SMPマシン上での粗粒度タスク並列処理におけるデータプリフェッチ手法(SMPシステム)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
スポンサーリンク
概要
- 論文の詳細を見る
現在多くのサーバで使用されている主記憶共有型マルチプロセッサシステム(SMP)では,プロセッサの動作速度向上と共に,メモリアクセスオーバヘッドの増大が,プロセッサ毎にスケーラブルな性能向上を得るための大きな障壁となっている.本論文では,このメモリアクセスオーバヘッドを軽減しスケーラブルな性能向上を得るために,粗粒度タスクのデータローカライゼーション(データ分割)によっても取り除けなかったデータ転送をプリフェッチによりタスク処理とオーバラップさせることにより軽減させるスタティックスケジューリングを提案し,その性能を評価する.提案するアルゴリズムは,コンパイル時のスタティックスケジューリングを前提とし,今回評価に使用したv880用のプリフェッチディレクティブを挿入したOpenMP並列化Fortranを出力するものである.性能評価の結果,Sun Forteコンパイラの逐次処理プリフェッチなしの場合と比較すると,SPEC95fpのtomcatvでは8プロセッサで最大13.9倍,swimでは8プロセッサで最大22.3倍の速度向上を得るなど,スーパーリニアスピードアップが効率良く引き出せるだけでなく,Sun Forteコンパイラによる自動プリフェッチ命令挿入を用い同一プロセッサ台数で処理する場合どうしを比較してもtomcatvでは1プロセッサで1.11倍,8プロセッサで3.86倍,swimで1プロセッサで1.44倍,8プロセッサで1.85倍の速度向上が得られ,本手法の有効性が確認された.
- 一般社団法人情報処理学会の論文
- 2003-11-27
著者
-
木村 啓二
早稲田大学基幹理工学研究科情報理工学専攻
-
笠原 博徳
早稲田大学基幹理工学研究科情報理工学専攻
-
宮本 孝道
早稲田大学理工学部コンピュータ・ネットワーク工学科
-
石坂 一久
早稲田大学理工学部コンピュータ・ネットワーク工学科
-
石坂 一久
早稲田大学
-
宮本 孝道
早稲田大学基幹理工学部情報理工学科
-
飛田 高雄
ソニー
-
宮本 孝道
早稲田大学
-
山口 高弘
日本放送協会
-
笠原 博徳
早稲田大学
-
木村 啓二
早稲田大学
関連論文
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- 瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境 (コンカレント工学)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ,VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ, VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- OSCARチップマルチプロセッサ上でのマルチグレイン並列処理
- マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法(プロセッサアーキテクチャ)
- シングルチップマルチプロセッサ上での近細粒度並列処理 (並列処理)
- シングルチップマルチプロセッサ上でのマルチグレイン並列処理
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- ヘテロジニアスマルチコア上でのコンパイラによる低消費電力制御(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ヘテロジニアスチップマルチプロセッサにおける粗粒度タスクスタティックスケジューリング手法(並列処理手法, SHINING 2006 「アーキテクチャとコンパイラの協調および一般」)
- ホモジニアスマルチコアにおけるコンパイラ制御低消費電力化手法(ARC-4: 低電力アーキテクチャ2, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- マルチコアプロセッサ上でのマルチメディア処理の並列化(マルチプロセッサ)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- マルチコア上でのマルチメディアアプリケーションの自動並列化
- OSCARコンパイラにおける制約付きCプログラムの自動並列化(並列化コンパイラ)
- 階層グルーピング対応バリア同期機構の評価(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 自動並列化のためのElement-Sensitiveポインタ解析
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- OSCAR API標準解釈系を用いたParallelizable Cプログラムの評価
- 情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能
- 組込み向けマルチコア上での複数アプリケーション動作時の自動並列化されたアプリケーションの処理性能
- マルチコア上でのOSCAR APIを用いた並列化コンパイラによる低消費電力化手法
- 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの評価
- 2000-ARC-139-16 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの構成
- 情報家電用マルチコア並列化APIを生成する自動並列化コンパイラによる並列化の評価
- 情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- プログラム構造に着目したメニーコアアーキテクチャシミュレータの高速化手法
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- マルチグレイン並列処理用マルチプロセッサシステム
- SMPサーバ及び組込み用マルチコア上でのOSCARマルチグレイン自動並列化コンパイラの性能(並列化コンパイラ)
- 瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境(組込みシステム,一般)
- 情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能
- OSCAR API標準解釈系を用いた Parallelizable C プログラムの評価
- ヘテロジニアスマルチコアプロセッサ上でのスタティックスケジューリングを用いたMP3エンコーダの並列化
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク
- マルチコアにおけるParallelizable Cプログラムの自動並列化
- マルチコアプロセッサ上での粗粒度タスク並列処理のためのコンパイラによるローカルメモリ管理手法
- 共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価
- SMPマシン上での粗粒度タスク並列処理オーバーヘッドの解析
- キャッシュ最適化を考慮したマルチプロセッサシステム上での粗粒度タスクスタティックスケジューリング手法
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- OSCARチップマルチプロセッサ上でのMPEG2エンコーディングの並列処理(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- マルチコアプロセッサ上でのデータローカライゼーション(一般セッションD 並列化と並列環境)
- チップマルチプロセッサ上でのMPEG2エンコードの並列処理(アーキテクチャとソフトウェアの協調技術)
- OSCARチップマルチプロセッサ上でのMPEG2エンコードの並列処理(チップマルチプロセッサ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- OSCARチップマルチプロセッサ上でのデータ転送ユニットを用いたデータローカライゼーション(ARC-7 : キャッシュシステム)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- データローカライゼーションを伴うMPEG2エンコーディングの並列処理(コンパイラ技術)
- OSCAR CMP上でのスタティックスケジューリングを用いたデータローカライゼーション手法(ARC-5:コンパイラ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- チップマルチプロセッサ上での粗粒度タスク並列処理によるデータローカライゼーション
- OSCAR型シングルチップマルチプロセッサにおける動きベクトル探索処理のマルチグレイン並列処理
- シングルチップマルチプロセッサにおけるJPEGエンコーディングのマルチグレイン並列処理
- OSCAR型シングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理
- シングルチップマルチプロセッサにおけるマルチグレイン並列処理
- シングルチップマルチプロセッサ上でのマルチメディアアプリケーションの近細粒度並列処理
- 自動並列化技術を用いたメディア処理オフロード
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- SMPマシン上での粗粒度タスク並列処理におけるデータプリフェッチ手法(SMPシステム)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
- SMPマシン上での粗粒度タスク並外処理におけるデータプリフェッチ手法
- マルチグレイン並列化コンパイラとそのアーキテクチャ支援
- マルチグレイン並列化コンパイラとそのアーキテクチャ支援
- マルチグレイン並列化コンパイラとそのアーキテクチャ支援
- 編集にあたって(マルチコアにおけるソフトウェア)
- コンピュータのその先を見せる : 早稲田大学コンピュータ・ネットワーク工学科における広報活動
- HOT Chips 15(会議レポート)
- マルチグレイン並列化コンパイラにおけるローカルメモリ管理手法(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチグレイン並列化コンパイラにおけるローカルメモリ管理手法(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチコアにおける Parallelizable C プログラムの自動並列化
- MP3エンコーダを用いたOSCARヘテロジニアスチップマルチプロセッサの性能評価(プロセッサアーキテクチャ)
- MP3エンコーダを用いたヘテロジニアスチップマルチプロセッサの性能評価(並列処理手法, SHINING 2006 「アーキテクチャとコンパイラの協調および一般」)
- OSCAR FORTRAN Compilerを用いたマルチグレイン並列性の評価
- 科学技術計算プログラムにおけるマルチグレイン並列性の評価
- OSCARマルチコア上でのローカルメモリ管理手法(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- FPGAを用いたマルチプロセッサシステムテストベッドの実装