粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法
スポンサーリンク
概要
- 論文の詳細を見る
マルチプロセッサシステム上でのFortranプログラムの粗粒度並列処理手法としてマクロデータフロー処理が提案されている.マクロデータフロー処理のように,ダイナミックスケジューリングを用いて粗粒度タスク(マクロクスク)を実行時にプロセッサに割り当てる方式では,従来,マクロタスク間で共有されるデータを集中型共有メモリ上に置き,マクロタスク間のデータ授受は集中型共有メモリを介して行なう方法がとられていた.しかし,このような方式では,集中型共有メモリを介したデータ転送オーバヘッドが大きくなるという問題が生じる.この問題点を解決するためには,マクロタスク間データ授受のために,プロセッサ内ローカルメモリの利用が重要となる.このローカルメモリの有効利用では,現在までマクロタスク間(ループ間)データ授受に関してほとんど研究がされておらず,単一ループ内でローカルメモリの有効利用を行う研究として,Array Privatization法が提案されているにすぎない.また,分散共有メモリマシン上でのデータ分割・配置に関しては,AndersonとLamがプロセッサ間通信の最小化を目指した静的なデータ分割・配置法を提案している.しかし,この方法は,マクロデータフロー処理のように実行時に手順とデータを動的に配置し,粗粒度並列処理を行う方式には適用できない.そこで,筆者等は,マクロデータフロー処理において,複数Doallループ間で,Doallループの並列性を利用しつつ,ローカルメモリ経由でデータ授受を行う方法を提案してきた.この方式では,ローカルメモリ経由データ授受を行なう複数マクロタスクを,コンパイル時のタスク融合を用いて,実行時に同一プロセッサに割り当てている.このため,タスク融合のできない複数マクロタスク間(例えば,分割された部分Doallループと部分シーケンシャルループの間)では,ローカルメモリを介してデータ授受を行なうことが困難であった.本稿では,そのような問題点を解決し,Doallループとシーケンシャルループ間でのデータローカライゼーション手法を提案する.本手法では,Doallループとシーケンシャルループを,配列データの使用範囲が等しくなるように複数の部分Doallループと部分シーケンシャルループに分割し,その後,データ転送量の多い部分Doallループと部分シーケンシャルループを実行時に同一プロセッサに割り当てて,ローカルメモリ経由データ授受を実現する並列マシンコードを生成する方式をとる.
- 一般社団法人情報処理学会の論文
- 1994-09-20
著者
-
吉田 明正
東邦大学理学部情報科学科
-
笠原 博徳
早稲田大学基幹理工学研究科情報理工学専攻
-
尾形 航
早稲田大学理工学部電気電子情報工学科
-
前田 誠司
(株)東芝研究開発センター
-
吉田 明正
早稲田大学理工学部
-
山下 浩一郎
早稲田大学理工学部
-
前田 誠司
(株)東芝
-
笠原 博徳
早稲田大学
-
山下 浩一郎
早稲田大学 理工学部
関連論文
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価(並列/分散アーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 階層統合型粗粒度タスク並列処理におけるタスク階層決定手法(HPC-1 : 最適化)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価(組込みシステムプラットフォーム)
- 瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境 (コンカレント工学)
- マルチコア上でのOSCAR APIを用いた低消費電力化手法(組込みシステムプラットフォーム)
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ,VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- 54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討(マルチコア,プロセッサ, VLSI回路,デバイス技術(高速,低電圧,低消費電力))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価(ARC-4 : 実行スケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- マルチグレイン並列性向上のための選択的インライン展開手法(並列・分散処理技術)
- マルチグレイン並列性向上のためのインライン展開手法
- OSCARチップマルチプロセッサ上でのマルチグレイン並列処理
- 並列処理階層自動決定手法を用いた粗粒度タスク並列処理
- (2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
- 150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
- マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法(プロセッサアーキテクチャ)
- シングルチップマルチプロセッサ上での近細粒度並列処理 (並列処理)
- シングルチップマルチプロセッサ上でのマルチグレイン並列処理
- マルチコアのためのコンパイラにおけるローカルメモリ管理手法(組込みシステムプラットフォーム)
- ヘテロジニアスマルチコア上でのコンパイラによる低消費電力制御(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ヘテロジニアスチップマルチプロセッサにおける粗粒度タスクスタティックスケジューリング手法(並列処理手法, SHINING 2006 「アーキテクチャとコンパイラの協調および一般」)
- ホモジニアスマルチコアにおけるコンパイラ制御低消費電力化手法(ARC-4: 低電力アーキテクチャ2, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法(ARC-6 : ソフトウェア最適化,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 2D-7 マルチコアプロセッサ上でのハーモニッククラスタリングを用いた基本周波数解析の並列処理(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 情報家電用マルチコア・プロセッサ
- マルチコアプロセッサ上でのマルチメディア処理の並列化(マルチプロセッサ)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 独立に周波数制御可能な4320MIPS、SMP/AMP対応4プロセッサLSIの開発(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 階層統合型粗粒度タスク並列処理のための並列Javaコード生成手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理(マルチコア,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- マルチコア上でのマルチメディアアプリケーションの自動並列化(マルチコア)
- マルチコア上でのマルチメディアアプリケーションの自動並列化
- OSCARコンパイラにおける制約付きCプログラムの自動並列化(並列化コンパイラ)
- 階層グルーピング対応バリア同期機構の評価(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 自動並列化のためのElement-Sensitiveポインタ解析
- Fortran マルチグレイン並列処理におけるデータローカライゼーション手法
- Fortran粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法
- 粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法
- Fortran マクロデータフロー処理におけるデータローカライゼーション手法
- マルチグレイン並列処理におけるタスク融合を用いたデータローカライゼーション手法
- マクロデータフロー処理におけるデータローカライゼーション手法
- Fortranマクロデータフロー処理におけるデータローカライゼーション
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理
- OSCAR API標準解釈系を用いたParallelizable Cプログラムの評価
- 情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能
- 組込み向けマルチコア上での複数アプリケーション動作時の自動並列化されたアプリケーションの処理性能
- マルチコア上でのOSCAR APIを用いた並列化コンパイラによる低消費電力化手法
- 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの評価
- 2000-ARC-139-16 近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの構成
- 情報家電用マルチコア並列化APIを生成する自動並列化コンパイラによる並列化の評価
- 情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 自動並列化技術を用いたメディア処理オフロード
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- 並列化コンパイラによるソフトウェアコヒーレンシ制御
- 共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法
- 共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法
- 商用SMP上での粗粒度タスク並列処理
- 共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価
- 階層統合型粗粒度タスク並列処理のためのJavaコンパイラ
- C-014 階層統合型粗粒度タスク並列処理のための並列Javaコード生成(ハードウェア・アーキテクチャ,一般論文)
- 2D-4 GPU上でのSpecmurt分析を用いた基本周波数解析の並列処理(音声・音楽情報処理,一般セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 3A-3 階層統合型粗粒度タスク並列処理における再帰メソッドの並列Javaコード生成(ハイパフォーマンスコンピューティング,一般セッション,アーキテクチャ,情報処理学会創立50周年記念)
- B_010 PCクラスタ上での階層統合型粗粒度タスク並列処理のMPI実装手法(B分野:ソフトウェア)
- PCクラスタ上での階層統合型粗粒度タスク並列処理
- SMP上でのデータ依存マクロタスクグラフのデータローカライゼーション手法
- データ依存マクロタスクグラフに対するデータローカライゼーション手法
- 一般的なマクロタスクグラフに対するループ間データローカライゼーション手法
- 階層型粗粒度タスク並列処理のためのタスク多重割当てを用いた実行方式(並列処理)
- 2000-ARC-139-31 階層型粗粒度タスク並列処理のための多重割当てを伴うダイナミックスケジューリング
- 階層型粗粒度並列処理における同一階層内ループ間データローカライゼーション手法 (並列処理)
- マルチグレインデータローカライゼーションのための近細粒度タスクスケジューリング
- 階層的マクロデータフロー処理のインプリメント手法
- 2D-5 マルチグレイン並列処理におけるサブルーチンを含むデータローカライゼーション手法
- Fortran階層型マクロデータフロー処理におけるデータローカライゼーション
- 階層型マクロデータフロー処理におけるデータローカライゼーション手法
- C-014 階層統合型粗粒度タスク並列処理におけるマクロタスク生成手法(C分野:アーキテクチャ・ハードウェア)
- 粗粒度タスク並列処理のための階層統合型実行制御手法(並列・分散処理技術)(次世代移動体通信システム)
- D-6-8 ランダムマクロタスクグラフを用いた階層統合型粗粒度並列処理の性能評価(D-6. コンピュータシステム)
- 階層型マクロタスクグラフのための異階層タスクの統合実行制御手法(ARC-5:コンパイラ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 粗粒度タスク並列処理における階層統合型スケジューリング
- 実用レベルのマルチグレインFORTRANコンパイラの開発
- ICS'96参加報告
- ICS'95参加報告
- 無同期近細粒度並列処理における並列コードスケジューリング
- マルチグレイン並列処理におけるデータローカライゼーションのための近細粒度タスクスケジューリング
- スタティックスケジューリングを用いたマルチプロセッサシステム上での無同期近細粒度並列処理
- 無同期細粒度並列処理のためのデータ転送順序最適化
- マルチコアプロセッサ上でのJava階層統合型粗粒度タスク並列処理(ソフトウェア,ネットワーク,クラウド及び一般)
- マルチコアプロセッサ上でのJava階層統合型粗粒度タスク並列処理 (コンピュータシステム)
- E-001 GPU上での一般化調和解析を用いたピッチ抽出の並列処理(音楽情報科学(1),E分野:自然言語・音声・音楽)
- Fortran マクロデータフロー処理のマクロタスク生成手法