ウエーブフロント型並列処理におけるタイルサイズの決定方式
スポンサーリンク
概要
- 論文の詳細を見る
科学技術分野の計算の大半は大規模配列データを扱うループ計算で占められ、このようなループを超並列計算機で実行するには、データパラレル方式にもとづいたループ並列処理が一般的である。つまり、配列データやループの各イタレーショシをプロセッサエレメント(以下PEと呼ぶ)に分散し、各PEが互いに通信しながら並列処理を行う。ここで問題となるのは、PE間通信が処理全体のボトルネックになることである。特にデータ転送の起動オーバーへツドが非常に大きいので、ループ運搬依存をもつ多重ループをウェーブフロント型並列処理する場合、イタレーション一回ごとに データ転送を行うと性能がでない.この問題を解決するため、数回~数百回のイタレーションに一回の割合でデータ転送をまとめて行う研究がいくつか発表されている。そこでの基本的な手法は、ループのイタレーション空間を、「タイル」と呼ばれるイタレーションの集まりで分割し(これをタイリングと呼ぶ)、各タイルをPEに割り付け、データ転送はタイルを単位として行うものである。タイリング方式には、タイルを大きくとれば、通信回数は少なくてすむが、他のPEの開始が遅れて並列性が十分に生かせないというトレードオフがある。このため、タイルの大きさが全実行時間にどのような影響を及ぼすかを解析して最適なタイルサイズを決定する必要がある。Ramamujamらは、タイルの各辺の長さが等しいなどの特殊な条件下での最適なタイルサイズを示 した。Hiranandaniらもいくつかの特別な場合について最適タイルサイズを示している。しかし、一般的な条件下での最適タイルサイズの決定方式は、これまで提案されていなかった。本報告では、依存ベクタの方向が任意の場合に二次元タイリングを適用し、必ずしもタイルの各辺の長さが等しくなくてもよいという条件下で、最適タイルサイズを決定する方法を提案する。
- 社団法人情報処理学会の論文
- 1994-03-07
著者
-
太田 寛
アドバンスト並列化コンパイラ研究体:(株)日立製作所情報コンピュータグループ
-
太田 寛
日立製作所システム開発研究所
-
太田 寛
(株)日立製作所システム開発研究所
-
斎藤 靖彦
(株)日立製作所システム開発研究所
-
海永 正博
(株)日立製作所システム開発研究所
-
小野 裕幸
(株)日立製作所システム開発研究所
関連論文
- ウェーブフロント型ループの超並列計算機向けコンパイル技法
- ウエーブフロント型並列処理におけるタイルサイズの決定方式
- 超並列計算機用データ自動分割方式の提案
- リカレンスをもつループのスーパースカラ向け高速化方式
- ベンチマークプログラムによるCPUアーキテクチャの性能評価の考察
- データ並立言語HPFの拡張機能仕様
- データ並列言語HPFの拡張機能仕様HPF/JA
- リバモアループによるデータパラレル計算モデルの性能評価
- 分散メモリ型並列計算機における式評価時のデータ転送回数最小化アルゴリズム
- Prolog高速インタプリタの処理特性
- 並列計算機用FORTRANの並列化トランスレータの基本構想
- 複雑な実行順序制御方式のマイクロプログラムのためのマイクロアセンブラ
- 手続き間自動並列化コンパイラWPPの評価
- 分散メモリ型並列計算機向けの自動データ分散並列化方式
- 分散メモリ型並列計算機向けの自動データ分散並列化技術の検討
- HPF処理系Parallel FORTRANによるNAS Parallelベンチマークの並列化
- 4. HPFトランスレータ"Parallel FORTRAN"の開発と評価 (>特集
- HPF処理系によるNAS Parallel Benchmarksの並列化
- High Performance Fortranトランスレータの機能概要
- HPF処理系による NAS Parallel Benchmarks の並列化
- HPF処理系によるNAS Parallel Benchmarksの並列化
- High Performance Fortranトランスレータの機能概要
- 分散共有メモリ向けコンパイラにおける自動データ分散方法
- 2000-HPC-82-15 分散共有メモリ向け手続き間自動データ分散方法の実装と評価