粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

概要

論文の詳細を見る
マルチプロセッサシステム上でのFortranプログラムの粗粒度並列処理手法としてマクロデータフロー処理が提案されている.マクロデータフロー処理のように,ダイナミックスケジューリングを用いて粗粒度タスク(マクロクスク)を実行時にプロセッサに割り当てる方式では,従来,マクロタスク間で共有されるデータを集中型共有メモリ上に置き,マクロタスク間のデータ授受は集中型共有メモリを介して行なう方法がとられていた.しかし,このような方式では,集中型共有メモリを介したデータ転送オーバヘッドが大きくなるという問題が生じる.この問題点を解決するためには,マクロタスク間データ授受のために,プロセッサ内ローカルメモリの利用が重要となる.このローカルメモリの有効利用では,現在までマクロタスク間(ループ間)データ授受に関してほとんど研究がされておらず,単一ループ内でローカルメモリの有効利用を行う研究として,Array Privatization法が提案されているにすぎない.また,分散共有メモリマシン上でのデータ分割・配置に関しては,AndersonとLamがプロセッサ間通信の最小化を目指した静的なデータ分割・配置法を提案している.しかし,この方法は,マクロデータフロー処理のように実行時に手順とデータを動的に配置し,粗粒度並列処理を行う方式には適用できない.そこで,筆者等は,マクロデータフロー処理において,複数Doallループ間で,Doallループの並列性を利用しつつ,ローカルメモリ経由でデータ授受を行う方法を提案してきた.この方式では,ローカルメモリ経由データ授受を行なう複数マクロタスクを,コンパイル時のタスク融合を用いて,実行時に同一プロセッサに割り当てている.このため,タスク融合のできない複数マクロタスク間(例えば,分割された部分Doallループと部分シーケンシャルループの間)では,ローカルメモリを介してデータ授受を行なうことが困難であった.本稿では,そのような問題点を解決し,Doallループとシーケンシャルループ間でのデータローカライゼーション手法を提案する.本手法では,Doallループとシーケンシャルループを,配列データの使用範囲が等しくなるように複数の部分Doallループと部分シーケンシャルループに分割し,その後,データ転送量の多い部分Doallループと部分シーケンシャルループを実行時に同一プロセッサに割り当てて,ローカルメモリ経由データ授受を実現する並列マシンコードを生成する方式をとる.
一般社団法人情報処理学会の論文
1994-09-20

粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

スポンサーリンク

概要

著者

関連論文

スポンサーリンク