不規則アクセスを伴うループの並列化コンパイル技法 : Inspector/Executorアルゴリズムの高速化

概要

論文の詳細を見る
本稿では,分散メモリ型の並列計算機に対するSPMDコード生成技法について述べる.インデックス配列による間接アクセスが存在するループを並列化すると,不規則なアクセスパターンを生ずる.従来inspectorとexecutorというコードを生成する手法が提案されてきたが,inspectorにおいて全対全のプロセッサ間通信が必要であり,適用できるコードの範囲にも制限がある.これらの問題を解決するために,逆インデックス法と全検査法という2つのinspectorのアルゴリズムを提案する.さらに,それらの手法の有効性を高並列計算機AP1000上で評価した.その結果,部分ピボッティング付きLU分解のプログラムでは,Inspector/Executor戦略を用いない場合に比べ,逆インデックス配列法で42倍,全検査法で11倍まで実行時間が高速化された.また,不規則疎行列とベクトルの積を求めるプロラグラムで,従来のinspectorアルゴリズムと逆インデックス法とを比較すると,1.6倍に実行時間の高速化が達成された.
社団法人情報処理学会の論文
1994-04-15