ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化

概要

論文の詳細を見る
プロセッサの高速化に伴うメインメモリとの速度差の増大により,キャッシュの有効利用は実効性能の向上に重要な役割を占めるようになっている。本論文では,プログラムを基本ブロック,ループ,サブルーチンといった粗粒度タスクに分割し,それらの間の並列性を利用する粗粒度タスク並列処理における,ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化手法について述べる.本手法では,キャッシュサイズを考慮.して複数のループを整合分割することによって,分割後のループがアクセスするデータサイズがキャッシュに収まるようにした後,各分割ループを粗粒度タスクと定義し,同一データを使用する粗粒度タスクを同一プロセッサ上で可能なかぎり連続に実行することのより,複数ループ間でキャッシュの有効利用を図る.さらに,連続実行される粗粒度タスク集合がアクセスするデータに対して,定義された配列サイズを拡大する方式のパディングを用いたデータレイアウトの変更によりラインコンフリクトミスの削減を行う.本手法の性能評価をSun UItra80上でspec95のswim用いて行った.合計キャッシュサイズが16MBとなる4PEでの実行では,swimの約13MBのデータセットはパディングによるコンフリクトミスの削減により,ほとんどがキャッシュ上に収まるため,Forteのみを用いた場合の4PEでの最小処理に対して,本手法により6.02倍の性能向上が得られた.一方,データサイズがキャッシュサイズより大きい場合の1PEでの実行では,粗粒度タスク間キャッシュ最適化とパディングの併用することにより処理時間は79.1秒となり,パディングのみを用いたForteの運次実行時間93.5秒に対して18.2%,OSCARによる粗粒度タスク間キャッシュ最適化のみの処理時間90.1秒に対しては13.9%の性能向上が得られることがわかり,両者を組み合わせて適用する本手法の有効性が確かめられた.また,RS6000 SP 604e上では,本手法での8PEの処理時間は52.0秒と,粗粒度タスク間キャッシュ最適化のみを適用した場合の8PEの処理時間59.2秒と比べ14%向上し,XLFコンパイラが8PEまでで最も良い値を出した6PEの108.0秒に対して2.08倍の性能向上が得られた.
一般社団法人情報処理学会の論文
2002-08-22

ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化

スポンサーリンク

概要

著者

関連論文

スポンサーリンク