配列間パディングを用いた粗粒度タスク並列処理のためのキャッシュ最適化(並列・分散処理技術)

概要

論文の詳細を見る
マルチプロセッサシステムの普及にともない自動並列化コンパイラの重要性が高まっている.従来自動並列化コンパイラの研究では,ループ並列処理を中心とした研究が行われてきたが,システムの実効性能を向上させるためには,ループ並列処理に加えループやサブルーテン間の並列性を利用する粗粒度タスク並列処理,ステートメント間の並列性を利用する近細粒度並列処理を階層的に利用するマルチグレイン並列処理が注目されている.また,プロセッサとメモリの速度差の増大によりメモリアクセスレイテンシが性能向上のボトルネックになっている.したがって,データローカリティ最適化によるキャッシュメモリの有効利用も性能向上の重要なファクタとなる.本論文では粗粒度タスク並列処理の性能の向上を目指した粗粒度タスク間キャッシュ最適化手法について述べる.本手法では,データローカライゼーション手法を用い,データおよびタスクをキャッシュサイズにフィットするように分割し,同一データにアクセスするタスクを連続的に実行できるようにプログラムの実行順序を変えたうえで,配列間パディングを用いデータレイアウトを変えることによって,連続実行される粗粒度タスク間でのコンフリクトミスを削減する.本手法の性能をキャッシュ構成の異なる2台の4プロセッサマルテプロセッサワークステーションSun Ultra 80(ダイレクトマップ)とIBM RS/6000 44p-270 (セットアソシアティブ)上で性能評価を行った.Ultra 80ではネイティブコンパイラSun Forte 6 update 2 の自動並列化の最高性能に対してSPEC CFP95のtomcatvで5.1倍,swimで3.3倍,hydro2dで2.1倍,turb3dで1.1倍の性能向上が得られた.またRS/6000ではIBM XL Fortran 7.1 コンパイラに対して,tomcatvで1.7倍,swimで4.2倍,hydro2dで2.5倍, turbSdで1.03倍の性能向上が得られた.
一般社団法人情報処理学会の論文
2004-04-15

配列間パディングを用いた粗粒度タスク並列処理のためのキャッシュ最適化(並列・分散処理技術)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク