細粒度通信機構を持つ並列計算機EM-Xにおける共有メモリプログラムの効率的実行

概要

論文の詳細を見る
分散メモリ型並列計算機EM-Xは, グローバルポインタと細粒度通信によるリモートメモリアクセスを用いることにより, システム全体のメモリを分散共有メモリとして扱うことができる.共有メモリプログラムの実行において高速な通信起動とマルチスレッド実行によるレイテンシ隠蔽の効果を検証するため, ベンチマークプログラムをEM-X上で実行した.マルチスレッドの効果は見られたが, 共有メモリアクセスの頻度が高いプログラムでは台数効果が限定的であった.この主な原因はマルチスレッド実行におけるスレッド切替えのオーバヘッドであることが分かった.次に, スレッド切替え抑制の観点から共有データのコピーをローカルメモリに置き, ソフトウェアにより一貫性を制御する機構を実装して改善を試みた.その結果, 高頻度の共有アクセスを行うプログラムに対して注意深く最適化を施した場合に, マルチスレッドを併用したリモートメモリアクセスを用いる方式よりも高い性能が得られた.共有メモリアプリケーションを効率的に実行するためには, 両方式のトレードオフを考慮し, アプリケーションに応じて適切な選択を行うことが重要であることが分かった.
一般社団法人情報処理学会の論文
2000-11-15

細粒度通信機構を持つ並列計算機EM-Xにおける共有メモリプログラムの効率的実行

スポンサーリンク

概要

著者

関連論文

スポンサーリンク