メモリバンド幅に着目したマルチコアノード上のアプリケーション最適化

概要

論文の詳細を見る
プロセッサのマルチコア化は,チップ当たりのピーク性能の大幅な向上をもたらしているが,その一方でプロセッサチップ当たりのメモリバンド幅の向上はコア全体の要求には応えられていない.この状況により,特にメモリアクセス率の高い HPC アプリケーションにおけるメモリウォール問題は今後ますます深刻化すると考えられる.本研究では,実アプリケーションにおけるメモリ性能要求の観点から,現在のマルチコアプロセッサがどの程度その性能を活かせているかを検証する.それに基づき,アプリケーションに応じて適切な利用コア数が存在することを指摘し,性能最適化への指標を与える.高メモリバンド幅を要求するアプリケーション例として Lattice QCD について,超並列クラスタ T2K-Tsukuba を用いて検証した結果,ノード上の 16 core のうち 8 core までの利用で性能向上は頭打ちになり,システム管理デーモンとの関係で,むしろそれ以上の利用では性能が低下することが示された.
一般社団法人情報処理学会の論文
2010-02-15