共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価(コンパイラ及びツール, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)

概要

論文の詳細を見る
マルチプロセッサシステムの普及に伴い, 実効性能, システム価格性能比, ソフトウェア生産性向上のため高性能な自動並列化コンパイラの重要性が高まっている.しかしながら並列処理技術において広く利用されているループ並列処理手法は既に成熟期に至り, 今後の大幅な性能向上実現のためには従来とは異なる並列化手法の利用が必須である.本論文ではループ並列処理に加え, 基本ブロック, ループ, サブルーチンといった粗粒度タスク間の並列性を利用する粗粒度タスク並列処理・基本ブロック内ステートメントレベルの並列性を用いる近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCARマルチグレイン自動並列化コンパイラの性能評価について述べる.OSCARコンパイラではプログラムの形状や並列性に応じた適切な処理プロセッサ数や各並列処理粒度の決定, 複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている.SPEC95FPを用いた本性能評価においてOSCARコンパイラは, IBM pSeries690 Power4 24プロセッササーバ上でIBM XL Fortranコンパイラ8.1の自動並列化性能に比べ平均4.78倍, SGI Altix3700 Itanium2 16プロセッササーバ上においてIntel Fortran Itanium Compiler 7.1に比ベ平均2.40倍, Sun Fire V880 Ultra SPARC III Cu 8プロセッササーバ上においてSun Forteコンパイラ7.1に比べ平均1.90倍の性能向上が得られた.
2005-01-21

共有メモリ型マルチプロセッササーバー上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価(コンパイラ及びツール, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク