2000-HPC-81-9 キャッシュサイズループ並列化とその評価
スポンサーリンク
概要
- 論文の詳細を見る
高性能を容易に得る手段として共有メモリ型並列機(SMP)が注目されている。SMP向け自動並列化コンパイラにおいて高性能プログラムを得るには、ループ並列化に加えてキャッシュ向け最適化の適用も必要である。本研究では、連続する複数の並列ループに渡ってキャッシュ上のデータ再利用を促進するキャッシュサイズループ並列化の実現方法を検討し、性能評価を行った。人手で並列化したプログラムによる実機評価では、SGI Origin2000条でSPECfp95 / tomcatvのカーネルループ中の2ループに対し、1次データキャッシュに対する本並列化を適用した場合、この2ループが13.7〜19.5%(1〜16PE)の高速化を、また2次キャッシュに対して適用した場合、4.9〜17.0%(1〜16PE)の高速化を達成した。
- 一般社団法人情報処理学会の論文
- 2000-06-02
著者
関連論文
- 再構成プロセッサFE-GA上へのFFTのマッピング(アーキテクチャII, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- AT-2-2 動的再構成プロセッサFE-GAとその開発環境(AT-2.リコンフィギュラブルデバイスとCAD技術,パネルセッションチュートリアルセッション,ソサイエティ企画)
- 手続き間自動並列化コンパイラWPPの評価
- 4. HPFトランスレータ"Parallel FORTRAN"の開発と評価 (>特集
- High Performance Fortranトランスレータの機能概要
- High Performance Fortranトランスレータの機能概要
- 並列化コンパイラにおける組合せ並列化技術
- 2000-HPC-81-9 キャッシュサイズループ並列化とその評価
- 手続き間自動並列化コンパイラWPPの試作 : 実機性能評価
- 手続き間並列化コンパイラWPPの試作 : 変数プライベート化技術 : ソフトウェア科学・工学 / 並列化コンパイラ(1)
- 並列化支援システム「Parassist」の試作 : 並列プロセス表示方法
- 並列化支援システム「Parassist」の試作 : 並列性検査方法
- 並列化支援システム「Parassist」の試作 : 不正並列化検出方法
- 並列化支援システム「Parassist」の試作 : 機能と構成
- オブジェクトコード評価ツールの開発
- HPF処理系における再分散解析機能の開発
- HPF処理系における再分散解析機能の開発
- HPF処理系における最適化機能 : 実行時判定の削除