キャッシュメモリを意識した古典的反復解法の実装方法(数値計算)
スポンサーリンク
概要
- 論文の詳細を見る
近年マイクロプロセッサの演算性能は大幅に向上したが,一方で,多くの大規模科学技術計算においてはキャッシュミスヒットが要因となりプロセッサの演算性能を生かすことが難しくなっている.このような状況をふまえ,本稿では大規模疎行列連立1次方程式の古典的反復解法であり流体計算などで用いられる逐次的過剰緩和法 (SOR法) を高速実行する方法を考える.SOR法の標準的な実装を行うとデータアクセスの局所参照性が小さくなりキャッシュミスヒット率が高くなる.そこで,本稿ではキャッシュミスヒットを削減するよう未知数の更新順序を最適化する手法について述べる.この手法では,未知数の更新を行う範囲を指定する枠を定め,枠内に含まれる節点上の未知数を更新し,枠を一定の規則に従い移動させ,再度枠に含まれる節点上の未知数を更新する操作を繰り返す.ここでは,向き付きグラフを用いて本手法の正当性を保証するための枠の形状と移動方法が満たすべき必要十分条件を与える.本手法の評価では,Pentium3 (933MHz) 上において標準的な実装方法に比べ,2次元5点差分問題で約3倍,3次元7点差分問題で約2倍に演算性能が向上することを確認した.また,手法の長所を最大限に発揮させるような方策として,枠の形状の最適化方法およびデータ格納方式の改良法を与える.
- 一般社団法人情報処理学会の論文
- 2003-01-15
著者
-
土肥 俊
日本電気株式会社 C&C 第二システム開発本部
-
襲田 勉
日本電気株式会社基礎研究所
-
土肥 俊
日本電気株式会社基礎研究所
-
土肥 俊
日本電気株式会社 C&c 第二システム開発本部
-
鷲尾 巧
日本電気株式会社基礎研究所
-
丸山 訓英
日本電気株式会社基礎研究所
関連論文
- F05-4 高速並列液晶シミュレータPALCYDWEB(PArallel Lyquid CrYstal Display Simulator for WEB enviroment)の開発(F05 広域分散ネットワークを利用した協調研究環境)(フォーラムおよびチュートリアルセッション)
- 2000-HPC-82-8 非構造メッシュ用Block ILU前処理付き反復法のベクトル化手法
- 並列コンピュータCenjuにおけるILU前処理反復法の実現と評価
- 1. NEC のバイオ IT ソリューション
- 並列マシンCenju2による非圧縮性流体解析
- キャッシュメモリを意識した古典的反復解法の実装方法(数値計算)
- 非構造メッシュ用BILU前処理付き反復法のベクトル・並列化手法
- 非構造メッシュ用Block ILU前処理付き反復法のベクトル化手法
- 分散メモリ並列計算機上におけるアダプティブ有限要素法のための動的負荷分散アルゴリズム
- 分散メモリ並列計算機上におけるアダプティブ有限要素法のための動的負荷分散
- 生命科学と数理