数値計算プログラミングにおけるデータ移動制御のためのブロック化アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
スーパスカラ計算機では算術演算,性能が従来のスカラ計算機に比して飛躍的に強化された.その結果データ移動(ロード/ストア命令)の計算時間に占める比率が増大した.計算速度を考慮するプログラムは計算順序を変更しデータ移動を削減する方法で,大きなチューニング効果をあげられる場合がある.この方法はFortranプログラムからは透過なレジスタへのロード命令の実行やキャッシュヘのデータのステージングの回数を,媒介的な方法(計算密度,キャッシュ利用密度)で把え,計算機の個性に合わせた最適化を狙うものである.行列行列積和の例題では約3倍という大幅なチューニング効果を達成した.この方法をプログラミング技法の問題としてでは江く,線形代数計算の問題として,ブロック化された定式化で記述すると,ベクトル計算機や階層型記憶装置をもつ計算機にも応用することができ,見通しが良くなる.
- 一般社団法人情報処理学会の論文
- 1992-10-15
著者
関連論文
- Blue Geneに適した格子QCDプログラムの超並列化(並列計算)
- 多変量解析に基づいた情報検索手法の比較検討
- Blue Gene/Lシステム--スーパーコンピューティングへのグランドチャレンジ
- 分散メモリ型並列計算機での対称行列のデータ構造と多重スカイライン法への応用(並列処理)
- 解剖法順序を活かす多重スカイライン法
- 分散メモリ型並列計算機のための多重スカイライン法
- AISTスーパークラスタP-32のLinpackによる性能評価(HPC-8 : クラスタ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- スーパーコンピュータBlue Gene/Lの設計思想
- スーパーコンピュータ Blue Gene/L の設計思想
- ETC順序による3重対角行列の並列ソルバー
- 「シミュレーションにおける性能・品質」特集について(シミュレーションにおける性能・品質)
- IBM RS/6000とPOWERアーキテクチャの10年間
- IBM RS/6000とPOWERアーキテクチャの10年間
- 小特集「モンテカルロシミュレーション」について
- IBM Power4の紹介
- FEM解析の高速化のためのプログラミング
- シミュレーション技術の教育とIT技術
- 小特集「環境問題とシミュレーション技術」(環境問題とシミュレーション技術)
- ガウス超幾何級数_2F_1(3/2, 3/2;3;x)の高精度・高速の近似計算法
- ベクトル型インタフェースの対数ルーチン
- シュール補元による反復法のチューニング
- ベクトル型インターフェースの対数ルーチン
- 完全楕円積分の高速計算法
- 反復法における直接解法の利用
- LU 分解のブロック化アルゴリズム
- 数値計算プログラミングにおけるデータ移動制御のためのブロック化アルゴリズム
- IBM3090VF に適した数値計算法(数値計算基本アルゴリズムとそのソフトウェアの研究)