メモリ使用量の少ない一般化共役残差法の提案
スポンサーリンク
概要
- 論文の詳細を見る
大規模疎行列を係数行列に持つ連立一次方程式の解法には,Krylov部分空間法が広く用いられている.その中でも,係数行列が非対称の場合の解法として,Arnoldi原理に基づいたGCR(Generalized Conjugate Residual)法が知られている.このGCR法の実装に関してリスタート版のGCRや,eGCR(efficient GCR)などが提案されているが,これらの方法を計算量,メモリ使用量の両方の観点から考察し,これら既存の方法と比べて計算精度と計算量は同程度でメモリ使用量が少ない方法(meGCR)と,計算精度は悪くなるが計算量とメモリ使用量が少ない方法(uGCR)の2つの方法を提案する.さらに,これらの方法を逐次環境と並列環境で実装して収束性や実行時間を調べた.この結果,meGCR法は収束性に問題がなく十分実用的であることがわかった.しかし,uGCR法は精度の問題から収束性のよい問題にしか適用できないことがわかった.
- 一般社団法人情報処理学会の論文
- 2001-03-08
著者
-
黒田 久泰
東京大学情報基盤センター
-
金田 康正
東京大学情報基盤センター
-
黒田 久泰
愛媛大:東大情
-
工藤 誠
東京大学大学院情報理工学系研究科コンピュータ科学専攻
-
工藤 誠
東京大学理学部情報科学科
-
片桐 孝洋
東京大学大学院理学系研究科情報科学専攻
関連論文
- SR11000/J2における4倍精度演算を改良したFFTの実装と評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 複数多項式によるMBPSの改善とHITACHI SR11000/J2での実装評価(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- SR11000モデルJ2における4倍精度積和演算の高速化(数値計算)
- 発見科学の構想と展開(発見科学)
- 6.自動チューニング機能付き数値計算ライブラリ(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- マルチコア環境における自動チューニング機能付き疎行列反復解法ライブラリ
- ブロック幅を動的決定する疎行列連立一次方程式の直接解法
- 自動チューニング機構が並列数値計算ライブラリに及ぼす効果
- 積和演算命令に向いた8基底FFTカーネルの提案
- 級数に基づく多数桁計算の演算量削減を実現する分割有理数化法