倍精度正方行列特異値分解アルゴリズムのGPGPU上での性能・精度評価
スポンサーリンク
概要
- 論文の詳細を見る
Bischof の方法による正方行列の特異値分解アルゴリズムを GPGPU 向けに倍精度で実装した.実装のパラメータ (帯幅) を様々に変化させて実行し, NVIDIA 社の Tesla C2050 を搭載した計算機を含む 2 つの計算機で評価を行った.さらに, LAPACK の CPU への実装 (MKL) および GPGPU への実装 (CULA,MAGMA) と比較を行った.我々の実装により得られる特異値,特異ベクトルの精度は他の実装と同程度となった.また, Xeon X5680 (3.3GHz,hexa-core) および Tesla C2050 を搭載した計算機で特異値分解を行ったとき,我々の実装は MKL の 3.9倍, CULA および MAGMA の 1.8 倍高速となった.さらに,実行時間の内訳について詳細な分析を行い,その結果に基づき我々の実装の高速化手法について検討した.
- 2012-10-15
著者
-
山本 有作
神戸大学大学院システム情報学研究科
-
山本 有作
神戸大学大学院システム情報学研究科計算科学専攻|科学技術推進機構 戦略的創造研究推進事業
-
廣田 悠輔
神戸大学大学院システム情報学研究科計算科学専攻
-
橋本 拓也
神戸大学大学院システム情報学研究科システム科学専攻
-
廣田 悠輔
神戸大学大学院システム情報学研究科
関連論文
- 階層的な性能モデルに基づく行列計算の自動チューニング(数値計算のための自動チューニング)
- 非対称固有値計算におけるヘッセンベルグ化のGPUによる高速化
- 密行列計算アルゴリズムに対するブロック分割法の最適化と性能評価
- ある在庫管理問題に対する分枝限定法の応用 (最適化モデルとアルゴリズムの新展開)
- 密正方行列特異値分解における並列I-SVD法の特性を用いた後処理の高速化
- 固有値計算のための dqds 法の Totally Nonnegative な Hessenberg 行列への拡張について (科学技術計算アルゴリズムの数理的基盤と展開)
- QR分解アルゴリズムに対する自動チューニング-性能モデルに関する考察-
- とびらの言葉
- 離散ハングリー戸田方程式に基づく Totally Nonnegative 行列に対する固有値計算 (科学技術計算における理論と応用の新展開)
- 倍精度正方行列特異値分解アルゴリズムのGPGPU上での性能・精度評価
- ハウスホルダー変換に基づく直交化法の最近の進展 : 並列計算・高性能計算の観点から (科学技術計算における理論と応用の新展開)
- 非直交同時対角化アルゴリズムのハイブリッド解法(応用)
- 非直交同時対角化アルゴリズムのハイブリッド解法
- ハングリー型の離散可積分系と非対称行列の固有値計算 : 可積分アルゴリズムにおける最近の発展(サーベイ,応用可積分系研究部会)
- ハングリー型の離散可積分系と非対称行列の固有値計算 : 可積分アルゴリズムにおける最近の発展