正方行列向け特異値分解のCUDAによる高速化
スポンサーリンク
概要
- 論文の詳細を見る
本論文では GPGPU 向けの統合開発環境 CUDA を用いた,正方行列の特異値分解の高速化について報告する.正方行列の特異値分解では,計算対象の行列を二重対角行列に変換してから特異値分解を行い,その後逆変換を行うことで,もとの行列の特異値分解を得る.本論文では CUDA の BLAS ライブラリ (CUBLAS) の中の高性能な SGEMM (行列乗算ルーチン) を効率的に利用することで,比較的少ないコストで大幅な高速化を行うことを目指し,演算の大部分が BLAS によって行われる二重対角化と逆変換部分を GPU を用いて高速化した.実装にあたっては,行列乗算を中心に二重対角化が可能な Bischof の手法が GPU 向けに適していることを簡単な性能予測を通して確認し,この手法を採用した.また,各計算ステップにおける CPU と GPU との仕事の適切な分担や計算のオーバラップについても考慮した.GPU として NVIDIA の GeForce8800 GTX を用いた性能評価の結果,CPU (Intel Core2 Duo 1.86GHz 2 コア使用)のみで計算する場合と比べて,5,120 次元の正方行列の特異値分解の計算が約 4 倍高速化できることを確認した.
- 2009-07-02
著者
-
深谷 猛
名古屋大学大学院工学研究科計算理工学専攻
-
山本 有作
名古屋大学大学院工学研究科計算理工学専攻
-
中村 佳正
京都大学大学院情報学研究科数理工学専攻
-
山本 有作
名古屋大学大学院工学研究科
-
山本 有作
神戸大学大学院システム情報学研究科計算科学専攻
-
中村 佳正
京都大学大学院情報学研究科
-
畝山 多加志
京都大学化学研究所
-
山本 有作
名古屋大学
-
山本 有作
神戸大学大学院工学研究科
-
中村 佳正
京都大学大学院 情報学研究科 数理工学専攻:独立行政法人 科学技術振興機構
関連論文
- 複素非対称行列向け固有値解法のCSX600による高速化(HPC-10 : 自動チューニングI)
- 長方行列向け特異値分解の浮動小数点コプロセッサによる高速化(高性能計算)
- 多重連結領域の固有値問題に対するSakurai-Sugiura法の拡張(理論,行列・固有値問題の解法とその応用,平成21年研究部会連合発表会)
- 行列の指数関数に基づく連立線形常微分方程式の大粒度並列解法とその評価(応用,行列・固有値問題の解法とその応用,平成21年研究部会連合発表会)
- 多倍長環境における最適PWM問題の数値解法
- 階層的な性能モデルに基づく行列計算の自動チューニング (特集 数値計算のための自動チューニング)
- 7.自動チューニングの適用事例 : 量子化学計算と信号処理(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 階層的な性能モデルに基づく行列計算の自動チューニング(数値計算のための自動チューニング)
- 非対称行列向けマルチシフトQR法の性能予測方式(数値計算1)
- キャッシュマシン向け三重対角化アルゴリズムの性能予測方式(HPC-2: 自動チューニング)
- キャッシュマシン向け対称密行列固有値解法の性能・精度評価(HPC応用)
- 対称三重対角行列向けマルチシフトQR法の漸近的収束性解析(理論,行列・固有値問題の解法とその応用,平成20年研究部会連合発表)
- ハウスホルダーQR分解のためのAllReduceアルゴリズムの性能と精度(並列数値計算)
- Kakarala-Ogunbonaの画像分解における特異値の近接度を低減させるアルゴリズム(画像処理)
- 画像圧縮に適した特異値分解アルゴリズムの考察(科学技術計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 画像圧縮に適した特異値分解アルゴリズムの考察(科学技術計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 2資産に依存するオプションの高速・高精度価格計算手法(数値計算)
- 離散ハングリーロトカ・ボルテラ系による固有多項式の数値的因数分解(理論,応用可積分系,平成20年研究部会連合発表会)
- 上二重対角行列の最小特異値の下界に関する最近の進展について (数値解析と数値計算アルゴリズムの最近の展開)
- シフトの計算回数の制限を用いたmdLVs法の高速化
- 正方行列向け特異値分解のCUDAによる高速化
- ある在庫管理問題の動的計画法による解法とCUDAを用いた高速化
- 非対称固有値計算におけるヘッセンベルグ化のGPUによる高速化
- JSIAM Letters 誌の創刊について
- 日本応用数理学会の次なる発展のために
- なぜ可積分な特異値計算アルゴリズムは高精度か(ソリトン理論から可積分数理へ:"de nouvelles perspectives ")
- 平成17年春の研究部会連合発表会
- 可積分系のグラフ論的描像について (可積分系数理の展望と応用)
- 高速SVDアルゴリズムとその応用((地球環境を守る)大規模シミュレーション)
- 固有値分解を目的としたツイスト分解法による分割統治法の改善(行列・固有値問題の解法とその応用,平成20年研究部会連合発表)
- 特異値分解法I-SVDにおける左特異ベクトル計算部の改善(ウェーブレット,平成20年研究部会連合発表会)
- 特異値計算のmdLVsアルゴリズムと特異値分解のI-SVDアルゴリズムにおける最近の進展 (流体計算における高速アルゴリズムの理論とその応用)
- 非対称固有値計算におけるヘッセンベルグ化のGPUによる高速化
- 高次収束するSteffensen型反復解法(数値計算アルゴリズムの研究)
- ニュートン・ステファンセン・シャンクス(離散可積分系と離散解析)
- 密行列計算アルゴリズムに対するブロック分割法の最適化と性能評価
- ブロックハウスホルダーQR分解の並列計算における自動チューニング手法の検討
- 分割統治法とツイスト分解法による新しい特異値分解アルゴリズム(数値アルゴリズム)
- ロトカ・ボルテラ系による特異値計算アルゴリズムの並列化(一般講演1)
- 特異値計算アルゴリズムの性能評価のための条件数の大きい行列作成法
- 特異値計算アルゴリズムの性能評価のための条件数の大きい行列作成法
- 10. ソリトン理論と数値計真法 (非線形現象の不思議)
- 行列の特異値計算のmdLVsアルゴリズムにおける最近の進展 (非線形波動現象の数理と応用)
- 行列の特異値を求めるアルゴリズムに含まれた離散可積分系に対する中心多様体理論アプローチ(数値シミュレーションを支える応用数理)
- 上2重対角のテスト行列を作成するためのアルゴリズム
- 固有分解と特異値分解用ライブラリの性能評価のためのテスト行列に関する考察(数値計算1)
- 高速特異値分解のためのライブラリ開発(数値アルゴリズム)
- 実対称3重対角行列の高精度ツイスト分解とその特異値分解への応用(行列・固有値問題の解法とその応用, 平成17年研究部会連合発表会)
- 特異値計算アルゴリズムdLVの基本性質について(応用可積分系, 平成17年研究部会連合発表会)
- 高精度特異値計算ルーチンの開発とその性能評価(数値計算)
- 新しい特異値計算ルーチンによる対称3重対角行列の固有値計算の評価(数値計算アルゴリズム(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 新しい特異値計算ルーチンによる対称3重対角行列の固有値計算の評価
- 連分数と可積分系 (離散可積分系の研究の進展 : 超離散化・量子化)
- ある在庫管理問題に対する分枝限定法の応用 (最適化モデルとアルゴリズムの新展開)
- 近接特異値を持つ行列に対応したI-SVD法の並列化とその評価
- 密正方行列特異値分解における並列I-SVD法の特性を用いた後処理の高速化
- シフトの計算回数の制限を用いたmdLVs法の高速化
- 多倍長環境における直交多項式理論に基づく最適なPWM波形の数値計算アルゴリズム
- An algorithm for the nonlinear eigenvalue problem based on the residue theorem (数値解析における理論・手法・応用--RIMS研究集会報告集)
- 「行列・固有値問題の解法とその応用」第1回研究集会に参加して
- 離散戸田方程式を用いた大規模疎行列の連立一次方程式, 行列式, 固有多項式の計算法(応用可積分系, 平成17年研究部会連合発表会)
- Recent Topics on Symmetries and Hidden Symmetries of Nonlinear Fields
- Ostrowski型下界とBrauer型下界をシフトとして用いたdqds法の収束性について(理論,行列・固有地問題の解法とその応用,平成19年研究部会連合発表会)
- 非線形可積分系--無限自由度と離散時間系への道標 (古典力学の輝き--未解決問題と新しい発見)
- 固有値計算のための dqds 法の Totally Nonnegative な Hessenberg 行列への拡張について (科学技術計算アルゴリズムの数理的基盤と展開)
- (82)ある創成科目の計画立案と実施状況 : 1年生向け創成科目の例(第21セッション 創成教育(I))
- QR分解アルゴリズムに対する自動チューニング-性能モデルに関する考察-
- とびらの言葉
- アルゴリズムと可積分系 : 可積分系によるアルゴリズム開発をめざして (高機能化を目指した非線形システム制御総合特集号-II)
- セパラトリックスをもつ可積分系の広田差分について (離散可積分系の応用数理)
- 戸田分子方程式のタウ関数による Laplace 変換の連分数展開(漸近解析に於る幾何学的方法)
- 離散時間可積分系と数値計算法
- 確率分布族と直交多項式の可積分変形 : モーメント問題とタウ関数のかかわり(非線形可積分系の応用数理)
- 固有値解法の最近の進展 : 密行列向け解法を中心に
- 高速積分変換に基づくオプション価格評価法
- 高速ガウス変換を用いた天候デリバティブの価格計算手法(最適化手法)
- iWAPT 2008報告(学術会合報告)
- 京都大学情報学研究科で推進する全学共通情報教育プログラムについて : 計算科学科目を中心として(ラボラトリーズ)
- 密行列固有値解法の最近の発展(I) : Multiple Relatively Robust Representationsアルゴリズム(行列・固有値問題における線形計算アルゴリズムとその応用)
- オプション価格評価のための高性能計算技術 : 高速多重極展開法と二重指数型数値積分公式の適用 (数値解析と新しい情報技術)
- とびらの言葉
- 密行列固有値解法の最近の発展(II) : マルチシフトQR法(サーベイ,行列・固有値問題の解法とその応用,平成18年研究部会連合発表会)
- 密行列固有値解法の最近の発展 : マルチシフト QR 法とその収束理論に向けて(線形作用素の理論と応用に関する最近の発展)
- 疎行列連立一次方程式の直接解法
- 動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化 (コンピューティングシステム Vol.4 No.4)
- SIAM CSE 11(学術会合報告)
- 離散ハングリー戸田方程式に基づく Totally Nonnegative 行列に対する固有値計算 (科学技術計算における理論と応用の新展開)
- ハウスホルダー変換に基づく直交化法の最近の進展 : 並列計算・高性能計算の観点から (科学技術計算における理論と応用の新展開)
- On some properties of a discrete hungry Lotka-Volterra system of multiplicative type
- 対称三重対角行列向けマルチシフトQR法の漸近的収束性解析
- 超並列環境における密行列計算プログラムの性能モデリングに向けた検討
- ハングリー型の離散可積分系と非対称行列の固有値計算 : 可積分アルゴリズムにおける最近の発展(サーベイ,応用可積分系研究部会)
- アルゴリズム・情報幾何・非線形可積分系(非線形可積分系による応用解析)
- 非線形可積分系の応用解析の新展開(非線型可積分系の研究の現状と展望)
- 非線形問題としての情報空間--非線形可積分系の応用解析から (情報空間)
- 非線形可積分系の応用解析の進展:ニューロダイナミクスにおける可積分系の視点(非線型可積分系の研究の現状と展望)
- 非線形可積分系の応用解析の展開
- 非線形可積分系の応用解析の試み
- TOPOLOGY OF SPACES OF RATIONAL MAPPS AND NONLINEAR INTEGRABLE SYSTEMS OF LAX TYPE
- A Self-Dual Yang-Mills Hierarchy : Periodic Reduction, Ansatz Solutions and Transformation Group