APU上の混合精度AMG法
スポンサーリンク
概要
- 論文の詳細を見る
GPU 上では倍精度浮動小数点演算に対して,単精度浮動小数点演算は 2 倍程度の性能を発揮することができる.一方で単精度浮動小数点演算では,高精度を必要とする処理において解の精度が十分に得られない.そこで GPU 上では単精度浮動小数点演算を行い,必要な解の精度を得るために CPU 上で倍精度浮動小数点演算を行う混合精度実装手法に着目した.本研究ではこの混合精度手法を CPU と GPU を内蔵する APU 上で代数的マルチグリッド法に適用する.行列サイズ 603 の三次元拡散方程式の異方性問題では,すべて倍精度演算を用いた場合と比べて,本手法では求解時間を約 60% に短縮することができた.
- 2013-09-23
著者
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 1-105 ワークショップを中心とした情報検索演習に関するプログラムの構築 : 工学院大学情報学部における初年次教育の事例((01)基礎科目の講義・演習-I,口頭発表論文)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マイクロマグネティックシミュレータの OpenMP による高速化
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- マルチGPUを用いたAMG法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPUのダイレクト通信を用いたAMG法
- GPUのダイレクト通信を用いたAMG法
- Smoothed Aggregationに基づくAMG法における分散アグリゲートの集約による通信の最適化
- マルチカラー法を用いたマルチGPU上でのAMG法(情報・システム基礎,学生論文)
- SMAC法による流体解析を対象としたAMGライブラリの自動チューニング方式(ソフトウェアシステム)
- APU上の混合精度AMG法
- 情報量基準ABICによるデータの当てはめの制約条件付き問題への適用
- Strassenのアルゴリズムを用いた行列積自動チューニングライブラリ(情報・システム基礎,学生論文)
- マルチカラー法を用いたマルチGPU上でのAMG法