GPUのダイレクト通信を用いたAMG法
スポンサーリンク
概要
- 論文の詳細を見る
本研究では大規模な非構造格子の問題を高速に解ける線形解法の一つである AMG 法のマルチ GPU 上での実装手法について考察する.緩和法は AMG 法の性能を決める重要な要素であるが,高い並列性が求められる GPU 上では十分な研究がなされていない.そこで GPU 上の AMG 法ではよく利用されるヤコビ法以外にもマルチカラー・ガウス・ザイデル法や弱い依存関係を排除することによる調整彩色したマルチカラー・ガウス・ザイデル法の GPU 上での効率的な実装手法を提案する.また,本研究では MPI を用いてマルチ GPU に実装した.通信部分に GPU 間のダイレクト通信を使用することで最適化を行う.数値実験の結果,通信部分を最大で 1.8 倍高速化した.更にマルチ GPU 環境においても強い異方性の問題についてマルチカラー・ガウス・ザイデル法を適用した AMG 法はヤコビ法を緩和法としたときより早く収束することがわかった.
- 2012-12-06
著者
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 1-105 ワークショップを中心とした情報検索演習に関するプログラムの構築 : 工学院大学情報学部における初年次教育の事例((01)基礎科目の講義・演習-I,口頭発表論文)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マイクロマグネティックシミュレータの OpenMP による高速化
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- マルチGPUを用いたAMG法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPUのダイレクト通信を用いたAMG法
- GPUのダイレクト通信を用いたAMG法
- Smoothed Aggregationに基づくAMG法における分散アグリゲートの集約による通信の最適化
- マルチカラー法を用いたマルチGPU上でのAMG法(情報・システム基礎,学生論文)
- SMAC法による流体解析を対象としたAMGライブラリの自動チューニング方式(ソフトウェアシステム)
- APU上の混合精度AMG法
- 情報量基準ABICによるデータの当てはめの制約条件付き問題への適用
- Strassenのアルゴリズムを用いた行列積自動チューニングライブラリ(情報・システム基礎,学生論文)
- マルチカラー法を用いたマルチGPU上でのAMG法