マルチGPUを用いたAMG法
スポンサーリンク
概要
- 論文の詳細を見る
本研究では大規模な非構造格子の問題を高速に解ける線形解法の一つである AMG 法のマルチ GPU 上での実装について説明する.緩和法は AMG 法の性能を決める重要な要素である.CPU 上では幾つかの緩和法の実装が検討されているが,高い並列性が求められる GPU 上では十分な検討がされていない.従って,本研究ではヤコビ法,マルチカラー・ガウス・ザイデル法,弱い依存関係を排除することによって調整彩色したマルチカラー・ガウス・ザイデル法など 3 つの緩和法を用いて評価した.更に本稿では色情報に基づいたパディングや行列の並べ替えを必要とする GPU に最適な実装についても示した.
- 2012-03-19
著者
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法の疎行列計算への適用(数値計算)
- ソフトウェア自動チューニングにおける標本点逐次追加型性能パラメータ推定法(数値計算,数理計画法)
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 多次元FFTの並列処理
- 1-105 ワークショップを中心とした情報検索演習に関するプログラムの構築 : 工学院大学情報学部における初年次教育の事例((01)基礎科目の講義・演習-I,口頭発表論文)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マイクロマグネティックシミュレータの OpenMP による高速化
- ハイパクロスバネットワークの通信性能評価
- キューブ系ネットワークの特性
- 主記憶共有型ベクトル並列スーパコンピュータ向けLU分解アルゴリズムの高速化手法
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- クラスタ型ベクトル並列スーパコンピュータS-3000クラスタシステムのアーキテクチャと特性評価
- スーパースカラ方式とベクトル処理方式の比較 : 主記憶アクセス特性に着目して
- 並列計算機H2Pのシステム構成
- 分散型共有メモリをもつデータパラレル並列計算機のアーキテクチャ
- データ転送オーバヘッドの削減を主眼とした並列処理アーキテクチャの提案
- 高並列計算機による空気力学シミュレーションの構想(第8回航空機計算空気力学シンポジウム論文集 航空宇宙におけるCFDの将来展望とスーパーコンピュータへの期待)
- 並列計算機H2Pの要素プロセッサ間非同期データ転送方式
- データ転送オーバヘッドの削減を主眼とした並列処理アーキテクチャの評価
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 最小二乗法におけるGivens法とHouseholder法について
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- マルチGPUを用いたAMG法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPUのダイレクト通信を用いたAMG法
- GPUのダイレクト通信を用いたAMG法
- Smoothed Aggregationに基づくAMG法における分散アグリゲートの集約による通信の最適化
- マルチカラー法を用いたマルチGPU上でのAMG法(情報・システム基礎,学生論文)
- SMAC法による流体解析を対象としたAMGライブラリの自動チューニング方式(ソフトウェアシステム)
- APU上の混合精度AMG法
- 情報量基準ABICによるデータの当てはめの制約条件付き問題への適用
- Strassenのアルゴリズムを用いた行列積自動チューニングライブラリ(情報・システム基礎,学生論文)
- マルチカラー法を用いたマルチGPU上でのAMG法