流体解析を対象としたAMGライブラリの自動チューニング
スポンサーリンク
概要
- 論文の詳細を見る
SMAC法による流体解析を対象にAMGライブラリのオンライン自動チューニング手法を提案し,有効性を評価する.このような解析では,各時間ステップで圧力に関するポアソン方程式を解くことになる.この際に,AMG法のパラメタの特性を考慮し探索範囲を狭め,パラメタを動的に選択するAMGライブラリを作成した.ソルバのパラメタとしてAMGのサイクル,各レベルのSOR法の加速係数,AMGと組み合わせる複数の解法(GMRES法,BICGSTAB法,CG,組み合わせない)を考慮している.組み合わせると147個のソルバの中からを状況に応じて選択を行っていることとなる.本手法では途中解法が発散しても,動的に別の解法が選択されるため,解法を固定化している場合と比較し,解析をより安定に進めることができる.またソルバ全体の時間としても,自動チューニングを行わない場合と比較して最大9%程度性能が改善した.
- 2011-03-08
著者
-
藤井 昭宏
工学院大学
-
小柳 義夫
工学院大学
-
小柳 義夫
東京大学大学院情報理工学系研究科
-
小柳 義夫
工学院大学情報学部コンピュータ科学科
-
中村 修
住友金属工業(株)総合技術研究所
-
藤井 昭宏
工学院大学情報学部コンピュータ科学科
-
小柳 義夫
東京大学
-
中村 修
住友金属工業
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSE2を用いた反復解法ライブラリLis 4倍精度版の高速化(Session 2:最適化)
- フィリップ・クレイトン, ザカリー・シンプソン編, 『宗教と科学ハンドブック』
- 座談会「計算工学の過去・現在・未来」?
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 広幅スラブ連続鋳造用旋回流ノズルの吐出角度設計(鋳造・凝固)
- スラブ連続鋳造用旋回流ノズルの吐出孔設計(鋳造・凝固)
- 1-105 ワークショップを中心とした情報検索演習に関するプログラムの構築 : 工学院大学情報学部における初年次教育の事例((01)基礎科目の講義・演習-I,口頭発表論文)
- 反復法ライブラリ向け4倍精度演算の実装とSSE2を用いた高速化
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- マイクロマグネティックシミュレータの OpenMP による高速化
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 領域分割による並列AMGアルゴリズム
- 並列直接解法によるSmoothed Aggregation MG法の改良と評価(高性能計算及び一般)
- 領域分割による並列AMGアルゴリズム
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 領域分割法とその並列化(数値計算アルゴリズムの研究)
- 領域分割法とその並列化
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- スーパーコンピュータと科学技術計算の最新動向
- 日本数学会編, 岩波 数学辞典 第4版, 岩波書店, 2007年
- 会長所感
- 木構造型ネットワークにおける最適ブロードキャストスケジューリング
- 木構造型ネットワークにおける最適Broadcastスケジューリング(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散共有メモリを用いた並列FFTとその最適化
- コモディティ分散共有メモリIBM x440 の性能評価
- 分散共有メモリを用いた疎行列アルゴリズムの細粒度並列処理とその最適化
- Globusを用いたGrid上での並列数値処理とその性能評価
- Globusを用いたGrid上での並列数値処理とその性能評価 (インターネットコンファレンス2002論文集)
- 情報科学から見た物理学(物理と情報)
- SC2003印象記
- ICIAM2003に参加して(1)(ICIAM'03報告)
- 科学とキリスト教
- エイズウイルス侵入のメカニズム
- 第14回 日本エイズ学会総会
- HIV病態におけるTH1・TH2
- ペタフロップス・コンピューティングの夢
- 第6回ヒトレトロウイルスと日和見感染症学会 : 基礎
- 免疫不全マウスを用いたウイルス感染モデル
- ハイパーフォーマンス・コンピューティングの現状と将来
- とびらの言葉
- スーパーコンピュータの現状と将来
- XMLビジネス標準開発のための設計情報アーキテクチャ
- 日本規格協会XML関連標準化調査研究委員会の活動
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 疎行列ソルバにおける非同期反復解法の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- エイズ研究に用いられる実験動物 (特集 HIV感染症--基礎と臨床) -- (基礎)
- HIV感染とエイズ発症のメカニズム
- 計算物理学とスーパーコンピュータ(フェロー)
- 第17代会長からのメッセージ(20周年記念)
- なぜスパコンは世界一を目指さなければならないのか(20周年記念)
- 学会事務センターの破綻とその後(20周年記念)
- Jacobi-Davidson 法の並列前処理とその性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 大規模固有値問題のためのJacobi-Davidson法とその特性について
- 2000-HPC-82-10 OpenMPを用いたJacobi-Davidson法の並列実装とその性能評価
- コンピュータとシミュレーション (20世紀科学革命の基礎--相対論,量子論から脳科学まで)
- マルチGPUを用いたAMG法
- 数値シミュレーションと超並列処理 (超並列処理)
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPU上でのAMG法におけるChebyshev多項式緩和法
- GPUのダイレクト通信を用いたAMG法
- GPUのダイレクト通信を用いたAMG法
- 大規模疎行列係数連立一次方程式に対する前処理つき共役勾配法の並列化
- 短距離力分子動力学法の並列化
- Smoothed Aggregationに基づくAMG法における分散アグリゲートの集約による通信の最適化
- マルチカラー法を用いたマルチGPU上でのAMG法(情報・システム基礎,学生論文)
- SMAC法による流体解析を対象としたAMGライブラリの自動チューニング方式(ソフトウェアシステム)
- APU上の混合精度AMG法
- 情報量基準ABICによるデータの当てはめの制約条件付き問題への適用
- Strassenのアルゴリズムを用いた行列積自動チューニングライブラリ(情報・システム基礎,学生論文)
- マルチカラー法を用いたマルチGPU上でのAMG法