並列プログラミングモデルと自動チューニング(<特集>数値計算のための自動チューニング(続))
スポンサーリンク
概要
- 論文の詳細を見る
In this study, framework for automatic tuning on selection of optimum parallel programming model in finite-element computation has been investigated. Target FEM code has been tested and optimized on T2K Open Supercomputers (Tokyo) with up to 1,024 cores. Combination of "firsttouch data placement", "sequential reordering of data", NUMA control with "localalloc", optimization of inter-domain communications improved performance of hybrid parallel programming models, and final performance of hybrid is competitive with or rather better than that of Flat MPI programming model. Target code can be utilized as an engine of the framework for automatic tuning.
- 2010-12-24
著者
関連論文
- マルチコアクラスタにおける有限要素法アプリケーションのための階層型領域間境界分割に基づく並列前処理手法(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SIAM PP10参加報告 : SIAM-JSIAM協力へ向けて必要なこと(学術会合報告)
- SIAM CSE09(Conference Reports)
- SIAM PP 08報告(学術会合報告)
- 8.並列反復法と自動チューニング : マルチコア時代の並列プログラミングモデル(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- マルチコアクラスタにおける有限要素法アプリケーションのための階層型領域間境界分割に基づく並列前処理手法 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- Segmented Scan法のCUDA向け最適化実装
- OpenATLib:数値計算ライブラリ向け自動チューニングインタフェース
- Xabclib : 汎用的自動チューニングインターフェースOpenATLibを利用した反復解法ライブラリの開発(数値計算のための自動チューニング(続))
- 並列プログラミングモデルと自動チューニング(数値計算のための自動チューニング(続))
- 行列計算ライブラリ向け数値計算ポリシーインターフェースの提案
- 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
- OpenATLibを利用した疎行列ライブラリの開発と評価
- OpenATLib:汎用的な自動チューニングインターフェースの設計と実装
- 3次元津波伝搬シミュレーションにおけるコード最適化一手法
- M×N通信による大規模連成シミュレーション(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- M×N通信による大規模連成シミュレーション(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- OpenMP/MPIハイブリッド並列プログラミングモデルの多重格子法への適用
- マルチコアプロセッサにおけるリオーダリング付き非構造格子向け前処理付反復法の性能
- 自動チューニングインターフェース OpenATLib における疎行列ベクトル積アルゴリズム
- T2Kオープンスパコンが創る新しい計算機環境
- SC08参加報告
- マルチコアクラスタにおける有限要素法アプリケーションのための階層型領域間境界分割に基づく並列前処理手法(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- APCOM07-EPMESC XI報告(学術会合報告)
- GeoFEMベンチマークによるHitachi SR11000/J2の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- GeoFEMベンチマークによるHitachi SR11000/J2の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 階層型領域分割によるマルチステージ並列前処理手法へのハイブリッド並列プログラミングモデルの適用(グリッドと数値計算)
- 計算科学手法と原子力分野における応用 : 第9回 高速化技術(その2)
- ボクセル型背景格子を使用した大規模並列可視化手法(HPC-6 : 並列アプリケーション)
- GeoFEMベンチマークによるHitachi SR11000/J1およびIBM p5-595のノード性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- GeoFEMベンチマークによるHitachi SR11000/J1およびIBM p5-595のノード性能評価(性能評価, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコア時代の並列前処理手法 (科学技術計算アルゴリズムの数理的基盤と展開)
- 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装
- ヘテロ環境を目指した拡張階層型領域間分割に基づく高次フィルイン付き前処理手法の高速化
- 自動チューニング機構を有するアプリケーション開発・実行環境ppOpen-HPC
- 三次元有限要素法アプリケーションのCUDA向け実装と性能評価
- 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価
- 六面体メッシュの適合型並列局所細分化と負荷分散(HPC-10:大規模計算,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- FEF09(15th International Conference on Finite Elements in Flow Problems)(Conference Reports)
- 国際クリロフ(Krylov)京都フォーラム(学術会合報告)
- 並列有限要素法のための新しい領域分割手法
- スパコンは本当にものづくりに役立つのか?
- 東京大学における「学際計算科学・工学人材育成プログラム」
- 地盤工学会地盤環境賞を受賞して(2)(学会の動き)
- 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価
- 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念
- 10th International Meeting on High-Performance Computing for Computational Science (VECPAR 2012) 参加報告
- 有限要素法係数行列生成プロセスのマルチコア・メニィコア環境における最適化