ヘテロ環境を目指した拡張階層型領域間分割に基づく高次フィルイン付き前処理手法の高速化
スポンサーリンク
概要
- 論文の詳細を見る
拡張階層型領域間分割は,領域外からの高次フィルインを考慮可能とする並列化手法であり,分散データの局所性も高いことから,メニーコア環境での効率的な並列化手法として期待される.本研究では,物性値分布に不均質性をもつことから悪条件となる三次元静弾性問題に対し,拡張階層型領域間分割に基づく高次フィルイン前処理付き反復解法を適用する.本報告では,T2K(東大) を利用し,マルチコア環境における本並列実装プログラムの収束性および高次フィルイン付き前処理の並列性能についてマルチカラー法との比較に基づき評価する.
- 2011-07-20
著者
-
中島 研吾
東京大学情報基盤センター
-
大島 聡史
東京大学情報基盤センタースーパーコンピューティング研究部門
-
大島 聡史
独立行政法人科学技術振興機構 Crest|東京大学
-
大島 総史
東京大学情報基盤センター
-
林 雅江
東京大学情報基盤センター
-
大島 聡史
東京大学情報基盤センター
関連論文
- OMPCUDA : GPU向けOpenMPの実装(高性能計算)
- マルチコアクラスタにおける有限要素法アプリケーションのための階層型領域間境界分割に基づく並列前処理手法(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 相乗り通信を利用したソフトウェアDSMの通信回数削減手法(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- CPUとGPUを用いた並列GEMM演算の提案と実装(数値計算)
- MPIとの比較によるソフトウェアDSMの性能評価(ARC-9:メモリ管理,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- SIAM PP10参加報告 : SIAM-JSIAM協力へ向けて必要なこと(学術会合報告)
- SIAM CSE09(Conference Reports)
- SIAM PP 08報告(学術会合報告)
- 8.並列反復法と自動チューニング : マルチコア時代の並列プログラミングモデル(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- メッセージ通信型GPGPUプログラミング(プログラミング環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 既存の並列化手法を用いたGPGPUプログラミングの提案(Inventive and Creative Architecture特別セッションI)
- GPUコンピューティング向け中間言語の研究
- Segmented Scan法のCUDA向け最適化実装
- GPU向けソフトウェアキャッシュ機構の実装と評価
- GPU向けソフトウェアキャッシュ機構の実装と評価
- OpenATLib:数値計算ライブラリ向け自動チューニングインタフェース
- Xabclib : 汎用的自動チューニングインターフェースOpenATLibを利用した反復解法ライブラリの開発(数値計算のための自動チューニング(続))
- 並列プログラミングモデルと自動チューニング(数値計算のための自動チューニング(続))
- メッセージ通信型GPGPUプログラミング(プログラミング環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 行列計算ライブラリ向け数値計算ポリシーインターフェースの提案
- 自動チューニングインターフェースOpenATLibにおける疎行列ベクトル積アルゴリズム
- OpenATLibを利用した疎行列ライブラリの開発と評価
- OpenATLib:汎用的な自動チューニングインターフェースの設計と実装
- ソフトウェアDSM MochaとMPIの並列ベンチマークを用いた性能評価(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- CPUとGPUの並列処理による行列積和演算方式の提案(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 3次元津波伝搬シミュレーションにおけるコード最適化一手法
- M×N通信による大規模連成シミュレーション(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- M×N通信による大規模連成シミュレーション(数値計算と計算環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- OpenMP/MPIハイブリッド並列プログラミングモデルの多重格子法への適用
- SIAM AN10(Conference Reports)
- マルチコアプロセッサにおけるリオーダリング付き非構造格子向け前処理付反復法の性能
- 自動チューニングインターフェース OpenATLib における疎行列ベクトル積アルゴリズム
- T2Kオープンスパコンが創る新しい計算機環境
- SC08参加報告
- マルチコアクラスタにおける有限要素法アプリケーションのための階層型領域間境界分割に基づく並列前処理手法(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- APCOM07-EPMESC XI報告(学術会合報告)
- GeoFEMベンチマークによるHitachi SR11000/J2の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- GeoFEMベンチマークによるHitachi SR11000/J2の性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 階層型領域分割によるマルチステージ並列前処理手法へのハイブリッド並列プログラミングモデルの適用(グリッドと数値計算)
- 計算科学手法と原子力分野における応用 : 第9回 高速化技術(その2)
- ボクセル型背景格子を使用した大規模並列可視化手法(HPC-6 : 並列アプリケーション)
- GeoFEMベンチマークによるHitachi SR11000/J1およびIBM p5-595のノード性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- マルチコア時代の並列前処理手法 (科学技術計算アルゴリズムの数理的基盤と展開)
- 三次元有限要素法アプリケーションにおける行列生成処理のCUDA向け実装
- ヘテロ環境を目指した拡張階層型領域間分割に基づく高次フィルイン付き前処理手法の高速化
- 自動チューニング機構を有するアプリケーション開発・実行環境ppOpen-HPC
- 三次元有限要素法アプリケーションのCUDA向け実装と性能評価
- 自動チューニングインターフェースOpenATLibにおける自動チューニング機能の評価
- 六面体メッシュの適合型並列局所細分化と負荷分散(HPC-10:大規模計算,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- HxABCLibScript:非均質計算機向け自動チューニング記述言語拡張
- FEF09(15th International Conference on Finite Elements in Flow Problems)(Conference Reports)
- 国際クリロフ(Krylov)京都フォーラム(学術会合報告)
- 並列有限要素法のための新しい領域分割手法
- スパコンは本当にものづくりに役立つのか?
- 東京大学における「学際計算科学・工学人材育成プログラム」
- 地盤工学会地盤環境賞を受賞して(2)(学会の動き)
- 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価
- 複数GPU向けのCUDAコードを生成するOpenMP処理系の提案
- 収束障害(Fault Convergence):数値計算ソフトウェアにおける新しい安全性の概念
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーションと性能評価
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のためのアプリケーション最適化と異機種計算機環境での性能評価
- Xeon PhiにおけるSpMVの性能評価
- 10th International Meeting on High-Performance Computing for Computational Science (VECPAR 2012) 参加報告
- レイテンシコアの高度化・高効率化による将来のHPCIシステムに関する調査研究のアプリケーションの異機種環境での評価 〜メニーコア環境を中心に〜
- 通信削減アルゴリズムCAQRのRSDFTの直交化処理への適用と評価
- 有限要素法係数行列生成プロセスのマルチコア・メニィコア環境における最適化