GPUスパコンにおける1億個のスカラー粒子計算の強スケーリングと動的負荷分散
スポンサーリンク
概要
- 論文の詳細を見る
近接相互作用に基づく粒子法の大規模計算では,時間的に粒子の空間分布が大きく偏ることによるノード間の計算負荷の不均一や,ノード間の移動にともなうメモリの断片化が並列化実行性能を大きく低下させる.本論文では,メモリが階層的に分散するGPUスパコンにおいて,与えられた速度場に基づいて移動するパッシブ・スカラー粒子の計算を例題とし,分割した領域間の粒子数の不均一を定期的に解消する方法と,粒子の再整列によりメモリの断片化を解消する方法を提案し,両者を合わせて実行性能の大幅な向上を図る.隣接領域の境界を横切って移動する粒子をGPU上で探索する際,GPU計算に特化したアルゴリズムの提案と実装を行う.粒子の再整列は大きなオーバヘッドとなるため,再整列の最適回数を求めるためのモデルを提案する.GPU間の動的負荷分散と粒子の再整列を導入した実装を構築し,ベンチマーク問題に対する検証を64 GPUを用いて行い負荷分散の効果を確認した.また,GPUスパコンTSUBAME 2.0において1.6億個のパッシブ・スカラー粒子計算に対して良好な強スケーリングを得ることができ,負荷分散を用いない場合と比較して6倍以上の高速化を実現した.
- 2013-09-25
著者
関連論文
- 双曲型方程式のGPUによる高速計算(GPGPUコンピューティングの数理)
- 低アスペクト比トカマク炉におけるアルファ粒子のリップル損失
- 「GPGPUコンピューティングの数理」特集号に寄せて(GPGPUコンピューティングの数理)
- GPUコンピューティングによるCFDの超高速計算(第22回数値流体力学シンポジウム)
- 3・5 GPGPUについての研究動向(3.計算力学,機械工学年鑑)
- AP-1-5 GPUのストリーミング計算によるHPCアプリケーションの高速化(AP-1.回路とシステム領域におけるメニコア計算機の活用,パネルセッション,ソサイエティ企画)
- 3 フルGPUによるCFDアプリケーション(アクセラレータ,再び-スパコン化の切り札-)
- GPGPUによる保存形IDO法の圧縮性流体計算
- CUDAによるプラズマ2流体不安定性計算の加速
- 23aSH-1 GeVガンマ線観測衛星GLASTの初期ステータス(23aSH X線・γ線,宇宙線・宇宙物理領域)
- シューメイカー・レビー彗星と木星との衝突シミュレーション(シューメーカー=レビー第9彗星の木星衝突)
- CIP有限体積法による風波シミュレーション
- 放電励起高エネルギー密度プラズマの短波長コヒーレント光源への応用
- 高速放電励起軟X線レーザーの短波長化
- 原子炉熱流動の微視的シミュレーション
- ルンゲ・クッタ時間積分を用いた局所補間微分オペレータ(IDO)法による双曲型方程式解法の計算精度と数値安定性の向上
- マルチGPUによるフェーズフィールド相転移計算のスケーラビリティー-40GPUで5 TFLOPSの実効性能
- CUDAによる Poisson 方程式の定常反復計算
- CUDAによる定常反復Poissonベンチマークの高速化(並列化と高速化)
- 低価格パソコンを用いたMotion JPEG, DV, MPEG2による高品位な動画の作成と再生
- レイトレーシングを用いた爆風伝播の可視化(OS22a CGと計算力学)
- 保存形IDO(局所補間微分オペレータ)法(CIP法)
- 直交格子でのイメージベースト血流計算手法の開発(イメージベースト連成バイオメカニクス)
- 3.2 低アスペクト比トカマク炉のアルファ粒子閉じ込め(3.高閉じ込めは高ベータと両立するか?, 球状トカマクの実用炉への展望-トカマクの低アスペクト比化への挑戦-)
- ST炉におけるアルファ粒子閉じ込めに関する諸問題
- F0103(2) CUDAによる流体計算のGPUコンピューティング : 100倍の高速化を目指して([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
- 4.CIP法を用いた流体解析(パーソナルコンピュータで行うプラズマ解析)
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 〜32GPUで700GFLOPS超を達成〜
- GPGPUによる最先端流体シミュレーション : CUDAによるHPCアプリケーション開発
- 局所補間微分オペレータ法による二次元一様等方性乱流の直接数値計算(流体工学,流体機械)
- 自由表面を含む粒子群-流体連成解析
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 : 32GPUで700GFLOPS超を達成
- マルチメジャーを用いた計算手法(CIP法、IDO法)
- 複雑形状の複雑でない計算法(コンピュータが描く科学の世界)
- J0501-3-5 回転体の気液二相流数値計算(流体機械の研究開発におけるEFD/CFD(3))
- GPUを用いたCIP法によるプラズマ2流体不安定性の高速シミュレーション
- T11 コンピュータグラフィックスを応用した計算力学における可視化概論
- GPUによるラージエディ・シミュレーションの高速化(注目研究in年会2010)
- メソスケール気象モデルASUCAのTSUBAME 2.0での実行 (第24回数値流体力学シンポジウム特集) -- (特集 注目研究in CFD24)
- GPUによるラージエディ・シミュレーションの高速化(乱流の予測とモデリング(1),一般講演)
- 並列計算技術の最新動向 : スパコンと流体アプリケーション
- 円筒形状における気液二相流数値計算(数値計算(2),一般講演)
- 高次精度保存型IDO法によるラージエディ・シミュレーション(数値計算(2),一般講演)
- GPUスパコンによる非静力学平衡モデルの大規模気象計算
- 回転体に駆動される気液二相流の数値計算
- メソスケール気象モデルASUCAのTSUBAME 2.0での実行(注目研究in CFD24,第24回数値流体力学シンポジウム)
- GPUによる樹枝状凝固成長のフェーズフィールド計算
- GPUによる樹枝状凝固成長のフェーズフィールド計算
- 次世代気象モデルのフルGPU計算--TSUBAME 2.0の3990GPUで145TFlops
- 次世代気象モデルのフルGPU計算--TSUBAME 2.0の3990GPUで145TFlops
- GPUコンピューティング(新用語解説)
- 408 マルチGPUノードにおける3次元Phase Fieldモデルの高速計算(OS4.GPGPUによる計算力学(2),オーガナイズドセッション)
- 402 GPUによる高次精度移流スキームの演算性能(OS4.GPGPUによる計算力学(1),オーガナイズドセッション)
- 626 GPUによる3次元Cahn-Hilliard方程式に基づく相分離計算(OS3.GPGPUコンピューティング(3),オーガナイズドセッション)
- 621 GPUを用いた保存形IDO法による高精度圧縮性流体の高速計算(OS3.GPGPUコンピューティング(2),オーガナイズドセッション)
- 617 フルGPUによるCFDアプリケーション(OS3.GPGPUコンピューティング(1),オーガナイズドセッション)
- 616 LES乱流モデルを用いた保存型IDO法によるチャネル乱流計算(OS2.CIP法とその関連手法(4),オーガナイズドセッション)
- 615 IDO法によるPassive Scalarの乱流計算(OS2.CIP法とその関連手法(4),オーガナイズドセッション)
- 304 CIP有限体積法による風波乱流場の数値シミュレーション(OS3.CIP法とその関連手法(1),オーガナイズドセッション)
- 404 3次元格子ポルツマン法による非圧縮流体ソルバーのGPUによる加速(OS4.GPGPUによる計算力学(1),オーガナイズドセッション)
- 308 マルチモーメントを用いたコンパクト・スキームの開発(OS3.CIP法とその関連手法(2),オーガナイズドセッション)
- GPUスパコンを用いた大規模数値シミュレーション(最先端研究)
- 複数ノードのGPUによる大規模パッシブスカラー粒子計算の強スケーリングと動的負荷分散
- 局所補間を用いた高精度PIC法の開発
- 気液二相流シミュレーションの大規模GPUコンピューティング
- ACMゴードンベル賞・特別賞&SC'11テクニカル・ペーパー TSUBAME 2.0スパコンにおける樹枝状凝固成長のフェーズフィールド法を用いたペタスケール・シミュレーション (SC'11特集号)
- 強震動シミュレータGMSのGPU化
- 17^ビジュアリゼーションカンファレンス開催報告
- フォトリアリスティック・レンダリングによる科学技術計算のビジュアライゼーション
- CS-4-1 流体解析・電磁界解析に適したGPUコンピューティングと大規模計算化(CS-4.電磁界シミュレーション分野におけるGPGPU利用技術の進展,シンポジウムセッション)
- GPUスパコンにおける1億個のスカラー粒子計算の強スケーリングと動的負荷分散
- W052001 GPUコンピューティングによる超大規模流体解析の高速演算([W05200](流体工学部門,計算力学部門企画),流体コードの高速演算と大規模モデルの取扱)
- フォトニック結晶共振器の解析 : FDTD法とそのGPUによる高速化(テラヘルツ応用,シミュレーション技術,一般)
- 炉心燃料チャンネル内大規模二相流シミュレーション