Blue Geneに適した格子QCDプログラムの超並列化(並列計算)
スポンサーリンク
概要
- 論文の詳細を見る
Blue Geneは専用計算機の価格性能比で,汎用性を備えたスーパコンピュータを目的として開発された.組み込みシステム向けであるPowerPC440をコアとしたデュアルコアプロセッサであり,各CPUにFPUを2つ搭載したダブルFPUという構造を持つ.また,チップ上に実装した通信機能によって相互接続することで,非常に大規模な並列計算機を構築することができる.我々は格子QCDアプリケーションを,Blue GeneのダブルFPU命令セットを効果的に利用し,MPIよりも低遅延時間で通信のできるトーラスパケット通信を直接利用することで,高い並列度を実現することに成功した.本論文ではこれらのBlue Geneに特有の手法について報告する.
- 2006-05-15
著者
-
土井 淳
日本アイ・ビー・エム(株)東京基礎研究所
-
土井 淳
日本 Ibm 東京基礎研究所
-
寒川 光
日本アイ・ビー・エム株式会社東京基礎研究所
-
松古 栄夫
高エネルギー加速器研究機構
-
橋本 省二
高エネルギー加速器研究機構
-
橋本 省二
高エネルギー加速器研究機構素粒子原子核研究所
-
土井 淳
日本アイ・ビー・エム株式会社東京基礎研究所
-
寒川 光
日本アイ・ビー・エム
-
土井 淳
日本アイ・ビー・エム 東京基礎研
関連論文
- 厳密なカイラル対称性をもつ格子ゲージ理論のシミュレーション(熱場の量子論とその応用,研究会報告)
- Blue Geneに適した格子QCDプログラムの超並列化(並列計算)
- 30aZN-4 オーバーラップディラック演算子の固有値分布とカイラル凝縮(素粒子論)
- 量子色力学におけるカイラル対称性の破れの数値的検証(最近の研究から)
- Towards θ vacuum simulation in lattice QCD
- θ vacuum in lattice QCD simulation(Quantum Field Theories : Fundamental Problems and Applications)
- 27aXE-3 トポロジーを保つ格子作用3 : デイラック演算子に与える効果(素粒子論)
- 27aXE-1 トポロジーを保つ格子作用1 : トポロジカルチャージの安定性(素粒子論)
- 30aSC-3 Cmsparg-Wilson フェルミオンを用いたカイラル領域てのメソン相関関数の解析(素粒子論)
- Spectral function analysis of hadron correlators on anisotropic lattices (有限温度・有限密度の場の量子論とその応用)
- 多変量解析に基づいた情報検索手法の比較検討
- Blue Gene/Lシステム--スーパーコンピューティングへのグランドチャレンジ
- 同次処理に基づく整数演算を用いた多面体ソリッドモデラ
- 分散メモリ型並列計算機での対称行列のデータ構造と多重スカイライン法への応用(並列処理)
- 解剖法順序を活かす多重スカイライン法
- 分散メモリ型並列計算機のための多重スカイライン法
- 正確な演算を利用した曲線・曲面の交点の存在判定
- IBMプロフェッショナル論文 Blue Gene/Pにおけるアプリケーション最適化と性能評価
- AISTスーパークラスタP-32のLinpackによる性能評価(HPC-8 : クラスタ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- OpenDXで始めるデータ可視化(「研究のツールボックス」(3))
- 30pSF-3 Hadron Spectroscopy in Anisotropic Lattice QCD
- 力学モデルを用いたウェブサイトの可視化
- 力学モデルを用いたグラフデータの画面配置手法の改良
- 1E-1-1 力学モデルによるループの自己干渉除去アルゴリズム
- 浮動小数点演算ユニットを利用した4×4行列式の適応的符号判定処理
- 正確な演算による低次代数曲線・曲面の干渉処理の提案
- 4×4行列式を対象とした適応的符号判定処理の高速化
- 同次幾何演算の整数値データ長の増加問題に対する考察
- 正確な演算を利用した幾何アルゴリズム : 現状と今後の展望
- 双対原理を利用したソリッドモデリング
- クォーターエッジデータ構造への稜線ループの導入
- スーパーコンピュータBlue Gene/Lの設計思想
- スーパーコンピュータ Blue Gene/L の設計思想
- 格子ゲージ理論の進展とK, Bの物理(実験観測に基づく統一描像の構築,研究報告会)
- ETC順序による3重対角行列の並列ソルバー
- Charmonium properties near the deconfinement transition and the heavy quark-antiquark free energy (熱場の量子論とその応用)
- An analysis of the spectral function on finite temperature lattices (熱場の量子論とその応用)
- Spectral function of the charmonium near the deconfining transition on the lattice
- 「シミュレーションにおける性能・品質」特集について(シミュレーションにおける性能・品質)
- 格子ゲージ理論(2002年度 信州冬の学校,地域スクール報告)
- IBM RS/6000とPOWERアーキテクチャの10年間
- IBM RS/6000とPOWERアーキテクチャの10年間
- 小特集「モンテカルロシミュレーション」について
- IBM Power4の紹介
- FEM解析の高速化のためのプログラミング
- O(1/mQ)effect in the lattice heavy quark effective theory (QCDとハドロン物理の新展開)
- 31a-Y-2 格子上のHeavy Quark Effective TheoryとIsgur-Wise関数
- 2p-A-4 格子上のHeavy Quark Effective Theoryと分散関係
- シミュレーション技術の教育とIT技術
- 小特集「環境問題とシミュレーション技術」(環境問題とシミュレーション技術)
- ガウス超幾何級数_2F_1(3/2, 3/2;3;x)の高精度・高速の近似計算法
- ベクトル型インタフェースの対数ルーチン
- シュール補元による反復法のチューニング
- ベクトル型インターフェースの対数ルーチン
- 完全楕円積分の高速計算法
- 反復法における直接解法の利用
- LU 分解のブロック化アルゴリズム
- 数値計算プログラミングにおけるデータ移動制御のためのブロック化アルゴリズム
- IBM3090VF に適した数値計算法(数値計算基本アルゴリズムとそのソフトウェアの研究)
- 超伝導がもたらした物性と素粒子の交流(超伝導発見から100年を迎えて)
- 超伝導がもたらした物性と素粒子の交流
- 並列・分散プログラミング言語X10によるHPCアプリケーションの記述