超並列環境における密行列計算プログラムの性能モデリングに向けた検討
スポンサーリンク
概要
- 論文の詳細を見る
現在のペタスケールの計算機やこれから先のポストペタスケールの計算機向けに密行列計算プログラムを開発する際,性能モデルを用いて性能を予測することで作業を効率化することが期待される.本稿では,そのような性能モデルを構築するための検討を行うことを目的とし,その検討材料として,我々が行った 「京」 コンピュータにおける行列の三重対角化プログラムの性能モデリングと,その過程で行った予備調査の結果を報告する.そして,その結果を踏まえて,密行列計算の性能モデリングに向けた検討を行う.
- 2013-07-24
著者
関連論文
- 量子多体系・高精度シミュレーションの研究開発 : 密度行列繰り込み群法の超並列化と大規模計算
- LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 長方行列向け特異値分解の浮動小数点コプロセッサによる高速化(高性能計算)
- 階層的な性能モデルに基づく行列計算の自動チューニング (特集 数値計算のための自動チューニング)
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング(数値計算のための自動チューニング)
- 階層的な性能モデルに基づく行列計算の自動チューニング(数値計算のための自動チューニング)
- マルチコア環境における固有値ソルバ
- 疎行列固有値ソルバーの自動チューニングLOBPCGの量子多体問題への応用を中心に(HPC-10 : 自動チューニングI)
- 密度行列繰り込み群法における大規模固有値計算の並列化 (数値解析と数値計算アルゴリズムの最近の展開)
- 正方行列向け特異値分解のCUDAによる高速化
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 密行列計算アルゴリズムに対するブロック分割法の最適化と性能評価
- ブロックハウスホルダーQR分解の並列計算における自動チューニング手法の検討
- 22pZD-4 箱型トラップ中でのFFLO状態と強結合の効果(22pZD 量子エレクトロニクス(Fermi原子系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- マルチコアクラスタ向け通信手法を用いた密度行列繰り込み群法の並列化
- QR分解アルゴリズムに対する自動チューニング-性能モデルに関する考察-
- 9.MPI通信ライブラリの自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 量子多体問題における自由度の壁とそれを越える並列対角化アルゴリズムの開発 : 地球シミュレータ上での超並列量子計算の現状(数値シミュレーションを支える応用数理)
- MPI集団通信の性能チューニングについて
- 性能測定基盤と連携する数値計算ソフトウェア(HPC-11 : 自動チューニング)
- 地球シミュレータ上での18テラフロップス級及び1590億次元行列の厳密対角化計算:トラップされた強相関フェルミ原子ガスの基底状態探索(計算科学の基盤技術とその発展)
- 20507 地球シミュレータ・フルノードを利用した超大規模疎行列固有値の新規計算手法(大規模数値解析(2),OS11 大規模数値解析)
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 25aRD-10 光格子における擬CuO_2模型の提案(25aRD 量子エレクトロニクス(Fermi粒子系,及びBose-Fermi混合系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- 10万超コアを駆使する固有値ソルバについての検討
- ParCo2009参加報告(学術会合報告)
- 自動チューニングによる通信最適化を施した固有値ソルバの開発について
- 動的計画法を用いたブロックハウスホルダQR分解アルゴリズムの性能最適化 (コンピューティングシステム Vol.4 No.4)
- SIAM CSE 11(学術会合報告)
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 超並列環境における密行列計算プログラムの性能モデリングに向けた検討
- 18aAD-4 多軌道強相関クラスタハバードモデルに対する厳密対角化法の並列化(18aAD 電子系1,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- GPUへの完全オフロード化によるTSQRの高速化に関する研究