LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
スポンサーリンク
概要
- 論文の詳細を見る
エルミート疎行列用の固有値アルゴリズムの一つであるLOBPCGは、Davidson法などに比べるとコストが高くまた収束性について未知の部分があるものの、量子多体問題での応用経験では方程式求解の必要が無く並列実装の容易さは特筆に価する。ブロック化による同時固有モード探索も強力であるが、同時計算するモード数の2乗に比例するコストと含有モード(固有値分布)による収束性の違いにより十分な性能が得られないことがある。本報告ではデフレーションを効果的に併用することでモード数を制限するwindowの導入と,SA (Simulated Annealing)のように収束判定の残差ノルムを徐々に減少させながら全モードを大域的に収束させる方法について考察する。
- 2008-07-29
著者
-
今村 俊幸
電気通信大学
-
今村 俊幸
電気通信大学電気通信学部情報工学科|crest Jst
-
今村 俊幸
電気通信大学情報理工学部:crest (jst)
-
今村 俊幸
理化学研究所計算科学研究機構|crest(jst)
関連論文
- 量子多体系・高精度シミュレーションの研究開発 : 密度行列繰り込み群法の超並列化と大規模計算
- LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング (特集 数値計算のための自動チューニング)
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング(数値計算のための自動チューニング)
- マルチコア環境における固有値ソルバ
- 疎行列固有値ソルバーの自動チューニングLOBPCGの量子多体問題への応用を中心に(HPC-10 : 自動チューニングI)
- 密度行列繰り込み群法における大規模固有値計算の並列化 (数値解析と数値計算アルゴリズムの最近の展開)
- 1p-P-5 トカマク・プラズマにおけるハイブリッド・シミュレーション
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 途切れの無い思考を支援するプログラミング環境STAの構築
- 緊急時放射能放出源推定システムの広域分散計算環境への実装とその実時間可視化
- 並列分散科学技術計算用I/Oライブラリ Stampi-I/O の開発
- 異機種計算機間通信ライブラリStampiにおける並列I/O機能の実装
- ワールドワイドメタコンピューティングの試みについて
- ワールドワイドメタコンピューティングの試みについて
- 異機種並列計算機間の通信を支援する並列分散通信ライブラリ : Stampi
- 22pZD-4 箱型トラップ中でのFFLO状態と強結合の効果(22pZD 量子エレクトロニクス(Fermi原子系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- マルチコアクラスタ向け通信手法を用いた密度行列繰り込み群法の並列化
- 並列分散科学技術計算環境STA(4) : 異機種並列計算機の統合利用環境の構築
- 並列分散科学技術計算環境STA(3) : 異機種並列計算機間通信ライブラリの構築
- 並列分散科学技術計算環境STA(2) : エディタを中心に統合された並列プログラム開発環境PPDEの構築
- 並列分散科学技術計算環境STA(1) : 目的及び概要
- 異機種並列分散コンピューティングのためのメタ・スケジューリングの構想
- トカマクプラズマ計算(NEXT)における異機種並列計算機を結合したハイブリッドコンピューティング
- 並列分散科学技術計算の支援環境--SSP
- 複数の並列計算機上での科学技術計算のための統合利用環境の構築
- 並列分散科学技術計算を支援するソフトウェア・システム(STA)の構築
- キャッシュ競合を制御する性能安定化機構内蔵型数値計算ライブラリについて(数値計算)
- GRIDコンピューティング環境における行列ライブラリ向け性能保証方式の検討(数値計算)
- 自動チューニング型の固有値ソルバーについて
- 並列言語ADETRAN4のVPP-500での利用と評価
- 仕様記述言語VDMによる並列計算機ADENA4シミュレータの実現
- 共有メモリ型アーキテクチャでのC-Stabアルゴリズムの性能評価(HPC-2: 自動チューニング)
- 9.MPI通信ライブラリの自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 量子多体問題における自由度の壁とそれを越える並列対角化アルゴリズムの開発 : 地球シミュレータ上での超並列量子計算の現状(数値シミュレーションを支える応用数理)
- MPI集団通信の性能チューニングについて
- 性能測定基盤と連携する数値計算ソフトウェア(HPC-11 : 自動チューニング)
- 地球シミュレータ上での18テラフロップス級及び1590億次元行列の厳密対角化計算:トラップされた強相関フェルミ原子ガスの基底状態探索(計算科学の基盤技術とその発展)
- 20507 地球シミュレータ・フルノードを利用した超大規模疎行列固有値の新規計算手法(大規模数値解析(2),OS11 大規模数値解析)
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 4011 地球シミュレータを用いた世界最大規模の固有値計算への挑戦(F-2 フォーラム「地球シミュレータにおける最適化およびハイエンドシミュレーション」)
- 強相関フェルミ原子ガスの量子物性 : 物性予測への新しいアプローチ
- 共有分散メモリ型並列計算機における新規通信手法
- 強相関電子系における超大規模固有値問題 : 地球シミュレータ上でのベクトル並列計算(数値シミュレーション)
- ハバードモデルの超大規模固有値問題に対する地球シミュレータでの並列計算法 (数値解析と新しい情報技術)
- 25aRD-10 光格子における擬CuO_2模型の提案(25aRD 量子エレクトロニクス(Fermi粒子系,及びBose-Fermi混合系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- 10万超コアを駆使する固有値ソルバについての検討
- ベクトル計算機上でのRetry型アルゴリズム群について(数値計算)
- ベクトル計算機上での Retry 型アルゴリズム群について
- 性能安定型LAPACKの自動生成の試み(HPC-4 : 数値計算アルゴリズム(1))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 相対論的分子軌道コードDIRAにおけるDHF計算のベクトル化
- ParCo2009参加報告(学術会合報告)
- 分散メモリ型並列計算機における縦ブロック分割並列LU分解
- 複合並列計算機におけるADETRAN4処理系の実装について
- 自動チューニングによる通信最適化を施した固有値ソルバの開発について
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 超並列環境における密行列計算プログラムの性能モデリングに向けた検討
- 18aAD-4 多軌道強相関クラスタハバードモデルに対する厳密対角化法の並列化(18aAD 電子系1,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- GPUへの完全オフロード化によるTSQRの高速化に関する研究