超並列環境向きの固有値計算アルゴリズムと自動チューニング(<特集>数値計算のための自動チューニング)
スポンサーリンク
概要
- 論文の詳細を見る
On the emerging era for many-core computing environment, there are three topics to be overcome; i) highly parallel algorithm, ii) resource conflict avoiding algorithms and implementation technique, iii) flexible algorithm and implementation being aware of heterogeneity. The selection of an appropriate resource from a large amount of resource is a sort of optimization problem, and automatic tuning technique plays a big role here. It is needless to say that significance of numerical linear libraries rises in the field of the scientific simulations in the future. However, we must argue whether the existing libraries and algorithms are suitable for a present multicore and a massively parallel computer system. This paper surveys the trend for the existing software, especially the numerical linear algebra library for multicore processors. The investigation focuses on the standard eigenvalue problem of dense real symmetrical matrices, and suitable algorithm for the parallel computing environment and the automatic tuning technique are reported. Finally, it touches about the next generation eigenvalue solver developed on the next generation supercomputer system.
- 2010-09-24
著者
関連論文
- 量子多体系・高精度シミュレーションの研究開発 : 密度行列繰り込み群法の超並列化と大規模計算
- LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング (特集 数値計算のための自動チューニング)
- 超並列環境向きの固有値計算アルゴリズムと自動チューニング(数値計算のための自動チューニング)
- マルチコア環境における固有値ソルバ
- 疎行列固有値ソルバーの自動チューニングLOBPCGの量子多体問題への応用を中心に(HPC-10 : 自動チューニングI)
- 密度行列繰り込み群法における大規模固有値計算の並列化 (数値解析と数値計算アルゴリズムの最近の展開)
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 緊急時放射能放出源推定システムの広域分散計算環境への実装とその実時間可視化
- 並列分散科学技術計算用I/Oライブラリ Stampi-I/O の開発
- 異機種計算機間通信ライブラリStampiにおける並列I/O機能の実装
- ワールドワイドメタコンピューティングの試みについて
- ワールドワイドメタコンピューティングの試みについて
- 22pZD-4 箱型トラップ中でのFFLO状態と強結合の効果(22pZD 量子エレクトロニクス(Fermi原子系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- マルチコアクラスタ向け通信手法を用いた密度行列繰り込み群法の並列化
- 並列分散科学技術計算を支援するソフトウェア・システム(STA)の構築
- キャッシュ競合を制御する性能安定化機構内蔵型数値計算ライブラリについて(数値計算)
- GRIDコンピューティング環境における行列ライブラリ向け性能保証方式の検討(数値計算)
- 自動チューニング型の固有値ソルバーについて
- 共有メモリ型アーキテクチャでのC-Stabアルゴリズムの性能評価(HPC-2: 自動チューニング)
- 9.MPI通信ライブラリの自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 量子多体問題における自由度の壁とそれを越える並列対角化アルゴリズムの開発 : 地球シミュレータ上での超並列量子計算の現状(数値シミュレーションを支える応用数理)
- MPI集団通信の性能チューニングについて
- 性能測定基盤と連携する数値計算ソフトウェア(HPC-11 : 自動チューニング)
- 地球シミュレータ上での18テラフロップス級及び1590億次元行列の厳密対角化計算:トラップされた強相関フェルミ原子ガスの基底状態探索(計算科学の基盤技術とその発展)
- 20507 地球シミュレータ・フルノードを利用した超大規模疎行列固有値の新規計算手法(大規模数値解析(2),OS11 大規模数値解析)
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 4011 地球シミュレータを用いた世界最大規模の固有値計算への挑戦(F-2 フォーラム「地球シミュレータにおける最適化およびハイエンドシミュレーション」)
- 強相関フェルミ原子ガスの量子物性 : 物性予測への新しいアプローチ
- 共有分散メモリ型並列計算機における新規通信手法
- 強相関電子系における超大規模固有値問題 : 地球シミュレータ上でのベクトル並列計算(数値シミュレーション)
- ハバードモデルの超大規模固有値問題に対する地球シミュレータでの並列計算法 (数値解析と新しい情報技術)
- 25aRD-10 光格子における擬CuO_2模型の提案(25aRD 量子エレクトロニクス(Fermi粒子系,及びBose-Fermi混合系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- 10万超コアを駆使する固有値ソルバについての検討
- ベクトル計算機上でのRetry型アルゴリズム群について(数値計算)
- ベクトル計算機上での Retry 型アルゴリズム群について
- 性能安定型LAPACKの自動生成の試み(HPC-4 : 数値計算アルゴリズム(1))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 相対論的分子軌道コードDIRAにおけるDHF計算のベクトル化
- ParCo2009参加報告(学術会合報告)
- 自動チューニングによる通信最適化を施した固有値ソルバの開発について
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 超並列環境における密行列計算プログラムの性能モデリングに向けた検討
- 18aAD-4 多軌道強相関クラスタハバードモデルに対する厳密対角化法の並列化(18aAD 電子系1,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- GPUへの完全オフロード化によるTSQRの高速化に関する研究