分散メモリ型並列計算機における縦ブロック分割並列LU分解
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes a vertical-block decomposed parallel LU factorization method(hereafter VB-PLU), which processes effectively on a distributed memory parallel computer. Because VBPLU method is based on the block algorithm, the message aggregation technique and the block-cyclic distribution strategy, it can reduce issue of communication and improve load balance. Further-more this method ensures to use long vectors for updating in Gauss-elimination, thus it is also advantageous with vector processors. In this paper, VBPLU method is shown and computational costs are estimated. Its evaluations are confirmed through numerical experiments on two parallel computers, SR2201 and VPP300.
- 日本応用数理学会の論文
- 1998-09-15
著者
関連論文
- 量子多体系・高精度シミュレーションの研究開発 : 密度行列繰り込み群法の超並列化と大規模計算
- LOBPCGにおける段階的収束とwindowの効果について(HPC-7:自動チューニングII,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- マルチコア環境における固有値ソルバ
- 疎行列固有値ソルバーの自動チューニングLOBPCGの量子多体問題への応用を中心に(HPC-10 : 自動チューニングI)
- 密度行列繰り込み群法における大規模固有値計算の並列化 (数値解析と数値計算アルゴリズムの最近の展開)
- 1p-P-5 トカマク・プラズマにおけるハイブリッド・シミュレーション
- Cell BEによる粒子法の並列化(アプリケーション高速化,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 途切れの無い思考を支援するプログラミング環境STAの構築
- 緊急時放射能放出源推定システムの広域分散計算環境への実装とその実時間可視化
- 並列分散科学技術計算用I/Oライブラリ Stampi-I/O の開発
- 異機種計算機間通信ライブラリStampiにおける並列I/O機能の実装
- ワールドワイドメタコンピューティングの試みについて
- ワールドワイドメタコンピューティングの試みについて
- 異機種並列計算機間の通信を支援する並列分散通信ライブラリ : Stampi
- 22pZD-4 箱型トラップ中でのFFLO状態と強結合の効果(22pZD 量子エレクトロニクス(Fermi原子系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- マルチコアクラスタ向け通信手法を用いた密度行列繰り込み群法の並列化
- 並列分散科学技術計算環境STA(4) : 異機種並列計算機の統合利用環境の構築
- 並列分散科学技術計算環境STA(3) : 異機種並列計算機間通信ライブラリの構築
- 並列分散科学技術計算環境STA(2) : エディタを中心に統合された並列プログラム開発環境PPDEの構築
- 並列分散科学技術計算環境STA(1) : 目的及び概要
- 異機種並列分散コンピューティングのためのメタ・スケジューリングの構想
- トカマクプラズマ計算(NEXT)における異機種並列計算機を結合したハイブリッドコンピューティング
- 並列分散科学技術計算の支援環境--SSP
- 複数の並列計算機上での科学技術計算のための統合利用環境の構築
- 並列分散科学技術計算を支援するソフトウェア・システム(STA)の構築
- キャッシュ競合を制御する性能安定化機構内蔵型数値計算ライブラリについて(数値計算)
- GRIDコンピューティング環境における行列ライブラリ向け性能保証方式の検討(数値計算)
- 自動チューニング型の固有値ソルバーについて
- 並列言語ADETRAN4のVPP-500での利用と評価
- 仕様記述言語VDMによる並列計算機ADENA4シミュレータの実現
- 共有メモリ型アーキテクチャでのC-Stabアルゴリズムの性能評価(HPC-2: 自動チューニング)
- 9.MPI通信ライブラリの自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- 量子多体問題における自由度の壁とそれを越える並列対角化アルゴリズムの開発 : 地球シミュレータ上での超並列量子計算の現状(数値シミュレーションを支える応用数理)
- MPI集団通信の性能チューニングについて
- 性能測定基盤と連携する数値計算ソフトウェア(HPC-11 : 自動チューニング)
- 地球シミュレータ上での18テラフロップス級及び1590億次元行列の厳密対角化計算:トラップされた強相関フェルミ原子ガスの基底状態探索(計算科学の基盤技術とその発展)
- 20507 地球シミュレータ・フルノードを利用した超大規模疎行列固有値の新規計算手法(大規模数値解析(2),OS11 大規模数値解析)
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 大規模SMPクラスタにおける固有値ライブラリの通信最適化について(並列数値計算, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 4011 地球シミュレータを用いた世界最大規模の固有値計算への挑戦(F-2 フォーラム「地球シミュレータにおける最適化およびハイエンドシミュレーション」)
- 強相関フェルミ原子ガスの量子物性 : 物性予測への新しいアプローチ
- 共有分散メモリ型並列計算機における新規通信手法
- 強相関電子系における超大規模固有値問題 : 地球シミュレータ上でのベクトル並列計算(数値シミュレーション)
- ハバードモデルの超大規模固有値問題に対する地球シミュレータでの並列計算法 (数値解析と新しい情報技術)
- 25aRD-10 光格子における擬CuO_2模型の提案(25aRD 量子エレクトロニクス(Fermi粒子系,及びBose-Fermi混合系の理論),領域1(原子・分子,量子エレクトロニクス,放射線物理))
- ベクトル計算機上でのRetry型アルゴリズム群について(数値計算)
- ベクトル計算機上での Retry 型アルゴリズム群について
- 性能安定型LAPACKの自動生成の試み(HPC-4 : 数値計算アルゴリズム(1))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 相対論的分子軌道コードDIRAにおけるDHF計算のベクトル化
- 分散メモリ型並列計算機における縦ブロック分割並列LU分解
- 複合並列計算機におけるADETRAN4処理系の実装について
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用
- 4倍精度基本線形代数ルーチン群QPBLASの紹介とアプリケーションへの応用