疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
スポンサーリンク
概要
- 論文の詳細を見る
疎行列アルゴリズムの共有メモリアーキテクチャへの実装において,BLASレベルでの並列化を行うことにより,行列-ベクトル間演算レベルでの並列性を容易に記述することができる.本稿では,Level 1,2 BLASサブルーチン並列化の利点及び問題点について,SMP上での実装評価をもとに考察する.
- 一般社団法人情報処理学会の論文
- 2001-03-08
著者
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- フィリップ・クレイトン, ザカリー・シンプソン編, 『宗教と科学ハンドブック』
- 座談会「計算工学の過去・現在・未来」?
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 領域分割による並列AMGアルゴリズム
- 並列直接解法によるSmoothed Aggregation MG法の改良と評価(高性能計算及び一般)
- 領域分割による並列AMGアルゴリズム
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 領域分割法とその並列化(数値計算アルゴリズムの研究)
- 領域分割法とその並列化
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 線形計算ライブラリを用いた共役勾配法系固有値解法の設計と実装(HPC-9 : 数値解析II)
- スーパーコンピュータと科学技術計算の最新動向
- 日本数学会編, 岩波 数学辞典 第4版, 岩波書店, 2007年
- 会長所感
- 木構造型ネットワークにおける最適ブロードキャストスケジューリング
- 木構造型ネットワークにおける最適Broadcastスケジューリング(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散共有メモリを用いた並列FFTとその最適化
- コモディティ分散共有メモリIBM x440 の性能評価
- 分散共有メモリを用いた疎行列アルゴリズムの細粒度並列処理とその最適化
- Globusを用いたGrid上での並列数値処理とその性能評価
- Globusを用いたGrid上での並列数値処理とその性能評価 (インターネットコンファレンス2002論文集)
- 情報科学から見た物理学(物理と情報)
- SC2003印象記
- ICIAM2003に参加して(1)(ICIAM'03報告)
- 科学とキリスト教
- エイズウイルス侵入のメカニズム
- 第14回 日本エイズ学会総会
- HIV病態におけるTH1・TH2
- ペタフロップス・コンピューティングの夢
- 第6回ヒトレトロウイルスと日和見感染症学会 : 基礎
- 免疫不全マウスを用いたウイルス感染モデル
- ハイパーフォーマンス・コンピューティングの現状と将来
- とびらの言葉
- スーパーコンピュータの現状と将来
- XMLビジネス標準開発のための設計情報アーキテクチャ
- 日本規格協会XML関連標準化調査研究委員会の活動
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 高帯域ネットワークを用いたソフトウェア分散共有メモリの実現と性能評価(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- InfiniBandクラスタを用いた疎行列線形代数演算ライブラリの効率的な実装技術(HPC-6: 高速ネットワークとその応用)
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- エイズ研究に用いられる実験動物 (特集 HIV感染症--基礎と臨床) -- (基礎)
- HIV感染とエイズ発症のメカニズム
- 計算物理学とスーパーコンピュータ(フェロー)
- 第17代会長からのメッセージ(20周年記念)
- なぜスパコンは世界一を目指さなければならないのか(20周年記念)
- 学会事務センターの破綻とその後(20周年記念)
- Jacobi-Davidson 法の並列前処理とその性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 大規模固有値問題のためのJacobi-Davidson法とその特性について
- 2000-HPC-82-10 OpenMPを用いたJacobi-Davidson法の並列実装とその性能評価
- コンピュータとシミュレーション (20世紀科学革命の基礎--相対論,量子論から脳科学まで)
- 大規模疎行列係数連立一次方程式に対する前処理つき共役勾配法の並列化
- 短距離力分子動力学法の並列化