分散共有メモリを用いた並列FFTとその最適化
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,高速なマイクロプロセッサItaniumを搭載した分散共有メモリシステムNEC Itanium ccNAMUサーバ(AzusA)上で並列FFT (Fast Fourier Transform) アルゴリズムを実装し,2^<24>点FFTの計算において8PEで3.12Gflops (ピーク性能の13.3%)という高い性能を引き出すことができた.分散共有メモリアーキテクチャで重要となるデータの配置方法の違いによる性能差を分析し,適した配置方法を選択した.また従来のキャッシユメモリを有効利用するFFTアルゴリズムに改良を加えin-placeアルゴリズムに対応させた.これにより使用するキャッシュメモリ量が少なくなり,より大きなサイズのFFTを計算する場合においても高い性能を出すことができる.
- 一般社団法人情報処理学会の論文
- 2003-05-15
著者
-
小柳 義夫
工学院大学
-
小柳 義夫
東京大学大学院情報理工学系研究科
-
額田 彰
科学技術振興機構戦略的創造研究推進事業
-
額 田
東大 大学院情報理工学系研究科
-
額 田
東京大学大学院情報理工学系研究科コンピュータ科学
-
小柳 義夫
東京大学
-
西 田
東京大学大学院情報理工学系研究科コンピュータ科学
関連論文
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- フィリップ・クレイトン, ザカリー・シンプソン編, 『宗教と科学ハンドブック』
- 座談会「計算工学の過去・現在・未来」?
- 行列計算ライブラリインタフェースSILCの分散並列環境への実装(HPC-14 : 分散環境(2))
- 計算環境に依存しない行列計算ライブラリインタフェースSILC(一般講演2)
- 1L-8 MPIを用いたハードディスクドライブシミュレータプログラムの並列化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 科学技術シミュレーションにて多用される代数的多重格子法の評価
- AMG法の自動パラメタ選択手法について
- AMG法のパラメタと性能に関する考察
- 領域分割による並列AMGアルゴリズム
- 並列直接解法によるSmoothed Aggregation MG法の改良と評価(高性能計算及び一般)
- 領域分割による並列AMGアルゴリズム
- 1L-6 GPGPUを利用した疎行列ソルバの高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1L-5 Cell/B.E.による疎行列ベクトル積の高速化(メニーコア・並列ソフトウェア,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 領域分割法とその並列化(数値計算アルゴリズムの研究)
- 領域分割法とその並列化
- PowerXCell 8iによる磁気記録シミュレータの高速化(マルチコア,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- PowerXCell 8iによる磁気記録シミュレータの高速化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- スーパーコンピュータと科学技術計算の最新動向
- 日本数学会編, 岩波 数学辞典 第4版, 岩波書店, 2007年
- 会長所感
- 木構造型ネットワークにおける最適ブロードキャストスケジューリング
- 木構造型ネットワークにおける最適Broadcastスケジューリング(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 分散共有メモリを用いた並列FFTとその最適化
- コモディティ分散共有メモリIBM x440 の性能評価
- 分散共有メモリを用いた疎行列アルゴリズムの細粒度並列処理とその最適化
- Globusを用いたGrid上での並列数値処理とその性能評価
- Globusを用いたGrid上での並列数値処理とその性能評価 (インターネットコンファレンス2002論文集)
- 情報科学から見た物理学(物理と情報)
- SC2003印象記
- ICIAM2003に参加して(1)(ICIAM'03報告)
- 科学とキリスト教
- エイズウイルス侵入のメカニズム
- 第14回 日本エイズ学会総会
- HIV病態におけるTH1・TH2
- ペタフロップス・コンピューティングの夢
- 第6回ヒトレトロウイルスと日和見感染症学会 : 基礎
- 免疫不全マウスを用いたウイルス感染モデル
- ハイパーフォーマンス・コンピューティングの現状と将来
- とびらの言葉
- スーパーコンピュータの現状と将来
- XMLビジネス標準開発のための設計情報アーキテクチャ
- 日本規格協会XML関連標準化調査研究委員会の活動
- GPGPUを用いたAMG法
- TSPにおけるアントコロニー最適化法のGPUによる高速化
- 流体解析を対象としたAMGライブラリの自動チューニング
- AMGライブラリのMPI/OpenMPハイブリッド並列による高速化
- エイズ研究に用いられる実験動物 (特集 HIV感染症--基礎と臨床) -- (基礎)
- HIV感染とエイズ発症のメカニズム
- 計算物理学とスーパーコンピュータ(フェロー)
- 第17代会長からのメッセージ(20周年記念)
- なぜスパコンは世界一を目指さなければならないのか(20周年記念)
- 学会事務センターの破綻とその後(20周年記念)
- Jacobi-Davidson 法の並列前処理とその性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 疎行列アルゴリズムのための共有メモリアーキテクチャ上でのBLASの並列化手法と性能評価
- 大規模固有値問題のためのJacobi-Davidson法とその特性について
- 2000-HPC-82-10 OpenMPを用いたJacobi-Davidson法の並列実装とその性能評価
- コンピュータとシミュレーション (20世紀科学革命の基礎--相対論,量子論から脳科学まで)
- 数値シミュレーションと超並列処理 (超並列処理)
- 大規模疎行列係数連立一次方程式に対する前処理つき共役勾配法の並列化
- 短距離力分子動力学法の並列化