SMPクラスタにおける並列FFTのブロックアルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, SMPクラスタにおける並列一次元FFTのブロックアルゴリズムを提案する.提案する並列一次元FFTアルゴリズムは, six-step FFTアルゴリズムに基づいている.キャッシュミスの回数を減らすために, six-step FFTアルゴリズムはブロックnine-stepFFTに変更することができる.このブロックnine-stepFFTアルゴリズムではキャッシュメモリを効果的に利用することにより, 性能が改善されることを示す.ブロックnine-stepFFTアルゴリズムに基づいて, 並列一次元FFTをdual PentiumIII PC SMPクラスタに実装し, 性能評価を行った.その結果, 8ノードのdual PentiumIII 1GHz PC SMPクラスタでは1.3GFLOPSを越える性能を得ることができた.
- 2001-07-25
著者
関連論文
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- T2K筑波システムにおけるLinpack性能評価(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Short Vector SIMD命令を用いた並列FFTの実現と評価(性能最適化)
- 大規模固有値問題のmaster-worker型並列解法(数値計算)
- OmniRPCによるグリッド環境での大規模固有値問題の並列解法(数値アルゴリズム)
- "FIRST"-第一世代天体の起源解明のための専用・汎用計算機融合型クラスタ(HPC-8: 高性能クラスタ)
- EthernetマルチリンクによるPCクラスタ向け高バンド幅・耐故障ネットワークRI2N/UDP(ネットワーク)
- tagged-VLANとマルチリンクに基づくPCクラスタ向け高性能・耐故障ネットワークの実装と評価(Session 3:Cluster/Grid)
- VFREC-Net : ドライバ制御によるtagged-VLANを用いたPCクラスタ向けマルチパスネットワーク(ネットワーク)