PCクラスタにおける並列一次元FFTのブロックアルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,PCクラスタにおける並列一次元FFTのブロックアルゴリズムを提案する.提案する並列一次元FFTアルゴリズムは,six-step FFTアルゴリズムに基づいている.キャッシュミスの回数を減らすために,six-step FFTアルゴリズムはブロックnine-stepFFTに変更することができる.このブロックnine-step FFTアルゴリズムではキャッシュメモリを効果的に利用することにより,性能が改善されることを示す.ブロックnine-step FFTアルゴリズムに基づいて,並列一次元FFTをdual PentiumIII PC SMPクラスタに実装し,性能評価を行った.その結果,8ノードのdual PentiumIII 1GHz PC SMPクラスタでは1.3GFLOPSを超える性能を得ることができた.
- 2002-09-15
著者
関連論文
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- Relis-G : 計算グリッドのための遠隔ライブラリインストール機構(グリッド)
- GridRPCシステムにおけるリモートプログラムシッピング機構(グリッド)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- OmniRPCによるグリッド環境での大規模固有値問題の並列解法(数値アルゴリズム)
- Omni/SCASHにおける実行時性能評価に基づく動的負荷分散拡張の実装と評価
- Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- 超並列計算機CP-PACSにおけるNAS-PBの仮想評価
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- ハイパクロスバ・ネットワークのスループットの理論的解析
- ハイパクロスバ網における適応ルーチングの導入とその評価
- ハイパクロスバ・ネットワークの転送性能の解析
- ハイパクロスバ・ネットワークにおけるバッファの利用法と転送性能について
- ハイパクロスバ・ネットワークにおけるバーチャル・カット・スルーの性能評価
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- PCクラスタにおけるDVS制御による電力性能の最適化(ARC-3: 低電力アーキテクチャ1, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- OpenGRコンパイラの設計および開発
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 超並列相互結合網におけるバッファ制御方式の改良
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- 対話型OpenMPプログラム作成支援ツールの開発(ARC-9:ハイパフォーマンスコンピューティング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- プロセッサの消費電力測定と低消費電力プロセッサによるクラスタの検討(省電力)
- 低消費電力プロセッサによるクラスタの検討(ARC-6:低消費電力化)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- HPC向けオンチップメモリプロセッサアーキテクチャSCIMAのSMP化の検討と性能評価
- 超並列ネットワーク・シミュレータ生成系INSPIREにおけるネットワーク記述検証システムの実装
- ハイパクロスバ網における迂回ルーティング・アルゴリズムに関する研究
- 並列処理ネットワークのための性能評価用シミュレータ生成系INSPIRE
- NASPB CG, FTにおけるSCIMAの性能評価
- 超並列計算機CP-PACSにおけるNPB Kernel CGの評価(並列処理)
- 超並列計算機CP-PACSのネットワーク性能評価
- 超並列計算機CP-PACSの基本性能評価
- 方式レベル記述言語AIDLを用いた高性能プロセッサ設計支援
- 擬似ベクトルプロセッサにおける高速リストベクトル処理
- 超並列計算機CP-PACSのCGベンチマークによる性能評価
- 並列計算機の仮想性能評価システムVIPPES
- ハイパクロスバ・ネットワークにおけるVirtual Channelの動的選択による適応ルーティング
- 2. 超並列計算機 CP-PACS のアーキテクチャ ( 計算物理学と超並列計算機 : CP-PACS計画)
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 超並列計算機のためのCommodity Networkに基づく並列入出力・可視化システム
- CP-PACSのアーキテクチャの概要
- P2P分散システムXtremWeb上でのGrid RPCシステムOmniRPCの設計(HPC-7 : グリッド(2))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- University of California, Department of Applied Science at Lawrence Livermore National Laboratory訪問記(海外,ラボラトリーズ)
- It's still the Bandwidth!
- これでいいのか?日本のスパコン
- CONFLEX-G : OmniRPCによるグリッド環境上での分子立体配座探索プログラムの実装と性能評価(グリッド応用)
- OmniRPCによる広域ネットワーク環境でのグリッドアプリケーションの性能評価(HPC-5 : グリット(1))(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- OmniRPCによるグリッド環境での大規模固有値問題の並列解法 (数値解析と新しい情報技術)
- 重力計算専用計算機GRAPE-6のリモートアクセス環境(HPC環境とその応用)
- 分散メモリ型並列計算機における並列入出力システム
- スライドウィンドウ方式による擬似ベクトルプロセッサ
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサ
- 擬似ベクトルプロセッサによるリストベクトル処理
- ハイパークロス網の拡張について
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化(数値計算)
- MPI上のソフトウェア分散共有メモリシステム(並列処理のためのシステム)
- Omni/SCASHおけるFirst Touch page allocation の実装(ARC-9:ハイパフォーマンスコンピューティング)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 高バンド幅/耐故障性を持つクラスタ向けネットワークRI2Nの性能評価(HPC-4 : ネットワーク)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ユーザレベルでのマルチリンク利用による高バンド幅/耐故障性を持つクラスタ向け結合ネットワークRI2N
- ヘテロなクラスタ環境におけるStrassenの行列積アルゴリズムの並列化
- ItaniumプロセッサによるSCoreクラスタ構築に関する検討(高性能計算及び一般)
- SMP-PCクラスタにおけるSPAM粒子シミュレーションのハイブリッド並列化
- PCクラスタにおける並列一次元FFTのブロックアルゴリズム
- SR8000におけるOpenMPベンチマーク
- SR8000におけるOpenMPベンチマーク
- ハイパフォーマンスコンピューティング向けアーキテクチャSCIMA
- マルチバンクメモリ上における擬似ベクトルプロセッサPVP-SWの性能評価
- 擬似ベクトルプロセッサPVP-SWのシミュレーション評価
- PVP-SWとハイパクロスバ・ネットワークを用いた計算機の評価
- ハイパクロスバ・ネットワークにおけるNASベンチマークの評価
- スライドウィンドウ方式に基づく擬似ベクトルプロセッサの評価
- ハードウェア記述言語によるsuperscalar及びVLIWプロセッサの設計とその比較
- 方式レベル記述言語AIDLの改良
- 2000-HPC-82-31 汎用可視化ツールAVS/Expressの並列化とその性能評価
- 並列入出力機構を用いた可視化システムの提案
- 超並列計算機CP-PACSにおける大規模分子動力学法シミュレーション (並列処理)
- CP-PACSにおける空間分割法による分子動力学法シミュレーション
- ハイパクロスバ・ネットワークにおける適応ルーティングの実現方法とその評価
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- SPAM粒子シミュレーションコードのハイブリッド並列化
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- PCクラスタにおけるTDLを用いたOpenMPコンパイラ
- 大規模並列処理ネットワークにおけるランダム転送性能の評価
- HPC向けプロセッサのメモリ・アーキテクチャの基本構成
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- オンチップメモリを用いたHPCプロセッサの検討
- ハイパクロスバ・ネットワークの性能評価
- 並列計算機ネットワーク用ルータ・チップの自動設計システム (機能論理設計, アーキテクチャ設計支援と一般)
- ハイパクロスバ ・ネットワークにおける並列ソート処理