CUDAによる高速フーリエ変換(<特集>GPGPUコンピューティングの数理)
スポンサーリンク
概要
- 論文の詳細を見る
Latest GPUs have not only high computation power but also high memory bandwidth required to accelerate memory intensive computations like FFT. This paper presents a high performance FFT library for CUDA GPUs. It is important to use auto-tuning to exploit the best performance. As a result, the library achieved much higher than other existing libraries.
- 2010-06-25
著者
関連論文
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータのLinpack評価(GPGPUコンピューティングの数理)
- CUDAによる高速フーリエ変換(GPGPUコンピューティングの数理)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ソフトウェアECCによるGPUメモリの耐故障性の実現と評価(信頼性とセキュリティ,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- CUDAによる高速フーリエ変換
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータの Linpack 評価
- GPU向け耐メモリエラーソフトウェアフレームワーク
- GPU向け耐メモリエラーソフトウェアフレームワーク
- CUDA GPU向けの自動最適化FFTライブラリ
- GPUにおける耐故障性を考慮した数値計算の電力性能
- CUDA環境における高性能3次元FFT
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- GPUにおけるモデルに基づいた電力効率の最適化
- GPUにおけるモデルに基づいた電力効率の最適化
- GPUクラスタにおける省電力タスクスケジューリング
- 異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpackの性能向上手法
- GPUにおける性能と消費電力の相関性の解析
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 〜32GPUで700GFLOPS超を達成〜
- GPU向け耐メモリエラーソフトウエアフレームワーク
- GPU向け耐メモリエラーソフトウエアフレームワーク
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 : 32GPUで700GFLOPS超を達成
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- スーパコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成 (コンピューティングシステム Vol.4 No.4)