超並列マルチコアGPUを用いた高速演算処理の実用化 : 512個の32/64-bitプロセッサ・コアを1チップに集積したGPUの数値演算処理への応用(システムLSIアーキテクチャと組込みシステム-プロセッサ,メモリ,システムLSI,画像処理及び関連するソフトウェア)
スポンサーリンク
概要
- 論文の詳細を見る
PC/WS等に使用されるグラフィックスチップは、描画アルゴリズムの急速な進歩に対応するため、汎用の並列マルチコアGPUとなった。また必要な描画性能に対応するために、そのコア数は数百にも及ぶ。この計算資源をコンピュテーションの分野にも適応するためにNVIDIAは2006年にCUDAというSW/HWアーキテクチャを開発した。これにより、処理対象を階層的にスレッド記述するだけでHWが各コアに最適なスレッド割付を行い、効率良く超並列処理が実行できる。最新のGPU製品の単精度浮動小数点ピーク性能は1TFLOPSを超え、一昔前のスーパーコンピュータの性能をより身近なものとした。本論文では昨年末に発表された最新のFermiアーキテクチャをも含めて最新のGPUコンピューティング技術をご報告させていただく。
- 2010-01-21
著者
関連論文
- 超並列マルチコアGPUを用いた高速演算処理の実用化 : 512個の32/64-bitプロセッサ・コアを1チップに集積したGPUの数値演算処理への応用(システムLSIアーキテクチャと組込みシステム-プロセッサ,メモリ,システムLSI,画像処理及び関連するソフトウェア)
- 最先端LSI技術をキラーアプリ創出にいかにつなげるか?(システムLSIアーキテクチャと組込みシステム-プロセッサ,メモリ,システムLSI,画像処理及び関連するソフトウェア)