低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価(科学技術計算)
スポンサーリンク
概要
- 論文の詳細を見る
ステンシル計算は科学技術計算において重要な計算カーネルの一つであるものの、その小さな演算密度のために、マルチコアプロセッサやGPGPUでは限られたメモリ帯域により実効性能が制約されてしまう。本研究では、複数のFPGAから成るシステムにおいて高性能ステンシル計算を実現するスケーラブルストリーミングアレイ(SSA)を提案する。SSAは、多段のパイプライン処理により、一定の外部メモリ帯域に対して線形の速度向上を実現する。本稿では、SSAの設計を示すと共に、複数のFPGAに対する性能モデルを導出する。9つのStratix III FPGAを用いて実装されたSSAは、僅か2GB/sの外部メモリ帯域に対してピーク性能の87.4%にあたる260GFlop/sの2次元ヤコビ計算を実現した。これは、中規模以上の計算サイズ対して得られる線形の速度向上によるものである。
- 2011-05-05
著者
-
山本 悟
東北大学大学院情報科学研究科
-
佐野 健太郎
東北大学大学院情報科学研究科
-
初田 義明
東北大学大学院情報科学研究科
-
中村 維男
東北大学大学院情報科学研究科
-
中村 維男
東北大
-
山本 悟
東北大学大学院
-
初田 義明
株式会社工房
-
高野 芳彰
東北大学大学院情報科学研究科
-
中村 維男
東京工業大学
関連論文
- 相変化を伴う超臨界水熱合成の数値シミュレーション(マルチフィジックスCFD/EFDの最前線)
- 「マルチフィジックスCFD/EFDの最前線」小特集号発刊にあたって(マルチフィジックスCFD/EFDの最前線)
- FPGAによるHPCのためのストリーム計算に関する一検討 : 2次元ヤコビ法のためのスケーラブルパイプラインモジュールの設計と評価(応用3)
- 暗号VLSIプロセッサのための固有電力消費アーキテクチャ
- 細粒度電力制御Cooled logic アーキテクチャ
- 第23回数値流体力学シンポジムウム報告
- 複数FPGA上で動作するスケーラブルア***ロセッサのためのGALS設計 (リコンフィギャラブルシステム)
- FPGAを用いた浮動小数点データストリーム高速圧縮のためのアルゴリズムの検討
- 蒸気タービン翼列における湿り蒸気流れの数値解法の現状
- 高性能差分法計算のためのFPGAアレイにおけるFPGA間通信機構の検討(チップ間通信,ルーティング,インターコネクト,デザインガイア2008-VLSI設計の新しい大地)
- 任意物質の圧縮性熱対流が計算できる数値解法(流体工学,流体機械)
- RC-003 複数FPGAによるアレイ型差分法専用計算機のためのFPGA間通信帯域評価(ハードウェア・アーキテクチャ,査読付き論文)
- 簡単なIB法による三次元任意形状物体周り流れの数値計算(流体工学,流体機械)
- アレイ構造に基づく差分法専用計算機のFPGA実装
- タービン多段静動翼列を通る湿り蒸気流れの大規模計算(マルチフィジックスCFDシミュレーションの産業応用)
- 1627 タービン多段翼列を通る湿り蒸気流れの陰的並列計算(J12-1 流体機械に関連した流体解析と数値最適化技術(1),J12 流体機械に関連した流体解析と数値最適化技術)
- 熱伝導方程式の差分解法と Excel を用いた計算
- 7・4・2 タービン流れ(7・4 圧縮性流れ, 7.流体工学,創立110周年記念機械工学年鑑)
- 多段タービン翼列を通る湿り蒸気流れの数値シミュレーション(流体工学,流体機械)
- FPGAによる数値流体力学専用計算機(リコンフィギャラブルシステム,一般)
- ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
- SOUNDコンピュータの試作
- ニューラルネットワークの学習におけるゲイン修正の有効性
- ディレー付きニューラルネットワークを用いた符号化・復号化
- ディレー素子内包型バックプロパゲーションニューラルネットワーク(BPD)の一構成
- パイプライン型アーキテクチャにおけるOR並列型Prolog実行の一検討
- パイプライン型Prologアーキテクチャにおける負荷分散の一検討
- 多項式高速アルゴリズムの統一と一般化
- 高速省電力ウェーブパイプライン用評価テスト回路の開発
- ウェーブパイプラインと従来方式パイプラインの性能評価
- 3値平衡光伝送符号について(技術談話室)
- Z^*_n中の原始元の簡略化した識別法について
- ベクトル量子化用コードブック生成のための並列弱肉強食アルゴリズムの性能解析
- LJ-11 視覚的画質劣化を抑制するベクトル量子化手法(J. グラフィクス・画像)
- ベクトル量子化のためのコードブック生成並列処理に関する研究
- ベクトル量子化のための並列コードブック生成アルゴリズムの性能評価(2.第1回情報シナジー研究会)
- 3DCGiRAMアーキテクチャによる実時間レイトレーシングシステム
- D-11-73 レイトレーシングハードウェアのための交差判定器の計算精度に関する一考察
- データ並列ボリュームレンダリングのためのボリューム適応分割手法
- J0501-2-5 実機規模蒸気タービン試験を対象とした湿り蒸気流れの数値シミュレーション(流体機械の研究開発におけるEFD/CFD(2))
- K-032 損失データ再送および属性限定受信に対応した映像配信システム(K分野:ヒューマンコミュニケーション&インタラクション)
- N-027 対話型映像再生に対応した業務用映像配信システム(N分野:教育・人文科学)
- J0101-1-2 相変化を伴う液体・超臨界流体の数値シミュレーション(エネルギーと環境問題におけるマルチフィジィックスCFDシミュレーション(1))
- 相変化を伴う超臨界水熱合成の数値シミュレーション
- J0501-2-6 部分流入タービンノズル段の全周流動解析による性能予測(流体機械の研究開発におけるEFD/CFD(2))
- 1101 Poly(dA)・poly(dT) DNAの自己組織化流動における分子構造の時空間変化(S14-1 制御と情報・生体への応用(1),S14 制御と情報・生体への応用)
- 「マルチフィジックスCFD/EFDの最前線」小特集号発刊にあたって
- 第23回 数値流体力学シンポジムウム報告
- J0101-1-3 相変化を伴う超臨界二酸化炭素の超音速流動シミュレーション(エネルギーと環境問題におけるマルチフィジィックスCFDシミュレーション(1))
- 三次元離散要素法によるダブルヘリカルリボン形粉体かくはん槽の数値シミュレーション(流体工学,流体機械)
- 複数FPGA上で動作するスケーラブルア***ロセッサのためのGALS設計(システムアーキテクチャ)
- メモリ帯域向上のための浮動小数点データストリームロスレス圧縮ハードウェア(数値計算)
- ベクトル量子化のためのコードブック生成専用プロセッサに関する研究
- 空間分割法に基づく高速コードブック生成アルゴリズムの提案と評価
- 3102 多段タービン翼列を通る湿りを伴う干渉流れの数値シミュレーション(OS-31A,OS-31 CFDの工学的応用)
- ターボ機械翼列を通る湿り空気・蒸気の乱流解析(OS23c 相変化・超臨界流体の計算力学)
- F0103(1) FPGAと高性能数値計算([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
- RC-011 差分法専用計算機におけるFPGA間時分割通信機構の遅延評価(ハードウェア・アーキテクチャ,査読付き論文)
- 飛行機雲の数値シミュレーション
- MMPDCLアルゴリズムに基づくコードブック生成専用プロセッサ(アーキテクチャ全般)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- 三次元圧縮性オイラー方程式の時間進行差分法
- 圧縮性オイラー方程式の解法に適する陰的時間進行法
- 3101 相変化を伴う流れ解析法の構築と実用化(キーノート講演,OS-31A,OS-31 CFDの工学的応用)
- 二次元自然対流問題による前処理形陰的流束分離スキームの検証(流体工学,流体機械)
- 遷音速ならびに超低速の非定常凝縮流れの数値解析(OS23c 相変化・超臨界流体の計算力学)
- マイクロチャンネル内超臨界流体の数値シミュレーション(OS23b 相変化・超臨界流体の計算力学)
- 前処理法とPeng-Robinson状態方程式に基づく気・液・固体の数値解法(OS23b 相変化・超臨界流体の計算力学)
- 429 GIS と前処理法に基づくエアロゾル輸送の数値解法
- 407 電離を考慮した軸対称電磁プラズマ粘性流れの数値解析(O.S.4-2 高エンタルピー流・内部診断)(O.S.4 圧縮性流れ・衝撃波)
- 低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価 (リコンフィギャラブルシステム)
- 非定常遷音速翼列流れの高解像差分スキーム(日本ガスタービン学会賞(第8回)報告)
- 非平衡凝縮・超臨界流体の数値解法とその応用
- 複数FPGA上で動作するスケーラブルア***ロセッサのためのGALS設計
- 反変速度成分のオイラーまたはナビエ・ストークス方程式を用いた遷音速翼列流れの計算
- 浮動小数点データ圧縮ハードウェアのための複数ストリーム符号化方式(FPGA応用,FPGA応用及び一般)
- 浮動小数点データ圧縮ハードウェアのための複数ストリーム符号化方式(FPGA応用,FPGA応用及び一般)
- 浮動小数点データ圧縮ハードウェアのための複数ストリーム符号化方式(FPGA応用,FPGA応用及び一般)
- J0501-1-5 非定常流動解析に基づく部分流入段の性能向上に関する研究([J0501-1]流体機械の研究開発におけるEFD/CFD(1))
- 518 任意物質の熱流動が計算できる前処理型数値解法の開発(2)(OS5-3 機能性流体工学の先端融合化,OS5 機能性流体工学の先端融合化,オーガナイズドセッション)
- 518 任意物質の熱流動が計算できる前処理型数値解法の開発(1)(OS5-3 機能性流体工学の先端融合化,OS5 機能性流体工学の先端融合化,オーガナイズドセッション)
- 低メモリ帯域で高性能ステンシル計算を実現するスケーラブルストリーミングアレイの試作と評価(科学技術計算)
- F0501-(3) 蒸気タービン湿り蒸気流れの大規模シミュレーション(【F0501】流体機械・エネルギー機器の研究開発における先端マルチフィジックスシミュレーション,先端技術フォーラム)
- 0603 超音速ノズルを通る超臨界二酸化炭素の数値シミュレーション(OS6-1 流体機械のCFD解析最前線,オーガナイズドセッション)
- 浮動小数点データストリーム圧縮ハードウェアの試作実装と評価(数値計算と高速化)
- 格子ボルツマン法による流体計算に対する密結合FPGAクラスタのスケーラビリティ評価(数値計算と高速化)
- ビルディングキューブ法に基づく非圧縮性流体専用計算機の性能見積もり(注目研究in CFD26,第26回数値流体力学シンポジウム)
- 異なるビット幅を扱う浮動小数点データストリーム圧縮ハードウェアの性能評価(FPGA回路, FPGA応用及び一般)
- 異なるビット幅を扱う浮動小数点データストリーム圧縮ハードウェアの性能評価(FPGA回路, FPGA応用及び一般)
- 異なるビット幅を扱う浮動小数点データストリーム圧縮ハードウェアの性能評価(FPGA回路, FPGA応用及び一般)
- 密結合FPGAクラスタの試作と格子ボルツマン計算の実装
- FPGAクラスタによる格子ボルツマン法専用計算機の実装と性能評価(FPGA計算応用, FPGA応用及び一般)
- FPGAクラスタによる格子ボルツマン法専用計算機の実装と性能評価(FPGA計算応用, FPGA応用及び一般)
- FPGAクラスタによる格子ボルツマン法専用計算機の実装と性能評価(FPGA計算応用, FPGA応用及び一般)
- 複数データストリームの帯域向上のための圧縮ハードウェアの実装と評価(FPGA応用(1),リコンフィギャラブルシステム,一般)
- 浮動小数点データストリーム圧縮ハードウェアの試作実装と評価
- ストリーム計算のための高位合成コンパイラの設計と実装(FPGA高位合成,FPGA応用及び一般)
- 複数ストリームのための帯域圧縮ハードウェアの実装と評価(再構成アーキテクチャ,FPGA応用及び一般)
- 格子ボルツマン法による流体計算に対する密結合FPGAクラスタのスケーラビリティ評価
- ストリーム計算のための高位合成コンパイラの設計と実装(FPGA高位合成,FPGA応用及び一般)
- 複数ストリームのための帯域圧縮ハードウェアの実装と評価(再構成アーキテクチャ,FPGA応用及び一般)