複数のFPGAを用いたデータフローマシン構築の検討(マルチFPGAシステム,FPGA応用及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
近年,物理学,化学,経済学といった種々の分野で科学技術計算が用いられている.その計算には,通常多くの浮動小数点演算が含まれており,汎用CPUでは実行効率が悪く,専用計算機上で実行されることが多い.アクセラレータとして使用されるデバイスは様々であるが,FPGAというリコンフィギャラブルデバイスは,微細化による組込み素子の増大に伴い,比較的安価である点,柔軟なメモリアクセスを実現できる点から広く利用されてきた.しかし,FPGA上にアプリケーションを実装することは,アルゴリズムといった理論の研究者にとっては困難であるという問題がある.そこで,本研究では,ALUアレイを構成し,それを利用してストリーム処理を行うことができるシステムを提案,設計する.これにより,ALUへの命令とALU間の接続情報及び演算データを用意することで,ハードウェア上での実行が可能となることを目的とした.また,専用計算機上で実行した場合の性能の目安となることも同様に目的とした.MUSCLという計算流体力学のアプリケーションを用いて評価した結果,演算部分の性能は2.4GHzのIntel Core 2Duo上での実行に対して,約4.1倍が期待できることがわかった.また,パイプライン利用率が専用計算機との比較において大きな割合を占めることがわかった.
- 2011-01-10
著者
-
長名 保範
成蹊大学理工学部
-
天野 英晴
慶應義塾大学
-
天野 英晴
慶應義塾大学理工学部情報工学科
-
田舎片 健太
慶應義塾大学理工部情報工学科
-
森下 博和
慶應義塾大学理工部情報工学科
-
藤田 直行
宇宙航空研究開発機構研究開発本部
-
天野 英晴
慶應義塾大学大学院理工学研究科計算機科学専攻
-
天野 英晴
慶應義塾大学理工学部
-
田舎片 健太
慶応義塾大学理工学部情報工学科
-
藤田 直行
宇宙航空研究開発機構
-
藤田 直行
宇宙航空研究開発機構総合技術研究本部計算科学研究グループ
-
天野 英晴
慶應義塾大学 理工学部
関連論文
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(計算機システム)
- 5K-7 省電力MIPSプロセッサコア評価のための計算機システムのFPGAによる試作(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- FPGAアレイCubeを用いたレーベンシュタイン距離計算の性能評価(応用1)
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ClearSpeed製SIMD型マルチコアプロセッサにおける並列アプリケーション実行時間予測手法の検討(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 代理処理の範囲拡大によるサーバ電力使用量削減のための基礎検討
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 動的リコンフィギャラブルデバイスにおける電力分析と低電力化手法の検討(コンピュータシステム)
- ClearSpeed製SIMDプロセッサの通信性能評価(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ハイパフォーマンスコアとローパワーコアの組み合わせにおける細粒度動的スリープ制御の実装と評価(組込みシステムプラットフォーム)
- Network-on-Chipにおけるエラー検出・訂正方式に関する研究(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- マルチパスイーサネットにおけるOn/Offリンクアクティベーション法の評価(ネットワーク,クラウド及び一般)
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- 動的リコンフィギャラブルデバイスにおける構成情報配送のためのマルチキャスト手法の検討(コンピュータシステム)
- Dua-Vthセルの利用による動的リコンフィギャラブルプロセッサのリーク電力削減の評価(デバイスアーキテクチャ1)
- 動的リコンフィギャラブルプロセッサMuCCRA-3の実機評価(リコンフィギャラブルアーキテクチャ)
- FPGAを用いた汎用生化学シミュレータにおけるハードウェアモジュール自動生成アルゴリズムの実機評価(リコンフィギャラブル応用)
- CFD専用計算機FLOPS-2Dへ向けたUPACS制限関数群モジュール化の検討(リコンフィギャラブル応用)
- FPGAによるUPACSサブルーチンの高速化(リコンフィギャラブル応用)
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 並列計算機ASCAの要素プロセッサによる近細粒度並列処理
- C言語実装を用いたインタプリタ方式の命令エミュレーション性能の向上(コンピュータシステム)
- 低エネルギーを目的とした大規模リコンフィギャラブルプロセッサアレイSMAの予備評価(リコンフィギャラブルアーキテクチャ,デザインガイア2008-VLSI設計の新しい大地)
- Rearrangeable NoC:配線遅延を考慮した分散ルータアーキテクチャ(Inventive and Creative Architecture特別セッションIII)
- 省電力MIPSプロセッサにおけるOSの試作とシミュレーションによる電力評価(セッション7:資源管理)
- 性能予測モデルの学習と実行時性能最適化機構を有する省電力化スケジューラ(省電力方式)
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(低消費電力)
- スーパースカラプロセッサにおける細粒度動的スリープ制御の実装と評価(低消費電力,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- スーパースカラプロセッサにおける細粒度動的スリープ制御の実装と評価(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- MIPS R3000における細粒度動的スリープ方式の提案(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- MIPS R3000における細粒度動的スリープ方式の提案(低消費電力化技術(1),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- Splitエコー命令によるコードサイズ削減(プロセッサ)
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- LAN領域での高性能並列処理に適したネットワークスイッチ用ASIC(システムLSIのための先進アーキテクチャ論文)
- 高性能計算をサポートするネットワークインタフェース用コントローラチップMartini
- RHiNETネットワークインタフェースの性能評価
- PLIを用いたネットワークインタフェースコントローラとホストプログラムの協調シミュレーション
- RHiNETスイッチ : RHiNET-2, 3/SW
- RHiNET/MEMOnetネットワークインタフェース用コントローラチップMartiniの予備評価
- RHINETの概要とMartiniの設計/実装
- RHiNETネットワークインタフェースプロトタイプの性能評価
- 高速性と柔軟性を併せ持つネットワークインタフェース用チップ:Martini
- LASN用10Gbps/port 8x8ネットワークスイッチ:RHiNET-3/SW
- 光インタコネクトを使った高速転送におけるフロー制御手法
- 150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
- スレッドレベル並列性を活かす科学技術計算用FPGAシステムの提案(Inventive and Creative Architecture特別セッションIII)
- FPGAを用いた生化学シミュレータにおける反応速度式の類似性に着目した演算パイプライン自動結合アルゴリズム(リコンフィギャラブル応用)
- FPGA上でのシミュレーションに向けた生化学モデルコンパイラの実装(コンピュータシステム)
- FPGAを用いた生化学シミュレータにおける入力ポート制約を考慮した演算パイプラインスケジューリング(応用3)
- 高速アルゴリズムを適用したデータ駆動型確率モデル生化学シミュレータのFPGAへの実装と評価(応用事例,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 生化学シミュレータReCSiPにおける反応速度式共有化(アプリケーション,リコンフィギャラブルシステム,一般)
- FPGAを用いた確率モデル生化学シミュレータ(リコンフィギャラブルシステム)
- FPGAを用いた確率モデル生化学シミュレータ
- ReCSiPボードにおける汎用ホストインターフェイスの実装と評価(リコンフィギャラブルシステム,一般)
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- HOSMII:DRAM混載型FPGAに基づく仮想ハードウェアシステム
- 仮想ハードウェアWASMIIのためのデータフローコンパイラの研究
- データ駆動型制御機構付き MPLD を用いた並列処理マシン WASMIIの仮想化
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- リコンフィギャラブルプロセッサDRP上でのエッジ近傍合成機能付きαブレンダの実装(FPGAとその応用及び一般)
- 動的な部分再構成デバイスを用いた仮想ハードウェアシステム
- キャッシュ制御機構を持つスイッチ結合型並列計算機SNAIL-2の評価
- 多重出力可能なMINの命令レベルシミュレータによる評価(EVA-2:並列処理と評価)
- キャッシュ制御用マルチキャストネットワークMINCチップを用いたスイッチ結合型並列計算機SNAIL-2の評価
- スイッチ結合型マルチプロセッサSNAIL-2のデータ転送用ネットワークPBSFの評価
- ExpEtherにおけるRDMA通信のためのソフトウェア環境の構築(ARC-10:クラスタ技術,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ExpEtherにおけるRDMA通信機構の実装(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- 動的リコンフィギャラブルプロセッサMuCCRAの結合網に関する研究(バス・配線アーキテクチャ,FPGA応用及び一般)
- クラウドコンピューティング環境におけるふくそう制御方式の適用領域評価
- クラウドコンピューティング環境における最適複数資源同時割り当てとふくそう制御方式
- マルチパスイーサネットにおける省電力On/Offリンクアクティベーション法(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSS型MINに基づくマルチプロセッサSNAIL
- Localメモリを持つ共有メモリ型並列計算機を効果的に使用するための環境EULASH
- ローカルメモリを持つ共有メモリ型並列計算機用OSの設計と実装
- SSS型MINに基づくマルチプロセッサSNAILの実装と評価
- ネットワークとサーバの連携によるトータル電力使用量削減を実現する接続信号シーケンスの提案
- B-7-54 複数種別資源同時割り当てを前提とした公平性実現アルゴリズムの提案(B-7.情報ネットワーク,一般セッション)
- B-7-53 ネットワークとエンドシステムの連携によるトータル電力使用量削減のため接続信号シーケンス(B-7.情報ネットワーク,一般セッション)
- マルチFPGAプラットフォームFLOPS-2Dにおける演算パイプラインの実装(リコンフィギャラブル応用3)
- FPGAを用いた高スループット確率モデル生化学シミュレータの設計と評価
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案(高信頼化技術・設計技術)
- 代理応答・処理の範囲拡大によるサーバ電力使用量削減方式の提案(省エネルギー)
- マルチFPGAシステムFLOPS-2Dに向けたパイプライン構築手法の検討(HPCとアーキテクチャ,デザインガイア2009 VLSI設計の新しい大地)
- RC-012 FPGAに基づく生化学シミュレータにおける反応速度式の類似性に着目したパイプライン自動構築(ハードウェア・アーキテクチャ,査読付き論文)
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案
- 複数のFPGAを用いたデータフローマシン構築の検討(マルチFPGAシステム,FPGA応用及び一般)
- 複数のFPGAを用いたデータフローマシン構築の検討(マルチFPGAシステム,FPGA応用及び一般)
- 複数のFPGAを用いたデータフローマシン構築の検討(マルチFPGAシステム,FPGA応用及び一般)