PCI-Expressに接続されたFPGAによる並列ループの効果的処理手法(デザインガイア2010 : VLSI設計の新しい大地)
スポンサーリンク
概要
- 論文の詳細を見る
PCI-Expressインターフェイスを搭載するFPGAの登場により,CPUやメモリとFPGA間のデータ転送速度が高くなった.しかしながら,HWの実行時間がデータ転送時間より長い場合,データ転送を一時停止させる必要がある.その結果,データ転送速度の低下を招くことになる.そこで,本稿では,データ並列性をもつループを対象とし,高いデータ転送速度を維持してFPGAでHW処理を行うReSTとReSTフレームワークを提案する.ReSTの構成は,専用のReSTフレームワークで生成される.実装評価により,ReSTが高いデータ転送速度でHW処理を実現できることを示す.
- 2010-11-23
著者
-
佐藤 幸紀
北陸先端科学技術大学院大学情報科学センター
-
井口 寧
北陸先端科学技術大学院大学
-
井口 寧
北陸先端科学技術大学院大学情報科学センター
-
荒木 光一
北陸先端科学技術大学院大学情報科学研究科
-
佐藤 幸紀
北陸先端科学技術大学院大学情報社会基盤研究センター
-
佐藤 幸紀
北陸先端科学技術大学院大学情報社会基盤センター
関連論文
- 北陸先端科学技術大学院大学共有計算サーバ使用成果報告2009
- 動的リコンフィギャラブルプロセッサにおける並列タスクのデータ転送を隠ぺいするための効果的な処理法(設計技術,リコンフィギャラブルシステムとその応用論文)
- 遠隔日本語学習コースウェアの設計条件 : システム・エンジニアのためのコースウェア開発に向けて
- 大規模サーバにおけるウイルス検査システムの運用法
- 没入型3次元仮想現実体感システムCAVEとAVSを用いたナノテク用新材料の電子状態の可視化(HPC-5 : 科学技術計算)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- サーバにおけるコンピュータウィルス検査システムの設計と運用(次世代のインターネット/分散システムの構築・運用技術)
- 没入型3次元仮想現実体感システムCAVEとAVSを用いたゼオライトの電子状態の可視化(HPC-3: 科学技術計算)
- FPGAを用いた音場シミュレーションシステム構築に関する検討(リコンフィギャラブルシステム,一般)
- 動的バイナリトランスレーションによるループネスト検出とプログラムチューニング支援への応用
- 動的バイナリトランスレーションによるループネスト検出とプログラムチューニング支援への応用
- 信頼性を考慮したグリッド向け自律分散ストレージシステム(グリッドシステム)
- 信頼性を考慮したキャンパスグリッド向け自律分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 信頼性を考慮したキャンパスグリッド向け自律分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- 信頼性を考慮したキャンパスグリッド向け自律分散ファイルシステム
- JAISTにおける共有計算サーバ環境 (北陸先端科学技術大学院大学共有計算サーバ使用成果報告2009)
- 北陸先端科学技術大学院大学共有計算サーバ使用成果報告2008
- JAISTにおける共有計算サーバ環境 (北陸先端科学技術大学院大学共有計算サーバ使用成果報告2008)
- 北陸先端科学技術大学院大学共有計算サーバ使用成果報告2007
- 実行時データ依存解析によるループ階層構造に着目した並列性抽出
- FPGAによる音場シミュレーションとその計算精度に関する検討
- ループ並列化のためのループ階層構造を検出する実行時プロファイリング手法(高性能計算とアクセラレータ)
- クラスタ型データパスによるスーパースカラプロセッサの低消費電力化(プロセッサアーキテクチャ)
- 命令の並列性と逐次性を利用したクラスタ型プロセッサの命令ステアリング方式(プロセッサアーキテクチャ)
- 命令の並列性と逐次性を利用したクラスタ型プロセッサの命令ステアリング方式
- 超並列シミュレーションとビジュアライゼーション
- FPGAを用いたオーディオ電子透かしの検出(応用2, FRGAとその応用及び一般)
- FPGAを用いたオーディオ電子透かしの検出(応用2, FRGAとその応用及び一般)
- FPGAを用いたオーディオ電子透かしの検出(応用2, FRGAとその応用及び一般)
- PCI-Expressに接続されたFPGAによる並列ループの効果的処理手法(デザインガイア2010 : VLSI設計の新しい大地)
- C112 日本語教育プログラムについて
- マルチコンテキスト型リコンフィギャラブルプロセッサにおけるデータ並列タスクの処理法(リコンフィギャラブルアーキテクチャ,デザインガイア2008-VLSI設計の新しい大地)
- 配線遅延を考慮したマルチスレッド方式アーキテクチャ : SHIFT Machineの提案
- JAIST Campus Grid の構築について
- 大規模計算サーバ用ストレージシステム
- CRAY-T3E/1200EにおけるNAS Parallel Benchmark
- 北陸先端科学技術大学院大学情報科学センタ利用の手引
- 力触覚提示装置を用いた書道用筆モデルの提案
- 超並列計算機向き相互結合網SRTにおける適応型ルーティング
- 超並列計算機向き相互結合網SRTのデッドロックフリー・ルーティング (並列処理)
- 超並列計算機向き相互結合網SRTにおける適応型ルーティング
- 超並列計算機向き相互結合網SRTにおける適応型ルーティング
- 超並列計算機向き相互結合網SRTにおける適応型ルーティング
- 超並列計算機におけるハードウェア高速化によるシステム性能の評価
- CRAY-T3E/1200EにおけるNAS Parallel Benchmark
- Loop-Call Context Treeを用いたランタイムデータフロー解析
- 北陸先端科学技術大学院大学 共有計算サーバ使用成果報告2010
- FPGAを用いたオーディオ電子透かしの超高速検出(研究速報)
- FPGAを利用した高速オーディオフィンガープリントシステムの構築(FPGAとその応用及び一般)
- FPGAを利用した高速オーディオフィンガープリントシステムの構築
- FPGAを利用した高速オーディオフィンガープリントシステムの構築
- FPGAを利用した高速オーディオフィンガープリントシステムの構築(FPGAとその応用及び一般)
- FPGAを利用した高速オーディオフィンガープリントシステムの構築(FPGAとその応用及び一般)
- FPGAを利用した高速オーディオフィンガープリントシステムの構築(FPGAとその応用及び一般)
- ループ構造に着目したマルチグレイン・マルチレイヤ並列処理システムの提案(Inventive and Creative Architecture特別セッションI)
- C-017 クラスタ化アーキテクチャにおける非重複分散レジスタファイルの評価(C分野:アーキテクチャ・ハードウェア)
- プログラムにおける命令の並列性と逐次性について(高速化手法)
- 高速データバスに接続されたFPGAにおけるHWボトルネックを解消するための設計フレームワーク (リコンフィギャラブルシステム)
- 温度予測モデルを用いた重み付けシフトによるウェーハスタック実装の放熱
- (並列・分散処理技術)1次元再帰シフトトーラス相互結合網の拡張(オブジェクト指向技術)
- ウェーハスタック実装の温度予測モデル
- 温度予測モデルを用いた重み付けシフトによるウェーハスタック実装の放熱
- 改良型重み付けシフトによる格子結合型ウェーハスタック実装の放熱と再構成
- 超並列システムの将来像と課題
- 分散メモリ型ネットワークインタフェースの提案と評価
- 重み付けシフトによる格子結合型ウェーハスタック実装の放熱と再構成
- 大規模サーバにおけるウイルス検査システムの運用法
- 力触覚提示装置を用いた書道用筆モデルの提案
- バイナリトランスレーションによるループ反復間のデータ依存解析
- 高速データバスに接続されたFPGAにおけるHWボトルネックを解消するための設計フレームワーク(設計フレームワーク)
- システムエンジニアを対象とした遠隔日本語学習コースウェアの開発
- 重み付けシフトによる格子結合型ウェーハスタック実装の放熱と再構成
- SRT相互結合網のウェーハスタック実装における冷却について
- マルチポートメモリを用いたハイパキューブ型マルチプロセッサシステム
- 超並列計算機用プロセッサ結合網 SRT : ネットワーク特性と故障回避アーキテクチャ
- 超並列計算機用プロセッサ結合網SRTネットワーク特性と故障回避アーキテクチャ
- Shifted Recursive Torus interconnection network for massively parallel computers
- Shifted Recursive Torus interconnection network for massively parallel computers
- 超並列計算機向きプロセッサ結合網SRT
- 超並列向きプロセッサ結合網Shifted Recursive Torus
- マルチポートメモリを用いたハイパーキューブ結合マルチプロセッサの通信性能
- マルチポートメモリを用いたハイパーキューブ型マルチプロセッサシステムの通信性能
- 北陸先端科学技術大学院大学 共有計算サーバ使用成果報告2011
- Amazon EC2 GPUクラウドにおけるOpenFOAM流体計算の性能評価
- e-Learningを意識したコースウェア設計の考え方
- システム・エンジニア向け日本語学習コースウェアの開発
- ウェブ版ロールプレイ練習のデザインに関する評価
- デュアルポートメモリを用いたハイパーキューブ型マルチプロセッサシステム
- 組込みシステムにおける再構成時間を考慮した低消費電力指向の設計フレームワークの提案(高位合成と開発環境,リコンフィギャラブルシステム,一般)
- 動的部分再構成による連想メモリ内エントリの定数化の検討(動的再構成,リコンフィギャラブルシステム,一般)
- 包囲型マイクロホン・スピーカアレイによる音空間レンダリングの試み(音響信号処理,聴覚,一般)