TCAノードにおけるランタイムバイナリアクセラレーションの検討(FPGA応用(2),リコンフィギャラブルシステム,一般)
スポンサーリンク
概要
- 論文の詳細を見る
我々は、Courierと呼ぶランタイムバイナリアクセラレーション(RBA)のためのツールチェインと、Trailblazerと呼ぶドメイン固有言語を開発している。RBAは、実行中のバイナリ(実行ファイル)の解析結果を元に、ユーザが指定した任意の部分をアクセラレータへ自動的にオフロードし、実行時間を短縮するものである。TCA(Tightly Coupled Accelerators:密結合並列演算加速機構)は、筑波大学を中心として開発が行われているスーパーコンピュータHA-PACSのノード内・ノード間通信機能を強化する機構である。具体的には、TCAに搭載されているPEACH2(PCI-Express Adaptive Communication Hub 2)の持つPCIeを介して、GPU同士の直接通信を行う。従来、本論文では、CourierとTCAの構成を概略し、どのようにTCAノードへCourierのホストCPU側の処理を移譲すべきかを検討する。
- 一般社団法人電子情報通信学会の論文
- 2013-05-13
著者
-
天野 英晴
慶應義塾大学大学院理工学研究科開放環境科学専攻コンピュータ科学専修
-
Hanawa T
筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
-
トーマス デビッド
Department of Electrical and Electronic Engineering, Imperial Collegem London, United Kingdom
-
宮島 敬明
慶應義塾大学大学院理工学研究科
-
トーマス デビッド
Department of Electrical and Electronic Engineering, Imperial Collegem London
-
天野 英晴
Faculty of Science and Technology, Keio University
-
久原 拓也
慶應義塾大学理工学部
-
塙 敏博
筑波大学システム情報工学研究科
-
トーマス デビッド
Department of Electrical and Electronic Engineering, Imperial College London, United Kingdom
-
宮島 敬明
慶應義塾大学 理工学部
関連論文
- 高性能・耐故障マルチリンクEthernet結合システムのNFSへの適用と評価(クラスタとグリッド技術)
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ:PEACH (集積回路)
- マルチパスネットワークを持つPCクラスタにおける動的経路制御システム(クラスタシステム)
- ディペンダブルな組込みシステムに適した省電力高性能通信機構(通信とグリッドII)
- OpenMPを用いた並列ベンチマークプログラムによる組込み向けマルチコアプロセッサの評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (ディペンダブルコンピューティング)
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (コンピュータシステム)
- コア温度情報を用いたOSによる細粒度パワーゲーティング制御方式の設計
- エラー検出・再送機能を備えた低消費電力オンチップルータの設計
- 誘導結合による3次元積層チップおよび転送技術の提案
- マルチレール相互結合網における通信プロファイリングに基づく性能最適化
- トラフィック量に適応する非対称マルチリンクEthernetトランキング
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- 仮想マシンとSpecCデバイスモデルを統合したデバイス故障エミュレータの実現
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 非対称な形状に適応する高バンド幅multi-link Ethernet
- 組込み機器向けon-chip/off-chipコア間通信機構
- 高性能・耐故障マルチリンクEthernet結合システムの性能評価
- ユーザ透過に利用可能な高性能・耐故障マルチリンクEthernet結合システム
- メモリバンド幅に着目したマルチコアノード上のアプリケーション最適化
- 演算加速装置に基づく超並列クラスタHA-PACSによる大規模計算科学
- コア温度の変化に適応するOSによる細粒度パワーゲーティング制御方式
- コア温度の変化に適応するOSによる細粒度パワーゲーティング制御方式
- スクリプト言語Xcryptによる格子QCDシミュレーションの最適化
- PCI Expressを用いた通信リンクPEARLにおけるネットワーク管理機構
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- アクセラレータを搭載した PC クラスタのための仮想環境の実装と評価
- 複数のFPGAを用いたデータフローマシン構築の検討(マルチFPGAシステム,FPGA応用及び一般)
- 超低電力アクセラレータSLD(Silent Large Datapath)の実機評価(FPGAアクセラレーター,FPGA応用及び一般)
- 超低電力アクセラレータSLD(Silent Large Datapath)の提案(FPGAアクセラレーター,FPGA応用及び一般)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)
- 動的部分再構成を利用した切替可能なAES S-box回路の評価(FPGA応用,FPGA応用及び一般)
- ネットワーク混合型Cell/B.E.のHigh Performance Linpackにおける評価(並列処理技術,組込み技術とネットワークに関するワークショップETNET2011)
- Impulse Cを用いたFPGAのリソースシェアリングと顔向き認識アルゴリズムの実装(画像処理)
- 低消費電力アクセラレータSLD-2の実装と評価(低消費電力化)
- 低電力アクセラレータSLD-1におけるアプリケーションプログラムの最適化(低消費電力化)
- FaSTARにおける流束の面積分計算高速化のためのOut-Of-Order機構(科学技術計算)
- Cell/B.E.クラスタにおけるMPI自動拡張ツールの実装と評価
- Cell Broadband Engine クラスタ向けスレッド仮想化環境におけるMapReduceフレームワークの実装と評価
- Cell/B.E.クラスタにおけるMPI自動拡張ツールの実装と評価
- Cell Broadband Engine クラスタ向けスレッド仮想化環境におけるMapReduceフレームワークの実装と評価
- VLIW ProcessorにおけるMixed Power Gatingの研究(ハードウェア,ネットワーク,クラウド及び一般)
- ランタイムバイナリアクセラレーションに向けたドメイン固有言語とツールチェインの提案 (リコンフィギャラブルシステム)
- 超低電力アクセラレータCMAにおける構成情報削減を目指したPEアレイ接続網の最適化 (リコンフィギャラブルシステム)
- 動的再構成プロセッサアレイMuCCRA-3のメモリコントローラの研究 (リコンフィギャラブルシステム)
- 高位合成言語向け自動最適化ツールの実装 (ディペンダブルコンピューティング)
- 高位合成言語向け自動最適化ツールの実装 (コンピュータシステム)
- 再構成回数削減による動的リコンフィギャラブルプロセッサの消費電力削減手法の提案 (コンピューティングシステム Vol.4 No.4)
- 高位合成における回路分割の実装 (コンピュータシステム・2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- 超低消費電力粗粒度再構成アクセラレータCMAのPEアレイアーキテクチャの最適化
- VLIW型プロセッサにおけるMixed Power Gatingの研究
- FPGAを用いたアクセラレーションシステムにおけるデータパス分類用優良類似度の考察(リコンフィギャラブル応用,デザインガイア2011-VLSI設計の新しい大地-)
- FaSTARのFPGA実装におけるOut-Of-Order機構の評価(リコンフィギャラブル応用,デザインガイア2011-VLSI設計の新しい大地-)
- 多電源可変パイプラインルータにおける電源ドメインサイズの解析(ネットワーク応用,FPGA応用及び一般)
- 多電源可変パイプラインルータにおける電源ドメインサイズの解析(ネットワーク応用,FPGA応用及び一般)
- 多電源可変パイプラインルータにおける電源ドメインサイズの解析(ネットワーク応用,FPGA応用及び一般)
- OpenCVとGPUを対象としたラインタイムバイナリアクセラレーション機構の試作と評価 (コンピュータシステム)
- 光空間リンクを用いた省配線・可変トポロジであるHPC相互結合網
- 光空間リンクを用いた省配線・可変トポロジであるHPC相互結合網
- SOTBを用いたマイコンの電力最適化
- SOTBを用いたマイコンの電力最適化
- 低消費電力アクセラレータCMA の計算完了の保証機構について
- 低消費電力アクセラレータCMA の計算完了の保証機構について
- Cell Broadband Engineクラスタ向けスレッド仮想化環境におけるMapReduceフレームワークの実装と評価(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- Cell Broadband Engineクラスタ向けスレッド仮想化環境におけるMapReduceフレームワークの実装と評価(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- Cell/B.E.クラスタにおけるMPI自動拡張ツールの実装と評価(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- Cell/B.E.クラスタにおけるMPI自動拡張ツールの実装と評価(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- ヘテロジニアスマルチコアプロセッサ向けアプリケーション開発(リコンフィギャラブル応用)
- ランタイムバイナリアクセラレーションに向けたドメイン固有言語とツールチェインの提案(高位合成と開発環境)
- 超低電力アクセラレータCMAにおける構成情報削減を目指したPEアレイ接続網の最適化(デバイスアーキテクチャと性能評価技術)
- 高位合成言語向け自動最適化ツールの実装(ディペンダブルコンピューティングシステム及び一般)
- 高位合成言語向け自動最適化ツールの実装(ディペンダブルコンピューティングシステム及び一般)
- FPUにおける細粒度パワーゲーティング制御手法の基礎的検討
- FPUにおける細粒度パワーゲーティング制御手法の基礎的検討
- FPGA設計コンテスト : 今までの報告と参加のお願い(学生/教養のページ)
- 低消費電力アクセラレータCMAのコプロセッサ化について(プロセッサアーキテクチャ,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- 高位合成における回路分割の実装(FPGA・メニーコア,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))
- OpenCVとGPUを対象としたラインタイムバイナリアクセラレーション機構の試作と評価(GPU・マルチコア,クラウド、ネットワーク及び一般)
- 低消費電力アクセラレータCMAの計算完了の保証機構について(省電力化機構,組込み技術とネットワークに関するワークショップETNET2013)
- 低消費電力アクセラレータCMAの計算完了の保証機構について(省電力化機構,組込み技術とネットワークに関するワークショップETNET2013)
- オンチップ・リークモニタによるランタイム・パワーゲーティングの制御にむけた損益分岐点の評価(応用設計, FPGA応用及び一般)
- オンチップ・リークモニタによるランタイム・パワーゲーティングの制御にむけた損益分岐点の評価(応用設計, FPGA応用及び一般)
- SOTBを用いたマイコンの電力最適化(省電力化機構,組込み技術とネットワークに関するワークショップETNET2013)
- ExpEtherを用いた単一ホスト構成マルチGPUシステムと複数ホスト構成との比較(計算機システム, FPGA応用及び一般)
- ExpEtherを用いた単一ホスト構成マルチGPUシステムと複数ホスト構成との比較(計算機システム, FPGA応用及び一般)
- オンチップ・リークモニタによるランタイム・パワーゲーティングの制御にむけた損益分岐点の評価(応用設計, FPGA応用及び一般)
- ExpEtherを用いた単一ホスト構成マルチGPUシステムと複数ホスト構成との比較(計算機システム, FPGA応用及び一般)
- SOTBを用いたマイコンの電力最適化(省電力化機構,組込み技術とネットワークに関するワークショップETNET2013)
- ホストから複数リンクを用いた低遅延ネットワークトポロジ(計算機システム, FPGA応用及び一般)
- ホストから複数リンクを用いた低遅延ネットワークトポロジ(計算機システム, FPGA応用及び一般)
- ホストから複数リンクを用いた低遅延ネットワークトポロジ(計算機システム, FPGA応用及び一般)
- Linuxスケジューラによるリークモニタを用いた細粒度パワーゲーティング制御手法と実チップにおける評価
- Linuxスケジューラによるリークモニタを用いた細粒度パワーゲーティング制御手法と実チップにおける評価
- TCAノードにおけるランタイムバイナリアクセラレーションの検討(FPGA応用(2),リコンフィギャラブルシステム,一般)
- 低消費電力アクセラレータCMAの演算終了時間における投機的データ収集機構の実装(開発環境と性能評価,リコンフィギャラブルシステム,一般)