低消費電力アクセラレータCMAの計算完了の保証機構について(省電力化機構,組込み技術とネットワークに関するワークショップETNET2013)
スポンサーリンク
概要
- 論文の詳細を見る
Cool Mega-Array (CMA)は高性能低電力アクセラレータのための新たなアーキテクチャである.このCMAの問題点として,PEアレイが組み合わせ回路で構成されているためにより,計算が完了する時間がわからないこと,つまり計算の完了が保証できないことが挙げられる.現状ではプログラマは計算完了時間を予測してコードに記述しているが,これは,アプリケーションごとに異なる値であり,温度や電圧によっても左右されるため,現実的ではない.よって,本研究では,PEアレイでの消費電力,面積,及びアプリケーション搭載の可用性に悪影響を与えることなく,アプリケーションの実行完了の保証を行う機構について提案,実装した.今回の提案手法では,計算の完了を示す信号をPEアレイ内で転送することにした.この計算完了信号は計算開始と同時にPEアレイに人力され,計算完了後に出力される.これをコントローラが監視していることによって計算の完了を探知することができる.また,各PE内に遅延線を設計し,演算の種類によって各PEの計算完了信号を次のPEに出力するようにした.これらの機構により,面積1.15 %増,電力0.448%増に抑えつつ,プログラマがコードに計算完了時間を記述する必要をなくすことに成功した.
- 2013-03-06
著者
-
天野 英晴
慶應義塾大学
-
小崎 信明
慶應義塾大学理工学部
-
天野 英晴
慶應義塾大学 理工学部
-
天野 英晴
慶應義塾大学大学院理工学研究科開放環境科学専攻コンピュータ科学専修
-
小崎 信明
慶應義塾大学理工学研究科
-
津坂 章仁
慶應義塾大学大学院理工学研究科
-
宇野 理恵
慶應義塾大学大学院理工学研究科
-
伊澤 麻衣
慶應義塾大学大学院理工学研究科
-
小崎 信明
慶應義塾大学大学院理工学研究科
関連論文
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(計算機システム)
- 5K-7 省電力MIPSプロセッサコア評価のための計算機システムのFPGAによる試作(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- FPGAアレイCubeを用いたレーベンシュタイン距離計算の性能評価(応用1)
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ClearSpeed製SIMD型マルチコアプロセッサにおける並列アプリケーション実行時間予測手法の検討(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ClearSpeed製コプロセッサの並列ベンチマークによる性能評価と性能向上手法の提案(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- メモリ周りに制約を有するMPUにおけるプリフェッチ機能付メモリモジュールの意義(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 動的リコンフィギャラブルデバイスにおける電力分析と低電力化手法の検討(コンピュータシステム)
- ClearSpeed製SIMDプロセッサの通信性能評価(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ハイパフォーマンスコアとローパワーコアの組み合わせにおける細粒度動的スリープ制御の実装と評価(組込みシステムプラットフォーム)
- Network-on-Chipにおけるエラー検出・訂正方式に関する研究(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- DIMMnet-3ネットワークインタフェースにおけるMPI支援機能(ARC-6:相互結合網,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- DIMMnet-2ネットワークインタフェースコントローラの設計と実装(HPCハードウェア)
- DIMMスロット装着型デバイスDIMMnet-2の改良方針(ARC-7: ネットワークインタフェースとルーティング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- マルチパスイーサネットにおけるOn/Offリンクアクティベーション法の評価(ネットワーク,クラウド及び一般)
- DIMMスロット搭載型ネットワークインターフェースDIMMnet-1とその低遅延通信機器AOTF
- 動的リコンフィギャラブルデバイスにおける構成情報配送のためのマルチキャスト手法の検討(コンピュータシステム)
- Dua-Vthセルの利用による動的リコンフィギャラブルプロセッサのリーク電力削減の評価(デバイスアーキテクチャ1)
- 動的リコンフィギャラブルプロセッサMuCCRA-3の実機評価(リコンフィギャラブルアーキテクチャ)
- FPGAを用いた汎用生化学シミュレータにおけるハードウェアモジュール自動生成アルゴリズムの実機評価(リコンフィギャラブル応用)
- CFD専用計算機FLOPS-2Dへ向けたUPACS制限関数群モジュール化の検討(リコンフィギャラブル応用)
- FPGAによるUPACSサブルーチンの高速化(リコンフィギャラブル応用)
- 低遅延オンチップネットワークのための予測ルータの評価(組込みシステムプラットフォーム)
- 並列計算機ASCAの要素プロセッサによる近細粒度並列処理
- C言語実装を用いたインタプリタ方式の命令エミュレーション性能の向上(コンピュータシステム)
- 低エネルギーを目的とした大規模リコンフィギャラブルプロセッサアレイSMAの予備評価(リコンフィギャラブルアーキテクチャ,デザインガイア2008-VLSI設計の新しい大地)
- Rearrangeable NoC:配線遅延を考慮した分散ルータアーキテクチャ(Inventive and Creative Architecture特別セッションIII)
- 省電力MIPSプロセッサにおけるOSの試作とシミュレーションによる電力評価(セッション7:資源管理)
- 性能予測モデルの学習と実行時性能最適化機構を有する省電力化スケジューラ(省電力方式)
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(低消費電力)
- スーパースカラプロセッサにおける細粒度動的スリープ制御の実装と評価(低消費電力,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- スーパースカラプロセッサにおける細粒度動的スリープ制御の実装と評価(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- MIPS R3000における細粒度動的スリープ方式の提案(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- MIPS R3000における細粒度動的スリープ方式の提案(低消費電力化技術(1),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- Splitエコー命令によるコードサイズ削減(プロセッサ)
- DIMMnet通信インタフェース用パケット伝送レイヤ
- bDais : DIMMnet-1/InfiniBand間ルータの評価(ARC-9 : 相互結合網II)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- LAN領域での高性能並列処理に適したネットワークスイッチ用ASIC(システムLSIのための先進アーキテクチャ論文)
- 高性能計算をサポートするネットワークインタフェース用コントローラチップMartini
- RHiNETネットワークインタフェースの性能評価
- PLIを用いたネットワークインタフェースコントローラとホストプログラムの協調シミュレーション
- RHiNETスイッチ : RHiNET-2, 3/SW
- RHiNET/MEMOnetネットワークインタフェース用コントローラチップMartiniの予備評価
- RHINETの概要とMartiniの設計/実装
- RHiNETネットワークインタフェースプロトタイプの性能評価
- 高速性と柔軟性を併せ持つネットワークインタフェース用チップ:Martini
- LASN用10Gbps/port 8x8ネットワークスイッチ:RHiNET-3/SW
- 光インタコネクトを使った高速転送におけるフロー制御手法
- 150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
- スレッドレベル並列性を活かす科学技術計算用FPGAシステムの提案(Inventive and Creative Architecture特別セッションIII)
- FPGAを用いた生化学シミュレータにおける反応速度式の類似性に着目した演算パイプライン自動結合アルゴリズム(リコンフィギャラブル応用)
- FPGA上でのシミュレーションに向けた生化学モデルコンパイラの実装(コンピュータシステム)
- FPGAを用いた生化学シミュレータにおける入力ポート制約を考慮した演算パイプラインスケジューリング(応用3)
- 高速アルゴリズムを適用したデータ駆動型確率モデル生化学シミュレータのFPGAへの実装と評価(応用事例,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 生化学シミュレータReCSiPにおける反応速度式共有化(アプリケーション,リコンフィギャラブルシステム,一般)
- FPGAを用いた確率モデル生化学シミュレータ(リコンフィギャラブルシステム)
- FPGAを用いた確率モデル生化学シミュレータ
- ReCSiPボードにおける汎用ホストインターフェイスの実装と評価(リコンフィギャラブルシステム,一般)
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- HOSMII:DRAM混載型FPGAに基づく仮想ハードウェアシステム
- 仮想ハードウェアWASMIIのためのデータフローコンパイラの研究
- データ駆動型制御機構付き MPLD を用いた並列処理マシン WASMIIの仮想化
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DIMMnet-2における通信ライブラリMPI-2の実現(通信と同期, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- リコンフィギャラブルプロセッサDRP上でのエッジ近傍合成機能付きαブレンダの実装(FPGAとその応用及び一般)
- 動的な部分再構成デバイスを用いた仮想ハードウェアシステム
- キャッシュ制御機構を持つスイッチ結合型並列計算機SNAIL-2の評価
- 多重出力可能なMINの命令レベルシミュレータによる評価(EVA-2:並列処理と評価)
- キャッシュ制御用マルチキャストネットワークMINCチップを用いたスイッチ結合型並列計算機SNAIL-2の評価
- スイッチ結合型マルチプロセッサSNAIL-2のデータ転送用ネットワークPBSFの評価
- ExpEtherにおけるRDMA通信のためのソフトウェア環境の構築(ARC-10:クラスタ技術,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ExpEtherにおけるRDMA通信機構の実装(メッセージ通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- 動的リコンフィギャラブルプロセッサMuCCRAの結合網に関する研究(バス・配線アーキテクチャ,FPGA応用及び一般)
- マルチパスイーサネットにおける省電力On/Offリンクアクティベーション法(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SSS型MINに基づくマルチプロセッサSNAIL
- Localメモリを持つ共有メモリ型並列計算機を効果的に使用するための環境EULASH
- ローカルメモリを持つ共有メモリ型並列計算機用OSの設計と実装
- SSS型MINに基づくマルチプロセッサSNAILの実装と評価
- 革新的電源制御による超低消費電力高性能システムLSIの構想(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 革新的電源制御による超低消費電力高性能システムLSIの構想(低消費電力化技術(2),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- FPGAを用いた生化学シミュレータ向けSBML処理系の構築(リコンフィギャラブル応用I)
- パワーゲーティングを適用した動的リコンフィギャラブルプロセッサの設計と評価(デバイスアーキテクチャ)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の通信性能評価
- 動的再構成可能プロセッサを用いた組み込み向け複数暗号処理エンジンの実装(セキュリティ・暗号1, 組込技術とネットワークに関するワークショップ)
- 動的リコンフィギャラブルプロセッサを用いたIPsecアクセラレータの設計と実装(アプリケーションI)(リコンフィギャラブルシステムにおける設計技術及び一般)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- リコンフィギャラブルプロセッサ上でのブロック暗号RC6の実装(FPGAとその応用及び一般)
- AT-2-1 動的リコンフィギャラブルプロセッサMuCCRA(AT-2.リコンフィギュラブルデバイスとCAD技術,パネルセッションチュートリアルセッション,ソサイエティ企画)
- 反応を伴った圧縮性流体計算によるRHiNET-2の評価(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(CPSY-6並列分散ソフトウェア)
- コア温度情報を用いたOSによる細粒度パワーゲーティング制御方式の設計
- エラー検出・再送機能を備えた低消費電力オンチップルータの設計
- 誘導結合による3次元積層チップおよび転送技術の提案
- 並列分散処理環境RHiNET-2システムの実装と評価(コンピュータシステム)
- RHiNET-2クラスタにおけるユニキャストをもとにしたマルチキャストアルゴリズムの評価(コンピュータシステム)
- RHiNET-2クラスタを用いたデッドロックフリー固定ルーティングの実機評価(ネットワーク)