A Dynamic Control Mechanism for Pipeline Stage Unification by Identifying Program Phases
スポンサーリンク
概要
- 論文の詳細を見る
Recently, a method called pipeline stage unification (PSU) has been proposed to reduce energy consumption for mobile processors via inactivating and bypassing some of the pipeline registers and thus adopt shallow pipelines. It is designed to be an energy efficient method especially for the processors under future process technologies. In this paper, we present a mechanism for the PSU controller which can dynamically predict a suitable configuration based on the program phase detection. Our results show that the designed predictor can achieve a PSU degree prediction accuracy of 84.0%, averaged from the SPEC CPU2000 integer benchmarks. With this dynamic control mechanism, we can obtain 11.4% Energy-Delay-Product (EDP) reduction in the processor that adopts a PSU pipeline, compared to the baseline processor, even after the application of complex clock gating.
- (社)電子情報通信学会の論文
- 2008-04-01
著者
-
富田 眞治
京都大学物質-細胞統合システム拠点
-
YAO Jun
Graduate School of Informatics, Kyoto University
-
MIWA Shinobu
Graduate School of Engineering, Tokyo University of Agriculture and Technology
-
SHIMADA Hajime
Graduate School of Informatics, Kyoto University
-
TOMITA Shinji
Graduate School of Informatics, Kyoto University
-
Yao Jun
Graduate School Of Informatics Kyoto Univ.
-
Tomita S
Graduate School Of Informatics Kyoto Univ.
-
Tomita Shinji
Kyoto Univ. Kyoto‐shi Jpn
-
Tomita Shinji
Graduate School Of Informatics Kyoto Univ.
-
Miwa Shinobu
Graduate School Of Engineering Tokyo University Of Agriculture And Technology
-
Tomita Shinji
Graduate School Of Informatics Kyoto University
-
Shimada Hajime
Graduate School Of Informatics Kyoto University
関連論文
- インタラクティブ・スーパーコンピューティング環境の実現に向けて
- A Dynamic Control Mechanism for Pipeline Stage Unification by Identifying Program Phases
- 並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装)
- 並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
- 操作の連続性を考慮した手術シミュレータの高速化手法(HPC-8 : アプリケーションII)
- インタラクティブシミュレーションにおける遠隔操作フレームワークの実装(HPC-6 : 開発・実行環境)
- パス情報を用いた分岐フィルタ機構(プロセッサアーキテクチャ)
- スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング(ARC-4:スケジューリング,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- セル投影型並列ボリュームレンダリングのEarly Ray Terminationによる高速化(並列計算)
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 中規模コモディティクラスタ向け相互結合網Three Quadsの提案(ネットワーク, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- 並列事前実行における再利用バッファの高速化(一般セッションC 設計と実装)
- (2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
- 150回研究会記念特別企画(2)パネル討論 : アーキテクチャ研究の将来
- 小容量RAMを用いたオペランド・バイパスの複雑さの低減手法(プロセッサアーキテクチャ)
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- DVIによる超高速単方向リンクを用いた並列ボリュームレンダリング(FPGAとその応用及び一般)
- An Instruction Mapping Scheme for FU Array Accelerator
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 行列に基づくOut-of-Orderスケジューリング方式の評価
- 直接依存行列型スケジューリングを適用したクラスタ化スーパースケーラ・プロセッサの評価
- D-10-5 An Instruction Decomposition Scheme to Aid Fine-Grained Online Recovery in Pipeline Processor
- 情報処理学会の未来に向けての若い世代からの論断
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- An EDP Study on the Optimal Pipeline Depth for Pipeline Stage Unification Adoption
- A Two-phase, Cooperative Detailed/Global Parallel Wire Routing Algorithm
- A Light Bypass Network Design for Cascading ALU Executions
- A Dynamic Control Mechanism for Pipeline Stage Unification by Identifying Program Phases
- Dynamic Control Mechanisms for Pipeline Stage Unification Based on Program Phase Detection
- Dynamic Control Mechanisms for Pipeline Stage Unification Based on Program Phase Detection(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- 並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
- 並列ボリュームレンダリング・アクセラレータVisAの開発とその予備実装(高速データ通信と実装,FPGA応用及び一般)
- 故障に対してユーザ側の耐性を高めるデジタル家電アーキテクチャ(Inventive and Creative Architecture特別セッションII)
- ALU Cascadingを行う動的命令スケジューラ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- ALU Cascadingを行う動的命令スケジューラ(低消費電力化技術(2),集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
- ReVolver/C40 : A Scalable Parallel Computer for Volume Rendering-Design and Implementation-(Development of Advanced Computer Systems)
- 汎用GPUを用いた大規模可視化クラスタの構築
- Parallel Cloth Simulation with Adaptive Mesh Refinement and Coarsening Using OpenMP on Fujitsu HPC2500(Parallel Processing Applications)
- An approach towards fast simulation of virtual cloth with adaptive mesh refinement and coarsening on Fujitsu HPC2500
- Priority Enhanced Stride Scheduling
- スーパースケーラのための高速な動的命令スケジューリング方式
- 並列ボリュームレンダリングにおける投機的描画に関する考察(ARC-8: 応用システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- スーパースケーラのための高速な命令スケジューリング方式のIPCの評価
- 日本の計算機アーキテクチャ研究の将来((2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画))
- R.M.Tomasulo : An Efficient Algorithm for Exploiting Multiple Arithmetic Units (20世紀の名著名論)
- 大学における情報教育環境の整備(情報技術の新時代に向けて)
- 数値シミュレーション過程の実時間可視化を支援するハードウェア
- ReVolver/C40を用いた時系列ボリュームデータの実時間可視化
- Special Issue on Development of Advanced Computer Systems
- RazorProtector: Maintaining Razor DVS Efficiency in Large IR-Drop Zones by an Adaptive Redundant Data-Path
- Evaluation of a New Power-Gating Scheme Utilizing Data Retentiveness on Caches
- Selective Check of Data-Path for Effective Fault Tolerance
- An Instruction Scheduler for Dynamic ALU Cascading Adoption
- An Instruction Scheduler for Dynamic ALU Cascading Adoption