BTB拡張による値予測機構のエネルギー削減
スポンサーリンク
概要
- 論文の詳細を見る
Recent advances in computer design allow microprocessors to enable parallelism in programs in order to achieve high performance. True dependency is one of the many factors that restrict parallelism in a computer program. To overcome the restrictions of true dependency, a number of schemes for value prediction have been proposed. The value predictor predicts an instruction result on the basis of the value history obtained from Value History Table (VHT). However, it consumes considerable energy because VHT is large and is referenced very frequently. In this paper, we propose a more efficient mechanism for a value predictor that extends the use of an existing branch target buffer (BTB) to reduce the number of invalid VHT references. We introduced a predictability bit (p_bit) to identify an instruction that has a predictable value, and we added a field to BTB to ensure that the p-bits corresponded to successive instructions. The proposed mechanism controls VHT references on the basis of p_bits. The evaluation results show that the proposed mechanism reduces invalid references by 27.6% and 42.4% and energy by 16.6% and 25.7% with 0.1% performance loss on average in the 8 and 32 p_bits length, respectively.
著者
関連論文
- パイプラインステージ統合をオンチップで制御する低消費電力プロセッサのFPGA実装と評価(低消費電力技術,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 依存関係に基づくスラックの共有化手法(コンピュータシステム)
- Drowsyキャッシュにおける活性期間の制御手法に関する検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- Drowsyキャッシュにおける活性期間の制御手法に関する検討(低消費電力キャッシュ,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- タスクの予測によりコンテキストスイッチを投機実行する手法に関する検討(並行処理(1))
- 投機的実行の深さに着目した低消費電力化手法(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- パイプラインステージ統合のオンチップ制御機構(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- スラック命令数を増加させるスラック共有化手法(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 発見的手法に基づくローカル・スラック予測機構(プロセッサアーキテクチャ)
- 命令実行時の振る舞いに着目したローカル・スラック予測(組込技術とネットワークに関するワークショップETNET2006)
- リネーミングされるレジスタ番号の整列によるレジスタ・キャッシュの高精度化手法(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- クリティカル・パス上の命令に着目したレジスタ・キャッシュの使用法(メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- リネーミングされるレジスタ番号の整列によるレジスタ・キャッシュの高精度化手法(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- クリティカル・パス上の命令に着目したレジスタ・キャッシュの使用法(メモリシステム, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- VT-CMOSキャッシュの性能低下をアドレス予測を用いて低減する先行起動機構(キャッシュ機構)
- 頻出値を利用した物理レジスタの共有化手法(プロセッサアーキテクチャ)
- マルチコアプロセッサにおけるメモリ依存予測及び同期機構
- 投機的実行の深さに着目した低消費電力化手法(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- パイプラインステージ統合のオンチップ制御機構(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- スラック命令数を増加させるスラック共有化手法(プロセッサアーキテクチャ(1),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 命令実行時の振る舞いに着目したローカル・スラック予測(組込技術とネットワークに関するワークショップETNET2006)
- 命令実行時の振る舞いに着目したローカル・スラック予測(組込技術とネットワークに関するワークショップETNET2006)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- SKYのマルチスレッド・モデルを実現したSMTプロセッサにおける物理レジスタの共有化手法(チップマルチプロセッサ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- 非数値計算プログラムにおけるスレッドレベル並列性の限界 : スレッド間メモリ曖昧性除去技術との関係(プロセッサアーキテクチャ)
- C-004 ライトバックキャッシュにおけるメインメモリアクセスレイテンシの隠蔽(ハードウェア・アーキテクチャ,一般論文)
- 単一チップ・マルチプロセッサSKYにおけるデータフローを考慮したスレッド分割技法(コンパイラ技術)
- C-021 仮想ルータのためのパケット転送高速化機構(ハードウェア・アーキテクチャ,一般論文)
- 音響FDTD法演算支援LSIの設計(FPGAとその応用及び一般)
- 音響FDTD法演算支援LSIの設計
- 音響FDTD法演算支援LSIの設計(FPGAとその応用及び一般)
- 音響FDTD法演算支援LSIの設計(FPGAとその応用及び一般)
- 音響FDTD法演算支援LSIの設計(FPGAとその応用及び一般)
- C-002 メニーコアにおける柔軟なデータ供給支援の検討と予備評価(ハードウェア・アーキテクチャ,一般論文)
- C-001 コア融合アーキテクチャにおける最適コア割り当ての研究(ハードウェア・アーキテクチャ,一般論文)
- 予測の容易さに着目して競合の発生を抑制するストライド値予測機構
- 最近の値の局所性に着目した共有化による物理レジスタ削減
- 単一チップマルチプロセッサ・アーキテクチャSKYにおけるメモリ同期機構の評価
- 単一チップマルチプロセッサ・アーキテクチャSKYにおけるスレッド分割技法の評価
- VT-CMOSを用いたデータキャッシュでの性能低下をアドレス予測を用いて低減する手法
- VT-CMOSを用いたデータキャッシュでの性能低下をアドレス予測を用いて低減する手法
- VT-CMOSを用いたデータキャッシュでの性能低下をアドレス予測を用いて低減する手法
- 非数値計算応用向けスレッド・レベル並列処理マルチプロセッサ・アーキテクチャSKY(マルチメディアネットワークシステム)
- C-034 フリップフロップに着目したソフトエラー訂正機構の検討(ハードウェア・アーキテクチャ,一般論文)
- 仮想計算機のリソース制御によるHTTP-GET Flood攻撃対策(情報ネットワーク)
- C-005 学習テーブルを用いた値予測の効率化(ハードウェア・アーキテクチャ,一般論文)
- BTB拡張による値予測機構のエネルギー削減
- 予測の容易さに着目して競合の発生を抑制するストライド値予測機構
- VDEC を利用した実践的な半導体・集積回路工学教育の実践
- L-032 複数台のおとりマシンによるHTTP-GET Flood攻撃対策(セキュリティ実装,L分野:ネットワーク・セキュリティ)
- M-006 一時的アクセス権を用いたインターネット予約システムにおけるクライアントのスケジューリング(マルチメディア通信と分散処理,M分野:ユビキタス・モバイルコンピューティング)
- データの冗長性に着目したキャッシュの回路面積削減