3M-7 Reevaluating the Renamed Trace Cache Architecture
スポンサーリンク
概要
- 論文の詳細を見る
In order to exploit parallelism, modern superscalar processors utilize register renaming to solve data dependency problems. The RMT(register mapping table) used in register renaming is said to be one of the most energy consuming components in the processor due to its high access frequency and large area. Multi-port structure of the RMT can gain area exponentially to its port number which can make it unrealistic when implementing high width processors. The RTCA, abbreviation for Renamed Trace Cache Architecture(also known as the anti-dualflow architecture) is an architecture proposed to solve these problem that the RMT brings about. Within this architecture, the path between two dependent operand is explicitly shown in order to solve the dependency, that in return can take off the renaming stage of the pipeline. However, extra tags are needed in addition to the trace cache that RCTA uses, which can lead to degradation in performance. In this paper, we evaluate and compare the RCTA to a typical trace cache architecture. It is shown that the increment in trace cache tags can cause an amount of degradation in average fetch IPC. Nevertheless, the shorten pipeline can potentially maintain overall performance.
- 2010-03-08
著者
-
五島 正裕
東京大学情報理工学系研究科
-
堀尾 一生
東京大学大学院情報理工学系研究科
-
坂井 修一
東京大学
-
塩谷 亮太
東京大学情報理工学系研究科:日本学術振興会
-
坂井 修一
東京大学 情報理工学系研究科
-
王 彦鈎
東大
-
堀尾 一生
東大
-
塩谷 亮太
東大
-
五島 正裕
東大
-
坂井 修一
東大
-
ハイハー グェン
京都大学情報学研究科
関連論文
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良 (ディペンダブルコンピューティング)
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良 (コンピュータシステム)
- タイミング制約を緩和するクロッキング方式の予備評価(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- パス情報を用いた分岐フィルタ機構(プロセッサアーキテクチャ)
- スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング(ARC-4:スケジューリング,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- プロセッサ性能に対する主記憶バンド幅の影響の評価(プロセッサアーキテクチャ)
- 情報漏洩防止のためのプラットフォーム認証(認証・監視,コンピュータの未来〜エコ、ディペンダビリティ、そして〜及び一般)
- ツインテール・アーキテクチャの改良(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ツインテール・アーキテクチャの評価(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- タイミング・フォールト耐性を持つクロッキング方式(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラムの繰り返し構造に着目した動的なヘルパースレッディング(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 分岐プレディシジョン(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 4K-4 情報漏洩防止のための暗黙的インフォメーションフロー追跡(情報爆発時代における分散処理とセキュリティ,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチコア・プロセッサの不均質共有キャッシュにおけるLRU大域置き換えアルゴリズム(プロセッサアーキテクチャ)
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタ・ファイル書き込み時タイミング・エラーに関する脆弱性評価(ARC-11:高信頼性および応用システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 脆弱性検出のための値範囲解析(プログラム解析)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- AI-1-4 超ディペンダブルVLSIへの挑戦(AI-1.デイベンダブルVLSIに向けて,依頼シンポジウム,ソサイエティ企画)
- 計算機アーキテクチャのトップカンファレンスを攻略しよう!
- タイミング・エラー耐性を持つスーパスカラ・プロセッサ(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 小容量RAMを用いたオペランド・バイパスの複雑さの低減手法(プロセッサアーキテクチャ)
- 逆Dualflowアーキテクチャ(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 最適なロールバック・ポイントを選択するトランザクショナル・メモリ
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサのコミット方式
- 面積効率を指向するプロセッサの設計
- 選択的キャッシュ・アロケーション:マルチスレッド環境におけるキャッシュ利用効率の向上手法
- 文字列ごとの情報フロー追跡手法のPHPへの実装と評価
- 汎用グラフィクスカードを用いた並列ボリュームレンダリングシステム(並列処理応用)
- 汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリ
- 耐永久故障FPGAアーキテクチャ
- SWIFT:文字列ごとの情報フロー追跡手法
- 逆Dualflowアーキテクチャ
- 3M-5 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリの評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-7 Reevaluating the Renamed Trace Cache Architecture
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- フロントエンド実行(マルチスレッド実行とプロセッサアーキテクチャ)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズム(キャッシュの効率的利用)
- リザーベーションステーションと物理レジスタ・ファイルを併用するスーパースケーラ・プロセッサ(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- 3M-1 プロセッサ性能に対する主記憶バンド幅の影響の評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(設計技術/性能評価,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 6M-2 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサの評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-2 面積効率を指向するプロセッサの設計と実装(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 2ZE-3 情報漏洩防正のためのプラットフォーム認証(認証プラットホーム,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 2ZE-2 情報漏洩防止プラットフォーム(認証プラットホーム,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 1ZE-8 文字列ごとの情報フロー追跡手法のPHPへの実装(ネットワークセキュリティ,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 2T-3 タイミング制約を緩和するクロッキング方式の提案(論理・物理設計,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 6M-1 耐永久故障FPGAアーキテクチャの予備評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 5M-4 繰り返し構造に着目した分岐プレディシジョンの改良(マルチスレッドと分岐,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- ツインテール・アーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- 動的負荷分散機能を備えたセル投影型並列ボリュームレンダリングシステムの実装
- 大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 超ディペンダブル・プロセッサアーキテクチャの構想(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- 超ディペンダブル・プロセッサアーキテクチャの構想(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタファイルの書き込み時タイミングエラーの検出・回復手法(ARC-2:プロセッサアーキテクチャI,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- タグ・アーキテクチャのための効率的なタグ管理機構(アーキテクチャ)
- 逆Dualflowアーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 汎用グラフィクスカード上での簡易シミュレーションと可視化(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- レジスタ・リネーミングとディスパッチ・ネットワークを不要とするトレース・キャッシュ・アーキテクチャ
- プラットフォーム遠隔認証
- プラットフォーム部分認証 (コンピュータシステム)
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサ(ディペンダブルコンピューティングシステム及び一般)
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサ(ディペンダブルコンピューティングシステム及び一般)
- 汎用CAMを用いた区間再利用プロセッサシミュレータの高速化(CPSY-3 性能評価)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 2次キャッシュを用いた再利用および並列事前実行機構における高速化手法(高速化手法)
- 曖昧再利用によるMP3エンコーダの高速化手法
- 動的タイムボローイングを可能にするクロッキング方式の予備実験(半導体回路,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- プラットフォーム部分認証(アーキテクチャ,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- ループを並列実行するクラスタ型アーキテクチャ(ARC-2:プロセッサアーキテクチャI,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 1. Niagara: 32ウェイマルチスレッドSPARCプロセッサ(実例, 新世代マイクロプロセッサアーキテクチャ(後編))
- 耐故障FPGAアーキテクチャ
- 命令グループごとのキャッシュ・パーティショニングの予備評価
- 固定長インターバルを用いないフェーズ検出手法の改良
- 動的タイム・ボローイングを可能にするクロッキング方式の適用手法
- 過去の競合命令にチェックポイントを設定するトランザクショナル・メモリ
- Zigzag-HVP : A Cost-effective Technique to Mitigate Soft Errors in Caches with Word-based Access(Processor Architecture)
- 動的命令解析に基づく多重再利用および並列事前実行(アーキテクチャとシステムソフトウェア)