レジスタ・リネーミングとディスパッチ・ネットワークを不要とするトレース・キャッシュ・アーキテクチャ
スポンサーリンク
概要
- 論文の詳細を見る
我々の研究室では面積効率の高いスーパスカラ・プロセッサを実現する手法を提案してきた.特に,命令間の依存解析を行うレジスタ・リネーミングに必要なロジックを削減する手法として,Renamed Trace Cache(RTC) を提案した.RTC は依存解析済みの命令列をトレース・キャッシュに格納し,再利用する.通常のレジスタ・リネーミングでは依存解析結果を再利用することは不可能だが,RTC では,後続の命令が依存元の命令を指定する形式に命令の変換を行うことによって,再利用を可能にしている.RTC ヒット時は,依存解析を行うことなく命令の実行が可能である.ミス時にのみ依存解析を行う.そのときのリネーム幅を最小限にすることで,RMT の面積を大幅に削減することができる.多くの場合は RTC にヒットするため,性能の低下は抑えることができ,面積効率は高くなる.本稿では RTC を応用し,更にディスパッチされた後の命令列を格納する Dispatched Image Cache(DIC) を提案する.DIC は対応する命令ウィンドウへの分配情報も再利用する.これは,RTC と同様の方法で依存解析を行った命令を,対応する命令ウィンドウに合わせて領域が区切られた DIC にまとめて格納することで可能となる.DIC ヒット時には,得られたイメージをそのまま命令ウィンドウに格納すればよく,レジスタ・リネーミングとディスパッチ・ネットワークの処理を行う必要がない.これらの処理は,ミス時にのみ,小規模のロジックによって時間をかけて行う.そうすることで,性能を落とさずにレジスタ・リネーミングとディスパッチに必要な回路負荷を最小限に抑えることができる.また DIC では,命令の出現パターンや実行パスの変化によってキャッシュの利用効率が落ちる場合がある.本稿ではキャッシュの利用効率が落ちないような DIC のキャッシュ格納手法の提案・比較を行った.予備評価の結果,高価なキャッシュ格納アルゴリズムを実装することによるキャッシュ利用効率の向上は,そのために必要となる追加ロジックの量に見合っていないという結果が得られた.
- 2011-07-20
著者
-
五島 正裕
東京大学情報理工学系研究科
-
五島 正裕
東京大学大学院情報理工学系研究科
-
塩谷 亮太
東京大学情報理工学系研究科:日本学術振興会
-
五島 正裕
東京大学 情報理工学系研究科
-
坂井 修一
東京大学 情報理工学系研究科
-
ハイハー グェン
京都大学情報学研究科
-
倉田 成己
東京大学大学院情報理工学系研究科
関連論文
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良 (ディペンダブルコンピューティング)
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良 (コンピュータシステム)
- タイミング制約を緩和するクロッキング方式の予備評価(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- パス情報を用いた分岐フィルタ機構(プロセッサアーキテクチャ)
- スラック予測を用いたクラスタ型スーパースカラ・プロセッサ向け命令ステアリング(ARC-4:スケジューリング,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- プロセッサ性能に対する主記憶バンド幅の影響の評価(プロセッサアーキテクチャ)
- 情報漏洩防止のためのプラットフォーム認証(認証・監視,コンピュータの未来〜エコ、ディペンダビリティ、そして〜及び一般)
- ツインテール・アーキテクチャの改良(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ツインテール・アーキテクチャの評価(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- タイミング・フォールト耐性を持つクロッキング方式(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラムの繰り返し構造に着目した動的なヘルパースレッディング(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 分岐プレディシジョン(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 4K-4 情報漏洩防止のための暗黙的インフォメーションフロー追跡(情報爆発時代における分散処理とセキュリティ,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチコア・プロセッサの不均質共有キャッシュにおけるLRU大域置き換えアルゴリズム(プロセッサアーキテクチャ)
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタ・ファイル書き込み時タイミング・エラーに関する脆弱性評価(ARC-11:高信頼性および応用システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 脆弱性検出のための値範囲解析(プログラム解析)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- 並列可視化処理向けFPGA搭載PCIカードへのボリュームレンダリングの予備実装(応用2, FRGAとその応用及び一般)
- AI-1-4 超ディペンダブルVLSIへの挑戦(AI-1.デイベンダブルVLSIに向けて,依頼シンポジウム,ソサイエティ企画)
- 計算機アーキテクチャのトップカンファレンスを攻略しよう!
- タイミング・エラー耐性を持つスーパスカラ・プロセッサ(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 小容量RAMを用いたオペランド・バイパスの複雑さの低減手法(プロセッサアーキテクチャ)
- 逆Dualflowアーキテクチャ(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- グローバル分岐履歴を用いたスラック予測器(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 最適なロールバック・ポイントを選択するトランザクショナル・メモリ
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサのコミット方式
- 面積効率を指向するプロセッサの設計
- 選択的キャッシュ・アロケーション:マルチスレッド環境におけるキャッシュ利用効率の向上手法
- 文字列ごとの情報フロー追跡手法のPHPへの実装と評価
- 汎用グラフィクスカードを用いた並列ボリュームレンダリングシステム(並列処理応用)
- 汎用グラフィクスハードウェアを用いた並列ボリュームレンダリングの実装(ARC-4:並列処理応用と実装技術)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- Out-of-orderスーパスカラ・プロセッサの耐過渡故障方式の改良(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリ
- 耐永久故障FPGAアーキテクチャ
- SWIFT:文字列ごとの情報フロー追跡手法
- 逆Dualflowアーキテクチャ
- 3M-5 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリの評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-7 Reevaluating the Renamed Trace Cache Architecture
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズムの改良(並列処理応用)
- フロントエンド実行によるプリロードの提案(ARC-2 : プロセッサアーキテクチャII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- フロントエンド実行(マルチスレッド実行とプロセッサアーキテクチャ)
- 参照の空間局所性を最大化するボリューム・レンダリング・アルゴリズム(キャッシュの効率的利用)
- リザーベーションステーションと物理レジスタ・ファイルを併用するスーパースケーラ・プロセッサ(ARC-1:プロセッサ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- 3M-1 プロセッサ性能に対する主記憶バンド幅の影響の評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(設計技術/性能評価,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 6M-2 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサの評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-2 面積効率を指向するプロセッサの設計と実装(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 2ZE-3 情報漏洩防正のためのプラットフォーム認証(認証プラットホーム,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 2ZE-2 情報漏洩防止プラットフォーム(認証プラットホーム,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 1ZE-8 文字列ごとの情報フロー追跡手法のPHPへの実装(ネットワークセキュリティ,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 2T-3 タイミング制約を緩和するクロッキング方式の提案(論理・物理設計,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 6M-1 耐永久故障FPGAアーキテクチャの予備評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 5M-4 繰り返し構造に着目した分岐プレディシジョンの改良(マルチスレッドと分岐,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- ツインテール・アーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 距離画像生成処理におけるメディアプロセッサの評価(メディアプロセッサ)
- ステレオ画像処理を用いた曖昧再利用の評価(画像処理における再利用)
- 動的負荷分散機能を備えたセル投影型並列ボリュームレンダリングシステムの実装
- 大規模ボリュームレンダリング処理における擬似透視投影法に関する考察
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 超ディペンダブル・プロセッサアーキテクチャの構想(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- 超ディペンダブル・プロセッサアーキテクチャの構想(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタファイルの書き込み時タイミングエラーの検出・回復手法(ARC-2:プロセッサアーキテクチャI,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- タグ・アーキテクチャのための効率的なタグ管理機構(アーキテクチャ)
- 逆Dualflowアーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 汎用グラフィクスカード上での簡易シミュレーションと可視化(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- レジスタ・リネーミングとディスパッチ・ネットワークを不要とするトレース・キャッシュ・アーキテクチャ
- プラットフォーム遠隔認証
- プラットフォーム部分認証 (コンピュータシステム)
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサ(ディペンダブルコンピューティングシステム及び一般)
- 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサ(ディペンダブルコンピューティングシステム及び一般)
- 汎用CAMを用いた区間再利用プロセッサシミュレータの高速化(CPSY-3 性能評価)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 2次キャッシュを用いた再利用および並列事前実行機構における高速化手法(高速化手法)
- 曖昧再利用によるMP3エンコーダの高速化手法
- 動的タイムボローイングを可能にするクロッキング方式の予備実験(半導体回路,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- プラットフォーム部分認証(アーキテクチャ,2011年並列/分散/協調処理に関する『鹿児島』サマー・ワークショップ(SWoPP鹿児島2011))
- ループを並列実行するクラスタ型アーキテクチャ(ARC-2:プロセッサアーキテクチャI,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 1. Niagara: 32ウェイマルチスレッドSPARCプロセッサ(実例, 新世代マイクロプロセッサアーキテクチャ(後編))
- 耐故障FPGAアーキテクチャ
- 命令グループごとのキャッシュ・パーティショニングの予備評価
- 固定長インターバルを用いないフェーズ検出手法の改良
- 動的タイム・ボローイングを可能にするクロッキング方式の適用手法
- 過去の競合命令にチェックポイントを設定するトランザクショナル・メモリ
- Zigzag-HVP : A Cost-effective Technique to Mitigate Soft Errors in Caches with Word-based Access(Processor Architecture)
- 動的命令解析に基づく多重再利用および並列事前実行(アーキテクチャとシステムソフトウェア)