追い出しラインに着目したプリフェッチスロットリング手法
スポンサーリンク
概要
- 論文の詳細を見る
シングルスレッド性能の限界が指摘される中,プリフェッチは軽量なハードウェアで IPC を大きく向上させている.近年のプリフェッチ手法は大量のアドレスを想起する傾向にあり,これは多くのプログラムで有効となっている.しかし,その一方で,僅かなプリフェッチに対しても,キャッシュポリューションを生じて性能を大きく下げてしまうプログラムが存在する.このため,プリフェッチの積極度を適切に制御する技術が研究されるようになってきた.本論文では,プリフェッチの成功率に着目していた従来手法とは異なり,キャッシュの余裕度に着目した"Cache Metabolism"値を提案し,軽量化と高性能の双方を実現する.提案手法は,置き換えラインを観測することによって CM 値を推測し,その値を元にプリフェッチ積極度を制御する.ハイブリッド・ストライド・プリフェッチャーをベースとした評価では,SPEC2006 全体の調和平均で,最も良い積極度に対しさらに 2.3% の性能向上を得た.
- 一般社団法人情報処理学会の論文
- 2009-07-28
著者
-
入江 英嗣
東京大学大学院情報理工学系研究科
-
平木 敬
東京大学情報理工学系研究科
-
平木 敬
東京大学理学部情報科学科
-
今井 浩
東京大学
-
今井 浩
九州大学
-
今井 浩
Erato今井量子計算機構プロジェクト Jst:東京大学情報理工学系研究科コンピュータ科学専攻
-
平木 敬
東大
-
入江 英嗣
電気通信大学大学院情報システム学研究科
-
本城 剛毅
東京大学大学院情報理工学系研究科
-
入江 英嗣
東京大学情報理工学系研究科
-
本城 剛毅
東京大学情報理工学系研究科
-
今井 浩
Jst‐erato
-
平木 敬
東京大学情報科学科平木研究室
-
平木 敬
電子技術総合研究所電子計算機部計算機方式研究室
-
今井 浩
東京大学理学系研究科情報科学専攻 Erato今井量子計算機構プロジェクト 科学技術振興事業団
関連論文
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列TCPストリーム間協調を目的とした流量調整機構Stream Equalizerの性能評価(HPC-11:通信,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ツインテール・アーキテクチャの改良(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 3H-4 ストアキューの拡張によるロードトラフィックの削減方式
- 3H-2 複数パス実行時におけるキャッシュトラフィックの傾向分析
- 2. 情報科学技術戦略コア(21世紀卓越した情報研究拠点プログラムの目指す研究(前編))
- 情報科学技術戦略コア
- 予測ミスした命令の実行を継続する投機手法(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式 (集積回路)
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Internet2 Land Speed Record : 長距離TCP通信高速化への挑戦
- 超高速インターネット通信におけるFPGA技術の利用(超並列SIMDプロセッサ,先端的コンピュータシステム技術及び一般)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 4K-4 情報漏洩防止のための暗黙的インフォメーションフロー追跡(情報爆発時代における分散処理とセキュリティ,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- レジスタ・ファイル書き込み時タイミング・エラーに関する脆弱性評価(ARC-11:高信頼性および応用システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 脆弱性検出のための値範囲解析(プログラム解析)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 連載:理学のキーワード : 第29回
- タイミング・エラー耐性を持つスーパスカラ・プロセッサ(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 逆Dualflowアーキテクチャ(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- 動的推定によるプリフェッチ量最適化
- Webブラウザを用いた長距離データ転送の高速化
- コヒーレントでないメモリシステムへのアーキテクチャ支援
- Ruby用仮想マシンにおけるAOTコンパイラ
- メニーコアプロセッサ向き共有キャッシュ配分方式
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- クラスタ型プロセッサのための分散投機メモリフォワーディング(プロセッサアーキテクチャ)
- 発行時間差に基づいた命令ステアリング方式(プロセッサアーキテクチャ)
- クリティカルパス情報を用いた分散命令発行型マイクロプロセッサ向けステアリング方式(アーキテクチャ)
- VLDP3アーキテクチャにおけるメモリリネーミング手法の検討
- VLDP3アーキテクチャにおけるレジスタ値の高速Forwarding手法の提案
- VLDP3 : データフローを高速実行する大規模アーキテクチャ
- C-17 VLDP3アーキテクチャの構想(4) : メモリ依存に関する初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-16 VLDP3アーキテクチャの構想(3) : レジスタフォワーディング機構の初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-15 VLDP3アーキテクチャの構想(2) : ソフトウェア支援(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-14 VLDP3アーキテクチャの構想(1) : プロセッサ構成(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- SWIFT:文字列ごとの情報フロー追跡手法
- 逆Dualflowアーキテクチャ
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- オフライン環境における多様性の高い実行時自己改変ソフトウェア(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- TCPによる長距離ディスク間データ転送の高速化
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- 置換データの性質に着目した動的キャッシュパーティショニング
- 追い出しラインに着目したプリフェッチスロットリング手法
- フィードバックを用いたハイブリッド・プリフェッチ方式
- MK-4 Data Reservoir : 科学技術研究向け超高速ネットワーク基盤(大型プロジェクト紹介,学術系企画)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 小規模・省電力コアのための省資源分岐予測方式(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- GeForce GTX 280 vs. Cell
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 実行パス履歴情報を利用した分岐予測手法(プロセッサアーキテクチャ)
- 実行パス履歴情報を利用した分岐予測手法(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 命令ウインドウ拡張による命令レベル並列性の利用(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 転換する情報教育
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(設計技術/性能評価,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- コンテクスト切り替えによる動的な投機的再利用(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(CPSY-3予想とスケジューリング)
- 投機的再利用による動的並列実行方式
- flat-c: 超並列計算機向けC言語の実現(HPC-9: 並列プログラミング)
- ツインテール・アーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- 4.先端グローバルR&D網の構築と国際協調アプリケーションの展開 : JGN2の国際連携活動(オープンリサーチ型次世代ネットワーク技術への挑戦-National Project JGN2 4年間のFact Sheets-)
- 予測ミスした命令の実行を継続する投機手法(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- エミュレータの機能拡張によるゲーム所用時間の削減(ソフトウェアシステム,SWoPP2006)
- エミュレータの機能拡張によるゲーム所用時間の削減
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- タグ・アーキテクチャのための効率的なタグ管理機構(アーキテクチャ)
- 資源情報流通サーバSSS-Server
- メモリ依存予測を利用したフォワーディング局所化手法(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- XMLを用いた言語間変換
- 高性能な8倍精度浮動小数点演算機構の実現
- 多種言語処理系性能の評価に適したベンチマークプログラム
- 不要キャッシュブロックのパーティショニングによる排除方式
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 2010年度論文賞の受賞論文紹介 : 低次キャッシュとプリフェッチ
- 実用的なRuby用AOTコンパイラ
- 例外依存関係を越える部分冗長性除去