不要キャッシュブロックのパーティショニングによる排除方式
スポンサーリンク
概要
- 論文の詳細を見る
マルチコアプロセッサの共有キャッシュにおけるコア間の競合ミスを削減する複数のパーティショニング方式が提案されている.しかし多くのパーティショニング方式は,dead block と呼ばれるキャッシュ上の再アクセスされないブロックによる利用効率の低下を考慮していない.本論文では我々が提案したマルチコアプロセッサ向けの共有キャッシュパーティショニング方式である HFCA (History-Free Cache Allocation) を利用して,共有キャッシュから dead block を排除し,各コアに効率的にキャッシュを割り当てる方式を提案する.HFCA は共有キャッシュを各コアのパーティションと,アクセス頻度の低いブロックを含んだ共有パーティションに分けることで dead block を分離する.評価の結果,SPEC CPU2006 と共有キャッシュより大きなデータへのアクセスが並列実行される場合に,HFCA により IPC が平均 6.5% 向上し,パーティションとして確保するキャッシュの way 数が全体の 57% に削減され,HFCA はキャッシュミスを最小化するパーティションの割り当て,及び dead block の排除効果を同時に実現できることが判明した.
- 2011-07-20
著者
-
平木 敬
東京大学情報理工学系研究科
-
平木 敬
東京大学理学部情報科学科 電子技術総合研究所
-
平木 敬
東京大学大学院情報理工学系研究科コンピュータ科学
-
平木 敬
東京大学理学部情報科学科
-
今井 浩
東京大学情報理工学系研究科
-
今井 浩
東京大学
-
今井 浩
九州大学
-
今井 浩
Erato今井量子計算機構プロジェクト Jst:東京大学情報理工学系研究科コンピュータ科学専攻
-
平木 敬
東大
-
小川 周吾
東京大学大学院情報理工学系研究科
-
平木敬
東京大学
-
今井 浩
Jst‐erato
-
今井 浩
Erato今井量子計算機構プロジェクト 科学技術振興事業団
-
平木 敬
東京大学情報科学科平木研究室
-
平木 敬
東京大学大学院情報理工学系研究科:電子技術総合研究所情報アーキテクチャ部
-
平木 敬
電子技術総合研究所電子計算機部計算機方式研究室
-
今井 浩
東京大学理学系研究科情報科学専攻 Erato今井量子計算機構プロジェクト 科学技術振興事業団
-
今井 浩
東京大学理学部
-
今井 浩
東京大学大学院情報理工学系研究科
関連論文
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 細粒度並列処理におけるレイテンシ隠蔽効果の評価
- 並列TCPストリーム間協調を目的とした流量調整機構Stream Equalizerの性能評価(HPC-11:通信,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- データフロー計算機 SIGMA-1 の基本性能評価
- 並列記述言語DFCIIの命令レベルデータ駆動計算機に対する構造文処理
- 同期構造を埋め込んだSIGMA-1用高級言語DFC II
- 命令レベルデータ駆動計算機における効率的な分岐命令の設計
- 科学技術計算用データ駆動計算機SIGMA-1における入出力の実現
- SIGMA-1用言語DFCに対する拡張機能の提案
- デ-タフロ-言語DFCの設計と実現
- 科学技術計算用並列計算機におけるベンチマークプログラム : その構成思想
- 科学技術計算用データ駆動計算機SIGMA-1LSI版のネットワーク構成
- 科学技術計算用データ駆動計算機SIGMA-1のモニタ
- 科学技術計算用データ駆動計算機SIGMA-1のソフトウェア環境
- 2. 情報科学技術戦略コア(21世紀卓越した情報研究拠点プログラムの目指す研究(前編))
- 情報科学技術戦略コア
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Internet2 Land Speed Record : 長距離TCP通信高速化への挑戦
- 超高速インターネット通信におけるFPGA技術の利用(超並列SIMDプロセッサ,先端的コンピュータシステム技術及び一般)
- サーバ性能向上の為のOSインタフェイスの実装と評価(OS-2 : OSの基本機能)
- Hardwareでの動画処理における動的再構成の有意性について
- RDTネットワークにおける疑似フルマップ方式の評価
- ディレクトリキャッシュにおける疑似フルマップシステムの定量的評価
- データ駆動計算機のアーキテクチャ最適化に関する考察
- データ駆動計算機EM-4の負荷分散
- データ駆動計算機EM-4のパイプライン構成
- データ駆動計算機EM-4のプロトタイプの構成
- データ駆動計算機EM-4における待ち合せ機構
- データ駆動計算機EM-4における要素プロセッサのシングルチップ化の検討
- データ駆動型シングルチッププロセッサのアーキテクチャ
- データ駆動型シングルチップによる高並列計算機の実行制御方式
- 連載:理学のキーワード : 第29回
- 並列計算機におけるネットワ-クを用いた動的負荷分散機構
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- 動的推定によるプリフェッチ量最適化
- 超並列計算機JUMP-1における分散共有メモリ管理プロセッサMBP-light(並列処理)
- Webブラウザを用いた長距離データ転送の高速化
- コヒーレントでないメモリシステムへのアーキテクチャ支援
- Ruby用仮想マシンにおけるAOTコンパイラ
- メニーコアプロセッサ向き共有キャッシュ配分方式
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- オフライン環境における多様性の高い実行時自己改変ソフトウェア(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- TCPによる長距離ディスク間データ転送の高速化
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- 置換データの性質に着目した動的キャッシュパーティショニング
- 追い出しラインに着目したプリフェッチスロットリング手法
- フィードバックを用いたハイブリッド・プリフェッチ方式
- MK-4 Data Reservoir : 科学技術研究向け超高速ネットワーク基盤(大型プロジェクト紹介,学術系企画)
- 小規模・省電力コアのための省資源分岐予測方式(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- メモリアクセス列の最適化を行うメモリインタフェース
- 超並列計算機JUMP-1におけるディスク入出力サブシステムの実装
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 実行パス履歴情報を利用した分岐予測手法(プロセッサアーキテクチャ)
- 実行パス履歴情報を利用した分岐予測手法(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 命令ウインドウ拡張による命令レベル並列性の利用(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 転換する情報教育
- プロファイルを利用した値の局所性による高速化手法(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- コンテクスト切り替えによる動的な投機的再利用(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(CPSY-3予想とスケジューリング)
- 投機的再利用による動的並列実行方式
- flat-c: 超並列計算機向けC言語の実現(HPC-9: 並列プログラミング)
- MBPコアのファームウェア設計 : 疑似フルマップ方式のサポート
- 超並列計算機JUMP-1におけるMBP-lightの性能評価
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- 4.先端グローバルR&D網の構築と国際協調アプリケーションの展開 : JGN2の国際連携活動(オープンリサーチ型次世代ネットワーク技術への挑戦-National Project JGN2 4年間のFact Sheets-)
- 分散共有メモリ型超並列計算機JUMP-1の入出力サブシステム
- エミュレータの機能拡張によるゲーム所用時間の削減(ソフトウェアシステム,SWoPP2006)
- エミュレータの機能拡張によるゲーム所用時間の削減
- 資源情報流通サーバSSS-Server
- XMLを用いた言語間変換
- 高性能な8倍精度浮動小数点演算機構の実現
- 多種言語処理系性能の評価に適したベンチマークプログラム
- 不要キャッシュブロックのパーティショニングによる排除方式
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 2010年度論文賞の受賞論文紹介 : 低次キャッシュとプリフェッチ
- ページカラーリングを応用したファイルキャッシュのページ割り当てによるキャッシュ性能の向上
- 実用的なRuby用AOTコンパイラ
- 実用並列アプリケーションの実行駆動シミュレータによる性能評価
- 例外依存関係を越える部分冗長性除去
- 実行時統計とJust-in-timeコンパイルによるロックの選択的最適化
- 細粒度並列計算機お茶の水1号 : メモリベースのデータ駆動同期機構の実現
- 動いているお茶の水1号 : 同期ビットを使用したコンパイル技法
- システムの階層的並列性を統一的に扱う最適化コンパイラ
- 細粒度並列計算機お茶の水1号 : 最適化コンパイラ
- コード変換によるディペンダブルな分散プログラムの自動生成
- 値番号に基づく部分冗長性除去
- 1600万計算コア超メニーコアアーキテクチャのシミュレーション
- パーセプトロン予測を用いたTCP輻輳制御(ネットワーク,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))