値予測用投機実行回路によるキャッシュコヒーレンシ機構の高速化
スポンサーリンク
概要
- 論文の詳細を見る
マルチコア・メニーコアシステムにおいてキャッシュコヒーレンシを保つための手法としてディレクトリ機構が一般的になりつつある。しかしながらディレクトリ機構はコア数の増加に伴う容量の問題や 3 hop アクセスによるレイテンシの増加といった欠点がある。一方ディレクトリを必要としない手法として、同期のタイミングで各コアが自発的に L1 のキャッシュを無効化する手法が提案されている。この手法では、実際には他のコアによって上書きされていないキャッシュラインが同期のタイミングで無効化されてしまう問題がある。本研究では値予測とともに用いられる投機実行回路により、これらのキャッシュラインの値を用いて投機実行することでキャッシュコヒーレンシ機構の高速化を図った。結果として複雑な予測機構を用いずに平均で28%高速化することができた。
- 2013-07-24
著者
関連論文
- 命令フェッチ調節とサイズ可変なReservation Staionによる電力消費最適化(ARC-1:低電力アーキテクチャ,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- Webブラウザを用いた長距離データ転送の高速化
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- TCPによる長距離ディスク間データ転送の高速化
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 置換データの性質に着目した動的キャッシュパーティショニング
- フィードバックを用いたハイブリッド・プリフェッチ方式
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Recordへの挑戦(インターネット・フォトニックネットワークアプリケーション, 一般)
- TCPストリームによる世界最長10ギガビット高速通信回線実験 : Internet2 Land Speed Record への挑戦
- CometインテリジェントNICの応用(第1版)(ネットワーク・インターネット基礎,産学連携論文)
- Comet インテリジェントNICの応用(第1版)
- 命令ウインドウ拡張による命令レベル並列性の利用(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 転換する情報教育
- 超並列計算機JUMP-1におけるMBP-lightの性能評価
- 分散共有メモリに基づく計算機クラスタ(計算機クラスタ)
- エミュレータの機能拡張によるゲーム所用時間の削減(ソフトウェアシステム,SWoPP2006)
- エミュレータの機能拡張によるゲーム所用時間の削減
- 多種言語処理系性能の評価に適したベンチマークプログラム
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 1600万計算コア超メニーコアアーキテクチャのシミュレーション
- TSVを用いる間接NoCの評価
- 値予測用投機実行回路によるキャッシュコヒーレンシ機構の高速化
- FPGAを用いたメニーコア評価基盤の構築とNoC評価
- ハードウェアトランザクショナルメモリのアーキテクチャに依存しない評価システム
- 歴史的計算機の動態保存から得られる知見