小規模・省電力コアのための省資源分岐予測方式(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,実装時の遅延と回路規模を考慮した分岐予測器である,MIN-TAGE分岐予測器を提案する.この手法ではパターン履歴テーブルのインデックス計算をEnhanced Folded Index手法を利用して計算することにより,既存手法と比較して分岐予測にかかる遅延とパイプライン化に伴うコストを削減する.このインデックス計算により効率的な分岐予測器のパイプライン化を実現する.MIN-TAGE分岐予測器を2nd Championpship Branch Prediction Infrastructureで評価した.その結果,MIN-TAGE分岐予測器はTAGE分岐予測器から構成コストを削減した上で,分岐予測ミスを2.6%削減した.
- 2007-08-01
著者
関連論文
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- FPGA基板を用いたモンテカルロ碁の高速化(アクセラレーションと回路設計,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 並列TCPストリーム間協調を目的とした流量調整機構Stream Equalizerの性能評価(HPC-11:通信,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 2. 情報科学技術戦略コア(21世紀卓越した情報研究拠点プログラムの目指す研究(前編))
- 情報科学技術戦略コア
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 通過順序に基づく車群マッチングと旅行時間推定
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Internet2 Land Speed Record : 長距離TCP通信高速化への挑戦
- 超高速インターネット通信におけるFPGA技術の利用(超並列SIMDプロセッサ,先端的コンピュータシステム技術及び一般)
- 実行時の分岐のふるまいに基づくスレッド間データ依存関係予測(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- スラック予測を用いるメモリ制御アーキテクチャ(ARC-10 : アーキテクチャIII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- TLBを用いるキャッシュ利用状況推定の高精度化(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ゲートウェイによる並列TCPのウィンドウサイズ平均化(HPC-15 : ネットワーク)
- Sakura-C : 超並列計算機向けC言語と最適化(HPC-1 : 最適化)
- 連載:理学のキーワード : 第29回
- プログラミング言語MLのCUDA向け拡張
- SIMD型計算機向けループ自動並列化手法
- 動的推定によるプリフェッチ量最適化
- Webブラウザを用いた長距離データ転送の高速化
- コヒーレントでないメモリシステムへのアーキテクチャ支援
- Ruby用仮想マシンにおけるAOTコンパイラ
- メニーコアプロセッサ向き共有キャッシュ配分方式
- マップ型履歴を用いたプリフェッチ方式とキャッシュ置換方式の協調動作
- 超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解
- オフライン環境における多様性の高い実行時自己改変ソフトウェア(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- 日米間QoSによるLFN高速化実験と分散KVSの構築(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- 量子純粋状態のボロノイ図について
- TCPによる長距離ディスク間データ転送の高速化
- BDDを用いたグラフのTutte多項式計算の再考察
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- 置換データの性質に着目した動的キャッシュパーティショニング
- 追い出しラインに着目したプリフェッチスロットリング手法
- フィードバックを用いたハイブリッド・プリフェッチ方式
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- FLASHを用いたリアルタイム講演中継システムとその特性(インターネット運用・管理技術,一般,インターネット運用・管理技術,一般)
- MK-4 Data Reservoir : 科学技術研究向け超高速ネットワーク基盤(大型プロジェクト紹介,学術系企画)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 協調能動型データベースシステム技術の研究に向けて (メディア統合および環境統合のための高機能データベースシステム、および一般)
- 7.論文誌周辺の研究倫理(研究者・技術者の倫理観・人生観)
- periodic graphのstatic graphに関する一考察
- 小規模・省電力コアのための省資源分岐予測方式(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- パケット喪失履歴に基づいたTCP幅輳制御方式(2010年並列/分散/協調処理に関する『金沢』サマー・ワークショップSWoPP2010)
- CometインテリジェントNICの応用(第1版)(ネットワーク・インターネット基礎,産学連携論文)
- 実行パス履歴情報を利用した分岐予測手法(プロセッサアーキテクチャ)
- 実行パス履歴情報を利用した分岐予測手法(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 命令ウインドウ拡張による命令レベル並列性の利用(ARC-1 : プロセッサアーキテクチャI)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 転換する情報教育
- コンテクスト切り替えによる動的な投機的再利用(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(CPSY-3予想とスケジューリング)
- 投機的再利用による動的並列実行方式
- flat-c: 超並列計算機向けC言語の実現(HPC-9: 並列プログラミング)
- 計算幾何を用いた1量子ビットの量子通信におけるHolevo容量計算のアルゴリズム
- 計算幾何を用いた1量子ビットの量子通信におけるHolevo容量計算のアルゴリズム
- "Peter Shor : Polynomial-Time Algorithms for Prime Factorization and Discrete Logarithms on a Quantum Computer", SIAM Journal on Computing,Vol.26,No.5, pp.1484-1509, 1997 (20世紀の名著名論)
- 座談会 いまモデル化が求められる理由 (特集 モデル化 変化する現実認識)
- 量子計算は暗号技術を破壊するか? (特集 コンピュータセキュリティ)
- バケット手法,Peano曲線を用いた平面マッチング,巡回セールスマン問題に対する近似算法の理論的評価
- 足切り横断ポリマトロイドに対するネットワーク算法
- 最大流算法の実際的評価
- 既存のCADシステムに対する設計データベース機能の追加について
- 幾何データの近似性を考慮した地理データベースでの幾何質問処理法
- 文字の可読性を考慮した対話的地図表示機能
- マルチメディア地理データベースにおける文字配置の自動化
- 最短路算法の実際的評価と新バケット法
- Analyzing automorphism groups of oriented matroids by semidefinite programming (Computational Geometry and Discrete Mathematics)
- ヘテロジニアス演算器構成による高耐故障実行ステージ(回路・設計手法)
- 通過順序に基づく車群マッチングと旅行時間推定
- 通過順序に基づく車群マッチングと旅行時間推定
- Computational Analysis of Orientations of Matroids (Computational Geometry and Discrete Mathematics)
- RL-001 FPGAを用いた広帯域高遅延ネットワーク向けの利用可能帯域推定(L分野:ネットワーク・セキュリティ,査読付き論文)
- 4.先端グローバルR&D網の構築と国際協調アプリケーションの展開 : JGN2の国際連携活動(オープンリサーチ型次世代ネットワーク技術への挑戦-National Project JGN2 4年間のFact Sheets-)
- エミュレータの機能拡張によるゲーム所用時間の削減(ソフトウェアシステム,SWoPP2006)
- エミュレータの機能拡張によるゲーム所用時間の削減
- 資源情報流通サーバSSS-Server
- XMLを用いた言語間変換
- 高性能な8倍精度浮動小数点演算機構の実現
- 多種言語処理系性能の評価に適したベンチマークプログラム
- 不要キャッシュブロックのパーティショニングによる排除方式
- HPC Ruby:静的解析に基づくRubyの高度最適化コンパイラ
- BTBへのBimode Cascading手法適用による分岐先アドレス予測の高効率化
- 多様な履歴の利用による分岐予測精度の向上
- 2010年度論文賞の受賞論文紹介 : 低次キャッシュとプリフェッチ
- 実用的なRuby用AOTコンパイラ
- 例外依存関係を越える部分冗長性除去
- 実行時統計とJust-in-timeコンパイルによるロックの選択的最適化
- コード変換によるディペンダブルな分散プログラムの自動生成
- 値番号に基づく部分冗長性除去
- 1600万計算コア超メニーコアアーキテクチャのシミュレーション
- パーセプトロン予測を用いたTCP輻輳制御(ネットワーク,2012年並列/分散/協調処理に関する『鳥取』サマー・ワークショップ(SWoPP鳥取2012))