メモリ依存予測を利用したフォワーディング局所化手法(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
スポンサーリンク
概要
- 論文の詳細を見る
実行コアを複数の実行クラスタヘ分割する"クラスタ型アーキテクチャ"は、広い実行幅と高クロック動作の両立を実現する方法として注目されている。クラスタ型アーキテクチャに関する様々な研究が行われている一方で、分散局所化の難しいメモリ参照処理がボトルネックとなることが指摘されている。各クラスタに小容量のD0キャッシュ(以下、D0)を設けるための手法はいくつか検討されているが、曖昧な依存関係や実行遅延予測のため、効果的な構成とすることが難しい。我々は既に、メモリ参照を分散局所化する手法として、メモリ依存予測を利用した"分散投機メモリフォワーディング"を提案している。本論文では、複製D0と分散投機メモリフォワーディングの比較評価を行い、それぞれの有効性を検討する。評価から、実行遅延予測失敗によるペナルティのため、プリミティブな複製D0が有効となるためには、大きなD0容量が必要な事が分かった。一方、分散投機メモリフォワーディングは適用事に限界があるものの、実行遅延予測失敗によるペナルティがないため、クラスタ内に小容量バッファしか利用できない場合に有効である事が分かった。
- 一般社団法人情報処理学会の論文
- 2004-07-30
著者
-
入江 英嗣
東京大学大学院情報理工学系研究科
-
坂井 修一
東京大学大学院工学系研究科
-
入江 英嗣
科学技術振興機構
-
高田 正法
東京大学大学院 情報理工学系研究科
-
坂井 修一
東京大学大学院 情報理工学系研究科
関連論文
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 2N-7 教養番組のテキスト教材における手順の構造化
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ツインテール・アーキテクチャの改良(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 2レベル・ストライド値予測機構の可能性検討(並列処理)
- 3H-4 ストアキューの拡張によるロードトラフィックの削減方式
- 3H-2 複数パス実行時におけるキャッシュトラフィックの傾向分析
- V_LD_Pアーキテクチャにおけるデータアクセスの軽減手法
- 2H-6 ショート・リブド・データの動的な予測に関する検討
- ALU-NET : VLDPアーキテクチャにおける命令実行機構
- VLDPアーキテクチャにおける実行パス制御方式の検討
- 命令ストリーミング : 複数パスの投機処理に適した命令列構成方式
- VLDPアーキテクチャの性能に関する初期的考察
- 命令ウィンドウの動的最適化
- V_LD_Pアーキテクチャにおける実行パス制御機構
- 5-2-1 東京大学「情報科学技術戦略コア」(5-2 情報・電気・電子分野の21世紀COE,3プロジェクトの拠点リーダーより)(5.大学での研究プロジェクト : 21世紀COEプログラム)(グローバル化時代の教育と研究)
- ツインテール・アーキテクチャの評価(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 周波数成分の重なり適応処理を用いた複数楽器の音源同定処理
- 特徴量に注目した複数楽器の演奏における音源同定処理
- 予測ミスした命令の実行を継続する投機手法(マイクロアーキテクチャ,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式 (集積回路)
- スレッド投機実行のためのキャッシュコヒーレンシプロトコルの検証(ARC-6: キャッシュ・システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 耐永久故障FPGAアーキテクチャ (ディペンダブルコンピューティング)
- タイミング・フォールト耐性を持つクロッキング方式(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラムの繰り返し構造に着目した動的なヘルパースレッディング(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 分岐プレディシジョン(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 4K-4 情報漏洩防止のための暗黙的インフォメーションフロー追跡(情報爆発時代における分散処理とセキュリティ,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチコア・プロセッサの不均質共有キャッシュにおけるLRU大域置き換えアルゴリズム(プロセッサアーキテクチャ)
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタ・ファイル書き込み時タイミング・エラーに関する脆弱性評価(ARC-11:高信頼性および応用システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 脆弱性検出のための値範囲解析(プログラム解析)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 料理映像の構造解析による調理手順との対応付け(マルチメディアパターン処理)
- 動きに基づく料理映像の自動要約(画像の認識と理解)
- 料理映像の特徴を利用した要約手法の検討
- タイミング・エラー耐性を持つスーパスカラ・プロセッサ(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 逆Dualflowアーキテクチャ(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- インタリーブ型剰余乗算回路の評価(VLSI設計技術とCAD)
- RSA暗号処理における高基数剰余乗算回路
- RSA暗号処理における高基数剰余乗算回路
- 動的推定によるプリフェッチ量最適化
- 最適なロールバック・ポイントを選択するトランザクショナル・メモリ
- 面積効率を指向するプロセッサの設計
- 文字列ごとの情報フロー追跡手法のPHPへの実装と評価
- 5D-4 図形間の類似性を利用した描画予測
- 編集にあたって(平成19年度論文賞の受賞論文紹介)
- No.1 社会情報インフラの安全と信頼(情報処理で社会を守る)
- クラスタ型プロセッサにおけるSMT実行(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- クラスタ型プロセッサにおけるSMT実行(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- クラスタ型プロセッサにおけるSMT実行
- クラスタ型プロセッサのための分散投機メモリフォワーディング(プロセッサアーキテクチャ)
- 発行時間差に基づいた命令ステアリング方式(プロセッサアーキテクチャ)
- クリティカルパス情報を用いた分散命令発行型マイクロプロセッサ向けステアリング方式(アーキテクチャ)
- VLDP3アーキテクチャにおけるメモリリネーミング手法の検討
- VLDP3アーキテクチャにおけるレジスタ値の高速Forwarding手法の提案
- VLDP3 : データフローを高速実行する大規模アーキテクチャ
- C-17 VLDP3アーキテクチャの構想(4) : メモリ依存に関する初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-16 VLDP3アーキテクチャの構想(3) : レジスタフォワーディング機構の初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-15 VLDP3アーキテクチャの構想(2) : ソフトウェア支援(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- C-14 VLDP3アーキテクチャの構想(1) : プロセッサ構成(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリ
- 耐永久故障FPGAアーキテクチャ
- SWIFT:文字列ごとの情報フロー追跡手法
- 逆Dualflowアーキテクチャ
- テレビニュース字幕の語義属性解析のための辞書作成
- 色頻度・局所エッジ成分を総合的に用いた物体検出手法とサッカー映像における選手検出への応用
- 料理テキスト教材における調理手順の構造化
- ニュース映像における人物の分離による背景の場面推定 (画像の認識・理解論文特集)
- 5M-8 ニュース映像における人物領域と背景領域の個別特徴量解析による人物と場面の追跡・索引付け手法
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 部分的試行に基づく動的共有キャッシュ分割方式
- GeForce GTX 280 vs. Cell
- 置換データの性質に着目した動的キャッシュパーティショニング
- 追い出しラインに着目したプリフェッチスロットリング手法
- フィードバックを用いたハイブリッド・プリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- 省ハードウェア資源のフィードバックつきハイブリッドプリフェッチ方式
- GeForce GTX 280 vs. Cell
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(設計技術/性能評価,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- ツインテール・アーキテクチャ(ARC-3:プロセッサアーキテクチャII,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 予測ミスした命令の実行を継続する投機手法(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 耐ソフトウェアタンパ・プロセッサ(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- タグ・アーキテクチャのための効率的なタグ管理機構(アーキテクチャ)
- メモリ依存予測を利用したフォワーディング局所化手法(ARC-3 : プロセッサアーキテクチャIII)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 2010年度論文賞の受賞論文紹介 : 低次キャッシュとプリフェッチ