メモリ投機を支援するCMPキャッシュコヒーレンスプロトコルの検討(チップマルチプロセッサ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
スポンサーリンク
概要
- 論文の詳細を見る
半導体プロセスの微細化に伴いチップマルチプロセッサが一般化しつつある。複数のプロセッサコアを有効活用する手法としてスレッド投機実行と呼ばれるマルチスレッド化手法が提案されてきた。スレッド投機の実現にはいくつかの付加的なハードウェアが必要となるが、本稿ではメモリ投機を支援する機構としてキャッシュコヒーレンスプロトコルに着目し、スレッド投機実行に起因するキャッシュミスを複数のプロトコルで評価した。その結果、ブロードキャストの適用により性能は約30%向上することがわかった。また、最も高い性能を達成したのは更新方式であるが,更新方式と無効化方式の性能差は6〜9%程度であり、ブロードキャストの適用効果に比べ、設計の複雑な更新方式を採用するメリットは小さいことがわかった。
- 一般社団法人情報処理学会の論文
- 2004-12-01
著者
-
坂井 修一
東京大学大学院工学系研究科
-
豊島 隆志
富士通株式会社
-
田代 大輔
(現)日立製作所中央研究所
-
バルリ ニコデムス
東京大学大学院 情報理工学系研究科:(現)日本テキサス・インスツルメンツ株式会社
-
田代 大輔
東京大学大学院工学系研究科
-
豊島 隆志
東京大学大学院 情報理工学系研究科
-
バルリ ニコ
東京大学大学院 情報理工学系研究科
-
坂井 修一
東京大学大学院 情報理工学系研究科
関連論文
- 2N-7 教養番組のテキスト教材における手順の構造化
- ツインテール・アーキテクチャの改良(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 2レベル・ストライド値予測機構の可能性検討(並列処理)
- 3H-4 ストアキューの拡張によるロードトラフィックの削減方式
- 3H-2 複数パス実行時におけるキャッシュトラフィックの傾向分析
- V_LD_Pアーキテクチャにおけるデータアクセスの軽減手法
- 2H-6 ショート・リブド・データの動的な予測に関する検討
- ALU-NET : VLDPアーキテクチャにおける命令実行機構
- VLDPアーキテクチャにおける実行パス制御方式の検討
- 命令ストリーミング : 複数パスの投機処理に適した命令列構成方式
- VLDPアーキテクチャの性能に関する初期的考察
- 命令ウィンドウの動的最適化
- V_LD_Pアーキテクチャにおける実行パス制御機構
- 5-2-1 東京大学「情報科学技術戦略コア」(5-2 情報・電気・電子分野の21世紀COE,3プロジェクトの拠点リーダーより)(5.大学での研究プロジェクト : 21世紀COEプログラム)(グローバル化時代の教育と研究)
- ツインテール・アーキテクチャの評価(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 周波数成分の重なり適応処理を用いた複数楽器の音源同定処理
- 特徴量に注目した複数楽器の演奏における音源同定処理
- スレッド投機実行のためのキャッシュコヒーレンシプロトコルの検証(ARC-6: キャッシュ・システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 耐永久故障FPGAアーキテクチャ (ディペンダブルコンピューティング)
- タイミング・フォールト耐性を持つクロッキング方式(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラムの繰り返し構造に着目した動的なヘルパースレッディング(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 分岐プレディシジョン(ARC-4:分岐予測,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチコア・プロセッサの不均質共有キャッシュにおけるLRU大域置き換えアルゴリズム(プロセッサアーキテクチャ)
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- レジスタ・ファイル書き込み時タイミング・エラーに関する脆弱性評価(ARC-11:高信頼性および応用システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 脆弱性検出のための値範囲解析(プログラム解析)
- 動的なインフォメーションフロー制御による情報漏洩防止手法(セキュアアーキテクチャ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 料理映像の構造解析による調理手順との対応付け(マルチメディアパターン処理)
- 動きに基づく料理映像の自動要約(画像の認識と理解)
- 料理映像の特徴を利用した要約手法の検討
- タイミング・エラー耐性を持つスーパスカラ・プロセッサ(耐エラー技術,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- パッシブWABの改良による低コストなレジスタ書き込みエラー検出手法(ディペンダブルコンピューティングシステム及び一般)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 文字列に着目した情報フロー追跡によるインジェクション攻撃の検出(セキュリティ・その他,組込技術とネットワークに関するワークショップETNET2008)
- 逆Dualflowアーキテクチャ(ARC-1 : アーキテクチャI,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- インタリーブ型剰余乗算回路の評価(VLSI設計技術とCAD)
- RSA暗号処理における高基数剰余乗算回路
- RSA暗号処理における高基数剰余乗算回路
- 最適なロールバック・ポイントを選択するトランザクショナル・メモリ
- 面積効率を指向するプロセッサの設計
- 文字列ごとの情報フロー追跡手法のPHPへの実装と評価
- 5D-4 図形間の類似性を利用した描画予測
- 編集にあたって(平成19年度論文賞の受賞論文紹介)
- No.1 社会情報インフラの安全と信頼(情報処理で社会を守る)
- クラスタ型プロセッサにおけるSMT実行(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- クラスタ型プロセッサにおけるSMT実行(プロセッサ技術(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- クラスタ型プロセッサにおけるSMT実行
- クラスタ型プロセッサのための分散投機メモリフォワーディング(プロセッサアーキテクチャ)
- 発行時間差に基づいた命令ステアリング方式(プロセッサアーキテクチャ)
- クリティカルパス情報を用いた分散命令発行型マイクロプロセッサ向けステアリング方式(アーキテクチャ)
- C-17 VLDP3アーキテクチャの構想(4) : メモリ依存に関する初期検討(計算機アーキテクチャと最適化,C.アーキテクチャ・ハードウェア)
- 耐永久故障FPGAアーキテクチャ(ディペンダブルアーキテクチャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリ
- 耐永久故障FPGAアーキテクチャ
- SWIFT:文字列ごとの情報フロー追跡手法
- 逆Dualflowアーキテクチャ
- テレビニュース字幕の語義属性解析のための辞書作成
- 色頻度・局所エッジ成分を総合的に用いた物体検出手法とサッカー映像における選手検出への応用
- 料理テキスト教材における調理手順の構造化
- ニュース映像における人物の分離による背景の場面推定 (画像の認識・理解論文特集)
- 5M-8 ニュース映像における人物領域と背景領域の個別特徴量解析による人物と場面の追跡・索引付け手法
- 4U-7 料理番組における映像とテキスト情報の対応づけ
- 言語情報を伴う画像の画像的特徴量と語義の統計的対応付け
- 字幕の語義に基づくニュース映像分類
- 3M-5 最適なロールバック・ポイントを選択するネスティッド・トランザクショナル・メモリの評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- ディペンダビリティとセキュリティ : デバイス、アーキテクチャ、ソフトウェア(ディペンダブルプロセッサ,ディペンダブルコンピュータシステムとセキュリティ技術及び一般)
- 3M-1 プロセッサ性能に対する主記憶バンド幅の影響の評価(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 動的タイミング・エラー検出のための「書き込み保証バッファ」の評価(設計技術/性能評価,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 音楽の要素構成構造に着目した曲断片のモーフィング
- 音楽の要素構成構造に着目した曲断片のモーフィング
- 3H-3 VLDPにおけるデータ書き戻し削減手法 : Last Use検出によりデータ書き戻しを制御する方式
- 6M-2 過渡故障耐性を持つOut-of-Orderスーパスカラ・プロセッサの評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 3M-2 面積効率を指向するプロセッサの設計と実装(プロセッサアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 1ZE-8 文字列ごとの情報フロー追跡手法のPHPへの実装(ネットワークセキュリティ,一般セッション, セキュリティ,情報処理学会創立50周年記念)
- 2T-3 タイミング制約を緩和するクロッキング方式の提案(論理・物理設計,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 6M-1 耐永久故障FPGAアーキテクチャの予備評価(計算機システム,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 5M-4 繰り返し構造に着目した分岐プレディシジョンの改良(マルチスレッドと分岐,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- 大規模データパス・アーキテクチャにおけるフェッチ機構
- 2000-ARC-139-11 大規模データパス・ア-キテクチャにおける命令ブロック構成の検討
- 2000-ARC-139-10 大規模データパス・アーキテクチャの実行機構
- 2000-ARC-139-9 大規模データパス・アーキテクチャの提案
- 複数パス投機実行のためのレジスタセット管理方式
- 自動採譜処理における知覚的階層に着目したパート分離処理
- 採譜支援システムにおける要素技術
- 採譜支援システムにおける要素技術
- 2000-MUS-36-5 音楽認知モデルによる感性情報抽出
- 2000-MUS-36-2 音響信号からのメロディ検索と採譜システム
- マン・マシン協調による採譜システム
- マン・マシン協調による採譜システム
- 5G-7 音響信号の特徴量の類似性に基く楽曲からのストリーム抽出
- 5G-6 楽曲の類似性に着目した音楽情景分析
- 4G-6 音楽音響信号からの楽曲の感性的特徴の抽出
- クラスタ型スーパースカラプロセッサにおけるストア命令の早期発行手法(プロセッサ技術(2), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- クラスタ型スーパースカラプロセッサにおけるストア命令の早期発行手法