Dual Renamingを用いたControl Independence(計算機システム)
スポンサーリンク
概要
- 論文の詳細を見る
現在のスーパスカラプロセッサでは,分岐予測ミスが発生したときにミスした分岐命令以降のすべての命令を取り消す.このペナルティを緩和するためControl Independence(CI)を利用する手法が提案されてきた.これらの手法は分岐ミス発生時に分岐の成否に依存しない命令(Control Independent Instructions:CI命令)を取り消さずに,再利用する.しかし,データ依存性のある命令は依存関係が更新されるため,そのまま再利用することができない.この問題を解決するために,レジスタ再Renaming(Re-renaming)の実行,対応する分岐パターンの限定,依存する命令の遅延などの手法が提案されている.これらの手法では,メカニズムの複雑化,オーバヘッドの増加,限定パターンや命令の遅延による効率の低下などの欠点が生じてしまう.本論文では,パターンの限定と遅延を行わず,より簡単なメカニズムでCI命令を再利用するためDual Renaming方式を提案する.本提案ではCI命令に依存先が確定できないソースオペランドに二つのタグを割り当て,分岐ミス時に簡単なメカニズムでデータ依存関係を回復し,CI命令の再利用を図る.本提案をSimpleScalar上に実装し,シミュレーションにより性能評価を行った.15段のパイプラインステージにおいて,最大29.52%の性能向上が達成された.
- 2011-01-01
著者
-
小柳 滋
立命館大学大学院理工学研究科
-
小柳 滋
立命館大学理工学部情報理工学部
-
孟 林
立命館大学大学院理工学研究科
-
小柳 滋
立命館大学情報理工学部
-
小柳 滋
立命館大学
-
小柳 滋
立命館大
-
孟 林
立命館大学 理工学部
関連論文
- 並列AIマシンProdigyの視覚的デバッガ(VDB)
- 並列AIマシンProdigyの応用(2) : 並列意味ネットワーク向き外延的知識の表現方法
- 並列AIマシンProdigyの応用(1) : 並列プロダクションシステムの実現と評価
- 仮想出力キューイング方式に基づいた低遅延オンチップルータの開発 (システム開発論文特集)
- 5P-6 検索キーワードに応じて適切な検索APIを選択するメタ検索システムの開発(情報検索(1),学生セッション,データベースとメディア)
- D-026 ユーザビリティ向上を目指した検索結果の視覚化(データベース,一般論文)
- 仮想出力キューイング方式に基づいた低遅延オンチップルータの開発(並列・分散システム,システム開発論文)
- D-037 SNSにおけるアクセスコントロールのための信頼値の算出方法(データベース,一般論文)
- D-025 階層クラスタリングにおける新しい手法の提案(データベース,一般論文)
- D-033 C2C型オンラインマーケットにおける商品の推薦システム(D分野:データベース)
- 1X-9 複数の共通鍵暗号の同一FPGA上での比較(セキュア設計・実装・フォレンジクス,学生セッション,セキュリティ)
- 1N-5 SVMを用いたIDS異常検知のハードウェア設計(組込みとセキュリティ,学生セッション,アーキテクチャ)
- 1N-4 ネットワーク侵入検知のための文字列照合のハードウェア設計(組込みとセキュリティ,学生セッション,アーキテクチャ)
- 協調フィルタリングにおける相関係数法の予測性能向上(情報検索,データ工学論文)
- LA-003 協調フィルタリングにおける相関係数法の改善手法の提案(A. モデル・アルゴリズム・プログラミング)
- Dual Renamingを用いたControl Independence(計算機システム)
- リアルタイムバースト検出手法の提案
- 6ZD-3 NoCにおけるマルチパスルーティング(ネットワークと専用アーキテクチャ,学生セッション,アーキテクチャ)
- 5K-2 「Control Independence」におけるリソース管理手法の提案(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- 2K-1 プロセッサ設計教育の実践と評価(プロセッサ設計とメモリシステム,学生セッション,アーキテクチャ)
- 4N-6 PHTエントリの破壊的競合を検知する手法とその効果(マルチスレッドと分岐予測,学生セッション,アーキテクチャ)
- C-010 CHAIN手法を用いたプロセッサのアウトオブオーダ実行(C分野:ハードウェア・アーキテクチャ)
- M_042 CHAIN手法とRENAME手法を混用するスーパースカラプロセッサの設計と評価(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- D-021 単語クラスタリングを用いた検索キーワードの提示(データベース,一般論文)
- C-009 学生によるプロセッサ設計実験に基づいたハード/ソフト協調学習システムの評価(ハードウェア・アーキテクチャ,一般論文)
- C-004 キャッシュ上のタグビットを用いたバッファオーバーフロー防止手法(ハードウェア・アーキテクチャ,一般論文)
- 6S-3 ブログ検索エンジンにおける話題兆候の発見(ユーザ指向・推薦,学生セッション,データベースとメディア)
- 4S-1 SNSにおける信頼値に基づいたアクセスコントロール(SNS,ブログ,ソーシャルWeb,学生セッション,データベースとメディア)
- D-039 A Comparison of Automatic Document Classification Methods for Vietnamese Language
- D-038 Hierarchical Clustering and Bisecting K-Means in producing Time Series Patent Map
- D-007 ばねモデルを用いた検索結果のグラフレイアウト手法(D分野:データベース)
- C-013 冗長二進数を用いたRSA暗号回路(C分野:ハードウェア・アーキテクチャ)
- LC-008 Three stages pipelined MD5 implementation on FPGA
- LC-002 プロセッサ設計支援ツールの設計・実装とハード/ソフト協調学習システムの評価(ハードウェア・アーキテクチャ)
- WWWアクセスシーケンスの新しいマイニング手法の提案(データマイニング・データウェアハウス)
- 4Q-3 複数のウィンドウサイズに対応したリアルタイムバースト検出手法の提案(ストリーム・空間検索,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-026 動的カテゴリ生成機能を備えたオンラインマーケットの開発(D分野:データベース)
- 2M-4 NoCにおけるQoS方式の提案とその評価(ネットワークアーキテクチャ,学生セッション,アーキテクチャ,情報処理学会創立50周年記念)
- C-011 スーパースカラプロセッサにおけるALU chainingとロード値予測を併用したデータ依存の軽減手法(C分野:ハードウェア・アーキテクチャ,一般論文)
- C-005 NoCにおける動的仮想チャネル分割によるQoSの実現とその評価(C分野:ハードウェア・アーキテクチャ,一般論文)
- O-015 プロフサイト内の人間関係解析によるネットパトロール支援に関する研究(O分野:情報システム,一般論文)
- O-014 プロフサイトの内容解析による非行逸脱行為判定手法の検討(O分野:情報システム,一般論文)
- 2S-1 ゆるやかな密度変化に対応するLDBSCANの拡張(マイニング・地理情報,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- 1R-9 検索連動広告における広告選択手法の提案(Web検索支援,学生セッション,データベースとメディア,情報処理学会創立50周年記念)
- D-004 P2P情報検索におけるDHTの階層化の提案(データベース,一般論文)
- C-016 IDSにおけるハードウェアでのパターンマッチング性能検証(ハードウェア・アーキテクチャ,一般論文)
- C-010 仮想出力キューイング方式に基づいた低遅延ルータのFPGA実装・評価(ハードウェア・アーキテクチャ,一般論文)
- RC-001 Dual Renamingを用いたControl Independenceアーキテクチャ(ハードウェア・アーキテクチャ,査読付き論文)
- C-012 Control Independenceアーキテクチャに適した分岐合流点の動的予測手法(C分野:ハードウェア・アーキテクチャ,一般論文)
- D_054 SNSにユーザ信頼値を付与した推薦システム(D分野:データベース)
- D_055 SNSにおけるユーザの関係の視覚化(D分野:データベース)
- C-002 リコンフィギュラブル・ハードウェアによるテンプレート・マッチングの設計(C分野:アーキテクチャ・ハードウェア)
- D-020 x-means法における分割停止規準の改良(データベース,一般論文)
- 1N-6 Four-stage Pipelining for Two Messages in MD5 Implementation with Data Forwarding
- ピンポンアルゴリズムの拡張
- N_009 ハード/ソフト協調学習のための命令セット定義ツールとプロセッサデバッガの開発(N分野:教育・人文科学)
- M_047 パケットフィルタリングのハードウェア設計(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- M_045 文字列照合のハードウェア設計(M分野:アーキテクチャ・ユビキタス・セキュリティ)
- D_023 検索のパーソナライズにおける文脈の追随(D分野:データベース)
- C_002 Handel-CによるSHA-1の設計とハードウェア/ソフトウェア最適分割の検討(C分野:ハードウェア)
- LC_005 ハイブリッド並列プログラミングによるMPEG2エンコーダの高速化(C分野:ハードウェア)
- ニュース・ウェブログ記事集約サイトの開発(ネットワーク・並列分散システムソフトウェア, システム開発論文)
- K-039 データマイニング手法を用いたマークシートテストの分析(K.ヒューマンコミュニケーション&インタラクション)
- C-034 ハード/ソフト最適分割を考慮したAES暗号システムとJPEGエンコーダの設計と検証(C分野:アーキテクチャ・ハードウェア)
- C-009 FPGAを用いたプロセッサ検証システムの設計と実装(C分野:アーキテクチャ・ハードウェア)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- ハード/ソフト・コラーニングシステムにおける各種マイクロプロセッサの設計と実装(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- A FPGA Based Hardware/Software Co-learning System
- C-030 Superscalar Microprocessor Design in a Hardware Software Co-learning System
- C-003 ダイナミック・リコンフィギュラブル・プロセッサの応用と評価(C分野:アーキテクチャ・ハードウェア)
- C-001 教育用マイクロプロセッサの設計とFPGAボード上での検証(C分野:アーキテクチャ・ハードウェア)
- A-030 PCクラスタ上でのJPEGエンコーダ・デコーダの並列化(A分野:モデル・アルゴリズム・プログラミング)
- LC-001 マイクロプロセッサの設計と検証に基づいたハード/ソフト・コラーニングシステムの拡張(C分野:アーキテクチャ・ハードウェア)
- D-046 Webコンテンツマイニングによるページ間の類似性の判定ツール(D.データベース)
- D-023 Evaluation of Parallel Algorithms for Association Rules Mining
- LC-008 プロセッサアーキテクチャ教育用FPGAボードコンピュータシステムの開発(C. アーキテクチャ・ハードウェア)
- Web上の技術情報と企業間の関係を用いた提携企業推薦
- マイクロブログから抽出した地物情報と投稿間隔を考慮した位置情報推定
- ECサイトへの訪問キーワードに着目したアクセス動向の可視化手法の提案
- 行列操作としての頻出アイテム集合列挙
- 行列上の相互順序決定
- 内積縮退MC:類似行の検出と類似列の検出を組み合わせたマトリクスクラスタリングアルゴリズム
- 著者属性の推定結果を用いたプロフの出会い目的の書き込み検出のための教師データ自動構築手法 (データベース Vol.4 No.3)
- リアルタイムバースト解析手法の提案
- 分岐予測ミスの偏りを利用した分岐予測器の提案 (コンピューティングシステム Vol.4 No.4)
- 大規模WebサイトにおけるWebアクセスログの最長共通部分列を用いた推薦の高速化手法(情報推薦,データ工学と情報マネジメント論文)
- RC-002 GPUを用いたリアルタイムレイトレーシングの並列化(コンピュータシステム応用,C分野:ハードウェア・アーキテクチャ)
- O-030 教師データの投稿年代を考慮した有害情報の判定手法に関する検討(情報検索,O分野:情報システム)
- B-035 GPUを考慮した並列分散GAの高速処理(GPGPU,B分野:ソフトウェア)
- N-019 複数SNSサイトにおける発信情報分析による個人特定の可能性の検証(電子化知的財産・社会基盤,N分野:教育・人文科学)
- C-028 ネットワークIDS向けのBloom Filterと偽陽性検出回路を用いたパターンマッチング回路(ディペンダブルシステム,C分野:ハードウェア・アーキテクチャ)
- C-013 動的な仮想チャネル管理機構を持ったオンチップルータ(コンピュータシステム,C分野:ハードウェア・アーキテクチャ)
- C-001 分岐予測ミスの偏りとローカル履歴の規則性を利用した分岐予測器の提案(計算機アーキテクチャと並列処理,C分野:ハードウェア・アーキテクチャ)
- FPGAを用いた液晶用ガラス欠損検出システムの高速化
- C-012 FPGAを用いた液晶用ガラス欠損検出システムの高速化(C分野:ハードウェア・アーキテクチャ,一般論文)
- C-005 演算レベル並列処理用マルチALUプロセッサの設計と実現(C分野:ハードウェア・アーキテクチャ,一般論文)