スーパースカラ・プロセッサにおける分岐命令の並列実行
スポンサーリンク
概要
- 論文の詳細を見る
我々はブースティング方式を採用したスーパースカラ・プロセッサSARCHの開発を行っている.3命令同時発行を行うSARCHにより,スカラ・プロセッサに対して1.75倍の性能向上が得られたが,4命令同時発行を可能にしても性能向上は1.77倍にとどまり,現アーキテクチャでは機能ユニット数を増加させても,飛躍的な向上は困難であると考えられる.そこで,さらに多くの並列性を引き出すために分岐命令の並列実行について検討を行った.分岐命令の並列実行を行うことで,命令レベル並列性の低い基本ブロックの合併,および,プログラム全体に占められる遅延スロット数の低減が可能となり,性能向上が期待できる.評価を行った結果,3つの分岐命令を並列に実行することにより,1分岐実行だけのスーパースカラ・マシンではあまり性能向上が得られなかったベンチマークにおいても並列性を引き出すことができ,平均で25%の性能向上を得ることができた.また,分岐命令並列実行による分岐処理時間増加に対して,branch on condition方式を採用することにより,実行サイクル数をほとんど増やすことなく,分岐処理時間をサイクル・タイム内に収められることが分かった.
- 1993-08-19
著者
-
中西 知嘉子
三菱電気株式会社システムLSI事業化推進センター
-
安藤 秀樹
名古屋大学大学院工学研究科電子情報学専攻
-
原 哲也
三菱電気株式会社システムLSI事業統括部
-
中屋 雅夫
三菱電気株式会社システムLSI事業化推進センター
-
原 哲也
三菱電機(株)システムLSI開発研究所
-
安藤 秀樹
三菱電機(株)システムLSI開発研究所
-
中西 知嘉子
三菱電機(株)システムLSI開発研究所
-
中屋 雅夫
三菱電機(株)システムLSI開発研究所
-
町田 浩久
三菱電機(株)システムlsi事業統括部
-
町田 浩久
三菱電機(株)システムlsi開発研究所
関連論文
- 複数命令フェッチに対する並列分岐先予測/命令フェッチ機構(並列処理)
- VLIWマシンのための非数値計算応用向き広域命令スケジューリング手法
- サイクル時間評価による命令レベル並列処理マシンの性能比較
- 投機的実行を支援するアーキテクチャのハードウェア設計
- スーパースカラ・プロセッサにおける分岐命令の並列実行
- パイプラインステージ統合とDVSの併用による消費電力の削減(省電力方式)
- スーパスカラプロセッサ-SARCH-のコードスケジューラ
- VT-CMOSキャッシュの性能低下をアドレス予測を用いて低減する先行起動機構(キャッシュ機構)
- 頻出値を利用した物理レジスタの共有化手法(プロセッサアーキテクチャ)
- 遺伝的アルゴリズムを用いた運転整理ダイヤの作成
- エリート個体群に共通の性質をサブゴールとする自立的漸進進化
- 遺伝的アルゴリズムを用いたオンライン分岐予測機構の設計
- パイプラインストールを除去した遺伝的アルゴリズム専用ハードウェア
- 遺伝的アルゴリズムを用いた分岐予測機構設計
- 自律的にサブゴールを獲得する漸進進化による理論回路自動設計
- 遺伝的アルゴリズムを用いた分岐予測機構設計
- サブツリー評価値による遺伝的操作を用いた論理回路自動設計に関する研究
- 計算機アーキテクチャのトップカンファレンスを攻略しよう!
- マルチコアプロセッサにおけるメモリ依存予測及び同期機構
- リオーダ・バッファのハードウェア量削減
- リオーダ・バッファの仮想的な拡大による先行実行
- パイプラインストールを除去した遺伝的アルゴリズム専用ハードウェアの実現
- パイプラインストールを除去した遺伝的アルゴリズム専用ハードウェアの実現
- 遺伝的アルゴリズムの専用ハードウェア化
- クラスタ化スーパスカラ・プロセッサにおけるレジスタ・ファイルの階層化と選択的広域通信制御(マルチスレッド実行とプロセッサアーキテクチャ)
- 命令発行キューの遅延時間評価
- 物理レジスタ2段階解放方式の低消費電力化手法の評価
- 物理レジスタ2段階解放方式の低消費電力化手法の評価
- 値予測を用いた物理レジスタ2段階解放による命令先行実行方式の性能向上(プロセッサアーキテクチャ)
- 命令発行キューの深いパイプライン化(ARC-3:アーキテクチャ2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 物理レジスタ2段階解放による命令先行実行方式の低消費電力化(ARC-10 : アーキテクチャIII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 物理レジスタ2段階解放による命令先行実行方式の評価(ARC-10 : アーキテクチャIII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- スーパスカラ・プロセッサのための物理レジスタ2段階解放(ARC-1: プロセッサ・アーキテクチャ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- 単一チップ・マルチプロセッサSKYにおける投機的スレッド実行の性能評価(プロセッサ/コンパイラ, FRGAとその応用及び一般)
- SKYのマルチスレッド・モデルを実現したSMTプロセッサにおける物理レジスタの共有化手法(チップマルチプロセッサ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- データ依存を考慮したプレスケジューリングを行う命令スケジューラ(プロセッサアーキテクチャ)
- 非数値計算プログラムにおけるスレッドレベル並列性の限界 : スレッド間メモリ曖昧性除去技術との関係(プロセッサアーキテクチャ)
- BSデジタル衛星放送用復調LSIのアルゴリズム検討
- CAS2000-11 / VLD2000-20 / DSP2000-32 BSデジタル衛星放送用復調LSIのアルゴリズム検討
- CAS2000-11 / VLD2000-20 / DSP2000-32 BSデジタル衛星放送用復調LSIのアルゴリズム検討
- BSディジタル衛星放送用TC8/Q/BPSK復調LSIの開発
- BSディジタル復調LSI制御システムとフレーム同期確定手段に関する提案
- 投機的実行のためのアーキテクチャ上の支援
- 1.5MLIPS40ビット推論プロセッサ
- 単一チップ・マルチプロセッサSKYにおけるデータフローを考慮したスレッド分割技法(コンパイラ技術)
- 5. チップ・マルチプロセッサ(1.アーキテクチャ基盤技術, 新世代マイクロプロセッサアーキテクチャ(前編))
- パス選択によるソフトウェアパイプライニング
- プレディケーティング: VLIWマシンにおける投機的実行のためのアーキテクチャ上の支援
- パス選択によるソフトウェア・パイプライニング
- 分岐先バッファにおける分岐先情報の削減
- 物理レジスタ2段階解放方式の低消費電力化手法の評価
- 物理レジスタ2段階解放方式の低消費電力化手法の評価
- QAMチャネルデコーダLSIの復調アルゴリズム検討
- QAMチャネルデコーダLSIの復調アルゴリズム検討
- QAMチャネルデコーダLSIの復調アルゴリズム検討
- パイプラインステージ統合によるプロセッサの消費エネルギーの削減(プロセッサアーキテクチャ)
- 低消費電力化のための可変パイプライン
- 低レイテンシ1対1結合マルチポート・インターリーブ・キャッシュの評価
- クロスバスイッチをなくしたマルチバンクキャッシュ
- ATM用検索機能付きアドレスキュー
- 関数呼び出し時のレジスタの退避/復元に着目したメモリリネーミング手法
- ライン・バッファ・ヒット/ミス予測を利用した動的命令スケジューリング
- 値予測を利用した分岐予測機構
- 値予測を用いた分岐予測機構の計算機性能に与える影響
- CICC'93
- 仮想リオーダ・バッファ方式における選択的先行実行による低消費電力化
- 発行キューのタグRAMのバンク化と正確なクリティカルパスの遅延時間評価