スーパースカラ・プロセッサにおける分岐命令の並列実行

概要

論文の詳細を見る
我々はブースティング方式を採用したスーパースカラ・プロセッサSARCHの開発を行っている.3命令同時発行を行うSARCHにより,スカラ・プロセッサに対して1.75倍の性能向上が得られたが,4命令同時発行を可能にしても性能向上は1.77倍にとどまり,現アーキテクチャでは機能ユニット数を増加させても,飛躍的な向上は困難であると考えられる.そこで,さらに多くの並列性を引き出すために分岐命令の並列実行について検討を行った.分岐命令の並列実行を行うことで,命令レベル並列性の低い基本ブロックの合併,および,プログラム全体に占められる遅延スロット数の低減が可能となり,性能向上が期待できる.評価を行った結果,3つの分岐命令を並列に実行することにより,1分岐実行だけのスーパースカラ・マシンではあまり性能向上が得られなかったベンチマークにおいても並列性を引き出すことができ,平均で25%の性能向上を得ることができた.また,分岐命令並列実行による分岐処理時間増加に対して,branch on condition方式を採用することにより,実行サイクル数をほとんど増やすことなく,分岐処理時間をサイクル・タイム内に収められることが分かった.
1993-08-19