SR11000向け実行資源均等化命令スケジューリング(コンパイラ及びツール, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)
スポンサーリンク
概要
- 論文の詳細を見る
スーパーテクニカルサーバSR11000モデルJ1に搭載されているPOWER5プロセッサでは、数命令ずつグループ化してグループ単位で命令の発行・完了などを行っている。POWER5ではこのグループ内の位置(スロット)により利用する実行資源が固定されている。このため、ロード/ストアや浮動小数点演算などの実行資源は2個ずつ実装されているが、ある実行資源を利用する命令がグループ内の特定のスロットにのみ存在する場合、2つのうち一方の実行資源だけを使うため、もう一方の実行資源が利用されず、最大性能が引き出せないという問題が生じる。そこで、グループ内の命令配置位置を考慮する実行資源均等化命令スケジューリングを開発した。実数型の基本演算プログラムに適用した結果、総和計算で約21%、加算計算で約16%の性能向上が得られた。
- 2005-01-21
著者
関連論文
- ハードウェアプリフェッチ機構を利用したコンパイラ制御によるデータプリフェッチ方式
- SR8000におけるデータプリロード処理
- 漸化式のスーパースカラ向け高速化
- リカレンスをもつループのスーパースカラ向け高速化方式
- SR11000におけるソフトウェアプリフェッチ手法の評価(ARC-7 : キャッシュシステム)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- D-6-11 SR11000モデルH1のソフトウェアプリフェッチ手法(D-6. コンピュータシステム)
- 並列化支援システム「Parassist」の試作 : 並列プロセス表示方法
- 並列化支援システム「Parassist」の試作 : 並列性検査方法
- 並列化支援システム「Parassist」の試作 : 不正並列化検出方法
- コード生成向きパタン照合における簡易な競合解消方法
- コ-ド生成向きパタン照合における簡易な競合解消方法
- URRアーキテクチャおよびコンパイラの試作
- 仮想スケジューリングに基づくレジスタ割り付け方式
- B-024 x64プロセッサ向けメモリアクセス最適化技術(ソフトウェア,一般論文)
- ストリーム数とリユースを考慮したループ分配方式(数値計算とコンパイラ)
- C-028 SR11000コンパイラにおけるデータキャッシュ向け最適化(C.アーキテクチャ・ハードウェア)
- RISC向けコンパイラにおけるループ構造変換
- スキャナ・ジェネレータSGENの開発
- パーサ・ジェネレータPGENの開発
- SR11000向け実行資源均等化命令スケジューリング(コンパイラ及びツール, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)