オンチップMIMDプロセッサにおける実行時並列化機構の性能評価
スポンサーリンク
概要
- 論文の詳細を見る
我々は、スーパースカラアーキテクチャによるプロセッサの速度向上がこれ以上求められない現在において大規模集積回路の集積度の上昇より得られる大きなハードウェア資源を活用し、かつ、現在の命令レベルでの投機実行よりもさらに大きな粒度であるループブロックの投機実行を行なうことにより高速化を行なう機構としてループブロックを実行時に並列化し実行を行なう run-time restructuringアーキテクチャを提案してきた。ループレベルの並列性は命令レベルの並列性よりも大きな資源を必要とするが、よりハイパフォーマンスを獲得することが可能である。run-time restructuringではオンチップMIMD アーキテクチャをベースとした並列マイクロプロセッサにおいて逐次形式で生成されたバイナリプログラムを実行時に解析し、再構成することによって、重複実行によるループレベルの投機実行を行なうことが可能である。本稿では、我々が先に提案したプログラム再構成による並列化スレッドの投機実行を行なうオンチップMIMDマイクロプロセッサにおける性能向上をSPEC95ベンチマークと画像アプリケーションに多く用いられているgif, jpeg, mpeg展開ルーチンを用いて計測した。結果として浮動小数アプリケーションでは大きなの実行時並列化の効果が得られ、また、画像アプリケーションや整数アプリケーションでもプログラム中にループが存在すれば、速度向上が得られることが示された。
- 1997-10-28
著者
関連論文
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ハードウェア・エンジンを用いた10GbE上のTCP通信解析(HPC-17 : 高性能通信)
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ソフトウェアDSMにおいてfetch-on-writeによる通信トラフィックを削減する手法
- 細粒度パケット間隔制御の実装と評価(OS-4: 通信システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- インテリジェントNICを用いた高帯域ネットワーク向けTCP通信方式(OS-3:ネットワーク)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 5-2-1 東京大学「情報科学技術戦略コア」(5-2 情報・電気・電子分野の21世紀COE,3プロジェクトの拠点リーダーより)(5.大学での研究プロジェクト : 21世紀COEプログラム)(グローバル化時代の教育と研究)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 実行時の分岐のふるまいに基づくスレッド間データ依存関係予測(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 2000-ARC-139-14 NICを活用したネットワークRAID方式の提案
- CPSY2000-42 高性能組み込み用プロセッサアーキテクチャの検討
- 中粒度メモリベース通信を支援するMemory-Based Processor II
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 長距離広帯域ネットワークでのTCP/IP Acknowledge Packet受信の影響ついて(インターネット応用及び一般)
- 10ギガビットネットワーク上での高効率TCP/IP通信の実現(HPC-17 : 高性能通信)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- Real Long Fat NetworkにおけるTCP/IPv6の通信性能評価(インターネット及び一般)
- FLASHを用いたリアルタイム講演中継システムとその特性(インターネット運用・管理技術,一般,インターネット運用・管理技術,一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- 擬似ネットワーク環境におけるTCP/IPの性能評価(インターネット及び一般)
- 高レイテンシ環境下におけるデータレゼボワールの性能評価
- 超高速ネットワーク用データ共有システム : データレゼボワールの性能評価
- 実行時再構成方式におけるバイナリトランスレーション支援
- 分散共有メモリ型超並列計算機JUMP-1におけるスケーラブルI/Oサブシステムの構成
- CPSY2000-51 ソフトウェア高レベルデータ値予測方式の予備評価
- 汎用細粒度並列計算機:お茶の水1号 : 構成と性能評価
- ソフトウェアDSM機構を支援する最適化コンパイラ
- 2000-OS-85-5 汎用クラスタ上の資源情報を用いたHTTPサーバにおける負荷分散性能の評価
- 2000-ARC-139-2 ハードウェア分散共有メモリにおけるスケーラブルなディレクトリ方式の定量的評価
- Casablanca:実時間処理RISCコアの設計と実装
- コンパイラが支援するソフトウェアDSM機構 : ADSMとUDSMの性能評価
- ソフトウェアシミュレータ上でのSPLASH-2ベンチマークの挙動に関する研究
- メモリべース通信を用いた高速MPIの実装と評価 (並列処理)
- 軽いハードウェアによる分散共有メモリ機構 (並列処理)
- リアルタイムラウンドロビン
- 分散共有メモリに基づく計算機クラスタ(計算機クラスタ)
- 汎用スケーラブルOS SSS-COREのカーネル構成について
- 並列アプリケーションによるMPI/MBCFの評価
- ループ並列投機実行のJava仮想マシンの適用
- 非対称分散共有メモリ上における最適化コンパイル技法の評価(並列処理)
- 非対称分散共有メモリ上における最適化コンパイル技法の評価
- 低コストハードウェア分散共有メモリ
- 非対称分散共有メモリ上におけるコンパイル技法
- 動的に生成されたオブジェクトを扱うループの並列化手法
- エラスティックメモリコンシステンシモデルのシミュレーション評価
- 実行時再構成方式テストベットOcha-Proの性能評価
- オンチップハードウエアによるループ並列化機構
- On Chip MIMDにおける大規模投機実行機構
- バイナリコンパチビリティを保ちながらloopを投機実行するアーキテクチャ
- Loopを並列実行するアーキテクチャ
- 汎用超並列オペレーティングシステムSSS-CORE : 高速MPIの実装と評価
- 汎用超並列オペレーティングシステムSSS-CORE : コンパイラによる通信最適化技法
- 汎用超並列分散オペレーティングシステム SSS-CORE : システム概要
- お茶の水5号のハードウェア分散共有メモリ機構
- 一般化されたコンバイニング機構の評価
- 軽いハードウェアによる分散共有メモリ : お茶の水5号の分散共有メモリ機構
- 汎用並列計算機プロトタイプお茶の水5号の予備評価
- 一般化されたコンバイニング機構
- スケーラブル並列計算機プロトタイプ : お茶の水5号
- 汎用並列計算機プロトタイプお茶の水5号の再構成可能高機能結合網
- メモリベース通信ファシリティの評価
- CPSY2000-43 実時間処理RISCコアCasablancaの評価
- アドレス変換ハードウェアで支援されたメモリベース通信の性能評価
- 並列計算機プロトタイプお茶の水5号の性能評価
- 汎用超並列OS SSS-COREにおけるスケジューリング方式(並列処理)
- アドレス変換機能を持つネットワークインターフェイス : メモリベース通信の性能測定
- Memory String Architectureに基づく並列計算機 : お茶の水7号
- 100BaseTXによるメモリベース通信の性能評価
- 資源情報流通サーバSSS-Serverを用いた負荷分散
- 高機能ネットワークを構築するギガビットチャネルの性能評価
- 汎用並列オペレーティングシステムにおける資源保護と仮想化
- 動いているお茶の水1号 : メモリシステムの評価
- 細粒度並列計算機お茶の水1号 : 基本構想
- 汎用超並列OS SSS-COREにおけるスケジューリング方式の評価
- 汎用並列 OS SSS-CORE におけるカーネルスケジューリング方式 : 詳細確率モデルによる性能評価
- 汎用並列OSのための資源情報を利用したスケジューリング方式の検討
- 汎用超並列オペレーティングシステム: SSS-CORE : ワークステーションクラスタにおける実現
- 分散メモリ型並列計算機における共有オブジェクト空間の実現
- 同期ビットを利用する細粒度並列コードの生成
- 汎用超並列オペレーティングシステムと協調動作するギガビットネットワーク
- 汎用超並列オペレーティングシステムSSS-COREのユーザレベル通信同期機構
- 汎用超並列オペレーティングシステムSSS-CORE上の非対称分散共有メモリにおけるコンパイル技法
- 汎用プロセッサのためのベクトルロード支援機構
- 並列OSの性能予測を可能にするシミュレーションモデル
- 汎用並列オペレーティングシステムにおける資源保護と仮想化
- 高機能分散共有メモリの実現に適した高速スヌーププロトコル : 東大プロトコル
- Elastic Memory Consistency Models
- JUMP-1 MBPコアの命令設計
- 汎用超並列オペレーティングシステムカーネルSSS-COREの基本構想
- 拡張されたSnoopy Spin Waitと階層化されたElastic Barrier
- オンチップMIMDプロセッサにおける実行時並列化機構の性能評価
- 共有メモリvs.メッセージパッシング
- FLASHを用いたリアルタイム講演中継システムとその特性