非対称分散共有メモリ上における最適化コンパイル技法の評価
スポンサーリンク
概要
- 論文の詳細を見る
我々は保護された高速なユーザー通信/ユーザー同期を実現する"非対称分散共有メモリ: ADSM"を提案してきた。ADSMは読み出しと書き込みの実現モデルが別々で、読み出しは通常の仮想共有メモリ方式と同様であるが、書き込みに関してはコンシステンシ維持コードが埋め込まれる。書き込みの自由度が高いから、様々な最適化が可能になる。我々はコンシステンシ維持コードの数を静的/動的に削減することで、書き込みのオーバーヘッドを削減する最適化手法を提案する。汎用並列オペレーティングシステムSSS-COREとAP1000+上に作成したコンパイラ並びにランタイムシステムにおいてSPLASH-2の LU-Contigを使って評価を行なった。実行時間は静的な最適化により80%向上し、更に動的な最適化を行なうことで30%向上した。
- 1997-10-28
著者
-
丹羽 純平
東京大学大学院情報理工学系研究科コンピュータ科学専攻
-
稲垣 達氏
東京大学大学院理学系研究科情報科学専攻:(現)日本アイ・ビー・エム株式会社東京基礎研究所
-
松本 尚
東京大学大学院情報理工学系研究科:科学技術振興事業団さきがけ研究21「情報と知」領域
-
平木 敬
東京大学大学院情報理工学研究科
-
稲垣 達氏
東京大学大学院理学系研究科情報科学専攻
関連論文
- CellおよびGPGPUの性能比較評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ハードウェア・エンジンを用いた10GbE上のTCP通信解析(HPC-17 : 高性能通信)
- 難読化コンパイラのユーザによる保護強度調整機構(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ソフトウェアDSMにおいてfetch-on-writeによる通信トラフィックを削減する手法
- 細粒度パケット間隔制御の実装と評価(OS-4: 通信システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- インテリジェントNICを用いた高帯域ネットワーク向けTCP通信方式(OS-3:ネットワーク)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 動的逆アセンブル手法の高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 高信頼性マルチホーミング通信方式(ネットワーク,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- プログラム実行時のキャッシュ連想度の需要予測方式(ARC-1:アーキテクチャ1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 5-2-1 東京大学「情報科学技術戦略コア」(5-2 情報・電気・電子分野の21世紀COE,3プロジェクトの拠点リーダーより)(5.大学での研究プロジェクト : 21世紀COEプログラム)(グローバル化時代の教育と研究)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境)
- 高速HW-SW協調検証モデル向けCtoHDL変換コンパイラ(プロセッサ向け最適化と開発環境,FPGA応用及び一般)
- 簡潔データ構造による全文検索のハードウェアを用いた高速化(ハードウェアアクセラレーション,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 分散共有メモリアクセスの優先度制御(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- トランザクショナルメモリのための性能評価手法(ARC-9:並列処理2,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 実行時の分岐のふるまいに基づくスレッド間データ依存関係予測(ARC-12 : 投機実行,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- スラック予測を用いるメモリ制御アーキテクチャ(ARC-10 : アーキテクチャIII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- TLBを用いるキャッシュ利用状況推定の高精度化(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- ゲートウェイによる並列TCPのウィンドウサイズ平均化(HPC-15 : ネットワーク)
- 2000-ARC-139-14 NICを活用したネットワークRAID方式の提案
- CPSY2000-42 高性能組み込み用プロセッサアーキテクチャの検討
- 中粒度メモリベース通信を支援するMemory-Based Processor II
- 実行時再構成方式におけるバイナリトランスレーション支援
- 量子和回路の効率化とシミュレーションによるデコヒーレンス耐性の解析
- 因数分解量子アルゴリズムの全量子シミュレーション
- 並列量子計算シミュレータについて
- 閾値関数のBDDの並列実装
- 分散共有メモリ型超並列計算機JUMP-1におけるスケーラブルI/Oサブシステムの構成
- CPSY2000-51 ソフトウェア高レベルデータ値予測方式の予備評価
- 汎用細粒度並列計算機:お茶の水1号 : 構成と性能評価
- ソフトウェアDSM機構を支援する最適化コンパイラ
- 2000-OS-85-5 汎用クラスタ上の資源情報を用いたHTTPサーバにおける負荷分散性能の評価
- 2000-ARC-139-2 ハードウェア分散共有メモリにおけるスケーラブルなディレクトリ方式の定量的評価
- Casablanca:実時間処理RISCコアの設計と実装
- コンパイラが支援するソフトウェアDSM機構 : ADSMとUDSMの性能評価
- ソフトウェアシミュレータ上でのSPLASH-2ベンチマークの挙動に関する研究
- メモリべース通信を用いた高速MPIの実装と評価 (並列処理)
- 軽いハードウェアによる分散共有メモリ機構 (並列処理)
- リアルタイムラウンドロビン
- 分散共有メモリに基づく計算機クラスタ(計算機クラスタ)
- 汎用スケーラブルOS SSS-COREのカーネル構成について
- 並列アプリケーションによるMPI/MBCFの評価
- ループ並列投機実行のJava仮想マシンの適用
- 非対称分散共有メモリ上における最適化コンパイル技法の評価(並列処理)
- 非対称分散共有メモリ上における最適化コンパイル技法の評価
- 低コストハードウェア分散共有メモリ
- 非対称分散共有メモリ上におけるコンパイル技法
- 動的に生成されたオブジェクトを扱うループの並列化手法
- エラスティックメモリコンシステンシモデルのシミュレーション評価
- 実行時再構成方式テストベットOcha-Proの性能評価
- オンチップハードウエアによるループ並列化機構
- On Chip MIMDにおける大規模投機実行機構
- バイナリコンパチビリティを保ちながらloopを投機実行するアーキテクチャ
- Loopを並列実行するアーキテクチャ
- 汎用超並列オペレーティングシステムSSS-CORE : 高速MPIの実装と評価
- 汎用超並列オペレーティングシステムSSS-CORE : コンパイラによる通信最適化技法
- 汎用超並列分散オペレーティングシステム SSS-CORE : システム概要
- お茶の水5号のハードウェア分散共有メモリ機構
- 一般化されたコンバイニング機構の評価
- 軽いハードウェアによる分散共有メモリ : お茶の水5号の分散共有メモリ機構
- 汎用並列計算機プロトタイプお茶の水5号の予備評価
- 一般化されたコンバイニング機構
- スケーラブル並列計算機プロトタイプ : お茶の水5号
- 汎用並列計算機プロトタイプお茶の水5号の再構成可能高機能結合網
- メモリベース通信ファシリティの評価
- CPSY2000-43 実時間処理RISCコアCasablancaの評価
- アドレス変換ハードウェアで支援されたメモリベース通信の性能評価
- 並列計算機プロトタイプお茶の水5号の性能評価
- 汎用超並列OS SSS-COREにおけるスケジューリング方式(並列処理)
- アドレス変換機能を持つネットワークインターフェイス : メモリベース通信の性能測定
- Memory String Architectureに基づく並列計算機 : お茶の水7号
- 100BaseTXによるメモリベース通信の性能評価
- 資源情報流通サーバSSS-Serverを用いた負荷分散
- 高機能ネットワークを構築するギガビットチャネルの性能評価
- 汎用並列オペレーティングシステムにおける資源保護と仮想化
- 動いているお茶の水1号 : メモリシステムの評価
- 細粒度並列計算機お茶の水1号 : 基本構想
- 汎用超並列OS SSS-COREにおけるスケジューリング方式の評価
- 汎用並列 OS SSS-CORE におけるカーネルスケジューリング方式 : 詳細確率モデルによる性能評価
- 汎用並列OSのための資源情報を利用したスケジューリング方式の検討
- 汎用超並列オペレーティングシステム: SSS-CORE : ワークステーションクラスタにおける実現
- 分散メモリ型並列計算機における共有オブジェクト空間の実現
- 同期ビットを利用する細粒度並列コードの生成
- 動いているお茶の水1号 : 同期ビットを使用したコンパイル技法
- システムの階層的並列性を統一的に扱う最適化コンパイラ
- 細粒度並列計算機お茶の水1号 : 最適化コンパイラ
- 細粒度並列計算機用最適化コンパイラ : OP.1
- 汎用超並列オペレーティングシステムと協調動作するギガビットネットワーク
- 汎用超並列オペレーティングシステムSSS-COREのユーザレベル通信同期機構
- 汎用超並列オペレーティングシステムSSS-CORE上の非対称分散共有メモリにおけるコンパイル技法
- 汎用プロセッサのためのベクトルロード支援機構
- 並列OSの性能予測を可能にするシミュレーションモデル
- 汎用並列オペレーティングシステムにおける資源保護と仮想化
- 高機能分散共有メモリの実現に適した高速スヌーププロトコル : 東大プロトコル
- Elastic Memory Consistency Models
- JUMP-1 MBPコアの命令設計
- 汎用超並列オペレーティングシステムカーネルSSS-COREの基本構想
- 拡張されたSnoopy Spin Waitと階層化されたElastic Barrier
- オンチップMIMDプロセッサにおける実行時並列化機構の性能評価
- 共有メモリvs.メッセージパッシング