OpenMP向けコンパイラ支援ソフトウェアDSMにおける最適化コンパイル手法
スポンサーリンク
概要
- 論文の詳細を見る
本稿は, コンパイラ支援ソフトウェア分散共有メモリシステムOmni/CSDSMにおける最適化コンパイル手法を示す.Omni/CSDSMは, OpenMP APIを用いて記述した共有メモリ並列プログラムをSMPクラスタ上で透過的に実行することができる.コンパイル時に並列性を考慮しながらプログラム全体にわたる解析を行い, 共有データの一貫性制御を効率良く行うための最適化を行うことを特徴とする.本稿では新たな最適化手法として, (1)ネストレベルに応じた手続きクローニング, (2)非共有データの検出, (3)一貫性制御プロトコルの最適化, (4)アラインメントの最適化, を提案する.さらに, Omni/CSDSMの最適化に必要なデータフロー解析手法と, その際に用いるプログラムの中間表現を示す.本システムを, Pentium II XeonプロセッサとMyrinetネットワークを用いたSMPクラスタ上で実装し, 特徴の異なる4本のOpenMP Cプログラムを用いて最適化の効果を評価した.その結果, 最大限最適化を行った場合に, 8ノード × 4スレッド(32プロセッサ)で逐次実行時の7.9倍から30.0倍の性能が得られた.
- 一般社団法人情報処理学会の論文
- 2001-11-15
著者
関連論文
- Cluster-enabled OpenMP : ソフトウェア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- メタレベル機能によるクラスライブラリ最適化手法(並列処理)
- メタレベル機能が支援するハイパフォーマンスオブジェクト指向計算
- メタレベル機能による並列プログラミング
- 2000-HPC-82-14 ソフトウエア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- 2000-HPC-81-13 Network Enabled Server System の設計
- グローバルコンピューティングのためのスケジューリングフレームワーク(並列処理)
- グローバルコンピューティングシステムNinfを用いた数値流体解析コンポーネントnetCFD
- Javaによる大域的並列計算環境Ninflet (並列処理)
- グローバルコンピューティングシステムのシミュレーションによる評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- 広域計算システムNinfにおけるユーザ認証
- 複数クライアントによるLAN/WANでのNinfの性能(並列処理)
- Ninfによる広域分散並列計算(並列処理)
- MPC++による様々な並列処理プログラミングスタイルのサポートとその性能
- Ninfによる広域分散並列計算
- ネットワーク数値情報システムNinf : マルチクライアント環境での性能
- 分散メモリ計算機用Ninf APIの実現に向けて
- ネットワーク数値情報ライブラリNinf : システム実装と評価
- Parallel STLによる並列プログラミング
- 超並列計算機のための同期処理機構とその評価
- ファイアウォールに対応したGlobusによる広域クラスタシステムの構築とその評価
- 2000-HPC-81-12 Firewellに対応したGlobusによる広域クラスタシステムの構築と性能評価
- GlobusにおけるResource Managerの試作 : グローバルコンピューティング環境の構築に向けて
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 細粒度通信機構を持つ並列計算機EM-Xによる疎行列計算の性能評価
- 細粒度通信機構を用いたRadixソートの実行
- 行列演算ベンチマークを用いた並列計算機EM-Xの評価
- OpenMP向けコンパイラ支援ソフトウェアDSMにおける最適化コンパイル手法
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- SMPクラスタ向けOpenMPコンパイラ
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- 並列非圧縮性流体解析プログラムのオブジェクト指向言語による実装と評価
- C++テンプレート・ライブラリを用いた行列解法の並列化
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- SMPクラスタにおけるコレスキー分解の並列化
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- SMPクラスタCOMPaSの性能評価
- 2000-HPC-82-13 OpenMP並列プログラムのデータフロー解析手法
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- F01-(4) RWCP における計算機クラスタ技術
- グローバルコンピュ-ティングへの期待
- 並列処理に「難しい」並行処理は必要か
- 特集「並列処理」の編集にあたって
- ハイパフォーマンスアプリケーションにおけるC++ STLを用いたプログラミング
- 細粒度並列アーキテクチャ用SISALコンパイラにおける並列粒度調整方式(並列処理)
- 並列粒度調整機能を組み込んだSISALコンパイラの設計と実装
- 光インタコネクションネットワークを用いたコンピューテングクラスタの構想
- Omni OpenMPコンパイラの性能評価
- OpenMP向けコンパイラ支援ソフトウェアDSM
- OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価
- Cenju-4の分散共有メモリ機構を用いたOmni OpenMPコンパイラ
- Omni OpenMPコンパイラの性能評価
- Omni OpenMPコンパイラの性能評価
- OpenMPコンパイラの試作と評価
- 手続き間並列化コンパイラWPPの試作 : 定数伝播とクローニングの評価
- 手続き間並列化コンパイラWPPの試作 : 現状と今後の課題
- Windows NTクラスタ上でのMyrinetによる通信の実現
- C++テンプレートを使ったデータ並列ライブラリの効率化手法
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- テンプレート・クロージャによる並列アレイ・ライブラリ
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較