SMP-PCクラスタにおけるOpenMP+MPIの性能評価
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 4台のIntel Pentium-II Xeonを搭載したSMP-PCを1ノードとし, 4ノードを100Base-TX EthernetとMyrinetで結合したSMP-PCクラスタCOSMOを用いて, RWCPで開発中のOmni OpenMPコンパイラとMPIを組み合わせたハイブリッドプログラミングについて, 典型的なHPCベンチマークを対象に評価する.また, Pthreadsを用いたマルチスレッドプログラミングとMPIを組み合わせたハイブリッドプログラミングと比較して, プログラミングの容易さと性能の点で検討する.その結果, OpenMPとMPIによるハイブリッド並列プログラムは, PthreadsとMPIによるプログラムとほぼ同様の性能向上が得られることがわかった.
- 一般社団法人情報処理学会の論文
- 2000-03-02
著者
-
朴 泰祐
筑波大学 電子・情報工学系
-
佐藤 三久
新情報処理開発機構
-
板倉 憲一
筑波大学 電子・情報工学系
-
近藤 正章
筑波大学電子・情報工学系:(現)東京大学先端科学技術研究センター
-
板倉 憲一
筑波大学計算物理学研究センター
-
朴 泰祐
筑波大学 計算科学研究センター
-
吉川 茂洋
筑波大学 電子・情報工学系
-
早川 秀利
筑波大学 電子・情報工学系
-
近藤 正章
筑波大学 電子・情報工学系
-
早川 秀利
筑波大学電子・情報工学系:(現)富士ソフトabc株式会社
-
吉川 茂洋
筑波大学システム情報工学研究科:(現)富士通株式会社
-
板倉 憲一
筑波大学 計算物理学研究センター
関連論文
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(計算機システム)
- Heterogeneous Multi-Computer System : 連続体・多粒子系融合型超並列計算機システム
- Cluster-enabled OpenMP : ソフトウェア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- メタレベル機能によるクラスライブラリ最適化手法(並列処理)
- メタレベル機能が支援するハイパフォーマンスオブジェクト指向計算
- メタレベル機能による並列プログラミング
- 2000-HPC-82-14 ソフトウエア分散共有メモリシステムSCASH上のOpenMPコンパイラ
- 超並列計算機CP-PACSにおける分子動力学法シミュレーション
- 超低電力メガスケールシステムのプロトタイプ : MegaProto
- 2000-HPC-81-13 Network Enabled Server System の設計
- グローバルコンピューティングのためのスケジューリングフレームワーク(並列処理)
- グローバルコンピューティングシステムNinfを用いた数値流体解析コンポーネントnetCFD
- Javaによる大域的並列計算環境Ninflet (並列処理)
- グローバルコンピューティングシステムのシミュレーションによる評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- 広域計算システムNinfにおけるユーザ認証
- 複数クライアントによるLAN/WANでのNinfの性能(並列処理)
- Ninfによる広域分散並列計算(並列処理)
- MPC++による様々な並列処理プログラミングスタイルのサポートとその性能
- Ninfによる広域分散並列計算
- ネットワーク数値情報システムNinf : マルチクライアント環境での性能
- 分散メモリ計算機用Ninf APIの実現に向けて
- ネットワーク数値情報ライブラリNinf : システム実装と評価
- Parallel STLによる並列プログラミング
- コア温度情報を用いたOSによる細粒度パワーゲーティング制御方式の設計
- 超並列計算機のための同期処理機構とその評価
- 細粒度パワーゲーティングを制御するOSの資源管理方式
- 細粒度パワーゲーティングを制御するOSの資源管理方式
- ファイアウォールに対応したGlobusによる広域クラスタシステムの構築とその評価
- 2000-HPC-81-12 Firewellに対応したGlobusによる広域クラスタシステムの構築と性能評価
- GlobusにおけるResource Managerの試作 : グローバルコンピューティング環境の構築に向けて
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 細粒度パワーゲーティングを適用した汎用マイクロプロセッサGeyser-1
- 細粒度通信機構を持つ並列計算機EM-Xによる疎行列計算の性能評価
- マイクロプロセッサ内の演算器に対する適応型パワーゲーティング
- マイクロプロセッサ内の演算器に対する適応型パワーゲーティング
- 細粒度通信機構を用いたRadixソートの実行
- 行列演算ベンチマークを用いた並列計算機EM-Xの評価
- OpenMP向けコンパイラ支援ソフトウェアDSMにおける最適化コンパイル手法
- XcalableMPによるNAS Parallel Benchmarks の実装と評価
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- SMPクラスタ向けOpenMPコンパイラ
- SMPクラスタ向けネットワーク・インタフェースAM通信 (並列処理)
- COMPaS : Pentium Proを用いたSMPクラスタとその評価 (並列処理)
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- Ninfによる遠隔計算資源アクセスシステムの構築とグローバルコンピューティングシステムの性能評価
- SMPクラスタ向けネットワーク・インタフェース上AM通信
- SMPクラスタでの共有/分散融合プログラミング
- Knapsack問題における共有メモリ型/分散メモリ型並列計算機の性能比較
- 分散メモリ向け並列言語 XcalableMP におけるユーザ定義データ分散機能の検討
- 超並列ネットワーク MDX用ルータチップの自動設計システム
- MDX-Baseline : 交信局所性とランダム交信能力を共に満足する網
- リストベクトル処理における擬似ベクトルプロセッサPVP-SWの評価
- マルチスレッド処理におけるキャッシュ構成方式の検討
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- 組込み機器向け on-chip/off-chip コア間通信機構の実装と評価
- 組込み機器向け on-chip/off-chip コア間通信機構
- 並列非圧縮性流体解析プログラムのオブジェクト指向言語による実装と評価
- C++テンプレート・ライブラリを用いた行列解法の並列化
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- SMP-PCクラスタにおけるOpenMP+MPIの性能評価
- 共有メモリPCクラスタにおけるハイブリッド並列プログラムの性能評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- 並列システム性能の視覚的解析とその評価
- SMPクラスタにおけるコレスキー分解の並列化
- SMPクラスタ上でのリモートメモリ転送を用いた通信と計算のオーバーラップによる性能改善
- SMPクラスタCOMPaSの性能評価
- 2000-HPC-82-13 OpenMP並列プログラムのデータフロー解析手法
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- F01-(4) RWCP における計算機クラスタ技術
- グローバルコンピュ-ティングへの期待
- 並列処理に「難しい」並行処理は必要か
- 特集「並列処理」の編集にあたって
- ハイパフォーマンスアプリケーションにおけるC++ STLを用いたプログラミング
- 細粒度並列アーキテクチャ用SISALコンパイラにおける並列粒度調整方式(並列処理)
- 並列粒度調整機能を組み込んだSISALコンパイラの設計と実装
- スライドウインドウを用いた擬似ベクトル処理
- 光インタコネクションネットワークを用いたコンピューテングクラスタの構想
- Omni OpenMPコンパイラの性能評価
- OpenMP向けコンパイラ支援ソフトウェアDSM
- OpenMP向けコンパイラ支援ソフトウェアDSMの性能評価
- Cenju-4の分散共有メモリ機構を用いたOmni OpenMPコンパイラ
- Omni OpenMPコンパイラの性能評価
- Omni OpenMPコンパイラの性能評価
- OpenMPコンパイラの試作と評価
- Windows NTクラスタ上でのMyrinetによる通信の実現
- C++テンプレートを使ったデータ並列ライブラリの効率化手法
- ハイパフォーマンスコンピューティングに適したメモリアーキテクチャの予備評価
- コモディティネットワークに基づく並列入出力システム
- 大規模データ並列プログラムの性能予測手法とNPB 2.3の性能評価 (並列処理)
- 高精度大規模並列プログラムシミュレーション環境によるNPBの挙動解析
- インスツルメンテーションに基づく性能評価環境の高精度化
- テンプレート・クロージャによる並列アレイ・ライブラリ
- Collective通信を用いたデータ並列プログラムの性能予測
- 並列アルゴリズムにおけるCollective通信の性能比較