Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
スポンサーリンク
概要
- 論文の詳細を見る
Omni/SCASHは,ソフトウエア分散共有メモリシステムSCASHを用いたクラスタ向けのOpenMP処理系である.本稿では,PCクラズタで多く用いられているEthernetで接続したPCクラスタ上でOmni/SCASHの性能評価を行った.基本性能を測定した結果,ページ転送,バリア同期などのコストがMyrinetに比べて,約10倍の差があることが分かった.このため,通信の少ないNPB EPでに良好なスケーラビリティが得られたが,演算に比べて通信の多いlaplaceやNPB BTでは,Myrinetに比べて,低い性能となった.また,SCASHを直接用いて書いたプログラムに比べて,Omni/SCASHでは,データの配置がページ境界に配置されていないことがあり,false-sharingするなど,改善の余地があることが分かった.
- 社団法人情報処理学会の論文
- 2002-08-21
著者
-
石川 裕
東京大学大学院情報工学系研究科
-
朴 泰祐
筑波大学電子・情報工学系
-
佐藤 三久
筑波大学電子・情報工学系
-
高橋 大介
筑波大学電子・情報工学系
-
原田 浩
筑波大学電子・情報工学系計算物理学計算センター
-
原田 浩
ヒユーレットパッカードジャパン
-
小島 好紀
筑波大学大学院理工学研究科
-
原田 浩
株式会社コンパックコンピュータ
-
高橋 大介
筑波大学計算科学研究センター
-
小島 好紀
筑波大学大学院システム情報工学研究科
関連論文
- 分散ページングによる大規模仮想メモリ空間(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- HMCS-G : グリッド環境における計算宇宙物理のためのハイブリッド計算システム(グリッド応用)
- Heterogeneous Multi-Computer Systemにおける重力効果を含む宇宙輻射流体計算
- ファイルサーバー独立な並列ファイルキャッシュ機構(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ソフトウェアによる精密ペーシング方式を用いたTCP通信性能の改善((フォトニック)IPネットワーク技術, (光)ノード技術, WDM技術, 一般)
- Gigabit Ethernet NIC の性能評価
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- NUMA並列型クラスタ上での効率的なスケジューリング(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- マルチコアクラスタ向け並列ファイルシステムアーキテクチャ(HPC-13:ファイルシステム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Etheretによるクラスタ上での分散共有メモリOpenMP Omni/SCASHの性能評価
- 6.SCore型クラスタ
- 超並列計算機CP-PACSにおけるPVMの実装
- CP-PACSパイロットモデルにおけるLINPACKベンチマークの高速化
- CP-PACSパイロットモデルにおけるNAS並列ベンチマークの評価
- 超並列計算機CP-PACSにおけるNAS-PBの仮想評価
- マルチコアSHにおける複数カーネル実行機構の設計と実装(OS-2:カーネルとネットワーク,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 超並列計算機用多段結合網における転送性能の解析 (並列処理)
- ハイパクロスバ・ネットワークにおける転送性能向上のための手法とその評価
- ハイパクロスバ・ネットワークのスループットの理論的解析
- ハイパクロスバ網における適応ルーチングの導入とその評価
- ハイパクロスバ・ネットワークの転送性能の解析
- ハイパクロスバ・ネットワークにおけるバッファの利用法と転送性能について
- ハイパクロスバ・ネットワークにおけるバーチャル・カット・スルーの性能評価
- 超低電力メガスケールシステムのプロトタイプ : MegaProto(高性能システム)
- GridMPI^ Version 1.0の概要(HPC-10: 通信ライブラリ)
- RHiNETの高速通信ライブラリPMv2による評価
- RHiNETの高速通信ライブラリPMv2による評価
- 並列アプリケーション実行におけるTCP/IP通信挙動の解析 (インターネットコンファレンス2003論文集)
- グリッド上のコレクティブ通信アルゴリズム
- ストリーミング配信に対するソフトウェアペーシング方式の効果(有線/無線シームレスネットワーク,ネットワーク制御,無線通信一般)
- ギャップパケットを用いたソフトウェアによる精密ペーシング方式(ネットワーク)
- MPIライブラリと協調するTCP通信の実現(ネットワーク)
- IBM pSeriesにおけるGridMPIの実装と性能評価(通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- IBM pSeries における GridMPI の実装と性能評価
- GridMPIのためのTCP/IP輻輳制御実装方式の検討(OS-3:ネットワーク)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 高い移植性を持つ最悪実行時間解析手法
- テラスケールコンピューティングのための遠隔スワップシステムTeramem
- 並列プログラム自動最適化ツールTEA Expertの実並列計算機における評価
- 周期タスクを対象とした最悪割り込み遅延予測(オペレーティングシステム・システムソフトウェア)
- 移植性の高い実行時間予測手法の設計と実装(ARC-7:性能予測,2006年並列/分散/強調処理に関する『高知』サマー・ワークショップ(SWoPP 高知2006))
- 実行時間予測ツールの設計と実装(ARC-5: 性能予測, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- GridMPI^の性能評価(HPC-6 : 通信ライブラリ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 超並列相互結合網におけるバッファ制御方式の改良
- 柔軟な負荷分散を可能にする分散型シングルIPクラスタ(OS-1 : 実行基盤)
- プライベートアドレスを有するクラスタ群のための高性能MPI通信リレー機構
- 移植性の高い最悪実行時間予測ツールRETASの設計と実装
- 移植性の高い最悪実行時間予測ツールRETASの設計と実装
- ヒューマノイド・ロボットのための実時間分散情報処理(実時間処理,組込システム及び一般)
- ヒューマノイド・ロボットのための実時間分散情報処理(実時間処理,組込システム及び一般)
- メモリバスアクセス率に基づくSMP-PCクラスタの性能評価
- 分散ページングによる大規模仮想メモリ空間(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- SCoreクラスタ計算環境
- VHDLによるハイパクロスバ網用ルータ・チップの設計
- SMP環境におけるLinuxスケジューラの評価
- SMP環境におけるLinuxスケジューラの評価
- プロセッサの消費電力測定と低消費電力プロセッサによるクラスタの検討(省電力)
- 低消費電力プロセッサによるクラスタの検討(ARC-6:低消費電力化)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 複数カーネル実行機構を利用したアプリケーション実行環境の設計と実装
- 複数カーネル実行機構を利用したアプリケーション実行環境の設計と実装
- MPI通信モデルに適した非同期通信機構の設計と実装(クラスタソフトウェア)
- MP1通信モデルに適した通信APIの設計と実装(HPC-7 : 通信ライブラリ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- GridMPI-通信遅延を考慮したMPI通信ライブラリの設計(HPC-7 : 通信ライブラリ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- WAN上の複数クラスタによる単一MPIアプリケーションの性能評価
- 移植性の高い最悪実行時間予測ツールRETASの設計と実装
- 移植性の高い最悪実行時間予測ツールRETASの設計と実装
- RHiNETによる共有メモリプログラミングのサポート
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- 分散並列モンテカルロ木探索フレームワークの提案
- 超並列オブジェクトベース言語OCoreの並列計算機上での実装
- NUMA並列型クラスタ上での効率的なスケジューリング(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- P-BusにおけるOSカーネル間通信機構の設計と実装(OS-2:カーネルとネットワーク,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- カーネル機能拡張のための抽象化レイヤP-Busの実装(セッション2:システム構成法)
- PBus : 柔軟なカーネル機能拡張のためのインタフェース(OS-3 : OS実装)
- 大規模メモリ空間の利用を支援する遠隔スワップメモリシステム(HPC-7 : データ管理)
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- PC間ネットワークによる共有アドレス空間を持つ並列処理システム
- マルチコア向け複数カーネル実行機構におけるデバイス共有
- マルチコア向け複数カーネル実行機構におけるデバイス共有
- ファイルサーバー独立な並列ファイルキャッシュ機構(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 光インタコネクションネットワークを用いたコンピューテングクラスタの構想
- Windows NTクラスタ上でのMyrinetによる通信の実現
- C++テンプレートを使ったデータ並列ライブラリの効率化手法
- 分散環境におけるシームレス並列コンピューティングシステムの構想
- OS開発のためのメニーコアハードウェアシミュレータの設計と実装
- 耐故障分散ロック機構の設計と検証
- 広域分散環境を提供するHPCIネットワーク・認証・ユーザ管理支援基盤の設計
- 広域分散環境を提供するHPCI先端ソフトウェア運用基盤の設計
- 広域分散環境を提供するHPCIシステムソフトウェア基盤の設計概要と共有ストレージ構築
- ハイバネート中の仮想マシンに対する透過的アクセス機構
- メニーコア環境におけるキャッシュアウェア・オペレーティングシステムに向けて
- メニーコア環境におけるキャッシュアウェア・オペレーティングシステムに向けて
- ItaniumプロセッサによるSCoreクラスタ構築に関する検討(高性能計算及び一般)
- リアルタイムLinuxのための軽量割込み処理
- RWCPにおけるクラスタ開発記(計算機クラスタ)
- SCoreの紹介とインスト一ルの基礎知識
- HPCIのためのネットワーク・認証基盤(ネットワーク研究開発テストベッド運用・利用,一般)
- 高性能分散計算環境のための認証基盤の設計
- パーシャルメッセージロギングを改善する耐故障性実現フレームワーク
- パーシャルメッセージロギングを改善する耐故障性実現フレームワーク