メニーコアプロセッサ・クラスタにおける並列プログラミング言語XcalableMPのベンチマークプログラム性能評価
スポンサーリンク
概要
- 論文の詳細を見る
メニーコアプロセッサのインテル Xeon Phi コプロセッサを搭載した Xeon サーバ・クラスタ上で、並列プログラミング言語 XcalableMP のベンチマークプログラムを実行し、その性能評価を行った。ベンチマークとしては HIMENO ベンチの L サイズを用い、Phi コプロセッサ単体での性能を測定した。さらに XL サイズを用いて 16 ノードの Xeon サーバ上に各 1 枚実装された 16 枚の Phi コプロセッサのクラスタで測定を行った。この結果、XcalableMP のベンチマークでは、単体、クラスタの両者で MPI 版と同等の性能が得られることが確認できた。さらに、XcalableMP のプログラムに OpenMP を適用したハイブリッドにより、16 計算ノード 2048 スレッドまでの性能向上することを確認できた。
- 2013-02-14
著者
関連論文
- 高性能計算のための低電力・高密度クラスタMegaProto(HPCハードウェア)
- PCクラスタにおけるDVS制御による電力性能の最適化(ARC-3: 低電力アーキテクチャ1, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- GlobusによるGrid RPCシステムの実装と評価
- PACS-CSにおける隣接通信性能の高速化(HPC-13 : 通信II)
- PACS-CSのための高性能通信ライブラリインターフェイスの設計(HPC-12 : 大規模運用システム(2))
- 演算加速機構を持つオンチップメモリプロセッサの検討と電力性能評価
- 科学技術計算用超並列クラスタPACS-CSの実装と基本性能評価(HPC-12 : 大規模運用システム(2))
- 片方向通信の実装方式の違いによる比較
- グローバルコンピューティング(8)グローバルコンピューティングへの期待
- 複数Gigabit Ethernetを用いたPACS-CSのための高性能通信機構の設計と評価(ネットワーク)
- PACS-CSのためのEthernetを用いた高性能通信機構の設計(HPC-8: 高性能クラスタ)
- COTSサーバ用標準インターコネクトの高速化技術 : ノード間通信をサポートするHWおよびSW技術の紹介
- COTSサーバ用標準インターコネクトの高速化技術 : ノード間通信をサポートするHWおよびSW技術の紹介(通信プロトコルとインターフェース及びアクセラレータ,SANを用いた高性能コンピュータシステム,及び一般)
- 高性能計算のための低電力・高密度クラスタMegaProto(クラスタと通信, 分散処理, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- OmniRPC : グリッド環境での並列プログラミングのためのGrid RPCシステム(グリッド基盤ソフト)
- R. Cytron and J. Ferrante and B. K. Rosen and M. N. Wegman and F. K. Zadeck, 『Efficiently Computing Static Single Assignment Form and the Control Dependence Graph』, ACM Trans. on Programming Languages and Systems, Vol.13, No.4, pp.451-490, Oct. 1991(20世紀の
- メニーコアプロセッサ・クラスタにおける並列プログラミング言語XcalableMPのベンチマークプログラム性能評価