多次元メッシュ/トーラスにおける通信衝突を考慮したタスク配置最適化技術
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,多次元メッシュ/トーラスにおける通信衝突を考慮したタスク配置最 適化技術の提案を行った.このタスク配置最適化では既存技術と異なり,通信 の実行される時間帯から通信衝突の発生を予測し,通信衝突を削減するタスク 配置を探索,出力することができる.この技術を用いることより既存技術に対 してさらに通信性能を向上させることが可能となる.6次元メッシュ/トーラス をネットワークトポロジとする「京」互換機であるFX10に提案手法を適用し, 既存技術であるメッセージサイズとホップ数によるタスク配置最適化技術やネッ トワークの律速点を調べるタスク配置最適化技術との比較を行う性能評価実験 を実施した.この実験において,メッセージサイズとホップ数のみによるタスク配置最 適化技術に対して最大で約43%,律速点を調べるタスク配置最適化技術に対し て最大で約79%の性能向上を示し,提案した技術の有効性を示した.このとき, タスクを配置するノードの形状により通信性能に違いが発生することを示し, その原因を解析した.また,同期を挿入して同時に転送開始する通信の集合を明確化することで,通 信性能が最大で35%向上することを示した.さらに,提案したタスク配置最適 化技術におけるタスク配置求解の実行時間は96ノードで272secとなり,他の技 術に比べても実用に足るということが分かった.
- 2013-09-25
著者
-
南里 豪志
九州大学情報基盤研究開発センター
-
森江 善之
九州大学情報基盤研究開発センター
-
南里 豪志
九州大学情報基盤研究開発センター|独立行政法人科学技術振興機構,CREST
-
森江 善之
九州大学情報基盤研究開発センター|独立行政法人科学技術振興機構,CREST
関連論文
- 並列版PAGMEつきCG法の性能解析(数値計算II)
- OpenMP 入門(4) : マルチコアCPU時代の並列プログラミング
- OpenMP 入門(2) : マルチコアCPU時代の並列プログラミング
- OpenMP 入門(1) : マルチコアCPU時代の並列プログラミング
- Access Gridの構築とGrid上での国際会議
- ハイブリッド並列化したIDR(s)法の計算時間に対するプロセス数とスレッド数の組み合わせ依存性について(並列化と高速化)
- 通信と計算の負荷を考慮した並列疎行列ベクトル積の動的負荷分散技術
- Access Gridの構築とGrid上での国際会議
- 負荷バランスの動的最適化によるMPIブロードキャスト性能改善
- Globus を用いた物質科学シミュレーション向け問題解決環境
- An MPICH-G Network on SuperSINET and its Performance(MPI性能評価)
- 性能モデルによる予測を併用したAlltoallアルゴリズム動的選択技術の評価(性能予測)
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信衝突削減のためのタスク配置最適化の評価(スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 通信タイミングを考慮した衝突削減のためのMPIランク配置最適化技術(並列計算)
- 負荷ばらつきを考慮したMPIブロードキャスト通信の動的最適化に関する研究(HPC-11 : 通信I)
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 通信タイミングを考慮したランク配置最適化技術(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ICCG法のデュアルコアPC上での並列性能評価(HPC-16 : 数値計算)
- MPIによる並列プログラミング入門
- Himeno BMTによるハイパフオーマンスコンピュータの性能評価(HPC-9 : 性能評価)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 基本数値演算 : 内積の評価とその応用
- ヘテロジニアスな並列計算環境を応用した連成・連係計算の提案
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- 連成・連携計算によるデータ量削減の評価
- 分散環境における共有メモリ型SPMDプログラミングモデル : Split-C/PVMの実装
- 異なるスカラアーキテクチャ(x86,SPARC64)の電磁流体コードによる性能評価
- 多次元メッシュ/トーラスにおけるプロセス配置に応じた集団通信アルゴリズム選択技術の提案
- 並列化コンパイラにおけるプロセッサ間非同期通信命令を用いた通信コストの最適化
- 多次元メッシュ/トーラスにおける通信衝突を考慮したタスク配置最適化技術
- 通信ライブラリの自動チューニングを支援するHint APIの提案