InfiniBand Atomic Operationの性能評価
スポンサーリンク
概要
- 論文の詳細を見る
Exa FLOPS 級スーパーコンピュータの実現には低レイテンシ・省メモリを兼ね備える通信プロトコルの開発が不可欠である.我々は本課題の解決手段の一つとして Atomic 通信を用いる通信資源の動的管理手法を検討している.本報告書は,通信手順の最適化や性能予測等に役立てるための基礎データの取得を目的に,InfiniBand の Atomic 通信を中心とした性能評価結果を報告する.メモリの不可分性を保つために自ノードメモリに対しても必要に応じて HCA を経由した Atomic Operation が必要であるが,この場合,自ノードのメモリアクセスにおいもてもノード間と同程度の性能しか望めないことが分かった.一方,外乱通信による性能劣化はメモリ書き換えを伴う RDMA Write, Atomic 通信を同時に行うことによって大きくなることが分かった.
- 2012-03-19
著者
-
尾上 勇介
九州大学大学院システム情報科学府
-
安島 雄一郎
富士通株式会社
-
秋元 秀行
富士通株式会社ヘッド先行開発部
-
岡本 高幸
筑波大学大学院システム情報工学研究科
-
尾上 勇介
九州大学大学院システム情報科学府情報学専攻
-
住元 真司
富士通株式会社
-
三浦 健一
富士通株式会社次世代テクニカルコンピューティング開発本部|独立行政法人科学技術振興機構戦略的創造研究推進事業
-
岡本 高幸
富士通株式会社|独立行政法人科学技術振興機構,CREST
-
安島 雄一郎
富士通株式会社次世代テクニカルコンピューティング開発本部|独立行政法人科学技術振興機構戦略的創造研究推進事業
-
住元 真司
富士通株式会社次世代テクニカルコンピューティング開発本部|独立行政法人科学技術振興機構戦略的創造研究推進事業
-
秋元 秀行
富士通株式会社次世代テクニカルコンピューティング開発本部|独立行政法人科学技術振興機構戦略的創造研究推進事業
-
三浦 健一
富士通株式会社次世代テクニカルコンピューティング開発本部|(独)科学技術振興機構戦略的創造研究推進機能
-
三浦 健一
富士通株式会社
関連論文
- BiCGStab(s,L)法の収束安定性の向上
- ISOR(s) 法前処理を用いたリスタート付きGCR(m) 法の収束性
- 10GbEインターコネクトを使用したブレードサーバ(XION)の試作(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 二次元電磁多重散乱の境界要素解析におけるIDR(s)法の適用(電磁界理論)
- 多物体電磁波散乱問題の境界要素解析における改良型IDR(s)法の性能評価(数値計算I)
- C-1-13 電磁波散乱問題の境界要素解析におけるIDR(s)法の適用(C-1.電磁界理論,一般セッション)
- SPT垂直ライトヘッドにおける反強磁性結合多層膜の膜構成最適化検討(磁気記録)
- IDR(s)法系統の反復法に適用可能な計算量削減の工夫(行列・固有値問題の解法とその応用,平成21年研究部会連合発表会)
- ユーザ透過に利用可能な耐故障・高性能マルチリンクEthernet結合システム(クラスタと省電力技術)
- IDR定理に基づく新しい反復法群の概観と性能評価(数値計算I)
- IDR定理に基づくIDR(s)反復解法族の電磁界問題への適用と評価
- IDR-AGS法の収束性と有効性の評価(数値計算I)
- マルチパスネットワークを持つPCクラスタにおける動的経路制御システム(クラスタシステム)
- ディペンダブルな組込みシステムに適した省電力高性能通信機構(通信とグリッドII)
- tagged-VLANを用いたPCクラスタ向けマルチパスネットワークにおける動的ルーティング(HPC-13 : 通信II)
- EthernetマルチリンクによるPCクラスタ向け高バンド幅・耐故障ネットワークRI2N/UDP(ネットワーク)
- tagged-VLANとマルチリンクに基づくPCクラスタ向け高性能・耐故障ネットワークの実装と評価(Session 3:Cluster/Grid)
- VFREC-Net : ドライバ制御によるtagged-VLANを用いたPCクラスタ向けマルチパスネットワーク(ネットワーク)
- UDPによるファイアウォール越えを用いたP2Pオーバーレイネットワーク(HPC-7 : 分散環境(1))
- EthernetマルチリンクによるPCクラスタ向け耐故障ネットワークRI2N/UDP(ネットワーク,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- EthernetマルチリンクによるPCクラスタ向け耐故障ネットワークRI2N/UDP(ネットワーク, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- tagged-VLANに基づくPCクラスタ向け高バンド幅ツリーネットワークの開発(HPCシステム)
- 有限境界要素法の解析に適したIDR(s)法の並列収束性評価
- 有限境界要素法併用法の解析に向いたIDR(s)法の収束性評価(HPC-5:数値計算I,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- IDR(s)法の収束性評価と比較
- ハイブリッド並列化したIDR(s)法の計算時間に対するプロセス数とスレッド数の組み合わせ依存性について(並列化と高速化)
- 行列のブロック・サイクリック分割に基づくIDR(s)法の並列性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- NICメモリを用いたZero Copy Socket方式の実装評価(インタコネクト, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- NICメモリを用いたZero Copy Socket方式の提案(インタコネクト, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- IDR定理をベースにした定常反復法の性能評価 (数値解析と数値計算アルゴリズムの最近の展開--RIMS研究集会報告集)
- IDR定理をベースにした定常反復法の性能評価 (数値解析と数値計算アルゴリズムの最近の展開)
- A^Tのべき乗を用いた初期シャドウ残差によるBiCG,CGS法の収束性の向上
- IDR(s)-SOR法の提案
- Element-by-Element方式有限要素解析における線形方程式解法の高速化
- Mesh・Torusネットワーク上での最適全対全通信アルゴリズムの評価
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- IDR(s)-SOR法の提案
- 積型反復法の前処理の適切な選択について(HPC-5:数値計算I,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- BiCG法による助走区間つき積型反復法の収束性評価(HPC-5:数値計算I,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- ブロック交換による非零要素均等分配法
- BiCR法の残差をもとに構築したBiCRSafe法の収束性について(数値計算)
- 行列のブロック・サイクリック分割に基づくIDR(s)法の並列性能評価(性能評価,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- BiCR法の残差ベクトルをベースにしたModified S(Stabilized) CRS法の提案(行列・固有値問題の解法とその応用,平成19年研究部会連合発表会)
- BiCR法の残差を礎に構築した BiCRSafe 法の収束性評価
- BiCR法の残差をベースにしたBiCRSafe 法の収束性評価(HPC-2 : 数値解析I)
- BiCR法の残差をベースにした前処理つきMSCRS法
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- NSIM : 将来の大規模相互結合網を対象とした通信シミュレータの開発
- 2次元Meshネットワーク・Torusネットワーク上での最適全対全通信アルゴリズム
- ユーザ透過に利用可能な高性能・耐故障マルチリンクEthernet結合システム
- サーバ用CPUのハードウェア資源削減に基づくチップマルチプロセッサの設計(アーキテクチャ一般及びチップマルチプロセッサ)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
- サーバ用CPUのハードウェア資源削減に基づくチップマルチプロセッサの設計
- Spin-valve GMR ヘッドのマグノイズ解析
- SPT垂直ライトヘッドにおける反強磁性結合多層膜の膜構成最適化検討
- 有限要素法によるマイクロ磁化解析シミュレータの開発
- 反強磁性結合多層膜 単磁極垂直ライトヘッドの膜厚最適化検討
- Eisenstat 版前処理の実装とその改良 (科学技術計算アルゴリズムの数理的基盤と展開)
- Multi-Restarts型Look-Back GMRES(k)法の提案
- MPI_Allreduceの「京」上での実装と評価
- MPI_Allreduceの「京」上での実装と評価
- Multi-Restarts型Look-Back GMRES(k)法の提案
- MPI_Allreduceの「京」上での実装と評価
- MPI_Allreduceの「京」上での実装と評価
- 816 BiCG法,CGS法の収束性の初期シャドウ残差依存性について(OS24.一般セッション(4) 電磁場/連立一次方程式の解法,オーガナイズドセッション)
- 815 GPBiCG-AR2法の収束性評価(OS24.一般セッション(4) 電磁場/連立一次方程式の解法,オーガナイズドセッション)
- 片側通信による,グローバルデータ構造の効率的な操作方法の検討
- InfiniBand Atomic Operationの性能評価
- エクサスケールコンピューティングに向けた省メモリ通信ライブラリの検討
- 8万ノードを接続する京速コンピュータ「京」のTofuインターコネクト(ネットワーク環境でのディペンダビリティ,及び一般)
- スーパーコンピュータ「京」の高性能・高信頼ファイルシステム (特集 スーパーコンピュータ「京」)
- スーパーコンピュータ「京」のMPIと低レベル通信 (特集 スーパーコンピュータ「京」)
- ハードウェア : ラック,冷却,プロセッサ,インターコネクト (特集 スーパーコンピュータ「京(けい)」)
- MPI_Allreduceの「京」上での実装と評価
- FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
- FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
- 非同期グローバルヒープの提案と初期検討
- DMATP-MPI: MPI向け動的メモリ割当分析ツール
- メニーコア向けNUMA最適並列分散I/Oの予備検証
- メニーコア向けNUMA最適並列分散I/Oの予備検証
- 外部反復と内部反復でLook-Backの対象が異なるFlexible GMRES(k,m)法の提案
- グローバルデータ構造のためのメモリ管理モデルの検討
- ACP基本層の実装と初期評価
- ACP基本層の設計思想とインタフェース
- スーパーコンピュータ「京」の構成と評価(計算機システム,システム開発論文)
- 外部反復と内部反復で Look-Back の対象が異なる Flexible GMRES(k, m) 法の提案