NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
スポンサーリンク
概要
- 論文の詳細を見る
近い将来,数 10 万ノードを相互結合網によって接続した大規模並列計算機が主流となると予測される.大規模並列計算機向けに通信ライブラリ,通信アルゴリズム,および相互結合網の開発を効率的に進めるためには,相互結合網の性能予測のための相互結合網シミュレータが必要不可欠である.シミュレータに対する要件としては,相互結合網を適切な詳細度でモデル化し,通信パターンを記述するための柔軟なインタフェースを持ち,シミュレーション結果に関して十分に詳細な情報を出力できることが挙がる.また,近年普及が拡大しているマルチコア・プロセッサの特徴である,共有メモリを介した低いレイテンシでの通信を利用できる設計となっていることが望ましい.そこで,本稿では大規模相互結合網の性能予測のための相互結合網シミュレータ NSIM を提案する.本シミュレータでは,対象システムにおけるプロセス間のデータ転送を省略し,シミュレーション時間とメモリ消費量を削減することで,マルチコア・プロセッサを搭載した小規模な並列計算機上での動作を可能としている.さらに,実行駆動型シミュレーション方式の採用により,相互結合網における混雑状況で振る舞いが動的に変化する通信パターンを正しくシミュレーションすることができる.実機でのランダムリング通信の実行結果との比較により,本シミュレータの予測結果が定性的に正しいことを確認した.また,全対全通信のシミュレーション結果から,本シミュレータが将来の大規模相互結合網を現実的な時間内でシミュレーションする能力を持つこと,および既存シミュレータと比較して省メモリかつ高速に動作することを示した.
- 2010-06-10
著者
-
安島 雄一郎
富士通株式会社
-
安藤 壽茂
富士通株式会社
-
稲富 雄一
九州大学
-
柴村 英智
財団法人九州先端科学技術研究所
-
薄田 竜太郎
福岡県産業・科学技術振興財団
-
薄田 竜太郎
(財)福岡県産業・科学技術振興財団
-
清水 俊幸
富士通
-
真木 淳
九州大学情報基盤センター
-
稲富 雄一
九州大学情報基盤研究開発センター
-
稲富 雄一
(財)九州先端科学技術研究所システムlsi研究室グループ次世代スーパーコンピュータ開発支援室
-
三輪 英樹
富士通株式会社
-
三吉 郁夫
富士通株式会社
-
清水 俊幸
富士通株式会社
-
薄田 竜太郎
財団法人九州先端科学技術研究所
-
平尾 智也
財団法人九州先端科学技術研究所
-
眞木 淳
財団法人九州先端科学技術研究所
-
稲富 雄一
国立大学法人九州大学
-
井上 弘士
国立大学法人九州大学
-
井上 弘士
九州大学大学院システム情報科学研究院
-
柴村 英智
(財)九州先端科学技術研究所
-
平尾 智也
(財)九州先端科学技術研究所
-
Inoue K
Kyushu
-
井上 弘士
九大 大学院システム情報科学研究院
関連論文
- 演算/メモリ性能バランスを考慮したCMP向けオンチップ・メモリ貸与法の提案(マイクロプロセッサ)
- 10GbEインターコネクトを使用したブレードサーバ(XION)の試作(CPSY-6 並列分散プラットホーム)(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 情報社会を支えるディペンダブル・プロセッサ
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 片側通信を用いた並列フラグメント分子軌道計算プログラムの実装(HPC-5 : アプリケーションI)
- GridFMO : グリッド環境を用いた大規模量子化学計算(グリッド)
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(マルチコア設計開発/性能評価,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- 大規模分子の分子軌道計算 : Lysozyme とモデルDNA分子の分子軌道
- 21pTC-8 メディエイターを用いた連成計算によるマルチスケール現象の理解に向けて1(化学物理一般(光応答・電子状態・シミュレーション),領域12,ソフトマター物理,化学物理,生物物理)
- 18pWD-3 RISM/SCF達成計算による溶液中分子の一電子軌道の固有値統計と局在(量子力学・量子カオス,領域11,原子・分子,量子エレクトロニクス,放射線物理)
- PM/InfiniBand-FJ : InfiniBandを用いた大規模PCクラスタ向け高性能通信機構の設計(ネットワーク)
- 大規模固有値問題のmaster-worker型並列解法(数値計算)
- FMO-MO法による大規模分子軌道計算(数値シミュレーション)
- C-12-29 演算/メモリ性能のバランスを考慮したマルチコア実行方式(C-12.集積回路,一般セッション)
- チップマルチプロセッサにおけるメモリ負荷変動の定量的解析(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- NICメモリを用いたZero Copy Socket方式の実装評価(インタコネクト, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- NICメモリを用いたZero Copy Socket方式の提案(インタコネクト, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- C-12-32 演算器配列型アクセラレータの温度解析(C-12.集積回路,一般セッション)
- SRAM/DRAMハイブリッド・キャッシュにおける実行時動作モード決定法の提案
- Partially Direct SCF 法の開発と性能評価
- 近似文字列照合プログラム実行の特徴解析と高速化に関する検討(解析・省電力,SWoPP2006)
- フラグメント分子軌道法プログラムABINIT-MPにおける2電子積分ルーチンの高速化ならびに並列化と性能評価
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- Mesh・Torusネットワーク上での最適全対全通信アルゴリズムの評価
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- 高信頼設計SPARC64Vマイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64Vマイクロプロセサ
- マルチコア向けオンチップメモリ貸与法における実行コード生成法の改善
- FMO-MO 法による大規模分子軌道計算(計算科学の基盤技術とその発展)
- FMO-MO法における大規模分子軌道計算 : 解くべき固有値問題の特徴(行列・固有値問題における線形計算アルゴリズムとその応用)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- NSIM : 将来の大規模相互結合網を対象とした通信シミュレータの開発
- PSI-NSIM : 大規模並列システムの性能解析に向けた並列相互結合網シミュレータ(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 次世代スーパーコンピュータの設計開発に向けたシステム性能評価環境PSI-SIM(HPC-16 : 性能評価)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- 2次元Meshネットワーク・Torusネットワーク上での最適全対全通信アルゴリズム
- Eric(二電子積分計算専用プロセッサ)LSIの開発
- 二電子積分計算専用プロセッサ・アーキテクチャの開発(高性能アーキテクチャ)
- 二電子積分計算専用プロセッサ・アーキテクチャ
- 二電子積分計算専用プロセッサ・アーキテクチャ
- WindowsNT上でのクロス開発環境を目指す並列化支援ツールの開発
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- タンパク質分子構造を例とする高性能計算結果の可視化システムの試作
- 大規模分子軌道計算における解くべき固有値問題の特徴
- メッセージ通信ライブラリを用いたプログラムの並列化例と計算速度および計算精度の評価
- Kaiser : 128-CPU SMPサーバの構成と評価
- AP1000+におけるSplit-Cの実装と実行性能の評価
- 9033 大規模固有値問題のグリッド環境向き並列解法(GS-D 一般セッション(行列計算))
- 分子軌道計算専用計算機のためのフォック行列並列計算アルゴリズムの開発
- コンピュータアーキテクチャと集積回路技術の協調の必要性について(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- コンピュータアーキテクチャと集積回路技術の協調の必要性について(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- 128-CPU SMP PRIMEPOWERシリーズの構成と実装
- 高並列計算機AP1000+のメッセージハンドリング機構
- AP1000+:並列化コンパイラをサポートするアーキテクチャ
- AP1000+:並列化コンパイラをサポートするアーキテクチャ
- メッセージ通信の分散メモリ型並列計算機性能への影響 : 通信と演算のオーバラップと直接メッセージ受信の効果
- 高並列計算機AP1000のアーキテクチャ
- 並列計算機AP1000用数値演算アクセラレータの構成と評価
- サーバ用CPUのハードウェア資源削減に基づくチップマルチプロセッサの設計(アーキテクチャ一般及びチップマルチプロセッサ)(デザインガイア2003 : VLSI設計の新しい大地を考える研究会)
- サーバ用CPUのハードウェア資源削減に基づくチップマルチプロセッサの設計
- キャッシュ・ミス頻発命令を考慮したメモリ・システムの高性能化(キャッシュメモリ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- PRIMEPOWER2000/1000/800のハードウェア (特集 インターネット時代の中核サーバ「PRIMEPOWER」)
- 2電子積分計算ルーチンの性能評価
- LINPACKベンチマークの並列ベクトル処理 : 並列計算機AP1000用数値演算アクセラレータによる実現
- 高速メッセージハンドリング機構 : AP1000における実現
- 高並列計算機AP1000のB-Netアーキテクチャと評価
- 目的コードサイズ縮小のための短形式命令サブセットの最適構成
- 目的コードサイズ縮小のための短形式命令サブセットの最適構成
- ソフトウエアシミュレーションによるシステムLSI設計・検証ツールの評価
- キャッシュ・ミス頻発ロード命令の特徴解析(一般セッションA プロセッサ・アーキテクチャI)
- キャッシュ・ミス頻発ロード命令を対象としたミス原因解析(高速化手法, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- キャッシュ・ミス頻発命令とその特徴解析(キャッシュメモリ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- パケットペーシングを用いた集団通信アルゴリズムのシミュレーション評価
- 交番検査方式による2線式符号検査回路の構成
- メニーコアプロセッサを対象とした柔軟性を有するハードウェアバリア機構の提案
- 片側通信による,グローバルデータ構造の効率的な操作方法の検討
- InfiniBand Atomic Operationの性能評価
- 並列FMOプログラムOpenFMOの性能最適化
- エクサスケールコンピューティングに向けた省メモリ通信ライブラリの検討
- 8万ノードを接続する京速コンピュータ「京」のTofuインターコネクト(ネットワーク環境でのディペンダビリティ,及び一般)
- ハードウェア : ラック,冷却,プロセッサ,インターコネクト (特集 スーパーコンピュータ「京(けい)」)
- FPGAを用いたメニーコア・アーキテクチャSMYLErefの評価環境の構築(評価,集積回路とアーキテクチャの協創〜ノーマリオフコンピューティングによる低消費電力化への挑戦〜)
- FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
- FX10におけるインタコネクト・コントローラの省電力化手法の初期検討
- 非同期グローバルヒープの提案と初期検討
- DMATP-MPI: MPI向け動的メモリ割当分析ツール
- FPGAを用いたメニーコア・アーキテクチャ SMYLEref の評価環境の構築
- グローバルデータ構造のためのメモリ管理モデルの検討
- ACP基本層の実装と初期評価
- ACP基本層の設計思想とインタフェース
- スーパーコンピュータ「京」の構成と評価(計算機システム,システム開発論文)
- SMYEOpenCLの実装と128コア上での評価実験(並列処理,集積回路とアーキテクチャの協創〜新しいアプリケーション創造に向けたアーキテクチャ、回路技術の貢献〜)