並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
スポンサーリンク
概要
- 論文の詳細を見る
本論文では、複数の実行環境が異なるクラスタシステム間での並列アプリケーションバイナリの可搬性を実現するためのMPI通信ライブラリ(MPI-Adaptor)の設計について述べる。実行バイナリの可搬性を確保するためには、MPIの実装毎に異なる引数と返り値を変換する必要がある。実現の有効性を判断するため、最小限度の変換機能をもつMPI-Adaptorのプロトタイプを実装した。簡易の評価結果、Xeon 3.8GHzのPCクラスタにおいて、MPIの変換オーバヘッドは送受信関数1回あたり0.028μs程度と小さく、MPI-Adaptor実現の有用性を示した。
- 一般社団法人情報処理学会の論文
- 2009-02-19
著者
-
松葉 浩也
東京大学情報基盤センター
-
石川 裕
東京大学情報基盤センター
-
成瀬 彰
富士通研究所
-
住元 真司
富士通研究所
-
久門 耕一
富士通研究所
-
堀 敦史
東京大学
-
鴨志田 良和
東京大学
-
安井 隆
日立製作所
-
中島 耕太
富士通研究所
-
中島 耕太
株式会社富士通研究所
-
住元 真司
(株)富士通研究所
-
石川 裕
東京大学情報理工学系研究科
-
石川 裕
東京大学
-
住元 真司
株式会社富士通研究所
-
久門 耕一
富士通研究所人工知能研究部
-
久門 耕一
(株)富士通研究所itコア研究所itアーキテクチャ研究部
-
久門 耕一
富士通研究所itシステム研究所
-
久門 耕一
(株)富士通研究所マルチメディアシステム研究所
-
堀 敦史
エム・アール・アイ システムズ 新情報処理開発機構
-
久門 耕一
富士通研
-
石川 裕
東京大学大学院情報理工学系研究科|東京大学情報基盤センター
関連論文
- GPGPU上での流体アプリケーションの高速化手法 : 1GPUで姫野ベンチマーク60GFLOPS超(高性能計算とアクセラレータ)
- MPI通信ライブラリの最適化と性能評価(HPC-1:MPI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 分散ページングによる大規模仮想メモリ空間(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 大規模InfiniBandシステムにおける経路更新手法の提案(ネットワーク技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ファイルステージング再考 : オンデマンド化と高速化に向けたプロトタイプ実装の評価(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 2.次世代高性能コンピュータシステム上の高信頼ソフトウェアシステムの開発支援技術(第1部:高い生産性を持つ高信頼ソフトウェア作成技術の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 時系列データの統計解析によるPCクラスタシステム解析手法の提案(クラスタシステム)
- キャッシュミス削減によるLinuxプロセススケジューラの高速化(アーキテクチャとシステムソフトウェア)
- NUMAマシンでのコマーシャルワークロード向けLinux最適化(並列処理)
- LinuxカーネルのNUMA向け最適化
- Xeonプロセッサ向けLinpackベンチマーク最適化手法とその評価(性能最適化)
- 高速通信機構PM2の設計と評価
- 既存OSの枠組みを用いたクラスタシステム向け高速通信機構の提案(特集:システムソフトウエアの新しい潮流)
- ソフトウェア分散共有メモリシステムにおけるページ転送方式の比較(並列処理)
- GigaE PM: Gigabit Ethernetを用いた高速通信機構の設計と評価(並列処理)
- ソフトウェア分散共有メモリSCASHにおけるページ管理ノードの動的再配置機構の実装と評価
- クラスタ上のプログラミング開発環境 : SCoreクラスタシステムソフトウェア
- GigaE PM II: Gigabit Ethernetによる高速通信ライブラリの設計
- Gigabit Ethernet NICの性能評価
- Gigabit Ethernet NIC の性能評価
- Myrinetを用いた分散共有メモリシステムの評価
- SMPクラスタ上でのMPIの実装と評価
- Gigabit Ethernetを用いた高速通信ライブラリの設計
- PM/InfiniBand-FJ : InfiniBandを用いた大規模PCクラスタ向け高性能通信機構の設計(ネットワーク)
- メモリトレースを元にした大規模サーバの性能予測
- 2000-ARC-139-1 メモリバストレースを用いた共有バス型並列計算機のキャッシュ評価
- 4H-7 GATESによるCommercial Workloadアクセスパターンの分析
- 4H-6 GATES(PCサーバ用汎用メモリアクセストレースシステム)の開発
- NUMA並列型クラスタ上での効率的なスケジューリング(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- IPMI規格に基づく管理保守系システムソフトウェア(OS-3 : 高性能計算機)
- 6.SCore型クラスタ
- 再送制御を考慮した通信モデルの設計(HPC-10 : 適応環境での通信)
- リアルタイムパケットの通信制御(OS-4: 通信システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- リアルタイムパケットの送信制御(ポスターセッション)
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 配列転置データ転送を高速化する10Gb Ethernetインタフェースカードの設計(ネットワーク)
- 高性能通信処理オフロードエンジンUZURA実現に向けて(HPC-6: 高速ネットワークとその応用)
- 10Gb Ethernetを用いた高性能通信機構の設計(HPC-6 : 通信ライブラリ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- LinuxカーネルのNUMA向け最適化
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- 通信量を考慮したデッドロック回避ルーティング方式
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- マルチコアPCクラスタ向けAll-to-all通信アルゴリズムの提案と評価
- カーネルレベルMPI非同期集団通信機構の設計と実装
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- ファイルステージングシステムCatwalkのMPI-IO実装
- 柔軟な負荷分散を可能にする分散型シングルIPクラスタ(OS-1 : 実行基盤)
- レイヤー7負荷分散のためのTCP接続移送機構
- レイヤー7負荷分散のためのTCP接続移送機構
- 多段スイッチInfiniBandネットワークにおける全対全通信性能の評価
- ファイルキャッシュシステムの有効性向上に向けた科学技術計算アプリケーションのI/O特性評価
- シームレスなMPI環境を実現するMPI-Adapterの設計と性能評価
- 分散ページングによる大規模仮想メモリ空間(クラスタ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ファイルステージング再考 : オンデマンド化と高速化に向けたプロトタイプ実装の評価(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ファイルステージング再考:オンデマンド化と高速化に向けたプロトタイプ実装の評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 電力制御スケジューラのプロトタイプ実装(OS-5 : 適応システム,2006年並列/分散/協調処理に関する『高知』サマー・ワークショップ(SWoPP高知2006)-研究会・連続同時開催-)
- 多段スイッチ InfiniBand ネットワークにおける全対全通信性能の評価
- マルチコアPCクラスタ向け All-to-all アルゴリズムの提案と評価
- マルチコアPCクラスタ向け All-to-all アルゴリズムの提案と評価
- T2Kオープンスーパーコンピュータと共用イノベーション
- NUMA並列型クラスタ上での効率的なスケジューリング(並列プログラミング/スケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- T2Kオープンスパコンが創る新しい計算機環境
- P-BusにおけるOSカーネル間通信機構の設計と実装(OS-2:カーネルとネットワーク,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- カーネル機能拡張のための抽象化レイヤP-Busの実装(セッション2:システム構成法)
- PBus : 柔軟なカーネル機能拡張のためのインタフェース(OS-3 : OS実装)
- 大規模メモリ空間の利用を支援する遠隔スワップメモリシステム(HPC-7 : データ管理)
- コモディティネットワークによる5GB/s通信の可能性(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- コモディティネットワークによる5GB/s通信の可能性(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 10Gb Ethernet上の通信プロトコル作成支援技術(OS-3 : 高性能計算機)
- 次世代高性能計算機アーキテクチャ上のシステムソフトウェア開発環境(OS-3 : 高性能計算機)
- 自律的システム管理ソフトウェアの設計(OS-4:ストレージと自律管理)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Linuxにおける共有メモリを保持するプロセスのマイグレーション機構(OS-4 : 資源保護,2006年並列/分散/協調処理に関する『高知』サマー・ワークショップ(SWoPP高知2006)-研究会・連続同時開催-)
- 単一IPアドレスクラスタにおける耐故障機構の設計と実装
- 憧れられるソフトウェア科学ビッグプロジェクト立ち上げを!
- CIMを用いた障害検知システム(OS-6 : 分散システム,2006年並列/分散/協調処理に関する『高知』サマー・ワークショップ(SWoPP高知2006)-研究会・連続同時開催-)
- 低消費電力のためのスケジューリングアルゴリズム(カーネルとライブラリ)
- クラスタ監視機能付きMPI通信ライブラリ(HPC-10: 通信ライブラリ)
- プロセス単位電力制御機構の予備評価(OS-3: カーネル, スケジューリング, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- シングルIPアドレスクラスタの設計(OS-2: 分散システム, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- 動的アクセスパターン解析によるソフトウェア分散共有メモリ(クラスタソフトウェア)
- メモリ消費電力に基づくCPU周波数の動的制御
- 広域分散環境を提供するHPCIネットワーク・認証・ユーザ管理支援基盤の設計
- 広域分散環境を提供するHPCI先端ソフトウェア運用基盤の設計
- 広域分散環境を提供するHPCIシステムソフトウェア基盤の設計概要と共有ストレージ構築
- 高帯域と低遅延を両立するFat Tree結線方式の提案
- 容易なアドバイス記述法をもつFault Resilienceプログラム環境構築にむけて
- 非同期コレクティブ通信の実装方式の検討
- 予測可能リアルタイムカーネルの設計と実装(OS (2))
- 厳密な周期タスク実行を支援する実時間Linuxカーネルの実装(OS-2 : 資源管理,2006年並列/分散/協調処理に関する『高知』サマー・ワークショップ(SWoPP高知2006)-研究会・連続同時開催-)
- User Mode Linux上における高速通信機構(仮想化)
- クラスタを単一システムとして扱うTCP/IPソケットの実装(ポスターセッション)
- IA64クラスタ上のソフトウェア分散共有メモリシステム(クラスタシステム)
- 通信量バランスの良いデッドロック回避ルーティング手法の提案とクラスタネットワークにおける評価 (コンピューティングシステム Vol.4 No.4)
- メモリ消費電力に基づくCPU周波数動的制御手法の評価
- X線自由電子レーザー施設SACLAとスーパーコンピューター「京」の連携(ネットワーク研究開発テストベッド運用・利用,一般)
- ジョブ間データ転送方式の検討