メニーコア向けNUMA最適並列分散I/Oの予備検証
スポンサーリンク
概要
- 論文の詳細を見る
将来の High Performance Computing (HPC) システムではメニーコア化・NUMA 化が進み,これらを考慮したシステムソフトウェアが重要になる.本稿では NUMA 型のメニーコアシステムにおける並列分散 I/O の実現に向けた予備検証の結果と考察について述べる.予備検証では,NUMA 環境での性能律速要素と律速時の性能影響を確認するため,既存の NUMA 環境でキャッシュ I/O における read/write の I/O 性能を測定した.本稿では予備検証で得た結果をもとに,将来 HPC での最適化された並列分散 I/O を実現する上での最適な分散ポリシーについて議論する.
- 2013-04-18
著者
-
堀 敦史
東京大学
-
住元 真司
株式会社富士通研究所
-
堀 敦史
理化学研究所計算科学研究機構
-
石川 裕
東京大学|理化学研究所計算科学研究機構
-
住元 真司
富士通株式会社
-
住元 真司
富士通
-
小田和 友仁
富士通株式会社
-
堀 敦史
理化学研究所
-
石川 裕
東京大学|理化学研究所
関連論文
- GPGPU上での流体アプリケーションの高速化手法 : 1GPUで姫野ベンチマーク60GFLOPS超(高性能計算とアクセラレータ)
- 大規模InfiniBandシステムにおける経路更新手法の提案(ネットワーク技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ファイルステージング再考 : オンデマンド化と高速化に向けたプロトタイプ実装の評価(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 2.次世代高性能コンピュータシステム上の高信頼ソフトウェアシステムの開発支援技術(第1部:高い生産性を持つ高信頼ソフトウェア作成技術の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 時系列データの統計解析によるPCクラスタシステム解析手法の提案(クラスタシステム)
- Xeonプロセッサ向けLinpackベンチマーク最適化手法とその評価(性能最適化)
- 高速通信機構PM2の設計と評価
- 既存OSの枠組みを用いたクラスタシステム向け高速通信機構の提案(特集:システムソフトウエアの新しい潮流)
- ソフトウェア分散共有メモリシステムにおけるページ転送方式の比較(並列処理)
- GigaE PM: Gigabit Ethernetを用いた高速通信機構の設計と評価(並列処理)
- ソフトウェア分散共有メモリSCASHにおけるページ管理ノードの動的再配置機構の実装と評価
- クラスタ上のプログラミング開発環境 : SCoreクラスタシステムソフトウェア
- GigaE PM II: Gigabit Ethernetによる高速通信ライブラリの設計
- PM/InfiniBand-FJ : InfiniBandを用いた大規模PCクラスタ向け高性能通信機構の設計(ネットワーク)
- 6.SCore型クラスタ
- 並列プログラムの実行可搬性を実現するMPI通信ライブラリの設計(インターコネクト/MPI通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 配列転置データ転送を高速化する10Gb Ethernetインタフェースカードの設計(ネットワーク)
- 高性能通信処理オフロードエンジンUZURA実現に向けて(HPC-6: 高速ネットワークとその応用)
- 10Gb Ethernetを用いた高性能通信機構の設計(HPC-6 : 通信ライブラリ)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- 通信量を考慮したデッドロック回避ルーティング方式
- Fat-Tree構成InfiniBandネットワークにおける競合回避手法の提案
- マルチコアPCクラスタ向けAll-to-all通信アルゴリズムの提案と評価
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- マルチコアPCクラスタ向けAll-to-allアルゴリズムの提案と評価
- InfiniBandにおける最適なアドレス割り当てによる経路更新処理の高速化
- ファイルステージングシステムCatwalkのMPI-IO実装
- PACS-CSにおける隣接通信性能の高速化(HPC-13 : 通信II)
- PACS-CSのための高性能通信ライブラリインターフェイスの設計(HPC-12 : 大規模運用システム(2))
- 多段スイッチInfiniBandネットワークにおける全対全通信性能の評価
- ファイルキャッシュシステムの有効性向上に向けた科学技術計算アプリケーションのI/O特性評価
- 科学技術計算用超並列クラスタPACS-CSの実装と基本性能評価(HPC-12 : 大規模運用システム(2))
- 片方向通信の実装方式の違いによる比較
- シームレスなMPI環境を実現するMPI-Adapterの設計と性能評価
- ファイルステージング再考 : オンデマンド化と高速化に向けたプロトタイプ実装の評価(ファイルシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ファイルステージング再考:オンデマンド化と高速化に向けたプロトタイプ実装の評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- SCoreクラスタ計算環境
- クラスタにおけるコンシステントチェックポイントの実現(特集:システムソフトウエアの新しい潮流)
- クラスタにおける並列プロセスマイグレーションの評価
- ギガビットネットワークを用いた並列プロセスマイグレーションの性能評価
- 通信ライブラリPMのUDP上への移植と評価
- 複数Gigabit Ethernetを用いたPACS-CSのための高性能通信機構の設計と評価(ネットワーク)
- PACS-CSのためのEthernetを用いた高性能通信機構の設計(HPC-8: 高性能クラスタ)
- 10Gb Ethernet上の通信プロトコル作成支援技術(OS-3 : 高性能計算機)
- 次世代高性能計算機アーキテクチャ上のシステムソフトウェア開発環境(OS-3 : 高性能計算機)
- OS開発のためのメニーコアハードウェアシミュレータの設計と実装
- ハードウェア同期機構を用いた超軽量スレッドライブラリ
- マルチコア・メニーコア混在型並列計算機向けOSの構想
- 高帯域と低遅延を両立するFat Tree結線方式の提案
- Two-Phase I/Oの高速化に関する一検討
- メニーコア向けシステムソフトウェア開発のための実行環境の設計と実装
- メニーコア環境におけるキャッシュアウェア・オペレーティングシステムに向けて
- メニーコア環境におけるキャッシュアウェア・オペレーティングシステムに向けて
- パイプライン型Two-Phase I/OのLustreにおける性能評価
- 並列ジョブのファイルI/Oをひとつのファイルに集約する方式の提案と予備評価
- メニーコア混在型並列計算機におけるスレッド管理方式
- MPI_Allreduceの「京」上での実装と評価
- メニーコア混在型並列計算機におけるMPI通信基盤の提案
- パイプライン型Two-Phase I/OのLustreにおける性能評価
- 並列ジョブのファイルI/Oをひとつのファイルに集約する方式の提案と予備評価
- メニーコア混在型並列計算機におけるスレッド管理方式
- MPI_Allreduceの「京」上での実装と評価
- メニーコア混在型並列計算機におけるMPI通信基盤の提案
- ハードウェア同期機構を用いた省電力MPIの実装と評価
- ハードウェア同期機構を用いた省電力MPIの実装と評価
- メニーコア混在型並列計算機におけるスレッド管理方式
- メニーコア混在型並列計算機におけるMPI通信基盤の提案
- メニーコア混在型並列計算機におけるスレッド管理方式
- メニーコア混在型並列計算機におけるMPI通信基盤の提案
- パイプライン型Two-Phase I/OのLustreにおける性能評価
- 並列ジョブのファイルI/Oをひとつのファイルに集約する方式の提案と予備評価
- ハードウェア同期機構を用いた省電力MPIの実装と評価
- MPI_Allreduceの「京」上での実装と評価
- ハードウェア同期機構を用いた省電力MPIの実装と評価
- MPI_Allreduceの「京」上での実装と評価
- パイプライン型Two-Phase I/OのLustreにおける性能評価
- 並列ジョブのファイルI/Oをひとつのファイルに集約する方式の提案と予備評価
- 片側通信による,グローバルデータ構造の効率的な操作方法の検討
- メニーコア混在型並列計算機における委託機構を用いたMPI通信基盤
- InfiniBand Atomic Operationの性能評価
- エクサスケールコンピューティングに向けた省メモリ通信ライブラリの検討
- マルチコア・メニーコア混在型計算機における軽量OS向けI/Oライブラリの提案
- 通信量バランスの良いデッドロック回避ルーティング手法の提案とクラスタネットワークにおける評価 (コンピューティングシステム Vol.4 No.4)
- スーパーコンピュータ「京」の高性能・高信頼ファイルシステム (特集 スーパーコンピュータ「京」)
- スーパーコンピュータ「京」のMPIと低レベル通信 (特集 スーパーコンピュータ「京」)
- マルチコア・メニーコア混在型計算機における演算コア側資源管理の代行方式
- MPI_Allreduceの「京」上での実装と評価
- RDMAをサポートするクラスタ向けの軽量協調キャッシング
- RDMAをサポートするクラスタ向けの軽量協調キャッシング
- 非同期グローバルヒープの提案と初期検討
- ヘテロジニアス計算機上のOS機能委譲機構
- 次世代高性能並列計算機のためのシステムソフトウェアスタック
- メニーコア向けNUMA最適並列分散I/Oの予備検証
- ヘテロジニアス計算機上のOS機能委譲機構
- 次世代高性能並列計算機のためのシステムソフトウェアスタック
- メニーコア向けNUMA最適並列分散I/Oの予備検証
- メニーコア用Agentプログラミング環境の提案
- 次世代高性能計算機システムのためのシステムソフトウェア実現にむけて