HPCI先端ソフトウェア運用基盤の構築と運用
スポンサーリンク
概要
- 論文の詳細を見る
平成 24 年度より運用が開始されている HPCI では,スーパコンピュータ 「京」 や基盤センター群が保有するスーパコンピュータ間の認証基盤統一,データ共有を実現している.しかしながら,既存のスーパコンピュータシステムはバッチキューでジョブ管理されていることや,計算ノードでの管理者権限がないため,OS や分散システムの研究開発を行う CS 系ユーザの利用環境条件を満たさない.また,インターネット上より各種データを取得し,それを用いた計算を行う場合や,得られた成果を外部に公開するには,スーパコンピュータの利用は不向きである.そこで我々は,利用者に対してシステムへの管理者権限を付与する広域分散システムのホスティング機能を提供する,先端ソフトウェア運用基盤を HPCI の枠組みの中で構築し,平成 26 年 4 月より本格運用を開始する.本稿では先端ソフトウェア運用基盤の設計,構築及び運用について紹介する.
- 2014-02-24
著者
関連論文
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 次世代光インターコネクトでのMPI通信に関する研究
- グリッドチャレンジテストベッドの構築と運用 : グリチャレテストベッドの作り方(HPC-3 : 大規模運用システム(1))
- 6K-3 情報爆発に対応する耐故障性MPIフレームワークの提案(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークCuckoo FTMPIの提案と評価(アーキテクチャ,SWoPP2006)
- ポータブルな耐故障性コンポーネントフレームワークを持つMPI実装に向けて(通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ポータブルな耐故障性コンポーネントフレームワークを持つMPI実装に向けて
- Speculativeチェックポインティングの設計と実装(2004年並列/分散/協調処理に関する「青森」サマーワークショップ(SWoPP青森2004))
- 自律的な通信回復を行うFault Tolerant MPIの実装と評価(HPC-10 : クラスタソフトウェア)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 光ネットワークの補助的利用によるHPC性能向上(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 6K-5 情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 次世代光インターコネクト上でのMPIアプリケーションの評価(HPC-11 : 通信I)
- B-12-10 光バーストスイッチング技術のGridアプリケーションへの適用(B-12.フォトニックネットワーク,一般講演)
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(ジョブスケジューリング, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- 光ネットワーク環境におけるMPI集団通信(分散共有メモリと通信ライブラリ, 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2006))
- レプリカ管理システムを利用したデータインテンシブアプリケーション向けスケジューリングシステム(応用システム, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- グリッド上のスケーラブルな並列レプリケーションフレームワーク(HPC-11 : グリッド(3))(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 増分データとErasure Codingを利用した高速なチェックポイント手法
- e-サイエンス基盤としての計算機センターPOP(Point-of-Presence)連携
- PoP(Point of Presence)によるe-サイエンスリソース連携(研究発表,ネットワーク研究開発テストベッド運用・利用,一般)
- e-サイエンス基盤としての計算機センターPOP (Point-of-Presence) 連携
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上
- 広域分散環境を提供するHPCI先端ソフトウェア運用基盤の設計
- 大規模SMP並列スーパーコンピューター(HITACHI SR16000モデルM1)の性能評価
- 高性能分散計算環境のための認証基盤の設計
- HPCI先端ソフトウェア運用基盤の構築と運用