ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
スポンサーリンク
概要
- 論文の詳細を見る
Intel プロセッサに加え NVIDIA GPU を備え,2010 年 11 月に稼働開始したヘテロ型スパコンである TSUBAME 2.0 における Linpack ベンチマークの実行について報告する.本システムは 2CPU と 3GPU を備えた計算ノードを約 1400 台持ち,それらはフルバイセクションのファットツリー構造を持つ QDR InfiniBand ネットワークにより接続される.理論演算性能は TSUBAME 1.0 の約 30 倍となる 2.4PFlops であり,それを TSUBAME 1.0 とほぼ同じ規模の電力で実現している.Linpack ベンチマークのコード改良およびチューニングを GPU を用いた大規模システムの特性に合わせ行い,実行速度として 1.192PFlops を実現した.この結果は日本のスパコンとしては初めて PFlops を超えるものであり,Top500 スパコンランキングに 4 位にランクされた.
- 2010-12-09
著者
-
額田 彰
東京工業大学学術国際情報センター
-
遠藤 敏夫
東京工業大学グローバルCOE
-
松岡 聡
国立情報学研究所
-
松岡 聡
東京工業大学
-
松岡 聡
東京工業大学:国立情報学研究所
-
遠藤 敏夫
東京工業大学 学術国際情報センター
-
松岡 聡
東京工業大学情報理工学研究科数理・計算科学専攻
-
額田 彰
東京工業大学|jst Crest
-
松岡 聡
東工大:国情研
-
遠藤 敏夫
東京工業大学
関連論文
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータのLinpack評価(GPGPUコンピューティングの数理)
- CUDAによる高速フーリエ変換(GPGPUコンピューティングの数理)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ヘテロ並列環境のための省電力タスクスケジューリング(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- ソフトウェアECCによるGPUメモリの耐故障性の実現と評価(信頼性とセキュリティ,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 複数GPUにおけるセルフスケジューリングによる並列数値演算(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 大規模計算環境におけるユーザ満足度を考慮した資源管理へむけて(並列処理環境,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- PoP(Point of Presence)によるe-サイエンスリソース連携 (インターネットアーキテクチャ)
- スワップコストの動的推定によるメモリの省電力化手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ポータビリティの高いジョブスケジューリングシステム設計と実装(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 2 東京工業大学TSUBAMEにおけるアクセラレータ活用事例(アクセラレータ,再び-スパコン化の切り札-)
- 仮想クラスタを用いたData-Intensive Application実行環境の性能モデル構築と最適化(HPC-2:仮想クラスタ,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Access Gridの構築とGrid上での国際会議
- ヘテロ型スーパコンピュータTSUBAMEのLinpackによる性能評価(高性能計算)
- 情報爆発時代に向けた新しいIT基盤技術の研究(情報爆発時代に向けた新しいIT基盤技術の研究)
- アクセラレータを用いたヘテロ型スーパーコンピュータ上の並列計算(通信プロトコルとインターフェース及びアクセラレータ,SANを用いた高性能コンピュータシステム,及び一般)
- ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価(HPC-3 : 大規模運用システム(1))
- 次世代光インターコネクトでのMPI通信に関する研究
- プロセス間共通メモリイメージを考慮したマイグレーション最適化(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 1 アクセラレータ技術の影と光 : ペタ〜エクサの次世代HPCの中心的な躍進技術へ(アクセラレータ,再び-スパコン化の切り札-)
- プロセス間共通メモリイメージを考慮したマイグレーション最適化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 3.情報爆発は情報システムをも「爆発」させる(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- NAREGIグリッドミドルウェアによる大規模連携接続実証実験(OS-6:分散システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置(HPC-13:ファイルシステム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 5K-4 情報爆発時代のグリッドファイルシステム上での大規模データ管理(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 広域分散環境における大規模データ管理のためのノードグルーピング(HPC-7 : データ管理)
- NAREGIミドルウェアβ-gLite間における相互ジョブ起動実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム
- レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行(HPC-3 : 科学技術計算)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- MPC++-on-MPIのコモディティクラスタ環境における評価
- ORE Grid : 仮想計算機を用いたグリッド実行環境の高速な配置ツール(グリッド)
- DisC : ごみ集め機構を備えたC++の分散記憶並列拡張言語
- グリッドチャレンジテストベッドの構築と運用 : グリチャレテストベッドの作り方(HPC-3 : 大規模運用システム(1))
- 6K-3 情報爆発に対応する耐故障性MPIフレームワークの提案(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 光ネットワークの補助的利用によるHPC性能向上(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- グリッド環境におけるMPI_Scatter/Gather通信アルゴリズムの最適化(HPC-1:MPI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 6K-5 情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-4 情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-2 情報爆発時代へ向けた不均一アーキテクチャにおけるスーパーコンピューティング(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 次世代省電力メモリを用いた並列プログラムの省電力化の評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 次世代光インターコネクト上でのMPIアプリケーションの評価(HPC-11 : 通信I)
- CPUおよびGPUを併用するFFTライブラリの提案と評価(HPC-1 : 最適化)
- グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム(グリッド)
- SANを用いた高性能コンピュータシステムの将来像と究極の姿(パネル討論,計算システムとファイルシステム,SANを用いた高性能コンピュータシステム,及び一般)
- CUDAによる高速フーリエ変換
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータの Linpack 評価
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- GPU向け耐メモリエラーソフトウェアフレームワーク
- GPU向け耐メモリエラーソフトウェアフレームワーク
- CUDA GPU向けの自動最適化FFTライブラリ
- GPUにおける耐故障性を考慮した数値計算の電力性能
- CUDA環境における高性能3次元FFT
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- GPUクラスタにおける科学技術計算の自動最適化
- GPUクラスタにおける省電力タスクスケジューリング
- 増分データとErasure Codingを利用した高速なチェックポイント手法
- 異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpackの性能向上手法
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUにおける性能と消費電力の相関性の解析
- 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ
- 高いヒープ使用率の下で高速なインクリメンタルGC
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 低負荷で多数の計算機をリアルタイムに監視するシステムVGXPの実装(大規模システム,SWoPP2006)
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 〜32GPUで700GFLOPS超を達成〜
- 増分データと Erasure Coding を利用した高速なチェックポイント手法
- 光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上
- GPU向け耐メモリエラーソフトウエアフレームワーク
- GPU向け耐メモリエラーソフトウエアフレームワーク
- 研究の世界に飛び込んで(平成18年度論文賞の受賞論文紹介)
- プロセス間共通メモリイメージを考慮したマイグレーション最適化(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 : 32GPUで700GFLOPS超を達成
- 共有メモリ並列計算機上の並列ガーベージコレクタの性能予測
- スワップコストの動的推定によるメモリの省電力化手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 高い耐遅延性を持つガウス消去法(HPC-7: 並列数値計算ライブラリ)
- Portableでrobustなglobal garbage collectorの構築について
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- TSUBAME 2.0の全貌
- TSUBAME 2.0の全貌
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- スーパコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成 (コンピューティングシステム Vol.4 No.4)
- GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法
- GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法
- TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価
- TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価