大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(マルチコア設計開発/性能評価,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,ぺタフロップス級スーパーコンピュータの性能予測を可能にするシステム評価環境PS-SIMの開発について報告する.また,実在するマシンを対象とした性能予測精度実験,ならびに,仮想ぺタスケール・システムを対象とした大規模性能予測実験の結果を示す.実在する計算機システムを利用して,2〜3桁高性能な計算機システムの性能を予測するためには,これらの間に存在する大きな性能差を埋める必要がある.そこで我々は,この要求を満足し高速かつ正確な性能予測を実現するため,1)プログラム・コード抽象化技術の導入,ならびに,2)仮想超並列実行環境の構築を行った.192GFlops(または52GFlops)のPCクラスタを用いて実在する6.5TFlopsマシンの性能を予測した結果,性能予測誤差は10%程度と高い精度を実現した.また,4,096個のマルチコア・プロセッサを搭載した仮想スーパー・コンピュータ(ピーク性能2.1PFlops)の性能予測を行った結果,HPLの実行において実効性能1.01PFlopsであった.このぺタスケール性能予測に要する時間は6時間と現実的な範囲内であり,本研究で開発した性能評価法ならびに各種ツールの有効性を示した.
- 2008-05-06
著者
-
薄田 竜太郎
財団法人福岡県産業・科学技術振興財団
-
安藤 壽茂
富士通株式会社
-
石附 茂
富士通株式会社
-
小松 秀実
富士通株式会社
-
稲富 雄一
九州大学
-
本田 宏明
九州大学
-
山村 周史
富士通株式会社
-
柴村 英智
財団法人九州先端科学技術研究所
-
于 雲青
九州大学
-
木村 康則
富士通株式会社
-
井上 弘士
九州大学
-
柴村 英智
(財) 九州システム情報技術研究所
-
青柳 睦
九州大学
-
村上 和彰
九州大学
関連論文
- 科学技術計算を対象とした大規模再構成可能データパスの性能評価(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 片側通信を用いた並列フラグメント分子軌道計算プログラムの実装(HPC-5 : アプリケーションI)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模再構成可能データパスにおけるオンチップ・ネットワーク・アーキテクチャの検討(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(マルチコア設計開発/性能評価,集積回路とアーキテクチャの協創〜どう繋ぐ?どう使う?マルチコア〜)
- 大規模システム評価環境PSI-SIM : 数千個のマルチコア・プロセッサを搭載したペタスケールコンピュータの性能予測(集積回路とアーキテクチャの協創 : どう繋ぐ?どう使う?マルチコア)
- 大規模科学技術計算向けSIMD拡張スカラプロセッサの提案とその評価(ARC-4 : アーキテクチャII,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 大規模分子の分子軌道計算 : Lysozyme とモデルDNA分子の分子軌道
- NAREGIグリッドミドルウェアによる大規模連携接続実証実験(OS-6:分散システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- グリッドミドルウェアの階層的管理機構によるNAREGIインストーラの設計と実装(グリッド)
- 大規模固有値問題のmaster-worker型並列解法(数値計算)
- FMO-MO法による大規模分子軌道計算(数値シミュレーション)
- Redefis:動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサVulcan2,および,その開発ツールISAcc(プロセッサ)
- 動的再構成可能プロセッサを対象とした自動ASIP生成 : 動的再構成可能プロセッサ Vulcan2, および, その開発ツールISAcc
- 動的再構成可能プロセッサVulcanの評価(FPGAとその応用及び一般)
- システムレベル設計に向けたFPGA応用教材の開発(FPGAとその応用及び一般)
- 3次元積層プロセッサ・アーキテクチャの研究動向
- Partially Direct SCF 法の開発と性能評価
- フラグメント分子軌道法プログラムABINIT-MPにおける2電子積分ルーチンの高速化ならびに並列化と性能評価
- 計算機アーキテクチャのトップカンファレンスを攻略しよう!
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- クラウド環境によるOpenNSIMインターコネクトシミュレーションサービス
- シンボル情報に基づくアプリケーション分析を目的としたシミュレータAiceの開発(ARC-11 : シミュレータおよびコンテスト報告,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- NSIM:将来の大規模相互結合網を対象とした通信シミュレータの開発
- 高信頼設計SPARC64Vマイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64 V マイクロプロセサ(システムLSIの応用とその要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 高信頼設計SPARC64Vマイクロプロセサ
- 動的再構成可能プロセッサVulcanの評価(FPGAとその応用及び一般)
- 動的再構成可能プロセッサVulcanの評価(FPGAとその応用及び一般)
- 動的再構成可能プロセッサVulcanの評価(FPGAとその応用及び一般)
- FMO-MO 法による大規模分子軌道計算(計算科学の基盤技術とその発展)
- FMO-MO法における大規模分子軌道計算 : 解くべき固有値問題の特徴(行列・固有値問題における線形計算アルゴリズムとその応用)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- アーキテクチャと集積回路はいかに協創すべきか(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスにおける実行前処理削減方式の検討
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 大規模再構成可能データパスプロセッサの設計手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- パケットペーシングを用いた最適全対全通信アルゴリズムのシミュレーション評価
- PSI-NSIM : 大規模並列システムの性能解析に向けた並列相互結合網シミュレータ(コンピュータシステム技術,先端的コンピュータシステム技術及び一般)
- 次世代スーパーコンピュータの設計開発に向けたシステム性能評価環境PSI-SIM(HPC-16 : 性能評価)
- 大規模並列システムの性能評価を目的としたプログラムコード抽象化技法(HPC-3 : スケジューリング)
- Eric(二電子積分計算専用プロセッサ)LSIの開発
- 二電子積分計算専用プロセッサ・アーキテクチャの開発(高性能アーキテクチャ)
- 二電子積分計算専用プロセッサ・アーキテクチャ
- 二電子積分計算専用プロセッサ・アーキテクチャ
- Cellプロセッサへの分子軌道法プログラムの実装と評価(HPC-6 : 並列アプリケーション)
- 大規模分子軌道計算における解くべき固有値問題の特徴
- 高信頼マイクロプロセッサ・アーキテクチャ(「信頼性・保全性・安全性の事例:電気・電子装置(計算機装置)編」〜信頼性ハンドブック出版から10年を経て〜)
- メッセージ通信ライブラリを用いたプログラムの並列化例と計算速度および計算精度の評価
- 超並列計算機に向き結合網:RDT
- リモート・ロジックアナライザの実装と評価(FPGAとその応用及び一般)
- リモート・ロジックアナライザの実装と評価(FPGAとその応用及び一般)
- リモート・ロジックアナライザの実装と評価(FPGAとその応用及び一般)
- リモート・ロジックアナライザの実装と評価(FPGAとその応用及び一般)
- リモート・ロジックアナライザの実装と評価
- リモート・ロジックアナライザの実装と評価
- リモート・ロジックアナライザの実装と評価
- リモート・ロジックアナライザの実装と評価
- 縮約ガウス関数にもとづく分子積分の計算法
- 9033 大規模固有値問題のグリッド環境向き並列解法(GS-D 一般セッション(行列計算))
- 分子軌道計算専用計算機用LSI(ERIC)の開発
- 分子軌道計算専用計算機のためのフォック行列並列計算アルゴリズムの開発
- コンピュータアーキテクチャと集積回路技術の協調の必要性について(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- コンピュータアーキテクチャと集積回路技術の協調の必要性について(集積回路技術とアーキテクチャ技術の協調・融合へ向けた,プロセッサ,並列処理,システムLSIアーキテクチャ及び一般)
- キャッシュ・ミス頻発命令を考慮したメモリ・システムの高性能化(キャッシュメモリ)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- 日本のアーキテクチャ研究に対する期待 : 産業界の視点から
- システムレベル設計に向けたFPGA応用教材の開発(FPGAとその応用及び一般)
- システムレベル設計に向けたFPGA応用教材の開発(FPGAとその応用及び一般)
- 2電子積分計算ルーチンの性能評価
- リコンフィギャラブルクラスタコンピューティングに向けたFPGAボードの開発(高速化技法, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- HPC向け大規模クラスタシステムにおける省電力機能の実装
- HPC向け大規模クラスタシステムにおける省電力機能の実装
- ロードアドレス予測による命令並列度の向上
- ロード・アドレス予測方法の検討
- 単一磁束量子回路による再構成可能な大規模データパスをもつプロセッサ(ディジタル・一般)
- 分子軌道計算向け専用プロセッサ(ERIC)の開発(回路技術(一般, 超高速・低電力・高機能を目指した新アーキテクチャ))
- SpecC言語を用いた二電子積分計算専用プロセッサ(Eric)の検証(システムオンシリコン設計技術並びにこれを活用したVLSI)
- SpecC言語を用いた二電子積分計算専用プロセッサ(Eric)の検証(システムオンシリコン設計技術並びにこれを活用したVLSI)
- EXPRESS-1:プロセッサ混載FPGAを用いた動的セルフリコンフィギャラブルシステム(システムアーキテクチャ,リコンフィギャラブルシステム論文)
- 動的リコンフィギャラブルシステムにおける再構成管理機構の開発(ハードウェアマネジメント, デザインガイア-VLSI設計の新しい大地を考える研究会-)
- 機能分割実装による実行時再構成型MPEG-2デコーダの実現可能性(リコンフィギャラブル応用I)
- プロセッサ混載FPGAにおける部分再構成制御機構の開発(デバイスアーキテクチャI)
- リモート・ロジックアナライザIPのFPGA実装と評価(システムII)(リコンフィギャラブルシステムにおける設計技術及び一般)(デザインガイア2004-VLSI設計の新しい大地を考える研究会-)
- FPGA遠隔再構成とリモート・ロジックアナライザ(FPGAとその応用及び一般)
- FPGA遠隔再構成とリモート・ロジックアナライザ(FPGAとその応用及び一般)
- パケットペーシングを用いた集団通信アルゴリズムのシミュレーション評価
- 超並列向き結合網Recursive Diagonal Torusの諸特性
- 相互結合網シミュレータINSIGHTの並列化について
- 超並列計算機のための相互結合網シミュレータ
- KITE : 書変え可能なLSIを用いた教育用マイクロプロセッサ
- FPGA遠隔再構成とリモート・ロジックアナライザ(FPGAとその応用及び一般)
- SA-1-5 ソフトコアプロセッサを用いたFPGAマルチプロセッサの実行可能性について
- KITEマイクロプロセッサによる計算機工学教育支援システム
- 並列FMOプログラムOpenFMOの性能最適化
- 動的リコンフィギャラブルシステムの部分再構成技術に関する研究
- FX10におけるパケットペーシングを用いたアプリケーションの通信性能評価
- CT-1-6 ポストエクサスケールスーパーコンピュータの実現の観点から見た超伝導デジタル技術への期待(CT-1.超伝導デジタル技術の展望,チュートリアルセッション,ソサイエティ)