Tightly Coupled Acceleratorsアーキテクチャ向け通信機構の予備評価
スポンサーリンク
概要
- 論文の詳細を見る
筑波大学計算科学研究センターでは,大規模 GPU クラスタである HA-PACS を導入し, 2012 年 2 月から運用を開始している.素粒子・宇宙物理・生命科学等の,極めて大量な演算を要求する大規模並列アプリケーションにおいて,数百〜千台規模の GPU を定常的に利用した大規模並列実行により,サイエンスの新しい分野を切り拓くことを目指している. HA-PACS は,既に稼働中のコモディティ技術による大規模 GPU クラスタ部分に加え,次世代のアクセラレータ間結合の要素技術として TCA (Tightly Coupled Accelerators) アーキテクチャに基づく実験クラスタからなる.本稿では, TCA を実現する通信機構 PEACH2 とその予備評価について述べる.
- 2012-12-06
著者
-
塙 敏博
筑波大学計算科学研究センター
-
佐藤 三久
筑波大学計算科学研究センター
-
塙 敏博
筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
-
佐藤 三久
筑波大学システム情報工学研究科
-
Hanawa T
筑波大学大学院システム情報工学研究科|筑波大学計算科学研究センター
関連論文
- クラスタをメモリ資源として利用するためのMPIに基づいた高速大容量仮想メモリ(コンピュータシステム技術,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- 演算加速機構を持つオンチップメモリプロセッサの電力性能評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 大規模SMPクラスタにおけるOpenMP/MPIハイブリッドNPB,RSDFTの評価(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 高性能・耐故障マルチリンクEthernet結合システムのNFSへの適用と評価(クラスタとグリッド技術)
- ユーザ透過に利用可能な耐故障・高性能マルチリンクEthernet結合システム(クラスタと省電力技術)
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ:PEACH (集積回路)
- マルチパスネットワークを持つPCクラスタにおける動的経路制御システム(クラスタシステム)
- ディペンダブルな組込みシステムに適した省電力高性能通信機構(通信とグリッドII)
- tagged-VLANを用いたPCクラスタ向けマルチパスネットワークにおける動的ルーティング(HPC-13 : 通信II)
- OpenMPを用いた並列ベンチマークプログラムによる組込み向けマルチコアプロセッサの評価(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (ディペンダブルコンピューティング)
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価 (コンピュータシステム)
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 大規模SMPクラスタにおけるOpenMP/MPIハイブリッドNPB,RSDFTの評価(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- オンチップメモリプロセッサでの演算加速機構の検討(プロセッサ・アーキテクチャ(2),「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- マルチレール相互結合網における通信プロファイリングに基づく性能最適化
- Flexible Fine Grain Thread Management By StackThreads/MP Library for OpenMP Task
- トラフィック量に適応する非対称マルチリンクEthernetトランキング
- 分散メモリ向け並列言語XcalableMPコンパイラの実装と性能評価
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- PCI Expressによる省電力・高信頼・高性能通信リンクのためのコミュニケータチップ: PEACH
- 匿名相互証明書とP2P通信を用いる認証方式(OS-1: セキュリティ, 2005年並列/分散/協調処理に関する『武雄』サマー・ワークショップ(SWoPP武雄2005)-研究会・連続同時開催-)
- XcalableMPによるNAS Parallel Benchmarksの実装と評価
- 計算素粒子物理学分野の国際データグリッドILDGと国内グリッドJLDG(グリッドI)
- 仮想マシンとSpecCデバイスモデルを統合したデバイス故障エミュレータの実現
- 大規模並列システムにおける電力最適化実行時の消費エネルギー予測手法
- 大規模SMPクラスタにおけるOpenMP/MPIハイブリッドNPB,RSDFTの評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 片方向通信の実装方式の違いによる比較
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- 組込み機器向けon-chip/off-chipコア間通信機構の実装と評価
- クラスタをメモリ資源として利用するためのMPIによる高速大容量メモリ
- マルチグリッド環境における効率的な監視システムに関する研究
- 超並列クラスタにおける3D-RISMへのVolumetric並列三次元FFTの適用と性能評価
- 分散メモリ向け並列言語XcalableMPにおけるユーザ定義データ分散機能の検討
- プログラムテスト環境を提供するクラウドコンピューティングシステムの検討
- 非対称な形状に適応する高バンド幅multi-link Ethernet
- 組込み機器向けon-chip/off-chipコア間通信機構
- 仮想マシンと SpecC デバイスモデルを統合したデバイス故障エミュレータの実現
- 高性能・耐故障マルチリンクEthernet結合システムの性能評価
- ユーザ透過に利用可能な高性能・耐故障マルチリンクEthernet結合システム
- XMLデータを対象としたファセット検索インタフェースの生成(セッション1,XML応用技術特集および一般)
- PCI Express による省電力・高信頼・高性能通信リンクのためのコミュニケータチップ : PEACH
- メモリバンド幅に着目したマルチコアノード上のアプリケーション最適化
- 非対称な形状に適応する高バンド幅 multi-link Ethernet
- PGAS言語XcalableMPのmulti-node GPU向け拡張仕様の実装と評価
- 演算加速装置に基づく超並列クラスタHA-PACSによる大規模計算科学
- 並列プログラミング言語XcalableMPにおけるデータおよびループのユーザ定義分散のための拡張仕様
- 並列プログラミング言語XcalableMPによるMPI並列ライブラリインターフェースの検討
- スクリプト言語Xcryptによる格子QCDシミュレーションの最適化
- 並列言語XcalableMPのGPU向け拡張
- PGAS言語XcalableMPとUnified Parallel Cの性能比較
- PCI Expressを用いた通信リンクPEARLにおけるネットワーク管理機構
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- MCAPIを用いた組込み向け耐故障分散共有メモリの実装
- 気象モデルの高解像度計算のGPU化
- 並列PGASプログラミング言語XcalableMPの入出力機能とLustreファイルシステムでの性能評価
- 並列PGASプログラミング言語XcalableMPの入出力機能とLustreファイルシステムでの性能評価
- 並列PGASプログラミング言語XcalableMPの入出力機能とLustreファイルシステムでの性能評価
- 並列PGASプログラミング言語XcalableMPの入出力機能とLustreファイルシステムでの性能評価
- 並列言語XcalableMPのアクセラレータ向け言語拡張のOpenCL実装
- JNIを用いたHadoopによる分子進化系統樹解析用プログラムTree-Puzzle並列化(数値解析,ネットワーク,クラウド及び一般)
- PCI ExpressネットワークPEARLにおける耐故障機構
- Tightly Coupled Acceleratorsアーキテクチャのための通信機構
- OmniコンパイラによるOpenACCの試作
- パーシャルメッセージロギングを改善する耐故障性実現フレームワーク
- パーシャルメッセージロギングを改善する耐故障性実現フレームワーク
- Tightly Coupled Acceleratorsアーキテクチャ向け通信機構の予備評価
- Tightly Coupled Acceleratorsアーキテクチャ向け通信機構の予備評価
- フラグメント分子軌道法に現れるFock行列計算のGPGPU化
- Tightly Coupled Acceleratorsアーキテクチャに基づくGPUクラスタの構築と性能予備評価
- PEACH2におけるパイプライン実行の検討(FPGA応用,リコンフィギャラブルシステム,一般)
- TCAノードにおけるランタイムバイナリアクセラレーションの検討(FPGA応用(2),リコンフィギャラブルシステム,一般)