ヘテロ並列環境のための省電力タスクスケジューリング(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
スポンサーリンク
概要
- 論文の詳細を見る
ClearSpeed等のアクセラレータや本来画像処理のためのデバイスであるGPUは,汎用CPUにくらべて用途は数値演算などに特化される一方,より高い価格性能比・電力性能比を実現する.そこで近年,スパコンやクラスタにそのようなアクセラレータを搭載する手法が関心を集めている.このようなシステムにおいてシステム全体の電力性能および速度性能の最適化を行うためには,以下が必要と考えられる.各タスクが汎用CPUとアクセラレータの双方で自由に実行できることと,エネルギー効率を考慮したタスクスケジューリング手法である.我々は前者が実現されているという仮定のもとでヘテロ型クラスタシステムのモデル化を行った.その上でタスクの性質を考慮するスケジューリング手法の提案を行い,シミュレーションによる評価を行った.
- 2008-07-29
著者
-
遠藤 敏夫
東京工業大学グローバルCOE
-
松岡 聡
国立情報学研究所
-
松岡 聡
東京工業大学
-
浜野 智明
東京工業大学
-
遠藤 敏夫
東京工業大学 学術国際情報センター
-
浜野 智明
東京工業大学|独立行政法人科学技術振興機構
-
遠藤 敏夫
東京工業大学
関連論文
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータのLinpack評価(GPGPUコンピューティングの数理)
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング(並列アプリケーション実装,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- GPU向けソフトウェアECCの性能評価 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ヘテロ並列環境のための省電力タスクスケジューリング(並列計算,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- ソフトウェアECCによるGPUメモリの耐故障性の実現と評価(信頼性とセキュリティ,SWoPP佐賀2008-2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ)
- 複数GPUにおけるセルフスケジューリングによる並列数値演算(ARC-5:並列処理1,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 大規模計算環境におけるユーザ満足度を考慮した資源管理へむけて(並列処理環境,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- PoP(Point of Presence)によるe-サイエンスリソース連携 (インターネットアーキテクチャ)
- スワップコストの動的推定によるメモリの省電力化手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ポータビリティの高いジョブスケジューリングシステム設計と実装(HPC-10 : ネットワークとスケジューリング)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- 2 東京工業大学TSUBAMEにおけるアクセラレータ活用事例(アクセラレータ,再び-スパコン化の切り札-)
- 仮想クラスタを用いたData-Intensive Application実行環境の性能モデル構築と最適化(HPC-2:仮想クラスタ,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- Access Gridの構築とGrid上での国際会議
- ヘテロ型スーパコンピュータTSUBAMEのLinpackによる性能評価(高性能計算)
- 情報爆発時代に向けた新しいIT基盤技術の研究(情報爆発時代に向けた新しいIT基盤技術の研究)
- アクセラレータを用いたヘテロ型スーパーコンピュータ上の並列計算(通信プロトコルとインターフェース及びアクセラレータ,SANを用いた高性能コンピュータシステム,及び一般)
- ヘテロ型スーパーコンピュータTSUBAMEのLinpackによる性能評価(HPC-3 : 大規模運用システム(1))
- 次世代光インターコネクトでのMPI通信に関する研究
- プロセス間共通メモリイメージを考慮したマイグレーション最適化(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 1 アクセラレータ技術の影と光 : ペタ〜エクサの次世代HPCの中心的な躍進技術へ(アクセラレータ,再び-スパコン化の切り札-)
- プロセス間共通メモリイメージを考慮したマイグレーション最適化 (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 四種プロセッサからなるヘテロ型スーパーコンピュータにおけるLinpackチューニング (計算機アーキテクチャ・ハイパフォーマンスコンピューティング・「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 3.情報爆発は情報システムをも「爆発」させる(パートI:情報爆発時代における新しい基盤技術,情報爆発時代におけるわくわくするITの創出を目指して)
- NAREGIグリッドミドルウェアによる大規模連携接続実証実験(OS-6:分散システム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 広域分散ファイルシステムにおけるアクセスパターンと性能を考慮したファイル配置(HPC-13:ファイルシステム,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 5K-4 情報爆発時代のグリッドファイルシステム上での大規模データ管理(情報爆発時代における分散システム技術,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 広域分散環境における大規模データ管理のためのノードグルーピング(HPC-7 : データ管理)
- NAREGIミドルウェアβ-gLite間における相互ジョブ起動実験(グリッド,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム(グリッド(1), 「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2005))
- ファイルへのアクセスの自動分散を行うグリッド用分散ファイルシステム
- レプリカ交換分子動力学シミュレータREMD Toolkitのグリッド上での実行(HPC-3 : 科学技術計算)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- MPC++-on-MPIのコモディティクラスタ環境における評価
- ORE Grid : 仮想計算機を用いたグリッド実行環境の高速な配置ツール(グリッド)
- カスタマイズ可能な仮想計算機上におけるグリッドでのジョブ実行(仮想計算機とクラスタ技術, SWOPP武雄2005 (2005年並列/分散/協調処理に関する「武雄」サマー・ワークショップ))
- Jojoによる遺伝的プログラミングの並列化(グリッド応用)
- Javaによる階層型グリッド環境Jojoの設計と実装(グリッド基盤ソフト)
- グリッド向け実行環境Jojoを用いた遺伝的アルゴリズムによる蛋白質構造決定
- グリッド環境に適したJava用階層型実行環境Jojoの設計と実装(高性能計算及び一般)
- DisC : ごみ集め機構を備えたC++の分散記憶並列拡張言語
- Omni/SCASHにおける性能不均質なクラスタ向け動的負荷分散機能の実装と評価(HPC-3 : クラスタソフトウェア)(2004年並列/分散/協調処理に関する『青森』サマー・ワークショップ(SWoPP青森2004) : 研究会・連続同時開催)
- Omni/SCASHにおける実行時性能評価に基づく動的負荷分散拡張の実装と評価
- グリッドチャレンジテストベッドの構築と運用 : グリチャレテストベッドの作り方(HPC-3 : 大規模運用システム(1))
- 6K-3 情報爆発に対応する耐故障性MPIフレームワークの提案(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 光ネットワークの補助的利用によるHPC性能向上(HPC-4:性能評価,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- グリッド環境におけるMPI_Scatter/Gather通信アルゴリズムの最適化(HPC-1:MPI,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- 6K-5 情報爆発時代の光インターコネクト上でのMPI通信アルゴリズム(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-4 情報爆発時代のグリッド環境に対応したMPI集団通信アルゴリズムの最適化(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 6K-2 情報爆発時代へ向けた不均一アーキテクチャにおけるスーパーコンピューティング(情報爆発時代におけるスーパーコンピューティング,一般セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 次世代省電力メモリを用いた並列プログラムの省電力化の評価(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 次世代光インターコネクト上でのMPIアプリケーションの評価(HPC-11 : 通信I)
- CPUおよびGPUを併用するFFTライブラリの提案と評価(HPC-1 : 最適化)
- グリッド環境におけるマルチレーンを用いたMPIコレクティブ通信アルゴリズム(グリッド)
- SANを用いた高性能コンピュータシステムの将来像と究極の姿(パネル討論,計算システムとファイルシステム,SANを用いた高性能コンピュータシステム,及び一般)
- 異種アクセラレータを持つTSUBAMEスーパーコンピュータの Linpack 評価
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- OpenCLを用いた異種GPUにおける性能特性に応じた最適化
- GPUにおける耐故障性を考慮した数値計算の電力性能
- CUDA環境における高性能3次元FFT
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- ヘテロ型スーパーコンピュータTSUBAME 2.0のLinpackによる性能評価
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- ステンシル計算を対象とした大規模GPUクラスタ向け自動並列化フレームワーク
- GPUにおけるモデルに基づいた電力効率の最適化
- GPUクラスタにおける科学技術計算の自動最適化
- GPUクラスタにおける省電力タスクスケジューリング
- 増分データとErasure Codingを利用した高速なチェックポイント手法
- 異種アクセラレータを持つヘテロ型スーパーコンピュータ上のLinpackの性能向上手法
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUクラスタを対象にした並列ステンシル計算の自動生成フレームワーク
- GPUにおける性能と消費電力の相関性の解析
- 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ
- 高いヒープ使用率の下で高速なインクリメンタルGC
- フォールト/リカバリモデルを考慮した耐故障性をもつMPIフレームワークABARISの提案と評価(通信,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- 低負荷で多数の計算機をリアルタイムに監視するシステムVGXPの実装(大規模システム,SWoPP2006)
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 〜32GPUで700GFLOPS超を達成〜
- 増分データと Erasure Coding を利用した高速なチェックポイント手法
- 光サーキットネットワークの補助的利用によるHPCアプリケーション性能向上
- 研究の世界に飛び込んで(平成18年度論文賞の受賞論文紹介)
- プロセス間共通メモリイメージを考慮したマイグレーション最適化(並列/分散コンピューティング,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 姫野ベンチマークのGPUマルチノード実行における通信と演算のオーバーラップによる高速化 : 32GPUで700GFLOPS超を達成
- 共有メモリ並列計算機上の並列ガーベージコレクタの性能予測
- スワップコストの動的推定によるメモリの省電力化手法(アクセラレーション/メモリシステム,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- 高い耐遅延性を持つガウス消去法(HPC-7: 並列数値計算ライブラリ)
- Portableでrobustなglobal garbage collectorの構築について
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- TSUBAME 2.0の全貌
- TSUBAME 2.0の全貌
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- グリーンスパコンTSUBAME2.0における電力危機対応運用
- スーパコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成 (コンピューティングシステム Vol.4 No.4)
- GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法
- GPUメモリ容量を超える問題規模に対応する高性能ステンシル計算法
- TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価
- TSUBAME2.0におけるMulti-rail InfiniBandネットワークの性能評価