HPCアプリケーションの性能可搬性に関する一検討
スポンサーリンク
概要
- 論文の詳細を見る
近年 HPC システムの多様化が進む中で,様々な HPC システムにおいても性能を引き出すことが可能な性能可搬性の高い HPC アプリケーションの開発が重要になりつつある.しかしながら,一般的に, HPC アプリケーションは 1 つの HPC システムに高度に最適化されているため,他の HPC システムでも高い性能を引き出すのは難しい.本報告では, HPC アプリケーションの性能可搬性を調査するために,特定の HPC システム向けに適用された最適化手法を様々な HPC システムを用いて評価し,その効果と性能可搬性について議論する.
- 2012-09-26
著者
-
小林 広明
東北大学
-
小林 広明
東北大学サイバーサイエンスセンター
-
撫佐 昭裕
日本電気株式会社
-
江川 隆輔
東北大学サイバーサイエンスセンター|JST CREST
-
小松 一彦
東北大学サイバーサイエンスセンター
-
小林 広明
東北大学サイバーサイエンスセンター|科学技術振興機構戦略的創造研究推進事業
-
江川 隆輔
東北大学サイバーサイエンスセンター:jst Crest
-
松岡 浩司
日本電気株式会社
-
安田 一平
東北大学大学院情報科学研究科
-
江川 隆輔
東北大学サイバーサイエンスセンター
関連論文
- 広域ベクトルコンピュータ連携による次世代HPC基盤の構築(3.2 第8回情報シナジー研究会, 3. 研究活動報告)
- GPU向け線形代数ライブラリの性能評価
- GPUを効率的に利用するための言語拡張と自動最適化手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- GPUコンピューティングのためのストリーム処理記述言語
- 大規模計算環境における分散協調型負荷分散手法(分散システム構築運用技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- RC-006 ウェイアロケーション型共有キャッシュ機構のハードウェア設計に関する研究(ハードウェア・アーキテクチャ,査読付き論文)
- I-004 フォトンマップ分割に基づく並列画像生成アルゴリズム(I分野:グラフィクス・画像)
- LC-010 SMTプロセッサの実行時性能予測のためのハードウェアリソース競合解析(ハードウェア・アーキテクチャ)
- LC-006 消費電力を考慮したウェイアロケーション型共有キャッシュ機構(ハードウェア・アーキテクチャ)
- ウェイアロケーション型共有キャッシュ機構の性能評価(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 実行時性能予測に基づくCPUとGPUへの動的タスク割当の検討(ハードウェア・アクセラレータ)
- LL_007 P2P型資源検索システムにおける動的論理リンク管理機構(L分野:ネットワークコンピューティング)
- LC_006 スレッド特微量に基づくマルチコアプロセッサスケジューリング(C分野:ハードウェア)
- LA-006 大規模P2Pシステムにおける計算資源探索のモデル化と性能評価(A分野:モデル・アルゴリズム・プログラミング)
- HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
- A-19-4 音声による計算機利用支援のための文字情報識別に関する一考察
- D-11-73 レイトレーシングハードウェアのための交差判定器の計算精度に関する一考察
- 東北大学サイバーサイエンスセンターの取り組みとSX-9の性能評価 (スーパーコンピュータSX-9特集)
- ウェーブパイプラインのための遅延調整手法に関する研究(システムオンシリコン設計技術並びにこれを活用したVLSI)
- 大規模科学計算システムの構築と運用(2.第1回情報シナジー研究会)
- 超並列計算機のための同期処理機構とその評価
- OpenCLによるGPUコンピューティングの性能評価
- CUDAアプリケーション向けチェックポイント・リスタート機能の実装と評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- CUDAアプリケーシヨン向けチェックポイント・リスタート機能の実装と評価
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- OpenCL によるGPUコンピューティングの性能評価
- ワーキングセット評価に基づくスレッドスケジューリング
- ワーキングセット評価に基づくスレッドスケジューリング
- ウェーブパイプラインのための遅延調整手法に関する研究(システムオンシリコン設計技術並びにこれを活用したVLSI)
- C-023 プロセッサ自動選択機能を有するBLASの実現に向けた性能評価(ハードウェア・アーキテクチャ,一般論文)
- RC-008 ボランティアコンピューティングの高効率化ためのクライアントレベルスケジューリング(ハードウェア・アーキテクチャ,査読付き論文)
- SPRAT:実行時自動チューニング機能を備えるストリーム処理記述用言語
- ポジション・ディスプレイ・マップによる知識表現
- 動的負荷分散機能を持つ高性能ボランティアコンピューティングの実現
- プログラム自動生成技術に基づくGPUコンピューティングの性能評価
- 機械構造の階層性に基づいた機械設計向き知識ベースに関する検討
- 3次元積層型乗算器の回路分割手法に関する研究(学生・若手研究会)
- 624 消費エネルギを考慮したGPUコンピューティングの検討(OS3.GPGPUコンピューティング(3),オーガナイズドセッション)
- Prolog言語の階層処理システムとその評価
- マイグレーションによる複合型計算システム向けジョブスケジューリング (コンピューティングシステム Vol.4 No.4)
- OpenCLにおけるタスク並列化支援のための実行時依存関係解析手法 (コンピューティングシステム Vol.5 No.1)
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構(ネットワーク応用,インターネット技術とその応用論文)
- 統合開発環境と連携するポータブルなビルドシステム
- HPCアプリケーションの性能可搬性に関する一検討
- ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価
- 高性能分散計算環境のための認証基盤の設計
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-)
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究(高速デジタルLSI回路技術,デザインガイア2011-VLSI設計の新しい大地-)
- 大規模並列システムのノード間通信を考慮した性能モデルに関する一検討
- 履歴情報に基づくジョブスケジューリングによる広域ベクトルコンピュータ連携の実現
- 大規模並列システムのノード間通信を考慮した性能モデルに関する一検討
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究
- 3次元積層型浮動小数点乗算器の回路分割手法に関する研究
- ソフトウェア進化のための自動性能追跡システム
- 履歴情報に基づくジョブスケジューリングによる広域ベクトルコンピュータ連携の実現(ネットワーク研究開発テストベッド運用・利用,一般)
- 10.6 複合システムにおけるチェックポイントリスタート(第10章:将来の課題,ディペンダブルVLSIシステム)
- 6.4 三次元LSIの課題と高信頼化(第6章:コネクティビティ,ディペンダブルVLSIシステム)