チューニング対象の限定による効率の良い性能可搬性向上手法
スポンサーリンク
概要
- 論文の詳細を見る
計算システムの多様化に伴い,既存の科学技術計算プログラムを新たな計算システムへ移植し性能を最適化する作業がしばしば求められている.しかしながら大規模な科学技術計算プログラムの移植および性能最適化には多大な労力が必要となり,問題となっている.本研究では,性能可搬性向上を目的とした場合に優先的に性能最適化を行うべきソースコードの箇所を限定し,効率良くアプリケーション全体の性能可搬性を向上させる手法を提案する.ベンチマークプログラムおよび実アプリケーションによる評価の結果,提案手法はアプリケーション全体の性能可搬性を効率よく向上させるために,最適化すべきソースコードの部位を限定できることが示された.
- 2013-05-22
著者
関連論文
- 10.GPUコンピューティングにおけるソフトウェア自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- OMPCUDA : GPU向けOpenMPの実装(高性能計算)
- GPUを効率的に利用するための言語拡張と自動最適化手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- POSIXスレッドを用いたCellプロセッサ向けAPIの提案(マルチプロセッサ)
- ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
- コードの性能可搬性を提供するSIMD向け共通記述方式(コンパイラ)
- F-Omega : サーバ稼動状況に適応するGridRPCアプリケーションの開発・実行フレームワーク(シミュレーション・エミュレーション,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- ネットワークサービス提供に向けた汎用システムにおけるソフトウェア修正方式(交換)
- 大規模計算環境における分散協調型負荷分散手法(分散システム構築運用技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- iPat/OMPでのソースコードレベル最適化における試行錯誤支援ツール(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- RC-006 ウェイアロケーション型共有キャッシュ機構のハードウェア設計に関する研究(ハードウェア・アーキテクチャ,査読付き論文)
- I-004 フォトンマップ分割に基づく並列画像生成アルゴリズム(I分野:グラフィクス・画像)
- LC-010 SMTプロセッサの実行時性能予測のためのハードウェアリソース競合解析(ハードウェア・アーキテクチャ)
- LC-006 消費電力を考慮したウェイアロケーション型共有キャッシュ機構(ハードウェア・アーキテクチャ)
- 実行時性能予測に基づくCPUとGPUへの動的タスク割当の検討(ハードウェア・アクセラレータ)
- LL_007 P2P型資源検索システムにおける動的論理リンク管理機構(L分野:ネットワークコンピューティング)
- LC_006 スレッド特微量に基づくマルチコアプロセッサスケジューリング(C分野:ハードウェア)
- LA-006 大規模P2Pシステムにおける計算資源探索のモデル化と性能評価(A分野:モデル・アルゴリズム・プログラミング)
- HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
- 多層パーセプトロンの分類能力向上法に関する一検討
- ニューラルネットワークを利用した自動表情認識システム
- メッセージ通信型GPGPUプログラミング(プログラミング環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- 非均一分散環境における並列性の仮想化(Inventive and Creative Architecture特別セッションII)
- 既存の並列化手法を用いたGPGPUプログラミングの提案(Inventive and Creative Architecture特別セッションI)
- F-Omega : サーバ稼動状況に適応するGridRPCアプリケーションの開発・実行フレームワーク(シミュレーション・エミュレーション,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- GPUコンピューティング向け中間言語の研究
- キャリアグレードOSのためのディスクWrite処理方式
- OpenCLによるGPUコンピューティングの性能評価
- GPU向けソフトウェアキャッシュ機構の実装と評価
- GPU向けソフトウェアキャッシュ機構の実装と評価
- CUDAアプリケーション向けチェックポイント・リスタート機能の実装と評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- GridRPCにおける計算ノードの動的な追加・切替を可能とする枠組
- F-Omega:グリッドアプリケーションの自動サーバ切替えの枠組み
- メッセージ通信型GPGPUプログラミング(プログラミング環境,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2008))
- iPat/OMPでのソースコードレベル最適化における試行錯誤支援ツール(コンパイラ及びツール,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2007))
- CUDAアプリケーシヨン向けチェックポイント・リスタート機能の実装と評価
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- OpenCL によるGPUコンピューティングの性能評価
- ワーキングセット評価に基づくスレッドスケジューリング
- F0103(4) Cellによる高性能計算の可能性を探る([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
- GridRPC における計算ノードの動的な追加・切替を可能とする枠組
- GPU向けソフトウェアキャッシュ機構の実装と評価
- GPU向けソフトウェアキャッシュ機構の実装と評価
- C-023 プロセッサ自動選択機能を有するBLASの実現に向けた性能評価(ハードウェア・アーキテクチャ,一般論文)
- RC-008 ボランティアコンピューティングの高効率化ためのクライアントレベルスケジューリング(ハードウェア・アーキテクチャ,査読付き論文)
- SPRAT:実行時自動チューニング機能を備えるストリーム処理記述用言語
- 動的負荷分散機能を持つ高性能ボランティアコンピューティングの実現
- プログラム自動生成技術に基づくGPUコンピューティングの性能評価
- 機械学習により抽出されたアプリケーションの特徴を利用したタスク配置の検討
- ヘテロジニアス計算機クラスタにおける省エネルギー化タスクスケジューリング手法
- HxABCLibScript:非均質計算機向け自動チューニング記述言語拡張
- 走行時パワーゲーティングにおけるスラック解析を用いた動的命令スケジューリングの検討
- マルチコア・プロセッサ向けのヘルパースレッドによるキャッシュ制御支援手法の検討
- 複数GPU向けのCUDAコードを生成するOpenMP処理系の提案
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構(ネットワーク応用,インターネット技術とその応用論文)
- 統合開発環境と連携するポータブルなビルドシステム
- ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価
- チューニング対象の限定による効率の良い性能可搬性向上手法
- ブロックバイパス機構によるキャッシュのエネルギ効率化に関する研究
- マルチプラットフォームにおける最適化手法の効果に関する一検討
- ソフトウェア進化のための自動性能追跡システム
- 10.6 複合システムにおけるチェックポイントリスタート(第10章:将来の課題,ディペンダブルVLSIシステム)