10.GPUコンピューティングにおけるソフトウェア自動チューニング(ソフトウェア自動チューニング技術の応用,<特集>科学技術計算におけるソフトウェア自動チューニング)
スポンサーリンク
概要
著者
関連論文
-
10.GPUコンピューティングにおけるソフトウェア自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
-
GPUを効率的に利用するための言語拡張と自動最適化手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
-
GPUコンピューティングのためのストリーム処理記述言語
-
ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
-
大規模計算環境における分散協調型負荷分散手法(分散システム構築運用技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
-
RC-006 ウェイアロケーション型共有キャッシュ機構のハードウェア設計に関する研究(ハードウェア・アーキテクチャ,査読付き論文)
-
I-004 フォトンマップ分割に基づく並列画像生成アルゴリズム(I分野:グラフィクス・画像)
-
LC-010 SMTプロセッサの実行時性能予測のためのハードウェアリソース競合解析(ハードウェア・アーキテクチャ)
-
LC-006 消費電力を考慮したウェイアロケーション型共有キャッシュ機構(ハードウェア・アーキテクチャ)
-
ウェイアロケーション型共有キャッシュ機構の性能評価(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
-
実行時性能予測に基づくCPUとGPUへの動的タスク割当の検討(ハードウェア・アクセラレータ)
-
LL_007 P2P型資源検索システムにおける動的論理リンク管理機構(L分野:ネットワークコンピューティング)
-
LC_006 スレッド特微量に基づくマルチコアプロセッサスケジューリング(C分野:ハードウェア)
-
LA-006 大規模P2Pシステムにおける計算資源探索のモデル化と性能評価(A分野:モデル・アルゴリズム・プログラミング)
-
HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
-
ベクトル量子化用コードブック生成のための並列弱肉強食アルゴリズムの性能解析
-
LJ-11 視覚的画質劣化を抑制するベクトル量子化手法(J. グラフィクス・画像)
-
ベクトル量子化のためのコードブック生成並列処理に関する研究
-
ベクトル量子化のための並列コードブック生成アルゴリズムの性能評価(2.第1回情報シナジー研究会)
-
多層パーセプトロンの分類能力向上法に関する一検討
-
ニューラルネットワークを利用した自動表情認識システム
-
OpenCLによるGPUコンピューティングの性能評価
-
CUDAアプリケーション向けチェックポイント・リスタート機能の実装と評価
-
実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
-
実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
-
CUDAアプリケーシヨン向けチェックポイント・リスタート機能の実装と評価
-
キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
-
キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
-
OpenCL によるGPUコンピューティングの性能評価
-
ワーキングセット評価に基づくスレッドスケジューリング
-
F0103(4) Cellによる高性能計算の可能性を探る([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
-
C-023 プロセッサ自動選択機能を有するBLASの実現に向けた性能評価(ハードウェア・アーキテクチャ,一般論文)
-
RC-008 ボランティアコンピューティングの高効率化ためのクライアントレベルスケジューリング(ハードウェア・アーキテクチャ,査読付き論文)
-
SPRAT:実行時自動チューニング機能を備えるストリーム処理記述用言語
-
動的負荷分散機能を持つ高性能ボランティアコンピューティングの実現
-
プログラム自動生成技術に基づくGPUコンピューティングの性能評価
-
624 消費エネルギを考慮したGPUコンピューティングの検討(OS3.GPGPUコンピューティング(3),オーガナイズドセッション)
-
メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構(ネットワーク応用,インターネット技術とその応用論文)
-
統合開発環境と連携するポータブルなビルドシステム
-
ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価
-
メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構
-
チューニング対象の限定による効率の良い性能可搬性向上手法
-
ブロックバイパス機構によるキャッシュのエネルギ効率化に関する研究
-
マルチプラットフォームにおける最適化手法の効果に関する一検討
-
ソフトウェア進化のための自動性能追跡システム
-
10.6 複合システムにおけるチェックポイントリスタート(第10章:将来の課題,ディペンダブルVLSIシステム)
もっと見る
閉じる
スポンサーリンク