マルチコアおよびGPGPU環境における画像処理最適化
スポンサーリンク
概要
- 論文の詳細を見る
スケーラを題材として,マルチコアおよび GPGPU 各々の HW 特性に適した画像処理の最適化を図る.マルチコア環境では,数値演算処理の削減,SIMD 化など直列性能の最適化を行った後,OpenMP を利用して並列化を図る.GPGPU(CUDA) では,スレッド並列を優先して並列処理の設計を行いブロックサイズを決める.また,CUDA 特有のメモリ階層に適したメモリアクセスの最適化を図る.
- 2009-07-28
著者
-
高山 征大
株式会社東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
矢野 勝久
(株)東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
境 隆二
(株)東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
高山 征大
(株)東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
出宮 健彦
(株)東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
境 隆二
株式会社東芝ディジタルメディアネットワーク社コアテクノロジーセンター
-
出宮 健彦
(株)東芝デジタルメディアネットワーク社コアテクノロジーセンター
-
境 隆二
(株)東芝 デジタルプロダクツ&サービス社
関連論文
- AV Applications for TV sets empowered by Cell Broadband Engine^(コンシューマ機器および一般)
- 並列プログラミングモデルMolatomium
- マルチコアおよびGPGPU環境における画像処理最適化
- CELL REGZA^におけるマルチコアソフト開発の実際(システムLSIアーキテクチャと組込みシステム-プロセッサ,メモリ,システムLSI,画像処理及び関連するソフトウェア)
- 条件実行制御を用いたVLIWにおける大域命令スケジュール
- VLIW計算機での手続き呼出最適化
- 線形モデルによるアプリケーション性能予測の一手法
- VLIW計算機における条件実行制御と最適化コンパイラの実アプリケーションによる評価
- A-029 SPEサーバを用いたプログラミング環境の構築(モデル・アルゴリズム・プログラミング,一般論文)
- 1A-1 Cellプロセッサにおけるソフトウェアトランザクショナルメモリの実装と評価(並列処理と動的再構成技術,一般セッション,アーキテクチャ)
- マルチコア向け並列プログラミングモデルの設計と実装
- VLIWコンパイラにおけるスピルコード最適化
- VLIWアーキテクチャにおける浮動小数点演算の性能評価
- VLIW計算機における条件実行アーキテクチャの評価とコンパイラの役割
- 命令スケジューリングアルゴリズム
- 式評価順序の最適化による微視的並列度向上
- ループ展開・ソフトウエアパイプライニングの新手法