OpenCLの性能可搬性改善に向けた基本APIの提案
スポンサーリンク
概要
- 論文の詳細を見る
アクセラレータ用標準並列言語として提案されている OpenCL は、各種並列言語や並列化フレームワークが乱立する現状を改善する可能性を持つ。しかしながら、GPU のメモリアーキテクチャを前提に仕様策定された OpenCL そのままでは、GPU とは異なったメモリアーキテクチャを持つアクセラレータの演算能力を引き出すのは困難である。この問題点に対し、本稿では OpenCL カーネルを直接ではなく、「自動データ転送」 を行うシステム関数を介して呼び出すことにより、OpenCL カーネル内から、アクセラレータ間で性能差が出やすいグローバル空間アクセス記述を排除するためのプログラミングフレームワーク、並びにそのための基本 API 群を提案する。
- 2011-07-20
著者
関連論文
- 画像認識用並列プロセッサ研究20年の夜明け(平成21年度喜安記念業績賞紹介)
- SIMD/MIND動的切替え型プロセッサIMAPCAR2の性能評価 (リコンフィギャラブルシステム)
- CDT-1-4 SIMD/MIMD動的切替え型プロセッサIMAPCAR2による動画像認識処理(CDT-1.「五感」情報処理 : アプリケーションの展望,チュートリアルセッション,ソサイエティ企画)
- CDT-1-4 SIMD/MIMD動的切替え型プロセッサIMAPCAR2による動画像認識処理(CDT-1.「五感」情報処理:アプリケーションの展望,チュートリアルセッション,ソサイエティ企画)
- AT-1-1 高並列SIMD/MIMD切替え型プロセッサIMAPCAR2による画像認識処理(AT-1. 高並列プロセッサによる高性能メディア信号処理,チュートリアルセッション,ソサイエティ企画)
- 低消費電力応用志向プロセッサ--画像認識プロセッサIMAPCAR2を例として (ICTでナビゲートする環境にやさしい社会特集) -- (先端環境技術)
- 画像認識アプリケーションを用いた動的切り替え可能なSIMD/MIMD型プロセッサのMIMDモードの性能評価(プロセッサアーキテクチャ)
- 動的切り替え可能なSIMD/MIMD型プロセッサにおけるMIMDコアの低コスト実現法(マイクロプロセッサ)
- 動的切り替え可能なSIMD/MIMD型プロセッサにおけるMIMDコアの低コスト実現法(マイクロプロセッサ)
- 車載組込み用画像認識プロセッサIMAPCAR (組込みソフトウエア・ソリユーシヨン特集) -- (組込みシステム・プラットフォーム)
- AS-2-5 車載用動画像認識プロセッサIMAP-CE向け並列アルゴリズムの設計手法(AS-2.最近のスマートマルチメディアシステムの技術動向,基礎・境界)
- 画像認識処理指向LSIの動向とメモリ集積型高並列プロセッサIMAP(ITS・監視・セキュリティのためのパターン認識・メディア理解)
- SA-8-4 128個のRISCコアを集積した動画像認識プロセッサとその応用(SA-8. スマートインフォメディアシステムの目指すもの)
- 画像フィルタ処理の高速化に向けたメディア拡張プロセッサ用SIMDコンパイラ(ARC-5:コンパイラ)(2003年並列/分散/協調処理に関する『松江』サマー・ワークショップ(SWoPP松江2003))
- 128個の4ウェイVLIW型RISCコアを集積した車載向け動画認識LSI(VSLI一般(ISSCC'03関連特集))
- SIMDア***ロセッサにおけるマルチスレッド実装方式の検討
- 画像認識用並列プロセッサ研究20年の夜明け
- SIMD/MIND動的切替え型プロセッサIMAPCAR2の性能評価(アーキテクチャ)
- 高並列プロセッサIMAPCARと車載画像認識への適用(一般セッション,センシング技術とその応用)
- IMAP-VISIONを用いた道路画像からの白線検出
- 動画像処理ボードIMAP-VISIONによる天候にロバストな先行車検出・追跡システム
- 一次元プロセッサアレイに基づく超高速画像処理システムの開発環境(並列処理)
- 動画像処理システムRVS-2による実時間動き計測
- メモリ型プロセッサによる動画像処理システムRVS-2 : 性能評価
- メモリ型プロセッサによる動画像処理システムRVS-2 : 基本ソフトウエア
- 一次元プロセッサアレイに基づくリアルタイム画像処理システムの開発環境
- 超高速動画像処理ボ-ドIMAP-VISION (ITS (高度道路交通システム)特集)
- 10GIPS IMAP-VISONボード : 性能評価
- 10GIPS IMAP-VISONボード : ハードウェア
- リアルタイムビジョンのための並列処理 LSI IMAP とそのシステム
- メモリ集積型SIMDプロセッサIMAP
- メモリ型プロセッサによる動画像処理システムRVS-2 : メモリ型プロセッサIMAP-2
- 並列画像理解のハードウェアアーキテクチャ (「並列・分散協調画像理解」)
- 並列画像理解のハードウェアアーキテクチャ
- メモリ集積型プロセッサIMAP-LSI
- メモリ型画像処理プロセッサIMAPとその応用
- 天候にロバストな先行車検出・追跡システム
- 128個のVLIWプロセッシングエレメントを集積した動画像認識プロセッサIMAP-CE
- OpenCLの性能可搬性改善に向けた基本APIの提案
- 画像による自車両周辺環境認識技術 (ITS特集) -- (ITS基盤システム構築のために)