プロファイルに基づくGPGPUのためのソースコード変換コンパイラ(GPUとマルチコア,組込み技術とネットワークに関するワークショップETNET2012)
スポンサーリンク
概要
- 論文の詳細を見る
CUDAによるGPGPU向けアプリケーションの開発はCPUに関する知見を要し,難しい.そこで,我々はコード記述の容易さと性能を両立する目的で,プロファイル・データを活用してC言語からCUDAへとコードを再構成するコンパイラを提案する.提案コンパイラは入力コードをタスクに分割した上で,タスクの処理内容から加速可能性の判定手法により,GPU/CPUへのタスク割り付けを行い,CUDAコードの生成とチューニングを行う.独自のソースコード変換システムである『SCRInfra』を用いて提案コンパイラの試作を行い,例題プログラムを用いた評価実験によって有効性を確認した.本報告では提案コンパイラの詳細と性能評価実験について述べる.
- 2012-02-24
著者
関連論文
- バイパスアーキテクチャ向けコード最適化における演算命令のクラスタリングを利用した改良手法に関する研究
- ±2^n自動更新可能な間接アドレッシングに有効なアドレス決定法(移動体衛星通信/適応信号処理/一般)(フィルタ設計,信号処理実現)
- ±2^n自動更新可能な間接アドレッシングに有効なアドレス決定法
- ±2^n自動更新可能な関節アドレッシングに有効なアドレス決定法
- 最適内挿近似理論を用いた2次元非分離型フィルタバンクの設計
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- A-3-3 バス接続バイパス構造を用いたマルチプロセッサのためのコードスケジューリング最適化手法についての検討(A-3.VLSI設計技術,一般講演)
- A-3-2 バイパス構造をバス接続したマルチプロセッサによる消費電力削減の検討(A-3.VLSI設計技術,一般講演)
- メモリアドレッシングの最適化とDSPコード自動生成
- MICS:システム設計のためのフレキシビリティの高いシミュレーション環境
- レジスタスロットを考慮したSIMD向け細粒度自動並列化コンパイラ
- 細粒度自動並列化に基づくマルチプロセッサ向けの移植性の高いバックエンドの構成
- レジスタ内Shuffleを考慮したSuperword Level Parallelismを活用したSIMDプロセッサのための自動並列化 (第21回 回路とシステム軽井沢ワークショップ論文集) -- (実現技術)
- A-3-4 MICSを用いたシステムアーキテクチャ設計手法の検討と評価(A-3.VLSI設計技術,一般講演)
- A-3-1 低消費電力のための細粒度並列化におけるデータ転送回数の削減(A-3.VLSI設計技術,一般講演)
- A-3-16 柔軟なシステム設計のためのシミュレーション環境MICSの動作速度の評価(A-3.VLSI設計技術,一般講演)
- システム設計のためのフレキシビリティの高いシミュレーション環境を用いた信号処理アルゴリズムの実装支援 (第20回 回路とシステム軽井沢ワークショップ論文集) -- (システム設計手法)
- A-3-4 動的再構成可能プロセッサのためのコンテクスト自動抽出とプログラムの等価変換による改善の検討(A-3.VLSI設計技術,一般講演)
- A-3-2 確率モデルにもとづく細粒度自動並列化コンパイラの検討(A-3.VLSI設計技術,一般講演)
- 三次元表現空間を用いたプログラムの解析と並列化の一手法
- A-3-2 可変論理プロセッサへの演算器のマッピング問題について(A-3.VLSI設計技術,基礎・境界)
- データドリブンに基づくバス解析の一手法
- 間接アドレッシングDSPのための複数同時データ転送を考慮したメモリ配置手法
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 計算順序とメモリアクセスを同時に考慮したDSPコード効率化
- パイプライン化DSPの条件分岐命令に伴う最悪実行時間を短縮するコード最適化手法
- 複数のアドレスレジスタを有するDSPのためのメモリアクセス手法(ディジタル信号処理,スペクトル拡散及び一般)
- 複数のアドレスレジスタを有するDSPのためのメモリアクセス手法(ディジタル信号処理,スペクトル拡散及び一般)
- 異種コード最適化方法を統合するためのコンパイラ構成に関する一考察 (第20回 回路とシステム軽井沢ワークショップ論文集) -- (インタラクティブセッション)
- A-3-3 マルチプロセッサ用の信号処理アルゴリズム向け最適化コンパイラの研究(A-3.VLSI設計技術,一般講演)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- ディジタルロックインアンプの実現に関する一考察
- データ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- データ転送の定量的評価に基づく多階層化キャツシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- データ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- マルチターゲットDSPコンパイラ
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良
- コンパイラにおける複数最適化方法の統合技術に関する一考察
- 離散更新可能な間接アドレッシングDSP用のメモリ配置方法(グラフ,ペトリ,ニューラルネット及び一般)
- 離散更新可能な間接アドレッシングDSP用のメモリ配置方法(グラフ,ペトリ,ニューラルネット及び一般)
- 間接アドレッシングにおけるメモリアクセスを考慮した計算順序の一決定方法(通信システム・非線形回路とシステム及び一般)
- 間接アドレッシングにおけるメモリアクセスを考慮した計算順序の一決定方法(通信システム・非線形回路とシステム及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法
- DSP2000-70 / SST2000-29 新しい重み付評価関数に基づく間接アドレシングDSPのための変数配置方法
- DSP2000-70 / SST2000-29 新しい重み付評価関数に基づく間接アドレシングDSPのための変数配置方法
- JITコンパイル方式による動的言語処理系の自動並列化の一手法
- JITコンパイル方式による動的言語処理系の自動並列化の一手法
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- D-3-6 GPGPUフレームワーク向け省電力なタスク割り付け手法に関する一検討(D-3.ソフトウェアサイエンス,一般セッション)
- JITコンパイル方式による動的言語処理系の自動並列化の一手法(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- JITコンパイル方式による動的言語処理系の自動並列化の一手法(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ(GPUとマルチコア,組込み技術とネットワークに関するワークショップETNET2012)
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ(GPUとマルチコア,組込み技術とネットワークに関するワークショップETNET2012)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法
- AS-1-1 高信頼な処理を指向した動的再構成可能プロセッサの一構成法(AS-1.環境・社会に優しい回路とシステム,シンポジウムセツション)
- AS-1-2 データ転送を含めたGPGPU消費電力モデルの提案とタスク割当への検討(AS-1.環境・社会に優しい回路とシステム,シンポジウムセツション)
- メモリアクセスのないコードも考慮したメモリアドレッシング最適化とDSPコード自動生成
- DSPコード最適化におけるメモリ配置の改良