データ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
スポンサーリンク
概要
- 論文の詳細を見る
本論文ではデータ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法を提案する.バースト転送を有効に使うために空間的・時間的局所性のあるデータをまとめ,それらのデータ群に対応する命令群の配置をデータ依存関係やキャッシュ容量の評価に基づき決定する.さらにバス競合を減少させるために適切なタイミングでプリロードを挿入する.計算機実験の結果,提案手法と粗粒度で並列化された従来手法で出力されたサイクル数を比較し性能が向上していることを確認した.
- 2010-02-22
著者
-
杉野 暢彦
東京工業大学大学院総合理工学研究科物理情報システム専攻
-
則武 卓也
東京工業大学大学院総合理工学研究科物理情報システム専攻
-
則武 卓也
東京工業大学大学院総台理工学研究科物理清報システム専攻
-
杉野 暢彦
東京工業大学大学院物理情報システム専攻
関連論文
- バイパスアーキテクチャ向けコード最適化における演算命令のクラスタリングを利用した改良手法に関する研究
- ±2^n自動更新可能な間接アドレッシングに有効なアドレス決定法(移動体衛星通信/適応信号処理/一般)(フィルタ設計,信号処理実現)
- ±2^n自動更新可能な間接アドレッシングに有効なアドレス決定法
- ±2^n自動更新可能な関節アドレッシングに有効なアドレス決定法
- 最適内挿近似理論を用いた2次元非分離型フィルタバンクの設計
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良(一般,ネットワーク,通信のための信号処理及び一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- データフローグラフの評価に基づくバイパスアーキテクチャ向けのコード最適化手法(デモ展示・ポスター講演,ネットワークプロセッサ,通信のための信号処理,無線LAN/PAN,一般)
- A-3-3 バス接続バイパス構造を用いたマルチプロセッサのためのコードスケジューリング最適化手法についての検討(A-3.VLSI設計技術,一般講演)
- A-3-2 バイパス構造をバス接続したマルチプロセッサによる消費電力削減の検討(A-3.VLSI設計技術,一般講演)
- メモリアドレッシングの最適化とDSPコード自動生成
- MICS:システム設計のためのフレキシビリティの高いシミュレーション環境
- レジスタスロットを考慮したSIMD向け細粒度自動並列化コンパイラ
- 細粒度自動並列化に基づくマルチプロセッサ向けの移植性の高いバックエンドの構成
- レジスタ内Shuffleを考慮したSuperword Level Parallelismを活用したSIMDプロセッサのための自動並列化 (第21回 回路とシステム軽井沢ワークショップ論文集) -- (実現技術)
- A-3-4 MICSを用いたシステムアーキテクチャ設計手法の検討と評価(A-3.VLSI設計技術,一般講演)
- A-3-1 低消費電力のための細粒度並列化におけるデータ転送回数の削減(A-3.VLSI設計技術,一般講演)
- A-3-16 柔軟なシステム設計のためのシミュレーション環境MICSの動作速度の評価(A-3.VLSI設計技術,一般講演)
- システム設計のためのフレキシビリティの高いシミュレーション環境を用いた信号処理アルゴリズムの実装支援 (第20回 回路とシステム軽井沢ワークショップ論文集) -- (システム設計手法)
- A-3-4 動的再構成可能プロセッサのためのコンテクスト自動抽出とプログラムの等価変換による改善の検討(A-3.VLSI設計技術,一般講演)
- A-3-2 確率モデルにもとづく細粒度自動並列化コンパイラの検討(A-3.VLSI設計技術,一般講演)
- 三次元表現空間を用いたプログラムの解析と並列化の一手法
- A-3-2 可変論理プロセッサへの演算器のマッピング問題について(A-3.VLSI設計技術,基礎・境界)
- データドリブンに基づくバス解析の一手法
- 間接アドレッシングDSPのための複数同時データ転送を考慮したメモリ配置手法
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 動的可変パイプライン方式の提案とプロセッサの低消費電力化への応用(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- 計算順序とメモリアクセスを同時に考慮したDSPコード効率化
- パイプライン化DSPの条件分岐命令に伴う最悪実行時間を短縮するコード最適化手法
- 複数のアドレスレジスタを有するDSPのためのメモリアクセス手法(ディジタル信号処理,スペクトル拡散及び一般)
- 複数のアドレスレジスタを有するDSPのためのメモリアクセス手法(ディジタル信号処理,スペクトル拡散及び一般)
- 異種コード最適化方法を統合するためのコンパイラ構成に関する一考察 (第20回 回路とシステム軽井沢ワークショップ論文集) -- (インタラクティブセッション)
- A-3-3 マルチプロセッサ用の信号処理アルゴリズム向け最適化コンパイラの研究(A-3.VLSI設計技術,一般講演)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラにおける複数のコード最適化方法の統合に関する一考察(ネットワークプロセッサ,通信のための信号処理,符号理論,一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- コンパイラによる複数最適化方法の統合に関する一考察(ハードウェア/ソフトウェア設計技術, 信号処理, LSI, 及び一般)
- ディジタルロックインアンプの実現に関する一考察
- データ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- データ転送の定量的評価に基づく多階層化キャツシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- データ転送の定量的評価に基づく多階層化キャッシュアーキテクチャ向け帰納的コード自動並列化手法(ポスターセッション,ネットワーク,通信のための信号処理及び一般)
- マルチターゲットDSPコンパイラ
- 演算命令のクラスタリングに基づくバイパスアーキテクチャ向けコード最適化手法の改良
- コンパイラにおける複数最適化方法の統合技術に関する一考察
- 離散更新可能な間接アドレッシングDSP用のメモリ配置方法(グラフ,ペトリ,ニューラルネット及び一般)
- 離散更新可能な間接アドレッシングDSP用のメモリ配置方法(グラフ,ペトリ,ニューラルネット及び一般)
- 間接アドレッシングにおけるメモリアクセスを考慮した計算順序の一決定方法(通信システム・非線形回路とシステム及び一般)
- 間接アドレッシングにおけるメモリアクセスを考慮した計算順序の一決定方法(通信システム・非線形回路とシステム及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- X-Yデータ転送に有効なメモリ割り当ての一手法
- DSP2000-70 / SST2000-29 新しい重み付評価関数に基づく間接アドレシングDSPのための変数配置方法
- DSP2000-70 / SST2000-29 新しい重み付評価関数に基づく間接アドレシングDSPのための変数配置方法
- JITコンパイル方式による動的言語処理系の自動並列化の一手法
- JITコンパイル方式による動的言語処理系の自動並列化の一手法
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- D-3-6 GPGPUフレームワーク向け省電力なタスク割り付け手法に関する一検討(D-3.ソフトウェアサイエンス,一般セッション)
- JITコンパイル方式による動的言語処理系の自動並列化の一手法(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- JITコンパイル方式による動的言語処理系の自動並列化の一手法(設計ツールとフレームワーク,組込み技術とネットワークに関するワークショップETNET2012)
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ(GPUとマルチコア,組込み技術とネットワークに関するワークショップETNET2012)
- プロファイルに基づくGPGPUのためのソースコード変換コンパイラ(GPUとマルチコア,組込み技術とネットワークに関するワークショップETNET2012)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法(グラフ,ペトリ,ニューラルネット,及び一般)
- 三次元空間を用いたプログラムの解析とマルチプロセッサのための分割の一手法
- AS-1-1 高信頼な処理を指向した動的再構成可能プロセッサの一構成法(AS-1.環境・社会に優しい回路とシステム,シンポジウムセツション)
- AS-1-2 データ転送を含めたGPGPU消費電力モデルの提案とタスク割当への検討(AS-1.環境・社会に優しい回路とシステム,シンポジウムセツション)
- メモリアクセスのないコードも考慮したメモリアドレッシング最適化とDSPコード自動生成
- DSPコード最適化におけるメモリ配置の改良