H.264エンコーダのコア関数のSTPエンジンへの実装(アプリケーションとシミュレーション,デザインガイア2009 VLSI設計の新しい大地)
スポンサーリンク
概要
- 論文の詳細を見る
H.264では従来の動画圧縮規格に比べて、はるかに高い圧縮効率が得られることが特徴であるが、そのために圧縮に必要な計算量が膨大となる。このため、組み込み用CPUのソフトウェアで実装する方法では十分な性能を実現することができない。動的リコンフィギャラブルプロセッサは、高い性能と低消費電力を実現する柔軟性のあるオフロードエンジンとして注目されている。しかし、H.264エンコーダのオフローディングに関して、実例の報告は少ない。これは、現在のH.264のエンコード処理が非常に複雑なので、複数のタスクの動的リコンフィギャラブルプロセッサへのオフロードが難しい点にある。NECエレクトロニクス社のDRP1の次世代の動的リコンフィギャラブルプロセッサSTPエンジンは、DMAの利用により、データ転送時間を隠蔽することでオフロードした複数のタスクを連続して実行できる機能を持つ。このため、複雑なH.264エンコーダのオフローディングも可能であると考えられる。本報告では、STPエンジンにH.264を実装する第一歩としてタスクの一部をオフローディングし、その演算速度の向上と、消費電力の低減を図る。H.264タスクの中のイントラ予測で利用されるsatdの値を求めるSATD8X8関数を実装し、メモリの読み出しや加算のバランスツリー化に関して考慮し、実行時間を最適化した。265MHzで動作するMIPS R3000と比較した結果、で約11倍の性能向上を実現した。
- 2009-11-26
著者
関連論文
- MIPS R3000プロセッサにおける細粒度動的スリープ制御の実装と評価(計算機システム)
- 5K-7 省電力MIPSプロセッサコア評価のための計算機システムのFPGAによる試作(マルチスレッドと省電力,学生セッション,アーキテクチャ)
- FPGAアレイCubeを用いたレーベンシュタイン距離計算の性能評価(応用1)
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- グラフィックプロセッサを用いた自己組織化マップの実装と評価(GPU,「ハイパフォーマンスコンピューティングとアーキテクチャの評価」に関する北海道ワークショップ(HOKKE-2009))
- ClearSpeed製SIMD型マルチコアプロセッサにおける並列アプリケーション実行時間予測手法の検討(ARC-3 : 性能評価およびモデリング,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 動的再構成プロセッサアレイMuCCRA-3のマルチコア化の研究 (リコンフィギャラブルシステム)
- 動的リコンフィギャラブルデバイスにおける電力分析と低電力化手法の検討(コンピュータシステム)
- ClearSpeed製SIMDプロセッサの通信性能評価(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- ハイパフォーマンスコアとローパワーコアの組み合わせにおける細粒度動的スリープ制御の実装と評価(組込みシステムプラットフォーム)
- Network-on-Chipにおけるエラー検出・訂正方式に関する研究(ネットワークオンチップとマルチコア,2009年並列/分散/協調処理に関する『仙台』サマー・ワークショップ(SWoPP仙台2009))
- メッセージ頭部の格納場所切替によるメッセージ交換の高速化(ARC-8 : 通信,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 再構成回数削減による動的リコンフィギャラブルプロセッサの消費電力削減手法の提案 (リコンフィギャラブルシステム)
- マルチコンテキスト型動的リコンフィギャラブルプロセッサからコンテキストメモリをなくす方法の提案 (リコンフィギャラブルシステム)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- マルチパスイーサネットにおけるOn/Offリンクアクティベーション法の評価(ネットワーク,クラウド及び一般)
- レーベンシュタイン距離と最小二乗法を用いた標識認識アルゴリズム
- 動的リコンフィギャラブルデバイスにおける構成情報配送のためのマルチキャスト手法の検討(コンピュータシステム)
- Dua-Vthセルの利用による動的リコンフィギャラブルプロセッサのリーク電力削減の評価(デバイスアーキテクチャ1)
- 動的リコンフィギャラブルプロセッサMuCCRA-3の実機評価(リコンフィギャラブルアーキテクチャ)
- FPGAを用いた汎用生化学シミュレータにおけるハードウェアモジュール自動生成アルゴリズムの実機評価(リコンフィギャラブル応用)
- CFD専用計算機FLOPS-2Dへ向けたUPACS制限関数群モジュール化の検討(リコンフィギャラブル応用)
- (2)パネル討論 : アーキテクチャ研究の将来(150回研究会記念特別企画)
- WASMII:データ駆動型制御機構をもつMPLD
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- Ether-Forwarding Engineを用いたRDMAコントローラの設計と実装 (ディペンダブルコンピューティング)
- Ether-Forwarding Engineを用いたRDMAコントローラの設計と実装(コンピュータシステム技術1,組込み技術とネットワークに関するワークショップ ETNET2010)
- Cell Broadband Engineを用いたスレッド仮想化環境の提案(ディペンダブルアーキテクシャ及び仮想化,ディペンダブルコンピューティングシステム及び一般)
- Impulse Cを用いたLine-Basedアーキテクチャ二次元離散ウェーブレット変換のFPGAへの実装(回路合成,組込み技術とネットワークに関するワークショップ ETNET2010)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- RHiNETの高速通信ライブラリPMv2による評価
- RHiNETの高速通信ライブラリPMv2による評価
- MDX(MultiDimensional Crossbar) : 大規模並列計算機用結合網クラス
- 超並列計算機JUMP-1における分散共有メモリ管理プロセッサMBP-light(並列処理)
- 超並列計算機JUMP-1におけるMBP Core Architectureの評価
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- ランタイムパワーゲーティングを適用したMIPS R3000プロセッサの実装設計と評価(低消費電力化技術)
- 教育用パイプライン処理マイクロプロセッサPICO^2の開発
- スケジューリングを考慮した多段結合網スイッチチップの実装
- 実レイアウトによるクロスバの性能評価
- マルチFPGAプラットフォームFLOPS-2Dにおける演算パイプラインの実装(リコンフィギャラブル応用3)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- ランタイムパワーゲーティングを適用した回路での検証環境と電力見積もり手法の構築(低消費電力化技術)
- Impulse Cを用いた離散ウェーブレット変換のFPGAへの実装(アプリケーション1,FPGA応用及び一般)
- 1-flitパケット構造を利用した非最短型完全適応ルーティング(バス・配線アーキテクチャ,FPGA応用及び一般)
- H.264エンコーダのコア関数のSTPエンジンへの実装(アプリケーションとシミュレーション,デザインガイア2009 VLSI設計の新しい大地)
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- マルチグレイン並列処理を利用したソフトウェア制御キャッシュの開発
- ハードウエア設計のマルチコンテキスト化手法
- 動的再構成プロセッサアレイMuCCRA-3のマルチコア化の研究(リコンフィギャラブルアーキテクチャ)
- FPGAにおける演算パイプライン共有化のためのデータパス分類手法の提案(高信頼化技術・設計技術)
- FPGA実装されたストリーム暗号CryptMTの評価(セキュリティ応用,デザインガイア2009 VLSI設計の新しい大地)
- LANにおける音声/静止画/データ複合通信の制御法
- 並列計算機(SM)^2-IIへの汎用ニューラル・ネットワーク・シミュレータの実装
- 動的リコンフィギャラブルプロセッサにおける、2電源電圧の動的な割り当てによる電力削減機構の実装(低消費電力設計,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサMuCCRA-3向け開発ツールの整備(開発環境,FPGA応用及び一般)
- クロスバ接続による3次元Network-on-Chip向け多層型トポロジ(集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- クロスバ接続による3次元Network-on-Chip向け多層型トポロジ(オンチップ・ネットワーク,集積回路とアーキテクチャの協創-プロセッサ,メモリ,システムLSI及び一般-)
- 非同期スイッチの試作
- 仮想ハードウェアWASMIIシステム用コンパイラの実装と評価
- マルチFPGAシステムFLOPS-2Dに向けたパイプライン構築手法の検討(HPCとアーキテクチャ,デザインガイア2009 VLSI設計の新しい大地)
- 多次元構造を持つMIN(並列処理)
- DIMMスロット搭載型ネットワークインタフェースDIMMnet-1の試作
- 動的リコンフィギャラブルプロセッサプロジェクトMuCCRA : コンフィギャラブル設計環境、省電力化、三次元ワイヤレス接続(新しいシステムLSIの展望,デザインガイア2009 VLSI設計の新しい大地)
- DIMMnet-1プロトタイプによるバンド幅と大域演算性能の評価
- 超並列計算機に向き結合網:RDT
- 可変構造型デバイスを用いた神経回路網シミュレータの実現に関する検討(一般セッションF Funny Architecture II)
- 並行プロセス記述言語NCCの改良
- 並列計算機テストベッドATTEMPTの概観
- バス結合型並列計算機の交信用メモリの性能評価 (並列処理)
- 並列計算機テストベッドATTEMPTの実装と評価
- 効率良い並列処理をサポートするローカルエリア向けネットワークスイッチ
- マルチグレインDSMをサポートするWSクラスタJUMP-1/3
- 科学技術計算用並行記述言語NCC/iのプログラミング環境
- 高速通信インタフェースDIMMnet-1における通信プリミティブの実装と評価
- 軽量メモリーベース通信のためのネットワークインタフェース
- Pruning Cacheを用いた分散共有メモリのディレクトリ構成法(並列処理)
- ローカルメモリを持つマルチプロセッサにおけるアプリケーションの最適化
- 並列計算機のための相互結合網シミュレータSPIDER
- 格子状接続並列計算機用マッピング : ローリングマッピングの効率的なPUアレイの実装例
- ハイパークロス網の拡張について
- 超並列向き結合網Recursive Diagonal Torusの諸特性
- 相互結合網RDTにおけるadaptive routing
- ニューラルネットワークに基づく細密配線アルゴリズムの並列計算機上への実装
- ニューラルネットワークに基づく並列自動配線アルゴリズム
- ATTEMPTのキャッシュコヒーレンシィプロトコル
- 分散型離散系シミュレーションのためのスケジューリング、マッピング手法の検討
- ATTEMPTの同期機構
- SSS型のMINにおけるhot spotの影響とメッセージ結合の効果
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- 動的リコンフィギャラブルプロセッサにおける動的電源切替による電力削減効果とオーバーヘッドを低減するマッピング手法(VLSI設計技術,FPGA応用及び一般)
- SSS-MIN用LSIチップの実装
- PE直結型動的リコンフィギャラブルプロセッサMuCCRA-Dの提案(リコンフィギャラブルプロセッサ,リコンフィギャラブルシステム,一般)
- ATTEMPTにおけるIEEE Futurebusインタフェース
- 光結合によるマルチリードライトメモリ
- 多重出力可能なMINの性能評価
- 軽量メモリベース通信用ネットワークルータ