ベクトル量子化のためのコードブック生成並列処理に関する研究
スポンサーリンク
概要
- 論文の詳細を見る
ベクトル量子化は高効率なデータ圧縮手法であり、データの保存や転送において核となる技術である。これまでに、誤差の少ない量子化のための最適コードブックを生成する様々な手法が提案されており、中でもアルゴリズムの改良によつでコードブック生成処理時間の短縮を図るLaw-of-the-Jungle(LOJ)アルゴリズムが注目を集めている。しかし、大きなデータセットを単一のCPUで処理する場合、アルゴリズムの改良による処理時間短縮には限界があり、並列処理によるさらなる速度向上が求めちれている。本論文では、メモリ分散型並列計算機に適した並列LOJアルゴリズムを提案する。32個の計算ノードを用いて並列コードブック生成実験を行った結果、27.4倍の高いスケーラビリティが得られた。
- 社団法人情報処理学会の論文
- 2002-08-21
著者
-
滝沢 寛之
東北大学
-
中村 維男
東北大学大学院情報科学研究科情報基礎科学専攻
-
佐野 健太郎
東北大学大学院情報科学研究科
-
中村 維男
東北大学大学院情報科学研究科
-
小林 広明
東北大学情報シナジー機構
-
小林 広明
東北大学情報シナジーセンター
-
滝沢 寛之
新潟大学総合情報処理センター
-
百瀬 真太郎
東北大学大学院情報科学研究科
-
中島 平
東北大学大学院工学研究科
-
Lima Clecio
東北大学大学院情報科学研究科
-
中島 平
東北大学大学院教育情報学研究部
関連論文
- 10.GPUコンピューティングにおけるソフトウェア自動チューニング(ソフトウェア自動チューニング技術の応用,科学技術計算におけるソフトウェア自動チューニング)
- GPUを効率的に利用するための言語拡張と自動最適化手法(HPC-12:言語処理系,2008年並列/分散/協調処理に関する『佐賀』サマー・ワークショップ(SWoPP佐賀2008))
- GPUコンピューティングのためのストリーム処理記述言語
- 暗号VLSIプロセッサのための固有電力消費アーキテクチャ
- 細粒度電力制御Cooled logic アーキテクチャ
- ニューラルネットワーク(クロストークリンク付きBPD)のFSK復調への応用
- SOUNDコンピュータの試作
- ディレー付きニューラルネットワークを用いた符号化・復号化
- ディレー素子内包型バックプロパゲーションニューラルネットワーク(BPD)の一構成
- 大規模計算環境における分散協調型負荷分散手法(分散システム構築運用技術,新しいパラダイムの中での分散システム/インターネット運用・管理)
- パイプライン型Prologアーキテクチャにおける負荷分散の一検討
- 高速省電力ウェーブパイプライン用評価テスト回路の開発
- ウェーブパイプラインと従来方式パイプラインの性能評価
- Z^*_n中の原始元の簡略化した識別法について
- RC-006 ウェイアロケーション型共有キャッシュ機構のハードウェア設計に関する研究(ハードウェア・アーキテクチャ,査読付き論文)
- I-004 フォトンマップ分割に基づく並列画像生成アルゴリズム(I分野:グラフィクス・画像)
- LC-010 SMTプロセッサの実行時性能予測のためのハードウェアリソース競合解析(ハードウェア・アーキテクチャ)
- LC-006 消費電力を考慮したウェイアロケーション型共有キャッシュ機構(ハードウェア・アーキテクチャ)
- ウェイアロケーション型共有キャッシュ機構の性能評価(ARC-2 : キャッシュメモリ,2007年並列/分散/協調処理に関する『旭川』サマー・ワークショップ(SWoPP旭川2007))
- 実行時性能予測に基づくCPUとGPUへの動的タスク割当の検討(ハードウェア・アクセラレータ)
- LL_007 P2P型資源検索システムにおける動的論理リンク管理機構(L分野:ネットワークコンピューティング)
- LC_006 スレッド特微量に基づくマルチコアプロセッサスケジューリング(C分野:ハードウェア)
- LA-006 大規模P2Pシステムにおける計算資源探索のモデル化と性能評価(A分野:モデル・アルゴリズム・プログラミング)
- HPC Challengeベンチマークを用いたSX-7システムの性能評価(HPCハードウェア)
- ベクトル量子化用コードブック生成のための並列弱肉強食アルゴリズムの性能解析
- LJ-11 視覚的画質劣化を抑制するベクトル量子化手法(J. グラフィクス・画像)
- ベクトル量子化のためのコードブック生成並列処理に関する研究
- ベクトル量子化のための並列コードブック生成アルゴリズムの性能評価(2.第1回情報シナジー研究会)
- 多層パーセプトロンの分類能力向上法に関する一検討
- ニューラルネットワークを利用した自動表情認識システム
- A-19-4 音声による計算機利用支援のための文字情報識別に関する一考察
- 3DCGiRAMアーキテクチャによる実時間レイトレーシングシステム
- MULHIキャッシュの設計及び評価
- D-11-73 レイトレーシングハードウェアのための交差判定器の計算精度に関する一考察
- VLIWアーキテクチャのためのダイナミックブースティング機構
- 投機的実行を行なうVLIWプロセッサの命令供給機構の設計
- 2ZC-7 参照画像を用いた光線追跡法の高速化に関する一検討(レンダリングとアニメーション,一般講演,インタフェース)
- 3M-1 興味部位の形状を考慮した動的輪郭モデル
- MULHIキャッシュ : VLIWプロセッサのための命令キャッシュ機構 (並列処理)
- 再構成可能な同期式データフロー計算機に関する一検討
- データ並列ボリュームレンダリングのためのボリューム適応分割手法
- ベクトル命令とスカラ命令を融合した命令レベル並列処理のためのスケジューリング手法
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 乗算器の回野規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- K-032 損失データ再送および属性限定受信に対応した映像配信システム(K分野:ヒューマンコミュニケーション&インタラクション)
- N-027 対話型映像再生に対応した業務用映像配信システム(N分野:教育・人文科学)
- リアルタイム・ビジュアル・デザインレビュー・システムの設計と実装(ハードウエアによるCG処理およびCG一般)
- 再構成可能な同期式データフロー計算機に関する一検討
- 再構成可能な同期式データフロー計算機に関する一検討
- TLB統一型キャッシュのためのタイムスタンプ無効化方式とその性能評価
- RICEによる2次キャッシュメモリの性能評価
- TLB-Assisted Cache
- ウェーブパイプラインを用いた時分割擬似マルチポートレジスタファイル (非同期式回路/システム設計論文小特集)
- 分散フレームバッファシステムを持つ画像生成用超並列処理システム(Mπ)^2の性能評価
- ハードウェアキャッシュ評価システム "RICE"
- 並列グラフ簡約システムにおけるタスク割当て手法とメモリ参照局所性評価
- ジェットパイプラインの並列化命令スケジューリングに関する一検討
- 分散共有メモリ型並列計算機のためのメッセージ損失を許容するメモリアクセスプロトコル
- データの更新をバイト単位で管理するキャッシュメモリ
- プロセッサクラスタ用メモリアクセスバッファリング機構
- メッセージロスのあるネットワークを用いた分散共有メモリマルチプロセッサシステムの評価
- FL階層化並列簡約システムの共有メモリシステム
- Wave-Pipeliningを用いた時分割擬似マルチポートレジスタファイル
- ジェットパイプラインのためのコンパイル技術に関する一検討
- FL階層化並列簡約システムの性能評価
- OpenCLによるGPUコンピューティングの性能評価
- CUDAアプリケーション向けチェックポイント・リスタート機能の実装と評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- 実アプリケーションを用いたチップマルチベクトルプロセッサの消費エネルギ評価
- ニューラルネットワークを用いた自動感情認識に関する一検討
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- キャッシュメモリを有するベクトルプロセッサのためのプログラム最適化手法
- ATMネットワークを用いた分散処理システムにおけるメモリアクセスプロトコル
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- レイトレーシング専用コンピューティングシステムRAPLASのFPGAによる実装(FPGAとその応用及び一般)
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- 乗算器の回路規模縮小に関する研究(システムLSIの応用と要素技術,専用プロセッサ,プロセッサ,DSP,画像処理技術,及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- ビットレベル並列性を利用した演算器の小規模化(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- マイクロプロセッサの熱解析に関する研究(プロセッサ, DSP, 画像処理技術及び一般)
- LC-008 マイクロプロセッサにおける細粒度発熱解析の一手法(C分野:アーキテクチャ・ハードウェア)
- ベクトル量子化のためのコードブック生成専用プロセッサに関する研究
- ワーキングセット評価に基づくスレッドスケジューリング
- F0103(4) Cellによる高性能計算の可能性を探る([F0103]計算力学の新たな潮流-GPGPU,FPGA,CELLコンピューティング-,先端技術フォーラム)
- C-023 プロセッサ自動選択機能を有するBLASの実現に向けた性能評価(ハードウェア・アーキテクチャ,一般論文)
- RC-008 ボランティアコンピューティングの高効率化ためのクライアントレベルスケジューリング(ハードウェア・アーキテクチャ,査読付き論文)
- SPRAT:実行時自動チューニング機能を備えるストリーム処理記述用言語
- 動的負荷分散機能を持つ高性能ボランティアコンピューティングの実現
- プログラム自動生成技術に基づくGPUコンピューティングの性能評価
- 624 消費エネルギを考慮したGPUコンピューティングの検討(OS3.GPGPUコンピューティング(3),オーガナイズドセッション)
- メタ情報拡散に基づくP2P型自己組織化サービス資源検索機構(ネットワーク応用,インターネット技術とその応用論文)
- ナノ粒子群形成アプリケーションのOpenACCによる実装と性能評価
- 10.6 複合システムにおけるチェックポイントリスタート(第10章:将来の課題,ディペンダブルVLSIシステム)