Optimized Codebook Construction and Assignment for Product Quantization-based Approximate Nearest Neighbor Search
スポンサーリンク
概要
- 論文の詳細を見る
Nearest neighbor search (NNS) among large-scale and high-dimensional vectors has played an important role in recent large-scale multimedia search applications. This paper proposes an optimized codebook construction algorithm for approximate NNS based on product quantization. The proposed algorithm iteratively optimizes both codebooks for product quantization and an assignment table that indicates the optimal codebook in product quantization. In experiments, the proposed method is shown to achieve better accuracy in approximate NNS than the conventional method with the same memory requirement and the same computational cost. Furthermore, use of a larger number of codebooks increases the accuracy of approximate NNS at the expense of a slight increase in the memory requirement.
著者
-
Sakazawa Shigeyuki
Kddi R&d Laboratories Inc.
-
Uchida Yusuke
Kddi R&d Laboratories Inc.
-
TAKAGI Koichi
KDDI Corporation
関連論文
- 短時間主成分分析を用いたモーションキャプチャデータからのビート抽出手法
- 輝度重心に基づくバイナリー特徴量の適応的照合による高速・高精度な同一映像検出(研究速報,映像メディア処理,画像符号化・映像メディア処理レター)
- D-12-19 アフィン不変領域抽出のためのSIFT拡張の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- B-7-104 動画のエラー伝播特性を考慮した不均一誤り保護の一検討(B-7. 情報ネットワーク,一般セッション)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- D-12-31 ショット境界のbi-gram表現による同一映像検索手法に関する一検討(D-12.パターン認識・メディア理解,一般セッション)
- BoFを利用した映像検索における索引規模削減手法(研究速報)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- H-042 Iフレームを用いたショット境界検出の高速化に関する性能評価(画像認識・メディア理解,一般論文)
- Light Weight MP3 Watermarking Method for Mobile Terminals
- Proactive Retransmission and Buffer Management for Layered Video Transmission over Wireless Channel
- Video Data Transmission Protocol "SVFTP" Using Multiple TCP Connections and Its Application(Networks)
- AN ALTERNATIVE APPROACH TO DEBLOCKING FILTERING FOR REDUCING DECODING LOAD IN H.264(INTERNATIONAL Workshop on Advanced Image Technology 2008)
- Personal Mobile DTV Terminal Designed for Service Trial of Digital Terrestrial Broadcasting with Full Use of Internet Connectivity(Selected Papers from ICMU 2004(First International Conference on Mobile Computing and Ubiquitous Networking))
- D-12-93 局所特徴の時間的バースト性を考慮した準同一映像検出(D-12.パターン認識・メディア理解,一般セッション)
- A STUDY ON VIDEO SCRAMBLING CONSIDERING INTER-FRAME PREDICTION(International Workshop on Advanced Image Technology 2006)
- Evaluation of the Corresponding Degree between a Visual Image and Its Associated Sound under Dynamic Conditions on a Wide Screen(Papers Selected from 2003 International Technical Conference on Circuits/Systems, Computers and Communication
- Beat Induction from Motion Capture Data Using Short-Term Principal Component Analysis
- 大域・局所画像特徴および音響特徴を用いた高精度なコピー検出手法(テーマセッション,映像処理とTRECVID)
- D-20-5 MODELING HUMAN MOTIONS SUCCESSIVELY IN MULTIPLE LATENT SPACES
- Quantization-Based Approximate Nearest Neighbor Search with Optimized Multiple Residual Codebooks
- 2-5 画像マッチングとカメラ追跡によるカメラポインタの性能改善(第2部門 メディア処理2)
- 10-1 カラーレイアウトを利用した違法コピー検出における投票に関する一考察(第10部門 ヒューマンインフォメーション1)
- 14-1 Iフレームを用いたショット境界検出の高速化に関する一検討(第14部門 ヒューマンインフォメーション2)
- 13-5 Reorganization of Motion Capture Database for Music Synchronization by Semantic Analysis
- 6-8 前景・背景分離を利用したタイムラプスビデオに関する一検討(第6部門 映像表現)
- 大規模特定物体認識の最新動向
- Efficient Generation of Dancing Animation Synchronizing with Music Based on Meta Motion Graphs
- 3-1 近似最近傍探索のための直積量子化コードブック作成手法に関する一検討(第3部門符号化・復号化)
- 8-3 特定物体認識のための最近傍密度推定に関する一検討(第8部門コンピュータビジョン,ヒューマンインタフェース,その他)
- 4-1 Human Motion Tracking in a Single Camera with a Graph Structure in Latent Spaces
- Optimized Codebook Construction and Assignment for Product Quantization-based Approximate Nearest Neighbor Search
- Large-scale Image Retrieval as a Classification Problem
- Optimized Codebook Construction and Assignment for Product Quantization-based Approximate Nearest Neighbor Search
- Large-scale Image Retrieval as a Classification Problem
- 3-3 Multimodal Synchronization for Virtual Agents
- 3-6 Cooperative Segmentation of Human Motions for Affective Agents