Large-scale Image Retrieval as a Classification Problem
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, we propose a new, effective, and unified scoring method for local feature-based image retrieval. The proposed scoring method is derived by solving the large-scale image retrieval problem as a classification problem with a large number of classes. The resulting proposed score is based on the ratio of the probability density function of an object model to that of a background model, which is efficiently calculated via nearest neighbor density estimation. The proposed method has the following desirable properties: (1) has a sound theoretical basis, (2) is more effective than inverse document frequency-based scoring, (3) is applicable not only to quantized descriptors but also to raw descriptors, and (4) is easy and efficient in terms of calculation and updating. We show the effectiveness of the proposed method empirically by applying it to a standard and improved bag-of-visual words-based framework and a k-nearest neighbor voting framework.
著者
-
Sakazawa Shigeyuki
Kddi R&d Laboratories Inc.
-
Uchida Yusuke
Kddi R&d Laboratories Inc.
-
SAKAZAWA Shigeyuki
KDDI R&D Laboratories, Inc.
関連論文
- 輝度重心に基づくバイナリー特徴量の適応的照合による高速・高精度な同一映像検出(研究速報,映像メディア処理,画像符号化・映像メディア処理レター)
- D-12-19 アフィン不変領域抽出のためのSIFT拡張の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- B-7-104 動画のエラー伝播特性を考慮した不均一誤り保護の一検討(B-7. 情報ネットワーク,一般セッション)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- D-12-31 ショット境界のbi-gram表現による同一映像検索手法に関する一検討(D-12.パターン認識・メディア理解,一般セッション)
- BoFを利用した映像検索における索引規模削減手法(研究速報)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- カラーレイアウト記述子を利用したコピー検出手法の性能評価(一般セッション,映像ハンドリング技術とその応用)
- H-042 Iフレームを用いたショット境界検出の高速化に関する性能評価(画像認識・メディア理解,一般論文)
- Light Weight MP3 Watermarking Method for Mobile Terminals
- Proactive Retransmission and Buffer Management for Layered Video Transmission over Wireless Channel
- Video Data Transmission Protocol "SVFTP" Using Multiple TCP Connections and Its Application(Networks)
- D-12-93 局所特徴の時間的バースト性を考慮した準同一映像検出(D-12.パターン認識・メディア理解,一般セッション)
- A STUDY ON VIDEO SCRAMBLING CONSIDERING INTER-FRAME PREDICTION(International Workshop on Advanced Image Technology 2006)
- 大域・局所画像特徴および音響特徴を用いた高精度なコピー検出手法(テーマセッション,映像処理とTRECVID)
- D-20-5 MODELING HUMAN MOTIONS SUCCESSIVELY IN MULTIPLE LATENT SPACES
- Quantization-Based Approximate Nearest Neighbor Search with Optimized Multiple Residual Codebooks
- 2-5 画像マッチングとカメラ追跡によるカメラポインタの性能改善(第2部門 メディア処理2)
- 10-1 カラーレイアウトを利用した違法コピー検出における投票に関する一考察(第10部門 ヒューマンインフォメーション1)
- 14-1 Iフレームを用いたショット境界検出の高速化に関する一検討(第14部門 ヒューマンインフォメーション2)
- 6-8 前景・背景分離を利用したタイムラプスビデオに関する一検討(第6部門 映像表現)
- 大規模特定物体認識の最新動向
- Efficient Generation of Dancing Animation Synchronizing with Music Based on Meta Motion Graphs
- 3-1 近似最近傍探索のための直積量子化コードブック作成手法に関する一検討(第3部門符号化・復号化)
- 8-3 特定物体認識のための最近傍密度推定に関する一検討(第8部門コンピュータビジョン,ヒューマンインタフェース,その他)
- Optimized Codebook Construction and Assignment for Product Quantization-based Approximate Nearest Neighbor Search
- Large-scale Image Retrieval as a Classification Problem
- Optimized Codebook Construction and Assignment for Product Quantization-based Approximate Nearest Neighbor Search
- Large-scale Image Retrieval as a Classification Problem
- 3-3 Multimodal Synchronization for Virtual Agents
- 3-6 Cooperative Segmentation of Human Motions for Affective Agents