局所特徴量の大規模照合に基づく物体インスタンスの検索 : TRECVID2012 Instance Searchタスク参加報告(テーマセッション,大規模データベースとパターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
我々がTRECVID 2012のInstance Searchタスクに参加した結果を報告する。我々の研究では、BoFのような手法を用いず局所特徴量を直接マッチングすることで、画像中の物体位置や背景の変化に対応できるという局所特徴量の利点を残し、それにより高い認識率を目指す。この際、データ量が膨大なためマッチングに時間がかかるという問題があるが、ハッシュに基づく近似最近傍探索手法を利用することにより、この問題に対処する。本手法を利用し、最大で18.2%のMean Average Precisionとなり、全24チーム中4位という結果を得ることができた。本稿では、このような単純な手法で何がどこまで認識できるのかを、実験データに基づいて明らかにするとともに、限界とそれを克服するための方策についても考察する。
- 一般社団法人電子情報通信学会の論文
- 2013-02-14
著者
-
黄瀬 浩一
大阪府立大学大学院工学研究科
-
岩村 雅一
大阪府立大学 大学院工学研究科
-
黄瀬 浩一
阪府大
-
黄瀬 浩一
大阪府立大学
-
阪田 智大
大阪府立大学大学院工学研究科
-
的崎 伸彰
大阪府立大学大学院工学研究科
関連論文
- 線画の著作権保護のための部分的複製検出法(画像検索-局所特徴量,情報爆発論文)
- 付加情報の一般的な割当(パターン認識)
- 特徴点の配置に基づく画像検索手法の解析 : Geometric HashingとLLAHの比較(画像認識,コンピュータビジョン)
- 特定物体認識におけるBloomier Filterを用いたメモリ削減法とその実験的評価(パターン認識応用,画像の認識・理解論文)
- 参照特徴ベクトルの増加による低品質画像の高速・高精度認識(パターン認識応用,画像の認識・理解論文)
- 物体認識技術に基づく実物体からのリンク機能の実現(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- 物体認識技術に基づく実物体からのリンク機能の実現(一般セッション5)
- カメラ付き携帯電話を入力デバイスとした大規模画像認識(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- カメラ付き携帯電話を入力デバイスとした大規模画像認識(一般セッション5)
- データベースおよびクエリの拡張による文書画像検索の精度向上法 (ヒューマン情報処理)
- 人物動作のn-gram表現に基づく物体認識(テーマセッション関連,一般物体認識・画像特徴量)
- 人物動作の n-gram 表現に基づく物体認識
- 大規模静止画像DBの検索
- 近さの多段階表現に基づく近似最近傍探索(テーマセッション関連,一般物体認識・画像特徴量)
- 隣接バケット探索を用いた近似最近傍探索手法の解析(一般セッション,実世界センシングとその応用)
- 近似最近傍探索の多段階化による高速特定物認識(画像認識,コンピュータビジョン)
- Bloomier Filterを用いた特定物体認識手法の性能に関する実験的検討(テーマセッション関連,一般物体認識・画像特徴量)
- 特定物体認識(チュートリアル,一般物体認識・画像特徴量)
- 大規模特定物体認識における認識率,処理時間,メモリ量のバランスに関する実験的検討(パターン認識と学習,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 特定物体認識におけるBloomier Filterを用いたメモリ削減(一般セッション,実世界センシングとその応用)
- 特定物体認識のためのデータベース容量削減法の検討 : 局所特徴量の量子化と取捨選択(一般セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 特定物体認識のためのデータベース容量削減法の検討 : 局所特徴量の量子化と取捨選択(一般セッション4)
- ディジタルペン
- リアルタイム単語認識技術を利用したカメラベース情報取得システム (パターン認識・メディア理解)
- Webカメラを用いたリアルタイム文書画像検索(研究速報,画像の認識・理解論文)
- ペン先画像からの手書き復元(研究速報)
- 近似最近傍探索を用いた物体認識のための多段階化とその効果(一般セッション,データ工学とメディア理解との融合)
- 認識が与える情報量 : 認識率100%まであと何ビット?(文書・文字メディアの認識・理解, 一般)
- 検出容易な文字パターン生成に関する検討(テーマセッション1,複合現実感のためのパターン認識・理解)
- ペン先カメラ画像からの手書きパターンの抽出(テーマセッション1,複合現実感のためのパターン認識・理解)
- レイアウトに依らない平面文書画像の射影歪み補正(テーマセッション5,複合現実感のためのパターン認識・理解)
- データ埋め込みペンに関する基礎的検討
- 三次元物体認識に用いる局所特徴量の取捨選択によるメモリ使用量削減手法の実験的検討(研究速報)
- 局所特徴量を用いた画像照合による特定物体認識 (特集 大規模画像データ処理)
- 局所特徴量の照合による線画の部分的複製検出(テーマセッション4,複合現実感のためのパターン認識・理解)
- 特徴点の配置に基づく画像検索手法の解析 : Geometric Hashing とLLAHの比較
- 一般物体認識における学習データセットのサイズ拡張による影響の解析(一般,First Person Visionのための認識・理解)
- 第13回パターン認識国際会議 (13th ICPR) 報告
- 局所特徴量の部分空間を用いた3次元物体認識におけるメモリ削減手法(一般,First Person Visionのための認識・理解)
- Webカメラを用いた多言語文書画像のリアルタイム検索システム(テーマセッション4,複合現実感のためのパターン認識・理解)
- 特徴点の局所的配置に基づく文書画像モザイキングの実験的検討(テーマセッション5,複合現実感のためのパターン認識・理解)
- ドイツ人工知能研究センター(DFKI)の20年 : 成功への道筋とそれを可能とした人々
- 特徴点の局所的配置に基づく位置合わせを用いた文書からの書き込み抽出法(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 特徴ベクトルの近傍探索と物体認識の効率に関する実験的検討(テーマ関連セッション1)
- 特徴点の局所的配置に基づく物体認識の精度・速度に関する一考察(テーマ関連セッション1)
- 特徴点の局所的配置に基づくリアルタイム文書画像検索とその拡張現実への応用(テーマ関連セッション1)
- 特徴点の局所的配置に基づくディジタルカメラを用いた高速文書画像検索(画像認識,コンピュータビジョン)
- 情報リサイクルのための文書の書き込み解析
- デジタルカメラを用いた高速文書画像検索におけるアフィン不変量および相似不変量の利用(テーマセッション,文字認識・文書理解)
- LI-001 デジタルカメラによる文書画像検索 : 1万ページから0.1秒で検索する(I分野:画像認識・メディア理解)
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- D-5-2 画像検索のための視覚化インタラクティブ・モジュール(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-5-1 語の共起の統計情報を用いた画像と説明文の対応付け(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-12-63 デジタルカメラを用いた文書画像検索の一手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-62 デジタルカメラを用いた文書画像からの書き込み抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- 文字の2次元出現密度分布に基づく文書画像の関連部分検索
- サポートベクトルマシンを用いた新聞記事からのプロフィール情報抽出
- カメラによる文字認識のためのカテゴリー情報の埋込に関する検討(画像認識,コンピュータビジョン)
- 局所特徴量を用いた画像照合による特定物体認識(大規模画像データ処理)
- 特徴点の局所的配置に基づくリアルタイム文書画像検索とその拡張現実への応用(テーマ関連セッション,事例ベースメディア解析)
- 近似最近傍探索を用いた物体認識のための多段階化とその効果(一般セッション,データ工学とメディア理解との融合)
- 認識が与える情報量 : 認識率100%まであと何ビット?(文書・文字メディアの認識・理解, 一般)
- An interface for embedding online information during writing (パターン認識・メディア理解)
- 621 在宅酸素療法患者の看護支援システムに関する研究(WS-2 高齢者,身障者向けのデザイン)
- データ埋め込みペン実現に向けたデータ抽出精度の検証(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2),文字認識・文書理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2), 文字認識・文書理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- 隣接グラフを用いた欧文文書画像からの文字列抽出 (画像の認識・理解)
- D-12-15 弛緩法に基づく文書画像のレイアウト解析
- 一般図形ボロノイ図に基づく文書画像からの文字列抽出
- データ埋め込みペンの実装(テーマセッション,文字・文書の認識・理解)
- ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元(テーマセッション,文字・文書の認識・理解)
- リアルタイム単語認識技術を利用したカメラベース情報取得システム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- 特徴追跡と文書画像検索を用いたカメラペンシステム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- 局所特徴量のハッシングによる大規模画像検索
- 特徴ベクトルの近傍探索と物体認識の効率に関する実験的検討(テーマ関連セッション,事例ベースメディア解析)
- 特徴点の局所的配置に基づく物体認識の精度・速度に関する一考察(テーマ関連セッション,事例ベースメディア解析)
- デジタルカメラを用いた高速文書画像検索におけるアフィン不変量および相似不変量の利用(テーマセッション,文字認識・文書理解)
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- 窓関数を用いた部分テキスト検索 -固定長法と出現密度法の比較-
- 窓関数を用いた部分テキスト検索 : ベクトル空間法と出現密度法の比較
- 単語の出現密度分布と偏出度を用いた図表と説明テキストの対応付け
- 単語の出現密度分布を用いた図表と説明テキストの対応付け
- カメラ撮影文字の事例に基づく実時間認識(テーマセッション,文字・文書の認識・理解)
- 付加情報の誤りと誤認識率の関係(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- 付加情報を用いるパターン認識における識別境界移動の効果 : 正規分布に従う人工サンプルを用いた場合の実験的検討
- 姿勢特徴のn-gram表現を用いた人物行動による物体認識(一般セッション,Computational Photography)
- 参照特徴ベクトルの増加による低品質画像の高速・高精度認識
- 点配置の一意性を利用した高速なアフィン不変形状認識(テーマセッション4,複合現実感のためのパターン認識・理解)
- 3日で作る高速特定物体認識システム
- 文書画像の事例ベース傾き補正の改良(テーマセッション1,文字・文書の認識・理解)
- 事例に基づく文書画像の回転角推定(研究速報)
- 特定物体認識における Bloomier Filter を用いたメモリ削減法とその実験的評価
- 階層的概念構造に基づく再プランニング