カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法(従来手法と呼ぶ)を提案した.すなわち,(1)単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2)メッシュ特徴による特徴抽出,(3)単語クラスタIDのn-gramによる索引付け,の3つである.しかし,従来手法には3つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gramの特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像320枚をクエリ画像とし,データベースの画像2,500枚に対して検索実験を行ったところ,検索精度88.1%,処理時間671[ms]を得た.検索精度については,従来手法の42.8%,OCRを用いた手法の70.3%から大幅に改善しており,処理時間についても,OCRを用いた手法の1/5であったことから,有効性が実証された.
- 2012-02-02
著者
関連論文
- 線画の著作権保護のための部分的複製検出法(画像検索-局所特徴量,情報爆発論文)
- 付加情報の一般的な割当(パターン認識)
- 特徴点の配置に基づく画像検索手法の解析 : Geometric HashingとLLAHの比較(画像認識,コンピュータビジョン)
- 特定物体認識におけるBloomier Filterを用いたメモリ削減法とその実験的評価(パターン認識応用,画像の認識・理解論文)
- 参照特徴ベクトルの増加による低品質画像の高速・高精度認識(パターン認識応用,画像の認識・理解論文)
- 物体認識技術に基づく実物体からのリンク機能の実現(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- 物体認識技術に基づく実物体からのリンク機能の実現(一般セッション5)
- カメラ付き携帯電話を入力デバイスとした大規模画像認識(一般セッション5,コンピュータビジョンとパターン認識のための学習理論)
- カメラ付き携帯電話を入力デバイスとした大規模画像認識(一般セッション5)
- データベースおよびクエリの拡張による文書画像検索の精度向上法 (ヒューマン情報処理)
- 人物動作のn-gram表現に基づく物体認識(テーマセッション関連,一般物体認識・画像特徴量)
- 人物動作の n-gram 表現に基づく物体認識
- 大規模静止画像DBの検索
- 近さの多段階表現に基づく近似最近傍探索(テーマセッション関連,一般物体認識・画像特徴量)
- 隣接バケット探索を用いた近似最近傍探索手法の解析(一般セッション,実世界センシングとその応用)
- 近似最近傍探索の多段階化による高速特定物認識(画像認識,コンピュータビジョン)
- Bloomier Filterを用いた特定物体認識手法の性能に関する実験的検討(テーマセッション関連,一般物体認識・画像特徴量)
- 特定物体認識(チュートリアル,一般物体認識・画像特徴量)
- 大規模特定物体認識における認識率,処理時間,メモリ量のバランスに関する実験的検討(パターン認識と学習,第12回画像の認識・理解シンポジウム推薦論文,画像の認識・理解論文)
- 特定物体認識におけるBloomier Filterを用いたメモリ削減(一般セッション,実世界センシングとその応用)
- 特定物体認識のためのデータベース容量削減法の検討 : 局所特徴量の量子化と取捨選択(一般セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 特定物体認識のためのデータベース容量削減法の検討 : 局所特徴量の量子化と取捨選択(一般セッション4)
- ディジタルペン
- リアルタイム単語認識技術を利用したカメラベース情報取得システム (パターン認識・メディア理解)
- Webカメラを用いたリアルタイム文書画像検索(研究速報,画像の認識・理解論文)
- ペン先画像からの手書き復元(研究速報)
- 近似最近傍探索を用いた物体認識のための多段階化とその効果(一般セッション,データ工学とメディア理解との融合)
- 認識が与える情報量 : 認識率100%まであと何ビット?(文書・文字メディアの認識・理解, 一般)
- 検出容易な文字パターン生成に関する検討(テーマセッション1,複合現実感のためのパターン認識・理解)
- ペン先カメラ画像からの手書きパターンの抽出(テーマセッション1,複合現実感のためのパターン認識・理解)
- レイアウトに依らない平面文書画像の射影歪み補正(テーマセッション5,複合現実感のためのパターン認識・理解)
- データ埋め込みペンに関する基礎的検討
- 三次元物体認識に用いる局所特徴量の取捨選択によるメモリ使用量削減手法の実験的検討(研究速報)
- 局所特徴量を用いた画像照合による特定物体認識 (特集 大規模画像データ処理)
- 局所特徴量の照合による線画の部分的複製検出(テーマセッション4,複合現実感のためのパターン認識・理解)
- 特徴点の配置に基づく画像検索手法の解析 : Geometric Hashing とLLAHの比較
- 一般物体認識における学習データセットのサイズ拡張による影響の解析(一般,First Person Visionのための認識・理解)
- 第13回パターン認識国際会議 (13th ICPR) 報告
- 局所特徴量の部分空間を用いた3次元物体認識におけるメモリ削減手法(一般,First Person Visionのための認識・理解)
- Webカメラを用いた多言語文書画像のリアルタイム検索システム(テーマセッション4,複合現実感のためのパターン認識・理解)
- 特徴点の局所的配置に基づく文書画像モザイキングの実験的検討(テーマセッション5,複合現実感のためのパターン認識・理解)
- ドイツ人工知能研究センター(DFKI)の20年 : 成功への道筋とそれを可能とした人々
- 特徴点の局所的配置に基づく位置合わせを用いた文書からの書き込み抽出法(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 特徴ベクトルの近傍探索と物体認識の効率に関する実験的検討(テーマ関連セッション1)
- 特徴点の局所的配置に基づく物体認識の精度・速度に関する一考察(テーマ関連セッション1)
- 特徴点の局所的配置に基づくリアルタイム文書画像検索とその拡張現実への応用(テーマ関連セッション1)
- 特徴点の局所的配置に基づくディジタルカメラを用いた高速文書画像検索(画像認識,コンピュータビジョン)
- 情報リサイクルのための文書の書き込み解析
- デジタルカメラを用いた高速文書画像検索におけるアフィン不変量および相似不変量の利用(テーマセッション,文字認識・文書理解)
- LI-001 デジタルカメラによる文書画像検索 : 1万ページから0.1秒で検索する(I分野:画像認識・メディア理解)
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- D-5-2 画像検索のための視覚化インタラクティブ・モジュール(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-5-1 語の共起の統計情報を用いた画像と説明文の対応付け(D-5. 言語理解とコミュニケーション, 情報・システム1)
- D-12-63 デジタルカメラを用いた文書画像検索の一手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-62 デジタルカメラを用いた文書画像からの書き込み抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- 文字の2次元出現密度分布に基づく文書画像の関連部分検索
- サポートベクトルマシンを用いた新聞記事からのプロフィール情報抽出
- カメラによる文字認識のためのカテゴリー情報の埋込に関する検討(画像認識,コンピュータビジョン)
- 局所特徴量を用いた画像照合による特定物体認識(大規模画像データ処理)
- 特徴点の局所的配置に基づくリアルタイム文書画像検索とその拡張現実への応用(テーマ関連セッション,事例ベースメディア解析)
- 近似最近傍探索を用いた物体認識のための多段階化とその効果(一般セッション,データ工学とメディア理解との融合)
- 認識が与える情報量 : 認識率100%まであと何ビット?(文書・文字メディアの認識・理解, 一般)
- An interface for embedding online information during writing (パターン認識・メディア理解)
- 621 在宅酸素療法患者の看護支援システムに関する研究(WS-2 高齢者,身障者向けのデザイン)
- データ埋め込みペン実現に向けたデータ抽出精度の検証(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2),文字認識・文書理解)
- 手書きパターンへの情報埋め込みと情報抽出(テーマセッション(2), 文字認識・文書理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- 隣接グラフを用いた欧文文書画像からの文字列抽出 (画像の認識・理解)
- D-12-15 弛緩法に基づく文書画像のレイアウト解析
- 一般図形ボロノイ図に基づく文書画像からの文字列抽出
- データ埋め込みペンの実装(テーマセッション,文字・文書の認識・理解)
- ペン先カメラ画像と紙面上特徴点を用いた手書きパターンの復元(テーマセッション,文字・文書の認識・理解)
- リアルタイム単語認識技術を利用したカメラベース情報取得システム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- データベースおよびクエリの拡張による文書画像検索の精度向上法(一般,顔・人物・ジェスチャ・行動)
- 特徴追跡と文書画像検索を用いたカメラペンシステム(テーマセッション(デモ発表特集),文字・文書の認識・理解)
- 局所特徴量のハッシングによる大規模画像検索
- 特徴ベクトルの近傍探索と物体認識の効率に関する実験的検討(テーマ関連セッション,事例ベースメディア解析)
- 特徴点の局所的配置に基づく物体認識の精度・速度に関する一考察(テーマ関連セッション,事例ベースメディア解析)
- デジタルカメラを用いた高速文書画像検索におけるアフィン不変量および相似不変量の利用(テーマセッション,文字認識・文書理解)
- 複比とハッシュに基づく文書画像検索(文書・文字メディアの認識・理解, 一般)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- ハッシュを利用した近似最近傍探索における隣接バケット参照の精度とメモリ使用量の理論式の導出(一般セッション,クロスモーダル)
- 窓関数を用いた部分テキスト検索 -固定長法と出現密度法の比較-
- 窓関数を用いた部分テキスト検索 : ベクトル空間法と出現密度法の比較
- 単語の出現密度分布と偏出度を用いた図表と説明テキストの対応付け
- 単語の出現密度分布を用いた図表と説明テキストの対応付け
- カメラ撮影文字の事例に基づく実時間認識(テーマセッション,文字・文書の認識・理解)
- 付加情報の誤りと誤認識率の関係(一般セッション,パターン認識・メディア理解のための学習理論とその周辺)
- 付加情報を用いるパターン認識における識別境界移動の効果 : 正規分布に従う人工サンプルを用いた場合の実験的検討
- 姿勢特徴のn-gram表現を用いた人物行動による物体認識(一般セッション,Computational Photography)
- 参照特徴ベクトルの増加による低品質画像の高速・高精度認識
- 点配置の一意性を利用した高速なアフィン不変形状認識(テーマセッション4,複合現実感のためのパターン認識・理解)
- 3日で作る高速特定物体認識システム
- 文書画像の事例ベース傾き補正の改良(テーマセッション1,文字・文書の認識・理解)
- 事例に基づく文書画像の回転角推定(研究速報)
- 特定物体認識における Bloomier Filter を用いたメモリ削減法とその実験的評価
- 階層的概念構造に基づく再プランニング