カメラを用いたレイアウトフリー文書画像検索(一般セッション,時系列パターン認識)

概要

論文の詳細を見る
本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法(従来手法と呼ぶ)を提案した.すなわち,(1)単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2)メッシュ特徴による特徴抽出,(3)単語クラスタIDのn-gramによる索引付け,の3つである.しかし,従来手法には3つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gramの特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像320枚をクエリ画像とし,データベースの画像2,500枚に対して検索実験を行ったところ,検索精度88.1%,処理時間671[ms]を得た.検索精度については,従来手法の42.8%,OCRを用いた手法の70.3%から大幅に改善しており,処理時間についても,OCRを用いた手法の1/5であったことから,有効性が実証された.
2012-02-02