ユーザの簡易指定に基づく情景中の文字抽出と認識(画像情報)

概要

論文の詳細を見る
情景画像中の文字を認識し, その文字情報に基づいた様々なコンテンツを利用することができれば, 非常に利便性が高い.これを実現するための技術として解決しなければならない重要な課題は, 複雑な情景画像中の所望の文字をいかに抽出し認識するかということである.本論文では, ユーザが簡易に指定した領域の情報を基に, 正確な文字領域を抽出し認識する手法を提案する.これは, すべての領域を自動抽出しその後ユーザに所望の領域を選択させるよりも, あらかじめユーザに位置を指定させた方が計算量や抽出精度の点で有利であると考えられるためである.この際, ユーザが正確に領域を指定する必要がないことが, 使いやすさのうえで重要であると考える.提案手法は, 可変テンプレートをベースとして, ユーザが指定した初期領域と同じ性質を持つ最大の領域を抽出することで最終的な文字領域を抽出する.領域抽出後は, 判別分析法による2値化, 射影により各文字パターンを切り出し認識を行う.
一般社団法人情報処理学会の論文
2005-10-15