テロップ認識のための映像からのロバストな文字部抽出法 (<特集>画像の認識・理解論文特集)

概要

論文の詳細を見る
本論文では,映像中に現れるテロップの文字部をOCRで判読できるように,精度良く切り出す方法を提案する.従来の研究では,映像中のテロップを背景から切り出す方法としてテロップの輝度が背景に比べて高いことを利用し,しきい値を決めて2値化する方法がとられていた.しきい値の決め方として,背景と文字の二つの輝度の分布を仮定した大津の方法や大津の方法を局所ブロックに用いた塩の方法がある.しかし,映像のように背景に様々な輝度を含むものでは,必ずしも仮定が成り立たず,良いしきい値が得られないという問題があった.また,実際には,影付け,縁取り及び信号変換処理の影響で文字の周辺で必ずしも輝度が高くなく,OCRで判読可能な十分な精度で文字を切り出すことができなかった.そこで,文字部の輝度分布をロバストに推定し,文字部として信頼度の高い領域を最初に抽出し,推定された分布に基づいて領域拡張を行い,文字部のみを切り出す方法を提案する.実,験の結果,従来手法より精度良く文字部を検出できOCR判読率が向上することを示す.
社団法人電子情報通信学会の論文
2001-08-01