複雑背最中の多色テロップの認識方式の検討(テーマセッション,文字・文書の認識と理解)
スポンサーリンク
概要
- 論文の詳細を見る
映像中の複雑背景上の多色文字列の認識手法を提案する.大量に録画されたTV番組の効率的な検索方法としてテロップ文字情報を使用する方法が挙げられる.テロップ文字認識では,テロップ領域と出現区間を求め,求めた領域内部から文字パターンを抽出し認識を行う.従来は,複雑な背景や複数の文字色が使用されるテロップの文字パターン抽出が困難であったため,背景の一様性や文字色に対する制約を設ける必要があった.本報告では,この制約を緩和するための一方式として,カラーテロップ画像を色によって分解し,各色分解画像上に現れる文字候補から文字列を再構成する方式を提案する.文字列の再構成では,各分解画像で得られた文字候補に対する文字認識確信度,文字の並びの連続性,色の連続性をコストとしたDynamic Programming (DP)法によって文字列を構成する文字を選択する.複雑背景上の一行多色文字列の文字認識評価で,従来の一行同一色に対応したテロップ認識技術よりも認識再現率で大幅な向上を実現した.
- 2011-03-03
著者
-
皆川 明洋
(株)富士通研究所
-
堀田 悦伸
(株)富士通研究所
-
皆川 明洋
株式会社富士通研究所:ソフトウェア&ソリューション研究所言語・メディア研究部
-
勝山 裕
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
桂 天宜
Fujitsu Research and Development Center Co., Ltd.
-
堀田 悦伸
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
桂 天宜
Fujitsu Research And Development Center Co. Ltd.
関連論文
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- 確率伝搬法を用いた帳票の論理構造認識に関する一方式
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- クラスタリングによる個人筆記特性に基づく数字認識の改善方式
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- セグメンテーションの負荷を軽減した手書き住所認識
- セグメンテーションの負荷を軽減した手書き住所認識 : 接触文字の分離機能を持つキー文字抽出方式
- セグメンテーションの負荷を軽減した手書き住所認識
- 種々の画像特徴を用いた手書数字の訂正線判定方式
- クラスタリングによる個人筆記性を用いた文字認識方式
- 手書きカナ文字の切り出し信頼度の定量化とその活用法
- 帳票認識技術の応用と展開(複合現実感のためのパターン認識・理解)
- 二値化閾値の補正による低解像度画像に頑強な文字抽出用二値化(テーマセッション,文字・文書の認識と理解)
- 複雑背最中の多色テロップの認識方式の検討(テーマセッション,文字・文書の認識と理解)
- 対象知識を利用した文書画像の2値化(画像認識,コンピュータビジョン)