テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
大量に録画されたTV番組の効率的な検索方法としてテロップ文字情報を使用する方法が有効である.テロップ文字認識では,テロップ出現区間,領域を求め,そこから文字パターンを抽出し認識を行う.本報告は,この中の文字パターン抽出に関する.テロップ領域について,表示区間の平均画像を色クラスタリングして色分解画像を生成する.マルチフレーム情報等でノイズを削除後,文字認識結果を使用して正しい文字パターン行を抽出する.その中からキー文字を求め,それを中心に文字候補矩形の集合を複数個生成し,認識結果の距離値情報と文字間隔情報を使用して正しい組合せを選択しノイズを除去した文字パターンを生成する.ニュース番組から取得した83テロップについて,文字矩形の角座標で評価を行い,再現率93.3%,適合率91.6%を達成した.
- 2008-02-14
著者
-
勝山 裕
株式会社富士通研究所
-
勝山 裕
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
白 洪亮
Fujitsu Research and Development Center Co., Ltd.
-
武部 浩明
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
藤本 克仁
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
-
藤本 克仁
株式会社富士通研究所
-
藤本 克仁
富士通研究所
-
藤本 克仁
(株)富士通研究所
-
武部 浩明
株式会社富士通研究所
-
白 洪亮
Fujitsu Research And Development Center Co. Ltd.
-
武部 浩明
(株)富士通研究所
-
勝山 裕
(株)富士通研究所ソフト&ソリ研究所言語・メディア研究部
関連論文
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- 文字認識技術を利用した講義動画のスライド同定--文字配置の類似度によるスライド同定方式と講義動画のスライド同定作業コストの削減効果
- 低解像度テキスト画像の高速かつ高精度な2値化方式
- D-11-108 プレプリント接触数字認識の一方式
- 文書間の色一様性に基づく文書画像群からの機密パターン抽出(ソフトコンピューティング及び一般)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning,夏のデータベースワークショップDBWS 2006)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning)
- 講演シーン検索における検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 二値化閾値の補正と罫線形状判定による罫線抽出の高精度化(テーマセッション1,文字・文書の認識・理解)
- 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- D-12-142 参照画像の動的合成に基づく罫線接触文字の一括認識(D-12.パターン認識・メディア理解,一般講演)
- D-12-141 文字ペア特有の識別情報を使用した類似文字認識に関する一検討(D-12.パターン認識・メディア理解,一般講演)
- D-12-30 消失点検出にハイブリッド手法を用いた携帯デジカメ撮影画像のための透視歪み補正(D-12.パターン認識・メディア理解,一般講演)
- e-文書・内部統制向け文書画像認識技術 (特集 研究開発最前線)
- 確率伝搬法を用いた帳票の論理構造認識に関する一方式
- D-12-88 文字列抽出用/図表抽出用の2種類の2値化方式を使用したカラー文書画像レイアウト解析手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-86 混色と薄い色使いにも強いカラー帳票レイアウト復元手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-65 複数の処理結果統合によるテキストブロック抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-42 仮説検証に基づく再帰的テキストブロック抽出手法(D-12.パターン認識・メディア理解A)
- D-11-94 平行測地線からの形状復元による画像歪み補正についての一検討(D-11.画像工学D)
- D-12-80 デジタルカメラと電子ペンを用いた紙情報入力についての一検討
- ディジタルカメラ画像からの罫線抽出の一方式
- D-12-19 非接触入力による濃淡画像からの罫線抽出方式
- 低解像度カラー文書画像から高品質な文字画像を抽出する二値化方式
- テロップ情報による語学番組シーン検索手法の評価
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- D-11-65 信頼性の高い文字要素を利用した帳票画像からの行抽出処理(D-11. 画像工学,一般セッション)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援 : 動画とスライドの対応付けとポインティング情報抽出(INFOSTAシンポジウム2003一般発表)(INFOSTAシンポジウム2003)
- 文字と画像のマッチチングを用いた講義動画中のスライド同定
- D-12-69 講義動画中のスライド同定を利用したレーザーポインタの同期表示
- スキャナで取得した画像におけるポストプリント・パターンのインク色と背景色との混色及びその補正に関する一考察(テーマセッション,文字・文書の認識・理解)
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 6ZN-3 語学番組検索システムにおけるシーン区切り検出手法(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- D-12-50 マークパターンが重畳された文字に対する認識方式(D-12.パターン認識・メディア理解,一般セッション)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- D-12-17 連続DPを用いた英数接触活字の切り出しと認識
- テクスチャ領域を含む帳票画像からの罫線抽出(テーマセッション2(文字画像処理1),文字・文書の認識・理解)
- グラフ表現を利用した手書き数字列のセグメンテーション方式(テーマセッション7,文字・文書の認識・理解)
- 文字仮説の多重生成による帳票画像からの単語抽出方式(テーマセッション1,文字・文書の認識・理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- 複数セル候補の組み合わせ探索に基づく帳票画像からのセル抽出(テーマセッション,文字認識・文書理解)
- D-12-64 形態素と候補文字情報を用いた文書画像の高精度検索方式
- D-12-14 特徴ベクトルの差分分布の利用に基づくフォントフリー文字認識手法
- 特徴領域の射影推定による高速高精度な大分類方式
- 図書の電子化のための文書認識技術 (特集 電子図書館を支える技術)
- 圧縮文字特徴と原特徴を併用した高速かつ高精度な文書認識方式
- 正読確立を用いた高速高精度な文字認識方式
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (パターン認識・メディア理解)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (データ工学)
- LI-5 文字認識を利用した講義動画中のスライド同定(I. 画像認識・メディア理解)
- D-12-20 カラー文書のモアレモデルを用いた高速文字パターン抽出法
- 背景模様付き見出しからの文字列抽出 : 連結成分の組合せの認識評価による抽出
- ビジネス文書を対象としたキ-ワ-ド自動抽出技術
- 未知文書とモデル文書の基準罫線対を適応的に用いる高精度高速フォーム識別方式
- ビジネス文書における高速タイトル抽出方式
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援--動画とスライドの対応付けとポインティング情報抽出 (INFOSTAシンポジウム2003--情報サービスソリューションに向けて)
- 文字認識と画像マッチングを利用した講義動画のスライド同定
- 交点追跡と全体最適化に基づく罫線抽出誤りに頑強な表項目セル抽出(画像認識,コンピュータビジョン)
- 複雑背最中の多色テロップの認識方式の検討(テーマセッション,文字・文書の認識と理解)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム(一般セッション,人の視聴覚情報処理とPRMUの接点)
- デジタルペンを活用したグループワーク電子化支援システム
- デジタルペンを活用したグループワーク電子化支援システム
- 最適2次元セグメンテーションによる情景内文字抽出(画像認識,コンピュータビジョン)