テロップ認識のための映像からのロバストな文字部抽出法 (<特集>画像の認識・理解論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,映像中に現れるテロップの文字部をOCRで判読できるように,精度良く切り出す方法を提案する.従来の研究では,映像中のテロップを背景から切り出す方法としてテロップの輝度が背景に比べて高いことを利用し,しきい値を決めて2値化する方法がとられていた.しきい値の決め方として,背景と文字の二つの輝度の分布を仮定した大津の方法や大津の方法を局所ブロックに用いた塩の方法がある.しかし,映像のように背景に様々な輝度を含むものでは,必ずしも仮定が成り立たず,良いしきい値が得られないという問題があった.また,実際には,影付け,縁取り及び信号変換処理の影響で文字の周辺で必ずしも輝度が高くなく,OCRで判読可能な十分な精度で文字を切り出すことができなかった.そこで,文字部の輝度分布をロバストに推定し,文字部として信頼度の高い領域を最初に抽出し,推定された分布に基づいて領域拡張を行い,文字部のみを切り出す方法を提案する.実,験の結果,従来手法より精度良く文字部を検出できOCR判読率が向上することを示す.
- 社団法人電子情報通信学会の論文
- 2001-08-01
著者
-
堀 修
(株)東芝研究開発センター
-
堀 修
株式会社東芝 研究開発センター
-
堀 修
(株)東芝 研究開発センター マルチメディアラボラトリー
-
三田 雄志
(株)東芝研究開発センターマルチメディアラボラトリー
-
三田 雄志
(株)東芝研究開発センター
-
三田 雄志
(株)東芝 研究開発センター
関連論文
- 時空間画像の自己相似性を用いたオブジェクト輪郭抽出(ディジタルデータ付き論文小特集)
- 顔パーツを利用した隠れを含む顔の検出手法
- 顔検出に適した共起に基づくJoint Haar-like特徴(パターン認識)
- I-004 移動するテロップの自動認識(I分野:画像認識・メディア理解)
- 個体差のある対象の画像照合に適した確率的増分符号相関(顔・身体動作認識, 画像の認識・理解論文)
- スポーツ映像要約のための状態遷移モデルを利用したナレーション生成
- スポーツ映像要約のための状態遷移モデルを利用したナレーション生成(放送・サービス, ITS画像処理, 映像メディア及び一般)
- オブジェクトの位置情報を利用したモバイル機器用映像クリッピングシステム(映像メディア処理,感性情報工学及び一般)
- 時空間画像の自己相似性を用いたオブジェクト輪郭の抽出
- 時空間画像の自己相似性を用いたオブジェクト輪郭の抽出(オフィスにおけるマルチメディア通信,ディジタルアーカイブ,及び一般)
- オブジェクト内部の動き推定による輪郭変形(オフィスにおけるマルチメディア通信および一般)
- オブジェクト内部の動き推定による輪郭変形
- SD-3-10 参加者の切り出し画像を実時間で共有するチャットシステムの開発
- 顔チャットシステム (特集 実用化時期を迎えたMPEG-4)
- テロップ認識のための映像からのロバストな文字部抽出法 (画像の認識・理解論文特集)
- 画像超解像のための閉ループ学習による代表事例の学習方法(画像・映像処理)
- 増分符号を用いた隣接ブロックの適合度評価による学習型超解像(一般セッション12)
- 増分符号を用いた隣接ブロックの適合度評価による学習型超解像(一般セッション4,三次元画像,多視点画像)
- 歪みを最小化する高周波成分の学習に基づく超解像度化方法(一般セッション7)
- 歪みを最小化する高周波成分の学習に基づく超解像度化方法(一般セッション7,顔・ジェスチャの認識・理解)
- 3.2 ストリームメディア通信サービス(モバイルインターネット・サービス)(モバイルインターネット)
- 統計的手法による画像からの顔領域の抽出 (画像の認識・理解)
- 輪郭・骨格・画像情報の統合による緑図形からのオブジェクト抽出
- 8-5 MPEGソフトウェアトランスコーダの試作
- 増分符号を用いた隣接ブロックの適合度評価による学習型超解像(一般セッション4,三次元画像,多視点画像)
- 歪みを最小化する高周波成分の学習に基づく超解像度化方法(一般セッション7,顔・ジェスチャの認識・理解)
- スポーツ映像要約のための状態遷移モデルを利用したナレーション生成(放送・サービス, ITS画像処理, 映像メディア及び一般)
- 画像特徴量[III] : 輝度に着目した画像特徴量と顔検出
- 時空間画像の自己相似性を用いたオブジェクト輪郭の抽出(オフィスにおけるマルチメディア通信,ディジタルアーカイブ,及び一般)
- オブジェクト内部の動き推定による輪郭変形
- 自動プレゼンテーションシステム(2) : 文書からの資料作成
- 自動プレゼンテーションシステム(1) : プレゼンテーションシステムの概要
- サムネイルのプログレッシブ・ダウンロードによる狭帯域ネットワークを介した映像のブラウジング手法
- 映像ブラウジングのための類似ショット統合 ( ビデオとハイパーメディアのインターフェース、および一般)
- 細胞・輪郭線を用いた図形の高品位な直線・円弧近似手法について
- ベクトル編集と同様の操作性を持ったイメージ編集機能の開発
- 小領域のブロックマッチングを複数用いたロバストなオブジェクト追跡法
- テンプレートマッチングに適した追跡点選択手法
- ゆう度比検定を用いたMPEGビットストリームからの動画像カット検出手法
- ロバスト統計を用いたハイパーメディア作成のための高速移動物体追跡法
- 尤度比検定による MPEG 圧縮動画像からのカット検出
- 映像解析技術を利用した映像メディアのためのGUI
- 動きベクトル符号量を用いたMPEG動画像からの高速カット検出
- MPEG動画像の高速カット検出方式
- AdaBoostの基本原理と顔検出への応用 : CVIM研究会 チュートリアルシリーズ(チュートリアル2)
- MPEG-7の概要(マルチメディア内容記述の国際標準MPEG-7)
- マルチメディアコンテンツ内容記述国際標準MPEG-7の概要とその応用 : 内容記述(メタデータ)はどのように作成されるか?
- 繰返しショットの統合による段層化アイコンを用いたビデオ・インタフェース(次世代ヒューマンインタフェース・インタラクション)
- 人物画像処理技術とその応用(一般セッション(2),人の検出・計測・認識)
- 人物画像処理技術とその応用(一般セッション(2),人の検出・計測・認識)
- 人物画像処理技術とその応用
- マルチメディア内容記述標準MPEG-7とその応用
- テロップ認識のための映像からの文字部抽出法
- 輪郭線と細線を用いた直線・円弧当てはめによる図面のベクトル化
- 図形あてはめによる円・円弧抽出手法
- こう配法の誤差モデルとオプティカルフローの定量的な信頼度(動画像処理論文特集)
- 定量的信頼度を伴うオプティカルフローの計算法
- 既存図面自動読取システムにおける補正エディタの開発
- 地図利用情報管理システムMINDS(5)地図自動つなぎ合わせシステム
- シャッターメガネ式立体ディスプレイのための信号処理によるクロストーク低減技術(立体映像技術一般)
- 3Dディスプレイのクロストーク低減技術
- 2D3D変換技術
- 8-9 フレームシーケンシャル方式3D液晶テレビのクロストークシミュレーション技術(第8部門 立体映像技術)