背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ文字認識
スポンサーリンク
概要
- 論文の詳細を見る
映像から切り出されたテロップ文字の認識では, 輪郭形状の鋸状劣化及び背景の残存ノイズが問題となる.本論文では, この問題に対処する(1)輪郭形状の劣化にロバストなWLDC特徴と(2)ノイズの影響を抑制する動的修正ユークリッド距離を用いたテロップ文字認識手法を提案する.(1)は, 背景及び文字両領域の形状を記述・正規化することにより, 輪郭形状の劣化に対するロバスト性を高めた特徴である.(2)は, 局所領域ごとに画素の変動量を求め, 画素の変動量に応じて距離値を修正することにより, ノイズの影響を動的に抑制する識別関数である.人工的に画質を劣化させた文字を用いた認識実験の結果, 各提案手法は劣化文字に対して従来法より大幅に認識率が向上することを確認した.また, 実映像中のテロップ文字を用いた認識実験では, 提案手法により識別率73%, 第10位累積分類率90%の結果を得た.
- 社団法人電子情報通信学会の論文
- 2000-07-25
著者
-
鈴木 章
Nttサイバースペース研究所
-
倉掛 正治
(株)NTTドコモネットワーク研究所
-
杉村 利明
Nttヒューマンインタフェース研究所:(現)(株)nttドコモ
-
倉掛 正治
Nttヒューマンインタフェース研究所
-
塩 昭夫
NTTヒューマンインタフェース研究所
-
森 稔
Nttコミュニケーション科学基礎研究所
-
森 稔
NTTサイバースペース研究所
-
倉掛 正治
Nttドコモマルチメディア研究所
-
倉掛 正治
NTTサイバースペース研究所
-
塩 昭夫
日本電信電話株式会社nttサイバースペース研究所:(現)nttアイティ株式会社
-
倉掛 正治
株式会社nttドコモネットワーク研究所
関連論文
- 構図と色情報を用いた類似画像検索のための低次元グローバル特徴量抽出手法(画像映像処理・システム,ネットワーク,放送,一般)
- 携帯電話機搭載カメラを用いた読取り条件にロバストなID読取り方式(画像認識、コンピュータビジョン)
- 複数カメラを用いたテレプレゼンスシステムに関する検討
- モバイル環境下における携帯端末を用いたID読取方式の検討
- 車載ラインセンサカメラを用いた都市景観データ取得システム
- ラインセンサによる都市データ取得システム
- L-037 コミュニティを用いたサービス利用知識流通機構(L分野:ネットワークコンピューティング)
- 同時確率増分符号相関を用いた高速物体検出・識別
- D-12-16 類似パターン検索にもとづく図形・文字入力方式
- FAX入力手書き図面認識のためのかすれ度合自動評価と線分つなぎ処理制御法の提案
- 特定マーク抽出にもとづくFAX入力帳票の傾斜補正法 : テンプレートに白黒両画素を含む拡張型一般化ハフ変換の適用
- 特定マーク抽出にもとづくFAX入力帳票の傾斜補正法:テンプレートに白黒画素を含む拡張型一般化ハフ変換の適用
- 23-10 図形の位置と白黒反転状態の情報を同時に抽出する一般化ハフ変換
- 23-9 動的2値化法を用いたFAX帳票画像の雑音除去
- 渋滞情報を用いた旅行時間推計方法
- 映像中のテロップ表示フレーム検出方法
- D-12-10 映像中に挿入された部分画像検出方法
- 映像中の静止/ロールテロップの検出方法
- PC版映像中テロップ認識システム
- ライン単位の二値化による映像中文字領域の抽出方法
- D-12-99 因子分解法に基づく回転運動画像列からの三次元形状復元(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- モバイル・ユビキタス環境における利用知識の流通に向けて(「21世紀の知識情報科学に向けて」,及び一般)
- ストローク間の距離情報と構造情報とを用いた変型の大きい文字のオンライン認識
- 有効範囲付テンプレート追加登録法による辞書学習
- 映像中の流れるテロップ文字列の抽出方法
- 色劣化に対処する映像中文字領域の抽出方法
- 映像検索のためのテロップ文字認識の検討
- 優先度管理規則と同時生起規則とを用いたオンライン続け字認識におけるストローク結合情報設定法
- オンライン文字認識における差分ストロークを用いた詳細識別
- 携帯型ペン入力インタフェース用個人辞書の学習
- 単語認識系における遺伝アルゴリズムを用いたキー文字選択の最適化
- D-12-121 因子分解法による複数物体の構造復元の検討
- D-11-114 空間周波数フィルタを用いた構造物抽出の一検討
- 空中撮影画像に対するカメラ運動を与えた因子分解法による構造復元
- センサ情報を与えた因子分解法による物体構造復元
- 拡張平均移動法による階層的クラスタリング
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 顔認識のための3次元形状復元に基づく任意視点顔画像生成(テーマ関連セッション2,三次元画像,多視点画像)
- 距離を用いた点対応付けと変形パターンの生成
- モルフォロジーフィルタの利用による航空写真の影領域の選択的画質改善法
- D-12-15 動的修正識別関数の雑音重畳文字に対する評価
- D-11-69 影領域を選択的に補正する航空写真の画質改善法
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))
- 局所的な隠蔽・照明反射・複雑背景に対処するアピアランスベースの3次元物体認識(テーマ関連セッション(2))(CVのためのパターン認識・学習理論の新展開)
- 実写ライブ動画映像を用いた移動体ナビゲーションの試み : Mobile Magic View
- 地理情報探索のためのデータ構造の一検討
- 低品質文字の認識における単語照合の精度推定法
- パターン間照合を利用した文字認識結果の確認修正法
- 文字位置のずれを許容する枠なし筆記住所認識
- 日本語OCRにおける認識結果の一括修正
- 未登録語の出現を考慮した単語認識
- 手書き文字認識の適応型後処理制御
- 文書情報蓄積検索システムの検討
- 手書き住所認識の後処理法
- 距離情報を用いた景観画像中のオブジェクト推定
- コミュニティに応じたアドレッシングを行うメタアドレス通信の提案
- ユビキタスセンサとのインタラクションに基づくユーザ支援システム
- ユビキタスセンサとのインタラクションに基づくユーザ支援システム
- 背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ文字認識
- 画質劣化にロバストな映像中テロップ文字認識
- 画質劣化を考慮した映像中文字認識
- 画像インデクシングを目的としたテキスト領域抽出不要の景観中文字認識 : 階層的認識辞書の適用による処理量の削減(マルチメディアとパターン認識理解,一般)
- B-15-2 ユーザ状況を考慮したモバイル端末向けプッシュ型情報配信システムの構築(B-15.モバイルマルチメディア通信,一般講演)
- プッシュ型情報通知システムにおけるモバイルユーザ向けコンテンツ選択制御(MBL5:アプリケーションプラットフォーム)
- プッシュ型情報通知システムにおけるモバイルユーザ向けコンテンツ選択制御(MBL5:アプリケーションプラットフォーム)
- サービスナビゲーションにおけるタスク選択支援のためのユーザコンテキスト抽出
- サービスナビゲーションにおけるタスク選択支援のためのユーザコンテキスト抽出
- サービスナビゲーションにおけるタスク選択支援のためのユーザコンテキスト抽出
- B-26 待ち受けiアプリの設計と評価(Webアプリケーション,B.ソフトウェア)
- M-72 携帯電話網を利用した分散コンピューティングセキュリティに関する一考察(携帯端末(2),M.ネットワーク・モバイルコンピューティング)
- 自動学習形補完法を用いた文字認識後処理
- 線画映像を用いてプライバシー保護に配慮したビジュアルサポートシステム
- 複数情報の統合による看板文字認識
- 景観中文字認識のための対象物適応型複数カメラ視線制御方式
- 対象物適応型カメラ視線制御による景観内文字領域抽出法
- カメラ画像の文字領域判別と適正2値化法
- 景観中文字認識アプリケ-ション用基本機能モジュ-ル開発支援システム
- 撮像斜影歪みを利用した文字平面の単眼視姿勢推定
- 非正読文字が高頻度で発生する単語認識系の性能推定法
- M-057 モバイル環境におけるサービスナビゲーションのためのユーザコンテキストモデルに関する研究(M.ネットワーク・モバイルコンピューティング)
- ユビキタスセンサを用いたユーザ状態の時空間表現と状態判別によるユーザ支援システム(一般セッション(8))(データマイニングとパターン認識・メディア理解)
- 景観画像中の候補文字集合に対する変形角度推定を用いたキーワード抽出および検索技術
- 複数メンバの視線カメラ映像を利用した体験の記録と有効区間検出
- M-34 無線オーバレイノードによる高密度無線マルチホップ通信(モバイル/アドホックネットワーク(2),M.ネットワーク・モバイルコンピューティング)
- 血管の接続性を考慮したパノラマ眼底画像の作成
- ユビキタスインタフェース技術 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- モバイルコミュニケーションスタイルの創造 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- 新しいコンセプトに基づいたコミュニケーションに向けて--HC3の実現を目指して (新概念通信特集)
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- 「遺伝的アルゴリズムを用いた類似文字識別のための特徴選択
- 線画映像コミュニケーションにおける対話ストラテジーと対話特性
- 歩行指導のための足底の部位別荷重パラメータの提案
- 勾配ベースの画像特徴量の視認性低下を目的とする遺伝的アルゴリズムを用いた特徴選択
- ろう者の緊急通報読取りにおける手話と日本語の相互補完性(福祉工学)
- 遺伝的アルゴリズムを用いた特徴と学習サンプルの同時選択とその文字認識への応用
- 緊急通報のリスト手話提示における言語間の相互補完性(福祉工学)
- 高い識別率と低い次元数を共に実現させる遺伝的アルゴリズムを用いた特徴選択とその文字認識への応用
- 映像視聴によるスポーツ動作分析のための画像情報提示方法
- マージン最大化の考え方を導入した遺伝的アルゴリズムによる特徴選択とその文字認識への応用