エッジ密集度によるテロップ文字フレーム検出誤り抑制法
スポンサーリンク
概要
- 論文の詳細を見る
我々は映像中のテロップ文字情報インデクシングをリアルタイムで実現する技術について検討を進めている。テロップインデクシングは、テロップフレーム検出処理、テロップ文字領域抽出処理、テロップ文字認識処埋の3モジュールから構成される。本稿では、従来提案しているテロップフレーム検出処理の問題点の一つであった誤検出(テロップが表示されていないフレームを誤って検出すること)を抑制する方法を提案する。 従来の方法は、テロップの持つ「出現後一定時間静止して表示される」という特徴に着目したフレーム間の輝度差分値を利用する方法である。前フレームとの間の局所的輝度ヒストグラム差分値が大きく、且つ後続フレームに渡り静止している高コントラストな画素の個数(エッジ一致度)の多いフレームをテロップフレームとして検出する。これは、背景部の変化を無視して、静止したテロップを含むフレームを検出する効果を持つ。しかし、テロップ以外の物体が出現後、一定時間静止して表示される場合にも誤って検出する問題があった。これは、検出に用いる特徴量(輝度ヒストグラム差分、エッジ一致度)にテロップとテロップ以外の物体の違いを強調する「文字らしさ」が十分反映されていないためである。以下では、出現物体がテロップかテロップ以外の物体かを判断するために、「文字らしさ」を反映したエッジペア特徴、及びこれを用いた誤検出の削減方法を提案し、評価実験結果及び考察を述べる。
- 社団法人電子情報通信学会の論文
- 1997-08-13
著者
-
新井 啓之
日本電信電話株式会社NTTサイバースペース研究所
-
新井 啓之
NTTサイバースペース研究所
-
倉掛 正治
Nttヒューマンインタフェース研究所
-
桑野 秀豪
NTTヒューマンインタフェース研究所
-
新井 啓之
NTTヒューマンインタフェース研究所
-
新井 啓之
北大理
-
小倉 健司
NTTヒューマンインタフェース研究所
-
桑野 秀豪
Nttサイバーソリューション研究所
-
小倉 健司
NTTインテリジェントテクノロジ株式会社
-
倉掛 正治
株式会社nttドコモネットワーク研究所
関連論文
- ディジタルサイネージの広告効果測定技術(学生/教養のページ)
- MCMC法に基づく対象と環境に三次元モデルを用いた人物追跡(画像認識,コンピュータビジョン)
- 単眼動画像を用いた近接する複数対象の三次元追跡(一般,膨大なデータから学ぶもの)
- 映像からの人数推定における遺伝的アルゴリズムを使ったカメラパラメータの調整(知的センシングと知的制御)
- 携帯電話機搭載カメラを用いた読取り条件にロバストなID読取り方式(画像認識、コンピュータビジョン)
- 複数カメラを用いたテレプレゼンスシステムに関する検討
- モバイル環境下における携帯端末を用いたID読取方式の検討
- 多視点カメラを用いた個人識別のための歩行特徴量に関する検討(テーマ関連セッション1)
- D-12-13 多視点カメラを用いた個人識別のための歩行特徴量抽出(D-12. パターン認識・メディア理解,一般セッション)
- 多視点カメラを用いた個人識別のための歩行特徴量に関する検討(テーマ関連セッション1,三次元画像,多視点画像)
- 画像処理による広告効果測定技術 (特集 デジタルサイネージのメディア化に向けた研究開発)
- 幾何モデルに基づく映像からの人数推定(マルチメディア情報入力及び処理方式および一般)
- 確率的予測に基づく人流計測(一般セッション(4))
- プロジェクタ・カメラシステムにおける射影変換行列と直線パターン検出に基づく複数平面の検出
- 映像からの人数計測のための幾何不変量に関する検討 (画像工学)
- 映像からの人数計測のための幾何不変量に関する検討 (映像表現&コンピュータグラフィックス・放送技術・メディア工学)
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- 高精細長尺実写画像を用いた3次元仮想空間構築システムの提案 : 屋内データによる実現性の確認([A]画像処理, コンピュータビジョンI)(マルチメディアおよび一般)
- D-12-9 異なる照明下で撮影されたスペクトル画像間の分光照明強度比推定
- 眼底画像中の動静脈識別法の提案
- グループトピックス 商用高分解能衛星画像による森林域の状況把握
- 6C-5 非定常行動検出における特徴量の検討(画像処理応用,一般セッション,人工知能と認知科学)
- D-12-118 複数の特徴抽出法の選択による非定常行動検出(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- 単眼動画像を用いた近接する複数対象の三次元追跡(一般,膨大なデータから学ぶもの)
- 多視点カメラを用いた個人識別のための歩行特徴量に関する検討(テーマ関連セッション1,三次元画像,多視点画像)
- 映像中のテロップ表示フレーム検出方法
- D-12-10 映像中に挿入された部分画像検出方法
- 映像中の静止/ロールテロップの検出方法
- PC版映像中テロップ認識システム
- ライン単位の二値化による映像中文字領域の抽出方法
- I-064 複数の外乱に対するロバスト性を考慮した静止物体検出方法(グラフィクス・画像,一般論文)
- 画像パターン特徴とノイズを考慮したオプティカルフローの確率分布推定法(PRMU一般, データ工学とメディア理解との融合)
- モバイル・ユビキタス環境における利用知識の流通に向けて(「21世紀の知識情報科学に向けて」,及び一般)
- ヒューマンインフォメーション(メディア情報,映像情報メディア年報)
- ヒューマンインフォメーション(メディア情報,映像情報メディア年報)
- 映像中の流れるテロップ文字列の抽出方法
- 色劣化に対処する映像中文字領域の抽出方法
- 映像検索のためのテロップ文字認識の検討
- 色の変化にロバストな被写体抽出方法の検討
- エッジ密集度によるテロップ文字フレーム検出誤り抑制法
- 映像中被写体検索のための部品抽出方法の検討
- 映像中被写体検索のための部品抽出方法
- 映像検索のためのテロップ情報自動インデクシング
- 矩形ブロックマッチングによる帳票識別方法
- 認識技術を用いた映像中キーターゲットインデクシングの検討
- 線分情報と閉領域形状に着目した手書き建築間取り図面理解システム
- 閉領域の形状と配置に基づく建築間取り図面認識
- 背景領域に注目した文字記入領域抽出法
- 力学系の定性的同定問題
- 文字認識精度に対応した日本語文書入力方式
- モルフォロジーフィルタの利用による航空写真の影領域の選択的画質改善法
- D-11-69 影領域を選択的に補正する航空写真の画質改善法
- D-12-44 集団速度の推定に基づく映像からの通過人数測定方法(D-12.パターン認識・メディア理解,一般セッション)
- デジタルサイネージの配信システムと効果測定技術
- 相互相関と二乗差を用いた照明変化にロバストな静止物体検出方法(センサネットワーク,Webにおける映像メディア処理,応用及び一般)
- 相互相関と二乗差を用いた照明変化にロバストな静止物体検出方法(センサネットワーク,Webにおける映像メディア処理,応用及び一般)
- インテリジェントな映像モニタリングを目指して (特集 映像モニタリングサービスを支える画像処理技術)
- 映像からの逆行者検知方法
- ユビキタス環境での状態系列モデルを用いたユーザ支援システム(ユビキタスコンピューティングと情報家電)(ユビキタス環境のモバイル通信システムとITS)
- 背景・文字の形状特徴と動的修正識別関数を用いた映像中テロップ文字認識
- 画質劣化にロバストな映像中テロップ文字認識
- 画質劣化を考慮した映像中文字認識
- 大規模な分散環境におけるユビキタス情報発見サービス(ネットワークプロトコル)
- M-057 モバイル環境におけるサービスナビゲーションのためのユーザコンテキストモデルに関する研究(M.ネットワーク・モバイルコンピューティング)
- ユビキタスセンサを用いたユーザ状態の時空間表現と状態判別によるユーザ支援システム(一般セッション(8))(データマイニングとパターン認識・メディア理解)
- ユビキタスインタフェース技術 (新概念通信特集)
- 映像からの逆行者検知方法(画像処理II, ITS画像処理,映像メディア及び一般)
- 映像からの逆行者検知方法(画像処理II,ITS映像メディア及び一般)
- 柔軟なインタフェース適応のためのWebサービスグループ管理システム(ネットワークサービス)(次世代移動体通信システム)
- 携帯機用モバイルサーバミドルウェア(モバイルコンピューティングとユビキタス通信高度交通システム合同研究報告)
- 携帯機用モバイルサーバミドルウェア(モバイルコンピューティングとユビキタス通信高度交通システム合同研究報告)
- 携帯機用モバイルサーバミドルウェア
- 携帯機用モバイルサーバフレームワークの提案(モバイルと組込み技術)
- 耐障害性・応答性向上のためのモバイルWebサービスプラットフォーム
- 無線マルチホップ・アクセスネットワークにおける経路制御及びハンドオーバ制御方式(無線アドホックネットワーク技術論文特集)
- シームレスサービスのためのモバイルセッションプロトコル
- ユビキタスインタフェース技術 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- 全体が観測できないときのLVQを用いた線形状の認識
- ニューラルネットと適応的ベクトル量子化器を利用した線図形の認識
- 文字認識のための手書き漢字変形モデル学習法 (画像処理技術)
- HMMを用いた動画像からの動作認識の高精度化と評価
- モバイルコミュニケーションスタイルの創造 (特集 モバイルコミュニケーションスタイルを変革する新インタフェース技術)
- 新しいコンセプトに基づいたコミュニケーションに向けて--HC3の実現を目指して (新概念通信特集)
- 関節のある動物体の記述と追跡
- 27p-W-2 CdMnTe, ZnMnTe励起子発光に対する磁場効果
- 27p-W-1 CdMnTeの発光III
- 5p-W-11 CdMnTeのMn^発光 I
- 30a-Y-1 CdMnTeの発光(圧力、温度依存症) II
- 5a-C-17 CdMnTeの発生(圧力、温度依存性) I
- カラー画像からの高速テロップ文字領域抽出法
- テロップ情報自動インデクシングシステムリアルタイム版
- 映像データ検索のためのテロップ文字抽出法
- 映像中文字領域抽出のためのカラー画像セグメンテーション
- デジタルサイネージの配信システムと効果測定技術
- D-12-2 群集の流動解析における特徴点マッチング手法の検討(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 単眼動画像を用いた近接する複数対象の三次元追跡
- 単眼動画像を用いた近接する複数対象の三次元追跡
- 符号化照明を使ったライト・トランスポートの獲得(画像・メディア処理技術,および一般)
- 3次元点群からの局所形状と大域的な形状モデルを用いた柱状物体検出(テーマセッション,大規模データベースとパターン認識)