機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
スポンサーリンク
概要
- 論文の詳細を見る
動画データの増加に伴い,動画データに対するシーン検索の要求が高まっている.我々の研究グループでは,動画内のテロップ情報に着目し,テロップ文字列や出現時間からメタデータを生成してシーン検索を行うシステムを開発してきた.本稿では文字列や出現時間以外に,色や位置の情報も特徴量として考慮し,さらにメタデータ生成に機械学習の手法を取り入れる.学習用動画のテロップに対して人手で会話字幕や見出し等のテロップ表示意図のクラス分けを行い,テロップ用のクラス分類器を生成する.未知の動画のテロップに分類器を適用してテロップの表示意図を推定することでメタデータ生成に利用する.
- 2011-05-30
著者
-
勝山 裕
株式会社富士通研究所
-
直井 聡
株式会社富士通研究所
-
渡辺 陽介
東京工業大学学術国際情報センター
-
横田 治夫
東京工業大学
-
直井 聡
(株)富士通研究所
-
横田 治夫
東京工大 大学院情報理工学研究科
-
横田 治夫
東京工業大学学術国際情報センター:東京工業大学大学院情報理工学研究科
-
直井 聡
(株)富士通研究所 マルチメディアシステム研究所
-
横田 治夫
東京工業大学学術国際センター|東京工業大学大学院情報理工学研究科計算工学専攻
-
渡辺 陽介
東京工業大学 学術国際情報センター
-
渡辺 陽介
東京工業大学
関連論文
- 分散ストリーム処理システムにおける高信頼化方式の提案(ストリーム処理,情報爆発論文)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- Webサーチを活用したTVテロップ認識率向上手法(一般,膨大なデータから学ぶもの)
- テロップ文字パターン抽出の一検討(テーマセッション6,文字・文書の認識・理解)
- 文字認識技術を利用した講義動画のスライド同定--文字配置の類似度によるスライド同定方式と講義動画のスライド同定作業コストの削減効果
- 対象情報源の動的変化を考慮した分散ストリーム処理最適化手法の提案(セッション7b:ストリーム・スカイライン)
- 大規模映像ストリームのための映像情報統合基盤システムの提案
- 講義講演シーン検索におけるレーザポインタ情報の活用法(コンテンツ技術,データ工学論文)
- D-11-108 プレプリント接触数字認識の一方式
- 音声情報を統合したプレゼンテーションコンテンツ検索(情報検索,データ工学論文)
- 分散ストリーム処理システムにおける高信頼化方式の提案
- 文書間の色一様性に基づく文書画像群からの機密パターン抽出(ソフトコンピューティング及び一般)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning,夏のデータベースワークショップDBWS 2006)
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 講義・講演シーン検索におけるスライドおよび音声中の検索語出現状況に基づくレーザーポインタ情報のフィルタリング(e-Learning)
- 講演シーン検索における検索語出現状況に基づくレーザーポインタ情報のフィルタリング
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップDBWS2005)
- 時系列データベースとストリーム処理の統合のためのデータモデルの提案(ストリームデータ1, 夏のデータベースワークショップ2005)
- 平行測地線からの形状復元によるデジカメ文書画像の歪み補正(テーマセッション3(文字画像処理2),文字・文書の認識・理解)
- D-12-146 認識誤りに対応した単語抽出方式(D-12.パターン認識・メディア理解,一般講演)
- D-12-141 文字ペア特有の識別情報を使用した類似文字認識に関する一検討(D-12.パターン認識・メディア理解,一般講演)
- D-12-30 消失点検出にハイブリッド手法を用いた携帯デジカメ撮影画像のための透視歪み補正(D-12.パターン認識・メディア理解,一般講演)
- e-文書・内部統制向け文書画像認識技術 (特集 研究開発最前線)
- D-12-88 文字列抽出用/図表抽出用の2種類の2値化方式を使用したカラー文書画像レイアウト解析手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-86 混色と薄い色使いにも強いカラー帳票レイアウト復元手法(D-12.パターン認識・メディア理解,一般講演)
- D-12-65 複数の処理結果統合によるテキストブロック抽出手法(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-42 仮説検証に基づく再帰的テキストブロック抽出手法(D-12.パターン認識・メディア理解A)
- D-11-94 平行測地線からの形状復元による画像歪み補正についての一検討(D-11.画像工学D)
- D-12-80 デジタルカメラと電子ペンを用いた紙情報入力についての一検討
- ディジタルカメラ画像からの罫線抽出の一方式
- D-12-19 非接触入力による濃淡画像からの罫線抽出方式
- ファイルRMC操作を考慮した関連ファイルの発見
- ファイルRMC操作を考慮した関連ファイルの発見
- テロップ情報による語学番組シーン検索手法の評価
- ユーザ作業を反映する仮想ディレクトリ生成のためのアクセス履歴解析手法
- 対象情報源を動的に選択可能なストリーム処理の実装と評価
- ファイルRMC操作を考慮した関連ファイルの発見
- ユーザ作業を反映する仮想ディレクトリ生成のためのアクセス履歴解析手法
- アクセス履歴に基づくファイル間関連度を用いたデスクトップ情報管理ツールの開発(ウェブ情報とデータベースに関して(ポスター講演))
- 文字認識技術を利用した講義動画のスライド同定(画像・映像処理)
- メディア工学シンポジウム聴講報告
- 企業から個人のためのOCRへ
- D-11-65 信頼性の高い文字要素を利用した帳票画像からの行抽出処理(D-11. 画像工学,一般セッション)
- 形態素解析とキーワード領域内の候補文字ラティス情報を用いた単語照合による文書画像の高精度検索方式(画像検索, 画像の認識・理解論文)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- 講義ビデオ中のレーザーポインタ抽出の一検討(文字とドキュメントの認識・理解)
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援 : 動画とスライドの対応付けとポインティング情報抽出(INFOSTAシンポジウム2003一般発表)(INFOSTAシンポジウム2003)
- 文字と画像のマッチチングを用いた講義動画中のスライド同定
- D-12-69 講義動画中のスライド同定を利用したレーザーポインタの同期表示
- 講義講演シーン検索における音声データの利用(eラーニング1, 夏のデータベースワークショップDBWS2005)
- 講義講演シーン検索における音声データの利用(eラーニング1, 夏のデータベースワークショップ2005)
- 3ZP-4 アクセスログ解析を用いて同一作業で使用されたファイル群を発見する手法の提案(情報爆発時代におけるデータマイニング・アルゴリズム,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 特徴ベクトルの差分分布の利用に基づく学習擬似ベイズ識別法
- 3T-5 ストリーム処理における情報源の動的選択機能(センサデータベースとコンテンツ,学生セッション,データベースとメディア)
- ラベル画像の階層的矩形表現を用いた罫線抽出方式
- データストリーム管理システムHarmonicaの設計と実装
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム,夏のデータベースワークショップDBWS 2006)
- 分散環境におけるストリーム処理の高信頼化(ストリーム,夏のデータベースワークショップDBWS 2006)
- ストリーム管理システムにおける永続化要求の妥当性評価(ストリーム)
- 分散環境におけるストリーム処理の高信頼化(ストリーム)
- 実世界情報ストリームの高度利用のための統合環境
- 6ZN-3 語学番組検索システムにおけるシーン区切り検出手法(情報爆発時代におけるマルチメディア処理,学生セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 文字特徴からの特徴合成に基づく単語一括認識(画像認識, コンピュータビジョン)
- クラスタリングによる個人筆記特性に基づく数字認識の改善方式
- 文字特徴からの特徴合成に基づく動的単語一括認識
- 文字特徴からの特徴合成に基づく単語一括認識
- D-12-17 連続DPを用いた英数接触活字の切り出しと認識
- セグメンテーションの負荷を軽減した手書き住所認識
- セグメンテーションの負荷を軽減した手書き住所認識 : 接触文字の分離機能を持つキー文字抽出方式
- セグメンテーションの負荷を軽減した手書き住所認識
- 種々の画像特徴を用いた手書数字の訂正線判定方式
- クラスタリングによる個人筆記性を用いた文字認識方式
- GIM法による表形式枠接触文字の分離
- 異種データストリーム統合基盤 : Stream Spinner(ウェブ情報とデータベースに関して(ポスター講演))
- 6ZK-1 分散ストリーム処理管理システムORINOCOの評価(情報爆発時代におけるストリームデータと実世界情報処理,学生セッション,「情報爆発」時代に向けた新しいIT基盤技術)
- 統合プレゼンテーションコンテンツ蓄積検索システムの試作(マルチメディア情報検索, データ工学論文)
- D-32 教育コンテンツを対象とした情報統合における利用者インタフェース(ネットワークサービスとDB,D.データベース)
- 枠接触文字分離法『GIM』の改良 : ループ形状特徴の評価の追加
- D-12-64 形態素と候補文字情報を用いた文書画像の高精度検索方式
- D-12-14 特徴ベクトルの差分分布の利用に基づくフォントフリー文字認識手法
- 枠接触文字の分離法『GIM』の評価 : 文字の位置ずれと枠の雑音,線幅変動の影響
- GIM法による枠接触文字の分離効果
- 枠接触変動と認識の信頼度に関する知識獲得による枠接触文字の分離法GIM-II
- 枠接触文字の分離法『GIM』の評価 : 文字線分の連続性/不連続性による復元効果
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (パターン認識・メディア理解)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法 (データ工学)
- LI-5 文字認識を利用した講義動画中のスライド同定(I. 画像認識・メディア理解)
- D-12-20 カラー文書のモアレモデルを用いた高速文字パターン抽出法
- 背景模様付き見出しからの文字列抽出 : 連結成分の組合せの認識評価による抽出
- ビジネス文書を対象としたキ-ワ-ド自動抽出技術
- 未知文書とモデル文書の基準罫線対を適応的に用いる高精度高速フォーム識別方式
- ビジネス文書における高速タイトル抽出方式
- e-ラーニング向け講演ビデオ複合コンテンツの作成支援--動画とスライドの対応付けとポインティング情報抽出 (INFOSTAシンポジウム2003--情報サービスソリューションに向けて)
- 文字認識と画像マッチングを利用した講義動画のスライド同定
- D-12-25 判別分析を用いた手書き文字と活字の判別方法
- 文字の形状特徴を利用した可変ウィンドウサイズによる高速ラベリング手法
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
- 機械学習を用いたテロップ表示意図推定による動画メタデータ生成手法(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)