野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
スポンサーリンク
概要
- 論文の詳細を見る
野球中継中のハイライトシーン映像を外出中の野球ファンヘ自動配信することを目的とした場合、リアルタイム内で処理可能なハイライトシーン検出法が必要となる.この問題を解決するためには、映像のディジタル化の処理を始めとして,映像解析・メタ情報の付与,ハイライトシーンの自動編集を自動的にリアルタイム内でオンラfレ処理することが必要となる.本研究では、音声認識技術と高速な映像解析技術を統合することにより、野球中継映像中のハイライトシーンをリアルタイム内で自動的に抽出するシステムの部分システムとして,PC(Pitcher and Catcher)シーンを高速・高精度に抽出する手法について報告する.実験を行った結果,実時間の1/20〜1/30内で処理が可能であり,F尺度により,95%の精度を達成した.
- 社団法人電子情報通信学会の論文
- 2003-07-10
著者
-
藤本 雅清
日本電信電話株式会社NTTコミュニケーション科学基礎研究所
-
有木 康雄
龍谷大学理工学部
-
藤本 雅清
ATR音声言語コミュニケーション研究所
-
藤本 雅清
龍谷大学理工学部
-
熊野 雅仁
龍谷大学理工学部電子情報学科
-
塚田 清志
株式会社毎日放送メディア開発局
-
神崎 伸夫
龍谷大学理工学部
-
濱口 伸
株式会社毎日放送
-
清瀬 基
株式会社毎日放送
-
塚田 清志
毎日放送
-
濱口 伸
毎日放送
-
清瀬 基
毎日放送
-
塚田 清志
大阪株式会社開発部
-
塚田 清志
株式会社毎日放送
関連論文
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマ関連セッション2)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 部分空間法と自己組織型ネットワークを用いた複数顔領域の切り出し
- 音響・言語モデルの適応処理によるスポーツ実況中継の音声認識(音声,聴覚)
- 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
- ニュース音声中の語彙反復による情報検索 : 部分空間射影に基づく話者正規化の応用
- 部分空間射影による話者正規化を用いた不特定話者HMM
- 話者部分空間への写像に基づく話者正規化の複数話者に対する有効性
- 話者部分空間への写像による話者認識と話者正規化
- キーワードスポッティングによる商品紹介映像の商品区間への分割方法の検討
- テロップ文字確認に基づくTVニュース記事の自動分類
- テロップ認識における平滑化雑音除去について
- ニュース映像中の文字認識に基づく記事の索引付け
- マルチモーダルインタラクションによるニュース映像中の人物認識(システム論文特集号)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(第8回音声言語シンポジウム)
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 音声区間検出の基礎と最近の研究動向(音声・言語・音響教育,一般)
- Dirichlet事前分布を用いた音声区間検出の検討
- 音声区間検出技術の最近の研究動向
- 多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 : マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合(テーマセッション2,アンビエント環境知能)
- Dirichlet事前分布を用いた音声区間検出の検討(韻律・VAD,第11回音声言語シンポジウム)
- 映像文法に基づいた映像編集支援システムのための使用可能なショット区間の自動抽出(画像処理)
- 映像文法に基づく映像編集支援システム
- 映像編集支援システムのためのショットサイズ自動付与(オフィスシステム論文小特集)
- アクティブ探索を用いた映像編集支援のためのショットサイズ自動判定
- アクティブ探索を用いた映像編集支援のためのショットサイズ自動判定
- アクティブ探索を用いた映像編集支援のためのショットサイズ自動判定
- D-12-20 アクティブ探索を用いた映像編集支援のためのショットサイズ判定
- SD-5-7 映像文法と映像解析に基づく編集支援システムの検討
- D-12-138 映像編集支援システムのための人物に関するインデキシング
- D-12-64 線の方向性と映像の構図に基づく撮影方向の判定
- 音声認識システムSOLONの日本語話し言葉コーパスによる評価(2006年版)(Session-7 システム,第8回音声言語シンポジウム)
- 文字切り出しの改善によるテロップ文字認識の精度向上
- 分散発展型データベースシステム技術の研究 (メディア統合および環境統合のための高機能データベースシステム、および一般)
- K-60 ニュース映像に対する発話内容と人物問い合わせシステム(ヒューマンインタフェース(HI)3,K.ヒューマンコミュニケーション&インタラクション)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- ポスター会話に対する発話区間検出と話者識別の検討(コミュニケーション・対話,第9回音声言語シンポジウム)
- 音声情報と画像情報の併用による商品紹介映像のセグメンテーション(音声,聴覚)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性ひずみの抑圧(音声, 聴覚)
- GMMに基づく音声信号推定法と時間領域SVDに基づく音声強調法の併用による雑音下音声認識(音声, 聴覚情報論的学習理論論文)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(耐雑音)(第5回音声言語シンポジウム)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMとEMアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧(第5回音声言語シンポジウム : 耐雑音)
- GMMに基づく音声信号推定法の改良と実走行車内音声による評価
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 野球中継のハイライトシーン実時間配信を目的としたPCシーンの自動検出(映像・マルチメディアとパターン認識・理解)
- 音声認識を用いたスポーツ実況中継におけるハイライトシーン検出
- 雑音に頑健な音声認識のための時間領域SVDとGMMに基づく音声信号推定法の統合
- 時間領域SVDとGMMに基づく音声信号推定法の統合による雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- GMMに基づく音声信号推定法を用いた雑音下音声認識
- キーワードスポッティングを用いた情報検索システムにおける拡張辞書の効果
- SD-3-4 テレビ放送を対象としたキーワードスポッティングによる音声対話型情報検索
- 音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別(音響信号処理/一般)
- I-47 映像文法に基づいた映像編集支援システムのための使用可能ショット区間自動抽出と索引付け(画像応用,I.画像認識・メディア理解)
- SD-5-6 テロップ文字認識による商品紹介映像の商品区間への分割方法
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 音響情報と映像情報の統合による多人数会話における話者決定技術(音響処理・話者同定,第10回音声言語シンポジウム)
- 単語の相関空間における英語・日本語ニュースの相互検索
- 英語・日本語ニュースの相互検索の検討
- 日本語話し言葉音声認識のための音節に基づく音響モデリング(音声,聴覚)
- 日本語話し言葉音声認識のための音節に基づく高精度な音響モデルの検討
- 日本語話し言葉音声認識のための音節に基づく高精度な音響モデルの検討
- 日本語話し言葉音声認識のための音節に基づく高精度な音響モデルの検討
- 音素誤り最小化デコーディングに基づく音響モデルの教師なし適応化
- 音声認識と話者認識を統合した話者の人名付与システム(音声言語情報処理とその応用)
- トピックセグメンテーションに基づく講義ビデオの構造化の検討
- 音素事後確率に基づく信頼度を用いた音響モデルの教師なし適応化
- 音素事後確率に基づく信頼度を用いた音響モデルの教師なし適応化
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識(音響処理・話者同定,第10回音声言語シンポジウム)
- 確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察(認識,理解,対話,一般)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 雑音除去とモデル適応を併用した雑音下音声認識 : AURORA2タスクでの評価
- マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
- マイクロフォンアレイとカルマンフィルタを用いたノイズロバストなハンズフリー音声認識の検討
- カルマンフィルタに基づく音声信号推定法を用いた雑音環境下での音声確認
- 雑音除去音声に対する特徴量抽出とMLLR適応の統合による雑音に頑健な音声認識
- カルマンフィルタと繰り返しMLLR適応を用いた非定常雑音下での音声認識
- 部分空間と混合分布モデルを用いた声質変換
- 音声の時間変化モデルに基づく音声信号指定法を用いた非定常雑音下での音声認識
- 雑音の時間変動を考慮にいれた雑音除去法の検討
- AR-GARCHモデルに基づいた音声区間検出手法の提案(音声,聴覚)
- 自動抽出されたアナウンサー発話に対するニュースディクテーションと記事分類
- 時期差を考慮した部分空間法による話者認識
- 複数の音声区間検出法の適応的統合の検討と考察
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 複数の音声区間検出法の適応的統合の検討と考察(雑音・VAD,第9回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- 音声と雑音両方の状態遷移過程を有する雑音下音声区間検出(Session-1 検出,第8回音声言語シンポジウム)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 話者適応と雑音混合モデル推定の同時適用による雑音抑圧(耐雑音処理,第13回音声言語シンポジウム)
- 音声区間検出の基礎と世界的な研究動向,今後の展開
- 音声の周期・非周期成分分解に基づく話者認識の検討(一般セッション,音声・言語・対話,一般)