自動学習による話者セグメンテーション
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、話者照合の技術をメディア処理に応用する方法と問題点について述べる。メディア処理としては、ニュース音声からアナウンサーの発話区間 (話者区間) を切り出す処理、座談会において参加者の発話区間を切り出す処理を目的としている。ニュース音声では、アナウンサーの発話区間を自動抽出することにより、ニュース記事の切り出しが可能となる。また、座談会では、参加者の発話区間を自動的に切り出すことにより、各参加者の意見をデータベース化することが可能となる。話者照合の方法としては、リアルタイム処理のために、部分空間法に基づく手法を採用している。
- 1997-11-21
著者
関連論文
- 部分空間法と自己組織型ネットワークを用いた複数顔領域の切り出し
- 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用
- ニュース音声中の語彙反復による情報検索 : 部分空間射影に基づく話者正規化の応用
- 部分空間射影による話者正規化を用いた不特定話者HMM
- 話者部分空間への写像に基づく話者正規化の複数話者に対する有効性
- 話者部分空間への写像による話者認識と話者正規化
- キーワードスポッティングによる商品紹介映像の商品区間への分割方法の検討
- テロップ文字確認に基づくTVニュース記事の自動分類
- テロップ認識における平滑化雑音除去について
- ニュース映像中の文字認識に基づく記事の索引付け