発話者情報によるテレビシーン検索のための字幕情報を用いた話者識別(ポスターセッション,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
録画機器の発達に伴い,大量の映像コンテンツがアーカイブ化されている.そのため,視聴者の要求する映像をすばやく提供するために,メタデータによる検索システムが数多く提案されている.本研究では従来手法によってメタデータの自動抽出が行われていないドラマ,アニメーション,バラエティ番組を対象とする.これらの番組の全ての台詞に対して発話者情報をメタデータとして抽出する.具体的には,デジタル放送に付与されている字幕情報を活用することで識別モデルの高精度化を行う.また,同時に発話傾向を考慮した話者の出現頻度を用いて識別結果を重み付けすることによって効果的なディジタル放送の話者識別を実現する.20番組を用いて評価を行った結果,従来手法より5.7%改善された.
- 2011-12-12
著者
関連論文
- 5U-7 携帯端末への話者照合を用いたセキュリティロック(音声インタフェース・システム,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- 発話者情報によるテレビシーン検索のための字幕情報を用いた話者識別(ポスターセッション,第13回音声言語シンポジウム)
- 発話者情報によるテレビシーン検索のための字幕情報を用いた話者識別(ポスターセッション,第13回音声言語シンポジウム)