オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)

スポンサーリンク

概要

論文の詳細を見る
教師なし・オンラインの音声区間検出(VAD)方法を提案する。オンラインEMは学習データのない未知の環境にも適用できる枠組みであるが、雑音のみの区間や音声のみの区間が連続すると、モデルの更新が適切に行われないという問題があった。これに対して、提案手法は変分ベイズEM(VB-EM)学習に基づいており、その過程で得られる自由エネルギー(Free Energy)をモデルの信頼度比較に利用するものである。VB-EMをオンライン学習に定式化し、モデルパラメータとモデル信頼度の推定を同時・逐次的に行う。CENSREC-1-Cを用いた音声区間検出の評価実験により、提案手法が従来のオンラインEMよりも有意に効果的であることを確認した。
2009-01-30

著者

関連論文

もっと見る

スポンサーリンク