環境音モデルとHMM合成による音声区間検出法の文章発話への適用

スポンサーリンク

概要

論文の詳細を見る
著者らは, 音声と環境音が重畳している場合にも頑健かつ効率的な音声区間検出を行うために, 環境音モデルとHMM合成を用いる方法を提案している.提案法では, まず音声と環境音のモデルを用いてビタビアライメントを求め, 音声に重畳している環境音を予測する.そして, 音声と予測した環境音の重畳モデルをHMM合成により作成し, この重畳モデルを加えて再度ビタビアライメントを求める.その結果, 音声と環境音が重畳している区間, 重畳している環境音とそのSN比を推定する.本稿では, 提案法を複数の音声区間が存在する文章発話の場合に拡張する.9通りの環境音を文章発話に重畳し, 音声区間検出実験を行った結果, 提案法の検出正解率は従来法と比べて最大で4.7%改善していることが明らかとなった.
一般社団法人情報処理学会の論文
2001-12-20

著者

関連論文

もっと見る

スポンサーリンク