実環境下単語音声区間検出のための雑音EHMM再学習の効果

スポンサーリンク

概要

論文の詳細を見る
単語認識を行う際に初めの段階の処理として単語音声区間検出がある。我々はエルゴディック隠れマルコフモデル (EHMM) を利用して雑音と音声の音響的特徴の差から雑音下の単語音声区間を検出する方法を検討し、振幅や零交差数を用いた方法に比べS/N比が低い場合に効果があることを示した。これを実環境で応用する場合は時間と共に変化する雑音の性質に対して、雑音EHMMのパラメータをリアルタイムに適応させる必要がある。本実験では検出すべき単語の直前の雑音による雑音EHMM再学習が検出にもたらす効果について調べた。その結果、実際の環境で雑音EHMMを適応させることにより、適応させる以前の雑音EHMMを用いた場合に比べ、検出の正解率が上がることが確認できた。また学習回数に制限を加えることにより、過学習による検出率の低下を抑制でき、かつリアルタイム処理の可能性を示した。
1997-09-12

著者

関連論文

もっと見る

スポンサーリンク