拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識

概要

論文の詳細を見る
本稿では、ジャンプ・マルコフ状態空間モデルに基づく、雑音下の音声認識手法について述べる。このモデルでは雑音パラメータと状態列は隠れた変数として、計算ベイズアプローチによって推定する。本方法はモデルレベルの雑音補償法であり、時間的に変化する加算性雑音のパラメータを、モンテ・カルロ・パーティクル・フィルタを用いて推定する。パーティクルは各時刻における雑音の状態を表す空間(雑音状態空間)に相当する。概念的には、ある時刻のパーティクルは、音声認識中に得られる音響・言語モデルから計算される遷移確率に応じて、次の時刻の雑音状態空間の候補となる、新たな複数のパーティクルに確率的に遷移していくと考える。その際、大きい尤度の値を示すパーティクルは遷移先として、より多くの候補に展開され、小さな尤度を示すパーティクルは場合によっては、それ以上の展開は行わないと判定される。なお、それらの展開には拡張型カルマン・フィルタを用いる。雑音パラメータは、各状態空間の尤度に基づいて、最小2乗誤差推定法によって推定する。本稿では、予備的な実験として、本方法をN-bestリスコアリングに適用した結果を示す。
社団法人電子情報通信学会の論文
2000-12-14

拡張型カルマン・パーティクル・フィルタを用いた雑音下音声認識

スポンサーリンク

概要

著者

関連論文

スポンサーリンク