ガウス混合分布の再構成による不特定話者音響モデルの改善

スポンサーリンク

概要

論文の詳細を見る
隠れマルコフモデル(HMM)による音響モデルと単語N-gramなどの言語モデル、及び時間同期ビーム探索の組み合わせによる連続音声認識においては、音響モデルの表現力不足に起因する音響尤度の局所的な落ち込みが認識性能低下の要因となる。本論文では、音響尤度の局所的落ち込み抑止を目的とした既学習のガウス混合分布型不特定話者HMMの表現力向上を、音声サンプルを用いたガウス混合分布の再構成によって図る手法を提案する。既学習HMMと音声サンプルとの照合によって得られる局所的誤りの傾向に基づいて、ガウス混合分布のコンポーネント追加、及び共有を行なう本手法により、音響尤度の局所的落ち込みを効果的に抑えることができ、その結果、音声認識率が向上することを確認した。
社団法人電子情報通信学会の論文
1997-06-20

著者

中村篤
Atr音声翻訳通信研究所

関連論文

もっと見る

スポンサーリンク