MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価(認識・理解・対話)

概要

論文の詳細を見る
一般に音声認識においては,音響モデルとして混合連続分布型HMMが使用されている.このモデルでは正規分布を仮定することにより,効率よくパラメータの推定を行うことができる.しかし雑音が重畳した音声では,混合分布でも対応がつかない分布になることも予想される.このような音声に対しては,任意の分布形状が表現できる離散分布型HMMが有用ではないかと考えられる.離散分布型HMMの場合,量子化サイズを小さくすると量子化歪みが大きくなり,逆にサイズを大きくすると学習データが不足し,充分にパラメータ推定ができないという問題がある.これに対し近年量子化のサイズが小さくて済む離散混合出力分布型HMMが提案されている.このHMMでは入力特徴ベクトルをサブベクトルに分割し量子化する方法と,個々の次元をスカラ量子化する方法が提案されている.本研究では前者のモデルを用いた,雑音重畳音声の認識について検討する.離散混合出力分布型HMMを用いても,なおパラメータ推定に大量のデータを要するが,学習データ量の削減の目的で,パラメータのMAP推定法を提案した.この推定法を雑音適応へ応用し,雑音重畳音声データによるバッチ適応を行った.このモデルと従来の混合連続型HMMとの認識実験による比較を行い,雑音環境下では本提案手法が有効であることを示した.
社団法人電子情報通信学会の論文
2003-05-22

MAP推定を用いた離散混合出力分布型HMMの雑音重畳音声での評価(認識・理解・対話)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク