音声認識のための高速最ゆう推定を用いた声道長正規化

スポンサーリンク

概要

論文の詳細を見る
近年、隠れマルコフモデル(HMM)を用いた大語業音声認識システムにおいて、声道長パラメータを用いた話者正規化の手法が提案されている。本稿では、声道長による特徴量の変化を、ケプストラム空間における声道長パラメータを用いた線形写像で表現し、そのパラメータを発声から最ゆう推定する手法を提案する。従来の、複数の声道長パラメータを予め用意する手法に比べ、計算量が少なく、より話者に最適なパラメータが推定可能、などの利点がある。日本語5000単語認識を用いた評価実験において、本方式単独で、7.1%誤りが減少し、また、ケプストラム平均正規化(CMN)と組み合わせた場合に、14.6%誤りが減少した。
社団法人電子情報通信学会の論文
1999-12-20

著者

関連論文

もっと見る

スポンサーリンク