音声認識のための高速最ゆう推定を用いた音道長正規化(音声情報処理 : 現状と将来技術論文特集)

スポンサーリンク

概要

論文の詳細を見る
近年, 隠れマルコフモデル(HMM)を用いた大語彙音声認識システムにおいて, 声道長正規化と呼ばれる話者による声道長の違いを補正する話者正規化の手法が提案されている.本論文では, 声道長による特徴量の変化を, ケプストラム空間における声道長パラメータを用いた線形写像で近似し, そのパラメータを発声から最ゆう推定する手法を提案する.従来の複数の声道長パラメータをあらかじめ用意する手法に比べ, 計算量が少なく, より話者に最適なパラメータが推定可能である.日本語5000単語認識を用いた評価実験において, 本方式単独で, 7.1%誤りが減少し, また, ケプストラム平均正規化(CMN)と組み合わせた場合に, 14.6%誤りが減少した.
社団法人電子情報通信学会の論文
2000-11-25

著者

関連論文

もっと見る

スポンサーリンク