ディジタル蝸牛モデルとHMMを用いた話者識別

スポンサーリンク

概要

論文の詳細を見る
単語音声を利用した話者識別では経時変化により識別率が低下する。この要因として、発声時間の変化や、各発声における音素の時間長の変化が考えられる。本報告では、ディジタル蝸牛モデルから得られた特徴パラメータを、HMM(Hidden Markov Model)を利用して発声時間の正規化を行なうことで経時変化の吸収を試みた。18人の話者識別実験の結果、平均識別率は、ディジタル蝸牛モデルのみで75.67%だったものが、ディジタル蝸牛モデル出力をHMMによって正規化することによって83.47%と、7.80%の改善ができた。さらに、各音素の位置を利用して、より個人差の大きい音素に重み付けをし、ディジタル蝸牛モデルからの出力を段方向に差分をとった話者識別も試みた。これらの対策を加えることで87.78%とさらに4.31%の改善ができることが明らかになった。
1998-03-05

著者

関連論文

もっと見る

スポンサーリンク