局所的音響情報を用いて合成した背景話者モデルに基づく話者照合(音声情報処理 : 現状と将来技術論文特集)

概要

論文の詳細を見る
本論文では, HMMに基づく話者照合における新しいゆう度正規化法を提案する.提案手法ではゆう度正規化に用いる背景話者モデルを, HMMの音素, 状態, 分布が表す局所的な音響情報に基づいて, 近傍話者のHMMから合成する.これにより, 音響空間において本人話者と背景話者との統計的モデル間距離を小さくでき, ゆう度変動を統計的に吸収できる効果的な正規化処理を実現できる.640人の電話音声を用いた話者照合実験(本人話者320人, 詐称者320人, 時期差なしのOpenテスト)において, 分布に基づいて生成したコホート話者モデルによるゆう度正規化(提案手法)を, 従来の話者別に選択するコホート話者モデルによる方法と比較した結果、Equal Error Rate(EER)を, 5.27%から1.76%に削減した.また, 100人の電話音声による実験(本人話者25人, 詐称者75人, 時期差3か月のOpenテスト)では, 分布に基づいて生成したコホート話者モデルと不特定話者モデルを組み合わせるゆう度正規化法により、不特定話者モデルによる手法と比較して, EERを3.41%から2.51%に削減でき, 本手法の有効性を確認した.
社団法人電子情報通信学会の論文
2000-11-25