話者ベクトルに基づく話者照合の検討(認識,理解,対話,一般)

概要

論文の詳細を見る
本稿では,話者ベクトルに基づくテキスト独立型話者照合の性能向上について述べる.本話者照合システムはアンカーモデルに基づいている.この方法では,照合対象話者の発声とアンカーモデル間の尤度からなる話者ベクトルによって,各々の話者が話者空間に配置される.従来の方法ではアンカーモデルとしてガウス混合モデル(GMM)を使用していたが,話者識別においてGMMではなく音素ベースのモデルを用いることによって性能が向上した.よって話者照合においても音素ベースのモデルを使用し性能向上を図る.話者照合の実験ではアンカーモデルにGMM又は隠れマルコフモデル(HMM)を使用して比較検討を行う.また話者ベクトルの次元数の検討も行った.評価話者は男女計300名を使用した.アンカーモデルにGMMを用いた時の最良のEERは1000次元で2.92%,HMMを用いたときには最良のEERは1000次元で2.68%が得られた.以上よりアンカーモデルにHMMを用いることの有効性が示された.
社団法人電子情報通信学会の論文
2008-07-10