不特定話者対応HMM認識ボコーダの検討

概要

論文の詳細を見る
本論文では, HMMを用いた音声認識, 音声合成に基づく極低ビットレート音声符号化方式であるHMM認識ボコーダにおける不特定話者への対応手法について検討する.我々はこれまでに, 入力音声の話者性を表す情報である移動ベクトルを求めて伝送し, 復号化器で用いるHMMを入力音声へ適応することにより, 入力音声の声質を再現する手法を提案している.しかし, 従来法では移動ベクトルを求める際に復号化器でスペクトルパラメータの生成に用いられるHMMと入力音声との間で定義される評価関数を用いており, 生成パラメータ列と入力パラメータ列との直接的な評価関数とはなっていなかった.そこで本論文では, 生成パラメータ列と入力パラメータ列との間で二乗誤差最小基準または最尤基準に基づいて定義される評価関数を導入し, 新たな移動ベクトルの計算法を提案する.主観評価実験により, 提案手法で移動ベクトルを100bit/s程度となるように量子化した場合に入力話者の音声データで学習した特定話者モデルと同等の音質となることを示した.
2001-07-19