話者照合におけるモデルとしきい値の更新法
スポンサーリンク
概要
- 論文の詳細を見る
本論文では話者照合において, 最近に発声した少量の更新用データを用いて, 発声変動に対して頑健になるように, 話者のモデルを更新する方法, およびその話者のモデルの頑健性を考慮しながら, 話者の判定に用いるしきい値を適切に設定する方法について検討する.話者のモデルは, 隠れマルコフモデル(hidden Markov model; HMM)で表す.モデルの更新では, 話者HMMのパラメータを, 更新用データと現在のパラメータ値から推定する.しきい値の設定では, 話者ごとに新しいしきい値を, 更新用データから計算した等誤り率(本人棄却率と詐称者受理率が等しくなる値)よりも高めのFA率を与える値を初期値として, 話者HMMの更新に合わせて, その等誤り率を与える値へ次第に近づくように設定する.本方法を, 話者20名によるテキスト独立型, およびテキスト指定型話者照合実験で評価した結果, モデルやしきい値を更新しない場合に比べて, 平均誤り率はテキスト独立型ではほぼ4割, テキスト指定型ではほぼ8割に削減された.
- 社団法人電子情報通信学会の論文
- 1998-02-25
著者
-
古井 貞煕
東京工業大学大学院情報理工学研究科計算工学専攻
-
古井 貞煕
東京工業大学
-
古井 貞煕
Nttヒューマンインタフェース研究所
-
松井 知子
NTTヒューマンインタフェース研究所
-
西谷 隆
東京工業大学
-
古井 貞熙
NTTヒューマンインタフェース研究所
-
西谷 隆
東京工業大学工学部
関連論文
- 音声認識実用化技術の展開(総合報告)
- SIFT混合ガウス分布と音響特徴を用いた映像からの高次特徴検出(テーマセッション関連,一般物体認識・画像特徴量)
- WFST音声認識デコーダにおけるon-the-fly合成の最適化処理(音声,聴覚)
- 携帯端末上でのプロキシ編集(映像理論・映像システム,画像処理・符号化及び一般)
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 頑健な区間検出とモデル適応に基づく雑音下音声認識(雑音下音声処理)(第6回音声言語シンポジウム)
- 区分線形変換による雑音適応法のための木構造クラスタリング法の検討
- 区分線形変換による雑音適応法における木構造クラスタリング法の検討
- 尤度最大化規準による雑音適応
- 雑音重畳音声に対する各種適応手法の検討