話者照合におけるHMMの局所的音響情報に基づく尤度正規化
スポンサーリンク
概要
- 論文の詳細を見る
HMMに基づく話者照合における新しい尤度正規化法を提案する。提案手法ではコホートモデルをHMMの音素、状態、分布が表す局所的な音響情報に基づいて選択される近傍話者のHMMから合成する。HMMの細部の音響情報を考慮した話者類似性に基づいてコホートモデルを生成することにより、音響空間において本人話者との統計的モデル間距離を小さくすることが可能である。これにより、入力音声の尤度の変動を統計的に吸収できる効果的な正規化処理を実現できる。100人の電話音声データを用いた話者照合実験において、分布に基づくコホートモデルによる尤度正規化(提案手法)と、従来の話者別にコホートモデルを選択する方法を比較した結果、Equal Error Rate(EER)は1.30%から0.70%まで低減し、本手法の有効性を確認した(本人話者25人、詐称者75人のOpenテスト、コホートサイズ5)。
- 一般社団法人情報処理学会の論文
- 1998-12-10
著者
-
高橋 淳一
株式会社nttデータ 情報科学研究所
-
磯部 俊洋
Nttデータ
-
磯部 俊洋
(株)nttデータ情報科学研究所
-
磯部 俊洋
名古屋大学情報科学研究科:(株)nttデータ技術開発本部
-
磯部 俊洋
(株)nttデータ技術開発本部
-
磯部 俊洋
株式会社nttデータ技術開発本部siアーキテクチャ開発センタ
-
高橋 淳一
(株)nttデータ情報科学研究所
-
磯部 俊洋
株式会社nttデータ技術開発本部itアーキテクチャソリューションセンタ
-
磯部 俊洋
株式会社NTTデータ基盤システム事業本部シ
関連論文
- B-6-45 高信頼IVRサービスのためのAsteriskを用いたセッションフェールオーバ実現法(B-6.ネットワークシステム,一般セッション)
- ピッチ変形幅を抑えたVCV波形素片生成機構をもつ高品質波形規則合成方式(音声情報処理 : 現状と将来技術論文特集)
- 金融ネットワークシステムANSERにおける高い了解性を有する波形音声合成の開発
- V・CV波形合成方式のための素片辞書構築方法
- VCV波形規制合成におけるピッチ変形率を考慮した素片辞書構築方法
- 無声化音節と二重母音を考慮したVCV波形合成向け素片辞書構築方法
- 金融ネットワークサービスANSERにおける合成音声の高品質化と評価
- 金融ANSER向け音声合成装置の開発
- 金融ネットワークサービスANSER用波形規則合成音の実フィールド展開に向けた品質評価
- 金融ネットワークサービスANSERにおける合成音声の高品質化