話者照合におけるHMMの局所的音響情報に基づく尤度正規化
スポンサーリンク
概要
- 論文の詳細を見る
HMMに基づく話者照合における新しい尤度正規化法を提案する。提案手法ではコホートモデルをHMMの音素、状態、分布が表す局所的な音響情報に基づいて選択される近傍話者のHMMから合成する。HMMの細部の音響情報を考慮した話者類似性に基づいてコホートモデルを生成することにより、音響空間において本人話者との統計的モデル間距離を小さくなることが可能である。これにより、入力音声の尤度の変動を統計的に吸収できる効果的な正規化処理を実現できる。100人の電話音声データを用いた話者照合実験において、分布に基づくコホートモデルによる尤度正規化(提案手法)と、従来の話者別にコホートモデルを選択する方法を比較した結果、Equal Error Rate(EER)は1.30%から0.70%まで低減し、本手法の有効性を確認した(本人話者25人、詐称者75人のOpenテスト、コホートサイズ5)。
- 社団法人電子情報通信学会の論文
- 1998-12-10
著者
-
高橋 淳一
株式会社nttデータ 情報科学研究所
-
磯部 俊洋
Nttデータ
-
磯部 俊洋
(株)nttデータ情報科学研究所
-
磯部 俊洋
名古屋大学情報科学研究科:(株)nttデータ技術開発本部
-
磯部 俊洋
(株)nttデータ技術開発本部
-
磯部 俊洋
株式会社nttデータ技術開発本部siアーキテクチャ開発センタ
-
高橋 淳一
(株)nttデータ情報科学研究所
-
磯部 俊洋
株式会社nttデータ技術開発本部itアーキテクチャソリューションセンタ
-
磯部 俊洋
株式会社NTTデータ基盤システム事業本部シ
関連論文
- B-6-45 高信頼IVRサービスのためのAsteriskを用いたセッションフェールオーバ実現法(B-6.ネットワークシステム,一般セッション)
- ピッチ変形幅を抑えたVCV波形素片生成機構をもつ高品質波形規則合成方式(音声情報処理 : 現状と将来技術論文特集)
- 金融ネットワークシステムANSERにおける高い了解性を有する波形音声合成の開発
- V・CV波形合成方式のための素片辞書構築方法
- VCV波形規制合成におけるピッチ変形率を考慮した素片辞書構築方法
- 無声化音節と二重母音を考慮したVCV波形合成向け素片辞書構築方法
- 金融ネットワークサービスANSERにおける合成音声の高品質化と評価
- 金融ANSER向け音声合成装置の開発
- 金融ネットワークサービスANSER用波形規則合成音の実フィールド展開に向けた品質評価
- 金融ネットワークサービスANSERにおける合成音声の高品質化
- 時間長モデルを用いた自動ラベリング
- 顔画像と音声を用いた個人認証方式
- 局所的音響情報を用いて合成した背景話者モデルに基づく話者照合(音声情報処理 : 現状と将来技術論文特集)
- 話者照合における背景話者モデル構築方法の比較
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- HMMの局所的音響情報を用いたコホート生成に基づく話者照合
- 複数の正規化尤度を複合的に用いた音声認識結果の信頼度算出法(認識, 信頼度)
- D-14-15 段階的信頼度を用いた音声認識結果の信頼度算出法(D-14. 音声・聴覚, 情報・システム1)
- 電話音声認識におけるHMM分解・合成法の性能評価
- 電話音声認識による資金移動サービスと対話の評価(次世代ヒューマンインタフェース・インタラクション)
- 音響モデル空間とケプストラム空間の一致による乗算性歪みの補償
- 電話音声認識における特徴量の正規化
- 携帯電話を経由した音声の認識評価
- ガーベージモデルを用いたキーワード抽出
- ホームバンキングを想定した電話音声認識に関するアンケート
- ホームバンキングを想定した電話音声認識の評価
- 電話音声認識装置における資金移動サービスシステムの評価
- 電話音声認識ハードウエアの開発
- 電話音声データコーパスとそれを用いた不特定話者認識システムの性能について
- 日英シームレス音声認識技術による航空路管制音声認識(音声,聴覚)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 統計的音響モデルに基づく年代と性別の識別に関する検討
- 複数の認識器を選択的に用いる音声認識システムのためのスコア補正法(音声,聴覚)
- 顔と音声のスコア統合による個人認証
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムにおけるドメイン識別の検討
- 音声対話システムを用いた車内対話の収集
- 音声対話モニタリングによる対話の知的支援機構の検討
- NGNにおけるみなし音声によるFAX通信の品質に関する評価
- B-6-75 OpenFlowを活用したクラウド基盤ネットワークの実現(B-6.ネットワークシステム,一般セッション)
- BP-3-1 システムインテグレータから見たOpenFlow/SDN(BP-3.仮想化、個人化が進むICTサービス〜SDN、クラウド、 BYOD〜,パネルセッション,ソサイエティ企画)