局所的音響情報を用いて合成した背景話者モデルに基づく話者照合(音声情報処理 : 現状と将来技術論文特集)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, HMMに基づく話者照合における新しいゆう度正規化法を提案する.提案手法ではゆう度正規化に用いる背景話者モデルを, HMMの音素, 状態, 分布が表す局所的な音響情報に基づいて, 近傍話者のHMMから合成する.これにより, 音響空間において本人話者と背景話者との統計的モデル間距離を小さくでき, ゆう度変動を統計的に吸収できる効果的な正規化処理を実現できる.640人の電話音声を用いた話者照合実験(本人話者320人, 詐称者320人, 時期差なしのOpenテスト)において, 分布に基づいて生成したコホート話者モデルによるゆう度正規化(提案手法)を, 従来の話者別に選択するコホート話者モデルによる方法と比較した結果、Equal Error Rate(EER)を, 5.27%から1.76%に削減した.また, 100人の電話音声による実験(本人話者25人, 詐称者75人, 時期差3か月のOpenテスト)では, 分布に基づいて生成したコホート話者モデルと不特定話者モデルを組み合わせるゆう度正規化法により、不特定話者モデルによる手法と比較して, EERを3.41%から2.51%に削減でき, 本手法の有効性を確認した.
- 社団法人電子情報通信学会の論文
- 2000-11-25
著者
-
高橋 淳一
株式会社nttデータ 情報科学研究所
-
磯部 俊洋
Nttデータ
-
磯部 俊洋
(株)nttデータ情報科学研究所
-
磯部 俊洋
名古屋大学情報科学研究科:(株)nttデータ技術開発本部
-
磯部 俊洋
(株)nttデータ技術開発本部
-
磯部 俊洋
株式会社nttデータ技術開発本部siアーキテクチャ開発センタ
-
中村 太一
(株)NTTデータ技術開発本部
-
高橋 淳一
(株)nttデータ情報科学研究所
-
中村 太一
(株)nttデータ情報科学研究所
関連論文
- B-6-45 高信頼IVRサービスのためのAsteriskを用いたセッションフェールオーバ実現法(B-6.ネットワークシステム,一般セッション)
- ステレオマッチングを応用した撮影の位置と時期が異なる航空写真からの建造物の変化抽出
- 一様範囲の推定を用いたテクスチャ画像の領域分割
- ピッチ変形幅を抑えたVCV波形素片生成機構をもつ高品質波形規則合成方式(音声情報処理 : 現状と将来技術論文特集)
- 金融ネットワークシステムANSERにおける高い了解性を有する波形音声合成の開発
- V・CV波形合成方式のための素片辞書構築方法
- VCV波形規制合成におけるピッチ変形率を考慮した素片辞書構築方法
- 無声化音節と二重母音を考慮したVCV波形合成向け素片辞書構築方法
- 金融ネットワークサービスANSERにおける合成音声の高品質化と評価
- 金融ANSER向け音声合成装置の開発
- 金融ネットワークサービスANSER用波形規則合成音の実フィールド展開に向けた品質評価
- 金融ネットワークサービスANSERにおける合成音声の高品質化
- 時間長モデルを用いた自動ラベリング
- 核非線形相互部分空間法による物体認識 (画像の認識・理解論文特集)
- リアルタイムスケジューリングを考慮したマルチキャスト伝送方式の検討
- リアルタイムスケジューリングを考慮したマルチキャスト伝送方式の検討
- リアルタイムスケジューリングを考慮したマルチキャスト伝送方式の検討
- 顔画像と音声を用いた個人認証方式
- 局所的音響情報を用いて合成した背景話者モデルに基づく話者照合(音声情報処理 : 現状と将来技術論文特集)
- 話者照合における背景話者モデル構築方法の比較
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- 話者照合におけるHMMの局所的音響情報に基づく尤度正規化
- HMMの局所的音響情報を用いたコホート生成に基づく話者照合
- 複数の正規化尤度を複合的に用いた音声認識結果の信頼度算出法(認識, 信頼度)
- D-14-15 段階的信頼度を用いた音声認識結果の信頼度算出法(D-14. 音声・聴覚, 情報・システム1)
- 電話音声認識におけるHMM分解・合成法の性能評価
- 電話音声認識による資金移動サービスと対話の評価(次世代ヒューマンインタフェース・インタラクション)
- 音響モデル空間とケプストラム空間の一致による乗算性歪みの補償
- 電話音声認識における特徴量の正規化
- 携帯電話を経由した音声の認識評価
- ガーベージモデルを用いたキーワード抽出
- ホームバンキングを想定した電話音声認識に関するアンケート
- ホームバンキングを想定した電話音声認識の評価
- 電話音声認識装置における資金移動サービスシステムの評価
- 電話音声認識ハードウエアの開発
- 電話音声データコーパスとそれを用いた不特定話者認識システムの性能について
- 日英シームレス音声認識技術による航空路管制音声認識(音声,聴覚)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 日英シームレス音声認識技術による航空管制音声認識(音声・音響処理)
- 統計的音響モデルに基づく年代と性別の識別に関する検討
- 複数の認識器を選択的に用いる音声認識システムのためのスコア補正法(音声,聴覚)
- 顔と音声のスコア統合による個人認証
- 複数モデルを選択的に用いる音声対話システムにおけるドメイン切り替え尺度の検討
- 音声対話システムにおけるドメイン識別の検討
- 音声対話システムを用いた車内対話の収集
- 音声対話モニタリングによる対話の知的支援機構の検討
- 視覚特性を考慮したウェーブレット変換画像符号化方式設計法に関する検討
- NGNにおけるみなし音声によるFAX通信の品質に関する評価
- B-6-75 OpenFlowを活用したクラウド基盤ネットワークの実現(B-6.ネットワークシステム,一般セッション)