頑健な話者認識システムの構築を目指して
スポンサーリンク
概要
- 論文の詳細を見る
話者認識システムの性能を劣化させる要因の一つに, 学習と認識との時期差やテキストの違いに起因する発声変動がある.本論文では, 基本的な話者認識システムの構成について解説するとともに, 発声変動に対して話者認識システムが頑健となるように, 話者のテンプレート/モデルの更新, および類似度正規化に関して検討した研究例のいくつかを紹介する.話者のテンプレート/モデルの更新については, 最近の複数回の発声の重ね合わせによって作成したテンプレートによって, 話者のテンプレートを更新する方法, 最近に発声した少量の更新用のデータを用いて話者のモデルを逐次的に更新する方法について述べる.類似度正規化に関しては, 尤度比検定, 事後確率の考えに基づく方法, Weighting Models Rankによる方法について述べる.各方法は, それぞれの発声変動を含む実験データに対して, 認識誤り率を半分以下にする効果がある.
- 社団法人映像情報メディア学会の論文
- 1997-07-22
著者
関連論文
- 話者照合におけるモデルとしきい値の更新法
- 4)話者認識研究の現状と展望([マルチメディア情報処理研究会 ネットワーク映像メディア研究会]合同)
- 話者認識研究の現状と展望
- テキスト指定型話者認識
- 話者認識におけるモデルとしきい値の更新法の検討
- 合成HMMによる環境適応型話者認識法
- 音韻・話者独立モデルによる話者照合尤度の正規化
- VQ ひずみ,離散/連続 HMM によるテキスト独立形話者認識法の比較検討
- 話者認識技術 (音声認識の最新技術)
- 音源・声道特徴を用いたテキスト独立形話者認識
- 8)話者認識技術の実用化に向けて(マルチメディア情報処理研究会)
- 話者認識技術の実用化に向けて
- 4)話者認識研究の現状と展望([マルチメディア情報処理研究会 ネットワーク映像メディア研究会]合同)
- 話者照合におけるモデルとしきい値の更新法
- 音声認識エンジンREXの開発
- 頑健な話者認識システムの構築を目指して
- N-bestに基づく話者適応化法の検討
- N-bestに基づく教師なし話者適応化法
- 音声の個人性の解明を目指して
- 音声認識のためのN-bestに基づく話者適応化
- MMによる話者認識
- 連続数字音声認識における音響モデル学習法の検討
- 連続数字音声における音響モデル学習法の検討
- 識別誤り最小化による話者適応化法の検討
- 3)頑健な話者認識システムの構築を目指して([マルチメディア情報処理研究会 ネットワーク映像メディア研究会]合同)
- 時期差による発声変動及び伝送歪みに頑健な話者照合
- 時期差による発声変動を考慮した話者モデルの生成法