ガウス混合分布の再構成による不特定話者音響モデルの改善
スポンサーリンク
概要
- 論文の詳細を見る
隠れマルコフモデル(HMM)による音響モデルと単語N-gramなどの言語モデル、及び時間同期ビーム探索の組み合わせによる連続音声認識においては、音響モデルの表現力不足に起因する音響尤度の局所的な落ち込みが認識性能低下の要因となる。本論文では、音響尤度の局所的落ち込み抑止を目的とした既学習のガウス混合分布型不特定話者HMMの表現力向上を、音声サンプルを用いたガウス混合分布の再構成によって図る手法を提案する。既学習HMMと音声サンプルとの照合によって得られる局所的誤りの傾向に基づいて、ガウス混合分布のコンポーネント追加、及び共有を行なう本手法により、音響尤度の局所的落ち込みを効果的に抑えることができ、その結果、音声認識率が向上することを確認した。
- 社団法人電子情報通信学会の論文
- 1997-06-20
著者
関連論文
- 生成駆動音声認識方式 (GD-SR)
- 単語グラフから例文集へのマッピング
- 生成駆動音声認識方式(GD-SR)
- パターンマッチングに基づく発話意図同定のための重要語検出方法
- 対話音声を対象とした連続音声認識システムの試作と評価
- 旅行会話タスクにおけるTARSPRECの性能評価
- 携帯電話型音声翻訳システムATR-MATRIX
- クライアント・サーバ型ATR-MATRIX
- クライアント・サーバ型 ATR-MATRIX
- 一般化ラプラス混合分布に基づく音声認識用音響デモリング(音声情報処理 : 現状と将来技術論文特集)
- クライアント・サーバ型ATR-MATRIX
- 地域や年齢的な広がりを考慮した大規模な日本語音声データベース
- 擬似的学習データを用いた単語スポッタ用ガーベジモデル学習法
- 隠れマルコフモデルを用いた音声認識
- 一般的ラプラス分布に基づく音響モデル
- 不特定話者音響モデルにおけるガウス混合分布再構成法
- 言語情報を用いた教師なしのQuasi-Bayesオンライン話者適応
- ガウス混合分布の再構成による不特定話者音響モデルの改善
- 擬似的学習データを用いた単語スポッティング用ガーベジモデル学習法
- 擬似的学習データを用いたキーワードスポッタのためのガーベジモデル学習法