混合連続分布HMM移動ベクトル場平滑化話者適用方式
スポンサーリンク
概要
- 論文の詳細を見る
混合ガウス分布型HMMにおける話者適応方式である「移動ベクトル場平滑化話者適応方式」を提案する.本手法は,話者適応の問題を少量学習音声資料を用いたHMMの再学習による分布の移動問題としてとらえ,学習前後のHMMのガウス分布の平均ベクトルの差分(移動ベクトル)が構成する一つの場(移動ベクトル場)の連続性の拘束条件に基づく移動ベクトルの補間と平滑化により,不十分な学習資料しか得られない場合に生じる(1)未学習モデルの問題と,(2)モデルの推定誤差の問題,に対処するものである.本論文では評価話者に男女各1名を用いた23音素認識実験により,平滑化はモデルの推定誤差を吸収するために有効な手法であることを示した.また,文節音声認識において,本手法の発話様式適応への応用と不特定話者モデルに基づく話者適応への応用を検討し,本手法の有効性を示した.
- 社団法人電子情報通信学会の論文
- 1993-12-25
著者
-
嵯峨山 茂樹
ATR自動翻訳電話研究所
-
嵯峨山 茂樹
Atr Interpreting Telephony Research Laboratories
-
嵯峨山 茂樹
(株)ATR自動翻訳電話研究所
-
大倉 計美
(株)ATR自動翻訳電話研究所
-
杉山 雅英
(株)ATR自動翻訳電話研究所
関連論文
- HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現
- ピッチ周波数依存音素モデルによるHMM音声認識
- 隠れマルコフ網と一般化LR構文解析を統合した連続音声認識
- 混合連続分布HMM移動ベクトル場平滑化話者適用方式
- ATR音声言語翻訳実験システムASURA
- HMMを用いた形態素解析
- ニューラルファジィ学習法による音声認識の性能向上
- 3)ピッチとスペクトルの相関を用いたHMM音素認識(視聴覚技術研究会)
- 数理統計モデルによる音声認識の現状と将来 (<特集>音声)
- ピッチとスペクトルの相関を用いたHMM音素認識
- 隠れマルコフモデルによる言語モデル自動獲得の検討
- 話者混合逐次状態分割法による不特定話者音声認識と話者適応
- 全音素エルゴディック HMM を用いた教師なし話者適応
- 逐次状態分割法による隠れマルコフ網の自動生成
- 双方向網探索によるHMM文節音声認識系の評価
- FPM-LRによる不特定話者連続音声認識
- セグメント特徴量を用いた雑音環境下でのHMM音声認識
- 1)セグメント特徴量を用いた雑音環境下でのHMM音声認識(視聴覚技術研究会)