最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
スポンサーリンク
概要
- 論文の詳細を見る
本論文では連続分布型HMMによる不特定話者音響モデルを認識対象話者の任意の量の音声データを用いて効果的に適応するための話者適応手法を提案する.本手法では事前知識を用いたパラメータ推定法である最大事後確率推定法(MAP推定法)とパラメータの補間・平滑化手法である移動ベクトル場平滑化法を統合することにより少量の適応データに対する適応性能を改善すると共に, 適応データ量に応じて平滑化の強さを制御する機能を加えることにより広い範囲の適応データ量に対して同じ枠組みで話者適応を行うことを可能にした.日本語の音素連接制約のみを用いた音素認識実験による評価では提案法により話者適応したモデルは20文節程度までの適応データに対してはMAP推定法よりも高い性能が得られ, それ以上の適応データに対してもMAP推定法と同程度の性能が得られることが確かめられた.
- 社団法人電子情報通信学会の論文
- 1998-03-25
著者
-
小坂 哲夫
Atr音声翻訳通信研究所:現在 キャノン情報メディア研究所
-
外村 政啓
ATR音声翻訳通信研究所
-
松永 昭一
ATR音声翻訳通信研究所
-
松永 昭一
Atr音声翻訳通信研究所:現在 Nttヒューマンインタフェース研究所
関連論文
- 最大事後確率推定法と適応データ量に応じた平滑化手法を用いた話者適応
- 話者クラスタリング手法を用いた不特定話者音素HMM作成法
- MAP-VFS話者適応法における平滑化係数制御の効果
- 発話/話者適応による自由発話音声中の音素認識
- 木構造話者クラスタリングを用いた話者適応
- 最大事後確率推定法と移動ベクトル場平滑化法を統合した話者適応方式
- 話者適応のための木構造話者クラスタリング
- 全音素エルゴディック隠れマルコフ網を用いた教師なし話者適応方式
- 多数話者自然発話音声データを用いた不特定話者モデル構築法の検討
- 重回帰写像モデルを用いた話者適応のための話者正規化方式
- 重回帰写像モデルを用いた話者正規化と話者適応化方式
- 重回帰モデルに基づく話者適応方式の検討
- 逐次状態分割法の分割過程木構造を用いた話者適応方式の検討
- 逐次状態分割法の分割過程を考慮した移動ベクトル場平滑化の検討
- 音素クラスタモデルを用いた未登録語検出法の検討
- 音素クラスタモデルを用いた未登録語の検出法の検討
- 連続音声認識における未知語検出の検討
- 大語い連続音声認識のための単語仮説数削減
- 単語グラフと可変長N-gramを用いた大語彙自然発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた自由発話音声認識
- 単語グラフを用いた連続音声認識法
- 語順の制約による探索空間の削減効果
- 音素履歴木を用いたフレーム同期型SSS-LR文音声認識
- 品詞および可変長単語列の複合N-gramの自動生成
- 連続音声認識のための品詞・単語可変長N-gram
- 連続音声認識のための可変長連鎖統計言語モデル
- 状態別話者クラスタリングを用いた不特定話者モデルの検討