音素単位HMMの連結学習における学習区間に関する検討
スポンサーリンク
概要
- 論文の詳細を見る
認識語彙数が増大したり,連続音声など認識単位が拡大した場合は,従来のように認識対象を全て学習することは困難となり音素単位の学習・認識となる。HMMによる認識はこのような音素単位による認識との親和性が良い方法であるが,大量の音声データを扱うようになると,人手に頼る音素ラベルを得るのが難しくなり,ラベルの無い音声データで学習を行う必要がある。このとき用いる連結学習はHMMパラメータ再推定に全音区間のデータを用いるため,本来パラメータ再推定に不必要なデータまで取り込んでいる。本稿では,正しい音声区間のデータでHMMの学習を行うようパラメータ再推定に用いるデータ区間を制限すれば認識性能が向上すると考え,ポーズまたは音素ラベルに基づき学習データ区間を制限して学習し認識性能を特定話者音素認識実験により調べた。その結果,約1, 3の学習回数で従来法と同等の認識率を得ることができ,学習回数が同じ場合には,誤認識が最大で60%減少した。
- 社団法人電子情報通信学会の論文
- 1993-08-19
著者
関連論文
- 教師なし話者適応のための教師信号選択の高精度化
- バッチディクテーションのための教師なし話者適応
- バッチディクテーションのための繰り返し教師なし話者適応
- 音素単位HMMの連結学習における学習区間に関する検討
- 音素認識と係り受け解析による文音声の認識 (音声音響情報処理の研究・開発)