音声認識のためのスペクトル内挿を用いた話者適応化

スポンサーリンク

概要

論文の詳細を見る
連続分布型HMMに基づく音声認識のための教師あり話者適応化の手法を提案する.使用者の負担を軽くするために適応化用単語の発声数を少なくすると,その中に現れない半音節(認識単位)の割合が増える.本手法では,適応化用データに含まれる半音節のHMMパラメータを補正した後で,適応化用データには含まれていない半音節のHMMパラメータをパラメータ空間における内挿(スペクトル内挿)により補正する.更に,適応化用データセットに依存した偏ったパラメータが推定されるのを避けるため,多数話者の多数音声データに基づく補正を行う.5,000単語大語い音声認識をシミュレートした類似100単語認識実験を行い,提案手法を評価した.不特定話者HMMによる認識率81.2%のところ,50単語を適応化に用いたとき,85.2%まで認識率が上昇し,本手法の有効性が確かめられた.
社団法人電子情報通信学会の論文
1994-02-25

著者

関連論文

もっと見る

スポンサーリンク