雑音に頑健な音声認識のための韻律情報の利用(自然言語情報処理研究会と一部合同開催 : 自動車内音声対話関連)

スポンサーリンク

概要

論文の詳細を見る
本論文では,韻律情報を利用した雑音に頑健な音声認識手法について述べる。韻律特徴量として,時間-ケプストラム平面のハフ変換から得られる対数基本周波数の傾き(△log F_0)と最大累積投票値を利用し,通常の音声認識で用いられる音響特徴量と結合して用いる.音韻と韻律の融合モデルは,音節単位のマルチストリームHMMで構築する.融合モデルの様々な雑音環境における頑健性を確認するため,不特定話者の連続数字発声を対象とした音声認識実験を行った.実験の結果,本手法によって様々な雑音環境において数字正解精度の改善が確認され,△log F_0と最大累積投票値が相補的に認識性能の向上に貢献することがわかった.また,基本周波数情報を音声認識に用いることで,雑音環境下における数字境界の推定精度が向上し,それによって,数字正解精度の改善と,頑健な挿入ぺナルティーの設定が実現されることが確認された.
一般社団法人情報処理学会の論文
2003-05-27

著者

関連論文

もっと見る

スポンサーリンク