雑音に頑健な基本周波数抽出法とその音声認識への適用

スポンサーリンク

概要

論文の詳細を見る
本稿では,雑音環境下での音声認識性能を,韻律情報を利用して向上させる手法を提案する.日本語では,イントネーションやアクセントは基本周波数(F_0)パターンとして表現され,句や単語の境界の準定に役立つ.筆者らは,種々の雑音に頑健な恥抽出法として「ハフ変換によるF_0出法」を提案し,様々な雑音環境下での有効性を確認している.そこで本稿では,この手法から得られた恥情報を韻律特徴量として,音韻・韻律特徴量を融合した音節HMMによる雑音に頑健な音声認識手法を提案する.男性話者11名による不特定話者実験として,4種類の雑音を様々なSNR条件で重畳した連続数字発声の認識を行ったところ,全ての条件で認識精度の向上が確認され,数字正解精度の改善は轡偉で最大約4.7%であった.雑音環境下での数字境界の推定精度が向上し,それによる認識精度の向上が得られたものと考えられる.
社団法人電子情報通信学会の論文
2002-04-19

著者

関連論文

もっと見る

スポンサーリンク