雑音環境下における静的・動的情報を用いた音響モデル適応(雑音下音声認識,認識,理解,対話,一般)

概要

論文の詳細を見る
本稿では,雑音環境下・実環境下での音声認識性能の改善を目的に,複数のストリームを用いた音響モデル適応手法を提案する.はじめに,静的成分と動的成分(Δ成分とΔΔ成分)などのように,音響特徴量を複数のストリームに分割する.次に,予備的に認識を行い,その結果によりそれぞれのストリームの並び替えを行う.モデル適応を行う際には,最も性能の高かったストリームでは,そのストリームの情報のみを用いてモデルパラメータの適応を行う.それ以外のストリームにおいては,当該ストリームより性能の高かったストリームもあわせて用いることで,モデルパラメータの適応を行う.提案手法の有効性を確認するため,コーパスCENSREC-1を用いて認識実験および適応実験を行った.予備実験結果では,音響特徴量の動的成分が静的成分と比べて雑音に対する頑健性を有することが確かめられた.適応・認識実験では,提案する適応手法は,従来の音響特徴量やストリームをそのまま用いる方法と比較して,最も高い認識性能を得ることができ,手法の有効性が確かめられた.
2012-07-12