雑音DBを用いたモデル適応化HMMのSN比別マルチパスモデルによる雑音下音声認識

概要

論文の詳細を見る
音声認識システムを実環境で利用する場合, その認識性能は周囲の環境雑音の混入に大きく影響を受ける.混入する雑音は多くの場合予測が困難であり, 入力される音声信号と音響モデルの間で不一致が生じ, 認識性能低下の原因となる.このことから, 変動する雑音の混入に対してロバストな音響モデルが求められている.混入する雑音の問題は, 雑音の種類が未知である問題とSN比が未知である問題の2つに分けて考えることができる.本稿ではこの問題に対し, 一つ目の雑音の種類が未知である問題に対して既存の雑音データと雑音モデルの適応化によるHMM合成法を用い, 二つ目のSN比が未知である問題に対して複数のSN比に対応した音響モデルを並列に用いる.AURORA2タスクによる評価実験の結果, 1secの適応データを用いることでSNR=5dBにおいてベースラインシステムに対して53%の認識性能改善を得た.これは従来法のHMM合成を用いた場合10secの適応データを用いた場合に匹敵する.
社団法人電子情報通信学会の論文
2001-12-13