離散混合出力分布型HMMを用いた非定常雑音下の音声認識(ポスターセッション)(第5回音声言語シンポジウム)

概要

論文の詳細を見る
従来,定常的な雑音への対処としてスペクトルサブトラクションやPMCなど種々の手法が提案され一定の成果を収めている.一方非定常雑音はスペクトルの特徴のバリエーションが大きく,大量のデータを集めてモデル化しにくいという問題がある.そのため,未知雑音,非定常雑音への対処は重要な課題の一つとなっている.本研究では,離散混合出力分布型HMM(DMHMM)を用い,未知の非定常雑音が重畳した音声に対するロバストな音声認識手法を提案する.我々はこれまでMAP推定によるDMHMMを用いた雑音下音声認識の検討を行い,その有効性を示してきた.本研究では,missing feature theory(MFT)に基づくDMHMMの離散分布の補正法を提案する.未知の非定常雑音が重畳すると,音響モデルに学習されない特徴が現れるが,閾値を設けることによりDMHMMの離散分布の補正を行うことにより対処する.提案手法の有効性を示すため,従来法である混合連続分布型HMM(CHMM)およびCHMMへMFTを適用した手法の一つであるacoustic backing-off法と比較実験を行なった.その結果3手法の中で最良の結果が得られ,またベースラインと比較して26.0%の認識率の向上を得た.
一般社団法人情報処理学会の論文
2003-12-18