複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討(福祉と音声処理,一般)

スポンサーリンク

概要

論文の詳細を見る
残響環境下では音声認識性能は著しく著しく劣化する.これに対し,人工残響インパルス応答をクリーン音声に畳み込んで学習することで,認識率が向上することが知られている.しかし,どのような残響インパルス応答を畳み込んで学習すべきか,という点に関しては十分に議論がなされていない.本研究では,人工残響インパルス応答の残響時間パラメータと認識率の関係を残響音声認識評価基盤(CENSREC-4)を用いて詳細に調べ,認識率が大きく変わる残響時間パラメータの範囲がテスト環境より短い残響時間に分布していることを述べる.また,その範囲に基づいて人工残響インパルス応答を選択しマルチコンディション学習を行うことが,未知残響環境に対して頑健な音声認識であることを示す.
社団法人電子情報通信学会の論文
2008-05-22

著者

関連論文

もっと見る

スポンサーリンク