残響環境下音声認識における発話位置・話者依存性の分析評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)

概要

論文の詳細を見る
本研究では残響環境下における音声認識性能の発話位置依存性と話者依存性について調査した結果を報告する.近年,使用者が大幅に増加している音声認識システム搭載の携帯機器を利用するにあたり,マイクロホンから離れて発話すると,雑音や室内残響等の混入により音声認識性能が著しく低下するという問題がある.そこで事前に各環境が与える音声認識性能の劣化量を予測できれば,音声認識の前処理にて使用者に適した音響特徴量の最適化ができる.また使用者の発話位置が既知であれば,その位置における音声認識性能の予測結果をもとに利用者に対して受音器への接近や離反を促すことが可能となる.これまでに雑音・残響環境下における音声認識性能の予測手法は数多く提案されてきた.そこで本研究では,音声認識性能の予測結果をもとに音声認識性能を向上させる基礎的研究として,残響環境下における音声認識性能の発話位置・話者依存性について調査した.具体的には,使用者の発話環境(入出力間距離,壁からの距離,発話方位)による音声認識性能の傾向を分析した.また各残響環境における複数話者の音声認識性能から残響に脆弱または頑健な話者の存在についても併せて調査した.発話位置依存評価では,壁と発話者間の距離と音声認識性能の関係が残響環境によって異なることが確認できた.また話者依存評価では,残響に脆弱な話者が存在することを明らかにした.
2011-05-05

残響環境下音声認識における発話位置・話者依存性の分析評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク