残響下音声認識における発話様式の実験的分析と評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)

概要

論文の詳細を見る
近年,音声認識技術の発展に伴って,ハンズフリー音声インターフェースが爆発的に普及している.残響環境下においてマイクロホンから離れて発話すると残響混入の影響により音声認識性能が著しく低下する問題がある.これに対して事前に音声認識システムの性能予測を行い,予測結果に基づいて音声認識システムの前処理に反映することで音声認識性能向上が期待できる.たとえば残響に頑健あるいは脆弱な話者を特定できれば,事前に各話者に適切な音響モデルを選択できる.そこで本研究では,残響下音声認識の性能向上を目指して音声認識性能の話者依存性について調査した.具体的には,多種の発話内容が収録されているCSRC連続音声データベースと残響環境のインパルス応答を用いて連続音素認識評価を行い,発話内容・発話様式と音声認識性能の関係を実験的に分析した.発話内容と音声認識性能の関係を評価した結果,明瞭に発声しやすい文章(天気予報文章など)は,残響の有無に関係なく音声認識性能が高いことを確認した.一方,発話様式と残響下音声認識性能の関係を評価した結果,両者間に顕著な傾向が確認できなかったことから,残響が発話様式に与える影響は小さいことがわかった.
2012-05-17

残響下音声認識における発話様式の実験的分析と評価(オーガナイズドセッション:スピーチエンハンスメント,音声・音響信号処理,音声及び一般)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク