特徴量強調における教師なし話者適応に関する検討(ポスターセッション)

スポンサーリンク

概要

論文の詳細を見る
近年,音声認識技術は様々なアプリケーションで使用されている.しかし,録音環境に含まれる雑音や残響等の音響的な歪みにより認識性能が大幅に低下する.この問題の解決策として,クリーン音声のGMMを用いて観測音声の特徴量から音響的歪みの影響を取り除く特徴量強調技術が知られている.一方,モバイルデバイスへの音声入力に代表される最近のアプリケーションの多くでは,多様な環境で録られた認識対象個人の音声データを蓄積しておくことが容易にできる.しかしながら,こうした個人データをどのように扱えば特徴量強調を含む認識システム全体の性能を効果的に向上できるかは明らかでない.本研究では,特徴量強調に用いるクリーン音声GMMのMAP適応と音声認識に用いる音響モデルのMLLR適応のいくつかの組み合わせ方について,その効果を実験的に比較検討する.
2012-12-13

著者

関連論文

もっと見る

スポンサーリンク