雑音環境下における音源分離を認識規範とした音声認識法の提案(生成,認識、音響心理)(音声の基礎と応用シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
雑音環境における音声認識の手法としては、スペクトルサブトラクションに代表されるような前処理を用いる手法とNOVO法のように認識に用いる音響モデルを雑音に応じて適応する手法が多数を占める。しかし、現時点で決定的な手法は存在しない。そこで、本研究ではボトムアップ的手法が中心であった音声強調処理(音源分離)に音韻特徴仮説をトップダウン的に与えることにより音声強調を行いながら仮説検定を行う手法を用いて、雑音環境下での音声認識を行う手法を提案する。提案法を用いて雑音中の母音認識を行った結果、雑音に強く影響されること無く認識を行うことができ、他の方法では認識できなかったSNR=-10dBにおいても正しく認識が行われた。
- 社団法人電子情報通信学会の論文
- 2004-06-19
著者
関連論文
- 変調伝達関数に基づいた骨導音声ブラインド回復法の検討
- 線形予測に基づいた骨導音声回復法の総合評価
- Comparative evaluation of bone-conducted-speech restoration based on linear prediction scheme (応用音響)
- 音声に含まれる感情情報の認識 : 感情空間をどのように表現するか
- A study on the LP-based blind model in restoring bone-conducted speech (Speech) -- (国際ワークショップ"Asian workshop on speech science and technology")
- 音声明瞭度の回復を目的とする線形予測分析に基づいた骨導音声ブラインド回復法の評価(聴覚・音声/一般)
- An LP-based blind restoration method for improving intelligibility of bone-conducted speech (音声)
- SingBySpeaking : 歌声知覚に重要な音響特徴を制御して話声を歌声に変換するシステム(スペシャルセッション・歌情報処理2)
- 方向性の手掛かりが雑音環境下での報知音の検知能力に及ぼす影響(聴覚・音声・言語とその障害,一般)
- 基本周波数の微細変動成分に対する知覚