2. 統計的手法を用いた音声モデリングの高度化とその音声認識への応用(<特集>音声情報処理技術の最先端)

スポンサーリンク

概要

論文の詳細を見る
従来、音声認識においては隠れマルコフモデル(HMM)による音声のモデル化が一般的であるHMMを用いた音声認識は丁寧な読み上げ発声に対しては90%以上の高い認識性能を持つ.しかしながら,日常会話などの通常の話し言葉音声に対してはその性能はまだ十分でない.また,認識性能の著しく低い話者が存在する,周囲雑音の影響を受け性能が劣化する,など多くの課題が残されている.これらの課題の解決のためには,HMMを内包した,より柔軟な統計的モデリング手法が必要とされている.この目的のために多様な手法が活発に研究されているが,ここでは,その中で特に3つのトピック,情報量基準を用いたモデル選択,構造的事後確率最大化による話者適応化,ダイナミックベイジアンネットを用いた音声モデリング,について解説し,今後の展望を述べる.
一般社団法人情報処理学会の論文
2004-10-15

著者

関連論文

もっと見る

スポンサーリンク