音素履歴木を用いたフレーム同期型SSS-LR文音声認識

スポンサーリンク

概要

論文の詳細を見る
連続発声された文音声の認識では、文節発声に比較して文法的暖昧性が増加する。従来用いられていた音素同期型HMM-LRでは、1つのLRスタックを1つのセルで表現するために、文法的暖昧性の増加に伴い同一音素列に対する仮説数も増加する。このため、音素照合が重複し処理時間が多くなる問題点があった。また、音素同期型探索では尤度の正規化が必要であるが、正規化の精度が悪いと認識率が低下する問題点があった。本論文では、音素履歴木を用いたフレーム同期型SSS-LR連続音声認識手法を提案する。本手法は、統語解析部に(1)音素履歴木(2)状態ネットワークを導入し、文法的暖昧性の増加に起因する仮説数の増加を抑えた効率的なフレーム同期型処理を実現した。なお、HMMモデルは音素照合の高精度化を図るためSSSアルゴリズムで作成したコンテキスト依存HMMモデルを使用した。また、本手法を用いた特定話者。不特定話者文認識実験結果について述べる。
一般社団法人情報処理学会の論文
1994-09-20

著者

関連論文

もっと見る

スポンサーリンク