番号案内を対象とした大語い連続音声認識アルゴリズム

概要

論文の詳細を見る
大語いの連続音声を対象とした音声認識アルゴリズムを提案する.本アルゴリズムは一般化予測LRパーザと音韻HMMを使ったHMM-LRアルゴリズムを基本としている.認識性能の向上と処理時間を減らすためここでは以下の3種類手法を併用する.(1)ビームサーチにおいて精密なゆう度を求めるために前向きのゆう度と後ろ向きのゆう度を利用する.(2)HMMのトレリス計算を削減して効率的な探索を行うために,整合窓を使って予測された意韻が存在しそうな音声区間のみを音韻照合に利用する.(3)効率的に探索を行うために無声化母音や表記の揺らぎを正規化し,同じ音韻系列をLRパーザのスタックと状態をチェックしてマージを行う.このアルゴリズムを7万人以上の加入者を含む電話番号案内タスクに適用して,連続単語発声の認識実験を行った.特定話者音声認識において85%の文認識率を達成した.更に,不特定話者音声認識においても,71%の文認識率を達成した.また,自由発声の特定話者音声認識においては59%の文理解率を達成した.
社団法人電子情報通信学会の論文
1994-02-25