Trigram・4-gramと文脈依存音響モデルを用いた1パス大語彙連続認識アルゴリズムとその高精度化(認識・理解・対話・一般)

スポンサーリンク

概要

論文の詳細を見る
大語彙連続音声認識の高精度化手法を開発した.我々の認識器は,1-best近似木構造辞書探索に線形辞書を組み合わせたアルゴリズムとなっており,効率的で高精度な探索を実現している.従来はbigramを用いていたこの手法を,トライグラムおよび4グラムを用いた1パスアルゴリズムに改良した.これにより,最適解の保証は失われるが,線形辞書を用いているためにその危険度は低くなる.また,単語間の音響的文脈の違いによる尤度の差を保存する尤度差インデックスを用いた,効率的で正確な単語間文脈依存音響モデルのデコーデイング法を提案する.最後に,複数の音響モデルを同時に1-パスアルゴリズムに用いてビームサーチにおける枝刈りを高精度化する方法も提案する.これらの手法を読み上げ音声およびニュース音声で評価した結果,有意な認識性能の向上を得た.
社団法人電子情報通信学会の論文
2006-06-16

著者

関連論文

もっと見る

スポンサーリンク