音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討

スポンサーリンク

概要

論文の詳細を見る
本報告では,大語彙連続音声認識のための高速な手法-音素グラフに基づく仮説制限法-について検討する.提案法は,認識の前処理として音素グラフを生成し,この音素グラフに含まれる情報を利用して,効率的に探索手法を狭める手法であり,5000語の語彙タスクにおいて誤り率を増加させることなく処理時間の約70%が削減可能であると報告してきた.本報告では,音素グラフ生成の際に,Fast Matchモデルを用いて1音素先読みを行うことで,音素グラフ生成自体の処理量削減をはかる.さらに,言語モデルにおける学習データの違いによる認識結果の違いについても検討する.語彙サイズ20000の新聞記事読み上げ文音声で評価し,音素グラフに基づく仮説制限法の導入は,単語誤り率をほとんど増加させることなく処理時間の約60%を削減できることを示す.
一般社団法人情報処理学会の論文
1999-12-20

著者

関連論文

もっと見る

スポンサーリンク