大語彙連続音声認識のための音素グラフに基づく仮説制限法の検討

スポンサーリンク

概要

論文の詳細を見る
本報告では, 大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition : LVCSR)のための高速な探索手法について検討し, 効果的に探索空間を狭める新しい手法-音素グラフに基づく仮説制限法-を提案する.本手法は, 認識の前処理として音素グラフを生成し, 認識段階ではその音素グラフの情報を利用して仮説の展開を制限しながら最良の単語列を探索する.音素グラフによる仮説制限は, 音素境界制限とForward-Backward Pruningからなり, これらは探索空間の大幅な削減を可能にする.語彙サイズ5000の新聞記事読み上げ音声を用いた認識実験において, 本手法が誤り率を増加させることなく処理時間の約70%を削減可能であることを示す.
社団法人電子情報通信学会の論文
1998-12-11

著者

関連論文

もっと見る

スポンサーリンク