音素グラフに基づく仮説制限法を用いた大語彙連続音声認識の検討
スポンサーリンク
概要
- 論文の詳細を見る
本報告では,大語臭連続音声認識のための高速な手法一音素グラフに基づく仮説制限法一について検討する.提案法は,認識の前処理として音素グラフを生成し,この音素グラフに含まれる情報を利用して,効率的に探索手法を狭める手法であり,5000語の語粟タスクにおいて誤り率を増加させることなく処理時間の約70%が削減可能であると報告してきた.本報告では,音素グラフ生成の際に,FastMatcllモデルを用いて1音素先読みを行うことで,音素グラフ生成自体の処理量削減をはかる,さらに,言語モデルにおける学習データの違いによる認識結果の違いについても検討する6語粟サイズ20000の新聞記事読み上げ文音声で評価し,音素グラフに基づく仮説制限法の導入は,単語誤り率をほとんど増加させることなく処理時間の約60%を削減できることを示す.
- 社団法人電子情報通信学会の論文
- 1999-12-21
著者
関連論文
- 単語グラフ統合を用いた種々の雑音環境下での音声認識 (音声)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)
- SP2000-25 N-gramに基づくエルゴディックHMMによる言語モデル
- Quinphone HM-Netを用いた単語グラフ統合に基づく講演音声認識(音声・言語・音響教育,一般)
- 単語グラフ統合を用いた種々の雑音環境下での音声認識(認識,理解,対話,一般)
- 音声雑音環境下における音声区間検出の検討
- 話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
- 英語発音評定における各種正規化の検討 (音声)
- 英語発音評定における各種正規化の検討 (言語理解とコミュニケーション)
- PLSA言語モデル適応におけるアニーリングスケジュールの評価(言語モデル・システム,第10回音声言語シンポジウム)