Webテキストを利用した言語モデル教師なし適応(認識・理解・対話・一般)

スポンサーリンク

概要

論文の詳細を見る
大語彙連続音声認識において高精度な認識を実現する有効な手段として,認識対象にマッチしたテキストを収集し,そこから認識対象に適応した言語モデルを作成する方法があるが,このテキスト収集作業は人手で行うには非常にコストの高い作業である.この問題を解決する手法として,我々はこれまでWWW(World Wide Web)から自動で対象マッチしたテキストを収集し,適応言語モデルを作成する方法を提案してきた[1].今回我々は,この手法をさらに改善する方法を提案する.一つは複数の単語を用いた検索クエリ構成法であり,この方法によって1000ページのWebテキスト収集時の単語正解精度が従来法より2.2ポイント改善した.さらに検索クエリに認識誤り単語が選択されることを回避する方法を提案した.この方法によって,検索クエリ候補に存在する認識誤り単語を4%にまで減少させた.
一般社団法人電子情報通信学会の論文
2006-06-16

著者

関連論文

もっと見る

スポンサーリンク