大規模コーパスへのクラス付与に基づく音声対話システム用言語モデルの構築

スポンサーリンク

概要

論文の詳細を見る
音声対話システムでは地名などの固有名詞(内容語)の認識が重要である.本研究では,これをクラスとしたクラスN-gramモデルの自動作成を行う.これにはクラスが多数付与された大規模コーパスが必要であるが,個別の音声対話システムのドメインにおいて大規模コーパスの存在を仮定するのは現実的ではない.そこで我々は,類似ドメインの大規模コーパスを用い,その中で,検索対象データベース中の内容語と一致する部分を種とした機械学習を行うことで,徐々にクラス付与箇所を増加させるというアプローチを採る.これにより,内容語周辺の多様な発話パターンを認識可能な言語モデルの構築を目指す.評価実験により,提案する枠組みにより,内容語の認識率が向上する可能性を示す.
2012-07-12

著者

関連論文

もっと見る

スポンサーリンク