ドメインとスタイルを考慮したWebテキストの選択による対話システム用言語モデルの構築(第8回音声言語シンポジウム)

概要

論文の詳細を見る
音声対話システムにおいて,ユーザの多様な発話を頑健に認識するためには,タスクドメインに合致した十分な量のテキストデータでN-gram言語モデルを学習することが望ましい.しかし,新たに音声対話システムを作成する際に,ユーザが入力すると想定される発話を大量に用意することは困難である.そこで本研究では, Webから学習データを収集・選択することにより効率的に言語モデルを構築する手法を提案する. Webの検索クエリは,対話システムが対象とするドメインについて記述された文書から作成して, Webを検索する.このようにして収集されたWebテキストの多くは,対話システムのユーザの発話スタイルとマッチしたものではなく,言語モデルの学習データとしてこれらのすべてを使用するのは適切でない.そこで,別の対話システムで収集されたユーザ発話コーパスを併用することで,発話スタイルの近い文を選択する.ソフトウェアサポートと観光案内の2つのドメインにおいて評価を行った結果,音声認識精度の有意な改善が得られた.また実験結果の分析により, Webテキストを選択する際に,テキストのスタイルを考慮することの重要性が確認された.
一般社団法人情報処理学会の論文
2006-12-21