複数トピック分類の信頼度に基づくドメイン外発話の検出(第5回音声言語シンポジウム : システム・信頼度)

概要

論文の詳細を見る
音声言語システムにおいては,バックエンドシステムが受理できない発話(ドメイン外発話)への対処が問題となる.本稿では,このようなドメイン外発話の検出法の枠組みを新たに提案する.本手法は,複数トピックの分類の信頼度を用いて,ドメイン内検証モデルをGPD(Generalized Probabilistic Descent)により学習する。この学習は,ドメイン内データの削除補間に基づいて行うため,ドメイン外の実データを必要とせず,移植性が高い.トピック分類手法として3つの手法(単語N-gram,LSA,SVM)を比較した結果,SVMが最も高い識別能力を得た.ドメイン外検出タスクにおいて,提案手法は,トピック分類結果の単純な組合せによるベースライン法と比較して,6.5ポイントも検出誤り率を改善した.さらに,実際のドメイン外データを用いて学習したシステムと比較しても,ドメイン外データを使用しない提案手法によりほぼ同等の性能が得られることがわかった.
社団法人電子情報通信学会の論文
2003-12-12