音声対話システムにおける簡略表現認識のための自動語彙拡張

概要

論文の詳細を見る
音声対話システムにおいて,ユーザはしばしば名称の一部を省略して「簡略表現」として発話する.その結果,音声認識誤りを招く.我々は,簡略表現を元の表現の単語列の一部の単語を省略した表現として定義し,簡略表現を確率とともに自動生成して音声認識辞書に自動追加する.簡略表現の取得には,日本語では複合語を分割する必要があるが,形態素解析器のみの分割では固有名詞は必ずしも正確に分割できない.さらに,多くの簡略表現を辞書に追加すると,語彙サイズの増加により音声認識精度が劣化する.我々は,これらの問題の解決方法として,単語分割や発音推定のシステムの自動分野適応と元の表現との平仮名編集距離で表した音韻的類似度に基づく簡略表現候補の取捨選択を提案する.提案手法によって生成した簡略表現候補を推定確率とともに語彙に自動追加した結果,既存辞書内の語のみを含む発話に対する文字正解精度と簡略表現を含む発話の文字正解精度の両方が向上した.この結果から,提案手法により人手による簡略表現の追加を上回る音声認識精度が実現できることを示した.
2011-12-15