汎用LVCSRを用いた対話音声の認識

スポンサーリンク

概要

論文の詳細を見る
本報告では汎用LVCSR(ディクテーション用)ソフトウエアを利用して,対話文音声を高精度で認識する方式を提案する。提案方式は,LVCSRが出力する音素系列を弁別的な特徴ベクトル系列に変換した後,対話管理部から指示される対話記述(語彙と文法知識)を利用して,キーワードをスポッティングする。本方式の特長は以下の二点にある。(1)言語モデルの制約を緩めて,LVCSRの持つ高い音素識別能力を最大限に利用している。(2)音素系列出力を弁別的な特徴ベクトル系列に置き換えた後DPマッチングを適用し,置換・脱落・付加誤りに対処している。本文では,道案内タスクの対話文音声データを用いて比較評価実験を行い,提案方式の有効性を示す。
一般社団法人情報処理学会の論文
2002-05-24

著者

関連論文

もっと見る

スポンサーリンク