音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
ドメインを限定しない自然な話し言葉の音声理解を目的とした音声認識の評価尺度とそれに基づくデコーディング手法を提案する.従来,音声認識の一般的な評価尺度として,全ての単語を一様に扱う「単語誤り率(word error rate: WER)」が用いられてきた.これに対して,情報検索の観点から各単語の重要度を考慮した「重みつきキーワード誤り率(weighted keyword error rate: WKER)」を提案する.講演音声からの重要文抽出のタスクにおいて,重みつきキーワード誤り率が重要文抽出の精度と相関が高いことを示す.その上で,ベイズリスク最小化(Minimura Bayes-Risk: MBR)の枠組みに基づいて,重みつきキーワード誤り率の最小化を行う音声認識を実現する.CSJの学会講演17講演を用いて評価を行い,提案する認識手法が重みつきキーワード誤り率及び重要文抽出精度の改善に効果があることを示す.
社団法人電子情報通信学会の論文
2004-12-15

著者

関連論文

もっと見る

スポンサーリンク