単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)

概要

論文の詳細を見る
ドメインを限定しない自然な話し言葉の音声理解を目的とした音声認識とそれを用いた音声理解について述べる.音声理解を困難にする単語の認識誤りを重要視する評価尺度である「重みつき単語誤り率(weighted word error rate: WWER)」について述べ,その上で,その重みつき単語誤り率の最小化を行う音声認識,具体的にはベイズリスク最小化(Minimum Bayes-Risk: MBR)の枠組みに基づいた音声認識手法について述べる.これまでにN-bestリストを用いたMBR音声認識の効果を確認しているが, N-bestリストは認識競合候補の表現力が弱く, MBR音声認識によるリスク最小化の効果が小さいという問題があった.このため,本稿では, N-bestリストよりも表現力の大きい単語グラフを利用したMBR音声認識に焦点をあてる.はじめに種々の単語グラフ探索アルゴリズムの比較を行い,コンフュージョンネットワーク型の単語グラフ探索の有効性を示す.次にCSJの学会講演10講演を用いて音声認識と音声理解のファーストステップである音声の重要箇所の同定(重要文抽出)の評価を行い,提案する手法が音声認識および重要文抽出の両方に対して効果があることを示す.
2006-12-21