音声理解のための音声認識評価尺度とベイズリスク最小化デコーディング(大語彙音声認識)(第6回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
ドメインを限定しない自然な話し言葉の音声理解を目的とした音声認識の評価尺度とそれに基づくデコーディング手法を提案する.従来,音声認識の一般的な評価尺度として,全ての単語を一様に扱う「単語誤り率(word error rate: WER)」が用いられてきた.これに対して,情報検索の観点から各単語の重要度を考慮した「重みつきキーワード誤り率(weighted keyword error rate: WKER)」を提案する.講演音声からの重要文抽出のタスクにおいて,重みつきキーワード誤り率が重要文抽出の精度と相関が高いことを示す.その上で,ベイズリスク最小化(Minimura Bayes-Risk: MBR)の枠組みに基づいて,重みつきキーワード誤り率の最小化を行う音声認識を実現する.CSJの学会講演17講演を用いて評価を行い,提案する認識手法が重みつきキーワード誤り率及び重要文抽出精度の改善に効果があることを示す.
- 社団法人電子情報通信学会の論文
- 2004-12-15
著者
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 会議録作成支援のための国会審議の音声認識システム (画像符号化・映像メディア処理レター特集)
- 音声理解を指向したベイズリスク最小化枠組みに基づく音声認識(音声,聴覚)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(第8回音声言語シンポジウム)
- 単語グラフを利用したベイズリスク最小化音声認識とそれに基づく重要文抽出(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- オンライン変分ベイズ学習に基づくモデル比較を用いた音声区間検出(認識)
- 会議録作成支援のための国会審議の音声認識システム(音声,聴覚)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)