音声認識のための複数の認識器を利用した能動学習

スポンサーリンク

概要

論文の詳細を見る
大語彙連続音声認識器の学習データに対する書き起こしコスト削減のための複数の認識器を利用した能動学習手法を提案する.この手法では複数の認識器から得られた複数の異なる認識結果文を用いて発話の選択を行う.認識結果文をアラインメントするためのプログレッシブ法と Voting Entropy を発話選択に用いている.提案手法を日本語話し言葉コーパスの 190 時間の音声データを使い評価し,能動学習を行わないランダムな発話選択より顕著に良い結果を得た.74% の単語正解精度を得るために必要な書き起こし付きデータ量はランダム選択では 97 時間,単語事後確率を用いた従来手法では 72 時間であるが,提案手法では 60 時間で済むという結果になった.
一般社団法人情報処理学会の論文
2009-12-14

著者

関連論文

もっと見る

スポンサーリンク