講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(話者適応・識別)(第5回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
講演音声を対象とした,音響モデルの高精度な教師なし話者適応について報告する.教師なし適応化においては,認識によって自動的に生成した不完全ラベルを用いるため,認識精度の低い講演音声を対象とした場合,教師ありの場合と比較すると適応精度が劣化してしまう.そこで認識結果の信頼度を用いることで,教師なし話者適応の高精度化を図る.本研究では,認識結果の高信頼度部分を抽出し,適応の精度を向上させることで認識率の改善を図った.高信頼度部分としては,異なる2つの認識システムの出力の共通部分を用いた.CSJコーパスで本手法の実験を行った結果,正解率・正解精度が約4%向上し,教師あり話者適応に近い認識機能の向上を得た.
一般社団法人情報処理学会の論文
2003-12-18

著者

関連論文

もっと見る

スポンサーリンク