講演音声における認識結果の高信頼度部分の抽出とそれを用いた教師なし話者適応(話者適応・識別)(第5回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
講演音声を対象とした,音響モデルの高精度な教師なし話者適応について報告する.教師なし適応化においては,認識によって自動的に生成した不完全ラベルを用いるため,認識精度の低い講演音声を対象とした場合,教師ありの場合と比較すると適応精度が劣化してしまう.そこで認識結果の信頼度を用いることで,教師なし話者適応の高精度化を図る.本研究では,認識結果の高信頼度部分を抽出し,適応の精度を向上させることで認識率の改善を図った.高信頼度部分としては,異なる2つの認識システムの出力の共通部分を用いた.CSJコーパスで本手法の実験を行った結果,正解率・正解精度が約4%向上し,教師あり話者適応に近い認識機能の向上を得た.
- 一般社団法人情報処理学会の論文
- 2003-12-18
著者
-
中川 聖一
豊橋技術科学大学
-
宇津呂 武仁
筑波大 大学院システム情報工学研究科
-
渡邉 友裕
豊橋技術科学大学工学部情報工学系
-
西崎 博光
山梨大学 大学院医学工学総合研究部
-
宇津呂 武仁
京都大学 大学院 情報学研究科
関連論文
- 長時間分析に基づく位相情報を用いた音声認識の検討 (音声)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 1987年音響・音声・信号処理国際会議(ICASSP 87)
- 文字コードに依存しない情報検索の実現
- 中間言語を用いたインドネシア語-日本語対訳辞書の拡充
- 非頻出語に対して頑健な日本語固有表現の抽出(語彙・固有表現・同義語)
- ワードスポッティング法を用いた文脈自由文法制御フレーム同期型HMM連続音声認識法
- ニュース番組における字幕生成のための文内短縮による要約
- 3W-5 ニュース音声の認識結果を用いた要約による字幕生成
- 連続出力分布型HMMによる日本語音韻認識