対話音声認識を指向した音響モデルの構築

スポンサーリンク

概要

論文の詳細を見る
発声変形等, 対話音声特有の音響的特徴を音響モデルに反映されるためには対話音声を用いた学習が必須であるが, あらゆる音素コンテクストについてその変形パターンを網羅しうるほど大量の対話音声コーパスは期待できないのが現状である。まず量は限られていても対話音声認識のために対話音声コーパスを用いて学習することの効果を確かめた。次に対話音声に読上げ音声を加えることで発話様式は異なっても学習量を増やすことの効果を確かめた。さらにより効果的に両コーパスを利用するために, 発話様式による音節構造の違いについて調べた。その結果, 対話音声では読上げ音声にくらべ出現コンテクストの偏りが見られた。この知識を学習に用いることで認識性能が向上することが確かめられた。
社団法人電子情報通信学会の論文
2000-01-21

著者

関連論文

もっと見る

スポンサーリンク