中国語音声認識における音素環境のモデリング

スポンサーリンク

概要

論文の詳細を見る
トライフォンモデルを中国語音声認識に応用する場合、出現するモデルの数が膨大となり、モデルの学習を十分に行うことは難しい。そのため、タスクの変更により音素環境のミスマッチが生じた場合、認識性能は大きく劣化する。そこで我々は音響環境を考慮し、調音特性をもとに音素環境を分類するとともに、この分類に対し適当な調音質問による文脈分類木を作成した。これにより音響モデルをデータ駆動クラスタリングにより状態共有することで、モデル数を大幅に削減することが可能となり、タスクの変更に伴う音素環境のミスマッチに関する問題を解決することができた。タスク依存データ・非依存データを用いた認識実験の結果、タスク非依存データにおいて14%の誤り改善率を得るとともに、タスク依存データに対して性能の劣化が無いことを確認した。
一般社団法人情報処理学会の論文
2001-02-02

著者

関連論文

もっと見る

スポンサーリンク