連続数字音声認識における音響モデル学習法の検討

スポンサーリンク

概要

論文の詳細を見る
連続数字音声認識は音声ダイアル、データ入力、クレジットカード番号/暗証番号照合など、さまざまな応用の考えられる技術である。しかし、実際の応用においては、通常、任意の数字の連続が許されるため、連続音声認識において重要な役割を果たす文法的拘束が有効に使えない。したがって、精度の高い音響モデルが必須である。本報告ではTied-mixture HMMをベースとした不特定話者連続数字音声認識のための高精度な音響モデルの学習法について報告する。単語(数字)を語頭(head)、語中(body)、語尾(tail)に分割することで効率よく音素コンテキストを考慮したサブワードモデルを用い、クラス間の識別能力を最大化するため誤り最小化学習を行うことにより、電子協音声データベースを用いた連続数字認識において非常に高い認識率を達成することができた。
社団法人電子情報通信学会の論文
1995-06-22

著者

関連論文

もっと見る

スポンサーリンク