音声知覚実験による音声認識モデル単位の検討

スポンサーリンク

概要

論文の詳細を見る
現在、音声認識モデルの単位として、当該音素の前後の音素環境を考慮したコンテキスト依存音素モデル(triphone)が標準となってきている。しかし、コンテキスト依存モデルには、モデル数が増加することにより、認識時の計算量が多くなる、相対的に学習データが減少する、認識のデコーダが複雑になる、などといった問題点もある。そのため、我々は従来より音節を認識モデルの単位として用いてきた。日本語の知覚上の基本単位は音節(モーラ)であるという報告もあり、音節がどの程度連続音声認識の単位として有効であるかを明らかにすることは意義深いと考えられる。本稿では、音声知覚実験による音節とtriphoneとの比較を行い、さらに音節とtriphoneを用いた音声認識実験を通して、音節が認識の基本単位として有効かどうか検討する。
社団法人電子情報通信学会の論文
1999-07-08

著者

関連論文

もっと見る

スポンサーリンク