音声認識のためのMDL基準に基づく環境依存認識単位のモデリング
スポンサーリンク
概要
- 論文の詳細を見る
Context-dependent phone units, such as triphones, have recently come to be used to model subword units in speech recognition systems that are based on the use of hidden Markov models (HMMs). While most such systems employ clustering of the HMM parameters (e. g., subword clustering and state clustering) to control the HMM size, so as to avoid poor recognition accuracy due to a lack of training data, none of them provide any effective criteria for determining the optimal number of clusters. This paper proposes a method in which state clustering is accomplished by way of phonetic decision trees and in which the minimum description length (MDL) criterion is used to optimize the number of clusters. Large-vocabulary Japanese-language recognition experiments show that this method achieves higher accuracy than the maximum-likeihood approach.
- 社団法人日本音響学会の論文
著者
-
渡辺 隆夫
NEC C&C メディア研究所
-
SHINODA Koichi
National Agricultural Research Center for Hokkaido Region
-
Shinoda K
Nec Corp. Kawasaki Jpn
-
Shinoda Koichi
NEC Corporation
-
Watanabe Takao
NEC Corporation
-
Watanabe T
Nec Corporation
-
篠田 浩一
NEC C&Cメディア研究所
関連論文
- 音声による文章入力のための言語モデル適用法の検討
- 音声認識のための高速最ゆう推定を用いた声道長正規化
- パソコン向け音声認識合成プラットフォームの構築とアプリケーションの試作
- 事後確率最大化手法を用いた言語モデルの学習
- 音声認識のためのスペクトルの調波構造の利用
- Diacylated 8-C-Glucosylcyanidin 3-Glucoside from the Flowers of Tricyrtis formosana
- 音声認識の実用化の現状と課題(パネルディスカッション「音声認識技術の実用化」)
- 音声認識のためのMDL基準に基づく環境依存認識単位のモデリング
- 構造的ベイズ手法による音響モデルの適応化