状態荷重を組み込んだ継続時間長制御型状態遷移モデルとその最小分類誤り訓練
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 識別的荷重パラメータを組み込んだ継続時間長制御型状態遷移(DST)モデルと, 本モデルを用いた音声認識設計法について述べる. 音声の音響的/時間的な変動は, 頑健な音声認識モデルを設計する上で重要な問題となっている. この問題に対処するため, 状態荷重パラメータをDSTモデルの構造に統合し, 対応する音声セグメントの得点を制御する. 状態荷重は, 局所的な発話の変動を吸収し, 音声パターンの得点に直接反映できる識別能力を提供する. 更に, 継続時間長を組み込んだ照合が, 過度の伸縮による不具合を防ぐ. 提案パラメータは, 他のすべてのモデルパラメータとともに, 最小分類誤り(MCE)基準により統一的に訓練される. MCE訓練は, 一般化確率的降下(GPD)法により実装され, 競合モデル間の認識誤り数を直接最小化する. 本論文では提案モデルと類似構造をもつ基本隠れマルコフモデル(HMM)との関連を述べ, HMMに対する本訓練法の適用可能性についても議論する. スポッティングを基本とする不特定話者単語認識実験では, 状態荷重と継続時間長制御が性能改善に効果があることを示す. 更に, 性能の低い話者に対して, MCE/GPD訓練による話者適応を施したところ, 認識率が65.5%から92.0%に向上し, 本訓練の有効性が示された.
- 社団法人電子情報通信学会の論文
- 1999-05-25
著者
関連論文
- 複写機における聴覚的階層メニューの検討(福祉と音声処理及び一般)
- 複写機における聴覚的階層メニューの検討(福祉と音声処理及び一般)
- 視覚情報を用いない複写機の操作方法
- 視覚を使わない複写機の新しい設定操作方式
- 部分的な音素の学習による話者適応
- 状態荷重を組み込んだ継続時間長制御型状態遷移モデルとその最小分類誤り訓練
- 構文解析機を用いたスポッティングによる連続音声認識
- 文テンプレートによる発話文認識
- 文テンプレートによる文認識方法