音声スペクトルの動的特徴を組み込んだ HMM
スポンサーリンク
概要
- 論文の詳細を見る
従来,HMMの音声認識への適用に際して種々の改良がなされているが,基本的には,音声は短い区間では定常的であって,その定常的な区間に適当なHMMの一つの状態が対応するという仮定がある.しかし,この仮定は,特にスペクトルの動的特徴が音韻性を与える重要な因子となる場合には必ずしも適切なものではない.本論文では,この問題を取り除く方法の一つとして,新しい構造をもつHMMの提案を行う.本モデルは,HMMの状態内での時間変化の記述を可能とし,具体的には,状態iにおける観測ベクトルy_tの確率密度を正規分布で与え,その平均値μ_iが状態iでの滞留時間に伴って変化するものである.この変化が線形の場合の各パラメータの推定法を示す.実験により,本モデルは,連続分布型基本HMMの性能を上回り,Δメルケプストラムを導入すれば,更に性能が向上することがわかった.また,計算量の大部分を占める各状態における特徴ベクトルの出力確率の計算量は,平均値μ_iの線形変化性を利用することにより,連続分布型基本HMMよりもわずかに増加するだけである.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
坪香 英一
松下電器産業株式会社
-
坪香 英一
松下電器中央研究所電子機器基礎研究所
-
中橋 順一
松下電器産業(株)中央研究所
-
中橋 順一
松下電器産業
-
中橋 順一
松下電器産業株式会社中央研究所電子機器基礎研究所
-
坪香 英一
松下電器産業株式会社中央研究所電子機器基礎研究所
関連論文
- 12-2 静止画・音声ファイル装置
- 対話処理駆動による音声対話システム
- 音節継続時間予測法を用いた不特定話者連続音声認識
- 音声スペクトルの動的特徴を組み込んだ HMM
- 特徴ベクトル間の非類似度を帰属度ベクトル間の非類似度とする音声認識
- Kullback-Leibler Divergenceを距離尺度とする音声認識
- ファジーベクトル量子化に基づくHMMの数理的考察とその改良
- 相乗型FVQ/HMM