HMMによる音声認識 : モデルの表現能力と頑健性
スポンサーリンク
概要
- 論文の詳細を見る
不特定話者、大語彙、連続音声認識を実現するために、隠れマルコフモデル(Hidden Markov Model:HMM)を用いた音声認識手法が、現在最も広く使われている。HMMは、各状態における出力確率分布の表現方法の違いにより、離散型HMM、半連続型HMM、連続型HMMの3種類がある。本稿では、それらのモデルの特徴について述べ、あわせて認識性能、頑健性を比較した実験例も紹介する。後半では、HMMの表現力を更に向上する手法として、スペクトルの局所的な遷移情報を利用して、動的な音声パターンの変化を効果的に表現するBigram制約HMMを紹介する。
- 社団法人電子情報通信学会の論文
- 1993-05-21
著者
関連論文
- フレーム間相関を利用した音韻 HMM による音声認識
- 音声デザインツールSesign
- ハイブリッドスケーラブル型音声合成方式
- 単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定(認識,理解,対話,一般)
- 単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション
- 話者照合機能を備えた音声秘書システム
- 音素信頼度尤度を用いたリジェクションの高精度化
- 公衆電話音声に対する音声認識性能評価
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 対立音素間の尤度差に基づく信頼度尺度によるリジェクション
- 語学訓練のためのHMM音声認識を用いた発声評価尺度
- 部分的尤度分布の差に着目した未知語のリジェクション
- VQコードのBigramで制約した音韻HMMによる音声認識
- コンタクトセンタ向け音声処理技術の展開 (特集 コンタクトセンタ業務に革新をもたらす音声処理技術)
- 学習移動ベクトルの相関関係を用いた音響モデルの話者適応化
- 4階層共有構造の音響モデルによる音声認識
- 音声認識エンジンREXの開発
- 雑音適応におけるTaylor展開の2次微分項の導入による効果
- 離散混合分布型HMMにおける量子化方法の検討
- Jacobian適応法による雑音適応の性能評価
- Jacobi行列を用いた音響モデルの適応アルゴリズム
- 音声認識のための音響モデルの構造
- Taylor展開による音響モデルの適応
- Taylor展開による音響モデルの適応
- Taylor展開に基づく高速な音響モデル適応法
- スペクトルサブトラクションとNOVO合成を用いた雑音下音声認識
- 音声認識における新しい高速化
- スペクトルの動的および静的特徴量を用いた言語音声の検出
- マイクロホンアレーを用いた音声認識収音系の基礎検討
- スカラー量子化による4階層共有構造HMMの高速計算
- 離散混合出力分布型HMM
- NOVO合成法を用いたBarge-in音声の認識
- 学習移動ベクトル間の相関によりtyingした音響モデルの共有構造
- 4階層共有構造音素モデルにおける分散値共有化の効果
- 典型的な応対フレーズ検出に基づく高精度用件フェーズ抽出手法(音声・音響一般,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 学習移動ベクトル間に相関を持つ音響モデルの共有構造
- 音声認識の音響モデルにおける高精度,高効率モデル化方式 (インタラクティブな音声インタフェ-スの実現を目指して)
- 4階層共有構造の音素HMM
- 4階層共有構造の音素HMM
- HMMによる音声認識 : モデルの表現能力と頑健性