連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討

概要

論文の詳細を見る
HMMのViterbiアルゴリズムに基づく音声認識はグラフサーチの問題である.我々は, best-firstサーチの技法を利用してViterbiアルゴリズムによる認識処理の高速化を図る手法を検討し, 離散分布型HMMにおいて, 最大経路スコア, および, 単純な音楽HMMを利用する推定スコア設定法によるVirterbi best-firstサーチのアルゴリズムを提供した[6].本論文では, Viterbi best-firstサーチを連続分布型HMMとセミ連続分布型HMMに適用し, 各モデルに適した推定スコア設定法を検討する.連続出力確率分布を用いてHMMでは, 推定スコア設定においてマッチング領域を削減するだけでなく, 負荷の大きい出力確率計算を簡略化することも重要である.このような観点から, 我々は連続分布型HMMにおいてガウス密度関数をステップ関数で代用する推定スコア設定法を提案した[8].しかしながら, この推定スコア設定法は出力確率計算を簡略化するだけで, マッチング領域を削減するものではなかった.本論文では, 各モデルの特徴に基づいて出力確率計算とマッチング領域の両方を考慮した新しい推定スコア設定法を検討し, 連続分布型HMMでは最大分岐密度と最大経路スコアに基づく方法, セミ連続分布型HMMでは最大分岐確率に基づく方法を提案する.特定話者/不特定話者単語認識実験により, 提案した推定スコア設定法による計算量低減の効果が大きいことを示す.
社団法人電子情報通信学会の論文
1998-11-25

連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討

スポンサーリンク

概要

著者

関連論文

スポンサーリンク