音声認識における確率モデルの重み係数の自動推定(音声認識・識別,第9回音声言語シンポジウム)

概要

論文の詳細を見る
音声認識における確率モデルのスケーリング係数を効率的に推定する新しい手法を提案する.音声認識システムの多くは,音響モデルと言語モデルで構成されており,それらの値のバランスを取るためにスケーリング係数が導入されている.従来,スケーリング係数の値は事前にテストデータを用い,認識実験を行うことによるグリッドサーチで調整されていた.提案法では,スケーリング係数を対数線形モデルの重みパラメータとし,最適値を事後確率最大化基準(maximum a posteriori probability)を基に勾配法を用いて推定を行う.事後確率はワードラティスを用いて計算を行った.ワードラティスを用いることによる推定値の初期値依存を避けるため繰り返し過程を導入する.繰り返し過程では,ワードラティスの生成と勾配法によるスケーリング係数値の推定が交互に繰り返される.実験の結果,提案手法により推定されたスケーリング係数の値が初期値に依存せずほぼ同じ値に推定されることを確認した.また,提案手法により推定された値を用いた場合の単語正解精度と,グリッドサーチで最適化された値を用いた単語正解精度の差は0.1%であることを確認した.
社団法人電子情報通信学会の論文
2007-12-13