音素決定木に基づく逐次状態分割法によるHM-Netの検討

概要

論文の詳細を見る
限られた学習サンプルを用いて高精度かつ頑健なコンテクスト依存モデルを生成するために重要なことは, パラメータの共有関係をどのように決定するか, 未知コンテクストをどのように扱うかである. 鷹見らによって提案された逐次状態分割法(SSS)[4]は, ゆう度最大化を基準にモデルの状態共有関係を自動的に決定する優れた手法であるが, 未知コンテクストの扱いが十分ではなく, 状態分割時の分布の分割法にも問題がある. 本論文では, 逐次状態分割法のコンテクスト方向の状態分割過程に, 音素決定本に基づくコンテクストクラスの分割法を導入し, 同時に分布の分割法も改良したDT-SSSアルゴリズム(Decision Tree-based Successive State Splitting)を提案する. この手法により, 高精度かつあらゆるコンテクストを表現可能なHM-Netの自動生成が可能となる. 特定話者/不特定話者連続音素認識実験より, 従来のSSSによるHM-Netと同等以上の音素正解率が得られた. 特に未知コンテクストを含む音声における誤りの削減が大きく, 本手法の有効性が示された.
社団法人電子情報通信学会の論文
1997-10-25