状態クラスタリングによるHM-Netの構造決定法の検討

概要

論文の詳細を見る
隠れマルコフ網 (HM-Net) は, 音素環境依存HMMの状態共有関係をネットワークとして表現する手法であり, 高精度かつ頑健な音声認識を実現する音響モデルとして有効であることが示されている. HM-Netを生成する方法として, これまで逐次状態分割法 (Successive State Splitting:SSS) やその改良が提案されているが, これらの手法は学習サンプルを用いて状態分割とパラメータ推定を繰り返す手法であるため, 大量の学習サンプルを利用する場合には計算量が膨大になるという問題がある. 通常, HM-Netは少量のサンプルによって構造決定され, 各状態の分布のみが多量のサンプルによって再推定される. しかし, 少量のサンプルでは大語彙連続音声認識などに用いる大規模なHM-Netの構造が得られない. 本報告では大語彙連続音声認識のための高精度なHM-Netを作成する手法として, 状態クラスタリングに基づく高速なHM-Netの構造決定法を提案する. 同じ学習サンプルセットを用いた場合に, 本手法が高速かつ従来と同等のHM-Netを生成可能であることを連続音素認識実験により示す.
一般社団法人情報処理学会の論文
1997-12-11