音声中の検索語検出における事前検索・HMM状態系列照合・リランキングの適用

概要

論文の詳細を見る
音声中の検索語検出 (STD:Spoken Term Detection) において,隠れマルコフモデル (HMM:Hidden Markov Model) 状態系列間の照合方式を用いた STD における・高精度化方式を提案する.提案方式では,音声ドキュメントに対し,予め音節認識を行っておき,得られた認識結果に対してあらゆる 2 音節 (音節バイグラム) での事前に検索を行っておく.クエリが与えられると,クエリの音節列を 1 音節ずつシフトさせながら 2 音節を作成し,2 音節事前検索の上位 K 件のみを照合対象データとして絞り込んだ上で,HMM 状態系列間の照合を行う.さらにリランキングを行うことによって,より高精度な検索の実現を図る.評価実験の結果,検索精度は従来方式と比べ,すべてのテストセットで約 10〜17 ポイントの精度向上が見られ,NTCIR-9 の Dry run を除くと,事前検索結果を導入してもほぼ精度低下なく 1.5 秒以下で検索可能であった.K = 1,000 とした場合,NTCIR-9 の Dry run を除き 3 つのテストセットにおいて,HMM 間照合をリランキングした場合と比べても,検索精度・検索時間で優位となった.以上より本提案方式の有効性を確認できた.
2013-12-12