単語適合率最大基準に基づく複数システムの統合

概要

論文の詳細を見る
本稿では,複数の認識結果の統合方法について提案する.近年,複数の認識結果を統合することによって,単独の認識結果よりも高い認識率が得られることが報告されている.複数の認識結果の統合にあたっては次のような問題点がある.(1)各認識結果の各単語に対してどのようなスコアを与えればよいか.(2)異なる認識結果をいかにして統合し,単語グラフを生成するか.(3)単語グラフの中からどのような基準で最良パスを選択するか。本稿では,最初の問題に対しては単語に対する事後確率値を,二番目の問題に対しては,編集距離最小の基準に基づくN次元のDPマッチングを,最後の問題に対しては,単語適合率に対する期待値が最大となるようなパスを選択するものとする.本手法に対し,二種類の実験で有効性の確認を行った.一番目の実験では,三種類の異なる音響特徴量を用いた認識結果を統合し,単独の認識結果の最良値よりも2.2ポイント低い単語誤認識率が得られた.また,二番目の実験では,三種類の異なるフレームシフトを用いた認識結果を統合し,単独の認識結果の最良値よりも0.6ポイント低い単語誤認識率が得られ,有効性が確認できた.
社団法人電子情報通信学会の論文
2002-06-21