Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム

概要

論文の詳細を見る
個人認識において, 音声と顔画像の複数情報をDempster-Shafer理論に基づき統合する新たな手法を提案し, この手法が棄却性能を含む総合的な個人認識性能を向上させる観点で有効であることを示す。従来の統合法は, 一般に音声, 画像の各単独情報の認識器において得られる尤度の重みつきの和によって統合尤度を算出し, この値のみを用いて認識結果を得るものが多い。ここで提案する手法は, 不確実量を扱えないというBayes確率の問題点を解決するために提案されたDempster-Shafer理論に基づき統合する方法である。Dempster-Shafer理論は, 数値化された複数の証拠を統合する魅力的な方法論であるが, 従来研究においては, 証拠を数値化する具体的で理にかなった方法が与えられていなかった。本研究では, この問題を正解カテゴリと不正解カテゴリの正規化尤度の累積密度分布関数をもとに証拠の数値化を行う新たな方法を提案する。実験の結果, 提案手法は, 従来の統合法に比べ18.0%認識率を改善できることを示す。
社団法人電子情報通信学会の論文
2001-11-08