Dempster-Shafer理論を用いた音声・画像情報の統合による個人認識システム
スポンサーリンク
概要
- 論文の詳細を見る
個人認識において, 音声と顔画像の複数情報をDempster-Shafer理論に基づき統合する新たな手法を提案し, この手法が棄却性能を含む総合的な個人認識性能を向上させる観点で有効であることを示す。従来の統合法は, 一般に音声, 画像の各単独情報の認識器において得られる尤度の重みつきの和によって統合尤度を算出し, この値のみを用いて認識結果を得るものが多い。ここで提案する手法は, 不確実量を扱えないというBayes確率の問題点を解決するために提案されたDempster-Shafer理論に基づき統合する方法である。Dempster-Shafer理論は, 数値化された複数の証拠を統合する魅力的な方法論であるが, 従来研究においては, 証拠を数値化する具体的で理にかなった方法が与えられていなかった。本研究では, この問題を正解カテゴリと不正解カテゴリの正規化尤度の累積密度分布関数をもとに証拠の数値化を行う新たな方法を提案する。実験の結果, 提案手法は, 従来の統合法に比べ18.0%認識率を改善できることを示す。
- 社団法人電子情報通信学会の論文
- 2001-11-08
著者
関連論文
- 音声認識実用化技術の展開(総合報告)
- 複数情報の統合による人物の性別・年齢層の推定法(顔とジェスチャの認識)
- クラス距離を重みとする局所保存射影とその顔画像による年齢推定への応用(テーマ関連セッション2)
- 会話ロボットとその聴覚機能
- 音声シフト : 音高の意図的な変化を利用した音声入力インタフェース(音声, 聴覚)
- 音声シフト : "SHIFT"on Speech
- I-062 監視カメラ映像からの実時間顔検出手法の一検討(I.画像認識・メディア理解)
- 複数情報の統合による人物の性別・年齢層の推定法
- 探索空間のエントロピーに基づく特徴量ストリームの動的な統合(音声認識・識別,第9回音声言語シンポジウム)
- 集合知に基づく語彙情報を用いたトピック依存言語モデリング(理解)