マルチモーダル対話データベースに基づく音声と身振りの認識系統合モデル

スポンサーリンク

概要

論文の詳細を見る
本稿では,音声と頭の動きを統合して扱い,ユーザの意図(肯定/否定)の識別をマルチモーダル対話データベース中のデータに基づいて行う「認識系統合モデル」を提案する.そしてこのモデルの意図識別率とマルチモーダルインタフェースの快適度の2点について評価した結果について述べる.その結果,実際の対話システムを開発して評価したときの識別率は,音声だけを用いた場合が86.3%,頭の動きだけを用いた場合が55.6%なのに対し,音声と頭の動きを両方とも用いた場合が91.9%となり,本認識系統合モデルが有効に機能することを確認できた. また,今回試作したマルチモーダルインタフェースを快適に感じるかどうかには個人差があることが分かった.
一般社団法人情報処理学会の論文
1996-06-15

著者

関連論文

スポンサーリンク