マルチモーダル対話データベースに基づく音声と身振りの認識系統合モデル
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,音声と頭の動きを統合して扱い,ユーザの意図(肯定/否定)の識別をマルチモーダル対話データベース中のデータに基づいて行う「認識系統合モデル」を提案する.そしてこのモデルの意図識別率とマルチモーダルインタフェースの快適度の2点について評価した結果について述べる.その結果,実際の対話システムを開発して評価したときの識別率は,音声だけを用いた場合が86.3%,頭の動きだけを用いた場合が55.6%なのに対し,音声と頭の動きを両方とも用いた場合が91.9%となり,本認識系統合モデルが有効に機能することを確認できた. また,今回試作したマルチモーダルインタフェースを快適に感じるかどうかには個人差があることが分かった.
- 一般社団法人情報処理学会の論文
- 1996-06-15
著者
-
外川 文雄
シャープ株式会社応用システム研究所RWCP新機能シャープ研究室
-
湯浅 夏樹
Rwcp 新機能シャープ研究室 シャープ(株)応用システム研究所内
-
湯浅 夏樹
シャープ株式会社映像メディア研究所内RWCP新機能シャープ研究室
-
三谷 純司
シャープ株式会社映像メディア研究所内RWCP新機能シャープ研究室
-
外川 文雄
RWCP 新機能シャープ研究室 シャープ(株)応用システム研究所内
関連論文
- SA-6-3 音のリズム抽出による表示タイミング制御(SA-6. メディア変換・統合技術とヒューマンコミュニケーション,シンポジウム)
- 繰り返しを利用した音声要約の有用性検討
- 大量文書データ中の単語間共起を利用した文書分類
- 大量の文書データから自動抽出した名詞間共起関係による文書の自動分類
- 対話における感情の変化の解析
- 画像処理による視線方向検出手法
- マルチモーダル対話データベースに基づく音声と身振りの認識系統合モデル
- 概念識別子の頻度分布を利用した文書分類
- 複数カメラによる顔の向きの識別