非言語情報を用いたHMMによるユーザ発話前内部状態の推定(テーマセッション,時系列パターン認識)

概要

論文の詳細を見る
本稿では,音声対話システムにおけるユーザの発話前内部状態を推定する手法について述べる.実環境におけるシステム主導型対話システムのプロンプトは,たびたびユーザを混乱させる.一般的な対話システムは入力に時間か掛かっているユーザに対してより詳細な内容の情報を提示するなどの補助を行うが,これらの補助はプロンプトに対する入力を考えているユーザにとってはわずらわしいものとなる.適切な応対を行うためには,システムは発話前のユーザ内部状態を考慮できなくてはならない.従来のユーザモデル研究は発話の言語的な情報に注目してきた.このアプローチの問題の一つはユーザの内部状態が人力発話の終了まで待たないと推定できないことである.したがって,本研究ではユーザ発話が起こる前のフィラーや無音区間,頭部運動などのユーザの非言語的な情報に着目する.本稿では,これまで検討してきた固定長の特徴量を時系列特徴として構築し直し,隠れマルコフモデルによってユーザモデルの推定を行う.被験者に対してopenな識別実験を行ったところ,79.6%の識別精度を得た.
2012-02-02