マルチモーダル音声対話における視覚情報の効果
スポンサーリンク
概要
- 論文の詳細を見る
人間-音声対話システム間の円滑な対話のためには、システムの理解状態をユーザに積極的に開示することが重要な要素のひとつであると考えている。そこで、マルチモーダル対話において音声モダリティと視覚モダリティを併用することで、音声モダリティ、視覚モダリティを単独に用いる場合と比較して、システムのユーザ発話に対する理解状態を、どのくらいはやく、かつ正確に伝えることができるのか検証した。その結果、システム側が言語表現のみでは判断のつかない音声を出力した際に、特にシステムがユーザ発話を理解できなかったことを提示した場合において、音声と視覚モダリティを併用することで、ユーザにシステムの理解状態をより正確に伝えることができるようになることがわかった。また、はやく伝えられるかどうかに関しては音声、視覚モダリティ間の差よりもシステム側の出力音声の長さに依存し、システムが長い発話で理解状態を提示した場合には、視覚モダリティを併用することによってユーザに理解状態をよりはやく伝えることができるようになることが示された。
- 社団法人電子情報通信学会の論文
- 1999-06-18
著者
-
青山 一美
早稲田大学理工学部
-
川森 雅仁
NTT研究所
-
田本 真詞
NTT研究所
-
相川 清明
NTT研究所
-
相川 清明
東京工科大学
-
田本 真詞
日本電信電話株式会社nttコミュニケーション科学基礎研究所
関連論文
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 多次元心的状態を扱う音声対話システムの構築
- 音声対話システム汎用プラットホームにおける行動管理部の構築
- 音声対話システム汎用プラットフォームの検討
- マルチモーダル音声対話における視覚情報の効果
- 人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御 (ヒューマンインタフェースとインタラクション)
- 人間型対話インタフェースにおけるまばたき制御の検討
- 人間とロボットのコミュニケーションにおける非言語情報の利用
- 人の検索行動における情報入手戦略の視線による分析
- 音声ドキュメント検索評価のためのテストコレクションの試作(第8回音声言語シンポジウム)
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- NTCIR-9 SpokenDoc: 音声検索語検出と音声ドキュメント検索の評価枠組の設計
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- SLP音声ドキュメント処理ワーキンググループ活動報告(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- Spoken Term Detectionのためのテストコレクション構築とベースライン評価
- 韻律情報に着目した相互理解発話モデル
- 文型と音調によるユーザ発話行為理解
- 文型と音調によるユーザの発話意図の推定
- TV番組の録画予約を受け付ける実時間音声対話システム
- D-5-3 対話制御部設計のための音声対話データ検索ツール
- 音声対話システムの誤解検出のための質問応答連鎖分析
- 質問-応答連鎖からの音声対話システムの誤解の検出
- 質問-応答連鎖からの音声対話システムの誤解の検出
- 質問-応答連鎖からの音声対話システムの誤解の検出
- 2000-SLP-32-4 複数話者の発話が混在する発話系列を用いた対話理解
- システム発話とユーザ発話からなる時系列による音声対話理解
- 音声対話システムの誤解に対するユーザ応答の分析
- 音声対話システムの誤解に対するユーザ応答の分析
- 音声対話システムの誤解に対するユーザ応答の分析
- 音声対話システムの誤解に対するユーザ応答の分析
- 音声認識エンジンREXの開発
- 対話処理のためのコーパス作成
- Spoken Term Detection のためのテストコレクション構築とベースライン評価
- 音声ドキュメント検索評価のためのテストコレクションの試作(Session-4 一般(ポスターセッション),第8回音声言語シンポジウム)
- 人の検索行動における情報入手戦略の視線による分析
- 複数文脈を用いる音声対話システムにおける統計モデルに基づく談話理解法
- "反省型"信頼性尺度に基づく書き起こしなしデータを用いた言語モデル学習
- "反省型"信頼性尺度に基づく書き起こしなしデータを用いた言語モデル学習
- 確認対象ごとの認識性能を考慮する効率的対話制御法(音声対話・翻訳)
- 単一ドメインシステムの統合による複数ドメイン音声対話システム
- 2つの認識文法を用いた主導権混合型対話制御
- 2つの認識文法を用いた主導権混合型対話制御
- システム知識制限下での効率的音声対話制御法
- 確認対象での認識性能を考慮する効率的対話制御法
- 対話コスト最小化に基づく効率的対話制御
- 対話コスト最小化に基づく効率的対話制御
- SA-7-4 音声対話システム「飛遊夢(ひゅうむ)」
- タスク適応型高効率対話制御法
- システム知識制限下における効率的対話制御
- 音声中の検索語検出のためのテストコレクション構築 -中間報告-
- 課題遂行対話における対話潤滑語の認定
- 決定木学習による音声対話システムのための話者交代判定法
- 決定木学習による音声対話システムのための話者交代判定法
- 音声対話システムにおける対話進行の分析
- 自律型音声対話システムによる対話データの自動収集 (テーマ:一般)
- 対話調整の表出における韻律的特徴の分析
- 対話調整の表出における韻律的特徴の分析
- 音声の音響的特性を用いた顔方向認識
- 音声の音響的特性を用いた顔方向認識
- 音声対話の発話交代に関わる現象の分析
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (音声)
- NTCIR-9 SpokenDoc--音声検索語検出と音声ドキュメント検索の評価枠組の設計 (言語理解とコミュニケーション)
- 音声ドキュメント検索テストコレクションの試作と基本検索性能評価
- 大語彙日本語連続音声認識研究基盤の整備 : 汎用音素モデルの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 学習・評価テキストコーパスの作成
- 大語彙日本語連続音声認識研究基盤の整備 : 評価用連続音声認識プログラムの開発
- 話し言葉における冗長表現の解釈
- 話し言葉における冗長表現の解釈
- 対話における統御の概念
- 対話における統御の概念
- 談話標識語の形式と機能について
- 対話における発話交代の分析
- 談話標識語の音韻的研究(II)
- 談話標識語の音韻的研究(II)
- 談話標識語の音韻的研究
- 談話標識語の音韻的研究
- 前プラトン問題について
- 対話の分析 : 間投詞的応答に着目して
- 対話の分析 : 間投詞的応答に着目して
- マルチモーダル対話による共同作業における指示表現の分析
- 逐次発話理解法による対話音声理解(音声,聴覚)
- 逐次理解を行う音声対話システムの発話理解評価法
- 逐次理解を行う音声対話システムの発話理解評価法
- N-Best 認識候補を用いた逐次言語理解によるロバストな音声理解法
- n-best音声認識と逐次理解法によるロバストな音声理解
- n-best音声認識と逐次理解法によるロバストな音声理解
- 決定木を用いた未知語属性推定による効率的対話方法
- 音声対話における実例に基づく未知語属性推定
- 人とコンピュータの自然な音声対話を目指して (特集論文1 人にやさしい対話型コンピュータ)
- 対話ダータの表記法
- 雑音下母音聴取における雑音の調波構造の影響
- 非線形変換フィルタによる音声特徴抽出
- 時期差による発声変動及び伝送歪みに頑健な話者照合
- 時期差による発声変動を考慮した話者モデルの生成法
- 音声ドキュメント処理ワーキンググループ活動報告 (言語理解とコミュニケーション)
- 音声ドキュメント処理ワーキンググループ活動報告 (音声)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告(音声検索,第13回音声言語シンポジウム)
- 音声ドキュメント処理ワーキンググループ活動報告