擬人化エージェントによるマルチモーダルインタフェース
スポンサーリンク
概要
- 論文の詳細を見る
一般に人が対面して対話をする際には、言語によるバーバル(verbal)な情報以外にも、視覚を通して視線の動きや様々な表情、また身振り手振りといったノンバーバル(non-verbal)な情報の授受も頻繁に行ない、意思や感情のスムーズな疎通を図っている[1]。すなわち人が対話する際には、言語による論理や感情の表現に加え、表情の変化やジェスチャー(これらを人の日常的な対話モードと呼ぶ)を意識的/無意識的に活用し、高度な相互理解を達成していると考えられる。これに対し、現在広く利用されているコンピュータや家電製品と人との対話においては、コマンドやボタン群といった人にとって非日常的な対話モードが用いられるのが一般的である。このだめユーザは機械毎にその操作法を学ばねばならず、機械の多機能/高機能化が進んだ昨今ではその負担は大きなものとなっている。今後もこのような状況が続けば、本来機械は多機能になるほどユーザに歓迎される筈が、それ故に敬遠されるという事態にもなりかねない。近年このような状況に鑑み、人の日常的な対話モードを活用し、人と機械のスムーズな対話の実現を目指すマルチモーダル対話(Multi-Modal Interaction : 以下MM対話)の重要性が強く認識されている。本稿では、このMM対話研究の一領域として最近注目を集めている擬人化エージェントによるマルチモーダルインタフェース 1 について慨説する[2,3]。
- 1997-03-06
著者
関連論文
- 半教師ありニューラルネットワークによる場所細胞の獲得とロボットの自律移動制御(人工知能,データマイニング)
- カーネルマシンへの高速ベクトル量子化の導入
- 人間との相互作用に基づくヒューマノイドロボット上の語順と挙動のオンライン学習(人工知能,認知科学)
- 自己増殖型ニューラルネットワークを用いたノイズのある環境下での追加学習が可能な連想記憶システム
- 自己増殖型ニューラルネットワークを用いたパターン情報ベースの推論機(バイオサイバネティックス,ニューロコンピューティング)
- LG-001 ノイズのある環境下でオンライン学習が可能な自己増殖型ニューラルネットワークを用いた連想記憶モデル(生体情報科学)
- LF-013 パターン情報ベースの命題論理式のための推論機の提案(人工知能・ゲーム)
- 自己増殖型ニューラルネット(SOINN)とパターンベース人工知能(オーガナイズドセッション,コンピュータビジョンとパターン認識のための学習理論)
- 自己増殖型ニューラルネット(SOINN)とパターンベース人工知能(オーガナイズドセッション2)
- 行動則の獲得状況を考慮した自己組織化マップによる状態空間構成法
- D-12-28 教師あり自己増殖型ニューラルネットワークを用いた顔画像認識(D-12. パターン認識・メディア理解,一般セッション)
- 競合型ニューラルネットを用いたオンライン準教師付能動学習手法(バイオサイバネティックス,ニューロコンピューティング)
- 局所情報と大域情報を統合する条件付確率場による画像ラベリング(画像認識,コンピュータビジョン)
- 競合型ニューラルネットを用いたオンライン準教師付き能動学習手法(一般セッション4)
- 高次相関特徴によるテクスチャ解析の試み
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 力学的自己増殖型ニューラルネットによる知覚・行為系列に基づく包摂アーキテクチャ上の状態空間構成
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 音声・視覚・画像を統合した対話システムの試作
- 変動要因が多い環境下でオンラインで稼働する画像を用いた自己位置同定手法
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 身振りと発話のマルチモーダルデータベース
- 手の表面情報認識による人物同定
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- インタフェース研究と脳科学
- インタフェース研究と脳科学
- インタラクションのための計測・認識 : ビジョンの特長を生かせるか?
- 学習による不特定環境下の顔の追跡と向きの推定
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 部分画像からの物体の認識と切り出し手法の提案
- 「顔」の情報処理
- 「顔」の情報処理
- ディベート : 「仮想ネットワーク社会に自律擬人化エージェントは必要か」の主旨と論点
- 高次局所自己相関特徴とKL展開による3次元物体のビューベース画像認識
- マルチモーダル対話システムのための人間型CGエージェントの構築
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 解説 マルチモーダル研究の現状と展望--フレーム問題の擬似的解決と実世界知能
- マルチモーダル研究の現状と展望 : フレーム問題の疑似的解決と実世界知能
- 生体の視覚に学ぶコンピュータビジョン
- D-12-12 プロトタイプ生成に基づくサポートベクトルマシンの高速化(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- 空間指示語と想起される認知領域の基礎的研究
- Multinomial Logit Modelによるオフライン手書き文字認識
- マルチモーダル対話における視覚の役割とその応用
- マルチモーダル対話における視覚の役割とその応用
- 擬人化エージェントによるマルチモーダルインタフェース
- 2-2 顔画像からの個人識別(2.認識技術の現状)(人体と顔の画像処理)
- 対話しながら学習するマルチモーダル対話システムを目指して
- マルチモーダル対話
- 転移学習とその周辺
- 組み込みシステムのGPGPU適用のためのアーキテクチャ提案(組込みアーキテクチャ,組込み技術とネットワークに関するワークショップETNET2012)
- 組み込みシステムのGPGPU適用のためのアーキテクチャ提案(組込みアーキテクチャ,組込み技術とネットワークに関するワークショップETNET2012)