ユーザとのインタラクションにおけるロボットの注意先の選択(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)

概要

論文の詳細を見る
視聴覚情報が混在するマルチメディア環境下において、ロボットが注意を向けるべき対象への視線方向を、視覚情報と聴覚情報によって自律的に切り替えることは、ユーザとロボットとの柔軟なインタラクションの実現やシーンの理解に密接に係わっている。すなわち、ロボットは聴覚的注意を向けた空間に視覚的注意を向け、音源に関する画像情報をアクティブに読み取る。これにより、視聴覚的注意を相互に作用させ、状況の変化を的確に把握する。本論文では、このために、まず、画像情報と音情報に対する解析結果を統合することにより、音源定位の性能を向上させることについて述べる。このような統合により、音の信号だけでは音源方向に対する判断が曖昧であっても、音源位置を正しく推定でき、聴覚的注意をそこに向けることが可能になる。次に、聴覚的注意によって提示された空間に対する視覚的処理を行う。これは、ある空間への聴覚的注意状態により画像と同じ大きさの重みマップを生成し、画像の動き特徴と結合した後、画像内の色特徴、エッジの方優性特徴と統合することによって実現する。統合結果として得られた誘目度マップを利用して、ロボットが視線を自律的に動かし、誘目度マップで定義された関心対象に対して動的に注意を向ける方法を提案する。最後に、視聴覚情報が混在する実際のシーンに対して提案手法を適用し、実験を行う。このシーンでは、音声や非音声音の信号、複数話者から発せられた異なるパワーを持つ音声信号、シーン内のユーザの動き、ジェスチャなどの情報が入り混じっている。ロボットの視線の選択結果として、人間が普段行うようなアテンションに近い結果が得られており、提案手法の有用性を確認できた。
2003-03-11

ユーザとのインタラクションにおけるロボットの注意先の選択(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク