ユーザとのインタラクションにおけるロボットの注意先の選択(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
スポンサーリンク
概要
- 論文の詳細を見る
視聴覚情報が混在するマルチメディア環境下において、ロボットが注意を向けるべき対象への視線方向を、視覚情報と聴覚情報によって自律的に切り替えることは、ユーザとロボットとの柔軟なインタラクションの実現やシーンの理解に密接に係わっている。すなわち、ロボットは聴覚的注意を向けた空間に視覚的注意を向け、音源に関する画像情報をアクティブに読み取る。これにより、視聴覚的注意を相互に作用させ、状況の変化を的確に把握する。本論文では、このために、まず、画像情報と音情報に対する解析結果を統合することにより、音源定位の性能を向上させることについて述べる。このような統合により、音の信号だけでは音源方向に対する判断が曖昧であっても、音源位置を正しく推定でき、聴覚的注意をそこに向けることが可能になる。次に、聴覚的注意によって提示された空間に対する視覚的処理を行う。これは、ある空間への聴覚的注意状態により画像と同じ大きさの重みマップを生成し、画像の動き特徴と結合した後、画像内の色特徴、エッジの方優性特徴と統合することによって実現する。統合結果として得られた誘目度マップを利用して、ロボットが視線を自律的に動かし、誘目度マップで定義された関心対象に対して動的に注意を向ける方法を提案する。最後に、視聴覚情報が混在する実際のシーンに対して提案手法を適用し、実験を行う。このシーンでは、音声や非音声音の信号、複数話者から発せられた異なるパワーを持つ音声信号、シーン内のユーザの動き、ジェスチャなどの情報が入り混じっている。ロボットの視線の選択結果として、人間が普段行うようなアテンションに近い結果が得られており、提案手法の有用性を確認できた。
- 2003-03-11
著者
-
陳 彬
電気通信大学 大学院電気通信学研究科:(現)富士通研究所
-
目黒 光彦
電気通信大学大学院電気通信学研究科電子工学専攻
-
金子 光秀
電気通信大学大学院電気通信学研究科電子工学専攻
-
目黒 光彦
日本大学生産工学部数理情報工学科
-
陳 彬
電気通信大学 大学院電気通信学研究科 電子工学専攻
関連論文
- インタラクティブ操作に基づく色覚異常者のためのカラー画像の色変換(ソフトコンピューティング及び一般)
- 混同色線理論と色覚モデルに基づくカラー画像からの弁別困難色の検出と弁別しやすい色への変換(プロセッサ,DSP,画像処理技術及び一般)
- ユーザとのインタラクションにおけるロボットの注意先の選択(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- 変形輪郭モデルに基づく動画像からの任意オブジェクト領域の抽出(ソフトコンピューティング及び一般)
- 多重解像度解析に基づく劣化した輪郭形状からのロバスト特徴量の抽出(ソフトコンピューティング及び一般)
- 組合せ最適化に基づく色覚異常者におけるカラー画像中の弁別困難色の変換(ソフトコンピューティング及び一般)
- A-20-9 周波数選択性ロバストフィルタによるカラー画像からのエッジ抽出(A-20.スマートインフォメディアシステム,基礎・境界)
- 混同色線理論と色覚モデルに基づくカラー画像からの弁別困難色の検出と弁別しやすい色への変換(プロセッサ,DSP,画像処理技術及び一般)
- 混同色線理論と色覚モデルに基づくカラー画像からの弁別困難色の検出と弁別しやすい色への変換(プロセッサ,DSP,画像処理技術及び一般)
- 混同色線理論と色覚モデルに基づくカラー画像からの弁別困難色の検出と弁別しやすい色への変換(プロセッサ,DSP,画像処理技術及び一般)
- ベイジアンネットワークに基づく視聴覚情報の統合を用いた画像からの3次元音源位置推定
- 室内監視画像からの物体検出と移動履歴管理--2台のズーム機能付きカメラによる時系列画像を用いた室内監視 (特集 最新の監視システム--セキュリティショー2004)
- 色覚バリアフリーを実現するカラー画像の色変換
- A-4-12 周波数選択特性を有する荷重メジアンフィルタによるボケと雑音で劣化した画像の復元
- 室内監視画像からの物体領域の検出と移動履歴の管理(画像処理)
- 会話シーンにおけるロボットと複数ユーザとの共同注意の形成(画像処理)
- 顔姿勢推定に基づくユーザとロボットとの共同注意の形成
- 固有空間法による顔特徴の解析と似顔絵の生成(ヒューマンコミュニケーション及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- D-12-108 シーン内に置かれた物体の室内時系列画像からの検出
- 曖昧さを含んだ時空間指示によるコンピュータとの知的インタラクション
- 眼・色・光 より優れた色再現を求めて, 畑田豊彦, 矢口博久, 五十嵐幹雄, 羽石秀昭, 郡司秀明, 杉浦博明, 福原政昭, 齋藤美穂, 矢野正, 小笠原治, 馬場護郎, 竹村裕夫, 谷添秀樹, 津村徳道(共著), 日本印刷技術協会(2007-12), A5判, 定価(本体1,905円+税)
- A-20-14 テストスコアの定量化に基づくPC上での色覚特性の判定(A-20.スマートインフォメディアシステム,一般セッション)
- J-1 周波数選択特性を有する荷重メジアンフィルタによる雑音で劣化した画像の復元(画像処理1,J.グラフィクス・画像)
- A-20-6 統合順序を考慮したカラー画像の領域統合(A-20.スマートインフォメディアシステム,一般セッション)
- A-20-5 面積可変ブロック領域の統合による任意オブジェクト領域の抽出(A-20.スマートインフォメディアシステム,一般セッション)
- ユーザのラフな位置指定による動画像からの任意領域の抽出(ソフトコンピューティング,一般)
- A-20-9 ユーザ操作による色覚特性の簡易判定(A-20. スマートインフォメディアシステム,一般セッション)
- 複数の異なるモダリティ情報の統合に基づく移動ロボットの行動選択
- 視聴覚情報の統合による音源の3次元位置推定と移動追跡(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- K-22 ユーザとロボットとのインタラクションにおける共同注意の形成手法(ヒューマン情報処理(1),K.ヒューマンコミュニケーション&インタラクション)
- 音声に対応した口形状変化を有する似顔絵アニメーションの生成
- 12-8 特徴強調を考慮した似顔絵アニメーションにおける口形状表現
- 少数の実写画像に基づく擬似3次元シーンの自動生成(3次元映像情報メディア技術)
- A-16-38 動画像から獲得した人間の歩行動作パターンに基づく移動ロボットの動作制御
- バイアス除去を伴う一般化荷重メジアンフィルタ(研究速報)
- シミュレーテッドアニーリング法による一般化荷重メジアンフィルタの設計(画像処理,ソフトコンピューティング,一般)
- 顕著性マップに基づく分割画像の優先的な領域統合(生体信号処理,画像処理,ソフトコンピューティング,一般)
- J-6 インタラクティブ操作による緩やかな拘束条件と領域判定規則に基づくオブジェクトの抽出(画像処理1,J.グラフィクス・画像)
- ロバストな強調及びハイパスフィルタを実現するスイッチングLlフィルタ(システムオンシリコン,RFID技術,一般)
- 12-4 チューブ生成に基づく動画像の時空間領域分割とオブジェクト抽出への応用
- チューブによる動画像オブジェクトの表現--動画像の簡易記述・生成への適用
- 少数の透視投影画像に基づいて生成された仮想空間における3次元移動表現
- 12-7 少数の透視投影画像こ基づく視点位置と視線方向の3次元移動表現
- A-16-8 少数の透視投影画像に基づく擬似3次元シーンの自動生成
- A-15-10 対象の時空間配置を表す言葉を用いたコンピュータとの知的インタラクション
- A-20-6 均等色空間色差を用いた動画像からの道路標識の検出(A-20.スマートインフォメディアシステム,一般セッション)
- A-20-10 平均自乗誤差規範に基づくカラー画像の領域分割(A-20.スマートインフォメディアシステム,一般セッション)