複数運動で生じた視聴覚事象の対応付け : 運動物体がカメラ視野外にある場合
スポンサーリンク
概要
- 論文の詳細を見る
Relating audio-visual events is important for constructing an artificial intelligent system, which can acquire the audio-visual knowledge of moving objects through active observation without a supervisor. This paper proposes a method for relating multiple audio-visual events observed by a camera and two microphones in the scene that a moving object is not in the view of the camera. As corresponding cues, we use Gestalt's grouping law: simultaneity of sound onsets and changes in movement, similarity of repetition between sound and movement, similarity of direction between sound and movement. Based on the correlation coefficient between sound onset series and STI time series, the component of frequency at sound onset is related to the spatiotemporal invariant sequence (STI sequence) of movement. We experimented in the real environment and obtained satisfactory results showing the effectiveness of the proposed method.
- 社団法人映像情報メディア学会の論文
- 2004-12-01
著者
-
向井 利春
理化学研究所基幹研究所
-
Chen Jinji
Nagoya University
-
Mukai Toshiharu
RIKEN
-
Takeuchi Yoshinori
Nagoya University
-
Matsumoto Tetsuya
Nagoya University
-
Kudo Hiroaki
Nagoya University
-
Yamamura Tsuyoshi
Aichi Prefectural University
-
Ohnishi Noboru
Nagoya University
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
Yamamura T
Aichi Prefectural University
-
Matsumoto Tetsuya
Department Of Informatics Kyushu University
-
Kudo H
Department Of Media Science Graduate School Of Information Science Nagoya University
関連論文
- サッカー選手から見たシーンの生成
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- DP-186-8 内視鏡手術支援ロボットと周辺技術の開発(第108回日本外科学会定期学術集会)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成
- 固視微動に示唆を得たビジョンシステムによる奥行き判別支援
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- 人体を外側から扱うロボットの設計 : 人と接するロボットRI-MANの研究開発を通して得られた知見
- 触覚情報を用いた全身マニピュレーションの実現
- テクノロマン・インタビュー 理化学研究所バイオ・ミメティックコントロール研究センター研究チーム 生物の機能を真似て実現する 人を優しく抱き上げるロボット
- 1B2-5 RI-MANの身体認知機能の構築(1B2 OS:ヒューマンフレンドリーロボット)
- 1B2-4 人間と接するロボットRI-MANの開発(1B2 OS:ヒューマンフレンドリーロボット)
- IPMCを用いたヘビ型水中ロボットにおける屈曲振幅増大現象のモデル化と解析
- 反射板を用いた2本のマイクによる2音源の2次元位置推定
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 感覚運動統合による音源定位ロボットの構築
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- スリット提示の視認性の検討
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 大画面スリット視における文字・図形の収縮率の検討
- 大画面スリット視における文字・図形の収縮率の検討(視聴覚情報処理及び一般)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- 日本語の修飾構造を評価する添削支援システムを実現するための基礎研究
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- オンライン言語処理モデルにおける自己修復文の解析手法
- 自己修復の分析に基づく発話生成モデルに関する考察
- 自己運動を誘導する視覚刺激に対する生体反応の分析
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- オプティカルフローを用いた複雑背景下における人物の腕領域の抽出と運動パラメータ推定
- 形状記憶ポリマーを用いた姿勢維持モジュールの基礎研究
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 触刺激による「方向」情報呈示とその識別について
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- 3)主観的輪郭生成のアルゴリズムとその画像理解への応用(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 主観的輪郭生成のアルゴリズムとその画像理解への応用 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 適応的なロバストSuper-Exponential法を用いた瞬時混合ブラインド音源分離(研究速報)
- 周波数領域BSSに対するSEMと参照信号EVA(アレー信号処理・音響計測/一般)
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 1P2-S-084 人工筋肉を用いたヘビ型水中ロボットの推進モデル(アクチュエータの機構と制御3,生活を支援するロボメカ技術のメガインテグレーション)
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- グリーンフィールド下大静脈フィルターの機械特性の数値解析(機械力学,計測,自動制御)
- 介護ロボット リーマン (特集 医療・福祉ロボット)
- 触覚センサのためのVDFオリゴマーの圧電特性
- IPMCの細胞毒性試験および質量分析
- 脳血管内カテーテル/ガイドワイヤシミュレータの開発
- カテーテルシミュレータの開発 : 第2報,ガイドワイヤのトルク伝達性の評価(機械力学,計測,自動制御)
- B202 画像処理を用いた触覚センサによる視触覚融合システム(B2-1 福祉工学1)
- B105 血管内カテーテルシミュレータに関する基礎研究 : 第2報,接触力算出方法の評価(B1-1 人工臓器)
- 複数運動で生じた視聴覚事象の対応付け : 運動物体がカメラ視野外にある場合
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- Relating Audio-Visual Events Caused by Multiple Movements: In the Case of Entire Object Movement and Sound Location Change (特集:電気関係学会東海支部連合大会)
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 運動で生じた視聴覚事象の対応付け
- 運動で生じた視聴覚事象の対応付け
- F-13 指向性マイクを利用した移動音源分離(音声・音声言語情報処理,F.音声・音楽)
- Printing Fabrication of a Bucky Gel Actuator/Sensor and Its Application to Three-Dimensional Patterned Devices
- シーン内の文字列領域の改良した抽出方法
- Extraction and Distortion Rectification of Signboards in a Scene Image for Robot Navigation
- 介護支援ロボットRIBAはアナログな人間をどう扱うか(2.デジタルはアナログ世界を制御するか,アナログからデジタルへ-進化するデジタルはアナログ世界にどう向き合うか-)
- J1103-1-1 形状記憶ポリマーを用いたMcKibben型アクチュエータの開発([1103-1]次世代アクチュエータシステム)
- 1P1-G03 IPMCの生体適合性(ソフトロボティクス)
- 複数運動で生じた視聴覚事象の対応付け
- 918 形状記憶ポリマーのロボットの姿勢維持への応用(OS9-5 形状記憶材料の特性と応用)
- 9H-09 触覚センサを用いた生体内触診に関する基礎研究(OS-13(4) 組織特性の診療デバイスと臨床応用)
- 1A1-E24 介護支援ロボットRIBAの安全対策と移乗作業の実現
- 有機強誘電体触覚センサを用いた生体内触診の数値解析 : 血管の特性のセンサ出力への影響
- 医療・介護ロボット分野における有機センサの可能性 : 触覚センサを中心として
- 形状記憶ポリマーを用いた姿勢維持モジュールの基礎研究
- A Novel Method for Exploring Patch-level Context to Improve Image Categorization Performance
- Fusion of 3D Shapes in Multiple View Points to Obtain More Accurate Shape (特集:電気関係学会東海支部連合大会)
- Measurement and Modeling of Electro-Chemical Properties of Ion Polymer Metal Composite by Complex Impedance Analysis