Relating Audio-Visual Events Caused by Multiple Movements: In the Case of Entire Object Movement and Sound Location Change (特集:電気関係学会東海支部連合大会)
スポンサーリンク
概要
- 論文の詳細を見る
Relating audio-visual events is important for constructing an artificial intelligent system, which can acquire the audio-visual knowledge of moving objects through active observation without a supervisor. This paper proposes a method for relating multiple audio-visual events observed by a camera and a microphone according to general laws without object-specific knowledge, which copes with including entire object movement and sound location change. As corresponding cues, we use Gestalt’s grouping law; simultaneity of sound onsets and changes in movement, similarity of repetition between sound and movement. Based on the correlation coefficient between auditory and visual sequences, the component of frequency at sound onset is related to the spatiotemporal invariant sequence (STI sequence) of movement. We experimented in the real environment and obtained satisfactory results showing the effectiveness of the proposed method.
- 社団法人 電気学会の論文
- 2003-12-01
著者
-
向井 利春
理化学研究所基幹研究所
-
Chen Jinji
Nagoya University
-
Yamamura Tsuyoshi
Aichi Prefectural University
-
CHEN Jinji
CIAIR Nagoya University
-
MUKAI Toshiharu
Bio-Mimetic Control Research Center, RIKEN
-
TAKEUCHI Yoshinori
CIAIR Nagoya University
-
MATSUMOTO Tetsuya
CIAIR Nagoya University
-
KUDO Hiroaki
CIAIR Nagoya University
-
OHNISHI Noboru
CIAIR Nagoya University
-
Mukai Toshiharu
Bio-mimetic Control Research Center The Institute Of Physical And Chemical Research (riken)
-
Yamamura T
Aichi Prefectural University
-
Matsumoto Tetsuya
Department Of Informatics Kyushu University
-
Kudo H
Department Of Media Science Graduate School Of Information Science Nagoya University
関連論文
- Speeding Up String Pattern Matching by Text Compression: The Dawn of a New Era (特集 〔情報処理学会〕創立40周年記念論文)
- DP-186-8 内視鏡手術支援ロボットと周辺技術の開発(第108回日本外科学会定期学術集会)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人体を外側から扱うロボットの設計 : 人と接するロボットRI-MANの研究開発を通して得られた知見
- 触覚情報を用いた全身マニピュレーションの実現
- テクノロマン・インタビュー 理化学研究所バイオ・ミメティックコントロール研究センター研究チーム 生物の機能を真似て実現する 人を優しく抱き上げるロボット
- 1B2-5 RI-MANの身体認知機能の構築(1B2 OS:ヒューマンフレンドリーロボット)
- 1B2-4 人間と接するロボットRI-MANの開発(1B2 OS:ヒューマンフレンドリーロボット)
- IPMCを用いたヘビ型水中ロボットにおける屈曲振幅増大現象のモデル化と解析
- 反射板を用いた2本のマイクによる2音源の2次元位置推定
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 形状記憶ポリマーを用いた姿勢維持モジュールの基礎研究
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 1P2-S-084 人工筋肉を用いたヘビ型水中ロボットの推進モデル(アクチュエータの機構と制御3,生活を支援するロボメカ技術のメガインテグレーション)
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- Linear GP with redundancy-removed recombination for synthesis of image feature extraction programs (数理モデル化と問題解決・バイオ情報学)
- グリーンフィールド下大静脈フィルターの機械特性の数値解析(機械力学,計測,自動制御)
- 介護ロボット リーマン (特集 医療・福祉ロボット)
- 触覚センサのためのVDFオリゴマーの圧電特性
- IPMCの細胞毒性試験および質量分析
- 脳血管内カテーテル/ガイドワイヤシミュレータの開発
- カテーテルシミュレータの開発 : 第2報,ガイドワイヤのトルク伝達性の評価(機械力学,計測,自動制御)
- B202 画像処理を用いた触覚センサによる視触覚融合システム(B2-1 福祉工学1)
- B105 血管内カテーテルシミュレータに関する基礎研究 : 第2報,接触力算出方法の評価(B1-1 人工臓器)
- Gauss-Newton Particle Filter(Systems and Control)
- Retrieval-Combination法を用いた単眼画像からの3次元人物姿勢推定
- Fast Human Pose Retrieval Using Approximate Chamfer Distance (特集:電気関係学会東海支部連合大会)
- COMBINING GLOBAL AND SIMPLIFIED PARTS-BASED APPROACH TO ESTIMATE HUMAN BODY CONFIGURATION(International Workshop on Advanced Image Technology 2005)
- 複数運動で生じた視聴覚事象の対応付け : 運動物体がカメラ視野外にある場合
- 実環境音源分離におけるフィルタタップ数の低減手法
- 実環境音源分離におけるフィルタタップ数の低減手法
- Relating Audio-Visual Events Caused by Multiple Movements: In the Case of Entire Object Movement and Sound Location Change (特集:電気関係学会東海支部連合大会)
- A-10-6 マイクの近接配置による音源分離の性能評価と考察
- 運動で生じた視聴覚事象の対応付け(映像メディアおよび一般 : インターネット, デジタル放送, マルチメディア, 三次元画像, 視覚と画質評価, ITS等)
- 運動で生じた視聴覚事象の対応付け
- 運動で生じた視聴覚事象の対応付け
- F-13 指向性マイクを利用した移動音源分離(音声・音声言語情報処理,F.音声・音楽)
- Acceleration of Genetic Programming by Hierarchical Structure Learning : A Case Study on Image Recognition Program Synthesis
- DETERMINATION OF CORRESPONDENCE BETWEEN AUDIO AND VISUAL EVENTS THROUGH ACTIVE MOTION(International Workshop on Advanced Image Technology 2007)
- Lawn Weeds Detection Methods Using Image Processing Techniques
- AN ATTENTIONAL CORRESPONDENCE OF AUDIO-VISUAL EVENTS(International Workshop on Advanced Image Technology 2005)
- Multi-Objective Genetic Programming with Redundancy-Regulations for Automatic Construction of Image Feature Extractors
- シーン内の文字列領域の改良した抽出方法
- 介護支援ロボットRIBAはアナログな人間をどう扱うか(2.デジタルはアナログ世界を制御するか,アナログからデジタルへ-進化するデジタルはアナログ世界にどう向き合うか-)
- A method for compensation of image distortion with image registration technique
- J1103-1-1 形状記憶ポリマーを用いたMcKibben型アクチュエータの開発([1103-1]次世代アクチュエータシステム)
- Scrub Nurse Robot for Laparoscopic Surgery
- 1P1-G03 IPMCの生体適合性(ソフトロボティクス)
- 複数運動で生じた視聴覚事象の対応付け
- 918 形状記憶ポリマーのロボットの姿勢維持への応用(OS9-5 形状記憶材料の特性と応用)
- 9H-09 触覚センサを用いた生体内触診に関する基礎研究(OS-13(4) 組織特性の診療デバイスと臨床応用)
- 1A1-E24 介護支援ロボットRIBAの安全対策と移乗作業の実現
- 有機強誘電体触覚センサを用いた生体内触診の数値解析 : 血管の特性のセンサ出力への影響
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information (パターン認識・メディア理解)
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information
- Incorporating Top-Down Guidance for Extracting Informative Patches for Image Classification
- 医療・介護ロボット分野における有機センサの可能性 : 触覚センサを中心として
- 形状記憶ポリマーを用いた姿勢維持モジュールの基礎研究
- アフィン変換と相関によるKanade-Lucas特徴点追跡法の特徴点対応付け精度の改善(3次元映像情報メディア技術)