AN ATTENTIONAL CORRESPONDENCE OF AUDIO-VISUAL EVENTS(International Workshop on Advanced Image Technology 2005)
スポンサーリンク
概要
- 論文の詳細を見る
A human being understands the environment by integrating information obtained by the senses of sight, hearing and touch. We propose a method of integrating audio-visual information to determine correspondences between audiovisual signals in the real world where the illumination varies and background objects and/or noises exist. The method uses sound source direction as attentional cues and directs attention toward it to observe the scene where a moving object probably exist. After paying attention, the method extracts the visual movement and correspond with the other modalities : hand, sound signals. The model to perceive objects accurately by adjusting camera's iris in varying illumination place or difficult situation to extract the visual movement for an auto-iris. We implemented the method and conducted experiments. The results show the effectiveness of the proposed method in correct corresponding by attention.
- 社団法人電子情報通信学会の論文
- 2005-01-03
著者
-
TAKEUCHI Yoshinori
Graduate School of Information Science and Technology, Osaka University
-
OHNISHI Noboru
Graduate School of Information Science, Nagoya University
-
MATSUMOTO Tetsuya
Graduate School of Information Science, Nagoya University
-
KUDO Hiroaki
Graduate School of Information Science, Nagoya University
-
Nishibori Kento
Graduate School of Information Science, Nagoya University
-
Nishibori Kento
Graduate School Of Information Science Nagoya University
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
Ohnishi Noboru
Graduate School Of Information Science Department Of Media Science Nagoya University
-
Matsumoto Tetsuya
Department Of Informatics Kyushu University
-
Takeuchi Yoshinori
Graduate School Of Engineering Science Osaka University
-
Kudo H
Department Of Media Science Graduate School Of Information Science Nagoya University
関連論文
- サッカー選手から見たシーンの生成
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- Optimal Scheme for Search State Space and Scheduling on Multiprocessor Systems
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成
- 固視微動に示唆を得たビジョンシステムによる奥行き判別支援
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 感覚運動統合による音源定位ロボットの構築
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- スリット提示の視認性の検討
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 大画面スリット視における文字・図形の収縮率の検討
- 大画面スリット視における文字・図形の収縮率の検討(視聴覚情報処理及び一般)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- 日本語の修飾構造を評価する添削支援システムを実現するための基礎研究
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- オンライン言語処理モデルにおける自己修復文の解析手法
- 自己修復の分析に基づく発話生成モデルに関する考察
- 自己運動を誘導する視覚刺激に対する生体反応の分析
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- オプティカルフローを用いた複雑背景下における人物の腕領域の抽出と運動パラメータ推定
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 触刺激による「方向」情報呈示とその識別について
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- 3)主観的輪郭生成のアルゴリズムとその画像理解への応用(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 主観的輪郭生成のアルゴリズムとその画像理解への応用 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 適応的なロバストSuper-Exponential法を用いた瞬時混合ブラインド音源分離(研究速報)
- 周波数領域BSSに対するSEMと参照信号EVA(アレー信号処理・音響計測/一般)
- 移動音源存在時のブラインド音源分離に対する一解決法
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- D-14-12 3音源混合信号からの源信号分離
- D-14-11 独立成分分析を用いた音源分離の性能評価
- 周波数領域で行うブラインド分離の一手法
- ラインカメラによる道路面撮像と画像処理
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 1P2-S-084 人工筋肉を用いたヘビ型水中ロボットの推進モデル(アクチュエータの機構と制御3,生活を支援するロボメカ技術のメガインテグレーション)
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- D-12-135 超高速ビジョンシステムと高速リニアスライダを用いた物体追跡
- コンピュータアニメーションによるサッカーシーンの再現
- 任意視点からサッカーシーンを復元する仮想カメラシステム
- 移動する選手から見たシーンの生成 : キャリブレーションと選字抽出の自動化
- 視覚障害者向け商品情報取得システム
- 視覚障害者の共有資料観覧支援システム
- 生物に示唆を得た選択的注意による視聴覚事象の対応付け手法
- 事前学習を用いないオンラインでの話者識別(聴覚・音声・言語とその障害,一般)
- 物体操作による視聴覚事象の対応付け
- 旋削自動プログラミングにおける同時加工順序のプランニング
- 盲人の空間認知に関する実験的考察(バリアフリーインタフェース)
- 一台のカメラによる顔と視線方向の推定
- 類似画像検索における部分教師付き特徴次元圧縮
- Linear GP with redundancy-removed recombination for synthesis of image feature extraction programs (数理モデル化と問題解決・バイオ情報学)
- NC2000-43 神経回路を用いた音源定位能力の自己組織的獲得
- 両眼網膜像の不一致検出と奥行き推定過程に基づいたサッカード機構 : 注視位置とサッカード間隔の評価
- Gauss-Newton Particle Filter(Systems and Control)
- Retrieval-Combination法を用いた単眼画像からの3次元人物姿勢推定
- Fast Human Pose Retrieval Using Approximate Chamfer Distance (特集:電気関係学会東海支部連合大会)
- COMBINING GLOBAL AND SIMPLIFIED PARTS-BASED APPROACH TO ESTIMATE HUMAN BODY CONFIGURATION(International Workshop on Advanced Image Technology 2005)
- Code Efficiency Evaluation for Embedded Processors(Special Section of Selected Papers from the 14th Workshop on Circuits and Systems in Karuizawa)
- Optimal Scheme for Search State Space and Scheduling on Multiprocessor Systems
- Reconfigurable AGU : An Address Generation Unit Based on Address Calculation Pattern for Low Energy and High Performance Embedded Processors
- Heart Instantaneous Frequency Based Estimation of HRV from Blood Pressure Waveforms
- DETERMINATION OF CORRESPONDENCE BETWEEN AUDIO AND VISUAL EVENTS THROUGH ACTIVE MOTION(International Workshop on Advanced Image Technology 2007)
- DETERMINATION OF CORRESPONDENCE BETWEEN AUDIO AND VISUAL EVENTS THROUGH ACTIVE MOTION
- AN ATTENTIONAL CORRESPONDENCE OF AUDIO-VISUAL EVENTS(International Workshop on Advanced Image Technology 2005)
- JPEG Encoder Design Space Exploration Using the ASIP Development System: PEAS-3 (特集:システムLSIの設計技術と設計自動化)
- Advantage and Possibility of Application-domain Specific Instruction-set Processor (ASIP)
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information (パターン認識・メディア理解)
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information
- Informative Patches Sampling for Image Classification by Utilizing Bottom-up and Top-down Information
- Seismic Response of Tall and Flexible Structure on Ground Including Contact Problem