運動を介した視聴覚による物体定位能力の獲得
スポンサーリンク
概要
- 論文の詳細を見る
視聴覚による知覚と首の回転運動の繰り返しによる,音源定位学習モデルを提案する.学習は,運動を介した視聴覚による物体定位を通して行われる.モデルは,3つの多層パーセプトロン型ニューラルネットワークの組み合わせで構成され,誤差逆伝播法による学習のための誤差信号は,運動を通して獲得する.提案モデルを検証するために,ロボットを用いたシステムを作成し,スピーカで音を発生させて実験を行った.実験の結果,聴覚的定位と視覚的定位の同時学習,未学習方位に対する汎化,および動作の効率化を示すことができた.音源とロボットとの距離に対する定位エラーの様子についても示し,さらに,学習されたニューラルネットワークの写像について考察を与える.
- 1997-03-18
著者
-
山村 毅
名古屋大学大学院工学研究科情報工学専攻
-
浅井 泰行
名古屋大学大学院工学研究科
-
黄 捷
会津大コンピュータ理工学部
-
大西 昇
名古屋大学 大学院 工学研究科 情報工学専攻
-
黄 捷
理化学研究所
-
大西 昇
名古屋大学
関連論文
- サッカー選手から見たシーンの生成
- 難聴者のための,会議における発言聴取支援システム(肢体障害・聴覚障害,HCGシンポジウム)
- 自己運動感覚を誘導する視覚刺激に対する生体反応の分析
- 自己運動を誘導する視覚刺激に対する生体反応の分析(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 自己運動を誘導する視覚刺激に対する生体反応の計測
- 3次元形状手がかりに基づく陰影からの表面反射特性知覚(ヒューマンインフォメーション)
- 視聴覚事象の中心的事例の教師なし学習
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション6)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 吹き付けによる3次元形状モデリングの提案
- 三次元CGにおけるカメラワークの自動生成
- 固視微動に示唆を得たビジョンシステムによる奥行き判別支援
- ディジタル画像内での部分複写の検出(改竄検出,映像符号化,システム及び一般)
- 重なり合う物体の輪郭線抽出 : 頂点組み合わせ決定と輪郭線生成の改良
- A-19-13 聴覚障害者の講義におけるハウリング音の位置検出(A-19.福祉情報工学,一般講演)
- 安全運転支援のための緊急自動車のサイレン音の検出
- 指示語に対応する指示対象抽出による遠隔パソコン要約筆記者支援の提案
- スペクトルの特徴マップを用いた上下方向音源定位学習システム(バイオサイバネティックス,ニューロコンピューティング)
- 音圧差情報付加による音源定位システムの性能改善
- 感覚運動統合による音源定位ロボットの構築
- 曲面に書かれた文字の抽出(テーマセッション: マルチメディアコンテンツ, データ工学とメディア理解との融合)
- 超高速ステレオヘッドを用いた移動物体追跡と効率的協調制御(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- スリット提示の視認性の検討
- スリット提示の視認性の検討(ヒューマンインフォメーション, ITS画像処理,映像メディア及び一般)
- 大画面スリット視における文字・図形の収縮率の検討
- 大画面スリット視における文字・図形の収縮率の検討(視聴覚情報処理及び一般)
- webページ中のテキストと表からの重要個所抽出
- E-18 Webページの主題推定(情報抽出,E.自然言語・文書)
- 日本語の修飾構造を評価する添削支援システムを実現するための基礎研究
- タッチパネル操作における視覚障害者の指の誘導法(聴覚と福祉情報工学・一般)
- Linear GP with Redundancy-removed Recombination for Synthesis of Image Feature Extraction Programs
- 画像内のオブジェクトに注目した画像内容検索(一般セッション(2))
- オンライン言語処理モデルにおける自己修復文の解析手法
- 自己修復の分析に基づく発話生成モデルに関する考察
- 自己運動を誘導する視覚刺激に対する生体反応の分析
- 指向性マイクロホンの近接配置における周波数領域ブラインド音源分離の性能評価(電気音響,音響一般)
- オプティカルフローを用いた複雑背景下における人物の腕領域の抽出と運動パラメータ推定
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 観測シーンに依存しない3次元物体認識(一般セッション)
- 触刺激による「方向」情報呈示とその識別について
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- 動画間の差異検出に基づくスポーツフォーム教示システム(一般,顔・人物・ジェスチャ・行動)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- スーパーピクセルを用いた対応付けによる室内の領域分割(一般セッション1,三次元画像,多視点画像)
- 3)主観的輪郭生成のアルゴリズムとその画像理解への応用(〔情報ディスプレイ研究会視聴覚技術研究会画像通信システム研究会〕合同)
- 主観的輪郭生成のアルゴリズムとその画像理解への応用 : 情報ディスプレイ視聴覚技術画像通信システム(視覚と画質特集)
- 適応的なロバストSuper-Exponential法を用いた瞬時混合ブラインド音源分離(研究速報)
- 周波数領域BSSに対するSEMと参照信号EVA(アレー信号処理・音響計測/一般)
- 移動音源存在時のブラインド音源分離に対する一解決法
- A-10-7 移動音源存在時の指向性マイクを利用したブラインド音源分離
- 音源分離における指向性マイクの有効性
- 分離パラメータ収束点推定を用いた源信号分離の収束性能の向上
- D-14-12 3音源混合信号からの源信号分離
- D-14-11 独立成分分析を用いた音源分離の性能評価
- 周波数領域で行うブラインド分離の一手法
- ラインカメラによる道路面撮像と画像処理
- ラベル要素検出とモデル照合による商品棚ラベル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- ラべル要素検出とモデル照合による商品棚ラべル認識(一般セッション,コンピュータビジョンとパターン認識のための機械学習と最適化,一般)
- リニアスライダを用いた高速ステレオビジョンシステム : 左右カメラの見えの違いを考慮した最適基線長探索(一般セッション2,三次元画像,多視点画像)
- 人工筋肉を利用したヘビ型水中推進ロボット
- 1P2-S-084 人工筋肉を用いたヘビ型水中ロボットの推進モデル(アクチュエータの機構と制御3,生活を支援するロボメカ技術のメガインテグレーション)
- 人工筋肉を利用したヘビ型推進ロボット
- 追従型高速ステレオビジョンシステムを用いた移動物体の形状復元(一般セッション(5))(ユビキタスコンピューティングのためのパターン認識・理解)
- D-12-145 超高速ステレオヘッドの冗長自由度の制御
- 生体模倣の実時間ビジュアルトラッキングシステム
- 生体模倣の実時間ビジュアルトラッキングシステム
- 一台のカメラによる顔と視線方向の推定
- 英文中に出現する未登録語の特徴分析とその意味推定のため知識の有効性に関する考察
- 画像中の物体領域の抽出
- 実物体と映り込みの分離方法
- 実物体と映り込みとの区別の方法
- 剛体構造復元のための正射影速度場間の対応決定(人間の視覚・聴覚情報)
- 運動を介した視聴覚による物体定位能力の獲得
- 空間情報, 連続性および調波構造を統合した複数音源分離のアプローチ
- 多チャンネル間の伝達関数の差による2話者の音声分離 : 相関に基づく漸近推定法によるチャンネル間伝達関数の求め方
- 有彩色物体を含むシーン中の半透明物体の検出について
- 主観的輪郭に示唆を得た,重なり合った物体の内部輪郭の生成
- マークアップ方式による文章作成システム
- マークアップ方式による文章作成システム
- マークアップ方式による文章作成手法の提案
- 運動を介した視聴覚による物体定位能力の獲得
- シーン内の文字列領域の抽出について
- シーン内の文字列領域の抽出
- 運動立体視に及ぼす透明性の知覚
- 外国人の書いた日本語文の訂正に関する基礎的研究
- 一面図からの配管部材の3次元形状復元システム
- 配管部材の一面図からの3次元形状復元
- 文表層情報に基づくアブストラクトの評価
- 文表層情報に基づくアブストラクト評価
- 映り込み分離カメラシステム
- 音声に込められた感情の判別
- 3)先行効果についての計算論的研究(ヒューマンインフォメーション研究会)
- 先行効果についての計算論的研究
- 先行効果についての計算論的研究
- 4)複数音源の定位と分離(視聴覚技術研究会)
- 複数音源の定位と分離
- 生体に示唆を得た音源定位システム--反響のある環境での単一音源定位
- 映り込み分離カメラシステム
- 映り込み分離カメラシステム