ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, we present an active audition system which is implemented on the humanoid robot "SIG the humanoid". The audition system for highly intelligent humanoids localizes sound sources and recognizes auditory events in the auditory scene. Active audition reported in this paper enables SIG to track sources by integrating audition, vision, and motor movements. Given the multiple sound sources in the auditory scene, SIG actively moves its head to improve localization by aligning microphones orthogonal to the sound source and by capturing the possible sound sources by vision. However, such an active head movement inevitably creates motor noises.The system adaptively cancels motor noises using motor control signals and the cover acoustics. The experimental result demonstrates that active audition by integration of audition, vision, and motor control attains sound source tracking in variety of conditions.onditions.
- 社団法人 人工知能学会の論文
- 2003-11-01
著者
-
中臺 一博
HRI-JP
-
北野 宏明
科学技術振興事業団erato北野共生システムプロジェクト : Robocup-rescue技術委員会
-
中臺 一博
科学技術振興事業団 ERATO 北野共生システムプロジェクト
-
奥乃 博
京都大学大学院
関連論文
- MFTを用いたロボットの動作中における音声認識
- マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- ロボット聴覚オープンソースソフトウエアHARK
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
- 「ロボット聴覚」特集について
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- スレッドレベル並列性を活かす科学技術計算用FPGAシステムの提案(Inventive and Creative Architecture特別セッションIII)
- FPGA上でのシミュレーションに向けた生化学モデルコンパイラの実装(コンピュータシステム)
- 高速アルゴリズムを適用したデータ駆動型確率モデル生化学シミュレータのFPGAへの実装と評価(応用事例,デザインガイア2007-VLSI設計の新しい大地を考える研究会)
- 生化学シミュレータReCSiPにおける反応速度式共有化(アプリケーション,リコンフィギャラブルシステム,一般)
- FPGAを用いた確率モデル生化学シミュレータ(リコンフィギャラブルシステム)
- FPGAを用いた確率モデル生化学シミュレータ
- FPGAを用いた汎用生化学シミュレータReCSiP(応用技術,リコンフィギャラブルシステム論文)
- ReCSiPボードにおける汎用ホストインターフェイスの実装と評価(リコンフィギャラブルシステム,一般)
- ロボットを対象とした二階層視聴覚統合音声認識システム (第27回日本ロボット学会学術講演会論文特集号(2))
- 波動音響シミュレータによる指向性の精度検証
- 大規模マイクロホンアレイによる発話方向推定の検討(音響信号処理/一般)
- 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
- 適応ステップサイズパラメータ法による高性能ブラインド音源分離(ブラインド信号処理/一般)
- AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- BeowulfクラスクラスタERATO-1のチューニングと評価
- FPGAを用いた生化学シミュレータ向けSBML処理系の構築(リコンフィギャラブル応用I)
- 2D-1 ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 室内マイクロホンアレイを用いた実時間発話方向推定
- RoboCup-Rescue(1)プロジェクト構想
- B-10-93 ヒューマノイドのための POF 光 LAN システムの構築
- 1P1-E07 センサ情報に基づくリアルタイム歩容生成法と歩容ライブラリの構築
- 1P1-E06 センサ情報に基づく二足ロボットの衝撃吸収運動 : コンプライアンス制御による両脚支持期の歩容
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた高スループット確率モデル生化学シミュレータの設計と評価
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- データ転送網を用いた確率モデル生化学シミュレータのFPGAへの実装の検討(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法(FPGAとその応用及び一般)
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- 人と共存するロボットシステムの展望
- 独立成分分析に基づく適応フィルタのロボット聴覚への適用
- 指向性スピーカを用いたロボット音声インタフェースの提案
- HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
- 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
- 3U-1 ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価(音声言語情報処理,学生セッション,人工知能と認知科学)
- E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)
- 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ(音声,聴覚)
- ロボット聴覚--高雑音下でのハンズフリー音声認識 (音声)
- FPGAを用いた生化学シミュレータReCSiPのシミュレーション制御機構(リコンフィギャラブル応用I)
- FPGAを用いた生化学シミュレータReCSiP向けの数値積分機構の実装と評価(リコンフィギャラブル応用I, リコンフィギャラブルシステム, 一般)
- FPGAを用いた生化学シミュレータ用のSBML処理系の構築(シミュレーション技術, SHINING 2005「アーキテクチャとコンパイラの協調および一般」)
- RoboCup-Rescue(21世紀を展望する)
- ロボカップレスキュープロジェクト : マルチエージェントシステム研究の大規模災害救助への応用を目指して(特集●社会・経済におけるマルチエージェント)
- RoboCup-Rescue : 情報科学の緊急災害対応問題への挑戦
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 波動音響シミュレータによる指向性の精度検証
- BeowulfクラスクラスタERATO-1のチューニングと評価
- qューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合
- アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG
- 細胞系譜構築システムのReconfigurable Systemによる高速化
- 細胞系譜構築システムのReconfigurable Systemによる高速化
- 細胞系譜構築システムのReconfigurable Systemによる高速化
- FPGAを用いた生化学シミュレータReCSiPにおける数値積分機構の性能改善手法
- FPGAを用いた生化学シミュレータReCSiPにおけるハードウェアリソース消費に関する考察
- 多数の人の声を一度に聞き分ける聴覚技術 : —聖徳太子ロボットを目指して—
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- 1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価(リコンフィギャラブル応用II, リコンフィギャラブルシステム, 一般)
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用(FPGAとその応用及び一般)
- ロボット聴覚の課題と現状
- ロボット聴覚の現状と課題
- ロボット聴覚の課題と現状(知能ロボットの技術:人工知能からのアプローチ(前編))
- ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位
- ロボットの耳は二つで十分か(なぜ耳は二つあるか?)
- ロボット聴覚の課題と現状
- ロボット聴覚の課題と現状
- 混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- 混合音を聞き分けるセンシング技術