ロボット聴覚の課題と現状
スポンサーリンク
概要
- 論文の詳細を見る
ロボットが人間社会の中に入り込み, 共生していくためには, 混合音が扱えること, アクティブオーディション, 動きながら聞く機構, 未知環境での音の知覚, 画像処理などの他の処理の統合, 実時間処理が大きな課題であることを指摘した.混合音の処理では, 音源定位が重要であり, 頭部伝達関数(HRTF)を使わない手法が必要となる.本稿では, これら課題に対して, マイクロフォン2本が必要であるという考えを述べ, 2本のマイクロフォンで実現可能な機能について, 解説をした.体を動かして聞くというアクティブオーディション, あるいは, 画像処理とモータ処理を統合して, 体全体で聞くという情報統合が重要である.そのために, 方向通過型フィルタや聴覚エピポーラ幾何学, 実時間処理方法を開発して, 複数の実験で有効性を確認した.
- 一般社団法人電子情報通信学会の論文
- 2001-12-13
著者
関連論文
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
- 4Q-2 音声認識と言語理解を動的に選択する音声理解フレームワーク(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 複数の言語モデル・言語理解方式を用いた音声理解の高精度化(理解)
- MFTを用いたロボットの動作中における音声認識
- LE-008 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(自然言語・音声・音楽)
- 音声認識結果とコンセプトへの重みづけによるWFSTに基づく音声言語理解の高精度化(学生セッション I)
- マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- 5Q-3 神経回路モデルを用いた音声模倣モデルによる音声バブリングと母音獲得過程シミュレーション(ニューラルネット(1),学生セッション,人工知能と認知科学)
- ロボット聴覚オープンソースソフトウエアHARK
- 人工神経回路モデルと声道物理モデルを用いた母音模倣モデルに基づく音素獲得シミュレーション
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 4ZC-2 楽器の内部モデルに基づくフィードフォワード制御によるテルミン演奏ロボットの開発(身体,学生セッション,コンピュータと人間社会)
- 3Y-2 顔追跡による音環境可視化システムのアウエアネスの改善(アンビエント・インタフェース,学生セッション,インタフェース)
- 5S-1 RNNを備えた2体の小型ロボット間の首振り動作と音声によるインタラクションにおける共有シンボルの創発(認知・推論・探索,学生セッション,人工知能と認知科学)
- 5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
- 5R-6 ベース音高確率とクロマベクトルの相関を考慮した和音進行認識(音楽検索・解析,学生セッション,人工知能と認知科学)
- 4R-2 音色特徴量に基づく調波・非調波統合モデルによる楽器音モーフィング(音楽演奏・生成,学生セッション,人工知能と認知科学)
- 4R-1 連続発音中の音色変化に着目した未学習譜面上への演奏信号生成(音楽演奏・生成,学生セッション,人工知能と認知科学)
- 4Q-4 音声対話システムにおける想定外発話の文法検証を用いた対話行為推定に基づくヘルプ生成(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 4Q-3 実環境音声対話システムにおけるバージイン発話タイミングを活用した指示対象の同定(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 3D-3 ロボットによる卓上物体操作のためのRNNを用いた道具身体化モデルの構築(人工知能(1),一般セッション,人工知能と認知科学)
- 「ロボット聴覚」特集について
- 5ZC-6 本質的に異なる数独解盤面の列挙と番号付け(エンタテインメントコンピューティング,学生セッション,コンピュータと人間社会)
- 調波構造と音源方向に基づく音源分離法における残響耐性の改善(音響と音声処理,音声強調,ロバスト音声認識)
- ロボット聴覚の現状と展望
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 単一テンプレート適応法による音楽音響信号を対象としたハイハットシンバルの音源同定(音楽音響信号認識)
- 6U-5 フィールドにおける音源定位のための音声視覚化デバイス「カエルホタル」の設計(ネットワーク応用,学生セッション,ネットワーク)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- ドラムパターン推定によるドラム音認識誤り補正手法
- テンプレート適応を利用した実世界の音楽音響信号に対するドラムスの音源同定
- ニホンアマガエルの同期した発声行動に関する実験的研究およびその数理モデル解析
- ロボットを対象とした二階層視聴覚統合音声認識システム (第27回日本ロボット学会学術講演会論文特集号(2))
- 波動音響シミュレータによる指向性の精度検証
- 大規模マイクロホンアレイによる発話方向推定の検討(音響信号処理/一般)
- 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
- 適応ステップサイズパラメータ法による高性能ブラインド音源分離(ブラインド信号処理/一般)
- AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- 楽譜情報を援用した多重奏音楽音響信号の音源分離と調波・非調波統合モデルの制約付きパラメータ推定の同時実現(音楽情報,新しいパラダイムの中での分散システム/インターネット運用・管理)
- 自己組織化マップによる教師なしクラスタリングを利用したドラム演奏の自動採譜(音楽音響信号認識/生成1)
- ゲーム理論に基づく参照結束性のモデル化と日本語・英語の大規模コーパスを用いた統計的検証
- インターネットワークにおける正しい電子メールアドレスを教えるシステム : Nuewildの構想
- 音高による音色変化を考慮した楽器音の音高・音長操作手法(演奏分析・支援・加工)
- 楽曲推薦システムの効率性とスケーラビリティの改善のための確率的推薦モデルのインクリメンタル学習法(検索・推薦)
- BeowulfクラスクラスタERATO-1のチューニングと評価
- LinuxによるBeowulfクラスタ構築格闘記
- 2D-1 ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 音声対話システムにおける簡略表現認識のための誤認識増加を抑制する自動語彙拡張(学生セッション II)
- 3U-5 音声対話システムにおけるユーザの固有名詞の簡略化に対処する語彙拡張(音声言語情報処理,学生セッション,人工知能と認知科学)
- テルミンの音高・音量特性のモデルに基づくテルミン演奏ロボットの開発
- 室内マイクロホンアレイを用いた実時間発話方向推定
- 複数の編集距離を用いた口語翻訳文の自動評価
- RNNを備えた2体のロボット間における身体性に基づいた動的コミュニケーションの創発
- 2X-8 音楽と自分の声を聞き分けながらビートに合わせて発声するロボットの開発(音楽情報科学(1)音楽音響,学生セッション,人工知能と認知科学)
- Query-by-Conducting:テンポ類似性に基づく同一楽曲における多様な解釈の検索インタフェース
- 多重奏音響信号中の演奏をユーザー指定の旋律に差し替えるフレーズ置換システム
- 人と共存するロボットシステムの展望
- 独立成分分析に基づく適応フィルタのロボット聴覚への適用
- 指向性スピーカを用いたロボット音声インタフェースの提案
- HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
- 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
- 3U-1 ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価(音声言語情報処理,学生セッション,人工知能と認知科学)
- E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)
- 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ(音声,聴覚)
- ロボット聴覚--高雑音下でのハンズフリー音声認識 (音声)
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 波動音響シミュレータによる指向性の精度検証
- BeowulfクラスクラスタERATO-1のチューニングと評価
- qューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合
- アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG
- 多数の人の声を一度に聞き分ける聴覚技術 : —聖徳太子ロボットを目指して—
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- 1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価(リコンフィギャラブル応用II, リコンフィギャラブルシステム, 一般)
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用(FPGAとその応用及び一般)
- ロボット聴覚の課題と現状
- ロボット聴覚の現状と課題
- ロボット聴覚の課題と現状(知能ロボットの技術:人工知能からのアプローチ(前編))
- ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位
- ロボットの耳は二つで十分か(なぜ耳は二つあるか?)
- ロボット聴覚の課題と現状
- ロボット聴覚の課題と現状
- 混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- 混合音を聞き分けるセンシング技術