室内マイクロホンアレイを用いた実時間発話方向推定
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,大規模マイクロホンアレイを用いた発話方向推定について報告する.筆者らは,先に音源の指向特性に基づいたビームフォーミング法を提案し,スピーカや人の発話方向推定について報告した.さらに,振幅成分の抽出,発話区間検出,周波数マスク,ヒストグラムの4つの改良手法を加えることで,高精度な推定が可能となることを示した.その後,実時間で方向推定が可能なシステムについて報告したが,計算量の制限などにより推定精度が低く,その主原因も不明確であった.本稿では,実時間システムの精度の低い原因を調査し,それをもとに改良を行った実時間システムを提案した.評価実験から,従来の実時間システムよりも実時間性,推定精度に優れていることを示した.
- 2010-07-09
著者
-
中臺 一博
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
中臺 一博
HRI-JP
-
中臺 一博
東京大学工学部電気工学科
-
中臺 一博
(株)ホンダ・リサーチ・インスティチュート・ジャパン:東京工業大学
-
中島 弘史
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
金田 豊
東京電機大学工学部
-
春原 卓也
東京電機大学工学部
-
金田 豊
NTTサイバースペース研究所
-
金田 豊
東京電機大学工学部情報通信工学科
-
金田 豊
東京電機大 工
-
金田 豊
Ntt Human Interface Laboratories
-
金田 豊
NTT研究所
-
金田 豊
Ntt Cyber Space Laboratories
-
金田 豊
東京電機大学大学院工学研究科情報通信工学専攻
関連論文
- AIチャレンジ研究会(SIG-Challenge)(研究会総覧)
- MFTを用いたロボットの動作中における音声認識
- マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- オーディオ・インタフェースの入出力フィルタ特性の検討
- ミニマックス規範に基づくサイドローブ最小ビームフォーミング
- 雑音に起因する誤差を最小化するインパルス応答測定信号
- ロボット聴覚オープンソースソフトウエアHARK
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
- 「ロボット聴覚」特集について
- 実物体を扱う遠隔協調作業を支援する壁面投影移動型アバタシステム Remy の提案
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- ロボットを対象とした二階層視聴覚統合音声認識システム (第27回日本ロボット学会学術講演会論文特集号(2))
- 波動音響シミュレータによる指向性の精度検証
- 大規模マイクロホンアレイによる発話方向推定の検討(音響信号処理/一般)
- 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
- 適応ステップサイズパラメータ法による高性能ブラインド音源分離(ブラインド信号処理/一般)
- AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- アプリケーション開発における音声認識(パネル討論)
- BeowulfクラスクラスタERATO-1のチューニングと評価
- 2D-1 ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 音楽情景分析の処理モデルOPTIMAにおける和音の認識
- 音楽情景分析の処理モデルOPTIMAにおける単音の認識
- 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理
- 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用
- 音楽情景分析の処理モデルOPTIMAの実装
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価
- 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理
- OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル
- 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像
- 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装
- 音楽音響信号を対象とする音源分離システム : 音モデルに基づくアプローチ
- 室内マイクロホンアレイを用いた実時間発話方向推定
- AIチャレンジ研究会(SIG-Challenge)
- 2次元長方形音場で発生するスウィープエコー
- 鉄道車両内部の音響特性について
- 人と共存するロボットシステムの展望
- 独立成分分析に基づく適応フィルタのロボット聴覚への適用
- 情報統合による実環境音環境理解 : マイクロホンアレイ統合による音源追跡
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 人・ロボット音声インタラクションのための情報統合に向けて
- 指向性スピーカを用いたロボット音声インタフェースの提案
- HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
- 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
- 3U-1 ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価(音声言語情報処理,学生セッション,人工知能と認知科学)
- E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)
- 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ(音声,聴覚)
- ロボット聴覚--高雑音下でのハンズフリー音声認識 (音声)
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 波動音響シミュレータによる指向性の精度検証
- アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(人工知能分野における博士論文)
- 複合Normalized LMS (NLMS)法モデルを用いたアフィン射影法の収束特性の検討
- BeowulfクラスクラスタERATO-1のチューニングと評価
- qューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合
- アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG
- A-10-10 Log-TSP信号を用いたスピーカの高調波歪測定の再現性について(A-10.応用音響,基礎・境界)
- 音楽音響信号を対象とする音モデルに基づく音源分離システム
- 近接音場形Filter-and-Sumアレーを用いた出力音劣化の改善
- 選択的収音技術の研究
- 多数の人の声を一度に聞き分ける聴覚技術 : —聖徳太子ロボットを目指して—
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- サブバンドピークホールド処理を用いた音源方向推定法
- はじめての音響信号処理 : ディジタル録音と補間の話(やさしい解説)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- 1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価(リコンフィギャラブル応用II, リコンフィギャラブルシステム, 一般)
- 情報統合によるインテリジェント人追跡(クラウドで始まる新たなネットワークロボット)
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用(FPGAとその応用及び一般)
- ロボット聴覚の課題と現状
- ロボット聴覚の現状と課題
- ロボット聴覚の課題と現状(知能ロボットの技術:人工知能からのアプローチ(前編))
- ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位
- ロボットの耳は二つで十分か(なぜ耳は二つあるか?)
- ロボット聴覚の課題と現状
- ロボット聴覚の課題と現状
- 混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- 混合音を聞き分けるセンシング技術
- マルチモーダル情報統合によるインテリジェント人追跡システム
- ロボット聴覚用オープンソースソフトウェア HARKの展開
- チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定
- 非同期分散マイクロホンアレイのオンラインキャリブレーションと伝達関数の推定(マイクロホンアレイの新しい技術展開)
- DI-1-6 聴覚を中心としたロボットの環境認識技術(DI-1.社会課題を解決するためのパターン認識・メディア理解技術の進展,依頼シンポジウム,ソサイエティ企画)