多段処理によるブラインド残響抑圧処理の性能向上
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,多入力の残響抑圧処理を1つの処理モジュールと考え,入力チャネルの異なる複数の処理モジュールを多段接続することで高い残響抑圧性能を実現する処理(多段処理)を提案する.今回,残響抑圧処理モジュールとしては,セミブラインドMINT法と適応無相関化逆フィルタの2つを利用した.多段処理の性能は,各モジュールの入力チャネルの組み合わせにより変化する.このため高い性能を実現するための予備的処理として,チャネル選択処理および遅延付加処理についても提案する.8チャネルのマイクアレイによる収録信号を用いた実験により各処理を評価した結果,以下の3つの知見を得た.(1)チャネル選択処理:選択チャネルの違いで抑圧性能に3-10dBの差が発生.適切なチャネル選択により残響抑圧性能を低下させることなくチャネル数の削減が可能(2)遅延付加処理:遅延付加は,特に遅延付加前の性能が低い場合に有効で,2-6dBの性能向上が可能.(3)多段処理:全チャネルを用いた1回の処理の残響抑圧性能がセミブラインドMINT法で14.6dB,適応無相関化逆フィルタで3.5dBであるのに対し,多段処理ではそれぞれ18.2dB(+4.2dB)および13.6dB(+10.1dB)となり,提案法が残響抑圧性能を向上させる手法として有効であることを確認した.
- 2009-07-10
著者
-
長谷川 雄二
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
中臺 一博
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
中臺 一博
HRI-JP
-
中臺 一博
東京大学工学部電気工学科
-
中臺 一博
(株)ホンダ・リサーチ・インスティチュート・ジャパン:東京工業大学
-
中島 弘史
(株)ホンダ・リサーチ・インスティチュート・ジャパン
-
醍醐 徹
東京電機大学工学部
-
金田 豊
東京電機大学工学部
-
金田 豊
NTTサイバースペース研究所
-
金田 豊
東京電機大学工学部情報通信工学科
-
金田 豊
東京電機大 工
-
金田 豊
Ntt Human Interface Laboratories
-
金田 豊
NTT研究所
-
醍醐 徹
東京電機大学 工学部
-
金田 豊
Ntt Cyber Space Laboratories
-
金田 豊
東京電機大学大学院工学研究科情報通信工学専攻
関連論文
- AIチャレンジ研究会(SIG-Challenge)(研究会総覧)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- 3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
- オブジェクト指向に基づくロボット・エージェントのマルチドメイン対話行動制御モジュール構築ツールRIME-TK
- MFTを用いたロボットの動作中における音声認識
- マルチドメイン音声対話システムにおける対話履歴を利用したドメイン選択(音声言語)
- 音源分離との統合によるミッシングフィーチャマスク自動生成に基づく同時発話音声認識
- インタラクション機能を有するプレゼンテーション記述言語の開発(インタフェース,入出力,その他)
- ロボット聴覚オープンソースソフトウエアHARK
- 残響下でのバージイン発話認識のための多入力独立成分分析を応用したロボット聴覚
- 5R-7 歌唱ロボットのためのビート情報とメロディ・ハーモニー情報の統合による音楽音響信号と楽譜の実時間同期手法の開発(音楽検索・解析,学生セッション,人工知能と認知科学)
- 「ロボット聴覚」特集について
- 実物体を扱う遠隔協調作業を支援する壁面投影移動型アバタシステム Remy の提案
- ロボットを対象としたビートトラッキング法の提案とその音楽ロボットへの応用
- 4.音楽ロボットのための実時間音楽情報処理(音楽情報処理技術の最前線)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 環境変動を考慮したロボット聴覚のための音源分離
- ミツバチ視運動反応を用いた視覚刺激による条件付け(バイオサイバネティックス, ニューロコンピューティング)
- 視覚刺激を用いたミツバチ条件付けによる視運動反応特性の変化
- ロボットを対象とした二階層視聴覚統合音声認識システム (第27回日本ロボット学会学術講演会論文特集号(2))
- 波動音響シミュレータによる指向性の精度検証
- 大規模マイクロホンアレイによる発話方向推定の検討(音響信号処理/一般)
- 移動型および静止型マイクロホンアレイ統合による複数移動音源追跡
- 適応ステップサイズパラメータ法による高性能ブラインド音源分離(ブラインド信号処理/一般)
- AS-6-1 マイクロホンアレイ統合によるロバストな音響ストリーム生成と移動人物追跡(AS-6.実環境における高品質収音のための音声信号処理,シンポジウム)
- アプリケーション開発における音声認識(パネル討論)
- インタラクション機能を有するプレゼンテーション記述言語の開発(HAIにおけるコミュニケーションとインタラクション適応)
- BeowulfクラスクラスタERATO-1のチューニングと評価
- 2D-1 ソフトマスクと音響モデル適応を用いた3話者同時発話音声認識(音声・音楽情報処理,一般セッション,人工知能と認知科学)
- 音楽情景分析の処理モデルOPTIMAにおける和音の認識
- 音楽情景分析の処理モデルOPTIMAにおける単音の認識
- 音楽情景分析の処理モデルOPTIMAにおける統計的単音仮説生成処理
- 音楽情景分析の処理モデルOPTIMAにおけるシーン情報の抽出と利用
- 音楽情景分析の処理モデルOPTIMAの実装
- 処理モデルOPTIMAに基づく音楽情景分析システムの構築 II : 情報統合の実現と評価
- 音楽単音記号列生成システムの処理モデルOPTIMAにおける単音仮説生成処理
- OPTIMA : 音楽音響信号から単音記号列を生成するシステムの処理モデル
- 音楽音響信号から単音記号列を生成するシステムOPTIMAの全体像
- 音源分離システムにおけるパターン照合モジュールの動的負荷分散を用いた並列実装
- 音楽音響信号を対象とする音源分離システム : 音モデルに基づくアプローチ
- 室内マイクロホンアレイを用いた実時間発話方向推定
- AIチャレンジ研究会(SIG-Challenge)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- LG_002 タスク指向対話とチャットを統合した対話ロボットインターフェース(G分野:音声・音楽)
- 音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援
- 人と共存するロボットシステムの展望
- 独立成分分析に基づく適応フィルタのロボット聴覚への適用
- 情報統合による実環境音環境理解 : マイクロホンアレイ統合による音源追跡
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 人・ロボット音声インタラクションのための情報統合に向けて(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 人・ロボット音声インタラクションのための情報統合に向けて
- 指向性スピーカを用いたロボット音声インタフェースの提案
- HRI-JPにおけるヒューマン-ロボットインタラクション研究(システムオンシリコン及び一般)
- ミッシングフィーチャー理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用
- 遺伝的アルゴリズムを用いたパラメータ最適化による話者位置に基づく同時発話認識の向上
- D-14-10 有向性音素グルーピングを用いた音声認識におけるロバスト性向上の検討(D-14.音声・聴覚,一般講演)
- 複数ドメイン音声対話システムにおける対話履歴を利用したドメイン選択の高精度化
- 3U-1 ロボット音声対話のためのMFTとICAによるバージイン許容機能の評価(音声言語情報処理,学生セッション,人工知能と認知科学)
- E-052 バージインを許容するロボット音声対話のためのICAを用いたセミブラインド音源分離(E分野:自然言語・音声・音楽)
- 動的リコンフィギャラブルデバイスDRPを用いたロボット聴覚のための音源分離フィルタ(音声,聴覚)
- ロボット聴覚--高雑音下でのハンズフリー音声認識 (音声)
- G-007 ミッシングフィーチャー理論による音源分離と混合音声認識の統合型インターフェース(G.音声・音楽)
- AI-1-3 ロボット聴覚オープンソースソフトウエアHARK(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
- 6J-8 実環境音声認識のためのロボット聴覚システム開発とパラメータチューニング(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 6J-7 ロボット音声対話におけるSemi-blind ICAを用いた自己発話キャンセル(情報爆発時代における対話ロボティクス,一般セッション,「情報爆発」時代に向けた新IT基盤技術,情報処理学会創立50周年記念(第72回)全国大会)
- 多段処理によるブラインド残響抑圧処理の性能向上
- 波動音響シミュレータによる指向性の精度検証
- アクティブオーディションによる自然なヒューマン・ロボットインターフェースの実現に関する研究(認知と身体性)(人工知能分野における博士論文)
- 3U-6 音声質問応答システムのユーザ発話を用いた質問応答データベース拡張支援(音声認識・理解,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- BeowulfクラスクラスタERATO-1のチューニングと評価
- qューマノイドを対象にした視聴覚統合による実時間人物追跡 : アクティブオーディションと顔認識の統合
- アクティブな視聴覚統合を用いた実時間人物追跡ヒューマノイドSIG
- 多数の人の声を一度に聞き分ける聴覚技術 : —聖徳太子ロボットを目指して—
- ロボット聴覚用オープンソースソフトウェアHARKの展開 (特集 世界に飛び出す日本のソフトウェア)
- ロボットを対象とした二階層視聴覚統合音声認識システム
- 多数の人の声を一度に聞き分ける聴覚技術 : 聖徳太子ロボットを目指して
- 1P1-G13 ロボット聴覚用オープンソースソフトウェアHARKの概要(コミュニケーション・ロボット)
- ロボット聴覚 : 高雑音下でのハンズフリー音声認識(オーガナイズドセッション,一般,オーガナイズドセッション(雑音を消せ!騒音下で有効な音声信号処理とは))
- 動的リコンフィギャラブルデバイスDRPを用いた音源分離フィルタの実装と評価(リコンフィギャラブル応用II, リコンフィギャラブルシステム, 一般)
- 情報統合によるインテリジェント人追跡(クラウドで始まる新たなネットワークロボット)
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用
- 方向通過型音源分離フィルタへのFPGAの応用(FPGAとその応用及び一般)
- ロボット聴覚の課題と現状
- ロボット聴覚の現状と課題
- ロボット聴覚の課題と現状(知能ロボットの技術:人工知能からのアプローチ(前編))
- ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位
- ロボットの耳は二つで十分か(なぜ耳は二つあるか?)
- ロボット聴覚の課題と現状
- ロボット聴覚の課題と現状
- 混合音を聞き分けるセンシング技術 (特集人間を理解するためのICT技術 : 人間を対象としたセンシング・情報処理からその応用まで) -- (人間をセンシングする技術)
- 2-2 混合音を聞き分けるセンシング技術(2.人間をセンシングする技術,人間を理解するためのICT技術-人間を対象としたセンシング・情報処理からその応用まで-)
- 混合音を聞き分けるセンシング技術
- マルチモーダル情報統合によるインテリジェント人追跡システム
- ロボット聴覚用オープンソースソフトウェア HARKの展開
- チューブ型ロボットの姿勢推定のためのEKF-SLAMを用いた可変マイクロホンアレイ位置推定
- 非同期分散マイクロホンアレイのオンラインキャリブレーションと伝達関数の推定(マイクロホンアレイの新しい技術展開)
- DI-1-6 聴覚を中心としたロボットの環境認識技術(DI-1.社会課題を解決するためのパターン認識・メディア理解技術の進展,依頼シンポジウム,ソサイエティ企画)