遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用
スポンサーリンク
概要
- 論文の詳細を見る
雑音の存在する環境下で音声認識システムなどを用いる場合, 雑音を抑制し, 音声を強調するシステムが必要となる. 我々は, 遅延和型ビームフォーマを用いて, 話者の方向を同定し, この方向に音響的なフォーカスを向け, 周囲の雑音を抑制する実時間処理システムを構築した. このシステムは, 移動型対話ロボットにおける, 音声認識系の前処理を行なうモジュールのプロトタイプとして開発され, 単一のDSP (TI社 TMS320C40 40MHz) に実装されている. 本報告では, 使用したアルゴリズム, ハードウェア構成について述べる. また, 実環境において, 簡単な雑音抑制/音声認識の評価実験を行なった. この結果, 6cm間隔の8個のマイクロホンからなる直線状アレイを用い, 実効的に約10dB程度の雑音抑制効果が得られた.
- 社団法人電子情報通信学会の論文
- 1996-12-20
著者
関連論文
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- 知能ロボットのめざすもの
- 汎用OSとデバイスドライバを共有できる実時間オペレーティングシステム
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 両耳聴を目的としたステレオマイクロホンアレーの評価
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 対話システム制御における時間の扱い
- EA2000-47 状態フィードバック制御に基づく音響インテンシティに着目した反射音抑圧手法
- サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
- サブスペース法を用いた音声強調法の音声認識への応用
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- 身振りと発話のマルチモーダルデータベース
- 並列ごみ集めを備えた並列Lispによる実時間処理能力の評価
- オブジェクト指向Lisp EusLispへの並列GCの実装(並列・分散)
- オブジェクト指向Lisp EusLispへの並列GCの実装(並列・分散)
- 動的負荷分散機構を備えた分散lisp処理系の実装
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- 環境音モデルとHMM合成を用いた音声区間検出の検討
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- 音声・視覚・画像をもつインタラクションシステム
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- Wavelet変換を用いたSpectral Subtractionによる音声強調
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完 : 単語補完機能の評価
- マルチモーダル機能(「RWC-実世界知能」)
- 音声補完の評価
- 音声補完の評価
- 音声補完: 音声ワイルドカード補完機能の実現
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 音声補完:単語補完ができる新たな音声入力インターフェース
- 2000-SLP-32-16 音声補完 : "TAB"on speech
- 有声休止箇所のリアルタイム検出システムの評価
- 自然発話中の言い淀み箇所のリアルタイム検出システム
- 自律学習機能(「RWC-実世界知能」)
- オフィスロボット
- RWC自律学習機能 : オフィスロボットJijo-2わ中心として
- 並列分散リアルタイム制御用レスポンシブプロセッサ
- ブラインド信号分離におけるPCAフィルタの効果
- サブスペース法と空間逆フィルタを用いた音源分離
- 人間型ロボットはヒトに近づけるか
- 幾何モデリング機能を備えたマルチスレッド並列オブジェクト指向言語EusLisp
- マルチスレッド並列EusLispの分割型メモリ管理手法
- マルチスレッドを用いた並列EusLispの設計と実現
- 対象指向型Lisp : EUSlispの他言語インタフェースとウィンドウシステムへの応用
- 対象指向型Lisp : EUSLispを用いたロボット用幾何モデリングシステム
- マルチメディアディスプレイを用いた統合型遠隔ロボット制御システム
- ロボット用マルチメディアディスプレイ : 対象指向型モデリングシステム
- ETALisp上の対象指向型プログラミング機能LEO
- 多点拘束条件を用いた両耳聴用ステレオマイクロホンアレイの提案
- 時間の扱いを考慮した対話システム制御手法
- マンマシン対話における言語表現の多様性の解析
- 初期反射音除去のための能動音場制御手法について
- 多点制御を用いた頭部伝達関数模擬における物理的模擬精度と聴感上の模擬精度
- D-14-36 RWCP実環境音声・音響データベース
- マイクロホンアレイを用いた音声認識方向辞書の精度が認識率に及ぼす影響
- 頭部伝達関数の模擬による音像距離定位のモデル化に関する検討
- 周波数領域のInfomaxとサブスペース法を併用した音響信号のブラインド分離
- クラスタリングによるHMM間の距離尺度の検討
- 日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 音響インテンシティに着目した状態フィードバック制御に基づく反射音抑圧手法の提案
- 状態フィードバック制御による壁面反射音抑圧手法に関する基礎的検討
- 状態フィードバック制御を用いた壁面吸音特性の制御手法に関する考察
- 音声対話システムの研究と実用化の動向 (<小特集>音声によるコンピュータとの対話を目指して)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 音声の変動記述のための知識ベースについて
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- マルチモーダル情報統合システムの研究動向
- 話者方向同定と雑音抑制による音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- 遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用
- マルチメディアディスプレイを用いた統合型遠隔ロボット制御法
- 人間との協同作業を特徴とする遠隔作業ロボットシステム
- 多面体間の接触による拘束条件を幾何モデルから導出する一般的なアルゴリズム