サブスペース法を用いた音声強調法の音声認識への応用
スポンサーリンク
概要
- 論文の詳細を見る
筆者らは, マイクロホンアレイの入力から空間相関行列を構成し,その固有値分析を行なうことにより, 指向性の低い雑音を音声信号から分離し, 音声信号のスペクトルを推定する手法を提案している. この手法では, 方向性信号のエネルギーが少数の固有値に集中するのに対し, 指向性の低い雑音のエネルギーは全ての固有値に分散することを利用し, 固有値の次元で, 雑音のエネルギーを削除するものである. 本報告では, この手法を音声認識系の前処理として用い, 指向性の低い雑音が重畳した音声信号に対する認識率が, 本手法を用いてどの程度回復するかをシミュレーション実験により調べた. この結果, 比較的平坦なスペクトルを持つ雑音に対しては, 従来法 (遅延和アレイ) に比べ, 10%程度の認識率の向上が見られた.
- 1997-06-20
著者
関連論文
- 音声分析・変換・合成方法STRAIGHTの音声符号化への適用について
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- コンピュータとの対話におけるユーザの振舞いの解析
- 視覚・聴覚・発話機能を有するエージェント型マルチモーダルインタフェースの試作
- MOSAICブラウザーを用いた音声対話システム
- ストリーム重みの制御による異種パラメータの統合法の検討
- EMアルゴリズムを用いたAudio-Visual HMMによる音声からの画像パラメータ推定
- EMアルゴリズムを用いたAudio-Visual HMMによる音声からの画像パラメータ推定
- HMMを用いた音声からの唇動画像合成法(次世代ヒューマンインタフェース・インタラクション)
- HMMを用いた唇動画像合成における学習・合成法の比較評価
- EMアルゴリズムを用いたHMMによる音声からの唇動画像合成法
- HMMを用いた音声からの唇画像合成法
- 音声から唇画像合成におけるコードブックマッピング法とHMM法の比較
- HMMを用いた音声と唇画像の統合による音声認識と唇画像生成
- 人の表情を有し音声対話・視覚機能を備えたマルチモーダルインタフェース
- 音声キーワードを用いたネットサーフィンとその評価
- 音声ネットサーフィンにおけるキーワード辞書自動抽出の評価
- 音声キーワードによるネットサーフィンの実現
- キーワードを用いた音声によるネットサーフィン
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 対話システム制御における時間の扱い
- サブスペース法を用いた音声強調法とその音声認識への応用(第2報)
- サブスペース法を用いた音声強調法の音声認識への応用
- 身振りと発話のマルチモーダルデータベース
- 実騒音環境におけるハンズフリー単語音声認識
- 各種音韻モデルによる車内環境での連続音声認識の性能
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- IE2000-22 / PRMU2000-47 / MVE2000-51 ジェスチャ認識システム評価用ジェスチャデータベースの開発
- EM法を用いた複数情報源からの概念獲得
- EM法を用いた複数情報源からの概念獲得
- 単語アクセントパターン識別におけるモーラ単位HMMの語彙独立性の評価と検討
- 確率・統計モデルの音声言語処理への応用 ( 「コーパスに基づく音声・自然言語処理」)
- 音声言語の確率モデル ( 「コーパスに基づく音声・自然言語処理」)
- 電話音声認識におけるHMM分解・合成法の性能評価
- 第5回ヨーロッパ音声通信技術会議(EuroSpeech'97)
- 日本語ディクテーションシステムにおける被覆率の高い言語モデル(音声情報処理 : 現状と将来技術論文特集)
- 日本語ディクテーションシステムにおける「読み」言語モデルの利用
- 「読み」情報を利用した大語彙連続音声認識
- フレーム間の関係を考慮した残響音声認識の検討
- 伝達特性Ergodic-HMMを用いたHMM合成法に基づく移動話者の音声認識
- 雑音・残響環境下でのHMM分解・合成法によるモデル適応化
- 短区間スペクトル分析における残響補正に関する検討
- 電話音声の話者認識における雑音とハンドセットの影響
- 短区間スペクトル分析における残響補正に関する検討
- オフィス移動ロボットJijo-2 の音声対話システム
- 事情通ロボットの音声対話インターフェース
- 論争支援マルチモーダル実験システム MrBengo
- 論争支援のマルチモーダル実験システム
- STRAIGHTの声道情報の量子化についての検討
- 4kHz帯域のSTRAIGHTの品質評価と情報圧縮について
- 音声・視覚・画像をもつインタラクションシステム
- 食道発声音声の母音の音響的特徴
- ボコーダ型音声分析合成系STRAIGHTによる低ビットレート音声符号化の評価
- ボコーダ型音声分析合成系STRAIGHTによる低ビットレート音声符号化
- Multimodal Interaction System that Integrates Speech and Visual Information (特集 RWC研究--実世界知能の実現を目指して) -- (第2部 実世界知能研究推進センターの最新の研究成果)
- 実世界視覚情報を対話的に学習・管理する人間型ソフトウェアロボット (知能情報メディア論文特集)
- 人間型マルチモーダルエージェントによる実世界情報の学習と管理
- 実空間中の人物や物体を認識して対話するマルチモーダル擬人化エージェント
- 音声補完 : 音声入力インタフェースへの新しいモダリティの導入(インタラクティブシステムとソフトウェア)
- 音声補完 : 単語補完機能の評価
- マルチモーダル機能(「RWC-実世界知能」)
- 音声補完の評価
- 音声補完の評価
- 音声補完: 音声ワイルドカード補完機能の実現
- 自然発話中の有声休止箇所のリアルタイム検出システム(音声情報処理 : 現状と将来技術論文特集)
- 音声補完:単語補完ができる新たな音声入力インターフェース
- 2000-SLP-32-16 音声補完 : "TAB"on speech
- 有声休止箇所のリアルタイム検出システムの評価
- 自然発話中の言い淀み箇所のリアルタイム検出システム
- 音声認識のためのマイクロホンアレー設計尺度についての検討
- 音声認識のためのマイクロホンアレー設計尺度についての検討
- 種々のマイクロホンアレーによる音声認識の検討
- 展示見学時の知識流通を目的としたcontext-awareな音声メッセージシステム
- フレームワイズな音声検出に基づく適応フィルタを利用した自動車内でのロバスト音声認識
- 正規分布の逐次適な適応化手法による話者適応の効果について
- 音声強調手法E-CMN/CSSの自動車環境内での音声認識における評価
- 音響エコーキャンセラによる車室内音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- ケプストラム平均正規化法とHMM合成法に基づくモデル適応化法E-CMN/PMCと自動車内音声認識への適用
- キーワードスポッティングに対する話者適応の効果に関する検討
- 音響エコー/加法性雑音/乗法性歪みが存在する自動車内でのロバスト音声認識
- 時間の扱いを考慮した対話システム制御手法
- マンマシン対話における言語表現の多様性の解析
- クラスタリングによるHMM間の距離尺度の検討
- 日本音響学会研究用連続音声データベース (<小特集>出揃った音声データベース)
- 電総研の研究用音声データベース (<小特集>出揃った音声データベース)
- 音声対話システム構築のための実対話データ収録実験
- 高度対話システムの実現のためのヒューマンファクタの解析
- 音声対話システムの研究と実用化の動向 (<小特集>音声によるコンピュータとの対話を目指して)
- 「音声研究者電子メールアドレス帳」について
- 音声の音響音声的変動パターンの類型化 : データベースと生成領域からの類推の利用 : 視聴覚技術 : 聴覚、音声関係および一般
- 音声の変動記述のための知識ベースについて
- 音声の音素片ネットワーク表現と時系列のセグメント化法を用いた自動ラベリング手法
- マルチモーダル情報統合システムの研究動向
- 話者方向同定と雑音抑制による音声認識性能の改善 ( 音響信号処理による音声認識性能の改善)
- 遅延和アレイを用いた音源方向同定/雑音抑制システムの試作とその音声認識への応用