利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
スポンサーリンク
概要
- 論文の詳細を見る
実環境下においてロバストな音声認識を実現するためには、背景雑音などの変動要因に対して音響モデルを適応させる技術が重要となる。本報告では、クリーン音声から学習した音響モデルに時変母数の正規分布で表したミスマッチモデルを組み合わせることで、雑音による変動を考慮した拡張音響モデルを構築する。そして、フレーム毎に、ミスマッチモデルの期待値と分散を、それぞれGaussian Mixture Model (GMM)と利得適応型Auto-Regressive Hidden Markov Model (ARHMM)分解法を用いて逐次的に推定することで、拡張音響モデルの適応を実現する。また、AURORA2のデータベースを用いて、提案手法の有効性を検討する。
- 社団法人電子情報通信学会の論文
- 2003-04-17
著者
-
浅野 太
産業技術総合研究所
-
田中 和世
筑波大学図書館情報学系
-
田中 和世
筑波大学図書館情報メディア研究科
-
田中 和世
筑波大学 大学院図書館情報メディア研究科
-
中村 哲
ATR音声言語通信研究所
-
佐宗 晃
産業技術総合研究所
-
佐宗 晃
産業技術総合研究所情報技術研究部門
-
中村 哲
Atr音声口語コミュニケーション研究所
-
浅野 太
産業技術総合研 情報技術研究部門
関連論文
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- 波形の折れ線近似による低遅延・少計算量楽音符号化方式(信号処理・符号化・一般)
- ヒューマノイドロボットにおける音響シミュレーションの検討
- ブラインド信号処理の最近の動向 : 超指数法と固有ベクトル法(ブラインド信号処理の技術とその応用論文)
- 軽い音声認識システムの開発と課題(若手研究者育成レクチャーシリーズ,認識,理解,対話,一般)
- 一般化固有値展開を用いたセミブラインド音源分離
- 会議音声データの収録とデータファイル化
- ニュース音声コーパスの構築
- 視覚情報を対話的に学習するマルチモーダル擬人化エージェント
- ヒューマノイドロボットにおける音響シミュレーションの検討
- 視聴覚センサ情報の統合による音源追跡
- マイクロホンアレイとカメラアレイを用いた会議録コンテンツ作成システムについて
- ロボットにおける音源位置推定(ロボットにおける音響技術)
- 多人数インタラクションの工学的応用 : 認識・理解システムの構築とその利用について(ワークショップ,言語・非言語コミュニケーション及び一般)
- ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(システム論文特集号)
- パーティクルフィルタを用いた移動音源の追跡技術
- マイクロホンアレイと音源定位を用いた会議録再生システムについて(立体音響・音場制御/聴覚/一般)
- ひずみ感と帯域感を考慮した楽音符号化方式の最適品質設計法(ネットワーク)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- 高次統計量の分布モデルを用いた音声・環境音識別法の検討(音声・音響処理)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- EMアルゴリズムを用いた移動音源の追跡と分離に関する基礎的検討(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 音を分ける
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 実環境における発話区間検出のための音響情報と画像情報の統合(音響と音声処理,音声強調,ロバスト音声認識)
- 調音の構造的制約を考慮した音声特徴抽出の検討
- 声帯振動の非線形効果パラメータのパタン化とその評価
- 声帯振動の非線形効果パラメータのパタン化
- ホルマントと調音パラメータノモグラムを用いた音声の低ビット符号化法
- 声帯振動の非線形効果を考慮した合成音声とその評価
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声文書検索のための多言語音素片セグメントの応用(第5回音声言語シンポジウム : ポスターセッション)
- 音声認識技術とその応用,現状と課題
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 利得適応型AR-HMM分解法を用いた音響モデルの雑音適応化の検討(音響と音声処理,音声強調,ロバスト音声認識)
- マイクロフォンアレイを用いた音環境の見守りによる非日常音と危険状態の検出システム(ユビキタス・センサネットワークの要素技術,コンテクストの抽出,スマートスペース,ユビキタス生活支援,一般)
- ARHMMに基づいた音声分析手法と歌声認識による評価(聴覚・音声及び一般)
- 対話型英語学習システムにおける日本人英語音声認識精度の検討
- 日本人英語の特性に基づく音声認識を用いた英会話学習支援システム
- 言語に共通な音声符号系とその音響セグメントモデルの作成
- 単語発声の複数サンプルを利用した未知語の音韻系列の推定(音声情報処理 : 現状と将来技術論文特集)
- 自動推論 Wizard of OZ システムによる日本語自由発話コーパス
- 被覆率を重視した大語彙連続音声認識用統計的言語モデル
- 人の間, ものの間のインタフェース
- WOZシステムで収録した自由発話音声の対話データベース
- 音声認識用統計的言語モデルのための形態素解析済みテキストの後処理
- ノンバーバル情報を導入した音声・画像統合対話システムでの初期データ収録
- ノンバーバル情報を導入した音声・画像統合対話システムの設計
- 複数サンプルを用いた未知語の音韻系列の推定
- 複数サンプルを用いた未知語認識
- RWC計画における音声対話データベースの構築
- 休止を単位とした漸進的対話処理
- 対話システム制御における時間の扱い
- Q&Aコーナー(コーヒーブレーク)
- コヒーレントサブスペース法を用いたアレイ信号処理による音声強調
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- エコーキャンセラの残留エコー特性測定に用いる信号の検討
- マン・マシン対話データのピッチパターン分類に関する検討
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成による音声区間検出法の文章発話への適用
- 環境音モデルとHMM合成を用いた文章発話に対する音声区間検出の検討
- セグメント単位の音声符号列からのレキシコンの生成
- 区分線形セグメントラティスによる日英混合音声の認識
- 言語混合単語音声認識に関する実験的検討
- 区分線形セグメントラティスにおける音韻的チャンクの抽出
- 中間符号系と記号列間距離計算に基づく音声処理の提案
- 区分線形セグメントラティス音韻モデルにおけるクラスタリング
- 単語セットの音声認識難易度推定 : 記号領域における単語間距離計算の応用
- 重畳区間の推定情報を用いたHMM合成に基づくロバスト音声認識の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 環境音モデルとHMM合成を用いた音声区間検出法の音声認識への適用
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法(マルチメディア通信とQoS, VoIP, ストリーミング, 一般)
- ひずみ感と帯域感を考慮した楽音符号化の最適品質設計法
- 音響情報と画像情報の統合による発話区間検出 : 基本的なコンセプト
- 話者位置推定のためのベイジアンネットによる音響情報と画像情報の統合
- SVMを用いた音源数推定の音源分離システムへの応用
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 隠れマルコフ網と逐次状態分割法を用いた環境音のモデル化の検討
- 音源分離におけるSVMを用いた音源数推定法について
- 音源分離におけるSVMを用いた音源数推定法について
- Kirchhoff-Helmholtz 積分方程式に着目した状態フィードバック制御による反射音抑圧手法の提案
- ブラインド信号分離における音源数推定法について
- 符号化音声の客観品質評価に用いる擬似音声の有効性
- 残留エコー特性の客観測定に用いるテスト信号の比較
- 楽音波形の折れ線近似に基づくVariable bit-rate符号化の一検討
- 帯域とビットレートを考慮した楽音符号化品質設計法
- 3. ICAによる音響信号の分離(見分ける,聞き分ける)
- 実音響環境における音響シーンデータの収集
- D-14-36 RWCP実環境音声・音響データベース
- 実環境における音響シーンデータベースの構築
- 一般化固有値展開を用いたセミブラインド音源分離
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 反射のある音場における信号分離 (独立信号分析と信号分離の基礎)
- 楽音波形の折れ線近似 Variable bit-rate 符号化方式の適応量子化による品質改善
- 高次Cumulantを用いたアレイ信号処理
- 近頃, 思うこと
- サブスペース法に基づいたアレイ信号処理による音声強調手法
- 分割構造を持つGriffiths-Jim型適応ビームフォーマについて
- RLS適応ビームフォーマの実装に関する検討