パーティクルフィルタとPolyak Averagingを用いた非定常雑音の抑圧(耐雑音)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では, パーティクルフィルタを用いた非定常雑音の逐次推定法及び抑圧法を提案し, 従来法と比較して非定常雑音下での音声認識性能改善に効果的である事を示す.提案手法において, 非定常雑音は再サンプリング法を含むパーティクルフィルタ及びマルコフ連鎖モンテカルロ法を通じて逐次推定され, クリーン音声は推定された非定常雑音をMMSE推定に基づく雑音抑圧法に適用することにより得られる.また, パーティクルフィルタで用いる状態空間モデルにPolyak averagingとfeedbackを導入することにより音声認識性能を大幅に改善できることを示す.
- 一般社団法人情報処理学会の論文
- 2005-07-15
著者
-
中村 哲
ATR音声言語通信研究所
-
藤本 雅清
ATR音声言語コミュニケーション研究所
-
藤本 雅清
NTTコミュニケーション科学基礎研究所
-
中村 哲
Atr音声口語コミュニケーション研究所
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
-
Fujimoto Masakiyo
Department Of Electronics And Informatics Faculty Of Science And Technology Ryukoku University
関連論文
- A-16-18 Blendshapesによるリップシンクアニメーションのためのキーフレーム削除法(A-16.マルチメディア・仮想環境基礎,一般講演)
- 携帯型端末を用いた音声自動翻訳システムとフィールド実験(モバイルと放送の融合時代を迎えて(1セグ放送, モバイル放送, 携帯放送融合サービス, 1セグ対応携帯端末, モバイルコンテンツと放送コンテンツの融合, マルチメディア配信, ディジタル放送受信機, および一般))
- バイモーダル音声認識における音素境界を越えた同期性のモデル
- 5.効率的アニメ制作支援のための3次元CG技術(情報技術が支えるアートとコンテンツの世界)
- 連続音声認識候補受理/リジェクションのためのワードスポッティング仮説検証手法(第5回音声言語シンポジウム : システム・信頼度)
- SLP雑音下音声認識評価WG活動報告 : 評価用データと評価手法について(Session-6 スペシャルセッション: 共通コーパスを利用した耐雑音技術評価, 第7回音声言語シンポジウム)
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
- 実走行車内単語音声データベースCENSREC-3と共通評価環境の構築
- CENSREC-3 : 実走行車内単語音声データベースと評価環境の構築(ポスターセッション)(第6回音声言語シンポジウム)
- 実環境下音声認識の評価の標準化とその動向(音声・言語における標準化動向)(第6回音声言語シンポジウム)