パワートラジェクトリー上での残響のモデル化と遠隔音声認識への適用(聴覚・音声及び一般)

スポンサーリンク

概要

論文の詳細を見る
遠隔音声認識で問題となる残響の影響を低減するため, MFCC分析におけるメルBPF出力パワートラジェクトリー上での残響のモデル化を検討している.この残響モデルは, 残響を表す指数的減衰係数, 直接音対残響音比, 初期反射によるカラーリング含むチャンネルゲインの3つのパラメータから成り立っている.モデルパラメータは, 残響有り無しの一対の学習音声を用いて対数パワートラジェクトリー上での誤差最小基準により推定される.指定パラメータを用いて残響パワートラジェクトリーを合成し, それから得られるMFCCを用いてHMMを学習した結果, 実残響音声で学習したHMMによる認識精度との差は数%以内であった.更に, このモデルに基づく逆フィルタとフロアリング及び平滑化の後処理より, 日本語数字音声の認識において単語正解精度を最大12
社団法人電子情報通信学会の論文
2005-07-15

著者

関連論文

もっと見る

スポンサーリンク