高即応・高精度な歪み特徴量モデルの推定のための動的静的アプローチ(耐雑音処理,第13回音声言語シンポジウム)

概要

論文の詳細を見る
本稿では,特徴量空間における歪み過程のモデルを,雑音の変化に感度よく,かつ精度よく推定するための動的静的アプローチを提案する.歪みによって劣化した特徴量からクリーン特徴量を直接推定する特徴量強調は,環境変動に頑健な音声認識に向けた有望なアプローチである.しかしながら,従来の方法では,歪み過程のモデルとして定常ないし変化の遅い加法性雑音を仮定しており,変化の速い雑音に対する効果は限定的であった.動的静的アプローチは,この問題を克服するために,動的ステップと静的ステップの2つのステップで構成される.動的ステップでは,各時間フレームにおける雑音の特徴量を一次的に推定する.動的ステップの目的は雑音の変化の特性を捉えることであり,そのために推定は波形や高次元スペクトルの空間で行われる.静的ステップでは,動的ステップで得られた雑音特徴量の一次推定値をクリーン特徴量モデルを用いて補正すると同時に,乗法性雑音の特徴量も最尤法により推定する.本稿では,マイクロホンアレイによる雑音下音声認識と残響音声認識の二つのシナリオについて動的ステップの構成方法を示し,実験により有効性を示す.
2011-12-12