ニューラルネットによる時間周波数マスキングフィルタの最適化
スポンサーリンク
概要
- 論文の詳細を見る
動的ケプストラムにより高い音声認識性能が得られることは既に示した。本報告は動的ケプストラムを求める時間周波数マスキングフィルタの逆向き誤差伝搬法による最適化法を提案する。マスキングフィルタはガウス型のリフタの組により表される。逆向き誤差伝搬法を用いてこれらのガウス分布の標準偏差と利得を最適な識別ができるように学習する。バックエンドの認識方法としてニューラルネットを用いる方法と、HMMを用いる方法について学習アルゴリズムを示した。リフタの形状を少ない数のパラメータで表しており、自由度が小さいため未学習サンプルに対して頑健な学習ができることが分かった。
- 社団法人電子情報通信学会の論文
- 1993-07-22
著者
関連論文
- 連続母音の遷移部の知覚における後続雑音の効果
- 周波数変化音追跡モデルに基づくスペクトル予測法
- 種々の周波数変化音の動的知覚特性
- 周波数変化音追跡モデルに基づく知覚スペクトル予測法
- 周波数変化音の動的知覚特性
- 音声認識のための新しい音声分析
- スイープ音追跡過程の動特性
- 連続音声の過度部の知覚における後続雑音の効果
- 音の立ち上がりによる時間周波数マスキングの制御
- 周波数変化音知覚における残効
- 各種時間周波数マスキングフィルタを用いた耐雑音性連続音声認識
- 動的ケプストラムを用いた音声認識におけるバースト性雑音に対する耐性の検討
- 動的ケプストラムを用いた音声認識における耐雑音性評価
- ニューラルネットによる時間周波数マスキングフィルタの最適化
- 複合周波数変化音追跡神経演算モデル
- 周波数変化音追跡神経回路モデル
- 周波数変化音追跡神経回路モデル
- 時間周波数マスキング特性を模擬した聴覚フィルタモデルによる音声認識
- 順向マスキングの時間周波数特性を模擬した動的ケプストラムを用いた音韻認識
- 周波数変化音追跡の動特性