短時間パワースペクトルの時間-周波数傾斜に基づく耐雑音性を持った音声認識特徴量
スポンサーリンク
概要
- 論文の詳細を見る
短時間パワースペクトル(STPS)に基づく音声認識のための特徴量として,対数化したSTPSの逆フーリエ変換で定義されるMFCCが広く利用されている。しかしSTPSのピークや谷の傾斜は,発声者の違い,分析時の周波数分解能や環境雑音による変動を受け易く,MFCCもこれらの変動に対する頑健性が弱い。本研究では雑音に対する頑健性を強調するという観点から,STPSの周波数軸方向又は時間軸方向の傾斜を2値化/3値化した値を利用する特徴量を提案する。本論文では2値化/3値化の利点及び提案する特徴量の計算法を示し,また単語単位のHMMに適用し,提案した特徴量の耐雑音性についてMFCCと比較して検証する。
- 2009-07-01
著者
関連論文
- 短時間パワースペクトルの時間-周波数傾斜に基づく耐雑音性を持った音声認識特徴量
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- FTTSSに基づいた音声認識LSIの開発(FPGAとその応用及び一般)
- 複数の変調スペクトル解像度を用いた音声認識の耐雑音性
- 確率的な韻律規則を文脈自由文法に組み込んだ連続音声認識
- 単語音声認識における時間変化を表現する特徴量の耐雑音性について(聴覚・音声/一般)
- 音声認識のためのスペクトルの時間変化を表す特徴量抽出についての検討
- 単語音声認識における時間変化を表現する特徴量の耐雑音性について
- 短時間パワースペクトルの時間-周波数傾斜の3値化に基づく音声特徴量を用いた単語認識(音声・聴覚,一般)
- 短時間パワースペクトルの時間-周波数傾斜の3値化に基づく音声特徴量を用いた単語認識
- 変調スペクトルの重要な成分のみを選択的に用いた雑音に強い音声認識
- 2006年秋季研究発表会