音声認識のための特徴量FTTSSの電話音声認識への適用について(聴覚・音声/一般)
スポンサーリンク
概要
- 論文の詳細を見る
以前我々が耐雑音性を目的として提案した音声認識のための特徴量FTTSS(Fourier Transform of Ternarized Spectral Slope)の抽出には8000Hzまでの周波数帯域を採用し、64チャネルのフィルタバンクを利用していた。本研究では、FTTSSを電話音声へ適用するため、模擬的な電話回線特性や実際の電話回線に通した音声の認識を行い、問題点および認識率向上のため周波数帯域やフィルタバンクのチャネル配置について検討を行った。また、認識精度の評価を行うために特徴量MFCC(Mel Frequency Cepstral Coefficients)を用いて認識した結果との比較、検討も行った。
- 社団法人電子情報通信学会の論文
- 2007-07-19
著者
関連論文
- 雑音下音声LSPパラメータ量子化ニューラルネットにおける中間層符号パターンと量子化歪の関連
- 粘弾性体による声帯音源の構築
- 単語音声認識における時間変化を表現する特徴量の耐雑音性について(聴覚・音声/一般)
- ビデオ教材作成支援を目的とした講義音声によるシーン分割(教育工学)
- 非対称声帯モデルによる疾患音声生成の数値シミュレーション(聴覚・音声/一般)
- 音声認識のための特徴量FTTSSの電話音声認識への適用について(聴覚・音声/一般)
- 音声認識のための特徴量FTTSSの電話音声認識への適用について