音声認識におけるメル線形予測分析法の評価

スポンサーリンク

概要

論文の詳細を見る
Strubeによって提案されたバークあるいはメルスケール上の線形予測分析は、人間の聴覚特性を用いたMFCCやPLP分析と同様に音声認識に有効であると期待される。しかし、この方法は通常の線形予測分析と比較して計算量が多く、音声認識にほとんど使用されていない。本報告では、メル化された予測係数を時間領域で効率的に推定するための分析手法(メル線形予測分析:MLPC分析)を提案する。本手法は、通常の線形予測分析の約2倍の計算量で実現できる。MLPC分析により得られるメルケプストラム(MLPCケプストラム)と通常のLPCメルケプストラムとを男性不特定話者音声認識実験を通して比較した。その結果、MLPCケプストラムの方はLPCメルケプストラムよりも音素認識率で約8.6%高い73.4%の認識率を、また単語認識率(520単語)で約3.3%高い96.0%の認識率を示した。
社団法人電子情報通信学会の論文
1998-06-11

著者

関連論文

もっと見る

スポンサーリンク