音声認識に有効な周波数帯域についての研究

スポンサーリンク

概要

論文の詳細を見る
音声認識に用いるパラメータとして、メル、バークなとの聴覚心理尺度に周波数変換したパラメータが用いられることがある。しかし、聴覚特性に基づいていても、それが音声認識に対してかならずしも最適であるとはいえない。そこで、本研究では線形選択予測の手法を用い、音声認識に対して有効な周波数帯域の調査を行なうことを目的とする。まず、選択線形予測の計算において自己相関係数を直接変換するという手法を提案した。そして、その手法が従来の方法よりも計算量の点で有利になることを示した。次に、この手法を用いて求めたパラメータを用い、単語音声認識実験を行なった。その結果、バーク軸にワーピングしたパラメータは、認識率を周波数軸に対して均一化するという点でリーズナブルであることが確かめられた。
社団法人電子情報通信学会の論文
1994-09-06

著者

関連論文

もっと見る

スポンサーリンク