音声の線形予測分析
スポンサーリンク
概要
- 論文の詳細を見る
最尤スペクトル推定法、PARCOR, LSPという音声分析・合成の発展の歴史は、数理的な手法が音声処理に本格的に導入され、成功した例である。これらはいずれも全極形線形モデルを基礎においているが、それぞれに特徴を持っている。LPCは、音声の全極形モデルに基づき、合成フィルターの安定性を保証した分析法である。(自己相関関数の正定値性による)しかしながらLPC係数を低ビット量子化すると、合成フィルタが不安定化する。PARCOR方式は、LPC係数{a i}を{k_i}に変換することにより、この問題を一応解決した。PARCOR方式の最適化に関して、精力的な研究を行った結果、その問題点もいくつか明らかになった。問題点の一つはPARCOR係数は、パラメータの種類により、またパラメータのとる値の組み合わせにより、そのスペクトル感度が大幅に異なることにあった。これらの問題を緩和するために、パラメータ間の不均等ビット割付、パラメータ値に対する非線形量子化等が導入された。さらにPARCOR係数から音声合成するとき、パラメータの線形補間による合成音のスペクトル歪みが大きいという問題もあった。これらがPARCOR方式の低ビット符号化の壁になっていた。こうした問題を解決することを目的として、1975年に線スペクトル分析法が考案された。これを元に、LSP方式が開発され、現在も携帯電話の音声符号化方式にも活用されている。
- 社団法人電子情報通信学会の論文
- 1998-09-10
著者
関連論文
- 音声言語関連大型プロジェクトの現状と将来
- パネル討論 : 音声言語関連大型プロジェクトの現状と将来
- 1985年IEEE音響・音声・信号処理国際会議(ICASSP85)
- 1983年IEEE音響・音声・信号処理国際会議 : ICASSP83
- 第91回米国音響学会及びIEEEの音響・音声・信号処理に関する1976年国際会議
- 音声スペクトルの統計的パラメ-タに含まれる個人性情報
- 長時間平均スペクトルによる話者認識における経時変化の効果
- 連続音声認識結果からの言語エントロピーの推定
- 空間音響特性を考慮したスぺースダイバーシチ型ロバスト音声認識(音声情報処理 : 現状と将来技術論文特集)
- 室内音響特性を考慮した音声認識に関する検討