音響調音対コードブックを用いた音声からの調音運動の逆推定

概要

論文の詳細を見る
調音運動と音声の同時観測データに基づく音響調音対コードブックを用い,音声スペクトルから調音パラメータの推定する手法を提案する.本手法は,入力音声のスペクトルに対してスペクトルセグメントを単位としてスペクトル距離に基づく音響調音対コードブック検索を行い,距離の小さい順に音響コードベクトルと対をなす調音コードベクトルの候補を複数個選択する.次に,選択された調音コードベクトルの候補に対して,調音運動の連続性を考慮したパス探索を行うことにより最適な調音パラメータを決定する.この手法では,実測された調音データを用いることで調音に関する静的及び動的な制約を調音音響コードブックに内在させ,かつ調音運動の連続性に基づく解の探索を行うことにより,音声スペクトルから調音パラメータを推定する逆問題における解の冗長性を解消している.3名の話者が発声した文章音声について調音パラメータの推定値を実測値と比較した結果,平均2乗誤差は1.81mmであり,声道の閉鎖やせばめ等の子音の調音特徴が音声から良好に推定されることが示された.
社団法人電子情報通信学会の論文
2002-07-25