統計的音声生成モデルに基づく任意話者の調音運動の逆推定(国際ワークショップ:Speech dynamics by Ear, Eye, Mouth and Machine)

スポンサーリンク

概要

論文の詳細を見る
本論文では、統計的音声生成モデルに基づく、任意話者の音声からの調音運動の逆推定法を提案する。本モデルは、音素毎に作られる調音運動に対するHMM(隠れマルコフモデル)と、HMMの各ステート毎に調音パラメータを音響パラメータに変換する調音・音響マッピングにより構成される。また、モデルは、磁気センサシステムを用いた連続発声の調音運動と音声の同時観測データにより統計的に作成される。本論文では、与えられた音声から上記モデルの調音・音響マッピングを適応する手法を提案し、その有効性を示す。
社団法人電子情報通信学会の論文
2003-06-20

著者

関連論文

もっと見る

スポンサーリンク