平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御(合成,生成,韻律,一般)

スポンサーリンク

概要

論文の詳細を見る
本研究では,重回帰隠れセミマルコフモデル(重回帰HSMM)に基づく合成音声の声質制御手法において,様々な声質の制御を少量の学習データから容易に実現することを目的に,平均声モデルからの話者適応手法を導入することを提案する.提案手法では,まず平均声モデルに少量の適応データを用いて話者適応を行い,学習に用いる各話者の話者適応HSMMを作成する.得られた話者適応HSMMのモデルパラメータと話者毎の声質の特徴を表す声質ベクトルから,最小二乗基準で重回帰HSMMの回帰行列を求め,最尤推定により補正を行う.20名の各話者50文章のデータを用いた声質制御実験を行い,主観評価から提案手法が合成音声の声質制御に有効であることを示す.さらに,複数の重回帰HSMMをモデル補間する手法を提案し,これを用いて複数の声質を制御することを試み,その結果を報告する.
2008-10-16

著者

関連論文

もっと見る

スポンサーリンク