HMMに基づく音声合成のための状態継続長モデルの構築

スポンサーリンク

概要

論文の詳細を見る
本論文では, HMMに基づく音声合成のための状態継続長モデルの構築法について述べる.音素HMMの各状態の状態継続長は1次元のガウス分布でモデル化し, 一つの音素HMMの全状態の状態継続長分布をまとめて一つの多次元のガウス分布として状態継続長モデルとする.状態継続長モデルは, 状態継続長に影響を与える要因を考慮して, 決定木によるコンテキストクラスタリングによりクラスタリングする.音声合成時には, 状態継続長モデルから尤度最大化基準により状態継続長を決定し, それに従いHMMからスペクトル列を生成する.予備実験において先行・当該・後続音素のみを考慮した状態継続長モデルでも, 自然のタイミングに近い合成音声を得ることができることを既に確認している.本論文では, さらにアクセント型, 構文情報のような状態継続長に影響を与える他の変動要因も考慮した実験を行った.
1998-09-11

著者

関連論文

もっと見る

スポンサーリンク