HMMに基づく音声合成における様々な発話速度の実現

スポンサーリンク

概要

論文の詳細を見る
本稿では,任意の発話速度で音声合成を行うための,音素継続時間長の制御手法を提案する.本手法では,「速い」「普通」「遅い」という,基本となる3種類の発話速度に対応する音素継続時間長のモデルを,実データから数量化I類を用いて構築し,これらを補間することによって目標とする発話速度の音素継続時間長モデルを作成する.柔軟な韻律制御が可能であるHMMに基づく音声合成方式によるTTSシステムに本手法を導入し,様々な発話速度での合成音声を被験者による主観評価実験によって評価する.ルールに基づく継続時間長制御手法との対比較実験の結果,提案手法の方が自然性が高いことが確認された.
一般社団法人電子情報通信学会の論文
2002-08-23

著者

関連論文

もっと見る

スポンサーリンク