統計モデルに基づく音声合成における話者・スタイルの多様化(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)

スポンサーリンク

概要

論文の詳細を見る
本稿では、隠れマルコフモデル(HMM)に基づく音声合成において、話者や感情表現・発話様式(スタイル)を多様化する手法について紹介する。HMM音声合成ではスペクトルや韻律特徴量がモデル内の各状態の分布パラメータとして表現されるため、モデルパラメータの操作、モデルの拡張が容易であり、様々な多様化手法が提案されている。本稿では代表的な話者の多様化手法として話者適応、話者補間、話者強調について、またスタイルの多様化手法としてスタイルモデリングスタイル適応、スタイル補間、スタイル制御、スタイル変換について説明する。さらに声質制御や話し言葉音声についても概説し、今後の課題や展望について述べる。
2013-01-23

著者

関連論文

もっと見る

スポンサーリンク