HMM音声合成技術の歌唱スタイル生成Job Pluginへの応用
スポンサーリンク
概要
- 論文の詳細を見る
HMM 音声合成は統計的な韻律のモデル化により,話者性やスタイルを柔軟に多様化することができる.本稿では,その表現力を波形素片接続型の歌声合成システムである VOCALOID? に取り入れる方法として,歌唱表現が現れる重要な特徴と考えられるピッチの変化をHMMでモデル化,生成する歌唱スタイル生成手法を提案する.HMM音声合成手法を歌唱スタイルのモデル化に利用する際には,未知の音高に対しても適切なパラメータ生成を行う必要がある.そこで本研究ではピッチベンドチェンジを用いたモデル化を提案する.また,長い時間伸ばされる音符に対して自然な変動を付与するため,ノート内を複数のセグメントに分割した単位でモデル化し,多段階のコンテキストクラスタリングを導入して楽曲構造と音符内の変動を階層的に表現する.また,この手法をVOCALOID?3の機能である Job Plugin として組み込んだ例を紹介する.
- 2013-12-12
著者
-
橘 誠
ヤマハ株式会社 サウンドテクノロジー開発センター
-
橘 誠
ヤマハ株式会社研究開発統括部第1研究開発部音声グループ
-
才野 慶二郎
ヤマハ株式会社研究開発統括部第1研究開発部音声グループ
-
久湊 裕司
ヤマハ株式会社研究開発統括部第1研究開発部音声グループ
-
才野 慶二郎
ヤマハ株式会社研究開発センター