音声合成の多様性向上の取り組み

スポンサーリンク

概要

論文の詳細を見る
本稿で言う音声合成の多様性とは,様々な話者や発話スタイルの音声合成システムが簡単に作れる能力を指している.話者の多様性向上のため,収録音声からその話者性を再現する音声合成モデルを自動生成するシステムを開発し,サービスを一般公開した.本サービスにより,有名人の声だけでなく,開発コストがかけられない一般ユーザの声での音声合成が可能となった.音声合成の応用を拡大していくためには,発話スタイルがそれぞれの応用に適していることが必要である.これまでに,音声インターフェース応用で有用な「対話調」などを開発してきた.さらに,感情をこめた電子書籍の朗読を実現するために,セリフの感情を自動判別するシステムを試作した.
2012-10-19

著者

関連論文

もっと見る

スポンサーリンク