日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)

スポンサーリンク

概要

論文の詳細を見る
本稿では自発性の高い対話音声の合成において,多様な韻律を生成するための拡張コンテキストの提案とその評価を行った結果を報告する.HMM音声合成では音韻・韻律の変動要因をコンテキストとして考慮し学習・合成を行っているが,従来の読上げ音声のためのコンテキストセットでは対話音声の韻律の多様性を実現することが困難である.そこで,大規模音声コーパスである日本語話し言葉コーパス(CSJ)に含まれる様々な情報をコンテキストとして追加し拡張コンテキストとした.従来のコンテキストと拡張コンテキストの比較を行い,音素引き延ばしおよびX-JToBIのトーン層ラベルに基づく情報がコンテキストとして有効であるという結果を得た.さらに,コンテキストの増加による過学習を避けるための決定木クラスタリングの新たな停止基準の導入や,実用上のシステムを考慮して合成時に一部の追加コンテキストを自動推定する手法の提案を行い,その有効性を評価した.
2011-05-05

著者

関連論文

もっと見る

スポンサーリンク