HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張(音声、聴覚,<特集>学生論文)

概要

論文の詳細を見る
本論文では自発性の高い対話音声の合成において,多様な韻律を生成するための拡張コンテクストを提案する.HMM音声合成では音韻・韻律の変動要因をコンテクストとして考慮し学習・合成を行っているが,従来の読上げ音声のためのコンテクストセットでは対話音声の韻律の多様性を実現することが困難である.そこで,本論文では大規模音声コーパスである日本語話し言葉コーパス(CSJ)に収録されている対話音声を対象とし,CSJに付与されている様々な情報をコンテクストとして追加し拡張コンテクストとした.コンテクストの増加による過学習を避けるための決定木クラスタリングの新かな停止基準を導入し,従来のコンテクストと拡張コンテクストの比較を行った.その結果音素引き延ばし及びX-JToBIのトーン層ラベルに基づく情報がコンテクストとして有効であった.更に実用性を考慮して,合成時に拡張コンテクストの一部を自動的に求める手法の有効性を評価し,正解のコンテクストを用いた場合と同程度の自然性が得られることを確認した.
2012-03-01