基本周波数及び音素持続時間を考慮した音声合成用波形素片データセットの作成

スポンサーリンク

概要

論文の詳細を見る
テキスト音声合成のために基本周波数(以下, Fo)及び音素持続時間を考慮した波形素片データセットを効率的に作成することを目的として ,Fo・音素持続時間の出現頻度分布予測を取り入れた評価規準を用いてテキストデータベースから発声用の文セットを抽出する方法を提案する. 放送用原稿, 新聞記事などのテキストデータベースから500文を抽出する実験を行ったところ, 82.6%のカバレッジが得られた. また, この文セットを発声リストとして音声を収録したところ, カバレッジは72.9%であった. Fo・音素持続時間を考慮せずに作成した同じ文数の一般的な音素バランス文を発声して得られた音声データベースと比較したところ, 全体のカバレッジでは1.13倍であり, 同じ力バレッジを得るために必要な文数は1/2であった. これらのことより, 本方式の有効性が示された.
1999-08-25

著者

関連論文

もっと見る

スポンサーリンク