中国語基本周波数パターンの2段階合成手法と柔軟な韻律制御(合成,生成,韻律,一般)

概要

論文の詳細を見る
典型的な声調言語として知られている中国語では、声調が意味の区別等、コミュニケーションの実現に大変重要な役割を果たしており、その適切な制御が重要である。一般的に声調言語では非声調言語と比べ、基本周波数(F_0)の変化が激しく、その制御はより困難な課題となる。我々はすでに、F_0パターンをフレーズ成分と声調成分とに分け、それぞれルールベース手法とコーパスベース手法で生成する2段階合成法を提案し[1,2]、朗読音声について、十分に自然性の高いF_0パターンが生成できることを示した。フレーズ成分と声調成分とに分けずにF_0パターンを生成し、合成音声を比較したところ、自然性の観点からは提案手法の明確な優位性が認められなかったが、韻律制御の柔軟性の観点から明らかな優位性が見られた。具体的には、強調したい単語の前に大きめのフレーズ指令を手作業で設定し、提案手法でF_0パターンを生成することにより、意図した単語が正しく強調された音声が得られた。
社団法人電子情報通信学会の論文
2007-10-18