HMMに基づく音声合成のための話者補間
スポンサーリンク
概要
- 論文の詳細を見る
This paper describes an approach to voice characteristics conversion for an HMM-based text-to-speech synthesis system using speaker interpolation. Although most text-to-speech synthesis systems which synthesize speech by concatenating speech units can synthesize speech with acceptable quality, they still cannot synthesize speech with various voice quality such as speaker individualities and emotions ; In order to control speaker individualities and emotions, therefore, they need a large database, which records speech units with various voice characteristics in synthesis phase. On the other hand, our system synthesize speech with untrained speaker's voice quality by interpolating HMM parameters among some representative speakers' HMM sets. Accordingly, our system can synthesize speech with various voice quality without large database in synthesis phase. An HMM interpolation technique is derived from a probabilistic similarity measure for HMMs, and used to synthesize speech with untrained speaker's voice quality by interpolating HMM parameters among some representative speakers' HMM sets. The results of subjective experiments show that we can gradually change the voice quality of synthesized speech from one's to the other's by changing the interpolation ratio.
- 社団法人日本音響学会の論文
著者
-
吉村 貴克
(株)豊田中央研究所
-
吉村 貴克
Department of Computer Science, Nagoya Institute of Technology
-
徳田 恵一
Department of Computer Science, Nagoya Institute of Technology
-
益子 貴史
Department of Information Processing, Interdisciplinary Graduate School of Science Engineering, Toky
-
小林 隆夫
Department of Information Processing, Interdisciplinary Graduate School of Science Engineering, Toky
-
北村 正
Department of Computer Science, Nagoya Institute of Technology
関連論文
- HMM音声合成に基づく音声認識率予測手法
- HMM音声合成に基づく音声認識性能予測手法
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- 韻律生成HMMのための学習データ作成ツール
- HMMに基づいた波形接続型音声合成方式の検討
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMMに基づく音声合成における品質改善に関する検討
- 固有声に基づく音声合成におけるピッチのモデル化
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- 固有声に基づいた triphone による音声合成
- HMM に基づく音声合成のための励振源モデルの検討
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- HMMに基づく音声合成システムの自動構築
- HMMに基づく音声合成のための話者補間
- 尤度最大化基準によるHMMからの音声パラメータ生成法の評価
- HMMに基づくピッチパターン生成における動的特徴量の効果
- HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化
- HMMに基づく音声合成のためのスペクトラム, ピッチ, 状態継続長のモデル化
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成システムにおける話者補間