日本語テキスト音声合成における音素単位とダイフォン単位に基づいた単位選択
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 日本語テキスト音声合成(TTS : Text-to-Speech)における新たな単位選択法を提案する.日本語では, 母音の無声化を除くとCV(C : 子音, V : 母音)とVから音節が構成されるため, 合成単位としてCV単位がよく用いられる.しかし, 波形接続型のTTSにおいてCV単位を用いて音声を合成すると, VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV^*単位や可変長単位)がこれまでに提案されているが, V-V接続の問題はまだ解決されていない.そこで, V-V接続により生じる不連続感を低減する手法として, 音素単位とダイフォン単位に基づいた新たな単位選択法を提案する.提案法では, 音素境界における接続だけでなく, 母音中心における接続も考慮して単位選択が行われる.評価実験結果から, 提案法は音素単位に基づいた従来法と比較し, よりよい性能をもっことが明らかになった.
- 社団法人電子情報通信学会の論文
- 2002-01-17
著者
-
津崎 実
京都市立芸術大学
-
津崎 実
Atr音声言語コミュニケーション研究所:京都市立芸術大学
-
津崎 実
Atr音声言語コミュニケーション研究所
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
河井 恒
Atr音声言語コミュニケーション研究所
-
河井 恒
株式会社kddi研究所音声処理グループ
-
河井 恒
KDD研究所
-
鹿野 清宏
奈良先端科学技術大学院大学
-
戸田 智基
ATR音声言語コミュニケーション研究所
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- フレッシュマン企画 : 音の常識Q&A(やさしい解説)
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識