ピッチ・パワーの時間変化を考慮した音声信号の周期成分・非周期成分分離方式(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
スポンサーリンク
概要
- 論文の詳細を見る
音声合成の音質向上を目的に、音声信号を、周期的な声帯振動を音源とする周期成分とノイズ的な信号を音源とする非周期成分に分離する方法を検討している。人間らしい自然な音声合成を実現する上で、肉声中に混在する周期成分と非周期成分を合成時に適切に再現することが一つの重要なポイントであるが、そのためにはまず、音声信号から周期成分と非周期成分に高精度で分離できる分析方法が必要である。しかしながら実際の音声では、周期成分として分離したい成分が、ピッチやパワーの時間変化の影響を受けて、完全な周期信号からは逸脱するため、周期成分が周期信号であることを前提とした分離方法では、周期成分が非周期成分にリークしてしまい、適切な分離が行えない問題がある。そこで本報告では、ピッチおよびパワーの時間変化を考慮した新しい周期成分・非周期成分への分離方式を提案する。さらに合成音声を用いて評価した結果と自然音声に対して実際に分離した例を示す。
- 2010-11-11
著者
-
籠嶋 岳彦
(株)東芝 研究開発センター
-
森田 眞弘
(株)東芝 研究開発センター
-
籠嶋 岳彦
東芝・マルチメディアラボラトリー
-
森田 眞弘
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝
関連論文
- FWFモデルを用いた複数素片選択融合方式による音声合成
- 閉ループ学習に基づく音声素片および基本周波数制御規則の生成
- スペクトル包絡を制御するためのピッチ波形のモデリング
- 代表パターンコードブックを用いた基本周波数制御法
- 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
- サブバンド閉ループ学習による音声素片の生成
- TOS-Drive TTS の米・英・独・仏・中国語への応用
- コンパクトなテキスト音声合成システムの開発
- 閉ループ学習に基づく最適な音声素片の解析的生成
- 閉ループ学習に基づく音声素片辞書の生成
- 閉ループ学習に基づく代表素片選択による音声素片の自動生成
- モーラを単位としたアクセント規則の自動構築
- 代表パターンコードブックを用いたピッチパターン制御法
- ベクトル量子化に基づいた音声合成素片辞書の符号化
- 閉ループ学習による音声素片の自動生成 -最適な素片の解析的生成-
- 閉ループ学習による音声素片の自動生成 -代表素片選択-
- 高音質LPC分析残差駆動合成器
- 高音質規則音声合成器のための有音声源生成法
- エスケープタイムアルゴリズムによるフラクタル符号化の画像再生
- エスケープ・タイム・アルゴリズムによるフラクタル符号化の画像再生
- ピッチ・パワーの時間変化を考慮した音声信号の周期成分・非周期成分分離方式(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 口語音声合成のための文末基本周波数制御
- 多段グローバル動き補償を用いた動画像符号化
- 次世代音声合成システムToSpeak V2を支える多様性向上技術
- 感情音声合成のための基本周波数制御
- 高音質で聞きやすい音声合成システム ToSpeak (特集 デジタルメディア処理先端技術)
- How to 発明 省メモリ高音質音声合成技術の発明
- テキスト音声合成技術実用化の動向(音声合成に関する研究の動向)
- 「日本語の作文技術」, 本多勝一著, 朝日文庫, 1982年(私のすすめるこの一冊)(コーヒーブレーク)
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定 (音声)
- 音声合成の多様性向上の取り組み
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)