閉ループ学習に基づく音声素片および基本周波数制御規則の生成
スポンサーリンク
概要
- 論文の詳細を見る
音声素片の閉ループ学習は,音声データベースから統計的に音声素片を生成する手法の一つである.音声素片に韻律変形を行って生成される合成音声のひずみを表す評価関数の最小化を学習の規範とするため,韻律変形に起因する劣化も含む合成音声の劣化を最小化する音声素片を生成することが可能である.また,F_0制御規則の学習においても閉ループ学習の概念を導人し,F_0生成モデルから出力されるF_0パターンのひずみに基づいてモデルパラメータ生成規則を学習することにより,自然性が高くかつロバストなF_0制御が実現できる.
- 社団法人電子情報通信学会の論文
- 2004-01-22
著者
-
瀬戸 重宣
(株)東芝研究開発センター((株)日本電子化辞書研究所)
-
瀬戸 重宣
(株)東芝・関西研究所
-
赤嶺 政巳
(株)東芝 研究開発センター
-
籠嶋 岳彦
(株)東芝 研究開発センター
-
森田 眞弘
(株)東芝 研究開発センター
-
志賀 芳則
Centre for Speech Technology Research, the University of Edinburgh
-
籠嶋 岳彦
東芝・マルチメディアラボラトリー
-
森田 眞弘
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝
-
瀬戸 重宜
(株)東芝 研究開発センター
-
志賀 芳則
Centre For Speech Technology Research The University Of Edinburgh
関連論文
- FWFモデルを用いた複数素片選択融合方式による音声合成
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価
- 不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用
- 実時間音声対話システムTOSBURGの開発(1)システム構成
- 東芝パソコンの音声認識 / 合成ソフトウェア
- 東芝の音声認識・合成ソフトウエアの紹介
- 閉ループ学習に基づく音声素片および基本周波数制御規則の生成
- スペクトル包絡を制御するためのピッチ波形のモデリング
- 代表パターンコードブックを用いた基本周波数制御法
- 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
- サブバンド閉ループ学習による音声素片の生成
- TOS-Drive TTS の米・英・独・仏・中国語への応用
- コンパクトなテキスト音声合成システムの開発
- 閉ループ学習に基づく最適な音声素片の解析的生成
- 閉ループ学習に基づく音声素片辞書の生成
- 閉ループ学習に基づく代表素片選択による音声素片の自動生成
- モーラを単位としたアクセント規則の自動構築
- 代表パターンコードブックを用いたピッチパターン制御法
- DSP組み込み可能な省メモリ音声合成方式
- ベクトル量子化に基づいた音声合成素片辞書の符号化
- 閉ループ学習による音声素片の自動生成 -最適な素片の解析的生成-
- 閉ループ学習による音声素片の自動生成 -代表素片選択-
- 高音質LPC分析残差駆動合成器
- 高音質規則音声合成器のための有音声源生成法
- エスケープタイムアルゴリズムによるフラクタル符号化の画像再生
- エスケープ・タイム・アルゴリズムによるフラクタル符号化の画像再生
- ピッチ・パワーの時間変化を考慮した音声信号の周期成分・非周期成分分離方式(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 口語音声合成のための文末基本周波数制御
- 実時間音声対話システムTOSBURGの開発(4)マルチモーダル応答
- 2.4kbps可変レートADP-CELP音声符号化
- CELP音声符号化における目標ベクトルの直交化に基づいた励振符号帳の高速探索
- 有声部/無声部に適した適応符号帳を持つCELP符号化方式
- CELP音声符号化方式における符号帳の非直交化探索法
- 相補直交化による基底変換を用いた音声符号化の一検討
- A-180 有声部/無声部に適した適応符号帳を持つCELP符号化方式(A-7. 情報理論,一般講演)
- A-179 CELP音声符号化方式における符号帳の非直交化探索法(A-7. 情報理論,一般講演)
- A-178 相補直交化による基底変換を用いた音声符号化の一検討(A-7. 情報理論,一般講演)
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価環境
- 音声自由対話システムにおける対話データ収集
- 多段グローバル動き補償を用いた動画像符号化
- 次世代音声合成システムToSpeak V2を支える多様性向上技術
- 感情音声合成のための基本周波数制御
- 高音質で聞きやすい音声合成システム ToSpeak (特集 デジタルメディア処理先端技術)
- How to 発明 省メモリ高音質音声合成技術の発明
- テキスト音声合成技術実用化の動向(音声合成に関する研究の動向)
- 「日本語の作文技術」, 本多勝一著, 朝日文庫, 1982年(私のすすめるこの一冊)(コーヒーブレーク)
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定 (音声)
- 音声合成の多様性向上の取り組み
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)