代表パターンコードブックを用いた基本周波数制御法
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,代表パターンを用いた基本周波数制御モデルと,そのモデルパラメータの制御規則を音声データベースから学習する方法について提案する.代表パターンは,アクセント句単位の典型的な基本周波数の変化パターンを表すベクトルであり,代表パターンの集合を代表パターンコードブックと呼ぶ.アクセント句ごとに選択された代表パターンに対して,音韻継続時間長に従ったモーラ単位の線形伸縮,及び対数周波数軸上での平行移動(オフセット)を行って接続することにより文の基本周波数パターンを生成する.制御規則の学習とは,代表パターンコードブック・代表パターン選択規則・オフセット推定規則の三つを音声データベースから抽出することに対応し,音声データベースの基本周波数パターンと,モデルにより生成されたパターンの誤差(近似誤差)が最小となるような規範のもとに,これらの制御規則を学習する.女性話者4名の音声データベースを用いて制御規則の学習実験を行った結果から,学習データに含まれない文章に対しても,オリジナルの話者に近い基本周波数パターンが生成できることを示す.
- 社団法人電子情報通信学会の論文
- 2002-06-01
著者
-
瀬戸 重宣
(株)東芝研究開発センター((株)日本電子化辞書研究所)
-
瀬戸 重宣
(株)東芝・関西研究所
-
志賀 芳則
(株)東芝 マルチメディア技術研究所
-
赤嶺 政巳
(株)東芝 研究開発センター
-
籠嶋 岳彦
(株)東芝 研究開発センター
-
森田 眞弘
(株)東芝 研究開発センター
-
志賀 芳則
Centre for Speech Technology Research, the University of Edinburgh
-
籠嶋 岳彦
東芝・マルチメディアラボラトリー
-
森田 眞弘
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝
-
瀬戸 重宜
(株)東芝 研究開発センター
-
志賀 芳則
Centre For Speech Technology Research The University Of Edinburgh
関連論文
- FWFモデルを用いた複数素片選択融合方式による音声合成
- 音素HMMを環境適応的に選択して用いた競合モデルによる環境雑音のリジェクション
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価
- 不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用
- 実時間音声対話システムTOSBURGの開発(1)システム構成
- 東芝パソコンの音声認識 / 合成ソフトウェア
- 東芝の音声認識・合成ソフトウエアの紹介
- パソコン用文音声合成ソフトウェアエンジンの開発
- 文音声合成PCカードの試作
- 音声セグメントベース規則合成方式を用いた英単語音声合成LSIの開発
- 直交化残差方式による文音声合成の検討
- 調音器官の動きに基づき音韻継続時間長制御
- 閉ループ学習に基づく音声素片および基本周波数制御規則の生成
- スペクトル包絡を制御するためのピッチ波形のモデリング
- 代表パターンコードブックを用いた基本周波数制御法
- 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
- サブバンド閉ループ学習による音声素片の生成
- TOS-Drive TTS の米・英・独・仏・中国語への応用
- コンパクトなテキスト音声合成システムの開発
- 閉ループ学習に基づく最適な音声素片の解析的生成
- 閉ループ学習に基づく音声素片辞書の生成
- 閉ループ学習に基づく代表素片選択による音声素片の自動生成
- モーラを単位としたアクセント規則の自動構築
- 代表パターンコードブックを用いたピッチパターン制御法
- DSP組み込み可能な省メモリ音声合成方式
- ベクトル量子化に基づいた音声合成素片辞書の符号化
- 閉ループ学習による音声素片の自動生成 -最適な素片の解析的生成-
- 閉ループ学習による音声素片の自動生成 -代表素片選択-
- 高音質LPC分析残差駆動合成器
- 高音質規則音声合成器のための有音声源生成法
- エスケープタイムアルゴリズムによるフラクタル符号化の画像再生
- エスケープ・タイム・アルゴリズムによるフラクタル符号化の画像再生
- ピッチ・パワーの時間変化を考慮した音声信号の周期成分・非周期成分分離方式(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 口語音声合成のための文末基本周波数制御
- 実時間音声対話システムTOSBURGの開発(4)マルチモーダル応答
- 2.4kbps可変レートADP-CELP音声符号化
- CELP音声符号化における目標ベクトルの直交化に基づいた励振符号帳の高速探索
- 有声部/無声部に適した適応符号帳を持つCELP符号化方式
- CELP音声符号化方式における符号帳の非直交化探索法
- 相補直交化による基底変換を用いた音声符号化の一検討
- A-180 有声部/無声部に適した適応符号帳を持つCELP符号化方式(A-7. 情報理論,一般講演)
- A-179 CELP音声符号化方式における符号帳の非直交化探索法(A-7. 情報理論,一般講演)
- A-178 相補直交化による基底変換を用いた音声符号化の一検討(A-7. 情報理論,一般講演)
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価環境
- 音声自由対話システムにおける対話データ収集
- 多段グローバル動き補償を用いた動画像符号化
- 次世代音声合成システムToSpeak V2を支える多様性向上技術
- 感情音声合成のための基本周波数制御
- 高音質で聞きやすい音声合成システム ToSpeak (特集 デジタルメディア処理先端技術)
- How to 発明 省メモリ高音質音声合成技術の発明
- _パタン生成機構を考慮したコーパスベース_制御方式の検討
- テキスト音声合成技術実用化の動向(音声合成に関する研究の動向)
- 「日本語の作文技術」, 本多勝一著, 朝日文庫, 1982年(私のすすめるこの一冊)(コーヒーブレーク)
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定 (音声)
- 音声合成の多様性向上の取り組み
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)