音声合成の多様性向上の取り組み
スポンサーリンク
概要
- 論文の詳細を見る
本稿で言う音声合成の多様性とは,様々な話者や発話スタイルの音声合成システムが簡単に作れる能力を指している.話者の多様性向上のため,収録音声からその話者性を再現する音声合成モデルを自動生成するシステムを開発し,サービスを一般公開した.本サービスにより,有名人の声だけでなく,開発コストがかけられない一般ユーザの声での音声合成が可能となった.音声合成の応用を拡大していくためには,発話スタイルがそれぞれの応用に適していることが必要である.これまでに,音声インターフェース応用で有用な 「対話調」 などを開発してきた.さらに,感情をこめた電子書籍の朗読を実現するために,セリフの感情を自動判別するシステムを試作した.
- 2012-10-19
著者
-
森田 眞弘
(株)東芝 研究開発センター
-
籠嶋 岳彦
東芝・マルチメディアラボラトリー
-
布目 光生
(株)東芝
-
布目 光生
(株)東芝 研究開発センター
-
森田 眞弘
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝研究開発センター知識メディアラボラトリー
-
籠嶋 岳彦
(株)東芝
-
布目 光生
(株)東芝研究開発センター
-
橘 健太郎
(株)東芝研究開発センター
関連論文
- FWFモデルを用いた複数素片選択融合方式による音声合成
- オントロジーメンテナンスのための固有名詞抽出技術の検討(オントロジー,「Webインテリジェンス」及び一般)
- 5H-3 投稿情報に基づくビジネスメールの話題分類(自然言語処理,一般セッション,人工知能と認知科学)
- セマンティックWebのツール(セマンティックWeb)
- 閉ループ学習に基づく音声素片および基本周波数制御規則の生成
- スペクトル包絡を制御するためのピッチ波形のモデリング
- 代表パターンコードブックを用いた基本周波数制御法
- 合成辞書作成に用いる音声DBの品質が合成音声に与える影響について
- サブバンド閉ループ学習による音声素片の生成
- TOS-Drive TTS の米・英・独・仏・中国語への応用
- コンパクトなテキスト音声合成システムの開発
- 閉ループ学習に基づく最適な音声素片の解析的生成
- 閉ループ学習に基づく音声素片辞書の生成
- 閉ループ学習に基づく代表素片選択による音声素片の自動生成
- モーラを単位としたアクセント規則の自動構築
- 代表パターンコードブックを用いたピッチパターン制御法
- ベクトル量子化に基づいた音声合成素片辞書の符号化
- 閉ループ学習による音声素片の自動生成 -最適な素片の解析的生成-
- 閉ループ学習による音声素片の自動生成 -代表素片選択-
- 高音質LPC分析残差駆動合成器
- 高音質規則音声合成器のための有音声源生成法
- セマンティックWebにおけるメタデータとその活用(セマンティックWeb)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インタフェース(ユーザインタフェースとインタラクティブシステム,インタラクションの理解とデザイン)
- 意味クラス解析と意図推定に基づくインタラクティブな情報検索インターフェース(テーマセッション1(テキスト処理・文字列画像処理),文字・文書の認識・理解)
- オントロジーメンテナンスのための固有名詞抽出技術の検討(オントロジー,「Webインテリジェンス」及び一般)
- I-003 応用規格に基づいたXML文書への変換を可能とする紙文書を対象とした階層的文書変換システム(I分野:画像認識・メディア理解)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析(文書・文字メディアの認識・理解, 一般)
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- XML文書変換を目的としたセル分類およびセル変形に基づく表構造解析
- エスケープタイムアルゴリズムによるフラクタル符号化の画像再生
- エスケープ・タイム・アルゴリズムによるフラクタル符号化の画像再生
- ピッチ・パワーの時間変化を考慮した音声信号の周期成分・非周期成分分離方式(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 口語音声合成のための文末基本周波数制御
- 多段グローバル動き補償を用いた動画像符号化
- キー概念辞書を利用しない構造抽出ルールの学習
- 次世代音声合成システムToSpeak V2を支える多様性向上技術
- 感情音声合成のための基本周波数制御
- 電子書籍の論理構造に基づくポーズ情報の推定とSSML構造化
- 電子書籍の論理構造に基づくポーズ情報の推定とSSML構造化
- 自然で聞きやすい電子書籍読上げのための文書構造解析技術
- 高音質で聞きやすい音声合成システム ToSpeak (特集 デジタルメディア処理先端技術)
- How to 発明 省メモリ高音質音声合成技術の発明
- テキスト音声合成技術実用化の動向(音声合成に関する研究の動向)
- 「日本語の作文技術」, 本多勝一著, 朝日文庫, 1982年(私のすすめるこの一冊)(コーヒーブレーク)
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定 (音声)
- 音声合成の多様性向上の取り組み
- ホルマントピーク形状のテンプレートを用いたスペクトル包絡推定(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)