HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では隠れマルコフモデル(HMM)に基づく音声合成において,目標話者の読上げスタイルの音声のみから異なる目標スタイルの音声を生成する手法を提案する.従来,読上げスタイルモデルから少量の目標スタイル音声を用いてスタイル適応を行うことにより目標スタイルの任意の文章を合成する手法が提案されているが,目標スタイルの音声が得られない場合にはこの手法を利用することはできない.提案法では,あらかじめ複数の話者により学習された読上げスタイルモデルに対し,同じ話者による目標スタイルへのスタイル変換を線形変換により表現する.これにより得られる変換行列は特定の話者に依存しない不特定話者のスタイル変換を表すため,これを目標話者の読上げスタイルモデルに適用することで目標話者の目標スタイル音声が利用できない場合についてもスタイル音声の合成が可能となる.評価実験では変換後の合成音声について話者性,スタイル再現性および自然性の3つの観点から提案法の有効性を検討する.
- 2011-12-12
著者
-
能勢 隆
東京工業大学大学院総合理工学研究科
-
能勢 隆
東京工業大学物理情報システム専攻
-
小林 隆夫
東京工業大学
-
小林 隆夫
東京工大 大学院総合理工学研究科
-
金川 裕紀
東京工業大学大学院総合理工学研究科物理情報システム専攻
-
金川 裕紀
東京工業大学 大学院総合理工学研究科 物理情報システム専攻
-
能勢 隆
東京工業大学 大学院総合理工学研究科
関連論文
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御(合成,生成,韻律,一般)
- 顔パーツを利用した隠れを含む顔の検出手法
- 適応メルケプストラム分析を利用した音声符号化とその評価
- 重回帰HSMMを用いた合成音声のスタイル制御(一般, STRAIGHTスペシャルセッション(SS))
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- D-12-118 歩行速度とテンポを考慮した歩行動作の生成(D-12. パターン認識・メディア理解, 情報・システム2)
- 重回帰HSMMに基づく合成音声のスタイル制御のための平均声からの話者適応手法(合成,生成,韻律,一般)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討 (音声)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討 (言語理解とコミュニケーション)
- HMM音声合成におけるモデル補間・適応による発話スタイルの多様化の検討(合成, 韻律, 生成, 一般)
- HMM音声合成における異なる発話スタイルの生成の検討
- D-14-13 テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討(D-14. 音声,一般セッション)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- スタイル推定に基づく音響モデルのオンライン適応手法(認識,理解,対話,一般)
- 平均声モデルを用いる合成音声の話者性とスタイルの同時多様化の検討
- 対話エージェントにおける不明確性を含む動作表現のモデル化の検討
- 対話エージェントにおける不明確性を含む動作表現のモデル化の検討(対話)
- 平均声に基づく音声合成における線形変換とMAPに基づく音響モデル学習法(一般)
- MSD-HMMに基づく音声のスタイル識別(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- MSD-HMMに基づく音声のスタイル識別(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- MSD-HMMに基づく音声のスタイル識別(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 隠れセミマルコフモデルに基づく音声合成システムのためのスタイル適応手法の評価(合成, 生成, 韻律, 一般)
- 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討(合成・生成,韻律,一般)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- 音声研究の現状と課題
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成におけるコンテキストクラスタリング決定木を用いた話者適応の検討(合成, 韻律, 生成, 一般)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計(音声言語情報処理とその応用)
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- IFスペクトログラム : 音声信号の時間周波数表現の一手法
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- RBFネットワークのハイブリッド学習アルゴリズム
- 改良DFT-MUSIC法を用いた低SNR環境における瞬時周波数の推定
- 低SNR環境下における瞬時周波数の推定
- 瞬時周波数に基づく雑音環境下でのピッチ推定
- 雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用
- F0量子化に基づく韻律コンテキストを用いたHMM音声合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- F0量子化に基づく韻律コンテキストを用いたHMM音声合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- メル一般化ケプストラム分析に基づく広帯域音声のCELP符号化の検討
- メル一般化ケプストラム分析に基づく広帯域音声のCELP符号化の検討
- 小特集にあたって(音声合成に関する研究の動向)
- 多様な音声合成のためのモデル適応・適応学習アルゴリズムの検討(合成, 生成, 韻律, 一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (信号処理)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (音声)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (応用音響)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張(音声、聴覚,学生論文)
- 強調音声合成のための局所韻律コンテキスト自動付与の検討
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討
- HMM音声合成における不特定話者スタイル変換の検討
- 強調音声合成のための局所韻律コンテキスト自動付与の検討(一般,音声知覚生成/聴覚コミュニケーション,一般)
- 言語モデルと音響モデルを利用したアクセント句境界の自動推定
- HMM音声合成におけるスペクトル特徴量の局所変動のモデル化とパラメータ生成への適用(一般セッション,福祉と音声処理,一般)
- 任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な韻律生成のための多クラス局所韻律コンテキストの検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な歌声合成のための重回帰HSMMに基づくスタイル制御法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 統計モデルに基づく音声合成における話者・スタイルの多様化(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)