テンソル表現に基づく任意話者声質変換に対する話者正規化学習の効果(一般セッション,福祉と音声処理,一般)
スポンサーリンク
概要
- 論文の詳細を見る
本報告ではテンソル表現に基づく任意話者声質変換における話者正規化学習の効果について検証する.声質変換の研究において,任意話者の音声を入力または出力として,変換を実現することはアプリケーション応用の観点からも重要な目的の一つである.任意話者声質変換を実現する技術として,固有声混合正規分布モデル(EV-GMM)に基づく固有声変換法(EVC)が提案されている.EVCでは多数の話者を用いて構築された話者空間表現によって,ごく少量の発声のみを用いて効率的な変換モデルの構築が可能となる.しかし,話者モデルを構築する発声を増やした場合でも必ずしも変換性能の向上がみられるわけではない.これは,GMMスーパーベクトルを用いた特徴量表現に内在する問題に起因すると考えられる.この問題に対して,先行研究において我々は,テンソル表現に基づく話者空間表現を用いた任意話者声質変換を提案し,より柔軟な話者性制御を実現した.本報告では,声質変換のさらなる性能向上のため,話者正規化学習とテンソルに基づく話者空間表現を統合する手法を提案する.提案法によってより柔軟で精緻な変換モデルの構築が可能となる.一対多声質変換の実験によって提案法における話者正規化学習の有効性を示す.
- 2012-11-01
著者
-
峯松 信明
東京大学大学院
-
広瀬 啓吉
東京大学大学院情報理工学系研究科
-
広瀬 啓吉
東大
-
齋藤 大輔
芝浦工業大学工学部電気工学科:東京工芸大学大学院工学研究科ハイパーメディア研究センター
-
齊藤 大輔
東京大学大学院情報理工学系研究科
関連論文
- 女性と判定される声の特徴 : 性同一性障害者の話声位
- 母語話者と中国語話者の日本語朗読音声の基本周波数パターンの比較
- 英語・中国語・母語話者の日本語朗読音声のF0に現れる特徴(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- 基本周波数パターン生成過程モデルに基づく日本語学習者音声の韻律の分析(一般)
- 中国語話者の日本語朗読音声の韻律的特徴と母語話者評価(聴覚・音声・言語とその障害,一般)
- 要素論から全体論へ : 全体から入る音声情報処理への招待(音響・音韻モデル)
- 孤立音[あ]を聞いて音韻/あ/と同定する能力は音声言語に必要か?(聴覚・音声/一般)
- 音声の構造的表象に基づく音声認知と外国語発音学習に対する一考察(言語の学習・教育)
- 音声の構造的表象を通して考察する失読症・自閉症の音声認知(一般)
- 音声の相対音感 : 音声と音楽の同質性に関する一考察(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)