F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)

スポンサーリンク

概要

論文の詳細を見る
HMM音素認識とHMM音声合成を用いた非パラレル学習に基づく声質変換手法を提案する.提案法では,音素認識と基本周波数の量子化を利用し,変換元の話者の入力音声から音素情報,音素継続長,及び基本周波数パターンの大まかな変動情報を抽出し合成部に伝達する.合成部では,伝達された各情報からコンテキスト依存ラベルを作成し,これとあらかじめ学習しておいた目標話者の多空間確率分布HMMを用いて,音声を生成する。元話者と目標話者のモデルは独立に学習することが可能であるため,元話者と目標話者が同じ文章を発話したパラレルデータを用意する必要がないという特徴がある.また音素継続長に含まれる話者性の適切な変換のため,入力音声の各音素の継続長に対して線形変換を行う.本稿では,パラレルデータが利用可能でない場合,及び継続長の変換の効果について客観及び主観評価を行い,提案手法である非パラレルデータ学習に基づく声質変換法の有効性を示す.
2009-12-14

著者

関連論文

もっと見る

スポンサーリンク