平均声に基づく音声合成における線形変換とMAPに基づく音響モデル学習法(一般)

スポンサーリンク

概要

論文の詳細を見る
本論文では,平均声に基づくHMM音声合成方式において合成音声の品質の向上を目的として,線形変換とMAPの組合せ手法を導入する.この手法を用いることで,目標話者の音声データ量が増加するに従って,線形変換による近似の誤差を解消することが可能となる.また,平均声に基づく音声合成方式では,コンテキスト依存HMMを共有するパラメータ共有構造が平均声の学習に用いる音声データに応じて変化するため,学習データを増加させることで豊富なコンテキスト情報を共有構造の構築に利用し,合成音声の品質を改善できる可能性がある.そこで,本論文では平均声モデルの学習データ量と合成音声の品質との関係について調査している.これらの手法を導入して得られた合成音声の品質について主観,客観評価を行った結果,平均声方式が特定話者(SD)方式よりも自然性の高い音声を合成可能であることが示された.
社団法人電子情報通信学会の論文
2006-11-03

著者

関連論文

もっと見る

スポンサーリンク