別話者音素による部分置換音声の自然性とスペクトル特徴量について(聴覚・音声・言語とその障害,一般)

スポンサーリンク

概要

論文の詳細を見る
波形接続型音声合成に複数話者の音声データを併用できれば,データベースの不足を補うことができ,有用であると考えられる.その基礎調査として,特定話者の音声中の音素を他話者の音素で代用できるかを調べるため,連続音声中の/CVC/環境の母音または長母音を他話者24名の同音素で置換し,音質の自然性を評価した.その結果,24名中の特定の3名で特に自然性が高く,その他の話者についても,置換箇所の音素時間長が短いか平均F0が低ければ自然性が高い傾向があった.さらに,実験から得られた評価値とスペクトルの関係を検討した結果,評価値と相関のある周波数帯域は主に3つに分かれること,スペクトルの包絡のpeakまたはdipと評価値との関係性が示唆された.
社団法人電子情報通信学会の論文
2008-03-13

著者

関連論文

もっと見る

スポンサーリンク