構造的表象からの音声合成とそれに基づく音声模倣に関する検討(音声生成・知覚,聴覚心理,音声学・音韻論,一般)

概要

論文の詳細を見る
音声は年齢,性別,声道長や音響機器などの非言語的特徴によって変形し,多様性に富んでいる.筆者らはこれまでに,これらの非言語性の変形におよそ不変な音声の構造的・抽象的表象を提案してきた.この表象は音声の動きのみに着眼した物理表象である.先行研究において,音声の構造的表象に基づく音声合成の枠組みを提案し,その基礎的検討を行ってきた.提案する枠組みでは音声発話を発話内容(語形)と発話者の身体性に分離して捉え,生成に際しては語形に発話者の身体性を付与する事で音声合成を実現する.これは,幼児の音声模倣に対応する音声合成のモデルといえる.本稿では提案する枠組みと幼児の音声模倣の対応について考察し,加えて解析的手法を導入する事で,初期検討における音響空間の全探索と比べて,技術的な改善を試みた.連続音声を対象とした音声合成実験を行い,主観評価実験の結果から提案手法において,少ない初期条件によって合成対象の話者性を持った音声が得られることを確認した.
社団法人電子情報通信学会の論文
2008-06-20