声質空間上での変換に基づく歌声らしさの転写に関する検討

概要

論文の詳細を見る
本稿では,特定話者の声に存在する歌声らしさを抽出し,任意の話者モデルに付加することで,歌声モデルを構築する手法を提案する.近年の話声の音声合成技術の発展に伴って,歌声合成技術は飛躍的に発展しているが,コーパスベースの手法における歌声合成モデルの個人性は,そのモデルを構築するためのデータベースに大きく依拠する.一方,話者適応技術を応用することで,少量の音声データを用いて対象歌手の歌声モデルを構成することも考えられるが,その音声データのうち不要な情報も含めて適応してしまう可能性がある.本研究では,音声データに含まれる声道特性に起因する情報のうち,「歌声らしさ」のような部分的情報に着目して,それを適切に転写する手法を検討した.本研究では任意話者声質変換で用いられる重みベクトル/重み行列の特徴量空間を声質空間と捉える.この空間上で同一話者の話声及び歌声が記述され,その変換関係によってこの話者の歌声らしさが表現される.この変換を別話者の話声モデルに適用することで,歌声らしさの転写を実現する.歌声の声質変換実験を通して,提案法による歌声らしさの転写が可能であることを示した.提案法を用いることで話声と歌声のモデル・データを相互に柔軟に利用することが可能となる.
2012-08-02

声質空間上での変換に基づく歌声らしさの転写に関する検討

スポンサーリンク

概要

著者

関連論文

スポンサーリンク