歌声・音声分析合成のためのF0適応多重フレーム統合分析に基づくスペクトル包絡と群遅延の推定法
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、音声 (歌声及び話声) の高性能な分析と高品質な合成のために、音声信号からそのスペクトル包絡と群遅延を高い精度と時間分解能で推定する手法を、F0 適応多重フレーム統合分析と名付けて提案する。従来、スペクトル包絡推定に関する研究は数多くなされてきたが、適切な包絡の推定は依然困難な課題である。また群遅延を合成に活用する研究があったが、ピッチマークと呼ばれる時刻情報が必要であった。本研究では、まず、全時刻 (全サンプリング点) について、F0 に適応させた短い時定数の窓を用いて FFT を行い、F0 適応スペクトルを推定する。次に、分析時刻毎に近傍の複数フレームから F0 適応スペクトルと群遅延を統合して、最終的なスペクトル包絡と群遅延を得る。スペクトル包絡の推定性能は、14 種類の音サンプル中 13 サンプルにおいて、対数スペクトル距離が 2 種類の既存手法のいずれかよりも低く、8 サンプルにおいて最も低かった。また群遅延を保存して合成できることを確認した。
- 2012-08-02
著者
関連論文
- デモンストレーション : 若手による研究紹介V(音楽音響信号処理 (1))
- デモンストレーション:若手による研究紹介III(デモセッション)
- デモンストレーション : 音楽情報処理の研究紹介VI(デモセッション)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- デモンストレーション:若手による研究紹介IV
- デモンストレーション: 若手による研究紹介II
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- VocaListener2: ユーザ歌唱の音高と音量だけでなく声色変化も真似る歌声合成システムの提案
- 歌声情報処理: 歌声を対象とした音楽情報処理
- ダンス動画コンテンツを再利用して音楽に合わせた動画を自動生成するシステム
- 新博士によるパネルディスカッションII : 楽しくさせる音楽,楽しくさせる研究(パネルディスカッション)
- デモンストレーション:音楽情報処理の研究紹介IX
- 歌声情報処理の最近の研究
- 口ドラム認識手法とそのドラム譜入力システムへの応用(音楽情報)
- 口(くち)ドラムによるドラムパターン検索手法(音楽・演奏の認識合成)
- 新博士によるパネルディスカッションIII 「私のための研究・価値を生み出す研究」
- 無伴奏歌唱におけるブレスの音響特性とそれに基づく自動ブレス検出(音響分析一般(1))
- VocaListener : ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案(セッション2)
- VocaListener : ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案(セッション2)
- 楽譜情報を用いない歌唱力自動評価手法(音楽音響分析,便利で身近な音楽情報処理)
- 歌唱力向上支援システムの試作 : ピッチとビブラートに関する視覚情報提示機能
- 歌唱力評価の聴取者実験と自動評価手法の検討
- Voice Drummer : ロドラムによる楽譜入力インタフェース(デモンストレーション: 若手による研究紹介II)
- VocaListener:ユーザ歌唱の音高および音量を真似る歌声合成システム
- VocaListenerによる学習データ生成を利用した多対多固有声変換に基づく歌声声質変換
- 歌声・音声分析合成のためのF0適応多重フレーム統合分析に基づくスペクトル包絡と群遅延の推定法
- 人間の歌い方を真似る歌声合成システムVocaListenerとロボット顔動作生成システムVocaWatcher(音楽制作と情報処理の友好関係)
- 人間の歌い方を真似る歌声合成システム VocaListener とロボット顔動作生成システム VocaWatcher