話者選択と移動ベクトル場平滑化を用いた声質変換における写像元話者の選択方法
スポンサーリンク
概要
- 論文の詳細を見る
話者選択と移動ベクトル場平滑化法(VFS: Vector Field Smoothing method)を用いた声質変換のためのスペクトル写像法(以下, SSVFSと略記)における写像元話者の選択方法を提案した.SSVFSでは, まず話者選択により, 複数話者の音声データベースの中から1名の話者を写像元話者として選択し, 次に選択話者空間から目標話者空間へのスペクトル写像をVFSによって行う.筆者らはこれまでに, SSVFSにより1単語程度の少ない学習データでもデータベース音声を目標話者音声に近づけられることを示した.しかし, 従来のSSVFSでは, 話者選択の尺度として学習音声のケプストラム距離最小基準を用いており, この尺度はスペクトル空間の写像に用いているVFSのアルゴリズムに対する適/不適を特に考慮したものではなかった.そのため, 話者によって写像精度に差が生じる原因ともなっていた.VFSは, 話者間の移動ベクトルによって写像を行う手法であるため, 移動ベクトル場の構造が単純なほど, 写像に効果がある.本論文では移動ベクトルの向きのばらつきによって移動ベクトル場の構造を表現できるものとしてとらえ, VFSのアルゴリズムに適した話者を選択するための尺度として, 移動ベクトルの向きのばらつきを反映した尺度を提案した.従来尺度との比較を行った結果, 提案尺度の方が写像精度との相関が強いことが示され, 提案尺度が話者に対するロバスト性の向上に有効であることが明らかになった.
- 社団法人電子情報通信学会の論文
- 1998-02-25
著者
-
橋本 誠
Atr音声翻訳通信研究所:現在 三洋電機株式会社
-
樋口 宜男
Atr音声翻訳通信研究所
-
樋口 宜男
(株)エイ・ティ・アール音声翻訳通信研究所:(現)国際電信電話株式会社
-
樋口 宜男
Atr音声翻訳通信研
-
橋本 誠
Atr音声翻訳通信研究所:(現)三洋電機(株)
関連論文
- 話者選択とVFSを用いたスペクトル写像のための学習データ決定法
- 韻律ラベリングシステムJ_ToBIのラベル情報を用いた重畳型基本周波数制御モデルパラメータの自動抽出
- 韻律ラベリング・システムJ_ToBIを用いた基本周波数制御規則の自動抽出
- 波形接続型音声合成システムCHATRの基本周波数に関する音素単位選択規準の改良
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- 複数話者の音声データベースから自動生成されたF_0制御規則の分析
- 臨界制動モデルパラメータの分布特性を用いたフレーズ境界の自動推定のための尺度の検討
- 統計的手法を用いた基本周波数パタン制御指令の自動分類
- 話者選択と移動ベクトル場平滑化を用いた声質変換における写像元話者の選択方法
- 雑音環境下における音声の個人性知覚の分析
- 話者選択と移動ベクトル場平滑化による声質変換のためのスペクトル写像
- 音声の個人性知覚に影響を及ぼす音響的特徴の分析
- 音声の個人性知覚における既知話者/未知話者の影響
- SSVFSを用いた発話特徴模擬システムの構築とSSVFSにおける写像元話者設定法の検討
- 音素内最適経路探索を用いた単位接続型音声合成方式
- 個人性の判別に影響を及ぼす音響的特徴の分析
- 話者選択と移動ベクトル場平滑化を用いた声質変換のためのスペクトル写像
- 話者選択と移動ベクトル場平滑化を用いたスペクトル写像による声質変換の検討
- 個人性の知覚に影響を及ぼす音響的特徴の分析
- Complex RBFネットワークを用いた音声変換方法
- 逆フィルタ波形の勾配を用いた音声波形の極性の検出
- STRAIGHTを用いたCHATRの韻律制御
- 日本人の姓のアクセント型推定
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 音素内最適経路探索を用いた可変長単位接続音声合成方式
- 確率文脈自由文法を用いた韻律句境界とポーズ位置の予測
- 確率文脈自由文法を用いた韻律句境界の推定
- 音声の個人性知覚に影響を及ぼす音響的特徴の定量的分析