話者選択と移動ベクトル場平滑化を用いた声質変換のためのスペクトル写像
スポンサーリンク
概要
- 論文の詳細を見る
本稿では、話者選択と移動ベクトル場平滑化(VFS: Vector Field Smoothing method)による、声質変換を目的としたスペクトル写像法(SSVFS: spectral mapping using Speaker Selection and VFS)を提案した。本手法は、予め複数登録話者の音声データを準備しておき、次の3つのステップによりスペクトルの写像を行なう。(1)話者選択により、目標話者に最も近い登録話者を1名選択し、(2)VFSにより、選択された話者のスペクトルコードブックから目標話者空間への移動ベクトルを求め、(3)移動ベクトルを用いて、選択話者から目標話者へ、任意の発話内容のスペクトル写像を行なう。話者選択を用いることにより、比較的距離の近い話者間で写像が行なえるため写像による誤差を抑えることができ、またVFSを用いることにより、少ない学習データでスペクトル写像を行なうことが可能となる。本手法を、1単語のみの学習により、目標話者を男女各4名、評価音声を50単語として平均ケプストラム距離で評価した。また、目標話者男女各1名に対する聴取実験による評価も行なった。実験の結果、(1)変換音声と目標話者音声との平均ケプストラム距離は、選択話者音声と目標話者音声との距離よりも減少すること(全目標話者平均減少率:約24.5%、最大減少率:約40.7%)、(2)約66%の割合で変換音声が選択話者音声より目標話者音声に似ていると判定され、VFSを用いない場合より高い判定率を得ること、が明らかとなり、本手法の有効性が示された。
- 社団法人電子情報通信学会の論文
- 1995-05-18
著者
-
橋本 誠
Atr音声翻訳通信研究所:現在 三洋電機株式会社
-
樋口 宜男
Atr音声翻訳通信研究所
-
樋口 宜男
(株)エイ・ティ・アール音声翻訳通信研究所:(現)国際電信電話株式会社
-
樋口 宜男
Atr音声翻訳通信研
-
橋本 誠
Atr音声翻訳通信研究所:(現)三洋電機(株)
関連論文
- 話者選択とVFSを用いたスペクトル写像のための学習データ決定法
- 韻律ラベリングシステムJ_ToBIのラベル情報を用いた重畳型基本周波数制御モデルパラメータの自動抽出
- 韻律ラベリング・システムJ_ToBIを用いた基本周波数制御規則の自動抽出
- 波形接続型音声合成システムCHATRの基本周波数に関する音素単位選択規準の改良
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- 複数話者の音声データベースから自動生成されたF_0制御規則の分析
- 臨界制動モデルパラメータの分布特性を用いたフレーズ境界の自動推定のための尺度の検討
- 統計的手法を用いた基本周波数パタン制御指令の自動分類
- 話者選択と移動ベクトル場平滑化を用いた声質変換における写像元話者の選択方法
- 雑音環境下における音声の個人性知覚の分析
- 話者選択と移動ベクトル場平滑化による声質変換のためのスペクトル写像
- 音声の個人性知覚に影響を及ぼす音響的特徴の分析
- 音声の個人性知覚における既知話者/未知話者の影響
- SSVFSを用いた発話特徴模擬システムの構築とSSVFSにおける写像元話者設定法の検討
- 音素内最適経路探索を用いた単位接続型音声合成方式
- 個人性の判別に影響を及ぼす音響的特徴の分析
- 話者選択と移動ベクトル場平滑化を用いた声質変換のためのスペクトル写像
- 話者選択と移動ベクトル場平滑化を用いたスペクトル写像による声質変換の検討
- 個人性の知覚に影響を及ぼす音響的特徴の分析
- Complex RBFネットワークを用いた音声変換方法
- 逆フィルタ波形の勾配を用いた音声波形の極性の検出
- STRAIGHTを用いたCHATRの韻律制御
- 日本人の姓のアクセント型推定
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 音素内最適経路探索を用いた可変長単位接続音声合成方式
- 確率文脈自由文法を用いた韻律句境界とポーズ位置の予測
- 確率文脈自由文法を用いた韻律句境界の推定
- 音声の個人性知覚に影響を及ぼす音響的特徴の定量的分析