話者選択と移動ベクトル場平滑化による声質変換のためのスペクトル写像
スポンサーリンク
概要
- 論文の詳細を見る
データベースの音声を少量学習データで入力話者音声 (目標話者音声) に変換する声質変換のためのスペクトル写像法を提案した. 本方式では, 話者選択により複数話者の音声データベースの中から入力話者に近い話者をスペクトル距離最小規準により1名選択し, 選択話者空間から入力話者空間へのスペクトル写像を移動ベクトル場平滑化法 (VFS : Vector Field Smoothing method) によって行う. 1単語 / uchiawase / のみで学習し, 別の50単語で写像を行った場合の変換音声と目標話者音声とのケプストラム距離の変化を調べた結果, 平均で約25%, 最大で約41%減少することが明らかとなり, 有効性が示された. 更に, ABX聴取実験による主観評価実験を行った結果, 約66%の割合で変換音声が選択話者より目標話者に近いと認められた. また, 最適学習データ決定過程のモデル化のために, 学習の度合を示す学習量を評価尺度としてとらえ, VFSの学習過程を考慮した学習量の定義付けを行った場合と, 考慮しない定義付けを行った場合について, 写像精度との相関を調べた. その結果, VFSの学習過程を考慮した場合には比較的強い相関が見られることが明らかになり, VFS学習過程を考慮したモデルにより最適学習データの決定が可能であることが示された.
- 社団法人電子情報通信学会の論文
- 1997-01-25
著者
-
橋本 誠
Atr音声翻訳通信研究所:現在 三洋電機株式会社
-
樋口 宜男
Atr音声翻訳通信研究所
-
樋口 宜男
(株)エイ・ティ・アール音声翻訳通信研究所:(現)国際電信電話株式会社
-
樋口 宜男
Atr音声翻訳通信研
-
橋本 誠
Atr音声翻訳通信研究所:(現)三洋電機(株)
関連論文
- 話者選択とVFSを用いたスペクトル写像のための学習データ決定法
- 韻律ラベリングシステムJ_ToBIのラベル情報を用いた重畳型基本周波数制御モデルパラメータの自動抽出
- 韻律ラベリング・システムJ_ToBIを用いた基本周波数制御規則の自動抽出
- 波形接続型音声合成システムCHATRの基本周波数に関する音素単位選択規準の改良
- 韻律制御パラメータ数を考慮した評価尺度に基づく韻律句境界の自動検出
- 統計的手法を用いた基本周波数制御規則の自動抽出
- 複数話者の音声データベースから自動生成されたF_0制御規則の分析
- 臨界制動モデルパラメータの分布特性を用いたフレーズ境界の自動推定のための尺度の検討
- 統計的手法を用いた基本周波数パタン制御指令の自動分類
- 話者選択と移動ベクトル場平滑化を用いた声質変換における写像元話者の選択方法
- 雑音環境下における音声の個人性知覚の分析
- 話者選択と移動ベクトル場平滑化による声質変換のためのスペクトル写像
- 音声の個人性知覚に影響を及ぼす音響的特徴の分析
- 音声の個人性知覚における既知話者/未知話者の影響
- SSVFSを用いた発話特徴模擬システムの構築とSSVFSにおける写像元話者設定法の検討
- 音素内最適経路探索を用いた単位接続型音声合成方式
- 個人性の判別に影響を及ぼす音響的特徴の分析
- 話者選択と移動ベクトル場平滑化を用いた声質変換のためのスペクトル写像
- 話者選択と移動ベクトル場平滑化を用いたスペクトル写像による声質変換の検討
- 個人性の知覚に影響を及ぼす音響的特徴の分析
- Complex RBFネットワークを用いた音声変換方法
- 逆フィルタ波形の勾配を用いた音声波形の極性の検出
- STRAIGHTを用いたCHATRの韻律制御
- 日本人の姓のアクセント型推定
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 音素内最適経路探索を用いた可変長単位接続音声合成方式
- 確率文脈自由文法を用いた韻律句境界とポーズ位置の予測
- 確率文脈自由文法を用いた韻律句境界の推定
- 音声の個人性知覚に影響を及ぼす音響的特徴の定量的分析