不特定話者対応HMM認識ボコーダの検討
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, HMMを用いた音声認識, 音声合成に基づく極低ビットレート音声符号化方式であるHMM認識ボコーダにおける不特定話者への対応手法について検討する.我々はこれまでに, 入力音声の話者性を表す情報である移動ベクトルを求めて伝送し, 復号化器で用いるHMMを入力音声へ適応することにより, 入力音声の声質を再現する手法を提案している.しかし, 従来法では移動ベクトルを求める際に復号化器でスペクトルパラメータの生成に用いられるHMMと入力音声との間で定義される評価関数を用いており, 生成パラメータ列と入力パラメータ列との直接的な評価関数とはなっていなかった.そこで本論文では, 生成パラメータ列と入力パラメータ列との間で二乗誤差最小基準または最尤基準に基づいて定義される評価関数を導入し, 新たな移動ベクトルの計算法を提案する.主観評価実験により, 提案手法で移動ベクトルを100bit/s程度となるように量子化した場合に入力話者の音声データで学習した特定話者モデルと同等の音質となることを示した.
- 2001-07-19
著者
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 第1回 HTSを用いた音声合成システムの構築
- 状態継続長を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- HMM音声合成に基づく音声認識率予測手法
- 音声合成研究も協調と競争の時代に : The Blizzard Challenge
- Blizzard Challenge 2005に向けたHMM音声合成システム((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- Eurospeech99, IEEE MMSP99会議報告
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 状態継続長を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4)
- 信頼度基準による解探索打ち切りに基づく超早音声認識
- D-12-29 アクティブ画像探索法を用いたHMMジェスチャー認識の特徴量抽出の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-117 情報量基準に基づいたHMMジェスチャー認識の状態数の検討(D-12. パターン認識・メディア理解B)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- 韻律生成HMMのための学習データ作成ツール
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- A-4-5 基本動作HMMに基づく手話単語認識手法(A-4.信号処理,一般講演)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)
- 拡張分離型格子HMMに基づく顔画像認識(テーマ発表,顔・人物・ジェスチャの認識・理解)
- HMM音声合成におけるモデル補間・適応による発話スタイルの多様化の検討(合成, 韻律, 生成, 一般)
- HMM音声合成における異なる発話スタイルの生成の検討
- 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討(合成・生成,韻律,一般)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 複数の音素決定木構造を含む統計モデルに基づく音声認識(ポスターセッション,第10回音声言語シンポジウム)
- HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
- 変分ベイズ法を用いたGMMに基づく話者認識(ポスターセッション,第10回音声言語シンポジウム)
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成におけるコンテキストクラスタリング決定木を用いた話者適応の検討(合成, 韻律, 生成, 一般)
- ベイズ的アプローチに基づくHMM音声合成(合成, 韻律, 生成, 一般)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- PD-2-5 話者認証における詐称について
- 多空間上の確率分布に基づいたHMM
- 多空間上の確率分布に基づいたHMM
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- 話者照合におけるHMM音声合成による合成音声の判別(音声言語情報処理とその応用)
- 話者照合システムにおける合成音声判別法の検討
- 話者照合システムにおける合成音声判別法の検討
- 平均声モデル構築におけるコンテキストクラスタリングと話者適応学習の検討
- 平均声モデル構築のためのコンテキストクラスタリング手法の検討
- HMMに基づく音声合成におけるピッチ・スペクトルの話者適応
- HMM音声合成における韻律の変動要因の検討
- HMM音声合成における韻律の変動要因の検討
- HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応
- HMMに基づく音声合成システムにおけるMAP-VFSを用いた音質変換
- 多空間確率分布HMMによるピッチパターン生成
- 多空間上の確率分布に基づいたHMM
- 多空間上の確率分布を用いたHMMによるピッチパタン生成の検討
- 多空間上の確率分布に基づいたHMMとピッチパタンモデルへの応用
- HMMに基づいた視聴覚テキスト音声合成 : 画像ベースアプローチ(音声言語情報処理とその応用)
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成(画像符号化・通信・ストリーム技術および一般)
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム
- 動的特徴を用いたHMMに基づく音声合成
- HMMに基づいた極低ビットレート音声符号化における不特定話者への対応
- 有声/無声境界の動的特徴量を考慮したピッチのモデル化
- 有声/無声境界の動的特徴量を考慮したピッチのモデル化
- 不特定話者対応HMM認識ボコーダの検討
- 瞬時周波数振幅スペクトルに基づくピッチ抽出法の検討
- 混合励振源を用いた極低ビットレート音声符号化の検討
- 対数スペクトルの任意基底関数による展開に基づく音声のスペクトル推定
- HMMに基づいた極低ビットレート音声符号化
- HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づいた極低ビットレート音声符号化
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づいた極低ビットレート音声符号化
- 対数スペクトルの任意基底関数による展開に基づいた音声のスペクトル推定とその応用
- 対数スペクトルの任意基底関数による展開に基づいた音声のスペクトル推定とその応用
- テキスト及び音声からの唇動画像の自動生成
- メルケプストラムをパラメータとするHMMに基づく音声合成
- HMMからの音声パラメータ生成アルゴリズム