HMMに基づく音声合成のための状態継続長モデルの構築
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, HMMに基づく音声合成のための状態継続長モデルの構築法について述べる.音素HMMの各状態の状態継続長は1次元のガウス分布でモデル化し, 一つの音素HMMの全状態の状態継続長分布をまとめて一つの多次元のガウス分布として状態継続長モデルとする.状態継続長モデルは, 状態継続長に影響を与える要因を考慮して, 決定木によるコンテキストクラスタリングによりクラスタリングする.音声合成時には, 状態継続長モデルから尤度最大化基準により状態継続長を決定し, それに従いHMMからスペクトル列を生成する.予備実験において先行・当該・後続音素のみを考慮した状態継続長モデルでも, 自然のタイミングに近い合成音声を得ることができることを既に確認している.本論文では, さらにアクセント型, 構文情報のような状態継続長に影響を与える他の変動要因も考慮した実験を行った.
- 1998-09-11
著者
-
吉村 貴克
(株)豊田中央研究所
-
北村 正
名古屋工業大学
-
益子 貴史
東京工業大学大学院総合理工学研究科
-
吉村 貴克
名古屋工業大学知能情報システム学科
-
徳田 恵一
名古屋工業大学
-
小林 隆夫
東京工業大学
関連論文
- A-15-1 コード進行を用いた楽曲のモデル化と楽曲間の類似度に関する研究(A-15.ヒューマン情報処理,一般セッション)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- カラー成分間の相関を利用したカラー画像符号化手法の一検討
- 色変換によるカラー画像の符号化効率改善に関する一検討
- A-15-2 クラシック音楽を対象としたGMMに基づく感性モデルに関する研究(A-15.ヒューマン情報処理,一般セッション)
- HMM音声合成に基づく音声認識率予測手法
- HMMに基づく人物や動作の多様性を考慮した手話認識手法(聴覚障害者支援ほか,福祉情報工学一般,地域におけるITサポート(シンポジウムテーマ))
- MSD-HMMによる隠れ領域を考慮した手話動作のモデル化
- HMM音声合成に基づく音声認識性能予測手法
- HMMを用いた手話単語を構成するサブユニットの自動生成手法
- A-4-18 Total Variationフィルタを用いた異常環境電磁波の検出(A-4.信号処理,一般セッション)
- A-10-3 相互相関関数を用いた混合音の音高・楽器推定(A-10.応用音響,一般セッション)
- A-1-14 高次ΔΣ変調 A-D 変換器に用いるループフィルタの一設計法
- A-4-28 HMMに基づく日本手話認識のための特徴の統合に関する検討(A-4.信号処理,基礎・境界)
- D-12-121 日本手話認識に用いる特徴量の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-29 アクティブ画像探索法を用いたHMMジェスチャー認識の特徴量抽出の検討(D-12. パターン認識・メディア理解, 情報・システム2)
- D-12-117 情報量基準に基づいたHMMジェスチャー認識の状態数の検討(D-12. パターン認識・メディア理解B)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- 韻律生成HMMのための学習データ作成ツール
- HMMに基づいた波形接続型音声合成方式の検討
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMMに基づく音声合成における品質改善に関する検討
- 固有声に基づく音声合成におけるピッチのモデル化
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- 固有声に基づいた triphone による音声合成
- HMM に基づく音声合成のための励振源モデルの検討
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- HMMに基づく音声合成システムの自動構築
- HMMに基づく音声合成のための話者補間
- 尤度最大化基準によるHMMからの音声パラメータ生成法の評価
- HMMに基づくピッチパターン生成における動的特徴量の効果
- 隣接ブロックを用いたDCT領域での高解像度化手法の高速化に関する一検討
- 高圧縮静止画像の高画質化に関する研究(研究速報,圧縮画像の画質改善,画像符号化・映像メディア処理)
- A-4-24 環境電磁波観測回路に用いるタイミング同期回路の開発(A-4.信号処理,一般講演)
- 逆ウェーブレット変換を用いた動画像高画質化に関する一検討
- 隣接ブロックを用いたDCT領域での解像度変換の高速化
- ケプストラム分析による大域・局所モデルを用いた異常環境電磁波の検出に関する一検討
- A-4-16 ケプストラム分析を用いた異常環境電磁波の検出(A-4.信号処理,一般講演)
- A-4-5 基本動作HMMに基づく手話単語認識手法(A-4.信号処理,一般講演)
- J_010 ウェーブレット変換を用いた動画像のブロックひずみ低減手法(J分野:グラフィクス・画像)
- A-4-6 隣接ブロックを用いたDCT係数上での解像度変換の有理数倍率への拡張に関する一検討(A-4.信号処理,一般講演)
- 逆ウェーブレット変換によるブロックひずみ低減手法
- 隣接ブロックを用いたDCT係数上での解像度変換
- JPEG・MPEGにおけるブロックひずみ低減手法の一検討
- ケプストラムに基づく雑音下のピッチ抽出法の改善
- 音声の動的特徴と付加雑音を用いる雑音下での単語音声認識
- ケプストラム合成音声の品質改善の一方法
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(ポスターセッション)(第5回音声言語シンポジウム)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(第5回音声言語シンポジウム : ポスターセッション)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造(第5回音声言語シンポジウム : ポスターセッション)
- 混合因子分析に基づく話者識別モデルのパラメータ共有構造
- パラメータ共有HMMに基づく音響信号からの自動和音認識の検討
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定
- 楽譜を考慮した演奏者の統計的モデル化手法の改善と演奏者識別による評価
- 単旋律のパート分配によるアンサンブルのための自動編曲手法
- ウェーブレットパケット交換による適応信号処理
- 楽譜情報のコンテキストクラスタリングに基づく演奏者のモデリング手法
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- HMMを用いた日変動パターンに基づく環境電磁波のモデル化と異常検出(信号処理,知的マルチメディアシステム,一般)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- 変分ベイズ法に基づく声質変換(音声合成・韻律,第9回音声言語シンポジウム)
- D-14-4 骨導音声を用いたGMMに基づく話者識別(D-14.音声,一般セッション)
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定 (音声)
- 視聴覚情報を用いた意図推定の為の決定木に基づく意図境界推定 (言語理解とコミュニケーション)
- A-4-29 HMMを用いた日平均情報に基づく環境電磁波の異常放射検出(A-4.信号処理,一般セッション)
- A-4-30 GMMを用いたケプストラムの日平均情報に基づく環境電磁波の分析(A-4.信号処理,一般セッション)
- A-10-3 GMMに基づく演奏者の音楽的逸脱のモデル化(A-10.応用音響,一般セッション)
- D-12-51 雑音の影響による音声と画像のずれをモデル化したバイモーダル大語彙連続音声認識(D-12.パターン認識・メディア理解A(パターンメディアの認識・理解・生成),一般セッション)
- ベイズ的アプローチに基づくHMM音声合成(合成, 韻律, 生成, 一般)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- 日本手話の音韻構造を考慮したHMMに基づく手話認識(一般セッション,福祉と見守りのための画像・音声処理)
- H-028 GMMを用いた環境電磁波の異常検出と地震のエネルギーとの相関(画像認識・メディア理解,一般論文)
- AS-2-10 SOM上の環境電磁波の特徴(AS-2.電磁波地震予知における信号処理の新展開、評価技術,シンポジウム)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(ポスターセッション)(第5回音声言語シンポジウム)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(第5回音声言語シンポジウム : ポスターセッション)
- 認識時に非観測な変動要因を考慮可能な音響モデリング(第5回音声言語シンポジウム : ポスターセッション)
- 認識時に非観測な変動要因を考慮可能な音響モデリング
- 2次元メルケプストラムとCombNET-IIを用いる話者認識 : StemNETによる認識
- 決定木に基づく音素コンテクスト・次元・状態位置の同時クラスタリングによる音響モデリング(音声,聴覚)
- D-12-119 手の動作と形状を用いたHMM手話認識(D-12. パターン認識・メディア理解B)
- A-4-23 手座標追跡によるジェスチャー認識
- I-21 ジェスチャーを用いた個人識別におけるPCAの次元数の検討(人物姿勢推定・ジェスチャ認識,I.画像認識・メディア理解)
- CombNET-IIによる中国語1000単語音声認識
- E-037 コード進行クラスタリングによる楽曲のモデル化と楽曲間類似度の評価(自然言語・音声・音楽,一般論文)
- D-12-124 手話単語認識のためのサブユニットHMMの自動生成(D-12.パターン認識・メディア理解B(コンピュータビジョンとコンピュータグラフィックス),一般セッション)
- A-10-4 環境電磁波のケプストラムを用いたベクトル量子化 : コードワードの解析(A-10.応用音響,一般セッション)
- K-019 手話単語を構成するためのサブユニットHMMの自動生成(教育工学・福祉工学・マルチメディア応用,一般論文)
- HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化
- HMMに基づく音声合成のためのスペクトラム, ピッチ, 状態継続長のモデル化
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づく音声合成システムにおける話者補間