HMM音声合成における共分散パラメータの共有に関する検討(ポスターセッション,第10回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本報告では隠れマルコフモデル(Hidden Markov Model; HMM)に基づく音声合成システムにおける共分散パラメータの共有について述べる.近年,音声合成システムへの需要が高まっており,HMMに基づいた音声合成システムでは音声波形の断片をそのまま利用するのではなく,音声波形の特徴をHMMによりモデル化し,HMMのモデルパラメータを合成システムに保持するため,同程度の音質の波形接続法式に比べてフットプリントが小さい利点がある.中でも組み込み向けのシステムには携帯電話,PDA,カーナビ,情報家電,ゲーム機等への用途があるが,必要なCPU,メモリ等が制限されることが多く,更なるフットプリントの縮小が必要である.HMMに基づく音声合成システムにコンテキスト依存モデルを用いることで高精度な音響モデルを構築することができ,決定木に基づくコンテキストクラスタリングを用いて状態共有構造を構築する際に,組み込み用途向けに決定木のサイズを小さくすることも考えられるが,音質が劣化する.本報告では,平均に比べて共分散が音質に与える影響が小さいことに注目し,全てのパラメータの共分散を共有する手法を提案する.このパラメータ共有を仮定した上でのコンテキストクラスタリングを行い,主観評価実験により,パラメータ数を大幅に削減するのみならず,若干の品質改善を達成した.
- 一般社団法人情報処理学会の論文
- 2008-12-02
著者
-
徳田 恵一
名古屋工業大学大学院
-
李 晃伸
名古屋工業大学大学院工学研究科創生シミュレーション工学専攻
-
大浦 圭一郎
名古屋工業大学
-
全 炳河
東芝欧州研究所
-
全 炳河
名古屋工業大学
-
李 晃伸
名古屋工業大学
-
南角 吉彦
名古屋工業大学 情報工学専攻
-
徳田 恵一
名古屋工業大学
-
李晃伸
名古屋工業大学大学院情報工学専攻
-
南角 吉彦
名古屋工業大学大学院 工学研究科
-
南角 吉彦
名古屋工業大学大学院工学研究科創成シミュレーション工学専攻
-
季 晃伸
京大
-
南角 吉彦
名古屋工業大学
-
南角 吉彦
名古屋工業大学大学院工学研究科
関連論文
- 拡張分離型格子HMMに基づく顔画像認識 (ヒューマン情報処理)
- 拡張分離型格子HMMに基づく顔画像認識 (パターン認識・メディア理解)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- 第1回 HTSを用いた音声合成システムの構築
- 状態継続長を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4,コンピュータビジョンとパターン認識のための学習理論)
- 回転変動を考慮した分離型2次元格子HMMによる顔画像認識(テーマ関連セッション4)
- 声質変換のためのスペクトル・F_0の同時モデリング(一般(ポスターセッション),第9回音声言語シンポジウム)