テキスト及び音声からの唇動画像の自動生成
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a technique for synthesizing lip movements that synchronize with given utterances based on HMM. In the training stage of the technique, speech unit HMMs are trained with audio and visual parameter vector sequences that represent speech and mouth shapes. Then speech unit HMMS are splitted into speech and visual parameter parts. In the recognition stage, input speech is converted into a transcription and a state sequence using the speech part of the HMMs. In the synthesis stage, a sentence HMM is constructed by concatenating visual parameter part of the HMMs corresponding to the transcription for the given speech. Then an optimum parameter vector sequence in an ML sense is obtained from the sentence HMM. The generated parameter sequence reflects statistical information of both static and dynamic features, and synthetic lip animation becomes quite smooth and natural.
- 1998-06-01
著者
関連論文
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御(合成,生成,韻律,一般)
- 顔パーツを利用した隠れを含む顔の検出手法
- 適応メルケプストラム分析を利用した音声符号化とその評価
- 重回帰HSMMを用いた合成音声のスタイル制御(一般, STRAIGHTスペシャルセッション(SS))
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- D-12-118 歩行速度とテンポを考慮した歩行動作の生成(D-12. パターン認識・メディア理解, 情報・システム2)
- 重回帰HSMMに基づく合成音声のスタイル制御のための平均声からの話者適応手法(合成,生成,韻律,一般)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- HMM音声合成におけるモデル補間・適応による発話スタイルの多様化の検討(合成, 韻律, 生成, 一般)
- HMM音声合成における異なる発話スタイルの生成の検討
- D-14-13 テレビ放送音に対する音声と音楽およびその混合音の識別に関する検討(D-14. 音声,一般セッション)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- スタイル推定に基づく音響モデルのオンライン適応手法(認識,理解,対話,一般)
- 平均声モデルを用いる合成音声の話者性とスタイルの同時多様化の検討
- 対話エージェントにおける不明確性を含む動作表現のモデル化の検討
- 対話エージェントにおける不明確性を含む動作表現のモデル化の検討(対話)
- 平均声に基づく音声合成における線形変換とMAPに基づく音響モデル学習法(一般)
- 隠れセミマルコフモデルに基づく音声合成システムにおける最尤線形回帰によるスタイル適応の検討(合成・生成,韻律,一般)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- 多空間確率分布に基づくポーズのモデル化(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成における多様なスタイル実現のための制御法(音響と音声処理・音声強調,ロバスト音声認識,一般)
- HMM音声合成におけるコンテキストクラスタリング決定木を用いた話者適応の検討(合成, 韻律, 生成, 一般)
- ベイズ的アプローチに基づくHMM音声合成(合成, 韻律, 生成, 一般)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- 声道長正規化を用いた平均声モデル学習の検討(音響と音声処理,音声強調,ロバスト音声認識)
- PD-2-5 話者認証における詐称について
- 多空間上の確率分布に基づいたHMM
- 多空間上の確率分布に基づいたHMM
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- HMM音声合成におけるガンマ分布状態継続長モデルの検討
- 話者照合におけるHMM音声合成による合成音声の判別(音声言語情報処理とその応用)
- 話者照合システムにおける合成音声判別法の検討
- 話者照合システムにおける合成音声判別法の検討
- 平均声モデル構築におけるコンテキストクラスタリングと話者適応学習の検討
- 平均声モデル構築のためのコンテキストクラスタリング手法の検討
- HMMに基づく音声合成におけるピッチ・スペクトルの話者適応
- HMM音声合成におけるSATを用いた平均声モデルの学習
- HMM音声合成におけるコンテキストクラスタリング決定木の構築法の検討
- HMM音声合成における韻律の変動要因の検討
- HMM音声合成における韻律の変動要因の検討
- HMM音声合成における平均声モデルの学習データセットの検討
- HMMに基づく音声合成システムにおける音韻継続長の話者適応
- HMM音声合成に用いるコンテキストの検討
- HMM音声合成におけるMLLRを用いたピッチ・スペクトルの話者適応
- HMM 音声合成システムのためのテキスト処理部の構築
- HMM に基づく音声合成システムにおけるピッチ・スペクトルの話者適応
- HMMに基づく音声合成システムにおけるMAP-VFSを用いた音質変換
- HMMに基づく音声合成システムのためのテキスト解析の検討
- MLLRおよびMAP/VFSを用いたHMM音声合成における話者適応
- 15) テキスト及び音声からの唇動画像の自動生成(〔ヒューマンインフォメーション研究会 ネットワーク映像メディア研究会〕合同)
- 音声駆動およびテキスト・音声駆動による唇動画像の生成
- 多空間確率分布HMMによるピッチパターン生成
- 多空間上の確率分布に基づいたHMM
- 多空間上の確率分布を用いたHMMによるピッチパタン生成の検討
- 多空間上の確率分布に基づいたHMMとピッチパタンモデルへの応用
- HMMに基づいた視聴覚テキスト音声合成 : 画像ベースアプローチ(音声言語情報処理とその応用)
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成(画像符号化・通信・ストリーム技術および一般)
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 隠れマルコフモデルに基づくハンドジェスチャーアニメーション生成
- 動的特徴を用いたHMMからの音声パラメータ生成アルゴリズム
- 動的特徴を用いたHMMに基づく音声合成
- HMMに基づいた極低ビットレート音声符号化における不特定話者への対応
- 有声/無声境界の動的特徴量を考慮したピッチのモデル化
- 有声/無声境界の動的特徴量を考慮したピッチのモデル化
- 不特定話者対応HMM認識ボコーダの検討
- 瞬時周波数振幅スペクトルに基づくピッチ抽出法の検討
- 混合励振源を用いた極低ビットレート音声符号化の検討
- 対数スペクトルの任意基底関数による展開に基づく音声のスペクトル推定
- HMMに基づいた極低ビットレート音声符号化
- HMMに基づく音声合成におけるスペクトル・ピッチ・状態継続長の同時モデル化
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく話者照合システムにおける合成音声による詐称の検討
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づいた極低ビットレート音声符号化
- HMMに基づく音声合成のための状態継続長モデルの構築
- HMMに基づいた極低ビットレート音声符号化
- 対数スペクトルの任意基底関数による展開に基づいた音声のスペクトル推定とその応用
- 対数スペクトルの任意基底関数による展開に基づいた音声のスペクトル推定とその応用
- テキスト及び音声からの唇動画像の自動生成
- メルケプストラムをパラメータとするHMMに基づく音声合成
- HMMからの音声パラメータ生成アルゴリズム