パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では,隠れセミマルコフモデル(HSMM)に基づく音声合成方式に重回帰モデルを組み込んだ重回帰HSMMを用いて,対話音声に見られる多様なパラ言語情報を制御可能な音声合成を目指す.本研究では,パラ言語情報を少数の次元から構成される空間上の座標として表現し,この空間を構成する次元を重回帰モデルの説明変数として用いる.次元には感情状態を表す一般的な指標とされている「快-不快」,「覚醒睡眠」の2つの次元を用いる.モデルの学習時には各発話に対し次元毎に主観的に評価された評価値を用いて学習し,合成時には任意の評価値を与えて任意の感情状態の音声を合成する.合成された音声の音響的特徴量から,2つの次元が合成音声に与える影響について検討する.また,合成された音声に対して3つの主観評価実験を行った.まず,自然性評価を行い,合成された音声の自然性について示した.次に,再現性評価を行い,付与した感情状態の再現性について示した.最後に,感情状態の表出について評価を行い,意図した感情状態が伝達されていることを示した.
- 2011-12-12
著者
-
能勢 隆
東京工業大学大学院総合理工学研究科
-
能勢 隆
東京工業大学物理情報システム専攻
-
森 大毅
宇都宮大学大学院工学研究科
-
永田 智洋
宇都宮大学大学院工学研究科
-
能勢 隆
東京工業大学 大学院総合理工学研究科
関連論文
- 重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御(合成,生成,韻律,一般)
- 自動誤り訂正能力を有する走査型文字入力システムの視覚フィードバック法(福祉と音声処理,一般)
- 走査型文字入力におけるスイッチ操作タイミング特性の測定とその自動誤り訂正への応用(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 走査型文字入力におけるスイッチ操作タイミング特性の測定とその自動誤り訂正への応用
- ささやき母音のフォルマント構造
- 運動障害性構音障害音声のパラメータ変換によるモノトーンな聴覚印象の機構解明
- 運動障害性構音障害症例の音響的及び知覚的性質
- 重回帰HSMMを用いた合成音声のスタイル制御(一般, STRAIGHTスペシャルセッション(SS))
- 重回帰HSMMに基づく合成音声のスタイル制御のための平均声からの話者適応手法(合成,生成,韻律,一般)
- A-19-3 走査型文字入力における不随意運動に伴う誤入力の自動キャンセル法(A-19.福祉情報工学,一般セッション)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討 (音声)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討 (言語理解とコミュニケーション)
- パラ言語情報を重視した音声対話データベースの設計
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- スタイル推定に基づく音響モデルのオンライン適応手法(認識,理解,対話,一般)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- 運動障害性構音障害症例の音響的及び知覚的性質
- F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 走査型文字入力におけるスイッチ操作タイミング特性の測定とその自動誤り訂正への応用(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 走査型文字入力におけるスイッチ操作タイミング特性の測定とその自動誤り訂正への応用(福祉と知能・情動・認知障害,福祉と音声処理,一般)
- 走査型文字入力におけるスイッチ操作タイミング特性の測定とその自動誤り訂正への応用
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 話速の変化に対する日本語の促音・長音の時間構造の分析に基づく日本語学習者の習熟度評価 : 中国語母語話者を例として
- 喉頭がんスクリーニングのためのインターネットを利用した音声の音響評価システム(システム論文特集号)
- 走査型文字入力における自動誤り訂正方式
- 対話音声のパラ言語情報ラベリングの安定性
- スキャン法に基づく文字入力の自動誤り訂正(高齢者支援/肢体不自由者支援/一般)
- 対話音声の時間構造がパラ言語情報の知覚に及ぼす影響
- F0量子化に基づく韻律コンテキストを用いたHMM音声合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- F0量子化に基づく韻律コンテキストを用いたHMM音声合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- 自動誤り訂正能力を有する走査型文字入力システムの視覚フィードバック法(福祉と音声処理,一般)
- 食道音声の声質改善の試み
- 食道音声の声質改善の試み
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (信号処理)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (音声)
- 音響類似性に基づく認識単位を用いた音声認識(音声情報処理 : 現状と将来技術論文特集)
- HMnetに基づく音響セグメントモデルを用いた連続音声認識
- Dysarthria の音響的特徴
- ソース・フォルマント型音声合成における声質変換
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価 (応用音響)
- 中国語におけるフォーカスされた単語の韻律的および分節的特徴 : 分析、合成および知覚
- 中国語におけるフォーカスされた単語の韻律的および分節的特徴 : 分析、合成および知覚
- フォーカスされた中国語単語の強勢パターンに関する研究
- コーパスベースのソース・フォルマント型テキスト音声合成システム
- J-052 日常的な対話における感情状態からの表情の生成(J分野:ヒューマンコミュニケーション&インタラクション)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 日常的な対話の談話分析に基づく話者の感情状態の推定
- 中国語二音節単語の相対F_O変化域の不変性
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- ささやき母音の自然性と母音範疇の知覚
- 複数カーソルに基づく高速な走査型文字入力方式
- 複数カーソルを用いた走査型文字入力方式の高速化
- 複数カーソルを用いた走査型文字入力方式の高速化
- HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張(音声、聴覚,学生論文)
- 自然発話の多様性を考慮した対話システム用文法の記述法
- 強調音声合成のための局所韻律コンテキスト自動付与の検討
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- A-19-2 脳血流量変化に基づく文字入力法の検討(A-19.福祉情報工学,一般セッション)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討
- HMM音声合成における不特定話者スタイル変換の検討
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討
- 韻律イベントHMMを用いた対話音声F0生成
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討
- 強調音声合成のための局所韻律コンテキスト自動付与の検討(一般,音声知覚生成/聴覚コミュニケーション,一般)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討
- HMM音声合成における不特定話者スタイル変換の検討
- 言語モデルと音響モデルを利用したアクセント句境界の自動推定
- HMM音声合成におけるスペクトル特徴量の局所変動のモデル化とパラメータ生成への適用(一般セッション,福祉と音声処理,一般)
- 脳血流量変化の統計モデルを利用した文章入力法の検討(福祉と音声処理、一般)
- 対話音声合成の自然性とパラ言語情報の可制御性に対する話者正規化学習の効果(学生ポスターセッション,音声アプリケーション,一般)
- 拍位置を考慮した和音bi-gramに基づく和声推定(学生ポスターセッション,音声アプリケーション,一般)
- 任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な韻律生成のための多クラス局所韻律コンテキストの検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な歌声合成のための重回帰HSMMに基づくスタイル制御法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 統計モデルに基づく音声合成における話者・スタイルの多様化(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)