言語モデルと音響モデルを利用したアクセント句境界の自動推定
スポンサーリンク
概要
- 論文の詳細を見る
テキスト音声合成システムの構築にはアクセント情報に関する韻律情報ラベルが付与された音声データが必要不可欠であるが,アクセント情報の付与は主に人手で行われており高コストである.そこで本研究では,音声データの自動ラベリングを目的としたアクセント句の境界推定手法を提案する.提案手法では,音声を書き起こしたテキスト情報だけでなく,音声から得られる F0 などの音響特徴量を使用する.アクセント句境界モデルおよびアクセント型モデルといった言語モデルには条件付き確率場 (CRF) を,そして音響モデルに隠れマルコフモデル (HMM) を使用し,それらを組み合わせてアクセント句の境界を推定する.本稿では,読み上げ音声に対するアクセント句境界推定実験を行い,従来法に比べ推定精度が向上することを示した.
- 2013-12-12
著者
-
能勢 隆
東京工業大学物理情報システム専攻
-
篠崎 隆宏
東京工業大学
-
小林 隆夫
東京工業大学
-
能勢 隆
東北大学大学院工学研究科
-
鈴木 啓史
東京工業大学大学院総合理工学研究科
-
郡山 智樹
東京工業大学大学院総合理工学研究科
-
篠崎 隆宏
東京工業大学大学院総合理工学研究科
関連論文
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 電子楽器用波形符号化方式の検討
- 重回帰HMMに基づく自然発話音声の発話様式識別(発音評価,認識,理解,対話,一般)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 平均声からの話者適応手法を用いた重回帰HSMMに基づく合成音声の声質制御(合成,生成,韻律,一般)
- F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 高精度音声認識のための教師なしクロスバリデーションおよび集合適応法の提案(認識)
- 顔パーツを利用した隠れを含む顔の検出手法
- 適応メルケプストラム分析を利用した音声符号化とその評価
- 重回帰HSMMを用いた合成音声のスタイル制御(一般, STRAIGHTスペシャルセッション(SS))
- アンサンブル学習に基づく音韻継続長のモデル化(合成, 生成, 韻律, 一般)
- D-12-118 歩行速度とテンポを考慮した歩行動作の生成(D-12. パターン認識・メディア理解, 情報・システム2)
- 重回帰HSMMに基づく合成音声のスタイル制御のための平均声からの話者適応手法(合成,生成,韻律,一般)
- HMMに基づくテキスト音声合成への混合励振源モデルとポストフィルタの導入(音声,聴覚)
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- マルチモーダルコミュニケーションのための音声合成プラットホーム
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMM音声合成におけるスペクトル・ピッチへの固有声手法の適用
- HMMに基づく音声合成への混合励振源モデルとポストフィルタの導入
- HMMに基づく音声合成におけるスペクトル・ピッチ・継続長の同時モデル化(音声情報処理 : 現状と将来技術論文特集)
- 年齢推定のための音声特徴量および推定器の検討(音声・言語・音響教育,一般)
- HMM音声合成におけるモデル補間・適応による発話スタイルの多様化の検討(合成, 韻律, 生成, 一般)
- HMM音声合成における異なる発話スタイルの生成の検討
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- 重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法(音声認識・音響モデル,第10回音声言語シンポジウム)
- スタイル推定に基づく音響モデルのオンライン適応手法(認識,理解,対話,一般)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- F0量子化と非パラレル学習に基づく声質変換の評価(テーマセッション,クロスモーダル)
- 最適な最小値独立置換族の構成
- F0量子化と非パラレル学習に基づく声質変換の検討(一般(ポスターセッション),第11回音声言語シンポジウム)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- A Polynomial Time Sampling Algorithm for an Optimal Family of Min-Wise Independent Permutations (Models of Computation and Algorithms)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 平均声に基づく対話音声合成に関する検討(テーマセッション,クロスモーダル)
- 音声の有無による違いを考慮したHome video簡易編集
- F0量子化に基づく韻律コンテキストを用いたHMM音声合成(一般(ポスターセッション),第11回音声言語シンポジウム)
- ICASSP2007報告(研究動向を探るセッション)
- 頑健なパラメタ推定のためのクロスバリデーションEM法の提案(第8回音声言語シンポジウム)
- 頑健なパラメタ推定のためのクロスバリデーションEM法の提案(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 頑健なパラメタ推定のためのクロスバリデーションEM法の提案(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 頑健なパラメタ推定のためのクロスバリデーションEM法の提案
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(耐雑音)(第5回音声言語シンポジウム)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 話し言葉音声の認識を目指して
- 話し言葉音声の認識を目指して
- 話し言葉音声の認識を目指して
- HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討
- 頑健なパラメタ推定のためのAggregated EM法の提案と評価(特徴量・音響モデル,第9回音声言語シンポジウム)
- 話し言葉コーパスを用いた音声認識の検討
- 効率的なクロスバリデーションに基づく混合ガウス分布の最適化法とその拡張(音響モデル)
- 音響モデルのアンサンブル学習
- 効率的なクロスバリデーション尤度評価に基づく混合ガウス分布の最適化(音響・音韻モデル)
- 発話速度変動を考慮した隠れモードHMMによる音声のモデル化 : 音声認識におけるベイジアンネットの応用(聴覚・音声/一般)
- 言語モデルのバッチ型教師なし適応化法
- 言語モデルのバッチ型教師なし適応化法
- 純粋関数型言語を用いた超コンパクト音声認識デコーダの開発
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 極低ビットレートボコーダのためのHMMに基づくF0符号化法の検討(一般(ポスターセッション),第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 言語モデルのバッチ型教師なし適応化法
- 日本語話し言葉コーパスを用いた講演音声認識(音声言語情報処理とその応用)
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 話し言葉音声認識における話者間の認識率変動要因の解析
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価(一般,音声・音響信号処理,音声及び一般)
- 軽量な画像特徴量を用いたマルチモーダル音声認識(音声、聴覚,学生論文)
- HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張(音声、聴覚,学生論文)
- 強調音声合成のための局所韻律コンテキスト自動付与の検討
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- 韻律イベントHMMを用いた対話音声F0生成(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- パラ言語情報を表現可能な対話音声合成のための重回帰HSMMの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成のための動的特徴量を用いた音素継続長モデリングの検討(音声合成,第13回音声言語シンポジウム)
- HMM音声合成における不特定話者スタイル変換の検討
- 強調音声合成のための局所韻律コンテキスト自動付与の検討(一般,音声知覚生成/聴覚コミュニケーション,一般)
- 言語モデルと音響モデルを利用したアクセント句境界の自動推定
- HMM音声合成におけるスペクトル特徴量の局所変動のモデル化とパラメータ生成への適用(一般セッション,福祉と音声処理,一般)
- 語尾伸ばし発声による3次元直接操作インタフェース
- 「音声認識」は今後こうなる!
- 発話中の一部区間を用いた感情認識(研究速報)
- SC1-5 S-CATにおける音響特徴量とSVRによるスコア推定(特別セッション 音声認識技術を応用したコンピュータ自動採点日本語スピーキングテストの開発)
- 任意話者の多様なスタイル生成のための話者正規化スタイル変換法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な韻律生成のための多クラス局所韻律コンテキストの検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 多様な歌声合成のための重回帰HSMMに基づくスタイル制御法の検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)
- 統計モデルに基づく音声合成における話者・スタイルの多様化(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)