HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 様々な言語を任意の話者の声で音声合成する方法を提案する.本手法は, HMM音声合成に基づいた話者適応可能な多言語音声合成法であり, まず, 様々な話者・様々な言語の音声データを集め, 話者と言語に依存しないHMMを学習する.そして, この音響モデルを少量の特定話者の音声データを使って適応する.適応されたHMMを音声合成に利用することにより, 話者の母国語に関係なく, その話者の声で多種多様な言語を音声合成することができる.言語横断音声合成を行った際の合成音声について, 複数被験者による聴取実験を行った結果, 単一言語の音響モデルと音素マッピングを用いた手法に比べ, 多言語音響モデルを用いる提案手法の方が優れた性能を有することが確認された.学習データに含まれていない言語を合成する場合においても, 我々の手法は単一言語の音響モデルを用いた音声合成に比べ, 同等かそれ以上の性能を有することが確認された.
- 社団法人電子情報通信学会の論文
- 2005-12-15
著者
-
岩野 公司
東京工業大学大学院情報理工学研究科計算工学専攻
-
岩野 公司
東京都市大学環境情報学部情報メディア学科
-
岩野 公司
東京都市大学 環境情報学部 情報メディア学科
-
古井 貞熙
東京工業大学
-
ラトレ ハビエル
東工大
-
ラトレ ハビエル
東京工業大学大学院計算工学専攻
関連論文
- WFST音声認識デコーダにおけるon-the-fly合成の最適化処理(音声,聴覚)
- F_0パターン生成モデルのための数量化I類の平均値置換による話者適応法の検討(感情音声,韻律,声質,音声生成・知覚,脳機能,一般)
- 耐雑音音声認識のためのハフ変換による基本周波数情報抽出の高速化
- WFST音声認識デコーダの高機能化とその応用 : on-the-fly合成法の検討(プラットフォーム)
- 話し言葉音声の音響的・言語的特徴の分析
- 音声情報を統合したプレゼンテーションコンテンツ検索(情報検索,データ工学論文)
- 音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討(音声・言語・音響教育,一般)
- 重要文抽出による音声自動要約手法とその客観評価法についての検討(要約, 検索, 認識・理解・対話・一般)
- 客観尺度を用いた音声自動要約手法の評価
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく閾値最適化法の検討(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討(ポスターセッション)(第6回音声言語シンポジウム)
- 雑音に頑健な話者照合のための基本周波数情報の利用(認識・理解・対話)
- 雑音に頑健な話者照合のための基本周波数情報の利用(認識・理解・対話)
- 音声と耳介画像を用いたマルチモーダル個人認証(認識・理解・対話)
- 音声と耳介画像を用いたマルチモーダル話者照合
- 音声と顔画像を用いたマルチモーダル話者照合
- 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 超並列計算機を用いた入力音声の変動に頑健な音声対話システムの検討(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 講義音声認識における講義スライド情報の利用(第8回音声言語シンポジウム)
- 実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法
- 実環境を考慮したマルチモーダル音声認識のためのストリーム重み最適化手法
- マルチモーダル音声認識におけるストリーム重み係数最適化の検討(ポスターセッション)(第5回音声言語シンポジウム)
- マルチモーダル音声認識におけるストリーム重み係数最適化の検討(第5回音声言語シンポジウム : ポスターセッション)
- マルチモーダル音声認識におけるストリーム重み係数最適化の検討(第5回音声言語シンポジウム : ポスターセッション)
- 横顔の動画像情報を用いたマルチモーダル音声認識(自然言語情報処理研究会と一部合同開催 : マルチモーダル・音声インタフェース関連)
- マルチモーダル音声認識のための画像特徴量の改善
- 実環境におけるマルチモーダル音声認識の評価
- オプティカルフローを用いたマルチモーダル音声認識法の提案と評価
- オプティカルフローを用いたマルチモーダル音声認識法の提案と評価
- オプティカルフローを用いたマルチモーダル音声認識の検討
- マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討(音声認識・識別,第9回音声言語シンポジウム)
- マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討(音声認識・識別,第9回音声言語シンポジウム)
- マルチストリームHMMを用いた特徴量の次元別重み付き話者照合の検討(音声認識・識別,第9回音声言語シンポジウム)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(耐雑音)(第5回音声言語シンポジウム)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 周波数帯域ごとの重みつき尤度を用いた雑音に頑健な音声認識(第5回音声言語シンポジウム : 耐雑音)
- 語彙制約なし音声認識へのアクセント句境界検出の統合
- モーラ遷移HMMに基づくF_0パターンのモデル化と生成
- 語彙制約なし音声認識へのアクセント句境界情報の利用
- 語彙制約なし音声認識へのアクセント句境界情報の利用
- 語彙制約なし音声認識へのアクセント句境界情報の利用
- タイプライタ型音声認識へのアクセント句境界情報の利用
- モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出 (音声言語情報処理)
- 句境界情報を利用した語彙制約のない姓名認識
- モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用
- モーラ遷移確率モデルを用いた句境界検出システムの語彙制約なし音声認識への応用
- モーラ遷移確率モデルを用いたアクセント型の識別とアクセント句境界の検出
- モーラ遷移確率モデルを用いたアクセント句の表現
- HMM音声合成における自然性と個人性に優れた韻律モデル適応法の検討
- マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討
- 話し言葉音声合成の韻律制御に関する検討
- マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討
- 話し言葉音声合成の韻律制御に関する検討
- マルチモーダル音声認識におけるストリーム重みの教師なし推定法の検討
- 話し言葉音声合成の韻律制御に関する検討
- 対話システムへの利用を想定したマルチモーダル音声認識の検討
- HMMを用いた話し言葉音声合成のためのモデルの検討
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- マハラノビス距離を用いた日本語話し言葉音声の音響的特徴の分析
- 講義音声認識における講義スライド情報の利用(Session-6 音声認識,第8回音声言語シンポジウム)
- 講義音声認識における講義スライド情報の利用
- 自由発話を対象とした対話システムの構築と評価
- 機械翻訳データを用いた音声認識のための言語モデル適応(多言語, CSJ, 認識・理解・対話・一般)
- 講演音声のインデキシングを目的としたセグメンテーション手法の検討
- 音声自動要約を利用した講演速聞きシステムの検討(自然言語情報処理研究会と一部合同開催 : NL・SLP合同開催 : 音声対話1)
- 音声自動要約を利用した講演速聞きシステムの検討
- ウェアラブルコンピュータ環境における話者照合
- 日本語話し言葉コーパスを用いた話し言葉音声の音響的特徴の分析(音声言語情報処理一般)(テーマ:音声対話システム、音声言語情報処理、一般)
- 言語モデルの教師なしバッチ型話題適応
- 言語モデルのバッチ型教師なし適応化法
- 言語モデルのバッチ型教師なし適応化法
- 雑音に頑健な音声認識のための韻律情報の利用(自然言語情報処理研究会と一部合同開催 : 自動車内音声対話関連)
- 雑音に頑健な基本周波数抽出法とその音声認識への適用
- ハフ変換による雑音に頑健な基本周波数抽出法
- ハフ変換を用いた雑音中の音声からの基本周波数抽出法
- HMMを用いた話し言葉音声合成の実現に向けての検討(一般, 一般, チュートリアルレクチャー)
- HMMを用いた話し言葉音声合成の実現に向けての検討
- 座談会 環境情報学部情報メディアの今後10年の展望と期待--ジャーナルと情報インフラの将来に望むこと (特集 環境情報学部情報メディアの今後10年の展望と期待--ジャーナルと情報インフラの将来に望むこと)
- マルチバンド音声認識のためのLDAに基づく帯域重み推定手法
- HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- HMM音声合成に基づいた話者適応可能な多言語音声合成法 : 開発と評価(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 多言語HMM音声合成における言語の追加
- HMM-based speaker adaptable polyglot synthesizer--Development and evaluation (第7回音声言語シンポジウム)
- 言語モデルのバッチ型教師なし適応化法
- 雑音に頑健な基本周波数抽出法とその音声認識への適用
- 並列処理型計算機を用いた音声店舗検索システム (第6回ネットワークシンポジウム講演論文集)
- 逐次話者適応を用いた並列処理型会議音声認識システムの検討
- 並列処理型計算機を用いた音声対話システムの検討 (テーマ:一般)
- 並列処理型会議音声認識システムの検討
- HMMに基づく音声合成における様々な発話速度の実現
- 軽量な画像特徴量を用いたマルチモーダル音声認識(音声、聴覚,学生論文)
- クラウド時代の新しい音声研究パラダイム
- 複数ピンマイクで収音された会議音声の重畳区間検出
- 数量化I類によるF_0パターン生成の制御要因に関する検討