HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成(一般セッション,音声・言語・対話,一般)
スポンサーリンク
概要
- 論文の詳細を見る
隠れマルコフモデル(Hidden Markov Model : HMM)に基づく音声合成において、生成される音声パラメータは過剰に平滑化される傾向にあり、合成音声の肉声感は劣化する。これに対して我々は、HMM音声合成の利点を保持したハイブリッド法として、分散共有フルコンテキストモデルによるパラメータ生成法を提案しており、スペクトルパラメータにおいてその有効性を示している。本稿では、より音質の高い合成音声を得るために、分散共有フルコンテキストモデルによるF0パターン生成法を提案する。F0のモデル化に広く用いられる多空間確率分布HMM(Multi-Space probability Distribution HMM : MSD-HMM)を用いて分散共有フルコンテキストモデルを構築し、凡パターンを生成する。実験的評価結果から、提案法により合成音声の音質が向上することを示す。
- 2013-01-23
著者
-
中村 哲
情報通信研究機構
-
中村 哲
国立国際医療センター研究所
-
戸田 智基
奈良先端科学技術大学院大学
-
中村 哲
独立行政法人情報通信研究機構|株式会社国際電気通信基礎技術研究所
-
志賀 芳則
情報通信研究機構
-
中村 哲
独立行政法人 情報通信研究機構
-
中村 哲
奈良先端科学技術大学院大学
-
NEUBIG Graham
奈良先端科学技術大学院大学
-
SAKTI Sakriani
奈良先端科学技術大学院大学
-
高道 慎之介
奈良先端科学技術大学院大学
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- Water, Livelihood and Health in Attapeu Province in Lao PDR
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- 日本住血吸虫中間宿主貝分布密度の空間解析による日本住血吸虫症の監視体制の確立
- 京都観光案内対話コーパスにおける対話行為タグの設計と分析(理解)
- 同調的対話システム構築のための音声対話コーパスの構築(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
- HMMに基づく音声合成における強調音声の生成(合成)
- 音響特性補正の導入による肉伝導音声変換の収録環境適応(認識)
- 肉伝導音声変換のための音響特性補正法
- 話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
- 4L-4 微弱振動子とNAMマイクを用いた発話障害者補助(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 喉頭摘出者データを用いた人工音声変換システムの評価
- 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討(聴覚・音声/一般)
- 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム(肢体不自由・コミュニケーション補助,情報福祉論文)
- 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換(視覚障害/聴覚障害,一般)
- ラオスにおけるメコン住血吸虫症の現況
- ラオスの農村地域の飲料水源と水利用パターンの変遷に関する研究
- NICTにおける音声・言語研究拠点MASTARプロジェクトについて(「ユニバーサルコミュニケーションを実現するための言語処理技術」シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- マルチモーダル音声言語処理とその応用(マルチモーダル)
- 同時通訳者の知識と韻律情報を用いた講演文章のチャンキング(チャンキング・要約)
- 無喉頭音声強調のための統計的声質変換技術 (福祉情報工学)
- 無喉頭音声強調のための統計的声質変換技術 (音声)
- 無喉頭音声強調のための統計的声質変換技術 (パターン認識・メディア理解)
- 統計的対話モデルを用いたWFSTに基づく音声対話システム
- 同調的対話を実現するプロトタイプシステムの開発(対話・インタフェース・インタラクション)
- ATR実環境雑音DB-ATRANS-を用いた雑音重畳音声認識実験(耐雑音)
- Blizzard Challenge 2005に向けたHMM音声合成システム((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- Great Mekong Area における人類生態変遷の研究(Mekong Human Ecological Transsition Study: MEHETS)
- バングラディシュの砒素汚染 : ナワブガンジ地域における医学生態学調査
- バングラデシュ砒素汚染地域住民の尿中セレン・ヨウ素濃度
- 東南アジアにおける生活習慣病の現状について
- 2 ここまできた音声翻訳技術(多言語自動通訳技術の実現に向けて)
- 音声翻訳研究の展開(機械翻訳)
- 翻訳可能なフレーズを単位とした音声認識結果の信頼度評価
- ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 統計的ボコーダにおけるスペクトルパラメータ系列推定法 (音声)
- GMMに基づく最尤変換法による携帯電話音声の帯域拡張(音響処理)
- ラオス ヴィエンチャン近郊農村における衛生課題及びメコン川の水質
- ラオスヴィエンチャン近郊農村における飲料水としての地下水の水質の安全性
- 輪切りレモンを用いた新サルモネラ検出法
- ラオスにおける小児下痢症原因微生物の季節変化
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 音声翻訳単位の推定における句読点情報の効果(ドキュメント処理・翻訳・言語獲得,第10回音声言語シンポジウム)
- 統計的声質変換に基づく食道音声強調における声質制御
- 音声翻訳システムのための声質変換法と日中英語間における評価
- HMM音声合成における系列内変動モデリング手法の評価 (音声)
- HMM音声合成における系列内変動モデリング手法の評価 (言語理解とコミュニケーション)
- 任意の話者を対象とする統計的声質変換・制御法
- 参照話者を用いた多対多固有声変換法
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法(音声,聴覚)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- Oriental COCOSDA : 音声データベースおよび音声入出力システム評価国際協調委員会東アジア部会について(一般セッション「音声言語処理」)
- Oriental COCOSDA : 音声データベースおよび音声入出力システム評価国際協調委員会東アジア部会について(一般セッション「音声言語処理」)
- QAシステムのための音声入力インターフェース
- 音声認識の信頼度・複数候補を利用したWFST対話システムの評価
- 雑音下マルチモーダル音声認識評価基盤CENSREC-1-AVの構築
- アジア・オセアニアの人口・健康・栄養転換の統合的研究
- 相談型対話のモデル化と対話戦略の最適化
- 音声認職の信頼度・複数候補を利用したWFST対話システムの評価
- バングラデシュにおける洪水後のコレラ発生状況
- 音声認識と音声翻訳の国際的共通評価基盤構築に向けて
- GISを用いたメコン流域における飲用水起因下痢症リスク評価
- コレラ対策事例を通じて見たラオスの感染症予防行政の一側面
- 意志決定を支援する音声対話システムの構築と評価
- 言語獲得ロボットによる発話理解確率の推定に基づく物体操作対話
- バングラデシュにおける井戸水のヒ素汚染 : 小地域内におけるヒ素濃度の分布
- ユーザの相づち・うなずきを喚起する音声対話システム(対話生成,人とエージェントのインタラクション論文)
- 同時性を考慮した音声翻訳システムの検討
- 同時性を考慮した音声翻訳システムの検討
- Massive AI時代の音声・言語技術(ビッグデータとAI)
- 全国音声翻訳実証実験の実施と実利用データを用いた音声認識のモデル適応(音声,聴覚)
- 誤り単語の視覚・聴覚提示における事象関連電位による違和感分析
- 27aHC-3 マインツ大学におけるハイパー核生成実験のためのK^+中間子弁別用エアロジェルチェレンコフ検出器の開発(27aHC 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス・中間子生成・ハドロン構造(合同),実験核物理領域)
- 27aHC-2 MAMI-Cにおけるハイパー核崩壊パイ中間子スペクトロスコピーの現状と展望(27aHC 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス・中間子生成・ハドロン構造(合同),実験核物理領域)
- 26aHC-3 MPPCを用いたシンチレーション検出器読み出し回路の開発(26aHC 実験核物理領域,素粒子実験領域合同 測定器(I)(合同),実験核物理領域)
- 26aHC-2 NKS2実験に用いる新光子標識化装置の開発(26aHC 実験核物理領域,素粒子実験領域合同 測定器(I)(合同),実験核物理領域)
- 27aHC-1 高品質電子線を用いたΛ粒子生成の研究(27aHC 実験核物理領域,理論核物理領域合同 ハイパー核・ストレンジネス・中間子生成・ハドロン構造(合同),実験核物理領域)
- 音声言語情報処理研究会の20年-歴代主査による研究レビュー-
- 2-4 話し言葉の音声翻訳技術(2.携帯電話の聞く技術,携帯電話の聞く・聞かせる技術)
- 多言語音声翻訳システム"VoiceTra"の構築と実運用による大規模実証実験(音声,聴覚,システム開発論文)
- 説得対話システムにおける話題誘導に基づく対話制御(言語モデル・音声対話)
- 対話システムにおける単語間の関係性を用いた話題誘導応答文生成(言語モデル・音声対話)
- HMM音声合成における分散共有フルコンテキストモデルによるF0パターン生成(一般セッション,音声・言語・対話,一般)
- 23aSA-3 JLabにおける中重ラムダハイパー核分光研究(ハイパー核(II)(合同),実験核物理領域,理論核物理領域合同,実験核物理領域)
- 非言語情報読み取りスキルを用いた自閉症スペクトラム指数の測定(発達障害,メディア・コミュニケーションの品質と福祉,及び一般)
- 非言語情報読み取りスキルを用いた自閉症スペクトラム指数の測定(発達障害,メディア・コミュニケーションの品質と福祉,及び一般)
- 非言語情報読み取りスキルを用いた自閉症スペクトラム指数の測定(発達障害,メディア・コミュニケーションの品質と福祉,及び一般)
- 非言語情報読み取りスキルを用いた自閉症スペクトラム指数の測定(発達障害,メディア・コミュニケーションの品質と福祉,及び一般)