無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)

概要

論文の詳細を見る
喉頭摘出者が音声を発声するためには,音源を生成するための代替発声法を必要とする.各種代替発声法は独自の長所と短所を持っているが,共通する問題点は,生成される無喉頭音声の自然性が低く,話者性も大きく損なわれることである.我々は,各種無喉頭音声の自然性及び話者性の改善を目指し,統計的声質変換技術に基づく強調処理の実現に取り組んでいる.これまでに,食道音声,電気音声,肉伝導微弱電気音声といった無喉頭音声に対して,大幅な自然性及び話者性改善効果が得られる変換技術を構築した.本報告では,これらの技術について概説する.
2010-10-01

著者

戸田智基
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
中村圭吾
奈良先端科学技術大学院大学情報科学研究科
戸田智基
奈良先端科学技術大学院大学
土井啓成
奈良先端科学技術大学院大学情報科学研究科
中村圭吾
奈良先端科学技術大学院大学情報科学研究科
戸田智基
奈良先端科学技術大学院大学情報科学研究科
土井啓成
奈良先端科学技術大学院大学情報科学研究科

関連論文

ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
スペクトル系列の最尤推定に基づく短遅延声質変換法
合同特別企画: パネルディスカッション「"音"研究の未来」
外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
HMMに基づく音声合成における強調音声の生成(合成)
音響特性補正の導入による肉伝導音声変換の収録環境適応(認識)
肉伝導音声変換のための音響特性補正法
話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
4L-4 微弱振動子とNAMマイクを用いた発話障害者補助(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
喉頭摘出者データを用いた人工音声変換システムの評価
喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討(聴覚・音声/一般)
肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム(肢体不自由・コミュニケーション補助,情報福祉論文)
喉頭摘出者データを用いた人工音声変換システムの評価 (コンシューマエレクトロニクス・メディア工学)
喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討
喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換(視覚障害/聴覚障害,一般)
無喉頭音声強調のための統計的声質変換技術 (福祉情報工学)
無喉頭音声強調のための統計的声質変換技術 (音声)
無喉頭音声強調のための統計的声質変換技術 (パターン認識・メディア理解)
Blizzard Challenge 2005に向けたHMM音声合成システム((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(第8回音声言語シンポジウム)
ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
統計的ボコーダにおけるスペクトルパラメータ系列推定法 (音声)
GMMに基づく最尤変換法による携帯電話音声の帯域拡張(音響処理)
デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
統計的声質変換に基づく食道音声強調における声質制御
音声翻訳システムのための声質変換法と日中英語間における評価
HMM音声合成における系列内変動モデリング手法の評価 (音声)
HMM音声合成における系列内変動モデリング手法の評価 (言語理解とコミュニケーション)
任意の話者を対象とする統計的声質変換・制御法
参照話者を用いた多対多固有声変換法
時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法(音声,聴覚)
HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
合同特別企画: パネルディスカッション「"音"研究の未来」
HMM音声合成における系列内変動モデリング手法の評価
異なる収録機器に対応した肉伝導音声変換のための音響特性自動補正
1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善
ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
異なる収録機器に対応した肉伝導音声変換のための音響特性自動補正
確率モデルに基づく声質変換技術 (小特集音声合成に関する研究の動向)
確率モデルに基づく声質変換技術(音声合成に関する研究の動向)
無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
統計的声質変換を用いた食道発声音声の音質改善
事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般)
統計的ボコーダにおけるスペクトルパラメータ系列推定法(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
ICASSP2007報告(研究動向を探るセッション)
実画像データベースを用いた発話顔画像合成の検討
音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
一対多固有声変換に基づく声質制御法の評価(合成,生成,韻律,一般)
固有声に基づく声質変換のための話者正規化学習法(合成,生成,韻律,一般)
固有声に基づく声質変換法(合成,生成,韻律,一般)
統計的声質変換法による肉伝導小声の音質改善(合成,生成,韻律,一般)
HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
マルチ発話様式を考慮した肉伝導音声認識用音響モデルに関する予備的検討(特徴量, 区間検出)
周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法
周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法
混合正規分布モデルに基づく声質変換法のSTRAIGHTへの適用
混合正規分布モデルに基づく声質変換法のSTRAIGHTへの適用
無喉頭音声強調のための統計的声質変換技術
GMMに基づく声質変換を用いた感情音声合成
側抑制性重み付けを用いた雑音環境下におけるSTRAIGHT分析合成系の品質改善(音声情報処理 : 現状と将来技術論文特集)
韻律的に多重化した音声データベースの設計と発話速度におけるその評価(音声,聴覚)
発話速度の異なるデータベースを用いた音声合成手法の検討
非可聴つぶやき認識のためのステレオ信号を用いたブラインド雑音抑圧法
公共案内システムにおける幼児音声認識部の開発と評価(セッション5 : 音声認識+音声合成)
公共案内システムにおける幼児音声認識部の開発と評価(セッション5 : 音声認識+音声合成)
タスク依存音響モデルのための発話レベルでの選択学習法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
コードブックを用いた実時間処理CMNの実装と評価
公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
韻律的に多重なデータベースの設計と評価
CHATR出力音声へのSTRAIGHTを用いた韻律制御
分散共有フルコンテキストモデルによるHMM音声合成に関する検討
VocaListenerによる学習データ生成を利用した多対多固有声変換に基づく歌声声質変換
統計的スペクトル変換法による肉伝導通常音声の自然性改善((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
拡張モバイルマニピュレーションのための新規物体の学習
統計的無喉頭音声強調における学習データのポーズ位置不一致への対応(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
同時性を考慮した音声翻訳システムの検討
同時性を考慮した音声翻訳システムの検討
ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良
統計的無喉頭音声強調における学習データのポーズ位置不一致への対応
2012年度喜安記念業績賞紹介:次世代音声合成方式の研究開発とオープンソース戦略による社会貢献
同時通訳データを利用した同時通訳用機械翻訳システムの構築
構文情報が機械翻訳に及ぼす影響の分析

無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク