スペクトル補正及び統計的音源生成に基づくハイブリッド電気音声強調(障碍者支援システム,音声/福祉/ディジタル信号処理/聴覚一般)
スポンサーリンク
概要
- 論文の詳細を見る
喉頭摘出者のための代用発声法の一つとして,電気式人工喉頭を用いた発声法がある.外部から機械的に生成される音源信号を用いて発声を行う方法であり,習得が容易で,かつ,比較的聞き取りやすい音声(電気音声)を生成できるという利点がある.一方で,自然な音源信号を機械的に生成するのは困難であり,特に発話内容に応じた自然な基本周波数パターンを生成するのは本質的に極めて困難な処理となる.結果として,電気音声の自然性は大きく劣化する.また,電気式人工喉頭から生成される音源信号自体が外部に漏れるため,雑音として電気音声に混入し,その品質を劣化させる.これらの問題に対処するため,本稿では,電気音声の聞き取りやすさを保持しながら自然性を大幅に改善する音声強調法として,従来の強調法である雑音抑圧に基づくスペクトル補正処理と統計的声質変換に基づく音源特徴量生成処理を組み合わせたハイブリッド法を提案する.提案法では,統計的手法によるスペクトルおよび有声無声情報への変換処理を回避することで,変換誤差により聞き取りやすさが劣化する事態を回避する.また,統計的手法により,通常音声の基本周波数パターンを予測することで,自然性を大幅に改善する.実験的評価結果から,本手法の有効性を示す.
- 一般社団法人電子情報通信学会の論文
- 2013-06-06
著者
-
戸田 智基
奈良先端科学技術大学院大学
-
田中 宏
奈良先端科学技術大学院大学物質創成科学研究科
-
サクティ サクリアニ
奈良先端科学技術大学院大学
-
中村 哲
奈良先端科学技術大学院大学
-
ニュービッグ グラム
奈良先端科学技術大学院大学
関連論文
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
- HMMに基づく音声合成における強調音声の生成(合成)
- 音響特性補正の導入による肉伝導音声変換の収録環境適応(認識)
- 肉伝導音声変換のための音響特性補正法
- 話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
- 4L-4 微弱振動子とNAMマイクを用いた発話障害者補助(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 喉頭摘出者データを用いた人工音声変換システムの評価
- 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討(聴覚・音声/一般)
- 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム(肢体不自由・コミュニケーション補助,情報福祉論文)
- 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換(視覚障害/聴覚障害,一般)
- 無喉頭音声強調のための統計的声質変換技術 (福祉情報工学)
- 無喉頭音声強調のための統計的声質変換技術 (音声)
- 無喉頭音声強調のための統計的声質変換技術 (パターン認識・メディア理解)
- Blizzard Challenge 2005に向けたHMM音声合成システム((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(第8回音声言語シンポジウム)
- ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 統計的ボコーダにおけるスペクトルパラメータ系列推定法 (音声)
- GMMに基づく最尤変換法による携帯電話音声の帯域拡張(音響処理)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- デモンストレーション: 音楽・音声言語情報処理の研究紹介(特別企画)
- 統計的声質変換に基づく食道音声強調における声質制御
- 音声翻訳システムのための声質変換法と日中英語間における評価
- HMM音声合成における系列内変動モデリング手法の評価 (音声)
- HMM音声合成における系列内変動モデリング手法の評価 (言語理解とコミュニケーション)
- 任意の話者を対象とする統計的声質変換・制御法
- 参照話者を用いた多対多固有声変換法
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- 時系列マッチングを含む統計モデルを用いた継続長およびスペクトルの同時変換(音声合成・声質変換,第10回音声言語シンポジウム)
- STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法(音声,聴覚)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- HMM音声合成システム(HTS)の開発(システム,第9回音声言語シンポジウム)
- 合同特別企画: パネルディスカッション「"音"研究の未来」
- HMM音声合成における系列内変動モデリング手法の評価
- 異なる収録機器に対応した肉伝導音声変換のための音響特性自動補正
- 1対多固有声変換に基づく無喉頭音声の音質及び話者性の改善
- ICSLPにおける研究動向 : 音響モデル・音声合成を中心に(Session-5 特徴量・音響モデル,第8回音声言語シンポジウム)
- 確率モデルに基づく声質変換技術(音声合成に関する研究の動向)
- 無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
- 無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
- 無喉頭音声強調のための統計的声質変換技術(テーマセッション,福祉と見守りのための画像・音声処理)
- 統計的声質変換を用いた食道発声音声の音質改善
- 事前収録話者データを用いた多対一声質変換法(合成,生成,韻律,一般)
- 統計的ボコーダにおけるスペクトルパラメータ系列推定法(オーガナイズドセッション:「Advances in soeech decomposition」,合成,生成,韻律,音声一般)
- 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
- ICASSP2007報告(研究動向を探るセッション)
- 実画像データベースを用いた発話顔画像合成の検討
- 音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- 一対多固有声変換に基づく声質制御法の評価(合成,生成,韻律,一般)
- 固有声に基づく声質変換のための話者正規化学習法(合成,生成,韻律,一般)
- 固有声に基づく声質変換法(合成,生成,韻律,一般)
- 統計的声質変換法による肉伝導小声の音質改善(合成,生成,韻律,一般)
- HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- HMM十分統計量と線形補間法に基づく高速教師なし話者適応の評価(Session-1 音響モデル・特徴量・学習, 第7回音声言語シンポジウム)
- マルチ発話様式を考慮した肉伝導音声認識用音響モデルに関する予備的検討(特徴量, 区間検出)
- 周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法
- 周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法
- 混合正規分布モデルに基づく声質変換法のSTRAIGHTへの適用
- 混合正規分布モデルに基づく声質変換法のSTRAIGHTへの適用
- 無喉頭音声強調のための統計的声質変換技術
- GMMに基づく声質変換を用いた感情音声合成
- 側抑制性重み付けを用いた雑音環境下におけるSTRAIGHT分析合成系の品質改善(音声情報処理 : 現状と将来技術論文特集)
- 韻律的に多重化した音声データベースの設計と発話速度におけるその評価(音声,聴覚)
- 発話速度の異なるデータベースを用いた音声合成手法の検討
- 非可聴つぶやき認識のためのステレオ信号を用いたブラインド雑音抑圧法
- 公共案内システムにおける幼児音声認識部の開発と評価(セッション5 : 音声認識+音声合成)
- 公共案内システムにおける幼児音声認識部の開発と評価(セッション5 : 音声認識+音声合成)
- タスク依存音響モデルのための発話レベルでの選択学習法(Session-8 ポスターセッション: 一般, 第7回音声言語シンポジウム)
- コードブックを用いた実時間処理CMNの実装と評価
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張(Session-4 システム・言語モデル, 第7回音声言語シンポジウム)
- 韻律的に多重なデータベースの設計と評価
- CHATR出力音声へのSTRAIGHTを用いた韻律制御
- 分散共有フルコンテキストモデルによるHMM音声合成に関する検討
- VocaListenerによる学習データ生成を利用した多対多固有声変換に基づく歌声声質変換
- 統計的スペクトル変換法による肉伝導通常音声の自然性改善((SS)高品質音声分析変換合成法STRAIGHT, 一般, STRAIGHTスペシャルセッション(SS))
- 拡張モバイルマニピュレーションのための新規物体の学習
- 統計的無喉頭音声強調における学習データのポーズ位置不一致への対応(オーガナイズドセッション:Advances in speech decomposition,合成,生成,韻律,音声一般)
- 同時性を考慮した音声翻訳システムの検討
- 同時性を考慮した音声翻訳システムの検討
- ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
- ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良(音声処理,時系列パターン認識)
- ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良
- 統計的無喉頭音声強調における学習データのポーズ位置不一致への対応
- 2012年度喜安記念業績賞紹介:次世代音声合成方式の研究開発とオープンソース戦略による社会貢献
- 同時通訳データを利用した同時通訳用機械翻訳システムの構築
- 構文情報が機械翻訳に及ぼす影響の分析
- ユーザ動作に伴う雑音を含む非可聴つぶやき音声におけるブラインド音声抽出
- 誤り単語の視覚・聴覚提示における事象関連電位による違和感分析
- 説得対話コーパスの構築と分析
- 分散共有フルコンテキストモデルによるHMM音声合成の改善(一般セッション,福祉と音声処理,一般)