日本語テキスト音声合成における音素単位とダイフォン単位に基づいた単位選択
スポンサーリンク
概要
- 論文の詳細を見る
本稿では, 日本語テキスト音声合成(TTS : Text-to-Speech)における新たな単位選択法を提案する.日本語では, 母音の無声化を除くとCV(C : 子音, V : 母音)とVから音節が構成されるため, 合成単位としてCV単位がよく用いられる.しかし, 波形接続型のTTSにおいてCV単位を用いて音声を合成すると, VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV^*単位や可変長単位)がこれまでに提案されているが, V-V接続の問題はまだ解決されていない.そこで, V-V接続により生じる不連続感を低減する手法として, 音素単位とダイフォン単位に基づいた新たな単位選択法を提案する.提案法では, 音素境界における接続だけでなく, 母音中心における接続も考慮して単位選択が行われる.評価実験結果から, 提案法は音素単位に基づいた従来法と比較し, よりよい性能をもっことが明らかになった.
- 社団法人電子情報通信学会の論文
- 2002-01-17
著者
-
津崎 実
京都市立芸術大学
-
津崎 実
Atr音声言語コミュニケーション研究所:京都市立芸術大学
-
津崎 実
Atr音声言語コミュニケーション研究所
-
鹿野 清宏
奈良先端科学技術大学院大学情報科学研究科情報処理学専攻
-
河井 恒
Atr音声言語コミュニケーション研究所
-
河井 恒
株式会社kddi研究所音声処理グループ
-
河井 恒
KDD研究所
-
鹿野 清宏
奈良先端科学技術大学院大学
-
戸田 智基
ATR音声言語コミュニケーション研究所
関連論文
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発(音声,聴覚)
- フレッシュマン企画 : 音の常識Q&A(やさしい解説)
- 音の持続時間が音源の大きさ知覚に及ぼす影響 : 母音刺激を用いた検討(日本基礎心理学会第28回大会,大会発表要旨)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (音声)
- ユーザ負担のない話者・環境適応性を実現する自然な音声対話処理技術の総合開発(総合報告)
- 混合正規分布モデルに基づく声質変換の高速化を目的とした共分散行列の対角化(合成)
- スペクトル系列の最尤推定に基づく短遅延声質変換法
- Mathematical metric of amount of musical noise in recursive spectral subtraction (応用音響)
- 並列ICAによる雑音推定に基づくリアルタイムブラインド音源抽出マイクロホンの開発(音声,聴覚)
- 空間的スペクトルサブトラクションを用いたハンズフリー音声認識
- 括弧表現に基づくWebテキストマイニングを用いた流行語への自動読み付与の提案
- ICAによる雑音推定を用いた平均二乗誤差最小化短時間振幅スペクトル推定法に基づく両耳補聴器 (応用音響)
- NAMセグメントを用いた個人認証法における未知話者データに対する頑健性の評価(聴覚・音声/一般)
- 音声分析・変換・合成方法STRAIGHTの音声符号化への適用について
- 実環境向け音声対話ロボット「キタちゃん」の開発
- 外部音源を用いた発声補助システムにおける統計的声質変換の評価(福祉と音声処理,一般)
- HMMに基づく音声合成における強調音声の生成(合成)
- 音響特性補正の導入による肉伝導音声変換の収録環境適応(認識)
- 肉伝導音声変換のための音響特性補正法
- 話者適応に基づく複数話者の非可聴つぶやき認識における話者正規化学習の有効性(音声認識技術)
- 4L-4 微弱振動子とNAMマイクを用いた発話障害者補助(リーディングプロジェクト e-society:自然な音声対話処理技術(2),一般セッション,リーディングプロジェクト e-society)
- 喉頭摘出者データを用いた人工音声変換システムの評価
- 喉頭摘出者の会話支援システムにおける微弱な音源信号に関する検討(聴覚・音声/一般)
- 肉伝導人工音声の変換に基づく喉頭全摘出者のための音声コミュニケーション支援システム(肢体不自由・コミュニケーション補助,情報福祉論文)
- 喉頭摘出者を想定して微弱な音源信号を用いて収録された肉伝導音声の声質変換(視覚障害/聴覚障害,一般)
- 11.人にやさしい音声インタフェース(第2部:情報の高信頼蓄積・検索技術等の開発,学と産の連携による基盤ソフトウェアの先進的開発)
- チャネル毎スペクトル減算と適応アレー信号処理の統合手法におけるミュージカルノイズ制御
- 種々の周波数遷移特性における音の時間知覚の比較(日本基礎心理学会第28回大会,大会発表要旨)
- 音声対話システムにおけるWeb検索タスクの発話分析とWeb検索のための大規模単語コーパスの検討(言語モデル)
- 等間隔性からのずれに対する聴覚感度の調査 : 周波数遷移の開始点と終了点での比較(日本基礎心理学会第27回東北大会,大会発表要旨)
- 旋律同定における場所・時間情報の役割 : 輪郭と音程の判断
- 聴覚的視点から見たアルペジオと和音の境界について : 蝸牛遅延との関連は?
- 3Q-3 NAMマイクによる心音の収録とその明瞭化(音声の分析・合成,学生セッション,人工知能と認知科学)
- Mathematical metric of musical noise in arbitrary exponent domain SS (音声)
- Mathematical metric of musical noise in arbitrary exponent domain SS (信号処理)
- Mathematical metric of musical noise in arbitrary exponent domain SS (応用音響)
- 独立成分分析を導入した空間的サブトラクションアレーによるハンズフリー音声認識システムの開発
- フレッシュマン企画 : 音の常識Q&A
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (信号処理)
- MMSE STSA estimator with ICA-based nonstationary noise estimation for high-quality speech enhancement (応用音響)
- 平均二乗誤差最小化短時間振幅スペクトル推定に基づくブラインド信号抽出
- 多点制御波面合成法とWave Field Synthesisによる合成波面の比較検討
- スペクトル減算法におけるミュージカルノイズ発生量と対数カートシス比の関連(音響信号処理/一般)
- 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応(音声,聴覚)
- モデル統合に基づく高速EM学習法(音響モデル)(第5回音声言語シンポジウム)
- モデル統合に基づく高速EM学習法
- 十分統計量を用いた教師なし話者適応および環境適応(音声言語情報処理とその応用)
- MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム
- 十分統計量に基づく教師なし環境話者適応におけるスペクトルサブトラクションの効果
- 十分統計量を用いた教師なし話者・環境適応の評価
- 高齢者音響モデルによる大語彙連続音声認識
- 十分統計量と話者距離を用いた音韻モデルの教師なし学習法
- スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応
- 日本人英語学習者音声の時間制御特性客観評価(音声生成・知覚,聴覚心理,音声学・音韻論,一般)
- Q&Aコーナー(コーヒーブレーク)
- ピアノ演奏における聴覚フィードバックの利用(音楽認知・知覚3)
- 素片接続型合成音声器の単位選択特徴量についての検討:聴覚モデルと物理モデルによる選択の聴取評価
- 聴覚モデルを導入した素片接続型音声合成系の単位選択用特徴量抽出の検討
- 大規模コーパスを用いた音声合成システムXIMERA(音声,聴覚)
- 音声合成システムXIMERAにおける日本語合成音の自然性劣化要因の分析
- コーパス・ベース音声合成システムXIMERA(一般, 一般, チュートリアルレクチャー)
- コーパス・ベース音声合成システムXIMERA
- 平均スペクトル等化の検討(合成, 韻律, 生成, 一般)
- 聴覚の情景分析の概説 : 聴覚心理学からのアプローチ
- 素片接続合成単位選択のための特徴量に関する聴覚モデルの導入 : 物理モデルとの比較と聴取実験による評価
- STRAIGHT合成音源に対する位相拡散の最適化 : 心理評価と制御変数値推定の試み
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定 (音声)
- 基本周波数パタンに見られる発話態度の分析(対話)
- 文中の音韻長伸縮の自然性許容に対する文節内位置の効果
- 持続時間収縮錯覚と時間間隔による文脈の関係について(音楽認知・知覚3)
- 語彙が与える印象に基づく対話韻律生成
- 調性の枠組みのある継時的音程の知覚 : 場所・時間情報による差異(日本基礎心理学会第24回大会,大会発表要旨)
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定
- 音色の印象に関わる非パワースペクトル的要因
- 合成音源に対する群遅延制御と基本周波数変換音声の品質
- 音声分析合成系における音源の非周期成分付加方式の比較検討
- 音声の非周期成分の時間特性の抽出と合成について
- STRAIGHT合成音源に対する位相拡散効果の最適化 - 心理評価による検討 -
- 群遅延・イベント・調派構造による音源情報表現の検討
- STRAIGHT分析合成音の心理評価 - 話者依存性の検討 -
- 単位接続型音声合成における音素環境代替による自然性劣化の知覚的評価
- コーパスベース音声合成技術の動向[III] : コーパスの設計と評価尺度
- 波形接続型音声合成における知覚的評価に基づく素片選択サブコスト関数の最適化(合成, 韻律, 生成, 一般)
- 波形接続型音声合成における局所的な自然性劣化を考慮に入れた素片選択の評価
- 素片接続型日本語テキスト音声合成における音素単位とダイフォン単位に基づく素片選択
- 音声合成用大規模音声コーパスにおける声質時期差の検討
- 波形接続型テキスト音声合成における素片選択コストの知覚的評価
- 素片接続型音声合成器の単位選択特徴量についての検討 : 聴覚モデルとMFCCによる選択の聴取評価
- 日本語テキスト音声合成における母音中心での接続を考慮に入れた単位選択
- 波形接続型音声合成における音素環境代替コストの予測
- STRAIGHTとPSOLAによる単語音声分析合成音の比較評価
- 日本語テキスト音声合成における音素単位とダイフォン単位に基づいた単位選択
- 日英バイリンガル・コーパスを用いた知覚的話者空間の推定(オーガナイズドセッション2,聴覚・音声・言語とその障害/一般)
- 語彙が与える印象に基づく対話韻律生成
- 寸法変調母音系列の同定成績と寸法抽出過程の時間的追随性との関連性(音声・聴覚,一般)
- 聴覚における「形」の恒常性と寸法正規化について(日本基礎心理学会第24回大会,大会発表要旨)
- Q&Aコーナー(コーヒーブレーク)
- 「ハイペリオン(上・下)」, ダンシモンズ著, 酒井昭伸訳, 2000年, 早川書房 (私のすすめるのこ一冊,コーヒーブレーク)
- 個人性を考慮した異言語音声合成に対する知覚評価
- 寸法判断における視聴覚情報統合(日本基礎心理学会第31回大会,大会発表要旨)