音声波形接続型音声合成のための物理的距離関数
スポンサーリンク
概要
- 論文の詳細を見る
波形接続型音声合成の評価のために、何種類かの音響信号処理を用いて特徴抽出を行ない比較をおこなった。本実験で用いたものは、LPC、LSP、MFCC、バイスペクトル、メル尺度対数スペクトル、Wiger-Ville Distributionなどである。今回の実験では、話者が話した同一の文章を音声合成で作成し、そのデータと生のデータと比較し物理的距離計算を行ない、そして、知覚的評価が含まれているMOS評価と比較し物理的距離とMOS評価の結果との相関を調べた。その結果、バイスペクトルを用いた場合に、MOS評価の結果と最も相関が高いことが分かった。また、ケプストラムに基づいたWigner-ville distibutionは、このような波形接続型音声合成には適していないことも分かった。
- 社団法人電子情報通信学会の論文
- 1999-05-20
著者
-
キャンベル ニック
Atr 音声言語通信研究所
-
Campbell N
奈良先端科学技術大学院大
-
Campbell N
Atr音声言語通信研
-
キャンベル ニック
ATR音声翻訳通信研究所
-
ジンドン チェン
ATR音声翻訳通信研究所
-
チェン ジンドン
Atr音声翻訳通信研究所
関連論文
- 大阪方言自然発話音声への ToBI の検討
- 韻律を用いた発話タイプの識別
- 日英音声翻訳システム ATR MATRIX
- 音声合成のための規則とデータの表現, 獲得, 評価(音声情報処理 : 現状と将来技術論文特集)
- 音声合成CHATRのしくみ
- 親しみやすいコンピュータ音声合成
- 親しみやすいコンピュータ音声合成
- 英語における韻律構造と文法構造の違いについて
- 外国語混合文対応型多言語音声合成方式の開発
- 日本語文音声における韻律情報と焦点の検討
- 音声波形接続型音声合成のための物理的距離関数
- 音声波形接続合成専用テキストのデータベース作成について
- 波形接続型音声合成システムにおけるアクセント型を考慮した音素単位選択
- 感情表現が可能な合成音声の作成と評価 (ヒューマンインタフェースとインタラクション)
- 日本語文音声における音素継続時間長とfocusの検討
- 外国語の音声合成について
- 音素接続部の不連続感を考慮した単位選択について
- 文音声における波形比較による強調抽出
- 入力音声の韻律を用いた音声合成
- 単位選択における音素境界の不連続感の検出及び音声合成への応用
- CHATR : 音声合成データベース処理について
- Tones and Break Indices (ToBI)システムと日本語への適用
- 自然音声の合成への一歩
- CHATR : 自然音声波形接続型任意音声合成システム
- 自動ToBI : 日本語朗読発声用の韻律ラベリング・ワークベンチ
- 韻律を用いたテキスト非限定型発話アクト識別方法
- AURORA-2タスク雑音環境下音声認識における雑音にロバストな特徴抽出法とモデル補償
- AURORA-2タスク雑音環境下音声認識における雑音にロバストな特徴抽出法とモデル補償
- 「電子情報と音声合成について」
- 音声データベース, 及び音声入出力システム評価の国際的協調に関する1994年国際作業部会
- スペクトル傾斜およびラウドネスに対するストレスの影響