CHATR : 音声合成データベース処理について
スポンサーリンク
概要
- 論文の詳細を見る
本報告では音声合成データベースにおいて音素ラベリング及び韻律ラベルリングを用いる方法についてと音声セグメントの多層的な記述方法についてを述べる。従来の音素による音声表記とは対照的に、本方式では音響的な違いを記述する重要な要素として韻律的な文脈を取り入れた。人間が発する音声の最小限の識別可能な音に於いて、意味を有する音の違いは文脈と調音様式に依存する。しかし、少数の高レベルの特徴を組み合わせることにより、高精度にインデックスを付与することが可能である。音声合成で上記の特徴は「重み学習」と「単位選択」の処理に用いられ、音声データベースより結合のための最適な連続セグメントを決定する。しかし、音響的な違いを定義するには音節などのより大きい、高いレベルの単位が理想的であるが、結合には音素より小さい単位である副音素のセグメントの方が適するというパラドックスになる。CHATRで使用するデータベースの作成にあたっては、初見で文の予測が可能となる方式で、音素より小さい単位のレベルの音声が持つ重要な特徴が全て識別される様、データの分析及び処理を行なう必要がある。本報告では「音節レベルでのラベルリング」と「音素より小さい単位のレベルでの音声単位」を組み合わすことにより、改良されたCHATRの音声合成システムを記述する。また、音声セグメントに縛られない多層的なアプローチが、音素に基づいた従来のシステムより好結果をもたらすことを示す。
- 一般社団法人情報処理学会の論文
- 1997-07-18
著者
関連論文
- 大阪方言自然発話音声への ToBI の検討
- 韻律を用いた発話タイプの識別
- 日英音声翻訳システム ATR MATRIX
- 音声合成のための規則とデータの表現, 獲得, 評価(音声情報処理 : 現状と将来技術論文特集)
- 音声合成CHATRのしくみ
- 親しみやすいコンピュータ音声合成
- 親しみやすいコンピュータ音声合成
- 英語における韻律構造と文法構造の違いについて
- 外国語混合文対応型多言語音声合成方式の開発
- 日本語文音声における韻律情報と焦点の検討
- 音声波形接続型音声合成のための物理的距離関数
- 音声波形接続合成専用テキストのデータベース作成について
- 波形接続型音声合成システムにおけるアクセント型を考慮した音素単位選択
- 感情表現が可能な合成音声の作成と評価 (ヒューマンインタフェースとインタラクション)
- 日本語文音声における音素継続時間長とfocusの検討
- 外国語の音声合成について
- 音素接続部の不連続感を考慮した単位選択について
- 文音声における波形比較による強調抽出
- 入力音声の韻律を用いた音声合成
- 単位選択における音素境界の不連続感の検出及び音声合成への応用
- CHATR : 音声合成データベース処理について
- Tones and Break Indices (ToBI)システムと日本語への適用
- 自然音声の合成への一歩
- CHATR : 自然音声波形接続型任意音声合成システム
- 自動ToBI : 日本語朗読発声用の韻律ラベリング・ワークベンチ
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 「電子情報と音声合成について」
- 音声データベース, 及び音声入出力システム評価の国際的協調に関する1994年国際作業部会
- スペクトル傾斜およびラウドネスに対するストレスの影響