- 論文の詳細を見る
This paper describes speech as a three-part process, portraying meaning through the intersection of text and voice. We distinguish the language-specific aspects of a spoken utterance from the speaker-specific characteristics of the voice, and show how these can be integrated, even for multi-lingual utterances, using a basic synthesis engine that remains flexible and free of language or speaker dependencies. We present a method for labelling a corpus of speech so that it can be re-cycled to produce novel utterances reproducing the speaking style and voice characteristics of the recorded speaker. In addition, the paper discusses the use of non-speech sounds that are common in spoken conversation and proposes that these may be an essential part of the perceived naturalness of speech. It suggests that future interfaces using speech synthesis may benefit from the controlled use of such non-speech noises as laughter and audible breaths to ease the interaction with a human user.
- 一般社団法人情報処理学会の論文
- 1997-02-07
- 大阪方言自然発話音声への ToBI の検討
- 韻律を用いた発話タイプの識別
- 日英音声翻訳システム ATR MATRIX
- 音声合成のための規則とデータの表現, 獲得, 評価(音声情報処理 : 現状と将来技術論文特集)
- 音声合成CHATRのしくみ
- 親しみやすいコンピュータ音声合成
- 親しみやすいコンピュータ音声合成
- 英語における韻律構造と文法構造の違いについて
- 外国語混合文対応型多言語音声合成方式の開発
- 日本語文音声における韻律情報と焦点の検討
- 音声波形接続型音声合成のための物理的距離関数
- 音声波形接続合成専用テキストのデータベース作成について
- 波形接続型音声合成システムにおけるアクセント型を考慮した音素単位選択
- 感情表現が可能な合成音声の作成と評価 (ヒューマンインタフェースとインタラクション)
- 日本語文音声における音素継続時間長とfocusの検討
- 外国語の音声合成について
- 音素接続部の不連続感を考慮した単位選択について
- 文音声における波形比較による強調抽出
- 入力音声の韻律を用いた音声合成
- 単位選択における音素境界の不連続感の検出及び音声合成への応用
- CHATR : 音声合成データベース処理について
- Tones and Break Indices (ToBI)システムと日本語への適用
- 自然音声の合成への一歩
- CHATR : 自然音声波形接続型任意音声合成システム
- 自動ToBI : 日本語朗読発声用の韻律ラベリング・ワークベンチ
- 韻律を用いたテキスト非限定型発話アクト識別方法
- 「電子情報と音声合成について」
- 音声データベース, 及び音声入出力システム評価の国際的協調に関する1994年国際作業部会
- スペクトル傾斜およびラウドネスに対するストレスの影響