様々な音声表現を実現できる音声作成ツール : Speed97
スポンサーリンク
概要
- 論文の詳細を見る
音声作成ツール(<Spe>___-ech <ed>___-itor 97)を開発した。本システムは、グラフィカルユーザインタフェース(GUI)を用いて、音声合成のパラメータが操作できるものであり、その目的は、従来のTTSでは不可能であったきめ細かな制御を可能とし、多種多様な品質や表情で音声を合成することにある。操作法には、漢字かな混じり文、アクセント型等をテキストベースで修正するモードと、音声のパワー、基本周波数、継続時間をパラメータレベルで修正するモードとがある。UNIX上とWindows95上で動作している。Speed97で作成された音声は、音声信号と音素記号等との対応が明確になっているため、他のメディアとの同期が容易にとれる等のメリットがある。また、Speed97は、音声ガイダンスの作成等の音声メッセージの作成ばかりでなく、例えば、感情を込めてせりふを読ませるなどして演技させることも可能である。さらに、Speed97で作成された音声は、1kbit/s以下の高能率音声符合化音声として利用することも考えられる。
- 一般社団法人情報処理学会の論文
- 1997-07-18
著者
-
水野 秀之
Nttヒューマンインタフェース研究所
-
阿部 匡伸
NTTヒューマンインタフェース研究所
-
中嶌 信弥
NTTヒューマンインタフェース研究所
-
水野 秀之
NTTインテリジェントテクノロジ
-
水野 秀之
Ntt サイバースペース研
-
水野 秀之
日本電信電話株式会社 Nttサイバースペース研究所
関連論文
- 自動ラベリングのためのHMM学習データ量の検討
- 形態素・音韻連鎖を考慮した音声合成コーパス用文セット生成の検討
- HMM音素モデルによる自動ラベリングのロバスト性の検討
- 音声メッセージ制作支援ツールSesign (特集論文2 コンテンツ流通基盤技術)
- コーパスを用いた歌唱ピッチパタンの自動生成
- 音声デザインツールSesign
- テンプレート・テキスト合成方式とCGキャラクタエージェントWebMessengerを用いたコンテンツ制作
- 対話型自動プレゼンテーションシステム
- マルチフォームユニットによるテキスト音声合成システム
- 音声作成ツール : Sesign99
- 躍動感のある音声合成インタフェースとCAIシステムへの応用 (特集 ここまできた音声認識・音声合成)
- 音声メッセージ制作システムSesign99 (特集 ここまできた音声認識・音声合成)
- WebMessenger:合成音声と動画像テンプレートを利用したコンテンツ制作フレームワーク
- 音声表現力と制作効率を向上させた音声作成ツール-Sesign98-
- CAIシステムの内部状態を合成音声によって伝達する方法の検討
- CALTURE : 合成音声を用いてインタラクティブに教示するペン習字CAIシステム
- 合成音声によるインタラクティブな教示音声をCAIシステムへ導入するための検討
- 合成音声によるリアクションがユーザーに与える印象について -合成音声の韻律と印象との関係-
- ハイブリッドスケーラブル型音声合成方式
- 規則合成音声で躍動感を実現する方略について
- コーパスベースアプローチによるテキストからの音声合成 (特集 簡単,快適,便利なコミュニケーション環境のための音声・音響処理技術)
- 韻律データベースを利用した基本周波数パタン制御
- 韻律データベースを利用した基本周波数パタン変形方式
- 環境依存型合成単位を用いた規則合成法および合成単位数とその品質評価
- 波形合成法を用いたテキスト音声合成ソフトウェア(FLUET)
- 合成単位数の削減と合成音声の品質の関係
- 狭帯域音声からの擬似広帯域音声の生成法 (特集論文 テキスト音声合成とその多様化技術)
- コードブックマッピングによる狭帯域音声から広帯域音声の生成法
- 音節区分化モデルに基づく基本周波数の2階層制御方式
- 異なる発話様式の特徴分析
- STRAIGHTによる音素片の韻律変形と音質の関係
- テキスト音声合成を用いた遠隔からのデータベースアクセスシステム
- 超高品質音声合成技術による情報案内システム (特集 ここまできた音声認識・音声合成)
- 様々な音声表現を実現できる音声作成ツール : Speed97
- 極相互の相関を考慮したホルマント周波数変換法
- フォルマント周波数とスペクトル傾斜の線形区分化規則による声質変換
- 基本周波数に応じてスペクトル包絡を変形するテキスト音声合成システム
- F_0に応じてスペクトル包絡を変形する音声合成方式の規則合成システムへの適用
- 基本周波数に応じてスペクトル包絡を変形する音声合成法式
- 帯域分割したスペクトル包絡のノン・パラメトリックな変形による声質変換
- 発話様式が制御可能な音声規則合成方式 (特集論文 テキスト音声合成とその多様化技術)
- 階層型合成音声制御記述言語MSCL : (Multi-layered Speech/Sound Synthesis Control Language)の構想
- 歌声合成システム : CyberSingers
- 音声合成を制御する記述言語
- コンテンツ作成ツールとしての合成音声記述言語MSCL
- 音声処理技術を利用した音声コンテンツ制作
- コンテンツ作成ツールとしての合成音声記述言語MSCL
- 音声処理技術を利用した音声コンテンツ制作
- 歌声合成システム
- 歌声合成システム
- 表現力豊かな合成音声を生成するための記述言語MSCL
- 基本周波数とスペクトルの漸次変形による音声モーフィング
- 異なる発話様式の特徴分析とその制御
- 表現力豊かな合成音声を生成するための記述言語MSCLの構想
- コーパスベース音声合成における音声合成単位とコーパスの設計方法(チュートリアル: 音声収録から始めるコーパスベース音声合成, 一般, チュートリアルレクチャー)
- COC音声合成ボ-ド (音声音響情報処理の研究・開発)
- 波形処理による声質変形装置(VarioVoice)
- 誤り指示音声の特徴分析と音声出力への適用
- 呼びかけ音声のバリエーションとその韻律的特徴
- 話者間距離と音声モーフィング効果の関係
- 発話様式のバリエーション (<小特集>声質:音声言語の多様性に迫る)
- 基本周波数とスペクトルの漸次変形による音声モーフィング
- 誤り指示音声の特徴とその効果
- 電話音声の擬似広帯域化処理装置
- 音声変換処理技術 : 基本周波数、継続時間、声質に関して
- 日本語テキスト音声合成用記号の標準化
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測(音声合成,第13回音声言語シンポジウム)
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 表現豊かな音声合成の為のテキストからの句末音調ラベルの予測
- 強調音声合成のための局所韻律コンテキスト自動付与の検討(一般,音声知覚生成/聴覚コミュニケーション,一般)
- 雑音重畳音声の聞き取りやすさと音響特徴量の関係の分析(一般,音声知覚生成/聴覚コミュニケーション,一般)
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- テキストからの表現豊かな音声合成のための句末上昇ラベル予測における句末コンテキストの利用
- 多様な韻律生成のための多クラス局所韻律コンテキストの検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)