表現力豊かな合成音声を生成するための記述言語MSCLの構想
スポンサーリンク
概要
- 論文の詳細を見る
多種多様な感情を含み表現力豊かな合成音声メディアの作成・編集を可能にする階層型合成音声制御記述言語MSCL(Multi-layered Speech/Sound Synthesis Control Language)を提案[1]している. MSCLは, 音声合成に関する知識を持たないユーザであっても容易に対話口調, あるいは, 多種多様の感情を含んだ合成音声を作成できる記述言語である. また, 合成音声との同期が必要な場合は, きめ細かな時間長制御も可能にする. MSCLは3つの階層構造を持っており, "賛同"や"嘆き"といった意味的な記述レベルであるS層, 音韻特徴の記述レベルである I層, そして, 音韻毎のピッチやパワーなどのより詳細な韻律制御パラメタを持つP層に分れている。本報告では, I層のためのピッチパターンに関する幾つかの基本的な韻律制御方法を合成音声を用いて検討した. また, 各韻律制御方法および制御方法の組み合わせによる聴覚的な効果を聴取評価実験によって明らかにした. この結果, ピッチパターンの制御によって多彩な感情を表現できることが分った. 制御方法の組み合わせによって表現できる感情を制御コマンドとし, S層への導入を検討した.
- 一般社団法人情報処理学会の論文
- 1997-07-18
著者
関連論文
- 音声認識を用いたマルチメディアコンテンツのインデクシング
- 音声メッセージ制作支援ツールSesign (特集論文2 コンテンツ流通基盤技術)
- 音声デザインツールSesign
- 音声作成ツール : Sesign99
- 音声メッセージ制作システムSesign99 (特集 ここまできた音声認識・音声合成)
- WebMessenger:合成音声と動画像テンプレートを利用したコンテンツ制作フレームワーク
- 音声表現力と制作効率を向上させた音声作成ツール-Sesign98-
- ハイブリッドスケーラブル型音声合成方式
- 韻律データベースを利用した基本周波数パタン制御
- 韻律データベースを利用した基本周波数パタン変形方式
- 雑音の統計的分布を用いた音声区間検出
- 環境依存型合成単位を用いた規則合成法および合成単位数とその品質評価
- 合成単位数の削減と合成音声の品質の関係
- K-36 音声強調に着目したマルチメディアコンテンツ要約技術(マルチメディア・仮想環境基礎2,K.ヒューマンコミュニケーション&インタラクション)
- 様々な音声表現を実現できる音声作成ツール : Speed97
- D-14-19 ニュースコンテンツにおける音響信号自動判別の検討
- 階層型合成音声制御記述言語MSCL : (Multi-layered Speech/Sound Synthesis Control Language)の構想
- 歌声合成システム : CyberSingers
- 音声合成を制御する記述言語
- 歌声音声合成システム:CyberSingers (特集 ここまできた音声認識・音声合成)
- コンテンツ作成ツールとしての合成音声記述言語MSCL
- 音声処理技術を利用した音声コンテンツ制作
- コンテンツ作成ツールとしての合成音声記述言語MSCL
- 音声処理技術を利用した音声コンテンツ制作
- 歌声合成システム
- 歌声合成システム
- 合成音声制御のための階層型記述言語MSCL
- 表現力豊かな合成音声を生成するための記述言語MSCL
- 音声合成のための韻律制御コマンド作成方法の検討
- 表現力豊かな合成音声を生成するための記述言語MSCLの構想
- スペクトルの動的および静的特徴量を用いた言語音声の検出
- B-18-34 電波強度を用いた屋内におけるユーザ位置推定手法の提案(B-18.知的環境とセンサネットワーク,一般セッション)
- ズボンのポケットに収納したスマートフォンによる歩容解析方法に関する検討