様々な音声表現を実現できる音声作成ツール : Speed97

概要

論文の詳細を見る
音声作成ツール(<Spe>___-ech <ed>___-itor 97)を開発した。本システムは、グラフィカルユーザインタフェース(GUI)を用いて、音声合成のパラメータが操作できるものであり、その目的は、従来のTTSでは不可能であったきめ細かな制御を可能とし、多種多様な品質や表情で音声を合成することにある。操作法には、漢字かな混じり文、アクセント型等をテキストベースで修正するモードと、音声のパワー、基本周波数、継続時間をパラメータレベルで修正するモードとがある。UNIX上とWindows95上で動作している。Speed97で作成された音声は、音声信号と音素記号等との対応が明確になっているため、他のメディアとの同期が容易にとれる等のメリットがある。また、Speed97は、音声ガイダンスの作成等の音声メッセージの作成ばかりでなく、例えば、感情を込めてせりふを読ませるなどして演技させることも可能である。さらに、Speed97で作成された音声は、1kbit/s以下の高能率音声符合化音声として利用することも考えられる。
一般社団法人情報処理学会の論文
1997-07-18