不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用

概要

論文の詳細を見る
システムからの音声応答を遮ってユーザから入力可能な不特定話者音声自由対話システムTOS-BURG2について述べる.先に試作した音声対話システムTOSBURGでは,キーワードに基づく連続音声理解と,マルチモーダル応答により,自由発話に基づく対話を実現した.更に,TOSBURG2ではより自由でテンポの良い対話を実現するため,入力音声信号に重畳した音声応答成分を騒音の能動制御技術によりキャンセルし,システムの音声応答中にでもユーザからの割込み入力が可能となった.また,音声認識精度向上のため,雑音下のキーワード検出に有効であった雑音免疫学習を拡張し,音声応答キャンセル後の残差成分を含む音声入力に対応できるよう改良した.音声応答キャンセルと雑音免疫学習の効果を評価するため,キーワード49単語を含む350文を成人男性5名が発声した音声データにシステムの音声応答を重畳させて実験を行い,SN比15dBの環境で,音声応答キャンセルと雑音免疫学習を行うことにより,キーワード検出率,付加誤り率,音声理解率が,それぞれ58.8%,24.1FA / H / W(False Alarns / Hour / Word),27.8%から,89.6%,15.4FA / H / W,58.4%に向上した.また,試作した実時間システムを用いて対話実験を行い,本システムの有効性を確認した.
社団法人電子情報通信学会の論文
1994-02-25

不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用

スポンサーリンク

概要

著者

関連論文

スポンサーリンク