不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用
スポンサーリンク
概要
- 論文の詳細を見る
システムからの音声応答を遮ってユーザから入力可能な不特定話者音声自由対話システムTOS-BURG2について述べる.先に試作した音声対話システムTOSBURGでは,キーワードに基づく連続音声理解と,マルチモーダル応答により,自由発話に基づく対話を実現した.更に,TOSBURG2ではより自由でテンポの良い対話を実現するため,入力音声信号に重畳した音声応答成分を騒音の能動制御技術によりキャンセルし,システムの音声応答中にでもユーザからの割込み入力が可能となった.また,音声認識精度向上のため,雑音下のキーワード検出に有効であった雑音免疫学習を拡張し,音声応答キャンセル後の残差成分を含む音声入力に対応できるよう改良した.音声応答キャンセルと雑音免疫学習の効果を評価するため,キーワード49単語を含む350文を成人男性5名が発声した音声データにシステムの音声応答を重畳させて実験を行い,SN比15dBの環境で,音声応答キャンセルと雑音免疫学習を行うことにより,キーワード検出率,付加誤り率,音声理解率が,それぞれ58.8%,24.1FA / H / W(False Alarns / Hour / Word),27.8%から,89.6%,15.4FA / H / W,58.4%に向上した.また,試作した実時間システムを用いて対話実験を行い,本システムの有効性を確認した.
- 社団法人電子情報通信学会の論文
- 1994-02-25
著者
-
竹林 洋一
(株)東芝研究開発センター
-
竹林 洋一
静岡大学情報学部情報科学科
-
金澤 博史
(株)東芝
-
竹林 洋一
(株)東芝 研究開発センター 情報・通信システム研究所
-
金沢 博史
(株)東芝関西研究所
-
永田 仁史
(株)東芝研究開発センター
-
瀬戸 重宣
(株)東芝研究開発センター((株)日本電子化辞書研究所)
-
永田 仁史
(株)東芝 関西研究所
-
金澤 博史
(株)東芝研究開発センター 川崎市
-
瀬戸 重宣
(株)東芝・関西研究所
-
金沢 博史
(株)東芝 関西研究所
関連論文
- 音声行動コーパスに基づく模倣場面に着目した音声言語獲得過程分析(言語獲得・学習,合成,生成,韻律,一般)
- 音声認識応用に関する学会試行標準
- 7.Bluetoothなどのローカルネットワーク技術(モバイル社会を支える先端技術 : 小型化と使いやすさを極める)
- ユビキタスセンシングによる格闘技の身体および心的モデルの検討(サービス・サービスイメージ)
- NeXT Computerを用いた音声合成実験環境
- 「人間の非論理情報を AIはどう取り扱うか」へのコメントと回答
- 2000-HI-89-6 Bluetoothの開発動向とヒューマンインタフェースへの応用
- キーボード対話からの感情抽出に関する検討
- 計算機との対話のための非言語音声の認識と合成
- 音声自由対話システムTOSBURG II : ユーザ中心のマルチモーダルインタフェースの実現に向けて
- 競合MAP推定法を用いた話者・環境適応学習
- 組織活性化支援のためのマルチモーダルナレッジの活用
- ユビキタス社会に向けた Bluetooth ヘッドセットの開発
- ユビキタス環境における音声対話システムMKIDSの開発
- Bluetoothのウェアラブルコンピューティングへの応用 (特集 新たなワイヤレスの世界を創るBluetoothの展開--ワイヤレスで簡単接続,パーソナルエリアネットワークの世界へ)
- 知識情報共有システム(Advice/Help on Demand)の開発と実践 : 知識ベースとノウハウベースの構築(次世代ヒューマンインタフェース・インタラクション)
- マルチモーダル秘書エージェントシステムの開発
- 知識ベースとノウハウベースの連携による知識情報共有システムの実現
- Advice/Help on Demand : 知識べースとノウハウベースの連携
- キーワードラティスのLR解析による自由発話理解
- コモンHIサービス環境の応用
- コモンHIサービス環境の開発
- コミュニケーション支援のための個人情報公開システムPIP
- 雑音免疫学習を用いたサブワードHMMに基づく雑音環境下の音声認識
- コミュニケーション支援のための個人情報公開システム(PIP) : 音声とキー入力を用いたマルチモーダル対話の検討
- 単語パターン照合と音韻HMMを併用したワードスポッティングに関する検討
- 音声自由対話システムにおける音声応答キャンセル機能の実現
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価
- 音声自由対話システムTOSBURG IIの評価
- 不特定話者音声自由対話システム TOSBURG2 : マルチモーダル応答と音声応答キャンセル利用
- マイクロホンアレイを用いた音声検出に関する検討
- 2chビームフォーマによる雑音抑圧処理に関する検討
- 2チャンネル適応型マイクロホンアレーを用いた音声認識
- ワ-クステ-ションにおける音声認識インタ-フェ-スの実現 (ヒュ-マンインタフェ-ス)
- ソフトウェア音声認識インタフェースの検討
- 実時間音声対話システムTOSBURGの開発(1)システム構成
- 入力モダリティの多様化とその統合・利用について(マルチモーダルIF (1),「マルチモーダルと音声HI」およびヒューマンインタフェース/音声言語情報処理一般)
- 入力モダリティの多様化とその統合・利用について
- ATMSベースのマルチモーダル入力統合方式を用いたインタフェースエージェントシステム
- 音声入出力、タッチジェスチャ入力、およびエージェントCG出力を持つマルチモーダル対話試作システム
- ユビキタス情報環境下のコミュニケーション活性化システムの開発(ヒューマン情報処理及び一般)(ヒューマンコミュニケーショングループ(HCG)大会)
- TX39用音声認識ミドルウエアの開発
- 自動プレゼンテーションシステム(3) : プレゼンテーションの実行
- 自動プレゼンテーションシステム(1) : プレゼンテーションシステムの概要
- 楽器演奏支援のためのウェアラブルインテリジェンスと音声対話(信号処理・符号化・一般)
- 楽器演奏支援のためのウェアラブルインテリジェンスと音声対話(信号処理・符号化・一般)
- 家電連携フレームワークにおけるユニバーサルアクセスの試み
- 文書構造抽出技法の開発
- 2X-9 子供の社会的行動理解のための発達段階別行動シミュレータの検討(人工知能と社会,学生セッション,人工知能と認知科学,情報処理学会創立50周年記念)
- J-006 育児支援のための取り合い場面における幼児の社会的行動モデルの検討(ヒューマンコミュニケーション&インタラクション,一般論文)
- 閉ループ学習に基づく音声素片および基本周波数制御規則の生成
- 代表パターンコードブックを用いた基本周波数制御法
- DSP組み込み可能な省メモリ音声合成方式
- A-10-11 車外音を活用した快走支援音響コンテンツの作成(A-10.応用音響,一般講演)
- HIの高度化を目指したメディア変換機能統合利用環境の構築 : HIウエアの開発
- マルチモーダルインタフェースの技術動向
- ヒューマンインタフェースの立場から : ユーザ中心の情報環境の実現に向けて
- 7. 音声理解と対話における自然言語処理 ( 自然言語処理技術の応用)
- 最適音素系列に基づく競合学習とMAP推定を用いた話者適応
- 複数の座標系による特徴表現を用いたHMM音声認識
- 雑音下の連続音声中からのキーワード検出
- 実時間音声対話システムTOSBURGの開発(3)対話処理
- 実時間音声対話システムTOSBURGの開発(2)音声理解
- 高耐雑音音声認識用アクセラレータの開発
- Bluetooth^ ヘッドフォン
- 競合MAP推定法を用いた雑音環境下での話者適応
- Bluetoothが拓くモバイル・ウェアラブルの世界(モバイル・ウェアラブルインテリジェンス)
- 「人間支援のためのバウンダリーレスなAI研究に向けて」へのコメントと回答 : 回答
- 人間支援のためのバウンダリーレスなAI研究に向けて
- DJインターフェイスを利用した音響環境のデザイン(一般2)(「ユビキタスとセキュリティ」および一般)
- ユニバーサルアクセスを考慮した家電操作マニュアルの検討
- 快走支援のためのマルチモーダルインタフェースとサラウンド感覚の拡張(ホームネットワークと組込みシステム, マルチモーダルインタフェース, ホームネットワーク, ヒューマンインタフェース, 情報家電, アクセシビリティ)
- 快走支援のためのマルチモーダルインタフェースとサラウンド感覚の拡張
- マルチモーダルヘッドセットを用いたうなずき検出と会話の重要箇所把握(一般1)(「ユビキタスとセキュリティ」および一般)
- ユビキタス社会の画像応用から見たセンシング技術への期待 : マルチモーダル知識コンテンツで経済・社会を活性化
- 1. 総論 : 1-1 ヒューマンインタフェースの観点から見た気の利いた情報システム (気の利いた情報システム)
- ディジタルメディア時代のヒューマンインタフェース研究の魅力 (私の研究生活事始め)
- 実時間音声対話システムTOSBURGの開発(4)マルチモーダル応答
- 2.6 ゲームと進化および社会の数理理論的研究 : エンタテインメントコンピューティングの事例(エンタテインメントコンピューティング)
- ヒューマンインタフェースの進化 : 情報処理技術 : 過去十年そして今後の十年
- 音声自由対話システムTOSBURG IIにおけるデータ収集と評価環境
- 音声自由対話システムにおける対話データ収集
- 特集「産学連携論文」・「社会人学生論文」の編集にあたって
- 特集「産学連携論文」・「社会人学生論文」の編集にあたって
- 複数ビームフォーマによる話者追随型マイクロホンアレイに関する検討
- 話者追尾型2chビームフォーマによる雑音抑圧に関する検討
- ブロック対角共分散行列を用いた連続分布型HMMの出力確率計算
- 双方向インターネット・ストリーミングを用いた遠隔地からのライブ出演を実現するコンサート支援システム
- K-033 映像情報の動的構造化とストリーミング配信に関する検討(K分野:ヒューマンコミュニケーション&インタラクション)
- 平成14年度情報学部研究プロジェクト報告 : 英語コミュニケーション環境活性化のためのインタラクション支援プロジェクト
- K-084 プレゼンテーション画面の手頃な手元配信方式の検討(K.ヒューマンコミュニケーション&インタラクション)
- K-081 能動的把握を補助する視覚補償機器(K.ヒューマンコミュニケーション&インタラクション)
- 「人間支援のためのバウンダリーレスなAI研究に向けて」へのコメントと回答
- EDR電子化辞書を用いた音声入力による知的文書作成支援システム
- 音声認識を用いたEDR電子化辞書の評価環境
- ワ-ドスポッティングによる音声認識における雑音免疫学習