2000-SLP-32-4 複数話者の発話が混在する発話系列を用いた対話理解
スポンサーリンク
概要
- 論文の詳細を見る
本報告では対話理解に関する理解規則の新しい記述方法について述べる.本手法は話者識別情報を含む任意長の入力発話系列に付して対話理解規則が適用される点に特徴がある.任意長の発話系列に対する理解規則の集合による対話記述は非決定性オートマトンによる対話記述となり, 入力発話に対し決定的な状態遷移を行う対話記述に比べ簡素な対話記述が可能となる.また, 対話システム自体を対話参加者ととらえシステム発話を入力の一部と見なした場合には、ユーザとシステム間のやり取りに関しても簡素な記述で柔軟な対話理解が行われる.本手法は話者数を一般化して, 2名の対話だけでなく3名以上の参加者による多人数対話に対しても対話理解規則の記述が可能である.
- 一般社団法人情報処理学会の論文
- 2000-07-14
著者
-
中野 幹生
日本電信電話株式会社nttコミュニケーション科学基礎研究所
-
中野 幹生
Ntt基礎研究所
-
中野 幹生
Nttコミュニケーション科学基礎研究所
-
相川 清明
東京工科大学
-
宮崎 昇
NTTコミュニケーシュン科学基礎研究所
-
中野 幹生
(株) ホンダ・リサーチ・インスティチュート・ジャパン
-
平沢 純一
Nttコミュニケーションズ株式会社先端ipアーキテクチャセンタ
-
宮崎 昇
日本電信電話株式会社NTTサイバースペース研究所
-
相川 清明
NTTコミュニケーション科学基礎研究所
関連論文
- 音声対話ロボットによる語彙と言い回しの制限がない名称学習(音声,聴覚)
- 複数の言語モデルと言語理解モデルによる音声理解の高精度化(音声認識・理解,情報爆発論文)
- Artificial Subtle Expressionとしての明滅光源による音声対話の円滑化(インタラクションデザイン,人とエージェントのインタラクション論文)
- 4Q-2 音声認識と言語理解を動的に選択する音声理解フレームワーク(音声対話・音声要約,学生セッション,人工知能と認知科学)
- 複数の言語モデル・言語理解方式を用いた音声理解の高精度化(理解)
- ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現(ポスターセッション,第10回音声言語シンポジウム)
- 文書分類手法を応用したインタラクティブプレゼンテーションにおける視聴者発話の理解(音声言語処理)
- 3U-6 インタラクティブなプレゼンテーションでのユーザ発話の自然な制限のための複数エージェントの利用(音声言語情報処理,学生セッション,人工知能と認知科学)
- オブジェクト指向に基づくロボット・エージェントのマルチドメイン対話行動制御モジュール構築ツールRIME-TK
- MFTを用いたロボットの動作中における音声認識