対話システムにおける強化学習の一般化手法を用いたユーザフィードバックの改善
スポンサーリンク
概要
- 論文の詳細を見る
対話システムにおいて, 効率的でユーザに使いやすい対話戦略のデザインは重要な問題である.従来より強化学習を用いた機械学習によるアプローチが提案されている.強化学習を用いた対話戦略の最適化は, ユーザからの定性的なフィードバックだけを用いて対話システムの最適化が行えるという特徴を持つ.しかし, 学習のために大量のデータが必要なため, データ収集のコストが大きい.このため, 訓練データを効率的に用いるような学習方法が望ましい.本稿では, 近似解を見つけ, 効率的に学習を行うことのできるような2つの強化学習の手法を提案する.この2つの手法を用いて対話システムの最適化を行い, そのシステムへのユーザのフィードバックを比較した.どちらの手法も最適化を行わなかったシステムに比べてユーザのフィードバックを改善することができた.
- 2005-02-04
著者
-
堂坂 浩二
日本電信電話(株) Nttコミュニケーション科学基礎研究所
-
Denecke Matthias
日本電信電話(株), NTTコミュニケーション科学基礎研究所
-
Denecke Matthias
日本電信電話(株) Nttコミュニケーション科学基礎研究所
関連論文
- 思考喚起型多人数対話システム--キャンプ
- 音声対話によるテキスト内容の伝達方法
- TV番組の録画予約を受け付ける実時間音声対話システム
- 多重文脈を用いた逐次的な発話理解
- 聞き役対話システムの構築を目的とした聞き役対話の分析
- 確認対象ごとの認識性能を考慮する効率的対話制御法(音声対話・翻訳)
- 単一ドメインシステムの統合による複数ドメイン音声対話システム
- 2つの認識文法を用いた主導権混合型対話制御
- 2つの認識文法を用いた主導権混合型対話制御
- システム知識制限下での効率的音声対話制御法
- 確認対象での認識性能を考慮する効率的対話制御法
- 対話コスト最小化に基づく効率的対話制御
- 対話コスト最小化に基づく効率的対話制御
- SA-7-4 音声対話システム「飛遊夢(ひゅうむ)」
- タスク適応型高効率対話制御法
- システム知識制限下における効率的対話制御
- POMDPによるTrigram対話制御 (音声)
- POMDPによるTrigram対話制御 (言語理解とコミュニケーション)
- 対話データの統計量を用いたPOMDPによる対話制御(対話,第11回音声言語シンポジウム)
- 対話データの統計量を用いたPOMDPによる対話制御
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- POMDPを利用した思考喚起型対話の制御(対話,第10回音声言語シンポジウム)
- まつしゅるーむの世界 : 環境知能の実現
- まっしゅるーむの世界--知能統合の実現に向けて (特集 コミュニケーション環境の未来に向けた研究最前線)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア解理・言語理解,ヒューマンインタラクションとパターン認識・メディア解理・言語理解,一般)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 環境知能の実現に向けた分野横断型研究の試み : 新しい「環境」における新しい「知」へ(ヒューマンインタラクションとパターン認識・メディア理解・言語理解)
- 妖精・妖怪の復権 : 新しい「環境知能」像の提案(優秀論文賞,情報処理学会創立45周年記念「50年後の情報科学技術をめざして」記念論文)
- 「環境知能シンポジウム2006--知性の森が織りなす未来」開催報告
- R&Dホットコーナー 「環境知能」プロジェクトの進展
- 対話システムにおける強化学習の一般化手法を用いたユーザフィードバックの改善
- 対話システムにおける強化学習の一般化手法を用いたユーザフィードバックの改善
- スムーズに対話する仕組み (特集 人間情報科学が切り拓くコミュニケーションの未来)
- 大規模テキストコーパスを用いて未知語に対処する対話システム(音声対話システムA)(テーマ:音声対話システム、音声言語情報処理、一般)
- 決定木を用いた未知語属性推定による効率的対話方法
- 音声対話における実例に基づく未知語属性推定
- 音声対話における実例に基づく未知語属性推定
- 人とコンピュータの自然な音声対話を目指して (特集論文1 人にやさしい対話型コンピュータ)
- 音声対話システムの言語・対話処理(音声言語インタフェースの実用化と音声言語対話への展開)
- アクション継続長制御を利用するPOMDP対話制御
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- POMDPによるTrigram対話制御(対話,第12回音声言語シンポジウム:情報アクセス,音声・言語処理一般)
- 対話行為タイプ列Trigramによる行動予測確率に基づくPOMDP対話制御(対話生成,人とエージェントのインタラクション論文)
- 人ロボット共生におけるコミュニケーション戦略の生成
- 聞き役対話の分析および分析に基づいた対話制御部の構築