OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
スポンサーリンク
概要
- 論文の詳細を見る
強化学習法は, 様々な状況に柔軟に適応するエージェントの有力な学習メカニズムとして注目されている.しかしながら, エージェント間での相互依存性のあるマルチエージェント環境では, 各エージェントへの適切な目標設定を行うのが困難であるので, 他のエージェントらとの相互作用をどう調整するかを扱う, 能動的かつ相互作用的な学習機能が必要となる.そこで本論文では, まず, 強化学習エージェントの学習目標がコミュニケート可能な強化信号であるとみなし, エージェント間でそれらを相互作用的に生成, 調整するための新しいマルチエージェント強化学習の枠組みを提案する.そして, 学習の目標と評価基準の自律生成の課題について議論する.
- 2000-07-12
著者
関連論文
- エージェント-環境間相互作用 : 強化学習の立場からの再考
- AIもズルや言い訳に熟達すべきか?(編集委員2007年の抱負)
- LC学習 : モデルに基づく段階的平均報酬強化学習手法
- LC学習:モデルに基づく段階的平均報酬強化学習手法
- Undiscounted Prioritized Sweeping:最適政策の優先順位付け強化学習の効率化手法
- RAE-PIA:複数報酬環境下における最適政策の効率的強化学習
- 2000-ICS-121-14 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- OFS2000-29 / AI2000-31 強化信号のコミュニケーションに基づくマルチエージェント強化学習
- RAE-PIA : 報酬獲得効率を最大化する政策の強化学習
- RAE-PIA:報酬獲得効率を最大化する政策の強化学習
- 多戦略学習手法MS-RL : 環境変動下におけるロバストな学習エージェントの実現
- 未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
- 未来開拓谷内田プロジェクト : インタラクションによる感性創発世界の構築
- ヒューマノイドの為の目標生成
- 人間と擬人化エージェントによるマインドマッピングの相互適応(IDEA: 適応のためのインタラクション設計)
- 人間とペットロボットの相互適応 : AIBOをしつける
- Self-Rewarded RAE:学習の合理性と高速性とを両立させた経験強化型学習法
- Self-Rewarded RAE : 学習の合理性と高速性とを両立させた経験強化型学習法
- 人間とペットロボットの相互適応--AIBOをしつける (小特集 「ヒューマンエージェントインタラクション」および一般)
- 行為の同型性に基づく強化学習法
- 視線行動の可視化による着眼スキル伝達支援
- 視線情報の可視化・共有による感性インタラクション支援(未来開拓谷内田プロジェクト-人間情報の可視化とインタラクション支援)
- インタラクション支援のための視線可視化方法の検討 : 発想支援システム"ミラーエージェント"の構築に向けて
- 情報量を考慮した関係記述の類似度に基づく家の初期構造概念の学習
- 背景知識に基づく家の構造概念の学習
- 関係の類似度に基づく家の構造概念の学習
- 人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザーモデルの推定
- 人間-エージェント間での読心ゲームにおける言い当て行動系列に依存したユーザモデルの推定
- 適応型模倣による複数個体の強化学習
- 模倣と自己主張に基づく行動の学習 : 集団における協調行動の生成
- 実例と教示による物体形状の概念学習 : 定量3D情報から定性値表現へ
- 抽象化副報酬の自動生成による実ロボット強化学習の高速化
- 経験型強化学習における仮想個体から実ロボットへの学習行動の伝播
- 人間と擬人化エージェントによる感情マッピングの相互学習 (特集 HAI(Human-Agent Interaction)および一般発表) -- (HAIセッション1 感情と表情)
- 逐次的学習法における時系列学習データ分布の変動点推定
- 種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
- 種を単位とした適応度評価による利他的コミュニケーションの進化的獲得
- 種を単位とした適応度評価による個体間の協調行動の進化
- 強化学習における時系列学習データ分布の変動点推定
- 視覚からのモデルと概念の学習
- 中学生の保護者を取り込む体験入学の実施ー名作ゲーム開発疑似体験を通してー
- Squeakを用いた小中学生のためのプログラミング講座ー奈良高専情報工学科公開講座ー