マルチエージェント連続タスクにおける報酬設計の実験的考察 : RoboCup Soccer Keepaway タスクを例として
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, we discuss guidelines for a reward design problem that defines when and what amount of reward should be given to the agent/s, within the context of reinforcement learning approach. We would like to take keepaway soccer as a standard task of the multiagent domain which requires skilled teamwork. The difficulties of designing reward for this task are due to its features as follows: i) since it belongs to the continuing task which has no explicit goal to achieve, it is hard to tell when reward should be given to the agent/s. ii) since it is a multiagent cooperative task, it is hard to decide what is a fair share of reward for each agents contribution to achieve the goal. Through some experiments, we show that the reward design have a major effect on the agents behavior, and introduce the successful reward function that makes agents perform keepaway better and more interesting than the conventional one does. Finally, we explore the relationship between `reward design and `acquired behaviors from the viewpoint of teamwork.
- 2006-11-01
著者
関連論文
- LO-003 グラフ構造に基づくコミュニティ抽出手法(情報システム)
- ネットワーク生成モデルを用いたコミュニティ抽出法の考察
- 最小カットを用いたネットワーククラスタリング手法の考察
- マルチエージェントシステムのための階層型モジュール強化学習
- マルチエージェント連続タスクにおける報酬設計の実験的考察 : RoboCup Soccer Keepaway タスクを例として
- エージェント間の相互作用 : 望ましい関係性の創発
- 4ZA-3 交通流制御のための情報提供戦略の学習(交通管理,学生セッション,ネットワーク,情報処理学会創立50周年記念)
- 道路ネットワークの変化に対する経路選択の学習