探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案
スポンサーリンク
概要
- 論文の詳細を見る
We propose a new strategy for parallel reinforcement learning ; using this strategy, the optimal value function and policy can be constructed more quickly than by using traditional strategies. We define two types of agents : the exploitation agents and the exploration agents. The exploitation agents select actions mainly for exploitation, and the exploration agents concentrate on exploration using the extended k-certainty exploration method. These agents learn in the same environment in parallel and combine each value function periodically. By using this strategy, the construction of the optimal value function is expected, and the optimal actions can be selected by the exploitation agents quickly. The experimental results of the mobile robot simulation showed the availability of our method.
- 2008-03-25
論文 | ランダム
- 4月 公募地方債発行条件 表面利率、0.96~1.068%に低下
- 第56回新槐樹社展 (公募展便り)
- 第64回立軌展 (公募展便り)
- POLITICS 求める人材と就任する人材とのギャップ 大学学長を世界から公募 グローバル化と問題点
- 3月 公募地方債発行条件 表面利率、0.98~1.082%に上昇