探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案
スポンサーリンク
概要
- 論文の詳細を見る
We propose a new strategy for parallel reinforcement learning ; using this strategy, the optimal value function and policy can be constructed more quickly than by using traditional strategies. We define two types of agents : the exploitation agents and the exploration agents. The exploitation agents select actions mainly for exploitation, and the exploration agents concentrate on exploration using the extended k-certainty exploration method. These agents learn in the same environment in parallel and combine each value function periodically. By using this strategy, the construction of the optimal value function is expected, and the optimal actions can be selected by the exploitation agents quickly. The experimental results of the mobile robot simulation showed the availability of our method.
- 2008-03-25
論文 | ランダム
- 福島県における周産期医療の現状 -総合周産期母子医療センターの開設にあたって-
- 169) 大動脈狭窄症と卵円孔開存を合併したNoonan症候群の1例(第104回日本循環器学会近畿地方会)
- 妊娠による母体-胎児間の同種免疫反応および免疫寛容現象に関する検討 : 第2報
- 134) 潜在性左室流出路狭窄を有し,失神を呈した心尖部肥大型心筋症の一例(第104回日本循環器学会近畿地方会)
- 慢性心不全 (特集 内科必携画像診断--Imaging Revolution) -- (循環器)