共進化を用いた強化学習に関する研究

スポンサーリンク

概要

論文の詳細を見る
強化学習は未知の環境に対し、動的計画法に基づいて行動戦略を獲得する有効な手段である。しかし、対象環境が他者の行動の結果により変動し、行動選択の有用度が変化する動的環境では単に強化学習の枠組みを適用しただけでは不十分である。本論文はこのような動的環境において、複数エージェント同士が同降に学習することによってより環境に適応したルールを獲得できる手法を提案する。具体的にはQ-Learningの強化学習に、生物学におけるCo-Evolution(共進化)の概念を導入させ、エージェント同士を相対的に評価する相互評価型強化学習を提案する。計算機実験として簡単な格子空間に存在する複数のエージェントを設定し、本提案法により従来の強化学習では得られないルール、ここでは状態行動対がエージェント間の共進化によって得られることを検証し、本提案手法の有効性を確かめる。
社団法人電子情報通信学会の論文
1994-09-26

著者

関連論文

もっと見る

スポンサーリンク