実環境内におけるロボットの Q-learning とその行動政策の逐一修正の検討

スポンサーリンク

概要

論文の詳細を見る
本論文では, 実環境内においてのQ-learningで得た行動政策を, 同じく実環境内に加えて, 異なる環境においての学習に使用し, それを逐一修正していくことによって環境の変化に適応する手法を検討する.これにより, 実時間上・多環境においてロボットが学習を行う際の多大な学習・試行回数と記憶容量と時間の削減につながる.
2005-03-22

著者

関連論文

もっと見る

スポンサーリンク