適応的モデル複雑度に基づくモジュール強化学習

スポンサーリンク

概要

論文の詳細を見る
ロボット等を取り巻く実世界の環境は一般に非定常であり,最適制御は時々刻々と変化する.定常なマルコフ決定過程を仮定する強化学習に基づいて,このような非定常な制御法を学習することは困難である.近年,非定常環境を複数の定常環境の重ね合わせと仮定し,各環境を予測器-制御器対のモジュールを用いて近似する強化学習法が注目を集めている.この方法では,学習に用いるモジュールの数を学習前に決めておく必要があるが,モジュール数を不適切に選択すると,学習の遅延や制御の悪化が引き起こされる.そこで本研究では,学習と並行して適切なモジュール数の探索を行うモデルを提案する.計算機実験により,提案手法が従来手法よりも高速,かつ,安定した学習を実現できることを示す.
2009-03-04

著者

関連論文

もっと見る

スポンサーリンク