モジュール型強化学習

スポンサーリンク

概要

論文の詳細を見る
複雑な制御を単純な制御の組み合わせで学習するモジュール型強化学習を提案する。モジュール型強化学習システムは制御モジュールと制御モジュールを選択する選択モジュールからなり、選択モジュールは制御対象の状態に応じて適切な制御モジュールを選択する。制御モジュール・選択モジュールはともにQ学習で制御を学習する。本報告ではモジュール型強化学習をKheperaロボットのゴールへの移動制御、対象物の収集制御に適用した結果を報告する。制御モジュールには制御対象の状態を表す入力の一部を入力し、選択モジュールには制御モジュールで計算されるQ値の最大値か最小値を入力した。モジュール化により入力空間を減少させることができるので、上記の制御を従来の強化学習より効率よく学習することができた。
社団法人電子情報通信学会の論文
1998-03-19

著者

山田訓
三菱電機先端技術総合研究所

関連論文

スポンサーリンク