Hyper-cubic Function Approximation for Reinforcement Learning Based on Autonomous-Decentralized Algorithm
スポンサーリンク
概要
- 論文の詳細を見る
Adaptive resolution of function approximator is known to be important when we apply reinforcement learning to unknown problems. We propose to apply successive division and integration scheme of function approximation to Temporal Difference learning based on local curvature. TD learning in continuous state space is based on non-constant value function approximation, which requires the simplicity of function approximator representation. We define bases and local complexity of function approximator in the similar way to the autonomous decentralized function approximation, but they are much simpler. The simplicity of approximator element bring us much less computation and easier analysis. The proposed function approximator is proved to be effective through function approximation problem and a reinforcement learning common problem, pendulum swing-up task and acrobot stabilizing task.
- 公益社団法人 計測自動制御学会の論文
著者
関連論文
- 車載カメラ画像からの視点変更画像生成に関する検討 (メディア工学 サマーセミナー2013 : 画像処理の理論と実際)
- 強化学習による物体識別のための探索行動の獲得
- 屋外不整地環境における無人車両のための走路判別
- 屋外不整地環境における無人車両のための走路判別 (特集 画像技術の実利用)
- プロジェクタ・カメラシステムを用いたテクスチャマッピングと点滅表示による色情報提示(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- マニピュレータに搭載したレーザレンジファインダを用いた透明容器中の液中物体の3次元形状計測
- 車載カメラ画像からの視点変更画像生成に関する検討(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 距離画像によるヒューマノイドの位置姿勢計測(若葉研究者の集い4,サマーセミナー2013〜画像処理の理論と実際〜)
- 1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
- State and Action Space Construction Using Vision Information.
- ステレオカメラを用いた視覚障碍者のためのタッチパネル操作支援システム
- 1A1-O09 教示データからの特徴空間の構成にもとづく力覚情報を用いた抱え上げ行動の生成(進化・学習とロボティクス)
- 1A1-O07 局所線形埋め込みを用いたロボット動作のための視覚特徴空間の生成(進化・学習とロボティクス)
- 群口ボットによる協調捕獲行動の自律分散制御
- Hyper-cubic Function Approximation for Reinforcement Learning Based on Autonomous-Decentralized Algorithm
- Function Approximation for Reinforcement Learning Using Autonomous-Decentralized Algorithm.