Function Approximation for Reinforcement Learning Using Autonomous-Decentralized Algorithm.
スポンサーリンク
概要
- 論文の詳細を見る
The adaptability of resolution to the complexity of approximated function has a great influence on the performance of learning in the function approximation for reinforcement learning. We propose applying the reaction-diffusion equation on a graph to function approximation for reinforcement learning.The function approximator expressed by nodes can change its resolution adaptively by distributing them densely in the complex region of the state space with the proposed algorithm. A function is expressed in a plane. The successive least square method is adopted to approximate the function from the data. Each plane corresponds to a node, which is an element of the graph. Each node moves to diffuse the complexity of the approximated function in the neighborhood based on the reaction-diffusion equation. The complexity of the function is defined by the change of gradient. The simulation shows the two points: 1) The proposed algorithm provides the adaptability for function approximation. 2) The function approximation improves the efficiency of the reinforcement learning.
- 公益社団法人 計測自動制御学会の論文
著者
関連論文
- 車載カメラ画像からの視点変更画像生成に関する検討 (メディア工学 サマーセミナー2013 : 画像処理の理論と実際)
- 強化学習による物体識別のための探索行動の獲得
- 屋外不整地環境における無人車両のための走路判別
- 屋外不整地環境における無人車両のための走路判別 (特集 画像技術の実利用)
- プロジェクタ・カメラシステムを用いたテクスチャマッピングと点滅表示による色情報提示(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- マニピュレータに搭載したレーザレンジファインダを用いた透明容器中の液中物体の3次元形状計測
- 車載カメラ画像からの視点変更画像生成に関する検討(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 距離画像によるヒューマノイドの位置姿勢計測(若葉研究者の集い4,サマーセミナー2013〜画像処理の理論と実際〜)
- 1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
- State and Action Space Construction Using Vision Information.
- ステレオカメラを用いた視覚障碍者のためのタッチパネル操作支援システム
- 1A1-O09 教示データからの特徴空間の構成にもとづく力覚情報を用いた抱え上げ行動の生成(進化・学習とロボティクス)
- 1A1-O07 局所線形埋め込みを用いたロボット動作のための視覚特徴空間の生成(進化・学習とロボティクス)
- 群口ボットによる協調捕獲行動の自律分散制御
- Hyper-cubic Function Approximation for Reinforcement Learning Based on Autonomous-Decentralized Algorithm
- Function Approximation for Reinforcement Learning Using Autonomous-Decentralized Algorithm.