Reinforcement Learning Based on Intrinsic Motivation and Temporal Abstraction via Transformation Invariance
スポンサーリンク
概要
- 論文の詳細を見る
Bottom-up processes have received much attention in unsupervised and developmental learning research domain. In contrast, effectiveness of top-down deeming on acquisition of adaptive behavior is discussed in this paper. Successful experience in the past, or a skill that could be expected to be reused successfully in a novel environment is stored in memory. Then abstract environment recognition via geometric transformation invariance is introduced to measure the reproducibility of executed skill in a novel environment. Additionally, reproducibility of skill in the environment is utilized to make up intrinsic motivation that drives the agent to active conceptualization of search space. It enables the agent to relativize current skill execution robustly in diverse environments. Useful characteristics of top-down deeming process are implemented on reinforcement learning and discussed through simulation experiments in grid world. The results demonstrate acceleration of learning progress by active conceptualization of environment. Additionally, it is shown by experiments for scaled environment that subjective anticipation could bring in consistent strategy of exploration and exploitation. Eligibility trace is also introduced for skill utility problem and it is shown that the traces regarding actions and skills could preserve learning performance for diverse skill settings.
著者
関連論文
- 自律分散ロボットシステム及び空間知能化技術による分散センシングとサービス応用(学生/教養のページ)
- 形状歪み補正を利用した表及びグラフを含んだ書籍の音読(学生研究発表会)
- Visual SLAMを用いたステレオカメラ搭載2足歩行ロボットによる動作計画と移動(学生研究発表会)
- 画像群を用いた移動カメラの位置姿勢推定による任意視点画像の生成(学生研究発表会)
- 全方位画像中の特徴点と直線エッジの同時拘束と基線長の自動決定に基づくStructure from Motionによる三次元環境モデル生成
- 災害・事故対応に求められるロボット技術
- 全方位画像中の特徴点と直線エッジの同時拘束と基線長の自動決定に基づくStructure from Motionによる三次元環境モデル生成
- 画像群を用いた移動カメラの位置姿勢推定による任意視点画像の生成
- 形状歪み補正を利用した表及びグラフを含んだ書籍の音読
- Visual SLAM を用いたステレオカメラ搭載2足歩行ロボットによる動作計画と移動
- サービスのグローバル展開に関する一考察 : 中国のホテル接遇サービスにみる文化的影響を中心に
- サービス工学とサービスロボティクス
- Collision Avoidance of Mobile Robot Based on Prediction of Human Movement According to Environments
- Reinforcement Learning Based on Intrinsic Motivation and Temporal Abstraction via Transformation Invariance
- プロジェクタ・カメラシステムを用いたテクスチャマッピングと点滅表示による色情報提示(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 車載カメラ画像からの視点変更画像生成に関する検討(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 距離画像によるヒューマノイドの位置姿勢計測(若葉研究者の集い4,サマーセミナー2013〜画像処理の理論と実際〜)
- 画像技術の実利用の現状と展望
- 日本ロボット学会の次世代構想
- 座面高と速度の異なるヒト起立動作における筋シナジー解析
- 災害現場へのロボット技術の適用
- サービスのグローバル展開に関する一考察 : 中国のホテル接遇サービスにみる文化的影響を中心に