主観報酬を用いた強化学習における人間の教示特性に関する考察
スポンサーリンク
概要
- 論文の詳細を見る
This note presents an application of reinforcement learning to caterpillar robot locomotion. An excellent advantage of reinforcement learning is that an action can be acquired using only a simple reward. In our previous work, the reward was a forward distance measured using a sensor. This reward was completely an "Objective reward". On the other hand, we have studied using the rewards given by the human's subjective judgment, which is defined as a "Subjective reward". As a result, the "Subjective reward" gave better results than that of the "Objective reward" under specific conditions. The main purpose of this study is to investigate the teaching methods of human being, which is the main factor that gives better results than "Objective reward". This note discusses the good teacher who gives an excellent "Subjective reward". The results show that the human being gives reward in consideration of not only distance but also motion forms, and can give better results than that of the "Objective reward".
著者
関連論文
- 複数可操作度総合評価によるマルチフィンガ・アームロボットのアドミッタンス制御(機械力学,計測,自動制御)
- 力センサ無しの条件下で近似ZMP計測法を用いたサーフィンロボットの実現 : 重力方向変化の環境下でのロボットの直立安定性の考察(機械力学,計測,自動制御)
- ミュラー・リヤー錯視による人間上肢運動の変化
- 強化学習によって獲得される芋虫型ロボットの前進行動形態に関する考察(機械力学,計測,自動制御)
- 姿勢バランス機構を持つ無線操縦型架線移動ロボットの開発
- 最適レギュレータを用いた小口径トンネルロボットの方向制御方法
- ファジイ技術のロボットへの応用
- 小口径トンネルロボットのファジィ方向制御法 : シミュレーションによる検討
- 小口径トンネルロボットのニューラル形最適ファジィ変数オートチューニング法
- 小口径トンネルロボットのニューラル形最適ゲインオートチューニング