強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得

スポンサーリンク

概要

論文の詳細を見る
人間のように多自由度の身体をもつロボットが,試行錯誤的に目的とする運動を獲得することは,ロボット学習の分野において大きな課題である.本論文では強化学習を用いて,ロボットが高次元状態空間中における運動学習を行うための手法,主に評価関数の近似方法についての考察を行う.制御タスクとしては,人間の身体の形を単純化した3リンク2関節ロボットの起き上がり運動を扱う.強化学習の一手法である,連続時間,連続状態のTemporal Difference学習則を,正規化ガウス関数を必要に応じて逐次配置する関数近似手法と組み合わせ,高次元連続状態空間中での起き上がり運動学習を行った.その結果,シミュレーション上で約2400回の試行後に起き上がり運動が獲得された.
社団法人電子情報通信学会の論文
1999-11-25

著者

関連論文

もっと見る

スポンサーリンク