[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)

概要

論文の詳細を見る
運動を模倣によって獲得する場合,教師の運動軌道を観測するだけで目的の運動を実現することは容易ではない.なぜなら,観測される運動軌道のみから教師の行動則や正確な出力トルク等を推定することは困難であり,かつ教師と学習者のダイナミクスは一般に異なるからである.このような場合,運動の目的が達成できるように,学習者のダイナミクスに合った運動を,観測した軌道を基に最適化することが必要となる.本研究では,最適化の手法として,階層型強化学習法と微分動的計画法を用いることを考える.具体例として,階層型強化学習法を用いて3リンク2関節ロボットの起立運動を模倣により獲得することを考える.ここでは,観測軌道を用いることで,短時間で起立運動の学習が行えることを示す.一方,微分動的計画法を用いた具体例として,5リンクロボットの2足歩行運動を観測軌道を基に構築することを考える.提案するロバスト微分動的計画法を用いることにより,PDサーボを用いて構築した軌道にくらべて,ロバストかつ少ない制御出力で歩行が可能となることを示す.
社団法人電子情報通信学会の論文
2003-10-17