[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
スポンサーリンク
概要
- 論文の詳細を見る
運動を模倣によって獲得する場合,教師の運動軌道を観測するだけで目的の運動を実現することは容易ではない.なぜなら,観測される運動軌道のみから教師の行動則や正確な出力トルク等を推定することは困難であり,かつ教師と学習者のダイナミクスは一般に異なるからである.このような場合,運動の目的が達成できるように,学習者のダイナミクスに合った運動を,観測した軌道を基に最適化することが必要となる.本研究では,最適化の手法として,階層型強化学習法と微分動的計画法を用いることを考える.具体例として,階層型強化学習法を用いて3リンク2関節ロボットの起立運動を模倣により獲得することを考える.ここでは,観測軌道を用いることで,短時間で起立運動の学習が行えることを示す.一方,微分動的計画法を用いた具体例として,5リンクロボットの2足歩行運動を観測軌道を基に構築することを考える.提案するロバスト微分動的計画法を用いることにより,PDサーボを用いて構築した軌道にくらべて,ロバストかつ少ない制御出力で歩行が可能となることを示す.
- 社団法人電子情報通信学会の論文
- 2003-10-17
著者
-
森本 淳
ATR脳情報研究所
-
森本 淳
東芝
-
銅谷 賢治
Atr脳情報研究所
-
森本 淳
Atr脳情報研究所ブレインロボットインタフェース研究室
-
森本 淳
(株)東芝
-
ATKESON Christopher
The Robotics Institute, Carnegie Mellon University
-
Atkeson Christopher
The Robotics Institute Carnegie Mellon University
-
森本 淳
Atr脳情報研究所プレインロボットインタフェース研究室
-
森本 淳
Atr脳情報研
関連論文
- 強化学習を用いたヒューマノイドロボットによる転倒回避ステップ動作の学習
- 動作認識における床反力情報の推定と見まね学習への適用(バイオサイバネティックス,ニューロコンピューティング)
- 経由点表現を用いた強化学習
- 個性を考慮した周期的全身運動の予測(パターン認識)
- 変分ベイズ法による自然方策勾配の推定法(一般, 脳・ヒューマンモデリング, 一般)
- 方策こう配法を用いた動的行動則の獲得 : 2足歩行運動への適用(画像認識,コンピュータビジョン)
- 動的行動則を用いた2足歩行の獲得(2足歩行ロボット1)
- 方策勾配法を用いた動的行動則の獲得 : 2足歩行運動への適用(「脳・認知科学」及び一般)
- 0719 ヒューマノイドとブレイン・マシン・インタフェース(OS41:人間とヒューマノイドの関連を考える)
- 歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
- マルチエージェント環境における共通なシンボルの生成(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
- 情報機器用筐体を成形する樹脂の衝撃性評価に関する研究
- 他エージェントの行動予測を利用したマルチエージェント強化学習法
- 平均報酬の多様体に基づく方策勾配法
- 運動学習プリミティブを用いた2足歩行の学習および適応(2足歩行ロボット1)
- モデルベース強化学習を用いた2足歩行運動の獲得(2足歩行ロボット1)
- 神経振動子を用いた2足歩行運動の実験的検討(2足歩行ロボット1)
- 観測軌道を基にした運動の最適化起立運動, 歩行運動への適用
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- 階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得
- 強化学習と最適制御(「システム制御理論の新領域特集号」)
- ロバスト強化学習
- 強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
- 強化学習による起き上がり運動パターンの獲得
- 特集について
- 学生会員メーリングリスト(RSJ-Forum)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用(IBIS2010(情報論的学習理論ワークショップ))
- 複数報酬のもとでの階層強化学習
- 大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用(IBIS2010(情報論的学習理論ワークショップ))
- 床反力情報とモーションキャプチャデータを用いた人間の動作認識
- 液晶性分子の定常せん断流れに対する分子動力学シミュレーション
- 2B03 モデル液晶分子の定常せん断流れの分子動力学シミュレーション
- 2G313 モデル液晶分子による分子動力学シミュレーション
- 神経情報科学サマースクール報告
- 神経情報科学サマースクール(NISS)2003報告神経情報科学サマースクール2003経過報造
- NISSからOCNC, ASCONEへ
- 神経情報科学サマースクールNISS2003講義録 : 脳の局所回路の計算機構
- 神経情報科学サマースクールNISS2000報告
- 神経情報科学サマースクール NISS99 報告
- ATR脳情報研究所
- 個性を考慮した周期的全身運動の予測
- 1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用
- 21pGS-15 正準相関座標系を用いた二足歩行の強化学習(21pGS 力学系とその周辺,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 高次元多重時系列データ解析のための正準多重整列法 (情報論的学習理論と機械学習)
- ロボット学習(活躍する機械学習)
- スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用(バイオサイバネティックス,ニューロコンピューティング)
- ロボット学習
- スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用
- 高次元多重時系列データ解析のための正準多重整列法(時系列解析,統計推理,データベース,一般)
- 25aAG-14 強化学習における価値の特徴抽出と二足歩行制御への応用(25aAG ニューラルネットワーク2,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 多重時系列データ解析のための正準多重整列法(パターン認識)
- 高次元多重時系列データ解析のための正準多重整列法