1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
スポンサーリンク
概要
- 論文の詳細を見る
This paper presents a method to learn stepping motions for fall avoidance with reinforcement learning. In order to overcome the curse of dimensionality associated with the large number of degrees of freedom with a humanoid robot, we consider learning on the reduced dimension state space based on a simplified inverted pendulum model. A feedback controller is introduced in the ankle joints so that the center of mass is forced to follow the dynamics of the inverted pendulum model. The proposed method is applied to a humanoid robot in numerical simulations, and simulation results demonstrate the feasibility of the proposed method to acquire appropriate stepping motions to avoid falling over caused by external perturbations.
- 一般社団法人日本機械学会の論文
- 2007-05-11
著者
-
丸山 淳一
奈良先端科学技術大学院大学
-
森本 淳
ATR脳情報研究所
-
中西 淳
Atr脳情報研究所:科学技術振興機構icorp
-
中西 淳
Atr脳情報研究所
-
森本 淳
東芝
-
松原 崇充
奈良先端大
-
森本 淳
(株)東芝
-
松原 崇充
Atr脳情報研究所ブレインロボットインタフェース研究室:奈良先端科学技術大学院大学情報科学研究科
-
松原 崇充
Atr脳情報研究所プレインロボットインタフェース研究室
-
森本 淳
Atr脳情報研究所プレインロボットインタフェース研究室
-
丸山 淳一
奈良先端大
-
森本 淳
Atr脳情報研
関連論文
- 強化学習を用いたヒューマノイドロボットによる転倒回避ステップ動作の学習
- 動作認識における床反力情報の推定と見まね学習への適用(バイオサイバネティックス,ニューロコンピューティング)
- 経由点表現を用いた強化学習
- 個性を考慮した周期的全身運動の予測(パターン認識)
- 変分ベイズ法による自然方策勾配の推定法(一般, 脳・ヒューマンモデリング, 一般)
- 方策こう配法を用いた動的行動則の獲得 : 2足歩行運動への適用(画像認識,コンピュータビジョン)
- 動的行動則を用いた2足歩行の獲得(2足歩行ロボット1)
- 方策勾配法を用いた動的行動則の獲得 : 2足歩行運動への適用(「脳・認知科学」及び一般)
- 0719 ヒューマノイドとブレイン・マシン・インタフェース(OS41:人間とヒューマノイドの関連を考える)
- 歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
- 情報機器用筐体を成形する樹脂の衝撃性評価に関する研究
- 平均報酬の多様体に基づく方策勾配法
- 運動学習プリミティブを用いた2足歩行の学習および適応(2足歩行ロボット1)
- モデルベース強化学習を用いた2足歩行運動の獲得(2足歩行ロボット1)
- 神経振動子を用いた2足歩行運動の実験的検討(2足歩行ロボット1)
- 観測軌道を基にした運動の最適化起立運動, 歩行運動への適用
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- 階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得
- 強化学習と最適制御(「システム制御理論の新領域特集号」)
- ロバスト強化学習
- 強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
- 強化学習による起き上がり運動パターンの獲得
- 特集について
- 学生会員メーリングリスト(RSJ-Forum)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用(IBIS2010(情報論的学習理論ワークショップ))
- 信号ネットワークの自己組織化制御(機械力学,計測,自動制御)
- ハイブリッドコントローラによる 2 リンクブラキエーションロボットの振幅制御
- 信号ネットワークの自己組織化制御
- 2リンクブラキエーションロボットの制御 : 目標ダイナミクス法による枝間隔の異なる枝渡りの実現
- 2リンクブラキエーションロボットの制御 -目標ダイナミクス法の実ロボットへの適用-
- 解析的手法による2リンクブラキエーションロボットの制御
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用(IBIS2010(情報論的学習理論ワークショップ))
- 床反力情報とモーションキャプチャデータを用いた人間の動作認識
- 液晶性分子の定常せん断流れに対する分子動力学シミュレーション
- 2B03 モデル液晶分子の定常せん断流れの分子動力学シミュレーション
- 2G313 モデル液晶分子による分子動力学シミュレーション
- 運動学習プリミティブを用いたロボットの見まね学習(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- 運動学習プリミティブを用いたロボットの見まね学習(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- ATR脳情報研究所
- 個性を考慮した周期的全身運動の予測
- 運動学習プリミティブを用いたロボットの見まね学習
- 1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用
- 卓球タスクにおけるスイング動作からのスピン関連情報抽出と打球予測への応用(人工知能,データマイニング)
- 21pGS-15 正準相関座標系を用いた二足歩行の強化学習(21pGS 力学系とその周辺,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 状態予測-行動則モジュールデータベースを用いたヒューマン-ロボットインタラクションにおける行動則の適応(ユーザ状態推定,人とエージェントのインタラクション論文)
- 高次元多重時系列データ解析のための正準多重整列法 (情報論的学習理論と機械学習)
- ロボット学習(活躍する機械学習)
- スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用(バイオサイバネティックス,ニューロコンピューティング)
- モーションタブレット : 次元削減法を利用したヒューマノイド用全身運動合成インタフェース
- ロボット学習
- スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用
- 高次元多重時系列データ解析のための正準多重整列法(時系列解析,統計推理,データベース,一般)
- 25aAG-14 強化学習における価値の特徴抽出と二足歩行制御への応用(25aAG ニューラルネットワーク2,領域11(統計力学,物性基礎論,応用数学,力学,流体物理))
- 多重時系列データ解析のための正準多重整列法(パターン認識)
- 高次元多重時系列データ解析のための正準多重整列法