強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
スポンサーリンク
概要
- 論文の詳細を見る
人間のように多自由度の身体をもつロボットが,試行錯誤的に目的とする運動を獲得することは,ロボット学習の分野において大きな課題である.本論文では強化学習を用いて,ロボットが高次元状態空間中における運動学習を行うための手法,主に評価関数の近似方法についての考察を行う.制御タスクとしては,人間の身体の形を単純化した3リンク2関節ロボットの起き上がり運動を扱う.強化学習の一手法である,連続時間,連続状態のTemporal Difference学習則を,正規化ガウス関数を必要に応じて逐次配置する関数近似手法と組み合わせ,高次元連続状態空間中での起き上がり運動学習を行った.その結果,シミュレーション上で約2400回の試行後に起き上がり運動が獲得された.
- 社団法人電子情報通信学会の論文
- 1999-11-25
著者
関連論文
- 強化学習を用いたヒューマノイドロボットによる転倒回避ステップ動作の学習
- 動作認識における床反力情報の推定と見まね学習への適用(バイオサイバネティックス,ニューロコンピューティング)
- 経由点表現を用いた強化学習
- 個性を考慮した周期的全身運動の予測(パターン認識)
- 変分ベイズ法による自然方策勾配の推定法(一般, 脳・ヒューマンモデリング, 一般)
- 方策こう配法を用いた動的行動則の獲得 : 2足歩行運動への適用(画像認識,コンピュータビジョン)
- 動的行動則を用いた2足歩行の獲得(2足歩行ロボット1)
- 方策勾配法を用いた動的行動則の獲得 : 2足歩行運動への適用(「脳・認知科学」及び一般)
- 0719 ヒューマノイドとブレイン・マシン・インタフェース(OS41:人間とヒューマノイドの関連を考える)
- 歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
- マルチエージェント環境における共通なシンボルの生成(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
- 位相を隠れ変数として持つ領域ベース結合MRFモデル
- 他エージェントの行動予測を利用したマルチエージェント強化学習法
- 複数の大脳基底核ループでの異なる表現を用いた逐次的行動選択
- 平均報酬の多様体に基づく方策勾配法
- 運動学習プリミティブを用いた2足歩行の学習および適応(2足歩行ロボット1)
- モデルベース強化学習を用いた2足歩行運動の獲得(2足歩行ロボット1)
- 神経振動子を用いた2足歩行運動の実験的検討(2足歩行ロボット1)
- 観測軌道を基にした運動の最適化起立運動, 歩行運動への適用
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- [招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
- 階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得
- 強化学習と最適制御(「システム制御理論の新領域特集号」)
- ロバスト強化学習
- 強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
- 強化学習による起き上がり運動パターンの獲得
- 特集について
- 学生会員メーリングリスト(RSJ-Forum)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用(IBIS2010(情報論的学習理論ワークショップ))
- 複数報酬のもとでの階層強化学習
- 大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測
- 複数の予測モデルを用いた強化学習による非線形制御
- マルチステップ状態予測を用いた強化学習 : 注視点移動を考慮した自動車運転モデル
- 複数のモデルを用いた強化学習による非線形制御方式
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用(IBIS2010(情報論的学習理論ワークショップ))
- 床反力情報とモーションキャプチャデータを用いた人間の動作認識
- 強化学習による自動車運転技能の獲得
- 強化学習による自動車運転技能の獲得
- 神経情報科学サマースクール報告
- 神経情報科学サマースクール(NISS)2003報告神経情報科学サマースクール2003経過報造
- NISSからOCNC, ASCONEへ
- 神経情報科学サマースクールNISS2003講義録 : 脳の局所回路の計算機構
- 神経情報科学サマースクールNISS2000報告
- 神経情報科学サマースクール NISS99 報告
- 脳科学とロボット
- Neural Control of Movement, 8th Annual Meeting レポート
- 1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
- 規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用
- ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用
- 高次元多重時系列データ解析のための正準多重整列法 (情報論的学習理論と機械学習)
- 科学の目 神経情報科学の新しい流れ
- スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用(バイオサイバネティックス,ニューロコンピューティング)
- 高次元多重時系列データ解析のための正準多重整列法(時系列解析,統計推理,データベース,一般)