階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得

スポンサーリンク

概要

論文の詳細を見る
日本ロボット学会の論文
2001-07-15

著者

銅谷賢治
奈良先端科学技術大学院大学
森本淳
ATR脳情報研究所
銅谷賢治
Atr脳情報研究所
森本淳
科学技術振興事業団 ERATO, 川人学習動態脳プロジェクト

関連論文

手の系列運動における選択的サッカード(脳・ヒューマンモデリング1, 脳・ヒューマンモデリング, 一般)
MEGとEOGを用いた眼球と大脳皮質の同時電流源推定によるMEG眼球アーチファクト除去(一般, 脳・ヒューマンモデリング, 一般)
眼球と大脳皮質の同時電流源推定による MEG 眼球アーチファクト除去
自然方策こう配法 : 平均報酬の自然こう配に基づく方策探索(人工知能,認知科学)
強化学習を用いたヒューマノイドロボットによる転倒回避ステップ動作の学習
ヒト円滑性追跡眼球運動における非周期視標運動の予測と学習(「脳・認知科学」及び一般)
サル側頭葉顔細胞のVB法による混合正規分布解析
サル側頭葉の顔細胞の集団ダイナミクス : MDSによる解析と連想記憶回路によるモデル化
動作認識における床反力情報の推定と見まね学習への適用(バイオサイバネティックス,ニューロコンピューティング)
ヒト大脳皮質における円滑性追跡眼球運動のための視標運動予測に関連する領域の機能的同定
MST野の細胞集団ダイナミクスを含む円滑性追跡眼球運動モデルとその計算理論
ベイズフィルタによる円滑性追跡眼球運動のモデル化
個性を考慮した周期的全身運動の予測(パターン認識)
変分ベイズ法による自然方策勾配の推定法(一般, 脳・ヒューマンモデリング, 一般)
方策こう配法を用いた動的行動則の獲得 : 2足歩行運動への適用(画像認識,コンピュータビジョン)
動的行動則を用いた2足歩行の獲得(2足歩行ロボット1)
方策勾配法を用いた動的行動則の獲得 : 2足歩行運動への適用(「脳・認知科学」及び一般)
空間的情報を含むマルコフ決定課題を用いた長期と短期の報酬予測に伴う脳活動のfMRI測定
短期と長期の報酬予測に伴う脳活動のfMRI測定
0719 ヒューマノイドとブレイン・マシン・インタフェース(OS41:人間とヒューマノイドの関連を考える)
歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
拡張結合混合モデルを用いた脳活動解析
センサフィードバックを用いたCPG制御における環境ダイナミクスと観測の不確定性の影響
MOSAICモデルにより環境を抽象化する階層型強化学習(バイオサイバネティックス,ニューロコンピューティング)
マルチエージェント環境における共通なシンボルの生成(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定(バイオサイバネティックス,ニューロコンピューティング)
教示者の行動目標を推定する見まね学習
教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習
変分法的ベイズ推定を用いた相互情報量の推定
他エージェントの行動予測を利用したマルチエージェント強化学習法
平均報酬の多様体に基づく方策勾配法
運動学習プリミティブを用いた2足歩行の学習および適応(2足歩行ロボット1)
モデルベース強化学習を用いた2足歩行運動の獲得(2足歩行ロボット1)
神経振動子を用いた2足歩行運動の実験的検討(2足歩行ロボット1)
観測軌道を基にした運動の最適化起立運動, 歩行運動への適用
[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
[招待論文]観測軌道を基にした運動の最適化 : 起立運動,歩行運動への適用(PRMU&NCテーマセッション(3) : 模倣学習)(認識と学習,模倣学習)
階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得
強化学習と最適制御(「システム制御理論の新領域特集号」)
ロバスト強化学習
強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
強化学習による起き上がり運動パターンの獲得
特集について
学生会員メーリングリスト(RSJ-Forum)
規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用(IBIS2010(情報論的学習理論ワークショップ))
Max-Min Actor-Criticによる複数報酬課題の強化学習(人工知能,認知科学)
異なった時間遅れを持つ感覚モダリティーを用いた実時間運動学習機構
複数報酬のもとでの階層強化学習
淡蒼球内節/黒質網様部の強化学習による確率的行動選択(一般)(ニューロインフォーマティックスとは何か)
淡蒼球内節/黒質網様部の強化学習による確率的行動選択
大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定
ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用(IBIS2010(情報論的学習理論ワークショップ))
床反力情報とモーションキャプチャデータを用いた人間の動作認識
神経情報科学サマースクール報告
生物における階層系列学習に関する考察
学習ダイナミクスの制御と脳の物質機構(システムと生命総合特集号)
神経情報科学サマースクール(NISS)2003報告神経情報科学サマースクール2003経過報造
NISSからOCNC, ASCONEへ
神経情報科学サマースクールNISS2003講義録 : 脳の局所回路の計算機構
神経情報科学サマースクールNISS2000報告
神経情報科学サマースクール NISS99 報告
モジュール競合による運動パターンのシンボル化と見まね学習
1A1-M09 強化学習を用いたステッピングによる転倒回避動作の学習(人間機械協調)
規範軌道の多様性を考慮した非線形力学系による運動記述の学習法 : ロボットによる見まね学習への応用
ヒトと運動アシストロボットにおける共通の状態空間の抽出 : 外骨格ロボット制御への応用
高次元多重時系列データ解析のための正準多重整列法 (情報論的学習理論と機械学習)
スタイル-位相適応に基づく周期運動の時空間同期 : 2足歩行運動への適用(バイオサイバネティックス,ニューロコンピューティング)
高次元多重時系列データ解析のための正準多重整列法(時系列解析,統計推理,データベース,一般)

もっと見る閉じる

スポンサーリンク

論文relation | CiNii API
論文
論文著者
博士論文
研究課題
研究者
図書
論文
著者
お問い合わせ
プライバシー