神経振動子ネットワークを用いた強化学習法による歩行運動の獲得
スポンサーリンク
概要
- 論文の詳細を見る
2足歩行運動のような生物のリズム運動は、中枢パターン生成器(CPG)と呼ばれる周期的な信号を生成する神経振動子ネットワークによって制御されていることが示唆されている。本報告では安定したリズム運動を生成するCPGコントローラを、試行錯誤的な強化学習により獲得する問題を取り扱う。CPGコントローラに対する強化学習を実現するために、我々はCPG-actor-criticモデルとよばれる新しい強化学習法を提案する。また本手法を用いた計算機シミュレーションによって、2足渉行を実現するCPGコントローラが強化学習の結果として得られることを示す。
- 社団法人電子情報通信学会の論文
- 2002-03-11
著者
-
石井 信
奈良先端科学技術大学院大学
-
佐藤 雅昭
国際電気通信基礎技術研究所脳情報研究所
-
中村 泰
大阪大学大学院工学研究科
-
中村 泰
奈良先端科学技術大学院大学論理生命学講座
-
佐藤 雅昭
ATR人間情報科学研究所
-
佐藤 雅昭
Atr脳情報科学研究所
関連論文
- 混合 von Mises-Fisher 分布の変分ベイズ推定について
- 内部状態を用いた強化学習によるマルチエージェント系における協調行動の獲得(機械学習によるバイオデータマインニング,一般)
- 指数族行列因子化の状態空間モデルへの拡張と時系列関係データ解析への応用
- POMDP課題遂行中のヒトの情報処理過程の隠れマルコフモデリング(一般)
- 階層的パーティクルフィルタのための適応的サンプリング分布推定とその剛体の実時間姿勢推定への応用
- 移動ロボットにおける環境同定のための統計的アプローチ
- 同時発音の相関を考慮した確率モデルによる音楽の和声推定
- エピソードタスクにおける方策オフ型LSTD(λ)法とその収束性(機械学習によるバイオデータマインニング,一般)
- 線スペクトル対を用いた楽器分類
- 隠れマルコフ/セミマルコフモデルに基づき原信号を動的に切り替える非定常独立成分分析