経由点表現を用いた強化学習

概要

論文の詳細を見る
本論文では経由点表現と強化学習を組み合わせた運動学習制御のための枠組みを提案する.従来,運動制御の分野において強化学習を用いて非線形フィードバック制御則を獲得しcart-poleの制御や起き上がり運動系列の獲得などの研究が行われている.また現在の強化学習の研究は大規模な問題に適用するためにモジュール化と階層化の方向に進んでいる.本論文で提案する枠組みはその手法の一つを与えるものである.それを用いてcart-pole制御のための運動系列の学習が可能であることをシミュレーションにより示す.
社団法人電子情報通信学会の論文
1999-11-25

著者

宮本弘之
九州工業大学大学院生命体工学研究科脳情報専攻
宮本弘之
科学技術振興事業団川人学習動態脳プロジェクト
川人光男
ATR人間情報通信研究所
宮本弘之
科学技術振興事業団
森本淳
奈良先端科学技術大学院大学
銅谷賢治
科学技術振興事業団川人学習動態脳プロジェクト
川人光男
(株)国際電気通信基礎技術研究所脳情報研究所
川人光男
Atr人間情報科学研
銅谷賢治
科学技術振興事業団
森本淳
Atr脳情報研究所プレインロボットインタフェース研究室

関連論文

脳磁図逆問題における複数のアーチファクト源と脳内電流分布の同時推定法(バイオサイバネティックス,ニューロコンピューティング)
比較的速い運動におけるフィードフォワードインピーダンス制御による精度の向上(バイオサイバネティックス,ニューロコンピューティング)
タスク最適化とスティフネスの選択(統計的学習理論及び一般)
多関節到達運動における運動学習モデルの定性的解析 : TOPSモデル
運動指令の大きさに依存した雑音のもとでの最大タスク達成軌道生成モデル
不完全な内部モデル表現形式による手先軌道予測の比較検討
複数の内部モデルの分離及び合成
多数の軌道データに基づいた軌道計画規範の定量的検討(2)
多数の軌道データに基づいた軌道計画規範の定量的検討
多関節運動における手先軌道の曲率 : 軌道計画の計算理論の検証
腕の姿勢に依存した手先軌道の曲率の変化
複数のノイズ源と大脳皮質の同時電流推定によるMEGアーチファクト除去(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
経由点到達運動の位置分散は軌道計画・実行の逐次モデルを支持する(バイオサイバネティックス,ニューロコンピューティング)
fMRI/MEG統合解析による心的な視標運動追跡に関わる皮質電流源の推定(一般,ベイズ情報処理及び一般)
MEGとEOGを用いた眼球と大脳皮質の同時電流源推定によるMEG眼球アーチファクト除去(一般, 脳・ヒューマンモデリング, 一般)
失敗から学ぶ卓球ロボット
道具使用イメージ時の小脳活動 : fMRI研究(ヒューマンコミュニケーション)
速度依存力場と位置依存力場に対する内部モデルの独立性 : 多重内部モデルの検証(バイオサイバネティックス, ニューロコンピューティング)
効果器間協調における順モデル使用の可能性 : ヒトの把持力負荷力結合モデルの仮説の検討(バイオサイバネティックス, ニューロコンピューティング)
複数の粘性力場に対する多重内部モデルの獲得とそのスイッチング
ヒトの効果器間協調における順モデル使用の妥当性
小脳単純スパイクはサル上肢運動のダイナミクスを表現するか?
III-9P3-6 筋活動の変化に対する適応 : 力制御課題施行中の筋へ,電気刺激を外乱として用いて(運動生理2)
一般化線形モデルを用いた神経細胞発火頻度解析(モデルの検証)
熟練到達運動において目標軌道は存在するか(バイオサイバネティックス, ニューロコンピューティング)
追従眼球運動の適応シミュレーション : 小脳皮質の計算モデルは視覚運動変換を行いうるか?
登上線維入力が小脳プルキンエ細胞の活動に与える影響(脳・ヒューマンモデリング1, 脳・ヒューマンモデリング, 一般)
追従眼球運動時の3つの脳内領域のニューロン活動の解析
垂直方向追従眼球運動の適応シミュレーション : 小脳皮質の計算モデルは運動学習を再現できるか?
小脳プルキンエ細胞単純スパイク発火を介する垂直方向追従眼球運動モデリング
I-B-7 軌道計画規範のための評価関数を用いた脳卒中片麻痺の運動学習過程の定量的評価
複数の粘性力場に対する多重内部モデルの獲得
小脳単純スパイクの線形和はサル上肢筋電時系列を再構成する
複数の粘性力場に対する多重内部モデルの獲得に関する考察
作業レベルのロボット学習のための見まねによる教示
複数の粘性力場に対する多重内部モデルの獲得
II-E-24KM 脳卒中片麻痺上肢のフィードフォワード運動訓練 : 訓練機器の開発とその試用
I-A1-4 小脳の内部モデルの再構築をめざした片麻痺上肢のフィードフォワード運動訓練の検討
小脳皮質のシナプス可塑性モデルに基づくサルの水平方向VOR適応のシミュレーション
追従眼球運動の適応シミュレーション : 小脳皮質の計算モデルは視覚運動変換を行いうるか?
小脳プルキンエ細胞発火を介する追従眼球運動シミュレーション
小脳における運動学習
一般化線形モデルを用いた小脳への登上線維入力の発火頻度解析
経由点表現を用いた強化学習
作業レベルのロボット学習のための見まねによる教示
最近のロボット教示方法--見まねによる作業レベル学習ロボットの開発例
タスクレベルのロボット学習
動作筋電図に混入した心電図成分の除去方法 : 心電図のピーク検出を利用して
表面筋電に基づく肩周囲筋トルクベクトル方向の推定方法
表面筋電と手先力に基づく肩周囲筋トルクベクトル方向の推定
表面筋電に基づく肩周囲筋トルクベクトル方向の推定
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
TK-3-6 実時間顔・腕姿勢認識システムと影消去技術(TK-3. 脳型コンピュータの原型を求めて,大会委員会企画)
背景や服装によらないマーカ無しの身振り認識のための腕姿勢推定法
ネオコグニトロンのGPU実装(ニューロコンピューティングの実装とシステム化,ニューロコンピューティングの実装とシステム化,一般)
道具を使うことをイメージした時の脳活動 : fMRIによる脳活動計測
エッジ情報を用いた陰影からの3次元形状推定 : 視聴覚技術
奥行き知覚における視覚的充填のダイナミクス
輪郭運動方向の計算における充填過程と大局的バインディング
輪郭運動方向の計算における充填過程と大局的バインディング
視覚系は緩和計算をもちいているか?
ロボットと人間の身振りによるコミュニケーション(手)
ネオコグニトロンによる視覚腹側経路のモデル化
位相を隠れ変数として持つ領域ベース結合MRFモデル
運動学習時における筋活性の変化
片葉仮説に基づくサルVOR適応シミュレーション : 小脳皮質の計算モデルはVOR適応モデルを再現しうるか?
片葉仮説に基づくサルVOR適応のシミュレーション : Lisbergerモデル批判
複数の大脳基底核ループでの異なる表現を用いた逐次的行動選択
ロボットへの教示方法
強化学習と最適制御(「システム制御理論の新領域特集号」)
ロバスト強化学習
強化学習を用いた高次元連続状態空間における系列運動学習 : 起き上がり運動の獲得
強化学習による起き上がり運動パターンの獲得
学生会員メーリングリスト(RSJ-Forum)
小脳の内部モデルと運動学習
3次元ヒト腕運動における軌道計画規範の定量的比較検討
経由点の運動時間情報最適化を考慮した計算論的軌道生成モデル
複数の予測モデルを用いた強化学習による非線形制御
マルチステップ状態予測を用いた強化学習 : 注視点移動を考慮した自動車運転モデル
ヒト運動の最適化原理と見まねに基づくタスク学習
強化学習による自動車運転技能の獲得
強化学習による自動車運転技能の獲得
対象物の形状に合わせて手の形を決定する神経回路モデル
筋肉・骨格系の運動制御を行う並列階層制御神経回路モデル (ニュ-ロコンピュ-ティング論文)
神経情報科学サマースクール NISS99 報告
運動経由点の時間情報最適化による書字運動モデル
運動軌道データから計算される評価関数による軌道計画規範の検討
最小化原理を応用した運動パターン認識
小脳に形成される多重内部モデル (特集小脳)
最適軌道計算のためのハイブリッド法
ヒト腕の運動軌道を生成するための運動規範モデル
小脳内部モデルとモザイクの計算論的神経科学
運動学習から認知へ
ヒト脳の高次機構解明
ヒトの腕の運動におけるダイナミックな最適化原理:キネマティクスが変更されたときの運動軌道生成の実験による研究

経由点表現を用いた強化学習

スポンサーリンク

概要

著者

関連論文

スポンサーリンク