回避行動の再利用メカニズムを備えた強化学習のための関数近似器修正手法と多関節ロボットへの応用
スポンサーリンク
概要
- 論文の詳細を見る
強化学習などの学習手法をロボットの運動学習に適用する際に問題となる学習コスト(転倒によるダメージなど)を軽減する一手法として,我々はあるタスクの学習中に回避行動を分離して学習しこれをほかのタスクの学習で再利用する手法を強化学習の枠組で提案,4リンク程度の土台非固定型ロボットへの応用を行ってきた[1].本稿では分離学習における分離性能を向上させることを目的として基底関数を修正する手法を提案し,運動学習における有効性を示す.さらに回避行動を再利用することによって運動学習における転倒ダメージが軽減するかを検討する.
- 社団法人電子情報通信学会の論文
- 2007-12-15
著者
関連論文
- 脳活動における多重内部モデルの再構成(バイオサイバネティックス,ニューロコンピューティング)
- 3次元ヒト腕運動における手先軌道・腕姿勢の予測規範の検討
- タスク最適化とスティフネスの選択(統計的学習理論及び一般)
- 複数のノイズ源と大脳皮質の同時電流推定によるMEGアーチファクト除去(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
- fMRI/MEG統合解析による心的な視標運動追跡に関わる皮質電流源の推定(一般,ベイズ情報処理及び一般)
- MEGとEOGを用いた眼球と大脳皮質の同時電流源推定によるMEG眼球アーチファクト除去(一般, 脳・ヒューマンモデリング, 一般)
- 眼球と大脳皮質の同時電流源推定による MEG 眼球アーチファクト除去
- 手指筋出力と運動野活動との関係 : NIRS と fMRI による比較
- 二つの粘性力場への同時適応と切換(バイオサイバネティックス、ニューロコンピューティング)
- 道具使用時の脳活動量と言語課題時に現れる脳活動量の相関関係(「脳・認知科学」及び一般)
- 複数の粘性力場に対する効果的な学習法の検討(「脳・認知科学」及び一般)
- 効果器の変化に対するヒトの適応 : 力制御課題中の筋へ電気刺激を外乱として用いて
- ヒト円滑性追跡眼球運動における非周期視標運動の予測と学習(「脳・認知科学」及び一般)
- 5)確率的並列処理による画像圧縮・復元方式について(視覚情報研究会)
- ヒト大脳皮質における円滑性追跡眼球運動のための視標運動予測に関連する領域の機能的同定
- MST野細胞集団の巡回神経結合に基づく円滑性追跡眼球運動モデル
- ポピュレーション符号から発火率符号への学習による変換 : 円滑性追跡眼球運動の神経表現
- MST野の細胞集団ダイナミクスを含む円滑性追跡眼球運動モデルとその計算理論
- ベイズフィルタによる円滑性追跡眼球運動のモデル化
- 歩行・姿勢リハビリテーションのための空電ハイブリッド式外骨格ロボットの提案
- やわらかい機械をめざして : メカトロニクスの今後(やわらかい機械)
- 拡張結合混合モデルを用いた脳活動解析
- 小脳プルキンエ細胞への入力タイミングをCa^2+濃度に変換するシグナル伝達のシミュレーション
- 5)エッジ情報を用いた陰影からの3次元形状推定(視聴覚技術研究会)
- MOSAICモデルにより環境を抽象化する階層型強化学習(バイオサイバネティックス,ニューロコンピューティング)
- 座談会 神経科学と理論研究の交流から生まれたもの
- マルチエージェント環境における共通なシンボルの生成(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
- 複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定(バイオサイバネティックス,ニューロコンピューティング)
- 教示者の行動目標を推定する見まね学習
- 教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
- 教示者の行動目標を推定する見まね学習(PRMU&NCテーマセッション(4) : 模倣学習)(認識と学習,模倣学習)
- ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習
- 回避行動の再利用メカニズムを備えた強化学習手法と多関節ロボットの全身運動学習への応用
- 回避行動の再利用メカニズムを備えた強化学習のための関数近似器修正手法と多関節ロボットへの応用
- モジュール強化学習と意図(意図研究のスペクトル)
- 複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定
- 田中宏和先生ASCONE2007講義録「ロコモーションの計算理論-生物とロボットの接点-」
- 14)ニューラル・ネットによる画像データ圧縮(Neuro-CODEC)の検討(画像通信システム研究会)
- 神経情報科学サマスク-ル NISS 2001 講義録 : 小脳の学習と内部モデル(眼球運動を題材に)
- S1C05脳内部モデルの計算理論
- 1)明るさ知覚の計算理論と神経回路モデル : 充填過程のマルコフ確率場モデル(〔視聴覚技術研究会 画像処理・コンピュータビジョン研究会〕合同)
- ブレイン・ネットワークインタフェース
- ブレイン・マシン・インタフェースの計測と制御
- モジュール競合による運動パターンのシンボル化と見まね学習
- 複数の予測器と制御器による系列運動の識別と学習
- 強化学習によるロボットの動作獲得のための基底関数に基づく行動空間生成手法
- コミュニケーションの脳科学とヒューマノイドロボット(コミュニケーションの本質に迫る-動物行動学、分子生物学、脳科学、ロボット工学からのアプローチ-,シンポジウムI,組織委員会企画)
- 強化学習によるロボットの動作獲得のための基底関数に基づく行動空間生成手法
- 色と動きに対する選択的注意に関する研究
- 計算論的神経科学と生物数学(脳化学2,数学者のための分子生物学入門-新しい数学を造ろう-)
- 脳とメディア概論 : 脳科学の新しい応用(視聴覚・脳とメディア)
- ブレイン・マシン・インターフェースによる運動・意思疎通機能再建のためのワイヤレス完全体内埋込装置の開発
- ブレイン・マシン・インターフェースによる機能支援 : リアルタイムロボットアーム制御とワイヤレス完全体内埋込装置の開発(ニューロリハビリテーションの進歩)
- 構成的発達科学の目指すもの
- Goals of Synthetic Developmental Science
- ブレイン・マシン・インターフェースによる機能支援 : リアルタイムロボットアーム制御とワイヤレス完全体内埋込装置の開発
- 複数のノイズ源と大脳皮質の同時電流推定によるMEGアーチファクト除去
- Brain-Machine Interfaces : Principles and Clinical Application
- ブレイン・マシン・インターフェースによる運動・意思疎通機能再建のためのワイヤレス完全体内埋込装置の開発
- ブレイン・マシン・インターフェースの基礎と臨床応用