1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement learning is effective in acquisition of optimal control policy. However, the calculation amount increases in high-dimensional space. In this paper, we propose a global and local optimal control method using dynamic programming(DP) and differential dynamic programming(DDP). In the global part, approximate the optimal trajectory in the state space by DP. In the local part, optimize the approximate trajectory in the neighborhood by DDP. The proposed method can reduce the calculation amount in optimal control.
- 一般社団法人日本機械学会の論文
- 2011-05-26
著者
関連論文
- インターネットブースター : ネットワーク配信可能なhw/sw複合体を用いたWEBアプリケーション(映像プロセッサ,システム開発論)
- 人と接するロボットのための並列タスク設計への最適化によるアプローチ
- 群ロボットによる協調捕獲行動の自律分散制御
- マルチエージェントシステムの自律分散制御-群移動ロボットによる協調捕獲行動
- hw/sw複合体を用いた木構造型SOMハードウェア
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- ネットワーク配信可能なhw/sw複合体,動画像コーデック(ネットワーク,FPGA応用及び一般)
- FPGAアレイに実装するポアソン方程式とCIP法演算回路の性能評価
- 分解能の調節可能な画像情報からの状態空間の構成
- ロボットの障害物回避行動生成における画像特徴の獲得
- 視覚からの対象物抽出に基づいた到達可能領域と拘束領域の推定による対象物操作の学習
- 能動的な動きに基づく知覚の恒常性を実現する状態表現(人工知能,データマイニング)
- 観測範囲に制限のあるセンサ同士の統合によるロボットの行動生成法
- 2A2-E05 SVMと補間を利用した対象物操作学習のための接触モード境界推定
- 1A1-F16 拡散学習を用いた不完全な知覚を有するロボットのための状態推定法
- 2P1-F19 恒常性を実現する能動知覚と行動学習
- 車載カメラ画像からの視点変更画像生成に関する検討 (メディア工学 サマーセミナー2013 : 画像処理の理論と実際)
- 強化学習による物体識別のための探索行動の獲得
- 屋外不整地環境における無人車両のための走路判別
- 屋外不整地環境における無人車両のための走路判別 (特集 画像技術の実利用)
- プロジェクタ・カメラシステムを用いたテクスチャマッピングと点滅表示による色情報提示(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- マニピュレータに搭載したレーザレンジファインダを用いた透明容器中の液中物体の3次元形状計測
- 車載カメラ画像からの視点変更画像生成に関する検討(若葉研究者の集い1,サマーセミナー2013〜画像処理の理論と実際〜)
- 距離画像によるヒューマノイドの位置姿勢計測(若葉研究者の集い4,サマーセミナー2013〜画像処理の理論と実際〜)
- 1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
- State and Action Space Construction Using Vision Information.
- ステレオカメラを用いた視覚障碍者のためのタッチパネル操作支援システム
- 1A1-O09 教示データからの特徴空間の構成にもとづく力覚情報を用いた抱え上げ行動の生成(進化・学習とロボティクス)
- 1A1-O07 局所線形埋め込みを用いたロボット動作のための視覚特徴空間の生成(進化・学習とロボティクス)
- 群口ボットによる協調捕獲行動の自律分散制御
- Hyper-cubic Function Approximation for Reinforcement Learning Based on Autonomous-Decentralized Algorithm
- Function Approximation for Reinforcement Learning Using Autonomous-Decentralized Algorithm.