2A1-3F-B3 強化学習における状態空間の縮小法について
スポンサーリンク
概要
- 論文の詳細を見る
状態空間をできるだけ縮小することにより, 強化学習を加速する方法について考察する。組立作業など, 幾何学的な拘束を受けるロボットマニピュレータを例に, 環境に応じて変化する, 自律的な状態空間の構成方法を数値計算により検討する。
著者
関連論文
- 強化学習における最適政策の信頼性を保証するサンプリング政策
- (122)金沢大学機能機械工学科における力学教育のボトムアップ(セッション35 教育システムA(講義・演習)V)
- 714 自動車の運動を考慮したレーンマーカ検出
- 強化学習における最適政策の信頼性を保証するサンプリング政策
- 1-325 卒業生による達成度評価 : アンケート結果の年次推移((14)教育評価・自己点検・評価システム-V)
- 「ロボティクスのための生命理解」特集について
- 2P2-3F-E1 蝶の羽ばたき飛行の数値シミュレーション解析
- 2A1-H07 蝶の羽ばたきの計測と数値計算
- 2P2-A11 脳・神経モデルによるリズム運動の生成と宇宙ロボットの姿勢制御への適用(9. 宇宙空間/軌道上で作業するロボット)
- 強化学習におけるサンプリング条件で信頼性が保証された最適政策
- 強化学習における性能と信頼性を両立する最適政策
- 部分的変化を伴う強化学習に対する効率的計算法
- 状態遷移モデルを逐次推定する強化学習の学習加速
- ステレオビジョンを用いた車両前方環境認識(機械力学,計測,自動制御)
- ステレオビジョンシステムと動的輪郭モデルを用いた高速道路におけるレーンマーカ検出(機械力学,計測,自動制御)
- 1-315 ステレオビジョンと動的輪郭モデルを用いた走行レーン検出
- 1-314 ステレオビジョンシステムを用いた一般道における障害物検出
- 2A1-3F-B3 強化学習における状態空間の縮小法について
- 2P1-L2 幾何学的な拘束を受けるロボットの強化学習に基づく環境認識(27. 強化学習とロボティクス・メカトロニクス)
- 2A1-08-006 強化学習を用いた宇宙ロボットの作業エラーリカバリー
- 蝶の飛翔制御法解明への実験的アプローチ
- 1A1-29-035 加法的変動を受けるロボットに対するニューラルネットワークを用いた適応的制御
- S1903-1-6 宇宙インフレータブル構造の宇宙実証 : SIMPLE(宇宙構造・材料(1),社会変革を技術で廻す機械工学)
- 2A1-M07 技能を自律的に発現する強化学習(進化・学習とロボティクス)
- 2A1-B09 環境との相互作用による蝶の羽ばたき飛翔の安定化(移動知)
- 2A1-C3 ハンドアイ・システムのタスク達成条件と制御法について(61. ビジュアルサーボ)
- 2A1-08-007 冗長な可変形状トラスに対する関節摩擦を考慮したインピーダンス制御
- 2A2-M10 脚型ローバのデッドレコニング(宇宙ロボット・メカトロニクス)
- 2P2-2F-F6 ビジュアルサーボに基づく局所情報のみを用いる分散制御
- 3302 太陽発電衛星システムの経緯と今後
- 1P1-I07 ハンドアイ・システムのタスク判定可能性・実現可能性・達成可能性