強化学習における性能と信頼性を両立する最適政策
スポンサーリンク
概要
- 論文の詳細を見る
- 2007-11-30
著者
-
泉田 啓
金沢大学大学院自然科学研究科機能機械科学専攻
-
泉田 啓
京都大学大学院工学研究科
-
藤井 信治
金沢大学大学院自然科学研究科
-
泉田 啓
京大 大学院工学研究科
-
泉田 啓
金沢大学大学院自然科学研究科
関連論文
- 強化学習における最適政策の信頼性を保証するサンプリング政策
- (122)金沢大学機能機械工学科における力学教育のボトムアップ(セッション35 教育システムA(講義・演習)V)
- 714 自動車の運動を考慮したレーンマーカ検出
- 強化学習における最適政策の信頼性を保証するサンプリング政策
- 1-325 卒業生による達成度評価 : アンケート結果の年次推移((14)教育評価・自己点検・評価システム-V)
- 「ロボティクスのための生命理解」特集について
- 2A1-H07 蝶の羽ばたきの計測と数値計算
- 強化学習におけるサンプリング条件で信頼性が保証された最適政策
- 強化学習における性能と信頼性を両立する最適政策
- 部分的変化を伴う強化学習に対する効率的計算法
- 状態遷移モデルを逐次推定する強化学習の学習加速
- ステレオビジョンを用いた車両前方環境認識(機械力学,計測,自動制御)
- ステレオビジョンシステムと動的輪郭モデルを用いた高速道路におけるレーンマーカ検出(機械力学,計測,自動制御)
- 1-315 ステレオビジョンと動的輪郭モデルを用いた走行レーン検出
- 1-314 ステレオビジョンシステムを用いた一般道における障害物検出
- 2A1-3F-B3 強化学習における状態空間の縮小法について
- 蝶の飛翔制御法解明への実験的アプローチ
- S1903-1-6 宇宙インフレータブル構造の宇宙実証 : SIMPLE(宇宙構造・材料(1),社会変革を技術で廻す機械工学)
- 2A1-M07 技能を自律的に発現する強化学習(進化・学習とロボティクス)
- 2A1-B09 環境との相互作用による蝶の羽ばたき飛翔の安定化(移動知)
- 2A2-M10 脚型ローバのデッドレコニング(宇宙ロボット・メカトロニクス)