方策勾配に基づく効率の良い課題非依存な強化学習法(創発システム,<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
- 2009-01-01
著者
-
森村 哲郎
奈良先端科学技術大学院大学情報科学研究科
-
森村 哲郎
奈良先端科学技術大学院大学:oist
-
森村 哲郎
奈良先端科学技術大学院大学情報科学研究科:(現)日本アイ・ビー・エム株式会社東京基礎研究所
関連論文
- 方策勾配に基づく効率の良い課題非依存な強化学習法(創発システム,人工知能分野における博士論文)
- 自然方策こう配法 : 平均報酬の自然こう配に基づく方策探索(人工知能,認知科学)
- 遅延を伴う確率的報酬獲得課題におけるヒトの意思決定に関する研究(一般セッション3)
- 自然 TD 学習 : 割引報酬における TD 誤差を利用する自然方策勾配に基づいた強化学習法