離散マルコフ決定過程における強化学習

スポンサーリンク

概要

論文の詳細を見る
日本知能情報ファジィ学会の論文
1997-08-15

著者

宮崎和光
東京工業大学総合理工学研究科
宮崎和光
東京工業大学大学院総合理工学研究科知能システム科学専攻

関連論文

罰回避政策の境界維持による合理的政策の形成
強化学習に基づくオセロゲームの政策形成
Profit Sharingを用いたマルチエージェントと強化学習における報酬配分の理論的考察
マルチエージェント強化学習における報酬配分の理論的考察
POMDPs環境下での決定的政策の学習
マルチエージェント強化学習の方法論 : Q-LearningとProfit Sharingによる接近
強化学習システムの設計指針
Profit Sharing に基づく強化学習の理論と応用 (計算学習理論の進展と応用可能性)
POMDPsにおける合理的政策の逐次改善アルゴリズムの提案
離散マルコフ決定過程下での強化学習 ( 強化学習)
ロボットアームによるほふく行動の強化学習
マルコフ決定過程下での統合的強化学習システム
MarcoPolo : 報酬獲得と環境同定のトレードオフを考慮した強化学習システム
l-確実探査法:エージェントによる環境同定のための行動選択戦略 : k-確実探査法の不確実性下への拡張
MarcoPolo - 報酬獲得と環境同定のトレードオフを考慮した学習システム
エージェントの学習 (「エージェントの基礎と応用」)
k-確実探査法 : 強化学習における環境同定のための行動選択戦略
強化学習の特徴と発展の方向
強化学習における報酬割当ての理論的考察
強化学習における環境同定と経験強化のトレードオフ
離散マルコフ決定過程における強化学習

もっと見る閉じる

スポンサーリンク

論文relation | CiNii API
論文
論文著者
博士論文
研究課題
研究者
図書
論文
著者
お問い合わせ
プライバシー