101 強化学習によるロボットの知的制御 : Lego Mindstorms への実装
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement Learning is a kind of machine learning. It aims to adapt an agent to a given environment with a clue to rewards. If we apply reinforcement learning systems to real world, we cannot bear to repeat numerous trials. We want the agent to acquire a rational policy very quickly even if it does not know all the environment. Furthermore, it is important to apply to non-Markovian environments such as Partially Observable Markov Decision Processes (POMDPs). In this paper, we focus on Profit Sharing (PS) and discuss the rationality of PS in POMDPs. By applying the algorithm to legoMindstorms^TM, its effectiveness is shown.
- 2000-09-01
著者
関連論文
- エージェント-環境間相互作用 : 強化学習の立場からの再考
- 専門科目名のリストを利用した学位授与事業のための科目分類支援システムの評価
- キーワードの関連用語を考慮したシラバス検索システムの構築(Webインテリジェンスとインタラクション)
- シラバス-専門用語の相互クラスタリングを用いたカリキュラム分析システムの改善(高等教育と情報)
- 分類候補数の能動的調整を可能にした学位授与事業のための科目分類支援システムの提案と評価(高等教育と情報)
- キーワードの関連用語を考慮したシラバス検索システムの改善(情報教育と授業支援システム/一般)
- 電子化されたシラバスに基づく学位授与事業のための科目分類支援システムの試作(組織活動を支える情報システム)(情報システム論文)
- シラバスの文書クラスタリングに基づくカリキュラム分析システムの構築(教育)
- N-029 シラバスデータベースの構築と利用(N.教育・人文科学)
- N-004 科目分類支援システムの改善とその応用(N.教育・人文科学)
- 罰回避政策形成アルゴリズムの改良とオセロゲームへの応用
- 罰を回避する合理的政策の学習
- 罰を回避する合理的政策の学習
- 罰回避政策の形成とゲーム問題への応用
- ITを利用した高等教育の展開--教室外講義,通信教育を中心に
- Profit Sharingを用いたマルチエージェントと強化学習における報酬配分の理論的考察
- 101 強化学習によるロボットの知的制御 : Lego Mindstorms への実装
- 強化学習システムの設計指針
- Profit Sharing に基づく強化学習の理論と応用 (計算学習理論の進展と応用可能性)
- 大学評価と学位授与(アイ・サイ問答教室)
- 電子化シラバスに基づく学位授与のための科目分類支援システムの検討
- 合理的政策形成アルゴリズムの連続値入力への拡張
- 期待報酬推定型 Profit Sharing におけるロバスト性解析 : 無効ルール抑制条件における理論的考察と局所解問題への展開
- Profit Sharing の不完全知覚環境下への拡張 : PS-r^*の提案と評価
- 11912 改良型罰回避政策形成アルゴリズムへの罰基底度閾値決定機構の導入と評価(OS7 ロボティックス・メカトロニクス(3),オーガナイズドセッション)
- より人間らしい人工知能を目指して(編集委員2007年の抱負)
- より人間らしい人工知能を目指して
- MindStormsと高等教育 : 特集総説(MindStormsと高等教育)