自己組織化マップを用いた教示による強化学習の高速化手法の提案
スポンサーリンク
概要
- 論文の詳細を見る
A new pre-teaching method for reinforcement learning using Self-Organizing Map (SOM) is described. The purpose of our study is to increase the learning rate using small number of teaching data generated by a human expert. In our method, the SOM is used to generate initial teaching data for the reinforcement learning agent from a few teaching data. The reinforcement learning function of the agent is initialized by using the teaching data generated by the SOM so as to increase the probability of selecting the optimal actions estimated by the SOM. Because the agent can get high rewards from the start of reinforcement learning, it is expected to increase the learning rate. The results of two computer simulations, mobile robot navigation and pursuit game, showed that the learning rate increased although the human expert had showed only a few teaching data.
- 2004-06-25
論文 | ランダム
- SECTION10 BtoB=IRの融合と企業ブランディング (特集/BtoBブランディングの実際--新たな優位性を求めて)
- SECTION8 BtoBブランディングと企業の広告宣伝費 (特集/BtoBブランディングの実際--新たな優位性を求めて)
- SECTION5 BtoBブランディングの実際--キヤノンマーケティングジャパン ブランディング活動で向上する、全社の顧客接点力 (特集/BtoBブランディングの実際--新たな優位性を求めて)
- SECTION4 BtoBブランディングの実際--村田製作所 リクルート効果からインターナルへ、次世代に続くブランド循環 (特集/BtoBブランディングの実際--新たな優位性を求めて)
- SECTION2 BtoBブランディングと事業所購買行動 (特集/BtoBブランディングの実際--新たな優位性を求めて)