自己組織化マップを用いた教示による強化学習の高速化手法の提案
スポンサーリンク
概要
- 論文の詳細を見る
A new pre-teaching method for reinforcement learning using Self-Organizing Map (SOM) is described. The purpose of our study is to increase the learning rate using small number of teaching data generated by a human expert. In our method, the SOM is used to generate initial teaching data for the reinforcement learning agent from a few teaching data. The reinforcement learning function of the agent is initialized by using the teaching data generated by the SOM so as to increase the probability of selecting the optimal actions estimated by the SOM. Because the agent can get high rewards from the start of reinforcement learning, it is expected to increase the learning rate. The results of two computer simulations, mobile robot navigation and pursuit game, showed that the learning rate increased although the human expert had showed only a few teaching data.
- 2004-06-25
論文 | ランダム
- 災害対応時の教訓を活かすために
- 柔構造樋門における最近の技術開発
- 1014 マルチファン型風洞による大気境界層や突風の模擬(2)(OS10-3 大気海洋の流体現象と環境流体,OS10 大気海洋の流体現象と環境流体,オーガナイズドセッション)
- 1014 マルチファン型風洞による大気境界層や突風の模擬(1)(OS10-3 大気海洋の流体現象と環境流体,OS10 大気海洋の流体現象と環境流体,オーガナイズドセッション)
- 通信キャリアーインタビュー 移動基地局、衛星基地局を駆使して復旧--ネットワーク冗長化を強固にしたい (特集 新聞各社の電力使用制限への対応/東日本大震災時の資材メーカー・通信キャリアーの対応を振り返る)