RBF型リカレントネットを用いた強化学習
スポンサーリンク
概要
- 論文の詳細を見る
強化学習は事前情報や知識を用いずに、制御の評価だけを用いて試行錯誤によって制御を自律的に獲得することができる学習法である。昨年我々は、フィードフォワードネットを用いた強化学習には、局所的な関数であるradial bases function(RBF)関数が有効であることと、強化学習のマニピュレータ制御への適用を報告した。ところで、過去の履歴を考慮する必要がある非マルコフ問題では、フィードフォワードネットでは不十分で、リカレントネットが必要である。これまでに、いくつかのリカレントネットを用いた強化学習法が提唱されたが、どれも効率よく学習できなかった。今回は、RBF型リカレントネットを用いた非マルコフ問題を効率よく学習できる強化学習法について報告する。
- 社団法人電子情報通信学会の論文
- 1996-03-11