Concurrent Q learning におけるrelaxationの改良
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,強化学習における動的環境への適応手法の一つであるCQL-eにおけるrelaxationの問題点を指摘し,その改善策を提案する.迷路問題において,ゴールまたは障害物の変化に対し,従来手法と提案手法がどのような挙動を示すかを比較する.
- 一般社団法人電子情報通信学会の論文
- 2013-03-06
著者
関連論文
- ダミーデータ付加によるバイオメトリクス認証の精度向上(IBIS2010(情報論的学習理論ワークショップ))
- 自己組織化マップを利用した索引型全文検索支援システム(IBIS2010(情報論的学習理論ワークショップ))
- 情報処理のダイナミクスを解析する手法-動的レプリカ法
- Concurrent Q Learning とSarsa、Q学習の動的環境への適応能力(第15回情報論的学習理論ワークショップ)
- Concurrent Q learning におけるrelaxationの改良