Concurrent Q Learning とSarsa、Q学習の動的環境への適応能力(第15回情報論的学習理論ワークショップ)
スポンサーリンク
概要
- 論文の詳細を見る
本研究では,強化学習の学習手法であるSarsaとQ学習,および,動的環境への適応手法の一つであるCQL-eの性能比較を行った.迷路問題において,目的地または障害物の変化に対し,各手法がどのような挙動を示すのかを検証した.
- 2012-10-31
著者
関連論文
- ダミーデータ付加によるバイオメトリクス認証の精度向上(IBIS2010(情報論的学習理論ワークショップ))
- 自己組織化マップを利用した索引型全文検索支援システム(IBIS2010(情報論的学習理論ワークショップ))
- 情報処理のダイナミクスを解析する手法-動的レプリカ法
- Concurrent Q Learning とSarsa、Q学習の動的環境への適応能力(第15回情報論的学習理論ワークショップ)
- Concurrent Q learning におけるrelaxationの改良