逐次的に分割された問題空間における複素強化学習(人工知能,データマイニング)

スポンサーリンク

概要

論文の詳細を見る
多くの不完全知覚が存在する問題空間を分割し,それぞれのサブタスクを複素強化学習を用いて解く手法を提案する.複素強化学習は,状態行動系列の文脈を学習に含むことで,部分観測マルコフ決定過程環境での学習を行うことを目指している.しかし,その学習性能は環境中の不完全知覚の現れ方に依存することが分かっている.一方,HQ-learningは,Q-learningを階層的に拡張した手法である.HQ-learningは,部分観測マルコフ決定過程環境をメモリレスな方策で解くことのできるサブタスクに分解することで,不完全知覚への解決を図っている.しかし,適切なサブゴールを設定することは困難であった.本論文ではHQ-learningの問題空間の分割を複素強化学習に応用するとともに,逐次的なサブエージェントの追加による問題空間の分割と,経験に基づくサブゴールの設定法を検討した.規模の異なる迷路問題に対し提案手法を評価し,提案手法の有効性を確認した.
2011-05-01

著者

関連論文

もっと見る

スポンサーリンク