BN混合モデルを用いたオンライン型方策改善システムの動的環境への適応(<特集>ベイジアンネット2 : ポスターセッション)

スポンサーリンク

概要

論文の詳細を見る
我々は,ベイジアンネット(Bayesian Network:BN)混合モデルを用いた強化学習エージェントの方策改善システムを提案した.BN混合モデルは,エージェントの存在する環境に対応する確率的知識表現と見なされる.本稿では,自律的に環境変化の認識とモデルの混合率学習を行う機構を上述のシステムに付加した,オンライン型方策改善システムを紹介する.エージェントナビゲーション問題を適用例として計算機実験を行い,複数環境に対応するBNを混合して方策改善に利用することで,未知環境を含む環境変化にエージェントが適応可能となることを示す.加えて,混合モデルを利用した方策改善法の特性について議論する.
社団法人電子情報通信学会の論文
2004-10-12

著者

関連論文

もっと見る

スポンサーリンク