自律型エージェントの行動学習に関する研究(エージェント・分散人工知能)(<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
本論文では,強化学習を行うエージェントに対し,「政策事前条件を用いて政策を再構築することにより環境の変化に適応する方法」および「概念学習を用いて政策事前条件を帰納的に獲得する方法」を提案し,実験によりその有効性を確認した.第1章の序論に続き,第2章では本論文で用いた強化学習アルゴリズムprofit sharingについて述べた.第3章では,「オンライン型profit sharing」を提案した.本手法は(1)必要とするメモリ量が有限である,(2)中間報酬を扱うことができる,(3)更新式を工夫することによりさまざまなエピソード加工が容易にできるという点で従来手法よりも優れている.第4章では,エージェントが環境の変化に適応する方法を提案した.本手法は,以前の環境で学習した政策を,「そのまま利用できる部分」と「学習しなおさなければならない部分」に分け,政策を部分的に修正する.そのまま利用できる部分を「政策事前条件」によって理論的に区別することを提案し,政策を再構築するアルゴリズムを示した.第5章では,政策事前条件を決定木学習やILPを用いて帰納的に学習する方法を提案した.状態の一般化によって,エージェントが実際には経験していない状態であっても,その状態が政策事前条件を満たすかどうかを予測することができる.第6章では,実験により提案手法の有効性を確認した.最後に,第7章で本論文の結論と今後の課題について述べた.
- 2004-01-01
著者
関連論文
- 強化学習結果の再構築への概念学習の適用
- G-7 Profit Sharing強化学習法の適格度トレースに基づくオンライン実装(人工知能(実装),G.人工知能)
- ILPアルゴリズムFOILを並列化する三つの手法とその比較
- 3S-4 疑似生態系モデルを用いた人工生命の群れ行動の解析
- 帰納的予測を用いたサッカーエージェントの行動学習
- 2M-7 群れの概念による自律運搬ロボットの協調行動
- ILPシステムの並列実装の方法
- ILPシステムの分散メモリ型並列計算機への実装
- 自律型エージェントの行動学習に関する研究(エージェント・分散人工知能)(人工知能分野における博士論文)
- 投資信託と銘柄のネットワーク構造に基づいた投資信託の分類