ベイジアンネットによるエージェントの確率的知識表現に関する研究(エージェント・分散人工知能)(<特集>人工知能分野における博士論文)
スポンサーリンク
概要
- 論文の詳細を見る
本論文は,強化学習エージェントのデータ系列と報酬をもとに構築したベイジアンネットを確率的知識として利用した方策改善システムを提案し,その特性についてまとめるとともに,ベイジアンネット構築の際の適切なパラメータ設定について論じたものである.第1章の序論に続き,第2章では,提案システムにおける方策の学習機構および改善機構である強化学習とベイジアンネットについての理論的背景について説明し,ネットワークに対応する同時確率分布のモデル化と,ネットワーク構造の決定法について紹介している.第3章では,提案システムの枠組みについて説明し,システムの各種設定,およびベイジアンネットを利用した具体的な方策改善の手順を示している.第4章では,エージェント追跡問題を適用例として行う計算機実験について説明した後,ネットワークの構造決定に利用する焼なまし法におけるパラメータ設定について議論するための例題について述べている.第5章では,ベイジアンネットによる環境情報の表現能力,方策改善システムの特徴や有効性,および焼なまし法を適用する際の適切なパラメータ設定の指針について,実験の結果をもとに考察している.第6章では結論として,提案システムが強化学習エージェントの方策改善に有効に作用すること,ベイジアンネットが環境についての確率的知識表現となっていること,およびネットワークの構造決定に利用するデータから適切なパラメータ設定の指針が得られることを述べている.
- 2004-01-01
著者
関連論文
- ベイジアンネットを利用した強化学習エージェントの方策改善(知識処理)(「インタラクション:理論,技術,応用,評価」)
- ベイジアンネットによるエージェントの確率的知識表現に関する研究(エージェント・分散人工知能)(人工知能分野における博士論文)