強化学習問題のための分布推定アルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
Estimation of Distribution Algorithms (EDAs) are a promising evolutionary computation method. Due to the use of probabilistic models, EDAs can outperform conventional evolutionary computation. In this paper, EDAs are extended to solve reinforcement learning problems which are a framework for autonomous agents. In the reinforcement learning problems, we have to find out better policy of agents such that it yields a large amount of reward for the agents in the future. In general, such policy can be represented by conditional probabilities of agents actions, given the perceptual inputs. In order to estimate such a conditional probability distribution, Conditional Random Fields (CRFs) by Lafferty (2001) are introduced into EDAs. The reason why CRFs are adopted is that CRFs are able to learn conditional probabilistic distributions from a large amount of input-output data, i.e., episodes in the case of reinforcement learning problems. Computer simulations on Probabilistic Transition Problems and Perceptual Aliasing Maze Problems show the effectiveness of EDA-RL.
- 2010-05-01
著者
関連論文
- 進化技術の基礎と情報通信・生産物流システムへの応用
- 強化学習問題のための分布推定アルゴリズム
- 進化論的計算手法の進化の系譜
- 分布推定アルゴリズムによる Memetic Algorithms を用いた制約充足問題解決
- 表面反射特性が未知な物体の3次元形状抽出可能なレンジファインダ
- 強化学習における矛盾の概念に沿った漸増的な状態空間の構成法
- 遺伝的アルゴリズムと機械学習の融合手法に関する考察
- 制約充足問題解決のための確率的リペア操作を内包した共進化型遺伝的アルゴリズム
- 知覚-行為履歴に依拠した状態分割法を用いた強化学習
- 共進化型ファジィクラシファイアシステムの提案
- スリット光投光法による柱状鏡面物体の形状測定法
- 物理システムを対象としたネットワーク型表現の構造変化生起順序に基づいた操作
- 強化学習における矛盾の概念に沿った漸増的な状態分割法の提案
- 共進化の機構を用いた遺伝的アルゴリズムの提案
- GAによる2次元濃淡画像からの3次元形状推定
- 第2回日豪共同ワークショップIES'98に参加して
- 共進化型GAによる動的制約充足問題解決
- 共進化型GAにおける符号化と適応度評価に関する考察
- 有用スキーマを探索する共進化型遺伝的アルゴリズム
- 分布推定アルゴリズムによる認知エージェントの行動則獲得
- 確率モデルを用いた進化計算 : 分布推定アルゴリズムに関する最近の話題
- 2006 IEEE World Congress on Computational Intelligence (WCCI2006)に参加して
- 2006 IEEE World Congress on Computational Intelligence (WCCI2006) に参加して
- 関数最適化のための分布推定アルゴリズム
- 構音障害支援と音声合成 (特集 不便の効用を活用するシステム)
- 確率的最適化の設計技術と適用技術