29P-E-2 強化学習とPSOに基づく教示知識の獲得(E会場 知的システム基礎・医療基礎,一般講演)
スポンサーリンク
概要
- 論文の詳細を見る
In order to realize intelligent agents such as autonomous mobile robots, Reinforcement Learning is one of the necessary techniques in control systems. However, there exist many problems to apply reinforcement learning to real-world tasks. The most severe problem is a huge number of iterations in the learning phase. In order to deal with the problem, the instruction approach for reinforcement learning agents based on sub-rewards and forgetting mechanisms were proposed and shown to be effective. However, the relationship between the instruction and the learning performance of reinforcement learning has not been adequately clarified. In this study, in order to clarify the instruction performance in the reinforcement learning, we propose an instruction knowledge acquisition method for the reinforcement learning scheme by the particle swarm optimization (PSO) algorithm. Through numerical experiments of the mountain car task and the Acrobat task, we show the validness of the proposed approach in terms of learning speed and accuracy.
- 2011-10-29
著者
関連論文
- 子個体生成数を適応的に変化させる分散型パラメータフリー遺伝的アルゴリズム
- モジュラーファジィモデルと並行学習に基づくファジィQ学習の構成
- マルチエージェント追跡問題のための相対座標系に基づく階層型モジュラー強化学習
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 9P-D-8 ファジイQ学習エージェントに対する教示方法の提案(D会場 大学院生・学部学生 奨励賞セッション)
- モジュラーファジィモデルに基づく協調フィルタリング(一般講演J,数理2(応用))
- モジュラーファジィモデルに基づく強化学習によるタスク分割(一般講演J,数理2(応用))
- 階層型強化学習によるエージェント行動の学習(一般講演2B)
- ステレオ視を用いた顔向き推定システムの開発(一般講演 B3)
- 顔の向き推定による顔画像認識システムの開発(一般講演4B)
- ファジィ推論モデルによる協調フィルタリングの改良(一般講演4A)
- クラスタリングに基づく数値属性相関ルール抽出の性能評価(一般講演1B)
- 厚板品質工程設計支援のための知的製造実績データベースシステム
- Small-world Networkによる分散GAに関する考察(一般講演K,計測・制御)
- FSS2007参加報告
- 異なる探索法と移住個体の選択を用いたDGAのイラストロジック問題への適用(一般講演3B)
- 出力属性を限定したファジィ相関ルール抽出手法(一般講演)
- 29P-E-2 強化学習とPSOに基づく教示知識の獲得(E会場 知的システム基礎・医療基礎,一般講演)
- 30P-A-8 ハイブリッド化したパラメータ不要の分散型GA(最適化,一般講演)
- 強化学習とPSOに基づく教示知識の獲得
- 第7回ファジィ学問塾開催報告
- 分散化したパラメータ不要の遺伝的アルゴリズム
- E-2-2 ファジィモデリングによる三次元計測(ファジィ(1))