9P-D-8 ファジイQ学習エージェントに対する教示方法の提案(D会場 大学院生・学部学生 奨励賞セッション)
スポンサーリンク
概要
- 論文の詳細を見る
In order to realize intelligent agent such as autonomous mobile robots, Reinforcement Learning is one of the necessary techniques in the control system. It is desirable in terms of knowledge or skill acquisition of agent that reinforcement learning is based only upon rewards concept instead of teaching signal. However, there exist many problems to apply reinforcement learning to actual problems. The most severe problem is huge iterations in learning process. Our motivation is to utilize appropriately instructions that we can give to the reinforcement learning agent along with main rewards in order to haste the learning process and to attain valid learning performance for preparation of segmentation. In this study, we propose instruction approach for Fuzzy Q-Learning agent based on sub-rewards and forgetting mechanisms. Through numerical experiments of grid world task and mountain car task, we show validness of the proposed approach in terms of learning speed and accuracy.
- 2010-10-09
著者
関連論文
- 子個体生成数を適応的に変化させる分散型パラメータフリー遺伝的アルゴリズム
- モジュラーファジィモデルと並行学習に基づくファジィQ学習の構成
- マルチエージェント追跡問題のための相対座標系に基づく階層型モジュラー強化学習
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 9P-D-8 ファジイQ学習エージェントに対する教示方法の提案(D会場 大学院生・学部学生 奨励賞セッション)
- モジュラーファジィモデルに基づく協調フィルタリング(一般講演J,数理2(応用))
- モジュラーファジィモデルに基づく強化学習によるタスク分割(一般講演J,数理2(応用))
- 階層型強化学習によるエージェント行動の学習(一般講演2B)
- ステレオ視を用いた顔向き推定システムの開発(一般講演 B3)
- 顔の向き推定による顔画像認識システムの開発(一般講演4B)
- ファジィ推論モデルによる協調フィルタリングの改良(一般講演4A)
- クラスタリングに基づく数値属性相関ルール抽出の性能評価(一般講演1B)
- 厚板品質工程設計支援のための知的製造実績データベースシステム
- Small-world Networkによる分散GAに関する考察(一般講演K,計測・制御)
- FSS2007参加報告
- 異なる探索法と移住個体の選択を用いたDGAのイラストロジック問題への適用(一般講演3B)
- 出力属性を限定したファジィ相関ルール抽出手法(一般講演)
- 29P-E-2 強化学習とPSOに基づく教示知識の獲得(E会場 知的システム基礎・医療基礎,一般講演)
- 30P-A-8 ハイブリッド化したパラメータ不要の分散型GA(最適化,一般講演)
- 強化学習とPSOに基づく教示知識の獲得
- 第7回ファジィ学問塾開催報告
- 分散化したパラメータ不要の遺伝的アルゴリズム
- E-2-2 ファジィモデリングによる三次元計測(ファジィ(1))