モジュラーファジィモデルに基づく強化学習によるタスク分割(一般講演J,数理2(応用))
スポンサーリンク
概要
- 論文の詳細を見る
In order to realize intelligent agent such as autonomous mobile robots, Reinforcement Learning is one of necessary techniques in behavior control system. However, applying the reinforcement learning to actual sized problem, the "curse of dimensionality" problem in partition of sensory states should be avoided maintaining computational efficiency. Furthermore the robot task is desired to be decomposed automatically in learning process for good performance. We tackle these two issues by applying modular fuzzy model with gating unit to reinforcement learning. The modular fuzzy model extending SIRMs architecture is formulated to apply Q-Learning reinforcement algorithm. The gating unit that is constructed as a neural network model or simple learning parameters is installed to switch the use of the modular model for task decomposition. Through numerical examples, we found that the proposed method has fair convergence property of learning compared with the conventional algorithms.
- 2008-10-11
著者
-
渡邊 俊彦
大阪電気通信大学・工学部
-
和田 竜也
NSD株式会社
-
渡邊 俊彦
大阪電気通信大学・工学部・電気電子工学科
-
和田 竜也
大阪電気通信大学大学院工学研究科
-
渡邊 俊彦
大阪電気通信大学 工学部 電気電子工学科
関連論文
- 子個体生成数を適応的に変化させる分散型パラメータフリー遺伝的アルゴリズム
- モジュラーファジィモデルと並行学習に基づくファジィQ学習の構成
- マルチエージェント追跡問題のための相対座標系に基づく階層型モジュラー強化学習
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 9P-D-8 ファジイQ学習エージェントに対する教示方法の提案(D会場 大学院生・学部学生 奨励賞セッション)
- モジュラーファジィモデルに基づく協調フィルタリング(一般講演J,数理2(応用))
- マルチエージェント追跡問題のための相対座標系に基づく階層型モジュラー強化学習
- モジュラーファジィモデルに基づく強化学習によるタスク分割(一般講演J,数理2(応用))
- 階層型強化学習によるエージェント行動の学習(一般講演2B)
- ステレオ視を用いた顔向き推定システムの開発(一般講演 B3)
- 顔の向き推定による顔画像認識システムの開発(一般講演4B)
- ファジィ推論モデルによる協調フィルタリングの改良(一般講演4A)
- クラスタリングに基づく数値属性相関ルール抽出の性能評価(一般講演1B)
- 厚板品質工程設計支援のための知的製造実績データベースシステム
- Small-world Networkによる分散GAに関する考察(一般講演K,計測・制御)
- FSS2007参加報告
- 異なる探索法と移住個体の選択を用いたDGAのイラストロジック問題への適用(一般講演3B)
- 出力属性を限定したファジィ相関ルール抽出手法(一般講演)
- 29P-E-2 強化学習とPSOに基づく教示知識の獲得(E会場 知的システム基礎・医療基礎,一般講演)
- 30P-A-8 ハイブリッド化したパラメータ不要の分散型GA(最適化,一般講演)
- 強化学習とPSOに基づく教示知識の獲得
- 第7回ファジィ学問塾開催報告
- 分散化したパラメータ不要の遺伝的アルゴリズム
- E-2-2 ファジィモデリングによる三次元計測(ファジィ(1))