強化学習とPSOに基づく教示知識の獲得
スポンサーリンク
概要
- 論文の詳細を見る
自律移動ロボットなどのインテリジェントエージェントを実現するための重要な要素技術の一つとして強化学習がある.強化学習は教師信号を用いずに報酬のみに基づいてスキルや知識を獲得する点で望ましい考え方である.しかし複雑なタスクの学習が必要となる実際の応用では強化学習の遂行のための膨大な試行の繰り返しが問題となる.この膨大な試行回数の低減は強化学習の重要な課題の一つである.筆者らは副報酬と忘却の機構を適用した強化学習エージェントへの教示方法を提案し,比較的単純なタスクを対象にして数値実験によりその有効性を示した.しかし,より複雑なタスクや複合的なタスクの強化学習においては,その効果が十分明らかになっているとは言い難い.そこで本研究では,より複雑なタスクの強化学習問題への教示の適用を対象として粒子群最適化の一つであるParticle Swarm Optimization(PSO)を用いて教示知識を獲得させる方法を提案し,車の山登りタスクとAcrobatタスクを対象とした数値実験により,提案手法の有効性を示した.
- 2012-05-30
著者
関連論文
- 子個体生成数を適応的に変化させる分散型パラメータフリー遺伝的アルゴリズム
- モジュラーファジィモデルと並行学習に基づくファジィQ学習の構成
- マルチエージェント追跡問題のための相対座標系に基づく階層型モジュラー強化学習
- 自然言語処理技術を活用した議会議事録の要約支援方法について
- 9P-D-8 ファジイQ学習エージェントに対する教示方法の提案(D会場 大学院生・学部学生 奨励賞セッション)
- モジュラーファジィモデルに基づく協調フィルタリング(一般講演J,数理2(応用))
- モジュラーファジィモデルに基づく強化学習によるタスク分割(一般講演J,数理2(応用))
- 階層型強化学習によるエージェント行動の学習(一般講演2B)
- ステレオ視を用いた顔向き推定システムの開発(一般講演 B3)
- 顔の向き推定による顔画像認識システムの開発(一般講演4B)
- ファジィ推論モデルによる協調フィルタリングの改良(一般講演4A)
- クラスタリングに基づく数値属性相関ルール抽出の性能評価(一般講演1B)
- 厚板品質工程設計支援のための知的製造実績データベースシステム
- Small-world Networkによる分散GAに関する考察(一般講演K,計測・制御)
- FSS2007参加報告
- 異なる探索法と移住個体の選択を用いたDGAのイラストロジック問題への適用(一般講演3B)
- 出力属性を限定したファジィ相関ルール抽出手法(一般講演)
- 29P-E-2 強化学習とPSOに基づく教示知識の獲得(E会場 知的システム基礎・医療基礎,一般講演)
- 30P-A-8 ハイブリッド化したパラメータ不要の分散型GA(最適化,一般講演)
- 強化学習とPSOに基づく教示知識の獲得
- 第7回ファジィ学問塾開催報告
- 分散化したパラメータ不要の遺伝的アルゴリズム
- E-2-2 ファジィモデリングによる三次元計測(ファジィ(1))