Shaping 強化学習を用いた自律エージェントの行動獲得支援手法
スポンサーリンク
概要
- 論文の詳細を見る
一般に,自律エージェントや自律移動ロボットに効率的な行動学習をさせるためには動物の学習メカニズムから工学的応用を行なうことは有効な手法であることが知られている.中でも,動物行動学,行動分析学や動物のトレーニング(調教)などで広く用いられている「Shaping」という概念が最近注目されている.Shapingは学習者が容易に実行できる行動から複雑な行動へと段階的,誘導的に強化信号を与え,次第に希望の行動系列を形成する概念である.本研究では繰り返し探索により自律的に目標行動を獲得できる強化学習にShapingの概念を取り入れたShaping強化学習を提案する.有効なShaping効果を検証するために強化学習の代表的なQ-Learning,Profit Sharing,Actor-Criticの3手法を用いた異なるShaping強化学習を提案し,グリッド探索問題のシミュレータを用いて比較実験を行なった.さらに,実際の動物などの調教の場などで知られている段階を追って行動を強化する「分化強化」という概念をShaping強化学習に取り入れた分化強化型Shaping Q-Learning(DR-SQL)を提案し,シミュレーション実験により手法の有効性が確認された.
- 2009-10-15
著者
関連論文
- Shaping 強化学習を用いた自律エージェントの行動獲得支援手法
- 対話型遺伝的アルゴリズムを用いたカオティック・インタラクティブ・サウンド生成システム
- ファジィ適応型探索並列遺伝的アルゴリズムおよびその改良手法
- 大域結合写像によるインタラクティブカオティックサウンド生成システムおよび音楽的要素の導入(人間要素を取り込む計算知能)
- 遺伝的アルゴリズムを用いた12音技法に基づく音列自動生成システム
- 変形ロジスティック写像による間欠性カオスを用いたマルチエージェントロボットのデッドロック回避手法
- 並列遺伝的アルゴリズムのファジィ適応型探索手法
- 生物型ロボットによるインタラクティブ情動コミュニケーションの基礎研究
- ロボットにおける理解とは?
- ロボットにおける理解とは?
- 「自律分散型サッカーロボット」特集にあたって(自律分散型サッカーロボット)
- 北信越支部の現状と課題
- 「人間共生システム」特集にあたって
- 遺伝的アルゴリズムを用いた色抽出のための閾値調整手法(「人工知能的方法論を用いた知的画像処理」)
- 第2回ファジィ学問塾報告
- 佐藤知正 編著, 東京大学21世紀COE実世界情報プロジェクト監修, 『人と共存するコンピュータ・ロボット学実世界情報システム』, オーム社, 2004年11月, B5変版292頁, 4,725円, ISBN4-274-94694-0
- 神経修飾物質系による動的学習パラメータを有する目標選択型Q-Learningに基づく情動行動学習システム
- 第10期理事会に突撃インタビュー
- FSS2011開催報告
- インタラクティブサウンド生成システムのための脳波特徴解析によるリラクゼーション効果の検証
- 新しい情動行動学習システムを用いた動物型エージェントによる感性評価実験 (日本感性工学会研究論文集)