神経修飾物質系に対応づけた強化学習パラメータの制御法
スポンサーリンク
概要
- 論文の詳細を見る
自然界における生体の脳は,報酬を得て罰から逃れるような適切な行動を,試行錯誤によって獲得する.強化学習は,このシステムを工学的に模倣した学習システムの枠組といえる.強化学習内で用いられる制御パラメータは,脳内に広く投射して各脳部位の機能の調整にかかわる神経修飾物質系と対応づけることができる.本研究では,神経修飾物質系の分泌が行動にどのような影響を与えるかを考慮し,環境の急激な変化に追従できる強化学習アルゴリズムを提案する.これまで得られていた報酬が減少した場合に,強化学習内で用いられる制御パラメータをうまく制御することで行動を素早く改善していく方法である.提案するアルゴリズムを実際に学習問題に適用した結果,突然の環境変化に柔軟に対応させることができた.
- 2002-12-06
著者
関連論文
- STDPを用いたエピソード記憶から意味記憶を形成する神経回路モデル(バイオサイバネティックス, ニューロコンピューティング)
- 色対比効果を補正する画像変換手法
- 入力の履歴を用いた成長型自己組織化マップ
- 対象の関係性により記憶可能な対象の個数が変化する短期記憶の神経回路モデル
- スパイクタイミング依存可塑性(STDP:Spike-Timing-Dependent Plasticity)
- 強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現(一般)(ニューロインフォーマティックスとは何か)
- 強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現
- 神経修飾物質系に対応づけた強化学習パラメータの制御法