強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現(一般)(ニューロインフォーマティックスとは何か)
スポンサーリンク
概要
- 論文の詳細を見る
Brown et al.(1964)は接近と回避のコンフリクト状態におけるラットの反応を調べた.動物実験の特徴として,(1)報酬と罰が同時に与えられる点,(2)環境が変化し,再学習をさせる点(3)確率的に報酬と罰が与えられる点が挙げられる.実験の結果,報酬獲得の過程において,報酬の与えられないことを経験していると,その後の無報酬による影響を減らすとし,罰を受けた場合,その後の罰による影響を減らすとしている.本稿では,既存の強化学習の手法を用いて,報酬及び罰の強化信号の獲得確率が異なる前学習の後に報酬を与えない,もしくは報酬と罰を同時に与える再学習を行ない,動物実験の結果の再現を試みた.しかし,従来の手法では,動物実験における特徴(3)による行動を再現できなかった.これに対応するアルゴリズムが必要だと考え,強化信号の獲得確率を考慮した学習パラメータ制御を導入したところ,Brown et al.(1964)の動物実験の結果を定性的に再現することができた.
- 2003-12-01
著者
関連論文
- STDPを用いたエピソード記憶から意味記憶を形成する神経回路モデル(バイオサイバネティックス, ニューロコンピューティング)
- 色対比効果を補正する画像変換手法
- 入力の履歴を用いた成長型自己組織化マップ
- 対象の関係性により記憶可能な対象の個数が変化する短期記憶の神経回路モデル
- スパイクタイミング依存可塑性(STDP:Spike-Timing-Dependent Plasticity)
- 強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現(一般)(ニューロインフォーマティックスとは何か)
- 強化学習による強化信号の出現確率を考慮した接近と回避の葛藤状態のラットの行動再現
- 神経修飾物質系に対応づけた強化学習パラメータの制御法
- 神経回路モデルによる図形の輪郭の非対称性を用いた歪対称図形の傾き推定(一般)
- 拡散的好奇心を取り入れた未知の情報へ行動を誘発する強化学習手法(一般)
- 聴覚特性に基づいた頭部伝達関数の補正による音像定位精度の改善(一般)