ラットのオペラント課題における強化学習モデル
スポンサーリンク
概要
- 論文の詳細を見る
強化学習理論の枠組みで動物の運動学習時における脳の働きを理解しようとするとき、動物は環境の状態全てを観測することは通常不可能であることから、その環境は部分観測マルコフ決定過程(POMDP)としてモデル化される。本研究では、ラットのオペラント課題をPOMDP問題として定式化し、その問題に対する強化学習モデルを提案する。本モデルは観測値から行動への確率的写像をもつ2つのサブエージェントから構成されており、アクティブなサブエージェントを状況に応じて切り替えることができる。数値計算により、本モデルは環境の隠れ状態に対応した内部状態を獲得することで最適な解を得る能力があることが分かった。
- 社団法人電子情報通信学会の論文
- 2002-11-04
著者
関連論文
- モデルフリーとモデルベース戦略の課題依存的な選択(BCI/BMIとその周辺)
- 報酬系による制御を取り入れたワーキングメモリーモデル
- カオスニューラルネットワークダイナミクスへのパターン間相関の影響
- ラットの空間探索課題における海馬-大脳基底核モデル
- ラットナビゲーションモデルによる水迷路課題
- NLP2000-18 / NC2000-12 海馬-連合野モデルによる時系列パターンの長期記憶形成
- 海馬-大脳基底核モデルによるラットナビゲーションタスク
- 時間遅れを取り入れた海馬CA3モデル
- NLP2000-18 / NC2000-12 海馬-連合野モデルによる時系列パターンの長期記憶形成
- 海馬を用いた記憶システムの神経回路網モデル
- 時系列情報が扱える海馬を含む記憶モデル
- 遅延を伴う確率的報酬獲得課題におけるヒトの意思決定に関する研究(一般セッション3)
- 強化学習を用いた放射状迷路課題のモデル化
- ラットのオペラント課題における強化学習モデル
- 方位選択性地図とクラスター学習則
- 方位選択性におけるピンホイル特異点の形成
- 回転パターンを認識するネオコグニトロン
- モンテカルロシミュレーションによる方位選択性の自己組織化
- 高次コラム構造の自己組織化
- 意思決定と行動学習の数理モデル (特集 学習と記憶--基礎と臨床)
- 脳と心のメカニズム 冬のワークショップ2003報告
- H-003 動的輪郭法のエネルギー解析による図地反転現象の考察(H.生体情報科学)
- 心的回転を基に構成されたパターン認識モデル
- 遮蔽されたパターンおよびテクスチャパターンの認識
- 非線形変換を用いたモジュール型ニューラルネットワークによるパターン認識
- 仮定と検証に基づくパターン抽出モデル
- フィッシャー情報行列を用いた多層パーセプトロンの学習について
- 独立成分分析を用いたパターンの特徴抽出法
- 回転対応型ネオコグニトロン
- 回転角に対応する可変結合を持つ回転対応型ネオコグニトロン
- 回転対応型ネオコグニトロンの改良