行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)

概要

論文の詳細を見る
Reinforcement learning is a theoretical framework for adaptive agents, including animals, humans, and robots, to acquire novel behaviors based on scalar reward signals. We developed a Bayesian framework for estimating the hidden variables and parameters of a reinforcement learning agent from the sequence of perception, action, and reward it experienced. Here we report how we applied the framework to data analyses of neuronal recording and functional brain imaging experiments, and discuss the potential use of the paradigm for understanding and assessment of human brain functions.
2007-05-17

著者

銅谷賢治
沖縄科学技術研究基盤整備機構
鮫島和行
ATR脳情報研究所
銅谷賢治
奈良先端科学技術大学院大学情報科学研究科:沖縄科学技術研究基盤整備機構
鮫島和行
玉川大学脳科学研究所
銅谷賢治
沖縄科学技術大学院大学先行研究神経計算ユニット
鮫島和行
東京農工大学大学院工学研究科
鮫島和行
玉川大学

関連論文

モデルフリーとモデルベース戦略の課題依存的な選択(BCI/BMIとその周辺)
感覚情報の能動的低次元化による強化学習(機械学習によるバイオデータマインニング,一般)
自由エネルギーを用いた強化学習による状態のタスク依存な集団符号化(一般,機械学習によるバイオデータマインニング・生命現象の非線形性,一般)
自然方策こう配法 : 平均報酬の自然こう配に基づく方策探索(人工知能,認知科学)
情動・行動の脳内機構に関するfMRI研究 : うつ病の病態解明に向けて(情動・行動の脳内機序に関する研究の進展)(2004年/第45回日本心身医学総会/北九州)
短-中-長期記憶形成モデルにおける海馬周辺領野のDynamicsについて
強化学習の基礎理論と応用
空間的情報を含むマルコフ決定課題を用いた長期と短期の報酬予測に伴う脳活動のfMRI測定
短期と長期の報酬予測に伴う脳活動のfMRI測定
特集「意図研究のスペクトル」にあたって
脳内報酬情報処理に及ぼす知覚的暖昧性の影響
知覚確率が報酬予測誤差に及ぼす影響
センサフィードバックを用いたCPG制御における環境ダイナミクスと観測の不確定性の影響
線条体における入力タイミングに依存するカルシウム応答モデル
MOSAICモデルにより環境を抽象化する階層型強化学習(バイオサイバネティックス,ニューロコンピューティング)
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定(バイオサイバネティックス,ニューロコンピューティング)
ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習
遅延を伴う確率的報酬獲得課題におけるヒトの意思決定に関する研究(一般セッション3)
自然 TD 学習 : 割引報酬における TD 誤差を利用する自然方策勾配に基づいた強化学習法
生命科学と制御 : 《第13回》座談会「制御と生命科学」
OB-06 ヒトにおける報酬関連脳活動と知覚的曖昧性(日本動物心理学会第68回大会発表要旨)
強化学習エージェントによる協調行動とコミュニケーションの創発(シンポジウム特集)
強化学習と最適制御(「システム制御理論の新領域特集号」)
線条体シナプス可塑性の分子機構のシミュレーション研究(セッション3:『バイオモデリング,シミュレーション』)
生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマイニング)
生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマインニング)
混合カルマンフィルタによる隠れ状態推定法 : Cyber Rodentの自己位置同定への応用
生命科学と制御 : 《第12回》脳の目的関数とは何か
Max-Min Actor-Criticによる複数報酬課題の強化学習(人工知能,認知科学)
行動学習データの強化学習モデルによる解析とその応用
行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
近傍成分分析による行動指向的状態表現の獲得
複数の報酬によって与えられる拘束のもとでの強化学習(「機械学習によるバイオデータマインニング」及び「一般」)
複数の価値関数を用いた多目的強化学習
モジュール強化学習と意図(意図研究のスペクトル)
2A1-N-044 構造の異なる複数の学習器の相互作用を利用した強化学習システム(認知ロボティクス1,生活を支援するロボメカ技術のメガインテグレーション)
複数報酬のもとでの階層強化学習
淡蒼球内節/黒質網様部の強化学習による確率的行動選択(一般)(ニューロインフォーマティックスとは何か)
淡蒼球内節/黒質網様部の強化学習による確率的行動選択
大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測
重点サンプリングを用いた複数強化学習器の同時学習
行動決定系列からの学習系の内部状態/パラメータ系列の推定
複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定
強化学習と大脳基底核(運動学習)
複数の予測モデルを用いた強化学習による非線形制御
強化学習MOSAIC : 予測性によるシンボル化と見まね学習
NC2000-48 複数モデルベース強化学習におけるモジュール間の評価割り付け
局所線形モデルに基づく状態分割を用いた階層強化学習
強化学習における適応的状態空間構成法
サイバーローデントプロジェクト
脳の中のコンピュータ--小脳,大脳基底核,海馬,大脳皮質の回路と物質機構 (特集コンピュータと脳)
意思決定と行動学習の数理モデル (特集学習と記憶--基礎と臨床)
モジュール競合による運動パターンのシンボル化と見まね学習
JNNS-DEX-SMI公開講座「神経回路網の理論展開と最先端応用」開催報告
強化学習における分割による自律的状態空間構成法
神経スパイク列からのモデルベースシナプス同定法 (ニューロコンピューティング)
線形ベルマン方程式に基づくロボット制御 : システム同定と指数価値関数近似
ASCONE実施報告
神経スパイク列からのモデルベースシナプス同定法(合同企画セッション:バイオデータマイニング,機械学習によるバイオデータマインニング,一般)
系列運動の自律学習におけるラットの適応的な学習法選択(一般講演,機械学習によるバイオデータマインニング,一般)
制限付きボルツマンマシンとエコーステートネットワークによる部分観測マルコフ決定問題の解法(一般講演,機械学習によるバイオデータマインニング,一般)
ASCONE06 開催報告
NIPS*2003 参加報告
運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御
第5回神経情報処理国際会議(ICONIP'98-Kitakyushu)
遅延報酬の割引に対するセロトニンの効果 : 精神疾患の病態理解への応用
運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御(一般,機械学習によるバイオデータマインニング,一般)
タイトル無し
機能局在を考慮したL1正則化ロジスティック回帰法によるfMRIデータ解析(機械学習によるバイオデータマインニング,一般)

行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク