サルの道具使用行動獲得の強化学習モデル
スポンサーリンク
概要
- 論文の詳細を見る
我々は,ニホンザルが1本の熊手を使用して遠方の餌を取る課題を約二週間で成功できるようになる一方で,長さの異なる二本の熊手を順次,複合的に用いて餌を取る課題を課題開始時から成功させることを示した.また,素手時には視覚受容野が手の届く範囲にあるが,熊手使用時には熊手の届く範囲にまで拡大するニューロンを頭頂間溝に存在することも示した.本研究は,これらの実験結果を説明する,強化学習理論に基づいたモデルを構築した【モデル】本モデルは,サルは餌と熊手との位置関係から熊手の価値をしている,という仮説を基に構築した.本モデルは,Actor-Criticモデルと,道具の価値を計算する道具評価システムから構成されている.【結果】計算機実験はサルの行動実験結果,及び,電気生理実験結果を再現した.この結果,本研究の仮説の妥当性を示唆した.
- 社団法人電子情報通信学会の論文
- 2002-03-13
著者
-
入來 篤史
独立行政法人理化学研究所
-
入來 篤史
東京医科歯科大学大学院医歯学総合研究科
-
中村 清彦
東京工業大学大学院総合理工学研究科知能システム科学専攻
-
毬山 利貞
東京工業大学 大学院総合理工学研究科 知能システム科学専攻
-
日原 さやか
理化学研究所BSI象徴概念発達研究チーム
-
日原 さやか
東京医科歯科大学認知神経生物学分野
-
石橋 英俊
東京医科歯科大学大学院医歯学総合研究科顎顔面生理学分野
-
入來 篤史
東京医科歯科大学
-
石橋 英俊
生理学研究所・神経化学
-
毬山 利貞
東京工業大学 大学院総合理工学研究科 知能システム科学専攻
-
中村 清彦
東京工業大学 大学院総合理工学研究科 知能システム科学専攻
-
日原 さやか
東京医科歯科大学医学部法医学教室
-
石橋 英俊
国立精神・神経センター・神経研究所モデル動物開発部
-
毬山 利貞
ダイフク
-
中村 清彦
東京工業大学
関連論文
- PCR-SSCP法によるHGHアリル・ヘテロ接合体の検出
- 数理的モデルを用いたタマリンの道具使用行動の解析
- OC-01 ジュウシマツによる3項目系列産出時の反応方略(日本動物心理学会第68回大会発表要旨)
- ヒト顔認知課題における短期記憶の容量限界
- サルの道具使用における頭頂葉の役割 (特集 頭頂葉の新しい機能地図)
- P-25 齧歯目デグーの道具使用 : デグーは道具の機能を理解しているか(日本動物心理学会第67回大会発表要旨)
- OD-08 齧歯目デグーの道具使用 : 熊手操作の獲得(日本動物心理学会第66回大会発表要旨)
- 動物の論理を比較する : 意味の獲得へと導くメカニズム(企画セッション: 進化・発進の現象とモデル, 進化・発進の現象とモデル, 一般)
- サルは『空間』をどう理解しているか(科学は今‥‥)
- 座談会 言語:思考の道具か,コミュニケーションの道具か? (特集=言葉の起源)
- サルの道具使用行動獲得の強化学習モデル
- サルの道具使用と身体像 (特集 手の運動の制御と学習)
- 機能的磁気共鳴画像法(fMRI)を用いた舌運動に伴う脳賦活領域の同定
- 科学通信 科学の動向:ニホンザル,鳴き声の生成--言語起源論への新たな切り口
- 口腔顔面と手指の協調行為に関与するニホンザル大脳皮質神経活動
- ニホンザル道具使用の脳内機構 : シンボル操作の起源に挑む
- ニホンザル道具使用の習熟過程
- 側抑制とシナプス可塑性を用いた多安定両眼視野闘争のモデル(バイオサイバネティックス,ニューロコンピューティング)
- 不確実な報酬の予測に対するドーパミン細胞活動の解析
- 外側膝状体における眼特異層形成過程のモデル解析(バイオサイバネティックス, ニューロコンピューティング)
- プロスペクト理論でのヒトの価値関数の進化による獲得モデル(脳・ヒューマンモデリング2, 脳・ヒューマンモデリング, 一般)
- シナプス可塑性を用いた多安定両眼視野闘争のモデル化
- シナプス可塑性を用いた多安定両眼視野闘争のモデル化
- 情報伝達効率に基づく概念形成機構の解析
- カテゴリ分類戦略による汎化パターンの解析
- 外側膝状体における層構造形成機構のモデル解析
- 両眼視野闘争における知覚振動のメカニズム
- チンパンジーの種割り行動を記述した数理モデル
- メンタルローテーションの脳内機構の運動残効による解析
- 遅延サッカード課題における確率的目標位置手がかり提示による反応時間の変化
- 音刺激とFinger tappingの同期化機構の小脳モデル
- 両眼視野闘争を説明する神経回路モデル
- 発達期の網膜における興奮波による外側膝状体の眼特異層形成モデル
- 短期的シナプス可塑性を組み込んだ神経回路網による時間間隔弁別機構の解析
- 環境の確率的変化に対する予測の神経機構の解明
- 前頭前野錐体細胞におけるシナプス入力位置に依存した長期可塑性へのドーパミン効果
- 雑音中からの連続音知覚における繰り返し学習の効果
- 単一細胞モデルによる発火タイミングの再現性の解析
- スパイク干渉による神経細胞の発火時刻の解析
- 第一次運動野のII/III層の水平結合の可塑性による同期学習モデル
- スパイクタイミングによる脳内情報処理の可能性 : スパイク発生の再現性
- 活性型Fynの脳内発現によるけいれん発作とチロシンリン酸化の亢進
- 数理的モデルを用いたタマリンの道具使用行動の解析
- 道具を使う手と脳の働き
- 共変調マスキング解除の神経回路モデル
- 摂食行動にみられる手と口の協調動作の神経機構
- 色一形状情報統合の神経機構の学習による形成過程のモデル解析
- ヒトの知性のメカニズムに挑む認知神経生物学の研究戦略 : 道具使用行為を通して言語進化のメカニズムを霊長類脳に探る
- 心理実験とモデル解析による確率的予測に基づくサッカードの脳内機構の解明
- 運動の習熟と記憶 (運動コントロ-ルと運動学)
- AFTERNOON TEA
- 発火潜時競争機構のサル側頭葉細胞応答による検証
- 単位立方体により構成される物体における一般的視点の原理の検証
- 人の色 : 単語命名応答における並列神経処理過程
- 物流システムとサービス・イノベーション
- 220 非接触給電システムにおける電源盤最小化アルゴリズムの開発
- Petri Net Decomposition Approach for Bi-Objective Routing for AGV Systems Minimizing Total Traveling Time and Equalizing Delivery Time
- 細胞内Ca^変動を導入した概日リズムの詳細モデリング
- スパースな非対称結合をもつリカレントニューラルネットワークにおける確率的状態遷移の解析
- 4A1 PETRI NET DECOMPOSITION APPROACH FOR AGV SYSTEMS TO MINIMIZE THE DEVIATION OF DELIVERY TIME AND TOTAL TRANSPORTATION TIME(Technical session 4A: Material handling system)
- 内発的動機づけに及ぼす目標設定および言語的フィードバックの影響
- スパースな非対称結合をもつリカレントニューラルネットワークにおける確率的状態遷移の解析