強化学習を用いた球技動作の予測と制御

スポンサーリンク

概要

論文の詳細を見る
神経回路モデルにより、動的な予測・学習・制御を行わせる。簡単な例として、ボールのシユート、壁打ちという球技動作を取り上げる。これらの問題においては一般に正確な教師信号は与えられない。ボールのシュートの場合には、入った場合にのみ「入った」という情報が与えられ、どのくらいゴールに近いかというような情報は与えられない。また、運動の制御はリアルタイムに行われるため、高速な学習アルゴリズムが要求される。本報告では、RBFを用いた予測と強化学習(TD学習)を組み合わせてモデルを構成し、計算機シミュレーシヨンを行った。
社団法人電子情報通信学会の論文
1997-05-23

著者

関連論文

もっと見る

スポンサーリンク