強化学習を用いた球技動作の予測と制御
スポンサーリンク
概要
- 論文の詳細を見る
神経回路モデルにより、動的な予測・学習・制御を行わせる。簡単な例として、ボールのシユート、壁打ちという球技動作を取り上げる。これらの問題においては一般に正確な教師信号は与えられない。ボールのシュートの場合には、入った場合にのみ「入った」という情報が与えられ、どのくらいゴールに近いかというような情報は与えられない。また、運動の制御はリアルタイムに行われるため、高速な学習アルゴリズムが要求される。本報告では、RBFを用いた予測と強化学習(TD学習)を組み合わせてモデルを構成し、計算機シミュレーシヨンを行った。
- 社団法人電子情報通信学会の論文
- 1997-05-23
著者
関連論文
- 21aWE-1 「先行制御」とリズムの自己生成の必要性(21aWE 生物物理,領域12(ソフトマター物理,化学物理,生物物理))
- A-15-25 ヒトの視覚-運動制御系におけるフィードバック強度とフィードフォワード強度のトレードオフ(A-15.ヒューマン情報処理,一般講演)
- A-15-18 リズミックな音刺激を与えたときの追従運動特性(A-15.ヒューマン情報処理,一般講演)
- こころの線形現象論 (特集 脳と心)
- 相互追従実験におけるヒトと機械の協調運動パターン(コミュニケーションデザイン及び一般)
- A-15-25 手動追従運動に対するターゲット弁別容易度の影響(A-15. ヒューマン情報処理)
- 人の感覚運動システムにおける先行位相の定量的研究
- ラットの空間探索課題における海馬-大脳基底核モデル
- 環状結合ニューラルネットワークのアトラクタとその流域構造
- ラットナビゲーションモデルによる水迷路課題
- 複素対数変換と応答ベクトルを用いた情報圧縮によるパターン探索の効率化
- 視覚情報による場所認知システムに関する研究
- NLP2000-18 / NC2000-12 海馬-連合野モデルによる時系列パターンの長期記憶形成
- ニューラルネットワークにおけるアトラクティブフィールドの学習に関する研究
- 循環結合型ニューラルネットワークのアトラクターの分類に関する研究
- 海馬-大脳基底核モデルによるラットナビゲーションタスク
- 結合写像による神経場のモデルと時間・空間情報のコーディング
- 行動分割型マルチエージェントによる強化学習の高速化
- 注意と予測を取り入れた物体追従システム
- 時間遅れを取り入れた海馬CA3モデル
- 25aZA-10 ランダムに正負の散逸を取るLangevin系 : 2階確率微分方程式への拡張
- 25pU-13 ランダムに正負の散逸を取るLangevin系の電気回路シミュレーション
- 28p-XF-14 ランダムに正負の散逸をとるLangevin系の統計性
- NH_4Cl多結晶薄膜の自己アフィンフラクタル界面の成長条件と粗さ指数
- NLP2000-18 / NC2000-12 海馬-連合野モデルによる時系列パターンの長期記憶形成
- 24. 非線形と自己組織 (非線形現象の不思議)
- コミュニケーションダイナミックス : 先行制御機構をもつ複数エージェントの相互作用の研究(テーマセッション「ランダムネスと予測〜その基礎と応用」及び一般, ランダムネスと予測-その基礎と応用1)
- コミュニケーションダイナミックス : 先行制御機構をもつ複数エージェントの相互作用の研究(テーマセッション「ランダムネスと予測〜その基礎と応用」及び一般, ランダムネスと予測-その基礎と応用1)
- 5p-R-10 二成分混合系における局在対流の安定性
- 6a-C5-4 二成分混合熱体流系での対流ロールの局在
- 5p-L-10 Benard Instabilityによる超音波減衰
- 3つの散乱機構がある場合のmobility : 光物性
- 23pZB-5 細胞性粘菌ミニ移動体の運動解析
- 細胞性粘菌高速パターン系 : 細胞分化の位置情報
- アナログ連想メモリの集積化
- ヒトの視覚運動系における位置誤差補正運動と予測運動の混在と分離
- 高齢運転者のカーブ走行時運転挙動特性について : ドライビングシミュレータによる走行実験分析
- 時系列学習で作られる内部表現と出力素子数の関係
- ニューラルネットワークによる動的メモリの構成
- 自己相関連想記憶の記憶容量増加に関する研究
- 2p-P-6 第2音波を用いた超流動ヘリウムの研究
- 2p-P-6 第2音波を用いた超流動ヘリウムの研究
- A-13-6 相互追従実験におけるヒトと機械の協調(A-13.思考と言語,一般講演)
- A-15-2 視標運動予測時における手の追従運動周波数変化(A-15. ヒューマン情報処理, 基礎・境界)
- ホップフィールドモデルのノイズ安定性
- 機能分離型ニューラルネットワークの情報処理能力
- ゲームにおけるローカルミニマム回避のアルゴリズム
- 脳の現象論と物理学
- 予測と行為 : 主体的行為はいかにして可能か
- 人の感覚運動系における先行制御
- 視覚目標追従時の手の先行運動
- 生物と脳の数理科学について--自然科学言語と人文科学言語の融合の場 (20世紀科学革命の基礎--相対論,量子論から脳科学まで)
- 興奮性を持つ写像によるニューラルネットワーク・モデルとその時系列学習への応用
- リミットサイクルを生成する集積化人工神経回路網の設計
- シンポルダイナミクスの学習によるパターンダイナミクスの記憶
- ワークショップ「脳型コンピュータとは何か」から : 脳型コンピュータとは何か?
- 脳型コンピュータとは何か?
- 神経場を用いた画像制御
- 3D04 ヒドラの再生における細胞間相互作用
- 強化学習を用いた球技動作の予測と制御
- 未知情報を選別・記憶する連想記憶システムの集積化
- 局所特徴導入による高速学習に関する研究
- しきい値制御荷重値更新による学習性能に関する研究
- 局所特徴導入による高速学習に関する研究
- しきい値制御荷重値更新による学習性能に関する研究
- 脳の理工学的研究 (特集 脳研究)
- 脳の理工学的研究の方法論について
- 荷重値の更新に閾値を設けたニューラルネットワークの学習性能とその集積化
- アナログ連想メモリの高機能化とその集積化
- 相互追従実験と組互タッピング実験における二者間の同期現象とモデル化 (ニューロコンピューティング)
- 相互追従実験と相互タッピング実験における二者間の同期現象とモデル化