D-8-3 RoboCupサッカーシミュレーションリーグ2Dにおけるリターンパス:chain_action上の状態予測(D-8.人工知能と知識処理)
スポンサーリンク
概要
- 論文の詳細を見る
- 2013-03-05
著者
関連論文
- 非マルコフ決定過程における強化学習 : 特徴的適正度の統計的性質(モデル/理論,ソフトウェアエージェントとその応用論文)
- 非マルコフ決定過程における方策勾配法の一考察 : カーリングの事例
- 1D-6 方策勾配法を用いたサッカーエージェントの学習 : パス・レシーブ(ゲーム・ロボカップ,一般セッション,人工知能と認知科学)
- 方策こう配法を用いた行動学習 : 環境のダイナミクスと行動知識との分離
- F_004 方策こう配法を用いた行動学習 : 方策中での状態遷移確率の表現(F分野:人工知能・ゲーム)
- 入力パターンベクトルの分布に基づくクラス分類問題の分割法
- 状態の複数の抽象化による方策こう配法の高速化 : トンネル状の障害物が存在する追跡問題への適用(情報ネットワーク)
- マルチエージェントシステムにおける行動制御 : PSOにおける重み係数の強化学習(情報ネットワーク)
- 方策勾配法による局面評価関数とシミュレーション方策の学習
- D-8-4 ファジィ制御ルールにより表現された方策を持つ方策勾配法の適用事例:RoboCup小型リーグ(D-8.人工知能と知識処理)
- D-8-3 RoboCupサッカーシミュレーションリーグ2Dにおけるリターンパス:chain_action上の状態予測(D-8.人工知能と知識処理)