Actorに適正度の履歴を用いたActor-Criticアルゴリズム : 不完全なValue-Functionのもとでの強化学習

スポンサーリンク

概要

著者

関連論文

もっと見る

スポンサーリンク