実環境内におけるロボットの Q-learning とその行動政策の逐一修正の検討
スポンサーリンク
概要
- 論文の詳細を見る
本論文では, 実環境内においてのQ-learningで得た行動政策を, 同じく実環境内に加えて, 異なる環境においての学習に使用し, それを逐一修正していくことによって環境の変化に適応する手法を検討する.これにより, 実時間上・多環境においてロボットが学習を行う際の多大な学習・試行回数と記憶容量と時間の削減につながる.
- 2005-03-22
著者
関連論文
- 3P7a-10 肝エコー画像におけるスペックルリダクションへの独立成分解析の適用(ポスターセッション)
- 量子力学的チャネルを用いたJaynes-Cummingsモデルの記述と情報量による解析(量子情報理論とその応用)
- 量子相互エントロピーによる量子増幅過程の解析(量子確率論とエントロピー解析)
- スクイズド真空状態による誤り確率の改善
- スクイズド真空状態の量子通信過程への応用
- 量子テレポーテーション過程の量子情報論的アプローチ(量子確率論とエントロピー解析)
- 実環境内におけるロボットの Q-learning とその行動政策の逐一修正の検討
- 肝エコー信号における独立成分の抽出
- 独立成分分析による肝エコー信号からの病変情報分離(医用超音波・アコースティックイメージング)
- A-2-4 GAによるCPGパラメータの最適化と足踏みシミュレーション(A-2.非線形問題,一般講演)