確率的傾斜法とメモリベース的な手法を組み合わせた強化学習法
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, for agents working on POMDP, a learning algorithm combining the memory-less learning and the memory-based learning is proposed. At first stage of the propposed algorithm, memory-less learning is applied. As a memory-less learning algorithm, the stochastic gradient method is employed. While the first stage, a state-action set series that accmplish the task is stored in memory. In the second stage, the memory-based learning is applied. In this process, only the series that obtained the first stage is used, so that this method is able to reduce the number of required memory effectively.The proposed algorithm are applied three kinds of simulation to be compared with memory-less learning algorithm. Through the computer simulations, it shown that the proposed algorithms works effectively in POMDP than ordinary memory-less learnings.
- 2008-07-01
著者
関連論文
- 確率的傾斜法とメモリベース的な手法を組み合わせた強化学習法
- D-15-38 寮生による全学情報教育の活性化の運用(D-15. 教育工学,一般セッション)
- 寮生による全学情報教育の活性化
- Differential Evolution における制御変数の自動調節
- D-15-28 寮生による全学情報教育の活性化の試み(D-15.教育工学,一般講演)
- 適応度の計算回数を削減するための遺伝子選択法
- 尤度最大化を目的としたエージェントの学習アルゴリズム
- Hierarchical Mixtures of Experts を用いた自律移動ロボットのための環境認識
- ニューラルネットワークによる行動作成に基づいた進化ロボット
- 順モデルによる自律移動ロボットの制御
- 柔らかい検索システム
- フィードバック誤差学習を利用した自律移動ロボットの逆モデリング
- ウィルス進化論を模した遺伝的アルゴリズム
- DNAのコード領域予測による遺伝情報解析
- A Nonlinear Integrator with Positive Phase Shifts for the Control System
- 評価値が単調に増加する遺伝的アルゴリズム
- Hierarchical Mixtures of Expertsを順モデルとして利用した逆問題のための学習アルゴリズム
- ニューラルネットワークによる順モデルを用いた冗長マニピュレータの逆キネマティクス問題の解法
- HMEを用いた順逆モデリング
- 新しい動的情報処理モデルの提案とその有用性
- 解像度変換符号化方式の検討
- カオス同期を用いた2信号遅延秘匿通信システムのシミュレーション
- ニューラルネットワークを用いた積分方程式の解法
- 順逆モデリングにおける順モデルに関する考察
- A-49 カオス同期を用いた2信号遅延秘匿通信システムのシミュレーション(A-2. 非線形問題,一般講演)
- 学習の初期にフィードバック誤差学習を利用する順逆モデルの同時学習アルゴリズム
- ニュ-ラルネットワ-クによる順逆モデルの同時学習
- 学習曲面におけるローカルミニマムの十分条件
- Smalltalk-80を用いた新入生導入教育
- Smalltalk-80を用いたソフトウェア教育支援システム : 概要および導入教育について
- EICを用いたニュ-ラルネットワ-クモデルの選択法