Online Learning of Genetic Network Programming and its Application to Prisoner's Dilemma Game
スポンサーリンク
概要
- 論文の詳細を見る
A new evolutionary model with the network structure named Genetic Network Programming (GNP) has been proposed recently. GNP, that is, an expansion of GA and GP, represents solutions as a network structure and evolves it by using “offline learning (selection, mutation, crossover)”. GNP can memorize the past action sequences in the network flow, so it can deal with Partially Observable Markov Decision Process (POMDP) well. In this paper, in order to improve the ability of GNP, Q learning (an off-policy TD control algorithm) that is one of the famous online methods is introduced for online learning of GNP. Q learning is suitable for GNP because (1) in reinforcement learning, the rewards an agent will get in the future can be estimated, (2) TD control doesn’t need much memory and can learn quickly, and (3) off-policy is suitable in order to search for an optimal solution independently of the policy. Finally, in the simulations, online learning of GNP is applied to a player for “Prisoner’s dilemma game” and its ability for online adaptation is confirmed.
- 社団法人 電気学会の論文
- 2003-03-01
著者
-
村田 純一
九州大学大学院 システム情報科学府
-
Murata Junichi
Department Of Electrical And Electronic Systems Engineering Faculty Of Information Science And Elect
-
Murata Junichi
Department Of Electrical Engineering Faculty Of Engineering Kyushu University
-
胡敬 炉
九州大学
-
MABU Shingo
Kyushu University
-
HIRASAWA Kotaro
Waseda University
-
HU Jinglu
Kyushu University
-
MURATA Junichi
Kyushu University
-
Markon Sandor
Graduate School Of Information Production And Systems Waseda University
-
村田 純一[他]
Graduate School of Information Science and Electrical Engineering, Kyushu University
関連論文
- 遺伝的ネットワークプログラミングによる不完全データベースからのクラス相関ルールの抽出
- Elevator Group Supervisory Control System Using Genetic Network Programming with Macro Nodes and Reinforcement Learning
- A Double-Deck Elevator Group Supervisory Control System with Destination Floor Guidance System Using Genetic Network Programming
- 強化学習と重要度指標を用いた遺伝的ネットワークプログラミングによる株式売買モデル
- Genetic Network Programming によるヘテロマルチエージェントシステムの構成
- 蟻の行動進化における Genetic Network Programming と Genetic Programming の性能比較
- ノード数減少型RBFネットワークとその制御器設計問題への応用
- 2A4-5 遺伝的ネットワークプログラミングによる不完全なデータベースからのクラス相関ルールの抽出(2A4 モデリング・識別)
- ブランチ制御型一般化学習ネットワーク
- Canny オペレータとフィードバック戦略に基づく糸球体の抽出
- Application of Likelihood Search Method to Neural Networks Learning
- Chaos Control on Universal Learning Network
- Likelihood Based Search Method(L.S.M.)
- Function Approximation Using LVQ
- 遺伝的ネットワークプログラミングのオンライン学習
- 1C3-4 Benchmark Test of RasID-GA for Inequality/Equality Constrained Optimization
- ゲーム理論のナッシュ均衡解による分散型制御システムの構成
- 遺伝的アルゴリズムによるニューラルネットワークの構造決定
- 遺伝的ネットワークプログラミングによる相関ルールの抽出
- 遺伝的ネットワークプログラミングを用いた医療相関ルールの抽出
- 獲得した情報を用いる遺伝的ネットワークプログラミングによるデータマイニング(知識処理)
- マルチブランチ構造を有するリカレントニューラルネットワーク
- ブランチ制御による機能局在を利用したマルチブランチニューラルネットワーク
- 階層型ニューラルネットワークにおけるマルチブランチ構造とその局所性
- 共生と進化現象を統合する生態系のモデル化の研究
- パラメータ可変一般化学習ネットワークの理論検討 (適応信号処理特集号)
- 確率一般化学習ネットワークとその非線形制御システムへの応用
- Propagation and control of stochastic signals through universal learning networks
- 一般化学習ネットワークの教師付き学習による連想記憶モデルの構築
- A functions localized neural network with branch gates
- Hybrid Universal Learning Networks
- Improvement of generalization ability for identifying dynamical systems by using universal learning network
- A New Minimax Control Method for Nonlinear Systems Using Universal Learning Networks
- Universal learning network and its application to chaos control
- 確率一般化学習ネットワークとその非線形制御システムへの応用
- 1C1-1 Actor-Criticを用いた遺伝的ネットワークプログラミング(1C1 強化学習)
- 教師あり学習・教師なし学習・強化学習を複合した brain-like 学習システム
- 強化学習を用いた遺伝的ネットワークプログラミングとそのエージェントの行動生成における性能評価(知識処理・知識コミュニティ)
- 入力ゲート付きニューラルネットワークとそのエージェントの行動学習への応用
- 2次元大津法とヒストグラム解析に基づく腎組織画像分割
- Genetic Network Programming with Reinforcement Learning and Its Application to Making Mobile Robot Behavior
- 確率分布・可能性分布を考慮したオートマトン学習ネットワーク
- ネットワーク型アセンブリ言語を用いた人工生態系モデルの基礎検討
- 難易度に基づく分割統治機能をもつゲート付きニューラルネットワーク
- Genetic Network Programmingを用いた共生学習進化型マルチエージェントシステム
- ノード数可変型 Genetic Network Programming
- Genetic Network Programming とそのマルチエージェントシステムへの応用
- 1-214 ネットワーク型アセンブリ言語を用いた人工生態系モデルの基礎検討
- 1-101 学習・進化型遺伝的ネットワークプログラミング
- ニューラルネットワークを用いた非線形GPC
- 一般学習ネットワークのインパルス応答に基づく非線形制御方式
- 空間分布一般化学習ネットワークを利用した複雑系の相互作用のモデル
- 確率的ニューラルネットワークにおける自己組織化
- ブランチ制御を考慮したパラメータ可変一般化学習ネットワーク
- 複数の分散探索, 集中探索エージェントを用いた最適化手法
- ファジィとLVQを用いた関数近似
- ニューラルネットワークによる共生進化マルチエージェントシステムの研究
- ニュートラルネットワークを用いた多段予測制御方式
- ファジィ共生と学習を考慮したLotka-Volterra生態系モデル
- 入力ゲート付きニューラルネットワークとそのエージェントの行動学習への応用
- ノードゲート付きニューラルネットワークを用いた非線形システム制御
- LVQを用いた迷路探索
- ファジイ推論相互作用に基づくマルチエージェントシステムの挙動の学習
- 遺伝的共生アルゴリズム
- ファジィ評価と2次微分を考慮した一般化学習ネットワークによるロバスト制御方式
- 階層型ニューラルネットワークへの入力の選定法
- 長・中・短期記憶を用いた発見的最適化法
- ニューラルネットワークの適応的ランダム探索最適化手法 - RasID -
- インパルス応答を考慮した一般化学習ネットワークによる非線形制御方式
- 確率一般化学習ネットワーク理論
- 一般化学習ネットワークの安定性・速応性を考慮した非線形制御方式
- 入力ゲート付きニューラルネットワーク
- 微分情報を用いたランダム探索最適化手法-Likelihood Search Method (L. S. M.)-
- 一般化学習ネットワークにおけるカオス制御方式
- ニューラルネットワーク学習におけるB. P. とL. S. M. の比較評価
- 機能局在型学習ネットワークによる非線形クレーンシステムの制御
- 一般化学習ネットワークの高次微分の計算理論
- パラメータ変動を伴うシステムのロバスト極配置制御とその非線形システムへの応用
- 脳の機能局在をペトリネットでモデル化する方式の提案
- Online Learning of Genetic Network Programming and its Application to Prisoner's Dilemma Game
- Elevator Group Control Using Multiagent Task-Oriented Reinforcement Learning
- A New Learning Method Using Local and Global Information for Neural Networks
- Increasing Robustness of Binary-coded Genetic Algorithm
- Universal Learning Networks with Branch Control
- Enhancing the Generalization Ability of Backpropagation Algorithm through Controlling the Outputs of the Hidden Layers
- ノードゲート付きニューラルネットワークとその非線形システム制御への応用
- Generalization Ability of Dynamic Systems by Using Second Order Derivatives of Universal Learning Network
- Behavior Learning of Autonomous Robots by Modified Learning Vector Quantization
- Genetic Symbiosis Algoritm for Multiobjective Optimization Problems
- システム/情報 A New Method Based on Determining Error Surface for Designing Three Layer Neural Networks
- A New Learning Method Using Prior Information of Neural Networks
- Chaos Control of Universal Learning Network
- A new learning method using local and global information for neural networks
- A New Learning Method Using Prior Information of Neural Networks
- Giant Skull Base Atypical Meningioma Presenting With Rapidly Progressive Impaired Consciousness Caused by Severe Venous Congestion : Case Report
- A New Control Method of Nonlinear Systems Based on Impulse Responses of Universal Learning Networks
- Probabilistic Universal Learning Networks and their Applications to Nonlinear Control Systems
- Robust Control using Second Order Derivatives of Universal Learning Network
- Universal Learning Network and Computation of its Higher Order Derivatives
- 再生可能エネルギーの不確実性に対応した小規模グリッドの最適電源運用計画手法