時変パラメータを持つ進化的強化学習システム

概要

論文の詳細を見る
In this paper, an evolutionary reinforcement learning system with time-varying parameters that can learn appropriate policy in dynamical POMDPs is proposed. The proposed system has time-varying parameters that can be adjusted by using reinforcement learning. Hence, the system can adapt to the time variation of the dynamical environment even if its variation cannot be observed. In addition, the state space of the environment is divided evolutionarily. So, one need not to divide the state space in advance. The efficacy of the proposed system is shown by mobile robot control simulation under the environment belongs to dynamical POMDPs. The environment is the passage that has gates iterate opening and closing.
社団法人電気学会の論文
2004-07-01

著者

小林邦和
山口大学大学院理工学研究科
大林正直
山口大学大学院理工学研究科
小林邦和
山口大学工学部
梅迫公輔
山口大学大学院理工学研究科
大林正直
山口大学工学部

関連論文

TD誤差に基づく強化学習のメタパラメータ学習法
認識細胞を用いた位置ずれ、大きさ、回転に不変なパターン認識
関数型結合重みを持つニューラルネットワークを用いた学習の高速化とその非線形制御への応用
階層モジュール型一般化学習ネットワークシステム
Stability Theory of Universal Learning Network
Forward Propagation Universal Learning Network
Universal Learning Network-Based Fuzzy System and Its Application to Non-Linear Control System
Nonlinear Control System Using Universal Learning Network with RBF and RasVal
Generalization Capability of Radial Basis Function Controller Using Randam Search Method with Variable Search Length in Universal Learning Network
Universal Learning Network-based Fuzzy System and its Application to Non-linear Control System
間接型適応的自己構造ファジィニューラルネットワーク制御システム
間接型適応的自己構造ファジィニューラルネットワーク制御システム
分散型制御システムのナッシュ均衡解による構成
ファジィ重み係数多目的非線形制御システムの一般化学習ネットワークによる構成
多目的ファジィ評価による一般化学習ネットワーク非線形制御方式
局所線形モデルを導入したウェーブレットニューラルネットワークのベイズ的設計法
一時的滞留機能を持つ過渡的カオス連想記憶モデル
状態予測型強化学習システム
DS-2-6 感情誘起型複数ロボットの適応行動の改善(DS-2. 共生コンピューティング,シンポジウムセッション)
Transient-SOM を用いた手画像命令学習システム
免疫回路網式強化学習法
カオスニューラルネットワーク連想記憶モデルにおける活性化関数の形状とその評価
時変パラメータを持つ進化的強化学習システム
関数型記憶行列を持つカオスニューラルネット連想記憶システムと相互情報量
自己組織化型ファジィ強化学習システム
適応的探索法を用いた強化学習
Radial Basis Function を用いたカオスニューラルネットワークとそのメモリサーチへの応用
関数型シナプス重みを持つニューラルネットワーク
D-2-21 ニューラルネットワーク構造最適化における可変長遺伝子コードをもつ間接符号化法
ウェーブレットネットワークを用いた多次元関数の近似
ネットワーク最適化機能をもつウェーブレットニューラルネットワーク
自己増殖機能を持つウェーブレットニューラルネットワーク
確率分布・可能性分布を考慮したオートマトン学習ネットワーク
分布を考慮したオートマトン学習ネットワーク : 確率分布・可能性分布
ファジィ評価と2次微分を考慮した一般化学習ネットワークによるロバスト制御方式
一般化学習ネットワークにおけるファジィルールを用いたパラメータの学習方式
ニューラルネットワークの適応的ランダム探索最適化手法 - RasID -
一般化学習ネットワークの2次微分を用いた非線形ダイナミカルシステムの抑制/活性化制御
機能局在型学習ネットワーク(Learning Petri Network)の非線形制御への応用
空間分布一般化学習ネットワークとその応用 : Lotka-Volterra 生態系への適用
インパルス応答を考慮した一般化学習ネットワークによる非線形制御方式
部分と全体を考慮したホロニック分散制御による大規模複雑システムの制御
一般化学習ネットサークの2次微分を用いた非線形ダイナミカルシステムの外部入力変動に対するロバスト制御方式
確率一般化学習ネットワーク理論
ニューラルネットワークの学習におけるB. P. M. とL. S. M. の最適評価指標探索能力の比較評価
カオス一般化学習ネットワークによるクラスター化制御
可能性一般化学習ネットワーク理論を用いた非線形関数の実現
一般化学習ネットワークの安定性・速応性を考慮した非線形制御方式
一般化学習ネットワークを用いた非線形ロバストオブザーバの構成
スイッチング機構を持つ一般化学習ネットワークの汎化能力
オートマン学習ネットワーク理論
一般化学習ネットワークの2次微分を利用した外乱抑制ロバスト制御方式
ホロニック制御による大規模複雑システムの制御
動的システムの同定問題におけるノード間時間遅れの最適化
ファジィ評価と2次微分を考慮した一般化学習ネットワークによるロバスト制御方式
一般化学習ネットワークの2次微分を利用した外乱抑制ロバスト制御方式
多重ブランチをもつ一般化学習ネットワークにおけるカオス制御
一般化学習ネットワークの2次微分を用いた非線形ダイナミカルシステムの初期値変動に対するロバスト制御方式
一般化学習ネットワークによるホロニック制御方式
集中化・多様化によるランダム探索法の評価
ファジィ評価を考慮した一般化学習ネットワークの2次微分ロバスト制御方式
RBF型一般化学習ネットワークの多層構造の評価
オートマトン学習ネットワーク
オートマトン学習ネットワーク
微分情報を用いたランダム探索最適化手法-Likelihood Search Method (L. S. M.)-
一般化学習ネットワークの安定性理論
一般化学習ネットワークにおけるカオス制御方式
一般化学習ネットワーク理論
フォワードプロパゲーション一般化学習ネットワーク理論
一般化学習ネットワークにおける遅れ時間の考察
一般化学習ネットワークの高次微分応用システム
ニューラルネットワーク学習におけるB. P. とL. S. M. の比較評価
機能局在型学習ネットワークによる非線形クレーンシステムの制御
大規模システムのホロニック制御 : タンクネットワーク群への適用
ペトリネットに準拠した機能局在型学習ネットワーク-Learning Petri Network-
一般化学習ネットワークの高次微分の計算理論
パラメータ変動を伴うシステムのロバスト極配置制御とその非線形システムへの応用
LTRを考慮したクレーンの極配置制御
脳の機能局在をペトリネットでモデル化する方式の提案
一般化学習ネットワークの高次微分の計算と応用
一般化学習ネットワークの2次微分の計算理論
一般化学習ネットワークを用いた非線形制御方式の提案
脳をペトリネットワークでモデル化した基本制御技術の開発
相互結合型ニューラルネットワークを用いた大規模巡回セールスマン問題の解法
層状神経回路網のパターン分離条件 : 層間の結合本数R=4の場合
カオスの縁を考慮したカオスシステムのニューラルネットワーク制御
ウェーブレットネットワークを用いた多次元関数の近似
遺伝的自己生成機能をもつウェーブレットニューラルネットワーク
遺伝的自己生成機能を持つウェーブレットニューラルネットワーク
層状神経回路網のパターン分離機能 : 層間の結合本数R=4の場合
2層ランダム神経回路網のパターン分離機能に関する考察
Modeling Nonlinear Dynamic Systems Using Universal Learning Network with Filtering Mechanism
部分的未知構造を持つ非線形システムのためのロバスト強化学習制御系設計法
強化学習制御と適応H∞制御の協働型制御方式
相互結合型ネットワークにおけるメタヒューリスティクスを用いた動的想起
マルチエージェントシステムにおける行動予測と意図推定に関する研究動向 (システム研究会機械学習・知能システム一般)
進化的計算手法を用いた多層カオスニューラルネットワークの動的想起 (システム研究会確率的最適化技術と機械学習技術の共進化)
H_∞追従性能補償器を備えたりアルタイム強化学習制御システム
相互結合型ネットワークにおけるメタヒューリスティクスを用いた動的想起
強化学習制御と適応H_∞制御の協働型制御方式

時変パラメータを持つ進化的強化学習システム

スポンサーリンク

概要

著者

関連論文

スポンサーリンク