時変パラメータを持つ進化的強化学習システム
スポンサーリンク
概要
- 論文の詳細を見る
In this paper, an evolutionary reinforcement learning system with time-varying parameters that can learn appropriate policy in dynamical POMDPs is proposed. The proposed system has time-varying parameters that can be adjusted by using reinforcement learning. Hence, the system can adapt to the time variation of the dynamical environment even if its variation cannot be observed. In addition, the state space of the environment is divided evolutionarily. So, one need not to divide the state space in advance. The efficacy of the proposed system is shown by mobile robot control simulation under the environment belongs to dynamical POMDPs. The environment is the passage that has gates iterate opening and closing.
- 社団法人 電気学会の論文
- 2004-07-01
著者
関連論文
- TD誤差に基づく強化学習のメタパラメータ学習法
- 認識細胞を用いた位置ずれ、大きさ、回転に不変なパターン認識
- 関数型結合重みを持つニューラルネットワークを用いた学習の高速化とその非線形制御への応用
- 階層モジュール型一般化学習ネットワークシステム
- Stability Theory of Universal Learning Network
- Forward Propagation Universal Learning Network
- Universal Learning Network-Based Fuzzy System and Its Application to Non-Linear Control System
- Nonlinear Control System Using Universal Learning Network with RBF and RasVal
- Generalization Capability of Radial Basis Function Controller Using Randam Search Method with Variable Search Length in Universal Learning Network
- Universal Learning Network-based Fuzzy System and its Application to Non-linear Control System
- 間接型適応的自己構造ファジィニューラルネットワーク制御システム
- 間接型適応的自己構造ファジィニューラルネットワーク制御システム
- 分散型制御システムのナッシュ均衡解による構成
- ファジィ重み係数多目的非線形制御システムの一般化学習ネットワークによる構成
- 多目的ファジィ評価による一般化学習ネットワーク非線形制御方式
- 局所線形モデルを導入したウェーブレットニューラルネットワークのベイズ的設計法
- 一時的滞留機能を持つ過渡的カオス連想記憶モデル
- 状態予測型強化学習システム
- DS-2-6 感情誘起型複数ロボットの適応行動の改善(DS-2. 共生コンピューティング,シンポジウムセッション)
- Transient-SOM を用いた手画像命令学習システム
- 免疫回路網式強化学習法
- カオスニューラルネットワーク連想記憶モデルにおける活性化関数の形状とその評価
- 時変パラメータを持つ進化的強化学習システム
- 関数型記憶行列を持つカオスニューラルネット連想記憶システムと相互情報量
- 自己組織化型ファジィ強化学習システム
- 適応的探索法を用いた強化学習
- Radial Basis Function を用いたカオスニューラルネットワークと そのメモリサーチへの応用
- 関数型シナプス重みを持つニューラルネットワーク
- D-2-21 ニューラルネットワーク構造最適化における可変長遺伝子コードをもつ間接符号化法
- ウェーブレットネットワークを用いた多次元関数の近似
- ネットワーク最適化機能をもつウェーブレットニューラルネットワーク
- 自己増殖機能を持つウェーブレットニューラルネットワーク
- 確率分布・可能性分布を考慮したオートマトン学習ネットワーク
- 分布を考慮したオートマトン学習ネットワーク : 確率分布・可能性分布
- ファジィ評価と2次微分を考慮した一般化学習ネットワークによるロバスト制御方式
- 一般化学習ネットワークにおけるファジィルールを用いたパラメータの学習方式
- ニューラルネットワークの適応的ランダム探索最適化手法 - RasID -
- 一般化学習ネットワークの2次微分を用いた非線形ダイナミカルシステムの抑制/活性化制御
- 機能局在型学習ネットワーク(Learning Petri Network)の非線形制御への応用
- 空間分布一般化学習ネットワークとその応用 : Lotka-Volterra 生態系への適用
- インパルス応答を考慮した一般化学習ネットワークによる非線形制御方式
- 部分と全体を考慮したホロニック分散制御による大規模複雑システムの制御
- 一般化学習ネットサークの2次微分を用いた非線形ダイナミカルシステムの外部入力変動に対するロバスト制御方式
- 確率一般化学習ネットワーク理論
- ニューラルネットワークの学習におけるB. P. M. とL. S. M. の最適評価指標探索能力の比較評価
- カオス一般化学習ネットワークによるクラスター化制御
- 可能性一般化学習ネットワーク理論を用いた非線形関数の実現
- 一般化学習ネットワークの安定性・速応性を考慮した非線形制御方式
- 一般化学習ネットワークを用いた非線形ロバストオブザーバの構成
- スイッチング機構を持つ一般化学習ネットワークの汎化能力
- オートマン学習ネットワーク理論
- 一般化学習ネットワークの2次微分を利用した外乱抑制ロバスト制御方式
- ホロニック制御による大規模複雑システムの制御
- 動的システムの同定問題におけるノード間時間遅れの最適化
- ファジィ評価と2次微分を考慮した一般化学習ネットワークによるロバスト制御方式
- 一般化学習ネットワークの2次微分を利用した外乱抑制ロバスト制御方式
- 多重ブランチをもつ一般化学習ネットワークにおけるカオス制御
- 一般化学習ネットワークの2次微分を用いた 非線形ダイナミカルシステムの初期値変動に対するロバスト制御方式
- 一般化学習ネットワークによるホロニック制御方式
- 集中化・多様化によるランダム探索法の評価
- ファジィ評価を考慮した一般化学習ネットワークの2次微分ロバスト制御方式
- RBF型一般化学習ネットワークの多層構造の評価
- オートマトン学習ネットワーク
- オートマトン学習ネットワーク
- 微分情報を用いたランダム探索最適化手法-Likelihood Search Method (L. S. M.)-
- 一般化学習ネットワークの安定性理論
- 一般化学習ネットワークにおけるカオス制御方式
- 一般化学習ネットワーク理論
- フォワードプロパゲーション一般化学習ネットワーク理論
- 一般化学習ネットワークにおける遅れ時間の考察
- 一般化学習ネットワークの高次微分応用システム
- ニューラルネットワーク学習におけるB. P. とL. S. M. の比較評価
- 機能局在型学習ネットワークによる非線形クレーンシステムの制御
- 大規模システムのホロニック制御 : タンクネットワーク群への適用
- ペトリネットに準拠した機能局在型学習ネットワーク-Learning Petri Network-
- 一般化学習ネットワークの高次微分の計算理論
- パラメータ変動を伴うシステムのロバスト極配置制御とその非線形システムへの応用
- LTRを考慮したクレーンの極配置制御
- 脳の機能局在をペトリネットでモデル化する方式の提案
- 一般化学習ネットワークの高次微分の計算と応用
- 一般化学習ネットワークの2次微分の計算理論
- 一般化学習ネットワークを用いた非線形制御方式の提案
- 脳をペトリネットワークでモデル化した基本制御技術の開発
- 相互結合型ニューラルネットワークを用いた大規模巡回セールスマン問題の解法
- 層状神経回路網のパターン分離条件 : 層間の結合本数R=4の場合
- カオスの縁を考慮したカオスシステムのニューラルネットワーク制御
- ウェーブレットネットワークを用いた多次元関数の近似
- 遺伝的自己生成機能をもつウェーブレットニューラルネットワーク
- 遺伝的自己生成機能を持つウェーブレットニューラルネットワーク
- 層状神経回路網のパターン分離機能 : 層間の結合本数R=4の場合
- 2層ランダム神経回路網のパターン分離機能に関する考察
- Modeling Nonlinear Dynamic Systems Using Universal Learning Network with Filtering Mechanism
- 部分的未知構造を持つ非線形システムのためのロバスト強化学習制御系設計法
- 強化学習制御と適応H∞制御の協働型制御方式
- 相互結合型ネットワークにおけるメタヒューリスティクスを用いた動的想起
- マルチエージェントシステムにおける行動予測と意図推定に関する研究動向 (システム研究会 機械学習・知能システム一般)
- 進化的計算手法を用いた多層カオスニューラルネットワークの動的想起 (システム研究会 確率的最適化技術と機械学習技術の共進化)
- H_∞追従性能補償器を備えたりアルタイム強化学習制御システム
- 相互結合型ネットワークにおけるメタヒューリスティクスを用いた動的想起
- 強化学習制御と適応H_∞制御の協働型制御方式