ニューラルネットワークを用いた強化学習のためのネットワークパラメータ設定法
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement learning approaches attract attention as the technique to construct the mapping function between sensors-motors of an autonomous robot through trial-and-error. Traditional reinforcement learning approaches make use of look-up table to express the mapping function between the grid state space and the grid action space. However the grid size of the state space affects the learning performances significantly. To overcome this problem, many researchers have proposed algorithms using neural networks to express the mapping function between the continuous state space and actions. However, in this case, a designer needs to appropriately set the number of middle neurons and the initial value of weight parameters of neural networks to improve the approximate accuracy of neural networks. This paper proposes a new method to automatically set the number of middle neurons and the initial value of the weight parameters of neural networks, on the basis of the dimensional-number of the sensor space, in Q-learning using neural networks. The proposed method is demonstrated through a navigation problem of an autonomous mobile robot, and is evaluated by comparing Q-learning using RBF networks and Q-learning using neural networks whose parameters are set by a designer.
著者
関連論文
- 中立性と凸凹を含む適応度景観の中立ネットワークに基づく構造解析
- インフォーマル・リーダーによる情報共有に基づく作業改善が集団業績向上に及ぼす影響
- R3Qによる進化型計算の中粒度Gridスケジューリング(グリッド)
- 進化型計算向け Grid Computing 環境へのマルチロボットシステムの実装
- 進化戦略における(μ, λ)-linkear Ranking Selectionに関する実験的考察
- 進化ロボティクスにおける steady-state GA の進化挙動解析
- 実例に基づく強化学習法BRLにおける行動空間の分割法の改良 : 第1報,移動ロボットのナビゲーション問題による検証(機械力学,計測,自動制御)
- 進化計算のためのグリッドコンピューティング
- ニユートラルネットワークを含む適応度景観における遺伝的アルゴリズムの進化ダイナミクス : 進化ロボティクスでの検証
- 確率ネットワークを用いた強化学習ロボットの獲得戦略の保存と利用(機械力学,計測,自動制御)
- 生態学的手法を用いたマルチエージェントシステムの解析に関する研究
- マルチロボットシステムのための強化学習の行動空間探索に関する一考察
- 実例に基づく強化学習法の頑健性向上に関する一考察 : マルチロボットシステムによる検証
- 1C1-4 進化型人工神経回路網を用いたマルチロボットシステムの協調行動獲得に関する一考察(1C1 強化学習)
- 4206 生態学的手法を用いたMASの進化過程の振る舞いの解析に関する研究(OS4 環境適応型知的人工システム)
- 進化型人工神経回路網の構造進化のための一手法 : 二重倒立振子問題への適用
- 根井の標準遺伝距離を用いた neutrality を含む問題でのGAの進化ダイナミクス解析
- 3930 適応的な行動空間の分割を行う強化学習を用いた実ロボットの行動獲得(J18-1 自律型グラウンドビークル,エアビークルの新展開(1),J18 自律型グラウンドビークル,エアビークルの新展開,2005年度年次大会)
- 根井の標準遺伝距離を用いた適応度景観に含まれる neutrality の推定 : 進化ロボティクスへの適用
- 4102 進化型人工神経回路網のパラメータチューニングによる一考察(OS4 環境適応型知的人工システム)
- 2P1-S-071 オンラインモデル更新を用いた進化型自律移動ロボットの移動物体認識(進化・学習とロボティクス5,生活を支援するロボメカ技術のメガインテグレーション)
- 2P1-S-069 生態学的手法を用いたマルチエージェントシステムの特徴の解析に関する研究(進化・学習とロボティクス5,生活を支援するロボメカ技術のメガインテグレーション)
- Robust-ESによるContinuous-Time Recurrent Neural Networksの進化的設計
- マルチエージェントシステムにおける学習エージェントの数理モデル
- 共生・共進化型マルチロボットシステム : 構造進化人工神経回路網の適用(G15-2 ロボットシステム,G15 ロボティクス・メカトロニクス部門)
- 2P2-3F-A5 自律移動ロボット用人工神経回路網の構造進化に関する研究
- 4106 身体性認知に基づくマルチロボットシステムの設計
- 2P1-3F-A7 連続空間における強化学習を用いたマルチロボットシステムの協調行動獲得
- 1P1-S-066 適応的な行動空間の分割を行う強化学習を用いたマルチロボットシステムの行動獲得(進化・学習とロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- 強化学習を用いた自律マルチロボットシステムの協調行動獲得 : ロボット台数の増減に関する一考察(進化・学習とロボティクス3)
- オンラインモデル更新を用いた自律移動ロボットの進化に関する基礎研究(進化・学習とロボティクス3)
- 強化学習を用いた飛行船ロボットの自律行動獲得(進化・学習とロボティクス1)
- 確率ネットワークによる学習エージェントの獲得戦略保存と適用に関する一考察(環境適応型知的人工システム)
- 社会性エージェント群の進化的生成シミュレーション(環境適応型知的人工システム)
- 321 協調荷押し問題における構造進化型人工神経回路網の汎化能力に関する一考察
- 強化学習による自律型アームロボットの協調行動獲得
- マルチエージェント環境における強化学習の一適用法
- マルチエージェント環境における強化学習の一適用法(機械力学,計測,自動制御)
- 2A1-3F-B8 情報量基準による強化学習エージェントの入出力モデルの評価
- 2-406 マルチエージェント環境における強化学習の構成法に関する一考察 : 実例に基づくアプローチと個体識別能力の効用
- 強化学習によるアーム型ロボット群の協調動作獲得 : 挙動の解析
- Neutral Networks を含む適応度景観における遺伝的アルゴリズムの進化ダイナミクス
- 『生命複雑系からの計算パラダイム』, 大内東,山本雅人,川村秀憲,柴肇一,高柳俊明,當間愛晃,遠藤聡志共著, 出版社 森北出版, 発行 2003年8月, 全ページ 201頁, 価格 3,570円, ISBN 4-627-85021-2
- マルチエージェントシミュレーションのためのユーザ情報に基づく意思決定モデル(進化・学習とロボティクス3)
- 授賞論文「均質な自律ロボット群による協調行動獲得問題 : 機能分化に基づくアプローチ」(学会賞の贈呈 : 2003年度学会賞論文賞)
- 4105 生物指向型生産システムとその実現への課題
- Multi-parent Recombination を用いる進化戦略
- 進化エージェント群による機能的役割分担生成に関する一考察
- CUDA環境におけるデータ並列化を用いた遺伝的アルゴリズムの実装手法
- 第19回中国支部学術講演会
- 2P2-G07 強化学習法BRLによる自律移動ロボットの狭路通行行動の獲得(進化・学習とロボティクス)
- 構造進化型人工神経回路網によるSwarm Roboticsのための適応的協調行動の生成
- 2A1-3F-D2 共創システムにおける共進化の役割 : 均質なマルチロボットシステムを例として
- 2-408 協調搬送問題における共進化型ニューラルコントローラの適応度景観の推定に関する一考察
- 「マルチエージェントシミュレーションの社会システムへの応用特集号」を企画して
- 2A2-D16 ヒトとアーム型ロボットの協調行動獲得実験 : 強化学習によるアプローチ
- 2A2-D14 強化学習法BRLによる自律移動ロボット群の集合行動の獲得
- 2A2-D10 強化学習法BRLによる連結された自律移動ロボット群の囲い込み行動の獲得
- 2P2-G09 強化学習を用いたアーム型ロボット群の機能分化過程の解析(進化・学習とロボティクス)
- 2A1-M06 実例に基づく強化学習法BRLを用いたアーム型自律ロボット群の追加学習能力に関する検証実験(進化・学習とロボティクス)
- 2A1-E20 オムニホイールを備えた自律ロボット群の強化学習による協調行動獲得
- 2A1-E04 NeuroEvolution of Augmented Topologiesの自律移動ロボット問題への適用に関するシステムチューニング
- 部分的初期化によるParticle Swarm Optimizationの拡張(第2報,マルチロボットシステム問題における検証)
- 部分的初期化によるParticle Swarm Optimizationの拡張(第1報,標準テスト関数における検証)
- 2P1-G08 ヒトと協調する2台のアーム型強化学習ロボットにおける機能分化過程の解析
- 2A2-F24 強化学習法BRLにおけるメタ学習のためのルール発火エントロピの学習収束指標への適用
- 2P1-G09 BRLを用いた移動ロボット群の協調箱押しタスクにおける段階的な行動獲得
- 繊維関連取引におけるネットワーク分析 : 染色加工整理業界側面からのネットワーク分析
- スワームロボットシステムの群挙動の解析 : 動物行動学に基づくアプローチ
- ニューラルネットワークを用いた強化学習のためのネットワークパラメータ設定法
- クラスタリングに基づくスワームロボットシステムにおける群協調行動分析のための一手法
- グリッドタスクスケジューリングアルゴリズムR3Qの不均一な中粒度タスクへの適用
- 進化型スワームロボットシステムの群挙動生成と役割分担の分析法(多点探索型機械学習の新展開)