1A1-O04 シェイピングを適用した協調箱押しタスクにおける強化学習ロボット群の協調行動の解析(進化・学習とロボティクス)
スポンサーリンク
概要
- 論文の詳細を見る
Reinforcement Learning (RL) is one of promising approaches for controlling an autonomous robot. However, its performance is quite sensitive to the segmentation of state and action spaces. To deal with this problem, we have proposed one RL technique, named BRL. BRL has the feature of segmenting state and action spaces autonomously. In this paper, we investigate the performance of BRL through cooperative Box-Pushing task using four mobile robots. Moreover, for treating that tasks, we adopt Shaping which is the notion extensively applied in various fields. Shaping make robot learn efficiently while raising difficulty step by step. It is considered effective to deal with task, because robots can search with previous learning. In addition, the cooperative behavior which is acquired by using Shaping is analyzed.
- 一般社団法人日本機械学会の論文
- 2011-05-26
著者
関連論文
- 実例に基づく強化学習法BRLにおける行動空間の分割法の改良 : 第1報,移動ロボットのナビゲーション問題による検証(機械力学,計測,自動制御)
- 確率ネットワークを用いた強化学習ロボットの獲得戦略の保存と利用(機械力学,計測,自動制御)
- マルチロボットシステムのための強化学習の行動空間探索に関する一考察
- 実例に基づく強化学習法の頑健性向上に関する一考察 : マルチロボットシステムによる検証
- 3930 適応的な行動空間の分割を行う強化学習を用いた実ロボットの行動獲得(J18-1 自律型グラウンドビークル,エアビークルの新展開(1),J18 自律型グラウンドビークル,エアビークルの新展開,2005年度年次大会)
- 4106 身体性認知に基づくマルチロボットシステムの設計
- 2P1-3F-A7 連続空間における強化学習を用いたマルチロボットシステムの協調行動獲得
- 1P1-S-066 適応的な行動空間の分割を行う強化学習を用いたマルチロボットシステムの行動獲得(進化・学習とロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- 321 協調荷押し問題における構造進化型人工神経回路網の汎化能力に関する一考察
- 強化学習による協調搬送問題へのアプローチ : 実機による検証
- 強化学習による棒押し問題へのアプローチ : 実機実験と学習過程の観測
- CUDA 環境におけるデータ並列化を用いた遺伝的アルゴリズムの実装手法
- CUDA環境におけるデータ並列化を用いた遺伝的アルゴリズムの実装手法
- 2P2-G07 強化学習法BRLによる自律移動ロボットの狭路通行行動の獲得(進化・学習とロボティクス)
- 2A2-D16 ヒトとアーム型ロボットの協調行動獲得実験 : 強化学習によるアプローチ
- 2A2-D14 強化学習法BRLによる自律移動ロボット群の集合行動の獲得
- 2A2-D10 強化学習法BRLによる連結された自律移動ロボット群の囲い込み行動の獲得
- 2P2-G09 強化学習を用いたアーム型ロボット群の機能分化過程の解析(進化・学習とロボティクス)
- 2A1-M06 実例に基づく強化学習法BRLを用いたアーム型自律ロボット群の追加学習能力に関する検証実験(進化・学習とロボティクス)
- 2A1-E20 オムニホイールを備えた自律ロボット群の強化学習による協調行動獲得
- 2P1-G08 ヒトと協調する2台のアーム型強化学習ロボットにおける機能分化過程の解析
- 2A2-F24 強化学習法BRLにおけるメタ学習のためのルール発火エントロピの学習収束指標への適用
- 2P1-G09 BRLを用いた移動ロボット群の協調箱押しタスクにおける段階的な行動獲得
- 繊維関連取引におけるネットワーク分析 : 染色加工整理業界側面からのネットワーク分析
- スワームロボットシステムの群挙動の解析 : 動物行動学に基づくアプローチ
- 進化型スワームロボットシステムの群挙動生成と役割分担の分析法(多点探索型機械学習の新展開)
- 1A1-P03 強化学習によるヒトと自律ロボット群の協調行動の獲得 : 環境変化に対する頑健性の検証(進化・学習とロボティクス)
- 2B3-2 強化学習ロボット群のための人工神経回路網の設定法 : 状態遷移予測器としての利用(OS8:進化・学習における人工神経回路網の設定法)
- 1A1-M12 CUDA環境におけるsteady-state GAの実装(進化・学習とロボティクス)
- 1A1-M02 スワームロボットシステムの群挙動の解析 : 複雑ネットワークに基づくアプローチ(進化・学習とロボティクス)
- 1A1-M10 メタ学習を導入した強化学習法BRLによる自律移動ロボット群の周回行動の獲得(進化・学習とロボティクス)
- 2B3-3 進化型人工神経回路網の初期設定に関する一考察 : 下平手法と山田手法の比較(OS8:進化・学習における人工神経回路網の設定法)
- 1A1-O10 マルチロボットシステムにおける頑健性向上のための知識の獲得・利用法の構築(進化・学習とロボティクス)
- 1A1-O04 シェイピングを適用した協調箱押しタスクにおける強化学習ロボット群の協調行動の解析(進化・学習とロボティクス)