共進化を用いた強化学習に関する研究
スポンサーリンク
概要
- 論文の詳細を見る
強化学習は未知の環境に対し、動的計画法に基づいて行動戦略を獲得する有効な手段である。しかし、対象環境が他者の行動の結果により変動し、行動選択の有用度が変化する動的環境では単に強化学習の枠組みを適用しただけでは不十分である。本論文はこのような動的環境において、複数エージェント同士が同降に学習することによってより環境に適応したルールを獲得できる手法を提案する。具体的にはQ-Learningの強化学習に、生物学におけるCo-Evolution(共進化)の概念を導入させ、エージェント同士を相対的に評価する相互評価型強化学習を提案する。計算機実験として簡単な格子空間に存在する複数のエージェントを設定し、本提案法により従来の強化学習では得られないルール、ここでは状態行動対がエージェント間の共進化によって得られることを検証し、本提案手法の有効性を確かめる。
- 社団法人電子情報通信学会の論文
- 1994-09-26
著者
関連論文
- 1336 個人の特性に適応する EMG 識別装置の開発 : データの使用頻度を用いた運動学習における進度の定量化
- 予測機構による協調動作獲得の促進
- 2P1-3F-B7 ラーニングクラシファイアの報酬系再構築による群ロボットシステムの制御
- DPGを用いた群ロボット制御系 : 場での相互作用における自己組織化モデル
- 振動引き込みモデルを用いた群ロボット制御系による障害物回避問題
- 2A1-S-067 代謝反応ネットワークの構造特性解析に関する研究(進化・学習とロボティクス4,生活を支援するロボメカ技術のメガインテグレーション)
- 運動画像からの特徴検出における基礎研究(進化・学習とロボティクス2)
- 装着型パワーアシスト装置の制御 : ニューラルネットワークを用いた動作の識別(進化・学習とロボティクス2)
- 骨動マイク用音声コマンドの設計(進化・学習とロボティクス2)
- FESを用いた空間情報呈示システムの開発 : 距離・刺激強度・刺激応答の関係性について(進化・学習とロボティクス2)
- 進化型強化モジュールを有するクラシファイアシステムに関する研究
- CSにおけるルール表現の拡張に関する研究
- 2A1-30-032 複数自律ブロックエージェントの挙動獲得に関する研究
- 2A1-30-031 多集団型進化戦略に関する研究
- 自動倉庫のための自律エージェント群の場の知識獲得に関する研究
- 形態をもつマルチエージェントの自律的振る舞いに関する基礎研究
- 2P1-3F-B5 遠隔制御を伴う自律除雪機の構築に関する基礎研究
- 2A1-2F-D1 骨導マイクと音声認識による福祉機器遠隔操作に関する研究
- 1P1-04-010 精密農法のためのマップに基づく作業機制御システムの開発
- 行動選択ネットワークに基づいた組織的行動の生成に関する研究
- 疲労度パラメータを導入した行動選択ネットワークによるエージェントの創発的組織化に関する考察
- 多数AGVの通信プロトコルの獲得 -多数機械による自律スケジュール実験-
- マルチエージェントシステムにおける学習エージェントの数理モデル
- GAによるジョブショップスケジューリングの多目的最適化に関する研究
- シーン認識と通信プロトコルを組み合わせたAGVの自律運転
- 2A1-3F-B2 階層型エージェントシステムを用いた追跡問題へのアプローチ
- 2P1-L9 生体信号を用いた強化学習の報酬に関する基礎研究(27. 強化学習とロボティクス・メカトロニクス)
- 2P2-76-099 生体信号を教師信号とした機械学習に関する基礎研究
- ヘテロマルチエージェントによる農産物市場モデルの基礎研究 : シンプルな農産物市場モデルの構築
- 触媒的代謝系の組織化に関する研究
- 2P1-E3 柔軟構造を有するSMA-Netの行動生成に関する基礎研究(29. 自己組織ロボットシステム)
- 柔軟構造を有する自律分散型ロボットの行動生成に関する基礎研究 : 自己組織化分類システムによる行動の評価
- アメーバを模倣した柔らかいロボットの構築
- アメーバを模倣した多自由度可変形ロボットに関する研究
- 2P2-3F-A7 Prosthetic hand control with tactile sensory feedback
- 2P2-3F-A6 表面筋電位による運動習熟過程のモデル化 : 上肢到達運動課題における考察
- 2P2-3F-A4 遺伝的アルゴリズムによる 2 エージェントゲームにおける適応的手法
- 2P2-3F-A3 システム構成要素間の関係変更に基づいた学習能力の獲得
- 2P2-3F-A1 統計的手法を用いたペットロボットの動作と印象との関係の解析
- 1P1-04-009 精密農法向けプラン生成システムの開発
- 進化的学習における適応度ランドスケープの自動創成に関する研究 : ペナルティ学習
- ALifeによるタスク処理
- マルチエージェントシステムにおけるゲーム環境の利用に関する研究
- 共進化を用いた強化学習に関する研究
- ビリヤード環境におけるアフォーダンス抽出 : コンビネーションプレイにおける不変項の獲得
- 振動引き込みモデルによる多粒子ロボット制御
- RNNを用いた形態形成振動子の基礎研究 : ネットワーク規模が振動様式に与える影響についての考察
- 1A1-36-047 EMG を用いた力覚提示装置の力センサシステム開発
- 1P1-3F-B3 触覚インタフェイス装着時における接触力を考慮した手指の振動閾値の測定
- 1-111 内骨格式装着型パワーアシスト機構の設計と解析
- アメーバ状運動モデルの構築に関する研究
- 2P2-3F-A2 2 次元内部状態と主観的評価を持つエージェントによる集団の形成
- 部品主体型生産システムにおける情報表現
- 非均質ロボット群における組織的学習に関する研究
- 2A1-3F-B5 装着型パワーアシスト装置制御のための人間動作の解析
- 外骨格式装置型腰部パワーアシスト機構の開発
- 1A1-E04 表面筋電位信号を用いた制御による装着型パワーアシスト機構の開発
- 2P1-41-052 自律移動ロボットのための連想記憶型ナビゲーションシステム
- 自律移動ロボットの環境知覚機構 : マルチロボット環境下における環境知覚
- 2-113 バネー質点系を基本としたロボットモデルにおける進化型計算による動作獲得
- GPのライブラリ空間表現
- 自律エージェント群による配送問題の分数的解法
- 大規模自律エージェント群による Collective Behavior