マルチエージェント環境における強化学習の一適用法(機械力学,計測,自動制御)
スポンサーリンク
概要
- 論文の詳細を見る
In order to give more adaptability to a multiagent system, it would be desirable for each agent to have some kind of online learning ability for how to help and guide the other agents, i.e., how to cooperate with each other for the purpose of achieving a task which is given to the whole system. When we browse the field of computational methods of online learning, reinforcement learning seems a good candidate for this mechanism. However, due to the theoretical limitation that it assumes that an environment is Markovian, traditional reinforcement learning algorithms cannot be applied directly to this behavior acquisition problem in a multiagent environment. In this paper, an online learning mechanism is designed by using two reinforcement learning units. The first one is for predicting the move of the other agents at the next time-step, and the second one is for building the appropriate action rule set for an agent itself. Several computer simulations of the cooperative carrying problem are conducted to investigate the effectiveness of the proposed approach.
- 2003-01-25
著者
-
大倉 和博
広島大学大学院
-
上田 完次
東京大学人工物工学研究センター
-
上田 完次
東大
-
大倉 和博
神戸大学工学部
-
川上 賢一郎
神戸大学自然科学研究科システム
-
川上 賢一郎
神戸大学自然科学研究科システム機能科学専攻
関連論文
- 公共財供給問題としてのインフォーマルコミュニケーションのモデル化と創出メカニズムの分析(エージェントベースシミュレーション,ソフトウェアエージェントとその応用論文)
- 中立性と凸凹を含む適応度景観の中立ネットワークに基づく構造解析
- 情報の局在性を考慮したネットワーク環境における協調行動の創発(ネットワークが創発する知能)
- ネットワーク外部性をともなう市場における情報非対称性と購買行動(参加型シミュレーション,マルチエージェントの理論と応用)
- 人工物の構造化と価値創成
- 生産システムの新しい概念(3.1 各分野の現状,3.精密工学の今,創立75周年記念)
- 自己の内的テンポを考慮した二者間の協調的リズム生成のモデル化
- 人工物の価値とサービス研究(サービスイノベーションとAIその2)
- 相互引き込みモデルに着目した音楽的周期性の創発に関する研究(セッション5)
- 異なる時系列をもった視聴覚信号による人間のリズム生成に関する研究
- 中心音を考慮したわらべうたの創発的設計(楽曲・コンテンツ生成)
- 創発とシンセシス : 人工物デザインから価値共創へ
- 2103 マルチエージェント学習による工程と日程の同時的計画手法(OS2-1 計画手法)
- 2203 限定合理的エージェントを導入した自己組織化生産システムに関する研究(OS2-2 エージェント技術の適用)
- マルチエージェント学習を用いたCO2冷媒ヒートポンプ給湯機ネットワークシステム
- 1B1-2 ネットワーク外部性を伴う市場における新製品導入の意思決定に関する研究(1B1 OS:共創・価値創成)
- 2107 半導体生産システムにおける遺伝的機械学習を用いた適応的ロット投入(OS2 生産スケジューリング)
- マルチ・エージェント学習モデルを用いた音楽的構造の創発
- 3805 サービス設計のためのレシーバ及びその要求表現(S70-1 新しい設計支援技術(1),S70 新しい設計支援技術)
- インフォーマル・リーダーによる情報共有に基づく作業改善が集団業績向上に及ぼす影響
- 1405 概念ネットワークを活用したアナロジーによる仮説的設計知識の生成手法(OS1 ソフト人工物II)
- 2210 人工物工学の方法論(第 18 報) : 共創人工物工学の概念と方法論
- R3Qによる進化型計算の中粒度Gridスケジューリング(グリッド)
- 進化型計算向け Grid Computing 環境へのマルチロボットシステムの実装
- 進化戦略における(μ, λ)-linkear Ranking Selectionに関する実験的考察
- 進化ロボティクスにおける steady-state GA の進化挙動解析
- 実例に基づく強化学習法BRLにおける行動空間の分割法の改良 : 第1報,移動ロボットのナビゲーション問題による検証(機械力学,計測,自動制御)
- 進化計算のためのグリッドコンピューティング
- ニユートラルネットワークを含む適応度景観における遺伝的アルゴリズムの進化ダイナミクス : 進化ロボティクスでの検証
- 確率ネットワークを用いた強化学習ロボットの獲得戦略の保存と利用(機械力学,計測,自動制御)
- 生態学的手法を用いたマルチエージェントシステムの解析に関する研究
- マルチロボットシステムのための強化学習の行動空間探索に関する一考察
- 実例に基づく強化学習法の頑健性向上に関する一考察 : マルチロボットシステムによる検証
- 1C1-4 進化型人工神経回路網を用いたマルチロボットシステムの協調行動獲得に関する一考察(1C1 強化学習)
- 4206 生態学的手法を用いたMASの進化過程の振る舞いの解析に関する研究(OS4 環境適応型知的人工システム)
- 進化型人工神経回路網の構造進化のための一手法 : 二重倒立振子問題への適用
- 根井の標準遺伝距離を用いた neutrality を含む問題でのGAの進化ダイナミクス解析
- 3930 適応的な行動空間の分割を行う強化学習を用いた実ロボットの行動獲得(J18-1 自律型グラウンドビークル,エアビークルの新展開(1),J18 自律型グラウンドビークル,エアビークルの新展開,2005年度年次大会)
- 根井の標準遺伝距離を用いた適応度景観に含まれる neutrality の推定 : 進化ロボティクスへの適用
- 4102 進化型人工神経回路網のパラメータチューニングによる一考察(OS4 環境適応型知的人工システム)
- 2P1-S-071 オンラインモデル更新を用いた進化型自律移動ロボットの移動物体認識(進化・学習とロボティクス5,生活を支援するロボメカ技術のメガインテグレーション)
- 2P1-S-069 生態学的手法を用いたマルチエージェントシステムの特徴の解析に関する研究(進化・学習とロボティクス5,生活を支援するロボメカ技術のメガインテグレーション)
- Robust-ESによるContinuous-Time Recurrent Neural Networksの進化的設計
- オプティカルフローの提示によって引き起こされる自己運動感覚を用いた歩行の誘導(一般セッション3)
- 相互引き込みモデルに着目した音楽的周期性の創発に関する研究(セッション5)
- 1403 強化学習を用いた和音列生成による共創的作曲(OS1 ソフト人工物I)
- マルチエージェントシステムにおける学習エージェントの数理モデル
- 共生・共進化型マルチロボットシステム : 構造進化人工神経回路網の適用(G15-2 ロボットシステム,G15 ロボティクス・メカトロニクス部門)
- 2P2-3F-A5 自律移動ロボット用人工神経回路網の構造進化に関する研究
- 4106 身体性認知に基づくマルチロボットシステムの設計
- 2P1-3F-A7 連続空間における強化学習を用いたマルチロボットシステムの協調行動獲得
- 1P1-S-066 適応的な行動空間の分割を行う強化学習を用いたマルチロボットシステムの行動獲得(進化・学習とロボティクス2,生活を支援するロボメカ技術のメガインテグレーション)
- 強化学習を用いた自律マルチロボットシステムの協調行動獲得 : ロボット台数の増減に関する一考察(進化・学習とロボティクス3)
- オンラインモデル更新を用いた自律移動ロボットの進化に関する基礎研究(進化・学習とロボティクス3)
- 強化学習を用いた飛行船ロボットの自律行動獲得(進化・学習とロボティクス1)
- 確率ネットワークによる学習エージェントの獲得戦略保存と適用に関する一考察(環境適応型知的人工システム)
- 社会性エージェント群の進化的生成シミュレーション(環境適応型知的人工システム)
- 321 協調荷押し問題における構造進化型人工神経回路網の汎化能力に関する一考察
- 強化学習による自律型アームロボットの協調行動獲得
- マルチエージェント環境における強化学習の一適用法
- マルチエージェント環境における強化学習の一適用法(機械力学,計測,自動制御)
- 2A1-3F-B8 情報量基準による強化学習エージェントの入出力モデルの評価
- 2-406 マルチエージェント環境における強化学習の構成法に関する一考察 : 実例に基づくアプローチと個体識別能力の効用
- 強化学習によるアーム型ロボット群の協調動作獲得 : 挙動の解析
- 1408 エージェントの限定合理性を考慮した人工システムの一提案(第2報)(OS1 ソフト人工物II)
- エージェントの限定合理性を考慮した人工システムの一提案(ソフト人工物I)
- リサイクルシステムにおける行動主体の意思決定と制度設計 : 使用済み製品の回収市場における分析(市場モデル, ソフトウェアエージェントとその応用論文)
- 1404 耐久消費財のリサイクルシステムにおける行動主体の意思決定 : リサイクル製品の普及に関する分析(OS1 ソフト人工物I)
- Neutral Networks を含む適応度景観における遺伝的アルゴリズムの進化ダイナミクス
- 『生命複雑系からの計算パラダイム』, 大内東,山本雅人,川村秀憲,柴肇一,高柳俊明,當間愛晃,遠藤聡志共著, 出版社 森北出版, 発行 2003年8月, 全ページ 201頁, 価格 3,570円, ISBN 4-627-85021-2
- マルチエージェントシミュレーションのためのユーザ情報に基づく意思決定モデル(進化・学習とロボティクス3)
- 授賞論文「均質な自律ロボット群による協調行動獲得問題 : 機能分化に基づくアプローチ」(学会賞の贈呈 : 2003年度学会賞論文賞)
- 4105 生物指向型生産システムとその実現への課題
- Multi-parent Recombination を用いる進化戦略
- 進化エージェント群による機能的役割分担生成に関する一考察
- CUDA環境におけるデータ並列化を用いた遺伝的アルゴリズムの実装手法
- 第19回中国支部学術講演会
- 2P2-G07 強化学習法BRLによる自律移動ロボットの狭路通行行動の獲得(進化・学習とロボティクス)
- 構造進化型人工神経回路網によるSwarm Roboticsのための適応的協調行動の生成
- 2A1-3F-D2 共創システムにおける共進化の役割 : 均質なマルチロボットシステムを例として
- 2-408 協調搬送問題における共進化型ニューラルコントローラの適応度景観の推定に関する一考察
- 「マルチエージェントシミュレーションの社会システムへの応用特集号」を企画して
- 2A2-D16 ヒトとアーム型ロボットの協調行動獲得実験 : 強化学習によるアプローチ
- 2A2-D14 強化学習法BRLによる自律移動ロボット群の集合行動の獲得
- 2A2-D10 強化学習法BRLによる連結された自律移動ロボット群の囲い込み行動の獲得
- 2P2-G09 強化学習を用いたアーム型ロボット群の機能分化過程の解析(進化・学習とロボティクス)
- 2A1-M06 実例に基づく強化学習法BRLを用いたアーム型自律ロボット群の追加学習能力に関する検証実験(進化・学習とロボティクス)
- 2A1-E20 オムニホイールを備えた自律ロボット群の強化学習による協調行動獲得
- 2A1-E04 NeuroEvolution of Augmented Topologiesの自律移動ロボット問題への適用に関するシステムチューニング
- 部分的初期化によるParticle Swarm Optimizationの拡張(第2報,マルチロボットシステム問題における検証)
- 部分的初期化によるParticle Swarm Optimizationの拡張(第1報,標準テスト関数における検証)
- 2P1-G08 ヒトと協調する2台のアーム型強化学習ロボットにおける機能分化過程の解析
- 2A2-F24 強化学習法BRLにおけるメタ学習のためのルール発火エントロピの学習収束指標への適用
- 2P1-G09 BRLを用いた移動ロボット群の協調箱押しタスクにおける段階的な行動獲得
- 繊維関連取引におけるネットワーク分析 : 染色加工整理業界側面からのネットワーク分析
- スワームロボットシステムの群挙動の解析 : 動物行動学に基づくアプローチ
- ニューラルネットワークを用いた強化学習のためのネットワークパラメータ設定法
- クラスタリングに基づくスワームロボットシステムにおける群協調行動分析のための一手法
- グリッドタスクスケジューリングアルゴリズムR3Qの不均一な中粒度タスクへの適用
- 進化型スワームロボットシステムの群挙動生成と役割分担の分析法(多点探索型機械学習の新展開)