20608 不確実性を低減するエージェントを導入したマルチエージェント強化学習(知的処理と診断)
スポンサーリンク
概要
- 論文の詳細を見る
It is known that the uncertainty of the state transition tends to rise in large-scale multi agent environments and to worsen converge of reinforcement learning. In this paper, it is tried to propose the new method that restrain exploration of some agents in each episode to improve converge of learning. The feature of this technique is that the agents whose explorations are restrained support learning of the normal agents by lowering the uncertainty of the state transition. It is shown that the proposal technique is effective by the simulation.
- 社団法人日本機械学会の論文
- 2006-03-09
著者
関連論文
- 212 場面遷移ネットを用いたサービス評価シミュレータ(設計マネジメント〔I〕)
- 場面遷移ネットGUI シミュレータによる マルチエージェントサービスフローシミュレーション
- 場面遷移ネットを用いたサービス工学に関する研究
- S1401-1-5 作業者の技能と教育を考慮した動的作業計画 : 作業配分ルールの最適化(生産システムの新展開(基礎・理論))
- 2203 作業者の技能と教育を考慮した動的作業計画 : 機械学習を用いた作業配分ルールの決定(OS2-2 スケジューリングII)
- k-確実探査法とFuzzy-ARTを用いた連続状態環境のセミマルコフ決定過程モデル構築手法の提案(機械力学,計測,自動制御)
- 価値関数モデルを用いたサービスの設計・評価のための顧客意思決定シミュレーション手法(第18回設計工学・システム部門講演会)
- 場面遷移ネットを用いたサービスの離散・連続ハイブリッドモデリングとマルチエージェントシミュレーション
- 探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案(機械力学,計測,自動制御)
- 強化学習を用いた組織論に基づく適応的マルチエージェントシステム
- 20608 不確実性を低減するエージェントを導入したマルチエージェント強化学習(知的処理と診断)
- 20607 強化学習における知覚情報の自動選択(知的処理と診断)
- 10204 動的環境における移動ロボットのSensor-Based Controlに関する研究(OS15 知能ロボット)
- 20720 k-確実探査法とFuzzy-ARTによるタスクに応じた自律的状態分割アルゴリズム((III),OS12 インテリジェントシステムと制御)
- 自己組織化マップを用いた教示による強化学習の高速化手法の提案(機械力学,計測,自動制御)
- 成長セルとk-確実探査法を用いた連続状態未知環境の最適経路探索(ハイブリッドダイナミクスからの新展開)
- ART-1ネットワークを用いた工場の設備グルーピングアルゴリズムの提案
- 2-301 自己組織化マップによる自律移動ロボットの behavior の生成
- κ-確実探査法と動的計画法を用いたMDPs環境の効率的探索法
- k-確実探査法と動的計画法を用いたMDPs環境の効率的探索法
- 2302 Web情報を用いた設計知識情報データベースの拡充手法
- 2301 サービス設計のための目標計画法に基づく設計値決定支援システム
- 1308 価値関数モデルを用いたサービスの設計・評価のための顧客意思決定シミュレーション手法
- 2503 サービス改善のための企業リソースを考慮したコンテンツパラメータ設計(OS12-2 ライフサイクル設計とサービス工学II:サービスのモデル化技法,OS12 ライフサイクル設計とサービス工学)
- 1404 場面遷移ネットを用いたサービスのマルチエージェントシミュレーション(OS12-1 ライフサイクル設計とサービス工学I:サービス設計と価値表現,OS12 ライフサイクル設計とサービス工学)
- 2411 サービスブループリントに基づくサービスシミュレーション手法(OS12-3 ライフサイクル設計とサービス工学III,OS12 ライフサイクル設計とサービス工学)
- 機械学習法を用いた作業者の技能と教育を考慮したスケジューリング支援システム (システム研究会 確率的最適化技術と機械学習技術の共進化)
- A Multi-Aspect Modeling Method for Service Flow Simulation Using Scene Transition Nets (STNs)
- 1302 サービス設計のための不確実性分析手法(OS9-2 ライフサイクル設計とサービス工学II)
- 1303 不確実要素を考慮したサービスコストシミュレーション手法(OS9-2 ライフサイクル設計とサービス工学II)
- 1301 場面遷移ネットに基づくサービスのマルチアスペクトモデリング手法(OS9-2 ライフサイクル設計とサービス工学II)