20607 強化学習における知覚情報の自動選択(知的処理と診断)

概要

論文の詳細を見る
In reinforcement learning, there is a problem that a number of experiences necessary for learning increase remarkably by the number of states increasing. As one of the method for the solution of this problem, it is proposed that the learning module that limits the sensor information and the learning module that does not limit learn in parallel and the learning module used for the action selection are changed in suitable timing. However, this timing has been decided by the trial and error in a conventional method. In this paper, we propose the method for doing an automatic, effective change by comparing uncertainty of action selection in each state and verify effectiveness by the simulation.
社団法人日本機械学会の論文
2006-03-09

著者

川田誠一
産業技術大学院大学創造技術専攻
舘山武史
首都大学東京
川田誠一
首都大
原田宗雄
都立大
舘山武史
首都大

関連論文

212 場面遷移ネットを用いたサービス評価シミュレータ(設計マネジメント〔I〕)
場面遷移ネットGUI シミュレータによるマルチエージェントサービスフローシミュレーション
場面遷移ネットを用いたサービス工学に関する研究
S1401-1-5 作業者の技能と教育を考慮した動的作業計画 : 作業配分ルールの最適化(生産システムの新展開(基礎・理論))
2203 作業者の技能と教育を考慮した動的作業計画 : 機械学習を用いた作業配分ルールの決定(OS2-2 スケジューリングII)
k-確実探査法とFuzzy-ARTを用いた連続状態環境のセミマルコフ決定過程モデル構築手法の提案(機械力学,計測,自動制御)
価値関数モデルを用いたサービスの設計・評価のための顧客意思決定シミュレーション手法(第18回設計工学・システム部門講演会)
場面遷移ネットを用いたサービスの離散・連続ハイブリッドモデリングとマルチエージェントシミュレーション
探索エージェントを導入した学習経験を共有するマルチエージェント強化学習システムの提案(機械力学,計測,自動制御)
強化学習を用いた組織論に基づく適応的マルチエージェントシステム
20608 不確実性を低減するエージェントを導入したマルチエージェント強化学習(知的処理と診断)
20607 強化学習における知覚情報の自動選択(知的処理と診断)
10204 動的環境における移動ロボットのSensor-Based Controlに関する研究(OS15 知能ロボット)
20720 k-確実探査法とFuzzy-ARTによるタスクに応じた自律的状態分割アルゴリズム((III),OS12 インテリジェントシステムと制御)
自己組織化マップを用いた教示による強化学習の高速化手法の提案(機械力学,計測,自動制御)
成長セルとk-確実探査法を用いた連続状態未知環境の最適経路探索(ハイブリッドダイナミクスからの新展開)
ART-1ネットワークを用いた工場の設備グルーピングアルゴリズムの提案
2-301 自己組織化マップによる自律移動ロボットの behavior の生成
κ-確実探査法と動的計画法を用いたMDPs環境の効率的探索法
k-確実探査法と動的計画法を用いたMDPs環境の効率的探索法
2302 Web情報を用いた設計知識情報データベースの拡充手法
2301 サービス設計のための目標計画法に基づく設計値決定支援システム
1308 価値関数モデルを用いたサービスの設計・評価のための顧客意思決定シミュレーション手法
2503 サービス改善のための企業リソースを考慮したコンテンツパラメータ設計(OS12-2 ライフサイクル設計とサービス工学II:サービスのモデル化技法,OS12 ライフサイクル設計とサービス工学)
1404 場面遷移ネットを用いたサービスのマルチエージェントシミュレーション(OS12-1 ライフサイクル設計とサービス工学I:サービス設計と価値表現,OS12 ライフサイクル設計とサービス工学)
2411 サービスブループリントに基づくサービスシミュレーション手法(OS12-3 ライフサイクル設計とサービス工学III,OS12 ライフサイクル設計とサービス工学)
機械学習法を用いた作業者の技能と教育を考慮したスケジューリング支援システム (システム研究会確率的最適化技術と機械学習技術の共進化)
A Multi-Aspect Modeling Method for Service Flow Simulation Using Scene Transition Nets (STNs)
1302 サービス設計のための不確実性分析手法(OS9-2 ライフサイクル設計とサービス工学II)
1303 不確実要素を考慮したサービスコストシミュレーション手法(OS9-2 ライフサイクル設計とサービス工学II)
1301 場面遷移ネットに基づくサービスのマルチアスペクトモデリング手法(OS9-2 ライフサイクル設計とサービス工学II)

20607 強化学習における知覚情報の自動選択(知的処理と診断)

スポンサーリンク

概要

著者

関連論文

スポンサーリンク