動的環境における強化学習のステップサイズパラメータ調整法(強化学習)
スポンサーリンク
概要
- 論文の詳細を見る
動的な環境において、強化学習のステップパラメータを、学習の過程において調整する方法を提案する。一般の強化学習では、学習対象である環境は一定と仮定されており、ステップパラメータは雑音などの効果を除去するために徐々に単調に減衰させることが多い。しかしマルチエージェント技術が適用されるのような環境では、環境は絶えず変化する場合が多く、その変化の度合いに応じてステップパラメータを調整する必要がある。本研究では、この調整方法を強化学習の過程で行う方法を提案し、その数学的解析および実験により、調整法の持つ意味や有効性を検討する。
- 2008-10-23
著者
-
野田 五十樹
産業技術総合研究所 情報技術研究部門
-
野田 五十樹
産業技術総合研 情報技術研究部門
-
野田 五十樹
京都大学工学部
-
野田 五十樹
(独)産業技術総合研究所情報技術研究部門
-
野田 五十樹
(独)産業技術総合研究所 情報技術研究部門
-
野田 五十樹
(独)産業技術総合研究所
関連論文
- 3 災害情報学(新しい○○情報学)
- ロボカップ12年(ロボカップ12年)
- 「ロボカップ12年」特集にあたって
- CBRテロを想定した避難シミュレータ(社会システムにおける知能,「社会システムにおける知能」および一般)
- 歩行者間の距離を利用した一次元人流モデル (特集 「知識発見の生命科学への応用」および一般)
- 1D-1 制約付きDelaunay三角形分割を利用したエージェント配置モデル(ゲーム・ロボカップ,一般セッション,人工知能と認知科学)
- ロボカップ(ゲームとコンピュータ)
- ロボカップサッカーシミュレータ(研究のツールボックス(2))
- CBRテロを想定した避難シミュレータ(社会システムにおける知能,「社会システムにおける知能」および一般)
- 避難シミュレータを利用した避難誘導計画の検証及び立案支援の提案
- RoboCupサッカーシミュレーションにおけるエージェント配置手法の提案
- 一次元歩行者モデルを用いた高速避難シミュレータの開発
- 一次元歩行者モデルを用いた高速避難シミュレータの開発
- アクティブRFIDを用いた展示館来場者の館内滞在傾向の分析(セッション3:実空間におけるモデル化とシミュレーション)
- アクティブRFIDを用いた展示館来場者の館内滞在傾向の分析(セッション3:実空間におけるモデル化とシミュレーション,社会システムと知能)
- 情報インフラに基づくグラウンディングとその応用 : サイバーアシストプロジェクトの概要
- Feedback Loopを持つBoltzmann Machineによるパターン遷移の学習
- シミュレーションによるデマンドバス利便性の評価(ユビキタス・モバイルアプリケーション,次世代社会基盤をもたらす高度交通システムとモバイル通信システム)
- 都市型フルデマンドバスの実用性
- 社会システム応用(人間中心の知的都市基盤)
- 人流計測による避難誘導効果の実証的検証
- 人流計測による避難誘導効果の実証的検証
- 人流計測による避難誘導効果の実証的検証
- CBRテロに対する対処訓練を支援する避難シミュレータの実現 (「知能と社会・ネットワーク」および一般発表)
- 情報操作による社会の安定化(セッション2: 社会システムと情報提示)
- 情報操作による社会の安定化(社会システムと情報提示, 「社会システムにおける知能」及び一般)
- チームプレイにおける意図の利用(意図研究のスペクトル)
- 災害救助・軍事プランニング(「プランニング技術の進展と新たな応用展開」)
- 道路交通ネットワークのダイナミクスと群ユーザ支援(ネットワークが創発する知能)
- 都市型フルデマンドバスの実用性
- デマンドバスはペイするか?
- デマンドバスはペイするか?
- 動的環境における強化学習のステップサイズパラメータ調整法(強化学習)
- ロボットにおける機械学習の課題と動向(知能ロボットの技術:人工知能からのアプローチ(前編))
- お気軽サッカーを目指して(ゲーム情報学研究の事例)(ゲーム情報学)
- 減災のための情報技術
- 3D-1 変化する環境に対するステップサイズパラメータオンライン調整法(人工知能(1),一般セッション,人工知能と認知科学)
- シミュレーションリーグとインフラ技術の技術的課題と展望
- A111 RoboCupにおけるマルチエージェントシミュレーション(集団行動のマルチエージェントシミュレーション)
- 3.RoboCupSoccerとRoboCupRescue(社会に向き合うエージェントシステム)
- ロボカップ道しるべ : 標準プラットフォームリーグ
- 地域住民と自治体の協働による発災対応力の向上と効率的な被害情報収集・共有のための防災訓練
- CBRテロ被害予測のためのシミュレータ
- 避難誘導効果の検証に向けた人流計測
- 4.センサデータマイニングを活用した安全安心な避難誘導への取組み(安全・安心社会実現のためのセンサデータマイニング応用)
- 意見交換 (2011年度人工知能学会全国大会(第25回) パネル討論 大震災と向き合う)
- 避難シミュレータのための動線解析と避難誘導支援への応用
- 防災for ICTから防災by ICTへ (2011年度人工知能学会全国大会(第25回) パネル討論 大震災と向き合う)
- 病院の傷病者受入れ潜在能力に関する分析--災害傷病者の病院における収容場所に関する研究
- ロボットにおける位置情報の活用 : Robotic Localization Service (RLS) の標準策定
- パネル討論「大震災と向き合う」(2011年度人工知能学会全国大会(第25回))
- 一次元歩行者モデルを用いた高速避難シミュレータの開発とその応用
- 接客サービス向上にむけたマルチエージェントモデル構築とシミュレーションの検討 (社会システムと情報技術研究ウィーク)
- 外食店舗における接客サービス向上のためのシミュレーションの検討 (第18回社会情報システム学シンポジウム 社会シミュレーション) -- (社会シミュレーション)
- 特集「社会を元気にするICT」の編集にあたって
- 災害救助支援のための情報共有プラットフォーム : データ仲介による情報システム連携
- DK-3-5 マルチエージェントシミュレーションの減災・防災分野への貢献 : 安全安心な避難誘導の実現に向けた取り組み(DK-3.防災システム研究者と情報システム研究者の対話,ソサイエティ特別企画,ソサイエティ企画)
- DK-3-5 マルチエージェントシミュレーションの減災・防災分野への貢献 : 安全安心な避難誘導の実現に向けた取り組み(DK-3.防災システム研究者と情報システム研究者の対話,ソサイエティ特別企画,ソサイエティ企画)
- 「減災ICT」特集号について
- 災害時におけるソーシャルメディア間の話題の比較分析
- 河川氾濫に対する避難計画の検証に向けた歩行者シミュレータの機能拡張
- 避難シミュレータのための動線解析と避難誘導支援への応用
- 震災時におけるTwitterのリツイート分析(「Webインテリジェンス」及び一般)
- ポストペタ時代における社会現象シミュレーションの可能性
- How Did We Used Twitter, How Communicate in Twitter at Catastrophic Earthquake in Japan
- ABMに基づく情報拡散シミュレーション
- マルチエージェン卜型拡張SIRモデルを用いた情報拡散シミュレーションの評価
- 異種協調型災害情報支援システム実現に向けた基盤技術の構築
- マルチエージェントシミュレーション:6.避難シミュレーションの実社会への応用