状態空間の部分的高次元化法によるマルチエージェント強化学習(分散協調とエージェント)
スポンサーリンク
概要
- 論文の詳細を見る
マルチエージェントシステムの設計手法の一つとして, マルチエージェント強化学習がある.マルチエージェント強化学習において, エージェントは自分以外のエージェントも環境の一部として観測する.そのため, エージェント数の増加に伴い状態空間が指数的に増加し(次元の呪), 学習速度を著しく低下させるという問題が生じる.また, 学習に必要なメモリ量も膨大となる.この問題を解決する手法として提案されたModular Q-learningには, 知覚の不完全性により学習性能が低下する問題がある.本研究では状態空間の部分的高次元化手法を用いてModular Q-learningの学習性能を改善する手法HMQLを提案する.
- 2005-04-01
著者
関連論文
- 4D-4 制約最適化・分散制約最適化問題における半正定値計画法の適用の検討(人工知能(2),一般セッション,人工知能と認知科学)
- ヒステリシス署名による改竄防止機構を備えたログ用ファイルシステムの提案(セッション5-A:不正アクセス対策(1))
- システムコールとライブラリ関数の監視による侵入防止システムの実現(セキュリティ)
- システムコールの実行順と実行位置に基づく侵入検知システムの実現(OS-2 : セキュリティ)
- FPGAを用いた制約最適化問題の解法の検討 (ディペンダブルコンピューティング)
- FPGAを用いた制約最適化問題の解法の検討 (コンピュータシステム)
- 分散制約最適化手法を適用した協調カメラ網アルゴリズムと実装 (ヒューマン情報処理)
- 分散制約最適化手法を適用した協調カメラ網アルゴリズムと実装 (パターン認識・メディア理解)
- 1G-1 出欠データと学習データを用いた学生の修学傾向分析(教育支援システム・教育実践,一般セッション,コンピュータと人間社会)
- D-8-10 制約最適化問題への半正定値計画法の適用についての一検討(D-8. 人工知能と知識処理,一般セッション)