記憶の階層構造のエージェントへの実装と協調の創発
スポンサーリンク
概要
- 論文の詳細を見る
強化学習の研究では, 環境からの知覚をそのまま学習器への入力に用いることが多い。しかし, エージェントが多数存在するシステムではこの場合の数が膨大になり, 学習が困難になる。なんらかの一般化が必要であるが, これを設計者がアプリオリに行う研究が多い。環境の変化にも耐えうる柔軟なシステムの作成のためには, これをエージェント自らがやるべきにもかかわらず, その試みは少ない。そこで, 記憶に階層構造をつくり, 学習の進捗や環境の変化にあわせて動的に再構築させるしくみを「知覚」から「学習器への入力」の間にいれ, 知覚の一般化をさせた。
- 一般社団法人情報処理学会の論文
- 1997-09-24
著者
関連論文
- 長期記憶を持ち非常に希の起こる現象の解析(経済物理学II-社会・経済への物理学的アプローチ-,京都大学基礎物理学研究所2005年度後期研究会)
- 長期記憶を持ち非常に希の起こる現象の解析(経済物理学II-社会・経済への物理学的アプローチ-,京都大学基礎物理学研究所2005年度後期研究会)
- 異なる時間フレームを用いたエージェントによる投機市場モデル
- 異なる時間フレームを用いたエージェントによる投機市場モデル
- GISデータを用いた鹿に関するマルチエージェントシミュレーション (特集 東京情報大学ハイテクリサーチセンター国際シンポジウム『人類存続の条件』) -- (ポスターセッション)
- 環境変化のディテクタ-としての複雑ネットワーク
- 金融市場における平衡期間と平衡外期間について(経済物理学-社会・経済への物理学的アプローチ,研究会報告)
- 金融市場における平衡期間と平衡外期間について(京都大学基礎物理学研究所2003年度前期研究会 経済物理学-社会・経済への物理学的アプローチ-,研究会報告)
- 環境変化の特性および多目的最適化との類似性を考慮した動的環境への進化的な適応法
- 環境変化の特性および多目的最適化との類似性を考慮した動的環境への進化的な適応法
- 動的環境への適応と経済時系列への応用
- 動的環境への適応と経済時系列への応用
- 動的環境下でのGA
- 動的環境下での進化学習システムの特徴と適応のメカニズム
- 進化学習システムの動的環境における様々な適応メカニズムの発現
- 進化学習システムの動的環境における様々な適応メカニズムの発現
- マルチフラクタル性を示すマーケットシミュレーション
- マルチフラクタル性を示すマーケットシミュレーション
- 2-308 マーケットシミュレーションとその妥当性について
- 動的環境へのエージェントの適応
- Swarm Festa に参加して
- 記憶の階層構造のエージェントへの実装と協調の創発
- マルチエージェントシステム 〜記憶の階層構造のエージェントへの実装と協調の創発〜
- 産業連関表の可視化について(セッション4B)
- Simulation using SWARM containing micro and macro adaptive mechanisms:If world populatlon will reach Stationary State, will it be"Self Organized Critical Point"?