目標学習を伴う強化学習エージェント集団の共同プランニング

概要

論文の詳細を見る
複数エージェントによる協調問題解決を, 強化学習の枠組みで扱おうという研究も, 近年, 活発化しつつある. 先駆的な研究として, [Weiss 93] はクラシファイアーシステム [Holland 86] を内部に持つエージェント集団が, 局所環境情報のみに基づき共同プランを学習するアーキテクチャを提案している. しかし, 局所環境情報のみに即応的な強化学習では, 複雑な問題に対する協調の学習は困難で, その解決のためにモジュール化された複数のクラシファイアーシステムの上位にそれらの調整をするクラシファイアーシステムを設けた階層型クラシファイアーシステム [Dorigo 93] や, クラシファイアーシステムにエージエント間の通信構造を学習する仕組みを組み込んだシステム [前沢 96] 等が提案されている. ところで, 協調行動が高度であればあるほど, 反応的行動の学習に加えて熟考に基づく行動の学習が必要となる. 本研究では, 熟考的要素を自ら達成すべき目標の設定としてとらえ, その目標, 目標の達成に必要な行為, 協調のために必要とされる通信構造を学習するための3つのクラシファイアーシステムを構造的に持つエージェントアーキテクチャを提案し, 視界を設定した3次元ブロックワールド問題を実験タスクとして取り上げ, 目標学習の有効性を調べる.
一般社団法人情報処理学会の論文
1997-03-12

目標学習を伴う強化学習エージェント集団の共同プランニング

スポンサーリンク

概要

著者

関連論文

スポンサーリンク