目標学習を伴う強化学習エージェント集団の共同プランニング
スポンサーリンク
概要
- 論文の詳細を見る
複数エージェントによる協調問題解決を, 強化学習の枠組みで扱おうという研究も, 近年, 活発化しつつある. 先駆的な研究として, [Weiss 93] はクラシファイアーシステム [Holland 86] を内部に持つエージェント集団が, 局所環境情報のみに基づき共同プランを学習するアーキテクチャを提案している. しかし, 局所環境情報のみに即応的な強化学習では, 複雑な問題に対する協調の学習は困難で, その解決のためにモジュール化された複数のクラシファイアーシステムの上位にそれらの調整をするクラシファイアーシステムを設けた階層型クラシファイアーシステム [Dorigo 93] や, クラシファイアーシステムにエージエント間の通信構造を学習する仕組みを組み込んだシステム [前沢 96] 等が提案されている. ところで, 協調行動が高度であればあるほど, 反応的行動の学習に加えて熟考に基づく行動の学習が必要となる. 本研究では, 熟考的要素を自ら達成すべき目標の設定としてとらえ, その目標, 目標の達成に必要な行為, 協調のために必要とされる通信構造を学習するための3つのクラシファイアーシステムを構造的に持つエージェントアーキテクチャを提案し, 視界を設定した3次元ブロックワールド問題を実験タスクとして取り上げ, 目標学習の有効性を調べる.
- 一般社団法人情報処理学会の論文
- 1997-03-12
著者
関連論文
- 4S-6 独居老人支援に向けた備忘録付き音声仮想対話システム(対話・質問応答,学生セッション,人工知能と認知科学)
- ロボカップレスキュープロジェクト
- 協調追跡のための提携における利得構成の進化的学習
- 協調追跡のための提携における利得構成の進化的学習
- エージェント間提携形成に基づく協調追跡行動の進化的学習
- エージェント集団の相互目標学習に基づく協調行動の発現
- 協調的目標学習を伴う強化学習エージェント集団の共同プランニング
- 目標学習を伴う強化学習エージェント集団の共同プランニング
- 強化学習エージェント集団の共同プラン生成における通信構造の相互進化
- E-012 ニュース検索のための格構造を用いたユーザの興味表現と分類手法(自然言語・音声・音楽,一般論文)
- 5H-4 ニュースからのトピック構造の抽出法とその対話的ニュース提供への適用(自然言語処理,一般セッション,人工知能と認知科学)
- E-026 個人適応的音声ニュース提供システムにおける関連ニュース提供戦略(自然言語・音声・音楽,一般論文)
- E-025 スマートホームにおける音声ニュース提供システムアーキテクチャの構築(自然言語・音声・音楽,一般論文)
- 2D-2 ユーザの興味プロファイルに基づく音声ニュースシステムにおける複数関連ニュース提供の対話的制御(音声対話・翻訳,一般セッション,人工知能と認知科学)
- 2D-1 ウェブニュース提供のための自己組織化関係ネットワークと格重み付き単語頻度ベクトルを用いたユーザの興味構造表現(音声対話・翻訳,一般セッション,人工知能と認知科学)
- E-065 個人適応的音声ニュース提供システムにおける対話戦略(E分野:自然言語・音声・音楽)
- E-064 ウェブニュース提供のためのベイジアンネットと格フレームを用いたユーザの興味構造表現(E分野:自然言語・音声・音楽)
- 多目的GAを用いたロボットの行動決定ネットワークの進化的獲得
- 3U-9 高齢者支援に向けた音声対話による日課管理システム(音声言語情報処理,学生セッション,人工知能と認知科学)
- Webページからのユーザの興味の遺伝的アルゴリズムに基づく抽出
- エージェント組織の分散信念管理の適応的統合 : 都市高速道路交通管制テストベッドによる実験
- エージェント組織の分散信念管理構造の動的自己編成
- 江崎伴雄、金子章弘著, 『マルチメディアとは何か』, 生産性出版 1993
- エージェント組織の協調仮設推論に基づく適応的問題解決
- エージェント間の統合権の分配に基づく組織型問題解決
- 因果ビュー選択に基づく仮説時間推論
- F-024 レーザレンジファインダを搭載した移動ロボットのパーティクルフィルタに基づく人物位置推定(複雑系及び一般,F分野:人工知能・ゲーム)
- SLAM空間でのレーザ距離センサーと全方位カメラによる人検出の統合