マルチエージェントシステムにおける行動制御 : PSOにおける重み係数の強化学習(情報ネットワーク)
スポンサーリンク
概要
- 論文の詳細を見る
マルチエージェント学習には方策こう配法を用いた自律分散型の強化学習が有効である.この応用例として,本論文ではPSOによる連続関数の最小値探索問題への適用を試みた.PSOでは各粒子の速度を決定する運動方程式の中に,それまでに発見された自己ベストとグループベストの地点への引力の強さを表す重み係数が含まれている.通常,これらの重み係数はシステム作成者が全粒子に対して一律の固定値を与える.本研究では,PSOの探索モデルをベースに方策こう配法が適用可能な新たな探索モデルを提案する.本探索モデルにおいては,重み係数は一律である必要はなく,粒子ごとに異なる値をとることが可能である.これは粒子に個性をもたせることに相当する.また,引力だけではなく斥力を考慮することも可能となる.学習により得られた重み係数の評価実験として,7種類のテスト関数を用いたベンチマークテストを行った.その結果から本探索モデルにおける学習能力の有効性を確認することができた.
- 2011-10-01
著者
関連論文
- 非マルコフ決定過程における強化学習 : 特徴的適正度の統計的性質(モデル/理論,ソフトウェアエージェントとその応用論文)
- 非マルコフ決定過程における方策勾配法の一考察 : カーリングの事例
- Ridgelet-Hough変換を用いた足跡画像符号化に関する考察 : 符号化方法の提案および従来法との特徴比較(プロセッサ, DSP, 画像処理技術及び一般)
- Ridgelet-Hough変換を用いた足跡画像符号化に関する考察--符号化方法の提案および従来法との特徴比較
- 1D-6 方策勾配法を用いたサッカーエージェントの学習 : パス・レシーブ(ゲーム・ロボカップ,一般セッション,人工知能と認知科学)
- 2P1-S-022 方策勾配法を用いたフリーキック時の行動学習(ロボカップ2,生活を支援するロボメカ技術のメガインテグレーション)
- Ridgelet-Hough変換を用いた足跡画像符号化に関する考察 : 符号化方法の提案および従来法との特徴比較(プロセッサ, DSP, 画像処理技術及び一般)
- Ridgelet-Hough変換を用いた足跡画像符号化に関する考察 : 符号化方法の提案および従来法との特徴比較(プロセッサ, DSP, 画像処理技術及び一般)
- 1A1-N-028 方策勾配法を用いた運動方程式中のパラメータ学習 : 2ストーン系のカーリングゲーム(マルチエージェントロボットシステム,生活を支援するロボメカ技術のメガインテグレーション)
- Ridgelet-Hough変換を用いた足跡画像符号化に関する考察 : 符号化方法の提案および従来法との特徴比較(プロセッサ, DSP, 画像処理技術及び一般)
- 離散最適化問題としての自律移動型ロボットの走行誘導
- 方策こう配法を用いた行動学習 : 環境のダイナミクスと行動知識との分離
- マルチエージェント系における行動学習への方策こう配法の適用 : 追跡問題(分散協調とエージェント)
- マルチエージェント系における方策勾配法 : 追跡問題
- マルチエージェント系における方策勾配法 : 追跡問題
- 強化学習を用いた自律移動型ロボットの行動計画法の提案
- 方策勾配法における目的関数の合成と追跡問題への適用 (テーマ:知能・適応と社会,ネットワーク) -- (マルチエージェントシステム)
- F_004 方策こう配法を用いた行動学習 : 方策中での状態遷移確率の表現(F分野:人工知能・ゲーム)
- 入力パターンベクトルの分布に基づくクラス分類問題の分割法
- 方策勾配法を用いた自律移動型ロボットの行動計画法
- ノードコストを考慮した最短経路探索法とデータ構造
- ノードコストを考慮した最短経路探索法とデータ構造
- 離散最適化問題としての自律移動型ロボットの経路計画
- 状態の複数の抽象化による方策こう配法の高速化--トンネル状の障害物が存在する追跡問題への適用
- 状態の複数の抽象化による方策こう配法の高速化 : トンネル状の障害物が存在する追跡問題への適用(情報ネットワーク)
- 動径基底関数を用いたクラス分類問題の分割法 : モジュール型ニューラルネットワークへの適用
- マルチエージェントシステムにおける行動制御 : PSOにおける重み係数の強化学習(情報ネットワーク)
- ファジィ制御ルールにより表現された方策を持つ方策勾配法の導出
- 方策勾配法による局面評価関数とシミュレーション方策の学習
- ニューラルネットワークによる数独の難易度判定手法の提案(「コンテキストを意識した知識の利用」及び一般)
- D-8-4 ファジィ制御ルールにより表現された方策を持つ方策勾配法の適用事例:RoboCup小型リーグ(D-8.人工知能と知識処理)
- D-8-3 RoboCupサッカーシミュレーションリーグ2Dにおけるリターンパス:chain_action上の状態予測(D-8.人工知能と知識処理)