強化学習エージェントによる協調行動とコミュニケーションの創発(シンポジウム特集)
スポンサーリンク
概要
- 論文の詳細を見る
コミュニケーションの原型は,個体が環境や他の個体との相互作用において,報酬の獲得や適応度の向上に寄与する形で発現したと考えられる.本研究では,報酬最大化を目的とする強化学習エージェントが,余剰な行動と感覚の自由度をコミュニケーショのために使うことを学習できるための条件を,2個体が互いに相手の縄張りに入ると報酬を得るが衝突すると罰を受けるというゲームにより検証した.このゲームでは,コミュニケーションと協調行動のそれぞれが必須ではないが,発光行動を使えるエージェント間では,互いにその光を信号として利用することで衝突を避け,報酬を獲得し合う協調行動の創発が観察された.信号の表現の仕方には多様性が見られ,また作業記憶を持つエージェント間では,信号を送る側とそれに従う側という役割分化も見られた.これは,コミュニケーションと協調行動が必須ではない状況において,意味と信号の任意の対応付けによるコミュニケーションが,コミュニケーションの達成そのものを目的としなくても一般的な行動学習の枠組みにより創発しうることを示す初めての知見である.
- 2007-12-15
著者
-
銅谷 賢治
沖縄科学技術研究基盤整備機構
-
佐藤 尚
北陸先端科学技術大学院大学知識科学研究科:(現)独立行政法人科学技術振興機構沖縄大学院大学先行的研究事業
-
内部 英治
独立行政法人沖縄科学技術研究基盤整備機構沖縄大学院大学先行的研究事業
-
銅谷 賢治
独立行政法人沖縄科学技術研究基盤整備機構沖縄大学院大学先行的研究事業
-
内部 英治
沖縄科学技術研究基盤整備機構
-
佐藤 尚
独立行政法人沖縄科学技術研究基盤整備機構大学院大学先行研究プロジェクト
-
佐藤 尚
独立行政法人沖縄科学技術研究基盤整備機構大学院大学先行研究プロジェクト:(現)独立行政法人国立高等専門学校機構沖縄工業高等専門学校メディア情報工学科
関連論文
- モデルフリーとモデルベース戦略の課題依存的な選択(BCI/BMIとその周辺)
- 感覚情報の能動的低次元化による強化学習(機械学習によるバイオデータマインニング,一般)
- 自然方策こう配法 : 平均報酬の自然こう配に基づく方策探索(人工知能,認知科学)
- 情動・行動の脳内機構に関するfMRI研究 : うつ病の病態解明に向けて(情動・行動の脳内機序に関する研究の進展)(2004年/第45回日本心身医学総会/北九州)
- 空間的情報を含むマルコフ決定課題を用いた長期と短期の報酬予測に伴う脳活動のfMRI測定
- 短期と長期の報酬予測に伴う脳活動のfMRI測定
- センサフィードバックを用いたCPG制御における環境ダイナミクスと観測の不確定性の影響
- 線条体における入力タイミングに依存するカルシウム応答モデル
- 自然 TD 学習 : 割引報酬における TD 誤差を利用する自然方策勾配に基づいた強化学習法
- 生命科学と制御 : 《第13回》座談会「制御と生命科学」
- 強化学習エージェントによる協調行動とコミュニケーションの創発(シンポジウム特集)
- 社会構造のダイナミクスに対する内部ダイナミクスとミクロマクロ・ループの効果
- マルチエージェント・システムによるリーダーおよび群れの創発
- マルチエージェント・システムによるリーダーおよび群れの創発
- 線条体シナプス可塑性の分子機構のシミュレーション研究(セッション3:『バイオモデリング,シミュレーション』)
- 生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマイニング)
- 生化学反応系のためのベイズ的システム同定法(機械学習によるバイオデータマインニング)
- 生命科学と制御 : 《第12回》脳の目的関数とは何か
- Max-Min Actor-Criticによる複数報酬課題の強化学習(人工知能,認知科学)
- 行動学習データの強化学習モデルによる解析とその応用
- 行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
- 行動学習データの強化学習モデルによる解析とその応用(コミュニケーション支援及び一般)
- 近傍成分分析による行動指向的状態表現の獲得
- 複数の報酬によって与えられる拘束のもとでの強化学習(「機械学習によるバイオデータマインニング」及び「一般」)
- 複数の価値関数を用いた多目的強化学習
- 2A1-N-044 構造の異なる複数の学習器の相互作用を利用した強化学習システム(認知ロボティクス1,生活を支援するロボメカ技術のメガインテグレーション)
- 複数報酬のもとでの階層強化学習
- 重点サンプリングを用いた複数強化学習器の同時学習
- サイバーローデントプロジェクト
- 線形ベルマン方程式に基づくロボット制御 : システム同定と指数価値関数近似
- マルチゲームにおける学習エージェントに内在化したルールによるマクロダイナミクスの安定化
- 衝突回避ゲームにおけるエージェントの行動学習に基づくコミュニケーションの創発
- 運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御
- 運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御 (ニューロコンピューティング)
- 運動-視覚ダイナミクス学習と線形ベルマン方程式によるロボット制御(一般,機械学習によるバイオデータマインニング,一般)