協調行動学習における非定常性の重要性
スポンサーリンク
概要
- 論文の詳細を見る
マルチエージェント系における協調行動の発現機構の理解は重要である.その発現は主に進化ダイナミクスの文脈で説明がされてきたが,よりタイムスパンの短い個人の経験によっても協調行動が発現することが知られている.強化学習などの個体レベルの学習による協調行動の発現に関する考察は十分でない.本研究では,最も簡単なマルチエージェント系である囚人のジレンマ課題を用いて,この協調行動の強化学習による発現では,環境の非定常性を取り扱うことが重要であることを論ずる.ここで,環境の非定常性は,相手の行動方策が自分の行動に依存するとことに起因する.環境の定常性を仮定した強化学習法によれば協調行動が安定な解とならない一方で,内部状態をもつ方策に対する方策勾配型強化学習法によれば協調行動の学習が可能になることを示す.
- 2013-01-17
著者
-
前田 新一
京都大学大学院情報学研究科システム科学専攻
-
石井 信
京都大学工学部
-
石井 優
大阪大学大学院 医学系研究科 分子・細胞薬理学講座
-
前田 新一
京都大学工学部電気電子工学科
-
田和 明洋
京都大学工学部電気電子工学科
関連論文
- 複層マルコフ確率場を事前分布とする超解像法におけるハイパパラメータ推定(バイオサイバネティックス,ニューロコンピューティング)
- Generalization of TD-learning from a semiparametric statistical viewpoint (情報論的学習理論と機械学習)
- 遮蔽物を含む画像からの超解像
- 4.不確実性を手なずけるベイズ統計推測による画像超解像(ビジョンコンピューティングにおける確率的情報処理の展開)
- 平均場近似を用いたHelmholtz Machineの学習
- 混合事前分布を用いたベイズX線CT (ニューロコンピューティング)
- オンライン適応自然勾配法による囲碁の盤面評価の学習 (ニューロコンピューティング)
- ADS-1-3 ディリクレ過程混合ガウス分布による画像拡大フィルタの学習(ADS-1.信号処理のための機械学習,シンポジウムセッション)
- セミパラメトリック統計学に基づく価値関数推定
- 同時発音の相関を考慮した確率モデルによる音楽の和声推定
- カラー画像拡大フィルタの疎ベイズ学習
- ADS-1-3 ディリクレ過程混合ガウス分布による画像拡大フィルタの学習(ADS-1. 信号処理のための機械学習,シンポジウムセッション)
- ダイナミクスを考慮したソースフィルタモデルの推定(音響信号処理)
- ベイズ超解像と階層モデリング
- 遷移する遮蔽下でのベイズ超解像
- 1分子蛍光イメージングに対する尤度比検定を用いたアプローチ(機械学習,一般)
- エピソードタスクにおける方策オフ型LSTD(λ)法とその収束性(機械学習によるバイオデータマインニング,一般)
- 線スペクトル対を用いた楽器分類
- 隠れマルコフ/セミマルコフモデルに基づき原信号を動的に切り替える非定常独立成分分析
- スムースギャップ事前分布をもちいた超解像
- Bayesian noisy ICA for source switching environments
- 価値関数の分解による高速な強化学習法
- 非線形ノイズ付き独立成分分析
- 学習によるproduct codeの設計(情報理論)
- 脳における予測と推定の仕組み (特集《神経情報処理》最前線--情報科学と神経科学の融合)
- 医用X線CTのためのベイズモデルの提案 (医用画像)
- 抗RNP抗体が陽性で間質性肺炎を合併した乾癬性関節炎の一例
- 生体イメージングによる骨代謝機能の解明 (特集 ロコモティブシンドローム(運動器症候群)--生物学的アプローチによる予防と治療)
- 277 インターフェロンによる肝炎の加療終了後に気管支喘息とアトピー性皮膚炎を発症した一例
- オンライン適応自然勾配法による囲碁の盤面評価の学習
- セミパラメトリック統計学の観点からのTD学習の一般化(一般講演(物理現象と学習),機械学習とその応用)
- MS11-6 骨髄線維症を認めた混合性結合組織病の一症例(MS11 自己免疫疾患・リウマチ性疾患・免疫不全症,ミニシンポジウム11,第21回日本アレルギー学会春季臨床大会)
- 混合事前分布を用いたべイズX線CT
- 好酸球増多を伴いIL-5, IL-6の異常産生を認めた全身性Castleman病の1例
- 医用X線CTのためのベイズモデルの提案
- 蛍光イメージングによる骨解析 (特集 骨を壊して骨を作る--細胞レベルの制御から3Dデザインへ)
- システムバイオロジー
- Kチャネルと受容体--多様な生理的制御メカニズムにおける新知見 (特集 不整脈研究の新しい潮流) -- (不整脈の基礎に関する新展開)
- G蛋白質制御カリウムチャネルの活性調節メカニズム (特集 一価チャンネル)
- 方法論にこだわりをもって : ドイツ体験談から
- 大腸癌の分子生物学 生体イメージングによる癌の可視化
- ECOC復号法に基づく階層的多値判別法
- Bayesian noisy ICA for source switching environments
- 光学系における二点分解能解析のための統計的手法
- 破骨細胞の遊走・位置決めの機構の解明とこれをターゲットとした新しい骨粗鬆症治療薬の開発 (第16回(平成20年度) 財団法人骨粗鬆症財団 研究助成に関する成果報告)
- イオンチャネルの機能と位置の制御 (〔2002年〕6月第5土曜特集 イオンチャネルの最前線) -- (イオンチャネルの一般的特性)
- スパイク信号列に基づく神経細胞間ネットワーク構造推定:group LASSOによるアプローチ
- SF-035-4 二光子励起顕微鏡を用いたがん細胞の生体イメージング(SF-035 サージカルフォーラム(35)大腸:その他-1,第111回日本外科学会定期学術集会)
- 視覚的注意効能のマップ表現構築に向けて(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- テンソル因子化を用いたニューロンイメージの修復(一般講演(バイオ情報学),機械学習によるバイオデータマインニング,一般)
- 確率システムの立場からの画像情報処理技術(システム制御情報における確率論の先端応用)
- S20-3 骨組織の生体多光子励起イメージングによる破骨細胞動態の解析(S20 New advances in allergy and immune regulation by imaging analysis,シンポジウム,第61回日本アレルギー学会秋季学術大会)
- 2. 生体イメージングによる癌細胞観察(癌研究における最近の進歩)
- 螢光イメージングを用いた免疫細胞と破骨細胞の挙動 (第1土曜特集 骨免疫学 : 研究最前線) -- (骨免疫とin vivoイメージング)
- グラフカットを用いた生体骨組織における血管透過性の評価手法
- SF-028-1 細胞周期の可視化によるインターフェロン/5-FU併用療法の作用機序解明を目指した基礎的検討(SF-028 サージカルフォーラム(28)肝 基礎-4,第112回日本外科学会定期学術集会)
- 骨組織のライブイメージングによる破骨前駆細胞の動態解析 (特集 分子イメージングの最先端)
- 混合正規分布モデルを用いた経時観測蛍光画像からの細胞核の検出と追跡手法
- グラフカットを用いた骨髄腔画像の領域分割
- 協調行動学習における非定常性の重要性
- 協調行動学習における非定常性の重要性
- ベイズ推定による顕微鏡画像の深さ推定
- ベイズ推定による顕微鏡画像の深さ推定
- PS-348-2 インターフェロン(IFN)レセプターの遺伝子導入及び細胞周期の可視化によるIFN/5-FU併用療法の機序解明に関する検討(PS ポスターセッション,第113回日本外科学会定期学術集会)
- YT-5-3(YRA) 消化器癌の生物学的動態を制御するエピジェネティクス(YT Young Researcher Award & Traveler's Grant,第113回日本外科学会定期学術集会)
- 経路積分強化学習による猫ひねり運動の制御
- VF-022-2 生体イメージングによる細胞周期と浸潤関連分子の同定と臨床応用(VF ビデオフォーラム,第113回日本外科学会定期学術集会)
- 経路積分強化学習による猫ひねり運動の制御