部分観測可能マルコフ決定過程を用いた私的観測付き繰返しゲームにおける均衡分析プログラム
スポンサーリンク
概要
- 論文の詳細を見る
本論文では不完全私的観測付き繰返しゲームの均衡を分析するプログラムを提案する.不完全私的観測付き繰返しゲームは,プレイヤが相手の行動についてノイズを含むシグナルを観測し,そのシグナルを他のプレイヤは観測できないという特徴を持つ.こうしたゲームは人工知能や経済の分野において様々な適用領域を持つため,大きく注目されている.しかし,このゲームにおける均衡を求めるには,非常に複雑な統計的推論が必要になるため,従来難しい未解決問題として知られていた.近年,均衡における振舞いを有限状態オートマトン(finite state automaton,FSA)で記述し,部分観測可能マルコフ決定過程(partially observable Markov decision process,POMDP)の理論を用いることで,あるFSAが均衡を構成するかどうかを明らかにできることが示された.しかし,その具体的な実装方法や実際の問題へ適用するためのプログラムは提供されていない.そこで本論文ではまず,標準的なPOMDPソルバのラッパとなるプログラムを開発する.このプログラムでは私的観測付き繰返しゲームの記述とFSAを入力として,そのFSAが対称的均衡を構成するかどうかを自動的に確認できる.さらに,このプログラムを繰返し囚人のジレンマに適用し,k-期相互処罰(k-MP)と呼ぶ新しいFSAのクラスを発見した.k-MPにおけるプレイヤは,初めに協力し相手の裏切りを観測するとそれ以降自分も裏切るが,続けてk回裏切りを観測すると元に戻り協力する.このプログラムを用いて状態数3以下のFSAを全探索した結果,繰返しゲームにおける観測構造パラメータのいくらかの範囲で,2-MPが他の純粋戦略均衡より優れており,従来よく知られている均衡である無限期罰則のトリガ戦略(grim-trigger)よりも効率的,つまり高い平均利得を実現することが分かった.
- 2012-11-15
著者
-
横尾 真
九州大学大学院システム情報科学研究院
-
岩崎 敦
九州大学大学院システム情報科学研究院
-
横尾 真
Nttコシュニケーション科学基礎研究所
-
横尾 真
九州大学大学院システム情報科学府
-
横尾 真
九大 大学院システム情報科学研究院
-
岩崎 敦
九州大学大学院システム情報科学府
-
神取 道宏
東京大学大学院経済学研究科
-
小原 一郎
Ucla経済学部
-
横尾 真
九州大学大学院 システム情報科学府
-
岩崎 敦
九州大学大学院 システム情報科学府
関連論文
- *-SAT:SATの拡張(最近のSAT技術の発展)
- セキュアキーワード広告オークションプロトコルの提案(メカニズムデザイン,ソフトウェアエージェントとその応用論文)
- 匿名の開環境下における協力ゲームについて(参加型シミュレーション,マルチエージェントの理論と応用)
- 1-D-6 特性関数の簡略記述法を用いた提携構造の形成(離散・組合せ最適化(2))
- 第18回 AAMAS-2010("I"見聞録)
- 架空名義操作不可能な組合せオークションの割当規則の特性(メカニズムデザイン,ソフトウェアエージェントとその応用論文)
- 摂動完全均衡に基づくマルチエージェント部分観測可能マルコフ決定過程のプラン構築(モデル/理論,ソフトウェアエージェントとその応用論文)
- キーワード広告におけるゲーム理論・オークション理論(Web技術,ビジネスモデルとAI)
- Take-it-or-Leave-it方式の再配分オークションメカニズムの提案(メカニズムデザイン,ソフトウェアエージェントとその応用論文)
- 開環境での協力ゲームにおける公平な配分を実現する解概念の提案(PhDセッション)
- 分散制約最適化問題へのソフトアーク整合の適用
- 2-E-9 匿名の開環境における協力ゲームについて(ゲーム理論(2))
- 開放型プロダクションシステムにおけるデータ依存関係の管理
- 適切な掲載数を決定するキーワード広告オークションプロトコルの提案(エージェント)
- 組合せオークションのための架空名義操作不可能なメカニズムの特性(メカニズムデザインと電子市場(1))
- クラーク税を用いた戦略的操作不可能な費用分担メカニズムの提案(メカニズムデザインと電子市場(1))
- Take-It-or-Leave-Itに基づく再配分オークションメカニズムの提案(メカニズムデザインと電子市場(1))
- セキュアキーワード広告オークションプロトコルの提案(メカニズムデザインと電子市場(2))
- 自動メカニズムデザインによる架空名義入札に頑健な組合せオークションメカニズムの構築(メカニズムデザインと電子市場(2))
- 非準線形効用を対象とした架空名義入札に頑健な複数ユニットオークションプロトコルの提案(「エージェント基礎」及び一般)
- 適切な掲載数を決定するキーワード広告オークションの提案(オークションとメカニズムデザイン)
- 任意の評価値に対する架空名義入札に頑健なダブルオークションプロトコル
- 平均的に予算非負なダブルオークションプロトコル
- 架空名義入札に頑健な組合せオークションプロトコルにおけるバンドルの設計方法
- AAMAS 2002(会議報告)
- 架空名義入札に頑健な複数ユニットオークションプロトコル
- 逐次型オークションの入札戦略決定手法 : 準線形効用と予算制約の導入
- 架空名義入札に頑健な組合せオークションプロトコル
- 特集「エージェント」の編集にあたって
- インターネットオークションの理論
- 架空名義入札に頑健なダブルオークションプロトコル
- 2-D-1 数理計画法を用いたメカニズムデザインの自動化 : 架空名義入札に頑健な組合せオークションメカニズムの設計(離散・組合せ最適化(5))
- 再構成可能なハードウェアを用いた充足可能性問題の解法
- 開環境での協力ゲームにおける解の簡略記述法
- 再構成可能なハードウェアを用いた充足可能性問題の解法
- 再構成可能なハードウェアを用いた充足可能性問題の解法
- 再構成可能なハードウェアを用いた充足可能性問題の解法
- 敵対者に対応する協調問題解決:限量記号付き分散制約充足問題
- 分散ラグランジュ緩和プロトコルにおける適応的な価格更新
- JAWSの発展とエージェント分野への寄与(エージェント)
- 予算制約を持つ入札者を対象とした再配分メカニズムの提案
- 難関国際会議に通すためには : 傾向と対策(国際会議に通すための英語論文執筆)
- 「Web技術,ビジネスモデルとAI」特集にあたって
- Eighteenth International Joint Conference on Artificial Intelligence(IJCAI-2003)(会議報告)
- 全米人工知能会議AAAI-94報告
- 8.パネル討論:エージェントの社会的インパクト(社会に向き合うエージェントシステム)
- 会議報告 IJCAI-01
- 特集「エージェント技術とその応用」の編集にあたって(特集・エージェント技術とその応用)
- 多状態コミットメント探索とその評価
- 多状態コミットメント実時間A^*アルゴリズムの性能解析
- ICMAS'95報告
- Greedyな割当手法に基づくStrategy-proofな組合せオークションプロトコルと公開競上げ式プロトコルへの拡張(分散協調とエージェント)
- 多様な興味を持つ専門家と素人が存在する場合の組み合わせオークション
- 専門家と素人が存在する場合の組合せオークション : 専門家が単一財にのみ専門知識をもつ場合(分散協調とエージェント)
- 架空名義入札に頑健な公開競上げ式複数同一財オークションプロトコル
- (1)マルチエージェントシステム(会議報告)
- 座談会 : AIと電子商取引の展望(AIの観点から見た電子商取引の将来像)
- マルチエージェントシステム
- 特集「マルチエージェント」の編集にあたって ( マルチエージェント)
- 分散協調処理
- Forbus, K. D. and de Kleer, J. : Building Problem Solvers, MIT Press (1993).
- 分散制約充足の高速化と通信網回線設定への適用
- 分散制約充足の通信網回線設定への適用
- 分散制約充足による分散協調問題解決の定式化とその解法
- RF-002 架空名義操作不可能な組合せオークションメカニズム : VCGメカニズムの改良(F分野:人工知能・ゲーム,査読付き論文)
- RA-007 架空名義操作不可能な施設配置メカニズムの特徴付け(A分野:モデル・アルゴリズム・プログラミング,査読付き論文)
- 複数同一財権利配分型オークションの安定性 : 被験者実験による検証(市場モデル, ソフトウェアエージェントとその応用論文)
- F-037 自動メカニズムデザインによる架空名義入札に頑健な組合せオークションメカニズムの構築(人工知能・ゲーム,一般論文)
- チーム選択問題のための架空名義操作不可能なオークションメカニズムの提案(オークションとメカニズムデザイン)
- 分散制約推論 : マルチエージェントシステムの基盤技術(論理と推論技術の展開)
- 計算機科学分野におけるオークション研究
- 架空名義操作不可能な施設配置メカニズムの特徴付け
- LF-011 不確実な状況下における協調プラン探索法への通信の導入(人工知能・ゲーム)
- 2.インターネットオークションとメカニズムデザイン(社会に向き合うエージェントシステム)
- 架空名義入札に頑健な組合せオークションプロトコルの提案と評価 : バンドルサイズ優先プロトコル(マルチエージェントの理論,マルチエージェントの理論と応用)
- 分散制約充足問題:特定の制約網に特化した変数順序付けヒューリスティックの提案
- 擬似木に基づく分散制約最適化問題の精度保証付き非厳密解法の提案
- AAAI理事就任にあたって
- 協力ゲームにおける特性関数のエージェントのタイプに基づく簡略表記法(理論,ソフトウェアエージェントとその応用論文)
- モンテカルロゲーム木探索に基づく限量記号付き制約充足問題の実時間解決(理論,ソフトウェアエージェントとその応用論文)
- MC-netsを用いた提携構造形成アルゴリズムの拡張 : 負の利得と外部性の導入(理論,ソフトウェアエージェントとその応用論文)
- 1-I-7 配属人数下限付き研究室配属問題(離散最適化(1))
- 1-I-6 混合整数計画法による自動メカニズムデザイン : 組合せオークションの設計と高速化(離散最適化(1))
- 1-E-1 無閉路ネットワーク上の架空名義操作不可能な施設配置メカニズムの特徴付け(都市・地域・国土)
- チュートリアル 『計算機科学者のためのゲーム理論入門』シリーズ(第2回)非協力ゲーム(発展編)
- 自動メカニズムデザインを利用した組合せオークションのルール抽出アルゴリズムの提案
- 非協力ゲーム(基礎編)
- 『計算機科学者のためのゲーム理論入門』シリーズについて
- 部分観測可能マルコフ決定過程を用いた私的観測付き繰返しゲームにおける均衡分析プログラム
- チュートリアル 『計算機科学者のためのゲーム理論入門』シリーズ(第3回)メカニズムデザイン(基礎編)
- 非協力ゲーム(発展編)
- メカニズムデザイン(基礎編)
- 2-C-11 オークションメカニズムの多項式表現と限量記号消去法を用いたメカニズム設計の自動化(連続最適化(2))
- 1-G-8 双対解を用いたコアおよび弱εコア^+の非空判定アルゴリズム(ゲーム理論(1))
- ゲーム理論・メカニズムデザインに関する研究動向(エージェント)
- Interactive Algorithm for Multi-objective Constraint Optimization
- RA-003 相互処罰による協調 : 私的観測付き無限回繰り返し囚人のジレンマの部分観測マルコフ決定過程による解法(アルゴリズム・コンピュテーション(2),A分野:モデル・アルゴリズム・プログラミング)
- RA-004 多目的制約最適化問題:ユーザとの対話型解法の提案(問題解決手法,A分野:モデル・アルゴリズム・プログラミング)
- A-024 配属人数下限付き研究室配属問題(数理モデル化と問題解決(2),A分野:モデル・アルゴリズム・プログラミング)
- 『計算機科学者のためのゲーム理論入門』シリーズ第4回 : メカニズムデザイン(応用編)