単調ルールによる多変量停止問題

概要

論文の詳細を見る
p変量確率変数X_n=(X^1_n、・・・、X^p_n)、n≧1がp人の集団(各人をプレイヤーとよぶ)によって次々に観測され、集団全体の決定のみがこの観測過程を停止できるとする。もしt期で停止すると、プレイヤーi(i=1、・・・、P)はY^i_t=X^i_t-tc^iの利得を受けとる。ただし、C=(c^1、・・・、c^p)は、1期間当りの観測費用である。各プレイヤーは停止時における自分の期待利得を最大にしたいと思っている。プレイヤーiがX_nの実現値を観測したとき、n期での過程の停止宣言をd^i_n=1、継続宣言をd^i_n=0で表わす。この系列がd^i=(d^i_1、d^i_2、・・・)をプレイヤーiの個人停止戦略とよび、行列d=(d^1、d^2、・・・、d^p)^Tを停止戦略とよぶ。このとき、各プレイヤーの意見を集約する集団の決定ルールが必要になる。我々は決定ルールを表わすために、{0、1}上のp変数論理関数{0、1}^p→{0、1}を使う。論理関数が単でƒ(1、・・・、1)=1であるとき、単調ルールとよぶ。このルールはKadaneが陪審員の選択問題で導入したWinning classと本質的に同じものである。本論文は集団の意志決定ルールとして単調ルールを用い、多人数停止問題を非協力ゲームとして定式化した。さらにNashの概念による均衡停止戦略*dを定義し、その存在性の明示と解析を行なった。これは駆出のMulti-Variate Stopping Problem with an Majority Rule の拡張である。有限期間(N<∞)では、漸化式で定まるベクトル列{V_n=(v^1_n、・・・、v^p_n)}に対して、プレイヤーi(i=1、・・・、P)がX^i_n≧v^i_<N-n>なるnで停止宣言することが均衡停止戦略になる。また均衡期待利得はv^i_Nである。例として不平等ルールでの秘書問題を扱った。無限期問(N=・∞)については、連立方程式の解*V=(*v^1、・・・、*v^p)によって同様な均衡停止戦略が求められる。特にC=0で、X_n=(X^1_n、・・・、X^p_n)が要素についてもi。i。d。の場合に、各プレイヤーの単調ルールƒに付随した集団に対する"パワー"を表わすρを定義し、これと均衡期待利得*Vとの比較を行なった。
社団法人日本オペレーションズ・リサーチ学会の論文

単調ルールによる多変量停止問題

スポンサーリンク

概要

著者

関連論文

スポンサーリンク