逐次割当て問題に関する多段ゲーム
スポンサーリンク
概要
- 論文の詳細を見る
逐次に出現する仕事に異なる能力を持ったn人の人間を割り当てる問題を考える。n人の人間の能力はO≦P_i≦1(i=1、 ‥‥、 n)により評価され、逐次に出現する仕事の価値は同一独立な確率変数の実現値としてあらわす。能力"P"の人間が価値"x"の仕事に就いたときのrewardをPxと考えてplayer Iはそのrewardの総和の期待値を最大にする様に振る舞い、一方、その仕事に要する費用は得られるrewardに正比例すると考え、Player IIは総費用の期待値、即ちrewardの総和の期待値を最小にする様に振る舞う。このときplayer Iに対してはγ回、player IIに対してはs回それぞれ相手の意志に拘らず一期間見送ることが出来ると考える。このときPlayer IIは見送るか否かをのみ決定することが出来る。この二人零和ゲームを動的計画法により定式化しゲームの値及び両playerの最適戦略を求める。この逐次ゲームはDerman、 Lieberman and Ross〔4〕で扱われている逐次割当て問題のゲーム論的拡張と考えられる。またP_i=1(i=1、‥‥、 n)の場合はSakaguchi〔8〕で扱われているものであり、その中で提起された問題、即ち"γとsのN=γ+s+nに対する比率を一定とするときN→∞としたときのゲームの値と最適戦略はどの様になるか"という事に対する解を与える。
- 社団法人日本オペレーションズ・リサーチ学会の論文