単調ルールによる多変量停止問題
スポンサーリンク
概要
- 論文の詳細を見る
p変量確率変数X_n=(X^1_n、・・・、X^p_n)、n≧1がp人の集団(各人をプレイヤーとよぶ)によって次々に観測され、集団全体の決定のみがこの観測過程を停止できるとする。もしt期で停止すると、プレイヤーi(i=1、・・・、P)はY^i_t=X^i_t-tc^iの利得を受けとる。ただし、C=(c^1、・・・、c^p)は、1期間当りの観測費用である 。各プレイヤーは停止時における自分の期待利得を最大にしたいと思っている。プレイヤーiがX_nの実現値を観測したとき、n期での過程の停止宣言をd^i_n=1、継続宣言をd^i_n=0で表わす。この系列がd^i=(d^i_1、d^i_2、・・・)をプレイヤーiの個人停止戦略とよび、行列d=(d^1、d^2、・・・、d^p)^Tを停止戦略とよぶ。このとき、各プレイヤーの意見を集約する集団の決定ルールが必要になる。我々は決定ルールを表わすために、{0、1}上のp変数論理関数{0、1}^p→{0、1}を使う。論理関数が単でƒ(1、・・・、1)=1であるとき、単調ルールとよぶ。このルールはKadaneが陪審員の選択問題で導入したWinning classと本質的に同じものである。本論文は集団の意志決定ルールとして単調ルールを用い、多人数停止問題を非協力ゲームとして定式化した。さらにNashの概念による均衡停止戦略*dを定義し、その存在性の明示と解析を行なった。これは駆出のMulti-Variate Stopping Problem with an Majority Rule の拡張である。有限期間(N<∞)では、漸化式で定まるベクトル列{V_n=(v^1_n、・・・、v^p_n)}に対して、プレイヤーi(i=1、・・・、P)がX^i_n≧v^i_<N-n>なるnで停止宣言することが均衡停止戦略になる。また均衡期待利得はv^i_Nである。例として不平等ルールでの秘書問題を扱った。無限期問(N=・∞)については、連立方程式の解*V=(*v^1、・・・、*v^p)によって同様な均衡停止戦略が求められる。特にC=0で、X_n=(X^1_n、・・・、X^p_n)が要素についてもi。i。d。の場合に、各プレイヤーの単調ルールƒに付随した集団に対する"パワー"を表わすρを定義し、これと均衡期待利得*Vとの比較を行なった。
- 社団法人日本オペレーションズ・リサーチ学会の論文
著者
関連論文
- A structured pattern matrix algorithm for multichain Markov decision processes(Mathematics of Optimization : Methods and Practical Solutions)
- 1-B-9 「不確実性理論の経営科学への応用」研究部会終了報告(意思決定)
- Fuzzy Perceptive Values for MDPs with Discounting (Mathematical Theory and Applications of Uncertainty Sciences and Decision Making)
- Fuzzy perceptive values for stopping models and MDPs
- Dynamic Decision Making with Fuzzy Preferences as a Utility Function (不確実で動的なシステムへの最適化理論とその展開 短期共同研究報告集)
- Fuzzy Metric Clustering and Dynamic Programming
- A Dynamic Decision Making Model with an Objective Function based on Fuzzy Preferences
- A Discrete-Time Consumption and Wealth Model with Uncertainty
- A Fuzzy Stopping Problem with the Concept of Perception (Mathematics of Decision-making under uncertainty)
- ファジィ確率変数の最適化問題とファイナンスへの応用 (動的システム最適化理論の展開とその応用)
- 区間値およびファジー値をもつ行列ゲーム (動的システム最適化理論の展開とその応用)
- American Options with Uncertainty of the Stock Prices : The Discrete-Time Model (Mathematical Decision Making under Uncertainty)
- A note on interval games and their saddle points (Mathematical Optimization Theory and its Algorithm)
- Markov decision processes with fuzzy rewards (Perspective and problem for Dynamic Programming with uncertainty)
- On a Fuzzy Extension of Stopping Times (Perspective and problem for Dynamic Programming with uncertainty)
- Fuzzy Stopping in Continuous-Time Systems with Randomness and Fuzziness (Mathematical Modeling and Optimization under Uncertainty)
- A monotone convergence theorem for a sequence of convex fuzzy sets on $\mathbb{R}^n$ (Mathematical Science of Optimization)
- A fuzzy treatment of uncertain Markov decision processes : Average case (Mathematical Decision Making under uncertainty and ambiguity)
- A fuzzy treatment of uncertain Markov decision processes (Continuous and Discrete Mathematics for Optimization)
- Sequences of Fuzzy Sets on $\mathbb{R}^n$ (Decision Theory in Mathematical Modelling)
- Some Pseudo-Order of Fuzzy Sets on $\mathbb{R}^n$
- The Optimal Stopping Problem for Fuzzy Random Sequences (Decision Theory and Its Related Fields)
- A POTENTIAL OF FUZZY RELATIONS WITH A LINEAR STRUCTURE : THE UNBOUNDED CASE(MATHEMATICAL OPTIMIZATION AND ITS APPLICATIONS)
- A POTENTIAL OF FUZZY RELATIONS WITH A LINEAR STRUCTURE : THE CONTRACTIVE CASE(MATHEMATICAL OPTIMIZATION AND ITS APPLICATIONS)
- ORDERING OF CONVEX FUZZY SETS : A BRIEF SURVEY AND NEW RESULTS
- MDPにおける効用関数とモーメント最適性(確率モデル(1))
- 『動的計画法』研究部会終了報告(ペーパーフェア)
- 動的計画法研究部会中間報告(ペーパーフェア)
- 「動的計画法」研究部会・中間報告(部会報告)
- 動的計画法研究部会終了報告(数理計画)
- 動的計画法研究部会中間報告(その1)(ペーパーフェア)
- Constrained Markov Decision Processes With Compact State And Action Sspaces : The Average Case (Dynamic Decision Systems under Uncertain Environments)
- Fuzzy Decision Processes with an Average Reward Criterion(Discrete and Continuous Structures in Optimization)
- Dynamic Fuzzy Systems with Time Average Rewards(Optimization Theory and its Applications in Mathematical Systems)
- Markov-Type Fuzzy Decision Processes with a Discounted Reward on a Closed Interval(Mathematical Structure of Optimization Theory)
- Game Theoretic Analysis for an Optimal Stopping Problem in Some Class of Distribution Functions
- 多人数資産処分問題のgame解について(決定理論とその周辺)
- 千葉県の高等学校における確率・統計の教育に関する調査
- 単調ルールによる多変量停止問題
- 多数決ルールによる多変量停止問題
- Multi-Variate Stopping Problem with a Monotone Logical Rule (決定過程論とその周辺)
- 多人数による最適停止問題(ストッピング・ルール)
- 二種類の倉庫をもつ陳腐化する在庫問題
- 一般状態の条件付きマルコフ決定過程について(確率モデル(1))
- 2-F-2 Multichain Markov decision processes and structured pattern matrix algorithm
- 平均コスト確率ゲームのミニマックス戦略と在庫モデルへの応用
- ファジィ決定課程 : 定式化と最適性
- 未知パラメータを含むセミ・マルコフ決定過程における平均最適な適応政策
- セミ・マルコフ決定過程と取替モデルへの応用