未知パラメータを含むセミ・マルコフ決定過程における平均最適な適応政策
スポンサーリンク
概要
- 論文の詳細を見る
未知パラメータを含むセミ・マルコフ決定過程において、平均コスト基準のもとでの最適な適応政策の構成の問題が取り扱われている。最初にパラメータの値が既知の場合、最適あるいはε-最適な定常政策が存在するための十分条件が与えられている。次に、パラメータの値が未知の場合が取り扱われている。この場合では、各時刻でのactionの選択は、その時刻までのsystemの観測された履歴による未知パラメータの推定値にもとづいてなされる。本論文は、推定量として、Mandl(1974)のminimum contrast estimatorをmodificationしたmodified η-minimum contrast estimatorが提案されている。そして、Fox and Rolph(1973)のforced choice cyclesの一つのversionを与えて、最適な適応政策が構成されている。応用として、故障確率分布が未知のage replacementの問題が議論されている。
- 社団法人日本オペレーションズ・リサーチ学会の論文
著者
関連論文
- 1-B-9 「不確実性理論の経営科学への応用」研究部会終了報告(意思決定)
- Fuzzy Metric Clustering and Dynamic Programming
- A Dynamic Decision Making Model with an Objective Function based on Fuzzy Preferences
- A Discrete-Time Consumption and Wealth Model with Uncertainty
- MDPにおける効用関数とモーメント最適性(確率モデル(1))
- 『動的計画法』研究部会終了報告(ペーパーフェア)
- 動的計画法研究部会中間報告(ペーパーフェア)
- 「動的計画法」研究部会・中間報告(部会報告)
- 動的計画法研究部会終了報告(数理計画)
- 動的計画法研究部会中間報告(その1)(ペーパーフェア)
- 千葉県の高等学校における確率・統計の教育に関する調査
- 単調ルールによる多変量停止問題
- 多数決ルールによる多変量停止問題
- 多人数による最適停止問題(ストッピング・ルール)
- 一般状態の条件付きマルコフ決定過程について(確率モデル(1))
- 2-F-2 Multichain Markov decision processes and structured pattern matrix algorithm
- 平均コスト確率ゲームのミニマックス戦略と在庫モデルへの応用
- ファジィ決定課程 : 定式化と最適性
- 未知パラメータを含むセミ・マルコフ決定過程における平均最適な適応政策
- セミ・マルコフ決定過程と取替モデルへの応用