部分観測可能なマルコフ決定過程とアルゴリズム
スポンサーリンク
概要
- 論文の詳細を見る
この論文では、システムの現在の状態を直接に観測することは許されず、システムの内部機構より発生される信号によってシステムの現在の状態に対する部分的なあるいは不完全な情報に基づくマルコフ決定過程について論述する。システムの状態を直接に観測して完全情報を得ることは、一般に高価でありまた物理的困難を伴在う場合が多いから、このような不完全情報の下でのマルコフ決定過程を考察することはより現実的であるし、また在庫管理、機械保全、待ち行列などの経営科学における種々のモデルヘの応用を可能にさせる。ここでは、状態、信号去よび行動が有限個の集合からなり無限期間の最適制御モデルを動的計画法によって公式化し、最適政策と最適費用に対する近似解を逐次近似法によって計算するためのアルゴリズムを提示する。主要な結果は。最適政策に対する近似解として区分的定数な定常政策が存在することと、最適費用に対する近似解として区分的線形な費用関数が存在することである。この結果からアルゴリズムはたかだか線形関数の操作を含むこと、従って線形計画法の範囲内にとどまることが明示される。このモデルでは動的計画法の状態変数が確率ベクトルとなって、その集合はもはや有限でも無限加算個でもなくなり。連続体となる。従来の動的計画法はその状態変数が連続なモデルに対して実行可能な解法として一般に機能しないから、われわれのアルゴリズムは同時に連続変数をもつ動的計画法の解法を与えることになる。更に、定常政策の特別次クラス(有限過度的政策)の概念を導入し、このクラスの政策がどんな=構造とその長所を有しているか論述する。この有限過度的政策の下では、部分観測可能なマルコフ過程から通常の有限状態のマルコフ過程への変換が可能となり、そこでは近似解ではなく正確な最適解を得ることが可能となる。
- 社団法人日本オペレーションズ・リサーチ学会の論文
著者
関連論文
- 1-F-5 買戻し請求権付き他社株転換社債の評価について(金融工学(2))
- 2-C-5 海外商品市場の活用と最適発注政策(在庫管理)
- 1-E-2 配置場所を考慮した陳腐化商品の多品目在庫管理モデル(在庫管理(1))
- 2-A-2 ダブルバリア型エクイティリンク債の評価(金融工学(2))
- 2-A-1 ジャンプ過程による永久ゲームコールオプションの評価について(金融工学(2))
- 1-F-4 ジャンプ過程のもとでのロシアンオプションの評価について(金融工学(2))
- 1-B-3 ノックイン条項型リンク債の評価(金融工学(1))
- 1-B-2 償還条項付きロシアンオプションの価格式について(金融工学(1))
- 1-B-1 転換価格下方修正条項付き転換社債の評価について(金融工学(1))
- 2-D-11 輸送方式の選択を考慮した動的ロットサイズ決定モデル(在庫管理(1))
- 配置場所を考慮した陳腐化商品の在庫管理モデル
- 2-C-1 スポット取引による無限期間の最適調達政策について(在庫管理)
- 1-C-7 複数料金クラスにおける補充付き座席管理について(在庫管理(1))
- 1-C-5 特価商品のオプション付販売政策について(在庫管理(1))
- 2-F-18 有限期間における最適投資戦略と資本構成(投資戦略)
- The Valuation of Callable Currency Linked Bonds (Financial Modeling and Analysis)
- 1-E-9 償還条項付き為替リンク債の評価について(オプション評価(1))
- 1-E-13 消却条項付き新株予約権の評価について(金融(2))
- 繰上償還の事前通知条項が付与された転換社債の評価について(金融工学(4))
- 1-E-3 A Cash Management Model with Two Sources of Short-term Funds : Impulse Control Approach
- 1-B-2 スポット価格と確率的在庫モデル(つくばOR学生発表(2))
- 2-D-9 繁忙期におけるオプション付き座席管理について(在庫管理)
- 1-A-1 A Continuous Time Seat Allocation Model of Callable Seats with Up-down Resets
- 1-E-3 A Continuous Time Seat Allocation Model with Up-down Resets
- Expropriation is the exercise of an option: modeling the Sakhalin-2 production sharing agreement as an American call option
- 2-A-14 輸送計画を考慮した動的ロットサイズ決定モデル(生産管理)
- ある種のダブルバリア型エクイティリンク債の評価
- The Valuation of Callable Russian Options for Double Exponential Jump Diffusion Processes (Financial Modeling and Analysis)
- 1-E-8 ジャンプ過程による償還条項付きロシアンオプションの評価について(オプション評価(1))
- 償還条項付き永久アメリカンオプションの価格式について
- 1-E-14 永久ゲームオプションの価格式の評価ついて(金融(2))
- 永久ゲームオプションの最適行使境界について(金融工学(4))
- 部分観測可能なマルコフ決定過程とアルゴリズム
- 1-A-2 追加発注の有無を考慮した季節商品の最適発注政策(在庫管理)
- 特価期間を考慮する季節商品の最適発注モデル
- 1-F-1 特価期間を考慮する季節商品の最適発注モデル(在庫管理)
- 1-D-5 新幹線と航空の価格競争とダイナミック・プライシング(在庫管理)
- 2-F-12 満期が有限のゲームロシアンオプション(金融(2))
- 2-F-11 他社価格を考慮した動的価格政策(金融(2))
- Game Russian option with the finite maturity (Financial Modeling and Analysis)
- 大学経営におけるORの活用 : 戦略的レベルから日常業務まで(特別講演)