逆制御過程と逆配分過程
スポンサーリンク
概要
- 論文の詳細を見る
まず、逐次決定過程として定式化された一次元状態空間上の有限段確定的動的計画(主動的計画)の逆(逆動的計画)を定義し、両計画に対して数理計画の双対定理に対応する定理(逆定理)を導いている。つぎに、この考え方をいわゆる制御過程(主制御過程)・多段配分過程(主配分過程)に応用して、それぞれ逆制御過程・逆配分過程を導入している。逆定理を適用すると、逆過程の最適解(最適利得関数列と最適政策)は、直接再帰式を解くことなく、主過程の最適解の逆関数演算と合成関数演算によって簡単に求められる。事実、逆過程の再帰式を解くことは主過程より相当困難である。このような意味でも逆定理は有効である。従来の逆定理においては、その主動的計画の目的関数はf_l(a_1;f_2(a_2;・・・;f_N(a_N;k(s_<N+1>))・・・))であった。ここでa_nは第n段における決定である。このため、応用範囲が一制約式の数理計画問題にに限定されていた。本論文では、目的関数を状態列{S_1、S_2、;・・・、s_<N+1>}にも依存する再帰型関数f_1(s_1、a_1 f_2(s_2、a_2;・・・;f_N(s_N、a_N;k(s_<N+1>))・・・))にしても、いわゆる逆理論が展開できることがわかった。このような目的関数は一般の逐次決定過程によく現われる。本論文の逆定理はこれらの過程に適用可能である。特に、制御過程・配分過程についてその逆過程を中心に解析している。考え方の本質的な点は、(1)主動的計画における状態と決定との対をその状態における"新しい決定"と見做して、(2)本来の状態を最適利得関数列に沿って逆変換したものとそのときの決定との対を、逆動的計画における"新しい決定"として、(3)従来の逆定理の考え方を部分的に導入したことにある。
- 社団法人日本オペレーションズ・リサーチ学会の論文