Regret-optimal policies in absorbing semi-Markov decision processes with multiple constraints(The Development of Information and Decision Processes)
スポンサーリンク
概要
著者
関連論文
- 不確実性の下でのマルコフ決定過程に対する区間ベイズ手法 (不確実性と意思決定の数理)
- 教育学部での数学授業から--線形代数学について
- 教育学部での数学の授業から--実数の概念の扱いについて
- 「資料の活用」領域での教材研究 : 中学一学年数学での新学習指導要領への対応
- マルコフ決定過程における TD 法による学習アルゴリズムについて(最適化問題における確率モデルの展開と応用)
- 最適値関数に表れる黄金比(最適化問題における確率モデルの展開と応用)
- Dynamic Programming creates The Golden Ratio, too(Mathematical Models and Decision Making under Uncertainty)
- 区間ベイズ推定による適応型品質管理 (不確実な状況における意思決定の理論と応用)
- 食塩水の問題から見たベイズ定理
- A pattern-matrix learning algorithm for adaptive MDPs : The regularly communicating case (Theory and Application of Decision Analysis in Uncertain Situation)