Variance Optimization for Continuous-Time Markov Decision Processes

Yaqing Fu

首页> 中文期刊> 《统计学期刊（英文）》 >Variance Optimization for Continuous-Time Markov Decision Processes

Variance Optimization for Continuous-Time Markov Decision Processes

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper considers the variance optimization problem of average reward in continuous-time Markov decision process (MDP). It is assumed that the state space is countable and the action space is Borel measurable space. The main purpose of this paper is to find the policy with the minimal variance in the deterministic stationary policy space. Unlike the traditional Markov decision process, the cost function in the variance criterion will be affected by future actions. To this end, we convert the variance minimization problem into a standard (MDP) by introducing a concept called pseudo-variance. Further, by giving the policy iterative algorithm of pseudo-variance optimization problem, the optimal policy of the original variance optimization problem is derived, and a sufficient condition for the variance optimal policy is given. Finally, we use an example to illustrate the conclusion of this paper.

著录项

来源
《统计学期刊（英文）》 |2019年第2期|181-195|共15页
作者
Yaqing Fu;
展开▼
作者单位

School of Economic;

Jinan University;

Guangzhou;

China;

展开▼
原文格式 PDF
正文语种 chi
中图分类数学;
关键词
Continuous-Time; Markov; Decision; Process; Variance; Optimality; of; Average; Reward; Optimal; Policy; of; Variance; Policy; Iteration;

相似文献

中文文献
外文文献
专利

1. Variance minimization for continuous-time Markov decision processes: two approaches [J] . ZHU Quan-xin . 高校应用数学学报B辑 . 2010,第004期
2. Modeling and On-line Optimization Controlof Crude Distillation Processes [C] . . 第九届过程控制科学报告会(上、下) . 1998
3. The Modeling And Optimization Of Chemical Processes Using Gene Expression Programming [A] . MOHAMED HASSAN SAID OMAR . 2009

Variance Optimization for Continuous-Time Markov Decision Processes

摘要

著录项

相似文献

相关主题

期刊订阅