机译:具有Borel状态空间的Markov控制过程中的强1最优策略
discrete-time Markov control processes; Borel state space; strong 1-optimal policies;
机译:具有Borel状态空间的Markov控制过程中的强1最优策略
机译:Markov决策过程的平均成本优化不等式与Borel空间和普遍可衡量的政策
机译:在Borel空间上的半马尔可夫控制过程的时间和比率预期平均成本最优性
机译:Borel空间中的弱耦合约束Markov决策过程
机译:强马尔可夫过程的p变异。
机译:使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
机译:Borel空间上半马尔可夫控制过程的时间和比率预期平均成本最优性
机译:具有Borel状态空间和无界奖励的马尔可夫决策链中所有策略类的Blackwell最优性