...
机译:使用改进的迭代动态规划算法获得更平滑的奇异弧策略
机译:使用改进的迭代动态规划算法获得更平滑的奇异弧策略
机译:对于折扣动态规划,修改后的策略迭代算法不是强多项式
机译:基于策略迭代的自适应动态规划算法的多人离散时间非零和游戏
机译:具有执行器饱和的离散非线性系统最优控制的广义策略迭代自适应动态规划算法
机译:关于用于增强学习的无模型策略迭代算法的收敛:不连续平均动力学下的随机逼近。
机译:一致光滑Banach空间中分层变分不等式的隐式和显式迭代算法
机译:修改的政策迭代算法对于折扣动态编程并不强烈的多项式
机译:折扣动态规划。第5部分。修改的策略迭代