退出
我的积分:
中文文献批量获取
外文文献批量获取
胡光华;
中国自动化学会;
强化学习; 部分可观测马氏决策过程; R学习; R(λ)学习; 机器学习;
机译:在POMDPs环境中使用状态转变的部分历史进行强化学习的方法
机译:基于长期平均成本准则的部分观测MDP的平稳最优策略的存在
机译:基于在线变分贝叶斯方法的部分可观测环境识别及其在强化学习中的应用
机译:一种仅成本可观测的MDP的具有多项式交互复杂度的强化学习算法
机译:不确定性下的计划:从信息路径计划到部分可观察的半MDP
机译:通过有限的强化进行强化学习:使用Bayes风险在POMDP中进行主动学习
机译:特征强化学习:第一部分:非结构化mDp
机译:无限地平线Dec-pOmDp中策略同步的分布式强化学习。
机译:使用MDP和逆向强化学习的新规则创建
机译:MDPS MDPS的控制方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。