机译:基于持续整合测试的加固学习奖励系统研究
College of Information Science and Technology Beijing University of Chemical Technology Beijing 100029 PR China;
College of Information Science and Technology Beijing University of Chemical Technology Beijing 100029 PR China;
College of Information Science and Technology Beijing University of Chemical Technology Beijing 100029 PR China;
College of Information Science and Technology Beijing University of Chemical Technology Beijing 100029 PR China;
Continuous integration; Test case prioritization; Reinforcement learning; Reward policy;
机译:通过概率图形模型使用任务成就奖励使用盖尔和强化学习的模仿学习
机译:整合多个皮层-纹状体环的分层强化学习模型:功能磁共振成像检查在刺激-行动-奖励关联学习中的应用。
机译:基于精度的多步强化学习分类器系统:处理连续输入和学习连续动作的模糊逻辑方法
机译:生成内部奖励的仿制学习和加强学习的有效整合
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:扩展的基底神经节强化学习模型以了解5-羟色胺和多巴胺在基于风险的决策奖励预测和惩罚学习中的作用
机译:概率图形模型使用盖爪和加固学习的仿制学习的集成
机译:将分层强化学习扩展到连续时间,平均奖励和多智能体模型