机译:通过时差强化学习来学习策略的自动化信号连接控制器
Transportation Research Croup, Faculty of Engineering and the Environment, University of Southampton, SO17 1BJ, UK;
Transportation Research Croup, Faculty of Engineering and the Environment, University of Southampton, SO17 1BJ, UK;
neural network; reinforcement learning; temporal difference; traffic; control; junction;
机译:自动化的信号连接控制器,可向人类专家学习策略
机译:信号交叉口的互联和自动车辆高效驾驶策略的开发:一种强化学习方法
机译:通过强化学习控制倒立摆的基于时差的模糊逻辑控制器整定
机译:基于时差GNG的增强学习环境中可以学习控制的算法
机译:培养基于物理的控制器,用于铰接性的人物,深增强学习
机译:PNAS Plus:在经验性货币涌现范例中对比时差和机会成本强化学习
机译:自动信号交叉控制器,通过时间差异强化学习来学习策略