Delays; Reinforcement learning; Quality of service; Markov processes; Spread spectrum communication;
机译:SDN-IOT中的核心骨干网络联合交通管制和多通道重新分配:多智能经纪深度加强学习方法
机译:基于合作组的多功能协同钢筋学习的大规模场景的自适应交通信号控制
机译:网络范围的交通信号控制优化使用多功能深度增强学习
机译:延迟最优交通工程通过多功能钢筋学习
机译:基于宏观动作的多智能经济型深度加强学习合作任务
机译:多主体强化学习和近似模型学习的竞技游戏
机译:网络范围的交通信号控制优化使用多功能深度增强学习