Sony Computer Science Laboratories Inc. Tokyo Japan;
Aerospace electronics; Robot kinematics; Task analysis; Trajectory; Mathematical model; Voltage control;
机译:整体强化学习和经验重播,用于部分未知约束输入连续时间系统的自适应最优控制
机译:基于持续动作空间加固学习的个性化生命体征控制监督经验
机译:连续非线性系统H∞控制器设计的基于值迭代的积分强化学习方法
机译:用于学习多目标,连续动作和状态空间控制器的连续价值迭代(CVI)增强学习和虚构体验重放(IER)
机译:高维,连续状态和动作空间中的自主思维发展及其在语音自主学习中的应用。
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:通过无模型增强学习的连续空间MDP的正式控制器合成