首页> 外国专利> SYSTEM AND METHOD FOR UNCERTAINTY-BASED ADVICE FOR DEEP REINFORCEMENT LEARNING AGENTS

SYSTEM AND METHOD FOR UNCERTAINTY-BASED ADVICE FOR DEEP REINFORCEMENT LEARNING AGENTS

机译：基于不确定性的深度加强学习代理建议的系统和方法

页面导航

摘要
著录项
相似文献

摘要

Disclosed are systems, methods, and devices for training a learning agent. A learning agent that maintains a reinforcement learning neural network is instantiated. State data reflective of a state of an environment explored by the learning agent is received. An uncertainty metric calculated upon processing the state data, the uncertainty metric measuring epistemic uncertainty of the learning agent. Upon determining that the uncertainty metric exceeds a pre-defined threshold: a request signal requesting an action suggestion from a demonstrator is sent; a suggestion signal reflective of the action suggestion is received; and an action signal to implement the action suggestion is sent.

机译：公开了用于训练学习代理的系统，方法和设备。实例化了维护加强学习神经网络的学习代理。收到了学习代理探索的环境的状态数据。在处理状态数据时计算的不确定性度量，学习代理的不确定性度量测量认识性的不确定性度量不确定性。在确定不确定性度量超出预定义的阈值时：发送请求来自演示者的动作建议的请求信号;收到了反映了行动建议的建议信号;发送用于实现动作建议的动作信号。

著录项

公开/公告号US2021073912A1

专利类型
公开/公告日2021-03-11

原文格式PDF
申请/专利权人 ROYAL BANK OF CANADA;
展开▼

申请/专利号US202017011310
发明设计人 FELIPE LENO DA SILVA;PABLO FRANCISCO HERNANDEZ LEAL;BILAL KARTAL;MATTHEW EDMUND TAYLOR;
展开▼

申请日2020-09-03
分类号G06Q40/04;G06N3/08;G06N3/04;
国家 US
入库时间 2022-08-24 17:38:05

相似文献

专利
外文文献
中文文献