首页> 中国专利> 一种基于最优解的智能体残障设备投放方法

一种基于最优解的智能体残障设备投放方法

摘要

本发明涉及一种基于最优解的智能体残障设备投放方法,包括计算得到智能体选择的动作和Q值并进行初始化操作;进行总回合中的一个片段操作,将当前状态初始化为S0,在概率为ε时选择最大Q值对应的动作,否则选择一个随机动作,并执行该动作获得奖励后进入下一个状态;将当前状态、执行的动作、奖励和下一个状态作为一个四元组集合存入经验池,并更新sum‑tree的父节点;判断当前Q值与最优值之间的误差是否在阈值范围内,得到最终智能体选择的动作和Q值。本发明的优点在于:奖励进行分解,每一个智能体的奖励不仅包含自己的奖励,还包括所有智能体共同的奖励,提升了智能体之间的协作性,对智能体学习起到促进作用同时能满足优化目标。

著录项

  • 公开/公告号CN114021775A

    专利类型发明专利

  • 公开/公告日2022-02-08

    原文格式PDF

  • 申请/专利权人 成都海天数联科技有限公司;

    申请/专利号CN202111161240.6

  • 发明设计人 唐源;王魁;唐小艳;刘玲意;

    申请日2021-09-30

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06Q50/26(20120101);G06N3/08(20060101);G06N20/00(20190101);

  • 代理机构11340 北京天奇智新知识产权代理有限公司;

  • 代理人肖会

  • 地址 610000 四川省成都市高新区天华一路99号B区7栋314、315号

  • 入库时间 2023-06-19 14:08:07

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号