首页> 中国专利> 基于内在动机的多智能体稀疏奖励环境协作探索方法

基于内在动机的多智能体稀疏奖励环境协作探索方法

摘要

本发明公开了一种基于内在动机的多智能体稀疏奖励环境协作探索方法,步骤1、初始化目标策略和探索策略;步骤2、构建人工势场函数,通过在环境中构建一个人工势场,引导探索策略在环境中根据人工势场中的势能进行探索,对于未探索充分区域加强探索,从而得到成功的经验,引导目标策略进行学习;步骤3、进行势能影响的分配;步骤4、利用人工势场影响更新探索策略,即利用经过信度分配的人工势场强度影响引导探索策略进行探索,加快对环境空间的探索,利用成功经验信号引导目标策略学习。与现有技术相比,本发明对稀疏奖励环境下智能体的探索效率有较高的提升,可以与多种强化学习算法进行结合。

著录项

  • 公开/公告号CN114169421A

    专利类型发明专利

  • 公开/公告日2022-03-11

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN202111455606.0

  • 申请日2021-12-01

  • 分类号G06K9/62(20220101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人李素兰

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2023-06-19 14:28:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-11

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号