首页> 中国专利> 一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法

一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法

摘要

本发明属于机器人中的多移动机器人技术领域,更具体地,涉及一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法。当奖励信号稀疏时,基于深度强化学习的多机器人编队导航方法难以通过试错的方式学习出有效的导航策略。为了让多机器人编队在奖励信号稀疏的情况下依然能够学习出导航策略,本发明提出了一种基于融合相对表现和绝对表现的课程学习方法;该方法首先依据起始点到目标点的距离对场景进行分类,然后基于多机器人编队在不同类型场景中的相对表现和绝对表现来安排接下来要进行交互的场景类型。通过本发明所提出的课程学习方法,多机器人编队能够在奖励信号稀疏的情况下学习出有效的导航策略。

著录项

  • 公开/公告号CN111830971B

    专利类型发明专利

  • 公开/公告日2021-09-07

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN202010544064.3

  • 发明设计人 林俊潼;成慧;

    申请日2020-06-15

  • 分类号G05D1/02(20200101);

  • 代理机构44102 广州粤高专利商标代理有限公司;

  • 代理人王晓玲

  • 地址 510275 广东省广州市海珠区新港西路135号

  • 入库时间 2022-08-23 12:25:57

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号