首页> 中国专利> 一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法

一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法

页面导航

摘要
著录项
相似文献

摘要

本发明属于机器人中的多移动机器人技术领域，更具体地，涉及一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法。当奖励信号稀疏时，基于深度强化学习的多机器人编队导航方法难以通过试错的方式学习出有效的导航策略。为了让多机器人编队在奖励信号稀疏的情况下依然能够学习出导航策略，本发明提出了一种基于融合相对表现和绝对表现的课程学习方法；该方法首先依据起始点到目标点的距离对场景进行分类，然后基于多机器人编队在不同类型场景中的相对表现和绝对表现来安排接下来要进行交互的场景类型。通过本发明所提出的课程学习方法，多机器人编队能够在奖励信号稀疏的情况下学习出有效的导航策略。

著录项

公开/公告号CN111830971B

专利类型发明专利
公开/公告日2021-09-07

原文格式PDF
申请/专利权人中山大学;
展开▼

申请/专利号CN202010544064.3
发明设计人林俊潼;成慧;
展开▼

申请日2020-06-15
分类号G05D1/02(20200101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人王晓玲
地址 510275 广东省广州市海珠区新港西路135号
入库时间 2022-08-23 12:25:57

相似文献

专利
中文文献
外文文献

1. 一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法 [P] . 中国专利： CN111830971B . 2021.09.07
2. 一种用于在稀疏奖励信号下学习多机器人编队导航策略的课程学习方法 [P] . 中国专利： CN111830971A . 2020-10-27
3. A learning method and a learning device for improving segmentation performance used for detecting a road user event by utilizing a double embedding configuration in a multi-camera system, and a testing method and a testing device using the learning method and a learning device. {LEARNING METHOD AND LEARNING DEVICE FOR IMPROVING SEGMENTATION PERFORMANCE TO BE USED FOR DETECTING ROAD USER EVENTS USING DOUBLE EMBEDDING CONFIGURATION IN MULTI-CAMERA SYSTEM AND TESTING METHOD AND TESTING DEVICE USING THE SAME} [P] . JP6867054B2 . 2021-04-28

机译：一种学习方法和学习设备，用于改进用于通过在多摄像机系统中利用双重嵌入配置来检测道路用户事件的分割性能，以及使用学习方法和学习设备的测试方法和测试设备。 {用于改进分段性能的学习方法和学习设备用于使用多摄像时系统中使用双重嵌入配置检测道路用户事件以及使用相同的测试方法和测试设备}
4. SIGNAL EMULATOR, MACHINE LEARNING METHOD OF LEARNING MODEL FOR IMAGE RECOGNITION, MACHINE LEARNING METHOD OF LEARNING MODEL FOR SIGNAL EMULATOR, AND MACHINE LEARNING SYSTEM OF LEARNING MODEL FOR IMAGE RECOGNITION [P] . 日本专利： JP2019179494A . 2019-10-17

机译：信号仿真器，用于图像识别的学习模型的机器学习方法，用于信号仿真器的学习模型的机器学习方法以及用于图像识别的学习模型的机器学习系统
5. A learning method and a learning apparatus for integrating the space detection result of another autonomous vehicle with the space detection result of the own autonomous vehicle acquired by V2V communication, and a test method and a test apparatus using the learning method and the learning apparatus. DEVICE FOR INTEGRATING OBJECT DETECTION INFORMATION ACQUIRED THROUGH V2V COMMUNICATION FROM OTHER AUTONOMOUS VEHICLE WITH OBJECT DETECTION INFORMATION GENERATED BY PRESENT AUTONOMOUS VEHICLE, AND TESTING METHOD AND TESTING DEVICE USING THE SAME} [P] . 日本专利： JP2020126623A . 2020-08-20

机译：一种学习方法和学习设备，用于将另一辆自动驾驶汽车的空间检测结果与通过V2V通信获取的自己的自动驾驶汽车的空间检测结果进行积分，以及一种使用该学习方法和学习设备的测试方法和测试设备。将通过V2V通信从其他自治车辆获取的目标检测信息与当前自主车辆生成的目标检测信息集成在一起的装置，测试方法和测试装置，使用相同的方法