首页> 中国专利> 基于深度强化学习的变质量水下航行器避障方法及系统

基于深度强化学习的变质量水下航行器避障方法及系统

页面导航

摘要
著录项
相似文献

摘要

本发明公开一种基于深度强化学习的变质量水下航行器避障方法及系统，包括：根据变质量水下航行器的运动状态和执行机构动作构建基于深度强化学习网络的避障仿真模型；将历史避障任务完整轨迹作为专家数据存入经验回放池，根据变质量水下航行器初始运动状态和高斯噪声得到当前执行动作，根据当前执行动作得到新运行状态和当前执行动作的奖励值，并存入经验回放池；根据经验回放池对避障仿真模型进行训练，根据当前训练的执行动作奖励值和历史训练的奖励平均值更新高斯噪声；以迭代训练完成后的基于深度强化学习网络的避障仿真模型得到变质量水下航行器避障任务行驶路径。对基于深度强化学习的DDPG网络模型进行改进，解决水下航行器的避障问题。

著录项

公开/公告号CN113010963B

专利类型发明专利
公开/公告日2022-04-29

原文格式PDF
申请/专利权人山东大学;
展开▼

申请/专利号CN202110240036.7
发明设计人李沂滨;李沐阳;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳;
展开▼

申请日2021-03-04
分类号G06F30/15;G06F30/27;G06N3/04;G06N3/08;
代理机构济南圣达知识产权代理有限公司;
代理人闫伟姣
地址 266237 山东省青岛市即墨滨海路72号
入库时间 2022-08-23 13:33:32

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习的变质量水下航行器避障方法及系统 [P] . 中国专利： CN113010963A . 2021-06-22
2. 一种基于深度强化学习的水下自主航行器动态避障方法 [P] . 中国专利： CN112925319B . 2022.06.07
3. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16
4. 一种基于ABAQUS的多轴蠕变疲劳预测方法 [P] . 世界知识产权组织专利： WO2020/143284A1 . 2020.07.16
5. 一种飞行器的拍摄方法、飞行器、终端设备及飞行系统 [P] . 世界知识产权组织专利： WO2020/143575A1 . 2020.07.16