首页> 中国专利> 基于深度强化学习的变质量水下航行器避障方法及系统

基于深度强化学习的变质量水下航行器避障方法及系统

摘要

本发明公开一种基于深度强化学习的变质量水下航行器避障方法及系统,包括:根据变质量水下航行器的运动状态和执行机构动作构建基于深度强化学习网络的避障仿真模型;将历史避障任务完整轨迹作为专家数据存入经验回放池,根据变质量水下航行器初始运动状态和高斯噪声得到当前执行动作,根据当前执行动作得到新运行状态和当前执行动作的奖励值,并存入经验回放池;根据经验回放池对避障仿真模型进行训练,根据当前训练的执行动作奖励值和历史训练的奖励平均值更新高斯噪声;以迭代训练完成后的基于深度强化学习网络的避障仿真模型得到变质量水下航行器避障任务行驶路径。对基于深度强化学习的DDPG网络模型进行改进,解决水下航行器的避障问题。

著录项

  • 公开/公告号CN113010963B

    专利类型发明专利

  • 公开/公告日2022-04-29

    原文格式PDF

  • 申请/专利权人 山东大学;

    申请/专利号CN202110240036.7

  • 申请日2021-03-04

  • 分类号G06F30/15;G06F30/27;G06N3/04;G06N3/08;

  • 代理机构济南圣达知识产权代理有限公司;

  • 代理人闫伟姣

  • 地址 266237 山东省青岛市即墨滨海路72号

  • 入库时间 2022-08-23 13:33:32

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号