基于DDPG算法的末制导律设计研究

刘扬; 何泽众; 王春宇; 郭茂祖

首页> 中文期刊> 《计算机学报》 >基于DDPG算法的末制导律设计研究

基于DDPG算法的末制导律设计研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

末制导律设计是拦截系统中的关键技术,常用的比例制导律及其变型在目标大机动时性能下降,且受到导航比的影响.提出基于DDPG算法的末制导律设计方法,通过对拦截问题的环境状态和动作(控制量)进行设计,实现了从仿真环境交互数据中学习回报最优的制导律;与传统方法相比,该无模型方法更具灵活性;针对强化学习方法动作集假设偏置弱带来训练效率低的问题,进一步提出将导航比作为决策优化参数,加速了训练过程并实现动态调整比例制导律中的导航比.对比实验表明,两种强化学习末制导律设计方法获得了优于比例制导律及其变型的拦截效果,展现出良好的研究前景和潜在的应用价值.

著录项

来源
《计算机学报》 |2021年第9期|1854-1865|共12页
作者
刘扬; 何泽众; 王春宇; 郭茂祖;
展开▼
作者单位

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

哈尔滨工业大学计算机科学与技术学院哈尔滨150001;

北京建筑大学电气与信息工程学院北京100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
末制导律; 强化学习; 确定性策略; 归纳偏置;

相似文献

中文文献
外文文献
专利

1. 基于改进DDPG算法的机器人路径规划算法研究 [J] . 周盛世 ,单梁 ,常路 . 南京理工大学学报（自然科学版） . 2021,第003期
2. 基于LSTM与非对称网络的改进DDPG算法研究 [J] . 何富君 ,王晓争 ,刘凯 . 计算机应用研究 . 2022,第1期
3. 基于自监督网络的DDPG算法的建筑能耗控制 [J] . 殷雨竹 ,陈建平 ,傅启明 . 计算机系统应用 . 2022,第2期
4. 基于DDPG算法的海上无人救援技术研究 [J] . 郑帅 ,贾宝柱 ,张昆阳 . 计算机应用与软件 . 2021,第004期
5. 基于DDPG算法的路径规划研究 [J] . 张义 ,郭坤 . 电脑知识与技术 . 2021,第004期
6. 基于MGEKF的反辐射无人机末制导律设计 [C] . ZHANG Xiaofeng ,张晓峰 ,ZHU Xueping . 陕西省兵工学会第十二届青年学术交流会 . 2014
7. 基于DDPG算法的船舶避碰路径规划研究 [A] . 袁传平 . 2020

基于DDPG算法的末制导律设计研究

摘要

著录项

相似文献

相关主题

期刊订阅