首页> 中国专利> 一种基于深度强化学习的智能反射面调控方法及装置

一种基于深度强化学习的智能反射面调控方法及装置

页面导航

摘要
著录项
相似文献

摘要

本发明提供了一种基于深度强化学习的智能反射面调控方法及装置，其中方法包括：策略网络根据第一状态生成第一动作；将幅值固定并输入优化模块，更新第一动作得到第二动作，同时得到第一目标值；将第二动作作用于无线环境得到第二状态，得到一个新样本并存入经验池；策略网络和价值网络根据样本进行深度确定性策略梯度训练，执行者利用深度确定性策略梯度方法更新其参数；根据第一目标值和目标Q网络产生的第二目标值确定第三目标值，根据第三目标值训练在线Q网络的DNN并更新其参数；重复执行上述步骤直至得到最小化AP发射功率的网络参数并输出。本发明能在更短的时间内实现稳定且高效地学习，可以更快地收敛到最优目标。

著录项

公开/公告号CN112019249B

专利类型发明专利
公开/公告日2021-02-19

原文格式PDF
申请/专利权人中山大学;
展开▼

申请/专利号CN202011135884.3
发明设计人龚世民;陈希雨;林嘉烨;谭源正;
展开▼

申请日2020-10-22
分类号H04B7/06(20060101);G06N20/00(20190101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人郭帅
地址 510000 广东省广州市新港西路135号
入库时间 2022-08-23 11:32:35

相似文献

专利
中文文献
外文文献

1. 一种基于深度强化学习的智能反射面调控方法及装置 [P] . 中国专利： CN112019249B . 2021.02.19
2. 一种基于深度强化学习的软件智能升级方法及装置 [P] . 中国专利： CN113031983A . 2021-06-25
3. MULTI-AGENT DEEP REINFORCEMENT LEARNING PROXY METHOD BASED ON INTELLIGENT GRID [P] . 世界知识产权组织专利： WO2020000399A1 . 2020-01-02

机译：基于智能网格的多智能体深度强化学习代理方法
4. Pointer-oriented object acquisition method for tangible treatment of information of the computer system which is based on one natural language and in which a received signal reaction of this computer system of artificial intelligence of a cyborg or an android, a corresponding association of this computer system of artificial intelligence of a cyborg or an android, a corresponding thought of this computer system of artificial intelligence of a cyborg or an android are substantiated [P] . 美国专利： US2009265298A1 . 2009-10-22

机译：一种基于指针的对象获取方法，用于对计算机系统的信息进行有形处理，该方法基于一种自然语言，并且该机器人或机器人的人工智能系统对该计算机系统的接收信号作出反应，该计算机系统具有相应的关联机器人或机器人的人工智能，该机器人或机器人的人工智能计算机系统的相应思想得到证实
5. METHOD FOR PROVIDING EDUCATIONAL CONTENTS BASED ON SMART-PHONE, AND COMPUTER-READABLE RECORDING MEDIUM WITH PROVIDING PROGRAM OF EDUCATIONAL CONTENTS BASED ON SMART-PHONE [P] . 韩国专利： KR20140056426A . 2014-05-12

机译：一种基于智能手机的教育内容提供方法以及一种基于智能手机的教育内容提供程序的计算机可读记录介质