首页> 中国专利> 一种基于深度强化学习的智能反射面调控方法及装置

一种基于深度强化学习的智能反射面调控方法及装置

摘要

本发明提供了一种基于深度强化学习的智能反射面调控方法及装置,其中方法包括:策略网络根据第一状态生成第一动作;将幅值固定并输入优化模块,更新第一动作得到第二动作,同时得到第一目标值;将第二动作作用于无线环境得到第二状态,得到一个新样本并存入经验池;策略网络和价值网络根据样本进行深度确定性策略梯度训练,执行者利用深度确定性策略梯度方法更新其参数;根据第一目标值和目标Q网络产生的第二目标值确定第三目标值,根据第三目标值训练在线Q网络的DNN并更新其参数;重复执行上述步骤直至得到最小化AP发射功率的网络参数并输出。本发明能在更短的时间内实现稳定且高效地学习,可以更快地收敛到最优目标。

著录项

  • 公开/公告号CN112019249B

    专利类型发明专利

  • 公开/公告日2021-02-19

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN202011135884.3

  • 发明设计人 龚世民;陈希雨;林嘉烨;谭源正;

    申请日2020-10-22

  • 分类号H04B7/06(20060101);G06N20/00(20190101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人郭帅

  • 地址 510000 广东省广州市新港西路135号

  • 入库时间 2022-08-23 11:32:35

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号