首页> 中文期刊> 《西安工业大学学报》 >一种二次釆样的强化学习方法

一种二次釆样的强化学习方法

         

摘要

为了提高强化学习算法训练过程中信息价值高样本的回放频率,缩短算法训练时间,本文提出一种二次采样方法.对经验池中随机采集批量样本进行分层,将每层中样本的TD_error分布采样,用二次采样得到的样本训练深度Q网络,并将二次采样方法采用在DQN算法中,利用OpenAI Gym平台上测试其效果,分析算法参数对学习性能的影响.实验结果表明:相较于DQN算法,该方法能提高更有信息价值样本以及表现优秀样本的被选概率,提高Agent的学习速度,减少Agent与环境的交互次数,改善Agent的学习效果.

著录项

  • 来源
    《西安工业大学学报》 |2021年第3期|345-351|共7页
  • 作者单位

    西安工业大学新型网络与检测控制国家地方联合工程实验室 西安710021;

    西安工业大学计算机科学与工程学院 西安710021;

    西安工业大学新型网络与检测控制国家地方联合工程实验室 西安710021;

    西安工业大学新型网络与检测控制国家地方联合工程实验室 西安710021;

    西安工业大学新型网络与检测控制国家地方联合工程实验室 西安710021;

    西安工业大学计算机科学与工程学院 西安710021;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 人工智能理论;
  • 关键词

    深度强化学习; 经验回放机制; 二次采样; 深度Q网络;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号