一种二次釆样的强化学习方法

周江卫; 关亚兵; 白万民; 刘白林

首页> 中文期刊> 《西安工业大学学报》 >一种二次釆样的强化学习方法

一种二次釆样的强化学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了提高强化学习算法训练过程中信息价值高样本的回放频率,缩短算法训练时间,本文提出一种二次采样方法.对经验池中随机采集批量样本进行分层,将每层中样本的TD_error分布采样,用二次采样得到的样本训练深度Q网络,并将二次采样方法采用在DQN算法中,利用OpenAI Gym平台上测试其效果,分析算法参数对学习性能的影响.实验结果表明:相较于DQN算法,该方法能提高更有信息价值样本以及表现优秀样本的被选概率,提高Agent的学习速度,减少Agent与环境的交互次数,改善Agent的学习效果.

著录项

来源
《西安工业大学学报》 |2021年第3期|345-351|共7页
作者
周江卫; 关亚兵; 白万民; 刘白林;
展开▼
作者单位

西安工业大学新型网络与检测控制国家地方联合工程实验室西安710021;

西安工业大学计算机科学与工程学院西安710021;

西安工业大学新型网络与检测控制国家地方联合工程实验室西安710021;

西安工业大学新型网络与检测控制国家地方联合工程实验室西安710021;

西安工业大学新型网络与检测控制国家地方联合工程实验室西安710021;

西安工业大学计算机科学与工程学院西安710021;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
深度强化学习; 经验回放机制; 二次采样; 深度Q网络;

相似文献

中文文献
外文文献
专利

1. 一种针对信息半对称下多方博弈的神经网络强化学习方法 [J] . 段行健 ,曹然 . 通讯世界 . 2021,第003期
2. 一种面向无人机群区域协同覆盖的深度强化学习方法 [J] . 姜波 ,梁晨阳 ,梅杰 . 空间控制技术与应用 . 2021,第6期
3. 一种结合演示数据和演化优化的强化学习方法 [J] . 宋拴 ,俞扬 . 计算机工程与应用 . 2014,第011期
4. 一种基于智能调度的可扩展并行强化学习方法 [J] . 刘全 ,傅启明 ,杨旭东 . 计算机研究与发展 . 2013,第004期
5. 一种改进的平均奖赏强化学习方法在RoboCup训练中的应用 [J] . 李瑾 ,刘全 ,杨旭东 . 苏州大学学报（自然科学版） . 2012,第002期
6. 一种适合MMOG的强化学习方法 [C] . 王洪彦 . 第五届中国软件工程大会 . 2008
7. Cas-GAN：一种基于GAN和强化学习的对话管理策略学习方法 [A] . Nabeel Muhammad . 2019

一种二次釆样的强化学习方法

摘要

著录项

相似文献

相关主题

期刊订阅