一种基于生成对抗网络的强化学习算法

陈建平; 邹锋; 刘全; 吴宏杰; 胡伏原; 傅启明

首页> 中文期刊> 《计算机科学》 >一种基于生成对抗网络的强化学习算法

一种基于生成对抗网络的强化学习算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:针对强化学习方法在训练初期由于缺少经验样本所导致的学习速度慢的问题,提出了一种基于生成对抗网络的强化学习算法。在训练初期,该算法通过随机策略收集经验样本以构成真实样本池,并利用所收集的经验样本来训练生成对抗网络,然后利用生成对抗网络生成新的样本以构成虚拟样本池,再结合真实样本池和虚拟样本池来批量选择训练样本,以此来提高学习速度。同时,该算法引入了关系修正单元,结合深度神经网络,训练了真实样本池中样本的状态、动作与后续状态、奖赏之间的内部联系,结合相对熵优化生成对抗网络,提高生成样本的质量。最后,将所提出的算法与DQN算法应用于OpenAI Gym中的CartPole问题和MountainCar问题。实验结果表明,与DQN算法相比,所提算法可以有效地加快训练初期的学习速度,且收敛时间缩短了15%。

著录项

来源
《计算机科学》 |2019年第10期|265-272|共8页
作者
陈建平; 邹锋; 刘全; 吴宏杰; 胡伏原; 傅启明;
展开▼
作者单位

苏州科技大学电子与信息工程学院江苏苏州215009;

苏州科技大学江苏省建筑智慧节能重点实验室江苏苏州215009;

苏州科技大学苏州市移动网络技术与应用重点实验室江苏苏州215009;

苏州大学计算机科学与技术学院江苏苏州215009;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
强化学习; 深度学习; 经验样本; 生成对抗网络;

相似文献

中文文献
外文文献
专利

1. 一种基于生成对抗网络的无人机图像去雾算法 [J] . 庄子尤 ,徐成华 ,魏育成 . 图像与信号处理 . 2021,第002期
2. 一种基于局部属性生成对抗网络的人脸修复算法 [J] . 蒋斌 ,刘虹雨 ,杨超 . 计算机研究与发展 . 2019,第011期
3. 一种基于生成对抗网络的图像修复算法 [J] . 李天成 ,何嘉 . 计算机应用与软件 . 2019,第012期
4. 一种基于生成对抗网络的单幅图像去雾算法 [J] . 李莎 ,柯文驰 ,李科 . 现代计算机（专业版） . 2019,第028期
5. 一种基于深度强化学习的SDN路由算法 [J] . 丁怀宝 . 上海师范大学学报（自然科学版） . 2021,第001期
6. 一种基于局部属性生成对抗网络的人脸修复算法 [C] . Jiang Bin ,蒋斌 ,Liu Hongyu . 第六届中国计算机学会大数据学术会议 . -1
7. 一种基于生成对抗网络的图像清晰化算法研究 [A] . 罗阳 . 2020

一种基于生成对抗网络的强化学习算法

摘要

著录项

相似文献

相关主题

期刊订阅