多智能体中基于蚁群算法信息素的Q学习研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科技的不断进步，日益复杂的实际问题已经渐渐超出了单个智能体所能处理的范畴，更多大型的实际应用需要很多个智能体共同合作完成，因而多智能体技术得到了愈来愈多研究人员的关注，这项技术也在过去二十多年得到了快速发展。其中，强化学习技术作为多智能体领域一个研究热点，也经历了较大的发展，它能够对多智能体系统搜索最佳解提供解决方案。Q学习是强化学习最主要的学习算法之一。
　　蚁群算法是模拟自然界蚂蚁群体行为的一种群智能优化算法，它通过对真实蚂蚁群体的智能行为研究，进而抽象出理论算法，对处理众多问题带来了新的办法。
　　本文通过将蚁群算法的信息素概念引入到多智能体系统中来实现同Q学习算法的结合，将信息素也纳入到动作指导信息中。信息素的引入让整个系统中的智能体在进行行为决策的时候，不单单依靠环境信息，而是考量信息素和环境因素的综合效应来选择行动，这样就加强了各个智能体之间的信息交互，从而能有效地提高原有算法的学习效率，更好的协作完成目标任务。
　　而对于结合的蚁群算法，针对信息素的更新策略，采用了改进的蚁群算法更新模式。首先对于信息素挥发因子ρ，采用了自适应调整的方式，这样就得到了结合蚁群算法自适应调整信息素挥发因子更新信息素的Q学习（APEF_Q），从而更大的提高了原有算法的搜索能力与收敛效率，最后通过围捕问题模型进行计算机仿真，结果证明了改进后的算法相较于原有算法，在性能上有明显的提高。
　　其次，对于信息素强度，利用动态的时变函数取代原有的常数项模式，这样得到了结合蚁群算法自适应调整信息素强度的Q学习（AP_Q），对于这种改进算法，采用了环境更为复杂的三维空间的围捕模型，通过加大难度的计算机仿真实验对改进的算法进行性能分析。通过与原有算法的对比，有效证明了改进后的算法更为可靠，算法效率也有了较为明显的增强。
　　最后，同样采用难度较大的三维空间仿真模型，对基本Q学习、结合基本蚁群算法信息素机制的Q学习（Ant_Q）以及两种结合改进蚁群算法信息素机制的Q学习（APEF_Q和AP_Q）这四项算法进行了实验对比。通过结果分析可以得出，结合了蚁群算法信息素机制的Q学习，相较于基本Q学习，在性能上有明显的提升。

著录项

作者
付鹏;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科模式识别与智能系统
授予学位硕士
导师姓名罗杰;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
多智能体; 蚁群算法; 信息素; Q学习方法;

相似文献

中文文献
外文文献
专利

1. 多智能体Q学习在多AUV协调中的应用研究 [J] . 严浙平 ,李锋 ,黄宇峰 . 应用科技 . 2008,第001期
2. 基于改进蚁群算法的Q学习算法研究 [J] . 付鹏 ,罗杰 . 计算机技术与发展 . 2013,第002期
3. 基于多智能体Q学习的异构车载网络选择方法 [J] . 聂雷 ,刘博 ,李鹏 . 计算机工程与科学 . 2021,第005期
4. 基于多智能体Q学习算法的交通信号优化控制 [J] . 陶巧云 . 数码设计．CG WORLD . 2020,第009期
5. 一种基于统计的多智能体Q学习算法 [J] . 谭天晓 ,赵辉 ,赵宗涛 . 微电子学与计算机 . 2008,第1期
6. 跨区域EMPI中基于贝叶斯理论的Q学习算法研究与应用 [C] . 郑世 ,高春蓉 ,余小益 . 2014中华医院信息网络大会 . 2014
7. 基于多智能体Q学习的车载通信MAC层信道接入技术研究 [A] . 杜艾芊 . 2017

多智能体中基于蚁群算法信息素的Q学习研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅