MAS中基于多奖惩标准的Q学习算法研究

乔林; 罗杰

首页> 中文期刊> 《计算机科学》 >MAS中基于多奖惩标准的Q学习算法研究

MAS中基于多奖惩标准的Q学习算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

传统的Q学习算法是基于单奖惩标准的。基于单奖惩标准的Q学习算法往往不能适应multi-agent system（MAS）面对的复杂变化的环境与状态,相反可能还会制约学习效率。提出的基于多奖惩标准的Q学习算法能够较好地适应复杂变化的状态与环境,分阶段完成任务,不同阶段使用不同的奖惩标准,能够快速地完成阶段目标。以三维世界中的围捕问题为仿真平台,增加了围捕的难度和状态环境的复杂性。仿真实验表明,基于多奖惩标准的Q学习算法能够灵活地适应复杂变化的环境与状态,高效地完成学习任务。

著录项

来源
《计算机科学》 |2012年第b06期|P.235-237|共3页
作者
乔林; 罗杰;
展开▼
作者单位

南京邮电大学自动化学院;

南京210046;

展开▼
原文格式 PDF
正文语种 CHI
中图分类自动推理、机器学习;
关键词
Q学习算法; 多奖惩标准; MAS; 三维围捕;

相似文献

中文文献
外文文献
专利

1. 星地融合网络中基于Q学习的切换算法研究 [J] . 熊丹妮 ,李屹 . 通信学报 . 2015,第009期
2. 基于改进蚁群算法的Q学习算法研究 [J] . 付鹏 ,罗杰 . 计算机技术与发展 . 2013,第002期
3. 基于Meta平衡的多Agent Q学习算法研究 [J] . 王万良 ,濮约庆 ,赵燕伟 . 计算机科学 . 2012,第B06期
4. 基于多态Q学习的无线网络MAC层CSMA协议优化策略 [J] . 雷小葳 ,李长云 ,徐曦 . 信息与电脑 . 2018,第006期
5. 多Agent系统中Q学习算法研究 [J] . 战忠丽 ,王强 ,王佩霞 . 辽宁农业职业技术学院学报 . 2008,第005期
6. 跨区域EMPI中基于贝叶斯理论的Q学习算法研究与应用 [C] . 郑世 ,高春蓉 ,余小益 . 2014中华医院信息网络大会 . 2014
7. 基于Q学习的Macro-Pico异构网络干扰协调算法研究 [A] . 汪朝晖 . 2015

MAS中基于多奖惩标准的Q学习算法研究

摘要

著录项

相似文献

相关主题

期刊订阅