XCSG在多机器人强化学习中的应用

邵杰; 杜丽娟; 杨静宇

首页> 中文期刊> 《计算机科学》 >XCSG在多机器人强化学习中的应用

XCSG在多机器人强化学习中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

XCS classifier system has been shown to solve machine-learning problems in a competitive way.However,in multi-robot problems,XCS is restricted to solve very small problems modeled by a Markov decision process.In this paper a new leaming technique XCSG that combines XCS and gradient descent methods was proposed to solve multi-robot machine-learning problems.XCSG builds low-dimensional approximation of the function,and gradient descent techniques use on-line knowledge to establish a stable approximation of functions,so that the Q-form has been maintained at a low-dimensional stable state.Approximate of the function not only requires smaller storage space,but also allows the robot online knowledge is summarized on the generalization.Simulation results show that XCSG algorithm solves the multi-robot reinforcement learning in a large space,slow learning,learning uncertainty and other issues.%XCS分类器在解决机器人强化学习方面已显示出较强的能力,但在多机器人领域仅局限于MDP环境,只能解决环境空间较小的学习问题.提出了XCSG来解决多机器人的强化学习问题.XCSG建立低维的逼近函数,梯度下降技术利用在线知识建立稳定的逼近函数,使Q表格一直保持在稳定低维状态.逼近函数Q不仅所需的存储空间更小,而且允许机器人在线对已获得的知识进行归纳一般化.仿真实验表明,XCSG算法很好地解决了多机器人学习空间大、学习速度慢、学习效果不确定等问题.

著录项

来源
《计算机科学》 |2013年第8期|249-251292|共4页
作者
邵杰; 杜丽娟; 杨静宇;
展开▼
作者单位

郑州成功财经学院信息工程系郑州451200;

南京理工大学计算机科学与技术学院南京210094;

商丘工学院信息与电子学院商丘476000;

南京理工大学计算机科学与技术学院南京210094;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
强化学习; 多机器人; 学习分类器; 梯度下降法的学习分类器;

相似文献

中文文献
外文文献
专利

1. 基于模糊小波网络的强化学习及其在多机器人决策策略中的应用 [J] . 段勇 ,李程 ,徐心和 . 高技术通讯 . 2013,第004期
2. 动作预测在多机器人强化学习协作中的应用 [J] . 曹洁 ,朱宁宁 . 计算机工程与应用 . 2013,第008期
3. 基于强化学习的多机器人仓储调度方法研究 [J] . CHEN Mingzhi ,QIAN Tonghui ,ZHANG Shizhen . 现代电子技术 . 2019,第014期
4. 多机器人强化学习的防碰撞方法仿真 [J] . 赵硕 . 计算机仿真 . 2016,第005期
5. 多机器人系统强化学习研究综述 [J] . 马磊 ,张文旭 ,戴朝华 . 西南交通大学学报 . 2014,第006期
6. 粒子群优化及其在多机器人系统中的应用展望 [C] . NI Chunbo ,倪春波 ,KONG Yifei . 2013年中国智能自动化会议 . 2013
7. 强化学习方法在多机器人博弈系统中的应用研究 [A] . 刘飞 . 2011

XCSG在多机器人强化学习中的应用

摘要

著录项

相似文献

相关主题

期刊订阅