基于多智能体强化学习的多AGV路径规划方法

刘辉; 肖克; 王京擘

首页> 中文期刊> 《自动化与仪表》 >基于多智能体强化学习的多AGV路径规划方法

基于多智能体强化学习的多AGV路径规划方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:AGV(automated guided vehicle)路径规划问题已成为货物运输、快递分拣等领域中一项关键技术问题。由于在此类场景中需要较多的AGV合作完成,传统的规划模型难以协调多AGV之间的相互作用,采用分而治之的思想或许能获得系统的最优性能。基于此,该文提出一种最大回报频率的多智能体独立强化学习MRF(maximum reward frequency)Q-learning算法,对任务调度和路径规划同时进行优化。在学习阶段AGV不需要知道其他AGV的动作,减轻了联合动作引起的维数灾问题。采用Boltzmann与ε-greedy结合策略,避免收敛到较差路径,另外算法提出采用获得全局最大累积回报的频率作用于Q值更新公式,最大化多AGV的全局累积回报。仿真实验表明,该算法能够收敛到最优解,以最短的时间步长完成路径规划任务。

著录项

来源
《自动化与仪表》 |2020年第2期|84-89|共6页
作者
刘辉; 肖克; 王京擘;
展开▼
作者单位

青岛大学自动化系青岛266071;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
多智能体强化学习; AGV路径规划; 独立强化学习;

相似文献

中文文献
外文文献
专利

1. 基于多智能体强化学习的无人车分布式路径规划方法 [J] . 张立雄 ,郭艳 ,李宁 . 电声技术 . 2021,第003期
2. 基于递阶强化学习的多智能体AGV调度系统 [J] . 李晓萌 ,杨煜普 ,许晓鸣 . 控制与决策 . 2002,第3期
3. 随机环境中基于强化学习的智能体路径规划 [J] . 马朋委 ,潘地林 ,汪立冬 . 电脑知识与技术 . 2015,第031期
4. 基于递阶强化学习的自主机器人路径规划智能体 [J] . 王文玺 ,肖世德 ,孟祥印 . 计算机集成制造系统 . 2009,第006期
5. 基于多智能体强化学习的动态频谱分配方法综述 [J] . 宋波 ,叶伟 ,孟祥辉 . 系统工程与电子技术 . 2021,第011期
6. 一种多智能体分层强化学习方法 [C] . 沈晶 ,程晓北 ,刘海波 . 中国人工智能学会第12届全国学术年会 . 2007
7. 基于深度强化学习的多智能体路径规划研究 [A] . 刘岱远 . 2021

基于多智能体强化学习的多AGV路径规划方法

摘要

著录项

相似文献

相关主题

期刊订阅