首页> 中国专利> 一种混合经验的多智能体强化学习运动规划方法

一种混合经验的多智能体强化学习运动规划方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种混合经验的多智能体强化学习运动规划方法，即ME‑MADDPG算法。该方法通过MADDPG算法训练，在产生样本时，不仅通过探索和学习产生经验，还增加了通过人工势场法将多无人机成功规划至目标的高质量经验，并把这两种经验存放至不同的经验池。在训练时，神经网络通过动态采样，以变化的概率从两种经验池中采集样本，以每个智能体的自身状态信息和环境信息作为神经网络的输入，以多智能体的速度作为输出。同时，在训练的过程中神经网络缓慢更新，稳定地完成多智能体运动规划策略的训练，最终实现多智能体在复杂环境下自主避障并顺利到达各自的目标位置。本发明可以在复杂动态的环境中高效地训练出稳定性和适应性更好的运动规划策略。

著录项

公开/公告号CN113341958B

专利类型发明专利
公开/公告日2022-02-25

原文格式PDF
申请/专利权人西北工业大学;
展开▼

申请/专利号CN202110558854.1
发明设计人万开方;武鼎威;高晓光;
展开▼

申请日2021-05-21
分类号G05D1/02(20200101);
代理机构61204 西北工业大学专利中心;
代理人金凤
地址 710072 陕西省西安市友谊西路127号
入库时间 2022-08-23 13:09:42

法律信息

法律状态公告日

法律状态信息

法律状态
2022-02-25

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种混合经验的多智能体强化学习运动规划方法 [P] . 中国专利： CN113341958B . 2022.02.25
2. 一种基于多智能体强化学习的机械臂抗干扰运动规划方法 [P] . 中国专利： CN114083539A . 2022-02-25
3. MULTI-AGENT DEEP REINFORCEMENT LEARNING PROXY METHOD BASED ON INTELLIGENT GRID [P] . 世界知识产权组织专利： WO2020000399A1 . 2020-01-02

机译：基于智能网格的多智能体深度强化学习代理方法
4. LESSON SYSTEM AND LESSON METHOD FOR MOTION OF HUMAN BEING [P] . 日本专利： JP2007244443A . 2007-09-27

机译：人体运动的经验教训系统和经验教训方法
5. Boolean Satisfiability (SAT) Reduction for Geometry and Kinematics Agnostic Multi-Agent Planning [P] . 美国专利： US2020041274A1 . 2020-02-06

机译：用于几何和运动学不可知的多智能体规划的布尔可满足性（SAT）降低