首页> 中国专利> 一种强化学习多代理合作任务下的代理贡献分配的方法

一种强化学习多代理合作任务下的代理贡献分配的方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种强化学习多代理合作任务下的代理贡献分配的方法，包括：每个代理独立观测环境状态，输入各自的策略网络，得到各自的动作决策；在模拟环境执行各代理的动作，环境反馈的全局奖励；将各代理之间的交互建模为一张无向图，使用此图计算出每个代理的贡献权值；使用各代理的贡献权值计算各代理的局部奖励，使用此局部奖励对每个代理各自的策略网络进行训练。该方法能够对多个代理与环境交互后的结果（奖励）进行贡献分配，能够起到可信度赋值的效果，给训练算法提供更加精准的奖励描述，帮助多代理系统在合作任务上学习到更好的策略。

著录项

公开/公告号CN111967199A

专利类型发明专利
公开/公告日2020-11-20

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN202011011848.6
发明设计人谭哲越;尹建伟;尚永衡;张鹿鸣;李莹;邓水光;
展开▼

申请日2020-09-23
分类号G06F30/27(20200101);G06F17/18(20060101);
代理机构33200 杭州求是专利事务所有限公司;
代理人林松海
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2023-06-19 08:59:45

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-05

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种强化学习多代理合作任务下的代理贡献分配的方法 [P] . 中国专利： CN111967199A . 2020-11-20
2. 一种多代理强化学习合作任务下的奖励函数建模方法 [P] . 中国专利： CN112084721A . 2020-12-15
3. METHOD AND SYSTEM FOR PERFORMING NEGOTIATION TASK USING REINFORCEMENT LEARNING AGENTS [P] . 美国专利： US2020020061A1 . 2020-01-16

机译：使用强化学习代理执行协商任务的方法和系统
4. METHOD AND SYSTEM FOR PERFORMING NEGOTIATION TASK USING REINFORCEMENT LEARNING AGENTS [P] . 欧洲知识产权局专利： EP3594891A1 . 2020-01-15

机译：使用强化学习代理执行协商任务的方法和系统
5. METHOD AND SYSTEM FOR PERFORMING NEGOTIATION TASK USING REINFORCEMENT LEARNING AGENT [P] . 日本专利： JP2020013568A . 2020-01-23

机译：使用强化学习代理执行协商任务的方法和系统