首页> 中国专利> 一种基于强化学习设计伦理智能体的方法

一种基于强化学习设计伦理智能体的方法

页面导航

摘要
著录项
相似文献

摘要

本发明涉及机器学习领域，公开了一种基于强化学习设计伦理智能体的方法，包括从行为规范中归纳并提取出元伦理行为；利用众包技术对元伦理行为进行分级，得到元伦理行为分级；基于轨迹树、元伦理行为分级设计和强化学习算法设计奖励机制；选择生活场景并利用奖励机制进行伦理智能体训练。本发明实现对不同场景中相似行为的概括，能够从广义上概括出人们日常生活中的各类行为，保证了环境的一般性，在一定程度上解决了场景受限的问题；通过众包技术对元伦理行为进行分级统计，即能够节省时间成本；结合元伦理行为分级与轨迹树，完善强化学习中的奖惩机制，高效应对可能遇到的人类行为。

著录项

公开/公告号CN113408738A

专利类型发明专利
公开/公告日2021-09-17

原文格式PDF
申请/专利权人桂林电子科技大学;暨南大学;
展开▼

申请/专利号CN202110531696.0
发明设计人古天龙;高慧;李龙;包旭光;李云辉;
展开▼

申请日2021-05-17
分类号G06N20/00(20190101);
代理机构45134 桂林文必达专利代理事务所(特殊普通合伙);
代理人张学平
地址 541004 广西壮族自治区桂林市七星区金鸡路1号
入库时间 2023-06-19 12:37:08

相似文献

专利
中文文献
外文文献

1. 一种基于强化学习设计伦理智能体的方法 [P] . 中国专利： CN113408738A . 2021-09-17
2. 一种基于多智能体强化学习的智能电网分区网络重构方法 [P] . 中国专利： CN114123178A . 2022-03-01
3. MULTI-AGENT DEEP REINFORCEMENT LEARNING PROXY METHOD BASED ON INTELLIGENT GRID [P] . 世界知识产权组织专利： WO2020000399A1 . 2020-01-02

机译：基于智能网格的多智能体深度强化学习代理方法
4. METHOD AND DEVICE FOR PERFORMING MULTIPLE AGENT SENSOR FUSION IN COOPERATIVE DRIVING BASED ON REINFORCEMENT LEARNING [P] . 韩国专利： KR20200094641A . 2020-08-07

机译：基于强化学习的协作驾驶中多智能体传感器融合的方法和装置
5. METHOD AND DEVICE FOR PERFORMING MULTIPLE AGENT SENSOR FUSION IN COOPERATIVE DRIVING BASED ON REINFORCEMENT LEARNING [P] . 欧洲知识产权局专利： EP3690711A1 . 2020-08-05

机译：基于强化学习的协作驾驶中多智能体传感器融合的方法和装置