首页> 中国专利> 一种基于强化学习设计伦理智能体的方法

一种基于强化学习设计伦理智能体的方法

摘要

本发明涉及机器学习领域,公开了一种基于强化学习设计伦理智能体的方法,包括从行为规范中归纳并提取出元伦理行为;利用众包技术对元伦理行为进行分级,得到元伦理行为分级;基于轨迹树、元伦理行为分级设计和强化学习算法设计奖励机制;选择生活场景并利用奖励机制进行伦理智能体训练。本发明实现对不同场景中相似行为的概括,能够从广义上概括出人们日常生活中的各类行为,保证了环境的一般性,在一定程度上解决了场景受限的问题;通过众包技术对元伦理行为进行分级统计,即能够节省时间成本;结合元伦理行为分级与轨迹树,完善强化学习中的奖惩机制,高效应对可能遇到的人类行为。

著录项

  • 公开/公告号CN113408738A

    专利类型发明专利

  • 公开/公告日2021-09-17

    原文格式PDF

  • 申请/专利权人 桂林电子科技大学;暨南大学;

    申请/专利号CN202110531696.0

  • 申请日2021-05-17

  • 分类号G06N20/00(20190101);

  • 代理机构45134 桂林文必达专利代理事务所(特殊普通合伙);

  • 代理人张学平

  • 地址 541004 广西壮族自治区桂林市七星区金鸡路1号

  • 入库时间 2023-06-19 12:37:08

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号