首页> 中国专利> 术语识别模型的建立方法及装置、术语识别方法及装置

术语识别模型的建立方法及装置、术语识别方法及装置

摘要

本发明公开一种术语识别模型的建立方法及装置、术语识别方法及装置,涉及人工智能技术领域,能够解决现有识别术语准确性较低的问题。本发明的方法主要包括:获取第一训练集;删除第一训练集中一定比例的术语标注,得到第二训练集;基于第一训练集进行模型训练得到第一术语识别模型,以及基于第二训练集进行模型训练得到第二术语识别模型;根据利用第一术语识别模型和第二术语识别模型分别对特定数据集进行术语识别得到的损失差异,从特定数据集中筛选出满足术语标注质量要求的标注数据作为第三训练集;利用第三训练集进行模型训练得到最终所需的术语识别模型。本发明主要适用于基于神经网络建立术语识别模型的场景中。

著录项

  • 公开/公告号CN113642329A

    专利类型发明专利

  • 公开/公告日2021-11-12

    原文格式PDF

  • 申请/专利权人 阿里巴巴集团控股有限公司;

    申请/专利号CN202010343731.1

  • 发明设计人 顾淑琴;张昱琪;施杨斌;陆军;

    申请日2020-04-27

  • 分类号G06F40/295(20200101);G06F40/242(20200101);

  • 代理机构11348 北京鼎佳达知识产权代理事务所(普通合伙);

  • 代理人任媛;刘铁生

  • 地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱

  • 入库时间 2023-06-19 13:15:27

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号