首页> 中国专利> 一种基于富文本特征的新闻实体链接方法和系统

一种基于富文本特征的新闻实体链接方法和系统

摘要

本发明公开了一种基于富文本特征的新闻实体链接方法和系统,所述方法包括如下步骤:构建候选实体的知识图谱,其中所述知识图谱包括指称实体和候选实体;获取新闻数据,从所述新闻数据中识别指称实体,根据所述指称实体从所述知识图谱中查找候选实体;将所述新闻数据进行分句获取上下文短句列表,筛选包含所述指称实体的所有上下文短句,生成上下文特征列表,获取候选实体的描述文本特征和附加属性特征,构建富文本特征,将所述富文本特征输入到二分类模型中训练,训练完毕后用于预测指称实体和候选实体的匹配的分类概率。所述方法和系统结合Attention计算让模型综合性考虑了不同描述方式下的文本语境,极大程度上提高了模型在复杂文本场景下的辨识度。

著录项

  • 公开/公告号CN114416923A

    专利类型发明专利

  • 公开/公告日2022-04-29

    原文格式PDF

  • 申请/专利权人 新华智云科技有限公司;

    申请/专利号CN202210055153.0

  • 发明设计人 辛宇;

    申请日2022-01-18

  • 分类号G06F16/33;G06F16/35;G06F16/36;G06F40/295;G06K9/62;G06N3/04;G06N3/08;

  • 代理机构杭州裕阳联合专利代理有限公司;

  • 代理人杨琪宇

  • 地址 310012 浙江省杭州市西湖区文一西路460号文娱中心430室

  • 入库时间 2023-06-19 15:07:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-20

    实质审查的生效 IPC(主分类):G06F16/33 专利申请号:2022100551530 申请日:20220118

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号