首页> 中国专利> 一种面向多源网络百科的知识库构建方法

一种面向多源网络百科的知识库构建方法

摘要

本发明公开了一种面向多源网络百科的知识库构建方法。本方法为:1)从设定的若干网络百科抓取页面,并从抓取的每一页面中抽取页面的类别信息;2)基于类别信息构建类别树,并将类别信息和类别树对应,形成知识库的类别体系;提取每个网络百科对应页面的的别名信息构建该网络百科的概念词典;3)对抓取的页面进行去重,得到知识库的概念集合;4)从页面集合中每一页面的页面信息框和正文中抽取三元组信息;5)将三元组中的客体转换成标准格式,然后根据得到的标准化三元组和类别体系建立知识库。本发明不仅可以输出实体的类别体系,还可以对三元组中的实体进行链接,得到高质量的三元组知识,适用于多个网络百科混合生成知识库的需求。

著录项

  • 公开/公告号CN107239481B

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 北京大学;

    申请/专利号CN201710236165.2

  • 发明设计人 韩喆;冯岩松;贾爱霞;赵东岩;

    申请日2017-04-12

  • 分类号G06F16/951(20190101);G06F16/958(20190101);G06F16/35(20190101);G06F16/36(20190101);

  • 代理机构11200 北京君尚知识产权代理有限公司;

  • 代理人司立彬

  • 地址 100871 北京市海淀区颐和园路5号北京大学

  • 入库时间 2022-08-23 11:35:08

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号