首页> 中国专利> 一种基于Wikipedia概念向量的中文词语相关度计算方法和装置

一种基于Wikipedia概念向量的中文词语相关度计算方法和装置

摘要

本发明公开了一种基于Wikipedia概念向量的中文词语相关度计算方法和装置。方法包括:1.由Wikipedia Dump服务站点获取生语料,进行规范化处理,生成Wikipedia基础语料库;2.进行概念标注扩充,构建Wikipedia概念语料库;3.根据Wikipedia概念语料库,训练概念向量;4.对于待比较词语对,根据Wikipedia,获得其词语概念集合;5.计算概念集合的笛卡尔积中的每个概念对所对应的概念向量的相似度,取最大值作为待比较词语对的相关度。利用本发明,可以充分挖掘Wikipedia蕴含的词语概念信息,生成词语概念向量,更准确有效地计算词语相关度。

著录项

  • 公开/公告号CN107491524B

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 齐鲁工业大学;

    申请/专利号CN201710707736.6

  • 发明设计人 鹿文鹏;张玉腾;张甜甜;孟凡擎;

    申请日2017-08-17

  • 分类号G06F16/36(20190101);G06F40/284(20200101);

  • 代理机构

  • 代理人

  • 地址 250353 山东省济南市西部新城大学科技园大学路3501号

  • 入库时间 2022-08-23 13:10:29

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号