首页> 中国专利> 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法

基于局部敏感哈希的中文多关键词模糊排序密文搜索方法

摘要

本发明涉及一种基于局部敏感哈希的中文多关键词模糊排序密文搜索方法,将中文关键词转换成对应的拼音串后,基于声韵母和音调、unigram对拼音串分割;设计了三种中文关键词向量生成算法,将拼音串映射成关键词向量。并且,利用局部敏感哈希的特性和布隆过滤器来实现关键词的模糊匹配。本发明采用一篇文档对应一个布隆过滤器作为文档的加密索引,当加入新文档(或删除旧文档)时,无需更改原数据集的加密索引,只需构建新文档的加密索引(或删除旧文档的加密索引),就可实现文档的动态更新。为了提高排序结果的精确性,本发明引入了域加权评分,将关键词向量间的欧氏距离、词频权重和域加权评分结合,实现更为精确的三因子排序,返回更加满足用户需求的文档。

著录项

  • 公开/公告号CN107220343B

    专利类型发明专利

  • 公开/公告日2020-09-01

    原文格式PDF

  • 申请/专利权人 福州大学;

    申请/专利号CN201710387493.2

  • 发明设计人 杨旸;刘佳;郭文忠;叶少珍;董晨;

    申请日2017-05-26

  • 分类号G06F16/31(20190101);G06F16/33(20190101);G06F21/62(20130101);

  • 代理机构35100 福州元创专利商标代理有限公司;

  • 代理人蔡学俊

  • 地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区

  • 入库时间 2022-08-23 11:12:06

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号