首页> 中国专利> 一种基于字符级局部敏感哈希法进行同源性检测的方法

一种基于字符级局部敏感哈希法进行同源性检测的方法

摘要

本发明公开一种基于字符级局部敏感哈希法进行同源性检测的方法,包括步骤一、筛选符合的后缀名源代码文件并除去文本和图片,步骤二、源代码预处理及滑窗处理并通过映射和进制转换得到最终指纹,步骤三、根据源代码计算出的指纹选择匹配同源文件,步骤四、查询结果后进行排序并选出最终选定版本;本发明从字符级直接对输入的字符进行滑窗处理,粒度更细,准确性更高,通过将较长的源代码转换为较短的指纹,不仅可以解决同源检测中的相似性问题,而且漏报率大大降低。

著录项

  • 公开/公告号CN113946345A

    专利类型发明专利

  • 公开/公告日2022-01-18

    原文格式PDF

  • 申请/专利权人 北京鸿渐科技有限公司;

    申请/专利号CN202111294922.4

  • 申请日2021-11-03

  • 分类号G06F8/41(20180101);G06F16/2458(20190101);

  • 代理机构11562 北京东方盛凡知识产权代理事务所(普通合伙);

  • 代理人李娜

  • 地址 100084 北京市海淀区农大南路1号硅谷亮城2B-71A

  • 入库时间 2023-06-19 13:57:16

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号