首页> 中国专利> 基于数字指纹和语义特征的新闻文本侵权检测方法与装置

基于数字指纹和语义特征的新闻文本侵权检测方法与装置

摘要

本发明公开了一种基于数字指纹和语义特征的新闻文本侵权检测方法与装置,能够通过检测文本相似性实时检测各大新闻媒体网站的新闻是否有侵权行为。本发明首先通过互联网采集新闻文本样本数据,并在新闻原文基础上构造出的侵权样本;然后利用word2vec模型实现新闻文本统一坐标系化,基于改进的局部敏感哈希方法提取文本指纹特征;接着基于长短时记忆循环神经网络模块,利用三元组损失学习文本语义特征;最后通过计算数字指纹特征和语义特征融合的相似度来判断文本是否有侵权。与现有技术相比,本发明将词语义嵌入到指纹中,更易检测出抄袭行为,并且同时利用数字特征和语义特征进行新闻文本相似度检测,能够有效提高新闻文本侵权检测的准确率。

著录项

  • 公开/公告号CN109918621A

    专利类型发明专利

  • 公开/公告日2019-06-21

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN201910119330.5

  • 发明设计人 杨鹏;孙麟;李幼平;张长江;郑斌;

    申请日2019-02-18

  • 分类号

  • 代理机构南京苏高专利商标事务所(普通合伙);

  • 代理人孟红梅

  • 地址 211189 江苏省南京市江宁区东南大学路2号

  • 入库时间 2024-02-19 11:32:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-16

    实质审查的生效 IPC(主分类):G06F17/22 申请日:20190218

    实质审查的生效

  • 2019-06-21

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号