首页> 中国专利> 基于混合特征分析的涉黄、涉赌网站检测方法

基于混合特征分析的涉黄、涉赌网站检测方法

摘要

本发明涉及一种基于混合特征的涉黄、涉赌网站检测方法。该方法包括以下步骤:对网络数据流量进行采集,对数据包进行解析后获取网站域名地址;根据域名地址获取对应网站的完整源码和首页长截图;使用基于关键词匹配的方法对网站域名进行过滤,然后人工标注网站类别(主要包括涉赌、涉黄网站和正常网站);分别使用word2vec和BoVW提取网站的文本特征和图像特征,然后训练联合分类器模型;并使用训练好的联合分类器对待检测的网站进行分类,检测该网站是否为涉赌网站或涉黄网站。本发明通过结合图像和文本特征并且使用联合分类器进行网站分类,能够实现更加精准的网站检测,最大限度地提高涉黄、涉赌网站的自动化识别能力。

著录项

  • 公开/公告号CN112347244A

    专利类型发明专利

  • 公开/公告日2021-02-09

    原文格式PDF

  • 申请/专利权人 四川大学;

    申请/专利号CN201910727964.9

  • 发明设计人 刘亮;陈扬;郑荣锋;

    申请日2019-08-08

  • 分类号G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 610065 四川省成都市武侯区一环路南一段24号

  • 入库时间 2023-06-19 09:51:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-25

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号