首页> 中国专利> 一种基于局部密度信息的软件缺陷数据自适应过采样方法

一种基于局部密度信息的软件缺陷数据自适应过采样方法

摘要

本发明公开了一种基于局部密度信息的软件缺陷数据自适应过采样方法,本发明首先在数据预处理阶段使用Min‑Max归一化方法统一量纲,使用提出的AgglomerativeClustering‑Relief特征选择方法,降低数据维度并删除冗余特征。然后在自适应分组采样阶段,通过分析在低维状态下的少数类实例的局部密度信息,将所有少数类实例根据各自的分布特点划分至不同的分组,并针对不同分组中的少数类实例,采用针对性的过采样策略进行自适应过采样。最终使数据集中两类样本数量达到平衡,从数据层面解决不平衡问题。

著录项

  • 公开/公告号CN113936185A

    专利类型发明专利

  • 公开/公告日2022-01-14

    原文格式PDF

  • 申请/专利权人 杭州电子科技大学;

    申请/专利号CN202111116252.7

  • 申请日2021-09-23

  • 分类号G06V10/774(20220101);G06V10/762(20220101);G06V10/764(20220101);G06V10/771(20220101);G06K9/62(20220101);

  • 代理机构33240 杭州君度专利代理事务所(特殊普通合伙);

  • 代理人杨舟涛

  • 地址 310018 浙江省杭州市下沙高教园区2号大街

  • 入库时间 2023-06-19 13:54:12

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号