声明
摘要
第一章绪论
1.1课题研究背景及意义
1.2国内外研究现状
1.2.1软件缺陷预测研究
1.2.2数据不平衡问题研究
1.3课题的主要研究内容
1.4本文组织结构
第二章数据不平衡问题下的软件缺陷预测
2.1类间不平衡与类内不平衡
2.2数据不平衡问题下的软件缺陷预测模型
2.3数据不平衡问题下的采样技术
2.3.1过采样与欠采样
2.3.2 SMOTE方法
2.3.3 ADASYN方法
2.3.4 MAHAKIL方法
2.3.5小结
2.4本章小结
第三章基于原始数据分布的数据集划分模型
3.1 K-means聚类划分算法
3.2基于K-means聚类的数据集分布划分模型
3.2.1样本分布情况讨论
3.2.2对簇数k的讨论
3.2.3结果分析
3.3本章小结
第四章基于原始数据分布的数据生成方法
4.1基于原始分布划分的数据生成
4.1.1数据生成比例
4.1.2数据生成方法
4.2算法设计
4.3生成数据结果分析
4.4本章小结
第五章实验及结果分析
5.1实验数据集
5.2评估指标
5.3实验设计
5.4实验结果与分析
5.4.1有效性分析
5.4.2缺陷占比选择
5.5本章小结
第六章结论与展望
6.1本文结论
6.2本文展望
参考文献
致谢
研究成果及发表的学术论文
作者和导师简介
北京化工大学;