基于软件演化数据挖掘的代码坏味道检测

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

大量的研究表明，代码坏味道的存在对于软件质量有极大的影响，甚至会导致软件系统失败。所以，如何发现代码中的坏味道吸引了大量研究者和实践者的注意力，成为软件工程的研究热点之一。研究者们已提出了一系列代码坏味道检测方法，但这些方法仅仅基于从源代码中所提取的静态结构化信息。本文观察发现，有一些代码坏味道具有能够从软件演化的变更历史特征来进行检测的特性；还有一些代码坏味道，在以往使用的是代码结构信息进行静态检测，但是演化历史数据可以帮助改进检测效果。
　　基于这个发现，本文提出了一种基于软件演化数据挖掘的代码坏味道检测方法BADE，它从软件的版本管理系统的演化信息中，提取变更事务集，运用机器学习方法进行代码变更的频繁模式发现和关联规则挖掘，在此基础上，利用启发式的算法来检测6种典型的代码坏味道――重复代码、霰弹式修改、发散式变化、并行继承、大对象和依恋情结。
　　具体地，本文的贡献包括：
　　1)代码变更的关联规则挖掘。本文定义了代码演化耦合度的概念，以代表代码实体之间的演化联系。BADE从版本管理系统的历史版本数据中，根据演化耦合概念构建变更事务集，过滤分支合并。接着采用自顶向下的搜索方法、剪枝策略和并行化运算的方式改进了关联规则挖掘算法 FP-Growth，从代码演化的变更事务集中发现代表代码实体之间的耦合关系的频繁模式。
　　2)基于启发式算法的代码坏味道检测。根据演化历史中代码实体之间的关联规则，设计启发式的算法来进行代码坏味道的检测。同时本文对代码进行静态检测获取代码的结构，来辅助启发式算法更准确地发现代码坏味道。
　　3)实验。本文选取了5个开源软件项目，采用BADE和其他现有方法进行了对比实验。实验结果表明：BADE能够获得较高的准确率和召回率，F-measure值在64%到92%之间；对于本身具有演化特性的坏味道，例如霰弹式修改，发散式变化和并行继承，BADE胜过现有基于单个代码快照的静态分析技术；对于重复代码、大对象和依恋情结等代码坏味道，BADE表现也较好；通过将演化数据挖掘和代码静态分析技术结合起来，能获得更好的检测性能。

著录项

作者
傅诗哲;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科软件工程
授予学位硕士
导师姓名赵建军,沈备军;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类软件工程;
关键词
代码坏味道检测; 软件演化; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 代码坏味对软件演化影响的实证研究 [J] . 章晓芳 ,朱灿 . 软件学报 . 2019,第005期
2. 基于BP神经网络的代码坏味检测 [J] . 王曙燕 ,张一权 ,孙家泽 . 计算机工程 . 2020,第010期
3. 基于软件代码演化信息的克隆谱系提取方法 [J] . 陈桌 ,张丽萍 ,王春晖 . 计算机应用 . 2016,第012期
4. 一种基于模糊概念格和代码分析的软件演化分析方法 [J] . 许佳卿 ,彭鑫 ,赵文耘 . 计算机学报 . 2009,第009期
5. 基于数据挖掘和机器学习的恶意代码检测方法 [J] . 廖国辉 ,刘嘉勇 . 信息安全研究 . 2016,第001期
6. 基于政务应用系统源代码检测平台的软件安全评分系统设计 [C] . 刘凯俊 ,李晨旸 ,赵章界 . 第七届全国网络安全等级保护技术大会 . 2018
7. 软件需求缺陷坏味道的检测方法研究 [A] . 陈敏杰 . 2016

基于软件演化数据挖掘的代码坏味道检测

目录

摘要

著录项

相似文献

相关主题

期刊订阅