第一个书签之前
基于缺陷报告和源代码的相似缺陷识别方法
摘 要
Abstract
第1章 绪 论
1.1课题来源
1.2课题研究的背景和意义
1.3国内外研究现状
1.3.1相似缺陷报告识别方法的国内外研究现状
1.3.2相似代码识别方法的国内外研究现状
1.3.3缺陷报告的代码文件定位方法的国内外研究现状
1.4课题研究的主要内容及章节安排
第2章 基于动宾短语和主题模型的相似缺陷报告识别方法
2.1引言
2.2方法的总体思路
2.3基于白名单的特征向量构建
2.4基于结构化信息的特征向量构建
2.4.1句法分析
2.4.2启发式过滤规则
2.4.3领域术语自动抽取
2.5基于LDA主题模型的特征向量构建
2.6基于动宾短语和主题模型的缺陷报告分类方法
2.7实验结果与分析
2.8本章小结
第3章 基于文本分析的缺陷报告与源代码匹配方法
3.1引言
3.2方法的总体思路
3.3数据预处理
3.4基于缺陷报告与代码文件的相关度计算
3.4.1token匹配程度的相关度计算
3.4.2文本相似度计算
3.4.3基于SVM的相关度计算
3.4.4相关度的线性组合
3.5缺陷报告与代码文件匹配方法
3.6实验结果与分析
3.7本章小结
第4章 基于局部敏感哈希和抽象语法树的相似代码识别方法
4.1引言
4.2方法的总体思路
4.3抽象语法树
4.4基于抽象语法树的特征向量构建
4.5局部敏感哈希算法
4.6相似代码识别方法
4.7实验结果与分析
4.8本章小结
结 论
参考文献
攻读硕士学位期间发表的论文及其它成果
致 谢
哈尔滨工业大学;