文摘
英文文摘
第一章前言
§1.1数据挖掘(Data Mining)
§1.1.1数据挖掘功能(Data Mining Functionalities)
§1.1.2数据挖掘的研究热点
§1.2分类(Classification)
§1.3分类所涉及的数据处理问题
§1.3.1数据清理(Data Cleaning)
§1.3.2相关性分析(Relevance Analysis)
§1.3.3数据变换(Data Transformation)
§1.4新的分类思想
第二章分类算法
§2.1贝叶斯网络(Bayesian Network)
§2.1.1贝叶斯定理(Bayesian Theorem)
§2.1.2朴素贝叶斯网络(Naive Bayesian Network)
§2.1.3贝叶斯信念网络(Bayesian Belief Network)
§2.1.4从数据中学习贝叶斯网络(Learning Bayesian Network From Data)
§2.2决策树(Decision Tree)
§2.2.1单决策树学习
§2.2.2委员会学习(committee learning)
§2.3小结
第三章一种新的分类思想:不可能即排除准则(Impossibility-Excluded Criterion)
§3.1基本原理
§3.2定义、性质和定理
§3.3 IEC的算法描述
第四章基于不可能即排除准则的分类算法(CLassification with Impossibility Excluded Criterion)
§4.1 CLIEC算法
§4.1.1初始化
§4.1.2直接预测
§4.1.3类标排除
§4.1.4投票汰弱
§4.1.5函数评分
§4.2离散化对CLIEC的完善
§4.2.1 CLIEC在处理连续属性方面的不足
§4.2.2常见的离散化算法
§4.2.3一种新颖的基于万有引力模型的离散化方法(Discretization with Universal Gravitation)
§4.3 CLIEC在标准数据集上的实验
§4.3.1 Breast Cancer
§4.3.2 Soybean
§4.3.3 Zoo
§4.3.4 Mushroom
§4.3.5 Iris
§4.4小结
第五章CLIEC在数据挖掘中的应用
§5.1“电梯设备维护与维修数据挖掘”项目简介
§5.2 CLIEC、DUG算法在电梯设备维护与维修项目中的应用
§5.2.1算法的实现
§5.2.2在“电梯设备维护与维修数据挖掘”项目中的应用
第六章结论及展望
致谢
参考文献
攻读硕士学位期间的研究成果