首页> 中文学位 >改进的C4.5决策树算法研究及在高考成绩预测分析中的应用
【6h】

改进的C4.5决策树算法研究及在高考成绩预测分析中的应用

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 课题来源

1.2 国内外研究现状、水平及发展趋势

1.3 选题的研究意义与目的

1.4 研究内容

1.5 拟采取的研究方法

1.6 预期成果

1.7 论文框架

第二章 数据挖掘综述

2.1 数据挖掘基本技术

2.1.1 数据挖掘定义

2.1.2 数据挖掘功能

2.1.3 数据挖掘方法

2.1.4 数据挖掘过程

2.2 分类挖掘及其应用

2.2.1 分类基本概念

2.2.2 分类挖掘算法

2.2.3 本文采用的分类挖掘算法

2.3 决策树算法及其应用

2.3.1 决策树概述

2.3.2 决策树构造过程

2.3.3 决策树的评价标准

2.3.4 决策树的剪枝

2.3.5 几种常见的决策树分类算法

2.3.6 本文采用的决策树算法

2.4 本章小结

第三章 改进的决策树算法研究

3.1 C4.5算法及其应用

3.1.1 ID3算法

3.1.2 C4.5算法

3.1.3 C4.5算法的应用实例

3.2 改进的C4.5算法

3.2.1 公式的改进

3.2.2 改进的C4.5算法的应用

3.3 改进前后的C4.5算法对比分析

3.3.1 决策树比较

3.3.2 时间复杂度比较

3.4 本章小结

第四章 改进的C4.5算法在高考成绩预测分析中的应用

4.1 开发背景

4.2 系统结构设计图

4.3 系统开发环境

4.4 解决方案

4.4.1 挖掘目标和对象

4.4.2 数据的收集

4.4.3 数据预处理

4.4.4 用改进的C4.5算法构建决策树

4.4.5 实验结果分析

4.5 在学生成绩管理系统中的实现

4.6 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

近年来,数据挖掘引起了信息产业界和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,如市场分析、顾客保有、科学探索等。其中数据分类是数据挖掘领域研究的重要课题。目前用于分类的方法有很多种,其中决策树分类方法以其算法理论清晰、易被理解以及容易转换成分类规则等优点被广泛研究与应用。
   本文以“学生成绩管理系统”为研究背景,目的是研究如何将数据挖掘技术与现有的数据库系统相结合,从大量的数据中提取出隐藏在数据之中的有用信息,为学校的管理者提供综合分析。通过对数据挖掘基本原理、基本算法的研究开发了基于决策树算法的高考成绩预测分析模块。以改进的决策树C4.5算法为基础,根据学生成绩数据库中的信息建立一个决策树成绩预测模型,对学生高考成绩进行综合分析预测。
   通过对几种典型的决策树算法进行分析比较,本文提出了改进的C4.5算法。该算法是将高等数学中的一些原理与C4.5算法相结合,对算法中的信息熵及分裂信息量公式进行化简,以达到提高算法运行效率的目的。
   最后利用程序分别实现改进前后的C4.5算法并进行对比实验,经过理论分析和实验结果表明,改进后的C4.5算法提高了决策树的构建速度,减少了算法的运行时间。本文提出的改进算法改善了原始决策树C4.5算法的性能,表现出了良好的分类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号