首页> 中文学位 >基于FP-树的关联规则数据挖掘方法研究
【6h】

基于FP-树的关联规则数据挖掘方法研究

代理获取

目录

文摘

英文文摘

燕山大学硕士学位论文原创性声明及燕山大学硕士学位论文使用授权书

第1章绪论

第2章关联规则挖掘

第3章基于FP-增长的频繁项集挖掘算法

第4章基于FP-树的频繁项集挖掘

第5章算法性能评估

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

作者简介

展开▼

摘要

数据挖掘技术可以从数据仓库中的历史数据里提取出有价值的信息。关联规则数据挖掘是其中一个重要研究方向,挖掘的关键是选取恰当的算法,算法的优劣直接影响到挖掘的效率。迄今为止已提出许多关联规则挖掘算法,大多在单维布尔型关联规则挖掘的Apriori算法基础上进行改进,FP-树技术就是其中的典型。 本文对关联规则挖掘算法进行了研究。首先对数据挖掘技术做了简要描述,其次对Apriori算法和FP-增长算法进行了系统的分析和总结,讨论了提高有效性的策略。在此基础上,提出了一组结合FP-树和FP-数组技术的改进算法。 对于频繁项集挖掘,在FP-增长算法基础上提出了一种FPgrowth*改进算法,通过改变存储方式,增加FP-数组结构,减少建立条件FP-树时所需的扫描次数,省略了FP-树的遍历时间;对于最大频繁项集挖掘,在FP-树结构的基础上提出了MFI-树结构,并结合MFI-树结构与FP-数组技术提出了FPmax*算法,用MFI-树保存已发现的MFI路径,同时为条件FP-树构造局部MFI-树,从而减少频繁项集的比较时间;对于封闭频繁项集,在FP-树结构的基础上提出了CFI-树结构,并结合CFI-树结构与FP-数组技术提出了一种FPclose算法,CFI-树包含已发现的封闭频繁项集及其计数信息,新发现的频繁项集只需要与CFI-树中结点进行比较,即可对其封闭性进行判断,从而提高了效率。 最后,用不同的数据集对算法的运行时间、内存消耗和可伸缩性进行了实验分析,证明了算法的有效性。

著录项

  • 作者

    郭伟;

  • 作者单位

    燕山大学;

  • 授予单位 燕山大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 原福永,叶德谦;
  • 年度 2006
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    数据挖掘; 关联规则; FP-树; FP-数组; 频繁项集;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号