首页> 中文学位 >使用长度递减支持度挖掘兴趣频繁模式和子空间
【6h】

使用长度递减支持度挖掘兴趣频繁模式和子空间

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景

1.2国内外研究现状

1.3本文的工作

1.3.1研究目标

1.3.2研究内容

1.3.3组织结构

第二章预备知识:频繁模式挖掘

2.1频繁模式的高效挖掘算法

2.1.1基本挖掘方法:apriori,FP-growth,eclat

2.1.2挖掘闭包和最大频繁项集

2.1.3频繁序列

2.1.4挖掘结构模式:图、树、格

2.2挖掘兴趣频繁模式

2.2.1基于约束的挖掘

2.2.2挖掘压缩的模式或近似的模式

2.2.3从频繁模式到兴趣度和相关性分析

2.3频繁模式对数据分析和挖掘任务的影响

2.3.1基于频繁模式的分类

2.3.2基于频繁模式的簇分析

2.4应用

2.4.1复杂结构数据的检索和相似搜索

2.4.2多媒体数据挖掘

2.4.3挖掘数据流

2.4.4网络挖掘

2.4.5生物医学和DNA数据分析

2.5频繁模式挖掘的研究方向

2.6结论

第三章在长度递减支持度约束条件下挖掘频繁闭包项集

3.1相关工作

3.2有关术语和定义

3.3数据结构

3.4搜索策略

3.5闭包检测方法

3.6剪枝策略

3.6.1无效前缀剪裁

3.6.2基于SVE性质的剪裁

3.7算法描述

3.8优化方法

3.9算法分析与比较

3.9.1测试环境和数据集

3.9.2实验结果

3.10总结

第四章子空间聚类分析

4.1子空间聚类理论

4.1.1聚类分析

4.1.2挑战和目标

4.2子空间聚类算法的分类

4.2.1数值型数据集的子空间聚类

4.2.2分类型数据集的子空间聚类

4.2.3子空间选择算法

4.3应用

4.3.1网络文本挖掘

4.3.2 DNA微点阵分析

4.5总结

第五章 LDS-频繁模式在子空间聚类中的应用

5.1研究的动机和内容

5.2子空间质量度量标准

5.2.1总的想法

5.2.2新标准的特点

5.2.3相关概念的形式定义

5.2.4质量度量函数的性质

5.3子空间质量与LDS-频繁闭包模式

5.4搜索兴趣子空间

5.5总结

第六章总结与展望

6.1总结

6.2对进一步工作的展望

参考文献

攻读硕士学位期间发表的论文及所参与基金项目

致谢

展开▼

摘要

频繁模式是指数据集合中的项集、子序列或者子结构,它们出现的频繁度不少于用户设置的阈值。频繁模式在挖掘关联规则、相关规则和数据间的其它有趣关系方面扮演着重要角色,此外它还可用于数据检索、分类、聚类等其它挖掘任务。因此,频繁模式挖掘是一项重要的数据挖掘任务,且已成为数据挖掘研究中的焦点课题。 本文对如何挖掘兴趣频繁模式及其在子空间聚类中的应用进行了研究。重点研究了以下两个问题:LDS-闭包频繁项集的垂直挖掘算法;如何使用LDS-频繁项集评估子空间的质量。本文的研究成果及创新内容主要包括以下几个方面: [1]提出了LDS-闭包频繁项集的垂直挖掘算法——LDS_CLOSED。 [2]提出了两种新的搜索空间剪裁方法:无效前缀剪裁和基于SVE性质的剪裁。 [3]试验结果表明,LDS_CLOSED不仅能够有效地控制频繁模式的数量,而且运行效率也远高于闭包频繁模式挖掘算法。 [4]提出了一种适用于分类数据集的子空间质量度量方法;其特点是无需用户输入一些难以估计的参数,很好地体现了“无指导学习”的观点。 [5]在子空间质量与LDS-(闭包)频繁项集之间建立起联系,从而解释了使用LDS约束条件的合理性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号