基于闭频繁项集的Web日志挖掘

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息技术的飞速发展,数据库应用的不断深化,数据挖掘已成为当今研究的热点。Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和方向。通过分析和发现Web日志记录中的规律,可以挖掘出Web用户潜在的使用规律和模式,这可被广泛用于发现电子商务中的潜在客户、提高Web服务的质量和效率以及优化企业信息门户性能等领域。然而,传统的基于关联规则的Web日志挖掘方法都是基于一般频繁项的,这类方法往往产生大量的候选规则,且存在大量冗余的规则,对时间和主存空间都是一种挑战。然而,闭频繁项集的数量远小于一般频繁项集,而且通过闭频繁项集可以得到所有的频繁项集,通过闭频繁项集产生的关联规则能得到所有的规则。对此,本文提出了一种基于闭频繁项集的Web日志挖掘算法—CFIs_Webmining,该算法在CHARM_L挖掘产生闭频繁项集格结构的基础上进一步提取最小关联规则,从而在一定程度上解决了以往基于一般频繁项集的关联规则挖掘算法出现的问题。本文首先阐述了课题的研究背景及Web日志挖掘的国内外研究现状,然后对数据挖掘、Web数据挖掘和Web日志挖掘进行了概述;接着在Web日志访问模式挖掘研究方面,重点研究了关联规则及其经典挖掘算法:Apriori算法和CHARM算法;然后介绍了闭频繁项集的概念,及高效挖掘闭频繁项集CHARM算法,还有在CHARM算法基础上挖掘产生闭频繁项集格结构的CHARM_L算法,同时引入了最小关联规则的概念,后两者都是构成CFIs_Webmining的重要组成部分。本文通过大量的实验证明了CFIs_Webmining算法的有效性。最后以周口师范校园网Web日志为数据源,运用本文提出的CFIs_Webmining算法,对经过数据预处理后的日志文件进行分析,得到了有价值的规则,并提出了对改进该网站的建议和改进方法。

著录项

作者
闫英春;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科软件工程
授予学位硕士
导师姓名谭浩;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;
关键词
Web日志挖掘; 关联规则挖掘; 闭频繁项集; 格结构; 最小关联规则;

相似文献

中文文献
外文文献
专利

1. 基于频繁项集挖掘最大频繁项集和频繁闭项集 [J] . 姜晗 ,贾泂 ,徐峰 . 计算机工程与应用 . 2008,第028期
2. 基于频繁闭项集的Web日志挖掘算法 [J] . 秦东霞 ,周航 ,张栋梁 . 周口师范学院学报 . 2012,第002期
3. MRClose：一种基于MapReduce的并行闭频繁项集挖掘算法 [J] . 胡娟 ,肖文 . 电子技术与软件工程 . 2017,第022期
4. 基于闭频繁项集短文本聚类 [J] . 张少磊 ,王忠 . 计算机应用 . 2016,第0z2期
5. 一种基于后缀项表的并行闭频繁项集挖掘算法 [J] . TANG Ying-feng ,CHEN Shi-ping . 计算机应用研究 . 2014,第002期
6. 基于关联规则中闭频繁项集的我所论文作者合著关系研究 [C] . 杨策 ,李彦文 . 中国中医科学院中医药信息研究所2010年学术年会 . 2011
7. 基于位运算的闭频繁项集挖掘算法的研究 [A] . 彭学武 . 2010

基于闭频繁项集的Web日志挖掘

目录

摘要

著录项

相似文献

相关主题

期刊订阅