基于子集的Apriori算法在MapReduce下的研究

周雯; 孟彩霞; 徐新瑞

首页> 中文期刊> 《信息技术》 >基于子集的Apriori算法在MapReduce下的研究

基于子集的Apriori算法在MapReduce下的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper,based on the frequent item set mining research,by using Hadoop distributed computing framework,proposes a new algorithm named SubApr,which is a parallel algorithm based on Apriori.The new algorithm only needs to scan database twice,processed by assigning data to different Hadoop compute nodes and used Apriori characteristics to pruning on MapReduce.Comparing with the other similar algorithms,it can reduce the storage of data for each compute node,reducing output candidate set,effectively reduces the amount of data communication of large data sets generated during mining,which can improve the efficiency of parallel algorithms.The experimental result shows that the new algorithm is effective and feasible.%文中在频繁项目集挖掘研究的基础上,针对Hadoop分布式计算框架,提出了一种基于子集的Apriori并行改进算法SubApr.该算法扫描数据库两次,将分块数据分配给不同的Hadoop计算节点进行处理,利用Apriori特性并结合MapReduce框架自身特点进行剪枝.该算法与同类算法比较,可以减少各个计算节点的存储数据,达到减少候选项集输出,有效减少了大数据集挖掘过程中产生的大量数据通信,从而提高并行挖掘的效率.实验结果表明,该算法是有效且可行的.

著录项

来源
《信息技术》 |2017年第1期|52-55,58|共5页
作者
周雯; 孟彩霞; 徐新瑞;
展开▼
作者单位

西安邮电大学计算机学院,西安710121;

西安邮电大学计算机学院,西安710121;

西安邮电大学计算机学院,西安710121;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
Hadoop计算框架; 关联规则; 大数据; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 云计算环境下基于MapReduce并行的Apriori算法优化研究 [J] . 李莉 . 自动化与仪器仪表 . 2014,第7期
2. 云计算环境下基于MapReduce的Apriori算法研究 [J] . 谭国强 ,张丹平 . 江西通信科技 . 2012,第002期
3. 基于MapReduce-HBase的Apriori算法的改进与研究 [J] . 程阳 ,章韵 . 南京邮电大学学报（自然科学版） . 2018,第005期
4. 基于MapReduce的改进的Apriori算法及其应用研究 [J] . 赵月 ,任永功 ,刘洋 . 计算机科学 . 2017,第006期
5. 基于云平台MapReduce的Apriori算法研究 [J] . 邵天会 . 电子技术与软件工程 . 2016,第020期
6. 基于云计算模式下的Apriori算法研究 [C] . HUANG Shou-ming ,黄守明 . 第18届全国信息存储技术学术会议 . 2012
7. 电子集市下基于Agent的自动交易理论及方法的研究 [A] . 金琳 . 2005

基于子集的Apriori算法在MapReduce下的研究

摘要

著录项

相似文献

相关主题

期刊订阅