基于Spark计算框架的分布式文本分类方法研究

首页> 外文期刊>Hans Journal of Data Mining >基于Spark计算框架的分布式文本分类方法研究

【24h】

基于Spark计算框架的分布式文本分类方法研究

机译：基于Spark计算框架的分布式文本分类方法研究

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统文本分类算法在面对日益增多的海量文本数据时效率低下的问题，论文在Spark计算框架上设计并实现了一种并行化朴素贝叶斯文本分类器，并着重介绍了基于Spark计算框架的文本分类实现过程。实验阶段，分别在单机、Map Reduce和Spark三种不同的计算框架下测试了文本分类的效率，并使用控制变量的方法在Spark计算框架下设计对照实验。实验证明，Spark计算框架下的朴素贝叶斯算法在面对海量文本分类时有着较高的处理效率。

机译：针对传统文本分类算法在面对日益增多的海量文本数据时效率低下的问题，论文在Spark计算框架上设计并实现了一种并行化朴素贝叶斯文本分类器，并着重介绍了基于Spark计算框架的文本分类实现过程。实验阶段，分别在单机、Map Reduce和Spark三种不同的计算框架下测试了文本分类的效率，并使用控制变量的方法在Spark计算框架下设计对照实验。实验证明，Spark计算框架下的朴素贝叶斯算法在面对海量文本分类时有着较高的处理效率。

著录项

来源
《Hans Journal of Data Mining》 |2018年第4期|共11页
作者

展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类计算技术、计算机技术;
关键词

相似文献

外文文献
中文文献
专利

1. 基于Spark分布式支持向量机的TMS数据纠错方法研究 [J] . Computer Science and Application . 2020,第4期

机译：基于Spark分布式支持向量机的TMS数据纠错方法研究
2. 基于云计算的分布式实时渲染研究 [J] . Computer Science and Application . 2018,第1期

机译：基于云计算的分布式实时渲染研究
3. 一种基于分布式计算机系统的新型飞机配电系统 [J] . 杨善水, 付大丰, 严仰光南京航空航天大学学报（英文版） . 2001,第002期

机译：一种基于分布式计算机系统的新型飞机配电系统
4. 分布式流媒体框架的分析与比较 [C] . 8th Joint International Computer Conference Nov 7-9, 2002 Ningbo China . 2002

机译：分布式流媒体框架的分析与比较
5. 基于CT检查的正位定位像计算等效水直径 [O] . 梁保辉 (Baohui LIANG), 付亚军 (Yajun FU), 曹明娜 (Mingna CAO) 2020

机译：基于CT检查的正位定位像计算等效水直径
6. 网格计算在文本分类中的应用 [O] . 杜志文, 曾文华 2006

机译：网格计算在文本分类中的应用

基于Spark计算框架的分布式文本分类方法研究

摘要

著录项

相似文献

相关主题

期刊订阅