首页> 中文学位 >大数据环境下农业数字资源存储与分析技术研究
【6h】

大数据环境下农业数字资源存储与分析技术研究

代理获取

目录

封面

声明

硕士学位论文评阅人、答辩委员会签名表

中文摘要

英文摘要

目录

第一章 引 言

1.1 论文研究背景及意义

1.2 国内外研究进展

1.3 主要研究内容与章节安排

第二章 大数据存储与分析工具

2.1 Hadoop

2.2 Hbase列式存储数据库

2.3 Spark大数据分析计算平台

2.4 本章小结

第三章 大数环境下农业数字资源存储与应用技术体系

3.1 基于大数据技术的农业数字资源存储框架设计

3.2 基于大数据技术的农业数字资源分析应用框架设计

3.3 基于大数据技术的农业数字资源存储与挖掘分析平台构建

3.3 本章小结

第四章 基于Hbase的农业数字资源存储实现

4.1 Hbase优势分析

4.2 基于Hbase的农产品贸易数据存储实例

4.4 测试与分析

4.5 本章小结

第五章 基于Spark的农业数字资源分析与应用

5.1 Spark处理技术优势分析

5.2 基于Spark的农产品贸易数据分析应用

5.3 本章小结

第六章 总结与展望

6.1 论文工作总结

6.2 未来工作展望

参考文献

致谢

作者简介

展开▼

摘要

随着互联网技术的广泛普及与飞速发展,整个社会各种类型的数据总量飞速增长,我们正在步入大数据时代。在大数据时代数字图书馆面临着两个关键性问题:海量数字资源的高速检索和数字资源的深度挖掘与分析。传统的基于关系型数据库的技术体系在面对海量数据的检索和应用在性能上要面临着很大的挑战,所以为了更好地整合存储各类数字资源,提高海量数字资源的应用水平,提供专业化水平更高知识服务,数字图书馆应创新技术体系,适时引入大数据技术以此作为工作的新入口。
  本文以国家农业图书馆馆藏数据资源为对象,分析了国家农业图书馆现有资源的总体情况以及目前国家农业图书馆所使用的技术体系面临的问题,对比当今流行的大数据技术在性能和功能上的优势,提出了一种基于大数据技术的新型数字图书馆数字资源存储与应用的技术框架。此框架整合了 HDFS、Hbase与 Spark大数据存储与处理技术。随后在本研究设计的技术框架的基础上搭建了具有三个节点的实验集群,初步构建了大数据技术平台。
  论文后半部分论述了基于Hbase的大数据存储体系与基于Spark的大数据分析体系的优势,通过实例化的方式实现了基于Hbase的农产品贸易数据的存储与挖掘分析,借此方式对这种新型技术体系进行技术可行性分析与功能探索。本研究所使用的农产品贸易数据在数据存储层采用Hbase进行数据组织并通过HDFS实现数据的分布式存储,并通过实验对比分析基于大数据技术体系的农产品贸易数据库在性能上和关系型数据库优劣,实验结果证明采用论文提出的新型基于大数据技术的技术体系在数据检索效率上远远高于传统关系型数据库。最后利用Spark的高性能机器学习与计算功能,采用新型图计算工具Spark GraphX对农产品贸易数据进行基于复杂网络算法的深度挖掘研究,扩展了农业数字资源的应用场景。
  本研究从基于大数据技术的数据存储、数据检索、数据挖掘等多个方面探索了大数据环境下数字图书馆采用新型分布式数字资源存储与应用的具体实现方式,相比关系型数据库技术体系在性能上有所提升,有一定现实意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号