首页> 中文期刊> 《武汉工程大学学报》 >基于Hive的空气质量大数据查询优化方法

基于Hive的空气质量大数据查询优化方法

         

摘要

为了提高对环境空气质量监测系统中省级环境监测中心站里已汇集的海量监测数据的统计和分析效率,提出了一种基于Spark集群在Hive上进行多维数据分区的查询优化方法.以湖北省环境监测中心站中的空气质量监测数据为研究对象,将数据转移到Spark集群利用Spark SQL连接Hive并进行分区存储.设计了12种查询,查询4个数据集,通过与采用传统查询方法的实验对比得出结论.实验结果表明:基于Hive的分区优化方法对空气质量大数据的查询时间有47%到96%的优化,而随着查询的复杂程度和数据量的增加,该方法的优化效果越明显.

著录项

  • 来源
    《武汉工程大学学报》 |2020年第4期|467-472|共6页
  • 作者单位

    智能机器人湖北省重点实验室(武汉工程大学) 湖北 武汉 430205;

    武汉工程大学计算机科学与工程学院 湖北 武汉 430205;

    智能机器人湖北省重点实验室(武汉工程大学) 湖北 武汉 430205;

    武汉工程大学计算机科学与工程学院 湖北 武汉 430205;

    智能机器人湖北省重点实验室(武汉工程大学) 湖北 武汉 430205;

    武汉工程大学计算机科学与工程学院 湖北 武汉 430205;

    智能机器人湖北省重点实验室(武汉工程大学) 湖北 武汉 430205;

    武汉工程大学计算机科学与工程学院 湖北 武汉 430205;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    Spark; Hive; 空气质量; 大数据; 查询优化;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号