Group-by Query Process in Middleware of Large Scale Data Intensive Systems

机译：组 - 通过大规模数据密集系统中间件查询过程

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Large scale data intensive systems are available in many fields in recent years, and itpsilas a severe challenge for group-by query of large volume of data in a cluster based on shared-nothing architecture. This paper proposes a design of a parallel query engine (PQE) and its asynchronous improvement (APQE) for group-by queries. PQE and APQE support for pipelined query processing and develop maximum degree of pipeline parallelism. APQE further eliminates the synchronous overhead of multi nodes parallelism, and returns part of final result as early as possible if no data dependency exists. Experimental results demonstrate that, compared to previous 2-step query engine, PQE and APQE can make a significant performance improvement for group-by query of large data sets in a shared-nothing cluster system, as well as obviously better scalability.

机译：近年来许多领域的大规模数据密集型系统可在许多领域获得，并且ITPSilas基于共享无线架构的集群中大量数据查询的群体严重挑战。本文提出了一种单独的查询引擎（PQE）和其异步改进（APQE）的设计，用于逐个查询。 PQE和APQE支持流水线查询处理，并制定最大程度的管道并行度。 APQE进一步消除了多节点并行性的同步开销，如果不存在数据依赖性，则尽早返回最终结果的一部分。实验结果表明，与之前的2步查询引擎相比，PQE和APQE可以对分组的大数据集进行大规模的性能改进，并且在共享的集群系统中，以及明显更好的可扩展性。

著录项

来源
《International Conference on Networking, Architecture, and Storage》|2009年||共8页
会议地点
作者

展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP393-53;
关键词
middleware; pipeline processing; query processing; asynchronous improvement; cluster system; group-by query process; large scale data intensive system; multinods parallelism; parallel query engine; pipeline parallelism; pipelined query processing; synchronous overhead; asynchronous pipeline; group-by query; result merge;

机译：中间件;管道处理;查询处理;异步改进;群集系统;按查询过程;大规模数据密集型系统;多边形并行发动机;管道并行;流水线查询处理;同步开销;异步管道;逐个ruber;结果合并;

相似文献

外文文献
中文文献
专利

1. Processing κ-skyband, constrained skyline, and group-by skyline queries on incomplete data [J] . Yunjun Gao, Xiaoye Miao, Huiyong Cui, Expert Systems with Application . 2014,第10期

机译：处理不完整数据的κ天波段，受约束的天际线和逐组天际线查询
2. A research agenda for query processing in large-scale peer data management systems [J] . Katja Hose, Armin Roth, Andre Zeitz, Information Systems . 2008,第7a8期

机译：大规模对等数据管理系统中查询处理的研究议程
3. An Efficient Middleware for Storing and Querying XML Data in Relational Database Management System [J] . Mohammed Adam Ibrahim Fakheraldien, Jasni Mohamad Zain, Norrozila Sulaiman Journal of computer sciences . 2011,第2期

机译：关系数据库管理系统中用于存储和查询XML数据的高效中间件
4. Group-by Query Process in Middleware of Large Scale Data Intensive Systems [C] . International Conference on Networking, Architecture, and Storage . 2009

机译：组 - 通过大规模数据密集系统中间件查询过程
5. A framework for ranking data sources and query processing sites in database middleware systems. [D] . Valenzuela Andrade, Eliana. 2009

机译：在数据库中间件系统中对数据源和查询处理站点进行排名的框架。
6. EAGLE—A Scalable Query Processing Engine for Linked Sensor Data [O] . Hoan Nguyen Mau Quoc, Martin Serrano, Han Mau Nguyen, 2019

机译：EAGLE-用于链接传感器数据的可扩展查询处理引擎
7. Semantic Query Routing and Processing in P2P Database Systems: The ICS-FORTH SQPeer Middleware [O] . The Ics-forth, Sqpeer Middleware, George Kokkinidis, 2007

机译：P2P数据库系统中的语义查询路由和处理：ICS-FORTH SQPeer中间件
8. Interactive Query Processing in Big Data Systems: A Cross Industry Study of MapReduce Workloads. [R] . R. H. Katz S. Alspaugh Y. Chen 2012

机译：大数据系统中的交互式查询处理：mapReduce工作负载的跨行业研究。

Group-by Query Process in Middleware of Large Scale Data Intensive Systems

摘要

著录项

相似文献

相关主题

期刊订阅