Job-Optimized Map-Side Join Processing Using MapReduce and HBase with Abstract RDF Data

机译：使用MapReduce和HBase与抽象RDF数据进行作业优化的Map-Side连接处理

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

The amount of RDF data being published on the Web is increasing at a massive rate. MapReduce-based distributed frameworks have become the general trend in processing SPARQL queries against the RDF data. Currently, query processing systems that use MapReduce have not been able to keep up with increases in semantic annotated data, resulting in non-interactive SPARQL query processing. The principal reason is that intermediate query results from join operations in a MapReduce framework are so massive that network bandwidth and hard disk drive I/O speeds may not keep pace with the processing speed. In this paper, we present an efficient SPARQL processing system that uses MapReduce and HBase. The system runs a job optimized query plan using our proposed abstract RDF data to decrease the amount of intermediate data, thus resulting in faster query processing performance. We also present an efficient algorithm of using Map-side joins while also using the abstract RDF data to filter out unneeded RDF data. Experimental results show that the proposed approach demonstrates better performance when processing queries with a large set of inputs than those found in previous works.

机译：在Web上发布的RDF数据的量以大量速度增加。基于MapReduce的分布式框架已成为处理对RDF数据的SPARQL查询的一般趋势。目前，使用MapReduce的查询处理系统尚未能够跟上语义注释数据的增加，从而导致非交互式SPARQL查询处理。主要原因是MapReduce框架中加入操作的中间查询结果如此大量，网络带宽和硬盘驱动器I / O速度可能不会与处理速度保持速度。在本文中，我们提出了一个使用MapReduce和HBase的有效的SPARQL处理系统。系统使用我们提出的抽象RDF数据运行作业优化的查询计划，以减少中间数据的量，从而导致更快的查询处理性能。我们还提供了一种使用映射侧连接的有效算法，同时还使用抽象的RDF数据来过滤掉不需要的RDF数据。实验结果表明，当使用比以前的作品中的那些输入有大量输入的查询处理查询时，该方法表明了更好的性能。

著录项

来源
《IEEE/WIC/ACM International Conference on Web Intelligence》|2015年|425-432|共8页
会议地点
作者
Hyunsuk Oh; Sejin Chun; Sungkwang Eom; Kyong-Ho Lee;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Distributed SPARQL Query Processing; Map Side Join Processing; RDF Store; Semantic Data;

机译：分布式SPARQL查询处理;地图侧联接处理; RDF存储;语义数据;

相似文献

外文文献
中文文献
专利

1. Map-Side Join Processing of SPARQL Queries Based on Abstract RDF Data Filtering [J] . Song Minjae, Oh Hyunsuk, Seo Seungmin, Journal of database management . 2019,第1期

机译：基于抽象RDF数据过滤的SPARQL查询的地图侧联接处理
2. Map-Side Join Processing of SPARQL Queries Based on Abstract RDF Data Filtering [J] . Song Minjae, Oh Hyunsuk, Seo Seungmin, Journal of database management . 2019,第1期

机译：基于抽象RDF数据过滤的SPARQL查询的Map-Side加入处理
3. Review of Large-Scale RDF Data Processing in MapReduce [J] . Ke Hou, Jing Zhang, Xing Fang Journal of Software Engineering . 2015,第1期

机译：MapReduce中大规模RDF数据处理的回顾
4. Job-Optimized Map-Side Join Processing Using MapReduce and HBase with Abstract RDF Data [C] . Hyunsuk Oh, Sejin Chun, Sungkwang Eom, IEEE/WIC/ACM International Conference on Web Intelligence . 2015

机译：使用MapReduce和HBase具有抽象RDF数据的工作优化的地图侧加入处理
5. Distributed SPARQL over Big RDF Data, A Comparative Analysis Using Presto and MapReduce. [D] . Mammo, Mulugeta. 2014

机译：在大型RDF数据上进行分布式SPARQL，使用Presto和MapReduce进行比较分析。
6. An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics [O] . Ronald C Taylor 2010

机译：Hadoop / MapReduce / HBase框架及其在生物信息学中的当前应用概述
7. Cascading map-side joins over HBase for scalable join processing [O] . Przyjaciel-Zablocki, Martin, Schätzle, Alexander, Hornung, Thomas, 2012

机译：通过HBase级联映射端连接以实现可伸缩连接处理
8. Interactive Query Processing in Big Data Systems: A Cross Industry Study of MapReduce Workloads. [R] . R. H. Katz S. Alspaugh Y. Chen 2012

机译：大数据系统中的交互式查询处理：mapReduce工作负载的跨行业研究。

Job-Optimized Map-Side Join Processing Using MapReduce and HBase with Abstract RDF Data

摘要

著录项

相似文献

相关主题

期刊订阅