首页> 外文学位 >Cleaning Framework for Big Data
【24h】

Cleaning Framework for Big Data

机译:大数据清洗框架

获取原文
获取原文并翻译 | 示例

摘要

With the advent of big data, more and more data is being generated every day and the data is one of the most valuable assets of any data-related system. The quality of data has received significant attention over the years, since the value of data relies heavily on its quality and usability. Proper use of high-quality data can help people make better predictions, analyses and decisions. Real-world data often contains numerous non-trivial problems which prevent it being used directly, and these problems make data cleaning necessary. Our research harnesses both context and usage patterns of data to identify the same object and link associated objects so that data can be cleaned through association. Our proposed cleaning framework consists of an identification and linkage process, association and repairing process, a ranking process that provides priority based on the severity of data issues, and a mechanism to answer big data queries by accessing small clean data. Our study shows that the proposed approach is able to associate datasets which can benefit the repairing process. Data quality improves significantly by using our approach and the efficiency remains stable.
机译:随着大数据的到来,每天都会生成越来越多的数据,并且数据是任何与数据相关的系统中最有价值的资产之一。多年来,由于数据的价值在很大程度上取决于其质量和可用性,因此数据的质量受到了极大的关注。正确使用高质量数据可以帮助人们做出更好的预测,分析和决策。现实世界中的数据通常包含许多不平凡的问题,这些问题直接阻止了数据的使用,而这些问题使数据清理成为必要。我们的研究利用数据的上下文和使用模式来识别相同的对象并链接关联的对象,以便可以通过关联清除数据。我们提出的清理框架包括标识和链接过程,关联和修复过程,基于数据问题的严重性提供优先级的排序过程,以及通过访问小的清理数据来回答大数据查询的机制。我们的研究表明,所提出的方法能够关联有利于修复过程的数据集。通过使用我们的方法,数据质量显着提高,效率保持稳定。

著录项

  • 作者

    Liu, Hong.;

  • 作者单位

    Oklahoma State University.;

  • 授予单位 Oklahoma State University.;
  • 学科 Computer science.;Information science.
  • 学位 Ph.D.
  • 年度 2017
  • 页码 107 p.
  • 总页数 107
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号