首页> 外国专利> SYSTEM AND METHOD FOR AUTOMATIC DATA ENRICHMENT FROM MULTIPLE PUBLIC DATASETS IN DATA INTEGRATION TOOLS

SYSTEM AND METHOD FOR AUTOMATIC DATA ENRICHMENT FROM MULTIPLE PUBLIC DATASETS IN DATA INTEGRATION TOOLS

机译:从数据集成工具中的多个公共数据集中自动富集数据的系统和方法

摘要

A source dataset is enriched by standardization of address data, date and time analysis, and demographic analysis. The enriched source dataset is used to form one or more distinct clusters that are unique combinations of values for one or more attributes of the enriched source dataset. One or more related datasets are found for each of the clusters, and the related datasets are merged into the enriched source dataset using a distributed join operation, wherein the distributed join allows each row of the source dataset to be joined with a different one of the related datasets, where the different one of the related datasets is closest to the cluster to which the row belongs.
机译:通过地址数据的标准化,日期和时间分析以及人口统计分析来丰富源数据集。丰富的源数据集用于形成一个或多个不同的群集,这些群集是丰富的源数据集的一个或多个属性的值的唯一组合。找到每个聚类的一个或多个相关数据集,并使用分布式连接操作将相关数据集合并到丰富的源数据集中,其中分布式连接允许源数据集的每一行与数据库中的不同数据集连接。相关数据集,其中不同的相关数据集之一最接近该行所属的集群。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号