首页> 外国专利> METHOD AND SYSTEM FOR INTEGRATING DATA FROM DIFFERENT DATA SOURCES INTO A KNOWLEDGE GRAPH STORAGE UNIT

METHOD AND SYSTEM FOR INTEGRATING DATA FROM DIFFERENT DATA SOURCES INTO A KNOWLEDGE GRAPH STORAGE UNIT

机译:用于将数据从不同数据源集成到知识图形存储单元的方法和系统

摘要

The present invention relates to a method for integrating data from different data sources (210, 220, 230, 240, 250) into a knowledge graph storage unit (300), comprising (a) transferring (S10) data from different data sources (210, 220,230,240, 250) into a receiving and extraction module (410) of an extraction-transformation-loading, ETL, data pipeline framework (400); (b) extracting (S20) the loaded data in the receiving and extraction module (410) by using an extraction data frame and transferring the extracted data to a transformation module (420) of the ETL data pipeline framework (400); (c) transforming (S30) the extracted data in the trans- formation module (420) by using transformation functionalities and transferring the transformed data to a mapping module (430) of the ETL data pipeline framework (400); (d) mapping (S40) the transformed data in the mapping module (430) by using mapping rule functionalities and transferring the mapped data to a post-processing module (440) of the ETL data pipeline framework (400); (e) post-processing the mapped data in the post- processing module (440) by using a library and transferring the post-processed data to a loading module (450) of the ETL data pipeline framework (400); and (f) loading the processed data by the loading module (450) to the knowledge graph storage unit (300); wherein the mapping module (430) uses a JSON-based mapping notation to convert the transformed data into a serialized form.
机译:本发明涉及一种用于将来自不同数据源(210,220,230,240,250)的数据集成到知识图存储单元(300)中,包括来自不同数据源的(a)传送(S10)数据(210 ,220,230,240,250)进入提取变换加载,ETL数据管道框架(400)的接收和提取模块(410); (b)通过使用提取数据帧提取(S20)在接收和提取模块(410)中加载的数据并将提取的数据传送到ETL数据流水线框架(400)的变换模块(420); (c)通过使用变换函数将变换的数据传输到ETL数据流水线框架(400)的映射模块(430)中的转换模块(420)中的提取数据(420)中提取的数据; (d)映射(S40)通过使用映射规则功能并将映射的数据传送到ETL数据流水线框架(400)的后处理模块(400)中的映射模块(430)中的变换数据。 (e)通过使用库并将后处理的数据传送到ETL数据流水线框架(400)的加载模块(400),在后处理模块(440)中处理映射数据。 (f)通过装载模块(450)将处理的数据加载到知识图形存储单元(300);其中映射模块(430)使用基于JSON的映射符号来将变换的数据转换为序列化形式。

著录项

  • 公开/公告号EP3847557A1

    专利类型

  • 公开/公告日2021-07-14

    原文格式PDF

  • 申请/专利权人 SIEMENS AKTIENGESELLSCHAFT;

    申请/专利号EP20190801715

  • 发明设计人 HASAN RAKEBUL;

    申请日2019-10-30

  • 分类号G06F16/27;G06F16/248;

  • 国家 EP

  • 入库时间 2022-08-24 19:55:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号