首页> 中国专利> 一种进行业务数据质量检核的方法和系统

一种进行业务数据质量检核的方法和系统

摘要

本发明公开了一种进行业务数据质量检核的方法和系统,该方法为:定义业务数据标准,并定义所述业务数据标准对应的质量要求,以此获得相应的标准集合;依据业务数据标准对应的质量要求,定义数据质量检核方法和模型,以此获得相应的数据质量检核规则集合;获取待质量检核的业务源数据,并配置应用数据质量检核规则和检核方法,形成业务数据质量检核方案集合;对业务数据检核方案进行配置执行,以此获得业务数据质量问题数据列表。本发明的进行业务数据质量检核的方法和系统能够保证源数据中的每一项数据均能够获得有效和准确的质量检核,依照数据质量问题报告对业务数据进行数据治理,从而实现数据质量的全面提升和数据资产的价值提升。

著录项

  • 公开/公告号CN112667622A

    专利类型发明专利

  • 公开/公告日2021-04-16

    原文格式PDF

  • 申请/专利权人 吉林银行股份有限公司;

    申请/专利号CN202110019064.6

  • 发明设计人 邹帮山;赵洋;李成功;温强;

    申请日2021-01-07

  • 分类号G06F16/215(20190101);G06F16/28(20190101);

  • 代理机构11210 北京纽乐康知识产权代理事务所(普通合伙);

  • 代理人刘艳艳

  • 地址 130000 吉林省长春市经济开发区东南湖大路1817号

  • 入库时间 2023-06-19 10:38:35

说明书

技术领域

本发明涉及数据资产质量管理技术领域,具体来说,涉及一种进行业务数据质量检核的方法和系统。

背景技术

在信息管理与信息系统领域中,数据资产是重要的核心价值所在。随着信息技术的不断发展和信息系统间的深入融合和集成共享,数据资产的质量问题显得尤为重要。影响数据资产质量的主要因素包括数据的真实性、完整性、准确性、数据成本、安全性。

目前数据资产的质量检核存在以下问题:

(1)需求定制化

根据用户的数据质量需求,定制数据质量检核方案,进行需求的定制化平台开发,以达到对业务数据质量检核目的。这种方法存在着通用性和适应性方面的缺点,新增系统或者增加变更数据质量检核要求,都需要进行定制化开发工作,系统开发周期长,效率底下。

(2)数据质量检核规则缺少通用性

目前的数据质量检核规则都与待检核信息系统相关联,每一个系统中的数据都有着个性化的定义,针对每个系统制定独立的检核规则。这种方法存在着工作量大、实施周期长、扩展性差的缺点,每当有新的系统上线或原有系统更新,都需要进行质量检核规则的调整和开发,运维成本高,不易扩展。

发明内容

针对相关技术中的上述技术问题,本发明提出一种动态进行业务数据质量检核的方法和系统,能够克服现有技术的上述不足。

为实现上述技术目的,本发明的技术方案是这样实现的:

一种进行业务数据质量检核的方法,包括以下步骤:

S1 定义业务数据标准,并定义所述业务数据标准对应的质量要求,以此获得相应的标准集合;

S2 依据业务数据标准对应的质量要求,定义数据质量检核方法和模型,以此获得相应的数据质量检核规则集合;

S3 获取待质量检核的业务源数据,并配置应用数据质量检核规则和检核方法,形成业务数据质量检核方案集合;

S4 对业务数据检核方案进行配置执行,以此获得业务数据质量问题数据列表。

进一步地,所述步骤S1具体包括:

S101 对业务数据标准分类进行定义,获取业务数据标准的分类集合;

S102 根据步骤S101中定义的业务数据标准分类定义详细的业务数据标准,形成标准的唯一编号、标准中文名称、业务数据定义、业务规则等业务属性集合;

S103 依据定义的业务属性集合,定义数据标准的数据类型、值域、代码编码规则、数据格式、计量单位等技术属性集合;

S104 对定义的数据标准,进行数据查重处理校验,以此获得相应的数据标准集合。

进一步地,所述步骤S2具体包括:

S201 根据步骤S1所述业务数据标准中的业务数据定义、业务规则,从数据质量的规范性、完整性、唯一性、一致性方面,定义数据质量检核的规则方法标准库;

S202 根据所述业务数据标准中的技术属性中数据类型为代码值类的,定义元数据代码值域的数据质量规则方法标准库;

S203 依据数据质量检核的规则方法标准库和元数据代码值域的数据质量规则方法标准库,生成业务数据质量检核模型。

进一步地,所述步骤S3具体包括:

S301 获取待质量检核的业务源数据的类型,与数据标准集合进行对照映射,生成业务数据质量检核的字段列表集合;

S302 根据业务数据对照映射结果和数据质量检核模型,选择数据的规范性、完整性、唯一性、一致性检核规则和检核方法;

S303 依据选择的业务数据质量检核规则和检核方法,生成业务数据质量检核方案。

进一步地,所述步骤S4具体包括:

S401 获取已定义的数据质量检核方案,配置方案检测时间计划;

S402 依据定义的数据质量检核方案执行计划,自动执行业务数据检核;

S403 按照业务数据项自动生成存在质量问题的数据列表和数据检核报告,进行业务数据质量的持续提升。

根据本发明的另一方面,提供了一种进行业务数据质量检核的系统,包括:

数据标准管理模块,用于定义业务数据标准和质量要求的数据集合;

检核模型和检核规则配置模块,用于对所述数据标准管理模块定义的数据标准和数据质量要求,进行定义数据检核模型,以此获得数据质量检核的规则方法标准库;

数据适配和数据采集获取模块,用于对源系统进行配置,自动化采集源系统的业务数据集合;

数据检核和质量报告生成模块,用于通过所述检核模型和检核规则配置模块配置数据检核方案,并对所述数据适配和数据采集获取模块采集的源系统数据进行定时轮询的质量检核,以此获得数据质量报告。

进一步地,所述数据标准管理模块包括:

数据标准子模块,用于管理标准分类信息和数据标准信息,以此确定数据标准的唯一编号、业务属性和技术属性,形成数据标准集合;

维度值子模块,用于代码维度分类和代码值域的管理,以此确定代码标准的内容,形成维度值集合。

进一步地,所述检核模型和检核规则配置模块包括:

标准检核规则库子模块,用于定义标准化的数据质量检核规则库,配置标准检核规则,以此获得数据质量检核的规则方法标准库;

检核模型子模块,用于预先定义业务数据标准化的质量检核模型,选择数据的规范性、完整性、唯一性和一致性检核规则和检核方法,以此获得数据检核方案。

进一步地,所述数据适配和数据采集获取模块包括:

数据适配子模块,用于根据源数据的种类,从数据库、文件、文本等配置自动化采集方式,以此形成数据适配采集规则集合;

数据采集获取子模块,用于依据所述数据适配子模块已定义的数据适配采集规则从各类数据源中采集数据质量检核的源数据,形成源数据集合。

进一步地,所述数据检核和质量报告生成模块包括:

数据检核方案子模块,用于依据数据质量检核模型,自动生成数据检核方案,对业务数据进行定时循环质量检核处理;

质量报告子模块,用于依据数据检核方案子模块在质量检核过程中记录的问题数据,生成业务数据质量检核的报告,提供为业务进行数据修订和质量改善。

本发明的有益效果:本发明的进行业务数据质量检核的方法和系统通过模块化的方式,对业务源数据依据数据标准和检核,以此进行数据标准对标映射、数据质量检核、数据质量问题报告生成,以此获得数据质量问题的明细数据,在数据质量检核领域提出了一种全新的技术实现方式,这样能够保证该源数据中的每一项数据均能够获得有效和准确的质量检核,依照数据质量问题报告对业务数据进行数据治理;能够根据用户的需求自动生成不同的数据质量检核模型,通过灵活的可视化配置快速实现,方法简单易懂,定义新的数据检核系统和检核规则无需二次开发,只需要增加对应适配器及检核模型,即可实现对不同系统、不同类型数据的质量进行定期定时自动化检核,从而实现数据质量的全面提升和数据资产的价值提升;从而实现数据资产内在价值的快速提升。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的进行业务数据质量检核的方法流程图;

图2是根据本发明实施例所述的进行业务数据质量检核的系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,根据本发明实施例所述的进行业务数据质量检核的方法,包括以下步骤:

S1 定义业务数据标准,并定义所述业务数据标准对应的质量要求,以此获得相应的标准集合,具体包括:

S101 对业务数据标准分类进行定义,获取业务数据标准的分类集合;

S102 根据步骤S101中定义的业务数据标准分类定义详细的业务数据标准,形成标准的唯一编号、标准中文名称、业务数据定义、业务规则等业务属性集合;

S103 依据定义的业务属性集合,定义数据标准的数据类型、值域、代码编码规则、数据格式、计量单位等技术属性集合;

S104 对定义的数据标准,进行数据查重处理校验,以此获得相应的数据标准集合;

S2 依据业务数据标准对应的质量要求,定义数据质量检核方法和模型,以此获得相应的数据质量检核规则集合,具体包括:

S201 根据步骤S1所述业务数据标准中的业务数据定义、业务规则,从数据质量的规范性、完整性、唯一性、一致性方面,定义数据质量检核的规则方法标准库;

S202 根据所述业务数据标准中的技术属性中数据类型为代码值类的,定义元数据代码值域的数据质量规则方法标准库;

S203 依据数据质量检核的规则方法标准库和元数据代码值域的数据质量规则方法标准库,生成业务数据质量检核模型;

S3 获取待质量检核的业务源数据,并配置应用数据质量检核规则和检核方法,形成业务数据质量检核方案集合,具体包括:

S301 获取待质量检核的业务源数据的类型,与数据标准集合进行对照映射,生成业务数据质量检核的字段列表集合;

S302 根据业务数据对照映射结果和数据质量检核模型,选择数据的规范性、完整性、唯一性、一致性检核规则和检核方法;

S303 依据选择的业务数据质量检核规则和检核方法,生成业务数据质量检核方案;

S4 对业务数据检核方案进行配置执行,以此获得业务数据质量问题数据列表,具体包括:

S401 获取已定义的数据质量检核方案,配置方案检测时间计划;

S402 依据定义的数据质量检核方案执行计划,自动执行业务数据检核;

S403 按照业务数据项自动生成存在质量问题的数据列表和数据检核报告,进行业务数据质量的持续提升。

如图2所示,根据本发明实施例所述的进行业务数据质量检核的系统,包括:

数据标准管理模块,用于定义业务数据标准和质量要求的数据集合;

检核模型和检核规则配置模块,用于对所述数据标准管理模块定义的数据标准和数据质量要求,进行定义数据检核模型,以此获得数据质量检核的规则方法标准库;

数据适配和数据采集获取模块,用于对源系统进行配置,自动化采集源系统的业务数据集合;

数据检核和质量报告生成模块,用于通过所述检核模型和检核规则配置模块配置数据检核方案,并对所述数据适配和数据采集获取模块采集的源系统数据进行定时轮询的质量检核,以此获得数据质量报告。

所述数据标准管理模块包括:数据标准子模块,用于管理标准分类信息和数据标准信息,以此确定数据标准的唯一编号、业务属性和技术属性,形成数据标准集合;维度值子模块,用于代码维度分类和代码值域的管理,以此确定代码标准的内容,形成维度值集合。

所述检核模型和检核规则配置模块包括:标准检核规则库子模块,用于定义标准化的数据质量检核规则库,配置标准检核规则,以此获得数据质量检核的规则方法标准库;检核模型子模块,用于预先定义业务数据标准化的质量检核模型,选择数据的规范性、完整性、唯一性和一致性检核规则和检核方法,以此获得数据检核方案。

所述数据适配和数据采集获取模块包括:数据适配子模块,用于根据源数据的种类,从数据库、文件、文本等配置自动化采集方式,以此形成数据适配采集规则集合;数据采集获取子模块,用于依据所述数据适配子模块已定义的数据适配采集规则从各类数据源中采集数据质量检核的源数据,形成源数据集合。

所述数据检核和质量报告生成模块包括:数据检核方案子模块,用于依据数据质量检核模型,自动生成数据检核方案,对业务数据进行定时循环质量检核处理;质量报告子模块,用于依据数据检核方案子模块在质量检核过程中记录的问题数据,生成业务数据质量检核的报告,提供为业务进行数据修订和质量改善。

综上所述,借助于本发明的上述技术方案,本发明的进行业务数据质量检核的方法和系统包括数据标准管理、检核模型管理、检核规则管理、数据适配管理、数据采集管理、质量报告、输出管理,通过数据标准管理定义数据质量的标准化要求,通过检核模型管理根据数据标准和检核规则库定义数据质量检核模型,通过数据适配器和数据采集管理将业务系统数据及元数据输入到检核模型,通过质量报告和数据管理将质量检核结果进行持久化输出,能够依据用户的质量检核个性化需求,通过可视化配置进行系统数据的自动化抽取,同时依据检核规则库动态生成业务数据质量检核模型,实现快速地对不同系统和不同数据进行质量检核工作;同时,新系统和新数据的接入无需任何开发工作,只需配置新的检核方案即可。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号