公开/公告号CN113822542A
专利类型发明专利
公开/公告日2021-12-21
原文格式PDF
申请/专利权人 天元大数据信用管理有限公司;
申请/专利号CN202111006048.X
申请日2021-08-30
分类号G06Q10/06(20120101);G06Q10/10(20120101);G06Q50/26(20120101);G06K9/62(20060101);G06F16/215(20190101);
代理机构37100 济南信达专利事务所有限公司;
代理人郗艳荣
地址 250100 山东省济南市高新区浪潮路1036号浪潮科技园S01楼23层
入库时间 2023-06-19 13:46:35
技术领域
本发明涉及技术评分与平台建设技术领域,特别涉及一种基于政务大数据的企业征信平台构建方法。
背景技术
企业信用信息基础数据库是银行征信系统的重要组成部分。
从技术研发流程上,银行征信系统通过专线与商业银行等金融机构总部相连,并通过商业银行的内联网系统将终端延伸到商业银行分支机构信贷人员的业务柜台,进行数据采集、存储,并生成征信报告供外界查询。
在整个研发流程上,银行征信报告没有推出信用指标体系与信用分,银行在应用纯线上信贷过程中,需要自己提取指标、进行指标加工,也需要自己构建模型,实现风控流程的自动化,这对地方金融服务平台面向的地方的、科技实力不是很强的金融机构来说,难度比较大。
基于上述问题,本发明提出了一种基于政务大数据的企业征信平台构建方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于政务大数据的企业征信平台构建方法。
本发明是通过如下技术方案实现的:
一种基于政务大数据的企业征信平台构建方法,其特征在于:包括以下步骤:
第一步,制定数据标准及数据标准化
基于开放的政务数据,整合形成标准数据资源目录;依据标准数据目录制定的数据加工标准,对政务数据进行清洗加工,将原始数据转换成标准数据;并对主键存在差异的表数据进行融合;
第二步,生成标准数据接口,指标提取与加工
基于政务数据标准字段以及当前金融机构放贷实践,提取风控指标,并对风控指标字段进行分层提取和加工计算;
第三步,建立并训练企业信用评价模型
采用深度学习建立企业信用评价模型,并对其进行训练;利用训练好的企业信用评价模型预测企业违约概率,并进行标准评分卡转换,将计算的企业违约概率转成企业标准信用分;
第四步,生成信用报告模板
为了应对不同地区开放的政务数据存在的差异,采用定制版报告生成信用报告模板,使其满足银行信审部门进行信审过程中的信息需求,为银行信审部门提高所需的必要信息。
所述第一步中,标准数据资源目录包括企业评价类的市场监管数据,单位社保公积金缴纳数据,企业纳税数据,司法数据,自然资源以及水电气数据和个人数据,个人数据包括个人公积金社保数据和房产数据。
所述第一步中,对标准数据中各表的主键相似度进行计算,当主键相似度超过预设的阈值时,对表数据进行融合,以充分利用政务数据,提取更多风控指标。
所述第一步中,以企业主标签为表数据的主键,所述企业主标签包括企业名称,统一社会信用代码,法定代表人姓名,所属行业,经营地址,注册日期以及企业类型。
所述第二步中,对风控指标字段进行分层时,将一级指标分为企业与个人两大维度;将二级指标分为偿债能力、偿债意愿、基本素质、发展潜力、信用记录和行业发展六大维度;三级指标为根据标准字段提取的具体指标;
对风控指标字段进行加工计算时,先定义指标加工逻辑,然后基于标准化后的数据字段进行加工计算。
所述第三步中,选择训练样本,确定模型网络结构,选择激活函数,通过确认损失函数、迭代次数与学习速率确定网络权重寻优策略,采用深度学习建立企业信用评价模型。
所述第三步中,对训练样本中的好样本与坏样本的信用评分分布情况进行检验和调整,最终输出企业信用评分及信用等级,完成对企业信用评价模型的训练。
所述第四步中,银行信审部门提高所需的必要信息包括企业基本信息、经营信息和信用信息;
所述经营信息包括社保缴纳、纳税信息和水电信息,所述信用信息包括司法信息、行政处罚和认定信息。
本发明的有益效果是:该基于政务大数据的企业征信平台构建方法,充分利用个地区开放的政务数据,能够为金融机构提供更多的评价维度,极大丰富了基于企业信贷数据的人行征信报告;同时,提供了企业信用指标接口,金融机构可以直接接入指标服务风控策略流程,应用方便,适宜推广应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1为本发明基于政务大数据的企业征信平台构建方法示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
政务大数据的开放共享目前已经成为地方政府服务小微企业、服务实体经济的重要手段,要实现这个目标,基于政务数据打造企业征信平台是一个重要环节。
该基于政务大数据的企业征信平台构建方法,包括以下步骤:
第一步,制定数据标准及数据标准化
基于开放的政务数据,整合形成标准数据资源目录;依据标准数据目录制定的数据加工标准,对政务数据进行清洗加工,将多源、异构,杂乱、低质的原始数据转换成完整、一致,准确规范的标准数据;并对主键存在差异的表数据进行融合;
第二步,生成标准数据接口,指标提取与加工
基于政务数据标准字段以及当前金融机构放贷实践,提取风控指标,并对风控指标字段进行分层提取和加工计算;
第三步,生成风控模型接口,建立并训练企业信用评价模型
采用深度学习建立企业信用评价模型,并对其进行训练;利用训练好的企业信用评价模型预测企业违约概率,并进行标准评分卡转换,将计算的企业违约概率转成企业标准信用分;
第四步,生成信用报告模板
为了应对不同地区开放的政务数据存在的差异,采用定制版报告生成信用报告模板,使其满足银行信审部门进行信审过程中的信息需求,为银行信审部门提高所需的必要信息。
所述第一步中,标准数据资源目录包括企业评价类的市场监管数据,单位社保公积金缴纳数据,企业纳税数据,司法数据,自然资源以及水电气数据和个人数据,个人数据包括个人公积金社保数据和房产数据。
所述第一步中,对标准数据中各表的主键相似度进行计算,当主键相似度超过预设的阈值时,对表数据进行融合,以充分利用政务数据,提取更多风控指标。
所述第一步中,以企业主标签为表数据的主键,所述企业主标签包括企业名称,统一社会信用代码,法定代表人姓名,所属行业,经营地址,注册日期以及企业类型。
所述第二步中,对风控指标字段进行分层时,将一级指标分为企业与个人两大维度;将二级指标分为偿债能力、偿债意愿、基本素质、发展潜力、信用记录和行业发展六大维度;三级指标为根据标准字段提取的具体指标;
对风控指标字段进行加工计算时,先定义指标加工逻辑,然后基于标准化后的数据字段进行加工计算。
所述第三步中,选择训练样本,确定模型网络结构,选择激活函数,通过确认损失函数、迭代次数与学习速率确定网络权重寻优策略,采用深度学习建立企业信用评价模型。
所述第三步中,对训练样本中的好样本与坏样本的信用评分分布情况进行检验和调整,最终输出企业信用评分及信用等级,完成对企业信用评价模型的训练。
所述第四步中,银行信审部门提高所需的必要信息包括企业基本信息、经营信息和信用信息;
所述经营信息包括社保缴纳、纳税信息和水电信息,所述信用信息包括司法信息、行政处罚和认定信息。
与现有技术相比,该基于政务大数据的企业征信平台构建方法,具有以下特点:
第一、按照相应国家标准对开放共享的政务大数据进行标准化治理,构建了一套金融机构认可的、能够充分反映企业经营状况及信用状况的指标体系,并基于此体系构建了企业信用评价模型;
第二、通过打造企业信用报告模板,将企业基本信息、信用评价、经营信息、信用状况等通过前端页面的形式展示到信用报告中,银行等金融机构可以直接接入指标服务风控策略流程,依照企业名称、统一社会信用代码及企业授权,从征信平台中查询企业信用报告。
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
机译: 政务决策的专家支持应用系统平台及其构建方法
机译: 大数据的企业产品开发战略基准的产品链制作方法,大数据的企业产品开发战略基准的产品链制作方法和存储产品开发战略基准的产品链存储程序的存储介质公司使用大数据
机译: 构建基于图形的通信操作的数据平台