首页> 中国专利> 一种贷款申请人的贷款信用评估方法、装置及存储介质

一种贷款申请人的贷款信用评估方法、装置及存储介质

摘要

本申请公开了一种贷款申请人的贷款信用评估方法,该方法包括:获取贷款申请人的信息数据;基于信息数据获取特征数据;将特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估;基于信用评估模型输出贷款申请人的贷款信用数据。因此,本申请通过获取贷款申请人的信息数据,并基于信息数据提取的特征数据以及信用评估模型,得到贷款申请人的贷款信用数据,能够提高对贷款申请人的信用评估的准确度。

著录项

  • 公开/公告号CN113283979A

    专利类型发明专利

  • 公开/公告日2021-08-20

    原文格式PDF

  • 申请/专利权人 广州市全民钱包科技有限公司;

    申请/专利号CN202110518830.3

  • 发明设计人 郑建辉;付盼吉;练祥韬;

    申请日2021-05-12

  • 分类号G06Q40/02(20120101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 510000 广东省广州市天河区兴国路21号1903、04、05、06、07房

  • 入库时间 2023-06-19 12:18:04

说明书

技术领域

本申请涉及人工智能技术领域,特别是涉及一种贷款申请人的贷款信用评估方法、装置及存储介质。

背景技术

为满足消费者的需求,金融机构开设了众多类型的业务,贷款业务是众多业务中一项重要业务。金融机构在发放贷款之前通常会对贷款申请人的信用进行评估,然后根据评估结果来决定是否发放贷款以及贷款发放的数额。

目前,通过使用评分卡和征信数据对贷款申请人的信用进行评估,单这种评估方式比较简单和浅显,对贷款申请人的信息挖掘不够深入,导致对于贷款申请人的信用评估结果不是很精确。

发明内容

本申请提供一种贷款申请人的贷款信用评估方法、装置及存储介质,能够提高对贷款申请人信用评估的准确度。

本申请第一方面提供一种贷款申请人的贷款信用评估方法,该方法包括:获取贷款申请人的信息数据;基于信息数据获取特征数据;将特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估;基于信用评估模型输出贷款申请人的贷款信用数据。

可选地,获取贷款申请人的信息数据的步骤,包括:获取贷款申请人在预设时间段内的信息数据,预设时间段为预设的历史时间点到当前时间点之间的一段时间。

可选地,基于信息数据获取特征信息的步骤,包括:按照预设分类规则将信息数据进行分类;按照预设的每类信息数据的第一特征因素获取每类信息的第一特征数据。

可选地:基于第一特征数据按照预设的第二特征因素获取第二特征数据,第二特征因素包括至少两个第一特征因素结合形成的第二特征因素。

可选地,将特征数据输入到信用评估模型的步骤,包括:将第一特征数据和/或第二特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估。

可选地,信息数据包括交易信息数据,交易信息数据对应的第一特征因素包括消费类型、单笔交易值、交易金额总值、交易次数、交易地区,第二特征因素包括交易均值、在特定交易地区的交易金额总值、在特定消费类型下的交易金额总值。

可选地,基于信息数据获取特征数据的步骤,包括:通过卷积神经网络层对信息数据进行特征数据的提取。

可选地,评估模型基于XGBoost模型构建,贷款信用数据包括信用数据、违约数据以及忘记还款数据。

本申请第二方面提供一种用户贷款概率预测装置,该装置包括:获取单元,用于获取贷款申请人的信息数据;处理单元,与获取单元连接,用于基于信息数据获取特征数据;预测单元,与处理单元连接,用于将特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估;输出单元,与预测单元连接,用于基于信用评估模型输出贷款申请人的贷款信用数据。

本申请第三方面提供一种计算机可读存储介质,存储介质存储有程序指令,程序指令被处理器执行时实现上述任一项的贷款申请人的贷款信用评估方法。

本申请至少具备的有益效果是:相较于现有技术,本申请的贷款申请人的贷款信用评估方法通过获取贷款申请人的信息数据,并基于信息数据提取的特征数据以及信用评估模型,得到贷款申请人的贷款信用数据,能够提高对贷款申请人的信用评估的准确度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图;

图2是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图;

图3是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图;

图4是本申请的贷款申请人的贷款信用评估装置的一结构示意图;

图5是本申请的计算机可读存储介质的一实施例的框架示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,在不冲突的情况下,本文所描述的实施例可以与其它实施例相结合。

本申请第一方面提供一种贷款申请人的贷款信用评估方法,本方法可以应用于贷款申请人的贷款信用评估装置中,该装置可以包括手机、电脑、服务器等电子设备。基于本方法,能够提高对贷款申请人信用评估的准确度。

请参阅图1,图1是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图。如图1,本方法包括以下步骤:

S11:获取贷款申请人的信息数据。

贷款申请人即向具有贷款业务的机构申请贷款的人,贷款申请人的信息数据可以包括贷款申请的身份信息数据、画像数据以及交易数据。其中,画像数据是对贷款申请人整体形象进行描述的数据,可以包括贷款申请人的行为、社交、网络等数据,交易数据是贷款申请人日常交易的数据。

具体地,贷款申请人的贷款信用评估装置可以直接获取贷款申请人的信息数据,也可以从其他设备获取,也可以基于外界的人为输入得到。

S12:基于信息数据获取特征数据。

信息数据具有一定的特征属性,例如身份信息数据的年龄特征属性、性别特征属性,社交数据的社交范围特征属性、社交数量特征属性,交易信息数据的交易类型特征属性、交易时间特征属性、交易价格特征属性等等。

值得说明的是,同一类别的信息数据在不同维度具有不同的特征属性,不同维度的特征属性反映了不同的特征属性,不同类别的信息数据具有不同的特征属性。不同类别信息数据的不同特征属性以及相同类别的不同特征属性在多维度上反映了信息数据的特性,这些特征影响着贷款申请人的贷款信用。

S13:将特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估。

信用评估模型是预先训练得到并存储于贷款贷款信用评估装置的,贷款信用评估装置将特征数据输入到信用评估模型,信用评估模型基于特征数据对贷款申请人的贷款信息进行评估。

其中,信用评估模型是基于大量的贷款申请人的信息数据样本和/或特征数据进行训练得到的,不同的信息数据样本和/或特征数据可以对应不同的评估结果,即不同的信息数据样本和/或特征数据可以与不同的评估结果之间可以建立对应关系。

S14:基于信用评估模型输出贷款申请人的贷款信用数据。

信用评估模型根据特征数据与评估结果对应的关系得到评估结果,评估结果可以用贷款信用数据反映,即此时输出贷款申请人的贷款信用数据。

其中,贷款信用数据可以是等级数据,等级越高信用越好,也可以是评分数据,评分越高信用越好。

基于上述内容可知,本申请的贷款申请人的贷款信用评估方法通过获取贷款申请人的信息数据,并基于信息数据提取的特征数据以及信用评估模型,得到贷款申请人的贷款信用数据。因此,上述方法得到的贷款申请人的贷款信用数据基于贷款申请人的信息数据,由此获得的贷款信用数据的准确度较高。

请参阅图2,图2是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图。

具体地,上述步骤S11可以包括:

S21:获取贷款申请人在预设时间段内的信息数据,预设时间段为预设的历史时间点到当前时间点之间的一段时间。

本实施例中,预设时间段为预设的历史时间点到当前时间点之间的一段时间,预设时间段可以是预设的多个不同的时间段。在另一些实施例中,预设时间段也可以是第一历史时间点到第二历史时间点之间的一端时间,第二历史时间点晚于第一历史时间点。在本实施例中,预设时间段的时间长度可以是一周、一个月、三个月、六个月、一年等等。

其中,可以根据贷款申请人的贷款申请额来从多个不同的预设时间段内选择一个时间段,进而获取该时间段内的信息数据。例如,贷款申请人的贷款申请额较大,那么可以选择时间长度较长的一个预设时间段,以保证评估结果的准确性;贷款申请人的贷款申请额较小,那么可以选择时间长度较小的一个预设时间段,以降低后续数据处理量。

上述的步骤S12可以包括:

S22:按照预设分类规则将信息数据进行分类。

获取预设时间段内的信息数据之后,按照预设分类规则将信息数据进行分类。预设的分类规则预先存储于贷款信用评估装置内,预设的分类规则可以是若信息数据为用户的购买商品的数据,则将相应的信息数据分为交易信息数据类,若信息数据为用户的年龄信息数据,那么将相应的信息数据分为身份信息数据类。

其中,按照预设的分类规则可以将信息数据划分为多个类别,不同类别的信息数据反映了申请人在不同维度上的信息。将信息数据分为多个类别,可以在不同维度上反映申请人的信息。

S23:按照预设的每类信息数据的第一特征因素获取每类信息的第一特征数据。

第一特征因素预先存储于贷款信用评估装置中,每类信息数据均具有第一特征因素,不同类别的信息数据的第一特征因素可以完全不同,或者部分相同。

第一特征因素是特定类别的信息数据所具有的特征因素,该特征因素能够反映信息数据的特征属性。例如,交易信息数据中包括时间、地点以及价格等等特征因素。

第一特征因素对应的数据即为第一特征数据,接上述例子,第一特征数据包括时间数据、地点数据以及价格数据等等。

因此,基于上述步骤S22以及步骤S23,得到了不同类别数据的不同特征数据,实现了对信息数据进行了全方面的特征分析并获取到了特征数据。这些特征数据能够全方位的反映申请人在多维度的特点,基于这些特征数据的全面性,能够准确地预测到申请人的贷款信用概率。

具体地,上述步骤S23之后,本方法还可以包括:

S24:基于第一特征数据按照预设的第二特征因素获取第二特征数据,第二特征因素包括至少两个第一特征因素结合形成的第二特征因素。

第一特征数据反映了对应类别的信息数据的特征属性,不同的第一特征因素对应的第一特征数据之间通过第二特征因素可能得到新的特征数据。

在本实施例中,第二特征因素包括至少两个第一特征因素,即第二特征因素是由第一特征因素构成的。例如,第一特征因素为时间、地点,第一特征数据为时间数据以及地点数据,那么第二特征因素可以是时间和地点,第二特征数据为包括时间和地点的数据。

在另一些实施例中,第二特征因素不包括第一特征因素,即第二特征因素为不同于第一特征因素的独立特征因素。例如,第一特征因素为总额、次数,第一特征数据为总额数据、次数数据,第二特征因素为平均额,第二特征数据为平均额数据。

具体地,上述步骤S103可以包括:

S25:将第一特征数据和/或第二特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估。

具体地,可以仅仅将第一特征数据输入到信用评估模型,也可以仅仅将第二特征数据输入到信用评估模型,也可以将第一特征数据以及第二特征数据输入到信用评估模型。

优选地,在一些实施例中,将第一特征数据以及第二特征数据均输入到信用评估模型中,以对贷款申请人的贷款信用进行评估。通过第一特征数据以及第二特征数据对贷款申请人的信用进行评估,可以利用更多的特征数据对贷款申请人的信用进行评估,使得对贷款申请人的信用评估更加准确。

请参阅图3,图3是本申请的贷款申请人的贷款信用评估方法的一实施例的流程示意图。

可选地,信息数据包括交易信息数据,交易信息数据对应的第一特征因素包括消费类型、单笔交易值、交易金额总值、交易次数、交易地区,第二特征因素包括交易均值、在特定交易地区的交易金额总值、在特定消费类型下的交易金额总值。

基于上述实施例,上述步骤S23可以包括:

S31:获取交易信息数据的消费类型、单笔交易值、交易金额总值、交易次数、交易地区的特征因素对应的第一特征数据。

其中,消费类型比如文化消费、餐饮消费、娱乐消费等,交易金额总值可以是所有消费的交易金额值之和。其中,消费类型、交易金额总值、交易次数、交易地区按照预设的规则分别转换成第一特征数据,即消费类型数据、单笔交易值数据、交易金额总值数据、交易次数数据、交易地区数据。例如,文化消费对应的文化消费数据为1,餐饮消费对应的餐饮消费数据为2,娱乐消费对应的娱乐消费数据为3。

上述步骤S24可以包括:

S32:基于消费类型数据、单笔交易值数据、交易金额总值数据、交易次数数据、交易地区数据按照交易均值、在特定交易地区的交易金额总值、在特定消费类型下的交易金额总值的特征因素获取第二特征数据。

即根据交易金额总值数据以及交易次数数据按照交易均值的特征因素可获得对应的交易均值数据,根据交易地区数据以及单笔交易数值数据按照在特定地区的交易金额宗旨的特征因素可获得在特定交易地区的交易金额总值数据,根据消费类型数据以及单笔交易值数据按照在特定消费类型下的交易金额总值的特征因素可获得在特定消费类型下的交易金额总值数据。

应理解,交易均值数据、在特定交易地区的交易金额总值数据、在特定消费类型下的交易金额总值数据,可以较好的反应申请人近期的经济状态,可以用于评估贷款申请人的贷款信用。

在一些实施例中,上述步骤S12可以包括::通过卷积神经网络层对信息数据进行特征数据的提取。

在一些实施例中,评估模型可以基于XGBoost模型构建,贷款信用数据包括信用数据、违约数据以及忘记还款数据。信用数据即评判用户信用好坏程度的数据,位于数据即评判用户违约可能性的数据,忘记还款数据即评判用户忘记还款的概率的数据。

其中,XGBoost本质上是一种集成的决策树算法,相对于逻辑回归和其他算法,至少具备以下几个优点:算法本身的优化:XGBoost损失函数对误差部分做二阶泰勒展开,模型效果更加精准;算法性能的提高:XGBoost考虑了训练数据为稀疏值的情况,可以为缺失值或者指定的值指定分支的默认方向,这能大大提升算法的效率;此外,XGBoost借鉴了随机森林的做法,支持列抽样,不仅能降低过拟合,还能减少计算。

本申请第二方面提供一种申请人贷款的贷款信用评估装置40,请参阅图4,图4是本申请的贷款申请人的贷款信用评估装置40的一结构示意图。

如图4,贷款申请人的贷款信用评估装置40包括获取单元41、处理单元42、预测单元43以及输出单元44。其中,获取单元41用于获取贷款申请人的信息数据,处理单元42与获取单元41连接,用于基于信息数据获取特征数据,预测单元43与处理单元42连接,用于将特征数据输入到信用评估模型,以对贷款申请人的贷款信用进行评估,输出单元43与预测单元43连接,用于基于信用评估模型输出贷款申请人的贷款信用数据。

其中,关于贷款申请人的贷款信用评估装置40的各单元的具体执行步骤,可参见上述方法部分,在此不再赘述。

本申请第三方面提供一种计算机可读存储介质,请参阅图5,图5是本申请的计算机可读存储介质50的一实施例的框架示意图。

如图5,本申请提供的计算机可读存储介质50上存储有程序指令51,程序指令51被处理器执行时实现上述实施例中任一项的贷款申请人的贷款信用评估方法。

其中,存储介质50可以包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号