首页> 中国专利> 风险评估方法、风险评估装置、设备及存储介质

风险评估方法、风险评估装置、设备及存储介质

摘要

本发明实施例提供一种风险评估方法、风险评估装置、计算机设备及存储介质,涉及人工智能领域。所述方法包括:获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点;根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图;基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息;基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。本申请实施例旨在快速准确地确定潜在的风险用户群组。

著录项

  • 公开/公告号CN114971878A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202210689661.4

  • 发明设计人 杨翰章;吴育人;庄伯金;

    申请日2022-06-17

  • 分类号G06Q40/02(2012.01);G06Q10/04(2012.01);

  • 代理机构深圳市力道知识产权代理事务所(普通合伙) 44507;

  • 代理人吴江维

  • 地址 518057 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 16:33:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G06Q40/02 专利申请号:2022106896614 申请日:20220617

    实质审查的生效

说明书

技术领域

本申请涉及人工智能领域,尤其涉及风险评估方法、风险评估装置、计算机设备及存储介质。

背景技术

如今,互联网金融信贷业务已成为银行及金融公司的一项重要业务,对于个人的贷款业务,用户仅需要通过APP填写对应的资料信息并上传至系统,若系统通过审批流程即可放款。虽然实现了信贷业务自动化,但是同时会出现一些用户利用信贷业务自动化的漏洞进行欺诈,因此金融公司面临着巨大的风险。

在上述欺诈手段中,进行欺诈的用户往往呈现出有组织的团伙性质,即这部分用户之间都存在着某种强关联关系。现有的风险评估方法主要借助专家经验的硬规则方法进行核查,这种方法无法适配各种不同场景,开发流程繁杂且效果较差。

发明内容

本申请提供了一种风险评估方法、风险评估装置、计算机设备及存储介质,旨在快速准确地确定潜在的风险用户群组,从而对这些风险用户群组进行差异化的风控策略,能够有效地防范欺诈风险。

为实现上述目的,本申请提供一种风险评估方法,所述方法包括:

获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点;

根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图;

基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息;

基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。

为实现上述目的,本申请还提供一种风险评估装置,所述风险评估装置包括:

业务信息提取模块,用于获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点;

同构图构建模块,用于根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图;

子图特征提取模块,用于基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息;

风险评估模块,用于基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。

此外,为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的风险评估方法。

此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的风险评估方法。

本申请实施例公开的风险评估方法、风险评估装置、设备及存储介质,通过获取业务数据的多个用户节点和异构信息节点,并根据多个用户节点和异构信息节点生成业务数据的同构图,再对同构图进行分解以及特征提取,得到各连通子图的特征信息,最后根据特征信息对各连通子图进行风险评估,得到各连通子图对应的风险预测结果。由此可以快速准确地确定潜在的风险用户群组,从而对这些风险用户群组进行差异化的风控策略,能够有效地防范欺诈风险。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种风险评估方法的场景示意图;

图2是本申请实施例提供的一种风险评估方法的流程示意图;

图3是本申请一实施例提供的一种同构图的示意图;

图4是本申请一实施例提供的一种连通子图的示意图;

图5是本申请一实施例提供的一种风险评估装置的示意性框图;

图6是本申请一实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。

在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

在现有技术中,主要采用专家系统或基于异构图的人工智能模型进行核查。若采用专家系统进行核查,其主要借助专家经验的硬规则方法进行核查,这种方法无法适配各种不同场景,开发流程繁杂且效果较差。若采用基于异构图的人工智能模型进行核查,由于从信息表提取出来的实体节点较多导致总体关联复杂,从而导致无法进行实时计算,进而无法准确地确定潜在的风险用户群组。

为解决上述问题,本申请提供了一种风险评估方法,应用在服务器,由此可以快速准确地确定潜在的风险用户群组,从而对这些风险用户群组进行差异化的风控策略,能够有效地防范欺诈风险。

其中,服务器例如可以为单独的服务器或服务器集群。但为了便于理解,以下实施例将以应用于服务器的风险评估方法进行详细介绍。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

如图1所示,本申请实施例提供的风险评估方法,可以应用于如图1所示的应用环境中。该应用环境中包含有终端设备110和服务器120,其中,终端设备110可以通过网络与服务器120进行通信。具体地,服务器120获取业务数据,服务器120通过业务数据提取得到多个用户节点和异构信息节点,并根据多个用户节点和异构信息节点生成业务数据的同构图,再对同构图进行分解以及特征提取,得到各连通子图的特征信息,最后根据特征信息对各连通子图进行风险评估,得到各连通子图对应的风险预测结果,并将各连通子图对应的风险预测结果发送给终端设备110。其中,服务器120可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。

请参阅图2,图2是本申请实施例提供的一种风险评估方法的示意流程图。其中,该风险评估方法可以应用在服务器中,由此可以快速准确地确定潜在的风险用户群组,从而对这些风险用户群组进行差异化的风控策略,能够有效地防范欺诈风险,进而提高金融信贷业务的安全性,提高用户体验。

如图2所示,该风险评估方法包括步骤S101至步骤S104。

S101、获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点。

其中,所述业务数据可以包括业务信息表等金融信贷业务数据表,一般地,用于可以通过APP上传业务数据,或可以从系统上获取到业务数据,业务数据记录了每个客户在申请信贷过程中提交及审核的各项信息。所述用户节点用于表示业务数据中的各个用户,由于每次客户申请和申请号是一一对应的,因此用户节点可以为申请号,并作为后续生成的同构图中的实体节点。所述异构信息节点为用户节点的属性,示例性的,异构信息节点可以包括申请单位及关联单位名、客户申请手机号、联系人号码、设备号等。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

在一些实施例中,遍历所述业务信息表,提取得到所述业务信息表对应的多个用户节点;根据业务信息类别对所述业务信息表进行拆分处理,得到多个业务信息子表;对所述多个业务信息子表进行预处理,得到所述业务信息表对应的异构信息节点。由于用户在申请信贷过程中提交及审核的各项信息一般是通过表格的形式提交,因此通过对业务信息表进行提取并预处理,从而可以快速准确地得到业务数据的多个用户节点和异构信息节点。

其中,所述业务信息类别可以包括用户基础信息、申请单位及关联单位信息、联系人信息、设备信息和GPS信息等类型,从而可以根据这几方面对业务信息表进行拆分处理,得到对应的多个业务信息子表。

具体地,可以先对业务信息表进行清洗处理,从而能够更快速准确地得到业务数据的多个用户节点和异构信息节点。

示例性的,可以根据业务信息类别对业务信息表进行拆分处理,得到多个业务信息子表,所述多个业务信息子表可以包括客户基础信息表、申请单位及关联单位信息表、联系人信息表、设备信息表以及GPS信息表等。

具体地,对多个业务信息子表进行缺失值处理或信息合并处理,从而得到业务信息表对应的异构信息节点。

示例性的,对于业务信息子表中存在缺失数据的情况,可以采用预先规定好的缺省值进行填充。

示例性的,对于存在相同申请号(即相同的用户节点)的数据行,对不同信息进行合并,并通过预先规定好的字符进行合并,例如在联系人信息表中,存在一个申请号(申请人)具有多个联系人的情况,因此可以将多个联系人的电话进行合并,并利用分隔符“||”进行拼接。

S102、根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图。

其中,所述关联信息用于指示各用户节点之间的关联关系,并用于生成业务数据的同构图。所述同构图以用户节点作为同构图的实体节点构建得到的。

在一些实施例中,根据所述异构信息节点与所述多个用户节点生成所述异构信息节点对应的关联信息表;根据所述异构信息节点对应的关联信息表生成各所述用户节点之间的关联边;根据各所述用户节点之间的关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。由此可以利用申请号和异构信息节点生成关联信息表以及关联边,从而更准确地构建业务数据的同构图。

其中,所述关联信息表可以包括倒排索引表和笛卡尔积表等关联表格,所述关联边用于表示各用户节点之间的关联关系,用于构建业务数据的同构图。

具体地,根据异构信息节点与多个用户节点生成异构信息节点对应的倒排索引表或笛卡尔积表;根据倒排索引表和笛卡尔积表生成各用户节点之间的关联边;并根据各用户节点之间的关联边对多个用户节点进行图谱构建,得到所述业务数据的同构图。

示例性的,对于申请单位及关联单位名、客户申请手机号、联系人号码、设备号等异构信息节点,可以以申请单位及关联单位名、客户申请手机号、联系人号码、设备号为键,以申请号列表为值,分别建立对应的倒排索引表。以申请单位及关联单位名为例,如表1所示,

其中,A单位和B单位为单位名,[00001,000012]和[00002,00003,00004]为申请号列表,即用户节点列表。由此可以根据分别建立异构信息节点对应的倒排索引表。

示例性的,对于GPS信息等异构信息节点,可以对GPS信息表建立笛卡尔积表,如表2所示,存储申请号间的两两GPS坐标对。

其中,APPLYNO_x表示申请号,LON_x及LAT_x分别代表x的经纬度坐标。由此可见,申请号APPLYNO_1的经度为115.28479,维度为36.06203,以此类推,从而得到各个申请号即用户节点的GPS坐标对,从而构建笛卡尔积表。

在一些实施例中,根据所述倒排索引表生成各所述用户节点之间的第一关联边;根据所述笛卡尔积表生成各所述用户节点之间的第二关联边;根据各所述用户节点之间的第一关联边和第二关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

其中,所述第一关联边可以为相等关联边,根据倒排索引表生成的,所述第二关联边可以为相似关联边,根据笛卡尔积表生成的。由此可以根据相等关联边和相似关联边构建对多个用户节点进行图谱构建,更快速准确地得到业务数据的同构图。

示例性的,对于申请单位及关联单位名、客户申请手机号、联系人号码、设备号等异构信息节点,可以建立第一关联边。通过各异构信息节点建立的倒排索引表,可在相同属性名对应的申请号列表建立相等关联边。以表1为例,申请号00001和000012间因具有相同的单位名(“A单位”)可建立关联边,同理,申请号00002、00003和00004也因具有相同单位名(“B单位”)可两两建立关联边。以此类推,根据各异构信息节点建立的倒排索引表生成各所述用户节点之间的第一关联边。

在一些实施例中,基于预设的距离度量算法,根据所述笛卡尔积表计算各所述用户节点之间的物理距离;对于任意两个所述用户节点,若所述两个用户节点之间的物理距离在预设距离区间内,则生成所述两个用户节点之间的第二关联边。由于GPS信息等异构信息,用户节点之间很难存在完全相同的信息,因此可以通过构建相似关联边来建立两个用户节点之间的关联关系。

其中,所述距离度量算法可以为haversine算法,可以通过笛卡尔积表中的经纬度坐标计算任意两个申请号间的物理距离,具体公式如下:

其中,a表示两点纬度的差值,b表示两点经度的差值,r表示地球半径。以表2为例,代入申请号00001和申请号00002的经纬度坐标,可以计算得到两者间距离为64.09km。

具体地,对于任意两个所述用户节点,若所述两个用户节点之间的物理距离在预设距离区间内,则生成所述两个用户节点之间的第二关联边。

示例性的,以申请号00001和申请号00002为例,两者间距离为64.09km,若预设距离区间为[30km,100km],则生成申请号00001和申请号00002之间的第二关联边,依次类推,生成各个用户节点之间的第二关联边。

在一些实施例中,对于任意两个所述用户节点,根据第一预设权重比例和所述两个用户节点之间的第一关联边数量得到所述第一关联边的权重比例,并根据第二预设权重比例和所述两个用户节点之间的物理距离得到所述第二关联边的权重比例;根据各所述用户节点之间的第一关联边及对应的权重比例、各所述用户节点之间的第二关联边及对应的权重比例对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。由此可以为相等关联边和相似关联边分配不同的权重,从而提高同构图构建的准确性。

其中,所述第一预设权重比例和所述第二预设权重比例表示预设的常量基础权重,具体可以根据用户设定,且所述第一预设权重比例和所述第二预设权重比例可以相同。

具体地,对于任意两个所述用户节点,根据第一预设权重比例和所述两个用户节点之间的第一关联边数量得到所述第一关联边的权重比例,第一关联边的权重计算公式具体如下:

其中,w

具体地,对于任意两个所述用户节点,根据第二预设权重比例和所述两个用户节点之间的物理距离得到所述第二关联边的权重比例,第二关联边的权重计算公式具体如下:

其中,a表示两点纬度的差值,b表示两点经度的差值,S

通过分别计算相等关联边和相似关联边对应的权重,并为对应的相等关联边和相似关联边分配相应的权重,从而能够提高同构图构建的准确性。

具体地,用户节点与异构信息节点之间为实体与其属性的关系,通过将拆分的子表导入现有图数据库比如Nebula Graph,便可支持可视化操作,如图3所示,其中实体节点表示用户节点。

S103、基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息。

其中,所述图分解算法可以为连通分支(Connected Component)算法等,用于将同构图分解为多个连通子图。连通子图是指任意两点有边连接的子图,并且该子图的节点与子图外的其他任何点都没有边相连。所述连通子图的特征信息至少包括统计特征和嵌入特征。

示例性的,如图4所示,子图A和B为某个图分解后的两个连通子图,连通子图A和连通子图B内的各节点内可以互连,但连通子图A和连通子图B之间没有节点可互连。

具体地,将同构图分解为多个连通子图后,对各个连通子图进行统计特征挖掘,统计特征具体可以包括子图平均年龄、子图节点及不同种类的边个数、子图最大中介中心度、每种关联边连接到点的最大个数、子图能形成长度大于等于四的不重复链路数以及子图最大关联度等。

同时,还可以对同构图使用网络表示学习算法,通过学习网络的结构特征来得到图中用户节点的向量表示,由于此向量表示可以捕捉到网络中节点之间的潜在关系,因此可以使用Embed模型将各连通子图中用户节点表示为向量形式的嵌入特征,从而得到各连通子图的嵌入特征。

具体地,Embed模型首先使用图划分算法METIS,将图中用户节点分为多个社团,然后通过捕获节点和多个社团连接强度的嵌入方法来学习节点表示,从而得到各连通子图的嵌入特征。

S104、基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。

其中,所述风险预测结果用于指示该连通子图对应的用户是否存在集资可能,即该用户是否存在欺诈风险。所述风险预测模型可以用于对各连通子图进行风险评估。

具体地,所述风险预测模型通过二分类模型训练子图集资与否而得到,其中分类标签为0(表示子图无集资)和1(表示子图有集资),模型的输出为预测子图标签为1的概率。可以基于历史数据构建训练集和测试集,分别用于风险预测模型的训练和验证。

在实际业务场景中,正常子图数(标签为0)与集资子图数(标签为1)差距悬殊,因此在分类过程中正负样本极不均衡,而样本不均衡的问题将使模型极易过拟合,最终导致模型泛化能力低,难以应用于真实业务中。为了解决因样本不均衡导致的过拟合问题,本方案在LightGBM框架的基础上,替换其原有的损失函数,使用了新的损失函数Focal Loss对训练集进行训练。Focal Loss的作用在于,通过改变正负样本权重以及难易样本权重,是模型学习更加均衡,从而解决了现有的模型泛化能力低,难以应用于真实业务的问题。最后采用网格搜索对训练模型进行参数调整,得到最优的风险预测模型。

在一些实施例中,根据所述统计特征和所述嵌入特征对各所述连通子图进行风险评估,得到各所述连通子图的预期风险以及对应的概率;根据各所述连通子图的预期风险以及对应的概率生成各所述连通子图对应的风险预测结果。

其中,所述预期风险可以为集资风险等风险。

具体地,可以将各连通子图的统计特征和所述嵌入特征输入到预设的风险预测模型中,将统计特征与嵌入特征进行合并处理,并进行风险评估,从而得到各连通子图的预期风险以及对应的概率,再根据各连通子图的预期风险以及对应的概率生成各连通子图对应的风险预测结果。由于各连通子图为用户节点对应的子图,因此通过确定各连通子图的预期风险以及对应的概率即可以得到各用户的预期风险以及对应的概率,从而得到各用户对应的风险预测结果,并确定用户是否存在集资可能以及欺诈风险。

具体地,分别确定各连通子图的预期风险对应的概率是否超过对应的预设概率阈值,若存在连通子图的预期风险对应的概率超过对应的预设概率阈值,则判定该连通子图不存在集资可能,若该连通子图的预期风险对应的概率未超过对应的预设概率阈值,则判定该连通子图存在集资可能,需要提醒人工复核。

示例性的,对于连通子图A,可以将连通子图A的统计特征和所述嵌入特征输入到预设的风险预测模型中进行风险评估,得到连通子图A的集资风险对应的概率为70%,若预设阀值为65%,则判定连通子图A存在集资可能,需要提醒人工复核,以此类推,分别得到各连通子图的风险评估结果。

需要说明的是,预设阀值可以为任何值,具体由用户以及预期风险而确定。

请参阅图5,图5是本申请一实施例提供的一种风险评估装置的示意性框图,该风险评估装置可以配置于服务器中,用于执行前述的风险评估方法。

如图5所示,该风险评估装置200包括:业务信息提取模块201、同构图构建模块202、子图特征提取模块203、风险评估模块204。

业务信息提取模块201,用于获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点;

同构图构建模块202,用于根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图;

子图特征提取模块203,用于基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息;

风险评估模块204,用于基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。

业务信息提取模块201,还用于遍历所述业务信息表,提取得到所述业务信息表对应的多个用户节点;根据业务信息类别对所述业务信息表进行拆分处理,得到多个业务信息子表;对所述多个业务信息子表进行预处理,得到所述业务信息表对应的异构信息节点。

同构图构建模块202,还用于根据所述异构信息节点与所述多个用户节点生成所述异构信息节点对应的关联信息表;根据所述异构信息节点对应的关联信息表生成各所述用户节点之间的关联边;根据各所述用户节点之间的关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

同构图构建模块202,还用于根据所述倒排索引表生成各所述用户节点之间的第一关联边;根据所述笛卡尔积表生成各所述用户节点之间的第二关联边;根据各所述用户节点之间的第一关联边和第二关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

同构图构建模块202,还用于基于预设的距离度量算法,根据所述笛卡尔积表计算各所述用户节点之间的物理距离;对于任意两个所述用户节点,若所述两个用户节点之间的物理距离在预设距离区间内,则生成所述两个用户节点之间的第二关联边。

同构图构建模块202,还用于对于任意两个所述用户节点,根据第一预设权重比例和所述两个用户节点之间的第一关联边数量得到所述第一关联边的权重比例,并根据第二预设权重比例和所述两个用户节点之间的物理距离得到所述第二关联边的权重比例;根据各所述用户节点之间的第一关联边及对应的权重比例、各所述用户节点之间的第二关联边及对应的权重比例对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

风险评估模块204,还用于根据所述统计特征和所述嵌入特征对各所述连通子图进行风险评估,得到各所述连通子图的预期风险以及对应的概率;根据各所述连通子图的预期风险以及对应的概率生成各所述连通子图对应的风险预测结果。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费终端设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

示例性的,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。

请参阅图6,图6是本申请实施例提供的一种计算机设备的示意图。该计算机设备可以是服务器。

如图6所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括易失性存储介质、非易失性存储介质和内存储器。

非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种风险评估方法。

处理器用于提供计算和控制能力,支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种风险评估方法。

该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一些实施方式中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:获取业务数据,并对所述业务数据进行信息提取,得到所述业务数据的多个用户节点和异构信息节点;根据所述异构信息节点建立各所述用户节点之间的关联信息,并根据所述多个用户节点和所述关联信息生成所述业务数据的同构图;基于预设的图分解算法,将所述同构图分解为多个连通子图,并对各所述连通子图进行特征提取,得到各所述连通子图的特征信息;基于预设的风险预测模型,根据各所述连通子图的特征信息对各所述连通子图进行风险评估,得到各所述连通子图对应的风险预测结果。

在一些实施方式中,所述处理器还用于遍历所述业务信息表,提取得到所述业务信息表对应的多个用户节点;根据业务信息类别对所述业务信息表进行拆分处理,得到多个业务信息子表;对所述多个业务信息子表进行预处理,得到所述业务信息表对应的异构信息节点。

在一些实施方式中,所述处理器还用于根据所述异构信息节点与所述多个用户节点生成所述异构信息节点对应的关联信息表;根据所述异构信息节点对应的关联信息表生成各所述用户节点之间的关联边;根据各所述用户节点之间的关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

在一些实施方式中,所述处理器还用于根据所述倒排索引表生成各所述用户节点之间的第一关联边;根据所述笛卡尔积表生成各所述用户节点之间的第二关联边;根据各所述用户节点之间的第一关联边和第二关联边对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

在一些实施方式中,所述处理器还用于基于预设的距离度量算法,根据所述笛卡尔积表计算各所述用户节点之间的物理距离;对于任意两个所述用户节点,若所述两个用户节点之间的物理距离在预设距离区间内,则生成所述两个用户节点之间的第二关联边。

在一些实施方式中,所述处理器还用于对于任意两个所述用户节点,根据第一预设权重比例和所述两个用户节点之间的第一关联边数量得到所述第一关联边的权重比例,并根据第二预设权重比例和所述两个用户节点之间的物理距离得到所述第二关联边的权重比例;根据各所述用户节点之间的第一关联边及对应的权重比例、各所述用户节点之间的第二关联边及对应的权重比例对所述多个用户节点进行图谱构建,得到所述业务数据的同构图。

在一些实施方式中,所述处理器还用于根据所述统计特征和所述嵌入特征对各所述连通子图进行风险评估,得到各所述连通子图的预期风险以及对应的概率;根据各所述连通子图的预期风险以及对应的概率生成各所述连通子图对应的风险预测结果。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时实现本申请实施例提供的任一种风险评估方法。

其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链语言模型的存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号