首页> 中国专利> 一种人力资源市场主体信用查询方法及系统

一种人力资源市场主体信用查询方法及系统

摘要

本发明属于数据处理领域,提供了一种人力资源市场主体信用查询方法及系统。其中,该查询方法包括获取接收信用查询请求,解析其中包含的人力资源市场主体的唯一标识信息;根据唯一标识信息,从信用存储数据库内调取相应信用评分;其中,人力资源市场主体的信用评分的计算过程为:获取各个人力资源市场主体相关联的求职招聘行为数据;分析求职招聘行为数据的集中趋势和变异度,筛选信用评价指标特征变量;基于逻辑回归算法计算各个信用评价指标特征变量的逻辑回归系数,编码后进行逻辑回归拟合;基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,计算得到信用评分并与唯一标识信息关联存储至信用存储数据库。

著录项

  • 公开/公告号CN112330280A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 山大地纬软件股份有限公司;

    申请/专利号CN202011217865.5

  • 申请日2020-11-04

  • 分类号G06Q10/10(20120101);G06F16/2457(20190101);

  • 代理机构37221 济南圣达知识产权代理有限公司;

  • 代理人张庆骞

  • 地址 250101 山东省济南市历城区港兴一路300号

  • 入库时间 2023-06-19 09:49:27

说明书

技术领域

本发明属于数据处理领域,尤其涉及一种人力资源市场主体信用查询方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

在人力资源市场线上线下招聘求职过程中,存在着虚假招聘信息、伪造学历证明以及爽约面试等不诚信行为,诚实守信的用人单位和求职者往往要花费大量的时间、经济以及人力成本去甄别招聘信息和求职简历材料的真伪,且效率非常低。不诚信行为已经严重扰乱了市场秩序、破坏了社会公德,有的甚至触犯国家法律法规,阻滞了人力资源市场的配置效率,增加了配置成本,影响了人民群众的高质量就业以及对就业服务的满意度和获得感。

发明人发现,针对人力资源市场主体的信用目前缺乏对应查询机制,而且人力资源市场主体信用分值过分依赖于人的经验和主观判断,不能根据定量分析得出精准合理的结论,现有的信用评价模型的结果很大程度上受特征的影响,特征处理的不合理会导致维度灾难,降低模型的准确度,产生过拟合等问题,在特征处理过程中存在类不平衡、特征缺失异常等问题,无法可靠准确地评估出人力资源市场主体信用分值,从而降低了市场资源配置效率和质量。

发明内容

为了解决上述背景技术中存在的至少一项技术问题,本发明提供一种人力资源市场主体信用查询方法及系统,其能够可靠准确地查询出人力资源市场主体信用对应分值,提高市场资源配置效率和质量。

为了实现上述目的,本发明采用如下技术方案:

本发明的第一个方面提供一种人力资源市场主体信用查询方法,其包括:

接收信用查询请求,解析其中包含的人力资源市场主体的唯一标识信息;

根据唯一标识信息,从信用存储数据库内调取相应信用评分;

其中,人力资源市场主体的信用评分的计算过程为:

获取各个人力资源市场主体相关联的求职招聘行为数据;

分析求职招聘行为数据的集中趋势和变异度,筛选信用评价指标特征变量;

基于逻辑回归算法计算各个信用评价指标特征变量的逻辑回归系数,编码后进行逻辑回归拟合,得到拟合后的系数值并对人力资源市场主体进行二分类;

基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,计算得到信用评分并与唯一标识信息关联存储至信用存储数据库。

本发明的第二个方面提供一种人力资源市场主体信用查询系统,其包括:

请求接收及解析模块,其用于接收信用查询请求,解析其中包含的人力资源市场主体的唯一标识信息;

信用评分调取模块,其用于根据唯一标识信息,从信用存储数据库内调取相应人力资源市场主体的信用评分;

所述信用评分调取模块,还包括:

数据获取模块,其用于获取各个人力资源市场主体相关联的求职招聘行为数据;

特征变量筛选模块,其用于分析求职招聘行为数据的集中趋势和变异度,筛选信用评价指标特征变量;

逻辑回归计算模块,其用于基于逻辑回归算法计算各个信用评价指标特征变量的逻辑回归系数,编码后进行逻辑回归拟合,得到拟合后的系数值并对人力资源市场主体进行二分类;

信用评分计算存储模块,其用于基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,计算得到信用评分并与唯一标识信息关联存储至信用存储数据库。

本发明的第三个方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的人力资源市场主体信用查询方法中的步骤。

本发明的第四个方面提供一种计算机设备,其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的人力资源市场主体信用查询方法中的步骤。

与现有技术相比,本发明的有益效果是:

(1)本发明基于接收的信用查询请求,解析信用查询请求中包含的人力资源市场主体的唯一标识信息,根据唯一标识信息,从信用存储数据库内调取相应信用评分,能够准确地调取对应信用评分,提高了市场资源配置效率和质量。

(2)本发明在人力资源市场主体的信用评分计算的过程中,基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,形成信用综合评价信用评分卡,实现了客观评价人力资源市场主体信用情况,信用评分计算结果更精准合理;同时采用数据预处理及分析技术,实现对特征数据的有效处理,解决类不平衡、特征缺失异常等问题,加快梯度下降寻找最优解的速度。

(3)本发明在人力资源市场主体的信用评分计算的过程中,采用特征分箱处理、证据权重WOE、IV值筛选、方差膨胀因子处理等手段,可以有效提取信用评价特征指标,提升模型性能;采用损失函数为依据,控制学习率、迭代次数,提高模型准确度,减少真实值与预测值之间的差值。

本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1是本发明实施例的人力资源市场主体信用查询方法流程图;

图2是本发明实施例的人力资源市场主体信用查询系统结构示意图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

实施例一

参照图1,本实施例提供人力资源市场主体信用查询方法,其包括:

S101:接收信用查询请求,解析其中包含的人力资源市场主体的唯一标识信息。

在具体实施中,人力资源市场主体可为个人或是企业。信用查询请求中包含人力资源市场主体属性信息,比如,名称,类型等等。

当人力资源市场主体为个人时,其唯一标识信息为身份证号码或是护照信息等。

当人力资源市场主体为企业时,其唯一标识信息为企业组织机构代码或是企业统一信用代码等等。

S102:根据唯一标识信息,从信用存储数据库内调取相应信用评分。

具体地,在信用存储数据库内,人力资源市场主体的信用评分与人力资源市场主体唯一标识信息两者一一对应关联存储,这样能够准确快捷地查询出人力资源市场主体的信用评分,保障了查询速度及准确性。

在本实施例中,人力资源市场主体的信用评分的计算过程为:

S1021:获取各个人力资源市场主体相关联的求职招聘行为数据。

在具体实施中,人力资源市场主体可为个人或是企业。

当人力资源市场主体为个人时,其关联的求职招聘行为数据包括但不限于个人性别、年龄、学历、职业、工作经历、参保缴费信息、连续缴费情况、行政事项承诺信息、行政处罚信息、是否有考试违规违纪、提供虚假学历证明、虚构从业经历、爽约面试等行为信息等。

当人力资源市场主体为企业时,其关联的求职招聘行为数据包括但不限于企业名称、类型、从业人员数、已订立书面劳动合同总数、年度工资总额、参加养老、失业、工伤保险人数、两年内立案数、劳动仲裁争议案件数、使用童工案件数、是否有虚构招聘需求、发布虚假岗位信息、提供虚假工资社保福利待遇、违法收取个人押金等费用等行为信息等。

S1022:分析求职招聘行为数据的集中趋势和变异度,筛选信用评价指标特征变量。

例如:对于个人一级指标包括个人特质、履约能力、经济行为、遵纪守法、社会责任五个方面的维度指标。

对于企业一级指标包括基本情况、金融财税、遵纪守法、管治能力、社会责任五个方面的维度指标。

具体地,个人、企业的指标就是在S1021中提到的那些指标,只不过通过特征工程做指标筛选是将有预测能力的指标筛选出来。假设在S1021中有50个变量,通过特征指标筛选,筛选出10个变量,这10个变量是我的入模变量。

在具体实施中,分析求职招聘行为数据的集中趋势和变异度之前,还包括:

对求职招聘行为数据中的脏数据,缺失值,异常值进行处理。

具体地,合成新的少数类样本,其过程为:

对于少数类中每一个样本a,以欧氏距离为标准计算它到少数类样本集中所有样本的距离,得到其k近邻。根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本a,从其k近邻中随机选择若干个样本,假设选择的近邻为b。对于每一个随机选出的近邻b,分别与原样本a构建新的样本。

处理特征缺失值的数据,使用随机森林回归填补缺失值。具体地,对缺失值进行处理,处理采用随机森林回归预测缺失值,遍历所有的特征,从缺失最少的开始进行填补,填补一个特征时,先将其他特征的缺失值用0代替,每完成一次回归预测,就将预测值放到原本的特征矩阵中,再继续填补下一个特征。

对异常值进行处理,排除影响评分模型的孤值点。排除影响信用评分模型的离群点数据。采用箱型图检验离群值,连续变量均值替代、离散变量用众数以及中位数替代。

在具体实施中,对每个指标变量做单变量分析以及变量之间的相关性分析,对于相关性大的两组变量择一处理。

在筛选信用评价指标特征变量的过程中,将连续信用评价指标特征变量离散化,利用卡方分箱,自底向上进行数据离散化处理,具有最小卡方值的相邻区间合并在一起。通过特征分箱将连续变量离散化或将多状态的离散变量合并成少状态,减少未离散化之前异常值对模型的干扰。

在实施例中,还对变量进行WOE编码,WOE编码起到了把回归系数“正则化”的作用。对原始自变量的编码,把分箱后的特征从非线性可分映射到近似线性可分的空间内。

依据IV值筛选出入模参数,IV是用来衡量自变量的预测能力,其中,IV由WOE加权求和计算所得。运用经验法则,筛选出对信息价值较高的特征变量。

S1023:基于逻辑回归算法计算各个信用评价指标特征变量的逻辑回归系数,编码后进行逻辑回归拟合,得到拟合后的系数值并对人力资源市场主体进行二分类。

具体地,将任意的输入变量映射到[0,1]区间,将线性回归的结果通过sigmiod函数映射到0与1之间从而实现分类。对评价主体实现二分类,构造损失函数,计算某一个样本的预测值与真实值的误差,误差越大,损失越大。使用梯度下降算法来求出代价函数的最小值。随机选择一个参数的组合计算代价函数,更新参数值,直到达到收敛条件。

S1024:基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,计算得到信用评分并与唯一标识信息关联存储至信用存储数据库。

具体地,评估模型分类预测的效果,包括但不限于ROC/AUC,KS,PSI,LIFT等一些评估方法。

在计算得到信用评分的过程中,预先设定某个特定的好坏比率Odds下的特定的预期分值和比率翻番的分数PDO;计算评价主体信用得分,总得分等于基础分和各变量部分得分之和。

Score=A-B*log(Odds)

其中,Score是信用得分,A,B是常数,通常将常数A称为补偿,常数B称为刻度因子。Odds是好坏比。Odds=1-p/p,失信概率为p,守信概率为1-p。

logistic回归模型计算比率如下:

log(Odds)=β

其中,用建模参数拟合模型可以得到模型参数β。常数A和B的值可以通过将两个已知或假设的分值代入公式计算得到。

通常情况下,需要设定两个假设:

(1)给某个特定的比率设定特定的预期分值;

(2)确定比率翻番的分数(PDO)

假设比率为x的特定点的分值为P。则比率为2x的点的分值应该为P+PDO。代入式中,可以得到如下两个等式:

P=A-Blog(x)

P-PDO=A-Blog(2x)

可求出A,B值。

实施例二

参照图2,本实施例提供一种人力资源市场主体信用查询系统,其包括:

请求接收及解析模块,其用于接收信用查询请求,解析其中包含的人力资源市场主体的唯一标识信息;

信用评分调取模块,其用于根据唯一标识信息,从信用存储数据库内调取相应人力资源市场主体的信用评分;

所述信用评分调取模块,还包括:

数据获取模块,其用于获取各个人力资源市场主体相关联的求职招聘行为数据;

特征变量筛选模块,其用于分析求职招聘行为数据的集中趋势和变异度,筛选信用评价指标特征变量;

逻辑回归计算模块,其用于基于逻辑回归算法计算各个信用评价指标特征变量的逻辑回归系数,编码后进行逻辑回归拟合,得到拟合后的系数值并对人力资源市场主体进行二分类;

信用评分计算存储模块,其用于基于预设评估模型将符合预设要求的拟合后系数值及二分类结果转化成标准评分卡,计算得到信用评分并与唯一标识信息关联存储至信用存储数据库。

本实施例的人力资源市场主体信用查询系统中的各个模块的具体实施过程,与实施例一所述的人力资源市场主体信用查询方法中的各个步骤的具体实施过程相同,此处不再累述。

实施例三

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一所述的人力资源市场主体信用查询方法中的步骤。

实施例四

本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例一所述的人力资源市场主体信用查询方法中的步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号