公开/公告号CN113112239A
专利类型发明专利
公开/公告日2021-07-13
原文格式PDF
申请/专利权人 成都商高智能科技有限公司;
申请/专利号CN202110439506.2
申请日2021-04-23
分类号G06Q10/10(20120101);G06F16/335(20190101);G06F16/35(20190101);G06F40/216(20200101);G06F40/289(20200101);G06F40/242(20200101);G06K9/62(20060101);
代理机构51276 成都蓉创智汇知识产权代理有限公司;
代理人谭新民
地址 610000 四川省成都市中国(四川)自由贸易试验区成都市天府新区湖畔路北段715号4号楼101号
入库时间 2023-06-19 11:49:09
技术领域
本发明涉及招聘岗位人才筛选领域,具体涉及一种便捷式岗位人才筛选方法。
背景技术
近年来,随着人力资源招聘市场需求的飞速发展,越来越多应聘者选择通过在网络上投递简历来寻找工作,而招聘人员则可以从互联网上获取更多的简历信息。招聘人员在网上对大量的求职者简历进行一轮筛选后,就会向符合岗位招聘需求的求职者发出面试邀请,然而招聘人员在网络上筛选求职者简历的过程是非常繁杂且重复的,这需要耗费其大量的时间和精力,不断细化的人才需求也对招聘者的职业素养要求越来越高。因此,如何高效地在海量的简历中筛选出合适的人才是目前企业人力资源面临的一大难题。
在现有的招聘方法中,大多数招聘者一般会按照岗位的要求进行粗略地筛选,提取求职者简历中的关键信息,以此判断求职者与需求岗位匹配度,然而求职者简历中的信息无法保证真实性,这就很容易造成求职者的职业技能能力与岗位不符,从而不仅浪费了招聘人员的时间,还可能造成遗漏掉潜在的合适的求职者。
发明内容
本发明的目的在于提供一种便捷式岗位人才筛选方法,解决招聘者无法快速高效的识别人才的问题,帮助招聘者岗位候选人与具体岗位的匹配情况,为企业高效招聘提供可靠方法和依据,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供一种便捷式岗位人才筛选方法,包括:
S1:获取招聘方发布的岗位需求信息;
S2:自动解析岗位需求信息,提取岗位需求技能关键词,并组成专属岗位测试试卷;
S3:根据所述岗位需求信息从预设的简历筛选条件提取模型中,提取与所述岗位需求信息相对应的简历筛选条件;
S4:接收简历信息,从所述简历信息中提取简历结构化信息,并与所述简历筛选条件进行比对,以判断所述简历是否满足所述简历筛选条件;
S5:将满足所述简历筛选条件的简历生成结果列表反馈给招聘方;
S6:招聘方将符合简历筛选条件的求职者列为需求岗位候选人;
S7:招聘方根据招聘需求,向岗位候选人发送专属岗位测试试卷;
S8:岗位候选人在规定时间内完成专属岗位测试试卷,系统自动将测试结果以人才报告的形式推送给招聘方;
S9:招聘方根据测试结果选择需要发出面试邀请的候选人。
进一步地,在步骤S2中,对岗位需求信息进行解析,需要将岗位需求信息通过关键字匹配技术进行分块,再将分块后的岗位需求信息分类形成结构化信息和技能关键词,以此来组成岗位测试试卷,匹配简历筛选条件模型,选出最优简历筛选条件。
进一步地,在步骤S4中,对所述待筛选简历进行解析,得到所述待筛选电子简历对应的目标岗位以及多个预设字段数据,包括:
S41:提取所述待筛选电子简历的文本信息;
S42:从所述文本信息中提取岗位数据,确定所述待筛选简历对应的目标岗位;
S43:对所有句子经分词,词性标注等预处理及特征选择,形成特征向量,采用基于向量机的算法为每个段落标注预定义的通用类别;
S44:采用隐马尔科夫模型从类别中提取详细的信息,得到最终的结构化简历。
进一步地,在步骤S4中,将简历结构化信息与简历筛选条件进行对比,采用改进的相似度量算法,对简历结构化信息与简历筛选条件进行相似度匹配计算,进而为招聘方推荐准确合适的求职者。
进一步地,所述基于向量机的算法选取为SVM算法,在简历分块问题中,类标签有六个,需要用SVM算法解决多类分类问题时,采用一对多的方法首先将某个类别数据归为一类,其余所有数据归为一类,分类时将未知样本归为具有最大分类函数值的类别,具体步骤如下:
S431:将个人基本信息所对应的向量作为正集,求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
S432:将求职意向所对应的向量作为正集,个人基本信息、自我评价、教育经历、工作经历、其他其他所对应的向量作为负集;
S433:将自我评价所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
S434:将教育经历所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
S435:将工作经历、所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、其他所对应的向量作为负集;
S436:将其他所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、所对应的向量作为负集。
进一步地,使用这六个训练集分别进行训练,得到六个训练结果文件。在分类的时候,把对应的向量分别利用这六个训练结果文件进行测试,每个测试都有一个结果f1(x),f2(x),f3(x),f4(x),f5(x),f6(x),选取这六个值中最大的一个作为最终的分类结果。
本发明具有的有益效果:
本发明公开的一种便捷式岗位人才的筛选方法,通过对筛选简历进行解析和分类,得到待筛选简历对应的目标岗位以及预定义六个通用类别,包括个人基本信息、求职意向与工作经历等,从而能够更好地解决简历分块的问题,进一步得到全面、准确反映应聘人特征的分类信息,然后提取关键信息,通过与简历筛选条件模型信息,进行匹配处理,实现对电子简历的快速、准确筛选,提高了电子简历的筛选效率,上述方法通过结合招聘方的岗位需求信息生成个性化的筛选条件,使得方法适应性强,且还可以针对招聘方的招聘或投递效果灵活地调整简历的筛选条件,保证了适中的筛选通过率,解决了未能针对招聘方的个性化招聘需求对简历进行筛选的技术问题。
附图说明
图1为本发明人才筛选方法流程示意图;
图2为本发明简历信息抽取流程示意图;
图3为本发明分词、词性标注及命名实体识别结果说明示意图;
图4为本发明匹配信息模型;
图5为本发明通用类别与详细信息定义;
图6为本发明层次化简历结构示意图;
具体实施方式
下面结合实施例及附图,对本发明作进一步的详细说明,但本发明的实施方式不限于此。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖向”、“纵向”、“侧向”、“水平”、“内”、“外”、“前”、“后”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“开有”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例
一种便捷式岗位人才的筛选方法,包括:
S101:获取招聘方发布的岗位需求信息;
S102:将岗位需求信息转化为纯文本的形式,分析岗位需求信息文本特点,提取类别关键字;
S103:获取所有类别关键字的位置,并按照记录的位置进行岗位信息划分。
S104:将岗位需求信息关键字与简历筛选条件提取模型库中的关键字进行匹配,若匹配成功,则认为提取相应的简历筛选条件;
S201:接受简历信息,如图5;
待筛选简历可以为doc、docx、PDF、HTML等格式。
S202:对不同样式的简历信息进行预处理,主要包括格式转换、去掉无意义的信息、分词、词性标注以及命名实体识别等,如图2、3、4;
S203:依据层次化简历结构,对整个简历文本进行分块,并将此简历分块问题看作文本分类问题处理。首先将整个简历文本以换行符分割成多个段落,并对所有段落经分词、词性标注等预处理以及特征选择,表示为特征向量,采取向量机算法为每个段落标注预定义通用类别,比如个人信息类、教育经历类以及工作简历等;
S2031:将简历文本经过分词、词性标注、去停用词等预处理步骤之后的所有词汇作为原始特征,并根据词汇在简历中出现的频率以及权值,向量总维数长度与字典里面的词字个数相同,如果某个词在该文章中并没与出现,那么相应此处的值为零,如果出现的次数多,权值比较高,这样就把文本转化为计算机可以处理计算的向量形式。
采用TF-IDF统计方法,即根据某个词在简历中出现的比例,以及该短语在总体语料库中出现的比例,来计算该词或短语的权值,权值越高,表明该词对文章的贡献度大。TF词频计算公式如下:
其中Mi表示某个词在该篇简历中出现的次数,Q表示简历中出现的总词数,Q统计的总次数不存在重复。
TDF反文档频率计算公式如下:
其中D表示语料库文章总数,Si表示在D的样本中包含i的文章篇数。
TD-IDF最后得到i的权值计算公式为:
当一个空间向量形成之后,由于词典次数肯定是成千上万的,因此向量也是相当长的,使用这样的向量运行分类算法,计算时间相当长,效果也不好,因此我们需要对得到的空间向量采用信息增益方法进行降维。
信息增益算法的公式为:
其中:P(C
信息增益的方法是:首先计算包含该特征词的信息熵,然后减去不包含该词的信息熵,以此来计算特征词t的权重,在最后得到的结果中,每个词都有一个对应的权重。权重由大到小排列,这样就可以随意选取前面较大的权重的词列入计算。
S2032:利用SVM模型解决简历信息分块的问题,首先将简历信息按照换行符分割成一个个段落,然后将每个段落表示成特征向量,即简历由段落序列S=s
用分类算法来解决文本分块问题首先假设不同块间类标签是相互独立的,依据这一假设,上述公式可以被描述为:
因此,可以通过最大化公式中的每一项来使该公式值最大。P(l
SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器。在进行分类时,采用一对多的方法以此把某个类别的样本归为一类,其他剩余的样本归为另一类,这样K个类别的样本就制造出了K个SVM,分类时将未知样本分类为具有最大分类函数的那一类。如本实施例中,将简历划分为6个通用类别:个人基本信息、求职意向、自我评价、教育经历、工作经历、其他。根据SVM算法,分别选取六个训练集如下:
1,个人基本信息所对应的向量作为正集,求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
2,求职意向所对应的向量作为正集,个人基本信息、自我评价、教育经历、工作经历、其他其他所对应的向量作为负集;
3,自我评价所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
4,教育经历所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、其他所对应的向量作为负集;
5,工作经历、所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、其他所对应的向量作为负集;
6,其他所对应的向量作为正集,个人基本信息、求职意向、自我评价、教育经历、工作经历、所对应的向量作为负集;
使用这六个训练集分别进行训练,然后的得到六个训练结果文件。在测试的时候,把对应的测试向量分别利用这六个训练结果文件进行测试。最后每个测试都有一个结果f1(x),f2(x),f3(x),f4(x),f5(x),f6(x)。于是最终的结果便是这六个值中最大的一个作为分类结果。
S204:在对整个简历进行分块之后,需要考虑不同类别文本表述的特点,采用分治思想从分类结果中进一步抽取详细信息。本实施例基于各个通用类别文本块中的信息采用基于HMM算法进行词性标注。
实现基于HMM的词性标注方法时,模型的参数估计是其中的关键问题。根据前面的介绍,我们可以随机地初始化HMM的所有参数,但是,这将使词性标注问题过于缺乏限制。因此,通常利用词典信息约束模型的参数。假设输出符号表由单词构成(即词序列为HMM的观察序列),如果某个对应的“词汇一词性标记”对没有被包含在词典中,那么,就令该词的生成概率(符号发生概率)为0,否则,该词的生成概率为其可能被标记的所有词性个数的倒数,即:
其中b
其中T(w
对于词性标注任务来说,已知的单词序列w
现在假设W是分词后的词序列,T是W某个可能的词性标注序列,其中T
W=(w
S301:从所述简历信息中提取简历结构化信息与所述简历筛选条件进行比对,以此判断所述简历是否满足所述简历筛选条件,如图6;
将招聘网站中企业和个人属性信息数据、简历和职位的属性信息匹配,本实施例中采取相似度算法,对简历的结构化信息与简历筛选条件进行相似度匹配甲酸,得到职位与简历之间的匹配度信息:
其中
S401:将满足所述简历筛选条件的简历生成结果列表反馈给招聘方;
S501:招聘方将符合简历筛选条件的求职者列为需求岗位候选人;
S601:根据所述岗位需求信息,提取岗位需求技能关键词,并组成专属岗位测试试卷;
S701:招聘方根据招聘需求,向岗位候选人发送专属岗位测试试卷;
S801:岗位候选人在规定时间内完成专属岗位测试试卷,系统自动将测试结果以人才报告的形式推送给招聘方;
S901:招聘方根据测试结果选择需要发出面试邀请的候选人。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。
机译: 便捷式驱动辊的制造方法,便捷式驱动辊以及配备有便捷式驱动辊的记录装置
机译: 具有便捷功能的链接成员,便捷链包括具有便捷功能的链接成员和链传动式便捷设备
机译: 设置人才成长方向的方法,补充能力的选择方法,补充人才的选择方法,人才评估方法,人才积累计划准备系统,人才供给系统,工作结果评估系统和信息传递媒介