首页> 中国专利> 团险险种粒度赔付率预测方法及相关设备

团险险种粒度赔付率预测方法及相关设备

摘要

本申请提供一种团险险种粒度赔付率预测方法及相关设备,首先,以企业险种为粒度表明数据的最小单元是险种,无需获取过于详细的数据,为后续的数据使用提供便利。其次,对脏数据进行清理可以提高赔付率预测的准确性和效率。然后,利用二分类模型组对赔付率进行预测,解放了人工预测给工作人员带来的高强度劳动,且无需使用复杂的算法来确认赔付率的具体数值,只需要判断预测赔付率在预设分布区间中的位置,降低了赔付率预测的难度。最后将目标子区间对应的子区间标签作为预测结果进行输出,实现了一定的保密性,使得预测结果更加直观。

著录项

  • 公开/公告号CN114841817A

    专利类型发明专利

  • 公开/公告日2022-08-02

    原文格式PDF

  • 申请/专利权人 中国人寿保险股份有限公司;

    申请/专利号CN202210221137.4

  • 发明设计人 刘艳珣;林鹏程;鞠芳;

    申请日2022-03-08

  • 分类号G06Q40/08(2012.01);G06Q10/04(2012.01);G06F16/215(2019.01);G06K9/62(2022.01);G06N20/00(2019.01);

  • 代理机构北京风雅颂专利代理有限公司 11403;

  • 代理人朱智勇

  • 地址 100095 北京市海淀区温泉镇景天路中国人寿研发中心

  • 入库时间 2023-06-19 16:12:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-19

    实质审查的生效 IPC(主分类):G06Q40/08 专利申请号:2022102211374 申请日:20220308

    实质审查的生效

  • 2022-08-02

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及保险业务技术领域,尤其涉及一种团险险种粒度赔付率预测方法及相关设备。

背景技术

团体保险(团险)是指以一张保险单为众多被保险人提供保障的保险。团体保险是以集体单位作为承保对象,以保险公司和集体单位作为双方当事人,采用一张保险单形式订立合同。通常是以团体单位为投保人,单位内工作人员为被保险人。保险种类(险种)大的方面来说自然分成社会保险和商业保险。社会保险包括养老保险、医疗保险、失业保险、工伤保险和生育保险。商业保险分成财产保险和人身保险。其中,财产保险又分为财产损失险、责任保险、信用保证保险三大类险种。粒度就是同一维度下,数据统计的粗细程度,计算机领域中粒度指系统内存扩展增量的最小值。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。业务员和审批员参考理赔记录、近3年的赔付率等信息,来主观衡量是否承保,参考历史信息做出判断的方法比较主观,对业务员和审批员的要求较高。

发明内容

有鉴于此,本申请的目的在于提出一种团险险种粒度赔付率预测方法及相关设备用以解决上述问题。

基于上述目的,本申请的第一方面提供了一种团险险种粒度赔付率预测方法,包括:

以企业险种为粒度获取当前组合特征数据;

对所述当前组合特征数据进行脏数据清洗,得到有效当前数据;

基于所述有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间;

将所述目标子区间对应的子区间标签作为预测结果进行输出。

本申请的第二方面提供了一种团险险种粒度赔付率预测装置,包括:

特征数据选取模块,被配置为:以企业险种为粒度获取当前组合特征数据;

清洗模块,被配置为:对所述当前组合特征数据进行脏数据清洗,得到有效当前数据;

预测模块,被配置为:基于所述有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间;

输出模块,被配置为:将所述目标子区间对应的子区间标签作为预测结果进行输出。

本申请的第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请的第一方面提供的所述的方法。

本申请的第四方面提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行本申请的第一方面提供的所述方法。

从上面所述可以看出,本申请提供的团险险种粒度赔付率预测方法及相关设备,首先,以企业险种为粒度获取当前组合特征数据,以企业险种为粒度表明数据的最小单元是险种,无需获取过于详细的数据,为后续的数据使用提供便利。其次,对所述当前组合特征数据进行脏数据清洗,得到有效当前数据,对脏数据进行清理可以提高赔付率预测的准确性和效率。然后,基于有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间,利用二分类模型组对赔付率进行预测,解放了人工预测给工作人员带来的高强度劳动,且无需使用复杂的算法来确认赔付率的具体数值,只需要判断预测赔付率在预设分布区间中的位置,降低了赔付率预测的难度。最后将目标子区间对应的子区间标签作为预测结果进行输出,赔付率的预测数值和目标子区间在分布区间的中的位置是内部数据,不需要进行公布,所以选择目标子区间对应的子区间标签作为预测结果进行输出,实现了一定的保密性,使得预测结果更加直观。

附图说明

为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例的团险险种粒度赔付率预测方法的流程图;

图2为本申请实施例的准备过程的流程图;

图3为本申请实施例的划分分布区间的流程图;

图4为本申请实施例的二分类模型组训练流程图;

图5为本申请实施例的赔付率预测的流程图;

图6为本申请实施例的确定赔付率在分布区间中位置的流程图;

图7为本申请实施例的结果输出的流程图;

图8为本申请实施例的获取当前组合特征数据的流程图;

图9为本申请实施例的团险险种粒度赔付率预测装置的结构图;

图10为本申请实施例的电子设备的结构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。

需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。

相关技术中,主要采用基于ARMA模型(auto regressive moving average model,自回归滑动平均模型)进行赔付率的预测,ARMA模型是模型参量法高分辨率谱分析方法之一。这种方法是研究平稳随机过程有理谱的典型方法,适用于很大一类实际问题。ARMA模型法有较精确的谱估计及较优良的谱分辨率性能,但其参数估算比较繁琐,且该方法是以赔付率为衡量指标,对保险业的未来发展情况进行预测,预测的是赔付率随时间的变化规律,即以时间为粒度进行的预测。相关技术中还有采用复杂的算法对有效当前数据进行处理预测方法,目的是通过一次计算,使处理后的预测赔付率直接落入对应的目标子区间或者得到具体的赔付率数值,其计算方式复杂,算法设计困难,对输入数据的要求较高。

本申请实施例提供的团险险种粒度赔付率预测方法,利用二分类模型组对赔付率进行预测,无需使用复杂的算法来确认赔付率的具体数值,只需要逐步判断预测赔付率在预设分布区间中的位置,降低了赔付率预测的难度。最后将目标子区间对应的子区间标签作为预测结果进行输出,赔付率的具体数值和目标子区间在分布区间的中的位置是内部数据,不需要进行公布,所以选择目标子区间对应的子区间标签作为预测结果进行输出,实现了一定的保密性,使得预测结果更加直观。

在一些实施例中,如图1所示,一种团险险种粒度赔付率预测方法,包括:

步骤100:以企业险种为粒度获取当前组合特征数据。

在该步骤中,以企业险种为粒度获取一定时间区间内已生效的一年期保单及相关投保信息,并考察该保单在生效期间险种粒度的赔付金额和赔付人数,并考察企业在过去一年的投保情况和赔付情况,以及统计过去一年以城市、职业粒度的险种赔付信息。提取组合以上维度的数据作为当前组合特征数据,最终形成的当前组合特征数据具体包含以下几种信息:(1)企业信息;(2)属组信息;(3)属组投保险种信息;(4)保单险种理赔信息。

步骤200:对当前组合特征数据进行脏数据清洗,得到有效当前数据。

在该步骤中,数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。

其中,因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”,而按照一定的规则把“脏数据”“洗掉”,这就是脏数据清洗。不符合要求的数据即“脏数据”主要是由不完整的数据、错误的数据、重复的数据三大类。而数据的清洗要遵从以下原则:(1)完整性:单条数据是否存在空值,统计的字段是否完善。(2)全面性:对于一组数值,可以通过比较最大值、最小值、平均值等数据定义值来判断该组值数据是否全面。(3)合法性:数值的类型、内容、大小是否符合预先设定的阈值。例如:投保人年龄超过200岁,这个数据就是不合法的。(4)唯一性:数据是否重复记录。例如:一投保人的数据被重复记录多次。

步骤300:基于有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间。

在该步骤中,向预先训练好的二分类模型组输入有效当前数据,利用二分类模型组对赔付率进行预测,解放了人工预测给工作人员带来的高强度劳动,且无需使用复杂的算法来确认赔付率的具体数值,只需要判断预测赔付率在预设分布区间中的位置,降低了赔付率预测的难度。

步骤400:将目标子区间对应的子区间标签作为预测结果进行输出。

在该步骤中,将目标子区间对应的子区间标签作为预测结果进行输出,是因为赔付率的预测数值和目标子区间在分布区间中的位置是内部数据,不需要进行公布,所以选择目标子区间对应的子区间标签作为预测结果进行输出,实现了一定的保密性,使得预测结果更加直观。

在一些实施例中,如图2所示,二分类模型组的预训练具体包括:

步骤010:以企业险种为粒度获取历史组合特征数据和与历史组合特征数据对应的历史赔付率。

在该步骤中,历史组合特征数据包括:投保人信息、方案信息及历史赔付信息,其中,投保人信息包括投保时间、单位性质、行业类别、职业类别、成员人数、在职人数、承保人数、投保人员年龄分布等;方案信息包括方案类型契约形式、业务大类、属组、险种、保额、保费、折扣率、佣金率、销售区域、是否存有追溯指定生效日等;历史赔付信息包括主险种、生效日期、期满日期、保单期初、保单期末、保单赔付情况等。

步骤020:基于历史赔付率确定赔付率的分布区间。

在该步骤中,对历史赔付率进行统计并计算,将历史赔付率按照赔付后的盈亏关系分为若干组,每组对应一个子区间,全部的组别对应的全部子区间共同构成分布区间。

步骤030:基于历史组合特征数据和历史赔付率训练二分类模型组。

在该步骤中,基于历史组合特征数据和历史赔付率,不断利用xgboost(极端梯度提升算法)训练多个二分类模型,多个二分类模型构成该二分类模型组。

其中,若训练效果不理想,可以替换为其他机器学习分类算法如LR(逻辑回归算法)、SVM(支持向量机算法)对二分类模型进行补充训练,直至训练结果满足用户的需求。

在一些实施例中,如图3所示,步骤020:基于历史赔付率确定赔付率的分布区间,具体包括:

步骤021:基于历史赔付率确定第一边界赔付率、第二边界赔付率和第三边界赔付率。

在该步骤中,基于历史赔付率的统计量,确定第一边界赔付率、第二边界赔付率和第三边界赔付率,作为划分不同子区间的边界。

可选地,选取70%作为第一边界赔付率,选取40%作为第二边界赔付率,选取90%作为第三边界赔付率。

步骤022:基于第一边界赔付率,将赔付率分为前半区间和后半区间。

在该步骤中,将赔付率小于或等于第一边界赔付率的划分为前半区间,将赔付率大于第一边界赔付率的划分为后半区间,其中,前半区间表示当赔付率小于或等于第一边界赔付率时可以盈利,后半区间表示当赔付率大于第一边界赔付率时出现亏损。先将分布区间划分为两个大区间,这两个大区间的代表的含义相互对立,实现将赔付率进行定性,即盈利或亏损。

步骤023:基于第二边界赔付率,将前半区间分为第一子区间和第二子区间。

在该步骤中,在已经确定盈利的前提下,基于第二边界赔付率,根据盈利的幅度将前半区间进行进一步地划分。将赔付率小于或等于第二边界赔付率的划分为第一子区间,将赔付率大于第二边界赔付率的划分为第二子区间,其中,第一子区间表示当赔付率大于零且小于或等于第二边界赔付率时盈利较大,第二子区间表示当赔付率大于第二边界赔付率二小于第一边界赔付率时盈利较小。将盈利的前半区间划分为两个盈利幅度不同的子区间,实现将赔付率进行的盈利情况进行定性,以确定该团险保单的优劣。

步骤024:基于第三边界赔付率,将后半区间分为第三子区间和第四子区间。

在该步骤中,在已经确定亏损的前提下,基于第三边界赔付率,根据亏损的幅度将后半区间进行进一步地划分。将赔付率小于或等于第三边界赔付率的划分为第三子区间,将赔付率大于第三边界赔付率的划分为第二子区间,其中,第三子区间表示当赔付率大于第一边界赔付率且小于或等于第三边界赔付率时亏损较小,第四子区间表示当赔付率大于第三边界赔付率亏损利较大。将亏损的后半区间划分为两个亏损幅度不同的子区间,实现将赔付率进行的亏损情况进行定性,以确定该团险保单的优劣。

步骤025:将第一子区间、第二子区间、第三子区间和第四子区间进行组合,得到分布区间。

在该步骤中,将第一子区间、第二子区间、第三子区间和第四子区间进行组合,得到零至第二边界赔付率、第二边界赔付率至第一边界赔付率、第一边界赔付率至第三边界赔付率、大于第三赔付率的分布区间。

可选地,分布区间为(0-40%、40%-70%、70%-90%、大于90%),其中(0-40%)为盈利较大的第一子区间,(40%-70%)为盈利较小的第二子区间,(70%-90%)为亏损较小的第三子区间,(大于90%)为亏损较大的第四子区间。如果用户需要进一步进行细分,则可以对任意子区间进行划分,但是需要训练更多、精确度更高的二分类模型组。

在一些实施例中,如图4所示,步骤030:基于历史组合特征数据和历史赔付率训练二分类模型组,具体包括:

步骤031:对历史组合特征数据进行数据清洗,得到有效历史数据。

其中,数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。由于在步骤200中需要对当前组合特征数据进行脏数据清洗,得到有效当前数据,并将该有效当前数据作为二分类模型组的输入,所以在二分模型组训练的时,同样需要将历史组合特征数据进行数据清洗,然后将清洗后的有效历史数据作为训练二分类模型组。

步骤032:将有效历史数据分割为训练数据集和验证数据集。

在该步骤中,为了验证二分类模型组的训练的结果,需要设置对照组,所以将有效历史数据分为训练数据集和验证数据集,利用训练数据集训练二分类模型组,利用验证数据集验证二分类模型组的训练结果。

其中,对有效历史数据集进行采样、embedding(嵌入)、归一化、特征组合等特征工程处理,将有效历史数据交叉验证分割成训练数据集和验证数据集。

步骤033:基于训练数据集,通过机器学习算法训练二分类模型组。

可选地,首选尝试xgboost算法(极端梯度提升算法)训练二分类模型组,若经过验证后符合业务员和和审批员的要求,则无需进行下一步的训练,若经过验证后不满足业务员和和审批员的要求,可以选择随机森林算法、svm算法(支持向量机算法)或LR算法(逻辑回归算法)等分类算法训练多分类模型组,进而调整模型参数和优化预测算法。

步骤034:利用训练好的二分类模型组对验证数据集进行赔付率预测,确定赔付率落入的目标子区间。

在该步骤中,二分类模型组已经初步训练完成,将验证数据集作为输入,二分类模型组会输出验证数据集对应的赔付率落入的目标子区间,该目标子区间为第一子区间、第二子区间、第三子区间和第四子区间中的一个,由于验证数据集是从历史组合特征数据中获得的,所以验证数据集的真值赔付率为历史赔付率。

步骤035:响应于确定历史赔付率位于目标子区间内,判定二分类模型组符合业务要求,训练完毕。

在该步骤中,若历史赔付率位于目标子区间内,即二分类模型组预测的赔付率与历史赔付率位于同一子区间内,说明二分类模型组预测的赔付率是符合要求的,二分类模型组训练完毕。若历史赔付率没有位于目标子区间内,即二分类模型组预测的赔付率与历史赔付率没有位于同一子区间内,说明二分类模型组预测的赔付率是不符合要求的,需要利用步骤033中的算法对二分类模型组进行进一步地训练,直至二分类模型组符合业务员和审批员的要求,即二分类模型组预测的赔付率与历史赔付率位于同一目标子区间。

在一些实施例中,如图5和图6所示,步骤300:基于有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间,具体包括:

步骤310:将二分类模型组分为第一二分类模型、第二二分类模型和第三二分类模型。

在该步骤中,与步骤021相对应,第一二分类模型对应第一边界赔付率,用于判定预测赔付率是位于前半区间还是后半区间;第二二分类模型对应第二边界赔付率,用于判定预测赔付率是位于第一子区间还是第二子区间;第三二分类模型对应第三边界赔付率,用于判定预测赔付率是位于第三子区间还是第四子区间。

步骤320:基于有效当前数据和第一边界赔付率,通过第一二分类模型判定预测赔付率在分布区间的位置。

在该步骤中,利用第一二分类模型对输入的有效当前数据进行处理,将处理后得到的预测赔付率与所述第一边界赔付率进行比较,若预测赔付率大于第一边界赔付率,则说明预测赔付率位于后半区间;若预测赔付率小于第一边界赔付率,则说明预测赔付率位于前半区间。由于只需要判断预测赔付率与第一边界赔付率的大小关系,无需确定预测赔付率的具体数值,所以选择第一二分类模型进行判断,相对于使用复杂算法对有效当前数据进行处理而得到赔付率的具体数值,或使用四分类模型甚至多分类模型对当前有效数据进行处理,一步直接得出预测赔率所在的最终目标子区间,使用多个二分类模型组进行逐步判定,降低了预测赔付率的预测难度,简化判定过程的算法的设计,而相对简单的算法可以降低二分类模型组中每个二分类模型的出错概率。

步骤330:响应于确定预测赔付率位于前半区间,基于有效当前数据和第二边界赔付率,在第一子区间和第二子区间中,利用第二二分类模型判定预测赔付率落入的目标子区间。

在该步骤中,在确定预测赔付率落入前半区间后,利用第二二分类模型对输入的有效当前数据进行处理,将处理后得到的预测赔付率与所述第二边界赔付率进行比较,若预测赔付率大于第二边界赔付率,则说明预测赔付率位于第二子区间;若预测赔付率小于第二边界赔付率,则说明预测赔付率位于第一子区间。由于只需要判断预测赔付率与第一边界赔付率的大小关系,无需确定预测赔付率的具体数值,所以选择第二二分类模型进行判断,降低了预测赔付率的预测难度,简化判定过程的算法的设计,而相对简单的算法可以降低第二二分类模型的出错概率。

步骤340:响应于确定预测赔付率位于后半区间,基于有效当前数据和第三边界赔付率,在第三子区间和第四子区间中,利用第三二分类模型判定预测赔付率落入的目标子区间。

在该步骤中,在确定预测赔付率落入后半区间后,利用第三二分类模型对输入的有效当前数据进行处理,将处理后得到的预测赔付率与所述第三边界赔付率进行比较,若预测赔付率大于第三边界赔付率,则说明预测赔付率位于第四子区间;若预测赔付率小于第三边界赔付率,则说明预测赔付率位于第三子区间。由于只需要判断预测赔付率与第三边界赔付率的大小关系,无需确定预测赔付率的具体数值,所以选择第三二分类模型进行判断,降低了预测赔付率的预测难度,简化判定过程的算法的设计,而相对简单的算法可以降低第三二分类模型的出错概率。

在一些实施例中,如图7所示,步骤400:将目标子区间对应的子区间标签作为预测结果进行输出,具体包括:

步骤410:响应于确定目标子区间为第一子区间,将与第一子区间对应的第一标签作为预测结果进行输出。

在该步骤中,可选地,若确定目标子区间为第一子区间,选择将与第一子区间对应的第一标签“盈利较大”作为预测结果进行输出。

步骤420:响应于确定目标子区间为第二子区间,将与第二子区间对应的第二标签作为预测结果进行输出。

在该步骤中,可选地,若确定目标子区间为第二子区间,选择将与第二子区间对应的第二标签“盈利较小”作为预测结果进行输出。

步骤430:响应于确定目标子区间为第三子区间,将与第三子区间对应的第三标签作为预测结果进行输出。

在该步骤中,可选地,若确定目标子区间为第三子区间,选择将与第三子区间对应的第三标签“亏损较小”作为预测结果进行输出。

步骤440:响应于确定目标子区间为第四子区间,将与第四子区间对应的第四标签作为预测结果进行输出。

在该步骤中,可选地,若确定目标子区间为第第子区间,选择将与第四子区间对应的第四标签“亏损较大”作为预测结果进行输出。

在一些实施例中,如图8所示,步骤100:以企业险种为粒度获取当前组合特征数据,具体包括:

步骤110:以企业险种为粒度,将获取的预设时间区间内已生效的一年期保单及相关投保信息作为第一特征信息。

步骤120:将保单在生效期间中险种粒度的赔付金额和赔付人数作为第二特征信息。

步骤130:将该企业在过去一年的投保情况和赔付情况作为第三特征信息。

步骤140:将该企业所在城市和该企业的投保职业在过去一年中的赔付情况作为第四特征信息。

步骤150:组合第一特征信息、第二特征信息、第三特征信息和第四特征信息,得到当前组合特征数据。

其中,获取的信息具体包括:投保人信息及方案信息,其中投保人信息包括投保时间、单位性质、行业类别、职业类别、成员人数、在职人数、承保人数、投保人员年龄分布等;方案信息包括方案类型、契约形式、业务大类、险种、属组、保额、保费、折扣率、佣金率、销售区域、是否存有追溯指定生效日等。提取并组合以上维度的数据作为当前组合特征数据,最终形成的当前组合特征数据具体包含以下几种信息:(1)企业信息;(2)属组信息;(3)属组投保险种信息;(4)保单险种理赔信息。

需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。

需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种团险险种粒度赔付率预测装置。

参考图9,所述团险险种粒度赔付率预测装置,包括:

特征数据选取模块1,被配置为:以企业险种为粒度获取当前组合特征数据;

清洗模块2,被配置为:对当前组合特征数据进行脏数据清洗,得到有效当前数据;

预测模块3,被配置为:基于有效当前数据和预训练的二分类模型组,确定预测赔付率在预设的分布区间的目标子区间;

输出模块4,被配置为:将目标子区间对应的子区间标签作为预测结果进行输出。

为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

上述实施例的装置用于实现前述任一实施例中相应的团险险种粒度赔付率预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的团险险种粒度赔付率预测方法。

图10示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。

处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。

存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。

输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

上述实施例的电子设备用于实现前述任一实施例中相应的团险险种粒度赔付率预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的团险险种粒度赔付率预测方法。

本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的团险险种粒度赔付率预测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。

另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。

尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。

本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号