首页> 中国专利> 应用于大数据推送服务的反馈处理方法及机器学习服务器

应用于大数据推送服务的反馈处理方法及机器学习服务器

摘要

本公开实施例提供一种应用于大数据推送服务的反馈处理方法及机器学习服务器,采用在推送偏差知识点匹配更新通道的情况下,根据参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差确定参考更新维度的第一更新置信度,从而按照每一个参考更新维度的第一更新置信度确定推送偏差知识点的目标更新维度的方式,通过第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,使得推送偏差知识点进入误差高的更新业务的更新置信度较小,从而根据更新业务的更新历史误差执行推送偏差知识点的更新,减少更新误差,进而解决了推送偏差知识点产生时造成的用户画像匹配程度下降的情况。

著录项

  • 公开/公告号CN112839104A

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利权人 葛天齐;

    申请/专利号CN202110158307.4

  • 发明设计人 葛天齐;

    申请日2021-02-04

  • 分类号H04L29/08(20060101);G06N20/00(20190101);

  • 代理机构

  • 代理人

  • 地址 225000 江苏省扬州市邗江区文昌西路华城科技广场10幢1023室

  • 入库时间 2023-06-19 11:05:16

说明书

技术领域

本公开涉及大数据技术领域,示例性地,涉及一种应用于大数据推送服务的反馈处理方法及机器学习服务器。

背景技术

随着5G网络通信技术的崛起,互联网的流量时代已经结束,互联网技术的发展已经过渡到了大数据算法时代,随之而来的基于大数据和算法的精准推送(内容或商品等),也在用户生活中的各个领域出现产品的快速更新和发展。

人工智能之所以能取得突飞猛进的进展,是大数据长足发展的结果。任何智能的发展,其实都需要一个学习的过程,都是训练某一领域“智能”的前提。关于数据来源,互联网及物联网是产生并承载大数据的基地,互联网服务商在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据,针对这些数据可以在目标业务画像场景信息中快速提取目标数据挖掘类型的可挖掘数据,以便于后续进行智能信息推荐。然而在相关技术中,单轮的数据挖掘后的信息推荐不一定是完全准确的、符合用户画像特征的,可能会存在推送偏差知识点,因此为了提高业务推送准确率,通常会涉及相应的用户反馈机制从而根据用户反馈的信息再进行优化和更新,相关技术中,如此减少推送偏差知识点的更新误差,是本领域亟待解决的技术问题。

发明内容

为了至少克服现有技术中的上述不足,本公开的目的在于提供一种应用于大数据推送服务的反馈处理方法及机器学习服务器。

第一方面,本公开提供一种应用于大数据推送服务的反馈处理方法,应用于机器学习服务器,所述机器学习服务器与多个移动互联网终端通信连接,所述方法包括:

获取基于待挖掘业务数据集对应的目标推送知识点进行信息推送的目标推送信息的用户行为反馈信息,在所述用户行为反馈信息中推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差;

根据所述参考更新维度所对应的所述第一更新历史误差和所述第二更新历史误差,确定所述参考更新维度的第一更新置信度,其中,所述第一更新置信度与所述第一更新历史误差和所述第二更新历史误差呈相反趋势关系;

按照每一个所述参考更新维度所对应的所述第一更新置信度,在所述参考更新维度中确定出所述推送偏差知识点的目标更新维度;

针对所述推送偏差知识点按所述目标更新维度进行更新操作。

第二方面,本公开实施例还提供一种应用于大数据推送服务的反馈处理系统,所述应用于大数据推送服务的反馈处理系统包括机器学习服务器以及与所述机器学习服务器通信连接的多个移动互联网终端;

所述机器学习服务器,用于:

获取基于待挖掘业务数据集对应的目标推送知识点进行信息推送的目标推送信息的用户行为反馈信息,在所述用户行为反馈信息中推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差;

根据所述参考更新维度所对应的所述第一更新历史误差和所述第二更新历史误差,确定所述参考更新维度的第一更新置信度,其中,所述第一更新置信度与所述第一更新历史误差和所述第二更新历史误差呈相反趋势关系;

按照每一个所述参考更新维度所对应的所述第一更新置信度,在所述参考更新维度中确定出所述推送偏差知识点的目标更新维度;

针对所述推送偏差知识点按所述目标更新维度进行更新操作。

根据上述任意一个方面,本公开采用在推送偏差知识点匹配更新通道的情况下,根据参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差确定参考更新维度的第一更新置信度,从而按照每一个参考更新维度的第一更新置信度确定推送偏差知识点的目标更新维度的方式,通过第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,使得推送偏差知识点进入误差高的更新业务的更新置信度较小,从而根据更新业务的更新历史误差执行推送偏差知识点的更新,减少更新误差,进而解决了推送偏差知识点产生时造成的用户画像匹配程度下降的情况。

附图说明

图1为本公开实施例提供的应用于大数据推送服务的反馈处理系统的应用场景示意图;

图2为本公开实施例提供的应用于大数据推送服务的反馈处理方法的流程示意图;

图3为本公开实施例提供的应用于大数据推送服务的反馈处理装置的功能模块示意图;

图4为本公开实施例提供的用于实现上述的应用于大数据推送服务的反馈处理方法的机器学习服务器的结构组件示意框图。

具体实施方式

下面结合说明书附图对本公开进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。

图1是本公开一种实施例提供的应用于大数据推送服务的反馈处理系统10的交互示意图。应用于大数据推送服务的反馈处理系统10可以包括机器学习服务器100以及与机器学习服务器100通信连接的移动互联网终端200。图1所示的应用于大数据推送服务的反馈处理系统10仅为一种可行的示例,在其它可行的实施例中,该应用于大数据推送服务的反馈处理系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。

在一种可能的设计思路中,应用于大数据推送服务的反馈处理系统10中的机器学习服务器100和移动互联网终端200可以通过配合执行以下方法实施例所描述的应用于大数据推送服务的反馈处理方法,具体机器学习服务器100和移动互联网终端200的执行步骤部分可以参照以下方法实施例的详细描述。

为了解决前述背景技术中的技术问题,图2为本公开实施例提供的应用于大数据推送服务的反馈处理方法的流程示意图,本实施例提供的应用于大数据推送服务的反馈处理方法可以由图1中所示的机器学习服务器100执行,下面对该应用于大数据推送服务的反馈处理方法进行详细介绍。

步骤S110,在推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差。

本实施例中,这里的目标业务更新服务可以是偏差推送优化中配置的进行偏差推送优化的应用服务。目标业务更新服务上的推送偏差知识点在经过更新业务节点的情况下往往具有多个可选的更新维度,此时可以获取每一个参考更新维度上的第一更新历史误差和第二更新历史误差,从而根据不同的更新历史误差确定目标更新维度。可以理解的是,这里的更新历史误差用于指示信息推送资讯的误差。例如,可以根据订阅更新业务上的业务投诉标记率确定出第一更新历史误差,根据推荐更新业务上的业务投诉标记率确定出第二更新历史误差。

可以理解的是,在部分情况下,例如单向推送的信息推送资讯上,在经过更新业务节点的情况下,只有一个待选的更新维度,此时则必然选择该更新维度。在具有至少两个参考更新维度的情况下才执行步骤S110。可以理解的是,在目标业务更新服务上在每一信息推送资讯的更新业务节点的前段可以设置用于确定更新维度的目标更新通道,推送偏差知识点启用至目标更新通道的情况下,需要确定出更新维度。这里,可以设置目标更新通道-参考更新维度的映射关系,从而便于在目标更新通道处根据映射关系确定可供选择的参考更新维度。例如,推送偏差知识点在匹配目标更新通道的情况下,可以确定出具有3个参考更新维度。

这里的订阅更新业务可以包括:按参考更新维度更新所允许启用的第一更新业务。例如,对于某些业务而言,更新业务1和更新业务2均是订阅更新业务,推送偏差知识点可以在更新业务1或更新业务2上启用,并进行更新操作。可以理解的是,由于进入更新的更新业务时可能需要经过其它更新业务。再例如,推送偏差知识点在确定进行更新后,为了进行更新业务的执行,可能需要通过下一个更新业务3关联于更新业务1或更新业务2。为了后续根据第一更新历史误差和第二更新历史误差确定出的第一更新置信度更符合推送偏差知识点启用下的信息推送资讯误差,这里的订阅更新业务还可以包括进入第一更新业务所需匹配的第二更新业务。这里的推荐更新业务包括:按参考更新维度更新后所允许启用的第三更新业务。

步骤S120,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系。

这里,第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,也就是第一更新置信度随着第一更新历史误差和第二更新历史误差的增大而减小,随着第一更新历史误差和第二更新历史误差的减小而增大,从而使得误差较大的参考更新维度被确定为目标更新维度的更新置信度小于误差较低的参考更新维度,从而使得推送偏差知识点选择误差低的参考更新维度的更新置信度较大。这里的第一更新置信度可以是与第一更新历史误差和第二更新历史误差之和呈相反趋势关系。可以理解的是,由于推送偏差知识点在更新中,在订阅更新业务上更容易误差较大,故而第一更新置信度可以是与第一更新历史误差和第二更新历史误差的加权之和呈相反趋势关系,在一种可能的设计思路中,第一更新历史误差的计算系数大于第二更新历史误差的计算系数。

步骤S130,按照每一个参考更新维度所对应的第一更新置信度,在参考更新维度中确定出推送偏差知识点的目标更新维度。

步骤S140,针对推送偏差知识点按目标更新维度进行更新操作。

在本公开实施例中,采用在推送偏差知识点匹配更新通道的情况下,根据参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差确定参考更新维度的第一更新置信度,从而按照每一个参考更新维度的第一更新置信度确定推送偏差知识点的目标更新维度的方式,通过第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,使得推送偏差知识点进入误差高的更新业务的更新置信度较小,从而根据更新业务的更新历史误差执行推送偏差知识点的更新,减少更新误差,进而解决了推送偏差知识点产生时造成的用户画像匹配程度下降的情况。

可以理解的是,前述的更新历史误差用于指示目标业务更新服务上的信息推送资讯的误差。例如,可以根据订阅更新业务上的业务投诉标记率确定出第一更新历史误差,根据推荐更新业务上的业务投诉标记率确定出第二更新历史误差。可以理解的是,在每一个更新业务节点的上游均可以设置目标更新通道,从而便于推送偏差知识点启用至目标更新通道的情况下,确定推送偏差知识点的目标更新维度。

在一种可能的设计思路中,根据每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差,确定推送偏差知识点的目标更新维度可以包括:根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系。按照每一个参考更新维度所对应的第一更新置信度,在参考更新维度中确定出推送偏差知识点的目标更新维度。这里,采用在推送偏差知识点匹配更新通道的情况下,根据参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差确定参考更新维度的第一更新置信度,从而按照每一个参考更新维度的第一更新置信度确定推送偏差知识点的目标更新维度的方式,通过第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,使得推送偏差知识点进入误差高的更新业务的更新置信度较小,根据更新业务的更新历史误差执行推送偏差知识点的更新,减少更新误差。

在一种可能的设计思路中,在目标业务更新服务上显示推送偏差知识点按目标更新维度进行更新操作包括:根据目标更新维度,从订阅更新业务的至少一个第一子更新业务中确定出第一目标子更新业务,并从推荐更新业务的至少一个第二子更新业务中确定出第二目标子更新业务。显示推送偏差知识点关联于第一目标子更新业务启用,并在第一子更新业务的更新位置处更新,进一步关联于第二目标子更新业务。这里,在确定目标更新维度后,可以根据目标更新维度确定订阅更新业务和推荐更新业务,从而确定出实际启用的第一目标子更新业务和第二目标子更新业务。可以理解的是,由于本公开实施例根据第一更新历史误差和第二更新历史误差确定目标更新维度,故而推送偏差知识点在更新中进入误差低的更新业务的更新置信度更大,从而保证推送偏差知识点的正常业务更新。

在一种可能的设计思路中,在显示多个推送偏差知识点启用在目标业务更新服务中之后,上述方法还可以包括:在任一个推送偏差知识点在目标业务更新服务的更新业务上的推送持续数量大于预设数量的情况下,显示将推送持续数量大于预设数量的推送偏差知识点从目标业务更新服务上移除。可以理解的是,通过移除推送持续数量大于预设数量的推送偏差知识点,也可以对局部误差较大,从而提高偏差推送的优化更新效率。

在一种可能的设计思路中,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度包括:根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差之和呈相反趋势关系,或者,第一更新置信度与第一更新历史误差和第二更新历史误差的加权之和呈相反趋势关系。这里在一种可能的设计思路中,第一更新历史误差的计算系数大于第二更新历史误差的计算系数。这里,第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系,使得误差较大的参考更新维度被确定为目标更新维度的更新置信度小于误差较低的参考更新维度,从而使得推送偏差知识点选择误差低的参考更新维度的更新置信度较大。

在一种可能的设计思路中,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差之和呈相反趋势关系,包括:在参考更新维度所对应的第一更新历史误差和第二更新历史误差之和大于或等于第一误差的情况下,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差之和呈相反趋势关系。或者,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差的加权之和呈相反趋势关系,包括:在参考更新维度所对应的第一更新历史误差和第二更新历史误差的加权之和大于或等于第二误差的情况下,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差的加权之和呈相反趋势关系。

这里,可以理解的是,当目标业务更新服务上的推送偏差知识点的数量过多时,若对每一个推送偏差知识点均确定该推送偏差知识点所对应的待选的更新维度的第一更新置信度,则所需的计算量较大。而当每一个参考更新维度所对应的订阅更新业务和推荐更新业务的知识点均较少的情况下,不论选择哪一个参考更新维度均不会造成信息推送资讯的误差较大。故而,在本公开实施例中,在参考更新维度所对应的第一更新历史误差和第二更新历史误差之和大于或等于第一误差的情况下,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,或者,在参考更新维度所对应的第一更新历史误差和第二更新历史误差的加权之和大于或等于第二误差的情况下,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度。这里的第一误差可以等于第二误差。

可以理解的是,在第一更新历史误差和第二更新历史误差之和小于第一误差的情况下,可以将为该参考更新维度所配置的第一更新置信度确定为第一更新置信度,或者,在第一更新历史误差和第二更新历史误差加权之和小于第二误差的情况下,可以将为该参考更新维度所配置的第二更新置信度确定为第一更新置信度。例如,可以预先为每一个参考更新维度配置相对于的更新置信度,如参考更新维度A的更新置信度为30%,参考更新维度B的更新置信度为30%,参考更新维度C的更新置信度为40%。

在一种可能的设计思路中,在参考更新维度所对应的第一更新历史误差和第二更新历史误差之和大于或等于第一误差的情况下,根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度包括:在参考更新维度所对应的第一更新历史误差和第二更新历史误差之和大于或等于第一误差的情况下,将参考更新维度所对应的第一更新历史误差和第二更新历史误差之和占第一数值的比例,确定为参考更新维度所对应的第一更新置信度,其中,第一数值为每一个参考更新维度所对应的第一更新历史误差和第二更新历史误差之和。

例如,可以通过公式Pi=Fi/Σ(Fi)计算获得参考更新维度i所对应的第一更新置信度Pi,其中,Fi=1/(Diin+Diout),Diout为参考更新维度i所对应的第一更新历史误差,Diin为参考更新维度i所对应的第二更新历史误差。

在一种可能的设计思路中,在推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差包括:在推送偏差知识点匹配目标更新通道的情况下,确定参考更新维度所对应的订阅更新业务和推荐更新业务,其中,订阅更新业务包括:按参考更新维度更新所允许启用的第一更新业务和进入第一更新业务所需匹配的第二更新业务,推荐更新业务包括:按参考更新维度更新后所允许启用的第三更新业务。将订阅更新业务所对应的第一业务投诉标记率确定为第一更新历史误差,其中,第一业务投诉标记率与订阅更新业务上的知识点的业务投诉数量相关。将推荐更新业务所对应的第二业务投诉标记率确定为第二更新历史误差,其中,第二业务投诉标记率与推荐更新业务上的知识点的业务投诉数量相关。

这里,通过将按参考更新维度更新所允许启用的第一更新业务和进入第一更新业务所需匹配的第二更新业务均确定为推荐更新业务,更加符合推送偏差知识点在目标业务更新服务上的实际启用情况,使得后续根据第一更新历史误差选择出的目标更新维度更为准确。在本公开实施例中,将订阅更新业务所对应的第一业务投诉标记率确定为第一更新历史误差,将推荐更新业务所对应的第二业务投诉标记率确定为第二更新历史误差。业务投诉标记率用于指示更新业务上知识点的业务投诉密集度,例如可以将在某一单位时间段的订阅更新业务上的知识点的业务投诉数量确定为第一业务投诉标记率,将单位时间段的推荐更新业务上的知识点的业务投诉数量确定为第二业务投诉标记率。可以理解的是,第一更新业务是执行参考更新维度的情况下所有允许启用的更新业务,第二更新业务是执行参考更新维度的情况下所有允许启用的更新业务。

在一种可能的设计思路中,针对推送偏差知识点按目标更新维度进行更新操作的具体实现方式可以包括:根据目标更新维度,从订阅更新业务的至少一个第一子更新业务中确定出第一目标子更新业务,并从推荐更新业务的至少一个第二子更新业务中确定出第二目标子更新业务。控制推送偏差知识点关联于第一目标子更新业务启用,并在第一子更新业务的更新位置处更新,进一步关联于第二目标子更新业务。这里,在确定目标更新维度后,可以根据目标更新维度确定订阅更新业务和推荐更新业务,从而确定出实际启用的更新业务。可以理解的是,为了推送偏差知识点启用有序,可以将第一目标子更新业务与第二目标子更新业务一一对应,在确定出第一目标子更新业务的情况下,根据沿预先配置的第一路径启用,由第一目标子更新业务进一步关联于第二目标子更新业务。

在一种可能的设计思路中,从订阅更新业务的至少一个第一子更新业务中确定出第一目标子更新业务包括:在第一子更新业务的数量大于等于两个的情况下,获取每一个第一子更新业务所对应的第三更新历史误差。根据第一子更新业务所对应的第三更新历史误差,确定第一子更新业务的第二更新置信度,其中,第二更新置信度与第三更新历史误差呈相反趋势关系。按照每一个第一子更新业务所对应的第二更新置信度,在第一子更新业务中确定出推送偏差知识点启用的第一目标子更新业务。

在一种可能的设计思路中,从订阅更新业务的至少一个第一子更新业务中确定出第一目标子更新业务包括:在第一子更新业务的数量大于等于两个的情况下,从第一子更新业务中随机确定出第一目标子更新业务,其中,每一个第一子更新业务被确定为第一目标子更新业务的更新置信度相同。当然可以理解的是,在本公开另一个可选实施例中,也可以在至少两个第一子更新业务中随机选择出第一目标子更新业务。

可以理解的是,对于第二目标子更新业务也可以根据第二子更新业务分别对应的第四更新历史误差,确定第二子更新业务的第三更新置信度,从而按照每一个第二子更新业务的第三更新置信度确定出第二目标子更新业务。或者,在至少两个第二子更新业务中随机选择出第二目标子更新业务,每一个第二子更新业务确定为第二目标子更新业务的更新置信度相同。

当然可以理解的是,在第一目标子更新业务确定情况下,也可以按照预先确定的第一目标子更新业务-第二目标子更新业务映射关系,确定出第二目标子更新业务,也就是,每一个第一目标子更新业务对应一个预先配置的第二目标子更新业务,从而减少计算量。

在一种可能的设计思路中,在推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差之前,还可以在任一个推送偏差知识点在目标业务更新服务的更新业务上的推送持续数量大于预设数量的情况下,将推送持续数量大于预设数量的推送偏差知识点从目标业务更新服务的更新业务上移除。

这里,由于偏差推送优化中所需控制的推送偏差知识点的数量较多,对于部分推送偏差知识点可能由于程序问题停留在目标业务更新服务上,故而对每一个推送偏差知识点在目标业务更新服务上的推送持续数量进行计时,在推送持续数量大于预设数量的情况下,可以将推送偏差知识点从目标业务更新服务上移除。可以理解的是,通过移除推送持续数量大于预设数量的推送偏差知识点,也可以对局部误差较大的推送偏差知识点移除,从而提高偏差推送的优化更新效率。

在一种可能的设计思路中,对于步骤S110,在获取基于待挖掘业务数据集对应的目标推送知识点进行信息推送的目标推送信息的用户行为反馈信息的流程中,可以通过以下示例性的子步骤实现。

步骤S111,调取移动互联网终端的业务项目大数据中任一目标业务项目数据,提取目标业务项目数据在目标业务画像场景信息中的第一描述信息,第一描述信息表征目标业务项目数据的画像场景特征和/或画像扩展特征。

在一种可能的设计示例中,上述机器学习服务器100自身维护有业务项目大数据库,该移动互联网终端的业务项目大数据中存储有多个挖掘业务对象数据作为目标业务项目数据。该业务项目大数据库可以由机器学习服务器100或其它外部服务中心(如业务响应服务器等)定期或不定期地更新内容。

在一种可能的设计示例中,从移动互联网终端的业务项目大数据中选择目标业务项目数据,当目标业务画像场景信息中存在与目标业务项目数据相同的业务画像标签时,提取目标业务项目数据在目标业务画像场景信息中的第一描述信息。

步骤S112,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到第二描述信息,第二描述信息表征预设画像场景描述信息与第一描述信息的关联关系。

在一种可能的设计示例中,目标业务项目数据的画像场景特征至少包括该目标业务项目数据在目标业务画像场景信息中的匹配业务信息。画像扩展特征至少包括目标业务项目数据所在业务场景的业务场景特征。预设画像场景描述信息至少包括:目标业务项目数据的业务场景特征和目标业务项目数据对应的至少一个关键业务数据。

在一种可能的设计示例中,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到目标业务项目数据在目标业务画像场景信息中的第二描述信息,包括:根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定目标业务项目数据的关联业务项目数据中存在的目标业务项目数据对应的至少一个关键业务数据,以及每个关键业务数据与最关联的目标业务项目数据之间的匹配业务数量。计算目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度。将每个关键业务数据与最关联的目标业务项目数据之间的匹配业务数量以及目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度,作为第二描述信息。

步骤S113,对目标业务项目数据的第一描述信息以及第二描述信息进行映射处理。

在一种可能的设计示例中,将第一描述信息和第二描述信息输入至经预先配置得到目标描述信息的决策神经网络,计算出第一描述信息和第二描述信息与目标描述信息的匹配度。

在一种可能的设计示例中,在配置决策神经网络的过程中,首先获取用于配置决策神经网络的样本业务画像场景信息,并对获取的样本业务画像场景信息进行业务场景区分处理,样本业务画像场景信息中的目标业务项目数据具有至少一个指示目标业务项目数据是否为该样本业务画像场景信息的目标数据挖掘类型的标签。从样本业务画像场景信息中提取附带标签的目标业务项目数据以及该目标业务项目数据的第三描述信息。利用附带标签的目标业务项目数据的预设画像场景描述信息对该目标业务项目数据的第三描述信息进行处理,得到目标业务项目数据的第四描述信息。对附带标签的目标业务项目数据的第三描述信息和第四描述信息进行映射处理,分别记录标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,将第一映射处理结果和第二映射处理结果作为目标描述信息。

步骤S114,根据第一描述信息和第二描述信息与目标描述信息的匹配度,确定目标业务项目数据是否为目标业务画像场景信息的目标数据挖掘类型,其中,目标数据挖掘类型用于指示与目标业务画像场景信息相关的挖掘业务对象,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息。

在一种可能的设计示例中,当第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度时,确定目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型。

在一种可能的设计示例中,目标业务项目数据具有用于指示目标业务项目数据所属业务场景的业务场景标签。在对目标业务项目数据的第一描述信息以及第二描述信息进行映射处理之后,将目标业务项目数据的所属业务场景作为目标业务场景。对第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度目标业务项目数据,进行迁移数据识别处理,以消除迁移数据。对迁移数据识别处理后的目标业务项目数据进行聚类分析,将包括业务场景标签的目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到业务场景的目标数据挖掘类型。

在一种可能的设计示例中,在调取移动互联网终端的业务项目大数据中任一目标业务项目数据之后,获取预设业务互动微服务。对预设业务互动微服务进行业务场景特征分析,得到目标业务项目数据的业务场景特征。对预设业务互动微服务进行关键业务数据分析,得到目标业务项目数据对应的至少一个关键业务数据。

在一种可能的设计示例中,目标数据挖掘类型为挖掘业务对象数据。

本公开实例提供的目标数据挖掘类型的确定方法,通过提取目标业务画像场景信息中的目标业务项目数据的第一描述信息,并利用目标业务项目数据的预设画像场景描述信息对第一描述信息进行加工处理,生成目标业务项目数据的第二描述信息,对目标业务项目数据的第一描述信息和第二描述信息进行映射处理,当满足预设条件时确定目标业务项目数据是否为目标数据挖掘类型。一方面,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。

下面详细介绍本公开实例提出的目标数据挖掘类型的确定方法,该方可以由前述机器学习服务器100执行。例如该方法包括以下步骤:

步骤S210,获取目标业务画像场景信息。

在一种可能的设计示例中,目标数据挖掘类型用于指示与目标业务画像场景信息相关的挖掘业务对象,具体而言,目标数据挖掘类型可以是挖掘业务对象的应用业务,例如基金推送业务等。用户自身并不清楚挖掘业务对象的确切应用业务,而只是知道自身的意图方向。因此,当用户根据自身需求在目标挖掘业务对象比如搜索栏中输入需要搜索的内容、寻找哪些业务画像场景信息中提到了与该需求匹配的相关应用业务时,目标挖掘业务对象对应的机器学习服务器100可以根据用户输入的内容,比如“如何进行基金投资”、“基金投资策略”等,检索出一些关于该内容的业务画像场景信息,这些检索出来的业务画像场景信息为上述目标业务画像场景信息,以供后续提取出符合用户需求的目标数据挖掘类型。

步骤S220,从移动互联网终端的业务项目大数据中调取移动互联网终端的业务项目大数据中任一目标业务项目数据。

步骤S230,获取目标业务项目数据的预设画像场景描述信息。

在一种可能的设计示例中,目标业务项目数据的预设画像场景描述信息包括:目标业务项目数据的业务场景特征和该目标业务项目数据对应的至少一个关键业务数据。

在一种可能的设计示例中,在获取目标业务项目数据的预设画像场景描述信息时,可以执行示例性的实施方式。

步骤S231,获取预设业务互动微服务。

例如,上述业务互动微服务可以预先设定,每个业务互动微服务可以包括多个分散的子业务互动微服务,比如可以包括基金选择服务中的数据、基金推荐进程中挖掘业务对象的描述信息以及人工筛选出的重点业务画像场景信息,等等,但不限于此。

步骤S232,对预设业务互动微服务进行业务场景特征分析,得到目标业务项目数据的业务场景特征。

在获取目标业务项目数据的业务场景特征时,机器学习服务器100可以通过第一预设算法,对上述各个子业务互动微服务进行业务场景特征分析,得到上述目标业务项目数据的一个多维的业务场景特征,得到的目标业务项目数据的业务场景特征可以代表目标业务项目数据在对应子业务互动微服务中的业务类别属性,其中,上述第一预设算法可以为现有技术中的特征向量提取算法,可以将子业务互动微服务的服务数据表示转换为业务类别属性空间中的向量。

这里,上述基金推荐进程中挖掘业务对象的描述信息可以为在基金推荐进程中发布或更新挖掘业务对象时,所提供的对该挖掘业务对象的描述信息,比如该挖掘业务对象的业务对象源、业务版本号、业务简介等等。

步骤S233,对预设业务互动微服务进行关键业务数据分析,得到目标业务项目数据对应的至少一个关键业务数据。

在一种可能的设计示例中,在获取上述目标业务项目数据对应的至少一个关键业务数据时,上述机器学习服务器100可以利用第二预设算法对上述各个子业务互动微服务进行分析,提取出一个或多个关键业务数据作为上述目标业务项目数据对应的至少一个关键业务数据。这里,上述目标业务项目数据对应的至少一个关键业务数据为与上述目标业务项目数据相关的业务项目数据,例如可以为描述上述目标业务项目数据所代表的挖掘业务对象的操作方法的业务项目数据,等等。

例如,在获取上述目标业务项目数据对应的至少一个关键业务数据时,上述机器学习服务器100可以对上述各个自业务互动微服务中的微服务数据按照完整的业务场景进行场景区分,对区分得到的每个业务场景进行业务场景类别分析以及场景标注处理,只保留指定业务场景类别的业务画像标签,来作为候选关键业务数据。以保留的候选关键业务数据为节点,以候选关键业务数据的共现关系作为边,构建候选关键业务数据图,迭代计算各个候选关键业务数据的计算系数,直至收敛,对各个候选关键业务数据的计算系数进行排序,从而得到最重要的X个候选关键业务数据,其中X≥1。查询挖掘业务对象数据库,对X个候选关键业务数据进行标记并过滤,得到N个关键业务数据,其中N≤X,并将N个关键业务数据作为上述目标业务项目数据对应的关键业务数据。

步骤S234,当目标业务画像场景信息中存在与目标业务项目数据相同的业务画像标签时,从目标业务画像场景信息中提取目标业务项目数据的第一描述信息,第一描述信息表征目标业务项目数据的画像场景特征和/或画像扩展特征。

在一种可能的设计示例中,上述目标业务项目数据的画像场景特征包括该目标业务项目数据在目标业务画像场景信息中的匹配业务信息。又例如,上述目标业务项目数据的画像场景特征还可以进一步包括上述目标业务项目数据的业务热度,其中,上述目标业务项目数据的业务热度,可以指示目标业务项目数据在目标业务画像场景信息中的出现次数。

在一种可能的设计示例中,上述目标业务项目数据的画像扩展特征包括上述目标业务项目数据所在业务场景的业务场景特征。又例如,上述目标业务项目数据的画像扩展特征还可以进一步包括上述目标业务项目数据的关联业务项目数据的业务场景类别,其中,上述关联业务项目数据为上述目标业务项目数据前后各Q个业务项目数据,即关联业务项目数据共包括2Q个业务项目数据。

例如,在提取上述目标业务项目数据的画像场景特征时,上述机器学习服务器100先确定上述目标业务项目数据在上述目标业务画像场景信息中的匹配业务信息,再统计出上述目标业务项目数据在上述目标业务画像场景信息中出现的次数,并将确定的上述目标业务项目数据的匹配业务信息以及出现次数作为上述目标业务项目数据的画像场景特征。又例如,上述机器学习服务器100还可以进一步确定出上述目标业务项目数据所代表的挖掘业务对象的业务需求方及其在目标业务画像场景信息中出现的场景位置信息,并将其作为上述目标业务项目数据的画像场景特征。

例如,在提取上述目标业务项目数据的画像扩展特征时,上述机器学习服务器100在确定上述目标业务项目数据在上述目标业务画像场景信息中的匹配业务信息后,获取上述目标业务项目数据出现时所在的各个业务场景,并提取上述目标业务项目数据所在的业务场景的业务场景特征,并将这些业务场景各自的业务场景特征作为上述目标业务项目数据的画像扩展特征。这里,可以使用上述第一预设算法来提取上述目标业务项目数据所在的业务场景的业务场景特征。又例如,上述机器学习服务器100在确定上述目标业务项目数据在上述目标业务画像场景信息中出现的业务层级后,还可以获取上述目标业务项目数据的关联业务项目数据的业务场景类别,并将获取的上述目标业务项目数据的关联业务项目数据的业务场景类别作为上述目标业务项目数据的画像扩展特征,也即还可以获取上述目标业务项目数据前后M个业务项目数据的业务场景类别,并将获取的上述目标业务项目数据前后M个业务项目数据的业务场景类别作为上述目标业务项目数据的画像扩展特征。

步骤S235,利用目标业务项目数据的预设画像场景描述信息对提取的第一描述信息进行处理,得到目标业务项目数据在目标业务画像场景信息中的第二描述信息,第二描述信息表征了目标业务项目数据的预设画像场景描述信息与第一描述信息的关联关系。

在一种可能的设计示例中,在上述机器学习服务器100对提取的上述第一描述信息进行处理时,可执行下述实施方式的操作:

步骤S2351,根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定每个出现位置处目标业务项目数据的关联业务项目数据中存在的目标业务项目数据对应的关键业务数据,以及每个关键业务数据与位置上最关联的目标业务项目数据之间的匹配业务数量。

例如,上述机器学习服务器100根据目标业务项目数据在目标业务画像场景信息中的匹配业务信息,确定上述目标业务项目数据的关联业务项目数据比如前后各100个业务项目数据中是否存在上述目标业务项目数据对应的关键业务数据,如果存在,则依次确定每个上述关键业务数据与其位置上最关联的上述目标业务项目数据之间的匹配业务数量,上述匹配业务数量也即上述关键业务数据和与其位置上最关联的上述目标业务项目数据之间间隔的字的个数。

步骤S2352,计算目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度。

在一种可能的设计示例中,上述机器学习服务器100计算上述目标业务项目数据的业务场景特征和上述目标业务项目数据所在业务场景的业务场景特征的匹配业务数量,并将该匹配业务数量作为二者的匹配度。又例如,上述目标业务项目数据的业务场景特征是可以代表上述目标业务项目数据的本义,因此,如果得到的二者的匹配度大于相似阈值,也即上述目标业务项目数据在上述目标业务画像场景信息中所在的业务场景代表上述目标业务项目数据的本来业务服务,而不是挖掘业务对象的业务服务,也就说明上述目标业务项目数据所在业务场景的业务场景特征对应的目标业务项目数据不是目标数据挖掘类型。

例如,上述目标业务项目数据的业务场景特征为FA={fA1,fA2,…,fAS},上述目标业务项目数据所在业务场景的业务场景特征为FB={fB1,fB2,…,fBS},S为业务场景特征FA和业务场景特征FB的业务节点,则可以计算出上述业务场景特征FA和业务场景特征FB的匹配度。

步骤S2353,将每个关键业务数据与位置上最关联的目标业务项目数据之间的匹配业务数量以及目标业务项目数据的业务场景特征和目标业务项目数据所在业务场景的业务场景特征的匹配度,作为第二描述信息。

进一步地,步骤S236,将目标业务项目数据的第一描述信息以及第二描述信息输入至经预先配置得到目标描述信息的决策神经网络。

在一种可能的设计示例中,上述决策神经网络可以是基于神经网络的决策神经网络,该决策神经网络连接一个分类器,比如Random Forrest分类器。从用于配置的样本业务画像场景信息中提取出用于配置上述决策神经网络的目标业务项目数据的第一描述信息和第二描述信息,将用于配置上述决策神经网络的目标业务项目数据的第一描述信息和第二描述信息输入上述决策神经网络,进而使上述决策神经网络学习得到上述目标描述信息,以使其后续可以分类识别目标业务项目数据是否为目标数据挖掘类型。

其中,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息,是配置后的决策神经网络记录的属性标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录属性标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,也即上述目标描述信息是在对上述决策神经网络配置的过程中,决策神经网络学习到的上述目标业务项目数据是目标数据挖掘类型时的训练向量的描述信息和上述目标业务项目数据不是目标数据挖掘类型时的训练向量的描述信息。

关于配置上述决策神经网络的方法,下文中会详细描述,这里不再赘述。

步骤S237,当第一描述信息和第二描述信息与目标描述信息中的第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与目标描述信息中的第二映射处理结果的匹配度时,对于第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度的目标业务项目数据,进行迁移数据识别处理,以消除迁移数据。例如,迁移数据可以是指存在业务迁移变化的数据,该部分数据需要预先进行消除。

在一种可能的设计示例中,在将第一描述信息和第二描述信息输入至经预先配置得到目标描述信息的决策神经网络之后,上述决策神经网络计算出第一描述信息和第二描述信息与目标描述信息的匹配度,当第一描述信息和第二描述信息与第一映射处理结果的匹配度大于或等于第一描述信息和第二描述信息与第二映射处理结果的匹配度时,确定目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型。

步骤S238,对迁移数据识别处理后的目标业务项目数据的进行聚类分析,将包括业务场景标签的目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到业务场景的目标数据挖掘类型。

在一种可能的设计示例中,目标业务项目数据还可以进一步包括用于指示目标业务项目数据所属的业务场景的业务场景标签。例如,如前,上述机器学习服务器100自身维护一个业务项目大数据库,该移动互联网终端的业务项目大数据中存储有多个挖掘业务对象数据作为目标业务项目数据,在存储时,根据各个目标业务项目数据所代表的挖掘业务对象所属的业务场景,对这些目标业务项目数据进行业务场景划分,并分别为其生成业务场景标签。

在一种可能的设计示例中,上述机器学习服务器100将目标业务项目数据的所属业务场景作为目标业务场景;由于上述机器学习服务器100消除迁移数据的上述目标业务项目数据的候选集中的各个目标业务项目数据第一描述信息和第二描述信息与目标描述信息的匹配度大于或等于预设阈值,也即上述目标业务项目数据的候选集中的各个目标业务项目数据是目标数据挖掘类型的置信度大于或等于预设阈值,可以使用K-means聚类方法对上述目标业务项目数据的候选集中的各个目标业务项目数据进行聚类分析,得到K个类,每个类对应一个业务场景,将目标业务项目数据所在的聚类分析结果作为目标数据挖掘类型所在的聚类分析结果,并从聚类分析结果中得到目标业务场景的目标数据挖掘类型。

又例如,在从聚类分析结果中得到目标业务场景的目标数据挖掘类型之后,还可以对聚类方法的聚类阈值进一步调整,来扩大聚类的范围,进而召回一些第一描述信息和第二描述信息与目标描述信息的匹配度小于预设阈值的目标业务项目数据,也即将一些是目标数据挖掘类型的置信度大于或等于预设阈值的目标业务项目数据加入到上述目标数据挖掘类型所在的聚类结果中。这样可以提高识别一些冷门的挖掘业务对象数据作为的目标数据挖掘类型的准确性和召回率。

在一种可能的设计示例中,上述机器学习服务器100还可以使用其它聚类算法,比如层次聚类方法对消除迁移数据的上述目标业务项目数据的候选集中的各个目标业务项目数据进行聚类分析,得到目标业务场景的目标数据挖掘类型,本公开实例对此不进行具体限定。

由此,一方面,由于使用了预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,大大提高了在目标业务画像场景信息中提取目标数据挖掘类型的准确性,另一方面在对第一描述信息和第二描述信息进行映射处理时的业务处理速度较快,因此,也便于快速确定目标业务画像场景信息中的目标数据挖掘类型,提高后续数据挖掘效率。

前述步骤S236中使用了预先配置的决策神经网络,来对第一描述信息与第二描述信息进行映射处理,以便得到与目标描述信息的匹配度。譬如接下来对配置决策神经网络的流程进行详细说明,例如可以包括以下步骤:

步骤A,获取样本业务画像场景信息,样本业务画像场景信息包括至少一个指示目标业务项目数据是否为目标数据挖掘类型的标签。

在一种可能的设计示例中,选取不同业务场景中预设数量的业务画像场景信息作为目标样本业务画像场景信息;利用标注模型对目标样本业务画像场景信息进行业务拆分处理,以标注出目标样本业务画像场景信息中有可能是挖掘业务对象数据的目标业务项目数据,并生成各个目标业务项目数据在目标样本业务画像场景信息中的标签,进而生成样本业务画像场景信息。

例如,从各个业务场景选取预设数量的业务画像场景信息,比如从电商直播业务场景选取2000个业务画像场景信息,从短视频业务场景选取2000篇业务画像场景信息,并将选取的这些业务画像场景信息作为目标样本业务画像场景信息;利用标注模型比如HNN模型(HopfieldNeural Network模型),对上述目标样本业务画像场景信息进行标注处理,标注出上述目标样本业务画像场景信息中出现的各个目标业务项目数据,并确定上述各个目标业务项目数据是否为目标数据挖掘类型,生成上述各个目标业务项目数据的标签,也即生成指示目标业务项目数据是否为目标数据挖掘类型的标签,这种从各个业务场景选取的、包含的目标业务项目数据附带有该目标业务项目数据是否为目标数据挖掘类型的标签的业务画像场景信息为样本业务画像场景信息。

又例如,为了保证目标样本业务画像场景信息中各个目标业务项目数据的标签的准确性,还可以对上述各个目标业务项目数据的标签进行人工校验。例如,根据目标业务项目数据在上述目标样本业务画像场景信息中的业务层级,对上述各个目标业务项目数据的标签进行人工校验,进而得到人工样本业务画像场景信息。

步骤B,从样本业务画像场景信息中提取附带标签的目标业务项目数据以及该目标业务项目数据的第三描述信息。

步骤C,利用附带标签的目标业务项目数据的预设画像场景描述信息对该目标业务项目数据的第三描述信息进行处理,得到目标业务项目数据的第四描述信息。

步骤D,对附带标签的目标业务项目数据的第三描述信息和第四描述信息进行映射处理。

在一种可能的设计示例中,将附带标签的目标业务项目数据的第三描述信息和第四描述信息输入至经预先配置得到目标描述信息的决策神经网络。由于上述样本业务画像场景信息中的每一个目标业务项目数据附带对应的标签,用于指示该目标业务项目数据是否为目标数据挖掘类型,因此,输入的该目标业务项目数据的第三描述信息和第四描述信息也间接的附带有上述目标业务项目数据的标签。

这里,上述标签可以为“1”或“0”,“1”用于表示确定标签,也即标识目标业务项目数据是目标数据挖掘类型,“0”用于表示非确定标签,也即表示目标业务项目数据不是目标数据挖掘类型。

例如,可以将附带标签的目标业务项目数据的上述第三描述信息和上述第四描述信息作为附带标签的目标业务项目数据的一个训练向量,输入值上述决策神经网络。

不失一般性的假设,输入的训练向量的格式可以如下:

目标业务项目数据1 标签1 训练向量1

目标业务项目数据2 标签2 训练向量2

……

在一种可能的设计示例中,当上述决策神经网络接收到输入的第三描述信息和第四描述信息组成的训练向量后,会学习具有表示确定标签的目标业务项目数据的训练向量的特征以及表示非确定标签的目标业务项目数据的训练向量的特征,并将学习的具有表示确定标签的目标业务项目数据的训练向量的描述信息作为第一分类结果,将学习的表示非确定标签的目标业务项目数据的训练向量的描述信息作为第二分类结果。

步骤E,分别记录标签表征确定标签的目标业务项目数据对应的第一映射处理结果,以及记录标签表征非确定标签的目标业务项目数据对应的第二映射处理结果,并将第一映射处理结果和第二映射处理结果作为目标描述信息。

在一种可能的设计示例中,目标描述信息为指示目标业务项目数据是否为目标数据挖掘类型的描述信息,通过对上述决策神经网络的配置,上述决策神经网络记录了目标业务项目数据是目标数据挖掘类型时对应的训练向量的描述信息和目标业务项目数据不是目标数据挖掘类型时对应的训练向量的描述信息,将其作为上述目标描述信息,也即上述目标描述信息是在对上述决策神经网络配置的过程中,决策神经网络学习到的上述目标业务项目数据是目标数据挖掘类型时的训练向量的描述信息和上述目标业务项目数据不是目标数据挖掘类型时的训练向量的描述信息。

在一种可能的设计示例中,在完成对上述决策神经网络的配置之后,当输入目标业务项目数据在目标业务画像场景信息中的第一描述信息和第二描述信息后,上述决策神经网络会计算出第一描述信息和第二描述信息与目标描述信息的匹配置信度,并将该匹配置信度作为第一描述信息和第二描述信息与目标描述信息上述匹配度。

在本公开实施例中,从目标业务画像场景信息中提取出具有标签的目标业务项目数据的预设画像场景描述信息和表征目标业务项目数据的画像场景特征和/或画像扩展特征的第一描述信息,对上述决策神经网络进行配置,该配置规模较低,并且收集业务互动微服务的成本较低,同时还可以达到准确高效,完全满足了快速识别目标业务画像场景信息中的目标数据挖掘类型的需求。

在一种可能的设计示例中,在以上实施例的基础上,在应用层面,还可以包括以下步骤。

步骤S114,当目标业务项目数据为目标业务画像场景信息的目标数据挖掘类型时,将目标业务项目数据添加到待挖掘业务数据集中,依据待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布。

在一种可能的设计思路中,在获取待挖掘业务数据集之后,可以对待挖掘业务数据集执行业务拆分处理,得到各个拆分业务组成的待挖掘业务数据集序列,再对待挖掘业务数据集序列进行处理,得到拓扑模式的待挖掘业务数据集的分布。

需要说明的是,对待挖掘业务数据集序列进行处理,得到拓扑模式的待挖掘业务数据集的分布的过程为:确定待挖掘业务数据集序列中的关键业务互动对象,依据待挖掘业务数据集中除了关键业务互动对象之外的其它每个业务互动对象各自分别与关键业务互动对象之间的互动模式,将待挖掘业务数据集序列中的各个业务互动对象按照拓扑形式排列,得到拓扑模式的待挖掘业务数据集的分布。

其中,待挖掘业务数据集序列中的关键业务互动对象可以为待挖掘业务数据集序列中存在多个(如两个以上)业务交叉的业务互动对象,待挖掘业务数据集中除了业务交叉的业务互动对象之外的其它每个业务互动对象都与业务交叉的业务互动对象存在直接或间接的互动模式,而业务互动对象之间的互动模式能够反映业务互动对象之间在互动场景上的搭配关系,这种搭配关系是和知识点相关联的,也就是说,本公开中的拓扑模式的待挖掘业务数据集的分布能够体现待挖掘业务数据集序列中业务互动对象之间的互动模式,从而体现待挖掘业务数据集序列中业务互动对象的知识点。

需要说明的是,本公开中的拓扑模式的待挖掘业务数据集的分布为将待挖掘业务数据集序列中的各个业务互动对象按照拓扑形式排列得到的序列,本公开中的拓扑模式的待挖掘业务数据集的分布具体可以为依存树。

步骤S115,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算待挖掘业务数据集中的每个业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点。

需要说明的是,业务挖掘节点表示了待挖掘业务数据集中的业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务层级,由于拓扑模式的待挖掘业务数据集的分布能够体现出待挖掘业务数据集的业务结构,因此,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算得到的待挖掘业务数据集中的每个业务互动对象的业务挖掘节点能够体现出待挖掘业务数据集的业务结构。

在一种可能的设计思路中,本公开中可以将业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务层级采用预设维度的向量来表示,从而得到业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点。其中,预设维度可以由本领域技术人员依据实际情况而设置,本公开并不做具体限定。

步骤S116,将待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点输入到预先配置的知识点分类网络中。

步骤S117,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象进行知识点深度提取,得到待挖掘业务数据集中的每个业务互动对象各自对应的知识点深度特征。

待挖掘业务数据集中的每个业务互动对象的知识点可以利用知识点深度特征来表示,知识点深度特征中每一维度的向量都表示了业务互动对象的知识点信息。

知识点深度特征的维度可以由本领域技术人员依据实际情况而设置,本公开并不做具体限定。并且,知识点深度特征的维度与业务挖掘节点的维度可以相同,也可以不同,本公开并不做具体限定。如果不相同,在后续进行向量运算之前,需要进行维度统一,例如:对低维度向量做升维处理,比如知识点深度特征维度为512,业务挖掘节点维度为312,那么可以让业务挖掘节点乘以一个312*512维度的矩阵,将业务挖掘节点变换为512维度的业务挖掘节点。本公开还可以采用对高维度向量做降维处理,具体的降维处理方式本公开实施例不再详细介绍。

每个业务互动对象各自对应的知识点深度特征的维度度可以相同,也可以不同,如果不相同,在后续进行向量运算之前,需要进行维度统一,例如:对低维度向量做升维处理,比如一个业务互动对象的知识点深度特征维度为512,另一个业务互动对象的知识点深度特征维度为312,那么可以让另一个业务互动对象的知识点深度特征乘以一个312*512维度的矩阵,将另一个业务互动对象的知识点深度特征变换为512维度的知识点深度特征。本公开还可以采用对高维度向量做降维处理,具体的降维处理方式本公开实施例不再详细介绍。

步骤S118,利用知识点分类网络,依据待挖掘业务数据集中的每个业务互动对象对应的业务挖掘节点以及知识点深度特征,生成待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征。

本公开中可以利用知识点分类网络,对待挖掘业务数据集中的某一业务互动对象对应的业务挖掘节点以及知识点深度特征做向量运算处理,得到待挖掘业务数据集中的某一业务互动对象对应的初始知识点深度特征。

步骤S119,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象。

需要说明的是,本公开实施例中,利用知识点分类网络对待挖掘业务数据集中的每个业务互动对象各自对应的初始知识点深度特征进行知识点溯源,可以得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象。

对待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征进行知识点溯源的过程为:将待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征与数据库中存储的所有备选业务互动对象的知识点深度特征做相似性运算,得到相似性运算结果,将相似性运算结果符合预设相似性阈值的备选业务互动对象作为待挖掘业务数据集中该业务互动对象对应的目标知识点对象。

其中,本公开实施例可以将待挖掘业务数据集中的任一个业务互动对象对应的初始知识点深度特征与数据库中存储的所有备选业务互动对象的知识点深度特征做卷积,得到卷积结果,将对卷积结果作为相似性运算结果,并对卷积结果执行置信度运算,得到置信度运算结果,依据置信度运算结果,从中选择符合预设更新置信度阈值的备选业务互动对象作为待挖掘业务数据集中该业务互动对象对应的目标知识点对象。

步骤S191,利用知识点分类网络确定待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,并依据层级顺序对目标知识点对象进行融合,生成待挖掘业务数据集对应的目标推送知识点,基于待挖掘业务数据集对应的目标推送知识点进行信息推送,获取针对信息推送的目标推送信息的用户行为反馈信息。

本公开中的知识点分类网络可以结合待挖掘业务数据集中的每个业务互动对象在拓扑模式的待挖掘业务数据集的分布中的业务挖掘节点以及预先配置得到的业务互动对象调序方式,得到待挖掘业务数据集中的每个业务互动对象各自对应的目标知识点对象的层级顺序,从而依据层级顺序对目标知识点对象进行融合,生成待挖掘业务数据集对应的目标推送知识点。

由于本公开实施例中依据待挖掘业务数据集中每个业务互动对象之间的互动模式,得到拓扑模式的待挖掘业务数据集的分布,而拓扑模式的待挖掘业务数据集的分布能够体现出待挖掘业务数据集的业务结构,因此,依据拓扑模式的待挖掘业务数据集的分布的分布特征,计算得到的待挖掘业务数据集中的每个业务互动对象的业务挖掘节点能够体现出待挖掘业务数据集的业务结构,进而知识点分类网络结合每个业务互动对象对应的业务层级信息向量,得到每个业务互动对象对应的初始知识点深度特征,从而在确定业务互动对象知识点的过程中考虑到了待挖掘业务数据集的业务结构对业务互动对象知识点的影响,提高知识点分类结果的准确性。

在一种可能的设计示例中,对于步骤S115,可以通过以下示例性实施方式实现。

示例性实施方式A:

将位于拓扑模式的待挖掘业务数据集的分布中交叉拓扑位置的业务互动对象作为关键业务互动对象,将拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自距离关键业务互动对象的业务范围,作为拓扑模式的待挖掘业务数据集的分布中任一业务互动对象各自对应的目标业务范围,将任一业务互动对象各自对应的目标业务范围映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的业务挖掘节点。

示例性实施方式B:

按照预设的关键业务互动对象模板,从拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象,在拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的区别业务范围作为该任一业务互动对象的区别业务节点标识。依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度。组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点。将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的向量,得到每个业务互动对象各自对应的相对业务挖掘节点

示例性实施方式C:

按照预设的关键业务互动对象模板,从拓扑模式的待挖掘业务数据集的分布中确定关键业务互动对象,在拓扑模式的待挖掘业务数据集的分布中的任一个业务互动对象与关键业务互动对象不在同一条业务通道上的情况下,将任一业务互动对象的目标业务范围与关键业务互动对象的目标业务范围的交集业务范围作为该任一业务互动对象的区别业务节点标识,依据待挖掘业务数据集中任一业务互动对象与关键业务互动对象的业务关系,确定任一业务互动对象的区别业务节点维度,组合任一业务互动对象的区别业务节点标识与该任一业务互动对象的区别业务节点维度,得到该任一业务互动对象的区别业务节点,将任一业务互动对象各自对应的区别业务节点映射为预设类别范围的业务挖掘节点,得到每个业务互动对象各自对应的相对业务挖掘节点。

在一种可能的设计思路中,对于步骤S118,可以利用知识点分类网络,对待挖掘业务数据集中的每个业务互动对象对应的绝对业务挖掘节点和知识点深度特征执行映射关联操作,将映射关联操作得到的结果作为待挖掘业务数据集中的每个业务互动对象对应的初始知识点深度特征。

在一种可能的设计思路中,对于步骤S118,可以对待挖掘业务数据集中的每个业务互动对象对应的知识点深度特征执行决策树处理,将每个业务互动对象对应的知识点深度特征转换成决策结果特征清单以及决策标签特征清单,利用每个业务互动对象对应的决策结果特征清单、决策标签特征清单中的决策标签特征清单以及相对业务挖掘节点,得到每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度,对每个业务互动对象的决策结果特征清单与决策标签特征清单之间的相似度执行归一化处理,得到每个业务互动对象的相似度对应的计算系数向量,利用每个业务互动对象的计算系数向量、每个业务互动对象的决策标签特征清单中的值向量清单以及相对业务挖掘节点得到每个业务互动对象各自对应的初始知识点深度特征。

在一种可能的设计思路中,对于知识点分类网络的训练过程包括以下示例性的实施方式。

(1)获取标定集中的标定数据的标定挖掘业务数据序列、标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点以及参考输出数据列表。

(2)将标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表。

(3)利用参考输出数据列表以及预测输出数据列表得到知识点分类网络的损失参数值。

(4)将损失参数值最大化时的模型参数作为知识点分类网络的模型参数,返回将标定集中的标定数据的标定挖掘业务数据序列以及标定挖掘业务数据中每个业务互动对象对应的业务挖掘节点输入到知识点分类网络中进行训练,得到预测输出数据列表的步骤继续训练,直至满足训练停止条件时停止训练。

图3为本公开实施例提供的应用于大数据推送服务的反馈处理装置300的功能模块示意图,下面分别对该应用于大数据推送服务的反馈处理装置300的各个功能模块的功能进行详细阐述。

获取模块310,用于获取基于待挖掘业务数据集对应的目标推送知识点进行信息推送的目标推送信息的用户行为反馈信息,在用户行为反馈信息中推送偏差知识点匹配目标业务更新服务中的用于确定更新维度的目标更新通道的情况下,获取每一个参考更新维度上订阅更新业务所对应的第一更新历史误差和推荐更新业务所对应的第二更新历史误差。

第一确定模块320,用于根据参考更新维度所对应的第一更新历史误差和第二更新历史误差,确定参考更新维度的第一更新置信度,其中,第一更新置信度与第一更新历史误差和第二更新历史误差呈相反趋势关系。

第二确定模块330,用于按照每一个参考更新维度所对应的第一更新置信度,在参考更新维度中确定出推送偏差知识点的目标更新维度。

更新模块340,用于针对推送偏差知识点按目标更新维度进行更新操作。

图4示出了本公开实施例提供的用于实现上述的应用于大数据推送服务的反馈处理方法的机器学习服务器100的硬件结构示意图,如图4所示,机器学习服务器100可包括处理器110、机器可读存储介质120、总线130以及收发器140。

在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令,使得处理器110可以执行如上方法实施例的应用于大数据推送服务的反馈处理方法,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的移动互联网终端200进行数据收发。

处理器110的具体实现过程可参见上述机器学习服务器100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上应用于大数据推送服务的反馈处理方法。

最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号