首页> 中国专利> 偏好预测模型的训练方法及用户偏好的预测方法

偏好预测模型的训练方法及用户偏好的预测方法

摘要

本申请实施例提供了一种偏好预测模型的训练方法及用户偏好的预测方法。该方法包括:获取用户对对象的历史评价数据;确定历史评价数据的数据量是否满足预设条件;基于历史评价数据的数据量是否满足预设条件,构建训练集;基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

著录项

  • 公开/公告号CN112862008A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 中信银行股份有限公司;

    申请/专利号CN202110333952.5

  • 发明设计人 周勖;

    申请日2021-03-29

  • 分类号G06K9/62(20060101);G06F16/435(20190101);G06F16/635(20190101);

  • 代理机构11354 北京市兰台律师事务所;

  • 代理人张峰

  • 地址 100020 北京市朝阳区光华路10号院1号楼6-30层、32-42层

  • 入库时间 2023-06-19 11:08:20

说明书

技术领域

本申请涉及数据处理技术领域,具体而言,本申请涉及一种偏好预测模型的训练方法及用户偏好的预测方法。

背景技术

目前,各种产品层出不穷,活跃用户量是评价产品的重要指标,如何保持活跃用户量的快速增长已经成为众多公司需要思考解决的问题,对用户的偏好进行预测并且投其所好是一个很好的解决办法。

对用户的偏好进行预测的一种办法是基于观测特征(Feature-based)的方法。这种方法的思路是直接以用户的观测特征为输入,通过建立线性回归、贝叶斯网络、支持向量机以及决策树等模型,对用户的偏好进行预测。

基于观测特征进行偏好预测的方式存在一定的瓶颈,就是预测粒度有限,以预测用户对不同视频的喜好为例,预测不可能精确到(用户,视频)对。例如,如果两个用户的可观测特征一样,则对于同一视频,预测的结果是一样的,但这种预测结果可能是不太合理的,用户的偏好实际上可能是不同的。因此,亟需提供一种能够提升用户偏好预测的准确率的方式。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的技术方案如下:

第一方面,本申请实施例提供了一种偏好预测模型的训练方法,该方法包括:

获取用户对对象的历史评价数据;

确定历史评价数据的数据量是否满足预设条件;

基于历史评价数据的数据量是否满足预设条件,构建训练集;

基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。

可选地,基于历史评价数据的数据量是否满足预设条件,构建训练集,包括:

若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;

若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。

可选地,基于训练集训练偏好预测模型,包括:

基于训练集,并根据协同过滤算法训练偏好预测模型。

可选地,可观测特征包括用户特征,用户特征包括以下至少一项:

用户年龄;

用户性别;

用户职业。

可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:

从视频的视频名称中提取的关键字;

从视频的发行年份中获取的时间信息。

可选地,若历史评价数据的数据量不满足预设条件,在训练出偏好预测模型之后,方法还包括:

按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。

第二方面,本申请实施例提供了一种用户偏好的预测方法,该方法包括:

获取用户对对象的历史评价数据;

将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。

第三方面,本申请实施例提供了一种偏好预测模型的训练装置,该装置包括:

数据获取模块,用于获取用户对对象的历史评价数据;

数据量比对模块,用于确定历史评价数据的数据量是否满足预设条件;

训练集构建模块,用于基于历史评价数据的数据量是否满足预设条件,构建训练集;

模型训练模块,用于基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。

可选地,训练集构建模块具体用于:

若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;

若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。

可选地,模型训练模块具体用于:

基于训练集,并根据协同过滤算法训练偏好预测模型。

可选地,可观测特征包括用户特征,用户特征包括以下至少一项:

用户年龄;

用户性别;

用户职业。

可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:

从视频的视频名称中提取的关键字;

从视频的发行年份中获取的时间信息。

可选地,若历史评价数据的数据量不满足预设条件,上述模型训练模块还用于:

在训练出偏好预测模型之后,按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。

第四方面,本申请实施例提供了一种用户偏好的预测装置,该装置包括:

评价数据获取模块,用于获取用户对对象的历史评价数据;

偏好预测模块,用于将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。

第五方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器和存储器;

存储器,用于存储操作指令;

处理器,用于通过调用操作指令,执行如本申请的第一方面的任一实施方式中或者第二方面的任一实施方式中所示的方法。

第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请的第一方面的任一实施方式中或者第二方面的任一实施方式中所示的方法。

本申请实施例提供的技术方案带来的有益效果是:

本申请实施例提供的方案,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1为本申请实施例提供的一种偏好预测模型的训练方法的流程示意图;

图2为本申请实施例提供的一种用户偏好的预测方法的流程示意图;

图3为本申请实施例提供的一种偏好预测模型的训练装置的结构示意图;

图4为本申请实施例提供的一种用户偏好的预测装置的结构示意图;

图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。

图1示出了本申请实施例提供的一种偏好预测模型的训练方法的流程示意图,如图1所示,该方法主要可以包括:

步骤S110:获取用户对对象的历史评价数据;

步骤S120:确定历史评价数据的数据量是否满足预设条件;

步骤S130:基于历史评价数据的数据量是否满足预设条件,构建训练集;

步骤S140:基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。

本申请实施例中,对象可以为产品,如视频等,历史评价数据可以为用户对对象的评分。

在对用户偏好进行预测时,隐藏特征起到了非常重要的作用。例如,表象上看是两个用户对视频的打分相似,而本质上是两个用户的某些隐藏特征相似,比如两者都喜欢喜剧片不喜欢恐怖片。因此,在解决用户偏好预测的问题中,根据已经观测到的用户偏好对用户抽取其隐藏特征是非常关键的一部分内容。

本申请实施例中,预设条件可以为预设的数据量,若历史评价数据较少,则可能会造成训练出的预测模型预测效果不佳,因此可以在根据历史评价数据训练预测模型之前,可以确定历史评价数据的数据量是否满足预设条件,根据历史评价数据的数据量是否满足预设条件来构建训练集,以保证训练出的预测模型的预测效果。

受限波兹曼机(Restricted Boltzmann Machine,RBM)可以通过叠加对特征进行深层次地抽象,并且可以灵活地处理概率生成模型。因此,为了能够更好地提取用户隐藏特征的模型来进行用户偏好预测,本申请实施例中通过建立受限波兹曼机模型来进行用户偏好预测。

本申请实施例提供的方法,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

本申请实施例的一种可选方式中,基于历史评价数据的数据量是否满足预设条件,构建训练集,包括:

若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;

若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。

本申请实施例中,可以在根据历史评价数据训练预测模型之前,可以确定历史评价数据的数据量是否满足预设条件,如果历史评价数据的数据量满足预设条件,这时可以认为用于进行模型训练的历史评价数据的数据量能够满足模型训练的需要,可以根据历史评价数据构建训练集。

如果历史评价数据的数据量不满足预设条件,这时可以认为用于进行模型训练的历史评价数据的数据量不能够满足模型训练的需要,为保证训练出的预测模型的预测效果,可以增加可观测特征用于模型训练,通过可观测特征以及历史评价数据共同构建训练集。

由于引入了可观测特征,这时即使历史评价数据的数据量较少,也可以对隐藏特征进行较好的预测。

本申请实施例的一种可选方式中,基于训练集训练偏好预测模型,包括:

基于训练集,并根据协同过滤算法训练偏好预测模型。

由于历史评价数据中,如果所有的用户给这所有的产品都进行了打分,那么可以得出此RBM有M个可见节点。但是实际情况时评分矩阵中大部分评分都是缺失的,为了应对评分缺失的情况,本申请实施例中根据协同过滤算法训练RBM。具体而言,可以对每一个用户都训练一个RBM,这些所有的RBM都有相同的隐藏节点数,但是每个RBM的可见节点数是一个用户评分中的产品数。这样虽然所有的RBM都只有一个训练样例,但是对应所有RBM,相同的隐藏节点和视频的偏差以及权重是绑在一起的。例如,两个用户对同一个视频进行里的打分,则对于两者的RBM,此视频与隐藏节点间的权重值是相同的。

本申请实施例中,可以对历史评价数据进行二值化处理,即RBM中的所有节点都只有0和1两种状态。构建二值化的RBM可以简化训练和预测过程。

本申请实施例的一种可选方式中,可观测特征包括用户特征,用户特征包括以下至少一项:

用户年龄;

用户性别;

用户职业。

本申请实施例中,可以将用户相关信息作为可观测特征,如将用户年龄、用户性别以及用户职业作为用户特征。

本申请实施例的一种可选方式中,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:

从视频的视频名称中提取的关键字;

从视频的发行年份中获取的时间信息。

本申请实施例中,可观测特征还可以包括对象特征,若对象为视频,这时可以从视频的相关信息中提取对象特征,如从视频名称中提取出一些能够表现视频特征的关键字,或从发行年份中获取时间信息。

本申请实施例的一种可选方式中,若历史评价数据的数据量不满足预设条件,在训练出偏好预测模型之后,方法还包括:

按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。

本申请实施例中,在训练出偏好预测模型之后,可以重复尝试获取历史评价数据,并且检测获取到的历史评价数据的数据量,当确定获取到的历史评价数据的数据量满足预设条件时,可以基于当前获取到的历史评价数据重新构建训练集,并根据重新构建出的训练集重新训练偏好预测模型。

作为一个示例,可以对可观测特征进行预处理,将用户特征及视频特征数值化。为了方便模型中的计算,本例中将用户特征及视频特征均映射为二值化的向量,具体关系如下:

年龄:本例中将年龄分为五个区间[-17][18-24][25-34][35-44][44-],用一个长度为5的二值向量来表示用户年龄所在区间;

性别:用长度为2的二值向量来表示性别(1,0)为男性,(0,1)为女性;

职业:用长度为21的二值向量来表示,若用户的职业是第i个,则向量中的第i个元素为1,其他元素为0;

电影类型:用长度为19的二值向量来表示,若视频的电影类型为第j个,则向量中的第j个元素为1,其他元素为0;

经过数据预处理,对于每个用户可以得到长度为28的向量作为可观测特征;对于每个视频可以得到长度为19的向量作为可观测特征。

图2示出了本申请实施例提供的一种用户偏好预测方法的流程示意图,如图2所示,该方法主要可以包括:

步骤S210:获取用户对对象的历史评价数据;

步骤S220:将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。

本申请实施例中,对象可以为产品,如视频等,历史评价数据可以为用户对对象的评分。

在对用户的进行偏好预测时,可以将用户的历史评价数据输入预训练的偏好预测模型,由于该预测模型是基于受限波兹曼机模型建立的,可以通过叠加对特征进行深层次地抽象,更好地提取用户隐藏特征的模型来进行用户偏好预测,使得预测出的用户偏好更为准确。

本申请实施例提供的方法,获取用户对对象的历史评价数据,将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果。基于本方案,由于是基于受限波兹曼机模型建立的偏好预测模型进行用户偏好预测,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

基于与图1中所示的方法相同的原理,图3示出了本申请实施例提供的一种偏好预测模型的训练装置的结构示意图,如图3所示,该偏好预测模型的训练装置30可以包括:

数据获取模块310,用于获取用户对对象的历史评价数据;

数据量比对模块320,用于确定历史评价数据的数据量是否满足预设条件;

训练集构建模块330,用于基于历史评价数据的数据量是否满足预设条件,构建训练集;

模型训练模块340,用于基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。

本申请实施例提供的装置,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

可选地,训练集构建模块具体用于:

若历史评价数据的数据量不满足预设条件,则基于历史评价数据以及可观测特征,构建训练集;

若历史评价数据的数据量满足预设条件,则基于历史评价数据构建训练集。

可选地,模型训练模块具体用于:

基于训练集,并根据协同过滤算法训练偏好预测模型。

可选地,可观测特征包括用户特征,用户特征包括以下至少一项:

用户年龄;

用户性别;

用户职业。

可选地,可观测特征还包括对象特征,若对象为视频,对象特征包括以下至少一项:

从视频的视频名称中提取的关键字;

从视频的发行年份中获取的时间信息。

可选地,若历史评价数据的数据量不满足预设条件,上述模型训练模块还用于:

在训练出偏好预测模型之后,按照预设的重试规则,重复获取用户对对象的历史评价数据,直至获取到的历史评价数据的数据量满足预设条件,基于历史评价数据更新训练集,并基于更新后的训练集训练偏好预测模型。

可以理解的是,本实施例中的偏好预测模型的训练装置的上述各模块具有实现图1中所示的实施例中的偏好预测模型的训练方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述偏好预测模型的训练装置的各模块的功能描述具体可以参见图1中所示实施例中的偏好预测模型的训练方法的对应描述,在此不再赘述。

基于与图2中所示的方法相同的原理,图4示出了本申请实施例提供的一种用户偏好的预测装置的结构示意图,如图4所示,该用户偏好的预测装置40可以包括:

评价数据获取模块410,用于获取用户对对象的历史评价数据;

偏好预测模块420,用于将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果,其中,偏好预测模型为根据上述的偏好预测模型的训练方法训练得到的。

本申请实施例提供的装置,获取用户对对象的历史评价数据,将历史评价数据输入预训练的偏好预测模型,得到用户的偏好预测结果。基于本方案,由于是基于受限波兹曼机模型建立的偏好预测模型进行用户偏好预测,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

可以理解的是,本实施例中的用户偏好的预测装置的上述各模块具有实现图2中所示的实施例中的用户偏好的预测方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述用户偏好的预测装置的各模块的功能描述具体可以参见图2中所示实施例中的用户偏好的预测方法的对应描述,在此不再赘述。

本申请实施例提供了一种电子设备,包括处理器和存储器;

存储器,用于存储操作指令;

处理器,用于通过调用操作指令,执行本申请任一实施方式中所提供的方法。

作为一个示例,图5示出了本申请实施例所适用的一种电子设备的结构示意图,如图5所示,该电子设备2000包括:处理器2001和存储器2003。其中,处理器2001和存储器2003相连,如通过总线2002相连。可选的,电子设备2000还可以包括收发器2004。需要说明的是,实际应用中收发器2004不限于一个,该电子设备2000的结构并不构成对本申请实施例的限定。

其中,处理器2001应用于本申请实施例中,用于实现上述方法实施例所示的方法。收发器2004可以包括接收机和发射机,收发器2004应用于本申请实施例中,用于执行时实现本申请实施例的电子设备与其他设备通信的功能。

处理器2001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器2001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。

总线2002可包括一通路,在上述组件之间传送信息。总线2002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器2003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

可选的,存储器2003用于存储执行本申请方案的应用程序代码,并由处理器2001来控制执行。处理器2001用于执行存储器2003中存储的应用程序代码,以实现本申请任一实施方式中所提供的方法。

本申请实施例提供的电子设备,适用于上述方法任一实施例,在此不再赘述。

本申请实施例提供了一种电子设备,与现有技术相比,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的方法。

本申请实施例提供的计算机可读存储介质,适用于上述方法任一实施例,在此不再赘述。

本申请实施例提供了一种计算机可读存储介质,与现有技术相比,通过获取用户对对象的历史评价数据,确定历史评价数据的数据量是否满足预设条件,基于历史评价数据的数据量是否满足预设条件,构建训练集,基于训练集训练偏好预测模型,偏好预测模型基于受限波兹曼机模型建立。基于本方案训练得到的偏好预测模型,能够更好地提取用户的隐藏特征来进行偏好预测,提升用户偏好预测的准确率。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号