首页> 中国专利> 一种基于逆倾向加权方法的反事实公平的推荐方法

一种基于逆倾向加权方法的反事实公平的推荐方法

摘要

本发明公开了一种基于逆倾向加权方法的反事实公平的推荐方法,包括:1.利用用户和产品的交互记录构建评分矩阵,利用用户的二值敏感属性构建敏感属性矩阵;2.提出推荐的反事实公平性定义;3.预训练推荐模型,获得用户和产品的表征;4.通过图卷积方式进行特征传播,构建特征到敏感属性的分类器;5.提出基于图的自监督学习正则化项;6.固定分类器参数,获得针对敏感属性取值的倾向分数;7.通过逆倾向加权技术构建推荐的损失函数,更新模型参数。本发明从因果影响估计的角度出发,避免从交互数据中构建因果图,以实现推荐的反事实公平性,同时兼顾推荐的准确度,保证推荐内容的质量,为促进推荐的公平性研究提供了有利基础。

著录项

  • 公开/公告号CN114936890A

    专利类型发明专利

  • 公开/公告日2022-08-23

    原文格式PDF

  • 申请/专利权人 合肥工业大学;

    申请/专利号CN202210345565.8

  • 申请日2022-03-31

  • 分类号G06Q30/06(2012.01);G06F16/9536(2019.01);G06N3/04(2006.01);G06N3/08(2006.01);

  • 代理机构安徽省合肥新安专利代理有限责任公司 34101;安徽省合肥新安专利代理有限责任公司 34101;

  • 代理人陆丽莉;何梅生

  • 地址 230009 安徽省合肥市包河区屯溪路193号

  • 入库时间 2023-06-19 16:26:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-09

    实质审查的生效 IPC(主分类):G06Q30/06 专利申请号:2022103455658 申请日:20220331

    实质审查的生效

说明书

技术领域

本发明涉及推荐领域,具体来说是一种基于逆倾向加权方法的反事实公平的推荐方法。

技术背景

随着信息量的爆炸性增长,丰富的音视频、商品等等资源给用户带来了信息过载的难题。为了解决这个问题,个性化推荐系统技术受到了广泛研究。通过将挖掘用户的历史记录、语义特征等信息,个性化推荐系统技术建模用户潜在的偏好,并将用户潜在感兴趣的产品资源推荐给用户,提高了用户的浏览体验。

协同过滤的方法是一种被广泛采用的个性化推荐系统技术。具体地,协同过滤方法通过将用户和产品的ID映射到嵌入表征空间,比较用户和产品表征的相似性获得用户和产品的预测交互情况,然后通过缩小预测交互和历史交互的差距来优化嵌入表征空间的参数。近年来,由于用户-产品交互天然地构成一个二部图结构,通过挖掘二部图的用户和产品之间的高阶协同信息,基于图卷积的推荐系统显著提高了性能,成为了主流推荐系统算法之一。然而,传统协同过滤算法在挖掘协同信息时,往往忽略公平性的要求。基于不同的敏感属性取值,用户群体往往可以被分为多个不同的用户分组。不同用户分组往往在交互行为上有着显著的差距,因此得到的推荐结果也有非常明显的区别。这种推荐结果上的区别往往违反了法律和道德意义层面上的公平原则,比如,工作推荐系统会针对资质相似的男性用户和女性用户推荐截然不同的工作,有性别歧视的风险。

现有的以公平性为目标的协同过滤推荐模型大多从数据角度分析用户分组之间的差异;数据角度的公平性往往强烈依赖于公平性的定义,不同的公平性定义之间往往不统一,甚至有很强的冲突;因此,这些数据角度分析的公平并不是最优的公平性分析方式,反而因为强制约束不同的个体或者群体趋于一致,造成了明显的推荐系统的性能损失。

发明内容

本发明为了解决现有技术的不足之处,从因果影响估计的角度出发,避免从复杂的交互数据中构建因果图,提出一种基于逆倾向加权方法的反事实公平的推荐方法,以期能实现推荐的反事实公平性,即用户的敏感属性值变化不会对推荐结果产生影响;同时兼顾推荐的准确度性能,保证推荐内容的质量,从而为改善推荐的公平性提出简单有效的优化方式,为促进推荐系统的公平性研究发展提供有利基础。

本发明为达到上述发明目的,采用如下技术方案:

本发明一种基于逆倾向加权的反事实公平的推荐方法的特点是按如下步骤进行:

步骤1、利用用户和产品的交互记录构建评分矩阵,利用用户的二值敏感属性值构建二值敏感属性矩阵:

令U表示用户集合,且U={u

令用户的二值敏感属性矩阵S=[s

步骤2、基于估计二值敏感属性值对推荐结果的因果影响,提出反事实公平性的定义:

步骤2.1、以所有用户的二值敏感属性值为真实情况,利用式(1)表示事实世界中第i个用户u

以所述事实世界中所有用户的二值敏感属性值的相反值为想象情况,利用式(2)表示预测反事实世界中第i个用户u

式(1)和式(2)中,

步骤2.2、通过对比式(1)和式(2),反映反事实世界和事实世界预测的用户偏好之间的区别,从而构建如式(3)所示的反事实公平性定义;

当满足式(3)时,事实世界和反事实世界的用户偏好完全相同,即二值敏感属性值对推荐结果没有任何因果影响;

式(3)中,p(u

步骤3、通过预训练的方式训练推荐模型,将用户对产品的评分矩阵R作为输入,对用户历史行为进行编码,获得用户和产品的表征:

步骤3.1、将用户和产品映射到预训练过程对应的用户嵌入表征Ρ=[p

步骤3.2、以用户的嵌入表征和产品的嵌入表征的内积作为预测的用户偏好

步骤3.3、建立如式(4)所示的损失函数

式(4)中,σ表示sigmoid激活函数;D

步骤3.4、通过随机梯度下降法对损失函数

步骤4、构建图卷积模块f以传播特征,并构建传播后的用户特征到敏感属性的分类器d:

步骤4.1、定义总卷积层数为K,当前卷积层为k,初始化k=0;

初始化第k层图卷积层的用户特征向量

初始化第k层图卷积层的产品特征向量

步骤4.2、通过图卷积方式传播用户特征,从而利用式(5)预测第k+1层图卷积层的第i个用户u

式(5)中,AGG代表图卷积操作,

步骤4.4、利用式(6)构建用户的第K层表征

式(6)中,MLP代表多层感知机,用于将用户的表征映射H

步骤4.5、利用式(7)建立交叉熵损失函数

式(7)中,Θ

步骤5、构建图的自监督学习正则化项,以提升敏感属性分类器d的性能:

步骤5.1、在训练过程中随机删除所述用户-产品二部图G中的节点,从而构造损坏点的图

步骤5.2、按照步骤4.1-步骤4.3的过程,对损坏的点图

步骤5.3、利用式(8)建立自监督学习正则化项

式(8)中,c(·)表示表征之间的余弦相似度,

步骤5.4、合并交叉熵损失函数

式(10)中,β是超参数,用于控制自监督学习正则化项

步骤6、固定训练好的分类器参数,输入所有用户的第K层表征

步骤7、通过逆倾向加权方法估计式(3)中的潜在预测偏好的期望

步骤8、基于所述因果效应,提出一种额外的正则化项,来实现最小化因果效应的目标;

步骤8.1、基于额外的正则化项,建立如式(12)所示的损失函数:

式(15)中,

步骤8.2、使用随机梯度下降法对总损失函数

与已有技术相比,本发明有益效果体现在:

1.本发明采用了反事实公平性的定义,认为个体用户应当得到公平的推荐结果而不被其敏感属性取值所影响。具体地说,本发明假设了个体用户敏感属性改变的情况,估计了个体用户敏感属性改变与否在推荐结果上的影响,并将这种影响降低到最小,以此保证了推荐的公平性。相对于相互冲突的数据性定义,本发明的反事实公平性定义具有解释性强、不对推荐性能产生大的损失等优点;

2.本发明利用了潜在因果框架中的逆倾向加权的方法,模拟了理想的随机对照实验场景,实现了推荐场景下的反事实公平性;

3.本发明在估算逆倾向的过程中,以用户的预训练表征初始化特征,利用图卷积和自监督学习的方式捕捉二部图的结构信息,充分考虑了用户历史交互中的协同信息和二部图结构信息的重要性,使得逆倾向估算的精确性得到提高。

附图说明

图1为本发明基于逆倾向加权方法的反事实公平的推荐方法的流程图。

具体实施方式

本实施例中,一种基于逆倾向加权的反事实公平的推荐方法,如图1所示,是按如下步骤进行:

步骤1、利用用户和产品的交互记录构建评分矩阵,利用用户的二值敏感属性值构建二值敏感属性矩阵:

令U表示用户集合,且U={u

令用户的二值敏感属性矩阵S=[s

步骤2、基于估计二值敏感属性值对推荐结果的因果影响,提出反事实公平性的定义:

步骤2.1、以所有用户的二值敏感属性值为真实情况,利用式(1)表示事实世界中第i个用户u

以所述事实世界中所有用户的二值敏感属性值的相反值为想象情况,利用式(2)表示预测反事实世界中第i个用户u

式(1)和式(2)中,

步骤2.2、通过对比式(1)和式(2),反映反事实世界和事实世界预测的用户偏好之间的区别,从而构建如式(3)所示的反事实公平性定义;

当满足式(3)时,事实世界和反事实世界的用户偏好完全相同,即二值敏感属性值对推荐结果没有任何因果影响;

式(3)中,p(u

步骤3、通过预训练的方式训练推荐模型,将用户对产品的评分矩阵R作为输入,对用户历史行为进行编码,获得用户和产品的表征:

步骤3.1、将用户和产品映射到预训练过程对应的用户嵌入表征Ρ=[p

步骤3.2、以用户的嵌入表征和产品的嵌入表征的内积作为预测的用户偏好

步骤3.3、建立如式(4)所示的损失函数

式(4)中,σ表示sigmoid激活函数;D

步骤3.4、通过随机梯度下降法对损失函数

步骤4、构建图卷积模块f以传播特征,并构建传播后的用户特征到敏感属性的分类器d:

步骤4.1、定义总卷积层数为K,当前卷积层为k,初始化k=0;

初始化第k层图卷积层的用户特征向量

初始化第k层图卷积层的产品特征向量

步骤4.2、通过图卷积方式传播用户特征,从而利用式(5)预测第k+1层图卷积层的第i个用户u

式(5)中,AGG代表图卷积操作,

步骤4.3、k+1赋值给k后,重复步骤4.2,对用户的节点特征进行传播,直到k=K为止;从而获得第i个用户u

步骤4.4、利用式(6)构建用户的第K层表征

式(6)中,MLP代表多层感知机,用于将用户的表征映射H

步骤4.5、利用式(7)建立交叉熵损失函数

式(7)中,Θ

步骤5、构建图的自监督学习正则化项,以提升敏感属性分类器d的性能:

步骤5.1、在训练过程中随机删除所述用户-产品二部图G中的节点,从而构造损坏点的图

步骤5.2、按照步骤4.1-步骤4.3的过程,对损坏的点图

步骤5.3、利用式(8)建立自监督学习正则化项

式(8)中,c(·)表示表征之间的余弦相似度,

步骤5.4、合并交叉熵损失函数

式(10)中,β是超参数,用于控制自监督学习正则化项

步骤6、固定训练好的分类器参数,输入所有用户的第K层表征

步骤7、通过逆倾向加权方法估计式(3)中的潜在预测偏好的期望

步骤7.1、根据贝叶斯法则

步骤7.2、用敏感属性值为1的用户子集U

步骤7.3、因为用户的敏感属性只与用户有关,与对应产品无关,因此,使用根据针对敏感属性值的倾向分数

步骤7.4、基于估测的潜在预测偏好的期望,用户的敏感属性对于推荐预测结果的因果效应可以被表示为:

步骤8、基于式(14)的逆倾向加权方法估计的敏感属性对于推荐预测结果的因果效应,提出一种额外的正则化项,来实现最小化因果效应的目标;

步骤8.1、基于额外的正则化项,建立如式(15)所示的损失函数:

式(15)使得推荐系统的预测结果同时满足拟合用户和产品之间的真实评分的要求和反事实公平性的要求;式(15)中,

步骤8.2、使用随机梯度下降法对总损失函数

实施例:

为了验证本方法的有效性,本发明采用推荐系统公平性领域常用的公开数据集:Movielens-1M。本发明采用被广泛采用的HR和NDCG作为推荐系统的性能评价指标,越高的结果代表越优秀的推荐系统性能;同时,采用Demographic Parity原则、EqualOpportunity原则和Counterfactual Fairness原则在TopK产品的基础上分别定义了新的公平性评价指标DP@K,EO@K以及ATE指标。公平性指标值越低,代表推荐算法越公平。

表1本发明方法和对比方法在Movielens-1M上推荐性能结果

表2本发明方法和对比方法在Movielens-1M上推荐公平性结果

如表1所示,相比其他公平性方法(FairGo,FairGNN),本发明(CFair-re、CFair-dn、CFair-dual)在Movielens-1M数据集上造成了更小的推荐系统的性能结果损失;如表2所示,本发明在Movielens-1M数据集上,取得了最优秀的公平性结果;实验结果充分验证了本发明的有效性。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号