技术领域
本发明涉及一种隐私保护方法,具体涉及一种基于目标函数扰动的决策模型隐私保护发布方法。
背景技术
当前,人工智能技术已经逐渐进入到人们生产生活的各个方面,其中,智能决策模型作为人工智能技术的一个重要模型,在推荐系统、决策系统等发挥着重要作用。来自各行业大量用户的感知数据,支撑着智能决策模型的准确、高效执行。然而,在第三方服务提供商收集和分析大量感知数据以为用户提供相应的智能决策时,也给参与用户带来了前所未有的隐私泄露风险,可能导致个人隐私严重暴露。例如,一些攻击者基于模型反演攻击、推断攻击等方式,挖掘训练数据集中的用户敏感信息。因此,有必要在训练和发布决策模型时引入隐私保护技术,但直接应用隐私保护技术会导致决策模型的准确性严重降低。
发明内容
为了解决现有的智能决策模型发布时会给参与用户带来隐私泄漏风险,而直接应用隐私保护技术会导致决策模型的准确性严重降低的问题,现提供一种基于目标函数扰动的决策模型隐私保护发布方法。
本发明所采用的技术方案是:
一种基于目标函数扰动的决策模型隐私保护发布方法,其特殊之处在于:首先根据智能决策场景中的用户决策数据构建目标函数,并对目标函数进行分解和泰勒展开,然后基于隐私保护模型计算敏感度上界,最后对目标函数进行扰动并根据扰动后的目标函数计算模型参数,以实现决策模型的隐私保护发布;具体包括以下步骤:
1)构建目标函数
获取每位用户i所拥有的决策数据集D
2)分解目标函数并进行泰勒展开
对每位用户i对应的目标函数
3)计算敏感度上界
基于差分隐私保护模型,计算敏感度上界Δ
4)扰动目标函数和发布决策模型
根据敏感度上界Δ
进一步地,所述步骤1)具体按照以下步骤实施:
1.1)获取每位用户i所拥有的决策数据集D
其中,
1.2)定义两个选项
则基于高斯随机变量进行决策数据效用性建模,得到用户i的决策数据效用性服从高斯分布
将用户i选择
其中,Pr表示概率,Φ表示标准正态分布的累积分布函数,β
1.3)根据公式(3),利用最大似然估计方法计算每位用户i的偏好参数β
进一步地,所述步骤2)具体按照以下步骤实施:
2.1)分别定义两个子函数g和r如下:
g(·)=lnΦ(·) (5);
利用公式(5)和(6),对每位用户i对应的目标函数
2.2)基于公式(7),对目标函数
其中,k={0,1,2},g
进一步地,所述步骤3)具体按照以下步骤实施:
3.1)对每位用户i的每条记录
3.2)用V[1],V[2],…,V[d]表示d-维向量V
根据公式(9)和柯西-施瓦兹不等式得到
3.3)根据差分隐私保护模型的敏感度定义公式和公式(8),得到近似目标函数
经过计算得到,
则敏感度上界Δ
进一步地,所述步骤4)具体按照以下步骤实施:
4.1)根据公式(11)和用户i的隐私预算参数∈
4.2)向每位用户i对应的近似目标函数
4.3)根据具有隐私保护的目标函数
则具有隐私保护的决策模型参数β
4.4)发布具有隐私保护的决策模型参数β
本发明相比现有技术的有益效果是:
本发明提供的基于目标函数扰动的决策模型隐私保护发布方法,基于差分隐私保护技术,通过对决策模型的目标函数进行噪声扰动来实现强隐私保护,避免向模型参数引入过量噪声,有效提高了决策模型的准确性,具有较好的实用性。相关的理论分析和实验分析均表明本发明能够在提供强隐私保护的前提下保证较高的模型准确性。本发明的方法整个过程简单、易于实现,无需复杂的加密解密运算,能够在发布决策模型的同时为参与用户提供强隐私保护,同时保证决策模型的准确性和较低的计算开销。
附图说明
图1是本发明基于目标函数扰动的决策模型隐私保护发布方法的流程图;
图2是本发明方法在不同隐私预算下的准确性随用户记录数量变化的实验结果图;
图3是本发明方法在合成数据集上与已有机制的准确性对比实验结果图;
图4是本发明方法在真实数据集上与已有机制的准确性对比实验结果图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
如图1所示,本发明提供的基于目标函数扰动的决策模型隐私保护发布方法,具体包括以下步骤:
Step1构建目标函数
首先,获取每位用户i所拥有的决策数据集D
其中,
然后,定义两个选项
则基于高斯随机变量进行决策数据效用性建模,得到用户i的决策数据效用性服从高斯分布
将用户i选择
其中,Pr表示概率,Φ表示标准正态分布的累积分布函数,β
根据公式(3),利用最大似然估计方法计算每位用户i的偏好参数β
Step2分解目标函数并进行泰勒展开
对每位用户i对应的目标函数
首先,分别定义两个子函数g和r如下:
g(·)=lnΦ(·) (5);
利用公式(5)和(6),将目标函数
基于公式(7),对目标函数
其中,k={0,1,2},g
Step3计算敏感度上界
首先,对每位用户i的每条记录
用V[1],V[2],…,V[d]表示d-维向量V
根据公式(9)和柯西-施瓦兹不等式可以得到
然后,根据差分隐私保护模型的敏感度定义公式和公式(8),得到近似目标函数
经过计算可知,
因此,可以得到敏感度上界Δ
Step4扰动目标函数和发布决策模型
首先,根据公式(11)和用户i的隐私预算参数∈
接着,向每位用户i对应的近似目标函数
根据具有隐私保护的目标函数
则具有隐私保护的决策模型参数β
最终发布具有隐私保护的决策模型参数β
在合成数据集上进行准确性随用户记录数量n的变化情况验证,实验结果如图2所示,设置用户总数N=100,隐私预算变化范围为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10},可以看到,本发明所设计的隐私保护机制在整体上具有较高的准确性,且准确性随隐私预算∈的增加而增大。此外,对比三条曲线可知,当每个用户所拥有的记录数量n分别为n=10,n=50,n=100时,本发明所设计的隐私保护机制的准确性随记录数量n的增加而增大。
在合成数据集上进行准确性验证,实验结果如图3所示,设置用户总数N=100,且每个用户拥有的记录数量为n=50,隐私预算变化范围设置为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10}。可以看到,与直接进行扰动的隐私保护机制相比,本发明所设计的基于目标函数扰动的隐私保护机制具有更高的准确性,说明本发明设计的隐私保护机制具有更好的实用性。
在真实数据集上进行准确性验证,实验结果如图4所示,设置用户总数N=100,且每个用户拥有的记录数量为n=13,隐私预算变化范围设置为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10}。可以看到,本发明所设计的基于目标函数扰动的隐私保护机制在整体上具有较高的准确性,且准确性随隐私预算∈的增加而增大,证明基于目标函数扰动的隐私保护机制能够在提供隐私保护的同时,有效保证决策模型的准确性,具有较好的实用性。
机译: 动态数据集发布中的隐私保护方法和使用该方法的隐私保护系统
机译: 动态数据集发布中的隐私保护方法和使用该方法的隐私保护系统
机译: 信息发布的隐私保护工具,处理隐私保护方法及程序null