首页> 中国专利> 基于隐私计算的贡献度计算方法及装置、设备、介质

基于隐私计算的贡献度计算方法及装置、设备、介质

摘要

本公开提供了一种基于隐私计算的贡献度计算方法及装置、设备、介质,涉及数据处理技术领域。该基于隐私计算的贡献度计算方法包括:获取样本数据,并将样本数据输入至独立模型中,得到预测标签数据;基于预测标签数据和与样本数据对应的目标标签数据,计算独立模型的模型性能指标数据,并根据模型性能指标数据确定独立收益数据;获取合作收益数据,并基于独立收益数据和合作收益数据计算目标贡献度。本公开实施例的技术方案可以避免暴露参与方的数据隐私,也可以将预测标签数据作为数据源参与到贡献度计算中提高计算各参与方贡献度的公平性,还可以从参与方角度直接计算独立收益数据,提高了联邦贡献度的计算效率。

著录项

  • 公开/公告号CN113297593A

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利号CN202110530357.0

  • 发明设计人 孟丹;彭宇翔;李宏宇;李晓林;

    申请日2021-05-14

  • 分类号G06F21/60(20130101);G06F21/62(20130101);

  • 代理机构11438 北京律智知识产权代理有限公司;

  • 代理人王辉;阚梓瑄

  • 地址 311121 浙江省杭州市余杭区五常街道文一西路998号18幢704室

  • 入库时间 2023-06-19 12:19:35

说明书

技术领域

本公开涉及数据处理技术领域,具体而言,涉及一种基于隐私计算的贡献度计算方法、基于隐私计算的贡献度计算装置、电子设备以及计算机可读存储介质。

背景技术

随着人工智能技术的快速发展,通过多方的样本数据训练性能较好的人工智能模型为用户提供更好的服务成为时代发展的必然要求。然而,如何提高评估各参与方的贡献度的公平性和公正性成为关键问题。

在相关的基于隐私计算的贡献度计算方法中不但存在贡献度计算效率较低,而且是根据平均主义对各参与方提供的数据进行贡献度评估的,使得各参与方的联邦贡献度的准确率较低;此外,在相关的基于隐私计算的贡献度计算方法中,未考虑标签对贡献度的影响。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开实施例的目的在于提供一种基于隐私计算的贡献度计算方法、联邦贡献度计算装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服计算各参与方的联邦贡献度的准确率较低和效率较低的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

根据本公开实施例的第一方面,提供了一种基于隐私计算的贡献度计算方法,包括:获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据;基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据;获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述样本数据包括跨样本场景中的本地样本数据;将所述样本数据输入至独立模型中,得到预测标签数据,包括:

将所述本地样本数据输入至独立模型中得到预测标签数据;其中,所述独立模型是基于所述本地样本数据中的训练样本数据,以及与所述训练样本数据对应的标签数据训练得到的。

在本公开的一些示例实施例中,基于前述方案,所述获取合作收益数据包括:包括:

获取预构建的联邦模型,并将所述本地样本数据输入至所述联邦模型中,得到联邦预测标签数据;基于所述联邦预测标签数据,以及与所述本地样本数据对应的目标标签数据计算所述联邦模型的模型性能指标数据;基于所述模型性能指标数据确定所述合作收益数据。

在本公开的一些示例实施例中,基于前述方案,所述基于所述独立收益数据和合作收益数据计算目标贡献度,包括:

基于所述独立收益数据和所述合作收益数据计算边际收益数据;根据所述边际收益数据计算所述目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述样本数据包括跨特征场景中的公共样本数据,所述预测标签数据包括第一密文预测标签数据,所述独立收益数据包括第一独立收益数据;其中,所述基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据,包括:

获取与所述公共样本数据对应的密文目标标签数据;接收由协助参与方发送的目标参与方的第一密文预测标签数据,并根据所述密文目标标签数据和所述第一密文预测标签数据计算所述目标参与方的密文模型性能指标数据;将所述密文模型性能指标数据由所述协助方发送至所述目标参与方,以使所述目标参与方根据所述密文模型性能指标数据计算与所述目标参与方对应的独立模型的第一模型性能指标数据,并基于所述第一模型性能指标数据确定所述第一独立收益数据;其中,所述第一密文预测标签数据是由所述目标参与方对所述目标参与方的独立模型输出的第一预测标签数据进行加密得到的。

在本公开的一些示例实施例中,基于前述方案,所述独立收益数据还包括第二独立收益数据,在所述基于所述模型性能指标数据确定所述第一独立收益数据之后,所述方法还包括:

获取本地样本数据,以及与所述本地样本数据对应的标签数据;将所述本地样本数据输入至与所述本地样本数据对应的独立模型中得到第二预测标签数据;基于所述标签数据和所述第二预测标签数据,计算所述独立模型的第二模型性能指标数据;基于所述第二模型性能指标数据确定所述第二独立收益数据。

在本公开的一些示例实施例中,基于前述方案,所述基于所述独立收益数据和所述合作收益数据计算目标贡献度,包括:

获取所述目标参与方的第一目标参数和所述第一独立收益数据,并基于所述第一目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算所述目标参与方对应的第一贡献度,以及将所述第一贡献度发送给所述目标参与方;获取第二目标参数,并基于所述第二目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算第二贡献度;将所述第一贡献度和所述第二贡献度作为所述目标贡献度,以根据所述目标贡献度确定所述目标参与方的样本数据和所述本地样本数据的有效性。

根据本公开实施例的第二方面,提供了一种联邦贡献度计算装置,包括:预测标签数据获取模块,用于获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据;独立收益数据确定模块,用于基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据;目标贡献度计算模块,用于获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述预测标签数据获取模块还包括预测标签数据获取单元,所述预测标签数据获取单元,用于将所述本地样本数据输入至独立模型中得到预测标签数据;其中,所述独立模型是基于所述本地样本数据中的训练样本数据,以及与所述训练样本数据对应的标签数据训练得到的。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置还包括合作收益数据确定模块,所述合作收益数据确定模块,用于获取预构建的联邦模型,并将所述本地样本数据输入至所述联邦模型中,得到联邦预测标签数据;基于所述联邦预测标签数据,以及与所述本地样本数据对应的目标标签数据计算所述联邦模型的模型性能指标数据;基于所述模型性能指标数据确定所述合作收益数据。

在本公开的一些示例实施例中,基于前述方案,所述目标贡献度计算模块还包括目标贡献度计算模块单元,所述目标贡献度计算模块单元,用于基于所述独立收益数据和所述合作收益数据计算边际收益数据;根据所述边际收益数据计算所述目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置还包括第一独立收益数据确定模块,所述第一独立收益数据确定模块,用于获取与所述公共样本数据对应的密文目标标签数据;接收由协助参与方发送的目标参与方的第一密文预测标签数据,并根据所述密文目标标签数据和所述第一密文预测标签数据计算所述目标参与方的密文模型性能指标数据;将所述密文模型数据由所述协助方发送至所述目标参与方,以使所述目标参与方根据所述密文模型数据计算与所述目标参与方对应的独立模型的第一模型性能指标数据,并基于所述第一模型性能指标数据确定所述第一独立收益数据;其中,所述第一密文预测标签数据是由所述目标参与方对所述目标参与方的独立模型输出的第一预测标签数据进行加密得到的。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置还包括第二独立收益数据确定模块,所述第二独立收益数据确定模块,用于获取本地样本数据,以及与所述本地样本数据对应的标签数据;将所述本地样本数据输入至与所述本地样本数据对应的独立模型中得到第二预测标签数据;基于所述标签数据和所述第二预测标签数据,计算所述独立模型的第二模型性能指标数据;基于所述第二模型性能指标数据确定所述第二独立收益数据。

在本公开的一些示例实施例中,基于前述方案,所述目标贡献度计算模块还包括目标贡献度计算单元,所述目标贡献度计算单元,用于获取所述目标参与方的第一目标参数和所述第一独立收益数据,并基于所述第一目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算所述目标参与方对应的第一贡献度,以及将所述第一贡献度发送给所述目标参与方;获取第二目标参数,并基于所述第二目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算第二贡献度;将所述第一贡献度和所述第二贡献度作为所述目标贡献度,以根据所述目标贡献度确定所述目标参与方的样本数据和所述本地样本数据的有效性。

根据本公开实施例的第三方面,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现上述任意一项所述的基于隐私计算的贡献度计算方法。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据上述任意一项所述的基于隐私计算的贡献度计算方法。

本公开实施例提供的技术方案可以包括以下有益效果:

本公开的示例实施例中的基于隐私计算的贡献度计算方法,通过获取样本数据,并将样本数据输入至独立模型中得到预测标签数据,并基于预测标签数据和与样本数据对应的目标标签数据,计算独立模型的模型性能指标数据以根据模型性能指标数据确定独立收益数据;在获取合作收益数据之后,基于独立收益数据和合作收益数据计算目标贡献度。一方面,可以基于由本地的独立模型输出的预测标签数据,以及与本地的样本数据对应的目标标签数据计算本地独立模型的模型性能指标数据,并基于模型性能指标数据确定独立收益数据,避免了对样本数据按照不同特征维度进行分类,并计算多个与样本数据的特征维度对应的子独立收益数据,以及基于子独立收益数据确定样本数据对应的独立收益数据,进而提高了独立收益数据的计算效率;从而,可以直接根据独立收益数据和合作收益数据计算目标贡献度,提高了目标贡献度的计算效率;另一方面,可以基于预测标签数据和目标标签数据计算模型性能指标数据,以根据模型性能指标数据确定独立收益数据,并根据独立收益数据和合作收益数据计算目标贡献度,不但提高了计算目标贡献度的准确率,而且可以将预测标签数据和目标标签数据作为数据源计算目标贡献度,进一步提高了计算目标贡献度的公平性和公正性,凸显了在计算目标贡献度的过程中标签数据的重要性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1示意性示出了根据本公开的一些实施例的基于隐私计算的贡献度计算方法的示意图;

图2示意性示出了根据本公开的一些实施例的合作收益数据确定方法流程的示意图;

图3示意性示出了根据本公开的一些实施例的目标贡献度计算方法流程的示意图;

图4示意性示出了根据本公开的一些实施例的第一独立收益数据确定方法流程的示意图;

图5示意性示出了根据本公开的一些实施例的第二独立收益数据确定方法流程的示意图;

图6示意性示出了根据本公开的一些实施例的另一目标贡献度计算方法流程的示意图;

图7示意性示出了根据本公开的一些实施例的联邦贡献度计算装置的示意图;

图8示意性示出了根据本公开的一些实施例的电子设备的计算机系统的结构示意图;

图9示意性示出了根据本公开的一些实施例的计算机可读存储介质的示意图。

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

此外,附图仅为示意性图解,并非一定是按比例绘制。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

在本示例实施例中,首先提供了一种联邦贡献度方法,该基于隐私计算的贡献度计算方法可以应用于服务器。图1示意性示出了根据本公开的一些实施例的基于隐私计算的贡献度计算方法流程的示意图。参考图1所示,该基于隐私计算的贡献度计算方法可以包括以下步骤:

步骤S110,获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据;

步骤S120,基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据;

步骤S130,获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

一方面,可以基于由本地的独立模型输出的预测标签数据,以及与样本数据对应的目标标签数据计算本地独立模型的模型性能指标数据,并基于模型性能指标数据确定独立收益数据,避免了对样本数据按照不同维度进行分类,并计算多个与样本数据维度对应的子独立收益数据,以及基于子独立收益数据确定样本数据对应的独立收益数据,进而提高了独立收益数据的计算效率;从而,可以直接根据独立收益数据和合作收益数据计算目标贡献度,提高了目标贡献度的计算效率;另一方面,可以基于预测标签数据和目标标签数据计算模型性能指标数据,以根据模型性能指标数据确定独立收益数据,并根据独立收益数据和合作收益数据计算目标贡献度,不但提高了计算目标贡献度的准确率,而且可以将预测标签数据和目标标签数据作为数据源计算目标贡献度,进一步提高了计算目标贡献度的公平性和公正性,特别在跨特征场景下当多方参与建模而有一参与方只有样本数据而没有标签数据时,凸显了在计算目标贡献度的过程中标签数据的重要性。

下面,将对本示例实施例中的基于隐私计算的贡献度计算方法进行进一步的说明。

在步骤S110中,获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据。

在本公开的一个示例实施例中,预测标签数据可以指将样本数据输入到独立模型中得到的标签数据,例如,预测标签数据也可以是将将样本编号为1到样本标号为200的正常鸢尾花的样本数据如花瓣的长度和宽度样本数据输入到独立模型中得到样本编号为1到样本标号为200的样本数据对应的标签数据如正常鸢尾花或变色鸢尾花,当然,预测标签数据还可以是将其他样本数据输入到独立模型中得到的其他标签数据,本例实施例对此不作特殊限定。独立模型是通过样本数据中的训练样本数据和与训练样本数据对应的标签数据训练得到的模型。

可以预先通过训练样本数据和与训练样本数据对应的标签数据训练得到独立模型,以便直接通过将本地样本数据输入至独立模型中得到预测标签数据,提高得到预测标签数据的效率。

在步骤S120中,基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据。

在本公开的一个示例实施例中,目标标签数据可以指样本数据对应的真实标签数据;模型性能指标数据可以指评价模型预测能力的指标数据,例如,模型性能指标数据可以是通过计算样本数据的预测标签数据和目标标签数据之间的模型性能指标数据,并根据模型性能指标数据确定的评价模型预测能力的指标数据,模型性能指标数据也可以是通过计算与独立模型的召回率和精确率对应的调和平均数(F1-Score),并根据调和平均数确定的评价模型预测能力的指标数据;模型性能指标数据还可以是通过计算独立模型的风险区分能力数据(KS),并根据独立模型的风险区分能力数据确定的评价模型预测能力的指标数据;当然,模型性能指标数据还可以是通过其他数据如模型准确率确定的评价模型预测能力的性能指标数据,本例实施例对此不作特殊限定。独立收益数据可以指通过模型性能指标数据确定的收益数据。

在跨样本场景中,可以通过将本地样本数据输入至预先训练完成的本地独立模型中得到预测标签数据,并基于预测标签数据和本地样本数据对应的目标标签数据计算本地独立模型的性能指标数据;进一步地,根据模型性能指标数据确定本地样本数据的独立收益数据。其中,跨样本场景可以指每个参与方的数据具有相同的特征分布,但各方的用户样本是独立的,而且每个参与方都有与自身样本对应的标签数据的场景。

在跨特征场景中,拥有样本数据和与样本数据对应的标签数据的参与方,可以利用本地的训练样本数据和训练样本数据对应的标签数据训练得到独立模型,并将样本数据输入至训练完成的独立模型中得到预测标签数据;进而,基于预测标签数据和与样本数据对应的标签数据计算独立模型的模型性能指标数据,并根据模型性能指标数据确定独立收益数据。其中,跨特征场景可以指参与方数据特征分布不同,但拥有共同的样本数据,并且一般只持有样本数据的第一参与方和同时持有样本数据和标签数据的第二参与方;然而,只持有样本数据的第一参与方需要通过获取有标签数据的第二参与方发送的与样本数据中的公共样本数据对应的密文标签数据,以根据公共样本数据中的训练样本数据和与训练样本数据对应的标签数据训练独立模型;然后,将公共样本数据输入至该独立模型中得到预测标签数据,并对该预测标签数据进行加密得到密文预测标签数据;通过协助参与方将该密文预测标签数据发送至第二参与方,以使第二参与方根据密文预测标签数据和密文标签数据在密文空间上计算第一参与方的密文模型性能指标数据;其中,密文模型性能指标数据可以是基于密文预测标签数据和密文标签数据计算得到的密文损失值,也可以是基于密文预测标签数据和密文标签数据计算得到的密文KS值,还可以是基于密文预测标签数据和密文标签数据计算得到的密文F1-Score值,当然,密文模型性能还可以是基于密文预测标签数据和密文标签数据计算得到其他的密文数据,本例实施例对此不作特殊限定。第一参与方在接收到协助参与方发送的由第二参与方计算的密文模型性能指标数据后,可以对密文模型性能指标数据进行解密得到模型性能指标数据,基于该模型性能指标数据计算独立模型的模型性能指标数据,并基于模型性能指标数据确定独立收益数据;在此过程中,第一参与方不需要将样本数据以及独立模型对应的预测标签数据暴露给第二参与方,提高了第一参与方数据隐私的安全性。

在步骤S130中,获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

在本公开的一个示例实施例中,合作收益数据可以指在联邦学习中由多个参与方提供的数据获取的收益数据;目标贡献度可以指在联邦学习中各个参与方提供的数据在联邦学习中的贡献度,例如,联邦学习中有两个参与方如持有样本数据和标签数据的第一参与方、只持有标签数据的第二参与方,目标贡献度可以是第一参与方的贡献度,也可以是第二参与方对应的贡献度,当然,目标贡献度还可以是在联邦学习中其他多个参与方各自的贡献度,本例实施例对此不作特殊限定。

无论在跨样本场景中,还是在跨特征场景中,都可以根据独立收益数据和合作收益数据计算目标贡献度。例如,在跨样本场景中,联邦学习中的各参与方均拥有样本数据、与样本数据对应的目标标签数据和本地模型,各个参与方可以在本地直接将样本数据输入至本地模型得到本地预测标签,并根据本地预测标签和目标标签计算本地模型的精度,进而确定本地的独立收益数据;从而,根据合作收益数据和独立收益数据直接计算目标贡献度。在跨特征场景中,没有与样本数据对应的标签数据的参与方,可以将本地模型输出的预测标签数据进行加密得到密文预测标签数据,并将密文预测标签数据通过协助参与方发送至持有标签数据的参与方,以使持有标签数据的参与方在空间密文上计算该本地模型的密文模型性能指标数据;没有与样本数据对应的标签数据的参与方在接收到协助参与方发送的密文模型性能指标数据后,根据密文模型性能指标数据确定该本地模型的模型性能指标数据,并基于模型性能指标数据确定独立收益数据,以及基于独立收益数据和合作收益数据计算自身的贡献度,也可以将独立收益数据发送至其他参与方,由其他参与方计算该贡献度,提高了计算目标贡献度的通用性。

在本公开的一个示例实施例中,在跨样本场景中,可以通过将本地样本数据输入至独立模型中得到预测标签数据;其中,独立模型是基于本地样本数据中的训练样本数据,以及与训练样本数据对应的标签数据训练得到的。

其中,本地样本数据可以指在联邦学习中的参与方自身持有的样本数据;可以将本地样本数据划分为训练样本数据和验证样本数据,并通过训练样本数据以及与训练样本数据对应的标签数据训练得到本地独立模型;随后,将本地样本数据或验证样本数据输入到本地独立模型中可以得到预测标签数据。

图2示意性示出了根据本公开的一些实施例的合作收益数据确定方法的示意图。参考图2所示,该合作收益数据确定方法可以包括以下步骤:

在步骤S210中,获取预构建的联邦模型,并将所述本地样本数据输入至所述联邦模型中,得到联邦预测标签数据;

在步骤S220中,基于所述联邦预测标签数据,以及与所述本地样本数据对应的目标标签数据计算所述联邦模型的模型性能指标数据;

在步骤S230中,基于所述模型性能指标数据确定所述合作收益数据。

联邦模型为基于所有参与方持有的数据进行联邦建模或隐私计算时,按照预定的联邦建模方法训练得到的模型。

其中,在跨样本场景中,联邦模型可以指根据联邦学习中各个参与方的训练样本数据和与训练样本数据对应的标签数据训练得到的模型;本地样本数据可以指联邦学习中某参与方的样本数据;联邦预测标签数据可以指将本地样本数据输入至联邦模型中得到的预测标签数据。

在相同性质的参与方之间拥有相似标签数据但样本数据分布不同的条件下,可以采样跨样本联邦的模式,以通过联合多个参与方的样本数据进行风险分析,以及对各参与方提供的数据的贡献度进行评估;同时,跨样本联邦的目的是充分利用联邦学习中各参与方提供的样本数据和与样本数据对应的标签数据,让各参与方利用本地样本数据和与样本数据对应的标签数据在本地进行模型训练,并得到本地模型的训练梯度,以及通过加密、差异隐私和获秘密共享技术掩饰本地模型的训练梯度,并将掩码后的训练梯度发送至服务器;服务器对各参与方的掩码后的训练梯度执行安全聚合,并将聚合的结果发送至各参与方,以使各参与方对聚合结果进行解密得到解密后的梯度数据,并根据解密后的梯度数据更新各自的本地模型。

图3示意性示出了根据本公开的一些实施例的目标贡献度计算方法的示意图。参考图3所示,该目标贡献度计算方法可以包括以下步骤:

在步骤S310中,基于所述独立收益数据和所述合作收益数据计算边际收益数据;

在步骤S320中,根据所述边际收益数据计算所述目标贡献度。

其中,边际收益数据可以指在联邦学习中新增参与方赋予给初始参与方的收益数据,例如,联邦学习中的初始参与方可以是参与方A,新增参与方可以是参与方B和参与方C,参与方A的边际收益数据可以是参与方B和参与方C带来的新增收益数据,当然,边际收益数据还可以是其他新增参与方赋予给初始参与方的新增收益数据,本例实施例对此不作特殊限定。

优选的,可以在确定各参与方的边际收益数据之后,计算各个参与方的边际收益数据的和得到联合边际收益数据,并直接通过计算各参与方的边际收益数据占联合收益数据的比率得到各参与方在联邦学习中各自的贡献度。

具体的,可以基于目标参与方的独立收益数据和多个参与方的合作收益数据,并根据沙普利公式计算目标参与方的边际收益数据和其他参与方的边际收益数据,确定所有参与方的边际收益数据的和-联合边际收益数据;进而,通过计算目标参与方的边际收益数据占联合边际收益数据的比例以确定目标参与方的目标贡献度;同理,也可以直接根据其他参与方的边际收益数据和联合边际收益数据计算得到其他参与方的贡献度。

举例而言,在联邦学习中,初始参与方可以是参与方B和参与方C,新增参与方可以是参与方A,参与方A的边际收益数据可以是引入参与方A带来的新增收益数据φ(A),同理,计算参与方B的边际收益数据φ(B),联合收益φ(S)=φ(A)+φ(B),参与方A的贡献度大小可以是W(A)。

其中,

图4示意性示出了根据本公开的一些实施例的第一独立收益数据确定方法的示意图。参考图4所示,该第一独立收益数据确定方法可以包括以下步骤:

在步骤S410中,获取与所述公共样本数据对应的密文目标标签数据;

在步骤S420中,接收由协助参与方发送的目标参与方的第一密文预测标签数据,并根据所述密文目标标签数据和所述第一密文预测标签数据计算所述目标参与方的密文模型性能指标数据;

在步骤S430中,将所述密文模型性能指标数据由所述协助方发送至所述目标参与方,以使所述目标参与方根据所述密文模型性能指标数据计算与所述目标参与方对应的独立模型的第一模型性能指标数据,并基于所述第一模型性能指标数据确定所述第一独立收益数据;其中,所述第一密文预测标签数据是由所述目标参与方对所述目标参与方的独立模型输出的第一预测标签数据进行加密得到的。

其中,公共样本数据可以在指跨特征场景中,持有标签数据的参与方与只持有样本数据的参与方共有的样本数据,例如,联邦学习中有参与方A和参与方B,其中,参与方A只有样本数据并没有与样本数据对应的标签数据,而参与方B持有与样本数据对应的标签数据;参与方A可以将样本数据进行加密,并将加密后的样本数据发送至协助参与方;同时,参与方B也可以将样本数据进行加密,并将加密后的样本数据发送至协助参与方;进而,协助参与方基于加密对齐技术,确认两个参与方共有的样本数据,即公共样本数据可以是通过协助参与方利用加密对齐技术确定的样本数据;当然,公共样本数据还可以是由协助参与方基于其他对齐技术确定的多个参与方共有的样本数据,本例实施例对此不作特殊限定。

密文目标标签数据可以指通过对与公共样本数据对应的目标标签数据进行加密得到的标签数据;目标参与方可以指在跨特征场景中,由持有样本数据而没有标签数据的参与方;第一密文预测标签数据可以指由目标参与方对目标参与方的独立模型输出的第一预测标签数据进行加密得到的标签数据;第一模型性能指标数据可以指目标参与方的独立模型的模型性能指标数据。

优选的,在跨特征场景中,各参与方可以将自身的样本数据进行加密,并将加密后的样本数据发送至协助参与方,以通过协助参与方对不同的加密样本数据进行安全对齐确定不同参与方之间共有的公共样本数据;持有与公共样本数据对应的标签数据的参与方,可以将标签数据进行加密得到的密文标签数据发送至目标参与方,以使目标参与方根据公共样本数据中的训练样本数据,以及与训练样本数据对应的标签数据训练得到独立模型,进而,将公共样本数据输入到该独立模型中得到第一预测标签数据;同时,目标参与方可以将第一预测标签数据进行加密得到第一密文预测标签数据,并通过协助参与方将第一密文预测标签数据发送至持有与公共样本数据对应的密文标签数据的参与方,以使该参与方可以在密文空间上,基于第一密文预测标签数据和密文标签数据计算目标参与方的密文模型性能指标数据,并通过协助参与方将目标参与方的密文模型性能指标数据发送至目标参与方;从而目标参与方可以基于自身的密文模型性能指标数据确定第一模型性能指标数据,以根据第一模型性能指标数据确定独立收益数据。

在跨特征场景中,首先通过协助参与方采用安全对齐技术确定不同参与方之间加密后的公共样本数据,并将与公共样本数据对应的密文目标标签数据发送至目标参与方,避免了将不同参与方的样本数据和标签数据暴露给协助参与方,提高了参与方的数据安全性;其次,通过协助方将第一密文预测标签数据发送至持有与公共样本数据对应的密文标签数据的参与方,以使该参与方可以在密文空间上基于第一密文预测标签数据和密文标签数据计算目标参与方的密文模型性能指标数据,以及通过协助参与方将密文模型性能指标数据发送至目标参与方;目标参与方可以对密文模型性能指标数据进行解密得到模型性能指标数据,并基于模型性能指标数据计算第一模型性能指标数据,进而根据第一模型性能指标数据确定第一独立收益数据,避免了通过协助参与方将密文目标标签数据发送至目标参与方,提高了第一独立收益数据的计算效率。

可选的,在跨特征场景中,通过协助参与方确定不同参与方共同持有的样本数据即公共样本数据后,可以利用该公共样本数据和与公共样本数据对应的目标标签数据训练得到联邦模型,并将参与方的样本数据输入至该联邦模型中可以得到预测标签数据;根据预测标签数据以及与样本数据对应的真实标签数据计算联邦模型的模型性能指标数据,并基于该模型性能指标数据确定合作收益数据。

图5示意性示出了根据本公开的一些实施例的第二独立收益数据确定方法的流程示意图。参考图5所示,该第二独立收益数据确定方法可以包括以下步骤:

在步骤S510中,获取本地样本数据,以及与所述本地样本数据对应的标签数据;

在步骤S520中,将所述本地样本数据输入至与所述本地样本数据对应的独立模型中得到第二预测标签数据;

在步骤S530中,基于所述标签数据和所述第二预测标签数据,计算所述独立模型的第二模型性能指标数据;

在步骤S540中,基于所述第二模型性能指标数据确定所述第二独立收益数据。

其中,第二模型性能指标数据可以指持有样本数据和与样本数据对应的标签数据的参与方的独立模型的模型性能指标数据;第二收益数据可以指持有样本数据和与样本数据对应的标签数据的参与方的独立收益数据;在跨特征场景中,持有样本数据和与样本数据对应的标签数据的参与方,可以利用本地样本数据以及本地的独立模型,在本地计算自身的贡献度。例如,参与方B拥有本地样本数据和与本地样本数据对应的标签数据,可以基于本地样本数据中的训练样本数据和与训练样本数据对应的标签数据训练得到本地的独立模型;进而,可以将本地样本数据输入至本地的独立模型得到第二预测标签数据。

可选的,持有样本数据和与样本数据对应的标签数据的参与方,可以将本地样本数据直接输入至训练完成的本地的独立模型中,得到第二预测标签数据;进而,可以通过计算与本地样本数据对应的标签数据和第二预测标签数据之间的模型性能指标数据,并基于模型性能指标数据确定与本地的独立模型对应的第二模型性能指标数据,以基于第二模型性能指标数据确定第二独立收益数据,可以避免将本地样本数据按照不同维度划分为多个样本数据,进而也避免了计算多个与样本数据维度对应的独立收益数据,提高了独立收益数据的计算效率。

图6示意性示出了根据本公开的一些实施例的另一目标贡献度计算的示意图。参考图6所示,该目标贡献度计算方法可以包括以下步骤:

在步骤S610中,获取所述目标参与方的第一目标参数和所述第一独立收益数据,并基于所述第一目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算所述目标参与方对应的第一贡献度,以及将所述第一贡献度发送给所述目标参与方;

在步骤S620中,获取第二目标参数,并基于所述第二目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算第二贡献度;

在步骤S630中,将所述第一贡献度和所述第二贡献度作为所述目标贡献度,以根据所述目标贡献度确定所述目标参与方的样本数据和所述本地样本数据的有效性。

其中,在跨特征场景中,第一目标参数可以指在联邦模型中用于计算第一参与方的贡献度的权重参数,且第一参与方为只持有样本数据而没有标签数据的参与方;例如,第一目标参数可以是第一参与方在联邦模型中贡献度的权重参数构成的参数集合,如联邦模型中有第一参与方和第二参与方(持有样本数据和与样本数据对应的标签数据的参与方),则对于任意参与方,其对应的集合中的元素均为2,即|N|=2,表明任意参与方在联邦中的参与方方式有两种。不失一般性,以第一参与方为例,一种是第一参与方为单独参与方,另一种是第一参与方是第二参与方的合作参与方;当第一参与方为单独参与方时,即|s|=1,可以根据目标公式,如沙普利公式(shapely)中的系数计算公式(1)

其中,k表示目标参数,N表示联邦模型中参与方构成的集合,S表示联邦中的参与方对应的集合,且S表示集合N的子集,|N|表示集合N对应的元素个数,|S|表示集合S对应的元素个数。

根据系数计算公式(1)可以得到第一目标参数构成的参数集合中的第一个元素为1/2,当第一参与方是第二参与方的合作参与方时,即|s|=2,根据沙普利公式中的系数计算公式可以得到第一目标参数构成的参数集合中的第二个元素为1,当然,第一目标参数可以指在联邦模型中用于计算第一参与方的贡献度对应的其他权重参数,本例实施例对此不作特殊限定。

第二目标参数可以指在联邦模型中用于计算第二参与方对应的贡献度的权重参数,例如,第二目标参数可以是第二参与方在联邦模型中贡献度的权重参数构成的参数集合,如联邦模型中有第一参与方和第二参与方,则对于任意参与方,其参与方对应的集合中的元素均为2,即|N|=2,表明任意参与方在联邦中的参与方方式有两种。不失一般性,以第二参与方为例,一种是第二参与方为单独参与方,另一种是第二参与方是第一参与方的合作参与方,当第二参与方为单独参与方时,即|s|=1,根据沙普利公式中的系数计算公式可以得到第二目标参数构成的参数集合中的第一个元素为1/2,当第二参与方是第一参与方的合作参与方时,即|s|=2,根据沙普利公式中的系数计算公式可以得到第二目标参数构成的参数集合中的第二个元素为1,当然,第二目标参数可以指在联邦模型中用于计算第二参与方的贡献度对应的其他权重参数,本例实施例对此不作特殊限定。

举例而言,在计算得到第一目标参数和第二目标参数后,还需要计算第一参与方的边际收益数据,即第一边际收益数据,以及第二参与方的边际收益数据-第二边际收益数据和所有参与方的边际收益数据之和-联合边际收益数据;其中,第一边际收益数据可以指去除第一参与方后将所有参与方对应的收益数据进行聚合得到的收益数据,例如,两方参与联邦建模时,若某一参与方只有样本数据而没有标签数据,则可以将标签数据作为贡献度计算的重要因素,进而可以根据沙普利公式中的目标公式(2)去除第一参与方后将第一目标参数分别与其他参与方对应的收益数据进行相乘和相加得到的收益数据,如联邦模型中有第一参与方和第二参与方,联邦模型对应的合作收益数据为45、第一参与方对应的第一独立收益数据为40、第二参与方对应的第二独立收益数据为30,当第一参与方为单独参与方时,去除第一参与方后没有其他参与方,则其他参与方对应的收益数据为0,而第一参与方没有标签数据不参与联邦贡献度计算,使得第一参与方的收益数据与其他参与方对应的收益数据的差值为0;当第一参与方是第二参与方的合作参与方时,去除第一参与方后其他参与方为第二参与方,合作收益数据与第二独立收益数据的差值为15,结合第一目标参数{1/2,1},得到第一边际收益数据为0+15=15,当然,第一边际收益数据还可以是将去除第一参与方后所有参与方对应的收益数据和第一目标参数分别进行相乘和相加得到的其他收益值,本例实施例对此不作特殊限定。

其中,i表示参与方,W

第二边际收益数据可以指去除第二参与方后将所有参与方对应的收益数据进行聚合得到的收益值,例如,在多方参与联邦建模时,若某一参与方只有样本数据而没有标签数据,则可以将标签数据作为贡献度计算的重要因素,去除第二参与方后将第二目标参数分别与其他参与方对应的收益数据进行相乘和相加得到的收益值,如联邦模型中有第一参与方和第二参与方,第一参与方只持有样本数据并不持有标签数据,第二参与方持有样本数据和标签数据,联邦模型对应的合作收益数据为45、第一参与方对应的第一独立收益数据为40、第二参与方对应的第二独立收益数据为30,当第二参与方为单独参与方时,去除第二参与方后没有其他参与方,则第二参与方对应的第二独立收益数据与其他参与方对应的收益数据的差值为30;当第二参与方是第一参与方的合作参与方时,去除第二参与方后其他参与方为第一参与方,但第一参与方只持有样本数据并不持有标签数据,第一参与方的真实收益数据为0,则合作收益数据与第一参与方的真实收益数据的差值为45,结合第一目标参数{1/2,1},由于15+45=60,得到第二边际收益数据为60,当然,第二边际收益数据还可以是将去除第二参与方后所有参与方对应的收益数据和第二目标参数分别进行相乘和相加得到的其他收益数据,本例实施例对此不作特殊限定。

联合边际收益数据可以指将各个参与方对应的边际收益数据进行聚合得到的收益值,例如,当有两个参与方时,联合边际收益数据可以是将各个参与方对应的边际收益数据进行相加得到的收益数据,如,当第一边际收益数据为15,第二边际收益数据为60时,得到的联合边际收益数据为75,当然,有多个参与方时,即参与方数量超过2个时,联合边际收益数据还可以是将各个参与方对应的其他边际收益数据进行聚合得到的收益数据,本例实施例对此不作特殊限定。

第一贡献度可以指第一参与方提供的数据内容在联邦模型中的贡献比,例如,第一贡献度可以是第一参与方对应的第一边际收益数据占联合边际收益数据的比率,如第一边际收益数据为15、第二边际收益数据为60、联合边际收益数据为75,得到的第一参与方对应的第一贡献度为20%,当然,第一贡献度还可以是第一参与方对应的其他第一边际收益数据占联合边际收益数据的比率,本例实施例对此不作特殊限定。

第二贡献度可以指第二参与方提供的数据内容在联邦模型中的贡献比,例如,第二贡献度可以是第二参与方对应的第二边际收益数据占联合边际收益数据的比率,如第一边际收益数据为15、第二边际收益数据为60、联合边际收益数据为75,得到的第二贡献度为80%,当然,第二贡献度还可以是第二参与方对应的其他第二边际收益数据占联合边际收益数据的比率,本例实施例对此不作特殊限定。

优选的,可以根据各个参与方持有的数据内容的属性,将各个参与方分为不同的组,如将持有样本数据和标签数据的参与方分为一组,将只持有样本数据的分为一组,根据各个参与方在联合模型中的参与方式确定各个参与方对应的目标参数,并根据各个参与方对应的独立收益数据、合作收益数据计算各个参与方对应的边际收益数据和联合边际收益数据;进而,基于各个参与方对应的边际收益数据和联合边际收益数据计算各个参与方对应的贡献度,凸显了标签数据的重要性,也提高了计算各参与方对应的贡献度的准确率,还避免了各个参与方的利益分配不均匀的问题。此外,还可以根据各个参与方对应的贡献度对各参与方的数据源进行有效性评估,贡献度大的参与方对应的数据源的有效性较高,而贡献度小的参与方对应的数据源的有效性较低。

需要说明的是,公开的示例实施例中的基于隐私计算的贡献度计算方法,适用于多个参与方,并不以第一参与方和第二参与方为限。

举例而言,在基于隐私计算的贡献度评估中,不仅考虑样本数据本身在联邦学习中的贡献度,还考虑标签数据在联邦学习中的贡献度,参与联邦的数据提供方有三个如参与方A、参与方B、参与方C,其中,仅有参与方A持有样本数据和标签数据,而参与方B和参与方C只持有样本数据;假设二分类问题的基准准确率为50%,联邦模型(A、B、C三方协同完成)二分类问题的准确率为95%,A方独立模型的准确率为60%,B方独立模型的准确率为70%,C方独立模型的准确率为80%;A、B联合建模的模型准确率为75%,A、C联合建模的准确率为85%,B、C联合建模的准确率为90%。参与方A对应的独立收益数据V(A)=10、参与方B对应的独立收益数据V(B)=20、参与方C对应的独立收益数据V(C)=30、参与方A和参与方B对应的合作收益数据V(AUB)=25、参与方A和参与方C对应的合作收益数据V(AUC)=35、参与方B和参与方C对应的合作收益数据V(BUC)=40、参与方A、参与方B、参与方C对应的合作收益数据V(AUBUC)=45。在联邦学习中存在某一参与方只有样本数据而没有标签数据的情况,因此可以将标签数据作为贡献度计算的重要因素。特别在跨特征场景下当多方参与建模,如参与方A、参与方B、参与方C,去除标签持有方A之后,其他无标签方参与方对应的收益数据V(S\A)均为0。

可选的,可以根据公式(1)计算得到各个参与方对应的目标参数、以及根据公式(2)计算其他用于确定各个参与方对应的边际收益数据的参数,具体如表1、表2和表3所示。

表1参与方A的目标参数

其中:N={A,AUB,AUC,AUBUC},|N|表示集合N对应的元素个数,|N|=4,S表示集合N的元素,V(S\A)表示集合N的元素S除参与方A之外其他参与方对应的收益数据。

由表1可知,参与方A在联邦模型中对应的目标参数为1/4、1/12、1/12、1/12,进而,将各个目标参数分别与对应的收益数据差值相乘并求和,得到参与方A的边际收益数据;其中,参与方A的边际收益数据Φ(A),Φ(A)=5+25/12+35/12+45/12=13.75。

表2参与方B的目标参数

其中,N={B,AUB,BUC,AUBUC},|N|表示集合N对应的元素个数,|N|=4,S表示集合N的元素,V(S\B)表示集合N的元素S除参与方B之外其他参与方对应的收益数据。

由表2可知,参与方B在联邦模型中对应的目标参数有1/4、1/12、1/12、1/12,进而,将各个目标参数分别与对应的收益数据差值相乘并求和,得到参与方B的边际收益数据Φ(B)=0+15/12+0+5/6=2.08。

表3参与方C的目标参数

其中N={C,AUC,BUC,AUBUC},|N|表示集合N对应的元素个数,|N|=4,S表示集合N的元素,V(S\C)表示集合N的元素S除参与方C之外其他参与方对应的收益数据。

由表3可知,参与方C在联邦模型中对应的目标参数为1/4、1/12、1/12、1/12,进而,将各个目标参数分别与对应的收益数据差值相乘并求和,得到参与方C的边际收益数据Φ(C)=0+25/12+0+5/3=3.75。由参与方A的边际收益数据、参与方B的边际收益数据、参与方C的边际收益数据可得联合边际收益数据Φ(S)=13.75+2.08+3.75=19.58;进而,可以计算得到参与方A的贡献度W(A)=13.75/19.58=70.22%,参与方B的贡献度W(B)=2.08/19.58=10.62%,参与方C的贡献度W(C),W(C)=3.75/19.58=2%,从而可以精确的得到各个参与方在联邦中的贡献度,也可以确定各个参与方提供的数据的有效性,还可以提高各参与方利益分配的公平性和公正性。

综上所述,基于隐私计算的贡献度计算方法可以适用于多个参与方,并且只需要从数据源的角度或者参与方的角度,即从各个参与方的数据整体出发计算各个参与方对应的联邦贡献度,并不需要将各个参与方对应的数据按照特征维度进行划分,并计算各个特征维度的样本数据对应的贡献度,再将各个特征维度的贡献度进行相加得到参与方对应的贡献度,提高了各个参与方的贡献度的计算效率。此外,可以通过协助参与方将只持有样本数据的目标参与方的密文预测标签数据发送到持有与样本数据对应的标签数据的参与方,该持有与样本数据对应的标签数据的参与方可以基于接收到的密文预测标签数据和与标签数据对应的密文标签数据计算目标参与方的密文模型性能指标数据,并将密文模型性能指标数据通过协助参与方发送至目标参与方,以使目标参与方计算本地的独立模型的模型性能指标数据,并基于模型性能指标数据确定独立收益数据,避免了暴露目标参与方对应的数据隐私,提高了目标参与方数据的安全性,也可以通过获取各个参与方的独立收益数据以及合作收益数据,并根据沙普利公式计算各个参与方对应的贡献度,提高了计算各参与方对应的贡献度的准确率;在计算贡献度的过程中,还可以将参与方的标签数据作为数据源参与贡献度的计算,进一步提高了计算各个参与方的贡献度的公平性和公正性。

需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

此外,在本示例实施例中,还提供了一种基于隐私计算的贡献度计算装置。参照图7所示,该联邦贡献度计算装置700包括:预测标签数据获取模块710,用于获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据;独立收益数据确定模块720,用于基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据;目标贡献度计算模块730,用于获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述预测标签数据获取模块710还包括预测标签数据获取单元,所述预测标签数据获取单元,用于将所述本地样本数据输入至独立模型中得到预测标签数据;其中,所述独立模型是基于所述本地样本数据中的训练样本数据,以及与所述训练样本数据对应的标签数据训练得到的。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置700还包括合作收益数据确定模块,所述合作收益数据确定模块,用于获取预构建的联邦模型,并将所述本地样本数据输入至所述联邦模型中,得到联邦预测标签数据;基于所述联邦预测标签数据,以及与所述本地样本数据对应的目标标签数据计算所述联邦模型的模型性能指标数据;基于所述模型性能指标数据确定所述合作收益数据。

在本公开的一些示例实施例中,基于前述方案,所述目标贡献度计算模块730还包括目标贡献度计算模块单元,所述目标贡献度计算模块单元,用于基于所述独立收益数据和所述合作收益数据计算边际收益数据;根据所述边际收益数据计算所述目标贡献度。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置700还包括第一独立收益数据确定模块,所述第一独立收益数据确定模块,用于获取与所述公共样本数据对应的密文目标标签数据;接收由协助参与方发送的目标参与方的第一密文预测标签数据,并根据所述密文目标标签数据和所述第一密文预测标签数据计算所述目标参与方的密文模型性能指标数据;将所述密文模型性能指标数据由所述协助方发送至所述目标参与方,以使所述目标参与方基于所述密文模型性能指标数据计算与所述目标参与方对应的独立模型的第一模型性能指标数据,并基于所述第一模型性能指标数据确定所述第一独立收益数据;其中,所述第一密文预测标签数据是由所述目标参与方对所述目标参与方的独立模型输出的第一预测标签数据进行加密得到的。

在本公开的一些示例实施例中,基于前述方案,所述联邦贡献度计算装置700还包括第二独立收益数据确定模块,所述第二独立收益数据确定模块,用于获取本地样本数据,以及与所述本地样本数据对应的标签数据;将所述本地样本数据输入至与所述本地样本数据对应的独立模型中得到第二预测标签数据;基于所述标签数据和所述第二预测标签数据,计算所述独立模型的第二模型性能指标数据;基于所述第二模型性能指标数据确定所述第二独立收益数据。

在本公开的一些示例实施例中,基于前述方案,所述目标贡献度计算模块730还包括目标贡献度计算单元,所述目标贡献度计算单元,用于获取所述目标参与方的第一目标参数和所述第一独立收益数据,并基于所述第一目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算所述目标参与方对应的第一贡献度,以及将所述第一贡献度发送给所述目标参与方;获取第二目标参数,并基于所述第二目标参数、第一独立收益数据、第二独立收益数据、合作收益数据计算第二贡献度;将所述第一贡献度和所述第二贡献度作为所述目标贡献度,以根据所述目标贡献度确定所述目标参与方的样本数据和所述本地样本数据的有效性。

上述中联邦贡献度计算装置各模块的具体细节已经在对应的基于隐私计算的贡献度计算方法中进行了详细的描述,因此此处不再赘述。

应当注意,尽管在上文详细描述中提及了联邦贡献度计算装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,在本公开的示例性实施例中,还提供了一种能够实现上述基于隐私计算的贡献度计算方法的电子设备。

所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。

下面参照图8来描述根据本公开的这种实施例的电子设备800。图8所示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如,所述处理单元810可以执行如图1中所示的步骤S110,获取样本数据,并将所述样本数据输入至独立模型中,得到预测标签数据;步骤S120,基于所述预测标签数据和与所述样本数据对应的目标标签数据,计算所述独立模型的模型性能指标数据,并根据所述模型性能指标数据确定独立收益数据;步骤S130,获取合作收益数据,并基于所述独立收益数据和所述合作收益数据计算目标贡献度。

存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。

参考图9所示,描述了根据本公开的实施例的用于实现上述基于隐私计算的贡献度计算方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施例的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号