首页> 中国专利> 基于隐私保护的word2vec模型训练方法、装置及系统

基于隐私保护的word2vec模型训练方法、装置及系统

摘要

本说明书实施例提供用于经由至少两个第一成员设备训练word2vec模型的方法、装置及系统。各个第一成员设备基于所具有的本地语料的语料分词结果生成本地分词词库,使用各自的本地分词词库进行隐私求交确定公共分词,并向其余第一成员设备共享非公共分词数目。随后,各个第一成员设备根据公共分词以及各个第一成员设备的非公共分词数目进行统一分词编号,生成统一字典。然后,各个第一成员设备基于统一字典和本地语料的语料分词结果生成各自的训练样本,并使用各自的训练样本执行基于隐私保护的模型训练来训练出word2vec模型。

著录项

  • 公开/公告号CN112507388B

    专利类型发明专利

  • 公开/公告日2021-05-25

    原文格式PDF

  • 申请/专利权人 支付宝(杭州)信息技术有限公司;

    申请/专利号CN202110158847.2

  • 发明设计人 陈超超;王力;周俊;

    申请日2021-02-05

  • 分类号G06F21/62(20130101);G06N3/08(20060101);G06N20/00(20190101);G06F40/284(20200101);G06F40/242(20200101);

  • 代理机构11376 北京永新同创知识产权代理有限公司;

  • 代理人林锦辉;刘景峰

  • 地址 310000 浙江省杭州市西湖区西溪路556号8层B段801-11

  • 入库时间 2022-08-23 11:49:48

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号