首页> 中国专利> 一种神经网络语言模型训练方法、装置、设备及存储介质

一种神经网络语言模型训练方法、装置、设备及存储介质

摘要

本申请公开了一种模型训练方法,包括:获取多组用于模型训练的批处理数据;通过运行于多块图形处理器上的多个计算节点,基于不同的批处理数据,并行训练同一神经网络语言模型;在当前轮次迭代时,通过多个计算节点中每个计算节点确定各参数的梯度;汇总各参数的梯度得到各参数的全局梯度,控制多个计算节点基于全局梯度同步进行参数更新;通过第一计算节点基于测试数据集对当前轮次更新后的神经网络语言模型进行性能评测得到当前语言模型性能指标值;通过第一计算节点广播当前语言模型性能指标值;根据当前语言模型性能指标值与上一轮次确定的语言模型性能指标值的大小关系,控制多个计算节点是否停止训练。本申请还公开了对应的系统。

著录项

  • 公开/公告号CN110379416B

    专利类型发明专利

  • 公开/公告日2021-10-22

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN201910755676.4

  • 发明设计人 黄羿衡;

    申请日2019-08-15

  • 分类号G10L15/06(20130101);G10L15/16(20060101);

  • 代理机构44285 深圳市深佳知识产权代理事务所(普通合伙);

  • 代理人王兆林

  • 地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层

  • 入库时间 2022-08-23 12:39:03

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号