首页> 中国专利> 一种神经网络语言模型训练方法、装置、设备及存储介质

一种神经网络语言模型训练方法、装置、设备及存储介质

页面导航

摘要
著录项
相似文献

摘要

本申请公开了一种模型训练方法，包括：获取多组用于模型训练的批处理数据；通过运行于多块图形处理器上的多个计算节点，基于不同的批处理数据，并行训练同一神经网络语言模型；在当前轮次迭代时，通过多个计算节点中每个计算节点确定各参数的梯度；汇总各参数的梯度得到各参数的全局梯度，控制多个计算节点基于全局梯度同步进行参数更新；通过第一计算节点基于测试数据集对当前轮次更新后的神经网络语言模型进行性能评测得到当前语言模型性能指标值；通过第一计算节点广播当前语言模型性能指标值；根据当前语言模型性能指标值与上一轮次确定的语言模型性能指标值的大小关系，控制多个计算节点是否停止训练。本申请还公开了对应的系统。

著录项

公开/公告号CN110379416B

专利类型发明专利
公开/公告日2021-10-22

原文格式PDF
申请/专利权人腾讯科技(深圳)有限公司;
展开▼

申请/专利号CN201910755676.4
发明设计人黄羿衡;
展开▼

申请日2019-08-15
分类号G10L15/06(20130101);G10L15/16(20060101);
代理机构44285 深圳市深佳知识产权代理事务所(普通合伙);
代理人王兆林
地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
入库时间 2022-08-23 12:39:03

相似文献

专利
中文文献
外文文献

1. 一种神经网络语言模型训练方法、装置、设备及存储介质 [P] . 中国专利： CN110379416B . 2021.10.22
2. 神经网络语言模型、训练方法、装置及存储介质 [P] . 中国专利： CN110442721A . 2019-11-12
3. QUESTION ANSWERING METHOD AND LANGUAGE MODEL TRAINING METHOD, APPARATUS, DEVICE, AND STORGAGE MEDIUM [P] . EP3816812A1 . 2021-05-05

机译：问题应答方法和语言模型训练方法，装置，设备和存储介质
4. QUESTION ANSWERING METHOD AND LANGUAGE MODEL TRAINING METHOD, APPARATUS, DEVICE, AND STORAGE MEDIUM [P] . US2021191962A1 . 2021-06-24

机译：问题应答方法和语言模型训练方法，装置，设备和存储介质
5. LANGUAGE MODEL TRAINING METHOD, DEVICE, ELECTRONIC EQUIPMENT AND READABLE STORAGE MEDIUM [P] . KR20210157342A . 2021-12-28

机译：语言模型训练方法，装置，电子设备和可读存储介质