首页> 中国专利> 大规模语言模型去偏倚方法、系统、设备及存储介质

大规模语言模型去偏倚方法、系统、设备及存储介质

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种大规模语言模型去偏倚方法、系统、设备及存储介质，包括：获取基于神经网络的大规模预训练语言模型；针对所述大规模预训练语言模型采用数据自生成方法获得用于性别偏倚分析的文本数据，形成语料库，基于所述语料库建立一系列模板；利用所述模板计算所述大规模预训练语言模型的性别偏倚水平，根据性别偏倚水平反向传播计算大规模预训练语言模型的纠偏梯度；根据纠偏梯度更新大规模预训练语言模型中的模型参数，重复寻优更新直至满足预设更新完成条件，得到去性别偏倚的大规模语言模型。因此本发明从信息论的角度分析语言模型的性别偏倚，且将偏差修正问题视为多目标优化问题，以减少偏倚，采用自动生成算法来解决训练数据不足的问题。

著录项

公开/公告号CN114462395A

专利类型发明专利
公开/公告日2022-05-10

原文格式PDF
申请/专利权人交叉信息核心技术研究院(西安)有限公司;
展开▼

申请/专利号CN202210184515.6
发明设计人刘奕然;刘潇;于洋;
展开▼

申请日2022-02-25
分类号G06F40/237;G06F40/20;G06N3/08;G06N3/04;
代理机构
代理人
地址 710077 陕西省西安市高新区天谷八路软件新城云汇谷156号B2座11层
入库时间 2023-06-19 15:13:29

法律信息

法律状态公告日

法律状态信息

法律状态
2022-05-10

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 语言模型得分前瞻值赋值设备、语言模型得分前瞻值赋值方法和程序存储介质 [P] . 中国专利： CN102027534A . 2011-04-20
2. 基于语言模型的问答匹配方法、系统、设备及存储介质 [P] . 中国专利： CN110019736B . 2021.10.01
3. 去隔行插值方法、装置及系统、视频处理方法和存储介质 [P] . 世界知识产权组织专利： WO2020/142916A1 . 2020.07.16
4. 一种输出功率的调节方法、设备、系统及存储介质 [P] . 世界知识产权组织专利： WO2020/142891A1 . 2020.07.16
5. 推荐系统训练方法、装置、计算机设备及存储介质 [P] . 世界知识产权组织专利： WO2020/143186A1 . 2020.07.16