首页> 中国专利> 验证共有子词对XLM翻译模型效果影响的实验方法

验证共有子词对XLM翻译模型效果影响的实验方法

摘要

本发明涉及验证共有子词对XLM翻译模型效果影响的实验方法。本发明包括:对XLM翻译模型预训练的语料库进行预处理;验证XLM翻译模型性能是否退化:用预处理后的语料库对XLM翻译模型进行预训练,用预训练后的模型初始化翻译模型,观察新的翻译模型的BLEU值。预处理包括如下:首先获取英语和法语子词中的共有子词及所有子词词频;然后根据分离比例,随机对共有子词进行分离;随后读取所有英法子词的词表保存在词典中,用于后续生成分离子词文件;使用生成的分离子词文件初始化词典,最后使用初始化后的词典来结构化模型语料库文件。本发明验证了共有子词对BLEU值的影响,且本发明对非同源语言的低资源神经机器翻译研究有帮助。

著录项

  • 公开/公告号CN112861516A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 昆明理工大学;

    申请/专利号CN202110079357.3

  • 申请日2021-01-21

  • 分类号G06F40/226(20200101);G06F40/242(20200101);G06F40/284(20200101);G06F40/58(20200101);

  • 代理机构53204 昆明人从众知识产权代理有限公司;

  • 代理人何娇

  • 地址 650093 云南省昆明市五华区学府路253号

  • 入库时间 2023-06-19 11:08:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-16

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号