首页> 中国专利> 一种基于伪平行语料库构造的蒙汉机器翻译方法

一种基于伪平行语料库构造的蒙汉机器翻译方法

摘要

一种基于伪平行语料库构造的蒙汉机器翻译方法,通过利用简单数据增强、回译两种方式以精确蒙汉平行语料库为依据分别构造出蒙汉伪平行语料库和其中回译技术中所使用的汉蒙翻译模型ΘB采用条件生成对抗网络的架构来构建。将精确蒙汉平行语料库、三个语料库混合得到大规模蒙汉伪平行语料库,使用此语料库同样以条件生成对抗网络的架构来训练蒙汉翻译模型ΘA,并在训练过程中使用软上下文数据增强技术将输入到蒙汉翻译模型ΘA的编码器中的蒙语词的one‑hot向量进行平滑处理,利用这个平滑向量随机的替换原本要输入到翻译模型ΘA中编码器的one‑hot向量进行训练;目的在于优化翻译模型ΘA的参数,提升模型ΘA的翻译能力。

著录项

  • 公开/公告号CN112215017B

    专利类型发明专利

  • 公开/公告日2022-04-29

    原文格式PDF

  • 申请/专利权人 内蒙古工业大学;

    申请/专利号CN202011141114.X

  • 申请日2020-10-22

  • 分类号G06F40/58;G06F40/211;G06F40/216;G06F40/237;G06F40/247;G06N3/04;G06N3/08;

  • 代理机构西安智大知识产权代理事务所;

  • 代理人段俊涛

  • 地址 010080 内蒙古自治区呼和浩特市土默特左旗内蒙古工业大学金川校区

  • 入库时间 2022-08-23 13:33:47

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号