首页> 中文期刊> 《中文信息学报》 >融合EMD最小化双语词典的汉—越无监督神经机器翻译

融合EMD最小化双语词典的汉—越无监督神经机器翻译

         

摘要

神经机器翻译在平行语料充足的任务中能取得很好的效果,然而对于资源稀缺型语种的翻译任务则往往效果不佳.汉语和越南语之间没有大规模的平行语料库,在这项翻译任务中,该文探索只使用容易获得的汉语和越南语单语语料,通过挖掘单语语料中词级别的跨语言信息,融合到无监督翻译模型中提升翻译性能;该文提出了融合EMD(Earth Mover's Distance)最小化双语词典的汉—越无监督神经机器翻译方法,首先分别训练汉语和越南语的单语词嵌入,通过最小化它们的E MD训练得到汉越双语词典,然后再将该词典作为种子词典训练汉越双语词嵌入,最后利用共享编码器的无监督机器翻译模型构建汉—越无监督神经机器翻译方法.实验表明,该方法能有效提升汉越无监督神经机器翻译的性能.

著录项

  • 来源
    《中文信息学报》 |2021年第3期|43-50|共8页
  • 作者单位

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

    昆明理工大学 信息工程与自动化学院 云南 昆明 650500;

    昆明理工大学 云南省人工智能重点实验室 云南 昆明 650500;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    无监督学习; EMD; 汉语—越南语; 神经机器翻译;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号