首页> 中文学位 >层次短语翻译模型研究和改进
【6h】

层次短语翻译模型研究和改进

代理获取

摘要

机器翻译是应用电子计算机实现从一种自然语言到另外一种自然语言的翻译。它属于计算语言学的范畴。经过几十年的发展,机器翻译在理论和实践方面都取得了非常大的进展,基于统计的方法是当前机器翻译的主流方法。
   David Chiang提出的层次短语模型已成为统计机器翻译中的主流模型之一,它在短语模型的基础上引入了非终结符,使模型具有了泛化能力,突破了短语模型只允许完全子串匹配的局限;它引入了层次短语,使模型具有了较好的远距离调序能力。
   层次短语翻译模型在取得巨大成功的同时,也具有明显的缺点,本文针对层次短语模型的不足进行改进,主要做了以下三点工作:
   一针对层次短语模型的层次规则抽取方法简单,存在大量无用,不合理的层次规则,造成模型规模庞大,解码费时与解码错误的问题,本文探讨了基于泛化能力的规则约束策略,通过是否具有泛化能力来衡量一条层次规则的有用性,过滤掉无用的层次规则。
   二针对层次短语模型解码过程中很多不合理规则的使用造成解码空间急剧扩张、在耗费大量解码时间的同时,造成解码错误的问题,我们对基于句法分析的层次短语模型解码优化做了初步的探讨,提出了使用句法信息限制不合理规则的使用的解码约束策略。
   三针对层次短语模型中只含有一个变量,在解码过程中,除词汇化信息外,并无更多的信息来明确层次规则的适用对象,容易造成解码错误的问题,我们提出了一个层次短语模型变量扩展框架,并在此框架下提出了一个初步的层次短语模型变量扩展方案。
   实验证明,本文所提出的方法能在加快解码速度的同时,改善翻译效果,因此是有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号