首页> 中文学位 >基于树—串的汉文—新蒙文统计机器翻译系统的研究
【6h】

基于树—串的汉文—新蒙文统计机器翻译系统的研究

代理获取

目录

声明

摘要

图表目录

第一章 绪论

1.1 研究背景及意义

1.2 机器翻译的发展现状

1.3 本文的主要工作

1.4 论文的组织结构

第二章 机器翻译方法技术分析

2.1 机器翻译方法

2.1.1 基于规则的翻译模型

2.1.2 基于实例的翻译模型

2.1.3 基于统计的翻译模型

2.2 统计机器翻译

2.2.1 基于词的翻译模型

2.2.2 基于短语的翻译模型

2.2.3 基于句法的翻译模型

2.3 本章小结

第三章 树-串翻译模型

3.1 句法分析

3.2 词语对齐

3.2.1 两个模型

3.2.2 几种方法

3.2.3 汉文-新蒙文的词对齐

3.3 树-串模型

3.4 TAT模板

3.4.1 三元组

3.4.2 对齐一致性

3.5 本章小结

第四章 训练和解码

4.1 训练

4.1.1 计算基准TAT

4.1.2 组合构造TAT

4.1.3 限制条件

4.1.4 概率估计

4.2 解码

4.2.1 搜索算法

4.2.2 剪枝策略

4.2.3 利用双语短语表

4.3 本章小结

第五章 系统搭建和实验分析

5.1 系统体系结构

5.2 数据准备工作

5.2.1 语料的整理

5.2.2 汉文-新蒙文双语词典

5.2.3 开源工具的准备

5.2.4 预处理及初期准备

5.3 实验数据

5.3.1 评测方法

5.3.2 实验结果及分析

5.4 本章小结

第六章 总结和展望

6.1 结论

6.2 未来研究方向

参考文献

致谢

展开▼

摘要

伴随着科技的日益进步,机器翻译这一利用高性能计算机来完成不同语言之间的翻译方法变得越来越重要。2003年以来,基于短语的模型成为了近十年的机器翻译的主流技术,然而短语间的重排序依然是基于短语的模型的一大缺陷。为解决这一缺陷,越来越多的研究者开始了基于句法的翻译模型的研究工作。
  然而相对于汉文,新蒙文的基础资源的建设就匮乏很多。汉文有了较成熟的词法和句法的分析模型,而新蒙文的词法分析刚刚开始发展,句法分析还是空白。利用源语言端句法分析作为指导的树-串翻译模型出现了,研究者们也证明了,该方法可以有效的解决基于短语的翻译模型中短语间重排序的缺陷。本文提出了运用基于树-串对齐模板(Tree-to-string Alignment Template,简称TAT)的翻译模型到系统中,它是一种在基于词的统计机器翻译的基础上引入句法树来指导翻译过程的翻译模型。针对目前蒙文机器翻译的基础信息建设不够完善的现状,无法获得大量的蒙文句法信息,在只对汉语的源语言端进行句法分析的情况下,树-串对齐模板的统计翻译模型无疑是非常适用的一种基于句法的统计机器翻译模型。
  最后,我们利用扩展后的双语词典对自动对齐结果进行了校正,编程实现了基于树-串的汉文-新蒙文统计机器翻译系统,并在此基础上加入了短语表优化了翻译结果。实验结果表明,词对齐的正确率高低直接影响最终译文的质量,并且证明了树-串对齐模板翻译模型对于汉文-新蒙文翻译的结果是有帮助的,翻译性能在加入短语表后也有了一定的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号