首页> 中文学位 >基于实例的机器翻译方法(EBMT)的分析和研究
【6h】

基于实例的机器翻译方法(EBMT)的分析和研究

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第一章机器翻译概述

1.1机器翻译的历史

1.2传统的机器翻译的方法

1.3新兴的机器翻译的方法

1.3.1基于统计的机器翻译的方法

1.3.2基于实例的机器翻译的方法

1.4机器翻译的发展前景

第二章基于双语对齐树库的EBMT

2.1 EBMT的双语语料库

2.2双语对齐树模型

2.2.1依存树模型

2.2.2面向数据的翻译(DOT)模型

2.2.3词汇功能语法的DOT(LFG-DOT)模型

第三章EBMT系统的设计

3.1词性标注和短语结构标注

3.2建立双语对齐树库

3.3 EBMT系统的翻译过程

第四章EBMT系统的实现

4.1 EBMT系统界面

4.2词性和短语结构标注工具

4.3双语对齐工具

4.4 MSXML解析器

4.5系统实现中遇到的问题

4.5.1中文量词和名词的关联

4.5.2标注和对齐

4.5.3替换节点的深度

4.5.4实现中的其它问题

4.6翻译系统测试结果

第五章总结和展望

5.1本系统的优缺点

5.2 EBMT系统的前景展望

致谢

参考文献

攻读硕士期间发表的学术论文

展开▼

摘要

机器翻译作为计算机自然语言处理的一个重要分支,其研究具有重大的社会经济价值。基于实例的机器翻译(EBMT)作为一种经验主义的方法,避免了复杂的深层次语法和语义分析,为机器翻译的发展指出了一条新路。 本文首先回顾了机器翻译的发展历史,并详细描述了机器翻译研究的现状。介绍了当今机器翻译领域的主要理论和方法,尤其是九十年代以来产生的新的基于语料库的方法,比较了新的经验主义的方法和传统的理性主义的方法的优缺点,讨论了机器翻译研究的发展趋势及其应用前景。 本文着重对基于双语对齐树库的EBMT方法进行了介绍。双语对齐树的引入使得EBMT系统的适应性和准确性得以提高。树对齐兼顾了单词对齐和结构对齐的特点,树的结构可以有效地表示语句中包含的结构信息和语法信息。本文对几种重要的基于双语对齐树的EBMT模型作了介绍。 接着本文介绍了EBMT系统的标注集和标注规则,以及对齐的方法和对齐关系的表示。系统使用基于可扩展标记语言(XML)的文档作为双语对齐树库的存储结构和表示方法。另外本文还给出了EBMT系统的翻译算法。 本文实现了一个基于双语对齐树库的EBMT系统,该系统使用VC进行开发,并通过微软提供的MSXML解析器对作为例句库的XML文档进行操作。本文还介绍了在EBMT系统实现过程中遇到的一些问题及解决的办法,或是提出了可能的解决问题的方案。 最后,本文给出了对该EBMT系统翻译性能进行测试的结果,分析了该系统的优缺点以及系统中存在的不足,总结了实现过程中的经验,并对EBMT系统未来的发展前景作了分析和展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号