首页> 中文学位 >面向模板机器翻译的文本生成技术研究
【6h】

面向模板机器翻译的文本生成技术研究

代理获取

目录

声明

摘要

第1章 引言

1.1 课题背景

1.2 基于模板机器翻译的概述

1.3 基于模板机器翻译中的短语翻译

1.4 短语翻译中需要解决的关键技术

1.5 论文结构

第2章 基于模板机器翻译中模板的匹配与优选

2.1 文本模板直接匹配的翻译框架

2.1.1 模板的定义

2.1.2 文本模板直接匹配的翻译模型

2.2 候选模板的抽取

2.2.1 Dice系数的原理

2.2.2 过滤候选模板

2.3 待译句子的变换

2.4 相似度计算及映射关系的获取

2.4.1 句子和模板间的相似度计算

2.4.2 映射关系的获取

2.4.3 编辑距离计算和映射关系获取实例

2.5 最优模板选择

2.5.1 编辑距离要素

2.5.2 短语译文质量要素

2.5.3 模板覆盖度要素

2.5.4 模板优选公式及实例说明

2.6 本章小结

第3章 基于模板机器翻译中译文的生成

3.1 译文生成规则

3.2 短语翻译引擎的构建

3.2.1 基于TM引擎的短语翻译

3.2.2 基于序列相交的短语翻译模型

3.2.3 基于模板的短语翻译

3.2.4 基于双语词典直翻(WDT)的短语翻译

3.3 短语翻译中汉语的词义消歧

3.3.1 基于贝叶斯分类器的消歧方法

3.3.2 基于最大熵模型的词义消歧方法

3.3.3 基于义项词语的无导词义消歧方法

3.3.4 基于词典的词义消歧方法

3.4 短语翻译中英语的冠词选择

3.4.1 基于转换的错误驱动方法的冠词选择

3.4.2 基于条件随机场的冠词选择

3.4.3 结合条件随机场和基于转换学习的方法进行冠词选择

3.5 本章小结

第4章 实验及结果分析

4.1 基于文本-模板直接匹配的翻译实验与分析

4.1.1 评测方法

4.1.2 实验结果及分析

4.2 译文生成中词义消歧的实验与分析

4.2.1 词义消歧的评测方法

4.2.2 词义消歧的实验与分析

4.3 冠词选择的实验与分析

4.4 对短语翻译引擎改良的实验与分析

4.5 本章小结

第5章 结束语

5.1 研究工作总结

5.2 未来的工作

参考文献

致谢

展开▼

摘要

多年来,机器翻译一直是自然语言处理领域最重要和最具挑战性的课题之一。本文基于东北大学与日本富士施乐公司多年的研究,探讨并实现了基于模板的机器翻译方法,并重点研究了基于模板的翻译方法中译文生成时需要解决的关键技术。
  最优模板选取和短语翻译是影响模板机器翻译的关键因素,本文通过基于文本-模板直接匹配、模板选优等方法改良了最适模板的选择;同时通过引入词义消歧和冠词选择方法改良了短语翻译的质量,并从整体上改善了机器翻译系统的性能。
  本文的主要内容包括:
  (1)针对候选模板的选取,本文提出了基于文本-模板直接匹配的方法。传统方法先利用句法分析器从待译句子中抽取候选模板,然后再计算抽取的模板同模板库中模板的相似度。但目前句法分析器的性能还不能满足实际需求,抽取模板的效果不理想,由此会影响到后续的相似度计算。本文根据候选模板对待译句子直接进行变换,然后利用编辑距离计算两者的相似度,最后利用回溯算法获取两者的映射关系。
  (2)模板的机器翻译中短语翻译的质量直接影响最终译文的质量,本文构建了独立的短语翻译模块,并将基于短语模板的方法作为短语翻译引擎的一个子模块。词义消歧问题是短语翻译中急需解决的问题,本文尝试了多种词义消歧方法,并将其融入到短语翻译引擎中;同时对英语译文生成时的冠词选择进行了探讨。
  实验结果表明基于文本-模板直接匹配的方法可以取得令人满意的性能,同时引入的词义消歧和冠词选择方法改善了译文的质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号