声明
摘要
第一章 绪论
1.1 机器翻译概述
1.2 统计机器翻译概述
1.2.1 噪声信道模型
1.2.2 对数线性模型
1.2.3 统计机器翻译金字塔
1.3 背景知识介绍
1.3.1 国内外翻译行业现状
1.3.2 云计算与机器翻译
1.3.3 本文的研究背景和意义
1.4 本文主要工作与创新点
1.5 本文的结构安排
第二章 云计算
2.1 云计算概述
2.2 开源项目Hadoop
2.2.1 分布式文件系统
2.2.2 分布式数据处理
2.2.3 分布式数据处理的API
2.3 基于MapReduce的统计机器翻译相关研究
2.4 本章小结
第三章 平行句对质量筛选
3.1 语料筛选的意义
3.2 相关研究工作
3.2.1 平行句对对齐
3.2.2 平行句对筛选
3.3 平行句对质量筛选的方法
3.3.1 基于句对长度比的方法
3.3.2 基于词对齐的方法
3.4 实验结果与分析
3.4.1 实验工具和数据介绍
3.4.2 Baseline结果
3.4.2 句对质量筛选
3.5 本章小结
第四章 领域分类与识别
4.1 统计机器翻译中的领域差异问题
4.2 领域识别方法的相关研究
4.2.1 语言模型困惑度
4.2.2 文本分类
4.3 双语句对的领域分类研究
4.3.1 直译与意译
4.3.2 基于n元组的双语平行句对表示
4.3.3 基于领域显著度的半监督分类方法研究
4.4 领域相关的统计机器翻译方法
4.5 实验结果与分析
4.5.1 领域分类结果
4.5.2 领域识别的翻译结果
4.6 本章小结
第五章 总结与展望
5.1 本文工作总结
5.2 工作展望
参考文献
硕士期间发表的论文
致谢