面向大规模数据的统计机器翻译语言模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网技术的发展，使得获取大规模双语平行数据成为可能，从而大大地推动了基于统计方法的机器翻译的研究和应用。近几年，随着基于深层神经网络等深度学习方法的快速发展，机器翻译及其他多种自然语言处理任务更是发展迅猛。然而，自然语言处理任务中，与图像和语音均属于较为底层的原始输入信号不同，语言(词、句子、篇章等文本信息)属于人类认知过程中产生的高层认知抽象实体，在应用神经网络等机器学习方法时，表示成为最大的问题之一。文本信息的向量表示成为将深度学习方法应用于自然语言处理任务的关键技术之一。本课题以词向量表示切入点，研究基于深度神经网络的语言模型建模方法，并将神经网络语言模型作为新的特征融入到统计机器翻译系统。
　　针对语言模型建模问题，课题首先介绍了传统的统计语言模型原理，然后介绍了神经网络方法下的连续的词向量表示方法与传统的表示方法，以及连续的词向量的生成理论，最后详细介绍了神经网路语言模型的实现步骤。以传统语言模型为基线方法，采用Moses作为统计机器翻译实验系统，分别使用中英NIST FBIS的10万句对，85万句对以及NIST中英新闻340万句对为训练语料进行对比实验。实验结果表明，在数据较小的情况下传统的方法比神经网络方法的效果好，且训练时间短。当数据规模较大时，后者效果优于前者。

著录项

作者
李琼;
展开▼
作者单位

西安理工大学;

展开▼
授予单位西安理工大学;
学科控制工程
授予学位硕士
导师姓名杜金华,谢国,马艳军;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类翻译机;机器翻译;
关键词
大规模数据; 统计机器翻译; 神经网络; 语言模型; 文本词向量;

相似文献

中文文献
外文文献
专利

1. 面向大规模语料的语言模型研究新进展 [J] . 骆卫华 ,刘群 ,白硕 . 计算机研究与发展 . 2009,第010期
2. 一个面向大规模数据仓库数据清洗策略的研究和实现 [J] . 汪恒杰 ,胡大斌 ,嵇晓 . 工程地质计算机应用 . 2004,第003期
3. 面向大规模数据集的索引学习算法研究 [J] . 李繁 ,严星 . 计算机仿真 . 2021,第010期
4. 面向大数据环境的大规模机器学习工具研究综述 [J] . 王伟宾 . 软件导刊 . 2021,第001期
5. 面向互联网应用的大规模数据实时查询优化方法研究 [J] . 沙梦钒 ,徐兰梅 ,滕庆勇 . 软件工程师 . 2020,第011期
6. 统计机器翻译中多种语言模型的融合 [C] . 奚宁 ,赵迎功 ,汤光超 . 第七届全国机器翻译研讨会 . 2011
7. 面向统计机器翻译的语言模型优化技术研究 [A] . 孙凯亚 . 2015

面向大规模数据的统计机器翻译语言模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅