首页> 中文会议>第七届全国机器翻译研讨会 >基于小规模俄汉双语词典的俄语形态切分

基于小规模俄汉双语词典的俄语形态切分

摘要

俄语是一种形态丰富的语言,其形态切分相关语料较为缺乏或带有噪声,这些都为俄语的形态切分研究带来困难。我们将此问题建模为经典的序列标注模型,首先自动切分小规模俄汉双语词典提取出形素字典作为训练数据,然后针对这种语言特点训练了一个基于最大熵的标注模型。在联合国六国平行语料中抽取的7万俄汉对齐句对上进行的机器翻译实验证明,我们的方法使得BLEU值相对没有形态切分的基线系统提高了1.92%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号