首页> 中国专利> 一种汉英词语自动对齐方法

一种汉英词语自动对齐方法

摘要

本发明涉及一种汉英词语自动对齐方法,首先对原始汉、英双语句提取划分语块的特征信息划分,生成多层不同粒度的语块划分锚点信息,对双语词对之间进行局部定位,生成词对齐文件。本发明解决了传统方法规划路径多、复杂度高,难生成好的对齐结果,影响对齐效率的问题,本发明根据相关特征将汉英双语句子分割,完成不同粒度下的单元对齐,在各种粒度下将词对齐操作限制在相应的单元范围内。实验表明,该方法获得的词语对齐比GIZA++工具包词对齐错误率下降了28%,在该词对齐基础上的翻译结果BLEU打分比原始词对齐提高了20%,而且克服了GIZA++不能对超过100个单词的长句子进行很好的词语对齐的弊端。

著录项

  • 公开/公告号CN101482861B

    专利类型发明专利

  • 公开/公告日2011-06-01

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN200810055783.8

  • 发明设计人 宗成庆;周玉;何彦青;

    申请日2008-01-09

  • 分类号

  • 代理机构中科专利商标代理有限责任公司;

  • 代理人梁爱荣

  • 地址 100080 北京市海淀区中关村东路95号

  • 入库时间 2022-08-23 09:07:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-06-01

    授权

    授权

  • 2009-09-09

    实质审查的生效

    实质审查的生效

  • 2009-07-15

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号