首页> 中国专利> 基于事件的中文指代语料库构建方法

基于事件的中文指代语料库构建方法

摘要

本发明涉及一种基于事件的中文指代语料库构建方法。本方法主要包括以下几个步骤:(1)选择CEC2.0语料库作为构建基础,(2)确定指代标注的目标以及标注方式,(3)根据具体的指代目标制定相应的标注规范,(4)CEC2.0语料文本预处理,(5)自动标注事件要素以及事件指代,(6)通过人工标注进一步优化标注结果,(7)设定一致性检验步骤,确保语料标注的质量。本发明克服了现有的指代消解语料库的缺陷。该方法不但可以覆盖语料库中的所有事件,而且是建立在中文句法分析和语义分析基础之上的,符合中文的特点,该方法还能够对标注后的语料进行一致性检查,以保证语料标注质量。

著录项

  • 公开/公告号CN106897364B

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 上海大学;

    申请/专利号CN201710020573.4

  • 发明设计人 张亚军;刘宗田;李强;周文;刘炜;

    申请日2017-01-12

  • 分类号G06F16/36(20190101);G06F40/30(20200101);

  • 代理机构31205 上海上大专利事务所(普通合伙);

  • 代理人何文欣

  • 地址 200444 上海市宝山区上大路99号

  • 入库时间 2022-08-23 11:32:41

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号