首页> 中文期刊> 《中文信息学报》 >HowNet义原标注一致性检验方法研究

HowNet义原标注一致性检验方法研究

         

摘要

义原(sememe)被定义为人类语言中不可再分的最小语义单位.一个词语的意义可以由多个义原的组合来表示.以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务.但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证.因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务.该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法.实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充.

著录项

  • 来源
    《中文信息学报》 |2021年第4期|23-34|共12页
  • 作者单位

    清华大学 计算机科学与技术系 北京 100084;

    清华大学 人工智能研究院 北京 100084;

    清华大学 智能技术与系统国家重点实验室 北京 100084;

    清华大学 计算机科学与技术系 北京 100084;

    清华大学 人工智能研究院 北京 100084;

    清华大学 智能技术与系统国家重点实验室 北京 100084;

    清华大学 计算机科学与技术系 北京 100084;

    清华大学 人工智能研究院 北京 100084;

    清华大学 智能技术与系统国家重点实验室 北京 100084;

    清华大学 计算机科学与技术系 北京 100084;

    清华大学 人工智能研究院 北京 100084;

    清华大学 智能技术与系统国家重点实验室 北京 100084;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    义原标注; HowNet; 一致性检验;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号