首页> 中文学位 >一种基于谱聚类的共指消解方法
【6h】

一种基于谱聚类的共指消解方法

代理获取

摘要

指代消解是自然语言处理中的一个基础性问题。指代消解在命名实体识别与跟踪、关系抽取、问题回答等任务中有着重要的作用。共指关系是指代关系中的等价关系,本文针对中文共指消解的具体任务,提出采用谱聚类的方法解决共指消解问题。
   本文所提出的基于谱聚类的共指消解方法通过两个步骤实现共指消解。首先采用最大熵分类器对待消解项对进行是否存在共指关系的分类,将分类结果的条件概率值作为待消解项对之间存在共指关系的概率。然后基于此概率值构造Laplacian矩阵,采用谱聚类算法对相应的矩阵求特征向量,从而将待消解项对适当的合并或拆分。最终形成实体类,实现共指消解。
   本文所采用的数据集是ACE2007中文语料,所采用的评测指标为ACE的评测工具计算得出的ACEValue和BCubed评测指标。
   本文还将谱聚类的算法与传递闭包、最近连接(ClosestLink)、最优连接(BestLink)、BellTree等已有的共指消解中的聚类算法进行比较,分析和对比各种聚类算法的特点。
   通过实验数据我们发现,谱聚类的方法在entitysubtype上通过适当的参数调整能从全局的角度进行实体类划分,ACEValue和BCubedF值分别达到了75.5%和82.0%,比上述常用的聚类算法中最好的性能分别高出0.6%和3.5%。但谱聚类的方法对于阈值和待消解项的类型较为敏感,因此,在不考虑类型的情况_卜其他聚类方法体现出了更好的效果。针对谱聚类算法自身存在的不足文章也进行了一定的讨论。
   最后,本文还对各种聚类算法阈值的自动生成进行了一些讨论,希望对今后进一步的工作有所帮助。

著录项

  • 作者

    谢永康;

  • 作者单位

    复旦大学;

  • 授予单位 复旦大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 吴立德;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 算法理论;
  • 关键词

    共指消解; 谱聚类; 最大熵;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号