首页> 中文学位 >面向突发事件的因果关系识别
【6h】

面向突发事件的因果关系识别

代理获取

目录

声明

摘要

插图或附表清单

1绪论

1.1课题来源

1.2研究背景和意义

1.3国内外研究现状和相关工作

1.4主要研究内容

1.5论文的组织结构

2面向突发事件的因果关系识别概述

2.1事件

2.1.1事件研究概述

2.1.2事件相关概念

2.2事件关系

2.2.1事件关系研究概述

2.2.2事件关系相关定义

2.3事件因果关系

2.3.1因果关系本质

2.3.2事件因果关系定义

2.4 CEC语料库

2.4.1 CEC 1.0语料库

2.4.2 CEC 2.0语料库

2.5事件触发词同义词表的构建

2.6面向突发事件的因果关系识别研究路线

2.7本章小结

3基于最大熵模型的突发事件同指消解

3.1突发事件同指消解概述

3.2最大熵模型

3.2.1最大熵模型介绍

3.2.2最大熵模型求解最优化算法

3.3基于最大熵模型的突发事件同指消解方法

3.3.1同指指代链标识

3.3.2特征选择

3.3.3最大熵模型的训练

3.3.4最大熵模型的测试

3.4实验结果和分析

3.5本章小结

4基于LSP的事件因果关系识别

4.1事件因果关系识别思路

4.2 LSP关系模式抽取

4.3事件因果关系模式候选集选择

4.3.1初始候选事件对因果关联度计算

4.3.2词汇模式候选集选择

4.3.3句法模式候选集选择

4.4突发事件因果关系识别

4.5实验与分析

4.5.2实验结果与分析

4.6本章小结

5总结与展望

5.1总结

5.2展望

参考文献

致谢

作者简介及读研期间主要科研成果

展开▼

摘要

信息网络的高速发展为共享平台带来了每日数以亿万计的事件和话题内容,事件作为信息的一个重要表述类型,面向事件的研究得到越来越多人的重视,事件之间是存在着本质的内在联系的,这种内在联系体现了事件间存在的多种深层语义关系,而其中最为重要的关系即为事件因果关系。事件因果关系识别,有望为面向事件的知识表示、信息检索和自动问答系统等自然语言处理领域的相关应用提供技术支持,对突发事件文本的语义理解具有重要的研究意义。  目前,有关识别事件因果关系的方法多集中于模式匹配和统计的机器学习方法。基于模式匹配的方法针对有显示关联词的显示因果关系识别效果较好,但对应于隐式因果关系的识别效果较差,该方法通用性不强。而基于统计的机器学习方法需要预先标注训练语料库,并且对特征具有一定的依赖性,通常识别效果随着语料规模增大而越好。针对上述问题,本文将提出一种基于LSP方法的事件因果关系识别,该方法在单一的事件对匹配基础上增加了句法模式匹配来增强因果事件对的识别效果,减少了对文本语料规模的依赖。主要内容和创新点包括:  (1)基于最大熵模型的事件同指消解  事件因果关系识别过程中,相同的事件触发词有可能由于没有指向同一实体,而被误判在因果事件对中,这时候往往需要对相同的触发词进行同指事件的判别,来帮助提升事件抽取过程中的性能。针对突发事件新闻文档密度高,同类别新闻语言风格相似的特点,提出基于最大熵模型的事件同指消解方法。该方法首先将人工标注的同指事件对象作为同指消解的正例和反例,分别训练正、反例的权重值,并根据事件的特点对事件要素进行分析,对文档提取语义、距离、关键词等方面的特征;然后,利用不同的特征组合循环迭代,训练最大熵模型;最后利用此模型对测试语料中待消解事件对进行计算来完成事件同指消解。  (2)基于LSP的事件因果关系识别  在最大熵模型的事件同指消解基础上,提出了一种基于LSP事件因果关系识别的方法。首先基于CEC2.0语料库通过结合事件触发词、事件要素以及关联词,从文本语义和句法结构入手,利用CEC语料现有的标注信息在训练语料中抽取LSP模式;然后通过统计方法分别对抽取的词汇、句法模式结合因果关系共性特征进行关联强度计算来得到LSP候选集;最后通过候选集在测试语料中进行模式匹配,并对匹配出来的事件对进行计算,使大于阈值的事件对为因果关系事件对,以此来实现对突发事件因果关系的识别。实验证明,基于LSP的事件因果关系识别方法在识别效率上与其它的方法相比有较大的提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号