首页> 中文学位 >基于迭代方法的命名实体关系抽取技术研究
【6h】

基于迭代方法的命名实体关系抽取技术研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

第一节研究的目的和意义

第二节选题的背景

第三节文献综述

第四节研究方法

第五节论文结构安排

第二章相关方法介绍

第一节命名实体相关概念

第二节命名实体关系

第三节信息抽取相关概念

2.3.1信息抽取基本概念

2.3.2信息抽取的主要任务

2.3.3信息抽取的发展历史

第四节命名实体关系抽取技术

2.4.1基于知识库的抽取算法

2.4.2基于特征向量的机器学习算法

2.4.3基于模式的Bootstrapping算法

第三章实体关系抽取算法及模型

第一节实体关系抽取主要算法框架

第二节命名实体识别算法

3.2.1组织机构名的内部构成

3.2.2机构专名、饰名、后缀的获取

3.2.3机构名识别

3.2.4机构名简称动态识别

第三节候选实体对的提取

3.3.1提取数据

3.3.2筛选数据

第四节扩展三元关系实体对

3.4.1机构实体扩展

3.4.2人物实体扩展

3.4.3迭代操作

3.4.4迭代方法总结

第四章命名实体特定关系检索查询系统实现

第一节关系抽取检索查询系统设计

第二节模块实现

4.2.1词性标注

4.2.2句子切分

4.2.3命名实体识别

4.2.4候选关系生成

4.2.5关系扩展

4.2.6关系存储

第三节运行实例

第五章总结与展望

第一节本文总结

第二节展望

致谢

参考文献

个人简历

展开▼

摘要

随着互联网的普及,信息的数量与日俱增,人们需要从海量的信息中提取真正需要的信息,信息抽取的研究正是在这种背景下产生的。信息抽取的主要目的是将无结构的文本转化为结构化或半结构化的信息,并以数据库的形式存储,供用户查询以及进一步分析利用。 信息抽取的基本任务包括命名实体识别和实体关系抽取。其中命名实体识别是实体关系抽取的基础,实体关系抽取是事件发现和多种应用系统的基础。实体关系抽取的任务是寻找并判定实体对之间存在的特定关系。当前主要的抽取技术可分为基于知识库的抽取算法、基于特征向量的机器学习算法、基于核函数的机器学习算法、基于模式的Bootstrapping算法。 本文的工作在命名实体识别的基础上重点研究了实体关系抽取技术并实现了一个实验性的实体关系抽取系统。通过深入分析关系抽取技术的重点和难点以及现有技术的特点和不足,设计实现了特定关系抽取检索查询系统。本文的主要工作体现在以下几个方面: 1)命名实体识别算法:作为关系抽取的前续工作,命名实体识别是本文工作的一个重要组成部分。本文的命名实体识别算法重点针对机构实体的识别,采用字典结合规则的方式,其中利用互信息原理对机构名简称进行识别,具有很高的准确率。 2)特定关系抽取及三元命名实体扩展算法:根据规则提取了某类特定实体关系,并对提取到的实体采用规则加迭代方式进行了关系扩展,具有很好的效果。 3)命名实体特定关系检索查询系统实现:本文介绍的命名实体特定关系检索查询系统采用模块化设计,总共包括六个主要的功能模块。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号