首页> 中文学位 >链接数据中关系紧密度的分析与评估
【6h】

链接数据中关系紧密度的分析与评估

代理获取

目录

第一个书签之前

展开▼

摘要

随着语义网的不断发展,链接数据作为一种结构化数据模型正在得到广泛的应用。对链接数据中的关系进行紧密度分析可以对链接数据中各个关系的重要程度和实体之间的关联性有一个直观的了解。关系紧密度是指链接数据中的关系相对于相关实体的重要程度。目前还没有专门的工作对链接数据中关系紧密度进行研究,所以本文提出利用维基百科来进行关系紧密度分析。论文的工作包括: (1)本文提出了一种利用维基百科来分析链接数据中关系紧密度的方法,该方法首先将链接数据中的关系映射到PATTY中的关系上,PATTY中包含从维基百科中抽取的关系以及这些关系对应的维基百科实例;接着再通过PATTY中的实例找到关系在维基百科中对应的页面;最后利用维基百科页面中的特征来分析链接数据中关系紧密度。 (2)本文提出了一种关系消歧方法,解决了链接数据中的关系映射到PATTY时候选关系可能存在歧义的问题。该方法将文本相似性、关系流行度、类别关联度作为特征项并构成特征向量作为输入,将关系消歧问题作为一种特殊的二分类问题,利用决策树来进行消歧。 (3)本文提出了两种关系紧密度分析方法:首先为基于关系所在位置的启发式规则方法,其次为基于随机游走的RelationRank方法。基于关系所在位置的启发式规则方法利用关系出现在维基百科位置进行建模,从而来分析链接数据中关系紧密度。基于随机游走的RelationRank方法利用随机游走模型来计算关系在整个维基百科页面中的重要程度从而进行关系紧密度分析。 本文使用了真实的链接数据对本文提出的方法进行了验证,实验结果表明本文提出的链接数据关系紧密度分析方法是有效的,且基于随机游走的RelationRank方法优于基于关系所在位置的启发式规则方法。本文工作为链接数据中关系紧密度的研究提供了一个新的思路和方法,能够帮助人们直观了解链接数据中实体之间的关系。

著录项

  • 作者

    刘晗潇;

  • 作者单位

    东南大学;

  • 授予单位 东南大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 李慧颖,彭艳兵;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    链接; 数据; 关系; 紧密度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号