首页> 中文学位 >双语开放链接模式的匹配技术研究
【6h】

双语开放链接模式的匹配技术研究

代理获取

目录

声明

摘要

图目录

表目录

缩略词表

第一章 绪论

1.1 研究背景

1.2 相关研究现状

1.3 研究内容

1.4 本文结构安排

第二章 背景知识

2.1 本体匹配

2.1.1 本体匹配的定义

2.1.2 本体匹配面临的问题

2.1.3 通用的本体匹配方案

2.2 双语本体匹配

2.3 开放链接数据与开放链接模式

2.3.1 开放链接数据

2.3.2 开放链接模式

第三章 双语开放链接模式的匹配问题

3.1 问题定义

3.1.1 模式层信息

3.1.2 双语开放链接模式的匹配

3.2 关键问题

第四章 双语开放链接模式的匹配算法

4.1 算法流程

4.1.1 模式信息的匹配算法

4.1.2 两类别的匹配判定算法

4.2 基于字典的相似度

4.3 基于结构的相似度

4.4 基于属性的相似度

4.4.1 类别的属性

4.4.2 基于属性的相似度

4.5 基于实例的相似度

4.5.1 基于属性取值集合的方法

4.5.2 基于实例抽取的方法

4.6 基于机器学习的方法

第五章 实验与评估

5.1 测试数据准备

5.1.1 数据获取

5.1.2 模式构建

5.1.3 数据统计

5.2 匹配实验

5.2.1 字典构建

5.2.2 模型训练

5.2.3 数据集发布与质量评估

5.3 对比实验与结果分析

第六章 总结与展望

6.1 工作总结

6.2 未来展望

致谢

参考文献

攻读硕士学位期间科研成果

展开▼

摘要

模式信息在语义网领域一直扮演着十分重要的角色,在单语言环境中,模式信息已经获得了广泛的研究和应用。然而,跨语言的模式信息链接虽然也能够在很多场景中获得应用,但对它的研究依旧显得不足,而且现有的跨语言信息匹配技术很难直接用于它的构建。
  基于以上现状,本文对双语开放链接模式的匹配技术进行了研究。具体来说,主要包含以下三点内容:
  1.研究双语类别之间相似度的评价方法。这是整个匹配问题的基础,本文提出了基于字典的相似度,基于结构的相似度,基于属性的相似度和基于实例的相似度四类方法。其中基于字典的方法解决了匹配的语言障碍,其他三类方法利用不同的类别描述信息从不同的维度对类别间的相似度进行了评价。
  2.研究基于机器学习的类别之间匹配的判定算法。本文尝试了逻辑斯谛回归,决策树,多层感知机三种机器学习的模型来综合上面所述的各种相似度评价方法,并对不同的模型进行了对比分析。
  3.研究匹配结果的评价方法。由于缺少黄金准则,对结果的评价是一个难点。最终本文采用了随机抽样加人工投票的方式对匹配结果进行了准确度分析,还将本算法与其他算法进行了对比实验,分析了准确度与覆盖度。
  总体来说本文提出了一个双语开放链接模式的匹配算法,其中基于属性和基于实例的相似度评价方法对实例信息的利用深入到了“属性”与“属性值”两个更细的粒度,使得双语信息匹配环境中实例的重合程度较低的问题得到了解决,这是本文的主要创新点。
  除了对匹配算法本身的研究之外,本文还对包括模式信息获取,构建和匹配在内的双语开放链接模式数据集的构建方法进行了探讨,最后成功构建并发布了电子商务和在线百科两个分领域的数据集。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号