首页> 中文学位 >大规模生物医学语义关联数据集的查询关键技术研究
【6h】

大规模生物医学语义关联数据集的查询关键技术研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景

1.2研究目标和主要内容

1.3论文结构安排

第二章 相关工作综述

2.1 DBpedia及生物医学数据集介绍

2.2本体不一致检验及处理

2.3海量RDF数据存储

2.4基于RDF的生物医学数据相关工作

第三章 数据一致性检验

3.1 DBpedia本体扩展

3.2不一致推理规则

3.3基于MapReduce的推理算法

3.4结果分析

3.5本章小结

第四章 生物医学语义关联数据集查询功能的设计

4.1数据集关系挖掘

4.2语义查询问题的设计

4.3本章小结

第五章 生物医学语义关联数据集查询功能的实现

5.1数据装载

5.2查询功能的实现

5.3本章小结

第六章 总结与展望

6.1总结

6.2展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

近年来,大规模语义数据Linked Data数据量呈现爆炸式的增长,其中生物医学数据集占据了相当大的比例。由于这些数据集分散且仅提供了有限的查询功能,没有充分出挖掘数据集中的有效信息,给用户提供一套综合的应用方案。因此,将RDF语义和生物学意义结合起来,研究其语义查询问题有着重要的理论意义和工程应用价值。
  在详细分析DBpedia、SIDER、Diseasome、DailyMed和LinkedCT等11个数据集的基础上,研究开发了一个具有生物学意义的多数据集语义查询平台。为了保证RDF语义数据的一致性,设计基于MapReduce的不一致检验算法,对跨领域核心枢纽数据集DBpedia进行验证,得出不一致检验结果并给出解决方案;设计数据集关系挖掘算法,绘制出数据集关系图;通过对数据集之间关系的分析,提出了三种语义查询问题:查询疾病信息、根据疾病查询药物和查询药物副作用;以Cassandra作为底层储存库,在分布式条件下采用MapReduce方法完成数据的装载;采用路径查询理论给出了三种查询功能的算法设计和实现,实例查询结果展示了平台的有效性和优越性。
  基于大规模生物医学语义关联数据集研究开发的语义查询平台,充分利用了语义 Web相关技术,并与生物学意义相结合,为用户提供了一个实用且有效的查询平台,同时对于智能问题回答系统的构建也有一定的指导意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号