首页> 中文学位 >面向语义异构的健康医疗数据集成模型研究
【6h】

面向语义异构的健康医疗数据集成模型研究

代理获取

目录

1 绪 论

1.1 研究背景

1.2 研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.2.3 现状评述

1.3 研究目的与意义

1.4 本文组织结构

1.5 本章小结

2 相关技术分析

2.1 健康医疗大数据

2.1.1 健康医疗大数据概述

2.1.2 健康医疗大数据典型特征

2.1.3 健康医疗大数据的来源与分类

2.2.1 中文分词概述

2.2.2 中文分词算法

2.2.3 中文分词意义

2.3.1 数据集成概述

2.3.2 数据集成方法

2.3.3 数据集成意义

2.4 本体

2.4.1 本体概述

2.4.2 本体描述语言---网络本体语言

2.4.3 本体构建

2.4.4 本体库作用

2.5 元数据

2.6 本章小结

3 医疗文本信息抽取方法研究

3.1 医疗文本数据分析

3.2 传统的医疗文本信息抽取

3.3 改进的医疗文本信息抽取方法

3.3.1 改进的基于词典的医疗文本分词算法

3.3.2 面向医疗文本的中文分词特征标注

3.3.3 基于多特征融合的命名实体识别方法

3.4.1 实体识别评价指标

3.4.2 双向最大匹配分词对比分析

3.4.3 多特征融合实验及结果分析

3.5 本章小结

4 基于分布式本体的医疗异构数据集成模型构建

4.1 基于分布式本体的医疗异构数据集成框架

4.2 医疗局部本体匹配映射

4.2.1 相似度影响因素分析

4.2.2 改进的医疗局部本体相似度计算

4.3 基于医疗领域的局部本体构建

4.4 MSA相似度检测算法

4.5 基于医疗领域的全局本体构建

4.6 医疗异构数据集成流程

4.7 本章小结

5 相关实验与结果分析

5.1 医疗局部本体构建实例

5.2 基于医疗本体的综合相似度算法对比分析

5.3 MSA相似度检测算法对比分析

5.4 医疗全局本体构建实例

5.5 本章小结

6 总结与展望

6.1 本文工作总结

6.2 未来工作展望

参考文献

附录

A. 作者在攻读硕士学位期间发表的论文

B. 学位论文数据集

致谢

展开▼

摘要

随着医疗卫生信息化建设不断深入,数字化改造使得各类医疗信息管理系统所维护的医疗数据呈爆炸性增长,预计到2025年医疗数据量将超过10ZB,当前医疗信息化工作已经在绝大多数医院内全面开展并已略见成效,而其中实现数据互通的医院却不到3%。即各系统产生的数据彼此独立,难以在系统之间交流共享,“数据孤岛”现象日益严重。因此通过多源异构医疗数据集成逐步实现医疗机构内以及机构之间的数据共享,成为实现医疗信息化建设的关键。  不同于其他行业的信息系统的数据集成,医疗卫生领域交叉学科类型众多,涉及到的专业内容繁杂,数据集成难度更大,存在系统更新同步困难、表达各异、交换方式复杂、以及非结构化数据难以有效利用等问题,使得现阶段采用传统ETL工具支持的数据仓库技术进行医疗数据集成很难满足医疗需求。本文立足智慧医院建设中的数据集成过程,针对现有数据集成待解决问题展开相关研究工作,主要有:  ①为解决医疗文本信息抽取问题,提出基于双向最大匹配的医疗文本分词技术的算法,设计出更加适合医疗领域的实体抽取组合;  ②为防止语义异构现象,提出基于本体的综合相似度算法和MSA相似度检测算法,屏蔽因为片面评价而遗漏的语义异构问题,提高匹配准确性;  ③为提高数据仓库集成质量,结合待集成的医疗异构数据特点和医疗机构的业务数据需求,构建面向医疗领域的分布式本体概念模型,解决医疗数据异构问题,指导ETL工作,完成医疗数据仓库的搭建。  综上,本文主要针对智慧医院建设中的数据集成阶段进行相关技术的研究与改进。结合中文分词相关技术,制定基于医疗文本的命名实体识别方案进行医疗文本数据信息的提取,改善医疗文本信息的存储和集成效率。整合各个业务系统的医疗数据,结合本体理论和相关映射算法,使医疗数据集成更加高效准确,方便各业务系统之间异构数据交互共享。优化智慧医院数据集成过程,为院内辅助诊疗、疾病预测、决策分析等多种业务需求提供数据支撑,同时提高医疗数据资源管理共享效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号