1 绪 论
1.1 研究背景
1.2 研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.2.3 现状评述
1.3 研究目的与意义
1.4 本文组织结构
1.5 本章小结
2 相关技术分析
2.1 健康医疗大数据
2.1.1 健康医疗大数据概述
2.1.2 健康医疗大数据典型特征
2.1.3 健康医疗大数据的来源与分类
2.2.1 中文分词概述
2.2.2 中文分词算法
2.2.3 中文分词意义
2.3.1 数据集成概述
2.3.2 数据集成方法
2.3.3 数据集成意义
2.4 本体
2.4.1 本体概述
2.4.2 本体描述语言---网络本体语言
2.4.3 本体构建
2.4.4 本体库作用
2.5 元数据
2.6 本章小结
3 医疗文本信息抽取方法研究
3.1 医疗文本数据分析
3.2 传统的医疗文本信息抽取
3.3 改进的医疗文本信息抽取方法
3.3.1 改进的基于词典的医疗文本分词算法
3.3.2 面向医疗文本的中文分词特征标注
3.3.3 基于多特征融合的命名实体识别方法
3.4.1 实体识别评价指标
3.4.2 双向最大匹配分词对比分析
3.4.3 多特征融合实验及结果分析
3.5 本章小结
4 基于分布式本体的医疗异构数据集成模型构建
4.1 基于分布式本体的医疗异构数据集成框架
4.2 医疗局部本体匹配映射
4.2.1 相似度影响因素分析
4.2.2 改进的医疗局部本体相似度计算
4.3 基于医疗领域的局部本体构建
4.4 MSA相似度检测算法
4.5 基于医疗领域的全局本体构建
4.6 医疗异构数据集成流程
4.7 本章小结
5 相关实验与结果分析
5.1 医疗局部本体构建实例
5.2 基于医疗本体的综合相似度算法对比分析
5.3 MSA相似度检测算法对比分析
5.4 医疗全局本体构建实例
5.5 本章小结
6 总结与展望
6.1 本文工作总结
6.2 未来工作展望
参考文献
附录
A. 作者在攻读硕士学位期间发表的论文
B. 学位论文数据集
致谢
重庆大学;