首页> 中国专利> 一种基于深度学习和知识图谱的患者画像方法及系统

一种基于深度学习和知识图谱的患者画像方法及系统

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开一种基于深度学习和知识图谱的患者画像方法及系统，包括：获取患者医疗数据；根据医学知识图谱对患者医疗数据进行分词，对每个词进行向量化后，构建词向量矩阵；将词向量矩阵采用预先训练的深度学习模型得到患者标签；根据患者标签完成对患者的画像。基于患者医疗数据和医学知识图谱计算患者的疾病标签，根据患者疾病标签完成患者画像，在辅助诊疗、用药推荐等应用中，能够辅助医生快速定位患者病情。

著录项

公开/公告号CN112837769A

专利类型发明专利
公开/公告日2021-05-25

原文格式PDF
申请/专利权人山东众阳健康科技集团有限公司;
展开▼

申请/专利号CN202110038673.6
发明设计人樊昭磊;吴军;李涛;何云威;王雷;孙钊;
展开▼

申请日2021-01-12
分类号G16H10/60(20180101);G16H20/10(20180101);G16H50/20(20180101);G06F16/35(20190101);G06F16/36(20190101);G06N3/04(20060101);G06N3/08(20060101);
代理机构37221 济南圣达知识产权代理有限公司;
代理人李琳
地址 250000 山东省济南市高新区新泺大街1166号奥盛大厦一号楼12层
入库时间 2023-06-19 11:05:16

说明书

技术领域

本发明涉及医疗大数据技术领域，特别是涉及一种基于深度学习和知识图谱的患者画像方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

目前，随着人们对生命健康的不断重视和医院日益增长的患者治疗成本，医生需要快速了解临床患者的病情，但是由于医生工作量巨大，与患者交流时间短，不能很全面的了解患者的实际病情，这就导致对患者采取的治疗方案不一定是最佳方案，很容易造成医患纠纷。

当前国家和医院对院内信息化建设投入持续加大，院内各信息化系统功能不断完善，系统存储的患者人口数据和医疗数据不断增长，庞大的规模为医疗数据的分析挖掘提供了保障。

知识图谱是指将知识以三元组形式组织，利用图结构进行存储的形式，最初是Google用来改进搜索引擎的体验，由于其存储的高效性、天然的关系链接以及易于推理的特性被不断用于各个行业。在医疗行业，医学知识图谱主要是用于存储医学知识；患者画像即对患者打标签，利用数据中心的人口信息、门诊、住院、体检医疗数据、公卫慢病信息等数据，通过算法抽取患者的特征，建立患者的标签模型，通过画像技术，医疗人员可以通过标签快速全面了解患者病情，给与最佳治疗方案，提高医生工作效率。

但是，发明人发现，现有技术仍存在着缺陷和不足，目前的画像技术主要应用场景为互联网、电商等，利用用户的网上注册信息和线上行为为用户画像，但不适用于医疗场景，主要有以下几个问题：(1)精度不准，为患者画像是为了使得医生可以提供更精准的治疗方案，对患者标签的准确性有更高要求；(2)现有画像只是单纯考虑用户的行为，而患者的画像需要考虑各种维度，如个人信息、区域环境、疾病发展情况、患者心理状态等，各种数据需要全程参与，才能不断完善患者标签体系，为医生治疗方案提供参考；(3)现有技术基本是基于特征的选择，这种方法没有考虑先后顺序，缺少了语义之间的联系。

发明内容

为了解决上述问题，本发明提出了一种基于深度学习和知识图谱的患者画像方法及系统，基于患者医疗数据和医学知识图谱计算患者的疾病标签，根据患者疾病标签完成患者画像，在辅助诊疗、用药推荐等应用中，能够辅助医生快速定位患者病情。

为了实现上述目的，本发明采用如下技术方案：

第一方面，本发明提供一种基于深度学习和知识图谱的患者画像方法，包括：

获取患者医疗数据；

根据医学知识图谱对患者医疗数据进行分词，对每个词进行向量化后，构建词向量矩阵；

将词向量矩阵采用预先训练的深度学习模型得到患者标签；

根据患者标签完成对患者的画像。

第二方面，本发明提供一种基于深度学习和知识图谱的患者画像系统，包括：

数据获取模块，被配置为获取患者医疗数据；

数据处理模块，被配置为根据医学知识图谱对患者医疗数据进行分词，对每个词进行向量化后，构建词向量矩阵；

标签计算模块，被配置为将词向量矩阵采用预先训练的深度学习模型得到患者标签；

画像模块，被配置为根据患者标签完成对患者的画像。

第三方面，本发明提供一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成第一方面所述的方法。

第四方面，本发明提供一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述的方法。

与现有技术相比，本发明的有益效果为：

本发明的基于深度学习和知识图谱的患者画像方法及系统中，基于患者医疗数据和医学知识图谱计算患者的疾病标签，加入医学知识图谱使画像结果更权威，更准确。

本发明基于深度学习和知识图谱的患者画像方法及系统中，利用医学知识图谱和患者医疗数据对深度学习模型进行多轮训练学习，该深度学习模型可以结合数据的语义层面，使画像结果更加准确。

本发明基于知识图谱和深度学习的患者画像方法和系统应用于医疗行业，通过分析患者标签，在辅助诊疗应用上，辅助医生快速定位患者病情，提供最佳治疗方案，提高医生工作效率，缓解医患紧张关系；或在精准推荐应用上，针对肿瘤，依据个性化标签精准推荐用药、检查检验等；或在质控管理应用上，实现用药合理性、检查检验性等。

本发明基于深度学习和知识图谱的患者画像方法及系统中，提供的系统接口对硬件要求不高，相应速度快，满足临床使用的实时性要求。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例1提供的基于深度学习和知识图谱的患者画像方法流程图；

图2为本发明实施例1提供的词向量矩阵构建示意图；

图3为本发明实施例1提供的基于深度学习和知识图谱的患者画像系统框架图。

具体实施方式：

下面结合附图与实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例1

如图1所示，本实施例提供一种基于深度学习和知识图谱的患者画像方法，包括：

S1：获取患者医疗数据；

S2：根据医学知识图谱对患者医疗数据进行分词，对每个词进行向量化后，构建词向量矩阵；

S3：将词向量矩阵采用预先训练的深度学习模型得到患者标签；

S4：根据患者标签完成对患者的画像。

所述步骤S1中，患者医疗数据包括但不限于：人口学基本信息、健康档案信息和门诊和住院信息等各种人口医疗结构化和非结构化数据；

所述人口学基本信息包括：性别、年龄、住址、籍贯等；

所述健康档案信息包括：慢病、过敏史、家族史、遗传史等信息；

所述门诊和住院信息包括：诊断、检查、检验、用药、手术、护理等信息。

所述步骤S1中，由于数据来源不统一，造成数据的格式、长度、结构等各种信息不相同，所以本实施例对患者医疗数据进行预处理，所述预处理包括：

对医疗数据的数据清洗、缺失值处理、术语标准化、非结构化数据处理等。

在本实施例中，还包括对医学知识图谱的构建：获取医学知识，采用三元组形式，将医学知识进行结构化，并存储至图数据库中，并将各个医学实体类型之间的关系进行标准化，以用于确定标签，完成医学知识图谱的构建；

例如，(冠心病，症状，胸痛)，(胸痛，性质，绞痛)......,N个三元组组成医学知识图谱；知识图谱的构建本质上是医疗标签体系的构建，例：患者有冠心病，则冠心病是该患者的一个疾病标签。

优选地，所述医学知识包括疾病、症状、体征、手术、伴随症状、症状属性、检查、检验、药品等。

在本实施例中，所述步骤S2对画着医疗数据的数据处理，具体包括：

S2-1：分词处理：将患者医疗文本数据利用最大匹配进行分词，由医学知识图谱提供词库，设词库中词的最大长度为n，首先选取患者医疗文本的前n个字，判断选取的词是否在词库中命中，如果命中，则进入下一次分词，剩余文本＝总文本-n；如果未命中，令n＝n-1，重复上述过程，直至文本中所有的词被分完。

S2-2：构建词向量：分词完成后，对每个词采用word2vec进行向量化，将自然语言进行数值化，构建词向量矩阵；定义向量维度为5，例如“胸痛”表示为[0,0,1,0,0]，即1天前出现无明显诱因，胸痛呈绞痛，映射为一个二维矩阵，如图2所示。

所述步骤S3中，采用预先训练的深度学习模型，结合患者的医疗数据和医学知识图谱，对词向量矩阵进行卷积、最大池化以及分类计算；具体为：

S3-1：卷积计算：输入词向量矩阵D

然后对词向量矩阵进行移动窗口的平滑处理，将得到新的词向量矩阵D

重复上述计算过程，直到词向量矩阵滑动到最后，最终得到输出f＝[s

S3-2：最大池化计算：对卷积计算得到的输出f的最大值max{s

S3-3：分类计算：对池化层的输出向量F进行softmax分类，最终得到标签的概率，如{“胸痛”：1，“绞痛”：1，...}；分类后的标签结合知识图谱可以确定标签类型，以此完成患者画像；

患者的标签包括但不局限于：疾病、症状、体征、手术、药品、检查、检验、性别、区域、过敏源等；根据患者的多分类标签，完成患者画像。

在本实施例中，还包括针对上述自动归类的标签，提供患者标签调整方法，以对标签进行确认修正，使得患者的画像更加精准。

在本实施例中，还包括对于已经确认标签的患者画像进行患者画像的统计管理，包括按标签进行统计分析、利用标签进行数据挖掘、精准医疗推荐、大屏可视化等；

另外，对于不同级别的医生分配不同的画像权限，例如主治医生只能查看自己管理患者的画像，主任医生可以查看科室所有患者的画像，并根据权限进行修改调整，方便患者标签的管理。

实施例2

本实施例提供一种基于深度学习和知识图谱的患者画像系统，包括：

数据获取模块，被配置为获取患者医疗数据；

数据处理模块，被配置为根据医学知识图谱对患者医疗数据进行分词，对每个词进行向量化后，构建词向量矩阵；

标签计算模块，被配置为将词向量矩阵采用预先训练的深度学习模型得到患者标签；

画像模块，被配置为根据患者标签完成对患者的画像。

如图3所示，在该患者画像系统的数据来源层，获取患者医疗数据，包括但不限于健康档案、门诊数据、住院数据、体检数据等各种人口医疗结构化和非结构化数据。

由于数据来源不统一，造成数据的格式、长度、结构等各种信息都不相同，所以在数据预处理层对患者医疗数据进行数据预处理，包括数据的清洗过滤、结构化和标准化的处理流程。

数据预处理完成后，该系统通过患者画像算法对患者进行打标签，通过分词向量化、卷积计算、最大池化和softmax分类以及结合医学知识图谱计算患者标签；得到患者标签后，医生可以通过画像调整模块确认患者画像结果，同时还可以通过权限管理对不同级别用户分配不同的权限，利用患者标签也可以进行数据分析和挖掘等；具体地：

画像调整模块针对系统自动归类的标签提供确认修正功能，使得患者的画像更加精准；

权限管理模块，对于不同级别的医生分配不同的画像权限，完成对患者画像权限的控制；

统计管理模块，对于已经确认标签的患者画像进行患者画像的统计管理，包括按标签进行统计分析、利用标签进行数据挖掘、精准医疗推荐、大屏可视化等。

在本实施例中，所述患者画像系统通过网络请求提供对外接口，各个系统可以通过接口访问实时对患者地画像；其中，患者画像接口模块包括WebAPI和WebService。

本实施例基于知识图谱和深度学习的患者画像方法和系统主要应用于医疗行业，通过基于患者画像，分析患者标签，在辅助诊疗应用上，辅助医生快速定位患者病情，提供最佳治疗方案；或在精准推荐应用上，针对肿瘤，依据个性化标签精准推荐用药、检查检验等；或在质控管理应用上，实现用药合理性、检查检验性等。

在更多实施例中，还提供：

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例1中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例1中所述的方法。

实施例1中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于深度学习和知识图谱的患者画像方法及系统 [P] . 中国专利： CN112837769A . 2021-05-25
2. 一种基于用户画像和知识图谱的股票风险预测方法及系统 [P] . 中国专利： CN112734569A . 2021-04-30
3. A METHOD FOR PROVIDING MULTI-USER GAMING SERVICES BASED ON KNOWLEDGE MAPS AND AN APPARATUS USING IT [P] . 韩国专利： KR20180097853A . 2018-09-03

机译：一种基于知识图谱的多用户游戏服务提供方法及其装置
4. RNA- A deep-learning based system for evaluating the RNA-guided nuclease activity using deep-learning [P] . 韩国专利： KR20190048926A . 2019-05-09

机译： RNA-一种基于深度学习的系统，用于通过深度学习评估RNA引导的核酸酶活性
5. RNA- A deep-learning based system for evaluating the RNA-guided nuclease activity using deep-learning [P] . 韩国专利： KR102029197B1 . 2019-10-08

机译： RNA-一种基于深度学习的系统，用于通过深度学习评估RNA引导的核酸酶活性