首页> 中国专利> 用于临床情节的可视化分析的方法和系统

用于临床情节的可视化分析的方法和系统

摘要

本文提供了用于临床情节的可视化分析的方法和系统。所述方法包括:获得情节定义,其包括满足一个或多个约束的针对一实体的带时间戳的事件的序列;将情节定义转化成正式查询;对于多个实体从数据存储库中获得满足正式查询的匹配数据,其中对于实体中的每一个,匹配数据包括多个带时间戳的事件;对匹配数据执行时间模式挖掘,以便识别以阈值以上的支持度值在一组输入情节中发生的一个或多个事件子序列模式;将统计模式分析器应用于识别出的事件子序列模式,以便识别在识别出的事件子序列模式和结果度量之间的一个或多个相关性;以及将识别出的相关性中的一个或多个可视化,其中所述步骤中的至少一个由至少一个硬件设备执行。

著录项

  • 公开/公告号CN104573306A

    专利类型发明专利

  • 公开/公告日2015-04-29

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN201410529298.5

  • 发明设计人 D·H·格茨;A·佩雷尔;王飞;

    申请日2014-10-10

  • 分类号G06F19/00(20110101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人于静;杨晓光

  • 地址 美国纽约

  • 入库时间 2023-12-18 08:25:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-08

    未缴年费专利权终止 IPC(主分类):G06F19/00 授权公告日:20180123 终止日期:20181010 申请日:20141010

    专利权的终止

  • 2018-01-23

    授权

    授权

  • 2015-05-27

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20141010

    实质审查的生效

  • 2015-04-29

    公开

    公开

说明书

技术领域

本发明的实施例通常涉及信息技术,并且更特别地涉及可视化分析工具。

背景技术

随着时间的推移,患者的医疗状况会常常以复杂且看似不可预知的方式发展。此外,在患者群体内会常常观察到症状和诊断的变化,即使那些患者正在与相同的潜在疾病斗争。类似地,当临床医生致力于寻找产生所期望的患者结果的治疗计划时,他们可以使用一系列的疗程、药物治疗和其他介入治疗。

为此,科学家已经长期研究了护理和疾病进展中的变化如何导致不同的结果。该领域中的大多数正式研究常常使用随机对照试验(RCT)。尽管RCT的结果提供了统计的严密性并充当循证医学的“金标准”,但是实施RCT却是昂贵和耗时的。当致力于产生和探索新的假设时,这会使过程变得缓慢而繁琐。结果,研究人员已经开始利用存储在电子病历(EMR)系统中的观测数据的增长的存储库。例如,已经开发了许多平台来分析大量这种电子数据并使其可用于即兴分析(ad hoc analysis)。

使用观测数据实施的常见类型的回顾性研究是时间事件分析。该类型的调查将每个患者的病史表示为带时间戳的事件的序列。然后分析这些事件的时间特性(诸如序列和定时)以查看它们如何影响患者的最终结果。已经使用各种技术(从数据挖掘系统到基于交互式可视化的工具)以从这种临床事件序列数据获得洞察。

尽管已经证明该类基于挖掘和基于可视化的方法有用,但是这两者都受到显著的限制。首先,基于挖掘的方法常常识别频繁发生模式的短片断。然而,在其中发生这些模式的上下文通常会丢失。这使得难以回答许多有意义的问题,例如“模式通常在一个情节中的初期还是晚期出现?”以及“模式的重要性在一个情节的不同阶段是否改变?”

相反,基于可视化的方法可以从开始到结束示出情节,从而使围绕中间事件的上下文清楚。然而,可视化方法通常局限于在变得复杂到难以解释(如果不是无法解释的话)之前的小数量的事件或事件类型。

因此,存在着对改进的可视化分析技术的需要,所述可视化分析技术将基于挖掘和可视化的技术相结合以克服上面概述的局限性。

发明内容

在本发明的一个方面中,提供了将基于挖掘和可视化的技术相结合的用于可视化分析的技术。示例性的计算机实现的方法可以包括以下步骤:获得情节定义,该情节定义包括满足一个或多个约束的针对一实体的带时间戳的事件的序列,其中情节定义至少包括起始里程碑事件、结束里程碑事件和结果度量(outcome measure);将情节定义转化成正式查询;对于多个实体从数据存储库中获得满足正式查询的匹配数据,其中对于每个实体,匹配数据包括多个带时间戳的事件,所述多个带时间戳的事件至少包括起始里程碑事件和结束里程碑事件;对匹配数据执行时间模式挖掘,以便识别以阈值以上的支持度值在一组输入情节中发生的一个或多个事件子序列模式(event subsequence pattern);将统计模式分析器应用于识别出的事件子序列模式,以便识别在识别出的事件子序列模式和结果度量之间的一个或多个相关性,该一个或多个相关性提供给定的模式在预测情节结果方面的信息度的指示;以及将一个或多个识别出的相关性可视化,其中所述步骤中的至少一个由至少一个硬件设备执行。

根据本发明另外的方面,情节定义可选地包括里程碑事件、前提条件、结果度量和时间约束中的一个或多个。前提条件可以指定在起始里程碑之前必须满足的一个或多个约束。情节定义可以由用户交互式地指定。

根据本发明另外的方面,时间模式挖掘包括频繁模式挖掘。频繁模式挖掘可以应用于通过正式查询返回的总事件序列,以及应用于在序列里程碑事件之间发生的每个中间事件序列。

根据本发明另外的方面,可视化包括将群体概览、里程碑时间轴和挖掘模式图中的一个或多个可视化。示例性里程碑时间轴示出定义总情节的里程碑事件的序列。示例性挖掘模式图将反映正面和负面覆盖的一组两个轴可视化,并且可选地提供用于时间比较的动画。

本发明的另一个方面或其元素可以用有形地体现计算机可读指令的制造品的形式实现,其中所述计算机可读指令在被执行时使计算机执行本文所描述的多个方法步骤。此外,本发明的另一个方面或其元素可以以装置的形式实现,其中所述装置包括存储器和耦合到存储器并配置成执行所提到的方法步骤的至少一个处理器。此外,本发明的另一个方面或其元素可以以用于执行本文所描述的方法步骤或其元素的装置的形式来实现;所述装置可以包括硬件模块或者硬件和软件模块的组合,其中软件模块存储在有形计算机可读存储介质(或多个这种介质)中。

根据结合附图阅读的说明性实施例的以下详细描述,本发明的这些和其他目的、特征及优点将变得明显。

附图说明

图1示出包含本发明的方面的示例性可视化分析系统;

图2示出可以通过本发明处理的示例性情节;

图3A示出允许用户指定情节的示例性图形用户接口;

图3B示出示例性查询结果,其包括满足图3A中所示的示例性查询中体现的情节约束的匹配患者和事件序列;

图4是示出包含本发明的方面的模式挖掘模块的示例性实现的流程图;

图5是示出包含本发明的方面的交互式可视化模块的示例性实现的流程图;

图6A至6C示出针对心力衰竭患者的示例性可视化;

图7示出在实现本发明的一个或多个方面和/或元素中有用的示例性可视化分析系统。

具体实施方式

本发明的方面提供了改进的可视化分析技术,其将基于挖掘和可视化的技术相结合以克服上面概述的局限性。根据本发明的一个方面,提供了改进的可视化分析技术,其将下述相结合:用于交互式地指定情节定义的可视化情节查询工具,执行模式挖掘以帮助发现情节内的重要中间事件的按需数据分析,以及用于允许临床事件序列数据的交互式探索和分析的动态信息可视化能力。查询能力允许用户直观和快速地取回满足感兴趣的复杂临床情节的患者群体。所公开的可视化分析系统然后自动地利用事件模式挖掘算法以便发现所返回的群体内的重要事件。最后,本发明的另一方面提供了让用户回答一系列有趣问题的交互式可视化接口。所公开的交互式可视化技术识别影响结果的事件以及那些关联如何随时间改变。

尽管在示例性患者和临床情节的上下文中举例说明了本发明,如对本领域普通技术人员而言明显的是,本发明可以应用于其中需要可视化分析以结合基于模式挖掘和时间事件可视化的技术的任何上下文中。

图1示出包含本发明的方面的示例性可视化分析系统100。如图1所示,示例性可视化分析系统100包括可视化查询模块110、下面结合图4进一步讨论的模式挖掘模块400、和下面结合图5进一步讨论的交互式可视化模块500。如在下文中所讨论的,示例性可视化分析系统100提供用于创建情节约束的直观用户接口、并实现用于即兴事件序列分析的交互式工作流程。

如图1所示,从患者数据存储库105中取回与可视化查询模块110的可视化查询中所表达的情节定义匹配的患者数据、并将其传递给模式挖掘模块400。如下面结合图2进一步讨论的,在一个示例性实现中,首先对完整情节200执行挖掘。然后对中间情节执行相同的挖掘算法。如下面结合图2进一步讨论的,图1中所示的去往模式挖掘模块400的四个箭头对应于图2中的四个条目(完整情节200,和中间情节220-1、220-2、220-3)。最后,如图1所示,交互式可视化模块500允许用户探索结果。

可视化查询模块

示例性可视化查询模块110具有两个特征:(1)使得能够定义临床情节规范的易于使用的用户接口组件,以及(2)将情节规范(episodespecification)转换为可执行查询、并从临床数据仓库取回匹配患者数据的查询引擎。

图2示出可以通过本发明处理的示例性情节200。如本文所使用的,情节包括匹配特定约束集的个体患者的临床事件序列。例如,情节可以包括患者在最初的心绞痛发作和最终的心力衰竭诊断之间的所有事件。把定义哪些事件序列应当被认为是情节的规则表示为情节规范。有效的规范包括三个元素:(1)里程碑事件、(2)前提条件、和(3)结果度量。

每个情节规范200具有至少两个里程碑事件210-1和210-N以表示情节200的起始和结束。例如,在前面的示例中,心绞痛的发作是起始里程碑210-1,并且心力衰竭是结束里程碑210-N。另外,可以包括中间里程碑(诸如里程碑事件210-2和210-3)以对附加约束进行编码。例如,心律失常可以被包括作为中间里程碑210,以便仅考虑在心力衰竭之前遭受不规律心跳的患者。最后,可以包括时间间隙以保证时间约束(例如,在里程碑之间至少有两年)。

前提条件是在起始里程碑之前必须满足的一组约束(如果有的话)。例如,前提条件可以指定仅仅包括在心绞痛发作之前具有糖尿病的诊断的患者。

结果度量指定用于评估情节200的最终结果的方式。继续心力衰竭的示例,患者的结果度量可以是例如最终的心脏瓣膜置换疗程的存在。结果度量定义是情节规范中的关键因素,因为模式挖掘算法寻找情节内的具有与好(或差)结果的强相关性的事件模式。

图3A示出允许用户指定情节200的示例性图形用户接口300。通常,示例性图形用户接口300允许用户交互式地指定他们希望分析的情节的类型。示例性用户接口300包括与规范的三个部分中的每一个相对应的区域310、320、330,并且可选地提供查询面板的“添加事件”控制340和“添加间隙”控制345,以允许用户插入新的元素到规范中。拖放交互可选地允许用户对规范的元素重新排序或者在前提条件部分、里程碑部分和结果部分之间移动所述元素。

在一个示例性实施例中,一旦用户已经经由用户接口300完成情节规范的定义,则将可视化查询规范转化成例如用结构化查询语言(SQL)表示的正式查询,该正式查询从患者数据存储库105取回匹配的患者事件情节。通常,查询会返回具有满足情节规范的(按适当顺序的)事件的所有患者。除了转化成SQL的步骤以外,示例性可视化分析系统100独立于下层的数据源,从而允许数据源之间的轻松迁移。

图3B示出示例性查询结果350,其包括满足图3A中所示的示例性查询中体现的情节约束的匹配患者和事件序列。以这种方式,通过查询返回的数据包含其病历满足情节规范的患者的群体。如图3B所示,对于每个示例性患者(诸如患者360-1至360-3),取回事件(诸如事件370-1至370-3)的列表,所述事件包含所要求的里程碑事件210,其以规范的第一里程碑210-1开始且以最后里程碑210-N结束。如图2所示,总情节200可以在里程碑事件210处可选地再分为一系列中间情节,诸如中间情节220-1至220-3。因此,患者的事件列表还可选地包括在情节里程碑210之间发生的中间事件。事件的完整序列被称为总情节200。任何一对邻近里程碑210之间的中间事件的跨度被称为中间情节220。

时间模式挖掘

如先前所指出的,模式挖掘模块400执行时间模式挖掘。图4是示出包含本发明的方面的模式挖掘模块400的示例性实现的流程图。通常,示例性模式挖掘模块400首先对总情节200执行频繁模式挖掘(FPM),然后再次对由可视化查询模块110取回的每个中间情节220执行频繁模式挖掘。一般来说,对于完整情节200存在一轮的模式挖掘,并且对于具有n个里程碑事件的情节存在另外的n-1轮的模式挖掘。在其中定义了四个里程碑的示例性情节中,在针对总情节的一轮模式挖掘之后存在附加的3轮模式挖掘。如在下文中所讨论的,示例性FPM引擎包括在步骤420期间操作的频繁模式挖掘器、以及在步骤430和440期间操作的统计模式分析器。

如图4所示,示例性模式挖掘模块400接收输入数据405,该输入数据405包括一组检测到的情节、相应的支持度值(示例性挖掘器寻找具有阈值以上的支持度值的模式)和结果。示例性模式挖掘模块400然后在步骤410期间执行包括折叠(collapse)并发事件集的预处理。

此后,在步骤420期间,模式挖掘模块400使用频繁模式挖掘器检测频繁事件模式。示例性频繁模式挖掘器负责检测在一组输入情节200中频繁出现的事件子序列。挖掘器基于其中出现了模式的输入情节的百分比(其在本文中被称为模式的支持度)将模式定义为“频繁”。如以上所指出的,挖掘器寻找具有阈值以上的支持度值的模式。在一个优选实施例中,支持度值是可配置的。用户还可以指定最小模式长度,其可以是任何大于或等于一的整数值。示例性模式挖掘模块400所采用的模式发现基于以位图表示为基础的顺序模式挖掘器(SPAM)(参见例如Jay Ayres等人的“Sequential Pattern Mining Using a Bitmap Representation”,Proc.of the8th ACM SIGKDD Int’l Conf.on Knowledge Discovery and Data Mining,429-35(2002),通过引用将其结合在本文中),其使用把搜索空间的深度优先遍历与有效修剪机制相集成的搜索策略。SPAM算法已经被证实比传统模式挖掘方法快一个数量级,特别是当其应用于相对长的情节时。SPAM算法将一组事件序列(即,情节数据)和用户指定的支持度值作为输入,并产生一组频繁模式作为输出。然后应用用户提供的最小长度阈值,以过滤掉太短的模式。

通常,统计模式分析器寻找所挖掘的模式和情节规范的结果度量之间的相关性。示例性模式挖掘模块400在步骤430期间采用统计模式分析器,以便根据识别出的频繁模式集为每个情节形成模式袋(BoP,bag-of-pattern)表示矩阵。更正式地,给定一组n个频繁模式,BoP表示是n维向量,其中该向量的第i个元素存储相应的情节内的第i个模式的频率。如果存在m个情节(对应于m个不同患者),那么构造m×n的情节模式矩阵X=[x1,x2,…,xn],其第(j,i)个元素指示第i个模式在第j个情节中出现的次数。因此,其第i列xj汇总第i个模式在所有m个情节中的频率。还可以构造m维情节结果向量y,使得yj是第j个情节的结果。在二进制的情况下,yi∈{+1,-1},其中+1表示正面结果且-1表示负面结果。给定该公式,计算测量每个xi和y之间的相关性的统计数值以便测量第i个模式在预测情节的结果方面的信息度。例如,可以计算皮尔逊相关性、P值(以测量相关性的显著性)、信息增益和优势比。

在步骤440期间,统计模式分析器对每种模式与结果的相关性执行统计分析。最后,模式挖掘模块400在步骤450期间提供结果到示例性图形用户接口300。

交互式可视化

如先前所指出的,一旦模式挖掘模块400已经完成,则将结果传递给交互式可视化模块500。图5是示出包含本发明的方面的交互式可视化模块500的示例性实现的流程图。通常,如下面进一步讨论的,示例性交互式可视化模块500提供群体概览、里程碑时间轴和挖掘模式图。

如图5所示,示例性交互式可视化模块500处理数据输入505,其包括一组事件序列和挖掘输出(例如,对于每个中间情节而言,模式和相关联的统计数值的列表;对于完整情节而言,模式和相关联的统计数值的列表)。

在步骤510期间,交互式可视化模块500最初聚合每个里程碑之间的事件序列数据,包括结果和定时。此后,交互式可视化模块500在步骤520期间产生流程图布局和色彩编码,并在步骤530期间呈现流程图。

在步骤540期间,示例性交互式可视化模块500取回针对所选的边缘(或者整个序列,如果没有选择任何边缘的话)的模式统计数值。在步骤550期间,产生事件模式散点图的递增呈现(以动画示出各个单独的事件的进入/退出/改变)。最后,在步骤560期间,交互式可视化模块500监听边缘选择事件。

如以上所指出的,示例性交互式可视化模块500提供群体概览。图6A至6C分别示出针对心力衰竭患者的示例性可视化600、630、660。图6A至6C示出不同的选择,其中图6A示出总情节、并且图6B和6C示出两个中间情节中的每一个。

如在下文中所讨论的,图6A提供可视化600,其示出在总情节200中检测到的若干模式。示例性可视化600包括群体概览可视化610,其示出由查询模块110返回的针对群体中的患者集的性别和年龄分布。除了这些图表之外,侧边栏面板610示出群体中的患者数量和平均结果。

如以上所指出的,示例性交互式可视化模块500还提供里程碑时间轴。通常,里程碑时间轴可视化示出定义总情节200的里程碑事件210的序列。如图6A所示,例如,每个里程碑事件210被表示为可以标记有相应事件类型的垂直灰色条,诸如心绞痛和心力衰竭。里程碑条220然后通过色彩编码的边缘连接。这些边缘以颜色表示中间情节220,例如表示平均结果值。默认情况下,例如,将平均结果归一化并映射到红色到黄色到绿色的色标(例如,绿色针对好结果;红色针对坏结果)。备选的色标(color scale)或映射可以用于支持色盲用户。里程碑时间轴是交互式的,并且可选地允许用户经由鼠标点击选择总情节或个体的中间情节。图6A示出具有三个里程碑事件210-1、210-2、210-3的里程碑时间轴。

用户可以从图6A中所示的总情节中选择两个中间情节220-1和220-2中的一个,以获得图6B和6C中所示的可视化630、660。图6B提供可视化630,其示出与对应于最终的心脏瓣膜置换的中间情节220-1相关联的模式。图6C提供可视化660,其示出在情节的后期出现的相同模式,但是不再显著。里程碑时间轴210中较暗的部分指示所选情节的范围。

如以上所指出的,示例性交互式可视化模块500还提供挖掘模式图。如图6A-6C所示,在里程碑时间轴210之下呈现挖掘模式图630。挖掘模式图630可视化一组模式、并且允许用户以各种方式比较和检查那些模式。首先,例如用散点图中的圆圈表示每个模式。挖掘模式图630的x和y轴分别反映正面覆盖和负面覆盖。因此,在示例性实施例中,主要在具有差结果的患者中出现的模式朝左上方定位。主要在具有好结果的患者中出现的模式朝右下方显示。

示例性可视化

每个模式的圆圈的大小表示信息增益,其中更大的圆圈更有意义,并且圆圈的颜色表示优势比。示例性实施例采用与时间轴210中所使用的相同的示例性绿色到黄色到红色的颜色梯度,以便对优势比进行编码。结果,大的红色圆圈表示趋向于导致差结果的挖掘模式,而大的绿色圆圈表示导致好结果的模式。可以经由鼠标点击来选择圆圈,以便取回关于模式的更多信息。在选择时,侧边栏可以被显示到散点图的右边,示出形成该模式的事件序列以及通过挖掘算法计算出的统计数值的完整集合。

与里程碑时间轴210相耦接,模式图630提供对所挖掘的模式统计数值的复杂集合的分级访问。用户可以经由时间轴选择情节(即,中间情节220)的区域,以查看模式图630中相应的模式集。用户可以然后选择那些模式中的一个,以查看包括该模式中的事件和诸如p值之类的详细统计数值的最低层的信息。

挖掘模式图630的重要特征是其对时间比较的支持。事件模式的显著性可以在情节的不同阶段之间变化。例如,特定模式可以存在于总情节200中,但是相对于结果不具有统计显著性。同时,该相同的模式可以在早期的中间情节220期间与结果具有非常强的关联,尽管在以后的时间中与结果绝对不相关。

为了帮助用户理解模式显著性的这些时间改变,只要里程碑时间轴选择发生了改变,示例性挖掘模式图630就采用动画转变。在有任何这样的改变时,模式图组件比较“之前”和“之后”模式集并计算三个不同的集:进入的模式、退出的模式和保留的模式。进入的模式是仅存在于情节的最新选择的部分中的模式。表示这些模式的圆圈被添加到图中。退出的模式是仅存在于情节的先前选择的部分中的模式。从图中移除这些模式的圆圈。最关键的是保留的模式。这些模式的圆圈以动画显示为新的位置、颜色和大小,以反映针对这些模式的统计数值的改变。因此,当用户从早期到晚期中间情节220进行点击时,气泡图随着模式的显著性和/或普遍性变得更大(或更小)而经由动画示出该模式的轨迹。如果选择了个体模式(如图6B-6C中),则该选择在整个动画过程中被保持,从而使得易于观察模式的特性在情节的不同部分之间如何改变。

一种示例性实现包括基于网络的应用,从而使得其能够容易地部署到较大用户群体。系统使用小服务程序(Servlet)技术,其由开源ApacheTomcat服务器和许多商业产品(例如,IBM WebSphere)支持。服务器端功能用Java实现。示例性实现连接到ICDA数据源(参见例如D.Gotz等人的“ICDA:A Platform for Intelligent Care Delivery Analytics”,AMIAAnnual Symposium Proc.,American Medical Informatics Association(2012),通过引用将其结合在本文中),该ICDA数据源基于广泛使用的标准,诸如ICD、CPT和NDC。

客户端功能使用标准网络技术来开发、并且允许通过任何现代网络浏览器进行访问。除了HTML、CSS和JavaScript技术之外,示例性实现还采用Dojo工具包用于用户接口小部件。D3.js被用作在其上构建定制可视化的可视化工具包。可视化因此依赖SVG作为底层呈现技术。

提供数据适配器以便将原型连接到两个数据源,其中每个数据源具有可用临床事件类型的稍微不同的集合。当用户与查询接口交互以添加事件约束到情节规范时,使用预键入查找(type-ahead find)来把选择约束为仅数据内存在的事件类型。这允许用户快速查看哪些事件类型在给定的数据集中可用,而无需对数据源具有深层的先备知识。

使用案例

所公开的方法允许用户对事件序列数据执行广泛的即兴可视化分析任务。讨论了三种示例性使用案例以示出所公开的可视化分析系统100所支持的调查类型。

一种模式随时间推移

图6A-6C中所示的这种使用案例使用ICD编码调查心力衰竭患者群体。基于用户定义的情节规范,示例性可视化分析系统100取回从血脂异常发展到心绞痛到心力衰竭的患者群体。百分之八的患者遭受结果度量诊断:心脏瓣膜置换。该群体大约有一半是男性,这些男性的大多数超过70岁。在总情节中发现大量频繁模式,但是全部是中性指示符或负面指示符(图6A中的黄色或绿色圆圈)。聚焦于特定中间情节220会返回更少的频繁模式。该使用案例中的一个有趣的模式包括主动脉冠状动脉分流。该模式在第一和最后中间情节220中是频繁的。然而,当朝情节的起始观察时,其在与结果度量的关联方面要显著得多。可视化在图6C中示出:尽管模式仍存在于第二中间情节中,但是在疾病进展的该阶段中该模式在正面结果子群中的罕见度更小,这会降低其显著性。

所有模式随时间推移

另一个使用案例使用ICD代码调查甲状腺机能减退患者群体。如通过用户指示的那样,示例性可视化分析系统100取回从肥胖症发展到高血压到2型糖尿病到甲状腺机能减退的患者群体。在群体的11.6%中发现的感兴趣的结果事件是贫血症的诊断。如人们可以预期的那样,该群组大多数是年龄在53-95岁范围内的女性。可以示出:当用户从第一中间情节移动到最后中间情节时,在观察到的模式中存在有趣的改变。在进展的起始处,发现非常少的(例如,七个)共同模式(并且全部具有负关联)。在中间时期,存在更多的模式,尽管与结果仅具有弱相关性。这可以按照圆圈沿挖掘模式图的对角线群集的方式来示出。对于该特定分析,贫血症的强指示不明显,直到第三和最后中间情节,在这两个中间情节中频繁模式的数量显著增长且优势比增长得相当大。

比较两种模式

另一个使用案例使用等级条件分类(HCC)数据调查高血压患者群。给出示例性情节规范,其要求四个里程碑条件的序列:高血压,随后是高血压性心脏病,随后是心绞痛,随后是心脏感染/炎症。结果度量被指定为心肺衰竭和休克。针对匹配该规范的患者群体取回情节,其中仅仅超过7%具有负面结果。在总序列中发现大量模式(具有最小长度1)。完全相同的模式可以在第一中间情节中发现,并且显著性甚至比总数据中的更强。进一步的分析示出,尽管在该早期阶段期间遭受心律失常的患者在那些最可能具有坏结果的患者之中,但是存在另一个具有更好结果的子群。在第一中间情节中具有内分泌/代谢紊乱的患者具有更好的结果(因此在图中为绿色圆圈)。然而,通过比较这两种模式的p值,可以看出,仅心律失常具有足够小的p值从而在统计上是显著的。内分泌/代谢紊乱模式具有0.094的p值,其大于通常所使用的0.05的显著性阈值。尽管如此,它仍然是可以充当针对附加调查的假设的可能因素。

本发明的各个方面提供了用于临床情节分析的探索性可视化分析系统,其将图形查询接口、事件模式挖掘和交互式可视化相结合。

如本文所描述的,图1、4和5中所示的技术还可以包括提供一种系统,其中该系统包括不同的软件模块,所述不同的软件模块中的每一个被体现在有形计算机可读可记录存储介质上。例如,所有的模块(或其任何子集)可以在相同的介质上,或者每一个可以在不同的介质上。模块可以包括图中所示的和/或本文所描述的任何或全部组件。在本发明的一方面中,模块可以例如在硬件处理器上运行。然后可以使用如上所述在硬件处理器上执行的系统的不同软件模块来执行方法步骤。此外,计算机程序产品可以包括有形计算机可读可记录存储介质,其中代码适于被执行从而执行本文所描述的至少一个方法步骤,包括提供具有不同软件模块的系统。

另外,图1、4和5中所示的技术可以经由可包括计算机可用程序代码的计算机程序产品来实现,所述计算机可用程序代码存储在数据处理系统中的计算机可读存储介质中,并且其中计算机可用程序代码通过网络从远程数据处理系统下载。此外,在本发明的一方面中,计算机程序产品可以包括存储在服务器数据处理系统中的计算机可读存储介质中的计算机可用程序代码,并且其中计算机可用程序代码通过网络被下载到远程数据处理系统,以便在计算机可读存储介质中由远程系统使用。

可以用包括存储器和至少一个处理器的装置的形式来实现本发明的方面或其元素,其中至少一个处理器耦合到存储器并配置成执行示例性方法步骤。

此外,本发明的一方面可以利用在通用计算机或工作站上运行的软件。参考图7,这样的实现可以采用例如处理器702、存储器704、以及例如由显示器706和键盘708形成的输入/输出接口。本文所使用的术语“处理器”旨在包括任何处理器件,诸如包括CPU(中央处理单元)和/或其他形式的处理电路的处理器件。此外,术语“处理器”可以指多于一个的个体处理器。术语“存储器”旨在包括与处理器或CPU相关联的存储器,诸如RAM(随机存取存储器)、ROM(只读存储器)、固定存储器件(例如,硬盘驱动器)、可移除存储器件(例如,磁盘)、闪存、等等。此外,本文所使用的短语“输入/输出接口”旨在包括例如用于将数据输入到处理单元的机构(例如,鼠标)、以及用于提供与处理单元相关联的结果的机构(例如,打印机)。处理器702、存储器704、以及诸如显示器706和键盘708的输入/输出接口可以例如经由总线710被互连作为数据处理单元712的一部分。适当的互连(例如经由总线710)还可以被提供给:网络接口714(诸如网卡),其可以被提供以便与计算机网络进行接口连接;以及媒体接口716,诸如磁盘或CD-ROM驱动器,其可以被提供以便与媒体718进行接口连接。

因此,如本文所描述的,包括用于执行本发明的方法的指令或代码的计算机软件可以存储在相关联的存储器件中(例如,ROM、固定或可移除存储器),并且当准备好被利用时,其由CPU部分地或全部加载(例如,加载到RAM中)并执行。这样的软件可以包括但不限于固件、驻留软件、微代码、等等。

适合于存储和/或执行程序代码的数据处理系统将包括至少一个处理器702,其通过系统总线710直接或间接耦合到存储器元件704。处理器元件可以包括在程序代码的实际实施期间所采用的本地存储器、大容量存储器和高速缓冲存储器,该高速缓冲存储器提供至少一些程序代码的临时存储,以便减少在执行期间必须从大容量存储器取回代码的次数。

输入/输出或I/O设备(包括但不限于键盘708、显示器706、指点设备、等等)可以直接(诸如经由总线710)或通过居间I/O控制器(为清楚起见而被略去)耦合到系统。

诸如网络接口714的网络适配器还可以耦合到系统,以使数据处理系统能够通过居间专用或公用网络耦合到其他数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器和以太网卡仅仅是当前可用的网络适配器类型中的几个。

如本文所使用的,包括权利要求在内,“服务器”包括运行服务器程序的物理数据处理系统(例如,图7中所示的系统712)。应当理解的是,这样的物理服务器可以或者可以不包括显示器和键盘。

所属领域的技术人员将理解的是,本发明的各个方面可以实施为系统、方法或计算机程序产品。因此,本发明的各个方面可以采取以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或软件和硬件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,本发明的各个方面还可以采取用一个或多个计算机可读介质实施的计算机程序产品的形式,该计算机可读介质上包含有计算机可读程序代码。

可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的适当组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件的上下文中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读信号介质可以包括例如在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读程序代码。这种传播的信号可以采用各种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明各方面的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言(诸如Java、Smalltalk、C++等),还包括常规的过程式程序设计语言(诸如“C”程序设计语言或类似的程序设计语言)。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

下面参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明的各方面。应当理解的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。

也可以把这些计算机程序指令存储在计算机可读介质中,这些指令可以使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,使得存储在计算机可读介质中的指令产生包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品。

计算机程序指令还可以加载到计算机、其它可编程数据处理装置或其他设备上,以使一系列操作步骤在计算机、其它可编程装置或其他设备上被执行以产生计算机实现的过程,使得在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的一个或多个方框中规定的功能/动作的处理。

附图中的流程图和框图示出根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意的是,在有些替代性实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

应当注意的是,本文所描述的任何方法可以包括提供一种系统的附加步骤,所述系统包括体现在计算机可读存储介质上的不同的软件模块;模块可以包括例如本文详细描述的任何或全部组件。然后可以使用如上所述在硬件处理器702上执行的系统的不同软件模块和/或子模块来执行方法步骤。此外,计算机程序产品可以包括计算机可读存储介质,其中代码适于被执行从而执行本文所描述的至少一个方法步骤,包括提供具有不同软件模块的系统。

在任何情况下,应当理解的是,本文所示出的组件可以以软件、硬件或其组合的各种形式实施,例如专用集成电路(ASICS)、功能电路、具有相关联的存储器的适当编程的通用数字计算机、等等。给定本文所提供的本发明的教导,相关领域普通技术人员将能够构想本发明的组件的其他实施。

在此所用的术语仅用于描述特定实施例的目的,且并非旨在限制本发明。如在此所使用的,单数形式的“一”、“一个”和“该”旨在也包括复数形式,除非上下文另有明确说明。将进一步理解的是,当在本说明书中使用时,术语“包括”和/或“包含”指的是所陈述的特征、整数、步骤、操作、元件和/或组件的存在,而并不排除另一个特征、整数、步骤、操作、元件、组件和/或其组合的存在或附加。

下面的权利要求中的所有装置或步骤加功能元件的对应结构、材料、动作和等同物旨在包括与具体要求保护的其他元件结合的用于执行功能的任何结构、材料或动作。

本发明的各种实施例的描述已经被提供用于说明和描述的目的,而并非旨在是无遗漏的或限制于所公开的实施例。在不背离所描述的实施例的范围和精神的情况下,对于那些本领域的普通技术人员,许多修改和变化将是明显的。本文中使用的实施例被选择是为了最好地解释本发明的原理、实际应用或对市场中发现的技术的技术改进,或者使本领域的其他普通技术人员能够理解本文所公开的实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号