首页> 中国专利> 一种基于关联规则认知发热疾病的系统、设备、存储介质

一种基于关联规则认知发热疾病的系统、设备、存储介质

摘要

本发明公开一种基于关联规则认知发热疾病的系统、设备、存储介质,所述系统包括:数据获取模块:用于获取一定量的发热病例样本并进行预处理,形成发热常规检测数据、发热伴随症状信息与对应的发热疾病的发热病例集合;数据预处理模块:用于对发热病例集合中的文本数据进行编码;规则挖掘模块:用于利用关联规则挖掘算法提取发热常规检测数据、发热伴随症状信息数据与对应的发热疾病之间的关联规则,形成关联规则库;发热分析模块:用于基于规则挖掘模块的关联规则库进行发热疾病分析与匹配。本发明综合了发热疾病两种不同模态的特征信息,利用关联规则算法分析发热疾病与各个模态特征之间的对应关系,降低了疾病认知难度。

著录项

  • 公开/公告号CN113257429A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 吾征智能技术(北京)有限公司;

    申请/专利号CN202110515818.7

  • 发明设计人 杜登斌;杜小军;杜乐;陈伯怀;

    申请日2021-05-12

  • 分类号G16H50/70(20180101);G16H50/20(20180101);

  • 代理机构42247 武汉红观专利代理事务所(普通合伙);

  • 代理人李季

  • 地址 100000 北京市海淀区西三旗沁春家园1号楼、2号楼、3号楼3层301-3045室

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本发明属于数据处理和人工智能技术领域,具体涉及一种基于关联规则认知发热疾病的系统、设备、存储介质。

背景技术

发热是十分常见的临床症状,是人体与疾病做斗争的一种防御反应,在内科工作中几乎每天都会遇到因发热而就医的患者。其病因众多,涉及临床各科。与其他常见症状相比,发热的病因诊断更加考验临床医生处理临床问题的能力。如何在缺少复杂的仪器设备的基层医院及时、准确地诊断发热,对病因进行印象诊断,并给予有效的治疗,是基层医生必须掌握的技术和方法。在医疗条件不足的情况下,过度依赖常规检测数据和医生、专家的经验,会增加发热疾病认知难度,贻误病情。

发明内容

有鉴于此,本发明提出了一种基于关联规则认知发热疾病的系统、设备、存储介质,用于解决发热疾病检查时过度依赖发热常规检测数据和医生、专家经验的问题。

本发明第一方面,公开一种基于关联规则认知发热疾病的系统,所述系统包括:

数据获取模块:用于获取一定量的发热病例样本并进行预处理,形成发热常规检测数据、发热伴随症状信息与对应的发热疾病的发热病例集合;

数据预处理模块:用于对发热病例集合中的文本数据进行编码;

规则挖掘模块:用于利用关联规则挖掘算法提取发热常规检测数据、发热伴随症状特征信息数据与对应的发热疾病之间的关联规则;

发热分析模块:用于基于规则挖掘模块的关联规则进行发热疾病分析与匹配。

优选的,所述预处理模块中,在对发热病例集合中的文本数据进行编码之前还包括:对于同一种发热疾病对应的发热常规检测数据与发热伴随症状信息进行合并。

优选的,所述发热常规检测数据包括低热37.2℃-38℃、中度发热38.1℃-39℃、高热39.1℃-41℃、超过41℃为超高热;所述伴随症状信息包括但不限于咳嗽、流涕、寒战、出血、肝肿大、脾肿大、皮疹、腹泻、腹胀、结膜充血、关节疼。

优选的,所述规则挖掘模块具体包括:

阈值设置单元:预先设置最小支持度阈值、最小置信度阈值;

频繁项统计单元:基于预处理后的发热病例集合,统计项目频数,删除频数小于最小支持度阈值的项,生成频繁项集;

规则分析单元:用于基于频繁项统计单元的统计结果,利用关联规则挖掘算法对集合中的每一类疾病的发热常规检测数据、伴随症状特征信息分别进行关联规则分析,得到发热常规检测数据、伴随症状特征信息与对应疾病之间的关联规则。

优选的,所述规则分析单元中,通过引力搜索算法筛选出发热病例集合中具有最优支持度的项目,提取发热病例集合中大于所述最优支持度的项目并按照支持度降序排列,根据所述排序顺序构建频繁模式树,基于所述频繁模式树分析项目之间的关联规则。

优选的,通过引力搜索算法筛选出发热病例集合中具有最优支持度的项目具体为:

从所述频繁项集中筛选出N个项目作为引力搜索算法的个体;

基于各个项目的支持度和置信度设置适应度函数,计算各个个体的适应度;

基于当前最优适应度进行个体位置更新,并重新计算适应度进行迭代运算,直到达到终止条件,输出最有适应度所在个体位置作为最优支持度。

优选的,所述适应度函数为:

f(x)=t

其中support(x)为项目x的支持度,H(x)为项目x的信息熵,t

本发明第三方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;

其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明第一方面所述的系统。

本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。

本发明相对于现有技术具有以下有益效果:

1)本发明综合了发热疾病两种不同模态的特征信息,利用关联规则算法分析发热疾病与各个模态特征之间的对应关系,可明确发热及其伴随症状特征信息对应疾病之间的关联规则,将发热疾病与各个模态特征之间原本模糊的关系进行规则化表示,基于规则化表示的关联规则实现基于跨模态融合的发热疾病自动认知与分析,避免过度依赖发热常规检测数据和医生、专家经验,降低了疾病认知难度;

2)本发明跨模态融合认知发热疾病的系统既保留了单个模态的信息特点,又可以综合利用多模态的特征信息,提高了认知发热疾病和最终决策的可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于关联规则认知发热疾病的系统结构示意图;

图2为本发明规则挖掘模块的结构示意图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1所示,本发明提出一种基于关联规则认知发热疾病的系统,所述系统包括数据获取模块10、数据预处理模块20、规则挖掘模块30、发热分析模块40;

所述数据获取模块10,用于获取一定量的发热病例样本并进行预处理,形成发热常规检测数据、发热伴随症状信息与对应的发热疾病的发热病例集合;

具体的,在对发热病例集合中的文本数据进行编码之前还可以对于同一种发热疾病对应的发热常规检测数据与发热伴随症状信息进行合并。所述发热常规检测数据包括低热37.2℃-38℃、中度发热38.1℃-39℃、高热39.1℃-41℃、超过41℃为超高热;所述伴随症状信息包括但不限于咳嗽、流涕、寒战、出血、肝肿大、脾肿大、皮疹、腹泻、腹胀、结膜充血、关节疼等。

比如,发热主要伴随症状信息表征类:1)、发热伴寒战,一般见于大叶性肺炎、败血症、急性胆囊炎、急性肾盂肾炎等;2)、发热伴结膜充血,一般见于麻疹、流行性出血热、斑疹伤寒等;3)、发热伴口唇单纯疱疹,多出现于急性发热性疾病,见于大叶性肺炎、流行性脑脊髓膜炎、间日疟等;4)、发热伴淋巴结肿大,一般见于传染性单核细胞增多症、淋巴结结核、丝虫病、白血病等;5)、发热伴肝脾肿大,一般见于传染性单核细胞增多症、病毒性肝炎、布氏杆菌病等;再比如,发热热型伴疼痛部位类:1)、高热、侧胸部疼痛,放射到肩部,寒战、咳嗽、咳铁锈色痰,可能为大叶性肺炎;2)、低热、胸部锐痛、干咳、胸水、咳痰、咯血、盗汗、乏力、呼吸困难,可能为结核性胸膜炎;3)、低热或中等高热,淋巴结肿大、腹泻、腹痛、倦怠、盗汗、食欲缺乏、腹水、腹内肿块,提示可能为结核性腹膜炎;4)、高热、咽痛,颈前淋巴结(位于胸锁乳突肌之前)肿大,下颌角淋巴结肿大、扁桃体明显肿大,畏寒,食欲不振、饮食、语言困难,咽痛向耳部放射,提示可能为急性化脓性扁桃体炎等;还比如,发热热型伴疼痛部位与主要症状特征信息类:1)、发热、咽痛、淋巴结肿大、伴触痛、喷嚏、鼻塞、流涕,咳嗽、咳痰、咽干、咽痒,提示可能为上呼吸道感染,即感冒;2)、起病急、高热、咽痛、寒战、伴呼吸困难、头疼、食欲不振、口渴、呕吐,提示可能为急性水肿性咽炎等。以上这些都可作为发热伴随症状信息。

所述数据预处理模块20,用于对发热病例集合中的文本数据进行编码;不同编码表示不同的发热伴随症状信息、发热伴随症状特征信息数据或发热疾病类型

所述规则挖掘模块30,用于利用关联规则挖掘算法提取发热常规检测数据、发热伴随症状信息数据与对应的发热疾病类型之间的关联规则;

所述规则挖掘模块30具体包括:

阈值设置单元301:预先设置最小支持度阈值、最小置信度阈值;

频繁项统计单元302:基于预处理后的发热病例集合,统计项目频数,删除频数小于最小支持度阈值的项,生成频繁项集;

规则分析单元303:用于基于频繁项统计单元的统计结果,利用关联规则挖掘算法对集合中的每一类疾病的发热常规检测数据、伴随症状特征信息分别进行关联规则分析,得到发热常规检测数据、伴随症状特征信息与对应疾病之间的关联规则。

所述规则分析单元中,通过引力搜索算法筛选出发热病例集合中具有最优支持度的项目,具体为:

从所述频繁项集中筛选出N个项目作为引力搜索算法的个体;

基于各个项目的支持度和置信度设置适应度函数,所述适应度函数为:

f(x)=t

其中support(x)为项目x的支持度,H(x)为项目x的信息熵,t

计算各个个体的适应度;

基于当前最优适应度进行个体位置更新,并重新计算适应度进行迭代运算,直到达到终止条件,输出最有适应度所在个体位置作为最优支持度。

然后提取发热病例集合中大于所述最优支持度的项目并按照支持度降序排列,根据所述排序顺序构建频繁模式树,基于所述频繁模式树分析项目之间的关联规则。

所述发热分析模块40,用于基于规则挖掘模块的关联规则进行发热疾病分析与匹配。将待测常规检测数据、发热伴随症状特征信息数据步骤与所述关联规则库中的参数数据逐条匹配,计算最邻近距离值,取所述最邻近距离值的最小值作为匹配输出结果,实现发热疾病类型的预测。

本发明还公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明所述的系统。

本发明还公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明所述的系统。所述存储介质包括:U盘、移动硬盘、存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号