首页> 中国专利> 基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪

基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪

摘要

本发明公开了一种基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪,激光拉曼光谱仪对每个样品进行两次扫描,用于获取健康人和包虫病患者的血清样本,分别得到对应样本的光谱数据,并取其平均作为该样品的拉曼光谱数据并传输至所述计算机;计算机接收拉曼光谱数据,采用自适应迭代惩罚最小二乘法消除拉曼光谱数据中的拉曼荧光背景,并采用自归一化算法对去除荧光背景后的拉曼光谱数据进行去噪处理;计算机将去除荧光背景、以及噪声处理后的拉曼光谱数据采用偏最小二乘法降维后,取前3个主成分作为新的变量输入空间构造样本矩阵,使用反向传播神经网络分类,在123个样本中选出74个用于训练集,49个用于测试集。

著录项

  • 公开/公告号CN108088834A

    专利类型发明专利

  • 公开/公告日2018-05-29

    原文格式PDF

  • 申请/专利权人 新疆大学;

    申请/专利号CN201710822280.8

  • 申请日2017-09-13

  • 分类号G01N21/65(20060101);G06N3/08(20060101);G06K9/00(20060101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人李林娟

  • 地址 830046 新疆维吾尔自治区乌鲁木齐市天山区胜利路666号

  • 入库时间 2023-06-19 05:27:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-26

    未缴年费专利权终止 IPC(主分类):G01N21/65 专利号:ZL2017108222808 申请日:20170913 授权公告日:20200428

    专利权的终止

  • 2020-04-28

    授权

    授权

  • 2020-04-24

    著录事项变更 IPC(主分类):G01N21/65 变更前: 变更后: 申请日:20170913

    著录事项变更

  • 2018-06-22

    实质审查的生效 IPC(主分类):G01N21/65 申请日:20170913

    实质审查的生效

  • 2018-05-29

    公开

    公开

说明书

技术领域

本发明涉及光谱诊断仪领域,尤其涉及一种基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪。

背景技术

包虫病是一种人畜共患的寄生虫病,呈全球性分布,新疆是高发区之一[1]。有研究表明,在没有治疗的情况下,大约95%的包虫病患者会在十年内死亡[2]。包虫病的早期诊断和干预是降低其发病率和死亡率的有效途径。常规的检查有临床症状诊断法、影像技术诊断法及免疫诊断法[3-5],但需专业人员操作、仪器昂贵、过程繁琐[6]。因此,发展一种简便、快速、准确的光谱诊断仪对未来的包虫病患者是非常重要的。

拉曼光谱是一种分子振动光谱,信号尖锐,特异性明显,能对样品提供无损、快速和灵敏的检测,且几乎不受水的干扰,适合于生物样品的分析[7-8],已经被越来越多地应用于医学诊断研究[9-11]。在早期的研究中,使用拉曼光谱结合PCA—BPNN(主成分分析—反向传播神经网络)模型对包虫病患者进行诊断,并取得了良好的结果[12],对包虫病患者的确诊率为90.9091%(10/11),对健康人的确诊率为93.3333%(14/15)。该方法对小样本可以实现较好的识别率,而大样本中包含更多的数据的内在规律和噪声,不适用于大样本的诊断。

由于激光光源照射在样品时,有机分子易将吸收光子转化为荧光分子从而产生荧光背景,使拉曼光谱信号仅仅为原始激发光信号强度的10-8左右[13],可能导致原始光谱难以反映出细胞的本质信息。因此减小和扣除荧光背景是顺利进行拉曼光谱分析研究的关键技术之一。拉曼光谱增强方法主要包括表面增强散射(SERS)[14-16]和拉曼光谱数据的后期处理[17-18]。SERS需要寻找表面粗糙化的活性基底材料或者合适粒径的纳米颗粒来增强拉曼信号,然而这些材料仅限一些过渡金属,且很多材料不适用于生物体,依赖于具体的样本而不通用,并且实现起来成本不菲[19]。因此拉曼光谱数据的后期数据处理就显得特别重要。

发明内容

本发明提供了一种基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪,本发明实现了对包虫病进行快速、准确的诊断,提高了诊断精度和效率,详见下文描述:

一种基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪,所述拉曼光谱诊断仪包括:氩离子激光器、激光拉曼光谱仪、以及计算机,

所述激光拉曼光谱仪通过自带的10倍物镜找到放置在载玻片上的样品所在位置,对该位置使用所述氩离子激光器进行激光照射;

所述激光拉曼光谱仪对每个样品进行两次扫描,用于获取健康人和包虫病患者的血清样本,分别得到对应样本的光谱数据,并取其平均作为该样品的拉曼光谱数据并传输至所述计算机;

所述计算机接收拉曼光谱数据,采用自适应迭代惩罚最小二乘法消除拉曼光谱数据中的拉曼荧光背景,并采用自归一化算法对去除荧光背景后的拉曼光谱数据进行去噪处理;

所述计算机将去除荧光背景、以及噪声处理后的拉曼光谱数据采用偏最小二乘法降维后,取前3个主成分作为反向传播神经网络的输入数据,使用反向传播神经网络分类,在123个样本中选出74个用于训练集,49个用于测试集。

所述氩离子激光器为激发波长为532nm的激光器。

所述拉曼光谱诊断仪的真阳性率为:94.2857±4.0721%,真阴性率为:95.2381±0%,预测总准确率为:94.6939±2.3269%。

本发明提供的技术方案的有益效果是:

1、经airPLS算法对原始光谱数据扣除荧光背景后,用偏最小二乘方法(PLS)将处理后的数据压缩成主成分,并用Kennard-stone(KS)方法将主成分划分为训练集、测试集,最后输入到反向传播神经网络(BPNN)模型中进行预测;本发明提高了诊断的精度和效率,满足了实际应用中的需要;

2、经数据建模分类试验表明:用airPLS-PLS-KS-BP模型(即本申请)预测,其真阳性率为:94.2857±4.0721%,真阴性率为:95.2381±0%,预测总准确率为:94.6939±2.3269%,验证了本发明设计的包虫病血清拉曼光谱诊断仪的可行性。

附图说明

图1为一种基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪的结构示意图;

图2为健康人和包虫病患者的拉曼光谱图;

图3为同样患有包虫病的不同患者的光谱图;

图4为一代表性样本的原始光谱和校正光谱图;

图5为偏最小二乘法分类结果示意图。

其中,(a)为没有扣除荧光背景;(b)为扣除荧光背景。

附图中,各部件代表的列表如下:

1:氩离子激光器; 2:激光拉曼光谱仪;

3:计算机; 4:样品。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。

目前使用最多的神经网络是多层结构的误差反向传播学习算法(BP),因为它可用于不知系统机理只知其输入输出变量的情况,并且已经证明此种模型可以逼近任何连续的非线性曲线[20]。对于BP网络,将光谱仪生成的上千个采样数据直接输入,即使建一个只含三层结点的网,其训练迭代次数之多也是目前微型机难以承受的。而且会使所建模型与训练样本集产生“过拟合”[21],使预测的适应性反而大大下降。

主成分法有极强的压缩数据能力,用它压缩的主成分输入BP网,所建模型(PCA-BP)能达到较高的预测精度,首先被广泛应用。但它选择变量时不考虑输出变量,所以需要改进。

偏最小二乘法(PLS)能根据输出变量将原始数据压缩为主成分,所建线性模型具有很高的预测精度[22]

实施例1

基于优化反向传播神经网络的包虫病血清拉曼光谱诊断仪,参见图1,该光谱诊断仪包括:氩离子激光器1、激光拉曼光谱仪2、以及计算机3(输入的数据:通过拉曼光谱仪扫描血清样品得到的样品的波长--强度的拉曼光谱数据)。

其中,激光拉曼光谱仪2用于扫描健康人和包虫病患者的血清样本分别得到对应样本的光谱数据,并传输至计算机3;计算机3接收拉曼光谱数据(即样品4的波长与强度的拉曼光谱数据)对其进行处理。

具体实现时,在环境温度下,激光拉曼光谱仪2通过自带的10倍物镜找到放置在载玻片上的样品所在位置,对该位置使用氩离子激光器1进行激光照射。

为了保证良好的信噪比,样品4由激发波长为532nm的氩离子激光器1激发。

拉曼光谱检测中,拉曼光谱的噪声主要有两类:一是仪器的热噪声,二是环境干扰;背景干扰则主要是:拉曼光谱荧光造成的基线漂移[24];从拉曼光谱信号中提取有用信息,对准确诊断包虫病至关重要。

计算机3采用自适应迭代惩罚最小二乘法(air PLS)来消除拉曼光谱数据中的拉曼荧光背景,并采用自归一化算法对去除荧光背景后的拉曼光谱数据进行去噪处理。

为了减少电子噪声、光散射和激光功率起伏等有害因素的影响[25],对每个样品4进行两次扫描,并取其平均拉曼光谱数据作为该样品4的拉曼光谱数据。

计算机3将经自适应迭代惩罚最小二乘法(air PLS)去除荧光背景后的拉曼光谱数据采用偏最小二乘法(PLS)降维后,计算机3取前3个主成分作为新的变量输入空间构造样本矩阵,使用BPNN分类;采用KS算法[23],在123个样本中选出具有代表性的60%(74个)用于训练集,40%(49个)用于测试集。

综上所述,本发明实施例用PLS根据输出变量将原始数据压缩为主成分,将该主成分输入BP网,再用KS[23]算法来划分训练集、测试集,最终实现对健康人和包虫病患者数据进行分类预测。

从分类性能方面对airPLS-PLS-KS-BP(自适应迭代惩罚最小二乘法-偏最小二乘法-Kennard-stone法-反向传播神经网络)、PLS-KS-BP(偏最小二乘法-Kennard-stone法-反向传播神经网络)、airPLS-PCA-KS-BP(自适应迭代惩罚最小二乘法-主成分分析法-Kennard-stone法-反向传播神经网络)、airPLS-PLS-BP(自适应迭代惩罚最小二乘法-偏最小二乘法-反向传播神经网络)模型进行后续实验的优化比较,后续结果表明airPLS-PLS-KS-BP模型能更好的对健康人和包虫病患者进行分类预测。

实施例2

下面结合具体的实验对实施例1中的方案进行可行性验证,详见下文描述:

一、血清样品来源

由新疆医科大学第一附属医院包虫病重点实验室提供,随机取出诊断明确、资料完整的健康人55例,包虫病患者68例,共123个血清样品。

二、模型评价

以诊断真阳性率、真阴性率、预测总准确率作为人工神经网络(ANN)模型评价指标。3个指标定义如下:

(1)~(3)式中,A、B、C、D分别代表真阳性、假阳性、假阴性、真阴性。阳性代表患有包虫病,阴性代表正常。

三、试验结果与分析

1、健康人与包虫病患者的拉曼光谱分析

所测健康人与包虫病患者的拉曼光谱示于下图,图2是从健康人和包虫病患者中各选一有代表性的拉曼光谱图。图3为同样患有包虫病的不同样品的拉曼光谱图。从图2可看出,健康人与包虫病患者的光谱形状相似,特征峰位置相似峰强度存在差异,是定性判别的基础。

从图3中可看出,同样患有包虫病的不同患者的光谱,受荧光背景的影响,拉曼光谱产生了基线漂移,且荧光背景变化范围很大,给定性判别带来了不良影响,因此,有必要对光谱进行背景扣除。

2、拉曼荧光背景扣除

消除荧光背景的主要目的是寻找拉曼波谱的特征峰,而这些特征峰常常处在一些较大的荧光背景上。airPLS算法是近年来提出的一种校正光谱基线漂移的方法,能有效扣除拉曼光谱中的荧光背景,基线估计速度快且灵活[26],故本发明实施例采用自适应迭代惩罚最小二乘法(air>

图4显示了一代表性样本的原始光谱和校正光谱。可以看出该算法在保持原本光谱峰型的情况下,能有效扣除拉曼荧光背景。

3、基于PLS-KS的BP判别模型

1)数据压缩

如果将全谱直接作为变量输入神经网络进行建模,计算工作量比较大,而且并非所有数据对建模都有用,应该尽量剔除信息较弱、与样品缺乏相关联的光谱区域数据以减少校正模型的计算工作量。而PLS提取的自变量主成分与因变量Y相关最大,同在处理多重共线、高冗余、多躁音的数据时比其他主元分析法,具有更高的精度、更强的稳定性[22],因此本研究采用PLS,其PLS模型的PLS成分数由十折交互验证方法确定。

分别对没有扣除背景和扣除背景后的光谱样本用PLS处理,并将其得分矩阵的第一、第二、第三主成分取出绘图分析。从图5(a)可以明显看出,如不进行背景扣除,健康人和包虫病患者样本根本无法分开;从图5(b)可以看出,进行背景扣除之后,光谱明显分成两类,健康人和包虫病患者样本能很好的分开,每类样本的聚集性因背景的扣除有了明显的提高。

2)样本划分

根据十折交互验证方法取PLS模型的PLS成分数为3,因此,降维后取前3个主成分作为新的变量输入空间构造样本矩阵,使用BPNN分类。为了使用BPNN正确的对新样本进行预测,因此待分析样品的变化必须尽可能多的纳入训练集中,因此必须用有效的算法从样品池中选择一些有代表性的样本,这些样本将尽可能覆盖生物信息成分的变动范围。

本发明实施例采用KS算法[23],在123个样本中选出具有代表性的60%(74个)用于训练集,40%(49个)用于测试集。

3)建模及结果比较

BP神经网络的输入层、输出层结构与实际应用有关,其设计关键在于隐层结构。在此,用三层BP神经网络结构,输入层节点为PLS方法降为后累计贡献率>85%的前三个主成分,输出层1个结点,隐层结点数按公式:

其中,m为隐层结点数,n为输出层结点数,l为输入层结点数,a为1~10之间的常数。且结合多次实验取最佳隐层结点数为3,隐层激活函数取sigmoid函数,输出层采用线性激活函数purelin,训练函数采用trainlm;网络训练迭代次数为2000次,并设置每500次显示1次误差,目标误差为0.00000001,学习速率根据经验为0.05,其余训练参数为默认值;输出神经元对健康人、包虫患者的输出值分别设定为1、2。判别时以≤1.5者为健康人,其他为包虫病患者。

BPNN中的初始权值是由网络随机完成初始化[27],为消除随机干扰,模型随机选择时段继续了5次的诊断结果,确诊率最高的是:在49例预测集数据中,包虫病患者有28例,28例确诊,0例被误诊,其真阳性率为100%,健康人有21例,20例确诊,1例被误诊,其真阴性率为95.2381%,预测总准确率为97.9592%;确诊率最低的是:在49例预测集数据中,包虫病患者有28例,25例确诊,3例被误诊,其真阳性率为89.2857%,健康人有21例,20例确诊,1例被误诊,其真阴性率为95.2381%,预测总准确率为91.8367%。

表1 airPLS-PLS-KS-BPNN模型诊断结果

基于BP神经网络初始权值随机化的特性,在计算包虫病的确诊率时可结合模型5次的运行结果,在49例预测集数据中,真阳性率为:94.2857±4.0721%,真阴性率为:95.2381±0%,预测总准确率为:94.6939±2.3269%。

原始光谱的PLS-KS-BPNN模型、airPLS-PCA-KS-BPNN模型和airPLS-PLS-BPNN模型的随机一次的运行结果如下表所示:

表2对比模型诊断结果

No.模型真阳性率真阴性率预测总准确率APLS-KS-BPNN76.9231%86.9565%81.6327%BairPLS-PCA-KS-BPNN72.7273%74.0741%73.4694%CairPLS-PLS-BPNN82.1429%80.9524%81.6327%DairPLS-PLS-KS-BPNN92.8571%95.2381%93.8776%

原始光谱、去荧光背景光谱、PCA方法提取主成分、随机抽取训练集等不同模型建模结果比较,可明显看出airPLS-PLS-KS-BPNN模型的真阳性率、真阴性率、预测总准确率均有提高,说明该模型中采用airPLS扣除背景后有效地消除了光谱漂移和噪声的影响,采用PLS压缩数据具有更高的精度、更强的稳定性,采用KS算法划分的训练集提高了样本的代表性,airPLS-PLS-KS-BPNN模型能更好的实进行包虫病的快速、准确的预测。

综上所述,本发明实施例利用拉曼光谱结合PLS-KS-BPNN定性判别方法对健康人和包虫病患者进行了诊断预测。通过比较airPLS法扣除拉曼荧光背景前后的模型预测结果,确定airPLS法能扣除拉曼荧光背景,有效地降低了光谱漂移,提高了聚类分析的准确性。分别采用PCA法和PLS法对数据进行压缩后的建模效果处理进行对比,较之PCA法,PCA法压缩成的主成分所含信息更精确地表达了输入与输出间的关系,用它们建立的BP模型具有更高的预测精度。而采用了KS算法划分训练集的模型相比随机选取的训练集的模型也更好的提高了预测的准确度。实验对比结果表明了airPLS-PLS-KS-BPNN模型能更好的实现对包虫病的早期诊断,且与传统包虫病诊断相比,本诊断仪具有易于携带、操作简单和分析快速等优点,适用于包虫病的快速、准确诊断。

参考文献

[1]Han S,Chen R,Fang W,etal.Investigation of the use of serology andultrasonography to detect hepatic cystic echinococcosis in Heilongjiang,China,using a Bayesian framework[J].Acta tropica,2016,162:212-217.

[2]Wu C,Zhang W,Ran B,et al.Genetic variation ofmitochondrial genesamong Echinococcus multilocularis isolates collected in western China[J].Parasites&vectors,2017,10(1):265.

[3]L’.Laca.Importance ofcomplex diagnostic approach in differentialdiagnosis ofalveolar echinococcosis:Helminthologia[J].Helminthologia,2015,52(4):298-302.

[4]Unal E,Keles M,Yazgan S,et al.A rare retrovesical hydatid cyst andvalue of transrectal ultrasonography in diagnosis:a case report and review ofthe literature[J].Medical Ultrasonography,2017,19(1):111-113.

[5]Pakala T,Molina M,Wu G Y.Hepatic Echinococcal Cysts:A Review[J].Journal of Clinical&Translational Hepatology,2016,4(1):39-46.

[6]Tamarozzi F,Covini I,Mariconti M,et al.Comparison of thediagnostic accuracy of three rapid tests for the serodiagnosis of hepaticcystic echinococcosis in humans[J].PLoS neglected tropical diseases,2016,10(2):e0004444.

[7]Yeturu S,Jentzsch P V,V,et al.Handheld Raman spectroscopyfor the early detection of plant diseases:Abutilon mosaic virus infectingAbutilon sp.[J].Analytical Methods,2016,8(17):3450-3457.

[8]Conrad A O,Bonello P.Application of Infrared and RamanSpectroscopy for the Identification of Disease Resistant Trees[J].Frontiersin Plant Science,2016,6(521):1152.

[9]Richardson W,Dan W,Wu L,et al.Ensemble multivariate analysis toimprove identification of articular cartilage disease in noisy Raman spectra[J].Journal of Biophotonics,2015,8(7):555-566.

[10]Stone N,Matousek P.Advanced transmission Raman spectroscopy:apromising tool for breast disease diagnosis.[J].Cancer Research,2008,68(11):4424.

[11]Matousek P,Stone N.Development of deep subsurface Ramanspectroscopy for medical diagnosis and disease monitoring.[J].ChemicalSociety Reviews,2016,45(7):1794.

[12]Cheng J Y,Xu L,Lü G D,et al.Study on the echinococcosis bloodserum detection based on Raman spectroscopy combined with neural network[J].Optoelectronics Letters,2017,13(1):77-80.

[13]Jarvis R M,Brooker A,Goodacre R.Surface-enhanced Ramanspectroscopy for bacterial discrimination utilizing a scanning electronmicroscope with a Raman spectroscopy interface.[J].Analytical Chemistry,2004,76(17):5198-202.

[14]Li S,Li L,Zeng Q,et al.Characterization and noninvasive diagnosisof fbladder cancer with serum surface enhanced Raman spectroscopy and geneticalgorithms.[J].Scientific Reports,2015,5:9582.

[15]Shehata D M,Lu X.Development of a Loop Mediated IsothermalAmplification(LAMP)-Surface Enhanced Raman spectroscopy(SERS)Assay for theDetection ofSalmonella EntericaSerotype Enteritidis:[J].Theranostics,2016,6(4):522-532.

[16]Sinha S S,Jones S,Pramanik A,et al.Nanoarchitecture Based SERSfor Biomolecular Fingerprinting and Label-Free Disease Markers Diagnosis[J].Accounts of Chemical Research,2016,49(12):2725.

[17]Huang Y Y,Beal C M,Cai W W,et al.Micro-Raman spectroscopy ofalgae:composition analysis and fluorescence background behavior.[J].Biotechnology&Bioengineering,2010,105(5):889.

[18]Zhang Z M,Chen S,Liang Y Z.Baseline correction using adaptiveiteratively reweighted penalized least squares.[J].Analyst,2010,135(5):1138-46.

[19]O'Grady A,Dennis AC,Denvir D,et al.Quantitative RamanSpectroscopy of Highly Fluorescent Samples Using Pseudosecond Derivatives andMultivariate Analysis[J].Analytical Chemistry,2001,73(9):2058-65.

[20]Liu Y K,Xie F,Xie C L,et al.Prediction of time series ofNPPoperating parameters using dynamic model based on BP neural network[J].Annalsof Nuclear Energy,2015,85:566-575.

[21]Liu C,Liu W,Lu X,et al.Application of multispectral imaging todetermine quality attributes and ripeness stage in strawberry fruit[J].PloSone,2014,9(2):e87818.

[22]Jia W,Zhao D,Shen T,et al.An optimized classification algorithmby BP neural network based on PLS and HCA[J].Applied Intelligence,2015,43(1):1-16.

[23]Chen W R,Yun Y H,Wen M,et al.Representative subset selection andoutlier detection viaisolation forest[J].Analytical Methods,2016,8(39):7225-7231.

[24]Liland K H,Kohler A,Afseth N K.Model‐based pre‐processing inRaman spectroscopy of biological samples[J].Journal of RamanSpectroscopy,2016,47(6):643-650.

[25]LiX,YangT,LiS,et al.Noninvasive liver diseases detection based onserum surface enhanced Raman spectroscopy and statistical analysis[J].Opticsexpress,2015,23(14):18361-18372.

[26]Zhang Z M,Chen S,Liang Y Z.Baseline correction using adaptiveiteratively reweighted penalized least squares.[J].Analyst,2010,135(5):1138-46.

[27]Mattfeldt T,Kestler H A,Hautmann R,et al.Prediction of prostaticcancer progression after radical prostatectomy using artificial neuralnetworks:a feasibility study[J].BJU international,1999,84:316-323.

本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号