法律状态公告日
法律状态信息
法律状态
2019-01-25
授权
授权
2017-03-01
实质审查的生效 IPC(主分类):G06F19/00 申请日:20160920
实质审查的生效
2017-01-25
公开
公开
技术领域
本发明属于工业过程控制领域,特别涉及一种基于层次分析法和加权投票决策融合的工业过程故障检测方法。
背景技术
近年来,工业生产过程的监测问题越来越得到工业界和学术界的广泛重视。一方面,实际的工业过程因为其过程复杂,操作变量多,存在非线性、非高斯、动态性等阶段,在单一假设下,运用某一种方法,其监测效果有很大的局限。另一方面,如果不对过程进行很好的监测,并对可能发生的故障进行诊断,有可能会发生操作事故,轻者影响产品的质量,重者将会造成生命和财产的损失。因此,找到更好的过程监测方法、并进行及时正确地预报已经成为工业生产过程的研究热点和迫切需要解决的问题之一。
传统的工业过程监测方法除了基于机理模型的方法外,大多采用多元统计分析方法,比如主元分析方法(PCA)和偏最小二乘方法(PLS)等。在机理模型难以获取的情况下,基于数据驱动的多元统计分析方法已经成为工业过程监测的主流方法。但是,传统的多元统计分析方法都存在一些基本的假设条件,而实际工业过程却相对复杂,过程可能是一部分线性、一部分非线性或者一部分非高斯的结合,所以使用单一分类器方法存在一些局限性,很难找到合适的模型。而信息融合方法是将多种方法进行集成,可以克服单一方法的劣势,在处理复杂工业过程的监控和故障诊断方面有其自身的优势。本发明采用该方法替代原有的单一多元统计分析方法对过程进行监测。另外为了提高融合效果,采用层次分析法对单一模型进行评价,得到单一模型在融合中的权重,使得融合过程中能够最大化放大单一模型的优势,弥补单一模型的劣势。传统的监测方法假设过程运行在单一条件下,已经无法满足实际工业过程的监测要求。即使对过程的不同工作条件分别进行建模,也无法达到满意的监测效果。因为对新的过程数据进行监测时,需要结合过程知识对该数据的工作条件进行判断,并选取相应的监测模型,这就大大增强了监测方法对过程知识的依赖性,不利于工业过程的自动化实施。
发明内容
本发明的目的在于针对现有技术的不足,提供一种基于层次分析法和加权投票决策融合的工业过程故障检测方法。
本发明的目的是通过以下技术方案来实现的:一种基于层次分析法和加权投票决策融合的故障检测方法,包括以下步骤:
(1)利用系统收集过程正常工况的数据组成建模用的训练样本集:X=[x1;x2;…;xn]。其中X∈Rn×m,n为训练样本数,m为过程变量数,R为实数集,Rn×m表示X满足n×m的二维分布。将这些数据存入历史数据库。
(2)对数据集X进行预处理和归一化,使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
(3)调用不同的分类器方法,选择分类器的个数为G,在新的数据矩阵集下建立不同的分类器模型,构造相应的T2和SPE统计量的检测统计限。
(4)将建模数据和各个模型参数存入历史数据库中备用。
(5)收集新的过程数据,并对其进行预处理和归一化。分别采用不同的分类器模型对其进行监测,即计算T2和SPE统计量,那么每一种分类方法对当前的监测数据样本都可以得到一个正常或者故障的决策。
(6)根据每一个分类器模型的检测结果构造层次结构模型,通过层次分析法对单一分类器性能进行评价,给出打分排序结果。
(7)结合加权投票决策融合方法,通过不同分类器对不同故障检测率的先验知识,计算当前监测数据在所有分类器方法下的综合检出率,做出最后决策。
本发明的有益效果是:本发明通过对每一个故障数据分别进行不同分类器方法下的分析和建模。然后,通过层次分析法对不同分类器的分类效果做出打分评价,最后结合加权投票融合方法将不同分类器方法下的检测结果进行集成融合,得到最终的检测结果。相比目前的其他过程监测方法,本发明不仅提高了工业过程的监测效果,增加了检测的准确性,使工业生产更加安全可靠,而且在很大程度上改善了单一故障检测方法的局限性,以及监测方法对过程知识的依赖性,增强了过程操作员对过程状态的掌握,更加有利于工业过程的自动化实施。
附图说明
图1是层次结构决策模型;
图2是PCA模型对故障1的检测结果图;
图3是KPCA模型对故障1的检测结果图;
图4是PPCA模型对故障1的检测结果图;
图5是PLS模型对故障1的检测结果图;
图6是FA模型对故障1的检测结果图;
图7是ICA模型对故障1的检测结果图。
具体实施方式
本发明针对工业过程的监测问题,首先利用集散控制系统收集正常工作状态下的数据作为训练数据集,然后分别调用不同的分类器方法,建立相应的分类器模型,构造两个监测统计量T2和SPE及其对应的统计限和SPElim。把所有的过程模型参数存入数据库中备用。对新的在线过程数据进行监测的时候,首先利用不同的分类器模型对其进行监测,得到相应的监测结果。然后根据不同分类器模型的监测结果,通过层次分析法对不同分类器模型进行打分评价,最后结合加权投票决策融合方法将不同分类器的监测结果集成融合得到最终的监测结果。
本发明采用的技术方案的主要步骤分别如下:
第一步利用集散控制系统收集工业过程正常状态下的数据组成建模用的训练样本集:X=[x1;x2;…;xn]。其中X∈Rn×m,n为样本总数,m为过程变量数。将这些数据存入历史数据库。
第二步对数据集X进行预处理和归一化,使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为
在历史数据库中对训练样本数据进行预处理,剔除野值点和明显的粗糙误差数据,使得训练样本数据的尺度不会影响到监测的结果,对不同过程变量数据分别进行归一化处理,即各个变量的均值为零,方差为1。这样,不同过程变量数据就处在相同的尺度之下,既而不会影响到后续的监控效果。
第三步调用不同的分类器方法,在新的数据矩阵集下建立不同的分类器模型,构造相应的T2和SPE统计量的检测统计限。
3.1、进行PCA建模,可以得到数据矩阵的协方差矩阵S∈Rm×m、酉矩阵U∈Rm×m、特征值构成的对角矩阵Λ∈Rm×m如下所示:
S=UΛUT
Λ=diag(λi),i=1,...,m
U=[u1,u2,...,um]
其中,表示新的数据矩阵集,S表示协方差矩阵,U表示酉矩阵,n表示训练样本数,m为变量数,Λ表示特征值λi构成的对角矩阵,且其对角元素是按照由大到小的顺序排列的diag(·)表示将括号中的量按对角线排列,um表示第m个构成U的列向量。
然后在其基础上得到负荷矩阵P∈Rm×k、残差负荷矩阵主元成分T∈Rn×k、残差矩阵如下所示:
P=[u1,u2,...,uk]
其中k为提取的主元个数,主要是利用累计方差贡献率(>80%)计算得到的。然后构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.2、进行KPCA建模,利用径向基核函数,通过非线性映射将原输入空间映射到高维特征空间,然后在高维特征空间内进行主元分析如上述PCA方法。在高维空间通过求取特征值、特征向量和得分并利用累计方差贡献率(>80%)计算得到主元个数d,得到相应的负荷矩阵、主元。
同样构造T2统计量并利用F分布给出监测统计限对残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.3、进行PPCA建模,建立模型如下:
其中P∈Rm×l为观测变量与隐变量之间的关系矩阵即负荷向量,t∈Rl为隐变量,e∈Rm为噪声,l为隐变量维度。通过EM算法进行参数估计,然后分别构造T2和SPE统计量。
3.4、进行PLS建模,建立如下模型,其中X∈Rn×q,Y∈Rn×p,n为样本数,q为输入变量数,p为输出变量数,对X和Y同时进行主成分分解。T和U分别为X和Y的主元得分矩阵,P和Q分别为X和Y的负荷矩阵,E和F为残差矩阵。
X=TPT+E
Y=UQT+F
然后建立X和Y的回归关系,最后构造T2统计量并利用F分布给出监测统计限对输入残差矩阵建立SPE统计量并计算其相应的监测统计限SPElim。
3.5、进行FA建模,可以得到如下矩阵模型:
其中u∈Rm为均值向量,P∈Rm×l为负载矩阵,t∈Rl为因子,e∈Rm为噪声,l为因子个数。通过EM算法进行参数估计,然后在因子空间和残差空间分别构造T2和SPE统计量。
3.6、进行ICA建模,可以得到该数据矩阵的独立成分矩阵S∈Rr×n,混合矩阵A∈Rm×r,分离矩阵W∈Rr×m以及残差矩阵如下:
其中r为选取的独立成分个数。然后,构造I2统计量并利用核密度估计方法给出其相应的监测统计限针对残差矩阵构造SPE统计量的监测统计限。
第四步将建模数据和各个模型参数存入历史数据库中备用。
第五步收集新的过程数据,并对其进行预处理和归一化。分别采用不同的分类器模型对其进行监测,即计算T2和SPE统计量,那么每一种分类方法对当前的监测数据样本都可以得到一个正常或者故障的决策。
首先对于新收集的过程数据进行预处理,剔除野值点和明显的粗糙误差数据,然后使用建模时的均值和方差等模型参数对其进行归一化处理。
然后采用不同的分类器模型,建立相应的监测统计量如下:
5.1、对于PCA分析
其中为归一化之后的新数据,tnew为新数据的主元,为残差矩阵,P为负荷矩阵,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew2为新数据的T2统计量值,T为矩阵的转置。
5.2、对于KPCA分析,同上述的PCA过程。
5.3、对于PPCA分析
M=PTP+λI
Tnew2=||M-1PTxnew||2
SPEnew=||λ-0.5(xnew-M-1PTxnew)||2
其中xnew为新数据,P为负荷向量,λ为噪声方差值,SPEnew为新数据的SPE统计量值,||·||表示2-范数,Tnew2为新数据的T2统计量值,T为矩阵的转置。
5.4、对于PLS分析,同PCA过程。
5.5、对于FA分析,同上述PPCA过程。
5.6、对于ICA分析
其中为归一化之后的新数据,snew为基于新数据所提取的独立成分向量,为新数据的I2统计量,继续针对残差向量建立SPE统计量为SPEnew:
第六步根据每一个分类器模型的检测结果构造层次结构模型,通过层次分析法对单一分类器性能进行评价,给出打分排序结果。
6.1、首先调用不同分类器方法,计算每种分类器下不同评价指标的值,如下所示:
准确率(ACC):
真正率(TPR):
假正率(FPR):
真负率(TNR):
假负率(FNR):
Precision:
F值:
其中TP指的是实际为故障样本预测也为故障样本的个数,FP指的是实际为正常样本预测为故障样本的个数,FN指的是实际为故障样本预测为正常样本的个数,TN指的是实际为正常样本预测也为正常样本的个数。Recall召回率也是真正率TPR。
6.2、然后通过层次分析法对单个分类器模型进行打分排序,具体步骤如下:
6.2.1、建立层次结构模型
选取ACC、F值、TPR、FPR、TNR、FNR、Precision评价指标作为准则层指标。选取PCA、KPCA、PPCA、PLS、FA、ICA作为方案层备选方案,构造决策评价层次模型。
6.2.2、构造判断矩阵
设某层有n个因素,要比较它们对上一层某一准则(或目标)的影响程度,确定在该层中相对于某一准则所占的比重。(即把n个因素对上层某一目标的影响程度排序)
上述比较是两两因素之间进行的比较,比较时取1~9尺度。
用aij表示第i个因素相对于第j个因素的比较结果,则A称为成对比较矩阵。
6.2.3、层次单排序
对每个成对比较矩阵计算最大特征值λ及其对应的归一化特征向量。
6.2.4、一致性检验
利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。
随机一致性指标RI数值
当CR<0.1时,通过一致性检验,否则重新构造成对比较矩阵
6.2.5、层次总排序
确定某层所有因素对于总目标相对重要性的排序权值过程,称为层次总排序。从最高层到最低层逐层进行。设:
A层m个因素A1,A2,…,Am对总目标Z的排序为a1,a2,…,am
B层n个因素对上层中A因素Aj的层次单排序为b1j,b2j,…,bnj(j=1,2,…,m)
B层的层次总排序为
B1:a1b11+a2b12+…amb1m
B2:a1b21+a2b22+…amb2m
…
Bn:a1bn1+a2bn2+…ambnm
即B层第i个因素对总目标的权值
第七步结合加权投票决策融合方法,通过不同分类器对不同故障检测率的先验知识,计算当前监测数据在所有分类器方法下的综合检出率,做出最后决策。
7.1、首先调用不同的分类器方法,得到相应的融合矩阵CMk。
其中G是选择分类器的个数,指的是第k个分类器方法将实际为第i类的样本判定为第j类的样本个数,M为类别数。
7.2、然后计算出相应的分类概率值,如下所示:
其中指的是第k个分类器方法的融合矩阵中的第i行第j列的元素,Vk(Ci)指的是当第k个分类器将样本分为第Cj类时,样本实际来自第Ci类的概率值。
7.3、然后根据上一步层次分析法得到的各分类器的权重,计算出加权分类概率值。
其中ωk为第k个分类器通过层次分析法进行模型评价后的得分,M为类别数。
7.4、对于融合后的加权分类概率值,通过比较正常和故障两种类别下,选择最大值作为最后的检测结果。
其中argmax{}表示括号内取最大值时对应的Ci输出值。
以下结合一个具体的工业过程的例子来说明本发明的有效性。该过程的数据来自美国TE(Tennessee Eastman——田纳西-伊斯曼)化工过程实验,原型是Eastman化学公司的一个实际工艺流程。目前,TE过程己经作为典型的化工过程故障检测与诊断对象被广泛研究。整个TE过程包括41个测量变量和12个操作变量(控制变量),其中41个测量变量包括22个连续测量变量和19个成分测量值,它们每3分钟被采样一次。其中包括21批故障数据。这些故障中,16个是己知的,5个是未知的。故障1~7与过程变量的阶跃变化有关,如冷却水的入口温度或者进料成分的变化。故障8~12与一些过程变量的可变性增大有关系。故障13是反应动力学中的缓慢漂移,故障14、15和21是与粘滞阀有关的。故障16~20是未知的。为了对该过程进行监测,一共选取了16个过程变量,如表1所示。接下来结合该具体过程对本发明的实施步骤进行详细地阐述:
1、采集正常过程数据作为训练样本数据,进行数据预处理和归一化
2、针对预处理和归一化后的训练样本数据,调用不同的分类器方法,分别建立不同的分类器模型并确定相应统计量的置信限
经过剔除野值点和粗糙误差点以及归一化后的数据集为对新的数据矩阵进行模型建立:
2.1、进行PCA分析和建模,选取9个主元成分,得到详细的PCA模型。然后构造T2统计量并用F分布确定其相应的监测统计限。同理,利用卡尔方分布确定SPE统计量的监测置信限。这里,我们选取两个统计量的置信度均为99%。
2.2、进行KPCA分析和建模,选取5个主元成分,得到详细的KPCA模型。然后构造T2统计量并用F分布确定其相应的监测统计限。同理,利用卡尔方分布可以确定SPE统计量的置信限。我们选取两个统计量的置信度均为99%。
2.3、进行PPCA分析和建模,选取隐变量维度为2,通过EM算法进行参数估计得到详细的PPCA模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.4、进行PLS分析和建模,选取22个输入变量,5个输出变量,得到详细的PLS模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.5、进行FA分析和建模,选取隐变量维度为2,通过EM算法进行参数估计得到详细的FA模型。然后构造T2统计量及其相应的监测统计限以及SPE统计量及其相应统计限。
2.6、进行ICA分析和建模,选取4个独立成分,得到详细的ICA模型参数信息,即独立成分信息S∈R4×960,混合矩阵A∈R16×4,分离矩阵W∈R4×16以及残差矩阵然后构造I2统计量并由核密度估计方法确定其相应的监测统计限。同理,可以确定SPE统计量的置信限。我们选取两个统计量的置信度均为99%。
3、获取当前监测数据信息,计算不同分类器的监测效果
为了测试新方法的有效性,分别对21个故障进行测试。首先对当前监测数据进行预处理和归一化,然后分别计算21种故障在6种不同分类器下的监测效果,计算出ACC、F值、TPR、FPR、TNR、FNR、Precision等指标。
4、通过层次分析法对各个分类器模型进行打分排序
选取ACC、F值、TPR、FPR、TNR、FNR、Precision评价指标作为准则层指标。选取PCA、KPCA、PPCA、PLS、FA、ICA作为方案层备选方案,构造如图1所示决策评价层次模型。针对每个故障得到6种不同分类器模型的打分,然后将每个分类器模型在21种故障下的打分求取平均,得到6种不同分类器模型的最终得分如表2所示,作为最终融合算法的权重。
5、在线过程监测
首先运用6种不同分类器模型对21个故障分别进行监测,以故障1为例6种分类器模型的监测结果如图2-图7所示,然后用新的融合方法将6种分类器模型的监测结果进行集成融合得到最终的决策结果,如表3所示。
从表3种可以看出,新的方法与单一分类器相比,故障检测准确率更高,特别是单一分类器检测效果不好的,通过新的方法可以对故障做出较好的检测。
表1:监控变量说明
表2:不同分类器模型的得分结果
表3:本发明方法和单一分类器方法对TE过程故障检测结果
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
机译: 一种用于在一个或多个调谐/秒的情况下检测投票数的系统,它可以进行投票,以及在对投票产生的权重或弃权进行加权或不加权的情况下检测和评估结果
机译: 一种用于在一个或多个调谐/秒的情况下检测投票数的系统,它可以进行投票,以及在对投票产生的权重或弃权进行加权或不加权的情况下检测和评估结果
机译: 一种使用加权投票的霍夫空间中物体定位的方法