首页> 中国专利> 基于PCA-SVR的XRF元素定量分析方法

基于PCA-SVR的XRF元素定量分析方法

摘要

本发明公开了一种基于PCA‑SVR的XRF元素定量分析方法,该方法包括读入元素峰值信息和含量信息;确定PCA‑SVR模型的输入输出;计算相关系数及单位特征向量;计算主成分;构造分类超平面,将最优分类超平面问题转化为二次规划模型;通过参数寻优训练PCA‑SVR模型,定量预测元素含量;选择最佳主成分个数;计算决定系数,评价PCA‑SVR模型预测效果。本发明运算过程简单,科学合理,流程简单,便于操作,预测准确率高,结果直观,通俗易懂,可以解决X荧光能谱峰值重叠干扰、以及传统仪器测量方法不准确等问题,减少了环境本底的影响,降低了由统计涨落造成的误差,能有效快速地对待测物所含元素进行定量预测。

著录项

  • 公开/公告号CN113848225A

    专利类型发明专利

  • 公开/公告日2021-12-28

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN202111073294.7

  • 发明设计人 杨婉琪;李福生;赵彦春;

    申请日2021-09-14

  • 分类号G01N23/223(20060101);G06K9/62(20060101);

  • 代理机构51203 电子科技大学专利中心;

  • 代理人周刘英

  • 地址 611731 四川省成都市高新区(西区)西源大道2006号

  • 入库时间 2023-06-19 13:27:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-03

    授权

    发明专利权授予

说明书

技术领域

本发明涉及元素检测领域,特别涉及一种基于PCA-SVR的XRF元素定量分析方法。

背景技术

随着能谱科学研究的逐步发展,在线定性定量检测技术成为了新的发展趋势。经过近十几年来的完善扩展研究,利用X射线荧光(XRF)光谱分析元素含量已经成为一种新型的分析技术,该方法被广泛应用于冶金、建材、地矿、商检、环保、食品卫生、有色金属等各个领域。该方法具有分析迅速、不破坏样品属性、分析范围广泛、结果稳定可靠、能快速实现多元素同时进行分析且操作简便等诸多优点。

传统方法主要是通过XRF光谱仪对微量元素进行精准定性和准确定量分析,其容易出现元素谱线之间峰计数重叠、元素信息的不确定性、元素检出限高等问题,如何在谱线重叠干扰的情况下,提高元素定量分析结果的准确性,成为了本发明研究的重点。因此将主成分分析-支持向量回归(PCA-SVR)算法应用于元素的定量分析,解决了传统X荧光光谱仪计算不准确且缺乏数据检验的问题,旨在为X荧光光谱仪结果的定量分析提供一种可供选择的检验方法。

发明内容

针对上述现有技术中存在的问题,本发明提供了一种基于PCA-SVR算法预测待测物所含元素含量的方法,该方法基于机器学习中的主成分分析(PCA)、支持向量回归(SVR)算法,建立样品元素的峰值特征信息与元素含量分析模型,提升定量分析结果的准确性,最终实现定量预测物质所含元素的含量信息。

为实现上述目的,本发明提出了一种基于PCA-SVR的XRF元素定量分析方法,该方法包括以下步骤:

步骤1:确定标准样品集,假定标准样品集中有n份待测样品,取所述标准样品集中经过ED-XRF荧光光谱仪(能量色散型X射线荧光光谱仪)能够识别的全部元素(元素周期表中12~92号元素)的并集,构成这n份待测样品所含有的元素集,即得标准样品集中有含量的元素集A;

步骤2:读入元素峰值信息和含量信息。取任一待测样品为待识别样品,通过ED-XRF荧光光谱仪测试其在元素集A中对应的元素峰值信息和含量信息,获得各元素的实测组分值(或峰计数)X和含量值Y。

步骤3:确定PCA-SVR模型的输入输出。构建PCA-SVR模型,将需要定量分析的某个元素称为目标元素,将对目标元素产生干扰的元素称为干扰元素。将所述标准样品集中目标元素及其干扰元素组成的实测组分值(或峰计数)矩阵作为PCA-SVR模型的输入,将目标元素的元素含量组成的实测含量值矩阵作为PCA-SVR模型的输出。例如,元素的实测组分值(或峰计数)矩阵X

步骤4:XRF光谱数据标准化。将原始X

式中,i为标准化矩阵

步骤5:求标准化矩阵

式中,n为待测样品份数,

步骤6:求标准化矩阵

式中,j为标准化矩阵

步骤7:将m个标准化后的单位特征向量

式中,i=1,2,...,n,j=1,2,...,m,A

步骤8:通过非线性函数映射将原始X

式中,p=1,2,...,k(k≤m),h

步骤9:为了控制计算速度,减少样本训练中出现的误差,引入了惩罚因子C和松弛变量ξ

式中,w为特征权值向量,C为惩罚因子,ξ

步骤10:运用基于网格搜索的交叉验证法进行参数寻优,训练PCA-SVR模型。通过不断迭代寻找最优参数,得到最优参数惩罚因子C和松弛变量ξ

式中,i=1,2,...,n,p=1,2,...,k,α

步骤11:将步骤10中通过计算k个主成分预测得到的单一目标元素含量与该单一目标元素真实含量结果情况进行对比:对k取不同的值分别计算均方根误差(RMSE)来选择最佳数量的主成分个数。RMSE用以衡量预测值与实际值的接近程度,RMSE越小,主成分个数选择越准确,元素含量预测越精准。通常RMSE随着主成分个数的增加而减少,直到达到最小值或恒定值。当RMSE曲线出现明显下降且之后逐渐趋于平缓时,此时对应的k值为最佳主成分个数k

式中,

步骤12:当主成分个数为k

式中,y

本发明运算过程简单,科学合理,流程简单,便于操作,预测准确率高,结果直观,通俗易懂;本发明的运算方式具有检测精度高,预测准确率高、计算复杂度小等特点,可以解决X荧光能谱峰值重叠干扰、以及传统仪器测量方法不准确等问题,减少了环境本底的影响,降低了由统计涨落造成的误差,能有效快速的对待测物所含元素进行定量预测。

附图说明

图1为本发明基于PCA-SVR的XRF元素定量分析方法流程图;

图2为本发明标准土壤样品光谱谱图;

图3为本发明基于主成分分析法结果图;

图4为本发明土壤元素含量预测结果图。

具体实施方式

下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。

本实施例提供了一种基于PCA-SVR的XRF元素定量分析方法,其工作流程如图1所示,获得标准土壤样品中元素信息和检出限的具体步骤如下:

步骤1:确定土壤样品集,设所述土壤样品集中有n份土壤样品,分别为样品1、样品2……样品57。取光谱仪能够识别的元素的全部元素,构成该土壤样品所含有的元素集A,最终得到A1~A57共57个元素集,即取A1~A57的并集即得土壤样品集中有含量的元素集A,元素集A中的元素包括在元素周期表12~92号元素中。

步骤2:采用57个国家标准样品作为标样,包括GSS系列土壤成分分析标准物质、GBW系列土壤成分分析标准物质和GSD水系沉积物成分分析标准物质,分别为GSS-1~GSS-27、GSS-32、GBW0070003~GBW0070006、GSD-2a~GSD-33。通过ED-XRF荧光光谱仪利用智能能量色散荧光分析法可以同时得到待测样品的XRF光谱图及样品中所含元素组分值X(或峰计数)和含量值Y,标准土壤样品的XRF光谱图如图2所示。

步骤3:在元素集A中,取所研究的目标元素及其对应干扰元素的并集作为PCA-SVR模型的输入变量,本实施例中的研究对象是23(V)、24(Cr)、25(Mn)、27(Co)、29(Cu)、30(Zn)、33(As)、42(Mo)、48(Cd)、82(Pb)十种的土壤有害元素,本文以Cd元素为例进行详细的元素含量预测说明。部分标准土壤样品成分信息如表1所示。

表1部分标准土壤样品成分信息

以57份标准土壤样品为例说明,记录目标元素的组分含量,此时原始数据收集完毕,详细信息见表2所示。

表2国家标准土壤样品成分信息(ppm)

将目标元素及其干扰元素组成的实测组分值矩阵X

表3目标元素的主要干扰元素

以Cd元素含量预测为例,PCA-SVR模型的输入为一个57×21的组分数据矩阵,即一个包含57个样本的矩阵,每个样本由Cd、V、Ti、As、K、Cr、Se、Fe、Ni、Zn、Sr、Cu、P、Co、Mn、Pb、Ca、Mo、Nb、Ag、Sb二十一个元素(所有目标元素及其对应干扰元素的并集)的组分值组成,其中第一列为单一目标元素(Cd)的组分值,其余20列为其他目标元素及所有干扰元素的组分值,且这20列数据的列位置可以随机排列。同样地,PCA-SVR模型的输出为一个57×1的组分数据矩阵,即一个包含57个样本的矩阵,每个样本由单一目标元素(Cd)的含量值组成。

步骤4:XRF光谱数据标准化。将原始大小为n×m的矩阵X

式中,i为标准化矩阵

步骤5:求标准化矩阵

式中,n为待测样品份数,

步骤6:求标准化矩阵

式中,j为标准化矩阵

步骤7:将m个标准化后的单位特征向量

式中,i=1,2,...,n,j=1,2,...,m,

步骤8:通过非线性函数映射将矩阵X

式中,p=1,2,...,k,k≤m,h

步骤9:为了控制计算速度,减少样本训练中出现的误差,引入了惩罚因子C和松弛变量ξ

式中,w为特征权值向量,C为惩罚因子,ξ

步骤10:运用基于网格搜索的交叉验证法进行参数寻优,训练PCA-SVR模型。通过不断迭代寻找最优参数,得到最优参数惩罚因子C和最优松弛变量ξ

式中,i=1,2,...,n,p=1,2,...,k,α

步骤11:将步骤10中通过计算k个主成分u

式中,

如图3所示,将采用传统的偏最小二乘回归(PLSR)方法和本发明基于PCA-SVR方法得到的RMSE曲线进行比较,PCA-SVR方法在主成分个数为4时为最佳,PLSR方法在主成分个数为8时为最佳;在相同主成分个数的情况下,PCA-SVR方法比PLSR方法的RMSE更小,预测更加准确。

步骤12:当主成分个数为k

式中,y

对于元素集A中其他9种研究对象23(V)、24(Cr)、25(Mn)、27(Co)、29(Cu)、30(Zn)、33(As)、42(Mo)、82(Pb),其元素含量预测方法与元素48(Cd)相同。

将采用传统的偏最小二乘回归(PLSR)方法和本发明基于PCA-SVR方法的标准土壤样品元素决定系数R

表4标准土壤样品元素含量预测的决定系数R

以微量元素Cd为例,其含量预测结果如图4所示,可见相较于偏最小二乘回归(PLSR)方法,基于PCA-SVR的XRF元素定量预测结果更符合元素含量真实结果。说明PCA-SVR算法有效解决了谱线重叠的问题,提高了元素定量分析结果的准确性,体现了本发明方法的优越性。

以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合;本领域的技术人员根据本发明技术方案的技术特征所做出的任何非本质的添加、替换,均属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号