技术领域
本发明涉及数据科学领域,更具体的说,涉及一种自动提取X射线衍射图谱中特征峰信息的方法。
背景技术
分子筛已广泛用于催化裂化、加氢裂化、汽油和柴油加氢改质等石油化工过程,是石油化工行业中应用最广的催化材料。
合成具有高效的分子筛催化剂能产生巨大的经济效益,而高通量合成系统以其高实验吞吐量被用于分子筛的实验研究和开发。
X射线衍射(XRD)图谱被广泛用于表征分子筛等微观晶体结构的手段。传统的手动峰标注需要操作人员逐个将图谱中的峰标注出来,这耗费了大量的人力资本。
因此,目前亟需一种自动提取X射线衍射图谱中特征峰信息的方法。
发明内容
本发明的目的是提供一种自动提取X射线衍射图谱中特征峰信息的方法,解决现有技术对于X射线衍射图谱中特征峰信息难以进行有效自动提取的问题。
为了实现上述目的,本发明提供了一种自动提取X射线衍射图谱中特征峰信息的方法,包括以下步骤:
S1、对X射线衍射图谱进行归一化处理和平滑操作;
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;
S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;
S4、遍历每个峰信号区间进行基线修正;
S5、对修正后的峰信号进行拟合,得到峰信号的信息参数,信息参数包括峰高、峰强度以及峰宽。
在一实施例中,所述步骤S1中,采用高斯滤波对X射线衍射图谱进行平滑操作。
在一实施例中,所述步骤S1,进一步包括以下步骤:
S11、将原始的X射线衍射图谱数据进行归一化处理;
S12、利用高斯滤波对X射线衍射图谱进行滤波操作,得到滤波后的X射线衍射图谱data
在一实施例中,所述步骤S2,进一步包括以下步骤:
S21、将衍射角度按序排列,对X射线衍射图谱data
S22、寻找出标准差图谱data
S23、遍历位置索引max
S24、寻找出标准差图谱data
S25、遍历极大值点位置索引max
S26、分别比较X射线衍射图谱data
在一实施例中,所述步骤S3,剔除掉不是峰的区间,进一步包括以下步骤:
遍历peak
其中,data
data
data
data
在一实施例中,所述步骤S3,将其中相邻的峰区间进行合并,进一步包括以下步骤:
对于peak
其中,peak
在一实施例中,所述步骤S4,进一步包括以下步骤:
S41、遍历peak
S42、遍历每条signal,在左右两端给定宽度的位置寻找最小的强度值包括左侧最小强度值l
S43、利用signal减去bkg得到signal
S44、利用以下公式从左到右更新bkg中的值:
bkg
其中,p_q
S45、重复S43-S44数次得到bkg
signal
在一实施例中,所述步骤S5,进一步包括以下步骤:
遍历signal
在一实施例中,所述高斯、洛伦兹混合函数公式如下:
式中,w
多峰拟合函数如下:
f(x)=f
其中,n为需要拟合的信号中的峰数量。
本发明提出的一种自动提取X射线衍射图谱中特征峰信息的方法,无须手动操作,可以自动化地将XRD图谱中特征峰的峰位置,峰强度以及峰宽信息提取出来,从而大大降低了手动提取峰的人力成本,提升了后续分析的效率。
附图说明
本发明上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变的更加明显,在附图中相同的附图标记始终表示相同的特征,其中:
图1揭示了根据本发明一实施例的自动提取X射线衍射图谱中特征峰信息的方法流程图;
图2揭示了根据本发明一实施例的X射线衍射图谱滤波前后局部对比图;
图3揭示了根据本发明一实施例的X射线衍射图谱标准差与平滑图谱对比图;
图4揭示了根据本发明一实施例的峰可行区域示意图;
图5揭示了根据本发明一实施例的信号基线修正前后对比图;
图6揭示了根据本发明一实施例的信号拟合效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释发明,并不用于限定发明。
XRD图谱中的衍射峰表现出较强的特征性和一致性,可以根据其这种性质,合理的设计出自动化提取峰的方法。
图1揭示了根据本发明一实施例的自动提取X射线衍射图谱中特征峰信息的方法流程图,如图1所示的自动提取X射线衍射(XRD)图谱峰中特征峰信息的方法,具体包括以下步骤:
S1、对X射线衍射图谱进行归一化处理和平滑操作;
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;
S3、对峰可行的区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;
S4、遍历每个峰信号区间进行基线修正;
S5、对修正后的峰信号进行拟合,得到峰信号的信息参数,信息参数包括峰高、峰强度以及峰宽。
下面详细对每一步进行说明。
S1、对X射线衍射图谱进行归一化处理和平滑操作。
对XRD图谱进行归一化处理,再利用高斯滤波进行平滑操作,消除掉一些小的峰的噪声干扰。
原始的XRD图谱包含很多细小的噪声,这些噪声会影响峰的提取过程,利用滤波将这些小的噪声预先去除掉。
所述步骤S1,进一步包括以下步骤:
S11、将原始XRD图谱数据进行归一化处理;
归一化处理,是本领域较为常用的处理算法,一般是指将数据的数值空间从最大到最小区间转换到0~1区间,具体操作为对于每个原始数据,减去该特征维度样本集中的最小值后,再除以转换后数据的最大值。
S12、利用高斯滤波对XRD图谱峰进行滤波操作,得到滤波后的图谱data
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行的区间。
峰值预搜索,将峰所在的位置大致框选出来。峰可行的区间即为可能出现峰的区间。
所述步骤S2,进一步包括以下步骤:
S21、将衍射角度按序排列,从衍射低角度到高角度,对滤波后的图谱data
S22、寻找出新的标准差图谱data
S23、遍历max
S24、寻找出data
S25、遍历max
S26、分别比较data
S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并。
进行峰区间整理,将一些明显不含峰的区间剔除掉,并且相邻的峰应应看成一个整体在后面进行多峰拟合,将其合并。
更进一步的,剔除掉不是峰的区间,进一步包括以下步骤:
遍历peak
data
data
data
更进一步的,将其中相邻的峰区间进行合并,进一步包括以下步骤:
对于peak
其中,peak
S4、遍历每个峰信号区间进行基线修正。
XRD图谱会出现基线漂移的现象,需要将其修正。
所述步骤S4,进一步包括以下步骤:
S41、遍历peak
S42、遍历每条signal,在左右两端给定宽度的位置寻找最小的强度值,包括左侧最小强度值l
S43、利用signal减去bkg得到signal
S44、利用以下公式从左到右更新bkg中的值:
bkg
其中,p_q
S45、重复(3)-(4)5次,得到bkg
signal
S5、对修正后的峰信号进行拟合,得到峰高、峰强度以及峰宽信息。
进行多峰拟合,利用具体的峰形函数将峰的具体参数拟合出来。
所述步骤S5,进一步包括以下步骤:
遍历signal
所述高斯、洛伦兹混合函数公式如下:
式中,w
多峰拟合函数如下:
f(x)=f
其中,n为需要拟合的信号中的峰数量。
本发明提出的自动提取X射线衍射图谱中特征峰信息的方法,在进行XRD峰信息的提取时,首先采用步骤S1对原始图谱进行平滑,然后采用步骤S2进行峰位置的预搜索,得到一系列可能存在峰的区间,然后依据步骤S3对这些可能含有峰的区间进行整理,剔除掉不含峰的区间,并将相邻的峰合并在一个信号区间里。在经过步骤S3找出所有的峰区间后,利用步骤S4消除信号中的基线漂移造成的干扰,最后利用步骤S5进行信号的拟合,得到每个峰的三个参数(峰位置、峰强度、峰宽)。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,该领域的专业技术人员根据本发明的内容做出的一些非本质的改进和调整,仍属于本发明的保护范围。
以下通过一张xrd图谱峰信息提取的实施例来说明本发明,具体步骤包括:
步骤S1、数据平滑。
将数据除以最大强度值得到最大峰强为1的标准化图谱;
利用长度为13,标准差为2的高斯滤波核在整个图谱上进行滤波得到data
步骤S2、峰值预搜索。
采用长度为13的滑动窗口划过整个图谱,计算窗口内的标准差,得到标准图谱如图3所示,图3揭示了根据本发明一实施例的X射线衍射图谱标准差与平滑图谱对比图。
找出其中的极大值点,以0.1的阈值筛选掉一部分极大值点。将这些极大值点左右20宽度的区间设为峰可行区间,如图4所示,图4揭示了根据本发明一实施例的峰可行区域示意图。
找出data
步骤S3、峰区间整理。
剔除掉峰值和左右端值之差小于0.1的区间,并以7的宽度判别相邻区间并将相邻区间合并得到peak
步骤S4、基线修正。
从peak
步骤S5、多峰拟合。
以w
本发明提出的一种自动提取X射线衍射图谱中特征峰信息的方法,无须手动操作,可以自动化地将XRD图谱中特征峰的峰位置,峰强度以及峰宽信息提取出来,从而大大降低了手动提取峰的人力成本,提升了后续分析的效率。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
机译: 1.一种用于分离和检测药物合成中的COD乙酸盐的方法,该方法包括乙酸拟杆菌和一种或多种可产生X射线衍生物的组分,并且这些组分具有接近于乙酸类细菌素的干扰峰或特征峰。
机译: 一种通过磁性层的电泳产生用于测量平动层,特别是用于将数字信息存储在数据处理系统中的层磁图谱的方法
机译: 一种通过磁性层的电泳产生用于测量平动层,特别是用于将数字信息存储在数据处理系统中的层磁图谱的方法