首页> 中国专利> 基于DA优化的汽油精炼过程中辛烷值损失预测方法与系统

基于DA优化的汽油精炼过程中辛烷值损失预测方法与系统

摘要

本发明提供一种基于DA优化的汽油精炼过程中辛烷值损失预测方法与系统,包括:获取汽油精炼样本数据;对样本数据进行预处理;基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量;将获得样本数据分为训练集和测试集;以精炼汽油辛烷值和含硫量为约束条件,基于DA优化的BP神经网络进行模型训练学习,获得第一辛烷值预测模型;在测试集的基础上,对获得的第一辛烷值预测模型进行测试,在满足预设的预测精度基础上最终输出模型作为辛烷值的预测模型,否则进行模型优化;以辛烷值的预测模型对实时获得的汽油精炼数据进行辛烷值预测输出。

著录项

  • 公开/公告号CN112307001A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利权人 中南大学;

    申请/专利号CN202011202434.1

  • 发明设计人 姚晶晶;李海普;张凤羽;苏新超;

    申请日2020-11-02

  • 分类号G06F16/215(20190101);G06K9/62(20060101);G06N3/08(20060101);

  • 代理机构32404 南京行高知识产权代理有限公司;

  • 代理人王菊花

  • 地址 410083 湖南省长沙市岳麓区麓山南路932号

  • 入库时间 2023-06-19 09:46:20

说明书

技术领域

本发明涉及汽油精炼技术领域,具体而言涉及一种基于DA优化的汽油精炼过程中辛烷值损失预测方法与系统。

背景技术

汽油是用量最大的石油产品之一,是一种重要的引擎燃料。随着社会的高速发展,导致汽油需求量不断提升,同时其不完全燃烧造成的环境问题日趋严重。如何有效降低汽油中的硫、烯烃含量,并同时较好保持其辛烷值成为研究热点。因此,运用科学的管理方法,结合数据挖掘技术指导汽油清洁化具有重要意义。

发明内容

本发明第一方面的目的在于提供一种基于DA优化的汽油精炼过程中辛烷值损失预测方法,包括以下步骤:

步骤1、获取汽油精炼样本数据;

步骤2、对样本数据进行预处理,通过数据清洗,去除异常数据和无效数据;

步骤3、基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量;所述操作变量包括五个维度的基本属性作为操作变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质、精炼工艺参数性质以及精炼汽油性质;

步骤4、将获得操作变量样本数据进行分类,分为训练集和测试集;

步骤5、以精炼汽油辛烷值和含硫量为约束条件,在训练集的基础上,基于DA优化的BP神经网络进行模型训练学习,获得第一辛烷值预测模型;

步骤6、在测试集的基础上,对获得的第一辛烷值预测模型进行测试,在满足预设的预测精度基础上最终输出模型作为辛烷值的预测模型,否则返回步骤5通过BP超参数调节进行模型优化,直到满足预设的预测精度;

步骤7、以最终输出的辛烷值的预测模型对实时获得的汽油精炼数据进行辛烷值预测输出。

优选地,在所述步骤3中,筛选出变量作为操作变量的具体操作包括:

计算各输入的变量之间的皮尔森相关系数,将彼此间皮尔森相关系数超过设定阈值的特征划归为相同类;

计算每个类内的各输入的变量与输出的最大互信息数并取均值,作为该类与输出结果间的相关程度度量,选择与结果相关程度最高的指定数目的类;

从被选择的多个类中,选择与结果间最大互信息数最高的一个特征保留,将所有被保留的特征作为预测模型的输入,即作为操作变量。

优选地,在所述步骤5中,以满足精炼前后汽油辛烷值损失控制在30%以内且硫含量小于等于5μg/g为约束条件,建立第一辛烷值预测模型。

优选地,在步骤5中,建立第一辛烷值预测模型的具体操作包括以下过程:

1)结合经验公式获得神经网络的隐含层节点数量n

2)基于最小估测值和最大估测值关系确定隐含层节点数量n

3)将神经网络超参数映射为整型向量,神经网络的超参数包括:隐层节点个数hidenum、层间传递函数TF1类型、层间传递函数TF2类型、反向传播训练函数BTF类型、性能评估函数BP类型;

4)将神经网络超参数的整型向量作为蜻蜓算法的解向量,使蜻蜓算法仅搜索整数解,将初始化以及迭代结束新产生的解向量取整,保证搜索空间为整数空间;

5)将蜻蜓算法的解向量作为评价函数的输入,将解向量逆映射为神经网络的超参数并据此创建神经网络;利用训练集的样本进行神经网络训练后,使用测试集决定系数的相反数作为评价指标返回值;将训练好的网络结构也作为返回值;

6)若模型预测性能满足预设的预测精度,则停止训练,输出模型作为最终输出的辛烷值的预测模型;否则,则检查输入特征及输出结果的分布,删除最明显的离群值对应样本后,重新训练模型,直到满足预设的预测精度。

本发明的第二方面还提出一种基于DA优化的汽油精炼过程中辛烷值损失预测系统,包括:

用于获取汽油精炼样本数据的模块;

用于对样本数据进行预处理,通过数据清洗,去除异常数据和无效数据的模块;

用于基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量的模块;所述操作变量包括五个维度的基本属性作为操作变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质、精炼工艺参数性质以及精炼汽油性质;

用于将获得操作变量样本数据进行分类,分为训练集和测试集的模块;

用于以精炼汽油辛烷值和含硫量为约束条件,在训练集的基础上,基于DA优化的BP神经网络进行模型训练学习,获得第一辛烷值预测模型的模块;

用于在测试集的基础上,对获得的第一辛烷值预测模型进行测试,在满足预设的预测精度基础上最终输出模型作为辛烷值的预测模型,否则返回步骤5通过BP超参数调节进行模型优化,直到满足预设的预测精度的模块;

用于以最终输出的辛烷值的预测模型对实时获得的汽油精炼数据进行辛烷值预测输出的模块。

优选地,筛选出N个变量作为操作变量的具体操作包括:

计算各输入的变量之间的皮尔森相关系数,将彼此间皮尔森相关系数超过设定阈值的特征划归为相同类;

计算每个类内的各输入的变量与输出的最大互信息数并取均值,作为该类与输出结果间的相关程度度量,选择与结果相关程度最高的指定数目的类;

从被选择的多个类中,选择与结果间最大互信息数最高的一个特征保留,将所有被保留的特征作为预测模型的输入,即作为操作变量。

优选地,以满足精炼前后汽油辛烷值损失控制在30%以内且硫含量小于等于5μg/g为约束条件,建立第一辛烷值预测模型。

优选地,建立第一辛烷值预测模型的具体操作包括以下过程:

1)结合经验公式获得神经网络的隐含层节点数量n

2)基于最小估测值和最大估测值关系确定隐含层节点数量n

3)将神经网络超参数映射为整型向量,神经网络的超参数包括:隐层节点个数hidenum、层间传递函数TF1类型、层间传递函数TF2类型、反向传播训练函数BTF类型、性能评估函数BP类型;

4)将神经网络超参数的整型向量作为蜻蜓算法的解向量,使蜻蜓算法仅搜索整数解,将初始化以及迭代结束新产生的解向量取整,保证搜索空间为整数空间;

5)将蜻蜓算法的解向量作为评价函数的输入,将解向量逆映射为神经网络的超参数并据此创建神经网络;利用训练集的样本进行神经网络训练后,使用测试集决定系数的相反数作为评价指标返回值;将训练好的网络结构也作为返回值;

6)若模型预测性能满足预设的预测精度,则停止训练,输出模型作为最终输出的辛烷值的预测模型;否则,则检查输入特征及输出结果的分布,删除最明显的离群值对应样本后,重新训练模型,直到满足预设的预测精度。

由本发明的技术方案,其与现有技术相比的显著的有益效果在于:

本发明提出一种MIC-DA-BPNN融合预测模型,明晰炼油工艺中变量的高度非线性和相互强耦联关系,解决了传统的数据关联模型中不能充分提取特征和不能适应于复杂特殊环境下的辛烷值损失预测问题;

本发明构建的融合预测模型,基于限制条件下的辛烷值损失降幅预测模型,确定了主要变量的优化,保证了不同原料性质下的最优解。

应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。

结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。

附图说明

附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:

图1是本发明的基于DA优化的汽油精炼过程中辛烷值损失预测方法的流程图。

图2是本发明的基于DA优化的汽油精炼过程中辛烷值损失预测方法中筛选操作变量的流程图。

图3是本发明的基于DA优化的汽油精炼过程中辛烷值损失预测方法中相关系数计算结果示意图。

具体实施方式

为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。

在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定意在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。

结合图示,根据本发明示例性实施例提出一种基于DA优化的汽油精炼过程中辛烷值损失预测方法,包括以下步骤:

步骤1、获取汽油精炼样本数据;

步骤2、对样本数据进行预处理,通过数据清洗,去除异常数据和无效数据;

步骤3、基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量;所述操作变量包括五个维度的基本属性作为操作变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质、精炼工艺参数性质以及精炼汽油性质;

步骤4、将获得操作变量样本数据进行分类,分为训练集和测试集;

步骤5、以精炼汽油辛烷值和含硫量为约束条件,在训练集的基础上,基于DA优化的BP神经网络进行模型训练学习,获得第一辛烷值预测模型;

步骤6、在测试集的基础上,对获得的第一辛烷值预测模型进行测试,在满足预设的预测精度基础上最终输出模型作为辛烷值的预测模型,否则返回步骤5通过BP超参数调节进行模型优化,直到满足预设的预测精度;

步骤7、以最终输出的辛烷值的预测模型对实时获得的汽油精炼数据进行辛烷值预测输出。

优选地,在所述步骤2中,采用最大最小的限幅法剔除不具有参考意义的数据,再根据拉依达准则去除异常值。

优选地,在所述步骤3中还包括:检查被选中特征的分布,若存在显著的离群点,则删除对应的样本。

下面,我们将结合具体的示例,更加具体的对上述过程进行示例性说明。

在获取到原始的汽油精炼数据后,首先根据汽车精炼过程涉及的原料数据、待生吸附剂数据、再生吸附剂数据、精炼工艺参数数据以及精炼汽油数据,用最大最小的限幅方法剔除一部分没有参考意义的数据,再根据拉依达准则(3σ准则)去除异常值,然后再将7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质等变量数据汇总,计算RON损失,最终形成367个变量数据和RON损失,RON损失不作为变量。

由于大部分变量数据正常,但无效数据点会影响模型的建立,因此对原始数据进行处理后才可以使用。但是由于炼油工艺过程的复杂性以及设备的多样性,它们的操作变量(也即工艺流程的控制变量)之间具有高度非线性和相互强耦联的关系,因此需要检测操作变量间非线性相关系数和强耦合关系,以及确定7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质的相互关系,本发明基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量。

在可选的实例中,结合图2、图3所示,在所述步骤3中,筛选出变量作为操作变量的具体操作包括:

计算各输入的变量之间的皮尔森相关系数,将彼此间皮尔森相关系数超过设定阈值的特征划归为相同类;

计算每个类内的各输入的变量与输出的最大互信息数并取均值,作为该类与输出结果间的相关程度度量,选择与结果相关程度最高的指定数目的类;

从被选择的多个类中,选择与结果间最大互信息数最高的一个特征保留,将所有被保留的特征作为预测模型的输入,即作为操作变量。

结合图3所示,在本发明的示例性实施例中,操作变量具有非线性关系,采用非线性处理能力较强的BP神经网络模型来预测辛烷值损失。

BP神经网络,一般指全连接神经网络,即相邻层间任意两个神经元之间均存在连接。本发明选择具有1个隐含层的神经网络。含有一个单隐含层的BP神经网络,只要隐含层节点数足够多,理论上即可表示出任意的非线性关系。该3层网络的数据前向传播过程为,输入矩阵乘以第一层连接权重矩阵后加上偏置1,经过隐含层传递函数,得到隐含层矩阵,隐含层矩阵乘以第二层连接权重矩阵加上偏置2,经过输出层传递函数,得到输出矩阵。

该网络的反向传播(Back propagation)过程为,以某种性能最优为目标,通过学习训练函数进行网络参数的更新。因此BP网络超参数主要包括:隐含层节点数目、隐含层传递函数类型、输出层传递函数类型、学习训练函数类型、性能函数类型。

1、根据经验确定隐层节点数范围

神经网络隐层节点的选定的一般原则是训练样本数必须超过网络模型的连接权数,一般为其2~10倍,对于输入为30维,输出为1维的网络,连接数为31倍隐层节点数,据此可确定隐层节点数需小于10.48。此外,也根据4种经验公式粗略确定隐含层节点数目范围。

假设k=325为样本数,n=30为输入神经元个数,m=1为输出神经元个数,n1为隐层节点数,经验公式如下:

其中,同时需满足

据此确定的n

根据fangfaGorman定理

n

据此确定的n

根据Kolmogorov定理

n

据此确定的n

根据经验公式

据此确定的n

2、将全部超参数映射为整型变量,采用蜻蜓算法优化

隐层节点数本身即为整数变量,根据上述经验将搜索范围设为5~10。

将隐含层传递函数类型等非整型变量,映射为整型变量,例如purelin函数类型映射为1,tansig函数类型映射为2。

然后,采用蜻蜓算法,以测试集的R

隐含层节点数目:8

隐含层传递函数类型:tansig

输出层传递函数类型:tansig

学习训练函数类型:traincgp

性能函数类型:sae。

作为可选的方式,在具体实现过程中,建立第一辛烷值预测模型的具体操作包括以下过程:

1)结合经验公式获得神经网络的隐含层节点数量n

2)基于最小估测值和最大估测值关系确定隐含层节点数量n

3)将神经网络超参数映射为整型向量,神经网络的超参数包括:隐层节点个数hidenum、层间传递函数TF1类型、层间传递函数TF2类型、反向传播训练函数BTF类型、性能评估函数BP类型;

4)将神经网络超参数的整型向量作为蜻蜓算法的解向量,使蜻蜓算法仅搜索整数解,将初始化以及迭代结束新产生的解向量取整,保证搜索空间为整数空间;

5)将蜻蜓算法的解向量作为评价函数的输入,将解向量逆映射为神经网络的超参数并据此创建神经网络;利用训练集的样本进行神经网络训练后,使用测试集决定系数的相反数作为评价指标返回值;将训练好的网络结构也作为返回值;

6)若模型预测性能满足预设的预测精度,则停止训练,输出模型作为最终输出的辛烷值的预测模型;否则,则检查输入特征及输出结果的分布,删除最明显的离群值对应样本后,重新训练模型,直到满足预设的预测精度。

其中,在建立预测模型过程中,以满足精炼前后汽油辛烷值损失控制在30%以内且硫含量小于等于5μg/g为约束条件,建立第一辛烷值预测模型。

由此,本发明针对汽油精制过程中辛烷值损失的问题,构建了MIC-DA-BPNN-DA融合预测模型,即基于最大信息系数(MIC)、蜻蜓算法(DA)、BP神经网络(BPNN)的预测模型,提取了具有独立性和代表性的变量,有效预测辛烷值的损失,验证组合模型的可靠性和精确度,并在约束条件下通过DA算法对主要变量操作方案进行优化。

本发明的第二方面还提出一种基于DA优化的汽油精炼过程中辛烷值损失预测系统,包括:

用于获取汽油精炼样本数据的模块;

用于对样本数据进行预处理,通过数据清洗,去除异常数据和无效数据的模块;

用于基于皮尔森相关系数和最大信息系数构建识别差异表达操作变量的方法,获取样本数据中各变量之间的关联关系,筛选出N个变量作为操作变量的模块;所述操作变量包括五个维度的基本属性作为操作变量,分别为原料性质、待生吸附剂性质、再生吸附剂性质、精炼工艺参数性质以及精炼汽油性质;

用于将获得操作变量样本数据进行分类,分为训练集和测试集的模块;

用于以精炼汽油辛烷值和含硫量为约束条件,在训练集的基础上,基于DA优化的BP神经网络进行模型训练学习,获得第一辛烷值预测模型的模块;

用于在测试集的基础上,对获得的第一辛烷值预测模型进行测试,在满足预设的预测精度基础上最终输出模型作为辛烷值的预测模型,否则返回步骤5通过BP超参数调节进行模型优化,直到满足预设的预测精度的模块;

用于以最终输出的辛烷值的预测模型对实时获得的汽油精炼数据进行辛烷值预测输出的模块。

优选地,筛选出N个变量作为操作变量的具体操作包括:

计算各输入的变量之间的皮尔森相关系数,将彼此间皮尔森相关系数超过设定阈值的特征划归为相同类;

计算每个类内的各输入的变量与输出的最大互信息数并取均值,作为该类与输出结果间的相关程度度量,选择与结果相关程度最高的指定数目的类;

从被选择的多个类中,选择与结果间最大互信息数最高的一个特征保留,将所有被保留的特征作为预测模型的输入,即作为操作变量。

优选地,以满足精炼前后汽油辛烷值损失控制在30%以内且硫含量小于等于5μg/g为约束条件,建立第一辛烷值预测模型。

优选地,建立第一辛烷值预测模型的具体操作包括以下过程:

1)结合经验公式获得神经网络的隐含层节点数量n

2)基于最小估测值和最大估测值关系确定隐含层节点数量n

3)将神经网络超参数映射为整型向量,神经网络的超参数包括:隐层节点个数hidenum、层间传递函数TF1类型、层间传递函数TF2类型、反向传播训练函数BTF类型、性能评估函数BP类型;

4)将神经网络超参数的整型向量作为蜻蜓算法的解向量,使蜻蜓算法仅搜索整数解,将初始化以及迭代结束新产生的解向量取整,保证搜索空间为整数空间;

5)将蜻蜓算法的解向量作为评价函数的输入,将解向量逆映射为神经网络的超参数并据此创建神经网络;利用训练集的样本进行神经网络训练后,使用测试集决定系数的相反数作为评价指标返回值;将训练好的网络结构也作为返回值;

6)若模型预测性能满足预设的预测精度,则停止训练,输出模型作为最终输出的辛烷值的预测模型;否则,则检查输入特征及输出结果的分布,删除最明显的离群值对应样本后,重新训练模型,直到满足预设的预测精度。

应当理解,本发明的实施例中,所使用的操作变量如下:

1、关于原料性质:原料硫含量(ug/g)、原料辛烷值(RON)、原料饱和烃(v%,烷烃+环烷烃)、原料烯烃(v%)、原料烯烃(v%)、原料芳烃(v%)、原料(溴值,gBr/100g)、原料密度(20℃),kg/m

2、待生吸附剂性质:焦炭,wt%、S,wt%

3、再生吸附剂性质:焦炭,wt%、S,wt%

4、精炼工艺参数性质:氢油比、反应过滤器压差、还原器压力、还原器流化氢气流量、反应器上部温度、反应器底部温度、反应器顶部压力、反应器顶底压差、再生器藏量、加氢裂化轻石脑油进装置流量、加氢裂化轻石脑油进装置累积流量、汽油产品去气分累积流量、8.0MPa氢气至循环氢压缩机入口、8.0MPa氢气至循环氢压缩机入口、8.0MPa氢气至反吹氢压缩机出口、8.0MPa氢气至反吹氢压缩机出口、D101原料缓冲罐压力。

5、精炼汽油性质:精炼后汽油硫含量(ug/g)、原料辛烷值。

虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号