首页> 中国专利> 一种电网企业经营投入的优化分配系统及方法

一种电网企业经营投入的优化分配系统及方法

摘要

本发明提供了一种电网企业经营投入的优化分配系统及方法。包括:S101,通过存储模块存储影响因素的当期指标和影响因素的滞后指标;S102,通过处理模块输出计算结果;S103,通过控制模块取舍相对应的影响因素指标;S104,处理模块对影响因素指标降维,平衡各类别指标的数量;S105,训练随机森林模型,通过电网企业经营投入优化分配模型预测经营投入的理论值;S106,处理模块对预测的经营投入理论值进行优化调整。该优化分配系统改善了现有技术中忽略了电网企业经济效益和电网运行情况等影响因素对电网投资的影响,聚焦于局部案例分析的问题。

著录项

  • 公开/公告号CN113240165A

    专利类型发明专利

  • 公开/公告日2021-08-10

    原文格式PDF

  • 申请/专利权人 国网能源研究院有限公司;

    申请/专利号CN202110475242.6

  • 申请日2021-04-29

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06Q50/06(20120101);

  • 代理机构11543 北京八月瓜知识产权代理有限公司;

  • 代理人李斌

  • 地址 102209 北京市昌平区未来科技城滨河大道18号A栋三、四层

  • 入库时间 2023-06-19 12:10:19

说明书

技术领域

本发明涉及电网投资规划技术领域,尤其是涉及一种电网企业经营投入的优化分配系统及方法。

背景技术

能源电力作为资金密集型行业,其发展投资是影响经济发展的关键。在全球疫情蔓延和经济下行压力下,稳定的电网投资是稳定经济发展的核心。因此,在电力需求面临较大的不确定性与用电成本持续下降的情况下,综合考虑影响电网企业经营投入的地区发展因素和内部管理因素,建立电网企业经营投入优化分配模型科学预测和分配电网企业的经营投入,做到精准投资十分重要。

目前,对于电网企业经营投入的优化分配方法涉及到的投资精准性策略领域的研究成果较少,主要侧重于监管期内输配电价与电网投资关系论证方面,注重输配电价改革政策对电网投资的影响考量,缺乏从电网企业实际运营过程出发,忽略了电网企业经济效益和电网运行情况等影响因素对电网投资的影响。同时,在电网企业经营投入的优化分配方法方面,主要聚焦于局部案例分析,例如对全国某个区域电网的研究,缺乏对内外部环境的综合考量,缺乏相应的普遍性,不具备有效的自上而下的可实施性。

发明内容

本发明的目的在于提供一种电网企业经营投入的优化分配系统及方法,该优化分配系统能够解决现有技术中忽略了电网企业经济效益和电网运行情况等影响因素对电网投资的影响,聚焦于局部案例分析的问题。

为了实现上述目的,本发明提供如下技术方案:

一种电网企业经营投入的优化分配方法,包括:

S101,通过存储模块存储影响因素的当期指标和影响因素的滞后指标;

S102,通过处理模块计算影响因素的当期指标及滞后指标的变异系数、相关系数和变量重要性评估并输出计算结果;

S103,通过控制模块根据所述计算结果判断是否取舍相对应的影响因素指标;

S104,处理模块通过主成分分析方法对所述影响因素指标降维,平衡各类别指标的数量;

S105,训练随机森林模型,以资本性投入和成本性投入为因变量,各类别指标降维形成的主成分为自变量,通过随机森林模型构建电网企业经营投入优化分配模型,通过所述电网企业经营投入优化分配模型预测经营投入的理论值;

S106,处理模块通过约束条件、投入产出效率水平和历史经营投入水平对预测的经营投入理论值进行优化调整。

在上述技术方案的基础上,本发明还可以做如下改进:

进一步地,所述S101还包括,S1011,将所述影响因素划分为经济社会发展类、产品行业发展类、公司经营管理类和电网运行发展类。

进一步地,所述S103还包括,S1031,通过控制模块判断所述变异系数是否小于指定值,若是,控制所述存储模块删除对应的影响因素指标;

S1032,通过控制模块判断所述影响因素指标与经营投入的相关关系是否显著,若是,控制所述存储模块保留对应的所述影响因素指标;

S1033,训练随机森林模型,通过处理模块计算每个影响因素当期指标及滞后指标的变量重要性,并按降序排序,通过控制模块根据重要性控制所述存储模块剔除相应比例的影响因素指标。

进一步地,所述S104还包括,S1041,通过处理模块将p维原始变量转变为标准化变量{z

S1042,通过处理模块得出特征方程|R-λI

S1043,所述处理模块根据所述特征根λ

进一步地,所述S105还包括,S1051,分别对行列两个方向添加随机过程,行方向上采用放回抽样获得训练集,列方向上采用无放回抽样获得特征子集,依此得到最优划分点。

进一步地,所述S105还包括,S1052,采用二分递归方式进行分裂,将每个属性分裂为两个子属性,样本容量为n的样本集合S会分裂为样本容量分别为n

进一步地,所述S106还包括,S1061,根据产出定投入,加大投入产出效率高的单位投资力度,提升公司经营绩效;针对投入产出效率高的单位,比较核价投资和理论值,取较大值,得到第一方案;

S1062,统筹兼顾投资能力和电网建设需求,合理安排各单位总控规模;通过调节投入规模理论值和历史值加权系数实现,即a*历史经营投入+b*经营投入理论预测,a+b=1,得到第二方案;

S1063,以规划投资、核价投资、投资能力为约束,严格控制投资规模,保持电网经营发展稳定,得到第三方案。

一种电网企业经营投入的优化分配系统,包括:

存储模块,其存储影响因素的当期指标和影响因素的滞后指标;

处理模块,其与所述存储模块电性相连,用于根据所述当期指标和滞后指标计算变异系数、相关系数和变量重要性评估并得到计算结果;通过主成分分析方法对所述影响因素指标降维,平衡各类别指标的数量;

控制模块,其与所述处理模块和所述存储模块电性相连,用于根据计算结果输出控制所述存储模块删除对应的影响因素指标;

随机森林模型,以资本性投入和成本性投入为因变量,各类别指标降维形成的主成分为自变量,通过随机森林模型构建电网企业经营投入优化分配模型,通过所述电网企业经营投入优化分配模型预测经营投入的理论值;

所述处理模块与所述随机森林模型电性相连,所述处理模块用于通过约束条件、投入产出效率水平和历史经营投入水平对预测的经营投入理论值进行优化调整。

进一步地,所述电网企业经营投入的优化分配系统还包括用户终端,所述用户终端与所述处理模块电性相连,用于接收所述处理模块输出的优化调整方案。

本发明具有如下优点:

本发明中的电网企业经营投入的优化分配系统及方法,在以往研究的基础上,综合考虑影响电网企业经营投入的地区发展因素和内部管理因素,建立基于随机森林模型的电网企业经营投入优化分配模型,科学预测和分配电网企业的经营投入,并给出三种情形下的调整方案。较以往其他研究具有以下优点:1、充分考虑了影响电网企业经营投入的地区发展因素和内部管理因素。2、能够直接对各单位经营投入进行分配。3、给出了结合实际形成的高、中、低等三套较为全面的调整方案;解决了现有技术中忽略了电网企业经济效益和电网运行情况等影响因素对电网投资的影响,聚焦于局部案例分析的问题。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中电网企业经营投入的优化分配方法的流程图;

图2为本发明实施例中S101的流程图;

图3为本发明实施例中S103的流程图;

图4为本发明实施例中S104的流程图;

图5为本发明实施例中S105的流程图;

图6为本发明实施例中S106的流程图;

图7为本发明实施例中电网企业经营投入的优化分配方法中影响因素类别的数据图;

图8为本发明实施例中影响因素指标的变异系数的数据图;

图9为本发明实施例中影响因素指标与发展投入规模相关系数的数据图;

图10为本发明实施例中影响因素指标重要性评估的数据图;

图11为本发明实施例中影响因素指标主成分降维结果的数据图;

图12为本发明实施例中各方面影响因素重要性评估的数据图;

图13为本发明实施例中模型预测效果评价的数据图;

图14为本发明实施例中电网企业经营投入的优化分配系统的控制原理图。

附图标记说明:

存储模块10,处理模块20,控制模块30,随机森林模型40,用户终端50。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种电网企业经营投入的优化分配方法,包括:

S101,存储模块存储当期指标和滞后指标;

本步骤中,通过存储模块10存储影响因素的当期指标和影响因素的滞后指标;

S102,处理模块输出计算结果;

本步骤中,通过处理模块20计算影响因素的当期指标及滞后指标的变异系数、相关系数和变量重要性评估并输出计算结果;

(1)变异系数

变异系数是原始数据标准差与原始数据平均数的比,可以衡量数据离散程度大小。本发明计算每个影响因素当期指标及滞后指标的变异系数,当变异系数过小时,认为影响因素指标在各时期、各单位间没有显著差异,删除该影响因素指标。反之,认为影响因素指标在各时期、各单位间具有显著差异,保留该影响因素指标。

(2)相关系数

本发明利用相关系数显著性检验筛选影响因素指标。若影响因素指标与经营投入的相关关系显著,保留该影响因素指标。反之,认为影响因素指标与经营投入规模的相关关系不显著,删除该影响因素指标。

(3)变量重要性评估

变量重要性评估是随机森林模型40建模过程中产生的特有中间产品,其原理是考察每个自变量在随机森林中的每颗树上做了多大的贡献,然后计算平均值,比较各自变量的贡献大小。自变量重要性的计算方法是,将模型中某个变量替换为随机噪声,考察袋外数据准确率下降程度,如果袋外数据准确率大幅度下降,说明这个自变量对于样本的预测结果有很大影响,进而说明重要程度比较高。本发明构造随机森林模型40,计算每个影响因素当期指标及滞后指标的变量重要性,并按降序排序,依据重要性剔除相应比例的影响因素指标。

S103,取舍影响因素指标;

本步骤中,通过控制模块30根据所述计算结果判断是否取舍相对应的影响因素指标;

S104,对影响因素指标降维;

本步骤中,处理模块20通过主成分分析方法对所述影响因素指标降维,平衡各类别指标的数量;

本发明采用主成分分析对影响因素指标进行降维,平衡各类别指标的数量。主成分分析设法将原始变量线性组合成一组相互无关的主成分,在确保不损失过多信息的条件下,选取少数主成分替代原始变量。

S105,预测经营投入的理论值;

本步骤中,训练随机森林模型40,以资本性投入和成本性投入为因变量,各类别指标降维形成的主成分为自变量,通过随机森林模型40构建电网企业经营投入优化分配模型,通过所述电网企业经营投入优化分配模型预测经营投入的理论值;

随机森林模型40是解决分类和预测问题的优秀算法之一,在实践中同样显示出其优越性。因此,选取随机森林模型40作为公司发展投入规模优化模型。

S106,对预测的经营投入理论值进行优化调整;

本步骤中,处理模块20通过约束条件、投入产出效率水平和历史经营投入水平对预测的经营投入理论值进行优化调整。

在上述技术方案的基础上,本发明还可以做如下改进:

如图2和图7所示,进一步地,所述S101还包括,S1011,影响因素划分类别;

本步骤中,将所述影响因素划分为经济社会发展类、产品行业发展类、公司经营管理类和电网运行发展类。

本发明将电网企业经营投入的影响因素划分为经济社会发展类、产品行业发展类、公司经营管理类、电网运行发展类等四个类别。经济社会发展类因素代表地区经济社会发展水平,涵盖经济发展和社会发展两个方面,可以通过人均GDP、工业增加值、进出口总额、第三产业增加值占比、居民人均可支配收入、全社会固定资产投资、社会消费品零售总额、城镇登记失业率等指标代表。

产品行业发展类因素代表能源电力行业发展水平,可以通过电力/蒸汽/热水生产和供应业投资、行业发电量、全社会用电量等指标代表。公司经营管理类因素代表公司计划实施和经营发展的水平,涵盖规划实施、经营效益和运行效率三个方面,可以通过公司供电量、业扩完成情况、营业收入、利润总额、资产总额、资产负债率、可控费用、经济增加值、净资产收益率、职工人数、全员劳动生产率等指标代表。电网运行发展类因素代表地区经济社会发展水平,可以通过线损率、电网发电量、发电设备容量、最大峰谷差等指标代表。

如图3所示,所述S103还包括,S1031,控制模块根据变异系数取舍影响因素指标;

本步骤中,通过控制模块30判断所述变异系数是否小于指定值,若是,控制所述存储模块10删除对应的影响因素指标;

S1032,控制模块根据影响因素指标与经营投入的相关关系取舍影响因素指标;

本步骤中,通过控制模块30判断所述影响因素指标与经营投入的相关关系是否显著,若是,控制所述存储模块10保留对应的所述影响因素指标;

S1033,控制模块根据重要性取舍影响因素指标;

本步骤中,训练随机森林模型40,通过处理模块20计算每个影响因素当期指标及滞后指标的变量重要性,并按降序排序,通过控制模块30根据重要性控制所述存储模块10剔除相应比例的影响因素指标。

如图4所示,所述S104还包括,S1041,得到相关系数矩阵;

本步骤中,通过处理模块20将p维原始变量转变为标准化变量{z

S1042,得出对应的特征向量;

本步骤中,通过处理模块20得出特征方程|R-λI

S1043,得出主成分;

本步骤中,所述处理模块20根据所述特征根λ

F

其中,p是变量个数,m是选取的主成分个数,m≤p。Tm是累计贡献率,取值范围为0%至100%。λi是第i个特征根,p个特征根的求和等于p。Fi是第i个主成分,{a

如图5所示,所述S105还包括,S1051,对行列两个方向添加随机过程;

本步骤中,分别对行列两个方向添加随机过程,行方向上采用放回抽样获得训练集,列方向上采用无放回抽样获得特征子集,得到最优划分点。

进一步地,所述S105还包括,S1052,采用二分递归方式进行分裂;

本步骤中,采用二分递归方式进行分裂,将每个属性分裂为两个子属性,样本容量为n的样本集合S会分裂为样本容量分别为n

子集合S

Gini

子集中因变量的变异R(S

如图6所示,所述S106还包括,S1061,得到第一方案;

本步骤中,根据产出定投入,加大投入产出效率高的单位投资力度,提升公司经营绩效;针对投入产出效率高的单位,比较核价投资和理论值,取较大值,得到第一方案;

S1062,得到第二方案;

本步骤中,统筹兼顾投资能力和电网建设需求,合理安排各单位总控规模;通过调节投入规模理论值和历史值加权系数实现,即a*历史经营投入+b*经营投入理论预测,a+b=1,得到第二方案;

S1063,得到第三方案;

本步骤中,以规划投资、核价投资、投资能力为约束,严格控制投资规模,保持电网经营发展稳定,得到第三方案。

如图14所示,一种电网企业经营投入的优化分配系统,包括:

存储模块10,其存储影响因素的当期指标和影响因素的滞后指标;

处理模块20,其与所述存储模块10电性相连,用于根据所述当期指标和滞后指标计算变异系数、相关系数和变量重要性评估并得到计算结果;通过主成分分析方法对所述影响因素指标降维,平衡各类别指标的数量;

控制模块30,其与所述处理模块20和所述存储模块10电性相连,用于根据计算结果输出控制所述存储模块10删除对应的影响因素指标;

随机森林模型40,以资本性投入和成本性投入为因变量,各类别指标降维形成的主成分为自变量,通过随机森林模型40构建电网企业经营投入优化分配模型,通过所述电网企业经营投入优化分配模型预测经营投入的理论值;

所述处理模块20与所述随机森林模型40电性相连,所述处理模块20用于通过约束条件、投入产出效率水平和历史经营投入水平对预测的经营投入理论值进行优化调整。

进一步地,所述电网企业经营投入的优化分配系统还包括用户终端50,所述用户终端50与所述处理模块20电性相连,用于接收所述处理模块20输出的优化调整方案。

以某电网企业27家子公司2015年至2018年数据为训练集构建模型,预测2019年经营投入,展示主要计算过程。

1.指标筛选

(1)变异系数

如图8所示,基于训练集数据计算影响因素当期指标及滞后指标的变异系数,判断影响因素指标数据的波动性程度。

由于比率指标数据的量纲较小,本发明不基于变异系数删除比率指标,只是以0.6为判断阈值,删除人均GDP、居民人均可支配收入、资产总额(滞后二期)等数据波动性较小的绝对量指标。

(2)相关系数

如图9所示,基于训练集数据计算影响因素当期指标及滞后指标与资本性投入规模和成本性投入规模的相关系数,判断模型中自变量与因变量的线性相关关系。

第三产业增加值占比、城镇登记失业率滞后指标、资产负债率、线损率与资本性投入规模的相关关系不显著。城镇登记失业率、全员劳动生产率当期指标和滞后一期指标与成本性投入规模的相关关系不显著。结合相关系数检验结果,删除与投入规模相关关系不显著的指标。同时,考虑到随滞后时期变长,全员劳动生产率指标对成本性投入规模的影响程度应逐渐衰减,且其当期指标和滞后一期指标不显著,因此也删除全员劳动生产率滞后二期指标。

(3)变量重要性评估

如图10所示,分别以资本性投入规模和成本性投入规模为因变量,以上一步筛选确定的影响因素当期指标及滞后指标为自变量,构建随机森林模型40,以指标数据被替换为白噪声数据后带来的袋外误差增加来评价各指标的重要性。

以80作为判断阈值,删除对资本性投入规模重要性相对较小的指标;以1作为判断阈值,删除对成本性投入规模重要性相对较小的指标。同样,考虑到影响程度随滞后时期变长而衰减,删除经济增加值滞后二期指标。

2.指标降维

如图11所示,经过指标筛选阶段,经济社会发展类、产品行业发展类、公司经营管理类、电网运行发展类各维度影响因素内包含的指标数量明显存在差异,且无法从整体角度评估经济发展、社会发展、行业发展、规划实施、经营效益、运行效率各方面影响因素的重要性。为平衡各维度各方面影响因素指标的数量,从整体角度判断各方面影响因素重要性,同时解决指标筛选阶段发现的多重共线性问题,按影响因素方面对指标进行主成分降维,保留第一主成分作为代表。

可以看出,资本性投入规模和成本性投入规模各方面影响因素第一主成分的特征根均大于1,且第一主成分的累计方差贡献率均大于84%,说明每个第一主成分引起的变异均占全部变异的84%以上,第一主成分能够提供各影响因素指标所包含的绝大多数信息。进一步,基于影响因素指标标准化数据和成分矩阵可以得到各方面影响因素第一主成分数据。

3.理论建模

如图12所示,考虑到历年资本性投入规模和成本性投入规模的延续性,本发明将资本性投入规模和成本性投入规模的滞后一期作为自变量引入优化分配模型。基于训练集数据,分别以资本性投入规模和成本性投入规模为因变量,经济发展、社会发展、行业发展、规划实施、经营效益、运行效率等方面影响因素第一主成分及投入规模滞后一期为自变量,建立基于随机森林模型40的经营投入优化分配模型。

建模过程中可以得到以误差增加衡量的各方面影响因素重要性评估结果。

采用平均绝对误差(MAE)、均方误差(MSE)、平均绝对百分比误差(MAPE)评价模型的预测效果,结果如图13所示。

4.分配调整

综合考虑规划投资、核价投资、投资能力等约束条件、投入产出效率水平、历史经营投入水平,对预测的经营投入理论值进行优化调整,得出高、中、低三套方案。

该电网企业经营投入的优化分配系统使用过程如下:

使用时,通过存储模块10存储影响因素的当期指标和影响因素的滞后指标;通过处理模块20计算影响因素的当期指标及滞后指标的变异系数、相关系数和变量重要性评估并输出计算结果;通过控制模块30根据所述计算结果判断是否取舍相对应的影响因素指标;处理模块20通过主成分分析方法对所述影响因素指标降维,平衡各类别指标的数量;训练随机森林模型40,以资本性投入和成本性投入为因变量,各类别指标降维形成的主成分为自变量,通过随机森林模型40构建电网企业经营投入优化分配模型,通过所述电网企业经营投入优化分配模型预测经营投入的理论值;处理模块20通过约束条件、投入产出效率水平和历史经营投入水平对预测的经营投入理论值进行优化调整。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本文件的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号