首页> 中国专利> 用电需量预测方法、装置、系统与计算机存储介质

用电需量预测方法、装置、系统与计算机存储介质

摘要

本发明公开了一种用电需量预测方法,包括:获取用电需量的历史数据,对所述历史数据进行预处理,得到第一分析数据;对所述第一分析数据进行特征判断,得到对应的判断结果,并根据所述判断结果,确定所述第一分析数据的预测模型;根据所述第一分析数据和所述预测模型,得到用电需量的预测数据。本发明还公开了一种用电需量预测装置、系统和计算机存储介质。本发明无需人工参与企业用电需量的预测分析工作,通过对用电需量的历史数据进行预处理,保证了第一分析数据的准确性和完整性,并可根据不同企业用电需量数据的数据特征进行预测,提高了用电需量预测数据的准确性。

著录项

  • 公开/公告号CN112418921A

    专利类型发明专利

  • 公开/公告日2021-02-26

    原文格式PDF

  • 申请/专利号CN202011259758.9

  • 发明设计人 史轶;郑韬;吴林;单铁园;陈仕波;

    申请日2020-11-11

  • 分类号G06Q30/02(20120101);G06Q50/06(20120101);G06F17/18(20060101);

  • 代理机构44542 深圳市恒程创新知识产权代理有限公司;

  • 代理人张小容

  • 地址 518057 广东省深圳市南山区粤海街道科苑南路3099号储能大厦六层

  • 入库时间 2023-06-19 10:00:31

说明书

技术领域

本发明涉及电力资源技术领域,尤其涉及用电需量预测方法、装置、系统与计算机存储介质。

背景技术

企业用电需量是衡量各社会企业电力资源合理使用的关键指标之一,一方面,在大型工商业用户两部制电价收费标准中,企业用电需量作为参与基础电价计费方式计算的关键组成部分,对企业用电经济型产生重要影响;另一方面,企业用电需量也能体现出企业自身生产设备与电网台区侧变压器设备的工作负载情况,对企业与电网台区侧的安全用电起到非常重要的量化指导意义。因此,企业用电需量数据的预测分析技术具有重要的意义与价值。

当前,用电需量的预测分析工作仍需人工参与,无法开展大规模企业用电需量自动化分析工作;此外,不同企业的用电需量差异显著,当前的用电需量预测方法也不能针对不同企业用电需量的数据特征进行预测。

发明内容

本发明的主要目的在于提出一种用电需量预测方法、装置、系统与计算机存储介质,旨在提高用电需量预测的准确性。

为实现上述目的,本发明提供一种用电需量预测方法,所述方法包括如下步骤:

获取用电需量的历史数据,对所述历史数据进行预处理,得到第一分析数据;

对所述第一分析数据进行特征判断,得到对应的判断结果,并根据所述判断结果,确定所述第一分析数据的预测模型;

根据所述第一分析数据和所述预测模型,得到用电需量的预测数据。

可选地,所述对所述历史数据进行预处理,得到第一分析数据的步骤包括:

根据预存的第一算法模型,确定所述历史数据中的异常数据,并对所述异常数据进行修正,确定修正完成后的历史数据为第二分析数据;

获取所述第二分析数据对应的采样间隔,以及各所述第二分析数据的采样时间点,并根据所述采样间隔和所述采样时间点,判断所述第二分析数据中是否存在采集缺失问题;

若存在,则确定出现采集缺失的缺失时间点,并根据所述缺失时间点,在预存的第二算法模型中进行数据填充,确定填充完成后的第二分析数据为第三分析数据;

获取预设的预测时间周期,根据所述预测时间周期,对所述第三分析数据进行重采样处理,得到第四分析数据,并对所述第四分析数据进行平稳性检测;

若所述第四分析数据具有平稳性,则确定所述第四分析数据为第一分析数据。

可选地,所述对所述第四分析数据进行平稳性检测的步骤之后,还包括:

若所述第四分析数据不具有平稳性,则对所述第四分析数据进行差分运算,使得经过所述差分运算后得到的第五分析数据具有平稳性,确定所述第五分析数据为第一分析数据。

可选地,所述特征判断包括季节特征判断,所述对所述第一分析数据进行特征判断,得到对应的判断结果的步骤包括:

基于预存的第三算法模型,确定所述第一分析数据是否存在周期频率;

若存在周期频率,则确定所述第一分析数据的第一判断结果为具有季节特征;

若不存在周期频率,则确定所述第一分析数据的第一判断结果为不具有季节特征。

可选地,所述确定所述第一分析数据的数据特征为不具有季节特征的步骤之后,还包括:

基于预存的第四算法模型,计算所述第一分析数据对应的趋势数据,并对所述趋势数据进行线性回归处理,得到所述趋势数据对应的拟合直线;

确定所述拟合直线的斜率,以及所述斜率的斜率绝对值,并将所述斜率绝对值和预设斜率绝对值进行比较;

若所述斜率绝对值大于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为具有趋势特征;

若所述斜率绝对值小于或等于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为不具有趋势特征。

可选地,所述判断结果包括第一判断结果和第二判断结果,所述根据所述判断结果,确定所述第一分析数据的预测模型的步骤包括:

若所述判断结果具有季节特征且具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果具有季节特征但不具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果为不具有季节特征但具有趋势特征,则确定所述第一分析数据的预测模型为自回归移动平均模型;

若所述判断结果为不具有季节特征且不具有趋势特征,则确定所述第一分析数据的预测模型为一次指数平滑模型。

可选地,所述得到用电需量的预测数据的步骤之后,还包括:

获取所述第一分析数据对应的目标预测数据,分别计算各所述目标预测数据与对应的第一分析数据之间的差值,得到残差数据;

基于预存的第五算法模型和所述残差数据,对所述预测模型进行调优,以确定最优预测模型。

此外,为实现上述目的,本发明还提供一种用电需量预测装置,所述用电需量预测装置包括:

数据处理模块,用于获取用电需量的历史数据,对所述历史数据进行预处理,得到第一分析数据;

模型确定模块,用于对所述第一分析数据进行特征判断,得到对应的判断结果,并根据所述判断结果,确定所述第一分析数据的预测模型;

数据预测模块,用于根据所述第一分析数据和所述预测模型,得到用电需量的预测数据。

可选地,所述数据处理模块还用于:

根据预存的第一算法模型,确定所述历史数据中的异常数据,并对所述异常数据进行修正,确定修正完成后的历史数据为第二分析数据;

获取所述第二分析数据对应的采样间隔,以及各所述第二分析数据的采样时间点,并根据所述采样间隔和所述采样时间点,判断所述第二分析数据中是否存在采集缺失问题;

若存在,则确定出现采集缺失的缺失时间点,并根据所述缺失时间点,在预存的第二算法模型中进行数据填充,确定填充完成后的第二分析数据为第三分析数据;

获取预设的预测时间周期,根据所述预测时间周期,对所述第三分析数据进行重采样处理,得到第四分析数据,并对所述第四分析数据进行平稳性检测;

若所述第四分析数据具有平稳性,则确定所述第四分析数据为第一分析数据。

可选地,所述数据处理模块模块还包括差分运算单元,所述差分运算单元用于:

若所述第四分析数据不具有平稳性,则对所述第四分析数据进行差分运算,使得经过所述差分运算后得到的第五分析数据具有平稳性,确定所述第五分析数据为第一分析数据。

可选地,所述模型确定模块还用于:

基于预存的第三算法模型,确定所述第一分析数据是否存在周期频率;

若存在周期频率,则确定所述第一分析数据的第一判断结果为具有季节特征;

若不存在周期频率,则确定所述第一分析数据的第一判断结果为不具有季节特征。

可选地,所述模型确定模块还用于:

基于预存的第四算法模型,计算所述第一分析数据对应的趋势数据,并对所述趋势数据进行线性回归处理,得到所述趋势数据对应的拟合直线;

确定所述拟合直线的斜率,以及所述斜率的斜率绝对值,并将所述斜率绝对值和预设斜率绝对值进行比较;

若所述斜率绝对值大于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为具有趋势特征;

若所述斜率绝对值小于或等于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为不具有趋势特征。

可选地,所述模型确定模块还用于:

若所述判断结果具有季节特征且具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果具有季节特征但不具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果为不具有季节特征但具有趋势特征,则确定所述第一分析数据的预测模型为自回归移动平均模型;

若所述判断结果为不具有季节特征且不具有趋势特征,则确定所述第一分析数据的预测模型为一次指数平滑模型。

可选地,所述用电需量预测装置还包括模型调优模块,所述模型调优模块用于:

获取所述第一分析数据对应的目标预测数据,分别计算各所述目标预测数据与对应的第一分析数据之间的差值,得到残差数据;

基于预存的第五算法模型和所述残差数据,对所述预测模型进行调优,以确定最优预测模型。

此外,为实现上述目的,本发明还提供一种用电需量预测系统,所述用电需量预测系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用电需量预测程序,所述用电需量预测程序被所述处理器执行时实现如上所述的用电需量预测方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有用电需量预测程序,所述用电需量预测程序被处理器执行时实现如上所述的用电需量预测方法的步骤。

本发明提出的用电需量预测方法,通过获取用电需量的历史数据,对历史数据进行预处理,得到第一分析数据;对第一分析数据进行特征判断,得到对应的判断结果,并根据判断结果,确定第一分析数据的预测模型;根据第一分析数据和预测模型,得到用电需量的预测数据。本发明无需人工参与企业用电需量的预测分析工作,通过对用电需量的历史数据进行预处理,保证了第一分析数据的准确性和完整性,并可根据不同企业用电需量数据的数据特征进行预测,提高了用电需量预测数据的准确性。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图;

图2为本发明用电需量预测方法第一实施例的流程示意图;

图3为本发明用电需量预测装置较佳实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的系统结构示意图。

本发明实施例系统可以是云服务器、管理服务器等。

如图1所示,该系统可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI 接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的系统结构并不构成对系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及用电需量预测程序。

其中,操作系统是管理和控制用电需量预测系统与软件资源的程序,支持网络通信模块、用户接口模块、用电需量预测程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。

在图1所示的用电需量预测系统中,所述用电需量预测系统通过处理器 1001调用存储器1005中存储的用电需量预测程序,并执行下述用电需量预测方法各个实施例中的操作。

基于上述硬件结构,提出本发明用电需量预测方法实施例。

参照图2,图2为本发明用电需量预测方法第一实施例的流程示意图,所述方法包括:

步骤S10,获取用电需量的历史数据,对所述历史数据进行预处理,得到第一分析数据;

本实施例用电需量预测方法运用于各大企业的用电需量预测系统中,为描述方便,用电需量预测系统以预测系统简称。企业用电需量是衡量各企业电力资源是否合理使用的关键指标之一,一是由于在大型工商业用户两部制电价收费标准中,企业用电需量是计算基础电价计费的关键因素,对企业用电经济型发展产生重要影响;二是由于企业用电需量也能反映出企业的生产设备与电网台区侧的变压器设备的工作负载情况,对企业与电网台区侧的安全用电起到非常重要的量化指导意义。故用电需量数据的预测分析技术具有重要的意义与价值。

在本实施例中,可通过智能电表等用电监测设备来记录各企业的用电需量数据,并根据用电需量的实际预测需求,对用电需量数据进行采集,得到用电需量的历史数据,再通过对历史数据进行预处理,如对历史数据进行修正和/或对数据进行填充等,得到用于预测用电需量的第一分析数据。

进一步地,所述对所述历史数据进行预处理,得到第一分析数据的步骤包括:

步骤S101,根据预存的第一算法模型,确定所述历史数据中的异常数据,并对所述异常数据进行修正,确定修正完成后的历史数据为第二分析数据;

在本实施例中,预存的第一算法模型可为高斯分布模型,若将历史数据作为一个样本,可通过确定样本容量、样本均值,计算出对应的样本方差,再确定各个样本数据的样本点概率,即各个历史数据的样本点概率,通过样本点概率与预设概率范围,确定历史数据中的异常数据,再通过预设算法对用电需量的异常数据进行修正、替换,得到用于预测用电需量的第二分析数据,保证了第二分析数据的准确性。

具体地,计算样本均值的公式如下:

计算样本方差的公式如下:

计算样本点概率的公式如下:

其中,

μ为样本均值;

m为样本容量;

i为历史数据标记序号;

x(i)为各个历史数据;

σ为标准差;

σ

x为各个历史数据;

P(x,μ,σ

例如,高斯分布模型中的预设概率范围为[-3σ,3σ],若样本点概率在预设概率范围内,则确定该样本点概率对应的历史数据为正常数据;若样本点概率不在预设范围内,则可确定该样品点概率对应的历史数据为异常数据。再通过预设算法,如线性平滑算法,对异常数据进行修正、替换,并在修正完成后,更新历史数据,得到第二分析数据。

若x

x

其中,x

x

x

步骤S102,获取所述第二分析数据对应的采样间隔,以及各所述第二分析数据的采样时间点,并根据所述采样间隔和所述采样时间点,判断所述第二分析数据中是否存在采集缺失问题;

在本实施例中,采样间隔为两次采样之间的时间差,即相邻两个第二分析数据对应的采样时间点之间的时间差,故可通过确定相邻两个采样时间点之间的时间差,将各个时间差与采样间隔进行比较来确定第二分析数据是否存在采集缺失问题。具体的,若各个时间差与采样间隔相等,则说明不存在采集缺失问题;若各个时间差有至少一个不等于采样间隔,则说明存在采集缺失问题。通过判断第二分析数据中是否存在采集缺失问题,可确保用于预测用电需量的数据具有完整性。

步骤S103,若存在,则确定出现采集缺失的缺失时间点,并根据所述缺失时间点,在预存的第二算法模型中进行数据填充,确定填充完成后的第二分析数据为第三分析数据;

在本实施例中,若存在采集缺失问题,则可通过确定出现采集缺失的缺失时间点,根据预存的第二算法模型,如前向数据填充模型和/或后向数据填充模型进行数据填充,从而将第二分析数据中确实的数据进行填充,得到第三分析数据。例如,若出现采集缺失的缺失时间点为t时刻、t+1时刻,且t-1 时刻的数据为A,t+2时刻的数据为B,在前向数据填充模型中进行数据填充后,t时刻和t+1时刻的数据都填充为A。

步骤S104,获取预设的预测时间周期,根据所述预测时间周期,对所述第三分析数据进行重采样处理,得到第四分析数据,并对所述第四分析数据进行平稳性检测;

在本实施例中,不同企业的用电需量对应的预测需求会有所差异,因此可根据实际预测需求确定预测时间周期,而为了合理而准确地预测企业用电需量数据,第三分析数据的采样间隔一般小于预测时间周期,例如,若企业用电需量数据需要以月份为单位进行数据分析预测,且预测时间周期为一个月,那么第三分析数据可以是分钟级周期数据或小时级周期数据,甚至可以是以一周或两周为周期的周期数据,因此需要对第三分析数据进行重采样处理,使得第三分析数据统一为月周期数据,即第四分析数据,并对第四分析数据进行平稳性检测,如采用ADF单位根检验对第四分析数据进行平稳性检测,以确定第四分析数据是否具有平稳性,其中,如果通过ADF单位根检验时不存在单位根,则说明第四分析数据具有平稳性;如果存在单位根,则说明第四分析数据不具有平稳性。可以理解的,平稳性检验是时间序列分析的一个关键问题,其中,在相等的时间间隔内收集到的不同时间点的数据集合成为时间序列,因此第四分析数据属于时间序列。如果用于预测分析的时间序列不具有平稳性,那么基于该时间序列得到的预测数据也就没有意义。

步骤S105,若所述第四分析数据具有平稳性,则确定所述第四分析数据为第一分析数据。

在本实施例中,预测系统是根据第一分析数据来预测用电需量的,因此,只有当历史数据经过预处理之后得到的第四分析数据具有平稳性,才能确定第四分析数据为第一分析数据。

进一步地,所述对所述第四分析数据进行平稳性检测的步骤之后,还包括:

步骤S106,若所述第四分析数据不具有平稳性,则对所述第四分析数据进行差分运算,使得经过所述差分运算后得到的第五分析数据具有平稳性,确定所述第五分析数据为第一分析数据。

在本实施例中,若检测到第四分析数据不具有平稳性,则需要对第四分析数据进行差分运算,使得第四分析数据趋于平稳。例如,若第四分析数据经过一阶差分运算后得到一阶数据,通过ADF单位根检验,若确定一阶数据具有平稳性,那么,可确定一阶数据为第五分析数据,即第五分析数据具有平稳性,也就不需要再对第五分析数据进行二阶差分运算了;若第四分析数据经过一阶差分运算后的一阶数据仍未具有平稳性,则对一阶数据进行二阶差分运算,得到二阶数据,若二阶数据仍未具有平稳性,则对二阶数据进行三阶差分运算,以此类推,直至经过多阶差分运算后的多阶数据具有平稳性,则将具有平稳性的多阶数据确定为第一分析数据。

步骤S20,对所述第一分析数据进行特征判断,得到对应的判断结果,并根据所述判断结果,确定所述第一分析数据的预测模型;

在本实施例中,由于不同企业的用电需量数据具有不同的数据特征,其中,数据特征主要表现为季节特征和/或趋势特征,因此需要进行特征判断,才能判断第一分析数据是否具有对应的数据特征,得到相应的判断结果,根据不同的判断结果,可确定不同的预测模型,能够实现用电需量的准确预测。

进一步地,所述特征判断包括季节特征判断,所述对所述第一分析数据进行特征判断,得到对应的判断结果的步骤包括:

步骤S201,基于预存的第三算法模型,确定所述第一分析数据是否存在周期频率;

在本实施例中,预存的第三算法模型优选为快速傅里叶变换模型,通过快速傅里叶变换公式,可确定第一分析数据中是否存在周期频率。可以理解的,在快速傅里叶变换模型中,输入是在采样时间轴上的各个数据,即第一分析数据,而输出(快速傅里叶转换结果)则是各个第一分析数据对应的频率分量的值,因此,可通过判断快速傅里叶转换结果是否存在周期,即通过判断各个第一分析数据对应的频率分量值是否存在周期性变化的情况,来确定第一分析数据是否存在周期频率。

计算周期频率的公式如下:

其中,k为正/余弦信号的频率,0≤k≤N-1,且k是自然数;

X(k)为快速傅里叶转换结果;

x(n)为第一分析数据组成的时间序列;

n为采样点标记;

N为采样点数量。

步骤S202,若存在周期频率,则确定所述第一分析数据的第一判断结果为具有季节特征;

在本实施例中,统计学中所给定产品的需求在基础时间序列经历可预测的周期性变化时,会表现出季节特征,季节特征是用于改善需求预测准确度的常用统计模式之一。若各个第一分析数据对应的频率分量值存在周期性变化,则说明第一分析数据中存在周期频率,可确定第一分析数据具有季节特征,即用电需量数据是周期性变化的。

步骤S203,若不存在周期频率,则确定所述第一分析数据的第一判断结果为不具有季节特征。

在本实施例中,若各个第一分析数据对应的频率值不存在周期性变化,则说明第一分析数据中不存在周期频率,可确定第一分析数据不具有季节特征,即用电需量数据不是周期性变化的。

所述特征判断还包括趋势特征判断,所述对所述第一分析数据进行特征判断,得到对应的判断结果的步骤包括:

步骤S204,基于预存的第四算法模型,计算所述第一分析数据对应的趋势数据,并对所述趋势数据进行线性回归处理,得到所述趋势数据对应的拟合直线;

在本实施例中,预存的第四算法模型优选为窗口移动平均算法,窗口移动平均算法是一种根据时间序列进行逐项推移,依次计算包含一定项数的时间序列平均值,以反映长期趋势的方法,通过用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法,也就是说,窗口移动平均算法适用于即期预测。因此,当时间序列的数值受周期变动和随机波动的影响,导致数据起伏较大,不易显示出发展趋势时,使用窗口移动平均算法可以消除这些因素的影响,显示出事件的发展方向与趋势 (即趋势线),然后可依据趋势线分析预测时间序列的长期趋势。在窗口移动平均算法模型中,第一分析数据的趋势数据包括各个第一分析数据的移动平均数,计算移动平均数的公式如下:

其中,t为第一分析数据的编号;

x

M

N为移动窗口数。

例如,若某企业的用电需量是以一个月为周期进行数据分析预测的,且用于预测的第一分析数据的采样点数目为n个,那么通过移动平均数计算得到的M

假设函数的计算公式如下:

h

其中,h

θ为待拟合参数;

n为趋势数据的编号;

x

由于影响h

损失函数的计算公式如下:

其中,J(θ)为损失函数;

x

y

h

若第一分析数据的真实值与假设值之间的差别较大,会使得损失函数 J(θ)的值也较大,因此,当J(θ)取最小值时,第一分析数据的真实值与假设值之间的差别最小,此时得到的θ,就是最优的θ,即此时假设函数的拟合度最高,可确定该假设函数为趋势数据的拟合直线。要使损失函数J(θ)的值最小,可采用随机梯度下降法对J(θ)进行求导,从而求出使J(θ)最小的参数θ。具体的,可随机确定一个θ作为初试值,然后向着让J(θ)减小最快的方向更新θ的取值,如此迭代,通过不断更新θ,使得J(θ)减小,直到J(θ)达到最小值。

涉及的计算公式包括:

θ的迭代公式:

其中,α称为学习率(learning rate),表示每次移动的步长,它控制θ每次向J(θ)变小的方向迭代时的变化幅度。若α太小,则损失函数的梯度下降速度很慢,若α太大,则会导致损失函数无法收敛甚至发散。J(θ)对θ的偏导表示J(θ)变化最大的方向。由于求的是J(θ)极小值,因此梯度方向是偏导数的反方向。

随机梯度下降法公式:

那么,θ的迭代公式就变为:

θ

通过随机梯度下降法求出的使损失函数J(θ)取最小值的θ即为最优θ,从而确定最优θ对应的拟合直线为拟合度最高的拟合直线,即确定为趋势数据对应的拟合直线。

步骤S205,确定所述拟合直线的斜率,以及所述斜率的斜率绝对值,并将所述斜率绝对值和预设斜率绝对值进行比较;

在本实施例中,由于只有当拟合直线具有明显的正相关趋势或者负相关趋势,才能判断是否具有趋势性,因此,需要预设斜率范围,将拟合直线的斜率与预设斜率范围比较,从而确定第一分析数据是否具有趋势特征。由步骤S204可知,最优θ即为拟合直线的斜率,θ可为正数,也可为负数,因此可通过预先设定一个预设斜率绝对值,并确定最优θ对应的斜率绝对值,将该斜率绝对值和预设斜率绝对值进行比较,从而确定第一分析数据是否具有趋势性。

步骤S206,若所述斜率绝对值大于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为具有趋势特征;

在本实施例中,若预设斜率绝对值为0.1763,当斜率大于0.1763时,说明趋势数据呈现出明显的正相关性;当斜率小于-0.1763时,说明趋势数据呈现出明显的负相关性,也即当斜率绝对值大于预设斜率绝对值时,用电需量的第一分析数据具有趋势特征。

步骤S207,若所述斜率绝对值小于或等于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为不具有趋势特征。

在本实施例中,若拟合直线的斜率范围在[-0.1763,0.1763]之间,即斜率绝对值小于或等于预设斜率绝对值时,则可认为拟合直线趋于水平,也就是说第一分析数据的趋势数据基本没有变化,可确定第一分析数据不具有趋势特征,即第二判断结果为不具有趋势特征。

进一步地所述判断结果包括第一判断结果和第二判断结果,所述根据所述判断结果,确定所述第一分析数据的预测模型的步骤包括:

步骤S208,若所述判断结果为具有季节特征且具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

在本实施例中,若第一分析数据具有季节特征且具有趋势特征,则可利用三次指数平滑模型(Holt-Winters)进行用电需量数据的预测,其中, Holt-Winters模型优选为累加的Holt-Winters模型。

Holt-Winters模型的算法公式如下:

s

t

p

其中,α、β、γ为调节系数,取值范围为[0,1];

s、t、p为平滑后的趋势参数。

步骤S209,若所述判断结果具有季节特征但不具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

在本实施例中,若第一分析数据具有季节特征但不具有趋势特征,也可利用三次指数平滑模型进行用电需量数据的预测,结合步骤S208和步骤S209 可知,若第一分析数据具有季节特征,不论其是否还具有趋势特征,均可利用三次指数平滑模型进行用电需量数据的预测。

步骤S210,若所述判断结果为不具有季节特征但具有趋势特征,则确定所述第一分析数据的预测模型为自回归移动平均模型;

在本实施例中,自回归移动平均模型(ARIMA,Autoregressive IntegratedMoving Average Model),又称为Box-Jenkins模型,也记作ARIMA(p,d,q),p 为自回归项数,d为使第一分析数据成为平稳序列所做的差分次数(阶数), q为滑动平均项数,是统计模型中最常见的一种用来进行时间序列预测的模型。若第一分析数据不具有季节特征但具有趋势特征,则可利用自回归移动平均模型进行企业用电需量数据的预测,从而提高用电需量预测数据的准确性。

具体地,ARIMA模型的计算公式为:

w

其中,w为d阶差分算子;

u为白噪声序列;

p和φ为AR模型参数;

δ、q和θ为MR模型参数。

步骤S211,若所述判断结果为不具有季节特征且不具有趋势特征,则确定所述第一分析数据的预测模型为一次指数平滑模型。

在本实施例中,一次指数平滑模型是一种特殊的加权平均法,通过对本期第一分析数据的真实值和假设值赋予不同的权重,求得下一期预测值的方法,这种方法既不需要存储全部历史数据,也不需要存储一组数据,从而可以大大减少数据存储问题。当第一分析数据不具有季节特征且不具有趋势特征时,一次指数平滑算法能够简单而准确地拟合第一分析数据,因此,利用一次指数平滑模型能够对用电需量数据进行准确预测。

具体地,一次指数平滑模型的计算公式如下:

s

其中,α为平滑系数,又称加权因子,取值范围为0≤α≤1;

s为平滑结果数据;

i为第一分析数据的编号;

x为待平滑的第一分析数据。

步骤S30,根据所述第一分析数据和所述预测模型,得到用电需量的预测数据。

在本实施例中,由于不同企业的用电需量数据具有不同的数据特征,因此,可充分考虑不同企业的用电需量数据特征,确定不同的预测模型,从而构建不同的预测策略,能够有效解决当前对用电需量数据预测分析时建模手段单一的问题,以及使用单一的算法模型无法实现准确预测的问题,从而在预测模型中根据提供的第一分析数据,准确得出用电需量的预测数据。

本实施例的用电需量预测方法,通过获取用电需量的历史数据,对历史数据进行预处理,得到第一分析数据;对第一分析数据进行特征判断,得到对应的判断结果,并根据判断结果,确定第一分析数据的预测模型;根据第一分析数据和预测模型,得到用电需量的预测数据。本发明无需人工参与企业用电需量的预测分析工作,通过对用电需量的历史数据进行预处理,保证了第一分析数据的准确性和完整性,并可根据不同企业用电需量数据的数据特征进行预测,提高了用电需量预测数据的准确性

进一步地,基于本发明用电需量预测方法第一实施例,提出本发明用电需量预测方法第二实施例。

用电需量预测方法的第二实施例与用电需量预测方法的第一实施例的区别在于,所述确定所述第一分析数据的预测模型的步骤包括:

步骤S301,基于预存的第六算法模型,确定预测模型的超参数,并基于所述超参数,确定所述第一分析数据的实际预测模型。

在本实施例中,预存的第六算法模型可为赤池信息量准则(AIC,AkaikeInformation Criterion),通过AIC可以权衡预测模型的复杂度和该预测模型拟合数据的优良性。

具体地,AIC的计算公式如下:

其中,k是预测模型中参数的数量;

n为观察数;

RSS为剩余平方和。

由于预测模型中的各个参数尚未确定,因此,需要利用AIC挑选出模型的超参数,其中,超参数是在开始机器学习过程之前设置值的参数,而不是通过训练得到的参数数据。通过AIC选择一组超参数,可以提高学习的性能和效果。

RSS((Residual Sum of Squares,残差平方和)是各个第一分析数据真实值与假设值之差的平方的总和,其中,预测数据为第一分析数据在预测模型中对应的假设值,因此,计算RSS需要先计算各个第一分析数据真实值与假设值之差,即残差数据,各个残差数据的平方和即为剩余平方和。预测模型中的参数越少,样本量越大,AIC值就越小,模型的拟合度就越高。因此,确定使AIC值最小的参数为预测模型的超参数,从而确定实际的预测模型。

本实施例的用电需量预测方法,通过AIC挑选出预测模型的超参数,从而优化实际预测模型,提高了用电需量预测数据的准确性。

进一步地,基于本发明用电需量预测方法第一、第二实施例,提出本发明用电需量预测方法第三实施例。

用电需量预测方法的第三实施例与用电需量预测方法的第一、第二实施例的区别在于,所述得到用电需量的预测数据的步骤之后,还包括:

步骤S302,获取所述第一分析数据对应的目标预测数据,分别计算各所述目标预测数据与对应的第一分析数据之间的差值,得到残差数据;

在本实施例中,预测数据中也包含与第一分析数据对应的目标预测数据,即第一分析数据的假设值,通过计算第一分析数据的假设值与真实值之间的差值,即可得到对应的残差数据。

步骤S303,基于预存的第五算法模型和所述残差数据,对所述预测模型进行调优,以确定最优预测模型。在本实施例中,预存的第五算法模型优选为Ljung-Box test算法模型。由残差数据组成的序列为残差序列,通过对残差序列进行白噪声检测,可确定第一分析数据中的有用信息是否被充分提取。如果残差序列表现出白噪声特征,则说明第一分析数据中的有用信息已经被充分提取,模型建立成功,即当前的预测模型为最优预测模型。利用Ljung-Box test算法模型对残差数据的白噪声特征进行检测,即检验预测模型中某个时间段内第一分析数据的假设值是否为随机的独立假设值。如果假设值并非彼此独立,那么一个假设值可能会在k个时间单位后与另一个假设值相关,即存在相关性,则说明预测模型不够准确,需要重新进行模型调优。

具体地,Ljung-Box test算法模型的计算公式如下:

其中,Q(h)为残差序列的统计量;

n为样本容量,即残差数据的数量;

h为卡方分布的自由度,Q(h)服从该卡方分布;

ρ

在Ljung-Box算法模型中,首先对总体参数,即第一分析数据作一个尝试性的假设,即原假设(零假设),再计算出统计量的值,并根据预先设定的显著性水平进行检验,做出拒绝或者接受原假设的判断。若接收原假设,则意味着原序列是白噪声序列,即第一分析数据对应的时间序列为白噪声序列,其中,时间序列为在相等的时间间隔内收集到的不同时间点的数据集合。因此,第一分析数据也属于时间序列。若第一分析数据对应的残差数据会表现出白噪声特征,则说明预测模型对用电需量数据的数据特征拟合充分;若拒绝原假设,则认为残差序列存在相关性,需要重新对预测模型的超参数进行调节,以重新对预测模型进行调优,如可通过AIC对预测模型中的超参数的取值范围进行调节,以确定预测模型的最优超参数,从而确定最优预测模型。

本实施例的用电需量预测方法,通过Ljung-Box算法模型对第一分析数据对应的真实值与假设值之间的残差序列进行白噪声检测,以确认预测模型是否需要进一步调优,使得用电需量数据的数据特征被充分拟合,确保预测模型最优,进一步保证了预测数据的准确性。

本发明还提供一种用电需量预测装置。参照图3,本发明用电需量预测装置包括:

数据处理模块10,用于获取用电需量的历史数据,对所述历史数据进行预处理,得到第一分析数据;

模型确定模块20,用于对所述第一分析数据进行特征判断,得到对应的判断结果,并根据所述判断结果,确定所述第一分析数据的预测模型;

数据预测模块30,用于根据所述第一分析数据和所述预测模型,得到用电需量的预测数据。

可选地,所述数据处理模块还用于:

根据预存的第一算法模型,确定所述历史数据中的异常数据,并对所述异常数据进行修正,确定修正完成后的历史数据为第二分析数据;

获取所述第二分析数据对应的采样间隔,以及各所述第二分析数据的采样时间点,并根据所述采样间隔和所述采样时间点,判断所述第二分析数据中是否存在采集缺失问题;

若存在,则确定出现采集缺失的缺失时间点,并根据所述缺失时间点,在预存的第二算法模型中进行数据填充,确定填充完成后的第二分析数据为第三分析数据;

获取预设的预测时间周期,根据所述预测时间周期,对所述第三分析数据进行重采样处理,得到第四分析数据,并对所述第四分析数据进行平稳性检测;

若所述第四分析数据具有平稳性,则确定所述第四分析数据为第一分析数据。

可选地,所述数据处理模块模块还包括差分运算单元,所述差分运算单元用于:

若所述第四分析数据不具有平稳性,则对所述第四分析数据进行差分运算,使得经过所述差分运算后得到的第五分析数据具有平稳性,确定所述第五分析数据为第一分析数据。

可选地,所述模型确定模块还用于:

基于预存的第三算法模型,确定所述第一分析数据是否存在周期频率;

若存在周期频率,则确定所述第一分析数据的第一判断结果为具有季节特征;

若不存在周期频率,则确定所述第一分析数据的第一判断结果为不具有季节特征。

可选地,所述模型确定模块还用于:

基于预存的第四算法模型,计算所述第一分析数据对应的趋势数据,并对所述趋势数据进行线性回归处理,得到所述趋势数据对应的拟合直线;

确定所述拟合直线的斜率,以及所述斜率的斜率绝对值,并将所述斜率绝对值和预设斜率绝对值进行比较;

若所述斜率绝对值大于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为具有趋势特征;

若所述斜率绝对值小于或等于预设斜率绝对值,则确定所述第一分析数据的第二判断结果为不具有趋势特征。

可选地,所述模型确定模块还用于:

若所述判断结果具有季节特征且具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果具有季节特征但不具有趋势特征,则确定所述第一分析数据的预测模型为三次指数平滑模型;

若所述判断结果为不具有季节特征但具有趋势特征,则确定所述第一分析数据的预测模型为自回归移动平均模型;

若所述判断结果为不具有季节特征且不具有趋势特征,则确定所述第一分析数据的预测模型为一次指数平滑模型。

可选地,所述用电需量预测装置还包括模型调优模块,所述模型调优模块用于:

获取所述第一分析数据对应的目标预测数据,分别计算各所述目标预测数据与对应的第一分析数据之间的差值,得到残差数据;

基于预存的第五算法模型和所述残差数据,对所述预测模型进行调优,以确定最优预测模型。

本发明还提供一种计算机存储介质。

本发明计算机存储介质上存储有用电需量预测程序,所述用电需量预测程序被处理器执行时实现如上所述的用电需量预测方法的步骤。

其中,在所述处理器上运行的用电需量预测程序被执行时所实现的方法可参照本发明用电需量预测方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端系统(可以是手机,计算机,服务器,空调器,或者网络系统等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号