首页> 中国专利> 基于马尔科夫链分布模型的超短期负荷预测方法及系统

基于马尔科夫链分布模型的超短期负荷预测方法及系统

摘要

本公开提供了一种基于马尔科夫链分布模型的超短期负荷预测方法及系统,获取待预测时刻之前预设时间段的用电量数据;将待预测时刻前一时刻的用电量数据输入到预设的马尔科夫链分布模型中,得到待预测时刻的用电量数据;其中,根据预设时间段的用电量数据得到训练数据集,对训练数据集进行分箱,并计算箱子之间的过渡矩阵,结合过渡矩阵进行马尔科夫链分布模型的训练;本公开解决了在概率负载预测中既缺乏基准模型标准也缺乏性能指标的问题,为概率负载预测和性能指标的正确使用提供一个潜在的基准,提高了负荷预测的准确性。

著录项

说明书

技术领域

本公开涉及负荷预测技术领域,特别涉及一种基于马尔科夫链分布模型的超短期负荷预测方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术,并不必然构成现有技术。

电力消耗预测已成为一个多世纪以来的基本业务问题。该业务涉及能源系统主题,例如运营,能源交易和电力系统规划。作为一种特殊情况,短期用电量预测对于需求侧管理以及对于减少建筑能耗的政策制定都很重要。大多数用电量研究都集中在点预测上,而在过去的几十年中,集中在概率负载预测上的研究数量逐渐增加。

通常,概率负荷预测旨在提供对未来状态的概率预测,这对涉众而言可能比单点预测更有价值。通常,概率预测包含有关随机变量不确定性的信息,而不仅仅是预期值。这使决策者可以进行最坏情况的优化(具有极高的分位数)或随机优化(具有来自分布的样本),这可以增加收入。概率模型可以产生预测分布的中值或均值,可以将其解释为点预测。点预测和概率预测之间的很大差异还在于使用度量来量化预测,例如,均方根估计(RMSE)普遍用于点预测,而连续排名概率评分(CRPS)可以用于概率预测中。但是,已经有研究人员提出,与点负荷预测相比,概率负荷预测在较高程度上缺乏完善的评估指标。

发明人发现,就概率超短期负荷预测(即一天之内的预测)而言,有些早期的例子中有的使用混合卡尔曼滤波器预测时间分辨率为5分钟的负荷,有的用分位数回归(QR)结合梯度提升进行了半小时分辨率的电力消耗预测,有的高斯过程与ARIMA基准模型一起用于预测半小时分辨率住宅负荷,有的使用对数正态过程对半小时分辨率住宅负荷的预测并将其与高斯过程进行比较,也有的使用随机森林进行了用电量的小时分辨率预测,并与回归树和支持向量回归作为基准进行了比较。可以得出的结论是,在概率负载预测中既缺乏基准模型标准也缺乏性能指标,与确定性负荷预测相比,这是PLF领域相对不成熟的影响,尚有待解决。

发明内容

为了解决现有技术的不足,本公开提供了一种基于马尔科夫链分布模型的超短期负荷预测方法及系统,解决了在概率负载预测中既缺乏基准模型标准也缺乏性能指标的问题,为概率负载预测和性能指标的正确使用提供潜在的基准,提高了负荷预测的准确性。

为了实现上述目的,本公开采用如下技术方案:

本公开第一方面提供了一种基于马尔科夫链分布模型的超短期负荷预测方法。

一种基于马尔科夫链分布模型的超短期负荷预测方法,包括以下步骤:

获取待预测时刻之前预设时间段的用电量数据;

将待预测时刻前一时刻的用电量数据输入到预设的马尔科夫链分布模型中,得到待预测时刻的用电量数据;

其中,根据预设时间段的用电量数据得到训练数据集,对训练数据集进行分箱,并计算箱子之间的过渡矩阵,结合过渡矩阵进行马尔科夫链分布模型的训练。

本公开第二方面提供了一种基于马尔科夫链分布模型的超短期负荷预测系统。

一种基于马尔科夫链分布模型的超短期负荷预测系统,包括:

数据获取模块,被配置为:获取待预测时刻之前预设时间段的用电量数据;

负荷预测模块,被配置为:将待预测时刻前一时刻的用电量数据输入到预设的马尔科夫链分布模型中,得到待预测时刻的用电量数据;

其中,根据预设时间段的用电量数据得到训练数据集,对训练数据集进行分箱,并计算箱子之间的过渡矩阵,结合过渡矩阵进行马尔科夫链分布模型的训练。

本公开第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开第一方面所述的基于马尔科夫链分布模型的超短期负荷预测方法中的步骤。

本公开第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开第一方面所述的基于马尔科夫链分布模型的超短期负荷预测方法中的步骤。

与现有技术相比,本公开的有益效果是:

本公开所述的方法、系统、介质或电子设备,实现了对未来状态的负荷概率预测,解决了在概率负载预测中既缺乏基准模型标准也缺乏性能指标的问题,为概率负载预测和性能指标的正确使用提供一个潜在的基准。

本公开附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。

图1为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的MCM模型预测过程的概念说明。

图2为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的示例用电量数据。

图3为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的与MCM、QR和PeEn模拟相关联的可靠性图。

图4为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的rMAE图。

图5为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的用于MCM,QR和PeEn仿真的PINAW图。

图6为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的MCM,QR和PeEn的nCRPS结果。

图7为本公开实施例1提供的一种基于马尔科夫链分布模型的超短期负荷预测的敏感性分析。

具体实施方式

下面结合附图与实施例对本公开作进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。

实施例1:

如图1-7所示,本公开实施例1提供了一种基于马尔科夫链分布模型的超短期负荷预测的方法,包括以下步骤:

步骤1:用于对用户的用电量的数据集进行训练,完成利用MCM模型提前半小时对用户的用电量进行预测,其包括:对训练数据集进行分箱、计算出箱子之间转换的过渡矩阵M、对数据集进行训练并使用一个输入测试数据值估计下一个时间步长的非参数概率分布。

步骤2:用于验证MCM模型的可靠性以及正确性,其包括:将预测结果与作为简单基准模型的持久集成(PeEn)作比较、将结果与作为高级基准模型的分位数回归(QR)作比较、比较三种模型下的可靠性、平均绝对误差(rMAE)、预测区间归一化平均宽度(PINAW)、归一化连续排名概率得分(nCRPS)、敏感性分析。

步骤1.1:对训练数据集进行分箱;

定义培训并测试限制范围内的居民用电时间序列[a,b],选择用于模型中的N个箱子,将训练时间序列归入N个箱子并在范围上平均分配[a,b]。

步骤1.2:计算出箱子之间转换的过渡矩阵M;

可以通过对训练数据中从一种状态到另一种状态的转变次数进行计数。也就是说,过渡矩阵M

其中,n

公式(1)估计从状态i转换到j的次数,为了使转换的总概率保持不变,使用从状态转换的总和对其进行归一化,转换矩阵取决于分辨率,在本实施例中使用半小时分辨率,如果更改分辨率,则需要对模型进行重新训练。

步骤1.3:对数据集进行训练;

观察测试数据t所对应的x(t)并确定它属于哪一个箱子i∈[1,……,N],过渡矩阵M的第i行对应于对x(t+1)的分段均匀分布预测,为了预测下一个时间步的用电量,更改时间步t→t+1,然后使用新的观察x(t+1)并确定属于哪一个是箱子,开始重复,这使得预测方法是递归的。

x(t)的预测概率分布等于过渡矩阵第i行对应的分段均匀分布。在形式上,预测x(t+1)的概率密度函数f可以表示为:

n是观测数据点的第n个箱子,每个f

步骤2.1:获取数据集;

本实施例中使用的数据包括澳大利亚悉尼都会区的住宅用电量。该数据集是公开可用的,包含300个匿名的住宅客户,从2010年7月1日到2013年6月30日,每半小时对他们的用电消耗量进行一次测量。经过仔细的数据清理过程,数据在接下来的三年中,从54个客户中随机选择了第69、74、157、211和274个客户进行预测,对于每个客户,总共有三年的数据价值,每年有17536个数据点。

步骤2.2:模拟设置;

将模拟分为多个方案,在每种方案中,对一位客户一年的用电量要提前半小时进行预测。这是基于同一位客户剩余两年的用电量培训数据。这样,模型就可以用来为每年(1、2、3)的每座房屋(69、74、157、211和273)生成预测,总共生成了15个模拟场景。训练数据集每个包含35072个数据点,测试数据集每个包含17536个数据点。对于方案,为了使QR和PeEn能够进行10步调节,每个测试数据集中预测的第一个数据点是17536中的数据点11。具体如表1所示。

表1:所使用的数据集中每个电量的平均值(KW)/标准偏差(KW)

步骤2.3:将预测结果与作为简单基准模型的持久集成(PeEn)和作为高级基准模型的分位数回归(QR)作比较;

作为简单的基准模型,本实施例中使用了持续集成(PeEn),它是一种常见的概率预测基准模型,其中在这种情况下,x(t+1)提前一步将用电量预测定义为h以前的用电量数据点x(t),x(t-1),…,x(t-(h-1))。这里h选为10,这是一个任意选择。但是,为了纠正这种歧义,进行了敏感性分析,在这种情况下有所不同。对持续集成的直观解释是,它将确定性预测的持续性预测基准概括为概率预测设置。

作为持续集成的替代方法,在本实施例中使用分位数回归(QR)作为基准的一种高级形式来产生用电量的概率预测。利用R中的quantreg软件包来实现适应电力使用的QR模型,下面是对通用QR模型的简要介绍,包括在预测用电量方面的特殊应用。

QR与线性回归类似–提出解释变量x与输出y之间的线性关系:

y=xβ+∈ (3)

β是参数的向量,∈是随机误差。

为了学习参数

τ代表分位数概率(0<τ<1),ρ

根据(6),每个分位数被独立地估计,这样就存在模型可能违反单调性的风险:

在本实施例中,y=y(τ)为预测时间步长t+1的耗电量x(t+1)的分位数τ∈[1,…,Q]的预测值。这是由x(t)之前的时间步长值和之前训练好的

步骤2.4:比较三种模型下的可靠性、平均绝对误差(rMAE);

作为比较模型可靠性的一种方法,它是从对角线的平均绝对偏差和平均分位数q(τ)估计为可靠性MAE(rMAE)。

它是从对角线的平均绝对偏差和平均分位数q(τ)估计为可靠性MAE(rMAE),并表示为:

Q是分位数,该分数也被称为差异或可靠性指数。

通过分析数据集以及用电量数据、MCM,QR和PeEn的模型中位数和预测间隔预测得MCM和QR之间的相似性,但有定性差异,其中一个特定示例是与第13小时的大峰值相关联的不同模型的预测间隔的差异。此处,MCM和QR均具有较短的高峰值在预测间隔宽度中,PeEn具有较低但较宽的峰,后者是因为在PeEn出现后的几步中包含了较高的峰。

通过分析可靠性图得所有模型都与对角线大致对齐,但每个数据集都有一些可变性,但PeEn除外,PeEn通常会低估数据的变化。

通过计算rMAE得因房屋而异,并且逐年不同,结论是PeEn在所有情况下都具有最高的rMAE,这意味着MCM和QR更加可靠。

步骤2.5:比较三种模型下的预测区间归一化平均宽度(PINAW);

预测间隔的清晰度是通过PINAW得分来衡量的,该得分定义为:

T是时间序列的数据点数,η是名义覆盖率,q

通过计算PINAW得由于PeEn预测仅包含10个数据点,因此图中的分位数较少。总的来说,所有型号的清晰度都差不多,客户和年份之间会有一定的差异。总体而言,MCM和QR非常相似,在清晰度方面QR通常略显优势。

步骤2.6:比较三种模型下的归一化连续排名概率得分(nCRPS);

清晰度和可靠性通过nCRPS得分进行量化,以供观察t定义为:

F

通过计算nCRPS得MCM和QR的平均nCRPS均优于PeEn,详细而言,QR在11个场景中的平均nCRPS最低,而MCM在4个场景中的平均nCRPS最低。就平均值而言,相似度很高,MCM的平均nCRPS为2.5,QR的平均nCRPS为2.45,QR的nCRPS仅低2%。

步骤2.7:比较三种模型下的敏感性分析;

通过分析灵敏性得由于MCM仅取决于一个时间步长滞后,因此在这些仿真中它是恒定的。就nCRPS而言,MCM和QR收敛以降低延迟,而PeEn具有更多可变的模式,并且对于所有延迟而言,其效果均不如MCM和QR。关于rMAE,MCM和QR以与nCRPS相似的方式收敛于较低的滞后,但是在这种情况下,PeEn下降并随着滞后数量的增加而接近零。这是因为随着滞后的增加,PeEn的分布会收敛到测试数据集的分布。对于少于大约24个时滞,MMA和QR在rMAE中表现优异。

实施例2:

本公开实施例2面提供了一种基于马尔科夫链分布模型的超短期负荷预测系统,包括:

数据获取模块,被配置为:获取待预测时刻之前预设时间段的用电量数据;

负荷预测模块,被配置为:将待预测时刻前一时刻的用电量数据输入到预设的马尔科夫链分布模型中,得到待预测时刻的用电量数据;

其中,根据预设时间段的用电量数据得到训练数据集,对训练数据集进行分箱,并计算箱子之间的过渡矩阵,结合过渡矩阵进行马尔科夫链分布模型的训练。

所述系统的工作方法与实施例1提供的基于马尔科夫链分布模型的超短期负荷预测方法相同,这里不再赘述。

实施例3:

本公开实施例3提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本公开实施例1所述的基于马尔科夫链分布模型的超短期负荷预测方法中的步骤。

实施例4:

本公开实施例4提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的基于马尔科夫链分布模型的超短期负荷预测方法中的步骤。

本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。

以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号