首页> 中国专利> 基于用户行为特点的用电模式分类和控制方法

基于用户行为特点的用电模式分类和控制方法

摘要

本发明公开了基于用户行为特点的用电模式分类和控制方法,通过二次聚类方法所建立的改进后的二次聚类模型,以工业园区内同一用户一年中每日的负荷点为特征向量,从聚类结果中可以归纳用户日常用电特征,并得到此企业用户的多种典型用电模式,为工业园区内的负荷预测、故障诊断、电价制定等提供依据;进一步的通过对负荷数据的最优化函数建模可以选取需求侧管理时的最佳计划用电模式,该模型有利于供电公司在保障电力供应的前提下尽可能减少售电利润损失;最终在此基础上建立的工业园区内的用户用电行为模式库,可以将不便建模的新驻企业与已建立的典型用户模式相比较,类推得到其负荷特性以提高园区的规划效率。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-05-27

    授权

    授权

  • 2015-01-07

    实质审查的生效 IPC(主分类):G06Q10/04 申请日:20140624

    实质审查的生效

  • 2014-12-10

    公开

    公开

说明书

技术领域

本发明涉本电力系统及其自动化技术领域,具体涉及工业园区负荷规划、分析以及需求侧管理的问题,尤其涉及基于用户行为特点的用电模式分类和控制方法。 

背景技术

智能电网在结构上包括智能输电网和智能配电网两方面的内容,智能配电网具有新技术内容多、与传统电网区别大的特点,其中与用户联系最紧密的智能需求侧管理对于实现智能电网建设的整体目标有着举足轻重的作用。需求响应通过掌握和分析系统的负荷构成,可以引导电力用户选择合理的用电时间,或采用合理的蓄能方式,达到移峰填谷的作用,可见应用聚类分析进行负荷特性研究,充分挖掘用户的用电特征是需求响应措施能有针对性实施的关键。 

目前国内对于需求侧响应的研究还远远不够,而对于具体的某个工业园区的负荷研究就更为稀少。另外针对园区内的需求侧响应方案往往优先安排大客户参与避峰计划,这样粗放型方法缺乏数学模型的支持和科学依据,不利于提高电力资源的配置效率。 

发明内容

本发明的目的是提供基于用户行为特点的用电模式分类和控制方法,为工业园区的负荷规划、分析和诊断提供了科学理论支持,而且便于深入挖掘用户的用电特征和参与需求响应项目的潜力,为需求 响应的实施从项目制定到项目评估提供全面支持,为电力公司提高安全性和稳定性提供保障。 

本发明采用下述技术方案: 

基于用户行为特点的用电模式分类和控制方法,主要包括以下步骤: 

1)对于工业园区规划进驻用户,选取该用户一年的负荷数据为特征向量,对特征向量进行研究,从负荷变化规律中提取相似用电行为特征; 

2)对用户一年中每天的负荷曲线进行研究,分别进行两次聚类分析,从而可以提取出多种能够表征该用户典型用电特点的日负荷曲线,将这多种曲线组成该用户的典型负荷曲线群,其中的每种负荷曲线都有效地代表了用户的某一类用电模式; 

3)选取全年典型负荷曲线群中该季度下的负荷曲线群,并与当日实际负荷曲线对比,分析用户k在该季度里的用电行为的差异性:定义ΔSi为不同模式i下的每日生产负荷曲线与目标曲线所包围的面积差,该目标曲线可为该季度下不同用电模式对应的负荷曲线群;其中 

>Ski=024Lkidt,>ΔSki=Sk0-Ski

式中:Lki为该季节内用户k在i模式下的实时生产负荷;ΔSki为该季节内用户k在i模式下的当日变化负荷;Sk0为该季节内用户k的实际日生产总负荷;Ski为该季节内用户k的当日目标生产总负荷,Ski在典型用电模式负荷群中取值; 

4)根据直接负荷控制的季节t和目标Lmax,利用优化函数建模以选取需求侧管理时的计划用电模式;所述优化函数建模如下:该模型有利于供电公司在保障电力供应的前提下最小化限电量,从而最大化售电利润; 

>min{Σk=1nΔSki}s.t.max{Σk=1nLki}Lmax>

式中:ΔSki为t季节内用户k在i模式下当日变化负荷;Lki为t季节内用户k在i模式下的实时生产负荷;Lmax为t季节内工业园区的实时总负荷上限; 

5)利用步骤4)选取的计划用电模式累积生成用户用电行为模式库,将不便建模的新驻企业与已建立的典型用户模式相比较,类推得到不便建模的新驻企业负荷特性,从而提高园区的规划效率。 

所述步骤2)中两次聚类分析主要按照以下的数学分析步骤计算出工业园区内对企业用户的负荷聚类结果: 

2A:首先确定聚类分析的聚类数范围: 

2A.1:确定聚类数的上下限,下限取2,上限取In(N),N为数据总数; 

2A.2:从聚类数下限开始计算该聚类数下的聚类有效性,计算完成后,聚类数C=C+1; 

2B:数据预处理:首先读取数据,然后对数据预处理; 

2C:确定类别数:选择聚类效果最好的类别数作为最终确定的聚类数Ca; 

2D:对聚类数Ca进行聚类分析,并进行有效性验证,并最终输出聚类结果。 

所述步骤2)中的2C步骤具体包括如下步骤: 

2.C1对聚类数进行第一次聚类,即系统聚类:对于给该聚类数C使用七种不同方法的系统聚类,得到每种方法下的聚类树及聚类中心; 

2.C2通过最优系统聚类法得出下一步的模糊C聚类的聚类树及聚类中心:通过cophenetic相关系数的比较这七种方法下聚类效果的好坏,选取聚类效果最好即cophenetic相关系数最大的方法得到的聚类树和聚类中心,提供下一步的模糊C聚类的聚类树及聚类中心; 

2.C3对聚类数进行特殊元素的提取:先提取并置空特殊类别的元素数据,然后对剩余的元素采用模糊C均值法进行第二次聚类分析,得到第二次聚类分析结果; 

2.C4对第二次聚类分析后的结果加上特殊元素提取的结构一起返回第A.2步,计算完所有的聚类数后,比较各个聚类数下模糊C均值法的有效性分析结果,选择聚类效果最好的类别数作为最终确定的聚类数Ca。 

所述步骤2B中数据的预处理具体包括以下几个步骤: 

2B.1首先对读取的数据进行非正常负荷数据的识别与处理,具体包括数据的横向识别与纵向识别: 

①横向识别:认为短时间内数据横向相似,即样本日与附近同 类日曲线相似,结合统计学原理,利用样本统计指标与设定阈值判断是否有非正常数据: 

首先利用横向识别中式 

>xn,i=1NΣn=1Nxn,.i,i=1~96>

计算序列的均值与方差,判断是否有非正常数据,当均值过大或过小时说明该日数据不正常,当方差过大说明该日数据非正常, 

再利用式进行3σ原理的非正常数判断,其中ε为阈值,通常取1~1.5,如果式满足,则xn,.i即为非正常数据; 

利用式>xn,.i*=α12Σxn±1,.i+β12Σxn,.i1,2+γ1xn,i>对非正常数据进行修正,其中α1、β1、γ1为自定义权值且α111=1,为第n天第i点修正数据;xn±1,.i为xn,.i附近两个横向负荷点,为距离xn,.i最近的两个相似日负荷点; 

②纵向识别:认为短时间内数据纵向相似,即相隔15min的连续3个数据相对稳定,没有突变,结合统计学原理,利用样本统计指标与设定阈值判断是否有非正常数据: 

首先利用式将某负荷点附近连续5个 数据平均化,形成平滑后的负荷序列; 

再判断原始数据与平滑后数据的误差是否满足式 

σn,i>δx′n,.i,σn,i为原该点数据与平滑后该点数据差的绝对值;如满足,则负荷点为非正常数据,δ为阈值,通常取0.08~0.15;其中σn,i=|xn,.i-x′n,.i

若负荷点为非正常数据,则利用式 >xn,.i*=α22Σxn,.i±1+β22Σxn,.i±2>修正,其中xn,.-1,xn,.0,xn,.97,xn,.98分别为第n-1和n+1天的最后和最前的两个负荷点,且α2、β2为自定义权值且α22=1; 

2B.2其次包括负荷数据加权处理:由于部分地区实行峰谷平分时电价政策,峰谷分时电价的峰、谷时段电价价差一般在2-5倍之间,所以需要对负荷数据加权处理,设定负荷曲线高峰时段各点的权值为3,即认为工作时段的权重较高,而夜间休息时段的权重较低,有利于使分类结果更能说明目标问题。 

对上述步骤2B.2加权处理后的负荷数据处理后进行第一次聚类分析:具体的,第一次聚类分析采用基于类平均法的系统聚类法对每日的负荷进行分类:用G来表示类,假定G中有m个元素,用列向量xi(i=1,2,...,m)来表示,dij表示元素xi与xj间距离,DKL表示类GK与类GL之间的距离; 

若定义类与类之间的平方距离等于其负荷数据对之间平方距离 的平均值;则Gk和GL之间的平方距离可表示为: 

>DKL2=1nKnLΣxiGk,xjGLdij>

式中:nK为类GK的元素个数;nL为类GL的元素个数; 

推广后的类间平方距离的递推公式为: 

>DMJ2=(1-β)[nKnMDKJ2+nLnMDLJ2]+βDKL2>

式中:nK为类GK的元素个数;nL为类GL的元素个数;nM为类G的元素个数;β<1为可变系数。 

所述步骤2C.3中模糊C均值法具体为:模糊C均值法的定义为把聚类归结成一个带约束的非线性规划问题,通过优化求解获得数据集的模糊划分和聚类:模糊C均值法通过迭代调整(U,P)使得目标函数J最小;其中,U=[μik]c×n为隶属度矩阵,P=[pi](i=1,2,…,c),表示第i类的代表聚类中心矩阵,Jm(U,P)是类内加权平方误差和的目标函数;dik表示样本xk与第i类聚类中心pi之间的失真度; 

可描述为: 

>Jm(U,P)=Σk=1nΣi=1c(μik)m(dik)2,m[1,)s,t.UMfc>式中:m称为加权指数;μik为子集Xi的特征函数,有μik∈{0,1};pi(i=1,2,...,c)表示第i类的聚类中心矩阵,pi=(pi1,pi2,...,pis)∈Rs。 

所述步骤2D中聚类结果的有效性验证具体如下: 

模糊划分系数F(U;c)是指n个可能性分布描述因子的平均值,定义为: 

>F(U;c)=1nΣj=1n(Σi=1cμij2/Σi=1cμij)>

可能性划分系数P(U;c)对于给定的聚类数c和隶属度矩阵U,定义为: 

>P(U;c)=1cΣi=1c(Σj=1nμij2/Σj=1nμij)>

聚类有效性函数FP(U;c)对给定的聚类数c和隶属度矩阵U,定义为: 

FP(U;c)=F(U;c)-P(U;c) 

所以对于U∈Mfc的“最优”的有限集合,若存在(U*;c*)满足 

>FP(U*;c*)=minc{minΩcFP(U;c)}>

则以(U*;c*)为“最优”的有效性聚类,其中,式中取cmax≤In n。 

本发明通过二次聚类方法所建立的改进后的二次聚类模型,以工业园区内同一用户一年中每日的负荷点为特征向量,从聚类结果中可以归纳用户日常用电特征,并得到此企业用户的多种典型用电模式,为工业园区内的负荷预测、故障诊断、电价制定等提供依据;进一步的通过对负荷数据的最优化函数建模可以选取需求侧管理时的最佳计划用电模式,该模型有利于供电公司在保障电力供应的前提下尽可能减少售电利润损失;最终在此基础上建立的工业园区内的用户用电行为模式库,可以将不便建模的新驻企业与已建立的典型用户模式相 比较,类推得到其负荷特性以提高园区的规划效率。 

附图说明

图1为本发明所述某企业负荷分类对比曲线图; 

图2为本发明方法的总步骤流程图; 

图3为本发明所述综合聚类法的具体流程图: 

图4为对用户进行需求侧管理时计算ΔSki的示意图。 

具体实施方式

如图3所示,本发明的目的在于为了克服现有技术的不足,提供一种基于用户行为特点的用电模式分类和控制方法,针对工业园区内规划进驻用户,首先选取该用户一年的负荷数据为特征向量,研究其负荷变化规律并提取相似用电行为特征;然后采用综合聚类分析的方法得到典型负荷代表曲线群,确保每条负荷曲线都能有效地代表用户的某一类用电模式;分析该用户在不同时间节点中用电行为的差异性,根据直接负荷控制的时段和目标,利用不同用电模式下的优化模型选取需求侧管理所需用电模式,充分挖掘用户的节电潜力;利用由此累积生成的用户用电行为模式库,将不便建模的新驻企业与已建立的典型用户模式相联系,提高供电安全性和经济性。 

具体的如图2所示,一种基于用户行为特点的用电模式分类和控制方法,方法主要包括以下步骤: 

1)对于工业园区规划进驻用户,选取该用户一年的负荷数据为特征向量,研究其负荷变化规律并提取相似用电行为特征; 

2)选用二次聚类法对园区用户负荷特性进行分类研究,即一次 聚类采用系统聚类法对负荷特性进行分类;二次聚类采用模糊C均值法,聚类中心由初次系统聚类结果即一次聚类提供。具体包括下面几个步骤: 

2A:首先确定聚类分析的聚类数范围: 

2A.1:确定聚类数的上下限,下限取2,上限取In(N),N为数据总数; 

2A.2:从聚类数下限开始计算该聚类数下的聚类有效性,计算完成后,聚类数C=C+1; 

2B:数据预处理:首先读取数据,然后对数据预处理; 

2C:确定类别数:选择聚类效果最好的类别数作为最终确定的聚类数Ca; 

2.C1对聚类数进行第一次聚类,即系统聚类:对于给该聚类数C使用七种不同方法的系统聚类,得到每种方法下的聚类树及聚类中心; 

2.C2通过最优系统聚类法得出下一步的模糊C聚类的聚类树及聚类中心:通过cophenetic相关系数的比较这七种方法下聚类效果的好坏,选取聚类效果最好即cophenetic相关系数最大的方法得到的聚类树和聚类中心,提供下一步的模糊C聚类的聚类树及聚类中心; 

2.C3对聚类数进行特殊元素的提取:先提取并置空特殊类别的元素数据,然后对剩余的元素采用模糊C均值法进行第二次聚类分析,得到第二次聚类分析结果; 

2.C4对第二次聚类分析后的结果加上特殊元素提取的结构一起返回第A.2步,计算完所有的聚类数后,比较各个聚类数下模糊C均值法的有效性分析结果,选择聚类效果最好的类别数作为最终确定的聚类数Ca。 

2D:对聚类数Ca进行聚类分析,并进行有效性验证,并最终输出聚类结果。 

3)分析用户k在相同季节t内用电行为的差异性,定义ΔSi为不同模式i下的每日当前生产负荷曲线与目标曲线所包围的面积差,该目标曲线可为不同用电模式对应的负荷曲线群: 

>Ski=024Lkidt---(1)>

ΔSki=Sk0-Ski      (2) 

式中:Lki为t季节内用户k在i模式下的实时生产负荷;ΔSki为t季节内用户k在i模式下的当日变化负荷;Sk0为t季节内用户k的实际日生产总负荷;Ski为t季节内用户k的当日目标生产总负荷,在典型用电模式负荷群中取值。对用户计算ΔSki按如图4中示例所示: 

4)根据直接负荷控制的季节t和目标Lmax,利用优化函数建模以选取需求侧管理时的计划用电模式,该模型有利于供电公司在保障电力供应的前提下最大化售电利润; 

>min{Σk=1nΔSki}s.t.max{Σk=1nLki}Lmax---(3)>

式中:ΔSki为t季节内用户k在i模式下当日变化负荷;Lki为t季节内用户k在i模式下的实时生产负荷;Lmax为t季节内工业园区的实时总负荷上限; 

5)利用由此累积生成的用户用电行为模式库,将不便建模的新驻企业与已建立的典型用户模式相比较,类推得到其负荷特性以提高园区的规划效率。 

本发明所述步骤2B.1中由于受信号干扰、软件故障、设备性能等影响,而使负荷数据未全面采集或有失真现象,所以首先对读取的数据进行非正常负荷数据的识别与处理,具体包括数据的横向识别与纵向识别: 

①横向识别:认为短时间内数据横向相似,即样本日与附近同类日曲线相似,结合统计学原理,利用样本统计指标与设定阈值判断是否有非正常数据: 

首先利用横向识别中式(4)(5)计算序列的均值与方差,判断是否有非正常数据,当均值过大或过小时说明该日数据不正常,当方差过大说明该日数据非正常。>xn,i=1NΣn=1Nxn,.i,i=1~96---(4)>

>σi2=1NΣn=0N(xn,.i-xn,i)2---(5)>

再利用式(6)进行3σ原理的非正常数判断,其中ε为阈值,通常取1~1.5。如果式(6)满足,则xn,.i即为非正常数据。 

>|xn,.i-xn,i|>3σiϵ---(6)>

对利用式(7)对非正常数据进行修正,其中α1、β1、γ1为自定义权值且α111=1,为第n天第i点修正数据;xn±1,.i为xn,.i附近两个横向负荷点,为距离xn,.i最近的两个相似日负荷点。 

>xn,.i*=α12Σxn±1,.i+β12Σxn,.i1,2+γ1xn,i---(7)>

②纵向识别:认为短时间内数据纵向相似,即相隔15min的连续3个数据相对稳定,没有突变,结合统计学原理,利用样本统计指标与设定阈值判断是否有非正常数据: 

首先利用式(8)将某负荷点附近连续5个数据平均化,形成平滑后的负荷序列。 

>xn,i=15Σj=-22xn,.i+j,i=1~96---(8)>

再判断原始数据与平滑后数据的误差是否满足式(10),σn,i为原该点数据与平滑后该点数据差的绝对值。如满足,则负荷点为非正常数据,δ为阈值,通常取0.08~0.15。 

σn,i=|xn,.i-x′n,.i|      (9) 

σn,i>δx′n,.i      (10) 

若负荷点为非正常数据,则利用式(11)修正, 

>xn,.i*=α22Σxn,.i±1+β22Σxn,.i±2---(11)>

其中xn,.-1,xn,.0,xn,.97,xn,.98分别为第n-1和n+1天的最后和最前的两个 负荷点,且α2、β2为自定义权值且α22=1。 

(2)负荷数据加权处理:由于部分地区实行峰谷平分时电价政策,峰谷分时电价的峰、谷时段电价价差一般在2-5倍之间,所以需要对负荷数据加权处理,设定负荷曲线高峰时段各点的权值为3(8:00-12:00,17:00-21:00),即认为工作时段的权重较高,而夜间休息时段的权重较低,有利于使分类结果更能说明目标问题。 

(3)对上述加权处理后的负荷数据处理后进行第一次聚类分析,第一次聚类分析采用基于类平均法的系统聚类法对每日的负荷进行分类:用G来表示类,假定G中有m个元素,用列向量xi(i=1,2,...,m)来表示,dij表示元素xi与xj间距离,DKL表示类GK与类GL之间的距离。若定义类与类之间的平方距离等于其负荷数据对之间平方距离的平均值。则Gk和GL之间的平方距离可表示为: 

>DKL2=1nKnLΣxiGk,xjGLdij---(14)>

式中:nK为类GK的元素个数;nL为类GL的元素个数。 

推广后的类间平方距离的递推公式为: 

>DMJ2=(1-β)[nKnMDKJ2+nLnMDLJ2]+βDKL2---(15)>

式中:nK为类GK的元素个数;nL为类GL的元素个数;nM为类G的元素个数;β<1为可变系数。 

(4)对第一次聚类分析后的负荷数据进行特殊元素提取。由于本发明下述步骤需要使用模糊C聚类的算法,而模糊C聚类的算法对分类 中的特殊元素敏感,当有样品数据比较特殊自成一类时,迭代次数会明显增多,甚至陷入死循环。因此在算法操作中加入了提取特殊元素这一步骤,恰好能利用此操作发现变量中的特殊元素,提高效率。特殊元素的提取主要根据负荷的具体情况而定,此为本领域人员熟知技术,在此不再举例说明。 

(5)对进行过元素提取的负荷数据进行第二次聚类分析,第二次聚类分析采用模糊C均值法;其中聚类中心由第一次系统聚类的结果提供。 

模糊C均值法的定义为把聚类归结成一个带约束的非线性规划问题,通过优化求解获得数据集的模糊划分和聚类。算法通过迭代调整(U,P)使得目标函数J最小。其中,U=[μik]c×n为隶属度矩阵,P=[pi](i=1,2,…,c),表示第i类的代表聚类中心矩阵,Jm(U,P)是类内加权平方误差和的目标函数。dik表示样本xk与第i类聚类中心pi之间的失真度。 

一般描述成: 

>Jm(U,P)=Σk=1nΣi=1c(μik)m(dik)2,m[1,)s,t.UMfc---(16)>

式中:m称为加权指数;μik为子集Xi的特征函数,有μik∈{0,1};pi(i=1,2,...,c)表示第i类的聚类中心矩阵,pi=(pi1,pi2,...,pis)∈Rs模糊C均值法的主要过程为输入要划分的聚类数目C、模糊指数m、数据集X,确定聚类中心矩阵P={p1,p2,p3,…,pc},然后计算隶属度矩阵U,再根据U计算聚类中心P,接着由P再计算U,如此反复直到 满足条件。 

具体步骤大致如下: 

①取定聚类数目C,模糊指数m和初始聚类中心迭代步数L=0; 

②计算隶属度矩阵UL: 

时,隶属度矩阵U中的元素μik的计算方法为: 

>μik=1Σj=1c(dik2djk2)1/m-1---(17)>

当时,>iIk,ik=0且>Σi=Iμik=1>

③用隶属度矩阵UL计算PL+1

>piL+1=Σk=1n(μikL)mxkΣk=1n(μikL)m---(18)>

④判断是否满足迭代条件:对给定的阀值ε,||UL+1-UL||<ε;如果满足,则算法中止;否则L=L+1,并转向②。 

(6)聚类结果的有效性验证:由于聚类的类别数需要在聚类分析前人为设定,需要对选择的聚类数C进行有效性问题。 

模糊划分系数F(U;c)是指n个可能性分布描述因子的平均值,定义为: 

>F(U;c)=1nΣj=1n(Σi=1cμij2/Σi=1cμij)---(19)>

可能性划分系数P(U;c)对于给定的聚类数c和隶属度矩阵U,定义为: 

>P(U;c)=1cΣi=1c(Σj=1nμij2/Σj=1nμij)---(20)>

聚类有效性函数FP(U;c)对给定的聚类数c和隶属度矩阵U,定义为: 

FP(U;c)=F(U;c)-P(U;c)      (21) 

所以对于U∈Mfc的“最优”的有限集合,若存在(U*;c*)满足 

>FP(U*;c*)=minc{minΩcFP(U;c)}---(22)>

则以(U*;c*)为“最优”的有效性聚类。注意式中取cmax≤In n。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号