首页> 中国专利> 一种基于集成分类器的电压暂降分类方法

一种基于集成分类器的电压暂降分类方法

摘要

本发明涉及电网数据处理技术领域,公开了一种基于集成分类器的电压暂降分类方法,其方法通过获取电压暂降数据以及对应的暂降类型标签构建训练样本集,将训练样本集输入到基础分类器进行训练,得到分类结果,计算每个暂降类型标签的分类正确率和总分类正确率,考虑电压暂降样本的数量不均衡,计算基础分类器在所有分类器中的分类器权重,并按照预设的权重更新规则对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,向相应的训练样本赋予更新权重,将各个分类器按照相应的分类器权重集成强分类器,利用强分类器对电压暂降数据进行分类处理,提高了分类的稳定性和精确性。

著录项

  • 公开/公告号CN115238767A

    专利类型发明专利

  • 公开/公告日2022-10-25

    原文格式PDF

  • 申请/专利号CN202210688031.5

  • 发明设计人 李新;

    申请日2022-06-17

  • 分类号G06K9/62(2022.01);G06Q50/06(2012.01);

  • 代理机构北京集佳知识产权代理有限公司 11227;

  • 代理人郑华丽

  • 地址 510600 广东省广州市越秀区东风东路757号

  • 入库时间 2023-06-19 17:25:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-11

    实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022106880315 申请日:20220617

    实质审查的生效

说明书

技术领域

本发明涉及电网数据处理技术领域,尤其涉及一种基于集成分类器的电压暂降分类方法。

背景技术

现有电压暂降分类方法一般是靠人工提取阈值,根据电压暂降不同类型的典型特征进行分类,但该类方法准确性较低,因此,现有技术中,通过GAN 网络、神经网络等算法以机器学习的方法代替人工提取特征,但是,该类方法未考虑到电压暂降短路故障、变压器投切、电机启动三种类型数量间的不平衡,短路故障在电网占比更大,变压器投切、电机启动两种类型更少,采取常规的训练方法无法增强样本数量少的暂降类型的特征,导致模型在实测数据中分类准确率较低。

发明内容

本发明提供了一种基于集成分类器的电压暂降分类方法,解决了电压暂降分类的准确性较低的技术问题。

有鉴于此,本发明第一方面提供了一种基于集成分类器的电压暂降分类方法,包括以下步骤:

S1、获取电压暂降数据以及对应的暂降类型标签,将所述电压暂降数据以及对应的暂降类型标签构建训练样本集,向所述训练样本集中的每个训练样本赋予初始权重;

S2、将所述训练样本集输入到基础分类器进行训练,得到分类结果,计算每个暂降类型标签的分类正确率和总分类正确率;

S3、获取不同暂降类型标签下的样本数量,以确定最少样本数量的暂降类型标签以及相应的分类正确率,计算基础分类器在所有分类器中的分类器权重;

S4、获取暂降类型标签对应的样本数量,按照预设的权重更新规则对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,得到每个训练样本对应的更新权重,向相应的训练样本赋予更新权重;

S5、重复步骤S2~S5直至所有分类器迭代更新完毕,将各个分类器按照相应的分类器权重集成强分类器;

S6、将所述电压暂降数据输入至所述强分类器进行分类处理,得到相应的暂降类型标签。

优选地,步骤S1具体包括:

获取电压暂降数据,通过下式1计算所述电压暂降数据的有效值为:

式1中,U(K)表示电压有效值,K表示采样点的总序列号,k表示采样点的计数符号,N

将所述有效值通过下式矩阵构建为有效值样本集为:

S={s

式2中,S代表有效值样本集,s

获取所述电压暂降数据对应的暂降类型,记为暂降类型标签,所述暂降类型标签包括短路故障类型、变压器投切类型和感应电机启动类型;

将所述电压暂降数据以及对应的暂降类型标签构建训练样本集,向所述训练样本集中的每个训练样本赋予初始权重为ω

优选地,步骤S2具体包括:

将所述训练样本集输入到基础分类器进行训练,输出暂降类型标签,通过下式分别计算每个暂降类型标签的分类正确率和总分类正确率:

式3中,y

优选地,步骤S3具体包括:

获取不同暂降类型标签下的样本数量,以确定最少样本数量的暂降类型标签以及相应的分类正确率,通过下式4计算基础分类器在所有分类器中的分类器权重:

式4中,α

优选地,步骤S4具体包括:

通过下式5计算基础权重为:

式5中,ω

获取暂降类型标签对应的样本数量,通过下式6~8对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,得到每个训练样本对应的更新权重:

通过下式6计算样本数量最多的暂降类型标签的训练样本的更新权重:

通过下式7计算样本数量最少的暂降类型标签的训练样本的更新权重:

ω

通过下式8计算样本数量居中的暂降类型标签的训练样本的更新权重:

ω

向相应的训练样本赋予相应的更新权重。

优选地,所述将各个分类器按照相应的分类器权重集成强分类器的步骤具体包括:

通过下式9将各个分类器按照相应的分类器权重集成强分类器为:

H(s)=sign|∑α

式9中,H(s)表示强分类器,sign为符号函数,α

从以上技术方案可以看出,本发明具有以下优点:

本发明通过获取电压暂降数据以及对应的暂降类型标签构建训练样本集,将训练样本集输入到基础分类器进行训练,得到分类结果,计算每个暂降类型标签的分类正确率和总分类正确率,考虑电压暂降样本的数量不均衡,计算基础分类器在所有分类器中的分类器权重,并按照预设的权重更新规则对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,向相应的训练样本赋予更新权重,将各个分类器按照相应的分类器权重集成强分类器,利用强分类器对电压暂降数据进行分类处理,提高了分类的稳定性和精确性。

附图说明

图1为本发明实施例提供的一种基于集成分类器的电压暂降分类方法的流程图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了便于理解,请参阅图1,本发明提供的一种基于集成分类器的电压暂降分类方法,包括以下步骤:

S1、获取电压暂降数据以及对应的暂降类型标签,将电压暂降数据以及对应的暂降类型标签构建训练样本集,向训练样本集中的每个训练样本赋予初始权重;

其中,每个样本在初始训练时具有相同的权重。

S2、将训练样本集输入到基础分类器进行训练,得到分类结果,计算每个暂降类型标签的分类正确率和总分类正确率;

本实施例中的基础分类器采用决策树分类器。

S3、获取不同暂降类型标签下的样本数量,以确定最少样本数量的暂降类型标签以及相应的分类正确率,计算基础分类器在所有分类器中的分类器权重;

可以理解的是,由于电压暂降样本的数量不均衡,故考虑电压暂降样本不平衡的分类器权重。

S4、获取暂降类型标签对应的样本数量,按照预设的权重更新规则对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,得到每个训练样本对应的更新权重,向相应的训练样本赋予更新权重;

S5、重复步骤S2~S5直至所有分类器迭代更新完毕,将各个分类器按照相应的分类器权重集成强分类器;

S6、将电压暂降数据输入至强分类器进行分类处理,得到相应的暂降类型标签。

需要说明的是,本实施例提供了一种基于集成分类器的电压暂降分类方法,获取电压暂降数据以及对应的暂降类型标签构建训练样本集,将训练样本集输入到基础分类器进行训练,得到分类结果,计算每个暂降类型标签的分类正确率和总分类正确率,考虑电压暂降样本的数量不均衡,计算基础分类器在所有分类器中的分类器权重,并按照预设的权重更新规则对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,向相应的训练样本赋予更新权重,将各个分类器按照相应的分类器权重集成强分类器,利用强分类器对电压暂降数据进行分类处理,提高了分类的稳定性和精确性。

在一个具体实施例中,步骤S1具体包括:

S101、获取电压暂降数据,通过下式1计算电压暂降数据的有效值为:

式1中,U(K)表示电压有效值,K表示采样点的总序列号,k表示采样点的计数符号,N

其中,电能质量监测平台所记录的电压暂降数据为电压瞬时值,则需要式1将电压瞬时值转换为有效值。

S102、将有效值通过下式矩阵构建为有效值样本集为:

S={s

式2中,S代表有效值样本集,s

S103、获取电压暂降数据对应的暂降类型,记为暂降类型标签,暂降类型标签包括短路故障类型、变压器投切类型和感应电机启动类型;

其中,暂降类型为预先设定的,其与电压暂降数据存在映射关系。

S104、将电压暂降数据以及对应的暂降类型标签构建训练样本集,向训练样本集中的每个训练样本赋予初始权重为ω

在一个具体实施例中,步骤S2具体包括:

S201、将训练样本集输入到基础分类器进行训练,输出暂降类型标签,通过下式分别计算每个暂降类型标签的分类正确率和总分类正确率:

式3中,y

需要说明的是,本实施例考虑了不同电压暂降类型的样本数量的不平衡,计算了每个暂降类型标签的分类正确率和总分类正确率。

在一个具体实施例中,步骤S3具体包括:

S301、获取不同暂降类型标签下的样本数量,以确定最少样本数量的暂降类型标签以及相应的分类正确率,通过下式4计算基础分类器在所有分类器中的分类器权重:

式4中,α

在一个具体实施例中,步骤S4具体包括:

S401、通过下式5计算基础权重为:

式5中,ω

S402、获取暂降类型标签对应的样本数量,通过下式6~8对不同样本数量的暂降类型标签对应的训练样本的初始权重进行更新,得到每个训练样本对应的更新权重:

通过下式6计算样本数量最多的暂降类型标签的训练样本的更新权重:

通过下式7计算样本数量最少的暂降类型标签的训练样本的更新权重:

ω

通过下式8计算样本数量居中的暂降类型标签的训练样本的更新权重:

ω

S403、向相应的训练样本赋予相应的更新权重。

可以理解的是,通过上述计算可以获得不同样本数量的暂降类型标签的更新权重,考虑到电压暂降样本的不均衡性,提高了分类器的分类精确性。

在一个具体实施例中,将各个分类器按照相应的分类器权重集成强分类器的步骤具体包括:

通过下式9将各个分类器按照相应的分类器权重集成强分类器为:

H(s)=sign|∑α

式9中,H(s)表示强分类器,sign为符号函数,α

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号