首页> 中国专利> 基于指标体系的行为分类方法、经济持留识别方法及装置

基于指标体系的行为分类方法、经济持留识别方法及装置

摘要

本发明涉及一种基于指标体系的行为分类方法、经济持留识别方法及装置,识别方法包括:构建发电机组经济持留指标体系,采集电力现货市场相关数据,获取机组指标数据;构建发电机组经济持留的Logit离散选择模型,并运用SCAD变量选择法对发电机组经济持留指标体系中的指标进行筛选;采用由筛选后的指标构建发电机组经济持留的SCAD‑Logit模型;获取筛选后的指标的发电机组数据,并载入发电机组经济持留的SCAD‑Logit模型中,对发电机组经济持留进行识别;输出并展示发电机组经济持留识别结果。与现技术相比,本发明不仅可以给出模型解释,清晰表达各指标对识别结果的边际贡献,还可以通过抑制或者促进相应指标值,实现对发电机组经济持留行为的有效控制。

著录项

  • 公开/公告号CN114819479A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利号CN202210237402.8

  • 发明设计人 孙波;程思远;王璠;谢敬东;孙欣;

    申请日2022-03-11

  • 分类号G06Q10/06(2012.01);G06Q30/02(2012.01);G06Q30/08(2012.01);G06Q50/06(2012.01);

  • 代理机构上海科盛知识产权代理有限公司 31225;

  • 代理人赵继明

  • 地址 201306 上海市浦东新区沪城环路1851号

  • 入库时间 2023-06-19 16:11:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-16

    实质审查的生效 IPC(主分类):G06Q10/06 专利申请号:2022102374028 申请日:20220311

    实质审查的生效

说明书

技术领域

本发明涉及数据识别技术领域,尤其是涉及基于指标体系的行为分类方法、经济持留识别方法及装置。

背景技术

电力现货市场运行初期交易规则的不完善会导致市场中出现市场力滥用的现象,经济持留为其中一种。经济持留是指发电机组通过申报高价,使得自身部分发电容量不中标,达到抬高市场出清价格,使自身或其利益联盟的机组获得高额利润的行为。经济持留会严重影响电力现货市场的安全稳定与健康发展。因此,快速有效地识别发电机组的经济持留对电力市场建设是非常迫切的。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于指标体系的行为分类方法、经济持留识别方法及装置,不仅可以给出模型解释,清晰表达各指标对识别结果的边际贡献,还可以通过抑制或者促进相应指标值。

本发明的目的可以通过以下技术方案来实现:

一种发电机组经济持留识别方法,包括以下步骤:

构建发电机组经济持留指标体系,采集电力现货市场相关数据,根据该发电机组经济持留指标体系获取机组指标数据;

构建发电机组经济持留的Logit离散选择模型,并运用SCAD变量选择法对发电机组经济持留指标体系中的指标进行筛选;

采用由筛选后的指标构建发电机组经济持留的SCAD-Logit模型;获取筛选后的指标的发电机组数据,并载入发电机组经济持留的SCAD-Logit模型中,对发电机组经济持留进行识别;

输出并展示发电机组经济持留识别结果。

进一步地,所述电力现货市场相关数据包括发电机组所属发电集团、装机容量、机组台数、单机容量、市场份额、输配电价、交易规则、交易实施细则和电力市场适用的法律法规及相关规程规范,以及机组运行情况、市场主体申报信息、现货电能量市场交易结果信息、市场主体交易结算信息、市场管理信息和运营总结信息。

进一步地,所述发电机组经济持留指标体系包括多个指标维度,多个指标维度包括市场结构类指标、竞价策略类指标和出清结果类指标;所述市场结构类指标包括市场份额和剩余供应指数,所述竞价策略类指标包括加权平均报价、报价波动程度、报价与成本偏差幅度、高报价指数和量价指数,所述出清结果类指标包括高价中标率、序外容量指数、平均收益率。

进一步地,所述发电机组经济持留的Logit离散选择模型基于潜在变量

在Logit离散选择模型中加入SCAD惩罚项,所述回归系数的取值根据所述Logit离散选择模型的分类结果和SCAD惩罚项的取值计算;

根据获取的机组指标数据采用交叉验证法确定SCAD惩罚项的第一调整参数;

采用共线性检验验证发电机组经济持留指标体系中各指标间的共线性,得到筛选后的指标。

进一步地,所述交叉验证法具体为:选取λ的备用集合Γ=(λ

将不同划分下的损失函数相加得到统计量S

进一步地,所述损失函数值的计算表达式为:

式中,e为自然对数,β

所述统计量S

进一步地,所述发电机组经济持留的Logit离散选择模型输出有分类变量y

式中,y

所述潜在变量

式中,i=1,2,...,n;j=1,2,...,J;x

所述分类变量y

式中,P(y

进一步地,加入SCAD惩罚项后,所述回归系数的计算表达式为:

式中,λ为第一调整参数,

本发明还提供一种基于指标体系的行为分类方法,包括以下步骤:

构建指标体系,根据该指标体系获取指标数据;

构建行为分类模型,并运用SCAD变量选择法对指标体系中的指标进行筛选;

采用由筛选后的指标构建行为筛选分类模型,获取筛选后的指标的指标数据,并在于所述行为筛选分类模型中,进行行为分类;

输出并展示行为分类结果。

本发明还提供一种发电机组经济持留识别装置,包括存储器以及耦接至所述存储器的处理器,所述的处理器被配置为基于存储在所述的存储器设备中的指令,执行如上所述的发电机组经济持留识别方法的步骤,所述处理器包括:

输入模块,用于输入电力现货市场相关数据;

指标体系模块,用于构建发电机组经济持留指标体系,并根据发电机组经济持留指标体系获取机组指标数据;

变量选择模块,用于构建发电机组经济持留的Logit离散选择模型,并运用SCAD变量选择法对发电机组经济持留指标体系中的指标进行筛选;

经济持留识别模块,用于采用由筛选后的指标构建发电机组经济持留的SCAD-Logit模型,获取筛选后的指标的发电机组数据,并载入发电机组经济持留的SCAD-Logit模型中,对发电机组经济持留进行识别;

输出模块,用于输出并展示发电机组经济持留识别结果。

与现有技术相比,本发明具有以下优点:

本发明在借鉴国内外电力市场中发电机组交易行为监管指标的基础上,综合考虑发电机组交易行为的内在因素及市场环境的外在因素,从结构类指标、行为类指标及影响类指标三个方面构建发电机组经济持留识别指标体系,为电力市场中有效识别经济持留提供依据。

对于复杂且高维的电力现货市场数据,SCAD变量选择法能够从多种指标中筛选得到机组经济持留的重要识别指标,并剔除具有共线性的指标与弱相关指标,从而降低数据维度,降低市场管理者的监管成本。

相对于其他机器学习的识别技术,本发明提出的技术,不仅可以给出模型解释,清晰表达各指标对识别结果的边际贡献,还可以通过抑制或者促进相应指标值,实现对发电机组经济持留行为的有效控制。

附图说明

图1为本发明实施例中提供的一种发电机组经济持留识别方法的流程图;

图2为本发明实施例中提供的一种发电机组经济持留识别装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中,需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

实施例1

如图1所示,本实施例提供一种发电机组经济持留识别方法,其特征在于,包括以下步骤:

S1:采集并输入电力现货市场相关数据;

本实施例中,电力现货市场相关数据包括发电机组所属发电集团、装机容量、机组台数、单机容量、市场份额、输配电价、交易规则、交易实施细则和电力市场适用的法律法规及相关规程规范,以及机组运行情况、市场主体申报信息、现货电能量市场交易结果信息、市场主体交易结算信息、市场管理信息和运营总结信息。

S2:从多个维度构建发电机组经济持留指标体系,根据该发电机组经济持留指标体系获取机组指标数据;

参阅表1,发电机组经济持留指标体系包括市场结构类指标、竞价策略类指标、出清结果类指标;其中,市场结构类指标包括市场份额、剩余供应指数;竞价策略类指标包括加权平均报价、报价波动程度、报价与成本偏差幅度、高报价指数、量价指数;出清结果类指标包括高价中标率、序外容量指数、平均收益率。

表1发电机组经济持留指标体系

S3:构建发电机组经济持留的Logit离散选择模型,并运用SCAD变量选择法对发电机组经济持留指标体系中的指标进行筛选,采用由筛选后的指标构建发电机组经济持留的SCAD-Logit模型,具体包括以下步骤:

S31:引入潜在变量

式中,i=1,2,...,n;j=1,2,...,J;x

发电机组经济持留的Logit离散选择模型输出有分类变量y

式中,y

分类变量y

式中,P(y

S32:在Logit离散选择模型中加入SCAD惩罚项p

式中,

采用交叉验证法选取模型的惩罚参数,并对指标进行计算筛选;确定λ的备选集合,考虑N个不同的λ取值,则令备选集合Γ=(λ

式中,e为自然对数,β

将不同划分下的损失函数s

S33:采用共线性检验验证指标间的共线性,为构建识别模型提供基础;指标筛选结果与共线性检验见表2。

表2指标筛选结果与共线性检验

指标共线性检验如上表所示,若所筛选出的指标方差膨胀因子大于10或容忍度小于0.1,则表明指标间存在共线性。

S34:由筛选所得指标构建发电机组经济持留的SCAD-Logit模型;得到发电机组经济持留识别的SCAD-Logit模型如下:

其中

S4:获取筛选后的指标的发电机组数据,并载入发电机组经济持留的SCAD-Logit模型中,对发电机组经济持留进行识别,具体包括以下步骤:

S41:采用分层抽样法构建样本集与测试集,避免数据的不均衡而造成模型识别误差;

S42:利用SCAD-Logit模型对发电机组经济持留进行识别分析;设定当机组经济持留的概率P(y

S43:使用混淆矩阵、ROC曲线与AUC值对模型进行性能评估。

混淆矩阵也称作误差矩阵,是用于模型精度评价的一种标准格式,如表3所示。

表3SCAD-Logit模型的混淆矩阵

SCAD-Logit模型作为二分类模型,在机组经济持留识别任务下,识别类别与真实类别之间存在四种不同的组合。表3中的TP表示真实类别为1,识别为1,即成功识别发电机组行使经济持留行为;TN表示真实为0,识别为0,即成功识别发电机组未行使经济持留行为;FP表示真实为0,识别为1,即将未行使经济持留的发电机组错误识别为行使经济持留的发电机组;FN表示真实为1,识别为0,即将行使经济持留的发电机组错误识别为未行使经济持留的发电机组。前两者TP和TN表示模型识别成功,对电力现货市场的监管有正向作用;后两者FP与FN表示识别错误,对电力现货市场的监管不仅没有正向作用,还会使监管过度,进而增加市场风险。

ROC曲线作为一种坐标图式的分析工具,一般用于评价模型识别能力。ROC曲线中主要的两个指标分别为真正率和假正率,也称作灵敏度和特异度,一般假正率为其横坐标,真正率为其纵坐标。真正率计算公式为TP/(TP+FN),假正率则为TN/(FP+TN)。对模型评价来说,自然希望真正率越大越好,而同时假正率越小越好,所以ROC曲线越靠近左上角,证明模型识别能力越好。

AUC值实际表示ROC曲线下的面积,作为评价模型的应用,其值域为0到1之间,因ROC曲线越靠近左上角越好,所以AUC的理想值为1,且越接近1,模型识别效果越好。

S5:输出并展示识别结果,如表4所示。

表4发电机组经济持留识别结果

以上是对本发明提供的一种基于SCAD-Logit模型的发电机组经济持留的识别技术进行的详细说明,以下将对本实施例提供的一种基于SCAD-Logit模型的发电机组经济持留的识别技术装置的结构和关系进行说明,如图2所示,本实施例提供的一种发电机组经济持留识别装置,具体包括:存储器以及耦接至存储器的处理器,的处理器被配置为基于存储在的存储器设备中的指令,执行如上的发电机组经济持留识别方法的步骤,处理器包括:

输入模块,用于输入电力现货市场相关数据;

更进一步的,电力现货市场相关数据包括发电机组所属发电集团、装机容量、机组台数、单机容量、市场份额、输配电价、交易规则、交易实施细则和电力市场适用的法律法规及相关规程规范,以及机组运行情况、市场主体申报信息、现货电能量市场交易结果信息、市场主体交易结算信息、市场管理信息和运营总结信息。

指标体系模块,用于构建发电机组经济持留指标体系,并根据发电机组经济持留指标体系获取机组指标数据;

更进一步的,发电机组经济持留指标体系包括市场结构类指标、竞价策略类指标、出清结果类指标;其中,市场结构类指标包括市场份额、剩余供应指数;竞价策略类指标包括加权平均报价、报价波动程度、报价与成本偏差幅度、高报价指数、量价指数;出清结果类指标包括高价中标率、序外容量指数、平均收益率。

变量选择模块,用于构建发电机组经济持留的Logit离散选择模型,并运用SCAD变量选择法对发电机组经济持留指标体系中的指标进行筛选;

更进一步的,变量选择模块中预置的SCAD变量选择法的统计量计算公式如下:

经济持留识别模块,用于采用由筛选后的指标构建发电机组经济持留的SCAD-Logit模型,获取筛选后的指标的发电机组数据,并载入发电机组经济持留的SCAD-Logit模型中,对发电机组经济持留进行识别;

更进一步的,经济持留识别模块中预置的SCAD-Logit模型公式如下:

输出模块,用于输出并展示发电机组经济持留识别结果。

本实施例还提供一种基于指标体系的行为分类方法,包括以下步骤:

构建指标体系,根据该指标体系获取指标数据;

构建行为分类模型,并运用SCAD变量选择法对指标体系中的指标进行筛选;

采用由筛选后的指标构建行为筛选分类模型,获取筛选后的指标的指标数据,并在于行为筛选分类模型中,进行行为分类;

输出并展示行为分类结果。

具体地,指标体系包括多个指标维度,每个指标维度均包括多个指标;

行为分类模型基于潜在变量

在行为分类模型中加入SCAD惩罚项,回归系数的取值根据行为分类模型的分类结果和SCAD惩罚项的取值计算;

根据获取的机组指标数据采用交叉验证法确定SCAD惩罚项的第一调整参数;

采用共线性检验验证指标体系中各指标间的共线性,得到筛选后的指标。

交叉验证法具体为:选取λ的备用集合Γ=(λ

将不同划分下的损失函数相加得到统计量S

行为分类模型输出有分类变量y

式中,y

潜在变量

式中,i=1,2,...,n;j=1,2,...,J;x

分类变量y

式中,P(y

加入SCAD惩罚项后,回归系数的计算表达式为:

式中,λ为第一调整参数,

损失函数值的计算表达式为:

式中,e为自然对数,β

统计量S

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其他的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号