首页> 中国专利> 一种电力现货市场等报价串谋机组识别方法

一种电力现货市场等报价串谋机组识别方法

摘要

本发明涉及一种电力现货市场等报价串谋机组识别方法,该方法基于Adaboost‑BP算法,具体包括数据采集步骤、数据预处理步骤、等报价串谋机组特征提取步骤、模型建立步骤,通过对等报价串谋机组进行分析,提取等报价串谋的机组特征,利用现货市场数据进行量化处理;通过Adaboost算法构建模型整体框架,提高识别模型识别的正确率;通过BP神经网络算法构建基础分类模型,识别现货市场中等报价串谋的机组。与现有技术相比,本发明具有识别等报价串谋机组的准确率高、可信度高等优点。

著录项

  • 公开/公告号CN112819551A

    专利类型发明专利

  • 公开/公告日2021-05-18

    原文格式PDF

  • 申请/专利号CN202110290596.3

  • 申请日2021-03-18

  • 分类号G06Q30/02(20120101);G06Q50/06(20120101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构31225 上海科盛知识产权代理有限公司;

  • 代理人林君如

  • 地址 510600 广东省广州市越秀区梅花路75号

  • 入库时间 2023-06-19 11:02:01

说明书

技术领域

本发明涉及电力市场串谋机组识别技术领域,尤其是涉及一种电力现货市场等报价串谋机组识别方法。

背景技术

在新形势下的电力市场中,现货市场交易规则尚不健全,在市场交易的过程中,机组为了获取高额利润,通过机组间协商、签订合同等方式,缔结为一个“联盟”,利用协商好的报价策略,同时报高价进而获得超额利润。当机组拥有较大的市场份额时,通过机组间的合谋所能获得的长期收益相对较多,机组间的串谋行为就越容易发生。机组采用等报价串谋方式,严重损害现货市场发现价格的能力,因此,为了保证市场的公平竞争和健康发展,建立一套现货市场等报价串谋机组的识别方法,对于维护电力市场的安全、稳定、可靠运行,具有积极意义。然而目前,针对等报价串谋机组还未有高效的识别方法,常用的识别方法是以收集机组数据进行人工分析,工作量大,识别速度慢,且准确率容易受人工误差影响,无法适用于现货市场中滥用市场力的机组占少数且市场数据量大的情况;且现有技术中只停留在对机组串谋的可能性进行评估,但并未对其形成串谋的逻辑和机理进行分析。此外,传统的串谋识别方法依据机组数据特征,构建评判指标,利用综合评价的方法识别滥用市场力行为,但综合评价方法涉及较多的主观因素,评价结果不够客观,并且不适用于维数高、数据量大的电力交易数据。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种电力现货市场等报价串谋机组识别方法。

本发明的目的可以通过以下技术方案来实现:

一种电力现货市场等报价串谋机组识别方法,该方法包括如下步骤:

步骤一、通过电力市场运营数据支持系统,采集电力现货市场数据。所述电力现货市场数据包括市场整体运营信息、机组的基本信息、机组的运营信息和年报信息。

步骤二、基于等报价串谋风险理论,利用采集的电力现货市场数据获取等报价串谋机组的相应特征,建立等报价串谋机组识别指标体系。所述等报价串谋机组的相应特征包括报价相似度、报价改变同步度、中标率和高价中标率,所述等报价串谋机组识别指标体系包括报量一致性指标、报价一致性指标、报价曲线差异度、报价变化序列相似度、机组中标率和机组高价中标率。

报价一致性指标表示机组i和机组j的报价一致性情况,其计算方式如下:

式中,

报量一致性指标表示机组i和机组j的报量一致性情况,其计算方式如下:

式中,

报价曲线差异度为机组i的报价曲线及机组j的报价曲线之间的阴影面积。机组报价曲线差异度的计算公式为:

式中,Diff

报价变化序列相似度为机组i的报价变化序列及机组j的报价变化序列的相关系数。其计算公式为:

P′

式中,R′

步骤三、根据步骤一获取的电力现货市场数据和步骤二得到的等报价串谋识别指标体系,删除等报价串谋识别指标体系中的缺失数据与错误数据,并对数据进行预处理,获取标准化数据。对数据进行预处理包括对等报价串谋机组识别指标依次进行的数据无量纲处理、数据一致化处理和数据指标筛选处理。

所述数据无量纲处理采用极值处理法对各等报价串谋机组识别指标进行统一数据形式处理。所述数据指标筛选处理是对数据一致化处理后的等报价串谋机组识别指标,采用主成分分析法获取各指标之间的相关系数,根据相关系数的大小进行指标筛选。

步骤四、基于Adaboost算法和BP神经网络算法,利用等报价串谋机组的相应特征建立现货市场中等报价串谋机组识别模型。具体内容为:

41)梳理电力现货市场中等报价串谋机组的相应特征并提取相应指标;

42)基于等报价串谋机组的识别指标,结合电力现货市场的实际情况,构建等报价串谋机组样本和用于模型训练的样本集;

43)初始化训练样本集及数据的权值分布;具体地:

根据训练样本集,在第一轮迭代中赋予训练样本集中的每个机组样本一个相同的权值,每次迭代更新机组样本的权重,相同的权值的表达式为:

D(1){ω

式中:

44)迭代训练弱分类器,更新训练样本集的权值分布;具体地:

441)采用k表示迭代次数,k=1,2,…,K,假设第k次迭代时每个机组样本的权重系数为D(k)={ω

式中,y

442)计算弱分类器G

结合加权误差率e

443)更新训练数据集的权值分布,其表达式如下:

D(k+1){ω

式中:ω

式中:Z

45)重复步骤44),得到一系列的弱分类器及其相应的权重;

46)利用权重参数线性组合各弱分类器,获取最终等报价串谋机组识别模型。

最终等报价串谋机组识别模型的表达式为:

式中,f(x)为利用权重参数线性组合的各弱分类器,表达式为:

步骤五、根据现货市场中等报价串谋机组识别模型识别等报价串谋机组,利用专家系统对等报价串谋机组的形成机理进行逻辑推演,识别现货市场中的等报价串谋机组。专家系统包括数据采集模块、专家知识库及推理机,专家知识库包括基于外在表现的正向推理规则、基于风险级别分析的推理规则和基于信用级别分析的推理规则;其中:

基于外在表现的正向推理规则包括:

机组间的报价一致性大于a*(a*表示报价一致性指标阈值,取市场中所有机组报价一致性指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报量一致性大于b*(b*表示报量一致性指标阈值,取市场中所有机组报量一致性指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报价曲线差异度小于c*(c*表示报价曲线差异度指标阈值,取市场中所有机组报价曲线差异度指标最大值的四分之一),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报价变化序列相似度大于d*(d*表示报价变化序列相似度指标阈值,取市场中所有机组报价变化序列相似度指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组的中标率大于e*(e*表示中标率指标阈值,取市场中所有机组中标率指标最大值的四分之三),则该机组越可能采用了串谋的方式参与现货市场;

机组的高价中标率大于f*(f*表示高价中标率指标阈值,取市场中所有机组高价中标率指标最大值的四分之三),则该机组越可能采用了串谋的方式参与现货市场;

基于风险级别分析的推理规则包括:

机组被等报价串谋识别模型识别出的频率越高,则该机组越可能参与串谋,被识别出的频率越高是指在一段时间内,机组被识别出的次数大于频率阈值G*(G*由专家确定);

基于信用级别分析的推理规则包括:

机组曾经有市场注册失信合同、履约失信、市场交易失信及信息披露失信等行为的次数越多,则该机组越可能参与串谋,失信次数越多是指在一段时间内,机组失信的次数大于次数阈值H*(H*由专家确定);

推理机根据专家知识库中的各推理规则对市场主体的行为进行分析,当某市场主体的推理值超过专家系统设定的等报价串谋机组风险阈值时,则认为该市场主体有90%的可能采用等报价串谋方式扰乱了市场的秩序,认定该机组为等报价串谋机组。

本发明提供的电力现货市场等报价串谋机组识别方法,相较于现有技术至少包括如下有益效果:

一、本发明考虑到现货市场数据维度高、数据量大且正负样本不均衡的特点,采用Adaboost算法构建模型整体框架,对处理不均衡样本问题有着明显优势,识别等报价串谋机组的准确率高;

二、本发明利用机器学习算法获取电力现货市场数据本身的等报价串谋机组相应特征,相比于传统主观的综合评价方法,本发明方法的识别结果更加客观、准确;

三、相比于现有人工分析技术,本发明通过机器学习算法获取电力现货市场数据本身的等报价串谋机组相应特征,并构建等报价串谋机组识别模型,效率更高,工作量小,能够避免人工操作带来的识别速度慢,识别结果存在误差等问题;

四、本发明针对现有技术中只停留在对机组串谋的可能性进行评估的缺陷,提出的基于专家系统的等报价串谋机组逻辑推演模型,同时考虑等报价串谋形成的逻辑性和存在的可能性,采用混合推理机和专家知识库对其进行分析,可以显著地提高等报价串谋机组识别结果的可信度,从而为市场监管者提供权威的数据化基础。

附图说明

图1为实施例中电力现货市场等报价串谋机组识别方法的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

实施例

如图1所示,本发明涉及一种电力现货市场等报价串谋机组识别方法,该方法基于Adaboost算法与BP神经网络算法,具体包括如下步骤:

S1,采集数据步骤:通过电力市场运营数据支持系统,采集电力现货市场的数据,电力现货市场的数据涵盖市场的整体运营信息、机组的基本信息、运营信息和年报信息。其中:

市场的整体运营信息涵盖社会用电信息包括各产业用电量、各产业用电量变动信息;发电生产信息包括总装机容量、各发电类型装机容量、各发电类型装机容量变化信息;发电设备利用小时信息包括发电类型累计平均利用小时数、各发电类型的累计平均利用小时数、各发电类型累计平均利用小时数的变化信息;电力投资建设信息包括电源投资建设资金、区域内新增电源信息。

机组的基本信息包括企业变更信息、发电企业装机容量、电源类型、机组性能信息、输配电价、交易规则、交易实施细则和相关法律法规。

运营信息包括机组运行情况、燃料供应情况、市场主体申报信息、交易结果信息、市场运行信息、交易结算信息、市场管理信息和运营总结信息。

年报信息包括企业财务健康状态、发电机组可用系数、交易合同签订及履约信息、处罚情况和违法违规情况。

S2,等报价串谋机组特征分析步骤:根据等报价串谋风险的定义,结合电力现货市场数据,通过专家分析等报价串谋机组的相应特征,建立等报价串谋机组识别指标体系。

本发明的等报价串谋机组相应特征包括报价相似性、报价改变同步性、易中标、易高价中标等特点,其中:

报价相似性特点是指在同一时刻,串谋联盟机组的报价序列相似程度较高,即各段申报电量占比及对应各段申报电量的价格相近;

报价改变同步性特点是指与前一时刻相比,串谋联盟成员同步改变报价策略,改变比例接近;

易中标特点是指串谋联盟机组在现货市场中更容易中标,即串谋联盟机组的中标率高于市场其他机组;

易高价中标特点是指串谋联盟机组报高价的部分容量容易中标,即串谋联盟机组的高价中标率高于市场其他机组;

本发明的等报价串谋机组识别指标体系包括报价一致性、报量一致性、报价曲线差异度、报价变化序列相似度、机组对中标率、机组对高价中标率等。

报价一致性指标表示机组i和机组j的报价一致性情况,其计算方式如下:

式中,

报量一致性指标表示机组i和机组j的报量一致性情况,其计算方式如下:

式中,

报价曲线差异度为机组i的报价曲线及机组j的报价曲线之间的阴影面积。机组报价曲线差异度的计算公式为:

式中,Diff

报价变化序列定义为机组i在t时刻的报价曲线与其前一时刻报价曲线的差得到的序列,报价变化序列相似度定义为机组i的报价变化序列及机组j的报价变化序列的相关系数。其计算公式为:

P′

式中,R′

机组中标率定义为机组中标总电量与其申报总电量的比值,其计算公式为:

式中,WR

机组高价中标率定义为机组报高价且中标电量占报高价的有效申报电量的比例。高价中标率通过发电商成交情况与申报情况的比较反映发电商的竞标策略与自身实力的配合情况,用于评价发电商策略的成功率与所具有的市场力。其计算公式为:

式中,

S3,数据预处理步骤:根据步骤S1中获取的电力现货市场的数据和步骤S2的等报价串谋识别指标体系,首先,处理步骤S1获得的电力现货市场数据中的缺失数据与错误数据,对于缺失数据,利用相邻数据均值代替,对于错误数据,删除错误数据并用相邻数据均值代替;其次,计算各指标;然后,对指标进行无量纲处理、一致化处理;最后,筛选指标,得到标准化数据。

数据预处理包括无量纲、一致化、指标筛选方法,其中:

无量纲方法的目的在于解决指标数据无法比较的问题,采用极值处理法统一各指标的数据形式,计算公式如下:

式中,X

一致化方法旨在解决各类指标性质差异问题将各类不同性质的指标进行一致化处理,转化为数值越大越好的正指标,得到标准化指标,示例如下:

若指标是极小型,为了转化为极大型指标,对X

式中,X

指标筛选方法对指标进行关联性分析和重要性分析,分析指标间的相关性,相关性较高的指标可以根据指标对结果的重要程度进行选择,相关性分析的计算方法如下式所示:

式中,r

S4,等报价串谋机组识别模型建立步骤:基于Adaboost算法和BP神经网络算法,利用等报价串谋机组特征建立现货市场中等报价串谋机组识别模型。具体流程包括:

S41,梳理步骤S2中的电力现货市场中等报价串谋机组的相应特征并对数据进行预处理得到相应指标;

S42,基于步骤S3处理后得到的指标,结合现货市场的实际情况,利用下式构建等报价串谋机组样本和用于模型训练的样本集。

T

T={T

其中,y

S43,初始化训练数据的权值分布:根据得到的训练集,在第一轮迭代中赋予训练集中的每个机组样本一个相同的权值,如下式,每次迭代更新机组样本的权重。

D(1){ω

其中,

S44,迭代训练弱分类器:用k表示迭代次数,k=1,2,…,K,K表示总的迭代次数。设第k次迭代时每个机组样本的权重系数为D(k)={ω

y

更新训练数据集的权值分布:

D(k+1){ω

其中,ω

式中,Z

重复步骤S44得到一系列的弱分类器及其相应的权重。

S45,利用权重参数线性组合各弱分类器:

利用识别模型,识别现货市场中等报价串谋的机组。

S5,等报价串谋机组识别步骤:根据现货市场中等报价串谋机组识别模型识别等报价串谋机组,利用专家系统对等报价串谋机组的形成机理进行逻辑推演,识别现货市场中的等报价串谋机组。

所述专家系统由数据采集模块、专家知识库及推理机组成,其中:

数据采集模块从步骤S1中所述的电力市场运营数据支持系统采集信息;

专家知识库包括基于外在表现的正向推理规则、基于风险级别分析的推理规则和基于信用级别分析的推理规则;其中:

基于外在表现的正向推理规则包括:

机组间的报价一致性大于a*(a*表示报价一致性指标阈值,取市场中所有机组报价一致性指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报量一致性大于b*(b*表示报量一致性指标阈值,取市场中所有机组报量一致性指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报价曲线差异度小于c*(c*表示报价曲线差异度指标阈值,取市场中所有机组报价曲线差异度指标最大值的四分之一),则这些机组越可能采用了串谋的方式参与现货市场;

机组间的报价变化序列相似度大于d*(d*表示报价变化序列相似度指标阈值,取市场中所有机组报价变化序列相似度指标最大值的四分之三),则这些机组越可能采用了串谋的方式参与现货市场;

机组的中标率大于e*(e*表示中标率指标阈值,取市场中所有机组中标率指标最大值的四分之三),则该机组越可能采用了串谋的方式参与现货市场;

机组的高价中标率大于f*(f*表示高价中标率指标阈值,取市场中所有机组高价中标率指标最大值的四分之三),则该机组越可能采用了串谋的方式参与现货市场;

基于风险级别分析的推理规则包括:

机组被等报价串谋识别模型识别出的频率越高,则该机组越可能参与串谋,被识别出的频率越高是指在一段时间内,机组被识别出的次数大于频率阈值G*(G*由专家确定);

基于信用级别分析的推理规则包括:

机组曾经有市场注册失信合同、履约失信、市场交易失信及信息披露失信等行为的次数越多,则该机组越可能参与串谋,失信次数越多是指在一段时间内,机组失信的次数大于次数阈值H*(H*由专家确定);

推理机根据专家知识库中的各推理规则对市场主体的行为进行分析,当某市场主体的推理值超过专家系统设定的等报价串谋机组风险阈值时,则认为该市场主体有90%的可能采用等报价串谋方式扰乱了市场的秩序,认定该机组为等报价串谋机组。

综上所述,本发明的电力现货市场等报价串谋机组识别方法,基于Adaboost算法和BP神经网络算法,通过对等报价串谋机组进行分析,提取等报价串谋的机组特征,利用现货市场数据进行量化处理;通过Adaboost算法构建模型整体框架,提高识别模型识别的正确率;通过BP神经网络算法构建基础分类模型,识别现货市场中等报价串谋的机组。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号