公开/公告号CN113269578A
专利类型发明专利
公开/公告日2021-08-17
原文格式PDF
申请/专利号CN202011206637.8
申请日2020-11-02
分类号G06Q30/02(20120101);G06F30/27(20200101);
代理机构15107 呼和浩特市盛联专利代理事务所(普通合伙);
代理人李静
地址 730050 甘肃省兰州市七里河区西津东路628号
入库时间 2023-06-19 12:14:58
技术领域
本发明属于发电企业滥用市场力违规识别技术领域,更具体地说,它涉及一种基于改进支持向量机的发电企业滥用市场力违规识别方法。
背景技术
目前国内外针对市场力的措施主要有场前预防和场后补救两种。场前预防措施主要是对市场结构及申报电价的控制。
对市场结构的控制最为典型的是三寡头测试法和赫芬达尔-赫尔希曼指数(HHI);而对申报电价的控制各个国家和地区各有不同,但基本都是在最高电价、最低电价及电价波动这三个方面做文章,如在美国的部分市场中,发电厂在任何时段不得申报超过过去1个月(或者1年)市场平均价格的200%或者300%。但这些预防措施都没有办法完全革除滥用市场力行为的出现,因而我们仍然需要有力的识别手段。目前的识别手段主要是场后的补救措施,如信息披露、违规举报、违规惩罚等。但依靠市场举报,肯定无法获知所有滥用市场力的成员且具有延时性,而我们需要的是实时监测方法,能够在集中竞价中很快地得到所有具有滥用市场力嫌疑的名单,然而,目前这方面只在学术上有所研究,国内并没有现行方法。
学术上实时监测方法主要有指标法和智能识别方法。指标法中既有传统的指标,如HHI、勒那指数等,也有近些年随着清洁能源的兴起新构造的指标。总起来说指标法是通过指标来反应市场力的某一方面,为专家判断提供信息,但指标无法全面反应企业各方面的情况,需要组织为合理的指标体系,并且需要和专家判断进行结合,缺乏自动识别能力。智能识别算法是随着智能算法的兴起而发展起来的,利用模糊评价、分类算法等方法实现自动识别。但这些方法一部分只考虑了场前市场力,另一部分没有自我学习能力,不能随着市场的变化自我适应。实际上,滥用市场力违规识别可以归结为分类问题,将竞价数据分为有违规嫌疑和无违规嫌疑两类,支持向量机因泛化能力强而得到广泛应用,但其参数优化在数据量较大时耗时较多。
发明内容
针对现有技术存在的不足,本发明的目的在于发明一种基于改进支持向量机的发电企业滥用市场力违规识别方法,通过根据电力市场数据量大维度高的特点构造的SVM-ICC-DPRP算法,用以改进支持向量机提高参数优化的速度,从而可以在市场主体及训练集不断扩增的情况下仍能迅速得到最佳模型。
为实现上述目的,本发明提供了如下技术方案:
一种基于改进支持向量机的发电企业滥用市场力违规识别方法,该方法包括建设阶段和使用阶段;
建设阶段包括以下步骤:
步骤1:分析和比较国内外市场力指标,根据中国电力市场的特点构造指标体系;
步骤2:收集并筛选典型发电企业报价数据及其燃料价格等必要生产数据作为样本点的原始数据;
步骤3:根据原始数据计算相应指标,构成训练集特征值;
步骤4:对计算得到的指标进行专家判断作为训练集的标签;
步骤5:使用SVM-ICC-DPRP算法对训练集进行训练,得到最佳分类模型;
使用阶段包括以下步骤:
步骤6:获取正在进行的发电企业报价数据及其燃料价格等必要生产数据,计算指标集作为测试集;
步骤7:使用建设阶段步骤5所得到的最佳分类模型对测试集进行分类,获取具有违规嫌疑的名单;
步骤8:对嫌疑名单进行专家判定,并作出相应处罚;
步骤9:将嫌疑名单及判定结果加入训练集;
步骤10:使用SVM-ICC-DPRP算法对新训练集进行训练,得到新的最佳分类模型。
进一步的,所述建设阶段步骤1中的指标体系,包括括场前指标、场中指标、场后指标,所述场前指标包括共享市场份额和必运行率,所述场中指标包括每段报价的价格成本偏离值及报高价比例,所述场后指标为勒那指数。
进一步的,所述共享市场份额等于该企业的市场份额及与该企业报价类似,且由同一集团控股的企业的市场份额之和,计算公式:
其中,n为发电企业的数量,q
其中m
进一步的,所述必运行率是指某一时段为满足系统负荷需求,一个电厂必须发电的功率与其总电量的比率,计算公式如下:
其中D表示市场总需求,q
进一步的,价格成本偏离值及报高价比例:
其中高价为大于该企业边际发电成本×(1+报价成本偏离值临界值)的价格;边际发电成本采用蒙特卡洛模拟法进行计算,临界值使用德尔菲法确定;
用蒙特卡洛法求边际发电成本,假定每个机组的生产函数为经典二次函数模型:
c
其中c
则发电企业实际总负荷为P
其中a
进一步的,所述勒纳指数为发电企业i的成交价格偏离自身边际生产成本的程度,计算公式为:
其中Mc边际发电成本,P
进一步的,所述发电企业报价数据,计算公式为:
X={x
进一步的,所述SVM-ICC-DPRP算法的步骤包括:
S1:将原始训练集T随机切分成n份{T
S2:使用标准支持向量机算法对T
S3:将SV
S4:核参数预选,使用固定惩罚参数C和核参数σ
其中σ为核参数,1=(1,…,1)
S5:比较D
S6:令核参数集{σ
S7:使用参数σ
S8:判断SV
S9:令T
S10:令T
S11:判断i是否小于3,若是i<3,则进一步判断判断j是否小于m,若j S12:对{CV 综上所述,本发明具有以下优点: 本发明提供的一种基于改进支持向量机的发电企业滥用市场力违规识别方法,可以快速精确地识别电力市场中发电企业滥用市场力的行为,对防范电力市场交易风险、提高电力市场运行效率具有重要意义。 附图说明 图1是一种基于改进支持向量机的发电企业滥用市场力违规识别方法的工作流程图; 图2是适用于中国电力市场的滥用市场力违规识别指标体系; 图3是蒙特卡洛模拟法求边际发电成本迭代图像; 图4是SVM-ICC-DPRP算法流程图。 具体实施方式 下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。 实施例1 如图1-图4所示的一种基于改进支持向量机的发电企业滥用市场力违规识别方法,该方法包括建设阶段和使用阶段; 建设阶段包括以下步骤: 步骤1:分析和比较国内外市场力指标,根据中国电力市场的特点构造指标体系; 步骤2:收集并筛选典型发电企业报价数据及其燃料价格等必要生产数据作为样本点的原始数据; 步骤3:根据原始数据计算相应指标,构成训练集特征值; 步骤4:对计算得到的指标进行专家判断作为训练集的标签; 步骤5:使用SVM-ICC-DPRP算法对训练集进行训练,得到最佳分类模型; 使用阶段包括以下步骤: 步骤6:获取正在进行的发电企业报价数据及其燃料价格等必要生产数据,计算指标集作为测试集; 步骤7:使用建设阶段步骤5所得到的最佳分类模型对测试集进行分类,获取具有违规嫌疑的名单; 步骤8:对嫌疑名单进行专家判定,并作出相应处罚; 步骤9:将嫌疑名单及判定结果加入训练集; 步骤10:使用SVM-ICC-DPRP算法对新训练集进行训练,得到新的最佳分类模型。 在建设阶段步骤1中的指标体系,包括括场前指标、场中指标、场后指标,所述场前指标包括共享市场份额和必运行率,所述场中指标包括每段报价的价格成本偏离值及报高价比例,所述场后指标为勒那指数。 各个指标解释如下: (1)共享市场份额: 企业i的共享市场份额等于该企业的市场份额及与该企业报价类似,且由同一集团控股的企业的市场份额之和,计算公式:
其中,n为发电企业的数量,q
其中m (2)必运行率: 必运行率与市场的供需关系有关,它是指某一时段为满足系统负荷需求,一个电厂必须发电的功率与其总电量的比率,计算公式如下:
其中D表示市场总需求,q (3)价格成本偏离值及报高价比例:
其中高价为大于该企业边际发电成本×(1+报价成本偏离值临界值)的价格。边际发电成本采用蒙特卡洛模拟法进行计算,临界值使用德尔菲法确定。 蒙特卡洛法求边际发电成本,假定每个机组的生产函数为经典二次函数模型: c 其中c 则发电企业实际总负荷为P
(4)勒那指数: 勒纳指数为发电企业i的成交价格偏离自身边际生产成本的程度,计算公式为:
步骤2中,得到发电企业报价数据X={x 在步骤5和步骤10,所述SVM-ICC-DPRP算法的步骤包括: S1:将原始训练集T随机切分成n份{T S2:使用标准支持向量机算法对T S3:将SV S4:核参数预选,使用固定惩罚参数C和核参数σ
其中σ为核参数,1=(1,…,1) S5:比较D S6:令核参数集{σ S7:使用参数σ S8:判断SV S9:令T S10:令T S11:判断i是否小于3,若是i<3,则进一步判断判断j是否小于m,若j S12:对{CV 实施例2 一种基于改进支持向量机的发电企业滥用市场力违规识别方法,在算例数据使用电力市场仿真实验构造数据集进行算例分析,该算例根据三段式报价,统一出清机制进行构造。初始样本数量为25个,经专家判断得到违规数据3个,未违规数据22个。部分样本如表1 所示。 表1部分样本点的竞价数据
一种基于改进支持向量机的发电企业滥用市场力违规识别方法,包括建设阶段和使用阶段。 其中,建设阶段包括以下步骤: 步骤1:通过比较国内外市场力指标,经过对部分指标的改造和构造,得到指标体系如图2所示。 步骤2:筛选得到25个样本点,部分企业的竞价数据见表1,发电机组的示范数据见表2; 表2部分机组参数
步骤3:根据原始数据计算相应指标,构成训练集特征值,示例如表3的2~8列,其中报价成本偏离值和勒那指数涉及到企业边际发电成本的计算。使用蒙特卡洛法计算发电企业边际发电成本,一个负荷预测为1600MW的发电企业的机组参数如表2所示,使用蒙特卡洛模拟法进行计算,迭代次数为10000次,得边际发电成本为 228.2545元/MWh,迭代图像见图3。 表3部分样本点数据
步骤4:对计算得到的指标进行专家判断作为训练集的标签如表 3中的第9列所示。 步骤5:使用SVM-ICC-DPRP算法对训练集进行训练,算法流程图如图4所示,得到最佳分类模型的精确度为92.00%,召回率为 100%,用时0.89秒。 使用阶段: 步骤6:获取正在进行的发电企业报价数据及其燃料价格等必要生产数据,计算指标集作为测试集,数据范例如表1所示,当场竞价企业为65个。 步骤7:使用最佳分类模型对测试集进行分类,获取具有违规嫌疑的名单共13个。 步骤8:对嫌疑名单进行专家判定,得到违规企业10个,未违规企业3个; 步骤9:将嫌疑名单及判定结果加入训练集,则样本集数量增加为68个; 步骤10:使用SVM-ICC-DPRP算法对训练集进行训练,得到新的最佳分类模型的精确度为94.74%,召回率为100%。用时1.09秒。 以上所述仅为本发明的较佳实施例,并不用于限制本发明,凡在本发明的设计构思之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 授权的超速车辆检测和识别方法涉及基于预先编程的命令控制车辆位置信息的不可消除的擦除,违规车辆的暴露信息和违规数据。
机译: 基于分类特征向量的训练支持向量机及基于相同特征的人脸识别方法
机译: 基于支持向量机的基于语音的性别识别方法