首页> 中国专利> 结蜡初期识别模型获得方法、结蜡初期识别方法及装置

结蜡初期识别模型获得方法、结蜡初期识别方法及装置

摘要

本发明公开了一种结蜡初期识别模型获得方法、结蜡初期识别方法及装置,通过使用获得的结蜡初期识别模型识别出结蜡初期的时间段的技术手段,帮助本领域技术人员及时确定采油设备的结蜡初期,进而使本领域技术人员得以在结蜡初期就对采油设备进行清蜡处理,降低清蜡处理的难度。

著录项

  • 公开/公告号CN112651165A

    专利类型发明专利

  • 公开/公告日2021-04-13

    原文格式PDF

  • 申请/专利权人 北京国双科技有限公司;

    申请/专利号CN201910910512.4

  • 发明设计人 李志元;

    申请日2019-09-25

  • 分类号G06F30/27(20200101);G06N20/00(20190101);G06Q50/02(20120101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人张建

  • 地址 100083 北京市海淀区北四环中路229号海泰大厦4层南401号

  • 入库时间 2023-06-19 10:35:20

说明书

技术领域

本发明涉及油井结蜡处理领域,尤其涉及结蜡初期识别模型获得方法、结蜡初期识别方法及装置。

背景技术

当前,油井的采油设备在经过一定时间的作业后,采油设备中的管道的管壁上会渐渐积累附着石蜡,该现象称为油井结蜡。随着采油设备作业的时间越长,采油设备中的管道的管壁上结蜡量越多,进而降低油井的产油量。

为此,本领域技术人员通常在经过特定时长后对采油设备进行清蜡处理。然而随着结蜡量的逐渐增多,清蜡难度也逐渐增高,因此,本领域技术人员希望可以在采油设备的结蜡初期进行清蜡处理。

发明内容

鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的结蜡初期识别模型获得方法、结蜡初期识别方法及装置,技术方案如下:

一种结蜡初期识别模型获得方法,包括:

获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

确定所述数据序列中符合结蜡故障特征的结蜡数据序列;

为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻;

对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。

可选的,所述确定所述数据序列中符合结蜡故障特征的结蜡数据序列,包括:

通过无监督机器学习模型确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

可选的,所述结蜡故障特征包括:所述示功图最大载荷变大且所述示功图最小载荷变小且所述示功图面积变大。

可选的,所述部分数据在结蜡数据序列中的数据数量占比为30%至70%。

一种结蜡初期识别方法,包括:

获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

将各所述至少一个时间段对应的数据序列输入上述的结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

可选的,在所述获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列之后,还包括:确定所述数据序列中符合结蜡故障特征的结蜡数据序列;

所述将各所述至少一个时间段对应的数据序列输入上述的结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果,包括:

将所述至少一个时间段对应的结蜡数据序列输入上述的结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

一种结蜡初期识别模型获得装置,包括第一数据序列获得单元、第一结蜡数据序列确定单元、结蜡初期标注单元和机器学习单元,

所述数据序列获得单元,用于获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

所述结蜡数据序列确定单元,用于确定所述数据序列中符合结蜡故障特征的结蜡数据序列;

所述结蜡初期标注单元,用于为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻;

所述机器学习单元,用于对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。

一种结蜡初期识别装置,包括:第二数据序列获得单元和识别结果获得单元,

所述第二数据序列获得单元,用于获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

所述识别结果获得单元,用于将各所述至少一个时间段对应的数据序列输入上述的结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

一种存储介质,其上存储有程序,所述程序被处理器执行时实现如上所述的结蜡初期识别模型获得方法,和/或,实现如上所述的结蜡初期识别方法。

一种电子设备,所述电子设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上所述的结蜡初期识别模型获得方法,和/或,实现如上所述的结蜡初期识别方法。

借由上述技术方案,本发明提供的结蜡初期识别模型获得方法、结蜡初期识别方法及装置,通过使用获得的结蜡初期识别模型识别出结蜡初期的时间段的技术手段,帮助本领域技术人员及时确定采油设备的结蜡初期,进而使本领域技术人员得以在结蜡初期就对采油设备进行清蜡处理,降低清蜡处理的难度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种结蜡初期识别模型获得方法的流程示意图;

图2示出了本发明实施例提供的示功图的示意图;

图3示出了本发明实施例提供的另一种结蜡初期识别模型获得方法的流程示意图;

图4示出了本发明实施例提供的一种结蜡初期识别方法的流程示意图;

图5示出了本发明实施例提供的另一种结蜡初期识别方法的流程示意图;

图6示出了本发明实施例提供的一种结蜡初期识别模型获得装置的结构示意图;

图7示出了本发明实施例提供的一种结蜡初期识别装置的结构示意图;

图8示出了本发明实施例提供的另一种结蜡初期识别装置的结构示意图;

图9示出了本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示,本发明实施例提供的一种结蜡初期识别模型获得方法,可以包括:

S100、获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积。

具体的,采油设备可以为抽油泵,本发明实施例可以通过抽油泵上的多种传感器获得某一历史时间段内的多种生产数据随时间变化的数据序列。可选的,该传感器可以是示功图传感器。具体的,示功图传感器的形式可以有多种,例如:载荷位移一体化传感器,本发明实施例在此不做限定。

可选的,本发明实施例可以获得同一油田区块中的油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列。可以理解的是,在实际的油田生产中,常常在一大块油田区域里分布着大小不一的油田区块,其中,每个油田区块的地质条件(油藏深度、油质等条件)可能存在不同程度的差异。因此,在不同地质条件的油田区块下作业的采油设备的油井结蜡现象出现的时间和程度也存在差异。基于上述原因,本发明实施例可以为各油田区块分别训练一个结蜡初期识别模型。

可以理解的是,对于任意两个油田区块之间,若该两个油田区块的地质条件相似,则本发明实施例也可以获得该两个油田区块中的油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列。

本申请发明人研究发现:油井结蜡现象会在一定程度上反映在示功图最大载荷、示功图最小载荷和示功图面积上,因此本发明实施例创造性地将示功图最大载荷、示功图最小载荷和示功图面积随时间变化的数据序列中的全部或部分数据进行机器学习,用于判断采油设备的结蜡初期的时间段。

其中,本发明实施例可以通过示功图传感器对抽油泵的抽油杆的伸长量变化引起的直径变化测量计算获得抽油泵在上下运动过程中所承受的力量大小,即示功图载荷。示功图传感器还可以测量得到抽油杆移动的距离,即位移,从而生成位移与载荷的对应数据点构成的示功图。本发明实施例中的示功图可以如图2所示,示功图是反映抽油泵作业状况的图形,一般横坐标为位移,纵坐标为载荷。可以理解的是,通过示功图获得的多种生产数据需要对示功图进行分析、计算才能得到。例如,在图2中,示功图最大载荷为A点对应的纵坐标上的值,示功图最大载荷为B点对应的纵坐标的值,示功图面积的获得方式可以为:先将示功图的不规则形状切割成规则形状(如三角形或四边形),然后对各规则形状的面积分别进行计算然后累加即可得到示功图面积。

其中,在至少一个历史时间段内的多种生产数据随时间变化的数据序列可以包括示功图最大载荷随时间变化的序列、示功图最小载荷随时间变化的序列和示功图面积随时间变化的序列。

可选的,历史时间段可以是技术人员选择的任意时长的时间段。例如,三个月。可以理解的是,技术人员可以根据需要选择连续或不连续的多个历史时间段内的生产数据随时间变化的数据序列。例如,技术人员可以选择2019年1月和2019年3月作为历史时间段。

可选的,本发明实施例中的某个历史时间段内产生的生产数据的数据序列可以如表1所示,其中,表1包括一个历史时间段内的多个时刻分别产生的生产数据的数据序列,表1中的序号指示生产数据的产生时刻的先后顺序,即序号所在的一行的不同生产数据的产生时刻相同。本申请可以将同一时刻采集的各生产数据确定为一组生产数据。表1可以为一个油井区块在某一历史时间段内的多种生产数据随时间变化的数据序列。需要注意的是,表1中的数据仅为示例性数据,用于体现某一油田区块在某一历史时间段内的多种生产数据随时间变化的数据序列。可以理解的是,实际情况下的数据与表1中的数据可以有较大的差距。

表1

S200、确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

具体的,结蜡故障特征可以是技术人员根据采油设备各部件上结蜡时示功图所表现出的特征。本申请发明人发现:当采油设备的游动凡尔和固定凡尔结蜡时,结蜡故障特征可以表现为示功图最大载荷大于理论最大载荷值。当采油设备的有关和抽油杆结蜡时,结蜡故障特征可以表现为示功图最大载荷大于理论最大载荷值,且示功图最小载荷小于理论最小载荷值。

可选的,在发明一可选的实施例中,所述结蜡故障特征包括:所述示功图最大载荷变大且所述示功图最小载荷变小且所述示功图面积变大。

具体的,结蜡故障特征可以是在一段时间内,示功图最大载荷随着时间变化不断变大且示功图最小载荷随着时间变化不断变小且示功图面积不断变大。例如,数据序列如表1所示,序号为3、4、5、6和7的连续序列,满足结蜡故障特征,则本发明实施例可以确定数据序列中序号为3、4、5、6和7的序列为结蜡数据序列。

可选的,基于图1所示的方法,如图3所示,本发明实施例提供的另一种结蜡初期识别模型获得方法,步骤S200可以包括:

S210、通过无监督机器学习模型确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

其中,无监督机器学习模型可以是基于孤立森林(Isolation Forest)算法构建的机器学习模型。本发明实施例可以使用无监督机器学习模型对采油设备在至少一个历史时间段内符合结蜡故障特征的结蜡数据序列的示功图最大载荷、示功图最小载荷和示功图面积的变化进行无监督机器学习,进而获得符合结蜡故障特征的结蜡数据序列的数据变化特征。

S300、为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻。

为了可以及时发现采油设备的结蜡初期,本发明实施例可以将获得的符合结蜡故障特征的结蜡数据序列中产生时刻相对早的部分数据添加结蜡初期标注。为了便于理解,此处通过举例进行说明:若表1中序号为3、4、5、6和7的序列为结蜡数据序列,本发明实施例可以将序号为3、4、5对应的生产数据添加结蜡初期标注,也可以将序号为3。4、5和6的序列对应的生产数据添加结蜡初期标注。

可选的,所述部分数据在结蜡数据序列中的数据数量占比为30%至70%。

需要注意的是,每个历史时间段对应的数据序列中可能存在多个结蜡数据序列。每个结蜡数据序列都存在产生时刻相对早的部分数据,该部分数据在与该部分数据对应的结蜡数据序列中的数据数量占比为30%至70%。

可以理解的是,由于技术人员掌握的清蜡技术不同,本发明实施例可以根据技术人员的需要确定所述部分数据在结蜡数据序列所占的百分比。当然,本发明实施例也可以根据结蜡数据序列中各生产数据的产生时刻的先后顺序,从前往后确定预设数量的生产数据确定为所述部分数据。

S400、对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。

其中,结蜡初期识别模型可以输出所述至少一个时间段中各时间段是否为结蜡初期的概率,技术人员可以根据该概率是否需要对采油设备进行清蜡处理。进一步地,结蜡初期识别模型可以将所述至少一个时间段中各时间段是否为结蜡初期的概率与预设的结蜡初期概率阈值进行对比,根据对比结果输出该时间段是否为结蜡初期的结论。可以理解的是,结蜡初期识别模型也可以同时输出所述至少一个时间段中各时间段是否为结蜡初期的概率和该时间段是否为结蜡初期的结论。

本发明实施例中获得的结蜡初期识别模型与一个油田区块或与地质条件相似的多个油田区块对应。本发明实施例获得的结蜡初期识别模型可以用于确定该结蜡初期识别模型对应的油田区块中的油井的采油设备的结蜡初期的时间段。

其中,机器学习方法可以有多种,如:K近邻、逻辑回归、梯度提升树、支持向量机、朴素贝叶斯、决策树、随机森林等。在实际应用中,本发明实施例可以依次选择上述机器学习方法中的一种对所述部分数据进行机器学习从而得到不同机器学习方法对应的结蜡初期识别模型。本发明实施例可以对各结蜡初期识别模型进行误差检验,获得误差最小的结蜡初期识别模型。

具体的,本发明实施例可以优先使用基于随机森林(Random forest)算法或LightGBM(Light Gradient Boosting Machine)算法,对所述部分数据进行机器学习获得的结蜡初期识别模型。其中,该机器学习是有监督机器学习。通过有监督机器学习标注有结蜡初期的标注的所述部分数据的数据特征,本发明实施例可以获得可识别至少一个时间段中各时间段是否为结蜡初期的结蜡初期识别模型。

在实际应用中,本发明实施例可以将添加结蜡初期标注的部分数据分为两部分,一部分作为训练数据,一部分作为测试数据。例如,获得1万份添加结蜡初期标注的部分数据,每份添加结蜡初期标注的部分数据都包括示功图最大载荷、示功图最小载荷和示功图面积的值。本发明实施例将8000份添加结蜡初期标注的部分数据作为训练数据,将另外2000份加结蜡初期标注的部分数据作为测试数据。首先通过训练数据进行机器学习获得结蜡初期识别模型,然后通过测试数据对结蜡初期识别模型进行准确度测试,如测试未通过,则增加或修改测试数据继续进行机器学习,直至测试通过。

本发明实施例提供的一种结蜡初期识别模型获得方法,可以获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;确定所述数据序列中符合结蜡故障特征的结蜡数据序列;为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻;对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。本发明实施例通过机器学习结蜡初期的数据获得的结蜡初期识别模型,帮助本领域技术人员及时确定采油设备的结蜡初期,进而使本领域技术人员得以在结蜡初期就对采油设备进行清蜡处理,降低清蜡处理的难度。

本发明实施例获得的结蜡初期识别模型可以应用于下述结蜡初期识别方法中。

如图4所示,本发明实施例提供的一种结蜡初期识别方法,可以包括:

S10、获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积。

步骤S10的原理说明请参考步骤S100,此处不作赘述。

S20、将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

其中,步骤S20中的结蜡初期识别模型可以为本发明实施例提供的一种结蜡初期识别模型获得方法得到的结蜡初期识别模型。

具体的,本发明实施例可以将结蜡初期识别模型对应的油田区块中的油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列输入该结蜡初期识别模型中,进而获得该至少一个时间段中各时间段是否为结蜡初期的识别结果。

具体的,经过预先训练好的结蜡初期识别模型,本发明实施例可以识别输入至该结蜡初期识别模型的数据序列是否存在与该数据序列对应的一个时间段中的各时间段是否为结蜡初期。

本发明实施例提供的一种结蜡初期识别方法,可以获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。本发明实施例通过训练好的结蜡初期识别模型可以判断出结蜡初期的时间段,进而得以通知本领域技术人员在采油设备的结蜡初期进行清蜡处理。

可选的,如图5所示,本发明实施例提供的另一种结蜡初期识别方法,在步骤S10之后,还可以包括:S30、确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

步骤S30的原理说明请参考步骤S200,此处不作赘述。

因此步骤S20可以包括:

S21、将所述至少一个时间段对应的结蜡数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

可以理解的是,由于采油设备所应用的工况可以不同,因此可能在某些特定情况下采油设备在某一时间段内不是结蜡初期的数据序列的数据特征与结蜡初期识别模型学习到的结蜡初期的数据特征相同,进而将不是结蜡初期的数据序列识别为结蜡初期。为了解决该问题,提升结蜡初期识别模型的识别准确率,本发明实施例可以在步骤S10之后先在数据序列中确定符合结蜡故障特征的结蜡数据序列,再将符合结蜡故障特征的结蜡数据序列输入该结蜡初期识别模型,最后根据该结蜡初期识别模型输出的识别结果,确定出结蜡数据序列中结蜡初期的时间段。

与上述方法实施例相对应,本发明实施例提供一种结蜡初期识别模型获得装置,其结构如图6所示,可以包括第一数据序列获得单元100、第一结蜡数据序列确定单元200、结蜡初期标注单元300和机器学习单元400。

所述第一数据序列获得单元100,用于获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积。

具体的,采油设备可以为抽油泵,本发明实施例可以通过抽油泵上的多种传感器获得某一历史时间段内的多种生产数据随时间变化的数据序列。可选的,该传感器可以是示功图传感器。具体的,示功图传感器的形式可以有多种,例如:载荷位移一体化传感器,本发明实施例在此不做限定。

可选的,本发明实施例可以获得同一油田区块中的油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列。可以理解的是,在实际的油田生产中,常常在一大块油田区域里分布着大小不一的油田区块,其中,每个油田区块的地质条件(油藏深度、油质等条件)可能存在不同程度的差异。因此,在不同地质条件的油田区块下作业的采油设备的油井结蜡现象出现的时间和程度也存在差异。基于上述原因,本发明实施例可以为各油田区块分别训练一个结蜡初期识别模型。

可以理解的是,对于任意两个油田区块之间,若该两个油田区块的地质条件相似,则本发明实施例也可以获得该两个油田区块中的油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列。

本申请发明人研究发现:油井结蜡现象会在一定程度上反映在示功图最大载荷、示功图最小载荷和示功图面积上,因此本发明实施例创造性地将示功图最大载荷、示功图最小载荷和示功图面积随时间变化的数据序列中的全部或部分数据进行机器学习,用于判断采油设备的结蜡初期的时间段。

其中,本发明实施例可以通过示功图传感器对抽油泵的抽油杆的伸长量变化引起的直径变化测量计算获得抽油泵在上下运动过程中所承受的力量大小,即示功图载荷。示功图传感器还可以测量得到抽油杆移动的距离,即位移,从而生成位移与载荷的对应数据点构成的示功图。本发明实施例中的示功图可以如图2所示,示功图是反映抽油泵作业状况的图形,一般横坐标为位移,纵坐标为载荷。可以理解的是,通过示功图获得的多种生产数据需要对示功图进行分析、计算才能得到。例如,在图2中,示功图最大载荷为A点对应的纵坐标上的值,示功图最大载荷为B点对应的纵坐标的值,示功图面积的获得方式可以为:先将示功图的不规则形状切割成规则形状(如三角形或四边形),然后对各规则形状的面积分别进行计算然后累加即可得到示功图面积。

其中,在至少一个历史时间段内的多种生产数据随时间变化的数据序列可以包括示功图最大载荷随时间变化的序列、示功图最小载荷随时间变化的序列和示功图面积随时间变化的序列。

可选的,历史时间段可以是技术人员选择的任意时长的时间段。例如,三个月。可以理解的是,技术人员可以根据需要选择连续或不连续的多个历史时间段内的生产数据随时间变化的数据序列。例如,技术人员可以选择2019年1月和2019年3月作为历史时间段。

所述第一结蜡数据序列确定单元200,用于确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

具体的,结蜡故障特征可以是技术人员根据采油设备各部件上结蜡时示功图所表现出的特征。本申请发明人发现:当采油设备的游动凡尔和固定凡尔结蜡时,结蜡故障特征可以表现为示功图最大载荷大于理论最大载荷值。当采油设备的有关和抽油杆结蜡时,结蜡故障特征可以表现为示功图最大载荷大于理论最大载荷值,且示功图最小载荷小于理论最小载荷值。

可选的,在发明一可选的实施例中,所述结蜡故障特征包括:所述示功图最大载荷变大且所述示功图最小载荷变小且所述示功图面积变大。

具体的,结蜡故障特征可以是在一段时间内,示功图最大载荷随着时间变化不断变大且示功图最小载荷随着时间变化不断变小且示功图面积不断变大。

可选的,所述第一结蜡数据序列确定单元200具体用于通过无监督机器学习模型确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

其中,无监督机器学习模型可以是基于孤立森林(Isolation Forest)算法构建的机器学习模型。本发明实施例可以使用无监督机器学习模型对采油设备在至少一个历史时间段内符合结蜡故障特征的结蜡数据序列的示功图最大载荷、示功图最小载荷和示功图面积的变化进行无监督机器学习,进而获得符合结蜡故障特征的结蜡数据序列的数据变化特征。

所述结蜡初期标注单元300,用于为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻。

为了可以及时发现采油设备的结蜡初期,本发明实施例可以将获得的符合结蜡故障特征的结蜡数据序列中产生时刻相对早的部分数据添加结蜡初期标注。

可选的,所述部分数据在结蜡数据序列中的数据数量占比为30%至70%。

需要注意的是,每个历史时间段对应的数据序列中可能存在多个结蜡数据序列。每个结蜡数据序列都存在产生时刻相对早的部分数据,该部分数据在与该部分数据对应的结蜡数据序列中的数据数量占比为30%至70%。

可以理解的是,由于技术人员掌握的清蜡技术不同,本发明实施例可以根据技术人员的需要确定所述部分数据在结蜡数据序列所占的百分比。当然,本发明实施例也可以根据结蜡数据序列中各生产数据的产生时刻的先后顺序,从前往后确定预设数量的生产数据确定为所述部分数据。

所述机器学习单元400,用于对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。

其中,结蜡初期识别模型可以输出所述至少一个时间段中各时间段是否为结蜡初期的概率,技术人员可以根据该概率是否需要对采油设备进行清蜡处理。进一步地,结蜡初期识别模型可以将所述至少一个时间段中各时间段是否为结蜡初期的概率与预设的结蜡初期概率阈值进行对比,根据对比结果输出该时间段是否为结蜡初期的结论。可以理解的是,结蜡初期识别模型也可以同时输出所述至少一个时间段中各时间段是否为结蜡初期的概率和该时间段是否为结蜡初期的结论。

本发明实施例中获得的结蜡初期识别模型与一个油田区块或与地质条件相似的多个油田区块对应。本发明实施例获得的结蜡初期识别模型可以用于确定该结蜡初期识别模型对应的油田区块中的油井的采油设备的结蜡初期的时间段。

其中,机器学习方法可以有多种,如:K近邻、逻辑回归、梯度提升树、支持向量机、朴素贝叶斯、决策树、随机森林等。在实际应用中,本发明实施例可以依次选择上述机器学习方法中的一种对所述部分数据进行机器学习从而得到不同机器学习方法对应的结蜡初期识别模型。本发明实施例可以对各结蜡初期识别模型进行误差检验,获得误差最小的结蜡初期识别模型。

具体的,本发明实施例可以优先使用基于随机森林(Random forest)算法或LightGBM(Light Gradient Boosting Machine)算法,对所述部分数据进行机器学习获得的结蜡初期识别模型。其中,该机器学习是有监督机器学习。通过有监督机器学习标注有结蜡初期的标注的所述部分数据的数据特征,本发明实施例可以获得可识别至少一个时间段中各时间段是否为结蜡初期的结蜡初期识别模型。

在实际应用中,本发明实施例可以将添加结蜡初期标注的部分数据分为两部分,一部分作为训练数据,一部分作为测试数据。例如,获得1万份添加结蜡初期标注的部分数据,每份添加结蜡初期标注的部分数据都包括示功图最大载荷、示功图最小载荷和示功图面积的值。本发明实施例将8000份添加结蜡初期标注的部分数据作为训练数据,将另外2000份加结蜡初期标注的部分数据作为测试数据。首先通过训练数据进行机器学习获得结蜡初期识别模型,然后通过测试数据对结蜡初期识别模型进行准确度测试,如测试未通过,则增加或修改测试数据继续进行机器学习,直至测试通过。

本发明实施例提供的一种结蜡初期识别模型获得装置,可以获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;确定所述数据序列中符合结蜡故障特征的结蜡数据序列;为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻;对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。本发明实施例通过机器学习结蜡初期的数据获得的结蜡初期识别模型,帮助本领域技术人员及时确定采油设备的结蜡初期,进而使本领域技术人员得以在结蜡初期就对采油设备进行清蜡处理,降低清蜡处理的难度。

通过上述结蜡初期识别模型获得装置获得的结蜡初期识别模型可以应用于本发明实施例提供的一种结蜡初期识别装置中,结蜡初期识别装置的结构如图7所示,可以包括:第二数据序列获得单元10和识别结果获得单元20。

所述第二数据序列获得单元10,用于获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积。

所述识别结果获得单元20,用于将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

其中,识别结果获得单元20所使用的结蜡初期识别模型可以为本发明实施例提供的一种结蜡初期识别模型获得装置得到的结蜡初期识别模型。

具体的,本发明实施例可以将结蜡初期识别模型对应的油田区块中的油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列输入该结蜡初期识别模型中,进而获得该至少一个时间段中各时间段是否为结蜡初期的识别结果。

具体的,经过预先训练好的结蜡初期识别模型,本发明实施例可以识别输入至该结蜡初期识别模型的数据序列是否存在与该数据序列对应的一个时间段中的各时间段是否为结蜡初期。

本发明实施例提供的一种结蜡初期识别装置,可以获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。本发明实施例通过训练好的结蜡初期识别模型可以判断出结蜡初期的时间段,进而得以通知本领域技术人员在采油设备的结蜡初期进行清蜡处理。

可选的,如图8所示,本发明实施例提供的另一种结蜡初期识别装置,还可以包括:第二结蜡数据序列确定单元30。

所述第二结蜡数据序列确定单元30,用于在第二数据序列获得单元10获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列之后,确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

所述识别结果获得单元20具体用于将各所述至少一个时间段对应的结蜡数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

可以理解的是,由于采油设备所应用的工况可以不同,因此可能在某些特定情况下采油设备在某一时间段内不是结蜡初期的数据序列的数据特征与结蜡初期识别模型学习到的结蜡初期的数据特征相同,进而将不是结蜡初期的数据序列识别为结蜡初期。为了解决该问题,提升结蜡初期识别模型的识别准确率,第二结蜡数据序列确定单元30在数据序列中确定符合结蜡故障特征的结蜡数据序列之后,识别结果获得单元20再将符合结蜡故障特征的结蜡数据序列输入该结蜡初期识别模型,最后根据该结蜡初期识别模型输出的识别结果,确定出结蜡数据序列中结蜡初期的时间段。

本发明实施例提供给的一种存储介质,其上存储有程序,所述程序被处理器执行时实现如上所述的结蜡初期识别模型获得方法,和/或,实现如上所述的结蜡初期识别方法。

本发明实施例提供给的一种电子设备600,其结构如图9所示,所述电子设备包括至少一个处理器610、以及与处理器610连接的至少一个存储器620、总线630;其中,所述处理器610、所述存储器620通过所述总线630完成相互间的通信;所述处理器610用于调用所述存储器620中的程序指令,以执行如上所述的结蜡初期识别模型获得方法,和/或,实现如上所述的结蜡初期识别方法。

所述结蜡初期识别模型获得装置包括处理器和存储器,上述第一数据序列获得单元100、第一结蜡数据序列确定单元200、结蜡初期标注单元300和机器学习单元400等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来获得结蜡初期识别模型,帮助本领域技术人员及时确定采油设备的结蜡初期,进而使本领域技术人员得以在结蜡初期就对采油设备进行清蜡处理,降低清蜡处理的难度。

所述结蜡初期识别装置包括处理器和存储器,上述第二数据序列获得单元10和识别结果获得单元20等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来获得所述至少一个时间段中各时间段是否为结蜡初期的识别结果,通过该识别结果,得以通知本领域技术人员在采油设备的结蜡初期进行清蜡处理。

本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如上所述的结蜡初期识别模型获得方法,和/或,实现如上所述的结蜡初期识别方法。

本文中的电子设备600可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:

获得油井的采油设备在至少一个历史时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个历史时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

确定所述数据序列中符合结蜡故障特征的结蜡数据序列;

为出现结蜡故障的所述历史时间段对应的各所述结蜡数据序列中的部分数据添加结蜡初期的标注,其中,所述部分数据的产生时刻早于其所在的所述结蜡数据序列中除所述部分数据外的其他数据的产生时刻;

对添加有所述结蜡初期的标注的所述部分数据进行机器学习,获得结蜡初期识别模型,其中,所述结蜡初期识别模型的输入为:至少一个时间段内的多种生产数据随时间变化的数据序列,所述结蜡初期识别模型的输出为:所述至少一个时间段中各时间段是否为结蜡初期。

可选的,所述确定所述数据序列中符合结蜡故障特征的结蜡数据序列,包括:

通过无监督机器学习模型确定所述数据序列中符合结蜡故障特征的结蜡数据序列。

可选的,所述结蜡故障特征包括:所述示功图最大载荷变大且所述示功图最小载荷变小且所述示功图面积变大。

可选的,所述部分数据在结蜡数据序列中的数据数量占比为30%至70%。

本申请还提供了另一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:

获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列,每个数据序列与一个时间段对应,所述多种生产数据至少包括:示功图最大载荷、示功图最小载荷和示功图面积;

将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

可选的,在所述获得油井的采油设备在至少一个时间段内的多种生产数据随时间变化的数据序列之后,还包括:确定所述数据序列中符合结蜡故障特征的结蜡数据序列;

所述将各所述至少一个时间段对应的数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果,包括:

将所述至少一个时间段对应的结蜡数据序列输入结蜡初期识别模型中,获得所述结蜡初期识别模型输出的所述至少一个时间段中各时间段是否为结蜡初期的识别结果。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号