首页> 中国专利> 一种确定气象数据融合评价指标的方法

一种确定气象数据融合评价指标的方法

摘要

本发明实施例提出了一种确定气象数据融合评价指标的方法,包括:获取至少两个气象数据插值方案的插值结果,以及插值方案对应的实际观测值u0(xi,yi);分别对每一个插值方案,计算其均方根误差RMSE和交叉验证CV;根据每一差值结果的均方根误差RMSE和交叉验证CV,确定气象数据融合的最佳插值方案。上述方案提出了一种确定气象数据融合评价指标的方法,能够对不同插值方案的结果进行评估,以确定与实际观测值最接近的插值方案。

著录项

  • 公开/公告号CN109190963A

    专利类型发明专利

  • 公开/公告日2019-01-11

    原文格式PDF

  • 申请/专利号CN201810975585.7

  • 申请日2018-08-24

  • 分类号G06Q10/06(20120101);G06Q50/26(20120101);

  • 代理机构11237 北京市广友专利事务所有限责任公司;

  • 代理人张仲波

  • 地址 100875 北京市海淀区新街口外大街19号

  • 入库时间 2024-02-19 08:16:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-28

    授权

    授权

  • 2019-02-12

    实质审查的生效 IPC(主分类):G06Q10/06 申请日:20180824

    实质审查的生效

  • 2019-01-11

    公开

    公开

说明书

技术领域

本发明涉及数据处理技术领域,尤其是涉及一种中国大陆确定气象数据融合评价指标的方法。

背景技术

随着社会的发展,越来越多领域都开始使用数据分析和数据处理技术。随着社会的发展,越来越多领域都开始使用数据分析和数据处理技术。在使用海量数据的很多领域,特别是需要从海量检测设备提取数据的领域,都可能面对部分数据丢失的风险。

气象数据是一种极其典型的海量数据集,气象数据要综合多种数据源的海量数据,其中台站检测到的数据是极其重要的一部分。但是台站由于天气原因或设备故障原因,可能会偶发数据丢失的情况;而有些地区由于各种原因导致未设置台站。由于气象数据都具有空间连续性和时间连续性,因此可以采用插值的方式来估算缺失的数据。现有技术中有多种插值的方案,但是针对同一数据集,利用不同的插值方案可能会得到不同的结果。但是现有技术中无法确定何种插值方案是最适合数据集的。

发明内容

针对当前的不同插值方案得到的结果不同导致无法确定何种插值方案最恰当的问题,本发明实施例提出了一种确定气象数据融合评价指标的方法,能够对不同插值方案得到的结果进行评估以确定最恰当模型的插值方案。

为了实现上述目的,本发明实施例提供了一种确定气象数据融合评价指标的方法,包括:

步骤1、获取至少两个气象数据插值方案的插值结果,以及插值方案对应的实际观测值u0(xi,yi);

步骤2、分别对每一个插值方案,计算其均方根误差RMSE和交叉验证CV;

其中N为气象数据对应的台站数量总和,是在(xi,yi)位置上的估计值;u0(xi,yi)为观测值;

其中是在位置(xi,yi)上的估计值;下标-i表示位置(xi,yi)处的估计值没有用到观测u0(xi,yi);

步骤3、根据每一差值结果的均方根误差RMSE和交叉验证CV,确定气象数据融合的最佳插值方案。

进一步的,所述方法还包括:

步骤4、对再分析数据与确定的最佳插值方案进行对比以进行评估。

进一步的,所述步骤4具体包括:

利用以下公式对对再分析数据与确定的最佳插值方案进行对比:

其中m是包含观测值的一个再分析资料的格,M是区域中这种格的总数,是格m里观测的均值,ur(m)是格m上的再分析数据,u~-i(m)是插值方案在格m中所有5公里分辨率的子格点的平均,且不包括格m中观测数据。

本发明的技术方案具有以下优势:上述方案提出了一种确定气象数据融合评价指标的方法,能够对不同插值方案的结果进行评估,以确定与实际观测值最接近的插值方案。

附图说明

通过下面结合附图对本发明的一个优选实施例进行的描述,本发明的技术方案及其技术效果将变得更加清楚,且更加易于理解。其中:

图1为本发明实施例的流程图。

具体实施方式

以下将结合所附的附图对本发明的一个优选实施例进行描述。

本发明实施例的技术可以应用于各种流域,本发明实施例中采用雅砻江流域水循环模拟技术集成,来对本发明实施例的技术进行说明。

本发明实施例中提出的确定气象数据融合评价指标的方法,其核心思路是将观测值作为参考值,评价多种插值方案中的哪一个的插值结果离观测更近。

如图1所示的,本发明实施例的确定气象数据融合评价指标的方法,包括:

步骤1、获取至少两个气象数据插值方案的插值结果,以及插值方案对应的实际观测值u0(xi,yi);

步骤2、分别对每一个插值方案,计算其均方根误差RMSE和交叉验证CV;

其中N为气象数据对应的台站数量总和,是在(xi,yi)位置上的估计值;u0(xi,yi)为观测值;

其中是在位置(xi,yi)上的估计值;下标-i表示位置(xi,yi)处的估计值没有用到观测u0(xi,yi);

步骤3、根据每一差值结果的均方根误差RMSE和交叉验证CV,确定气象数据融合的最佳插值方案;

步骤4、对再分析数据与确定的最佳插值方案进行对比以进行评估。

进一步的,所述步骤4具体包括:

利用以下公式对对再分析数据与确定的最佳插值方案进行对比:

其中m是包含观测值的一个再分析资料的格,M是区域中这种格的总数,是格m里观测的均值,ur(m)是格m上的再分析数据,是插值方案在格m中所有5公里分辨率的子格点的平均,且不包括格m中观测数据。

本发明实施例中利用两个指标来进行评价,第一个评价指标是均方根误差(root-mean-square error,RMSE);第二个指标是交叉验证(Cross Validation,CV);

具体的,均方根误差RMSE采用以下公式计算:

其中N是研究区域的所有时刻的台站数量总和,是在(xi,yi)位置上的估计值,它可以是估计的趋势面,也可以是趋势面订正后的插值结果,也可以是再分析资料在台站上的插值结果;u0(xi,yi)为观测值。

具体的,交叉验证CV采用以下公式:

其中是在位置(xi,yi)上的估计值,它可以是估计的趋势面,也可以是趋势面订正后的插值结果,也可以是再分析资料在台站上的插值结果;下标-i表示位置(xi,yi)处的估计值没有用到观测u0(xi,yi)。

RMSE和CV都能代表拟合的优度。RMSE在估计点(xi,yi)的值的时候用到了该点的观测值u0(xi,yi),但是计算CV时却没有用到。因此从某种意义上来讲,RMSE代表了在台站观测比较稠密的区域的拟合误差,然而CV可以看作是用来评估插值方法在独立数据上的验证。

将粗格点上的再分析资料插值到观测点上会造成很大插值误差。以上用台站数据直接验证再分析资料和本发明实施例插值资料的优劣对再分析资料不太公道。本发明实施例采用以下指标评估再分析资料和本发明实施例插值资料在再分析资料的粗格点上的优劣,

其中m是包含观测的一个再分析资料的格,M是区域中这种格的总数,是格m里观测的均值,ur(m)是格m上的再分析数据,是利用本发明实施例的插值方法在格m中所有5公里分辨率的子格点的平均,但格m中观测数据在估计时被剔除了。

对于所属技术领域的技术人员而言,随着技术的发展,本发明构思可以不同方式实现。本发明的实施方式并不仅限于以上描述的实施例,而且可在权利要求的范围内进行变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号