法律状态公告日
法律状态信息
法律状态
2019-06-28
授权
授权
2019-02-12
实质审查的生效 IPC(主分类):G06Q10/06 申请日:20180824
实质审查的生效
2019-01-11
公开
公开
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种中国大陆确定气象数据融合评价指标的方法。
背景技术
随着社会的发展,越来越多领域都开始使用数据分析和数据处理技术。随着社会的发展,越来越多领域都开始使用数据分析和数据处理技术。在使用海量数据的很多领域,特别是需要从海量检测设备提取数据的领域,都可能面对部分数据丢失的风险。
气象数据是一种极其典型的海量数据集,气象数据要综合多种数据源的海量数据,其中台站检测到的数据是极其重要的一部分。但是台站由于天气原因或设备故障原因,可能会偶发数据丢失的情况;而有些地区由于各种原因导致未设置台站。由于气象数据都具有空间连续性和时间连续性,因此可以采用插值的方式来估算缺失的数据。现有技术中有多种插值的方案,但是针对同一数据集,利用不同的插值方案可能会得到不同的结果。但是现有技术中无法确定何种插值方案是最适合数据集的。
发明内容
针对当前的不同插值方案得到的结果不同导致无法确定何种插值方案最恰当的问题,本发明实施例提出了一种确定气象数据融合评价指标的方法,能够对不同插值方案得到的结果进行评估以确定最恰当模型的插值方案。
为了实现上述目的,本发明实施例提供了一种确定气象数据融合评价指标的方法,包括:
步骤1、获取至少两个气象数据插值方案的插值结果,以及插值方案对应的实际观测值u0(xi,yi);
步骤2、分别对每一个插值方案,计算其均方根误差RMSE和交叉验证CV;
其中N为气象数据对应的台站数量总和,
其中
步骤3、根据每一差值结果的均方根误差RMSE和交叉验证CV,确定气象数据融合的最佳插值方案。
进一步的,所述方法还包括:
步骤4、对再分析数据与确定的最佳插值方案进行对比以进行评估。
进一步的,所述步骤4具体包括:
利用以下公式对对再分析数据与确定的最佳插值方案进行对比:
其中m是包含观测值的一个再分析资料的格,M是区域中这种格的总数,
本发明的技术方案具有以下优势:上述方案提出了一种确定气象数据融合评价指标的方法,能够对不同插值方案的结果进行评估,以确定与实际观测值最接近的插值方案。
附图说明
通过下面结合附图对本发明的一个优选实施例进行的描述,本发明的技术方案及其技术效果将变得更加清楚,且更加易于理解。其中:
图1为本发明实施例的流程图。
具体实施方式
以下将结合所附的附图对本发明的一个优选实施例进行描述。
本发明实施例的技术可以应用于各种流域,本发明实施例中采用雅砻江流域水循环模拟技术集成,来对本发明实施例的技术进行说明。
本发明实施例中提出的确定气象数据融合评价指标的方法,其核心思路是将观测值作为参考值,评价多种插值方案中的哪一个的插值结果离观测更近。
如图1所示的,本发明实施例的确定气象数据融合评价指标的方法,包括:
步骤1、获取至少两个气象数据插值方案的插值结果,以及插值方案对应的实际观测值u0(xi,yi);
步骤2、分别对每一个插值方案,计算其均方根误差RMSE和交叉验证CV;
其中N为气象数据对应的台站数量总和,
其中
步骤3、根据每一差值结果的均方根误差RMSE和交叉验证CV,确定气象数据融合的最佳插值方案;
步骤4、对再分析数据与确定的最佳插值方案进行对比以进行评估。
进一步的,所述步骤4具体包括:
利用以下公式对对再分析数据与确定的最佳插值方案进行对比:
其中m是包含观测值的一个再分析资料的格,M是区域中这种格的总数,
本发明实施例中利用两个指标来进行评价,第一个评价指标是均方根误差(root-mean-square error,RMSE);第二个指标是交叉验证(Cross Validation,CV);
具体的,均方根误差RMSE采用以下公式计算:
其中N是研究区域的所有时刻的台站数量总和,
具体的,交叉验证CV采用以下公式:
其中
RMSE和CV都能代表拟合的优度。RMSE在估计点(xi,yi)的值的时候用到了该点的观测值u0(xi,yi),但是计算CV时却没有用到。因此从某种意义上来讲,RMSE代表了在台站观测比较稠密的区域的拟合误差,然而CV可以看作是用来评估插值方法在独立数据上的验证。
将粗格点上的再分析资料插值到观测点上会造成很大插值误差。以上用台站数据直接验证再分析资料和本发明实施例插值资料的优劣对再分析资料不太公道。本发明实施例采用以下指标评估再分析资料和本发明实施例插值资料在再分析资料的粗格点上的优劣,
其中m是包含观测的一个再分析资料的格,M是区域中这种格的总数,
对于所属技术领域的技术人员而言,随着技术的发展,本发明构思可以不同方式实现。本发明的实施方式并不仅限于以上描述的实施例,而且可在权利要求的范围内进行变化。
机译: 一种用于运行风能组件的方法,其基于气象数据确定有结冰的风险,以及用于实施该方法的风能组件
机译: 一种用于运行风能组件的方法,其基于气象数据确定有结冰的风险,以及用于实施该方法的风能组件
机译: 一种基于气象数据确定结冰风险的风轮机的方法以及执行该方法的风轮机