首页> 中国专利> 基于克里金和信息熵理论相结合的水文站网优化模型

基于克里金和信息熵理论相结合的水文站网优化模型

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开一种基于克里金和信息熵理论结合的水文站网优化模型，以信息总量最大化和站网估计误差最小化两个目标为主导，提出站点最优布置的理论依据—NI‑KSE标准，对潜在站网进行重新规划布置。本发明将克里金和信息熵理论相结合在一起，较为系统评价潜在的水文站网，很好地解决站网中密度过大，局部误差太大和信息冗余量的缺陷，定量地描述站点间的信息总量和空间分布的合理性，对站网进行较为客观地评价和优化，具有合理性和有效性。

著录项

公开/公告号CN107315722A

专利类型发明专利
公开/公告日2017-11-03

原文格式PDF
申请/专利权人南京大学;
展开▼

申请/专利号CN201710532961.0
发明设计人王栋;徐鹏程;王远坤;吴吉春;
展开▼

申请日2017-07-03
分类号G06F17/18(20060101);G06Q10/04(20120101);
代理机构32204 南京苏高专利商标事务所(普通合伙);
代理人唐红
地址 210046 江苏省南京市栖霞区仙林大道163号南京大学
入库时间 2023-06-19 03:38:37

法律信息

法律状态公告日

法律状态信息

法律状态
2020-01-21

授权

授权
2020-01-17

著录事项变更 IPC(主分类):G06F17/18 变更前: 变更后: 申请日:20170703

著录事项变更
2017-11-28

实质审查的生效 IPC(主分类):G06F17/18 申请日:20170703

实质审查的生效
2017-11-03

公开

公开

说明书

技术领域

本发明涉及水文站网技术，具体涉及一种基于克里金和信息熵理论相结合的水文站网优化模型。

背景技术

水文站是一个在河流或者流域上设立的主要用于观测以及搜集河流湖泊和水库等水体相关水文和气象资料的基层水文机构，在很大程度上满足了水文预报、水文情报、水资源评价工作和水科学研究的基本需求。因此规划合理的水文站网能够充分反映水文时空变异特征，使之能收集准确详尽的水文信息，这显然是有必要探究较为客观地理论方法支撑水文站网的合理规划。一个有效水文站网体系一方面能反映流域时空分布特性并能够预测未知的点到面的相关数据的，另一方面在经济合理的前提下的站点组合能够反映最优的信息量。前人在站网规划的研究方法上大体可以归纳为以下几种：

1、数理统计方法，该方法应用最早，但要求研究者对水资源系统结构有充足的认识；同时，受到数理统计的原理的限制，统计分析技术的选择和样本数量都将对数据分析的结论产生较大影响；并且该方法只能通过估计精度与样本数量之间的关系来确定站点的数量，达不到对站点的空间布局优化的目的。

2、克里格插值法，需要在图上对水文变量估算误差的改进作出主观评价，若估计误差的标准差大于给定的标准差的范围，则空间中需要增设站点，反之就应该减少站点，实际应用中单一采用该方法主观性比较大精度不够高。

3、信息熵方法，在以往基于信息熵进行水文站网优化研究中，常以信息传递量为依据，选择某一指标进行站网评价优化，而单一信息熵指标往往不能全面反映站网所包含的信息总量、信息冗余程度等决定站网效用的重要因素。站对间的传递熵的估计很大程度上受限于联合概率密度函数的合理估计。

发明内容

发明目的：本发明的目的在于解决现有技术中存在的不足，提供一种基于克里金和信息熵理论相结合的水文站网优化模型。

技术方案：本发明一种基于克里金法和信息熵理论耦合的水文站网优化模型，其特征在于：依次包括如下步骤：

(1)变异函数的优选：基于最小累计残差的准则(Smallest residual sum ofsquares,SSERR)对已有的站网空间分布关系进行变异函数的模拟；从潜在的4个变异函数模型即指数(Exponential)、球形(Spherical)，高斯(Gaussian)和Matern变异函数中依据残差最小原则选择最优的变异函数模型，其中克里金方差定义为：

其中，h_0i为已知站点和未知站点间的距离，γ(h_0i)是距离h_0i下的变异值，μ_X为拉格朗日乘子，N为空间分布划分的样点个数，w_i为权重值，σ_X(y₀)为克里金标准差；

(2)决定增设站点区域和具体位置：首先，得到克里金标准差分布图(KSE map)，依据图中标准差最大的原则准确定位出需要增加的站点；

(3)增设站点雨量的插值：得到增加站点的日雨量值，并依据交叉检验数据统计量评价变异函数模型的效果；基于均方根误差(root mean square prediction error(RMSE)),均标准差(Mean squared normalized error,MNSE)和相关系数(Correlationcoefficient)：

其中，为位置y_i处的雨量估计值而X(y_i)为观测值，σ²(y_i)为相关的克里金方差；

(4)基于NI-KSE准则优选出最优的站点组合：首先，最小克里金标准差目标函数即可由第一步中的克里金方差开方得出，而最大信息量NI的目标函数通过以下公式得出：

其中，NI(X₁，X₁，...，X_k)代表从新增站点后得到的新的站网中选出的k个站点组成的子站网的信息总量，X₁，X₂，...，X_k则是各个雨量站，X_j是没有被选入备选集合的站点，μ₁是信息权重指标，H(X₁，X₂，...，X_k)为联合信息熵值，T(X_i，X_j)为信息传递量，C(X₁，X₁，...，X_k)为总的信息关联量(Total>

接着通过信息量目标函数权重值μ₁确定NI-KSE准则的计算值(TR_NI-KSE)：

MinTR_NI-KSE＝0.6rank_descend(NI)+0.4rank_ascend(KSE)

其中，rank_descend(NI)表示信息总量按降序下得到序数，rank(KSE_ascend)为KSE在升序下得到的序数，所以NI-KSE准则就是综合两个目标函数得到单目标函数下最小值时，该站点组合为最优的站点组合；

(5)得出和原始站网同等数目下的最优站点组合后，将最优的组合和原始站点组合的雨量估计值和观测值的误差进行对比分析，以此检验克里金和信息熵理论结合的站网优化模型的效果。

进一步的，所述步骤(1)中变异函数的优选步骤具体为：

(1.1)将每个站点的观测数据作为随机变量的观测值x_i(i＝1,2,…,n)，求得边缘熵值H(x_i)；模拟处样本变异函数模型：对原站网每天的数据空间分布进行经验模拟，并画出适合的样本分布曲线；

(1.2)基于原始数据得出四种变异函数模型下的理论分布曲线；

(1.3)计算四种理论模型和样本分布模型的最小累计残差值，优选出其中最小的残差值对应的理论变异函数模型。

进一步的，所述步骤(4)中基于NI-KSE准则的优选步骤为：

(4.1)初始化优选站点集合S₀并设置为空集，潜在的站网集合为F,并将F包含了原始站点和新增站点；

(4.2)由函数max{H(X_i)}，得出最大边缘熵条件下对应的站点i，并将此站点放到集合S中设定为S₁，站点集F删除站点i，更新站点集合S和F；

(4.3)依据最大信息量函数(Max NI(X₁，X₂，...，X_k))从F中得出新的优选站点，实时更新站点集合S和F，并实时计算出各个站点组合下的KSE和NI值；

(4.4)依次按照以上步骤可以将原始集合F的的站点按照重要程度进行排序；

(4.5)将排序后的站点组合按照NI-KSE准则下的评价指标Min TR_NI-KSE重新排序得出最优的站点组合。

有益效果：本发明将最大化信息总量和最小化估计误差值作为目标函数，并提出了NI-KSE准则下的综合评价指标值(TR_NI-KSE)得出最优的站点组合。其中信息总量这一评价因素兼顾到了最大信息联合熵、最小信息冗余量和最大信息传递能力三个子目标。克里金标准差(KSE)只需要得出合理的变异函数模型就可以得到对应的数值。与现有技术下相比，本发明具有以下优点：

(1)克服了传统的单一方法的局限性。一方面，单一的克里金插值法仅仅从误差最小的方面评选出增设和精简站点的区域，单一采用该方法主观性比较大精度不够高，另外前人采用的克里金法较多采用特定的变异函数模型，本专利考虑了4个潜在的变异函数模型显得较为客观全面；另一方面，单一的信息熵方法仅仅从信息联合熵、最小化互信息的角度上优选最优的站点组合，没有考虑到站点间的空间变异性，也无法增设站点只能在原有站点基础上进行精简，站网的预测误差和估计精度不能得到保证。而本专利系统性的考虑到信息量最大化和估计误差最小化两大目标，综合并最大化地发挥了了克里金和信息熵理论的优势，是优化模型更加的系统全面。

(2)综合性地提出三个站网评价指标Max NI，Min KSE，Min TR_NI-KSE，对站网的站点合理分布提供较为客观依据。同时采用了交叉检验统计数据评价变异函数模型的效果。

综上所述，本发明将克里金和信息熵理论结合对站网空间分布特性和系统的信息总量的不确定性进行了定量地描述，既可实现对站网信息的定量分析，又能合理布置站点的空间分布，具有合理性和有效性。

附图说明

图1为本发明的整理流程图；

图2为实施例中流域站点示意图；

图3为实施例中变异函数模拟图；

图4为实施例中克里金误差分布图；

图5为实施例中最优的站点分布图；

其中，图3(a)为算例1的变异函数模拟图，图3(b)为算例2的变异函数模拟图；图3(c)为算例3的变异函数模拟图；图3(d)为算例4的变异函数模拟图。

具体实施方式

下面对本发明技术方案进行详细说明，但是本发明的保护范围不局限于所述实施例。

为便于理解本发明，做以下说明：

四种变异函数模型归纳如下:

●指数函数模型：

●球形函数模型：

●高斯函数模型：

●Matern函数模型：

γ(h)＝(s-n)[1-(1-k)exp(1r|h|)-kexp(-rh²)]+n，

其中s，n，r，k是变异函数的参数。

假定(X₁，X₂，...，X_n)代表离散化的随机变量组合(n个站点组成的原始站网)，其联合概率密度函数为p(x₁，x₂，...，x_n)，X_i代表站点i处的水文时间序列值，边缘概率密度函数分别为p(x₁)，P(x₂)，...，p(x_n)，那么在水文站网优化过程中，边缘熵可以定义为

多变量的联合信息熵H(X₁，X₂，...，X_n)定义为：

传递量指标(或者互信息)可以表示为：

为了刻画系统的信息冗余量，引入了信息冗余指标(Total correlation,TC),其可以定义为：

其中，H(X_i)为站点i的雨量时间序列X_i的边缘熵。

如图1所示，本发明的基于克里金和信息熵理论结合的水文站网优化模型，具体包含以下步骤：

1.变异函数的优选：基于最小累计残差的准则(Smallest residual sum ofsquares,SSERR)对已有的站网空间分布关系进行变异函数的模拟。从潜在的4个变异函数模型即指数(Exponential)，球形(Spherical)，高斯(Gaussian)和Matern变异函数中依据残差最小原则选择最优的变异函数模型。具体的变异函数的优选步骤如下：

将每个站点的观测数据作为随机变量的观测值x_i(i＝1,2,…,n)，求得边缘熵值H(x_i)。

第1步，模拟处样本变异函数模型：对原站网每天的数据空间分布进行经验模拟，并画出适合的样本分布曲线；

第2步，基于原始数据得出四种变异函数模型下的理论分布曲线；

第3步，计算四种理论模型和样本分布模型的最小累计残差值，优选出其中最小的残差值对应的理论变异函数模型。

2.决定增设站点区域和具体位置：首先，在得出适合的理论变异函数后得到克里金标准差分布图(KSE map)，依据图中标准差最大的原则准确定位出需要增加的站点。

尽管，这一步简单但是确实较为关键的一步，因为这一步将直接影响到接下来的几步研究对象的具体位置。显而易见地是，KSE分布图很好地诠释了任意站点的空间变异性，一般来说站点密度较大的区域，KSE值就会相对较小，而站点稀疏的地区误差值就会较大需要增加站点满足估计精度的要求。

3.增设站点雨量的插值：得到增加站点的日雨量值，并依据交叉检验数据统计量评价变异函数模型的效果。基于均方根误差(root mean square prediction error(RMSE)),均标准差(Mean squared normalized error,MNSE)和相关系数(Correlationcoefficient)：

其中，为位置y_i处的雨量估计值而X(y_i)为观测值，σ²(y_i)为相关的克里金方差。

4.基于NI-KSE准则优选出最优的站点组合：首先，最小克里金标准差目标函数即可由第一步中的克里金方差开方得出，而最大信息量(NI)的目标函数需要以下公式得出：

其中，NI(X₁，X₁，...，X_k)代表从新增站点后得到的新的站网中选出的k个站点组成的子站网的信息总量，X₁，X₂，...，X_k则是各个雨量站下的水文时间序列，X_j是没有被选入备选集合的站点j处的水文时间序列，μ₁是信息权重指标，H(X₁，X₂，...，X_k)为联合信息熵值，T(X_i，X_j)为信息传递量，TC(X₁，X₁，...，X_k)为总的信息冗余量(Total>

一旦确定了信息量目标函数权重值μ₁，就能得到NI-KSE准则的计算值(TR_NI-KsE),

Min TR_NI-KSE＝0.6rank_descend(NI)+0.4rank_ascend(KSE)，

其中，rank_descend(NI)表示信息总量按降序下得到序数，rank(KSE_ascend)为KSE在升序下得到的序数。所以NI-KSE准则就是综合两个目标函数得到单目标函数下最小值时，该站点组合为最优的站点组合。具体的NI-KSE的优选步骤如下:

(1)初始化优选站点集合S₀并设置为空集，潜在的站网集合为F,并将F包含了原始站点和新增站点。

(2)由函数max{H(X_i)}，得出最大边缘熵条件下对应的站点i，并将此站点放到集合S中设定为S₁。站点集F删除站点i。更新站点集合S和F。

(3)依据最大信息量函数(Max NI(X₁，X₂，...，X_k))从F中得出新的优选站点。实时更新站点集合S和F。并实时计算出各个站点组合下的KSE和NI值。

(4)依次按照以上步骤可以将原始集合F的的站点按照重要程度进行排序。

(5)将排序后的站点组合按照NI-KSE准则下的评价指标Min TR_NI-KSE重新排序得出最优的站点组合。

5、雨量估计值和观测值的误差进行对比：得出和原始站网同等数目下的最优站点组合后，将最优的组合和原始站点组合的雨量估计值和观测值的误差进行对比分析，以此检验克里金和信息熵理论结合的站网优化模型的效果。

实施例1：本实施以上海市水文站网优化作为实际应用

以上海16个水文站组成的站网为例，以2012年1月1日到12月31日的日雨量序列为样本，用基于克里金和信息熵理论结合的水文站网优化模型对该站网进行评价和优化。

(1)流域概况

本文的数据资料来源于上海市，2012年1月1日-2012年12月31日逐日雨量数据。上海市全市面积6340.5平方公里，位于长江的入海口和太湖流域的东侧，位于长三角经济发展区域的核心。河流湖泊总面积达500平方公里，其中河流覆盖率达到9％-10％(见图2、表1)。图2中有16个已有的站点，经过克里金插值分析新增了5个站点。站点基本信息量和坐标设置见表1。

表1上海市雨量站一览表

(2)模型运行

首先对上海水文站网内的16个站点进行编号(1～16)，并选取了四个算例(Scenario)用于展示。(1)Scenario 1:mean daily rainfall data；(2)Scenario 2:rainfall data on2012/1/21；(3)Scenario 3:rainfall data on 2012/4/23；(4)Scenario 4:rainfall data on2012/11/22。变异函数模拟结果见图3。KSE图见图4。

表2不同权重指标下的站点排序结果

表3基于NI-KSE准则下的站点优化结果

(3)站网评价

图3中可得不同的空间分布结构适合不同的变异函数模型，为此选择了4个潜在的理论模型非常有必要。

图4中可以得出需要在17,18,19,20,21点(表1中)的坐标位置增加5个站点，因为这些未知站点的标准差值最大。接着需要利用克里金插值法得出这些站点的时间序列值进而进行接下来的NI-KSE准则分析得到最优站点的组合。

(4)站网优化

依据表2可得在权重指标μ₁为0.8和0.9时，排序结果趋于稳定，可知权重指标为0.8或0.9为宜。为了强调信息传递能力的重要性，选择了0.9作为后续的权重系数。表3是基于表2在站的个数为9个基础上重新进行NI-KSE准则的进一步优化的。利用最大化信息量和最小化克里金标准差之后，能够得到更为合理客观的结果，在站点个数为10时，最优的站点组合是S₁₀＝(10,19,20,17,7,21,3,9,6，11)。依照相同的原理和方法得到了站点数目为16的情况下最优的站点组合为S₁₆＝(1,3,6,7,9,10,11,13,17,19,20,21,5,16,2,15)。其分布图为图5所示，由图中可知经过NI-KSE准则优选后需要新增4个站点(17,19,20,21)，精简去掉4个旧站点(4,8,12,14)。

(5)模型效果测试

为了能够通过类似后验的方法得到模型算出的最优组合确实能够达到比原始的站网达到更好的效果。由表4，可以看出最优的站点组合只得出了0.96％的误差百分率而原始的站网有2.24％的误差。在信息指标方面，新的站网组合也比旧站网提供出较大的联合熵和信息传递能力，较小的信息冗余量值。为此，基于克里金和信息熵的水文模型优选出的站点组合确实能提供较为出色的估计能力和信息量。

表4站点组合效果对比

^a联合熵；^b互信息；^c多维冗余信息量(Total>d站网总的信息量。通过上述实施例可以看出，本发明在考虑到信息量最大化的同时也能考虑到站点间的空间分布特性，并最终能够提供比较好的模拟效果，既可实现对站网信息的定量分析，又能合理布置站点的空间分布，具有合理性和有效性，并最终为水文站网合理规划和站点增删提供技术和决策支持。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于克里金和信息熵理论相结合的水文站网优化模型 [P] . 中国专利： CN107315722A . 2017-11-03
2. 基于Copula函数和信息熵理论相结合的综合式水文站网评估模型 [P] . 中国专利： CN109460526A . 2019-03-12
3. article based on a metal alloy of nickel, chromium and elements containing water precipitates microcristallini metal alloy and method [P] . ITMI992629A1 . 2001-06-18

机译：基于镍，铬和含有水的元素的金属合金的制品沉淀出微克里斯塔利尼金属合金和方法
4. Interface optimizing model based upon database information [P] . 美国专利： US9116933B2 . 2015-08-25

机译：基于数据库信息的接口优化模型
5. Interface Optimizing Model Based Upon Database Information [P] . 美国专利： US2014304308A1 . 2014-10-09

机译：基于数据库信息的接口优化模型