首页> 中国专利> 一种省域范围内耕地质量影响因素的分析方法

一种省域范围内耕地质量影响因素的分析方法

摘要

本发明提供了一种省域范围内耕地质量影响因素的分析方法,属于耕地质量分析技术领域。本发明选取表征自然因素(地形地貌、气候、土壤)、土地利用情况和农业技术水平的多个指标,进行归一化处理、排除冗余变量干扰,得到耕地自然等指数的主要影响因素后,利用普通最小二乘回归法进行全局分析;并结合地理加权回归算法进行局部分析;最后根据全局分析和局部分析的结果,分析省域范围内耕地质量的影响因素。

著录项

  • 公开/公告号CN114971159A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 中国农业大学;

    申请/专利号CN202210355998.1

  • 申请日2022-04-06

  • 分类号G06Q10/06(2012.01);G06Q50/02(2012.01);

  • 代理机构北京睿智保诚专利代理事务所(普通合伙) 11732;

  • 代理人马欢欢

  • 地址 100083 北京市海淀区清华东路17号中国农业大学

  • 入库时间 2023-06-19 16:36:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G06Q10/06 专利申请号:2022103559981 申请日:20220406

    实质审查的生效

说明书

技术领域

本发明涉及耕地质量分析技术领域,尤其涉及一种省域范围内耕地质量影响因素的分析方法。

背景技术

耕地质量是保证粮食安全、农业效益和耕地可持续利用的关键,因此,耕地质量保护对我国的农业发展和社会稳定至关重要。针对我国耕地质量的现状,自然资源部形成了“十年一评价,每年一更新”的监管体系,获得了大量县级、省级以及国家级的分等更新成果。根据现有的数据成果,分析耕地质量的影响因素,是进行耕地质量保护与制定合理土地政策的基础。

以往学者们从县级、省级和区域尺度,采用不同方法对耕地质量影响因素进行研究,但多集中在对研究区的全局分析,对局部区域的研究也仅仅以现有行政区对研究区域进行划分后,讨论各行政区影响因素的不同。因此,根据对象的空间关系,来探究研究区内不同区域各影响因素影响程度差异的研究方法更符合实际情况。

发明内容

本发明的目的在于提供一种省域范围内耕质量影响因素的分析方法。

为了实现上述发明目的,本发明提供以下技术方案:

本发明提供了一种省域范围内耕地质量影响因素的分析方法,包括如下步骤:

(1)选取对耕地质量有影响的指标作为自变量,进行归一化处理、排除冗余变量干扰,得到耕地自然等指数的主要影响因素;

(2)以耕地自然等指数的面积加权平均值为因变量,以所述主要影响因素为自变量,采用普通最小二乘回归法进行全局回归;

(3)确定高斯函数中的带宽、构建空间权重矩阵;

(4)利用地理加权回归对耕地自然等指数与所述主要影响因素进行局部回归;

(5)结合全局回归和局部回归的结果,分析省域范围内耕地质量的影响因素。

优选的,所述对耕地质量有影响的指标包括地形地貌、气候、土壤、土地利用情况和农业技术水平指标。

优选的,所述地形地貌包括海拔、坡度;所述气候包括温度、降水;所述土壤包括土壤质地;所述土地利用情况包括复种指数;所述农业技术水平包括农用机械总动力、农用化肥施用量、农用塑料薄膜使用量。

优选的,所述对因变量有关键解释作用的自变量包括海拔、坡度、降水、温度、土壤质地、农用机械总动力、农用化肥施用量、复种指数、农用塑料薄膜使用量。

优选的,所述归一化处理的方法为普通最小二乘回归法;所述排除冗余变量干扰的方法为方差膨胀系数和Pearson相关系数分析。

优选的,所述主要影响因素包括坡度、降水、温度、土壤质地和农用机械总动力。

优选的,所述计算带宽的方法为交叉验证法或赤池信息量准则。

本发明选取表征自然因素(地形地貌、气候、土壤)、土地利用情况和农业技术水平的多个指标,进行归一化处理、排除冗余变量干扰,得到耕地自然等指数的主要影响因素(坡度、降水、温度、土壤质地和农用机械总动力)后,利用最小二乘回归算法进行全局分析;并结合地理加权回归算法进行局部分析;探究各主要影响因素对研究区内不同县(区)的影响程度差异,以期为农用地分等工作提供理论支持。

附图说明

图1为陕西全省耕地国家自然等分布;

图2为陕西各县区耕地自然等指数分布;

图3为实施例1的技术路线;

图4为实施例1中坡度局部回归系数分布;

图5为实施例1中降水局部回归系数分布

图6为实施例1中温度局部回归系数分布;

图7为实施例1中土壤质地局部回归系数分布;

图8为实施例1中农用机械总动力局部回归系数分布;

图9为实施例2中农用机械总动力局部回归系数分布。

具体实施方式

下面结合实施例对本发明提供的技术方案进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。

实施例1

以陕西省为例。陕西省位于我国内陆地区,黄河中游,下辖10个地级市、30个市辖区、6个县级市、71个县;地势南北高、中部低;横跨三个气候带,南北气候差异较大;全省年平均气温9~16℃,自南向北、自东向西递减;年平均降水量340~1240毫米,降水南多北少。陕西省耕地面积约为399万公顷,约占全省土地总面积的19.37%。根据陕西省2018年耕地质量等别评价成果,耕地国家自然等分布在5~14等,其中以12~14等分布最多,主要分布在12~14等,如图1所示(由于西安城区(包括:新城区、碑林区、莲湖区、雁塔区)数据缺失较为严重,故从样本中除去)。

表1全省耕地自然等统计表

以各县级行政区为单元,以区域内所有耕地的国家自然等指数的耕地面积加权平均值作为其耕地自然等指数值,计算结果如图2所示,各县(区)耕地自然等指数在496~3596之间;其中西安市、渭南市中南部、咸阳市南部、宝鸡市中部耕地自然质量较好,而延安市北部、榆林市耕地自然质量较差。

本实施例从地形地貌、气候、土壤、土地利用情况和农业技术水平等多个方面选取了包括:海拔、坡度、降水、温度、土壤质地、复种指数、农用机械总动力、农用化肥施用量、农用塑料薄膜使用量的9个指标,分析这些指标对陕西省耕地自然等指数的影响情况。技术路线如图3所示。

以上数据的来源:耕地自然等指数和耕地面积来源于陕西省耕地质量等别更新评价成果;海拔、坡度数据均由数字高程模型(DEM)数据进一步处理得到,来源于地理空间数据云(http://www.gscloud.cn);年平均气温、年降水量和土壤质地来源于中国科学院资源环境科学数据中心(http://www.resdc.cn);农作物播种面积、农用化肥施用量、农用机械总动力和农用塑料薄膜使用量均来源于《陕西统计年鉴》。

(1)全省耕地自然质量主要影响因素分析

首先采用普通最小二乘算法进行第一次全局回归(归一化处理),初步判断各自变量对因变量的影响程度大小,并筛选出可能存在多重共线性的变量,从而避免数据冗余。本实施例采用方差膨胀系数(variance inflation factor,VIF)对上述9个指标进行筛选,选出可能造成数据冗余的指标。

方差膨胀系数(下文简称为VIF)表征多元线性回归模型中,解释变量之间是否存在多重共线性的指标。其计算公式为:

式中,R

表2第一次普通最小二乘回归结果

由表2中各变量回归系数可知:耕地自然等指数与海拔、降水、温度、土壤质地、农用机械总动力、农用化肥施用量、复种指数呈正相关,与坡度、农用塑料薄膜使用量呈负相关;其中,温度、海拔、坡度、土壤质地和农用机械总动力对自然等指数影响较为显著,降水、农用塑料薄膜使用量、复种指数、农用化肥施用量对其影响较弱。由表2中VIF值可知:海拔、降水、温度三个变量的VIF值分别为33.57、9.54和36.89,均大于7.5,可能存在多重共线性,造成数据冗余,从而影响实验结果。

因此,对海拔、降水、温度这三个变量进行相关分析,从而剔除相关关系较强的指标中回归系数脚小的指标(即对耕地质量影响较弱的指标),避免解释变量冗余对回归结果产生影响。本实施例使用Pearson相关系数对可能冗余的变量进行相关分析,其计算公式如下:

式中,ρx

表3变量相关分析结果

由表3可知,温度与海拔的相关系数为-0.88,呈强相关;而降水与海拔、降水与温度之间的相关系数分别为0.19和0.27,相关性较弱。依据表2中的回归系数,温度对耕地自然质量影响程度大于海拔。综上,将海拔这一变量剔除。

剔除冗余指标后,对耕地自然等指数与筛选完毕后的各变量再次进行普通最小二乘回归,最终得出各变量对其影响程度。普通最小二乘法(Ordinary Least Squares,简称OLS)是一种最简单、最常用的回归方法,它是通过最小化均方误差的平方和来寻找数据的最佳函数匹配,其基本原则是最优拟合直线,使各点到直线的距离之和最小。本文采用OLS模型,评估各变量与耕地自然等指数之间全局关系,分析耕地自然等指数主要影响因素。其计算公式如下:

式中:

Y——因变量(各县级行政区的耕地自然等指数)

X

β

β

ε——随机误差

n——样本个数。

各变量的系数矩阵β=(β

其中,

X=(X

Y=(y

式中,

根据最小二乘原理,当各解释变量回归系数的估计值

此时,

表4第二次普通最小二乘回归结果

由表4各变量的回归系数可知:耕地自然等指数与降水、温度、土壤质地、农用机械总动力、农用化肥施用量、复种指数呈正相关,与坡度、农用塑料薄膜使用量呈负相关;各因素影响程度由大到小依次为:土壤质地>农用机械总动力>坡度>降水>温度>农用塑料薄膜使用量>复种指数>农用化肥施用量;各变量的p值由大到小依次为:农用化肥施用量>复种指数>农用塑料薄膜使用量>降水>温度>坡度>农用机械>土壤质地,其中,土壤质地、农用机械总动力、坡度、降水和温度5个变量的p值小于0.05,具有显著性;综上,土壤质地、农用机械总动力、坡度、降水和温度5个因素为陕西省耕地自然等指数空间分布的主要影响因素。

(2)局部耕地自然质量影响因素分析

利用普通最小二乘法完成全局分析后,采用局部回归模型来描述不同地理位置变量之间的差异。

地理加权回归(Geographic Weighted Regression,GWR)是Brunsdon等提出的一种局部加权回归模型,它表达了回归系数随空间位置的变化而变化的情况。GWR是普通全局回归模型的拓展,其实质是将空间影响以距离权重的形式加入到模型中,根据地理空间位置不断发生变化的参数估计值进行回归分析,来描述局部区域的空间非平稳。运用地理加权回归模型解释不同空间位置的耕地自然等指数与各变量之间的关系,其计算公式如下:

式中:

y

x

β

β

ε

m——自变量的个数。

根据地理学第一定律,样本i周围各样本指标的观测值对样本i指标的影响是不同的,与样本i空间上越接近,其观测值对样本i的指标值影响越大,反之则越小。本实施例中运用高斯核函数计算空间权重,从而生成空间权重矩阵来表示各样本之间的空间关系。其计算公式如下:

式中,W

由上式可知,带宽b是GWR模型空间权重计算的重要控制参数,若带宽过小,则可能造成局部模型过拟合,若带宽过大,则模型会趋于全局化。因此,计算合适的带宽对GWR模型的拟合效果起到重要的作用。本实施例中采用如下两种方法分别计算最优带宽:交叉验证法(cross-validation,CV)和赤池信息量准则(Akaikeinformationcriterion,AIC)。计算公式如下:

公式(1)中,y

本文分别采用CV和AIC两种确定带宽的方法对各县(区)的耕地自然等指数与前文中分析出的5个主要影响因素(土壤质地、农用机械总动力、坡度、降水和温度)进行地理加权回归,对比结果如表5所示:

表5两种带宽计算方法结果对比

表5中,带宽表示局部估计时以对象为中心的研究范围,采用CV算法其带宽为240052,而采用AIC算法为241168;残差平方和反映因变量的真实值与GWR模型所返回的估计值之间的差异情况,残差平方和越小,GWR模型拟合效果越好,此两种算法得到的残差平方和数值相等;R

采用地理加权回归工具对各县(区)的耕地自然等指数与前文中分析出的5个主要影响因素(土壤质地、农用机械总动力、坡度、降水和温度)进行局部回归,各变量回归参数统计结果如表6所示:

表6地理加权回归各变量回归参数统计结果

由表6可知,除坡度外,因变量与各自变量均呈正相关;各变量回归系数平均值的绝对值由大到小依次为:土壤质地>农用机械总动力>降水>温度>坡度,与OLS全局回归各变量的回归系数进行对比可知两种模型回归结果基本一致。变异系数可反应数据离散程度的大小,由表6中各变量回归系数的变异系数可知,各变量回归参数的变异系数绝对值由大到小依次为:坡度>降水>温度>土壤质地>农用机械总动力;其中坡度、降水和温度回归系数的变异系数较大,即对不同县(区)的影响程度差异较大,而土壤质地、农用机械总动力的回归系数的变异系数较小,即对不同县(区)的影响程度差异较小。各变量局部回归系数分布如图4~8所示。

图4,坡度:从省域尺度分析,坡度与耕地自然等指数呈负相关。局部回归结果表明:中部地区(包括:铜川市、渭南市、延安市南部、咸阳市中部和北部、西安市东部以及商洛市北部)坡度的回归系数为正数,与该县(区)的耕地自然等指数呈正相关,与其余地区呈负相关。榆林市、安康市、延安市北部和汉中市中北部坡度回归系数的绝对值较大,即坡度对该地区的耕地自然等指数影响程度较大;宝鸡市南部、西安市中西部、商洛市南部以及延安市南部坡度回归系数的绝对值较小,即坡度对该地区的耕地自然等指数影响程度较小。

图5,降水:从省域尺度分析,降水与耕地自然等指数呈正相关。局部回归结果表明:除商洛市的三个县(区)和安康市一个县(区)外,回归系数均为正数。其中,榆林市、延安市北部系数较大,即降水对该地区的耕地自然等指数影响程度较大;西安市、铜川市南部、咸阳市南部、商洛市东部和北部、安康市大部分地区和渭南市大部分地区系数较小,即降水对该地区的耕地自然等指数影响程度较小。

图6,温度:从省域尺度分析,温度与耕地自然等指数呈正相关。局部回归结果表明:除榆林市大部分地区外,回归系数均为正。其中,中部地区(包括:铜川市、渭南市、咸阳市中部和北部、宝鸡市东北部、延安市北部)回归系数较大,即温度对该地区的耕地自然等指数影响程度较大;汉中市、安康市、商洛市南部、榆林市南部、延安市北部以及宝鸡市西南部回归系数较小,即温度对该地区的耕地自然等指数影响程度较小。

图7,土壤质地:从省域尺度分析,土壤质地与耕地自然等指数呈正相关。其中,中部地区(包括:铜川市、渭南市、宝鸡市东北部、西安市东部、商洛市东部和北部以及咸阳市大部分地区)回归系数较大,即土壤质地对该地区的耕地自然等指数影响程度较大;南部和北部地区(包括榆林市、汉中市、延安市北部、安康市中部和南部以及宝鸡市西南部)回归系数较小,即土壤质地对该地区的耕地自然等指数影响程度较小。

图8,农用机械总动力:从省域尺度分析,农用机械总动力与耕地自然等指数呈正相关。西南部地区(包括:汉中市、安康市西北部、宝鸡市西南部、西安市西部)回归系数较大,即农用机械总动力对该地区的耕地自然等指数影响程度较大;中部地区(包括:铜川市、渭南市中部和北部、咸阳市东北部、延安市中部和南部)回归系数较小,即农用机械总动力对该地区的耕地自然等指数影响程度较小。

实施例2

实验验证

由于农用机械总动力在农用地质量分等中没有与其直接相关的分等因素,因此,基于陕西省2018年耕地质量等别更新评价成果数据,选取剖面构型、土壤有机质含量、有效土层厚度和灌溉保证程度四个分等参数,分别计算其与不同区域农用机械总动力的相关系数,探究农用机械总动力对耕地自然能质量影响大和影响小的区域中,其与各评价参数之间的相关关系。从而探究实施例1实验结果的合理性。

农用机械总动力与耕地自然能质量局部回归参数为0.26~0.29的区域为农用机械总动力对耕地自然质量影响程度小的区域,局部回归参数为0.44~0.49区域作为影响程度大的区域,其空间分布情况如图9所示。

分别计算影响程度大(局部回归参数为0.44~0.49)和影响程度小(局部回归参数为0.26~0.29)的区域农用机械总动力与剖面构型、土壤有机质含量、有效土层厚度和灌溉保证率各分等因素分值的相关系数,结果如表7所示:

表7农用机械总动力与分等参数分值相关系数

农用机械总动力对耕地自然质量影响较小区域中,其与剖面构型、土壤有机质含量呈极弱相关,与有效土层厚度、灌溉保证率呈中等程度相关;农用机械总动力对耕地自然质量影响较大区域中,其与土壤有机质含量呈极弱相关,与剖面构型呈强相关与有效土层厚度、灌溉保证率呈极强相关。

综上,农用机械总动力对耕地自然质量影响较小区域中农用机械总动力与各分等因素分值的相关性较弱,而农用机械总动力对耕地自然质量影响较大区域中,农用机械总动力与各分等因素分值的相关性较强,从而可以证明农业机械总动力对陕西省西南部地区耕地自然质量影响较大,对中部地区耕地自然质量影响较小的结论具有合理性。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号