首页> 中国专利> 一种基于空间误差模型的公共交通通达性差异分析方法

一种基于空间误差模型的公共交通通达性差异分析方法

摘要

本发明涉及一种基于ANOVA的基础设施公共交通通达性差异性分析方法,首先利用百度地图API获取到公交站点和基础设施的位置信息,然后获取到搭乘公共交通工具从公交站点到基础设施的通行时间和通行距离,继而计算得到各个公交站点的交通通达性和城市中各个行政区划的交通通达性,在分析并消除空间自相关性之后,利用方差分析,最后得到城市各行政区划交通通达性的差异性,从差异性结果可以分析得到城市中基础设施分布公平性评价。本发明对城市中基础设施的分布公平性进行评价,能对城市基础设施规划提供决策支持。

著录项

  • 公开/公告号CN106920391A

    专利类型发明专利

  • 公开/公告日2017-07-04

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201710114663.X

  • 申请日2017-02-28

  • 分类号G08G1/01(20060101);G06F17/30(20060101);

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人鲁力

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-06-19 02:45:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-02

    授权

    授权

  • 2017-07-28

    实质审查的生效 IPC(主分类):G08G1/01 申请日:20170228

    实质审查的生效

  • 2017-07-04

    公开

    公开

说明书

技术领域

本发明属于空间统计分析领域,特别涉及一种基于空间误差模型的公共交通通达性差异分析方法。

背景技术

公共交通是社会生活中主要的出行方式,通过公交、地铁、轻轨等这些公共交通,能到达乘客的目的地。将一个地方到另一个地方的便捷程度定义为交通通达度,分析一个城市的交通通达度是将街区看作城市的最小单元,在比较宏观的层面上分析整个城市的交通格局,可以为城市基础公共交通建设提供决策支持。交通通达度是由可达度(Accessibility)发展而来,Hansen最先定义了可达度的概念,可达度是相互作用的机会的潜力大小。在空间中,可达性用于反映一般出行者利用给定的交通系统从出发地点到达活动地点的便利程度,是交通系统、土地利用和出行者相互作用的关键因素。而空间中得物体存在普遍的相关性,进行必要的空间自相关分析,能得到更为精确的结果。在对可达度的研究应用中,Pooler运用回归分析法考察了就业增长与可达性的关系,用就业因素作为可达度研究的主要影响因子,对美国60个都市区进行了研究。Ozbay提出了一个新的可达度函数模型,研究的是就业可达度,并将这一模型运用到纽约和新泽西都市区的交通领域。在GIS取得了一些成就之后,更多的研究在利用GIS的相关理论方法,O-Kelly和Horner利用可达度理论对美国县域人口得统计数据进行了人口增长速度方面的研究。另外还有一些学者将可达度与时空相结合,更好的表述了城市中可达度得时空特征。Mavoa等人提出两种公交可达度的研究方法,并运用到新西兰的Auckland城市,最后提出了关于公共交通车辆频率得建议。Cheng等人分析了深圳市就医通达度,假设初级、二级、三级是就医得主要场所,并根据通行时间和空间差异分析每一个地区的空间可达度。

在计算一个点的交通通达性时,使用如下公式:

其中,Ai表示一个点的交通通达性,i,j分别表示空间中不同的两点,n,N表示空间中点的数量,Sij表示计算交通通达度的阻抗因子,通常是时间或者距离。

在计算一个区域的交通通达性时,使用如下公式:

其中,E表示一个区域的交通通达性,i表示这个区域中的任意一点,n,N表示空间中点的数量,Ai表示一个点的交通通达性。

方差分析(ANOVA)是一种特殊形式的统计假设检定,广泛应用于实验数据的分析中。统计假设检定是一种根据数据进行决策的方法[5]。方差分析用于检验两组或两组以上的实验数据组数据均值间差别显著性,首先设定一个零假设,表述为实验中所有的实验组数据均值间不存在显著差异。测试结果(通过零假设进行计算)如果不仅仅是因为运气,则在统计学上称为显著。然后经过一系列的统计计算,统计显著的结果(当可能性的P-value小于临界的“显著值”)则可以推翻零假设。方差分析的结果是用方差表表示的,误差由方差表示,组内的误差是每一个数据和他所在组的均值的方差表示,组间的误差是总的误差减去组内误差得到的,而总误差等于总方差,df是自由度,用于计算平均方差,最终由F值表示方差分析的结果,但是一般都是用p-value的值表示显著性结果,当p-value的值大于0.05时,则表示不存在显著性差异,若小于0.05,则表示存在显著性差异,具体计算如下表:

其中

Xi是数据集中的数据,是所有数据的均值,是每一组的均值,N是组的数量,n是总的数据数量。

空间自相关分析是利用空间误差模型(spatialerrormodel)计算的,空间误差模型最开始由Anselin在《Spatial Econometrics:Methods and Models》中提出,根据地理学第一定理,相邻的事物相似,远离的事物相异。空间误差模型来自于普通线性回归,即Y=αX+ε,当用于普通线性回归的两个变量都考虑空间自相关性时,则需要在原来变量的基础上减去周围相邻空间所共有的部分才能应用普通线性回归,即需要减去ρWY,其中ρ是空间自相关系数,W是空间邻接矩阵。所以得到空间误差模型如下:

Y-pWY=αx-αpWx+ε

整理变形有:

Y=aX+(I-pW)-1ε

因为空间误差模型不是线性模型,所以不能使用普通的最小二乘法进行参数估算,需要使用最大似然法进行参数估算。将变量代入模型中估算得到该变量的空间自相关系数,然后消除空间自相关影响,保证变量的独立性,才能进行方差分析。

对于普通的方差分析方法,实验数据必要满足独立性、正态性、等方差性的基本假设,即用于分析差异性的数据必须满足独立性、正态性、等方差性。对空间中的数据进行差异性分析,需要满足这样的基本假设,而空间数据最基本的特征就是具有空间自相关性,空间自相关性是空间数据之间存在的相互依赖的关系,所以不满足独立性,所以普通的方差分析并不能对空间数据进行差异性分析,在此基础上发展的基于空间误差模型的方差分析能有效地分析空间数据的差异性。

城市中分布着许多的基础设施,如医院、学校,分析城市基础设施的通行便利程度可以反映出基础设施在城市中的分布状况。利用基于空间误差模型的方差分析方法,可以分析出城市中不同地区基础设施的交通通达性,如果不同地区之间的基础设施的交通通达性差异显著,说明城市的基础设施分布不公平,而如果不同地区之间的基础设施的交通通达性差异不显著,说明城市的基础设施分布公平。对城市中基础设施的分布公平性进行评价,能对城市基础设施规划提供决策支持。

发明内容

本发明所要解决的问题是,提供一种城市内各个行政区划内基础设施分布是否公平的分析方法。

本发明提供一种城市内各个行政区划内基础设施分布是否公平的分析方法,包括以下步骤:

步骤1:从百度地图提供的API获取到城市公交站点数据和基础设施位置数据,利用百度地图提供的API获取到每一个公交站点到基础设施的距离、时间。计算公共交通通达性,具体包括:

步骤1.1:利用百度地图API获取到城市中所有的公交站点位置数据和基础设施位置数据。

步骤1.2:利用百度地图API和步骤1.1中得到的位置数据获取搭乘公共交通从每一个公交站点到任一基础设施的通行时间和同行距离。

步骤1.3:利用点的交通通达性计算公式和步骤1.2中得到的通行时间和同行距离计算出城市中每一个公交站点的交通通达性。

步骤1.4:利用面的交通通达性计算公式和步骤1.3中得到的点的交通通达性计算出城市各个区划的交通通达性。

步骤2:利用基于空间误差模型的方差分析将步骤1中计算得到的各个区域的交通通达性,包括数据的正态性检验、空间自相关分析、消除空间自相关影响,具体包括:

步骤2.1:对步骤1.4中计算得到的交通通达性数据进行正态性检验,使用的方法是Shapiro-Wilk正态性检验,如果通过正态性检验,则进行步骤2.2,否则利用Boxcox正态性变换将非正态性数据转换为正态性。

步骤2.2:利用空间误差模型对步骤2.1的数据做空间自相关性分析,分析得到空间自相关系数,然后消除公共交通通达性数据的空间自相关影响。

步骤2.3:将进行过步骤2.2的数据做方差分析,得到差异性分析结果

步骤3:将步骤2中分析得到的结果进行讨论,最终得到整个城市的基础设施分布公平性评价。

依照本发明所提供的城市基础设施公共交通通达性差异性分析方法,可以从通行时间和通行距离两个因素分析城市中基础设施的分布是否合理,这种分布是基于公平性评价出来的。而且在利用空间自相关分析的基础上,使用方差分析能得到更有说服力的差异性结果。

附图说明

图1为本发明实施例数据获取的流程图。

图2为本发明实施例基于空间误差模型的公共交通通达性差异分析方法的流程图。

具体实施方法

为了便于本领域普通技术人员的理解和实施本发明,下面结合附图及实施例对本发明做进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

本发明要解决的核心问题是:分析城市中的某一基础设施在各个行政区划中是否分布公平。

请见图1,本发明提供的一种基于ANOVA的基础设施公共交通通达性差异性分析方法,包括以下步骤:

步骤1:从百度地图提供的API获取到城市公交站点数据和基础设施位置数据,利用百度地图提供的API获取到每一个公交站点到基础设施的距离、时间。计算公共交通通达性;

步骤1.1:利用百度地图API获取到城市中所有的公交站点位置数据和基础设施位置数据;

具体实施时,可以参考百度地图API的开发者服务网站developer.baidu.com/map,获取城市中的公交站点位置数据和基础设施位置数据需要使用百度地图API中的JavaScriptAPI,通过提供的本地搜索API,写成HTML网页并以“公交站”为关键词搜索,得到城市中所有的公交站点的名称、所属行政区划、经纬度坐标。然后以基础设施的名称为关键词进行搜索,如“三甲医院”,“小学”,“中学”等,得到相应的基础设施的名称、所属行政区划、经纬度坐标。本发明对此选择武汉市的三甲医院进行交通通达性差异性分析。武汉市是湖北省省会,是中国中部地区的中心城市,是全国重要的工业基地、科教基地和综合交通枢纽,武汉市下辖13个行政区划,分别是江岸区、江汉区、硚口区、汉阳区、武昌区、洪山区、青山区、东西湖区、蔡甸区、江夏区、黄陂区、新洲区、汉南区。这里选择武汉市中心城区作为实验区域,即江岸区、江汉区、硚口区、汉阳区、武昌区、洪山区、青山区这7个行政区划。最终获取到武汉市中心城区共1416个公交站点,29个三甲医院位置数据。

步骤1.2:利用百度地图API和步骤1.1中得到的位置数据获取搭乘公共交通从每一个公交站点到任一基础设施的通行时间和同行距离;

具体实施时,可以参考百度地图API的开发者服务网站developer.baidu.com/map,获取搭乘公共交通从每一个公交站点到任一基础设施的通行时间和同行距离需要使用百度地图API中Web服务API中的DirectionAPI,在规划路径时,可以选择不同的公共交通换乘策略,包括少换乘、少步行、不坐地铁、时间短、地铁优先这五种策略。通过DirectionAPI,可以得到每一个公交站点通过乘坐公共交通工具到每一个基础设施的通行时间和通行距离,在这里所指的公共交通工具包括交通车、地铁、轻轨等。

步骤1.3:利用点的交通通达性计算公式和步骤1.2中得到的通行时间和同行距离计算出城市中每一个公交站点的交通通达性;

具体实施时,将步骤1.2中获取到的通行时间和通行距离分别代入交通通达性公式,得到每一个公交站点的基于时间的交通通达性和基于距离的交通通达性。

步骤1.4:利用面的交通通达性计算公式和步骤1.3中得到的点的交通通达性计算出城市各个区划的交通通达性;

具体实施时,统计落在每一个行政区划中的公交站点,用落在这个区划内的所有的公交站点的交通通达性在计算这个区划的交通通达性,由此可以得到城市中所有的区划的基于时间的交通通达性和基于距离的交通通达性。

步骤2:利用基于空间误差模型的方差分析将步骤1中计算得到的各个区域的交通通达性,包括数据的正态性检验、空间自相关分析、消除空间自相关影响等操作。

步骤2.1:对步骤1.4中计算得到的交通通达性数据进行正态性检验,使用的方法是Shapiro-Wilk正态性检验,如果通过正态性检验,则进行步骤2.2,否则利用Boxcox正态性变换将非正态性数据转换为正态性。

具体实施时,将步骤1中获得的数据进行正态性检验,采用的方法是Shapiro-Wilk正态性检验,Shapiro-Wilk正态性检验是一种基于相关性的算法,其计算式为:

其中,xi是待测变量,是待测变量的均值,ai是待估常量,W是检测统计量。检测统计量越大表示变量越符合正态分布,主要还是结合P-value的值来进行判断,一般选择0.05的置信水平,即表示当P-value大于等于0.05时,表示变量是正态性分布,当P-value小于0.05时,表示变量不是正态性分布。如果变量是正态性分布的,则进行步骤3.2,否则需要对变量进行正态性变换。Boxcox正态性变换是一种对非正态性数据进行幂运算转换为正态性数据的方法,同样以Shapiro-Wilk正态性检验的结果作为判断依据,计算在-2到2范围内选择满足正态性变换的幂运算参数。在实例中,武汉市中心城区基于时间和基于距离的公共交通就医通达性均不满足正态性分布,最终分别对数据做-0.9和-1.7的幂运算,将数据转换为正态性分布数据。

步骤2.2:利用空间误差模型对步骤2.1的数据做空间自相关性分析,分析得到空间自相关系数,然后消除公共交通通达性数据的空间自相关影响。

具体实施时,对步骤2.1中得到结果做空间自相关性分析,要利用空间误差模型计算空间自相关系数,首先要利用空间中城市各个区划的邻接关系建立空间邻接矩阵,其原理是:假设空间中有N块区域,则有这样一个N*N的矩阵来表示N块区域之间的邻接关系,如果第i块区域与第j块区域相邻,则矩阵中位置为(i,j)和位置为(j,i)的值都为1,否则值为0,同时定义矩阵中对角线上的数都为0。因为空间误差模型是一个回归模型,如果要计算某一个单一变量的空间自相关系数,需要代入空间邻接矩阵作为参数将交通通达性的数据与自身做回归,然后利用最大似然法估算回归模型中的系数,这其中便有空间自相关系数。计算得到空间自相关系数之后,需要消除空间自相关影响,具体计算公式为:

Y′=Y*(I-ρWY)

其中,I为对角线上全为1的单位矩阵。

在实例中,利用空间误差模型对数据进行分析,得到基于距离和时间的公共交通通达度的空间自相关系数为0.9812、0.9512,空间自相关性特别强,消除空间自相关性才能保证数据的独立性,满足独立性才能利用方差分析进行差异性分析。

步骤2.3:将进行过步骤2.2的数据做方差分析,得到差异性分析结果

具体实施时,对步骤2.2中的得到数据进行方差分析,得到的结果是方差分析计算得到F值。然后计算F值在整个数据分布上的P-value,由P-value分析差异性分析结果。

步骤3:将步骤2中分析得到的结果进行讨论,最终得到整个城市的基础设施分布公平性评价。

具体实施时,对步骤2.3中得到的P-value进行讨论,在0.05的置信水平上进行评价,如果P-value大于等于0.05,则表示差异不显著,该基础设施在城市中分布公平;如果P-value小于0.05,则表示差异显著,该基础设施在城市中分布不公平。但是对一个城市而言,空间上的公平主要是体现在距离上的,而时间上主要是居民出行时考虑的,所以基于时间的交通通达度体现了居民出行到基础设施的公平性,而基于距离的交通通达性体现了基础设施在城市中分布的公平性。在实例中,武汉市中心城区基于距离的公共交通就医通达性表现为有显著的差异,说明三甲医院在武汉市的分布有不公平的特征,而基于时间的公共交通就医通达性表现为没有显著的差异,说明居民在出行到三甲医院时,因为交通工具的影响,在空间上的不公平被弥补,最终表现为公平。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号