首页> 中国专利> 基于百度地图开放数据与Web数据挖掘的区域停车难易指数的分析方法

基于百度地图开放数据与Web数据挖掘的区域停车难易指数的分析方法

摘要

本发明提供了一种基于百度地图开放数据与Web数据挖掘的区域停车难易指数的分析方法,属于信息技术、智能交通技术、先进的交通管理与控制技术、交通基础信息采集、网页数据挖掘及相关软件技术领域。步骤一:土地利用信息挖掘;步骤二:区域停车需求建模;步骤三:区域停车供给分析;步骤四:区域停车难易指数的计算与制图;步骤五,区域停车难易程度地图绘制。城市建设者可通过本发明改善停车费率决策和停车设施规划,为解决目前城市日渐显著的“停车难”问题提供辅助决策依据。本发明的方法以及所得到的详细土地利用信息数据,可以为城市规划、停车场规划与运营、公众出行信息、城市交通建设相关决策以及与交通相关的科学研究提供有效支持。

著录项

  • 公开/公告号CN106250540A

    专利类型发明专利

  • 公开/公告日2016-12-21

    原文格式PDF

  • 申请/专利权人 大连理工大学;

    申请/专利号CN201610645209.2

  • 发明设计人 王仲;高玉龙;侯琳;

    申请日2016-08-09

  • 分类号G06F17/30(20060101);G06Q50/30(20120101);

  • 代理机构21200 大连理工大学专利中心;

  • 代理人温福雪;李宝元

  • 地址 116024 辽宁省大连市甘井子区凌工路2号

  • 入库时间 2023-06-19 01:11:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-10

    授权

    授权

  • 2017-01-18

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160809

    实质审查的生效

  • 2016-12-21

    公开

    公开

说明书

技术领域

本发明涉及到信息技术、智能交通技术、先进的交通管理与控制技术、交通基础信息采集、网页数据挖掘及相关软件技术领域,提出了一种在大数据背景下,基于百度地图开发的可以使出行者快速知晓目的地区域停车难易程度的方法。

背景技术

土地利用信息是城市规划、交通规划、交通出行需求预测以及停车需求预测不可或缺的基础数据。传统土地利用信息获取主要采用查阅规划数据档案或者人工实地调查与测量的方法,往往耗费大量的人力、物力、财力和时间。随着GPS、遥感卫星图像、地理信息系统技术和无人机航拍等方法日渐成熟,土地利用信息获取的精度和效率逐渐提高,获取方式也逐渐多元化。但是,以上方法还是需要消耗大量资源才能完成信息获取工作,成本高昂。近年来,随着我国城市化发展进程的加快,城市土地开发和利用情况的变化也随之加快,如何获取及时和准确的土地利用信息成为政府、企业界以及学术界的共同难题。大数据背景下,各种数据资源越来越丰富,开放性也越来越强,数据挖掘与分析技术的发展使得突破这一难题成为可能。

百度地图提供丰富的兴趣点(Point of Interest,简称POI)数据信息,这些兴趣点包括居民小区、办公楼、商业、医院、学校、餐饮、娱乐等数十类土地利用、建筑设施、以及各类工商企业机构。倘若能够利用网页数据挖掘技术,进一步挖掘与这些POI相对应且更详尽的信息,包括其位置、规模、人员数量、建筑面积、土地利用甚至经营情况等等,就可以利用这些POI数据信息和科学的预测方法,对指定区域的停车需求进行准确预测。

目前,将网页数据挖掘技术应用于获取地理信息的研究取得了一定进展。例如Wu Y和Niu Z在文献[Wu A Y,Niu Z.Extending a geocoding database by Web information extraction[J].Proceedings of SPIE-The International Society for Optical Engineering,2008.]中介绍了如何提取Web文档的地理信息来扩展地理编码数据库,以提供更好的本地网络搜索服务。Sagara等人在文献[Sagara T,Kitsuregawa M.Yellow page driven methods of collecting and scoring spatial Web documents[C]//Workshop on Geographic Information Retrieval SIGIR.2004:4-8.]中建立了一个可以提取网页内容中的地理信息的系统。Woodruff和Plaunt在文献[Woodruff A,Plaunt C.GIPSY:Automated geographic indexing of text documents[J].JASIS,1994,45(9):645-655.]中开发了地理参考信息处理系统(GIPSY),可以从网页文本信息中自动提取地理位置的坐标检索关键词,以支持地理参考信息的文件索引和检索。但是,通过文献和专利检索我们发现,将网页数据挖掘技术应用于获取精细化POI信息方面的研究和应用技术还比较匮乏,而将精细化的POI信息应用来预测区域停车需求,并进一步计算区域停车难易指数的技术还没有先例。当前的停车需求预测主要基于土地的利用类型以及不同利用类型的土地面积、建筑面积、城市的机动车拥有量、停车吸引率以及停车位的供应、价格和位置、城市的人口及就业情况,包括城市的人口数、户数及就业岗位数、单位雇员数等数据进行预测,而数据的有效性和时效性一直存在较大的问题。

基于上述精细化POI信息的重要性以及现有停车需求预测技术的不足之处,本发明从百度地图API开发着手,利用网页数据挖掘技术,开发出一种大数据背景下快速有效获取城市土地利用信息数据,并将其应用于停车难易程度指数计算的方法,以实现两个主要目的:1)发明区域停车难易指数这一重要指标,为驾驶员提供出行决策参考;2)通过利用百度地图API和网页数据挖掘,提升停车需求预测的精度和区域停车难易指数的精度。

发明内容

本发明提出了一种在大数据背景下,将Web数据挖掘技术获取的互联网中准确、精细化的土地利用信息应用于计算区域停车难易指数,并依据区域停车难易指数绘制区域停车难易程度地图,直观表征区域停车难易程度的新方法。本发明的技术路线如图1所示。

本发明的技术方案:

基于百度地图开放数据与Web数据挖掘的区域停车难易指数的分析方法,步骤如下:

步骤一:土地利用信息挖掘

1)挖掘POI信息

在百度地图开放平台基础上,进一步开发获取POI信息,包括名称、类别、地址、经度、纬度和UID六部分;

2)挖掘POI对应的详细土地利用信息

步骤1)挖掘得到的UID为其对应的POI的ID,是唯一的;在每个UID的前后添加网址,获得原始网址,即可抵达百度地图详细信息页面;将所有原始网址导入网页数据采集器,通过数据采集器对原始网址进一步挖掘,得到挖掘POI对应的详细土地利用信息;

3)POI信息与对应的详细土地利用信息匹配

POI信息与对应的详细土地利用信息不一一对应,依据步骤2)中原始网址和POI名称,将POI信息与对应的详细土地利用信息进行匹配,为区域停车难易指数计算提供基础数据;

步骤二:区域停车需求建模

综合利用已有模型的优点,在停车生成率模型和多因素的停车需求分析预测模型的基础上,兼顾相关分析法,研究用地与交通影响分析模型,通过多元线性回归方法确定各区域及其功能小区不同类型用地间相互作用后的动态发生率,在土地利用—停车需求模型基础上,建立适用于精细化土地利用信息的区域停车需求模型为区域停车指数的计算提供基础,公式如下:

Rij=Σj=1RBij×Lij+Σj=1nAij×Rij+kij---(1)

其中:Rij是i类用地属性j区域停车需求;Bij是第i区j类性质用地单位停车需求数量,即停车产生率,通过查阅相关城市规划标准与准则得到;Lij是第i区j类性质用地数量(建筑面积、土地面积),通过步骤一挖掘得到;Aij是第i区j类性质用地单位雇员停车需求数量,即停车产生率,通过查阅相关城市规划标准与准则得到;Rij是第i区j类性质用地数量(营业额、户数、单位雇员数或就业岗位),通过步骤一挖掘得到;kij为修正系数,由计算并通过现有数据进行校正得到。

步骤三:区域停车供给分析

通过相关部门的数据资料库、走访调查、问卷调查和实地调查等多方式结合的方法获取路内停车、路外停车设施(包括建筑物配建停车场、社会公共停车场及路内停车位)的现状基础数据及使用情况,得到区域停车供给Sij

步骤四:区域停车难易指数的计算与制图

根据区域停车需求、区域停车供给、停车周转及停车特征等数据特点,定义区域停车难易指数并建立计算模型,公式如下:

Pij=RijSij·Zi·K1i·K2i---(2)

其中:Pij是i类用地属性j区域停车指数值;Rij是i类用地属性j区域停车需求,由步骤二得到;Sij是i类用地属性j区域停车供给,由步骤三得到;Zi是i类用地属性停车周转率,通过调查或查找相关部门资料库得到;K1i是i类用地属性停车周转率修正系数,由计算并通过现有数据校正得到;K2i是i类用地属性停车指数值修正系数,由计算并通过现有数据校正得到。

步骤五:区域停车难易程度地图绘制

将步骤四得到的停车难易指数按数值分级,绘制区域停车难易程度地图,用不同颜色表示不同的区域停车难易程度。

本发明的有益效果:

1)通过区域停车难易程度地图展示区域停车难易程度,出行者能够更加方便、快捷、直观地了解目的地区域和周边地区的停车难易程度,从而采用更科学合理的出行方案出行,例如:a)改变出行方式,由驾驶小汽车改为乘坐公交、地铁或者采用自行车、步行方式;b)改变出行时间,错开高峰时段;或者c)取消出行。这些出行决策的变化,都将促进城市交通拥堵的缓解,减少交通所产生的碳排放,提高居民的交通出行满意度。

2)城市建设者可通过本发明改善停车费率决策和停车设施规划,为解决目前城市日渐显著的“停车难”问题提供辅助决策依据。

3)本发明所提供的方法以及所得到的详细土地利用信息数据,可以为城市规划、城市交通相关的决策以及与交通相关的科学研究提供有效支持。

附图说明

图1为基于百度地图开放数据与Web数据挖掘的区域停车难易指数的总技术路线。

图2为土地利用信息挖掘技术路线图。

图3为区域分区示意图。

图4为区域停车难易程度展示图。

具体实施方式

以下结合附图和技术方案,进一步说明本发明的具体实施方式。

一种基于百度地图开放数据与Web数据挖掘的区域停车难易指数的分析方法,步骤如下:

步骤一:土地利用信息挖掘

土地利用信息挖掘技术路线如图2所示。

1)POI信息挖掘

首先,利用百度地图API开放平台,加载百度地图,通过添加覆盖物功能添加任意多边形区域模拟小区,并对添加的多边形边界进行分析,按照指定密度获取小区内所有兴趣点的坐标,通常将密度设置为0.0005,这是因为在确定两个相邻POI点距离的时候,经过计算当R取半径平均值6371km时,地球表面上同一经线圈上相差1"两点间的距离约为30.887米,地球表面上同一纬线圈上相差1"两点间的距离约为30.887m×cos(纬度)。百度地图的坐标精确到小数点后6位,本发明的获取精度为0.0005,相当于每五十米获取一次POI信息。POI的获取半径为四个点构成正方形的对角线的一半,应该取值为35米,本发明中取值为40米,保证了获取信息的准确和完整性。

然后,采用逆地址解析功能与获取指定点周围POI信息功能,获取上一步所得到的每个点周围指定半径指定数量的POI信息,调用ActiveX,将获取的POI信息按照编号分别写入到不同TXT文件中。

最后,利用Excel VBA对上一步获取的POI数据进行数据清洗(整合、删重及统计),得到各小区无重复的POI信息。

2)POI对应的详细土地利用信息挖掘

首先,利用Excel将每个POI的UID与网址结构整合,生成原始网址作为火车头数据采集器的0级网址。

然后,将原始网址导入火车头数据采集器中,根据所需进行参数设置,对数据来源为安居客、搜房网、新浪乐居等网站的建筑物进行数据挖掘,选择性的获取小区名、地址、容积率、总建筑面积、总户数、当期户数、容积率、占地面积、车位数、车位配比、均价、物业费和网址等信息。

最后,将挖掘到的土地利用详细信息发布到Excel中,生成Excel文件;利用Excel VBA进行土地利用详细信息数据的进一步清洗(整合、删重与统计),完成土地利用详细信息挖掘。

3)POI信息与对应的详细土地利用信息匹配

利用Excel的VLOOKUP功能完成POI信息与对应的详细土地利用信息匹配工作。

在数据匹配的过程中,会出现以下两大问题:

1)数据挖掘重复值处理:针对一个建筑物不同楼层多次获取信息、不同网站提供的信息不同等情况。

2)数据挖掘缺失值处理:主要因是在百度地图的POI不完善、网站上POI对应的详细土地利用信息不完整。

对于第一种问题,数据挖掘重复值处理,在本文中优先保存详细土地利用信息中包含容积率、建筑面积、用地面积和人口信息的数据,如果出现多条包含此类信息的数据,根据相应情况,采取出现频率最多的数据。此方法结合Excel中MAX、COUNTIF和VLOOKUP函数既可以实现。采用此方法,保证通过重复值处理后,每个POI点的名称在每一列只出现一次。对于第二种问题,数据挖掘缺失值处理。产生问题的主要原因是在百度地图中,一些POI点只有地名和经纬度信息,具体POI点详情还没有使用者将其上传,同时这些POI点在网上也难以找到具体的建筑面积、容积率、用地面积和人口等信息。对于这些点,在本文中根据相应情况采取不同的方法进行信息填补,其中主要的方法是根据不同的属性设置缺省属性。

步骤二:区域停车需求建模

计算区域停车需求的方法是根据经纬度的数值大小,将研究区域划分为若干个小区,分别计算每个小区的停车需求。建立坐标系,取西南角对应的坐标为零点,从左往右为经度递增,Δx取0.005精度,从下往上为纬度递增,Δy取0.005纬度,每个区域近似接近于正方形,区域分区示意图如图3所示,hizj表示横排经度第i(i=0,1,2,3…)分区纵排纬度第j(i=0,1,2,3…)分区。可知,每个分区的中心坐标可表示为(x0+i·Δx+0.0025,y0+j·Δy+0.0025)。

利用发明内容步骤二的公式(1)进行区域停车需求计算,将容积率、建筑面积和占地面积统一格式为建筑面积,计算时依据以下几种原则和顺序:

1)先整体计算,在将计算结果按照经纬度所在小区分配到其所属小区并进行累加。

2)同时存在建筑面积和人口总数时取需求量大的值作为结果。

步骤三:区域停车供给分析

停车供给数据分公共停车场、配建停车场以及路内停车位三方面进行获取,具体获取方法如下:

公共停车场:建筑物配建停车场是指建筑物依据建筑物配建停车位标准所附设的面向本建筑物使用者和公众服务的供机动车停放的停车场。获取方法为结合法定图则、内业梳理与现场核查。

配建停车场:社会公共停车场是指位于道路红线以外、面向公众服务的供机动车停放的停车场。获取方法为收集经营性停车场数据与外业补充调查。

路内停车位:路内停车位是指在道路红线以内划设的面向公众服务的供机动车停放的停车空间。获取方法为区运输局正在编制的《路内停车规划》与外业补充调查。

步骤四:区域停车难易指数的计算

以区域为单位,利用发明内容步骤四中公式(2)进行停车难易指数的计算,按数值大小将停车难易指数分为五级,停车难易指数为1级,表明目标区域的静态停车难易程度为非常容易、停车难易指数为2级,表明目标区域的静态停车难易程度为容易、停车难易指数为3级,表明目标区域的静态停车难易程度为难度适中、停车难易指数为4级,表明目标区域的静态停车难易程度为难、停车难易指数为5级,表明目标区域的静态停车难易程度为比较难。

步骤五:区域停车难易程度地图绘制

根据停车难易指数分级绘制停车难易程度地图,用不同颜色表示不同区域的停车难易程度,停车难易程度从1级到5级采用从绿色到红色过渡的方式表示,最后呈现的效果图以深圳市坪山区为例进行展示,如图4所示。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号