首页> 中国专利> 一种基于出行交易数据和POI数据的居住地站点识别方法

一种基于出行交易数据和POI数据的居住地站点识别方法

摘要

本发明公开了一种基于出行交易数据和POI数据的居住地站点识别方法,首先提取每个用户出行当天第一条交易数据,并将其出发站点视为潜在居住地站点;之后计算潜在居住地站点间的两两距离,通过设置居住地站点集群距离阈值对潜在居住地站点进行集群识别,并计算每个站点的居住潜力;最后根据集群的数量、累积出行频率、内部站点出行频率等特征,结合居住潜力最终识别出用户的居住地站点。本方法简单易行,使用出行交易数据并结合POI数据进行辅助判断,更精准地识别出特定交通方式用户的居住地站点,为确定出行需求提供了一种新的方法,利用该方法得到的结果可以优化交通资源供给配置,也可为评价特定类型设施的空间可达性在需求识别方面提供有力支撑。

著录项

  • 公开/公告号CN113096383A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN202110265059.3

  • 发明设计人 陈学武;刘锡泽;陈文栋;陈景旭;

    申请日2021-03-09

  • 分类号G08G1/01(20060101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人朱桢荣

  • 地址 210096 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-06-19 11:45:49

说明书

技术领域

本发明涉及城市交通规划技术领域,特别是一种基于出行交易数据和POI数据的居住地站点识别方法。

背景技术

居住地识别对于确定出行需求,合理配置交通资源具有重要意义,也可为评价特定类型设施的空间可达性在需求识别方面提供有力支撑。每种交通方式具有不同的用户群体,使用出行数据分析居住地可以更精准的分析该交通方式的出行需求。传统的居住地获取主要通过问卷调查,不仅耗费巨大人力物力,而且调查周期时间长,覆盖样本有限;目前还有部分研究使用的是手机信令数据,然而其无法判断用户具体的出行方式,不能获取精确的交通需求。对于居住地站点识别,已有方法主要是通过选取频率最大的站点作为居住地站点,没有考虑到相邻站点间的关联性,在几个出行频率基本相同的站点间确定居住地站点时,没有考虑用地性质,造成一定误差。

发明内容

本发明所要解决的技术问题是克服现有技术的不足而提供一种基于出行交易数据和POI数据的居住地站点识别方法,针对特定交通方式识别更精准的出行需求。

本发明为解决上述技术问题采用以下技术方案:

根据本发明提出的一种基于出行交易数据和POI数据的居住地站点识别方法,包括以下步骤:

步骤(1)、提取某种交通出行方式的出行交易数据中每个用户出行当天第一条记录,将其出发站点作为潜在居住地站点;

步骤(2)、计算统计周期内每个用户所有潜在居住地站点间的两两距离;

步骤(3)、设置居住地站点集群距离阈值d,将潜在居住地站点间距离小于d的站点视为同一集群,分别对每个用户的潜在居住地站点以集群为单位进行聚合,根据POI数据计算潜在居住地站点的居住潜力;

步骤(4)、如果潜在居住地站点只有一个集群,则将该集群中出行频率最高的站点视为居住地站点,否则进入步骤(5);

步骤(5)、如果潜在居住地站点分属不同集群,且每个集群内只有一个站点,并且所有站点出行频率都相等,则无法识别居住地站点,否则进入步骤(6);

步骤(6)、如果潜在居住地站点分属不同集群,其中有一个集群出行累积频率最大,集群出行累积频率是指集群内所有站点的出行频率之和,则将该集群中出行频率最高的站点作为居住地站点,否则进入步骤(7);

步骤(7)、如果潜在居住地站点分属不同集群,且有不止一个集群出行累积频率最大,则选取累计频率最大的所有集群中出行频率最高的站点作为居住地站点。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,所述的居住地站点指最接近用户居住地的站点。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,步骤(1)中筛选的用户出行频率大于每周2天。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,步骤(3)中居住地站点集群距离阈值d取为当地城市该交通方式的站点服务范围;该交通方式是指步骤(1)中的交通出行方式;

设置居民接受的距站点的最大步行距离,并以此确定该交通方式的站点服务范围。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,步骤(3)中居住潜力计算公式如下:

其中,P

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,如果步骤(4)中的集群中存在两个及以上的出行频率最高的站点,则从出行频率最高的站点中选取居住潜力最高的站点。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,如果步骤(6)中累计频率最大的集群存在两个及以上的出行频率最高的站点,则从出行频率最高的站点中选取居住潜力最高的站点。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,如果步骤(7)中累计频率最大的集群存在两个及以上的出行频率最高的站点,则从出行频率最高的站点中选取居住潜力最高的站点。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,步骤(1)中,某种交通出行方式是指以下方式中的一种:公共自行车、互联网租赁自行车、地面公交、轨道交通。

作为本发明所述的一种基于出行交易数据和POI数据的居住地站点识别方法进一步优化方案,步骤(3)中,POI数据是指兴趣点数据,POI数据包括POI点的名称、经纬度坐标、地址和类型。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

本发明分析出行数据以集群为单位并通过POI数据进行辅助判断,更精准地识别出特定交通方式用户居住地站点,为确定出行交易需求提供了一种新的方法,政府或企业可利用该结果优化交通资源供给配置,也为评价特定类型设施的空间可达性在需求识别方面提供有力支持。

附图说明

图1是本发明的方法流程示意图。

图2为实施例1示意图。

图3是公交居住地站点居住潜力示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明。

实施例1:

本实施例为虚构场景,用以说明居住地站点识别中可能存在的情况,假定已经根据出行数据按照步骤(1)~(3)进行集群聚合,并已计算好每个站点的居住潜力。

如图2所示,场景①中的用户共有一个集群,该集群内有三个站点,根据步骤(4)可得居住地站点为频率为4的站点。

场景②中的用户共有一个集群,该集群内有三个站点,根据步骤(4)及公式(1)可得居住地站点为频率为4且居住潜力较大的站点。

场景③中的用户共有三个集群,每个集群内均只有一个站点,且频率均为1,根据步骤(5)可得,无法识别该用户的居住地站点。

场景④中的用户共有三个集群,三个集群分别的累积频率为8、6、5,其中累积频率为8的集群中,有一个最大频率为4的站点,根据步骤(6)可得,居住地站点为累积频率为8的集群中频率为4的站点。

场景⑤中的用户共有三个集群,三个集群分别的累积频率为9、6、5,其中累积频率为9的集群中,有两个频率为4的站点,根据步骤(6)及公式(1),居住地站点为累积频率为9的集群中频率为4且居住潜力较大的站点。

场景⑥中的用户共有三个集群,三个集群分别的累积频率为6、6、5,一个累积频率为6的集群包含一个频率为4的站点,另一个累积频率为6的集群所有站点的频率均为1,根据步骤(7)可得,居住地站点为累积频率为6的集群中频率为4的站点。

场景⑦中的用户共有两个集群,两个集群分别的累积频率均为6,且均包含频率为4的站点,根据步骤(7)及公式(1)可得,居住地站点为频率为4且居住潜力较大的站点。

实施例2;

本发明所述的出行交易数据可应用于多种交通出行方式,在本实施例中以公交刷卡数据进行说明。本实施例以南京市区(除高淳区外)为实验区域,采用的公交刷卡数据由南京市市民卡有限公司提供,时间范围为2019年3月1日至31日;采用的各类型POI数据由南京市相关部门提供,POI是指Point of Interests,简称POI,俗称“兴趣点数据”,每条POI数据都包含该POI点的名称、经纬度坐标、地址、类型等信息。

如图1所示,一种基于出行交易数据和POI数据的居住地站点识别方法包括如下步骤:

(1)原始刷卡数据记录包含字段如表1所示。

表1公交原始刷卡记录

提取出行数据中每个用户当天第一条出行数据,并筛选出一周内刷卡天数大于2天的用户:本发明以卡号尾号为64E5CFD的乘客为例,详细说明其居住地站点识别方法,该乘客出行当天第一条记录集合如表2所示,将其出发地作为潜在居住地站点。

表2卡号尾号为64E5CFD的乘客第一条出行记录集合

(2)计算统计周期内每个用户所有潜在居住地站点间的两两距离:从表2可知,该用户存在4个潜在居住地站点,计算站点间两两距离,结果如表3所示。

表3卡号尾号为64E5CFD的乘客所有潜在居住地站点间两两距离(单位:米)

(3)设置居住地站点集群距离阈值d,将潜在居住地站点间距离小于d的站点视为同一集群,分别对每个用户的潜在居住地站点以集群为单位进行聚合,根据POI数据计算潜在居住地站点的居住潜力:本发明将站点集群距离阈值d设置为500m,500m半径范围是南京市公交服务半径。从表3可以看出,该用户共有三个集群:

集群①:站点编号为021(刷卡次数为10)和站点编号为022(刷卡次数为10)

集群②:站点编号为046(刷卡次数为1)

集群③:站点编号为018(刷卡次数为2)

本发明以该用户刷卡次数最多的两条记录为例,计算潜在居住地站点的居住潜力。该用户刷卡次数最多的两个站点分别为大树城公交站(站点编号为021)和马道街·江宁路公交站(站点编号为022),如图3所示。大树城公交站有5个居住型POI,2个机构型POI,4个休闲型POI,1个商业型POI,共计12个POI;马道街·江宁路公交站有10个居住型POI,1个机构型POI,3个休闲型POI,2个商业型POI,共计16个POI。根据公式(1)可得,大树城公交站居住潜力为41.67%,马道街·江宁路公交站居住潜力为62.5%。

(4)该用户潜在居住地站点共有三个集群,不满足步骤(4)的条件,进入步骤(5)。

(5)该用户潜在居住地站点的三个集群站点数不全为1,不满足步骤(5)的条件,进入步骤(6)。

(6)该用户潜在居住地站点存在多个集群,其中集群①出行累积频率最大,满足条件,将该集群中出行频率最高的站点作为居住地站点,而该集群中存在两个出行频率最高的站点,通过步骤(3)得到的居住潜力可知,该用户的居住地站点应为马道街·江宁路公交站(站点编号为022)。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号