首页> 中国专利> 一种应用GPS出行调查数据识别出行和活动的方法

一种应用GPS出行调查数据识别出行和活动的方法

摘要

本发明公开了一种应用GPS出行调查数据识别出行和活动的方法。具体的识别方法分为四个阶段,即第一阶段、划分状态段,第二阶段、识别活动,第三阶段、识别出行,第四阶段、识别短时活动。其中第一阶段又分为四个步骤,即步骤一、将数据点转化为数据段,步骤二、判断数据段的状态,步骤三、合并相邻同状态的数据段,步骤四、调整状态段的状态。应用本发明所述的识别方法可以基于GPS出行调查数据进行出行和活动信息识别,从而实现对所有出行、活动以及活动时间在7分钟以内的短时活动的识别,且识别精度高。

著录项

  • 公开/公告号CN104504245A

    专利类型发明专利

  • 公开/公告日2015-04-08

    原文格式PDF

  • 申请/专利权人 吉林大学;

    申请/专利号CN201410736368.4

  • 申请日2014-12-04

  • 分类号G06F19/00;G08G1/01;

  • 代理机构长春吉大专利代理有限责任公司;

  • 代理人朱世林

  • 地址 130012 吉林省长春市前进大街2699号

  • 入库时间 2023-12-17 04:53:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-11

    未缴年费专利权终止 IPC(主分类):G06F19/00 专利号:ZL2014107363684 申请日:20141204 授权公告日:20170329

    专利权的终止

  • 2017-03-29

    授权

    授权

  • 2015-05-06

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20141204

    实质审查的生效

  • 2015-04-08

    公开

    公开

说明书

技术领域

本发明涉及居民出行调查和数据处理分析领域,涉及一种基于GPS(全球卫星定位)技 术的出行调查数据进行出行和活动识别的方法。

背景技术

居民出行调查是城市交通规划和管理工作的基础,其获取的出行数据可应用于交通问题 诊断、公交系统规划以及交通管理政策制定等方方面面。随着GPS技术的日益广泛应用,基 于GPS技术的出行调查成为获取出行数据的新途径。与传统的问卷调查方法相比,基于GPS 设备的出行调查具有调查效率高、数据精度高、信息量大等优点,将逐步取代传统的问卷调 查方法成为今后出行调查的主流方法。然而,GPS设备记录的是被调查者在不同时间点的经 纬度点、瞬时速度等数据,而不是可直接应用于交通规划和管理实际的出行起终点、活动开 始时间、出行目的、出行方式等信息,因此需要将GPS调查数据转化为出行和活动信息。而 出行和活动的识别是将GPS调查数据转化为出行和活动信息的首要和关键环节,其主要任务 是将GPS调查得到的一天的出行轨迹数据点划分成一天中的所有出行和活动。

在以往研究中,一些学者提出了应用浮动车或出租车进行GPS出行调查和出行信息识别 的方法,例如发明专利201210169897.1、200810038365.8和201210269040.7,但这些方法所 调查的出行信息局限于车辆出行信息,不能涵盖采取步行、公交等交通方式出行的居民出行 信息,无法应用于全方式的居民出行调查和出行信息识别。发明专利201210223939.5和 201410033560.7提出基于GPS调查数据的交通方式识别方法,没有进行出行和活动的识别。 而目前应用GPS设备或者手机定位软件进行的出行调查和出行信息识别研究中,例如发明专 利201210074506.8和201220505300.1、论文〔1〕用于交通出行调查的GPS时空轨迹数据简 化与语义增强研究.上海:华东师范大学硕士学位论文,2011;〔2〕交通运输系统工程与信 息,2010,10(2):178-183;〔3〕Transportation Research Part A,2007,41(3):220-232等学术 期刊,均存在忽略短时活动识别的问题,而导致活动和出行的识别结果不全,同时多数研究 出行调查样本量小,模型的有效性和精度无法得到很好的验证。

基于上述背景可见,亟需设计一种新型的基于GPS数据的出行和活动识别方法,以实现 短时活动的识别,同时应用较大样本量的调查数据进行数据的统计分析、参数设计和模型验 证,以提高识别精度和识别方法的广泛适用性。经查找,设计短时活动识别步骤,并且在大 样本量数据验证下开发出的高精度识别方法在国内外未见有相关报道。

发明内容

为了克服现有研究存在的无法识别短时活动、调查样本量小等缺点,本发明提供一种应 用GPS出行调查数据识别出行和活动的方法,该方法应用GPS出行调查数据,设计了包括 四个阶段的识别方法,以实现对包括短时活动的一天中所有出行和活动的整体识别,并应用 大样本GPS出行数据进行识别方法的精度计算。

本发明是采用如下技术方案实现的,结合附图说明如下:

1、一种应用GPS出行调查数据识别出行和活动的方法,主要包括如下步骤:

第一阶段、划分状态段

步骤一、将数据点转化为数据段

将数据中任一个数据点记为Di,其相邻的数据点记为Di+1,将Di、Di+1作为一个数据段, 记为Di,i+1;应用公式1计算数据段Di,i+1的持续时长ti,i+1秒,应用公式2计算数据段Di,i+1的 平均速度vi,i+1米/秒;

ti,i+1=Ti+1-Ti       公式1

vi,i+1=di,i+1/ti,i+1      公式2

其中,di,i+1为相邻两点Di和Di+1间的首尾距离,Ti和Ti+1分别为Di和Di+1的数据记录 时刻;

步骤二、判断数据段的状态

根据每一数据段Di,i+1的平均速度vi,i+1判断Di,i+1的状态,记为Dtypei,i+1,设定速度阈值 Vthresh为步行速度的下限0.6米/秒,若vi,i+1大于Vthresh,则判断Di,i+1为运动状态,记Dtypei,i+1=1; 若vi,i+1小于Vthresh,则判断Di,i+1为静止状态,记Dtypei,i+1=0;

步骤三、合并相邻同状态的数据段

判断任意相邻数据段Di-1,i与Di,i+1的状态Dtypei-1,i与Dtypei,i+1是否相等,若相等则将Di-1,i与Di,i+1合并为一个数据段Di-1,i+1,记合并后的新状态为Dtype i-1,i+1,且Dtype i-1,i+1=Dtype i-1,i= Dtypei,i+1,应用此方法将所有相邻同状态的数据段合并,直至所有相邻数据段的状态均不相 同,即为静止状态和运动状态交替出现,将此时每一个合并后得到的最终的数据段Dm,n叫做 状态段Km,n,其中m、n为任意数据段的两数据端点的标号,应用公式3和公式4分别计算 状态段Km,n的持续时长tm,n秒和首尾距离dm,n米:

tm,n=Tn-Tm公式3

其中,Tn和Tm分别为数据点Dn和Dm的记录时刻;

dm,n=Σdi,i+1i=m,m+1,...,n-1,n公式4

其中,di,i+1为相邻两点Di和Di+1间的首尾距离;

步骤四、调整状态段Km,n的状态

分别设定持续时长阈值Tthresh为27秒—30秒和距离阈值Dthresh为250米—300米,将 Dtypem,n=0即静止状态段Km,n的持续时长tm,n与Tthresh相比较;将Dtypem,n=1即运动状态段 Km,n的首尾距离dm,n与Dthresh相比较;

若静止状态段Km,n的持续时长tm,n小于Tthresh,或运动状态段Km,n的首尾距离dm,n小于 Dthresh,则将此状态段Km,n的状态Dtypem,n转化为相反状态,即若原来是Dtypem,n=0则改为 Dtypem,n=1,若原来是Dtypem,n=1则改为Dtypem,n=0;

若静止状态段Km,n的持续时长tm,n大于或等于Tthresh,或运动状态段Km,n的首尾距离dm,n大于或等于Dthresh,则状态段Km,n的状态值保持不变;

经过步骤四的调整后,相邻状态段Km,n的状态Dtypem,n有可能出现相同的情况,因此需 重复步骤三,对步骤四所得结果中具有相同状态的相邻状态段Km,n进行合并,最终得到静止 状态和运动状态相互交替的状态段;

第二阶段、识别活动

设定停留时长阈值Sthresh为420秒—540秒,将时长tm,n大于Sthresh的静止状态段Km,n识 别为活动,记为Am,n,Am,n等同于数据点Dm和Dn之间所有数据点构成的点集[Dm,Dn],并 应用公式4计算活动Am,n的持续时长tm,n

第三阶段、识别出行

识别活动后,连接两相邻活动间的点即组成了出行,记为Cn,j,Cn,j等同于数据点Dn和 Dj之间所有数据点构成的点集[Dn,Dj];

第四阶段、识别短时活动

对于以上识别结果中持续时长大于或等于20分钟的所有活动,若其中任意相邻两个活 动间不包含持续时长小于20分钟的活动,则上述识别结果不变;若其中任意相邻两个活动 间包含持续时长小于20分钟的活动,则对这两个相邻活动间的所有出行和活动进行重新识 别:应用第二阶段的方法识别活动,但将停留时长阈值Sthresh改为180秒—240秒,所识别出 的活动叫做短时活动,记为ADk,i,ADk,i等同于数据点Dk和Di之间所有数据点构成的点集[Dk, Di];之后再应用第三阶段的方法识别出行,至此完成所有出行、活动和短时活动的识别;

所识别出的任一出行Cn,j、活动Am,n、短时活动ADk,i,其两端数据点的经纬度坐标即分 别为出行、活动和短时活动的开始点和终止点的经纬度坐标,其两端数据点的数据采集时间 即分别为出行、活动和短时活动的开始和终止的时间。

与现有技术相比,本发明的有益效果是:

1、本发明所述的一种应用GPS出行调查数据识别出行和活动的方法,可以识别出调查 数据记录的所有出行和活动,尤其是可以识别出短时活动,从而解决在纸质出行调查中的被 调查者漏报短时活动的问题;

2、本发明所述的一种应用GPS出行调查数据识别出行和活动的方法,应用大样本量GPS 出行数据进行识别方法的精度计算,而且计算结果显示该方法对活动和出行的识别精度高。

附图说明

图1是本发明的基于GPS数据的出行和活动的总体识别流程图;

图2是本发明的数据段的状态示意图;

图3是本发明的状态段Km,n的状态判别方法示意图,其中:

(a)静止状态段Km,n的状态判别过程图;

(b)运动状态段Km,n的状态判别过程图;

图4是本发明的状态段划分示例图;

图5是本发明的出行和活动示意图;

图6是本发明的包含短时活动的出行和活动示意图;

图7是本发明的出行和活动识别结果示例图。

具体实施方式

下面结合附图进一步说明本发明的详细内容及其具体实施方式:

一、定义和数据格式

1.出行:个人为了某一目的从一个地点到另一地点的移动过程。

2.活动和短时活动:活动指个人在出行目的地进行的持续一段时间的行为。而短时活动 指持续时间在7分钟之内的活动。

3.数据点:由GPS设备采集到并记录的每一个出行位置点。

4.GPS出行调查数据的数据格式:参阅表1,本发明专利选取GPS出行数据中以下数据 项:序号、日期、记录时刻、经度、纬度、高度、首尾距离、瞬时速度、水平定位误差和卫 星数,共11项数据。表1为GPS设备采集到的其中4个示例数据点的数据。

表1 GPS出行调查数据示例

二、数据的初步处理

1、将记录时刻由世界协调时间转换为北京时间

GPS出行数据中的记录时刻是以世界协调时间(UTC)的形式记录的,比北京时间慢8 小时,为方便后面的对比分析,将记录时刻减去8小时,由世界协调时间转换为北京时间。

2、数据过滤

设定数据过滤条件:(1)GPS记录日期与填报日期相符;(2)卫星数≥3个;(3)水平 定位误差≤100米;(4)瞬时速度≤55.56米/秒;(5)数据点所记录的经度、纬度和高度在数 据调查的实际区域范围内。应用这5项过滤条件进行数据过滤,去掉不合格数据。

三、识别方法和步骤

参阅图1,本发明专利所述的一种应用GPS出行调查数据识别出行和活动的方法由四个 阶段组成,下面对具体识别步骤做详细论述:

第一阶段:划分状态段

步骤一、将数据点转化为数据段

将数据中任一个数据点记为Di,其相邻的数据点记为Di+1,将Di、Di+1作为一个数据段, 记为Di,i+1。应用公式1计算数据段Di,i+1的持续时长ti,i+1秒,应用公式2计算数据段Di,i+1的 平均速度vi,i+1米/秒。表2为转化后的数据段形式的GPS记录示例。

表2数据段形式的GPS记录示例

步骤二、判断数据段的状态

根据每一数据段Di,i+1的平均速度vi,i+1判断Di,i+1的状态,记为Dtype i,i+1,设定速度阈值 Vthresh为步行速度的下限0.6米/秒。根据《城市道路交通规划设计规范》,步行速度下限采用 步行速度实际调查数据的累积频率分布曲线中的第15百分位数值—0.6米/秒。若vi,i+1大于 Vthresh,则判断Di,i+1为运动状态,记Dtype i,i+1=1;若vi,i+1小于Vthresh,则判断Di,i+1为静止状 态,记Dtype i,i+1=0,参阅图2。

步骤三、合并相邻同状态的数据段

参阅图2,判断任意相邻数据段Di-1,i与Di,i+1的状态Dtypei-1,i与Dtypei,i+1是否相等,若 相等则将Di-1,i与Di,i+1合并为一个数据段Di-1,i+1,记合并后的新状态为Dtypei-1,i+1,且 Dtypei-1,i+1=Dtypei-1,i=Dtypei,i+1,应用此方法将所有相邻同状态的数据段合并,直至所有相邻 数据段的状态均不相同,即为静止状态和运动状态交替出现,将此时每一个合并后得到的最 终的数据段Dm,n叫做状态段Km,n,其中m、n为任意数据段的两数据端点的标号,应用公式 3和公式4分别计算状态段Km,n的持续时长tm,n秒和首尾距离dm,n米。经过步骤三后的数据 示例见表3。

表3状态段形式的GPS记录示例

步骤四、调整状态段Km,n的状态

分别设定持续时长阈值Tthresh为27秒—30秒和距离阈值Dthresh为250米—300米。其中, 具体阈值的确定可分别在此阈值范围内,根据实际调查数据中状态段持续时长和距离的累积 频率最高的值(即最接近实际的值)而确定。将静止的状态段Km,n(Dtypem,n=0)的持续时 长tm,n(秒)与Tthresh相比较;将运动的状态段Km,n(Dtype m,n=1)的首尾距离dm,n(米)与Dthresh相比较。

参阅图3(a)和(b),若静止状态段Km,n的持续时长tm,n小于Tthresh,或运动状态段Km,n的首尾距离dm,n小于Dthresh,则将此状态段Km,n的状态Dtypem,n转化为其相反状态(若原来 是Dtypem,n=0则改为Dtypem,n=1;若原来是Dtypem,n=1则改为Dtypem,n=0)。

参阅图3(a)和(b),若静止状态段Km,n的持续时长tm,n大于或等于Tthresh,或运动状 态段Km,n的首尾距离dm,n大于或等于Dthresh,则状态段Km,n的状态值保持不变。

经过步骤四的调整后,相邻状态段Km,n的状态Dtypem,n有可能出现相同的情况,因此需 重复步骤三,对步骤四所得结果中具有相同状态的相邻状态段Km,n进行合并,最终得到静止 状态和运动状态相互交替的状态段。参阅图4,为经过步骤二、步骤三和步骤四,最终得到 的静止状态和运动状态相互交替的状态段示例。

第二阶段:识别活动

参阅图5,设定停留时长阈值Sthresh为420秒—540秒。该停留时长阈值Sthresh具体值的 确定可在此阈值范围内,统计实际调查数据中活动停留时长的累积频率最高的值(即最接近 实际的值)而最终确定。将时长tm,n大于Sthresh的静止状态段Km,n(DTypem,n=0)识别为活动, 记为Am,n。Am,n等同于数据点Dm和Dn之间所有数据点构成的点集[Dm,Dn],并应用公式4 计算活动Am,n的持续时长tm,n

第三阶段:识别出行

参阅图5,识别活动后,连接两相邻活动间的点即组成了出行,记为Cn,j,Cn,j等同于数 据点Dn和Dj之间所有数据点构成的点集[Dn,Dj]。

第四阶段:识别短时活动

对于以上识别结果中持续时长大于或等于20分钟的所有活动,若其中任意相邻两个活 动Am,n、Aj,k间不包含持续时长小于20分钟的活动,则上述识别结果不变;若其中任意相邻 两个活动Am,n、Aj,k间包含持续时长小于20分钟的活动,则对这两个相邻活动Am,n和Aj,k间 的所有出行及活动进行重新识别。其中短时活动的持续时长阈值20分钟根据统计和对比实 际调查数据中短时和长时活动的持续时长及查阅相关资料确定。

参阅图6,应用第二阶段的方法识别活动,但将停留时长阈值Sthresh改为180秒—240秒。 该短时活动的停留时长阈值的确定可在此阈值范围内,统计实际调查数据中短时活动停留时 长的累积频率最高的值(即最接近实际的值)而最终确定。所识别出的活动叫做短时活动, 记为ADk,i,例如图6中的ADn+2,i。然后再应用第三阶段的方法识别出行。至此完成所有活 动、短时活动和出行的识别。

所识别出的任一出行Cn,j、活动Am,n、短时活动ADk,i,其两端数据点的经纬度坐标即分 别为出行、活动和短时活动的开始点和终止点的经纬度坐标,其两端数据点的数据采集时间 即分别为出行、活动和短时活动的开始和终止的时间。

例如,图6所示包括两次出行,第一次为Cn,n+2,其起终点分别为数据点Dn和Dn+2,第 二次出行为Ci,j,其起终点分别为数据点Di和Dj。图6所示还包括两次活动,第一次活动为 Am,n,其起终点分别为数据点Dm和Dn,第二次活动为Aj,k,其起终点分别为数据点Dj和Dk。 图6所示还包括一次短时活动ADn+2,i,其起终点分别为数据点Dn+2和Di

四、实施例

本发明所述的一种应用GPS出行调查数据识别出行和活动的方法的实施例,给出实施过 程和检验结果,但本发明的保护范围不限于下述的实施例。

1、识别结果

本发明专利应用北京市2010年的GPS居民出行调查数据进行实例分析,此次调查共采 集了900名被调查者的GPS出行数据,样本量较大。另外,本次调查还请被调查者对携带 GPS设备当天的出行记录进行了手工填报,这些手工填报的出行记录将用于核查识别结果的 精度。应用本发明专利所述的一种应用GPS出行调查数据识别出行和活动的方法,对其出行 和活动信息进行识别。

参阅图7,可知识别得出的其中一名被调查者一天的出行和活动。此被调查者一天中有 3次出行,1次短时活动和1次活动。其中第一次出行的起点为家,终点为短时活动地点; 第二次出行起点为短时活动地点,终点为活动地点;第三次出行起点为活动地点,终点为家。 识别中得出以下数据:家、活动地点和短时活动地点的经纬度坐标、活动和短时活动的开始 和结束时间、3次出行的出发时间和到达目的地时间、3次出行的出行轨迹。

2、识别精度计算

将识别结果与被调查者手工填报的实际出行记录数据做对比,从活动识别精度和出行识 别精度两个方面综合计算识别结果的精度。

(1)活动识别精度

应用公式5计算活动次数查准率,具体指识别出的活动次数中实际活动次数所占比例。

应用公式6计算活动持续时间相对误差,指识别出的活动持续时间与实际发生的活动持 续时间的相对误差。

(2)出行识别精度

应用公式7计算出行次数查准率,指识别出的出行次数中实际发生的出行次数所占比例。

3、识别结果评价

在活动识别精度方面,活动次数查准率为92.68%;活动持续时间相对误差的最大值为 9.71%,最小值为0.00%,均值为5.4%。在出行评价方面,出行次数查准率为91.93%。识别 精度计算结果表明,识别结果与调查结果高度吻合,说明本发明专利在应用大样本量数据进 行识别步骤和参数设计的基础上,获得了较高的识别精度。

另外,与被调查者填报的出行信息相比,应用本发明专利提出的识别方法所得的7分钟 以内的短时活动明显增多。说明本发明专利提出一种应用GPS出行调查数据识别出行和活动 的方法可以在一定程度上解决传统出行数据获取方法以及现有基于GPS数据的出行识别技 术存在的对于短时活动的漏报问题。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号