首页> 中国专利> 一种应用GPS出行调查数据识别出行和活动的方法

一种应用GPS出行调查数据识别出行和活动的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种应用GPS出行调查数据识别出行和活动的方法。具体的识别方法分为四个阶段，即第一阶段、划分状态段，第二阶段、识别活动，第三阶段、识别出行，第四阶段、识别短时活动。其中第一阶段又分为四个步骤，即步骤一、将数据点转化为数据段，步骤二、判断数据段的状态，步骤三、合并相邻同状态的数据段，步骤四、调整状态段的状态。应用本发明所述的识别方法可以基于GPS出行调查数据进行出行和活动信息识别，从而实现对所有出行、活动以及活动时间在7分钟以内的短时活动的识别，且识别精度高。

著录项

公开/公告号CN104504245A

专利类型发明专利
公开/公告日2015-04-08

原文格式PDF
申请/专利权人吉林大学;
展开▼

申请/专利号CN201410736368.4
发明设计人宗芳;张慧永;王潇;郑雨婷;白玉;袁义欣;何亚楠;
展开▼

申请日2014-12-04
分类号G06F19/00;G08G1/01;
代理机构长春吉大专利代理有限责任公司;
代理人朱世林
地址 130012 吉林省长春市前进大街2699号
入库时间 2023-12-17 04:53:00

法律信息

法律状态公告日

法律状态信息

法律状态
2022-11-11

未缴年费专利权终止 IPC(主分类):G06F19/00 专利号:ZL2014107363684 申请日:20141204 授权公告日:20170329

专利权的终止
2017-03-29

授权

授权
2015-05-06

实质审查的生效 IPC(主分类):G06F19/00 申请日:20141204

实质审查的生效
2015-04-08

公开

公开

说明书

技术领域

本发明涉及居民出行调查和数据处理分析领域，涉及一种基于GPS(全球卫星定位)技术的出行调查数据进行出行和活动识别的方法。

背景技术

居民出行调查是城市交通规划和管理工作的基础，其获取的出行数据可应用于交通问题诊断、公交系统规划以及交通管理政策制定等方方面面。随着GPS技术的日益广泛应用，基于GPS技术的出行调查成为获取出行数据的新途径。与传统的问卷调查方法相比，基于GPS 设备的出行调查具有调查效率高、数据精度高、信息量大等优点，将逐步取代传统的问卷调查方法成为今后出行调查的主流方法。然而，GPS设备记录的是被调查者在不同时间点的经纬度点、瞬时速度等数据，而不是可直接应用于交通规划和管理实际的出行起终点、活动开始时间、出行目的、出行方式等信息，因此需要将GPS调查数据转化为出行和活动信息。而出行和活动的识别是将GPS调查数据转化为出行和活动信息的首要和关键环节，其主要任务是将GPS调查得到的一天的出行轨迹数据点划分成一天中的所有出行和活动。

在以往研究中，一些学者提出了应用浮动车或出租车进行GPS出行调查和出行信息识别的方法，例如发明专利201210169897.1、200810038365.8和201210269040.7，但这些方法所调查的出行信息局限于车辆出行信息，不能涵盖采取步行、公交等交通方式出行的居民出行信息，无法应用于全方式的居民出行调查和出行信息识别。发明专利201210223939.5和 201410033560.7提出基于GPS调查数据的交通方式识别方法，没有进行出行和活动的识别。而目前应用GPS设备或者手机定位软件进行的出行调查和出行信息识别研究中，例如发明专利201210074506.8和201220505300.1、论文〔1〕用于交通出行调查的GPS时空轨迹数据简化与语义增强研究.上海：华东师范大学硕士学位论文，2011；〔2〕交通运输系统工程与信息，2010，10(2)：178-183；〔3〕Transportation Research Part A,2007,41(3):220-232等学术期刊，均存在忽略短时活动识别的问题，而导致活动和出行的识别结果不全，同时多数研究出行调查样本量小，模型的有效性和精度无法得到很好的验证。

基于上述背景可见，亟需设计一种新型的基于GPS数据的出行和活动识别方法，以实现短时活动的识别，同时应用较大样本量的调查数据进行数据的统计分析、参数设计和模型验证，以提高识别精度和识别方法的广泛适用性。经查找，设计短时活动识别步骤，并且在大样本量数据验证下开发出的高精度识别方法在国内外未见有相关报道。

发明内容

为了克服现有研究存在的无法识别短时活动、调查样本量小等缺点，本发明提供一种应用GPS出行调查数据识别出行和活动的方法，该方法应用GPS出行调查数据，设计了包括四个阶段的识别方法，以实现对包括短时活动的一天中所有出行和活动的整体识别，并应用大样本GPS出行数据进行识别方法的精度计算。

本发明是采用如下技术方案实现的，结合附图说明如下：

1、一种应用GPS出行调查数据识别出行和活动的方法，主要包括如下步骤：

第一阶段、划分状态段

步骤一、将数据点转化为数据段

将数据中任一个数据点记为D_i，其相邻的数据点记为D_i+1，将D_i、D_i+1作为一个数据段，记为D_i,i+1；应用公式1计算数据段D_i,i+1的持续时长t_i,i+1秒，应用公式2计算数据段D_i,i+1的平均速度v_i,i+1米/秒；

t_i,i+1＝T_i+1-T_i 公式1

v_i,i+1＝d_i,i+1/t_i,i+1 公式2

其中，d_i,i+1为相邻两点D_i和D_i+1间的首尾距离，T_i和T_i+1分别为D_i和D_i+1的数据记录时刻；

步骤二、判断数据段的状态

根据每一数据段D_i,i+1的平均速度v_i,i+1判断D_i,i+1的状态，记为Dtype_i,i+1，设定速度阈值 V_thresh为步行速度的下限0.6米/秒，若v_i,i+1大于V_thresh，则判断D_i,i+1为运动状态，记Dtype_i,i+1＝1；若v_i,i+1小于V_thresh，则判断D_i,i+1为静止状态，记Dtype_i,i+1＝0；

步骤三、合并相邻同状态的数据段

判断任意相邻数据段D_i-1,i与D_i,i+1的状态Dtype_i-1,i与Dtype_i,i+1是否相等，若相等则将D_i-1,i与D_i,i+1合并为一个数据段D_i-1,i+1，记合并后的新状态为Dtype _i-1,i+1，且Dtype _i-1,i+1＝Dtype _i-1,i＝ Dtype_i,i+1，应用此方法将所有相邻同状态的数据段合并，直至所有相邻数据段的状态均不相同，即为静止状态和运动状态交替出现，将此时每一个合并后得到的最终的数据段D_m,n叫做状态段K_m,n，其中m、n为任意数据段的两数据端点的标号，应用公式3和公式4分别计算状态段K_m,n的持续时长t_m,n秒和首尾距离d_m,n米：

t_m,n＝T_n-T_m公式3

其中，T_n和T_m分别为数据点D_n和D_m的记录时刻；

$d_{m, n} = \underset{i = m, m + 1, . . ., n - 1, n}{Σ d_{i, i + 1}}$ 公式4

其中，d_i,i+1为相邻两点D_i和D_i+1间的首尾距离；

步骤四、调整状态段K_m,n的状态

分别设定持续时长阈值T_thresh为27秒—30秒和距离阈值D_thresh为250米—300米，将 Dtype_m,n＝0即静止状态段K_m,n的持续时长t_m,n与T_thresh相比较；将Dtype_m,n＝1即运动状态段 K_m,n的首尾距离d_m,n与D_thresh相比较；

若静止状态段K_m,n的持续时长t_m,n小于T_thresh，或运动状态段K_m,n的首尾距离d_m,n小于 D_thresh，则将此状态段K_m,n的状态Dtype_m,n转化为相反状态，即若原来是Dtype_m,n＝0则改为 Dtype_m,n＝1，若原来是Dtype_m,n＝1则改为Dtype_m,n＝0；

若静止状态段K_m,n的持续时长t_m,n大于或等于T_thresh，或运动状态段K_m,n的首尾距离d_m,n大于或等于D_thresh，则状态段K_m,n的状态值保持不变；

经过步骤四的调整后，相邻状态段K_m,n的状态Dtype_m,n有可能出现相同的情况，因此需重复步骤三，对步骤四所得结果中具有相同状态的相邻状态段K_m,n进行合并，最终得到静止状态和运动状态相互交替的状态段；

第二阶段、识别活动

设定停留时长阈值S_thresh为420秒—540秒，将时长t_m,n大于S_thresh的静止状态段K_m,n识别为活动，记为A_m,n，A_m,n等同于数据点D_m和D_n之间所有数据点构成的点集[D_m,D_n]，并应用公式4计算活动A_m,n的持续时长t_m,n；

第三阶段、识别出行

识别活动后，连接两相邻活动间的点即组成了出行，记为C_n,j，C_n,j等同于数据点D_n和 D_j之间所有数据点构成的点集[D_n,D_j]；

第四阶段、识别短时活动

对于以上识别结果中持续时长大于或等于20分钟的所有活动，若其中任意相邻两个活动间不包含持续时长小于20分钟的活动，则上述识别结果不变；若其中任意相邻两个活动间包含持续时长小于20分钟的活动，则对这两个相邻活动间的所有出行和活动进行重新识别：应用第二阶段的方法识别活动，但将停留时长阈值S_thresh改为180秒—240秒，所识别出的活动叫做短时活动，记为AD_k,i，AD_k,i等同于数据点D_k和D_i之间所有数据点构成的点集[D_k, D_i]；之后再应用第三阶段的方法识别出行，至此完成所有出行、活动和短时活动的识别；

所识别出的任一出行C_n,j、活动A_m,n、短时活动AD_k,i，其两端数据点的经纬度坐标即分别为出行、活动和短时活动的开始点和终止点的经纬度坐标，其两端数据点的数据采集时间即分别为出行、活动和短时活动的开始和终止的时间。

与现有技术相比，本发明的有益效果是：

1、本发明所述的一种应用GPS出行调查数据识别出行和活动的方法，可以识别出调查数据记录的所有出行和活动，尤其是可以识别出短时活动，从而解决在纸质出行调查中的被调查者漏报短时活动的问题；

2、本发明所述的一种应用GPS出行调查数据识别出行和活动的方法，应用大样本量GPS 出行数据进行识别方法的精度计算，而且计算结果显示该方法对活动和出行的识别精度高。

附图说明

图1是本发明的基于GPS数据的出行和活动的总体识别流程图；

图2是本发明的数据段的状态示意图；

图3是本发明的状态段K_m,n的状态判别方法示意图，其中：

(a)静止状态段K_m,n的状态判别过程图；

(b)运动状态段K_m,n的状态判别过程图；

图4是本发明的状态段划分示例图；

图5是本发明的出行和活动示意图；

图6是本发明的包含短时活动的出行和活动示意图；

图7是本发明的出行和活动识别结果示例图。

具体实施方式

下面结合附图进一步说明本发明的详细内容及其具体实施方式：

一、定义和数据格式

1.出行：个人为了某一目的从一个地点到另一地点的移动过程。

2.活动和短时活动：活动指个人在出行目的地进行的持续一段时间的行为。而短时活动指持续时间在7分钟之内的活动。

3.数据点：由GPS设备采集到并记录的每一个出行位置点。

4.GPS出行调查数据的数据格式：参阅表1，本发明专利选取GPS出行数据中以下数据项：序号、日期、记录时刻、经度、纬度、高度、首尾距离、瞬时速度、水平定位误差和卫星数，共11项数据。表1为GPS设备采集到的其中4个示例数据点的数据。

表1 GPS出行调查数据示例

二、数据的初步处理

1、将记录时刻由世界协调时间转换为北京时间

GPS出行数据中的记录时刻是以世界协调时间(UTC)的形式记录的，比北京时间慢8 小时，为方便后面的对比分析，将记录时刻减去8小时，由世界协调时间转换为北京时间。

2、数据过滤

设定数据过滤条件：(1)GPS记录日期与填报日期相符；(2)卫星数≥3个；(3)水平定位误差≤100米；(4)瞬时速度≤55.56米/秒；(5)数据点所记录的经度、纬度和高度在数据调查的实际区域范围内。应用这5项过滤条件进行数据过滤，去掉不合格数据。

三、识别方法和步骤

参阅图1，本发明专利所述的一种应用GPS出行调查数据识别出行和活动的方法由四个阶段组成，下面对具体识别步骤做详细论述：

第一阶段：划分状态段

步骤一、将数据点转化为数据段

将数据中任一个数据点记为D_i，其相邻的数据点记为D_i+1，将D_i、D_i+1作为一个数据段，记为D_i,i+1。应用公式1计算数据段D_i,i+1的持续时长t_i,i+1秒，应用公式2计算数据段D_i,i+1的平均速度v_i,i+1米/秒。表2为转化后的数据段形式的GPS记录示例。

表2数据段形式的GPS记录示例

步骤二、判断数据段的状态

根据每一数据段D_i,i+1的平均速度v_i,i+1判断D_i,i+1的状态，记为Dtype _i,i+1，设定速度阈值 V_thresh为步行速度的下限0.6米/秒。根据《城市道路交通规划设计规范》，步行速度下限采用步行速度实际调查数据的累积频率分布曲线中的第15百分位数值—0.6米/秒。若v_i,i+1大于 V_thresh，则判断D_i,i+1为运动状态，记Dtype _i,i+1＝1；若v_i,i+1小于V_thresh，则判断D_i,i+1为静止状态，记Dtype _i,i+1＝0，参阅图2。

步骤三、合并相邻同状态的数据段

参阅图2，判断任意相邻数据段D_i-1,i与D_i,i+1的状态Dtype_i-1,i与Dtype_i,i+1是否相等，若相等则将D_i-1,i与D_i,i+1合并为一个数据段D_i-1,i+1，记合并后的新状态为Dtype_i-1,i+1，且 Dtype_i-1,i+1＝Dtype_i-1,i＝Dtype_i,i+1，应用此方法将所有相邻同状态的数据段合并，直至所有相邻数据段的状态均不相同，即为静止状态和运动状态交替出现，将此时每一个合并后得到的最终的数据段D_m,n叫做状态段K_m,n，其中m、n为任意数据段的两数据端点的标号，应用公式 3和公式4分别计算状态段K_m,n的持续时长t_m,n秒和首尾距离d_m,n米。经过步骤三后的数据示例见表3。

表3状态段形式的GPS记录示例

步骤四、调整状态段K_m,n的状态

分别设定持续时长阈值T_thresh为27秒—30秒和距离阈值D_thresh为250米—300米。其中，具体阈值的确定可分别在此阈值范围内，根据实际调查数据中状态段持续时长和距离的累积频率最高的值(即最接近实际的值)而确定。将静止的状态段K_m,n(Dtype_m,n＝0)的持续时长t_m,n(秒)与T_thresh相比较；将运动的状态段K_m,n(Dtype _m,n＝1)的首尾距离d_m,n(米)与D_thresh相比较。

参阅图3(a)和(b)，若静止状态段K_m,n的持续时长t_m,n小于T_thresh，或运动状态段K_m,n的首尾距离d_m,n小于D_thresh，则将此状态段K_m,n的状态Dtype_m,n转化为其相反状态(若原来是Dtype_m,n＝0则改为Dtype_m,n＝1；若原来是Dtype_m,n＝1则改为Dtype_m,n＝0)。

参阅图3(a)和(b)，若静止状态段K_m,n的持续时长t_m,n大于或等于T_thresh，或运动状态段K_m,n的首尾距离d_m,n大于或等于D_thresh，则状态段K_m,n的状态值保持不变。

经过步骤四的调整后，相邻状态段K_m,n的状态Dtype_m,n有可能出现相同的情况，因此需重复步骤三，对步骤四所得结果中具有相同状态的相邻状态段K_m,n进行合并，最终得到静止状态和运动状态相互交替的状态段。参阅图4，为经过步骤二、步骤三和步骤四，最终得到的静止状态和运动状态相互交替的状态段示例。

第二阶段：识别活动

参阅图5，设定停留时长阈值S_thresh为420秒—540秒。该停留时长阈值S_thresh具体值的确定可在此阈值范围内，统计实际调查数据中活动停留时长的累积频率最高的值(即最接近实际的值)而最终确定。将时长t_m,n大于S_thresh的静止状态段K_m,n(DType_m,n＝0)识别为活动，记为A_m,n。A_m,n等同于数据点D_m和D_n之间所有数据点构成的点集[D_m,D_n]，并应用公式4 计算活动A_m,n的持续时长t_m,n。

第三阶段：识别出行

参阅图5，识别活动后，连接两相邻活动间的点即组成了出行，记为C_n,j，C_n,j等同于数据点D_n和D_j之间所有数据点构成的点集[D_n,D_j]。

第四阶段：识别短时活动

对于以上识别结果中持续时长大于或等于20分钟的所有活动，若其中任意相邻两个活动A_m,n、A_j,k间不包含持续时长小于20分钟的活动，则上述识别结果不变；若其中任意相邻两个活动A_m,n、A_j,k间包含持续时长小于20分钟的活动，则对这两个相邻活动A_m,n和A_j,k间的所有出行及活动进行重新识别。其中短时活动的持续时长阈值20分钟根据统计和对比实际调查数据中短时和长时活动的持续时长及查阅相关资料确定。

参阅图6，应用第二阶段的方法识别活动，但将停留时长阈值S_thresh改为180秒—240秒。该短时活动的停留时长阈值的确定可在此阈值范围内，统计实际调查数据中短时活动停留时长的累积频率最高的值(即最接近实际的值)而最终确定。所识别出的活动叫做短时活动，记为AD_k,i，例如图6中的AD_n+2,i。然后再应用第三阶段的方法识别出行。至此完成所有活动、短时活动和出行的识别。

例如，图6所示包括两次出行，第一次为C_n,n+2，其起终点分别为数据点D_n和D_n+2，第二次出行为C_i,j，其起终点分别为数据点D_i和D_j。图6所示还包括两次活动，第一次活动为 A_m,n，其起终点分别为数据点D_m和D_n，第二次活动为A_j,k，其起终点分别为数据点D_j和D_k。图6所示还包括一次短时活动AD_n+2,i，其起终点分别为数据点D_n+2和D_i。

四、实施例

本发明所述的一种应用GPS出行调查数据识别出行和活动的方法的实施例，给出实施过程和检验结果，但本发明的保护范围不限于下述的实施例。

1、识别结果

本发明专利应用北京市2010年的GPS居民出行调查数据进行实例分析，此次调查共采集了900名被调查者的GPS出行数据，样本量较大。另外，本次调查还请被调查者对携带 GPS设备当天的出行记录进行了手工填报，这些手工填报的出行记录将用于核查识别结果的精度。应用本发明专利所述的一种应用GPS出行调查数据识别出行和活动的方法，对其出行和活动信息进行识别。

参阅图7，可知识别得出的其中一名被调查者一天的出行和活动。此被调查者一天中有 3次出行，1次短时活动和1次活动。其中第一次出行的起点为家，终点为短时活动地点；第二次出行起点为短时活动地点，终点为活动地点；第三次出行起点为活动地点，终点为家。识别中得出以下数据：家、活动地点和短时活动地点的经纬度坐标、活动和短时活动的开始和结束时间、3次出行的出发时间和到达目的地时间、3次出行的出行轨迹。

2、识别精度计算

将识别结果与被调查者手工填报的实际出行记录数据做对比，从活动识别精度和出行识别精度两个方面综合计算识别结果的精度。

(1)活动识别精度

应用公式5计算活动次数查准率，具体指识别出的活动次数中实际活动次数所占比例。

应用公式6计算活动持续时间相对误差，指识别出的活动持续时间与实际发生的活动持续时间的相对误差。

(2)出行识别精度

应用公式7计算出行次数查准率，指识别出的出行次数中实际发生的出行次数所占比例。

3、识别结果评价

在活动识别精度方面，活动次数查准率为92.68％；活动持续时间相对误差的最大值为 9.71％，最小值为0.00％，均值为5.4％。在出行评价方面，出行次数查准率为91.93％。识别精度计算结果表明，识别结果与调查结果高度吻合，说明本发明专利在应用大样本量数据进行识别步骤和参数设计的基础上，获得了较高的识别精度。

另外，与被调查者填报的出行信息相比，应用本发明专利提出的识别方法所得的7分钟以内的短时活动明显增多。说明本发明专利提出一种应用GPS出行调查数据识别出行和活动的方法可以在一定程度上解决传统出行数据获取方法以及现有基于GPS数据的出行识别技术存在的对于短时活动的漏报问题。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种应用GPS出行调查数据识别出行和活动的方法 [P] . 中国专利： CN104504245B . 2017.03.29
2. 一种应用GPS出行调查数据识别出行和活动的方法 [P] . 中国专利： CN104504245A . 2015-04-08
3. Systems and methods for predicting consumer spending behavior based on historical transaction activity progressions [P] . US11023909B1 . 2021-06-01

机译：根据历史交易活动进展预测消费者支出行为的系统和方法
4. SYSTEMS AND METHODS FOR PREDICTING CONSUMER SPENDING BEHAVIOR BASED ON HISTORICAL TRANSACTION ACTIVITY PROGRESSIONS [P] . US2021241295A1 . 2021-08-05

机译：根据历史交易活动进展预测消费者支出行为的系统和方法
5. MOBİL HABERLEŞME AKTİVİTELERİNİN ANALİZİYLE HAFTASONU SIKÇA SEYAHAT EDEN ABONELERİN TESPİT EDİLMESİ İÇİN BİR YÖNTEM [P] . TR201612550A1 . 2018-03-21

机译：移动通信活动分析：周末频繁出行的订户检测方法