法律状态公告日
法律状态信息
法律状态
2018-11-13
授权
授权
2017-01-04
实质审查的生效 IPC(主分类):G01C21/34 申请日:20160810
实质审查的生效
2016-12-07
公开
公开
技术领域
本发明属于交通规划与管理方法技术领域,涉及一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法。
背景技术
各种交通方式的出行比例、公共交通分担率等,一直是交通规划与交通管理部门所关注的重要数据。在交通分析中,常用的交通信息采集手段包括线圈、微波、视频等。不同的信息采集手段都有其优势与使用范围。
由于线圈、微波、视频等交通采集手段的使用空间范围较小,无法对人们出行行为进行持续且有效的追踪,更难以获取人们出行的OD信息。这些交通信息采集设备一般成本较高,由于成本与使用范围的限制,无法对整个城市进行大范围的覆盖。
目前,随着手机的普及,手机用户量庞大。运营商为了提供优质的通信服务,通过增加基站建设的投入,使得手机信号覆盖范围更广。手机号同时又是用户身份标识,易于区分用户,因此手机信令数据很适合用于分析人们出行的行为,从而优化城市的交通规划与管理。
目前,已有使用手机信令数据分析判断用户出行方式的专利。《基于手机信令数据的居民出行方式综合判别方法》通过分析出行子链的平均速度、出行时长、出行距离以及与GIS线网匹配的方法识别用户的出行方式。其缺点在于并未给出用户出行子链的平均速度、出行距离以及出行路径的获取方法。且基于手机信令数据利用现有的路径匹配方法无法获取用户准确的出行路径,则无法获取用户出行子链的出行路程以及平均速度,进而不能准确的识别用户的出行方式。针对以上问题本发明提出一种基于手机信令数据和导航路线数据的手机用户出行方式识别的方法。其能够简单且有效的分析出用户真实的出行路径,进而获取出行路程以及识别用户的出行方式。导航路线是指百度地图、搜狗地图、谷歌地图等为用户规划的以不同出行方式从某一位置到另一位置的出行路径。导航路线数据为导航路线包含的各种信息(如路程、预计花费时长等),此类数据能通过相应的地图开放API接口获取。
发明内容
有鉴于此,本发明的目的在于提供一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法,该方法具有准确度高、使用方便的优点。
为达到上述目的,本发明提供如下技术方案:
一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法,该方法包括以下步骤:
S1:获取某手机用户一段时间内的手机信令数据,并对手机信令数据按时间先后顺序排序,形成手机用户出行轨迹序列;
S2:根据驻留点将用户出行轨迹序列切割为多个有效出行段:按照停留时间,识别出此手机用户出行轨迹序列中的驻留点,根据驻留点将出行轨迹序列切割为各有效出行段,其中驻留点为手机用户停留时长超过一定阈值的单个基站或相邻的多个基站;
S3:根据用户出行直线距离以及直线移动速度对其出行方式进行初步判断;
S4:根据步骤S3的判别结果,提取对应的导航路线数据;
S5:利用基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)分析得到各导航路线与用户此有效出行段的基站序列的匹配度,取匹配度最大的导航路线为用户此有效出行段的出行路线,且此导航路线对应的交通方式为用户的出行方式。
进一步,所述步骤S3具体包括:获取某有效出行段P的起点和终点,计算起点与终点之间的直线距离Lp;获取用户通过P所花费的时长Tp,计算用户直线移动速度Vp=Lp/Tp;根据用户直线移动速度Vp,对出行方式进行初次判别,判别为高速出行方式和低速出行方式,其中高速出行方式包括公共交通与私人机动车,公共交通包括公交车与轨道交通,低速出行方式包括自行车与步行。
进一步,所述步骤S4具体包括:若为高速出行方式,则提取出以驾车和公共交通的出行方式(公共交通包括公交车与轨道交通)从有效出行段P的起点到终点的导航路线;若为低速出行方式,则提取以各种交通方式(交通方式包括驾车、公共交通、自行车和步行,其中公共交通包括公交车与轨道交通)从有效出行段P的起点到终点的导航路线;设获取到的导航路线集合为G={g1,g2,g3,…,gi,…,gn},gi表示第i个导航路线;其中导航路线数据包含从起点到终点所需要经过的道路沿线的经纬度坐标点L={l1,l2,l3,…,li,…,ln},li表示第i个导航路线gi对应的经纬度坐标数据集、路程S={s1,s2,s3,…,si,…,sn},S表示路程集合,si表示第i个导航路线gi对应的从有效出行段P的起点到终点的路程、交通方式Y={y1,y2,y3,…yi,…yn},Y表示交通方式集合,yi表示gi对应的交通方式,以及花费时长D={d1,d2,d3,…di,…,dn},D表示花费时长集合,di表示gi对应的花费时长。
进一步,所述步骤S5具体包括:
S51:设有效出行段P的基站坐标集合为B,使用基于密度的聚类算法DBSCAN对li中的经纬度坐标点和B中的基站坐标点进行聚类;设聚类算法搜索领域半径为Eps,最小包含点数为minPts;各聚类对象之间的距离为经纬度坐标点之间的距离;聚类得到m个坐标点的簇C={c1,c2,c3,…,ct,…,cm},C为簇的集合,ci为第i个簇;
S52:获取C中含有li坐标点的簇CL={ci,cj,……,ck},其中CL包含于C,i、j、k小于m,统计CL各簇中B坐标点的个数Nli;设B中坐标点的个数为Nb,计算Nli与Nb的比率rli,rli=Nli/Nb;由此得到各导航路线与用户此有效出行段的基站序列的匹配度R={rl1,rl2,rl3,…,rli,…rln};
S53:比较各导航路线的匹配度,若R中存在唯一的最大值,则取匹配度最大的导航路线grmax为用户此有效出行段P所走路线,且其出行路线为grmax对应的出行方式yrmax,路程为srmax;若R中存在多个最大值,则转到步骤S54;
S54:将匹配度最大的导航路线视为观察路线,则观察路线集合Gd={gd1,gd2,gd3,…,gdi,…gds},Gd包含于G,ds≤n,对于某些路段可采用多种交通方式,所以存在交通方式不同但路线相同的导航路线;获取Gd中gdi花费时长ddi以及用户此有效出行段P实际花费时长Tp,计算Tp与ddi的差值todi,todi=Tp-ddi;则TO={tod1,tod2,tod3,…todi,…tods},比较TO中各值,确定todi最小的导航线路为用户所走线路gtomin,用户所采用的出行方式为ytomin,出行路程为stomin。
本发明的有益效果在于:与现有技术相比,本发明提供的方法具有实现简单,识别准确率高,使用方便的优点。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明方法的流程示意图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
图1为本发明方法的流程示意图,如图所示,本发明提供的基于手机信令数据和导航路线数据的手机用户出行方式识别方法包括以下步骤:
S1:获取某手机用户一段时间内的手机信令数据,并对手机信令数据按时间先后顺序排序,形成手机用户出行轨迹序列;
S2:根据驻留点将用户出行轨迹序列切割为多个有效出行段:按照停留时间,识别出此手机用户出行轨迹序列中的驻留点,根据驻留点将出行轨迹序列切割为各有效出行段,其中驻留点为手机用户停留时长超过一定阈值的单个基站或相邻的多个基站;
S3:根据用户出行直线距离以及直线移动速度对其出行方式进行初步判断;
S4:根据步骤S3的判别结果,提取对应的导航路线数据;
S5:利用基于密度的聚类算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)分析得到各导航路线与用户此有效出行段的基站序列的匹配度,取匹配度最大的导航路线为用户此有效出行段的出行路线,且此导航路线对应的交通方式为用户的出行方式。
其中,在本实施例中,步骤S3具体包括:获取某有效出行段P的起点和终点,计算起点与终点之间的直线距离Lp;获取用户通过P所花费的时长Tp,计算用户直线移动速度Vp=Lp/Tp;根据用户直线移动速度Vp,对出行方式进行初次判别,判别为高速出行方式和低速出行方式,其中高速出行方式包括公共交通与私人机动车,公共交通包括公交车与轨道交通,低速出行方式包括自行车与步行。
步骤S4具体包括:若为高速出行方式,则提取出以驾车和公共交通的出行方式(公共交通包括公交车与轨道交通)从有效出行段P的起点到终点的导航路线;若为低速出行方式,则提取以各种交通方式(交通方式包括驾车、公共交通、自行车和步行,其中公共交通包括公交车与轨道交通)从有效出行段P的起点到终点的导航路线;设获取到的导航路线集合为G={g1,g2,g3,…,gi,…,gn},gi表示第i个导航路线;其中导航路线数据包含从起点到终点所需要经过的道路沿线的经纬度坐标点L={l1,l2,l3,…,li,…,ln},li表示第i个导航路线gi对应的经纬度坐标数据集、路程S={s1,s2,s3,…,si,…,sn},S表示路程集合,si表示第i个导航路线gi对应的从有效出行段P的起点到终点的路程、交通方式Y={y1,y2,y3,…yi,…yn},Y表示交通方式集合,yi表示gi对应的交通方式,以及花费时长D={d1,d2,d3,…di,…,dn},D表示花费时长集合,di表示gi对应的花费时长。
步骤S5具体包括:
S51:设有效出行段P的基站坐标集合为B,使用基于密度的聚类算法DBSCAN对li中的经纬度坐标点和B中的基站坐标点进行聚类;设聚类算法搜索领域半径为Eps,最小包含点数为minPts;各聚类对象之间的距离为经纬度坐标点之间的距离;聚类得到m个坐标点的簇C={c1,c2,c3,…,ct,…,cm},C为簇的集合,ci为第i个簇;
S52:获取C中含有li坐标点的簇CL={ci,cj,……,ck},其中CL包含于C,i、j、k小于m,统计CL各簇中B坐标点的个数Nli;设B中坐标点的个数为Nb,计算Nli与Nb的比率rli,rli=Nli/Nb;由此得到各导航路线与用户此有效出行段的基站序列的匹配度R={rl1,rl2,rl3,…,rli,…rln};
S53:比较各导航路线的匹配度,若R中存在唯一的最大值,则取匹配度最大的导航路线grmax为用户此有效出行段P所走路线,且其出行路线为grmax对应的出行方式yrmax,路程为srmax;若R中存在多个最大值,则转到步骤S54;
S54:将匹配度最大的导航路线视为观察路线,则观察路线集合Gd={gd1,gd2,gd3,…,gdi,…gds},Gd包含于G,ds≤n,对于某些路段可采用多种交通方式,所以存在交通方式不同但路线相同的导航路线;获取Gd中gdi花费时长ddi以及用户此有效出行段P实际花费时长Tp,计算Tp与ddi的差值todi,todi=Tp-ddi;则TO={tod1,tod2,tod3,…todi,…tods},比较TO中各值,确定todi最小的导航线路为用户所走线路gtomin,用户所采用的出行方式为ytomin,出行路程为stomin。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
机译: 记录有包含导航数据的数据的记录介质,用于根据导航数据再现数据的方法和设备,用于将包含导航数据的数据记录在记录介质上的方法和设备以及用于经由记录介质传输数据的系统基于导航数据的通讯路线
机译: 记录有包含导航数据的数据的记录介质,用于根据导航数据再现数据的方法和设备,用于将包含导航数据的数据记录在记录介质上的方法和设备以及用于经由记录介质传输数据的系统基于导航数据的通讯路线
机译: 记录有包含导航数据的数据的记录介质,用于根据导航数据再现数据的方法和设备,用于将包含导航数据的数据记录在记录介质上的方法和设备以及用于经由记录介质传输数据的系统基于导航数据的通讯路线