首页> 中国专利> 一种基于深度神经网络的城市区域聚集度预测方法、设备及介质

一种基于深度神经网络的城市区域聚集度预测方法、设备及介质

摘要

本发明公开了一种基于深度神经网络的城市区域聚集度预测方法、设备及介质,其中方法为:从城市的私家车轨迹中提取节假日每个时段的停留数据,所述停留数据包括该时段内所有停留点的位置和停留时长;根据每个时段内所有停留点的位置和停留时长,分别计算该时段内有关停留点的空间概率密度分布和时间概率密度分布;使用节假日连续时段对应构成的空间概率密度分布序列和时间概率密度分布序列分别构建训练集和预测标签集,训练预搭建的神经网络模型,得到聚集度预测模型;使用聚集度预测模型对目标预测时段的聚集度进行滚动预测。本发明适用于节假日期间对城市聚集度进行预测。

著录项

  • 公开/公告号CN112862177A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 湖南大学;

    申请/专利号CN202110142862.8

  • 申请日2021-02-02

  • 分类号G06Q10/04(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构43114 长沙市融智专利事务所(普通合伙);

  • 代理人熊开兰

  • 地址 410082 湖南省长沙市岳麓区麓山南路2号

  • 入库时间 2023-06-19 11:08:20

说明书

技术领域

本发明属于智能交通领域,尤其涉及基于深度神经网络的城市区域聚集度预测方法、设 备及介质。

背景技术

近年来随着城市化的发展,道路汽车的数量不断增加,尤其是私家车,在城市车辆中占 很大比例。根据中国统计局的一份报告显示,截止到2019年,私家车的数量已经超过了2.2 亿辆,占所有车辆的88.68%,越来越多的人选择驾驶私家车来满足自身的日常需求,具体来 说,私家车的驾驶行为具有明确的驾驶路线和目的地,并且在到达目的地后往往会停留一段 时间去完成所需活动。城市内的各个区域在任何时刻都有来自不同地方的私家车前往,这种 停留行为是生成城市区域聚集效应的关键特征,而停留时间的长短也是聚集效应的重要的时 间特征。

对于研究者和决策者来说,理解私家车聚集效应可以提供从基于位置的服务到智能交通 管理的广泛应用,包括交通状况监测、广告和目的地推荐以及城市规划等等。

现有的研究主要关注城市流动性及其与聚集效应的关系。人们普遍认为,私家车在工作 日比在周末更容易预测,因为人们在工作日出行时往往表现出规律性的时空流动模式,这意 味着区域的聚集性以及相关特征变化不大,因此工作日具有很强的相关性和可预测性。然而 在周末,由于人们出行的多样化和随机性,预测私家车在周末的聚集效应更具有挑战性。

现有研究缺少合适的时空建模方法,以及无法预测由于节假日期间人类随机性移动所导 致的聚集效应分布变化,对此,本发明设计了一种基于神经网络框架来预测周末城区私家车 聚集效应的方法。

发明内容

本发明提供一种基于深度神经网络的城市区域聚集度预测方法、设备及介质,适用于节 假日期间对城市聚集度进行预测。

为实现上述技术目的,本发明采用如下技术方案:

一种基于深度神经网络的城市区域聚集度预测方法,包括以下步骤:

步骤1,从城市的私家车轨迹中提取节假日每个时段的停留数据,所述停留数据包括该 时段内所有停留点的位置和停留时长;

步骤2,根据每个时段内所有停留点的位置和停留时长,分别计算该时段内有关停留点 的空间概率密度分布和时间概率密度分布;

步骤3,以T个时段为预测步长,以节假日N+T-1个连续时段对应构成的空间概率密度 分布序列和时间概率密度分布序列作为训练集,以训练集推迟T个时段的N个连续时段对应 构成的空间概率密度分布序列和时间概率密度分布序列作为预测标签集,训练预搭建的神经 网络模型,得到聚集度预测模型;

步骤4,获取目标预测时段之前的连续T个时段有关停留点的空间概率密度分布和时间 概率密度分布,使用聚集度预测模型进行滚动预测,获取得到目标预测时段有关停留点的空 间概率密度分布和时间概率密度分布,即为目标预测时段的聚集度。

在更优的技术方案中,所述训练集还包括预测时段构成的天气数据。

在更优的技术方案中,有关停留点的空间概率密度分布的计算公式为:

式中,p

在更优的技术方案中,采用最大似然估计城市的聚类中心p

式中,Θ和Ψ(p

在更优的技术方案中,有关停留点的时间概率密度分布的计算公式为:

式中,T

在更优的技术方案中,所述神经网络模型包括时空注意机制、LSTM、MLP、级联层、神经算法逻辑单元和全连接层;

所述时空注意机制包括相同数量的时间注意机制和空间注意机制以及融合门,所述时间 注意机制的输入为时间概率密度分布,所述空间注意机制的输入为空间概率密度分布,所述 融合门将相应的时间注意机制输出的时间表征和空间注意机制输出的空间表征进行加权融 合,并输出至LSTM;

所述MLP的输入为天气数据,所述级联层将LSTM和MLP的输出进行级联然后输出至神经算法逻辑单元,进而由全连接层对神经算法逻辑单元的输出数据进行全连接,最终由全 连接层输出预测数据。

在更优的技术方案中,所述全连接层包括两层稠密层和dropout模块,所述dropout模块 的比率取0.5。

一种设备,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器 用于执行所述存储器存储的计算机指令,具体执行上述任一技术方案所述的方法。

一种计算机存储介质,用于存储程序,所述程序被执行时,用于实现上述任一技术方案 所述的方法。

有益效果

1、本发明提出了一种特征提取方法来有效地捕获聚集效应的时空特征,包括使用Log-Cosh损失函数改进了一种核密度估计器用来建模空间特征,使用车辆的停留时间来表征 非线性的时间相关性。

2、本发明设计了时空注意机制来给予时空特征不同的权重从而更好地捕获时空特征,并 加入了节假日天气数据作为外部特征。

3、本发明设计了STANet-NALU框架来泛化模型,通过加入支持数据外推的NALU网络 来增强模型的泛化能力,实现更加准确的城市区域聚集效应预测使其具有数值外推能力来适 应节假日期间城区聚集度的非线性变化。

4、本发明应用在真实的私家车数据实验中,结果验证了本发明的有效性和优越性,为进 一步探索人类流动性提供了一个新的思路。

附图说明

图1是本发明提出的城市区域节假日聚集预测方法的概述。

图2是时空注意力机制结构图。

图3为区域聚集效应建模的可视化结果。

图4是不同的超参数下的神经网络学习率曲线。

图5表示三维的区域聚集度预测结果,(a)、(b)、(c)、(d)、(e)、(f)分别表示真实值、MLR预测值、STARIMA预测值、DCNN预测值、Multi-LSTM预测值以及根据本发明 提出的方法预测的结果。

图6表示平面的区域聚集度预测结果,(a)、(b)、(c)、(d)、(e)、(f)分别表示真实值、MLR预测值、STARIMA预测值、DCNN预测值、Multi-LSTM预测值以及根据本发明 提出的方法预测的结果。

具体实施方式

下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了 详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。

本实施例提供一种基于深度神经网络的城市区域聚集度预测方法,参考图1所示,包括 以下步骤:

步骤1,从城市的私家车轨迹中提取节假日每个时段的停留数据,所述停留数据包括该 时段内所有停留点的位置和停留时长。

本实施例通过使用GPS和物联网通信技术,收集城市私家车节假日的轨迹数据,按车辆 ID的行程轨迹(trip)存储在数据集中,包括每辆私家车的停车时刻、驶离时刻、停车位置。 本步骤1主要完成从城市的私家车节假日轨迹数据中提取停留数据:首先,对收集到的行程 轨迹数据进行清洗,包括删除ID信息缺失、停车少于三分钟以及短时间内异常移动等异常的 轨迹数据;然后,将节假日平均划分为24个时段,每个时段为1小时;以停车时刻为标准, 获取城市中每个时段内所有停留点的位置和停留时长。

步骤2,根据每个时段内所有停留点的位置和停留时长,分别计算该时段内有关停留点 的空间概率密度分布和时间概率密度分布。

本发明考虑到很难直接计算停留点的分布,采用核密度估计(KDE)方法,因为它不需要 先验知识的数据分布,可以根据停留点的相对位置自动聚类。

具体地,将城市划分为n个小区域,每个小区域内的停留点具有独立同分布的特点,设 所有小区域的聚类中心依次为p

式中,p表示停留点的位置,具体包括停留点的经纬度信息,K

由于数据集中存在一些远离聚类中心的离群点,这可能是由于车辆定位系统或信息上 传过程中的错误造成的。经典KDE方法对异常值特别敏感,它将异常值视为孤立的集群。 因此,即使是一个正常的停留点,经典KDE也会将其视为一个独立的集群中心,从而极大 地影响了聚合预测结果。因此在更优的实施例对采用的KDE方法进行扩展:

首先,将核密度估计的目标函数定义为如下加权和的形式:

此处,

本实施例选用高斯核函数,一般形式为:

解决问题的关键是求聚集中心,现存的方法多用最大似然估计,此时核密度估计函数

为了计算方便,我们将p和p

由于上式没有一个闭合解,所以本发明采用了核化迭代重加权最小二乘法,它必须先 初始化权重矩阵

之后经过k次迭代,判断函数

总之,本实施例上述采用扩展的核密度估计对停留点的分布情况进行表征,即得到私家 车停留点的空间概率密度分布

本发明中停留点的停留时长,是反映城市聚集效应在时间维度上的重要指标。例如,人 们可能会在周末带孩子去游乐园,通常花两个多小时,或者他们去超市买日用品,只花一个 小时。显然,游乐园的聚集效应与超市存在差别。本发明使用停留时间的概率密度分布来表 征城市聚集性的时间特征,近似为逆高斯分布:

T

步骤3,以T个时段为预测步长,以节假日N+T-1个连续时段对应构成的空间概率密度 分布序列和时间概率密度分布序列作为训练集,以训练集推迟T个时段的N个连续时段对应 构成的空间概率密度分布序列和时间概率密度分布序列作为预测标签集,训练预搭建的神经 网络模型,得到聚集度预测模型。

本实施例中的神经网络模型包括时空注意机制、LSTM、MLP、级联层、神经算法逻辑单元和全连接层。

在步骤2提取到停留点的空间概率密度分布和时间概率密度分布作为城市聚集度的空间 特征和时间特征后,本实施例在神经网络模型中设计了ST-attention块,即时空注意机制,用 来建模动态空间相关性和非线性时间相关性。

所述时空注意机制包括相同数量的时间注意机制和空间注意机制以及融合门。如图2所 示,,所述时空注意机制,一方面,空间嵌入层提供了聚集效应的地理表示,具体为基于历史 ASL行为的概率密度估计;另一方面,将停留时间的分布作为嵌入网络的时间特征。所述时 间注意机制的输入为时间概率密度分布,所述空间注意机制的输入为空间概率密度分布,所 述融合门将相应的时间注意机制输出的时间表征和空间注意机制输出的空间表征进行加权融 合,并输出至LSTM。

空间注意机制:在空间维度上,不同位置的停等点的概率密度分布相互影响,为此推 导出一个空间注意机制来捕捉聚集效应的空间之间的关联性,根据将区域划分为多个小区 域,根据第i个小区域停等点空间分布f

其中||为连接操作,

时间注意机制:在时间维度上,不同时间段的区域聚集度分布之间也存在相关性,本 发明使用时间注意力机制来捕获停留时间在观测中的非线性相关,定义

ST特征融合:即本发明设计的融合门,自适应融合注意层的k个并行注意机制所产生 的空间表征

其中q为sigmoid函数激活的门,融合机制自适应地控制了每个空间特征和时间特征的 输出。

虽然经典的LSTM具有推断函数的能力,但在学习过程中经常失败,特别是在训练过 程中数据超出数值范围时,其结果无法到达预期水平。本发明在LSTM之后加入了一种鼓励系统的数字外推的架构,即神经算法逻辑单元(即NALU层),针对节假日期间人们出 行随机性较大的情况,增强模型的数值外推能力,也就是泛化能力。本实施例中的神经算 法逻辑单元,由两个带权重的神经累加器(NAC)组合操作。一个标准NAC用于实现加减运 算,另一个用于在对数空间中学习更复杂的算术运算,如乘、除、幂函数等,可以表示为:

由于NAC不包含偏差参数,在隐含层也不进行非线性压缩,标准神经网络难以学习NAC。因此使用两个可以随机初始化的参数来获得权重值,即

式中,g=σ(G

本发明将整体的神经网络架构命名为STANet-NALU,它能够学习各种类型的函数,而 不是简单的数值特性,这使得更好地在数值范围内和范围外进行泛化,因此对节假日城市 聚集性的预测具有良好的预期效果。

在更优的实施例中,天气也会在一定程度上影响城市的聚集效应,因此本发明在对城 市的聚集效应进行预测时,另外再考虑天气情况作为外部特征来提高预测精度,故设置多 层感知机MLP和级联层。MLP用于输入独热编码后的天气数据,从天气数据中提取特征数据;然后由级联层将LSTM和MLP的输出进行级联然后输出至神经算法逻辑单元,进 而由全连接层对神经算法逻辑单元的输出数据进行全连接,最终由全连接层输出预测数据。

其中,所述全连接层包括两层稠密层和dropout模块,稠密层的激活函数为“linear”,优 化器选用“Adam”,dropout模块的比率取0.5。另外,LSTM层的激活函数均为“Sigmoid”。

本实施例的训练集,比如数据集中任一个节假日均为24小时,取节假日0点至23点过 程中共23个连续时段的空间概率密度分布序列和时间概率密度分布序列作为训练集,取节假 日4点至24点过程中共21个连续时段的空间概率密度分布序列和时间概率密度分布序列作 为预测标签集,预测步长取3个小时,则0点至3点过程中共3个连续时段的空间概率密度 分布序列和时间概率密度分布序列即为1个训练样本,3点至4点这个时段的空间概率密度 分布和时间概率密度分布作为对应的预测标签,……,最终1天节假日可得到21个训练样本 和对应的预测标签,用来训练前述预搭建好的神经网络模型,得到城市节假日聚集度预测模 型。

步骤4,获取目标预测时段之前的连续T个时段有关停留点的空间概率密度分布和时间 概率密度分布,使用聚集度预测模型进行滚动预测,获取得到目标预测时段有关停留点的空 间概率密度分布和时间概率密度分布,即为目标预测时段的聚集度。

本发明选取了2017年7月7日至2018年7月29日在中国深圳市罗湖区(东经114:04~ 114:21,北纬22:50~22:65)采集的私家车轨迹数据集,所选区域包括娱乐区、居住区、商业区 等多个功能区。该数据集包含5000多辆私家车,近10万次出行轨迹和2125条城市道路。本 发明根据停留点数据的分布来评价聚集度的变化。表1是一个经过清洗后的部分停等点数据, T1、T2分别表示车辆到达时刻和车辆离开时刻,StopLon、StopLat分别表示停车经纬度,即 为停留点的位置。

表1

首先以112×24小时为训练集,所有训练集推迟后1小时为验证集,最后37×24小时为 测试集,具体来说,训练样本7920个,验证样本2640个,测试样本2520个。如图一所示的 神经网络相关参数设置为m=64,n=16,优化器是“Adam”,损失函数选用“MSE”,度量标准用“accuracy”,LSTM层的激活函数均为“Sigmoid”,稠密层的激活函数为“linear”。

为了显示本发明的优越性,实验选择城市聚集发生了突然的变化的时间段作为测试,以 2018年7月29日周日13:00-14:00的聚集效应为例,实验对比了MLR(MultipleLinear Regression,多特征线性回归)、STARIMA(Space-Time AutoregressiveIntegrated Moving Average,时空自回归求和移动平均模式)、DCNN(Deep ConvolutionalNeural Network,深度 卷积神经网络)、Multi-LSTM(Multiple Long Short Term Memory,多特征长短时序列),采用 的五个评价标准为MSE(mean square error,均方误差)、RMSE(root mean square error,均 方根误差)、MAE(mean absolute error,平均绝对误差)、KL(Kullback-Leibler,KL散度) 和R2(R-Square,卡方值)。

以下表2是取不同数量的NALU层进行预测,其预测值与真实值之间的均方根误差(RMSE)。表3为本发明实施例的市节假日聚集度预测模型在深圳数据集上,与MLR、STARIMA、DCNN、LSTM的误差比较,其度量标准包括MSE、RMSE、MAE、KL、R2。

表2

表3

本发明从平面的角度观察城市区域停等点分布模型的性能。图3(a)给出了7月29日13:00 -14:00所选区域停等点的分布。如图3(b)所示,基于Huber损失的KDE函数对离群值异常 敏感,特别是在低密度区域的停等点的分布。在图3(c)中,本发明提出基于Log-cosh损失的 KDE模型是几乎不受异常值影响,生成了相对真实的分布。为了有效地学习训练数据的时空 相关性,找出最佳批大小、学习率以及NALU层数,本发明进行了一系列实验。实验中设置 学习率为不变量,批大小为自变量,均方根误差(RMSE)为因变量,结果见表2。研究发现选 择越小的批,误差越小,但是在相同的训练负荷下会导致更大的时间消耗。因此取135为最 佳批大小参数。图4给出了不同超参数下的学习曲线。学习曲线表明,无论学习率是多少, 它们最终都会收敛,但0.001是最好的学习率参数,因为它比其他设置收敛得更快。此外, 实验还评估了不同NALU层对学习的影响。结果表明层数对算法的收敛性没有实质影响。在 此基础上,将上述实验的最优参数应用于本发明提出的方案中。

为了直观地解释城市聚集预测,实验对比了其他基线方法,其超参数设置和特征选择如 下。(1)MLR:时间特征和空间特征是构建多输入的自变量。利用贝叶斯桥算法优化参数选 择。(2)STARIMA:滞后阶次、差分度、移动平均窗口大小分别设置为2,1,1。(3)DCNN。卷 积层的过滤器大小为32,内核大小为2x2,Adam被用作优化器,损失是MSE。(4)LSTM与Multi-LSTM具有相同的结构和参数设置。此外,Multi-LSTM加入了天气作为外部特征。

图5为三维视图的预测结果。实验结果表明,与地面真值相比,多本发明提出的方法取 得了更好的性能。结合图5和图6的结果进行性能比较,在图6(a)中观察到与真实值的显著 差异,尤其是在矩形区域,这是因为MLR只能捕获线性关系,而人们假期出行的随机性带 来了相邻时间段的分布的非线性聚集效应。在图6(c)中的绿圈区域,STARIMA削弱了该区域 的结果。同样可以在图5(c)中看到,它生成了错误的集群中心。DCNN方法的性能优于MLR 和ARIMA,但在图6(d)的红矩形和绿圆区域中出现了一些不正确的聚集区域。图6(e)的结果 给出了矩形集结中心相对于图6(a)的偏倚。也就是说,Multi-LSTM方法在表示聚合效应时会 产生偏差。综上所述,本发明所提出的方法STANet-NALU模型很好地捕捉了聚集效应的变 化,获得了最佳的可视化性能。它不仅准确预测了停等点分布的峰值(即聚集中心)的位置, 而且与基准相比给出相对正确的聚集度大小,在一系列指标MSE,RMSE,and MAE上对比传 统的LSTM模型,本发明均优于其他方法。

以上实施例为本申请的优选实施例,本领域的普通技术人员还可以在此基础上进行各种 变换或改进,在不脱离本申请总的构思的前提下,这些变换或改进都应当属于本申请要求保 护的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号