首页> 中文学位 >交通领域下在线集成时间序列预测方法及应用研究
【6h】

交通领域下在线集成时间序列预测方法及应用研究

代理获取

目录

第一个书签之前

交通领域下在线集成时间序列预测方法及应用研究

学位论文原创性声明和学位论文版权使用授权书

摘 要

Abstract

目 录

插图索引

附表索引

1 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 时间序列预测中的关键问题

1.4 论文的研究内容

2 时间序列预测及其相关模型

2.1 时间序列预测问题描述

2.2 相关模型介绍

2.3 现有在线集成学习方法的不足与发展前景

2.4 本章小结

3 基于非参数核平滑的在线集成回归模型

3.1 引言

3.2 基于拓扑学习的核密度回归和 Adaboost 算法简介

3.3 非参数在线集成核平滑回归框架

3.4 对比实验

3.5 本章小结

4 基于分类型损失函数的增量回归预测模型

4.1 引言

4.2 SVM 和 Learn++ 模型简介

4.3 基于 SVR 和 Learn++ 的在线集成回归算法框架设计

4.4 基于 R2C 和 Learn++ 的回归算法实现

4.5 对比实验研究

4.6 本章小结

5 基于在线迁移回归的集成位置预测模型

5.1 引言

5.2 问题描述和算法简介

5.3 基于在线迁移学习的车辆位置预测模型

5.4 在线迁移回归算法设计和实现

5.5 对比实验

5.6 本章小结

6 基于自适应加权策略的在线集成 LSTM 预测模型

6.1 引言

6.2 LSTM 神经网络基础简介

6.3 基于 R2C 的 LSTM 分类类型损失

6.4 在线集成 LSTM 模型设计

6.5 对比实验研究

6.6 本章小结

结 论

本文工作总结

工作展望

参考文献

附 录

攻读博士期间发表学术论文

致 谢

展开▼

摘要

交通领域下的时间序列数据(time series data)是指某一时间段下顺序采集到的数据,它通常用于客观地描述和记录车辆行驶过程中的某一事物或现象随时间变化的发展规律。通过对该领域下的时间序列数据进行分析,可以很大程度地挖掘数据中所隐藏的变化规律,从而对构建和谐交通、拥堵避免以及安全行驶做出重大贡献。而时间序列预测是分析时间序列数据的主要方式,它可以通过挖掘数据中所隐藏的变化规律,构建其预测模型来预测某一现象或事物的发展趋势。因此,如何构建交通领域下的时间序列预测模型具有重要的现实意义和研究价值。  在构建时间序列预测模型时,通常需要考虑以下两个方面。首先,时间序列数据是一种数据体量大、种类繁多且可真实反映事物或现象变化的大规模数据,因此预测模型通常必须具备训练大规模数据集的能力,而在线学习(online learning)是实现大规模数据学习的技术手段之一;其次,在非平稳环境中采集数据时会受到外部环境的影响,使得数据原本的分布情况随时间的推移发生改变,即存在概念漂移(concept drift)的现象,而集成学习(ensemble learning)作为一种辅助框架为解决概念漂移问题提供了重要的突破口。针对时间序列预测中存在的待处理数据庞大和概念漂移的问题,本文以交通领域中采集到的时间序列数据为基础,结合在线学习和集成学习,对如何构建基于在线集成学习的时间序列预测模型展开研究。本文主要的工作和贡献如下:  1.提出一种基于非参数核平滑的在线集成回归模型  在线学习是一种有效提高机器学习算法空间效率的技术,而集成学习作为实现组合算法的技术之一被广泛地应用于模型的性能优化领域。针对在线学习不允许再训练导致的参数选取困难的问题,提出一种基于非参数核平滑的在线集成回归模型。该模型首先引入拓扑学习神经网络,通过改进核密度回归方法将拓扑学习神经网络转换成一种前馈神经网络,并推导出相应的回归表达式;然后,设计最大似然估计用于回归模型的自适应参数选取;最后,通过结合集成学习的加权训练策略,提高拓扑学习回归预测模型的性能。所提出的方法在UCI数据集和交通流数据集上的对比实验结果表明,该方法的预测精度最高可分别提升45.27%和54.29%。  2.提出一种基于分类型损失函数的增量回归预测模型  在非平稳环境下所收集到的数据会受到外界环境影响而发生分布上的变化,即概念漂移的发生。不同的非平稳环境会发生不同的概念漂移,其中包括突然地、快速地、渐进地或周期性地甚至是变化率不同的概念漂移。因而导致具有固定的模型类型和参数设置的传统时间序列预测方法的性能逐渐下降。针对概念漂移带来的预测困难,提出一种概念漂移环境下的增量回归模型,以解决在非平稳环境下的数据分布变化问题。该模型首先通过将时间序列预测的回归任务转换为二元分类任务;其次,基于此变换构造出用于增量学习和集成学习的分类型损失函数;最后,通过将逐步更新的分离超平面进行公式推导得到最终的增量回归模型。在交通流预测应用上的实验结果表明,该方法的表现相较于现有的增量回归和集成回归方法更具稳定性,其预测精度最高可提升53.41%。  3.提出一种基于在线迁移回归的集成位置预测模型  时间序列数据通常存在前后点不一定是相邻时刻,即可能发生数据缺失的问题。尤其是在基于GPS设备的采集过程中,由于采集频率、设备精度、以及基站和GPS信号强弱等不同层次的原因,造成所采集到的位置时序数据在时间刻度上的观测值是不准确的甚至是缺失的。针对因GPS信号中断所带来的位置时序数据丢失的问题,提出一种在线迁移回归模型。该模型首先将GPS数据和辅助车辆行驶数据进行融合再进行训练;然后,在数据缺失期间,利用迁移学习来降低不利于当前情况下的训练样本的权重;最后,通过建立分类类型损失函数以进行集成回归学习,从而获得在线迁移回归模型。实验采用了真实的车辆位置数据集来验证,其结果表明所提出的方法相比现有的方法的预测精度提高了13.47%—61.51%。  4.提出一种基于自适应分类型加权策略的在线集成LSTM预测模型  单个长短期记忆神经网络(long short-term memory, LSTM)因其特殊的网络结构导致其训练时会产生大量的网络参数。且在每一个时间步长内会快速修改和更新LSTM记忆单元,从而对网络内部进行动态调整。针对单个LSTM的参数优化工程量大和内部变化难以捕捉的问题,提出一种基于自适应加权策略的在线集成LSTM预测模型。该模型首先基于虚拟二分类思想构造出用于回归任务的分类类型损失函数;然后,为了捕获基础LSTM模型在每一个时间步长下的变化,设计出一种自适应分类型加权策略,从而得到基于LSTM的在线集成预测模型。在交通速度预测应用上的实验结果表明,所提出的预测模型在性能上比单个LSTM模型提升了35.13%—48.02%,且比现有的集成LSTM方法提高了14.5%—28.45%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号