首页> 中文学位 >时间序列数据挖掘中的特征表示与分类方法的研究
【6h】

时间序列数据挖掘中的特征表示与分类方法的研究

代理获取

目录

声明

摘要

1.1研究背景

1.2 研究内容及意义

1.3研究工作及创新点

1.4 本文的组织结构

第2章相关工作

2.1 时间序列特征表示

2.1.1 基于域变换的特征表示方法

2.1.2 基于模型的特征表示方法

2.1.3 基于分段的特征表示方法

2.1.4基于符号的特征表示方法

2.2 时间序列分类方法

2.2.1 基于模型的分类方法

2.2.2 基于全局特征的分类方法

2.2.3 基于局部特征的分类方法

2.2.4基于组合的分类方法

2.3 本章小结

3.1 概述

3.2 问题形式化

3.3 基于转折点的在线分段线性表示方法

3.3.1初始线性分割

3.3.2 线性分段的评估与再次分割

3.3.3线性分段的合并

3.4实验与分析

3.4.1 实验设置

3.4.2 表示精度对比实验

3.4.3 表示效率对比实验

3.5 本章小结

4.1 概述

4.2问题形式化

4.3 基于自适应表示索引的时间序列多分辨率混合表示方法

4.3.1 自适应表示索引ARI的建立

4.3.2 基于自适应表示索引的高效多分辨率混合表示

4.3.3 MHR-ARI时间复杂度分析

4.4实验与分析

4.4.1 实验设置

4.4.2 索引建立时间的对比实验

4.4.3 表示效率的对比实验

4.4.4并行加速比分析

4.5 本章小结

第5章基于局部特征高效选取的时间序列分类方法

5.1 概述

5.2问题形式化

5.3高效Shapelet选取方法

5.3.1 生成代表性时间序列集合

5.3.2 生成精简Shapelet候选集合

5.3.3 ESS的时间复杂度分析

5.4实验与分析

5.4.1 实验设置

5.4.2 参数分析

5.4.3 基于分类精度的对比实验

5.4.4 基于分类效率的对比实验

5.5 本章小结

第6章基于多表示学习模型的时间序列分类方法

6.1 概述

6.2 多表示循环神经网络模型

6.3实验与分析

6.3.1 实验设置

6.3.2 基于分类准确率的对比实验

6.3.3 MR-RNN不同信道的分类精度对比实验

6.3.4注意力机制分析

6.4 本章小结

第7章总结与展望

7.1主要工作总结

7.2 未来工作展望

参考文献

致谢

攻读学位期间发表的学术论文目录

攻读学位期间参与科研项目情况

攻读学位期间获得的奖励

外文论文

展开▼

摘要

时间序列作为一种与时间相关的海量高维数据,广泛遍布于现实世界几乎所有的应用领域中。时间序列不仅具有“海量、高维”的传统大数据特性,还同时具有“实时更新”的“流数据”特性,因此被称为时间序列流数据(Streaming Time Series)。基于上述数据特性,传统的基于静态时间序列的数据挖掘方法往往无法直接应用于时间序列流数据上并获得相对理想的研究结果。因此如何从“海量、高维、实时更新”时间序列中发现潜在的知识己成为当前数据挖掘研究中的热点和难点问题。根据相关研究成果表明,时间序列数据挖掘已成为21世纪数据挖掘领域10大最具挑战性的研究问题之一,并受到国内外研究者的广泛关注。本学位论文将对时间序列数据挖掘研究中的两个关键问题:时间序列特征表示和时间序列分类展开相应的研究,主要工作和创新性可以归纳为以下几个方面: (1)本文提出一种基于转折点的时间序列在线特征表示方法。该方法以“在线”的方式对具有流数据特性的时间序列进行持续地特征表示,并从单点误差和分段误差两个不同的角度对该方法的表示精度进行约束,同时利用转折点和优化合并策略确保该方法具有相对理想的运行效率。实验结果显示:本文所提出的时间序列表示方法不仅具有更高的表示精度,同时具有较高的运行效率,此外该方法受参数变化的影响较小,具有良好的鲁棒性。 (2)本文提出了一种基于自适应表示索引的时间序列“多分辨率”混合表示方法。该方法是时间序列“多分辨率”分段表示和“多分辨率”符号表示的通用方法。它可以根据不同的表示需求,利用自适应表示索引快速生成不同类型的多分辨率表示结果(分段线性表示结果,分段聚合近似结果,符号聚合近似结果)。此外,该方法还支持对已经获取的分段线性表示结果进行局部调整,并能迅速获得调整后的相关表示结果的完整表示信息,从而避免了不必要的重复计算并提高了相应的表示效率。实验结果表明:本文所提出的方法不仅具有更高的索引创建效率和更高的“分段线性表示”效率,而且能够同时提供基于“分段聚合近似”以及“符号聚合近似”的多分辨率表示结果。 (3)本文提出了一种高效的局部特征选取方法对基于局部特征的时间序列分类算法进行加速。该方法通过:生成代表性时间序列集合以及精简局部特征候选集合两个相互独立的加速策略,对基于局部特征分类方法的“特征选取”效率进行提升,进而实现了分类算法整体效率的提升。实验结果表明:本文所提出的局部特征高效选取策略能够对原始分类方法的特征选取效率进行较大幅度的提升。与此同时,经本方法“加速”后的分类方法与原始分类方法的分类准确率基本处于同一精度水平。 (4)本文提出了一种基于多表示深度学习模型的时间序列分类方法。该模型将基于不同时间序列特征表示方法所产生的相应表示结果看作时序特征的不同表示形式,随后利用不同的信道从不同角度学习并获取当前表示结果中的相应数据特征,并根据其获取关键数据特征对时间序列分类进行有效的指导。实验结果表明:本文提出的模型具有更加全面的特征学习能力,相比于采用单一分类器的时间序列分类方法,该模型具有更高的分类准确率。与此同时,本文所提出的深度学习模型还能利用平行注意力机制对所获取的数据特征进行重要性评分,在一定程度上实现了时间序列分类结果的可解释性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号