首页> 中文学位 >地震前兆数据流的增量式数据挖掘方法研究
【6h】

地震前兆数据流的增量式数据挖掘方法研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

§1.1本课题的研究背景及意义

§1.2相关研究

§1.3数据流和数据流挖掘技术

§1.3.1数据流概述

§1.3.2数据流分析的理论基础

§1.3.3数据流挖掘

§1.4地震前兆观测数据流的分析处理

§1.4.1地震前兆观测数据流特征

§1.4.2地震前兆观测数据流的分析处理

§1.5本文的主要研究内容

§1.5.1时间序列特征模式并行挖掘

§1.5.2时间序列数据流增量式并行挖掘

§1.5.3动态时间序列在线相似性查找

§1.6本文的组织结构

第2章时间序列特征模式并行挖掘

§2.1引言

§2.2并行时序模式概述

§2.3基于IRST的并行时序模式挖掘算法

§2.3.1时间序列的线段表示

§2.3.2互关联后继树模型

§2.3.3基于互关联后继树的发现算法

§2.3.4数据分区与互关联后继树算法

§2.3.5基于互联后继树模型的发现算法

§2.4试验

§2.5小结

第3章时间序列数据流增量式挖掘

§3.1引言

§3.2相关工作

§3.3时间序列数据流增量式挖掘

§3.3.1基本思想

§3.3.2问题定义

§3.3.3基于重要点的分段

§3.3.4特征抽取及符号化

§3.3.5模式增量式更新

§3.3.6时间序列数据流增量式在线并行挖掘

§3.3.7算法描述

§3.4模拟试验

§3.5小结

第4章时间序列的在线相似性查找

§4.1引言

§4.2时间序列相似性查找简介

§4.2.1相似性查找描述

§4.2.1主要难点及相关技术

§4.3在线相似性查询

§4.3.1相关工作

§4.3.2基本概念及相关技术

§4.3.3动态模式匹配距离

§4.3.4基于弯曲窗口的动态模式匹配距离

§4.3.5动态模式匹配距离的下界距离

§4.3.4基于DPM的在线相似性并行查找

§4.4模拟试验

§4.5小结

第5章总结与展望

§5.1总结

§5.2进一步的工作

附录

致谢

展开▼

摘要

随着计算机、通信、网络技术的迅猛发展,许多应用领域出现了海量、高速、动态的数据,如交通工程和网络监控、电信记录管理和分析、商业交易管理和分析、金融信息监控、传感器网络监控等。区别于传统数据库中相对静态的数据,这类海量、持续、有序、快速和突变的数据,称为数据流。如何对这种全新的数据模型进行管理与分析,是一个严峻挑战;而时间序列数据流的分析与管理是其中一个重要研究方向。 随着地震监测技术日趋完善,各级地震台网收集了大量的观测数据,每天都有大量的数据不断流入。这些海量的历史观测数据和实时数据流统称为“地震前兆监测数据”。如何探测这些数据背后隐藏的地震前兆规律,是迫切需要解决的问题。本文在分析时间序列和时间序列数据流特点的基础上,根据地震前兆监测数据的实际应用需求,着重对时间序列数据流的挖掘与相似性查找等一些关键技术进行了研究。具体包括特征模式的并行挖掘、在线增量式并行挖掘、在线相似性模式查找等。本文所做的工作和取得的创新成果体现在以下三个方面: 1)时间序列特征模式并行挖掘研究提出了一种建立在集群式高性能计算机上基于互关联后继树(Inter-Relevant Successive Trees IRST)的并行时序模式挖掘算法,将数据线段化、树的建立及模式发现在多处理机上进行并行处理,有效地改进了算法的执行效率。实验结果表明,此算法较之串行算法有较高的效率。 2)时间序列数据流在线增量式并行挖掘算法研究根据IRST提出了一种并行的增量式数据流挖掘算法:着重从时间序列数据流挖掘目的和实用角度出发,采用滑动窗口窗口技术来处理最近数据序列,并在其上面建立一种基于互关联后继树的索引SIRST(Sequence Inter-Relevant Successive Trees),利用索引查找来发现频繁模式;为了提高算法效率,随着数据流的不断变化,动态更新索引模型SIRST,并引入数据交叠技术和并行计算技术来进一步提高算法的精度和效率。最后,将结果返回给用户,并利用挖掘结果实时更新模式库。 3)动态时间序列在线模式的相似性查找研究针对时间序列在线分析的需要,给出了一种动态时间序列的在线相似性查找算法。该算法采用了一种动态模式匹配距离作为相似性度量方式,为了提高查找效率和缩短响应时间,在计算模式距离时引入了窗口路径限制技术和早放弃技术来提高匹配距离计算效率,并将各指定的模式发送到各个处理器,进行并行的相似性匹配计算来提高响应时间。通过在地震前兆监测数据上的模拟试验表明,该算法比基于欧式距离和动态时间弯曲距离作为相似性度量方式的查找算法有较高的准确性,其效率虽然不如基于欧式距离作为相似性度量方式的查找算法,但比基于动态时间弯曲距离作为相似性度量方式的查找算法却提高了很多。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号