首页> 中文学位 >数据挖掘在登陆中国热带气旋路径分类及频数预测研究
【6h】

数据挖掘在登陆中国热带气旋路径分类及频数预测研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 引言

1.1.1 研究背景及研究意义

1.1.2 西北太平洋热带气旋气候研究进展

1.2 数据挖掘的应用进展

1.2.1 分类与预测算法在气象上应用的研究进展

1.2.2 聚类算法在气象上应用的研究进展

1.3 本文研究内容

1.4 本文组织结构

1.5 本章小结

第二章 资料来源与分析方法

2.1 资料来源说明

2.2 数据挖掘介绍

2.3 聚类算法的选择

2.3.1 K-means算法

2.3.2 FMM算法

2.4 决策树算法

2.4.1 C4.5 算法

2.4.2 CART算法

2.5 本章小结

第三章 基于有限混合模型的登陆中国热带气旋路径分类及特征分析

3.1 选择聚类数

3.2 对各类登陆我国的TC路径特征分析

3.2.1 夏秋季各类路径的特征分析

3.2.2 夏季各类路径的特征分析

3.3 本章小结

第四章 基于决策树算法的各类频数预测模型

4.1 基于CART算法建立路径频数预测模型

4.2 基于C4.5 算法建立路径频数预测模型

4.3 两种决策树模型的对比分析

4.4 本章小结

第五章 总结与展望

5.1 总结

5.2 下一步工作及展望

参考文献

致谢

作者简介

展开▼

摘要

热带气旋(TC)的路径很大程度上决定了TC的影响区域及TC的影响范围。TC频数的高低直接影响到国家沿海经济带的经济建设、社会的发展以及人民群众的生命财产安全。而TC的活动是一种非常复杂的自然现象,因此对于TC活动规律的研究一直都是气象学界的热点问题之一。基于TC路径数据集及气候信号数据集的挖掘,不仅能发现TC频数与人们已知气候信号之间的关系,更重要的是为人类的生活生产,国家社会的建设提供更为有利的保障和支持。本文将利用数据挖掘技术对历史上登陆中国的TC路径进行分类,并基于诸多人们已知的气候信号利用分类与预测算法中的两种决策树算法对每一类路径的TC频数进行了分类与预测并产生了科学、简单、直观的分类规则集,更好地揭示各类路径的TC频数与人们已知气候信号之间的关系,也为预测TC频数提供了新思路。
  具体而言,本文从以下三个方面进行了探索和研究:
  1.本文深入地了解了目前热带气旋研究领域的热点和难点,从数据挖掘的角度出发,设计了登陆中国TC路径分类模型以及各类路径TC频数的分类与预测模型。通过对数据挖掘中聚类算法以及分类与预测算法知识的深入学习,选取了适合TC路径分类问题的算法即FMM算法进行模型的建立;以及适合TC频数分类与预测的两种决策树算法:CART算法和C4.5算法,利用这两种算法分别对各类路径的TC频数进行模型的构建以及验证。发挥了气象学,数据挖掘,计算机科学交叉学科的优势。
  2.本文利用聚类算法对登陆中国的TC路径进行了相对客观的划分。通过对K-means算法以及FMM算法两类常被学者们用来划分TC路径的聚类算法原理的学习研究和对比,本文认为FMM算法对于TC路径的分类更加的科学。基于经验观察法,将历史上登陆中国的TC路径分为三类,并对每一类路径夏秋季和夏季的频数和生命史等特征进行了分析,发现了每一类登陆中国的TC生命史分布都各有特点。但是各类TC频数年际变化复杂,难以直观发现规律。
  3.为了解决上述问题,本文尝试利用CART算法和C4.5算法通过多种夏季的气候信号数据对夏季各类路径TC频数是否偏多分别进行了分类与预测,取得了较好的分类与预测效果,并且生成了简单易懂,科学有效的规则集,方便人们直观获取TC频数与气候信号之间的规律。
  以上工作不仅丰富了热带气旋领域的研究,也为数据挖掘和气象领域的科研问题结合提供了新思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号