首页> 中文学位 >一种新的不平衡数据处理方法在股票分类中的应用
【6h】

一种新的不平衡数据处理方法在股票分类中的应用

代理获取

目录

声明

致谢

摘要

1.1研究背景及意义

1.2研究现状

1.2.1 不平衡数据处理方法研究现状

1.2.2特征选择方法研究现状

1.3创新点

1.4论文安排

2不平衡数据分类的基本理论

2.1 不平衡数据的处理方法

2.1.1过抽样方法

2.1.2欠抽样方法

2.1.3分类性能评估准则

2.2特征选择

2.2.1过滤式特征选择

2.2.2封装式特征选择

2.2.3嵌入式特征选择

2.2.4特征搜索策略

2.3分类器支持向量机简介

2.3.1支持向量机

2.3.2集成学习

3一种新的不平衡数据的特征选择方法

3.1 一种新的不平衡数据处理方法BASMOTE

3.2一种新的特征选择算法HPMG

4股票分类模型建立及其实证研究

4.1 数据准备

4.2模型构建

4.3结果分析与对比

5结论与展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

随着我国金融市场的不断发展,越来越多的投资者将目光投向了股票市场。如何科学合理地进行股票的分析,选择优质股票是每一个投资者所要解决的首要问题。从基本面而言,公司的财务数据对股票的选择尤为重要。但在选股时,优质股票的数目远远小于普通股票即数据集是不平衡的,并且公司的财务数据往往是高维的,含有一些不相关特征,因此对数据进行平衡化处理以及进行特征选择是很有必要的。
  本文对原有的过抽样方法borderline-SMOTE算法与ADASYN算法加以创新,提出一种混合式的BASMOTE算法,在borderline-SMOTE基础上引入ADASYN算法自适应的思想,根据周围样本的分布自适应的合成新的少数类样本,在容易分类的地方合成较少的样本,在较难分类的地方合成较多的样本。从而获得更加有效合理的新的少数类样本。其次提出一种混合式的特征选择方法HPMG,对三种过滤式特征选择方法中引入封装式特征选择的思想,使用分类器的训练准确率作为每种过滤式特征选择方法确定特征个数的依据,并使用集成算法中的简单投票算法确定最终结果。
  本文利用上市A股中某一行业的股票财务数据,使用SVM作为分类器,分别把BASMOTE算法、混合式特征选择方法HPMG,与几种原有的过抽样方法以及特征选择方法作对比。验证了BASMOTE算法与混合式特征选择方法HPMG优于已有的过抽样方法以及特征选择方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号