声明
致谢
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状与难点
1.2.1 国内外研究现状
1.2.2 面临的问题与难点
1.3 论文研究内容
1.4 论文的组织结构
2 相关理论概述
2.1 主成分分析法
2.1.1 主成分分析法的基本原理
2.1.2 主成分分析法的几何解释
2.1.3 主成分分析计算步骤
2.2 自组织特征映射神经网络及其算法
2.2.1 SOFM神经网络结构
2.2.2 SOFM神经网络思想与学习算法
2.3 随机森林算法基本原理及其模型
2.3.1 决策树算法
2.3.2 随机森林算法
2.3.3 随机森林参数设置
3 医保数据特征工程处理
3.1 数据预处理
3.1.1 缺失值处理
3.1.2 噪声处理
3.1.3 数据整合处理
3.2 医保数据特征提取
3.3 医保数据特征处理
3.3.1 特征因子化
3.3.2 数据标准化
3.4 本章小结
4 结合SOFM-RF算法的医保异常检测模型
4.1 结合的SOFM-RF 模型
4.1.1 模型思想
4.1.2 模型建立
4.2 基于改进聚类算法的医保数据划分
4.2.1 常用聚类算法应用
4.2.2 运用PCA改进SOFM算法的研究
4.3 基于SOFM-SMOTE算法的非平衡医保数据处理
4.3.1 非平衡数据处理方法
4.3.2 SOFM-SMOTE算法模型
4.4 基于改进集成分类算法的异常检测
4.4.1 加权基分类器法
4.4.2 异常检测模型
4.5 本章小结
5 实验结果与分析
5.1 基于PCA改进SOFM算法实验
5.1.1 实验环境
5.1.2 主成分分析
5.1.3 聚类分析与对比
5.2 非平衡医保数据处理实验
5.2.1 实验环境
5.2.2 实验结果与分析
5.3 基于改进随机森林算法的医保异常检测实验
5.3.1 实验环境
5.3.2 各分类算法对比
5.3.3 基于现有算法模型对比分析
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
独创性声明
学位论文数据集
北京交通大学;