声明
摘要
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本论文的研究内容
1.4 本文的组织框架
1.5 本章小结
2 相关技术研究
2.1 医疗数据挖掘过程
2.2 数据挖掘功能
2.2.1 关联分析
2.2.2 分类
2.2.3 回归分析
2.2.4 聚类分析
2.3 数据预处理
2.3.1 数据预处理的任务
2.3.2 特征选择
2.4 本章小结
3 基于正规化回归模型的数据预处理过程
3.1 正规化回归模型
3.1.1 正规化的意义
3.1.2 正规化的原理
3.2 基于正规化回归模型的特征筛选方法
3.2.1 基于单一组学的特征筛选方法
3.2.2 基于多组学数据变量筛选方法
3.3 岭回归
3.4 基于岭回归分析数据预处理过程
3.4.1 岭迹分析
3.4.2 岭参数k值的选择
3.4.3 岭回归做变量选择
3.5 本章小结
4 优化随机森林算法
4.1 随机森林模型建立
4.1.1 随机森林算法
4.1.2 随机森林模型建立过程
4.2 OSNR-RF模型建立
4.2.1 问题描述与算法设计
4.2.2 综合评价指标提取
4.3 本章小结
5 基于正规化回归模型的医疗诊断数据挖掘
5.1 实验环境
5.2 基于正规化回归模型的数据分析
5.2.1 实验数据概述
5.2.2 基于岭回归分析的数据预处理过程
5.3 实验结果展示与分析
5.3.1 训练集对组合分类模型准确率的影响研究
5.3.2 基于Bagging抽样倍数的准确率影响研究
5.3.3 随机森林效率提升研究
5.3.4 OSNR-RF算法实验过程和分析
5.4 本章小结
结论
致谢
参考文献
攻读学位期间的研究成果