声明
摘要
第一章 绪论
1.1 课题研究背景及意义
1.2 课题研究现状
1.3 本论文主要内容及结构安排
1.3.1 主要内容
1.3.2 结构安排
第二章 机器学习算法及相关知识介绍
2.1 机器学习算法在生物数据中的应用
2.1.1 模式识别简介
2.1.2 变量选择问题
2.2 机器学习算法概述
2.2.1 PLS基本原理的介绍
2.2.2 SPLS基本原理的介绍
2.2.3 SPLS-DA基本原理的介绍
2.2.4 弹性网络的介绍
2.2.5 Naive Bayesian分类器的介绍
第三章 基于PLS识别NSCLC子类分类特征基因及生存分析
3.1 引言
3.2 数据及预处理方法
3.2.1 数据
3.2.2 预处理方法
3.3 基于PLS的特征基因识别模型
3.4 Cox模型的介绍
3.5 模式识别模型评价方法
3.6 结果与讨论
3.6.1 基于GE数据和ME数据的特征基因
3.6.2 GE分类模型和ME分类模型比较
3.6.3 与已有NSCLC子类分类结果的比较
3.6.4 基于GE特征基因的病人生存分析
3.6.5 基于ME特征基因的病人生存分析
3.7 IPA分析及功能基因注释
3.7.1 特征基因的IPV分析
3.7.2 基因功能注释
3.8 本章小结
第四章 利用CNV数据建立模型识别NSCLC子类分类特征基因
4.1 引言
4.2 CNV数据与处理方法
4.2.1 CNV数据
4.2.2 预处理方法
4.3 模式识别模型及模型评价方法
4.3.1 识别特征基因
4.3.2 模式识别模型
4.3.3 模型评价方法
4.4 结果
4.4.1 特征基因及特征基因的特征统计
4.4.2 特征基因区分NSCLC样本与正常样本
4.5 讨论
4.5.1 与已发表区分ADC与SCC结果比较
4.5.2 已知重要致癌基因和具有统计生物意义基因
4.5.3 合并三个基因集对NSCLC子类分类
4.6 本章小结
第五章 基于ESDA模型识别snoRNAs
5.1 引言
5.2 数据集与特征提取方法
5.2.1 数据集
5.2.2 特征提取方法
5.3 构建ESDA模型
5.4 ESDA模型评价方法
5.5 结果
5.5.1 与SnoReport模型比较
5.5.2 与其他常用分类器比较
5.5.3 验证ESDA
5.5.4 重要特征分析
5.6 讨论
5.7 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
发表论文和参加科研情况说明
致谢