首页> 中文学位 >基于集成学习的多类基因微阵列数据应用研究
【6h】

基于集成学习的多类基因微阵列数据应用研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 基因微阵列简介

1.1.1 基因微阵列技术

1.1.2 基因微阵列数据

1.2 研究背景综述

1.2.1 基于纠错输出编码的微阵列研究现状

1.2.2 基于遗传规划的微阵列研究现状

1.3 论文主要工作

1.3.1 论文主要创新

1.3.2 论文结构

第二章 相关理论综述

2.1 监督式学习概述

2.1.1 经验风险最小化

2.1.2 结构风险最小化

2.1.3 监督式学习的应用领域

2.2 集成学习

2.2.1 集成学习简介

2.2.2 差异度问题

2.3 特征选择算法

2.3.1 t-test方法

2.3.2 Laplacian Score方法

2.3.3 Symmetrical Uncertainty方法

2.4 纠错输出编码算法

2.4.1 编码矩阵算法

2.4.2 解码函数

2.4.3 二分类学习器

2.5 遗传规划概述

2.5.1 种群的初始化

2.5.2 交叉与变异操作

2.6 分类算法性能的评估方法

2.6.1 分类器性能度量指标

2.6.2 随机抽样划分方法

2.7 本章小结

第三章 基于纠错输出编码的集成多分类学习算法

3.1 Ensemble ECOC算法

3.1.1 Ensemble ECOC算法伪代码

3.1.2 特征选择算法

3.1.3 MLD/MGD算法示例

3.2 实验与分析

3.2.1 实验设定

3.2.2 多分类实验结果

3.2.3 特征选择结果

3.2.4 集成规模研究

3.2.5文献结果对比

3.3 非参数统计分析

3.3.1 Nemenyi Test方法

3.3.2 Kappa测度

3.4 本章小结

第四章 基于遗传规划的多类基因微阵列数据分析

4.1 集成遗传规划分类器

4.1.1 个体的生成

4.1.2 适应度函数

4.2 实验结果与分析

4.2.1 实验设定

4.2.2 实验结果与分析

4.3 本章小结

第五章 总结与展望

5.1 本文的主要工作

5.2 研究展望

参考文献

攻读硕士期间的研究成果

致谢

展开▼

摘要

集成学习是当前机器学习领域的一个研究热点,具体到多分类问题,旨在通过一组差异的分类器共同解决起初的多分类问题,然后经过大多数投票等策略将各个分类器的输出结果进行融合。集成多分类算法相比于单个的优秀分类器往往性能上更准确、更稳定,同时还具有更强的泛化能力。在解决多分类问题时,基于纠错输出编码算法(ECOC)。这是解决多分类问题的一种灵活、高效的算法框架,关键要点是将多分类转变为多个二分类问题。此外,遗传规划算法可用于解决二分类问题,通过进化计算得到准确的分类规则。本文在已有的研究基础上,对基因微阵列数据的集成多分类学习进行了理论探索和实践。
  本文主要围绕着集成多分类算法,应用于基因微阵列数据的分析中,主要工作集中在以下方面:
  1、提出了基于纠错输出编码的集成多分类学习算法。本文使用了三种filter特征选择算法对基因微阵列数据进行维度筛选,实现了将数据相关的纠错输出编码算法应用于基因微阵列数据的识别。通过集成多个纠错输出编码,提升了基因微阵列数据的分类准确率。
  2、设计了用于计算纠错输出编码差异度的方法。在集成纠错输出编码时,成员之间差异度越大,集成学习越有效。本文提出了两种选择策略:局部差异度最大化和全局差异度最大化。局部差异度计算纠错输出编码两两之间的差异度,全局差异度计算某个纠错输出编码与剩余的候选编码矩阵差异度的总和。
  3、提出了基于遗传规划的集成多分类算法。在解决多分类问题时采用纠错输出编码算法分解为二分类问题。设计遗传规划对于每一个二分类问题进行进化计算,然后集成最终的种群中适应度高、差异度大的个体。通过提升每一个二分类问题的准确率,基于遗传规划的集成多分类算法提升了整体的多分类性能。对于基因微阵列数据,该算法能够同步地筛选癌症关键基因。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号