首页> 中文学位 >基于AMC-Net和SSIP的人体蛋白图谱识别研究
【6h】

基于AMC-Net和SSIP的人体蛋白图谱识别研究

代理获取

目录

声明

第 1 章 绪论

1.1 本文研究背景及意义

1.2 国内外研究现状

1.2.1 蛋白质定位与识别的研究现状

1.2.2 卷积神经网络的研究现状

1.2.3 多标签图像识别方法的研究现状

1.3 本文研究内容

1.3 本文结构安排

第 2 章 人体蛋白图谱图像识别的理论基础

2.1 目标检测基本理论

2.2 经典的目标检测算法

2.3 人工神经网络的基本理论

2.3.1 卷积神经网络

2.3.2 激活函数

2.4 卷积神经网络的相关算法

2.4.1 传播算法

2.4.2 正则化算法

2.5 选择性搜索算法 Selective search

2.6 Selective search 中的图像分割

2.7 本章小结

第 3 章 基于 SSIP 的人体蛋白图谱图像识别方法

3.1 针对人体蛋白图谱的改进算法 Combined selective search

3.2 基于 SSIP 模型的多标签人体蛋白图像分类

3.2.1 SSIP 模型结构

3.2.2 SSIP 结果预测

3.3 多尺度方法优化 SSIP 的目标检测

3.4 人体蛋白图谱数据集与实验环境

3.5 客观评估标准

3.6 基于 SSIP 的实验结果与分析

3.6.1 不同尺度的卷积神经网络输入的对比实验

3.6.2 组合选择性搜索对 SSIP 的影响

3.6.3 不同目标检测方法对 SSIP 的影响

3.6.4 目标检测方法的尺度对 SSIP 的影响

3.7 本章小结

第 4 章 基于 AMC-Net 的人体蛋白图谱图像识别方法

4.1 多尺度网络模型结构 AMC-Net

4.2 针对人体蛋白图谱数据集的损失函数改进

4.2.1 经典损失函数

4.2.2 组合损失函数

4.3 基于 AMC-Net 的实验结果与分析

4.3.1 非对称分支结构的对比实验

4.3.2 多尺度方法的对比实验

4.3.3 组合损失函数的评估

4.3.4 AMC-Net 特征提取的可视化

4.3.5 AMC-Net 的定性分析

4.5 本章小结

第 5 章 人体蛋白图谱自动识别系统软件设计

5.1 软件设计要求

5.2 软件设计

5.3 不同模型的识别效果对比

5.4 本章小结

总结与展望

参考文献

附录 A 攻读学位期间发表的学术论文

附录 B 攻读学位期间参与的科研项目

致 谢

展开▼

摘要

由于多标签图像的复杂布局、对象之间的遮挡、单标签图像算法直接迁移表现不佳等因素,使得多标签图像识别模型很难达到实际应用的性能要求。此外,医学图像因不同类别之间特征差异较小,特征识别难度高,数据不均衡等因素,处理起来难度也更高。深度卷积神经网络因其强大的拟合能力和良好的泛化性能,已广泛应用于单标签图像识别任务当中。但由于多标签图像任务的识别难度远高于单标签图像任务,把单标签识别任务中优异的模型和方法直接迁移到多标签识别任务中也很难满足性能需求。  本文所研究的人体蛋白图谱图像数据集是多标签数据集,即其中每张图片都可能包含多个标签,这就使得一般的单标签方法失效,需采用多标签方法来解决问题。目前已有的一些关于人体蛋白图谱图片的识别研究,还不能与专家识别水平相提并论。随着医疗水平提高,数据累计越来越多,人工识别的方法日渐乏力,一个高性能的人体蛋白自动识别系统亟待设计。我们通过对目标检测、图像分割等相关理论和该数据集的特殊性进行分析,在选择性搜索算法的基础上提出了组合选择性搜索算法。同时,基于多标签问题转换理论和多尺度模型理论,分别提出了深度模型SSIP和卷积网络AMC-Net。另外提出了组合损失函数等优化方法。  本文研究结果概况如下:  (1)AMC-Net模型:针对蛋白质特征尺度变化大的问题,论文设计了一个多输入的非对称多尺度卷积神经网络AMC-Net用于处理不同尺度的蛋白质特征。该网络通过将输入图像缩放到三种不同尺度后,将其同时输入到网络模型中,模型的三个分支拥有不同的卷积核大小和池化核大小。其中,大尺度的图像对应大尺度的卷积核分支。实验证明这种多尺度和多输入的模型可以达到很好的分类效果,取得了0.821的F1分数。  (2)SSIP模型:针对数据集的多标签属性,论文设计了一个新颖的端到端多标签分类框架SSIP,该框架集成了改进的目标检测算法、自主设计的卷积神经网络、最大池化层以及阈值法。其中,目标检测算法基于目前先进的选择性搜索算法,并针对人体蛋白图谱图像信息分通道存储的特征,提出了组合选择性搜索算法。此外,论文还进行了大量的实验来评估SSIP框架,并证明了其具有良好的鲁棒性,在实验中其F1分数最高达到0.83。  (3)优化方面:在监督信号优化上,本文引入了组合损失函数。组合损失函数由二元交叉熵损失函数和F1分数损失函数调和而成,在缓解数据集类别严重失衡导致的模型过拟合问题的同时,可以指导模型提升F1分数(相较单独使用Focalloss提升了约0.015),且没有增加额外的计算量。在SSIP框架目标检测的优化上,本文提出多尺度目标检测方法,有效降低了漏检率,提升了F1分数约0.016。  本文以人体蛋白图谱数据集为实验对象,通过大量的对比实验,证明了所提出的AMC-Net、SSIP模型具有很好的鲁棒性,同时也通过实验证明了损失函数优化方法、多尺度优化方法等可以显著提升人体蛋白图谱识别的性能,为解决基本的生物学问题提供可行的研究工具。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号