首页> 中文学位 >基于结构特征与伪氨基酸组成的蛋白质结构类预测研究
【6h】

基于结构特征与伪氨基酸组成的蛋白质结构类预测研究

代理获取

目录

文摘

英文文摘

插图索引

附表索引

第1章 绪论

1.1 选题背景和意义

1.2 研究现状

1.3 本文主要工作

1.4 本文章节安排

第2章 蛋白质结构类预测介绍

2.1 蛋白质基础知识

2.1.1 蛋白质的组成

2.1.2 蛋白质的分类

2.1.3 蛋白质的结构

2.2 蛋白质结构类预测

2.2.1 蛋白质结构类预测简介

2.2.1 结构类预测模型

2.3 蛋白质结构分类数据库

2.4 小结

第3章 基于结构特征与伪氨基酸组成的特征提取

3.1 常见氨基酸序列特征提取简介

3.2 基于结构特征与伪氨基酸组成的特征提取

3.3 特征提取方法实验分析

3.4 小结

第4章 分类模型实验及结果分析

4.1 结构类预测模型简介

4.1.1 基于距离计算的分类模型

4.1.2 基于机器学习方法的分类模型

4.2 分类模型测试评估

4.3 多种分类模型的实验结果分析

4.3.1 数据集与测试方法

4.3.2 不同分类模型实验结果分析比较

4.4 小结

结 论

参考文献

致 谢

附录A 攻读学位期间所发表的学术论文

附录B 攻读学位期间所参加的项目

展开▼

摘要

蛋白质在生命活动中拥有着不可替代的功能,对蛋白质的研究也越来越重要。其中蛋白质结构类的预测在蛋白质的很多相关属性的预测中起到了重要的作用,如:蛋白质亚细胞定位、膜蛋白类型、G蛋白耦联体类型、酶家族类,蛋白质四级结构类型、与酶的活性等等。因此蛋白质结构类的相关研究在分子生物学中是相当重要的。
  蛋白质序列数据作为最原始的数据,包含了许多对蛋白质相关研究十分有利的潜在信息,因此对蛋白质序列信息的挖掘和基于序列信息来对蛋白质结构、功能、相互作用以及亚细胞定位等领域的深入研究引起了科研人员的广泛关注
  本文首先从蛋白质基本性质和性能出发,对目前蛋白质结构类预测现状进行了深入的研究分析。并从预测模型的四个方面对研究方法进行了探讨,首先是数据集的构建;特征提取方面对现有的基于蛋质序列特征提取方法包括基于氨基酸组成,耦联组合,伪氨基酸组成等等进行了分析对比;分类模型方面对目前研究者们常用的分类模型进行了研究;并分析比较了各种评估指标。
  接着在前面的研究分析基础上,本文提出了一种新的序列特征提取方法,该方法基于Chou-Fasman参数的数据特征,还包括了蛋白质序列的氨基酸组成、氨基酸的疏水特性、极性和部分氨基酸偶联体数据。该方法可以很好的降低这些数据的冗余,避免了部分数据对结果的负面影响。在所提取的特征基础上,运用支持向量机模型,运用留一法,较好的预测了一个由639条蛋白质数据构成的数据集的结构类,证明了该方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号