基于模糊支持向量机的蛋白质二级结构智能预测

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着人类基因组计划的完成，越来越多的蛋白质序列被测出，研究快速且有效的蛋白质二级结构预测算法已经刻不容缓。人们研究蛋白质结构的主要目的是为了研究蛋白质功能，了解蛋白质功能对生物制药、农业生物等领域具有重要意义。近年来，机器学习已经成为蛋白质二级结构预测的主流方法。本文在传统支持向量机(SVM)的基础上，改进了模糊支持向量机(FSVM)的隶属度函数，具体的研究工作如下:
　　1.本文首先考虑到具有相似的蛋白质一级结构序列往往具有相似的蛋白质二级结构，所以，提出一种蛋白质序列相似性比对方法，设置解离状态下的酸度(pKa(COOH))、解离状态下的碱性(pKa(NH3+)）、疏水性(Hy)这三个理化性质作为氨基酸残基的坐标，将氨基酸序列映射到三维空间，然后通过向量夹角余弦法度量两个蛋白质序列的相似程度。
　　2.利用点到类中心的距离设置隶属度能减少孤立点或噪声点，但没法有效的区分支持向量和噪声点，在此基础上，本文先将样本点映射到高维空间，然后在高维的环境下，结合K近邻算法，计算样本点与其周围样本点的紧密程度区分支持向量与噪声点、孤立点。
　　3.最后，本文新的蛋白质二级智能预测模型是将蛋白质序列相似性与FSVM算法结合的智能算法模型，先将测试集的蛋白质序列与pdb_full数据库的蛋白质序列进行相似性比较，当相似度大于0.9时就将pdb_full数据库中找到的蛋白质序列的二级结构作为测试集的二级结构，那些相似性低的氨基酸序列用FSVM模型预测。
　　改进的FSVM算法，在原有算法的基础上，将一些隶属度小的训练样本剔除，同时增加支持向量样本点的权重，排除噪声干扰，改进后的算法使准确度有了明显提高。用该算法与蛋白质序列相似性分析方法结合成的算法模型，实验结果发现其预测的准确率高于现有的使用机器学习的预测准确率。

著录项

作者
王静;
展开▼
作者单位

浙江理工大学;

展开▼
授予单位浙江理工大学;
学科电子与通信工程
授予学位硕士
导师姓名李重;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类蛋白质的二级结构;自动推理、机器学习;
关键词
蛋白质序列; 二级结构; 预测模型; 模糊支持向量机; 机器学习;

相似文献

中文文献
外文文献
专利

1. 基于优化的卷积神经网络的蛋白质二级结构预测 [J] . 赵亚武 ,刘毅慧 . 计算机应用与软件 . 2021,第007期
2. 基于长度信息和深度卷积神经网络分类建模的蛋白质二级结构预测方法 [J] . 朱树平 ,刘毅慧 . 计算机应用与软件 . 2021,第011期
3. 基于位点特异性打分矩阵的卷积神经网络预测SARS-CoV-2核衣壳蛋白的蛋白质二级结构 [J] . 钟琦 ,黄志鑫 ,陈晓舟 . 云南民族大学学报（自然科学版） . 2021,第001期
4. 基于生成对抗和卷积神经网络的蛋白质二级结构预测 [J] . 赵亚武 ,张华兰 ,刘毅慧 . 计算生物学 . 2020,第004期
5. 基于长短时记忆循环网络和基团特征的蛋白质二级结构预测 [J] . 韩心怡 ,刘毅慧 . 计算生物学 . 2020,第004期
6. 基于Profile和BP神经网络的蛋白质二级结构预测 [C] . 谢峰森 ,章勇 ,李剑 . 2011(第四届)全国网络与信息安全学术会议 . 2011
7. 基于神经网络的蛋白质二级结构预测研究 [A] . 赵子申 . 2021

基于模糊支持向量机的蛋白质二级结构智能预测

目录

摘要

著录项

相似文献

相关主题

期刊订阅