首页> 美国卫生研究院文献>BMC Bioinformatics >ProteinNet: a standardized data set for machine learning of protein structure
【2h】

ProteinNet: a standardized data set for machine learning of protein structure

机译:ProteinNet:用于蛋白质结构机器学习的标准化数据集

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundRapid progress in deep learning has spurred its application to bioinformatics problems including protein structure prediction and design. In classic machine learning problems like computer vision, progress has been driven by standardized data sets that facilitate fair assessment of new methods and lower the barrier to entry for non-domain experts. While data sets of protein sequence and structure exist, they lack certain components critical for machine learning, including high-quality multiple sequence alignments and insulated training/validation splits that account for deep but only weakly detectable homology across protein space.
机译:背景技术深度学习的飞速发展推动了其在生物信息学问题(包括蛋白质结构预测和设计)中的应用。在诸如计算机视觉之类的经典机器学习问题中,标准化数据集推动了进步,标准化数据集促进了对新方法的公正评估,并降低了非领域专家的进入门槛。尽管存在蛋白质序列和结构的数据集,但它们缺少某些对于机器学习至关重要的组件,包括高质量的多序列比对和绝缘的训练/验证拆分,这些拆分解释了整个蛋白质空间中的深度但仅是弱可检测的同源性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号