首页> 中国专利> 使用机器学习对蛋白质和其它序列定义的生物分子进行进化数据驱动设计的方法和设备

使用机器学习对蛋白质和其它序列定义的生物分子进行进化数据驱动设计的方法和设备

摘要

提供了一种用于使用数据驱动的基于进化的过程设计序列定义的生物分子诸如蛋白质的方法和设备。为了设计蛋白质,建立在基于无监督序列的模型与基于监督功能性的模型的组成之上的迭代方法可以选择可能具有所需功能性的候选氨基酸序列。将使用高通量基因合成和蛋白质筛选过程测量候选蛋白质的反馈用于精细化和改善将候选者选择引导到非常大的氨基酸序列搜索空间中最有希望的区域的模型。基于无监督序列的模型可以是例如受限玻尔兹曼机、变分自编码器、生成对抗网络、统计耦合分析或直接耦合分析模型。基于监督功能性的模型可以基于通过使用例如多变量线性回归、支持向量回归、高斯过程回归、随机森林或人工神经网络拟合所述高通量测定的测量值在无监督模型的减维的潜在空间中生成功能性前景。

著录项

  • 公开/公告号CN114651064A

    专利类型发明专利

  • 公开/公告日2022-06-21

    原文格式PDF

  • 申请/专利权人 芝加哥大学;

    申请/专利号CN202080078092.9

  • 发明设计人 R·兰加纳坦;A·费古森;

    申请日2020-09-11

  • 分类号C12N15/00;C12N15/09;C12N15/10;C40B10/00;C40B30/00;C40B40/06;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人权陆军;彭昶

  • 地址 美国伊利诺伊州

  • 入库时间 2023-06-19 15:43:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-21

    公开

    国际专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号