首页> 中国专利> 通过选取极端性状个体来进行全基因组选择育种的方法

通过选取极端性状个体来进行全基因组选择育种的方法

摘要

本发明公开了一种通过选取极端性状个体来进行全基因组选择育种的方法,对于某一数量性状,选取一部分性状表现上极端的个体,其中最高和最低的个体各占一半;构建估计群体,并进行估计群体性状测量;对极端性状参考群和估计群进行基因组测序和全基因组SNP标记挖掘;利用极端个体的表型值和基因型信息,计算每个SNP标记的育种效应值,并使用估计群全基因组分型,得到估计群个体的育种值,对估计群进行最终的选种。本发明尽可能少地牺牲基因组育种值估计准确度,节省大量的基因组测序费用;也通过极端群体降低了参考群体的大小对基因组选择准确度的影响,有利于样本珍贵的物种的相关研究,为基因组选择在各个物种上开展提供新的思路。

著录项

  • 公开/公告号CN105868584A

    专利类型发明专利

  • 公开/公告日2016-08-17

    原文格式PDF

  • 申请/专利权人 厦门胜芨科技有限公司;

    申请/专利号CN201610341966.0

  • 发明设计人 邱和松;

    申请日2016-05-23

  • 分类号

  • 代理机构

  • 代理人

  • 地址 361000 福建省厦门市集美区天英二里40号1002室之一

  • 入库时间 2023-06-19 00:19:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-26

    授权

    授权

  • 2016-10-12

    实质审查的生效 IPC(主分类):G06F19/24 申请日:20160523

    实质审查的生效

  • 2016-08-17

    公开

    公开

说明书

技术领域

本发明涉及生物信息学和基因组选择育种领域,具体是一种通过选取极端性状个体来进行全基因组选择育种的方法。

背景技术

育种是农业养殖中动植物繁育的重要内容,是优良品种培育和保持的重要方法。传统的人工育种是直接通过动植物的经济性状进行选种。由于农业上大多数的物种已经经历上长时间的人工选育,传统的人工选择的方法在现代农业很多物种的应用效果越来越有限。

随着动植物基因组和重要性状相关的基因定位和功能研究的深入,Meuwissen 等在2001年提出了利用全基因标记分型进行分子育种的方法,即基因组选择育种。全基因组选择本质上是一种基于全基因组范围内的标记辅助选择方法,其基本思想是:通过参考群体性状测定获得全基因组育种值,使用性状相关的 QTLs紧密连锁的 SNP 位点,应用统计学方法计算出每一个位点所对应的育种值大小; 然后再根据估计群体的个体的基因分型,对所要选择的个体进行全基因组育种值估计(genomicestimated breeding value, GEBV), 最后根据育种值的高低进行选择育种。

在基因组选择应用中需要两类群体:即参考群体和估计群体。基因组选择需要对参考群和估计群的个体进行全基因组的大量SNP分型。虽然现在有基因芯片和全基因组测序的生物基因可以用于大规模基因分型,但是上述芯片和测序费用昂贵,如果将所有参考群体都进行测序的话,成本是相当大的。因此,如果能够只测定一部分性状上有代表性的个体的基因型,就可以大大节省基因组选择的成本。本发明提出利用的极端性状的个体构建参考群,这样可以在低样本情况下挖掘到重要性状显著相关的SNP位点,利用这些位点对估计群进行基因组选择,从而大大降低基因组选择的测序费用。

发明内容

本发明的目的在于提供一种通过选取极端性状个体来进行全基因组选择育种的方法,通过性状测定获取每个参考群个体的表型值,然后只选取其中极端性状的部分的个体进行测序,从而降低对参考群体的测序费用,这些被测序的个体中,性能表现上最优和最差的个体各占一半,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种通过选取极端性状个体来进行全基因组选择育种的方法,对于某一数量性状,选取一部分性状表现上极端的个体,其中最高和最低的个体各占一半;构建估计群体,并进行估计群体性状测量;对极端性状参考群和估计群进行基因组测序和全基因组SNP标记挖掘;利用极端个体的表型值和基因型信息,计算每个SNP标记的育种效应值,并使用估计群全基因组分型,得到估计群个体的育种值,对估计群进行最终的选种。

作为本发明进一步的方案:所述的通过选取极端性状个体来进行全基因组选择育种的方法,具体包括以下步骤:

(1)选取极端性状的个体,构建极端性状参考群:

a.对所有估计群和参考群个体进行性状测量,获得所有个体的性状数据;

b.分析上述性状数据,通过统计分析和预先欲构建的极端群体参考群大小估计极端性状值范围;

c.根据极端性状值,确定组成极端性状参考群体的个体,其中最高和最低极端性状数目相等;

(2)构建估计群体,估计群体性状测量:

d.构建估计群体,保证估计群体的遗传背景尽量与参考群一致;

e.对估计群体的个体,依次测量其性状;

(3)对性状极端个体和估计群体进行基因组测序和全基因组SNP标记挖掘:

f.使用全基因组测序技术对极端性状参考群和估计群构建基因组测序文库;

g.使用高通量测序技术完成极端性状个体和估计群的基因组测序,并使用生物信息学技术获得参考群和估计群全基因组的SNP分型数据;

h.上述过程也能通过生物芯片高通量分型技术获得;

(4)计算每个SNP标记的育种效应值,对估计群进行育种值估计:

i.利用极端个体的表型值和基因型信息,加入到基于GBLUP、Bayes分析方法的基因组预测模型,计算每个SNP标记的育种效应值;

j.利用估计群全基因组分型结果和每个SNP的效应值,计算估计群每个个体的育种值;

k.对估计群个体按照育种值高低进行排列,选取育种高的个体进行育种。

作为本发明再进一步的方案:通过选择性状表现上极端的个体进行测序,从而预测估计群体的基因组育种值,通过只对部分个体进行测序,从而达到节省基因组测序费用的目的。

作为本发明再进一步的方案:将所有个体表型值进行排序,筛选其中表现最优和最差的极端个体作为参考群体。

作为本发明再进一步的方案:筛选出的个体中,最优和最差的个体各占一半。

作为本发明再进一步的方案:只对筛选出来的个体进行基因组测序,对其他个体不再进行测序。

与现有技术相比,本发明的有益效果是:

1.本发明能不增加任何额外费用的基础上,通过筛选性状表现最高和最低的个体构建参考群进行基因组测序,从而实现进行全基因组选择育种。

2.本发明在牺牲极少的GEBV估计准确度的基础上,能够节省大量的基因组的测序费用,为基因组选择的广泛应用实践提供了基础。

3.本发明的效果受全基因组分子标记数目和动植物物种的影响比较小,在一定程度上降低了参考群的规模,为难以获得大量样品的物种的相关研究带来了方便,为各种动植物基因组选择应用的开展提供了新的思路。

附图说明

图1为通过选取极端性状个体来进行全基因组选择育种的方法的流程图。

图2为通过选取极端性状个体来进行全基因组选择育种的方法中估计准确度在不同数量的极端选择个体和随机选择个体下的变化趋势图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1~2,本发明实施例中,一种通过选取极端性状个体来进行全基因组选择育种的方法,通过XII QTL-MAS会议提供的基因组选择数据包括如下步骤:

(1)试验群体和标记信息

试验群体为XII QTL-MAS(http://www.ncbi.nlm.nih.gov/pubmed/19278535?dopt=Abstract)研讨会上所使用的 模拟群体,所述群体分为参考群和估计群,其中参考群个体数为4665,估计群为1200,所模拟的性状遗传力为0.3,一共模拟6条染色体,共5726个SNP标记;

(2)极端性状参考群体的获得

将参考群体的4665个个体按照表型值由高到低进行排序,然后选择一部分极端的个体,其中表型值最高和最低的个体各占一半,为能够和极端个体的结果进行比较,也随机选择同样数量的随机个体作为对照,所筛选的个体数量分别从4000一直到500(分成8个组别,每个组别相差500个体);

(3)利用极端性状参考群体的性状和SNP分型数据获得SNP位点育种效应值

使用R和java程序,利用GBLUP算法实现SNP效应值的估算的方法,将筛选出来的个体表型和基因组SNP分型结果加入到基因组选择预测模型中,估计每个SNP位点的育种效应值;

(4)估计群个体育种值计算

利用估计群的基因型结果和SNP位点效应值,通过GBLUP算法预测估计群体的估计育种值(GEBV)。结合计算机模拟出的真实育种值(TBV),与GEBV做线性回归分析,评估GEBV的估计准确度。其中GEBV高的个体为用于繁育后代的亲本。

(5)分析实验结果,评估基于极端群体的基因组选择的选育效果

观察实验结果,以寻找最合适的极端个体比例作为后续实际生产中的标准,以图2为例,我们可以看到筛选极端个体,GEBV准确度随个体数下降的速度明显低于随机选择个体;当极端个体数量为2500时,所估计的GEBV准确度是所有个体估计出的GEBV准确度的97.1%,也就是说当牺牲不到3%的GEBV准确度进行基因组选择时,却可以节省46.4%的测序成本。在本实施例中,可以选择53.6%的极端个体进行基因组测序,从而节省大量的来自于参考群体的测序费用。

本发明通过将所有参考群个体中性状表现型最高和最低的个体筛选出来构建极端参考群,只对该部分个体进行基因组测序,进而获得估计群体的基因组育种值。由于只对部分个体进行测序,因此可以达到节省测序成本的目的。本发明的方法可以尽可能少地牺牲基因组育种值估计准确度,并且节省大量的基因组测序费用;同时本发明也通过极端群体降低了参考群体的大小对基因组选择准确度的影响,有利于样本珍贵的物种的相关研究,为基因组选择在各个物种上开展提供新的思路。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号