首页> 中国专利> 一种建立核心种质研究群体的计算机模拟方法

一种建立核心种质研究群体的计算机模拟方法

摘要

本发明提供一种建立核心种质研究群体的计算机模拟方法,包括以下步骤:田间小样本实际数据的获取,考察记录一系列田间数量性状数据;计算每个性状的均值M和标准差S;将实际群体个体数根据需要扩大为N倍,得到模拟群体初步规模;利用构造正态分布伪随机数方法,根据每个性状的标准差S,在计算机中模拟出性状数目和实际群体相同但大小为N的随机数群体,且均值为0,标准差为将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M,得到初步模拟群体P;将该初步模拟群体P的个体随机删除n%,得到模拟群体p。本发明不需考虑数量性状基因层面的问题,减少了盲目性,减小了成本,也避免了构建的模拟群体脱离实际的风险。

著录项

  • 公开/公告号CN102982228A

    专利类型发明专利

  • 公开/公告日2013-03-20

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN201210270088.X

  • 发明设计人 胡晋;王建成;关亚静;徐盛春;

    申请日2012-08-01

  • 分类号G06F19/00(20060101);

  • 代理机构33100 浙江杭州金通专利事务所有限公司;

  • 代理人王雪

  • 地址 310058 浙江省杭州市西湖区余杭塘路866号

  • 入库时间 2024-02-19 17:47:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-19

    未缴年费专利权终止 IPC(主分类):G06F19/00 授权公告日:20160928 终止日期:20180801 申请日:20120801

    专利权的终止

  • 2016-09-28

    授权

    授权

  • 2013-04-17

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20120801

    实质审查的生效

  • 2013-03-20

    公开

    公开

说明书

技术领域

本发明属于植物育种中的种质资源研究领域,具体涉及一种建立核心种质研究群体的计算机模拟方法。 

背景技术

丰富的种质资源是育种工作能够顺利开展的必要条件。种质资源的征集保存对作物新品种的选育、特异种质材料的利用以及种质创新具有重要意义。世界各地育种机构近百年来相继建立了众多种质资源库,不断搜集和保存各类种质资源。然而,随着种质资源的不断搜集,种质资源库变得越来越大,庞大的种质资源规模给保存、评价、研究和利用带来了众多困难。近年来,核心种质研究越来越受到广泛重视。核心种质(core collection)是用科学方法,从整个种质资源中选择一部分样本,以最小的遗传资源数量,尽可能最大限度的代表整个遗传资源的多样性。原始群体中未包含在核心种质中的种质材料并不被丢弃,而是被用做核心种质的补充,称为保留种质(reserve collection)。建立核心种质的目的是为了对其进行优先评价和利用,从而提高整个种质资源库的管理和利用水平。构建核心种质是研究和利用植物遗传资源的便捷途径,受到了世界各国的广泛重视。 

核心种质是种质资源研究的新领域,其构建方法还在不断摸索与完善中。核心种质构建策略通常包括分组方法、取样方法、取样比例、评价方法等。在核心种质构建策略研究中,常采用作物田间农艺性状测得的数据构建研究群体。然而,作物农艺性状多为数量性状,表现型值易于受环境影响导致测量不准确,经常会影响核心种质构建结果的有效性。因此,许多学者采用计算机模拟群体进行核心种质研究,取得了一系列重要成果。将计算机模拟应用于核心种质研究,不但能够节省大量的人力物力,而且模拟群体不受传统试验环境误差的影响,可以得到更加稳健可靠的结果。传统的种质资源群体模拟方法,常基于人为设置数量性状微效基因型值构建模拟群体。然而,人为设置数量性状微效基因型值有很大的盲目性,构建的模拟群体容易脱离实际,常常会导致核心种质构建策略研究得到错误的结论。 

发明内容

针对上述现有技术存在的问题,本发明提供一种基于田间小样本实际数据的计算机模拟构建核心种质研究群体的方法。为实现上述目的,本发明通过以下技术方案实现。 

一种建立核心种质研究群体的计算机模拟方法,包括以下步骤: 

(1)田间小样本实际数据的获取,将8~30个种质资源样品田间种植。根据种质资源本身特点参考“植物新品种特异性、一致性和稳定性测试国家标准”确定种植方案。 

考察记录一系列田间数量性状数据,考察的性状为8-15个。数量性状因种质资源本身特点而异,应选择变异幅度相对较大的性状进行记录,如株高、生育期、产量等。 

(2)基于田间小样本实际数据模拟核心种质研究群体包括以下步骤: 

1)计算每个性状的均值M和标准差S。 

2)将实际群体个体数根据需要扩大为N倍,得到模拟群体初步规模。 

3)利用常用的构造正态分布伪随机数方法,根据每个性状的标准差S,在计算机中模拟出性状数目和实际群体相同但大小为N的随机数群体(随机化标准差群体),群体中每个性状均满足正态分布,且均值为0,标准差为 

4)将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M,得到初步模拟群体P。 

5)将该初步模拟群体P的个体随机删除n%,得到最终的模拟群体p。 

其中,在步骤(2)的2)中,所述N倍的选择在于:构建核心种质之前,通常要进行分组,将所有样品按生态区、地理起源、植物学分类等分成一系列群体,然后在各个群体内构建核心种质,最后将所有核心种质整合。因此,分组后用于核心种质研究的群体规模通常在100~2000之间,据此来确定N的大小。 

其中,在步骤(2)的5)中,所述n%的选择在于:为了使模拟群体更加接近实际情况,将初步模拟群体P的个体随机删除n%,这里n%的范围通常为总数的十分之一到五分之一(10%~20%)。 

本发明与现有技术相比具有以下优点: 

本发明在构建核心种质模拟群体过程中,不需考虑数量性状基因层面的问题,减少了盲目性,避免了构建的模拟群体脱离实际的风险。 

本发明投入较少的成本采用田间种植种质资源小样本的方式获得基础模拟数据。小样本使得控制田间环境条件的难度大大降低,使得测量的田间数量性状数据可靠性大大 增加,进而使模拟群体更加接近真实情况。 

具体实施方式

下面给出本发明的较佳的实施例,这些实施例并非限制本发明的内容。 

实施例1

9个大棚毛豆品种(购于浙江省杭州市石桥路种子市场)测定12个数量性状(单株有效荚数、3粒荚数、2粒荚数、1粒荚数、3粒荚比例、2粒荚比例、1粒荚比例、豆荚长、豆荚宽、小区产量、调整小区产量和折合亩产),计算出每个性状的均值M和标准差S(表1)。将规模为9的实际群体大小扩大15倍,得到模拟群体初步规模为135。然后,利用常用的构造正态分布伪随机数方法,根据每个性状的标准差S,在计算机中模拟出包含12个性状135个体的随机化标准差群体,群体中每个性状均满足正态分布,且均值为0,标准差为 再将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M,得到初步模拟群体P(表2)。最后将初步模拟群体P随机删除20%的个体,得到包含108个体的大棚毛豆品种模拟群体。 

用目前较为有效的最小距离逐步取样法在模拟群体中抽取核心种质。最小距离逐步取样法需要结合有效的遗传距离和取样比例才能构成完整的核心种质构建策略。本实施例采用了5种常用遗传距离(欧氏距离、马氏距离、曼哈顿距离、夹角余弦距离和相关系数距离)和从小到大8个取样比例(5%、10%、15%、20%、25%、30%、35%、40%)来筛选有效的大棚毛豆核心种质构建策略。采用目前国际上常用的2种评价参数(极差符合率和变异系数变化率)评价核心种质的代表性。具体步骤为:采用最小距离逐步取样法在每个遗传距离和每个取样比例上均构建一次核心种质,计算极差符合率和变异系数变化率的值,结果汇总成表3。 

结果表明:欧氏距离在不同取样比例下均表现为极差符合率和变异系数变化率最高。15%取样比例下,欧氏距离构建核心种质的极差符合率超过85%;25%取样比例下,欧氏距离构建核心种质的极差符合率超过95%。因此,大棚毛豆核心种质构建过程中,欧氏距离为最佳遗传距离,15%以上为有效取样比例,25%为最佳取样比例(表3)。 

表19个大棚毛豆品种12个数量性状的测定值、均值和标准差 

注:夹数单位为(个),长度单位为(厘米),产量单位为(千克) 

表2大棚毛豆品种初步模拟群体P 

注:夹数单位为(个),长度单位为(厘米),产量单位为(千克) 

表3大棚毛豆群体在不同遗传距离和不同取样比例下构建核心种质的评价参数 

实施例2

12个大田毛豆品种(购于浙江省杭州市石桥路种子市场,其中8个包含于实施例1中的品种既适合大田种植也适合大棚种植)测定13个数量性状(单株有效荚数、3粒荚数、2粒荚数、1粒荚数,3粒荚比例、2粒荚比例、1粒荚比例、豆荚长、豆荚宽、3粒百荚鲜重、2粒百荚鲜重、百粒鲜重和百荚鲜重),计算出每个性状的均值M和标准差S(表4)。将规模为12的实际群体大小扩大15倍,得到模拟群体初步规模为180。然后,利用常用的构造正态分布伪随机数方法,根据每个性状的标准差S,在计算机中模拟出包含13个性状180个体的随机化标准差群体,群体中每个性状均满足正态分布,且均值为0,标准差为 再将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M,得到类似实施例1的表2的初步模拟群体P。最后将初步模拟群体P随机删除20%的个体, 得到包含144个体的大田毛豆品种模拟群体。 

采用同实施例1相同的取样方法、遗传距离、取样比例和评价参数,利用包含144个体的大田毛豆品种模拟群体研究核心种质构建策略,结果汇总成表5。 

结果表明:欧氏距离在不同取样比例下均表现为极差符合率和变异系数变化率最高。10%取样比例下,欧氏距离构建核心种质的极差符合率超过85%;25%取样比例下,欧氏距离构建核心种质的极差符合率超过95%。因此,大田毛豆核心种质构建过程中,欧氏距离为最佳遗传距离,10%以上为有效取样比例,25%为最佳取样比例(表5)。 

表412个大田毛豆品种13个数量性状的测定值、均值和标准差 

注:夹数单位为(个),长度单位为(厘米),重量单位为(克) 

表5大田毛豆群体在不同遗传距离和不同取样比例下构建核心种质的评价参数 

实施例3

15个豌豆品种(购于浙江省杭州市石桥路种子市场)测定9个数量性状(单株荚数、每荚粒数、豆荚长、豆荚宽、豆荚厚、百荚鲜、百粒鲜重、亩产量和小区产量),计算出每个性状的均值M和标准差S(表6)。将规模为15的实际群体大小扩大15倍,得到模拟群体初步规模为225。然后,利用常用的构造正态分布伪随机数方法,根据每个性状的标准差S,在计算机中模拟出包含9个性状225个体的随机化标准差群体,群体中每个性状均满足正态分布,且均值为0,标准差为 再将随机化标准差群体每个个体均加上实际数据测得的对应性状均值M,得到类似实施例1的表2的初步模拟群体P。最后将初步模拟群体P随机删除20%的个体,得到包含180个体的豌豆品种模拟群体。 

采用同实施例1相同的取样方法、遗传距离、取样比例和评价参数,利用包含180个体的豌豆品种模拟群体研究核心种质构建策略,结果汇总成表7。 

结果表明:马氏距离在不同取样比例下均表现为极差符合率和变异系数变化率最高。10%取样比例下,马氏距离构建核心种质的极差符合率超过85%;20%取样比例下,马氏距离构建核心种质的极差符合率超过95%。因此,豌豆核心种质构建过程中,马氏距离为最佳遗传距离,10%以上为有效取样比例,25%为最佳取样比例(表7)。 

表6 15个豌豆品种9个数量性状的测定值、均值和标准差 

注:夹数单位为(个),长度单位为(厘米),重量单位为(克),产量单位为(千克) 

表7豌豆群体在不同遗传距离和不同取样比例下构建核心种质的评价参数 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号