首页> 中国专利> 一种水稻SNP位点的筛选方法以及鉴定水稻品种的方法

一种水稻SNP位点的筛选方法以及鉴定水稻品种的方法

摘要

本发明公开了一种水稻SNP位点的筛选方法以及鉴定水稻品种的方法,涉及生物分子技术领域,本申请提出在筛选用于鉴定水稻品种的SNP位点前,先对用于获取SNP位点的水稻样本进行过滤,先过滤掉非核心群体样本后,再对SNP位点进行筛选和检测,这样能够显著提高SNP位点对于鉴定和分析特定水稻品种的针对性和有效性,为特定水稻品种的有效鉴定以及水稻优质异种基因图谱的构建提供了途径。

著录项

说明书

技术领域

本发明涉及生物分子技术领域,具体而言,涉及一种水稻SNP位点的筛选方法以及鉴定水稻品种的方法。

背景技术

籼稻和粳稻是普通栽培稻分化最为深刻和最为主要的两个方向。一般而言,籼稻与粳稻在形态上及地理分布上都有很大的差异。在漫长的水稻种植过程中形成了南籼北粳的布局。但随着现代育种进程的加快,亲和基因的发现与种间杂种优势不断利用,使得籼粳之间的界限变得越来越模糊。

新的形势下对籼粳鉴定提出了新的要求。目前,稻谷的收购价在籼稻、粳稻之间存有差异,市场上一般采用观察粒形来区分籼稻和粳稻,但这并不准确,对于越来越多的籼粳杂交后代,对其进行分类显得尤为重要。

鉴于此,特提出本发明。

发明内容

本发明的目的在于提供一种水稻SNP位点的筛选方法以及鉴定水稻品种的方法。

本发明是这样实现的:

第一方面,本发明实施例提供了一种水稻SNP位点的筛选方法,其包括:基于N例水稻样本基因组的信息,获得水稻的SNP候选位点,N≥2;所述N例水稻样本为去除非核心群体样本后的样本;对所述SNP候选位点进行筛选,获取用于鉴定水稻品种的目标位点。

第二方面,本发明实施例提供了一种鉴定水稻品种的方法,其包括对待检测水稻样本的目标位点进行检测,所述目标位点如前述实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

第三方面,本发明实施例提供了一种用于鉴定水稻品种的试剂盒,其包括:用于检测目标位点基因型的试剂;所述目标位点如前述实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

第四方面,本发明实施例提供了检测目标位点基因型的试剂在制备用于区分或鉴定水稻品种的试剂盒中的应用,所述目标位点如前述实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

本发明具有以下有益效果:

本申请提出在筛选用于鉴定水稻品种的SNP位点前,预先对用于获取SNP位点的水稻样本进行过滤,先过滤掉非核心群体样本后,再对SNP位点进行筛选和检测,这样能够显著提高SNP位点对于鉴定和分析特定水稻品种的针对性和有效性,为特定水稻品种的有效鉴定以及水稻优质异种基因图谱的构建提供了途径。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为染色体水平的样本筛选规则示意图;

图2为实施例1中筛选前水稻样品各染色体在PC1轴的分布图;

图3为实施例1中筛选后水稻样品各染色体在PC1轴的分布图;

图4为实施例1中筛选前后,水稻样品全基因组水平在PC1,PC2,PC3轴的分布图;

图5为试验例1中水稻样品筛选前后Hp分布曲线差异;

图6为试验例1中筛选前后获得的SNP数量和基因数量的差异。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。

本发明提供了一种水稻SNP位点的筛选方法,其包括:基于N例水稻样本基因组的信息,获得水稻的SNP候选位点,N≥2,所述N例水稻样本为去除非核心群体样本后的样本;对所述SNP候选位点进行筛选,获取用于鉴定水稻品种的目标位点。

本文中的“N例水稻染色体和/或基因组的数据”可以通过现有的基因数据库或自己检测的方式获取,基于样本基因组信息获得SNP位点的方法可基于现有技术获得,不再赘述。

水稻育种中常用杂交水稻育种的方式进行新品种的选育,由于育种目标和选育代数等差异,在育成的水稻品种中,部分样品会存在较多的杂合基因型,本发明将这样的杂合基因型定义为“非核心群体样本”,包括非核心群体籼稻和非核心群体粳稻。

目前,基于常规的筛选方法获得的SNP候选位点无法有效的反应特定水稻品种的特异性,筛选获得的位点也无法有效地对其进行鉴定和研究。因此,对水稻样品做精细筛选有其必要性,对杂交水稻的样本进行去除,获得特定水稻品种的核心位点。

在优选的实施方式中,N≥10;N≥50;N≥100。样本量越大,结果则越具备说服力。

在优选的实施方式中,所述去除非核心群体样本的步骤包括:分别对N例水稻样本的每条染色体进行PCA分析,将N例样本分为2个群体,以PC1轴中两个群体的中点为中心(基线),将PCA分分布图中距离中心最近的1%~10%的样本对应的染色体标记为混合类型。水稻具有12条染色体,分别对每条染色体进行PCA分析后,当1例样本被标记的染色体的条数≥2次,则将该样本过滤去除,不用于后续的SNP位点筛选。

在优选的实施方式中,所述SNP候选位点为非同义突变的SNP位点(Non-Synonymous SNP)。SNP包括基因间区SNP、基因非编码区SNP和基因编码区SNP,基因编码区SNP包括非同义突变和同义突变,对于不引起编码氨基酸变化的即为同义突变,引起氨基酸变化的则为非同义突变。这样的SNP更具代表性,SNP的改变导致了密码子编码氨基酸的变化,从而导致了蛋白序列的变化和三维结构的变化,对基因功能有直接的影响。

在优选的实施方式中,对所述SNP候选位点进行筛选的步骤包括:计算所述SNP候选位点在群体中的杂合度分数Hp,将小于Hp设定阈值的位点作为标记为初始的目标位点。

杂合度分数Hp是用于评估基因多态性和研究全体遗传学的参数,其的计算公式如下:

H

其中,Σn

Hp的范围是0~0.5,当Hp等于0.5时,表示Σn

优选地,所述Hp设定阈值为0.001~0.05;更优选地,所述Hp设定阈值为0.001~0.005,相对于其他Hp值而言,基于本申请设定的Hp设定阈值筛选获得的SNP位点能够更加稳定准确地实现特定水稻品种的鉴定,为特定水稻品种的有效鉴定和构建水稻优异种基因图谱提供了途径。

在优选的实施方式中,获取所述初始的目标位点后,对所述SNP候选位点进行筛选的步骤还包括:将编码区中的SNP位点均为所述初始的目标位点的基因标记为目标基因,获取所述目标基因编码区中SNP位点作为最终的目标位点。这样设置的好处在于:能够将不同水稻品种中更具代表性的位点和基因筛选出来,包含目标位点和普通SNP位点的基因对于水稻品种的鉴定仍然不太具备代表性,这样的情况SNP可能不足以导致基因功能的变化,对编码区中SNP均为初始的目标位点的基因进行标记,从而获得所有目标基因中的初始目标位点作为最终的目标位点,能够显著提高最终获得的SNP位点有效性和针对性。在优选的实施方式中,所述水稻选自籼稻和粳稻中的至少一种。

本发明实施例还提供了一种鉴定水稻品种的方法,其包括对待检测水稻样本的目标位点的基因型进行检测,所述目标位点如前述实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

在优选的实施方式中,所述水稻品种包括籼稻和粳稻中的至少一种。

本发明实施例还提供了一种用于鉴定水稻品种的试剂盒,其包括:用于检测目标位点基因型的试剂;所述目标位点如前述任意实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

在可选的实施方式中,所述试剂的种类可以为引物对、探针和基因芯片中的至少一种。

此外,本发明实施例还提供了检测目标位点基因型的试剂在制备用于区分或鉴定水稻品种的试剂盒中的应用,所述目标位点如前述任意实施例所述的水稻SNP位点的筛选方法筛选获得的目标位点。

在优选的实施方式中,所述水稻选自籼稻和粳稻中的至少一种。

以下结合实施例对本发明的特征和性能作进一步的详细描述。

实施例1

提供一种筛选水稻核心SNP位点的方法,其包括以下步骤。

1、数据获取

选取NCBI(NCBI公共测序数据数据库,网址:https://www.ncbi.nlm.nih.gov/sra/)公开的水稻基因组DNA测序数据,其中选择Illumina测序平台包括的44697份测序数据,占总数据量的99.62%。

2、SNP检测

SNP检测采用bwa(版本不限,http://bio-bwa.sourceforge.net/)比对软件对双末端序列进行比对,比对选择aln策略或mem策略,参数选择默认参数。使用samtools(版本不限,http://samtools.sourceforge.net/)对比对的序列进行整理排序,使用GATK(版本不限,https://software.broadinstitute.org/gatk/)进行SNP检测,共检测出3.07M个SNP位点。

3、PCA分析与样品筛选

PCA分析采用PLINK(版本v1.9或更高,http://www.cog-genomics.org/plink/1.9/)和Genome-wide Complex Trait Analysis(GCTA)(版本不限,http://cnsgenomics.com/software/gcta/)进行对检测出的SNP位点进行分析。分析过滤MAF<0.05(MAF为最小等位基因频率)的SNP位点后,分别对12条水稻染色体进行PCA分析。在染色体水平,PCA分析结果在PC1坐标轴上将水稻分为2个群体,结合水稻样品信息观察,2个群体分别为籼稻群体和粳稻群体。根据PC1坐标轴上的样品分布情况,部分水稻品种零散分布在籼稻和粳稻群体之间,结合进化树分析这部分水稻品种认为是混合类型(杂交品种,非核心群体籼稻或非核心群体水稻)。为减少混合类型水稻品种对后续分析的干扰,采用python程序对品种进行过滤,过滤/筛选的规则可参照图1,基于水稻样本染色体水平的PCA分布图的分析结果,定义籼稻和粳稻PCA分布中,PC1轴的中点为中心(虚线),定义最靠近中心位置的10%的样本为所在染色体的非籼稻和/或非粳稻核心群体样品。如果某一样品具有2条以上的染色体被标记为非核心群体类型,则该水稻样本被过滤,不用于后续分析。经上述样品过滤策略,选出核心籼稻群体品种1205种,粳稻核心样品群体655种。

本实施例中,筛选前水稻样品各染色体在PC1轴的分布图可参照图2,筛选后水稻样品各染色体在PC1轴的分布图参照图3。筛选前后,水稻样品全基因组水平在PC1,PC2,PC3轴的分布图见图3。

4、Hp和Fst分析

Hp表示pooled heterozygosity score:H

Fst(固定系数)采用R语言软件包hierfstat(版本:0.04-22,https://cran.r-project.org/web/packages/hierfstat/index.html),Fst值的范围是0~1,0表示该基因型完全没有被固定,在不同群体中的碱基比例相同(对应各群体的Hp等于0.5),Fst值等于1表示两个群体间的基因型完全不相同(对应各群体的Hp等于0,且两个群体的基因型不相同)。

5、标记目标位点和目标基因

编码基因的筛选根据Nipponbare(MSU7.0)的基因注释信息,统计每个基因编码区中,非同义突变SNP位点的Hp值。如果该基因的所有非同义突变SNP位点在籼稻群体或粳稻群体的Hp值都小于0.001(Hp设定阈值)且Fst值大于等于0.95,则该基因判定为在籼稻和粳稻中同时受选(标记为目标基因);如果该基因的所有改变氨基酸的SNP位点仅在粳稻的Hp值小于0.001而Fst值小于0.95,判定为粳稻受选基因;如果该基因的所有改变氨基酸的SNP位点仅在籼稻的Hp值小于0.001而Fst值小于0.95,判定为籼稻受选SNP位点(目标位点)。

总共筛选出2459个籼稻和粳稻同时受选的SNP位点(在1226个基因中),1788个粳稻受选SNP位点(在1389个基因中)和828个籼稻受选SNP位点(在828个基因中),合计5636个SNP位点,对应3224个编码基因。

6、基因芯片特异引物设计

根据SNP位点所在旁侧序列,根据碱基互补配对原则,对每个SNP位点设计特异的短DNA序列。方法如下:采用Primer3在SNP位点两侧设计引物序列,要求其中一条引物序列距离SNP位点的距离小150bp,SNP位点距离引物3’末端的距离大于10bp,保证扩增的序列可以被150bp读长的高通量测序测到,且不受引物序列的干扰。扩增长度不大于500bp。

引物设计完成后,采用blastn(版本不限)比对软件,将引物序列对比对到参考基因组,在相似性大于95%,且3’末端最后3个碱基完全匹配的情况下,上下游引物中至少有一条特异结合到SNP目标区域,如果不符合,重新设计引物。

实施例2

提供一种筛选水稻核心SNP位点的方法,大致与实施例1相同,区别在于:省略了步骤3:PCA分析与样品筛选。

实施例3

提供一种筛选水稻核心SNP位点的方法,大致与实施例1相同,区别在于:Hp设定阈值<0.05。

实施例4

提供一种筛选水稻核心SNP位点的方法,大致与实施例1相同,区别在于:Hp设定阈值<0.01。

实施例5

提供一种筛选水稻核心SNP位点的方法,大致与实施例1相同,区别在于:Hp设定阈值<0.1。

实施例6

提供一种筛选水稻核心SNP位点的方法,大致与实施例1相同,区别在于:在步骤5中,对基因编码区的所有SNP位点(同义突变的和非同义突变的)进行Hp值的分析和筛选,将符合设定阈值的位点作为最终的受选位点/目标位点。

试施例1

基于实施例1(筛选后)和实施例2(筛选前或未经筛选)提供的核心SNP位点的筛选方法进行实验。并比较实施例2和实施例1籼稻和粳稻的SNP位点数量的Hp值分布曲线,在样品筛选前的Hp分布曲线中,籼稻和粳稻Hp分布曲线的最大值不等于0,主要是由非核心群体样品干扰所致,导致最大值右移,见图5,结果显示,筛选前和筛选后的曲线与筛选前出现明显变化。

检测出的受选SNP位点和对应的基因数量的差别见图6。结果显示,在筛选前,仅显示极少数基因出现籼稻和粳稻同时受选,少部分基因为籼稻受选或粳稻受选。而在样品筛选后,无论是籼粳稻同时受选的基因还是籼稻和粳稻各自受选的基因,数量都大幅度提高,而提高的主要原因是去除了非核心籼稻粳稻样品的干扰得到的结果。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号