首页> 中国专利> 一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法

一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法

摘要

本发明公开了一种基于MeRIP‑Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法,包括:对所提取的绵羊肺脏组织RNA依次进行RNA免疫沉淀、文库构建和测序;对测序得到的原始数据进行质控过滤得到高质量数据,将该高质量数据与绵羊参考基因组比对得到具有唯一比对位置的数据,将该唯一比对位置的数据进行可视化分析;根据上述唯一位置的数据进行m6A甲基化修饰的peak鉴定和注释,得到peak相关基因;对差异m6A甲基化修饰基因进行鉴定,对差异peak相关基因进行GO与KEGG功能富集分析;根据所鉴定的结果,选择10个基因使用MeRIP‑qPCR方法对MeRIP‑Seq富集和测序结果进行验证。本发明首次从表观遗传角度出发,将m6A甲基化修饰与藏绵羊高原低氧适应性联系起来,为藏绵羊生产和品种培育提供重要的理论依据。

著录项

说明书

技术领域

本发明属于生物技术领域,尤其涉及一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法。

背景技术

高原环境是动物生产最具有挑战的不利条件之一,而高原低氧又是诸多环境因子中最关键的因子之一。高原低氧环境会直接或间接影响动物生理、生产和健康等。在生理上表现为喘息、血管扩张快和血液指标变化等;在生产上表现为繁殖力低和体重增长慢等;在健康上表现为免疫力和抗病力下降等。怕高寒和惧低氧是绵羊重要的生物学特性。青藏高原作为藏绵羊的中心产区,扎什加羊产区位于青海省玉树州曲麻莱县麻多乡扎什加村和巴颜村,平均海拔在4500m以上,在高原低氧状态下,藏绵羊的机体内哪个或哪些基因和代谢通路是如何发挥调控作用以进行调节和适应是非常值得深入去研究的。

现有多项研究中,通过将缺氧与mRNA中m

一旦海拔高度(氧气含量)高于(低于)动物最适生理范围时就会产生严重应激,进而影响其生产性能。越来越多的证据表明DNA甲基化修饰在动物高原低氧适应性过程中发挥重要调节作用,同样转录组层面的m

发明内容

本发明的目的在于提供一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法。

本发明是这样实现的,一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法,该方法包括以下步骤:

(1)对所提取的绵羊肺脏组织RNA依次进行RNA免疫沉淀、文库构建和测序;

(2)对测序得到的原始数据进行质控过滤得到高质量数据,将该高质量数据与绵羊参考基因组比对得到具有唯一比对位置的数据,将该唯一比对位置的数据进行可视化分析;

(3)根据上述唯一比对位置的数据中进行m

(4)对差异m

(5)根据所鉴定的结果,选择10个基因使用MeRIP-qPCR方法对MeRIP-Seq富集和测序结果进行验证。

优选地,在步骤(2)中,对测序得到的原始数据通过FASTQ软件进行质控过滤得到高质量数据;

将该高质量数据通过Bowtie2软件比对到绵羊的核糖体数据库中,通过Bowtie2软件去除比对上核糖体RNA的数据,将该数据比对到绵羊参考基因组上得到具有唯一比对位置的数据。

优选地,步骤(3)包括以下具体步骤:

3A、使用MACS2软件在全基因组范围内进行peak扫描(peak calling),阈值为Qvalue<0.05,其中,组内重复样本间的peak进行过滤,保留overlap>50%的共有peak进行后续分析;如果组内有两个生物学重复,则保留的peak必须在两个样本中都出现;如果组内有三个生物学重复,则保留的peak必须在至少两个样本中都出现;

3B、使用DiffBind软件进行组间peak的合并,得到各个处理组间peak的并集,并计算各个peak在各个样本中的丰度,根据peak在基因组上的区域信息及基因的注释信息,得到peak相关基因。

优选地,步骤(4)包括以下步骤:

4A、利用MeRIP数据与Input数据,计算每个peak的相对甲基化率,然后用exomePeak软件对组间的所有peak进行RNA甲基化率差异分析,利用FDR值与log2FC(log2fold change,log2差异倍数)来筛选差异peak,筛选条件为FDR<0.05且|log2FC|>1,对差异peak相关基因进行GO与KEGG功能富集分析;

4B、使用DAVID数据库对差异peak关联的基因进行GO功能富集分析,利用超几何分布检验计算GO功能显著富集的p值,再对p值进行Benjamini&Hochberg多重检验纠正,FDR≤0.05(False discovery rate,错误发现率)的GO terms被认为显著富集,使用KEGG数据库对差异peak关联基因进行Pathway的功能注释和归类,KEGG pathway功能富集方法同GO分析。

本发明克服现有技术的不足,提供一种基于MeRIP-Seq(Methylated RNAImmunoprecipitation,RNA甲基化免疫共沉淀)技术挖掘藏绵羊高原低氧适应性相关基因的方法,本发明选择高低海拔绵羊(扎什加羊和湖羊)各3只并采集肺脏组织进行表观转录组测序,运用MeRIP-Seq和生物信息学方法来探索藏绵羊适应高原低氧的分子机制,寻找与藏绵羊高原低氧适应性相关的基因及调控通路,为藏绵羊生产和品种培育提供理论依据。

相比于现有技术的缺点和不足,本发明具有以下有益效果:本发明首次从表观遗传角度出发,将m

附图说明

图1是藏绵羊和湖羊m

图2是m

图3是m

图4是藏绵羊和湖羊共有peak对应m

图5是是藏绵羊和湖羊差异表达peak和基因的鉴定;其中,图A是差异表达peak统计图;图B是差异表达基因火山图;

图6是m

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

方法实施例

本发明公开了一种基于MeRIP-Seq技术挖掘藏绵羊高原低氧适应性相关基因的方法,该方法包括以下步骤:

(1)对所提取的绵羊肺脏组织RNA依次进行RNA免疫沉淀、文库构建和测序

1A、本发明以高海拔(≥4500m,青海省玉树州曲麻莱县)的扎什加羊作为试验组,以低海拔(≤1500m,甘肃省武威市民勤县)的湖羊作为对照组。随机选择健康的1.5岁扎什加羊和湖羊各3只(公羊),进行屠宰并采集肺脏组织,保存于液氮中用于RNA提取。

1B、RNA提取和片段化

使用TRlzol Reagent(Invitrogen,美国)提取总RNA。使用mRNA纯化试剂盒(Ambion,美国)对总RNA进行两次纯化后得到mRNA,并用DNA酶(Promega,美国)去除基因组DNA。纯化后的mRNA随机打断成约100bp的短片段,并使用甲醛变性琼脂糖凝胶电泳和Nanodrop 2000(Thermo,美国)检测RNA、mRNA和片段化mRNA的完整性和浓度。

1C、RNA免疫沉淀(IP,Immunoprecipitation)、文库构建和测序

将片段化的mRNA分成两份,其中一份用作Input对照(即不做IP实验),直接构建转录组测序文库,用于消除抓取带有甲基化片段过程中的背景。另一份片段化的mRNA用m

使用

(2)对测序得到的原始数据进行质控过滤得到高质量数据,将该高质量数据与绵羊参考基因组进行比对得到具有唯一比对位置的数据,将该唯一比对位置的数据进行可视化分析

在步骤(2)中,Illumina测序结束后得到原始数据(Raw reads),使用FASTQ软件进行质控过滤低质量数据后得到高质量数据(Clean reads)。reads过滤的步骤为:1)去除含adapter的reads;2)去除含N比例大于10%的reads;3)去除全部都是A碱基的reads;4)去除低质量reads(质量值Q≤20的碱基数占整条read的50%以上)。

使用Bowtie2软件将Clean reads比对到绵羊的核糖体数据库中,去除比对上核糖体RNA的reads。使用Bowtie2软件将过滤后并去除比对上核糖体RNA的reads比对到绵羊参考基因组(Oar_v4.0)上,将比对到基因组上唯一位置的reads用于后续分析。将reads在每条染色体比对结果的bigwig文件导入Integrative Genomics Viewer(IGV)软件,进行全基因组、染色体甚至是单个碱基水平的可视化浏览。

(3)根据上述唯一位置的数据中进行m

3A、m

Peak(富集区域)鉴定是指从全基因组范围内寻找发生m

3B、差异m

利用MeRIP数据与Input数据,计算每个peak的相对甲基化率,然后用exomePeak软件对组间的所有peak(两组peak的并集)进行RNA甲基化率差异分析,利用FDR值与log2FC来筛选差异peak,筛选条件为FDR<0.05且|log2FC|>1。

(4)对差异m

在步骤(4)中,使用DAVID数据库对差异peak关联的基因进行GO功能富集分析。利用超几何分布检验计算GO功能显著富集的p值,再对p值进行Benjamini&Hochberg多重检验纠正,FDR≤0.05的GO terms被认为显著富集。使用KEGG数据库对差异peak关联基因进行Pathway的功能注释和归类,KEGG pathway功能富集方法同GO分析。

(5)根据所鉴定的结果,选择10个基因使用MeRIP-qPCR方法对MeRIP-Seq富集和测序结果进行验证

在步骤(5)中,根据MeRIP-Seq结果,选择10个基因使用MeRIP-qPCR方法(参考文献:Wang XX,Wu RF,Liu YH,Zhao YL,Bi Z,Yao YX,Liu Q,Shi HL,Wang FQ,Wang YZ.m

效果实施例

(1)测序数据概述

利用Illumina HiSeqTM 4000平台对构建的12个文库进行双端测序,数据质量控制和基因组比对结果如表1所示:

表1 MeRIP-Seq测序和比对数据概述

注:HS代表湖羊,TS代表扎什加羊

12个文库共产生554873296条Raw datas,数据质量控制后剩余474062728条Cleandatas,Clean datas平均比率为86.35%。12个文库GC含量在49.27~55.78%之间,符合碱基组成规律。Q20>93.96%,Q30>88.91%。利用Bowtie2软件将获得的Clean datas比对到绵羊参考基因组上(Oar_v4.0),约65.17%以上的reads可以精确的比对且匹配率较高。将唯一比对到绵羊参考基因组上的数据用于进一步的生物信息学统计分析。

(2)藏绵羊和湖羊m

利用MACS2软件从全基因组范围内寻找发生m

表2 6个样品的m

注:Total tags:peak总序列深度;Genome rate(%):peak基因组比对率(%)。

为了确定所鉴定m

(3)藏绵羊和湖羊m

对组内重复样本间的peak进行过滤,保留overlap>50%的共有peak进行后续的分析(组内有三个生物学重复,则保留的peak必须在至少两个样本中都出现)。为了探究绵羊m

通过组间peak合并后,湖羊和藏绵羊分别含有2843和2889个m

表3 m

为了解基因发生m

为了反映甲基化修饰程度的高低,进而统计了peak对应reads的分布情况。藏绵羊和湖羊在5’UTR和终止密码子附近甲基化修饰程度较高,且藏绵羊甲基化富集程度显著高于湖羊。

(4)藏绵羊和湖羊m

为了探究RNA甲基化修饰是否参与绵羊高原低氧适应性调控,本发明中对富含m

(5)藏绵羊和湖羊组间RNA甲基化率差异分析

利用exomePeak软件对藏绵羊和湖羊所有的peak进行RNA甲基化率差异分析,筛选条件为FDR<0.05且|log2FC|>1。藏绵羊和湖羊中总共有8个peak达到显著条件,其中7个上调表达,1个下调表达(如图5所示)。这些peak有效注释到的基因为SERBP1(SERPINE1 mRNAbinding protein 1,SERPINE1mRNA结合蛋白1)、PLVAP(plasmalemma vesicle-associatedprotein质膜小泡相关蛋白)、PARP2(poly ADP-ribose polymerase 2,ADP核糖聚合酶2)和TEX14(testis-expressed gene 14,睾丸表达基因14)。这4个差异表达基因显著富集到33个GO terms和2个KEGG pathway(Base excision repair和Apoptosis)中。

(6)藏绵羊高原低氧适应相关m

为了进一步发明这些含有m

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号