首页> 中国专利> 一种突变的COL4A5基因及其应用

一种突变的COL4A5基因及其应用

摘要

本发明公开了一种突变的COL4A5基因及其应用。一种用于检测Alport综合征的突变的COL4A5基因,COL4A5基因的突变使编码的IV型胶原α5第1371位丝氨酸突变为终止子,导致截短的IV型胶原α5链。本发明所述的突变的COL4A5基因或者所述的突变的IV型胶原蛋白α5链在制备AS检测试剂或检测设备中的应用。所述的检测设备进一步优选包括含有检测突变的COL4A5基因的基因芯片的检测平台。本发明提供了AS新的致病基因的致病位点,为该疾病的诊断提供了新的分子生物学基础。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-13

    授权

    授权

  • 2017-07-25

    实质审查的生效 IPC(主分类):C12N15/12 申请日:20170310

    实质审查的生效

  • 2017-06-30

    公开

    公开

说明书

技术领域

本发明属于生物医药领域,涉及一种突变的COL4A5基因及其应用。

背景技术

Alport综合征(alport syndrome,AS)是一种以进行性肾功能减退和肾小球基底膜结构异常伴神经性耳聋和眼病为临床特征的遗传性肾病。目前认为AS有三种遗传方式:X连锁显性遗传(XL;约占80%),常染色体隐性遗传(AR;约占15%)和常染色体显性遗传(AD;极少数),分别由编码Ⅳ型胶原不同α链的基因COL4A5(或COL4A5和COL4A6)、COL4A3和(或)COL4A4突变所致。

X连锁遗传致病基因有COL4A5(或COL4A5和COL4A6),COL4A5定位于Xq22,是与AS联系最紧密的基因,自第一个COL4A5突变发现以来,已有400多种基因突变在欧洲、亚洲地区和美国相继报道,突变类型多种多样。COL4A6和COL4A5基因头对头相邻位于X染色体上,有学者认为单独的COL4A6基因突变不会导致AS的发生。目前还没有发现COL4A6基因单独的变异的情况,COL4A6基因突变均伴有COL4A5基因异常,出现AS伴弥漫性平滑肌瘤。

常染色体遗传致病基因有COL4A3和(或)COL4A4。这些患者既可为该基因突变的复合杂合子或纯合子,又可为杂合子。文献报告的所检测得到的COL4A3基因突变均为点突变,且突变位置分布于整个基因、无明显的热点突变,突变类型多种多样。已报道的在AR的AS家系中发现的COL4A4基因突变也均为点突变,且突变位置分布于整个基因、无明显的热点突变,突变类型多种多样。

由于AS具有高度的临床和遗传异质性,传统的Sanger基因检测方法需要消耗大量的时间与成本。因此,开发高效、快捷、经济、可同时对多个已知致病基因进行突变检测的方法对其临床诊断非常重要。明确受检人的致病基因和突变,实现对AS的准确诊断、个性化治疗以及产前诊断。

发明内容

本发明的目的是针对AS,提供一种突变的基因COL4A5。

本发明的另一目的在于提供该基因在制备AS诊断试剂中的应用。

本发明的目的可通过如下技术方案实现:

一种用于检测Alport综合征的突变的COL4A5基因,COL4A5基因的突变使编码的IV型胶原α5第1371位丝氨酸突变为终止子,导致截短的IV型胶原α5链。

所述的突变的COL4A5基因,野生型COL4A5基因在Ensemble数据库中的基因编号为:ENSG00000188153,突变的COL4A5基因在物理位置107925013处碱基C缺失,导致移码框偏移,产生了提前的终止子,其他部分与野生型相同。

一种突变的IV型胶原蛋白α5链,野生型IV型胶原蛋白α5链在Ensemble数据库中的基因转录本编号为:NM_033380.2,突变的IV型胶原蛋白α5链在该野生型蛋白的第1371位氨基酸由丝氨酸突变为终止子,其他部分与野生型相同。

本发明所述的突变的COL4A5基因或者所述的突变的IV型胶原蛋白α5链在制备Alport综合征疾病检测试剂或检测设备中的应用。

所述的检测试剂优选:引物或引物对、探针、抗体、或核酸芯片中的一种或多种。

所述的检测设备进一步优选包括含有检测突变的COL4A5基因的基因芯片的检测平台。

一种检测Alport综合征的试剂盒,所述的试剂盒包括:

(a)检测COL4A5基因物理位置为107925013核苷酸位点的试剂;或检测IV型胶原α5链第1371位氨基酸位点的试剂;

(b)说明书。

所述的试剂优选引物或引物对、探针、抗体、或核酸芯片中的一种或多种。

所述的试剂进一步优选基于深度测序为平台的基因芯片杂交探针。

其中,检测COL4A5基因物理位置为107925013处核苷酸位点的杂交探针序列可以自行设计,也可以直接委托商业机构设计合成。这些探针序列的设计为本领域的常规技术。

一种以深度测序为平台筛查AS患者中COL4A5基因突变的方法,包括以下步骤:

(1)建立AS患者家系临床与遗传资源库,收集AS家系的临床资料及血液标本,提取基因组DNA;

(2)设计用于检测COL4A5基因突变的杂交探针,并将其整合到基因芯片上;

(3)利用制备的基因芯片捕获目标区域并进行深度测序;

(4)对测序结果进行优化的生物信息学分析,筛选到一个新的AS致病突变为COL4A5;NM_033380.2c.4112delC;p.Ser1371*。在基因水平上,该突变是位于X染色体上COL4A5基因的物理位置为107925013(Ensemble数据库)处的碱基C缺失;在RNA水平上,该突变导致COL4A5基因编码的RNA第4112位的碱基C缺失;在蛋白水平上,COL4A5基因编码蛋白第1371位氨基酸由丝氨酸突变为终止子。

其中,步骤(2)所述的基因芯片优选Roche-NimbleGen公司生产的基因芯片。

步骤(3)所述的利用制备的基因芯片捕获目标区域并进行深度测序优选利用美国Illumina公司的Hi-seq2000仪器完成。

步骤(3)步骤(3)所述的利用制备的基因芯片捕获目标区域并进行深度测序优选利用美国Illumina公司的Hi-seq2000仪器完成。

步骤(3)所述的利用制备的基因芯片捕获目标区域并进行深度测序优选流程为:将基因组DNA片段化,在DNA末端标记“A”并与Illumina PE接头-寡核苷酸混合物相连接;连接产物经PCR富集,获得DNA文库,并将DNA文库与已知致病基因捕获芯片杂交、洗脱、纯化,获得编码序列;创建配对末端,在Illumina HiSeqTM2000平台上对目标序列进行测序。

有益效果

1.AS是常见的、严重的导致终末期肾病的疾病。挖掘AS的新致病突变和新致病基因有利于进一步探索AS的分子遗传学病因,是充分利用我国的肾脏病科的AS资源,造福AS患者的现实需要,是后基因组时代最重要的研究方向之一。本专利旨在探索AS的遗传学病因,从而帮助了解发病机制、辅助临床诊断、产前诊断和转基因治疗。

2.大量研究证实,IV型胶原基因的突变能够引起AS,本专利的候选基因涵盖了4个已知致病的基因(COL4A3,COL4A4和COL4A5和COL4A6),这些基因均是由申请人在多年从事遗传学研究的基础上查阅大量文献所筛选出的,通过本发明方法的到进一步明确了这些基因不同类型的突变与AS的关系。

3.AS具有显著的遗传异质性,目前已知致病基因3个,仍存在大量未知的致病突变,应用传统技术研究显然具有很大的局限性。本发明提供了AS新的致病基因的致病位点,为该疾病的诊断提供了新的分子生物学基础。

附图说明

图1挖掘致病基因新突变的技术路线

图2深度测序流程

图3家系图

图4测序峰图

具体实施方式

实验方法:

1.AS遗传资源库的建立。

1.1收集以下三类AS患者的临床资料及血液标本:

1.1.1 3代或超过3代的X染色体连锁显性遗传的AS家系。

1.1.2收集X染色体连锁显性遗传的小家系。

1.1.3收集无家族史的IV型胶原蛋白α5链染色阴性的散发病例。

1.2提取基因组DNA:

采用TIANamp血液DNA抽提试剂盒(Tiangen Biotech Co.Ltd,Beijing,China),按照厂家提供的protocol从采集到的病人外周血中提取病人的基因组DNA。

2.挖掘AS已知致病基因COL4A5的新突变。

2.1设计并定制AS相关基因捕获芯片:

2.1.1候选基因的选择:

该基因捕获芯片涵盖了目前文献已报道的导致AS的四个基因:COL4A3、COL4A4、COL4A5和COL4A6,其在Ensemble数据库中的基因编号如下表所示。

基因基因编号COL4A3ENSG00000169031COL4A4ENSG00000081052COL4A5ENSG00000188153COL4A6ENSG00000197565

注:以上信息均来自Ensemble数据库(www.ensembl.org),可输入基因编码检索基因详细信息及基因序列。

2.1.2转录本的选择:

针对不同基因选择特定的转录本,每个基因均含有多个转录本,在选择转录本时,我们的原则是:首先考虑拥有CCDS编码蛋白的转录本,若一个基因有多个转录本均编码蛋白,则首选含氨基酸数最多的蛋白相对应的转录本,若多个转录本氨基酸含量相同,则进一步选择含碱基数最多的转录本。据以上原则,我们所筛选出的IV型胶原基因相关转录本分别是:

基因转录本编号COL4A3NM_000091.4COL4A4NM_000092.4COL4A5NM_033380.2COL4A6NM_001847.2

注:以上信息均来自Ensemble数据库(www.ensembl.org),可输入转录本编码检索转录本详细信息。

2.1.3杂交探针的设计:

申请人根据挑选出的不同转录本设计杂交探针,并由Roche-NimbleGen公司定制。杂交探针的设计标准为:(1)探针覆盖所有候选基因的目标区域,即外显子区域以及外显子和内含子拼接处(外显子上下游各100个bp);(2)去除重复序列:对于在基因组出现的高度重复序列以及在人类基因组中出现2-5倍的较低频率的重复片段,我们予以去除,避免捕获其他同源基因,增加假阳性,从而降低检测效率。申请人将所有候选基因的目标区域与人类基因组DNA序列进行比对,共删除了2.5%的重复序列;(3)在探针设计过程中,我们对临近的外显子进行了特定的整合,其相邻探针整合标准为:当相邻外显子的综合目标区域(即前个外显子的上游100bp起至后一个外显子的下游100bp止)总和小于600bp,即将其整合为一个探针,以求通过一对探针完成多对外显子区域的捕获;(4)当所设计探针序列小于250bp时,在其两端各包含上下游100bp的内含子的基础上,分别再增加相同碱基数的内含子,使探针大小达到250bp。

设计用于筛选AS致病基因COL4A5的杂交探针序列(Configuration:0200162535,Hoffmann-La Roche)。

2.2目标区域捕获及深度测序(见图2):

首先将基因组DNA片段化,并在DNA末端标记“A”,与Illumina PE接头-寡核苷酸混合物相连接,连接产物经PCR富集,获得DNA文库。然后将DNA文库与已知致病基因捕获芯片杂交、洗脱、纯化,获得编码序列。最后创建配对末端,在Illumina HiSeqTM2000平台上对目标序列进行测序。

2.3对测序数据进行生物信息学分析,筛选出候选致病基因:

2.3.1采用Mosaik软件(http://bioinformatics.bc.edu/marthlab/Mosaik)

处理Illumina原始测序数据(配对末端数据),产生.bam类型文件。将.bam文件输入GATK,利用GATK检测单核苷酸变异体(single nucleotide variant)和小的插入或缺失(insertion/deletions),同时进行质量评估,便于下游的生物信息学分析,最后产生.vcf类型文件。

2.3.2将患者的测序结果在包括

dbSNP132(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/database/snp132.txt.gz.),HapMap计划(ftp://ftp.ncbi.nlm.nih.gov/hapmap),

1000Genome Project(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp),

炎黄数据库(http://yh.genomics.org.cn/)

以及Exome Variant Server(http://evs.gs.washington.edu/EVS/)在内的五个单核苷酸多态性(SNP)数据库中筛查,滤过所有已知的SNP位点;

2.3.3将患者的测序结果所对应的基因序列进行比较和分析,优先分析插入/缺失突变、无义突变和错义突变,结果可分为三类,包括已知突变、其它基因的新突变和COL4A5基因的新突变。

2.4经Sanger测序验证,鉴定致病基因:

PCR法分别针对筛选出的突变位点及邻近DNA序列在相应家系中进行扩增,所用引物序列采用Primer5(http://frodo.wi.mit.edu/)引物设计软件设计。所用PCR的反应体系(20μL体系)为:5*buffer4μL,25mMMgCl22μL,DNA1μL,上游引物F(SEQ ID NO.1)1μL,下游引物R(SEQ ID NO.2)1μL,10mM dNTP0.4μL,Taq酶0.1μL,ddH2O10.5μL。PCR反应程序:98℃5min,35个循环(98℃10s,60℃15s,72℃1min),72℃7min,4℃5min。3%琼脂糖凝胶电泳检测,

与紫外线切胶仪下切取PCR产物凝胶并纯化。对所有的PCR产物分别以正、反向引物送深圳华大基因公司测序。并对测序结果进行进一步分析,使用NCBI在线对比工具

BLAST(http://blast.ncbi.nlm.nih.gov/),排除假阳性结果,并筛选出在家族中共分离的突变位点。

实验结果:

申请人对已收集的来自20个不同遗传类型的AS家系的20位先证者通过上述目标区域测序的方法检测其致病基因,得到以下初始实验结果(表1和2):

表1

表2

aFr.1:Frequency>

bFr.2:Frequency>

cFr.3:E>

defClassification:N.P(not>

COL4A3 reference transcript NM_000091.4;COL4A4 reference transcriptNM_000092.4;COL4A5 reference transcript NM_033380

The criteria of clinical significance are based on American Collegeof Medical Genetics

注:以上突变位点为突变碱基在Ensemble数据库中对应的物理位置;突变类型中,Het代表杂合突变,Hom代表纯合突变。

以上述表格中COL4A5在IID18患者家系中的突变验证为例,详细阐述突变验证相关实验结果:

1.临床资料

1.1家系图(见图3)

1.2家族中先证者临床资料:

24h尿蛋白8.52g,尿红细胞100万/ml,血肌酐1.31mg/dl,纯音测听双耳均从500HZ起下降。肾组织免疫荧光IV型胶原染色α3、α5链均缺失。

家系验证结果:

我们从先证者及相关家庭成员的血液中提取基因组DNA,通过对先证者进行目标区域捕获测序,我们发现了COL4A5基因NM_033380.2(COL4A5):c.4112delC(p.S1371*),该基因相关的突变从未在AS患者中发现。经Sanger测序验证证实该突变位点在该家族中表现为共分离(见图4),且我们在正常人对照中筛选未发现相应突变。

根据我们所设计的筛选流程,借助我们所设计的基因芯片及深度测序技术,并经过Sanger验证我们成功证实该突变位点COL4A5 p.S1371*为新的AS致病位点。

<110> 中国人民解放军南京军区南京总医院

<120> 一种突变的COL4A5基因及其应用

<160> 2

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 上游引物F

<400> 1

ggacaagcac agcaagcaaa 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 下游引物R

<400> 2

gatgggttga taggtgcagc 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号