首页> 中国专利> 检测朗格罕细胞组织细胞增生症的融合基因和突变

检测朗格罕细胞组织细胞增生症的融合基因和突变

摘要

本申请提供了检测朗格罕细胞组织细胞增生症的FNBP1‑BRAF融合基因,MAP3K10基因A17T和/或R823C突变,并提供了相应检测试剂。上述融合基因和突变可以激活RAS‑RAF‑MEK‑ERK通路,可作为朗格罕细胞组织细胞增生症检测标志物,为诊断试剂盒和治疗提供新靶点。

著录项

说明书

技术领域

本发明属于肿瘤分子生物学诊断领域,具体地,本申请提供了检测朗格罕细胞组织细胞增生症的融合基因和突变及其具体应用。

背景技术

朗格罕细胞组织细胞增生症(LCH)是一类以CD1a和/或CD207阳性树突状细胞异常克隆性增殖聚集、并导致组织损伤为特点的疾病,可发生于任何年龄,多发于幼年儿童,15岁以下儿童年发病率约为2.6-8.9/100万。该病临床表现复杂多变、异质性极强,轻者表现为自限性的单纯骨或皮肤损害,重者累及全身多个器官或系统,如骨、皮肤、淋巴结、肺、垂体、耳、眼、口腔、甲状腺等,肝、脾、骨髓这些危险器官受累会危及生命。该病极易误诊、误治,治疗过程中容易复发,病情反复进展易遗留尿崩、生长发育迟缓、骨骼畸形等后遗症,是血液系统疑难罕见病的代表病种之一。

2010年研究人员首次发现,在57%的LCH患者中存在B-Raf原癌基因丝氨酸/苏氨酸激酶(BRAF)基因的V600E突变,导致丝裂原活化蛋白激酶(Mitogen activated proteinkinase, MAPK) RAS-RAF-MEK-ERK信号通路的激活(Badalian-Very 等, Blood 2010, 116(11): 1919-1923.)。之后陆续在LCH中发现其它MAPK通路相关基因的突变,如MAP2K1(Brown等, Blood 2014, 124 (10): 1655-1658.)、BRAF缺失(Chakraborty等, Blood2016, 128 (21), 2533-2537.)、ARAF(Nelson等, Blood 2014, 123 (20): 3152-3155.)、ERBB3(Chakraborty等, Blood 2014, 124 (19): 3007-3015.)、MAPK3及MAPK7(Durham等,Nature Medicine 2019, 25 (12): 1839-1842.)等基因突变;少数患者中存在PI3K信号通路的基因突变,如PIK3CA、PIK3CD突变等(Héritier等, Blood 2015, 125 (15): 2448-2449.),这些突变均导致了细胞外调节蛋白激酶(Extracellular signa regulatedkinase, ERK)的磷酸化激活。同时,在LCH中发现BRAF、NTRK3等激酶融合体也可导致MAPK通路的激活,如PACSIN2-BRAF(Zarnegar等, Pediatr Blood Cancer 2018, 65 (1).10.1002/pbc.26699.)、FAM73A-BRAF(Chakraborty等, Blood 2016, 128 (21), 2533-2537.)、PLEKHA6-NTRK3(Cai等, International Journal of Cancer 2019, 144 (1),117-124.)等融合基因,导致LCH的发病。但是,目前仍然有20%左右的LCH患者中,未发现明确的已知致病相关基因突变,导致MAPK通路激活的分子机制未知,其分子谱尚未完全清楚。

目前认为LCH是一种骨髓髓系来源的肿瘤,但又同时具有炎症性疾病的特点,发病机制尚不明确。研究表明,BRAF-V600E突变是LCH重要的致病驱动基因,该突变在不同细胞中发生的层级可能决定了临床表现的差异,并与临床危险度及预后相关;针对BRAF-V600E突变的靶向治疗如维罗非尼、达拉非尼已被尝试用于治疗复发/难治性LCH患者,显示出良好的治疗反应和安全性。然而,具有BRAF-V600E突变患者的表现和预后仍存在较大的差异,提示其它遗传学改变的存在可能对患者的发病及预后产生重要影响。由于疾病的极强异质性,MAP2K1、ARAF等其它相关基因突变的临床意义、与预后的关系及分子靶向治疗的应用尚不明确。

为了进一步研究LCH疾病的发病机制,分析LCH致病的分子谱,阐明LCH中病理性MAPK通路激活的机制,并应用于指导临床诊断、治疗,为临床实施靶向治疗提供新靶点,急待在分子筛选组中增加新的基因突变,以更好地检测和研究LCH。

发明内容

一方面,本申请提供了检测FNBP1-BRAF融合基因的试剂在制备检测朗格罕细胞组织细胞增生症的试剂盒中的应用。

另一方面,本申请提供了检测朗格罕细胞组织细胞增生症的试剂盒,其特征在于,其中包括检测FNBP1-BRAF融合基因的试剂。

进一步地,所述FNBP1-BRAF融合基因编码的氨基酸序列为SEQ ID NO.1。

进一步地,所述FNBP1-BRAF融合基因核苷酸序列为SEQ ID NO.2。

进一步地,所述试剂为PCR试剂、FISH试剂、染色体显带试剂、测序试剂或免疫组化试剂。

另一方面,本申请提供了检测MAP3K10基因A17T和/或R823C突变的试剂在制备检测朗格罕细胞组织细胞增生症的试剂盒中的应用。

另一方面,本申请提供了检测朗格罕细胞组织细胞增生症的试剂盒,其特征在于,其中包括检测MAP3K10基因A17T和/或R823C突变的试剂。

进一步地,所述MAP3K10基因A17T突变的氨基酸序列为SEQ ID NO.3,对应核苷酸序列为SEQ ID NO.4。

进一步地,所述MAP3K10基因R823C突变的氨基酸序列为SEQ ID NO.5,对应核苷酸序列为SEQ ID NO.6。

进一步地,所述检测试剂为PCR试剂、测序试剂、FISH试剂或毛细管电泳试剂。

本申请中检测融合基因和突变的检测方法可以选用本领域已知的或研究中各种基于PCR的方法、FISH方法、测序方法、免疫组化方法、电泳方法等,并可以使用对应的市售试剂盒进行,这些方法中的试剂和操作步骤本领域技术人员可以从工具书和相应试剂盒说明书中获知,并根据检测的具体需要作出适当调整。

首次发现了一种新的融合基因FNBP1-BRAF和两种新的MAP3K10-A17T、MAP3K10-R823C基因突变,并在实验中发现这些基因突变可以激活RAS-RAF-MEK-ERK通路,可作为LCH检测标志物,为诊断试剂盒和治疗提供新靶点。

融合基因FNBP1-BRAF由FNBP1基因的1号到12号外显子和BRAF基因的8到18号外显子组成,形成的融合蛋白由FNBP1蛋白(位于所述融合蛋白的N端)与BRAF蛋白C端的片段(位于所述融合蛋白的C端)构成。

MAP3K10-A17T突变基因的mRNA序列上第49位碱基由鸟嘌呤G突变为腺嘌呤A(c.49G>A),形成的突变蛋白第7位氨基酸由丙氨酸A突变为苏氨酸T(p. A17T)。

MAP3K10-R823C突变基因的mRNA序列上第2467位碱基由胞嘧啶C突变为胸腺嘧啶T(c.2467C>T),形成的突变蛋白第823位氨基酸由精氨酸突变为C半胱氨酸(p. R823C)。

附图说明

图1为融合基因FNBP1-BRAF序列结构示意图;

图2为Western 杂交检测部分结果图,2A显示FNBP1-BRAF融合基因表达可激活HEK-293T细胞中MAPK通路的ERK激酶活性;2B显示表达FNBP1-BRAF融合蛋白的HEK-293T细胞对靶向药物曲美替尼敏感,而对达拉非尼耐药;

图3为基因组合测序部分结果图:结果显示检测到MAP3K10-A17T突变,基因序列上第49位碱基由鸟嘌呤G突变为腺嘌呤A;

图4为基因组合测序部分结果图:基因组合测序结果显示MAP3K10-R823C突变,基因序列上第2467位碱基由胞嘧啶C突变为胸腺嘧啶T;

图5为Western 杂交检测部分结果图,5A显示MAP3K10-A17T和MAP3K10-R823C突变蛋白表达可激活HEK-293T细胞中MAPK通路的ERK激酶活性;5B显示表达MAP3K10-A17T或MAP3K10-R823C突变蛋白的HEK-293T细胞对靶向药物曲美替尼敏感,而对达拉非尼耐药;

图6为具有不同基因突变的LCH患儿的无进展生存率图,生存率存在显着差异(P =0.029),具有ARAF突变或者同时存在两个及以上突变的患儿组预后最差,明显低于其它组患儿。

具体实施方式

实施例1突变基因筛查过程

1. 样本采集及基因检测

共收集223例LCH患者病灶活检组织或石蜡包埋的未染色切片,包括骨140例、皮肤42例、其它部位组织41例。其中148例患儿的病灶组织采用基因组合Ⅰ(包含162个基因和7个融合基因,如表1所示)进行基因测序,75例患儿的病灶组织和口腔拭子样本(作为对照)采用基因组合Ⅱ(包含229个基因和10个融合基因,如表2所示)进行了基因测序。

基因测序步骤:(1)从检测样本提取人基因组DNA,并进行DNA样本质量检测;(2)基因组DNA随机打断成成长度为180-280bp的片段,制备DNA文库,与生物素标记的探针进行液相杂交,再进行外显子捕获,经PCR扩增后进行文库质检,合格即可进行测序;(3)根据文库的有效浓度以及数据产出需求进行Illumina HiSeq PE150测序,获得原始测序序列(RawData)。

表1检测LCH基因组合Ⅰ组合所包含的基因名称

表2 检测LCH基因组合Ⅱ组合包含的基因名称

2. 生物信息分析

步骤包括:(1)测序数据质量评估:通过对测序错误率、数据量、比对率等进行统计,评估建库测序是否达到了标准,符合标准则进行后续的分析。(2)变异信息挖掘及分析:对测序得到的原始数据(Raw data)进行质控,步骤如下:1)去除序列5’和3’末端低质量碱基;2)丢掉含未检出的碱基(N)占比过多的序列;3)去除序列中的接头碱基,得到高质量的Clean data;然后将Clean data与人参考基因组(版本hg19)序列进行比对分析,采用MEM算法,参数-M,其余参数均使用软件默认参数,获得Bam文件;最后基于Bam文件进行SNVs /InDel的检出及注释,从而得到全部突变信息。(3)体细胞SNVs/Indels变异检测:1)候选体细胞SNVs/Indels变异检测:使用Mutect2软件对Tumor及Normal成对样本进行体细胞突变检测,获得候选SNVs/Indels变异信息。使用ANNOVAR软件同时关联多个数据库(如dbSNP,1000g,ESP6500,HGMD,OMIM等)对上述获得的变异进行注释。2)确定体细胞SNVs/Indels变异:对上一节1)中获得的变异进行二次过滤,保留等位基因频率0.05以上的位点。在ANNOVAR功能注释后,选择在正常人群数据库中罕见的所有变异。二次过滤标准为:纳入统计的reads标准为在突变位点左右20bp内应无mismatch,此外如果突变位点处于reads的两端少于20bp位置时此类reads也不纳入统计;针对非热点,保留满足Alt_T列≥5且Depth_T列≥20 且Ratio_T列≥0.05,且同时满足Alt_N列<5且Ratio_N列<0.3的突变位点;针对热点,保留满足Alt_T列≥1且Depth_T列≥20的突变位点;利用IGV软件,针对上述保留的位点再查看其覆盖情况,排除假阳性。

3. 检测结果

(1)进行基因检测的LCH患儿临床特征:

总计223例初治LCH患者采用本发明的基因组合进行了基因测序,其中148例患儿采用基因组合Ⅰ进行基因测序,75例患儿采用基因组合Ⅱ进行基因测序,两组患儿的临床特征和预后无差异,因此,我们将两组患儿合并分析。

223例LCH患者中男孩为131例(58.7%),女孩为92例(41.3%),诊断时中位年龄为3.3岁(范围0.1岁-16.1岁)。临床分型:单系统受累组(SS组)为129例(57.8%),无危险器官受累的多系统组(MS RO—组)为56例(25.1%),有危险器官受累的多系统组即高危组(MS RO+组)为38例(17.0%)。受累器官以骨(发生率89.7%)最为常见,其它依次为皮肤(17.5%)、肺(13.9%)、垂体(13.0%)、淋巴结(12.6%)、耳部(12.1%)、肝(12.1%)、脾(9.4%)、造血系统(7.6%)、眼部(4.5%)等。

所有患儿的中位随访期为16.1月(范围1.0月-36.2月)。随访期内有55例(24.7%)患儿出现疾病进展或复发;17例(7.6%)患儿发生了后遗症,其中包括15例尿崩症、1例肝硬化和1例矮小症。总体2年无进展生存率(PFS)为66.4%±5.3%。

(2)基因突变检测结果:

在223例进行了基因组合测序的LCH患者中,186例患者(83.4%)中检测到已知的MAPK信号通路相关基因突变,具体检测结果见表3。

最常见基因突变为BRAF-V600E,阳性率为51.6%(115例),其次为MAP2K1突变,阳性率为17.9%(40例)。检测到的MAP2K1突变主要发生于基因2号和3号外显子上的调控和催化核心区域,最常见的为p. Q58_E62del缺失突变(12例,5.4%),其它为多种缺失插入和错义突变,有2例MAP2K1-Q354H突变,发生在10号外显子蛋白激酶催化功能域。

检出的BRAF其它突变有:BRAF-V600D突变(8例,3.6%);BRAF框内缺失突变(15例,6.7%),框内缺失突变中,最多见的为BRAF p. N486_T491delinsK (7例,3.6%);其次为BRAF剪接突变p. R506_K507insLLR(4例,1.8%)。此外,还检出ARAF突变5例(2.2%),KRAS突变2例(0.8%)。

同时,在一些患儿中同时存在两种突变,如4例BRAF-V600E阳性患者中同时检测到其它基因突变,包括2例样本同时存在MAP2K1突变,1例为KRAS突变,1例为BRAF-K601Q突变;1例患儿同时存在BRAF p. N486_T491delinsK突变和MAP2K1-T28I突变;1例患儿中同时检测到两个不同的MAP2K1突变,MAP2K1 p. I103N和p.Y130C突变;1例患儿中同时存在ARAQ347_A348del与p.F351L两种突变。

表3. LCH患者采用基因组合进行基因测序的结果

(3)发现新的基因突变:

1)新的融合基因FNBP1-BRAF

在1例LCH患儿(病例LCH-147)的耳后软组织样本,经基因组合Ⅱ测序,发现1种新的融合基因,由位于染色体9q34.11的FNBP1基因和染色体7q34的BRAF基因形成,判断融合连接处是chr9:132666538和chr7:140497728,预测FNBP1基因的1号到12号外显子和BRAF基因的8号到18号外显子可以形成框内融合蛋白,形成的融合蛋白保留了BRAF蛋白激酶结构域;并且通过引物5'AGGCATCATGGTCTACAGAATCT3'(正向、SEQ ID NO.7)和5'ACTTCTCTAGGGATGCCTGC3'(反向、SEQ ID NO.8)进行了Sanger一代测序验证,进一步证实了FNBP1-BRAF的chr9:132666538和chr7:140497728融合位点,连接点为“AAAAT”序列(如图1所示)。

病例LCH-147临床特点:男孩,初诊年龄3个月,因主诉“发现右耳下肿物”入院,在外院行右耳下肿物活组织病理检查,确诊为LCH。入院后完善相关检查,受累器官评估为耳后软组织,临床分型为单系统受累型。由于该患儿年龄小,未给予化疗,目前观察一年,患儿无复发等事件发生,耳后软组织病变较前明显吸收好转。

为了评估FNBP1-BRAF融合基因的生物学功能,首先采用RT-PCR技术,获取FNBP1-BRAF融合转录本的完整编码基因序列片段,引物序列为:正向5’

-ACGGGCCCTCTAGACTCGAGCGCCACCATGAGCTGGGGCACCGAGCTCTGGGATC-3(SEQ IDNO.9),反向5’

-AGTCACTTAAGCTTGGTACCGAGTGGACAGGAAACGCACCATATC-3(SEQ ID NO.10)’。将目的基因片段与GV141载体(元件:CMV-MCS-3FLAG-SV40-Neomycin,XhoI / KpnI 酶切,购自吉凯基因公司)连接,构建重组FNBP1-BRAF融合表达质粒,并经DNA测序鉴定序列正确。

按转染试剂KeyGenTrans(江苏凯基生物技术股份有限公司,KGD034)的使用说明,将FNBP1-BRAF融合基因表达质粒转染到HEK-293T细胞中,同时分别转染空载体作为阴性对照(Control),转染BRAF-V600E突变基因表达质粒(购自吉凯基因公司)作阳性对照。继续使用含10%胎牛血清(以色列Biological Industries,04-001-1ACS)的DMEM培养基(美国Corning,10-013-CV),在37℃、含5% CO2饱和湿度培养箱中培养,转染48小时后,收集细胞,采用RIPA裂解液(北京普利莱基因技术有限公司,C1053)提取蛋白,在4-12% Bis-Tris蛋白质凝胶(美国Thermo Fisher Scientific,NP0335PK2)电泳、分离蛋白质,转印到硝酸纤维素膜上,并采用以下抗体如抗p44/42 MAPK(ERK1/2)抗体(Proteintech公司,66192-1-Ig)、抗磷酸p44 / 42 MAPK(ERK1/2)抗体(美国CST公司,4370S)、抗α-Tubulin抗体(日本MBL公司,PM054)、抗FLAG抗体(美国Sigma公司,F1804),经Western 杂交检测,结果表明(图2A),FNBP1-BRAF融合蛋白在HEK-293T细胞中成功表达,并且与BRAF-V600E突变蛋白功能相似,FNBP1-BRAF融合蛋白可以激活细胞中MAPK通路的ERK激酶活性(磷酸化p-ERK表达明显增高),因而与LCH致病相关。

为了解表达FNBP1-BRAF融合蛋白的细胞对靶向药物的敏感性,分别将空载体(Control)、BRAF-V600E突变基因表达质粒、FNBP1-BRAF融合基因表达质粒转染到HEK-293T细胞中,培养48h后,再分别加入二甲基亚砜(美国MERCK公司,DMSO,作为阴性对照)、10μM达拉菲尼(美国Abmole公司,M1855)和10μM曲美替尼(美国Abmole公司,M1759),经药物处理48h后,收集细胞,并提取蛋白,进行Western 杂交检测,结果如图2B所示,表达BRAF-V600E突变蛋白的细胞对BRAF抑制剂达拉非尼、MEK激酶抑制剂曲美替尼这两种分子靶向药物均敏感(p-ERK表达均明显下降);而表达FNBP1-BRAF融合蛋白的细胞仅对曲美替尼敏感(p-ERK表达明显下降),而对达拉非尼耐药(p-ERK表达无明显下降),这些结果为携带这种融合基因的患者应用靶向治疗提供了非常有价值的参考。

2)新的MAP3K10基因突变A17T和R823C

在2例LCH患儿中发现2个新的MAP3K10突变:

在病例LCH-176的右髋臼骨组织样本,经基因组合Ⅱ测序,发现1种新的MAP3K10-A17T突变,如图3所示,基因mRNA序列上第49位碱基由鸟嘌呤G突变为腺嘌呤A(c.49G>A),蛋白第7位氨基酸由丙氨酸A突变为苏氨酸T(p.A17T)。

在病例LCH-162的左侧髋骨组织样本,经基因组合Ⅱ测序,发现另1种新的MAP3K10-R823C突变,如图4所示,基因mRNA序列上第2467位碱基由胞嘧啶C突变为胸腺嘧啶T(c.2467C>T),突变蛋白第823位氨基酸由精氨酸突变为C半胱氨酸(p.R823C)。

有研究报道,在组织细胞疾病Erdheim-Chester病中曾发现MAP3K10-G677S突变,与我们发现的这两个突变位点不同,并且其致病意义尚未明确(Durham等, NatureMedicine 2019, 25 (12): 1839-1842.),在LCH中没有发现MAP3K10突变的相关报道。

患者临床特点:

病例LCH-176:女孩,初诊年龄6.6岁,因主诉“右髋疼痛2月”入院,行右侧髋臼活组织病理和免疫组织化学检查,结果为:CD1a(+),CD207(+),因此确诊为LCH。入院后完善相关检查,受累器官评估为左桡骨、右髂骨、右股骨颈,临床分型为单系统受累型(多发骨受累)。予以一线化疗(长春地辛、强的松治疗12周)及维持治疗(长春地辛、强的松治疗),病情好转,总疗程半年后停药,目前无复发等事件发生。

病例LCH-162:女孩,初诊年龄5.6岁,因主诉“左腿跛行3月余”入院,行左侧髋臼活组织病理检查,结果为:CD1a(+),CD207(+),因此确诊为LCH。入院后完善相关检查,受累器官评估为左侧髂骨、T6椎体及其附件,临床分型为单系统受累型(多发骨受累)。予以一线化疗(长春地辛、强的松治疗12周)及维持治疗(长春地辛、强的松及6-巯基嘌呤治疗),病情好转,总疗程1年后停药,目前无复发等事件发生。

为了研究MAP3K10基因突变的生物学功能,首先采用RT-PCR技术,分别获取MAP3K10-A17T和MAP3K10-R823C突变转录本的完整编码基因序列片段,引物序列分别为:MAP3K10-A17T:正向5’

-ACGGGCCCTCTAGACTCGAGCGCCACCATGGAGGAGGAGGAGGGGGCGGTGGCC-3’ (SEQ IDNO.11),反向5’

- AGTCACTTAAGCTTGGTACCGAGTGGGAGCCGTGGGCCCCGCACAGGGGCACTGTG -3’ (SEQID NO.12);MAP3K10-R823C:正向5’

-ACGGGCCCTCTAGACTCGAGCGCCACCATGGAGGAGGAGGAGGGGGCGGTGGCC-3’ (SEQ IDNO.13),反向5’

-AGTCACTTAAGCTTGGTACCGAGTGGGAGCCGTGGGCCCCGCACAGGGGCACTGTG-3’ (SEQ IDNO.14)。将目的基因片段分别与GV141载体(元件:CMV-MCS-3FLAG-SV40-Neomycin,XhoI /KpnI 酶切,购自吉凯基因公司)连接,构建重组MAP3K10-A17T和MAP3K10-R823C突变表达质粒,并经DNA测序鉴定序列正确。

按转染试剂KeyGenTrans的使用说明,分别将MAP3K10-A17T和MAP3K10-R823C突变表达质粒转染到HEK-293T细胞中,同时转染空载体作为阴性对照(Control),转染BRAF-V600E突变基因表达质粒作阳性对照。转染48小时后,收集细胞,提取蛋白,经Western 杂交检测,结果表明(图5A),MAP3K10-A17T和MAP3K10-R823C突变蛋白在HEK-293T细胞中成功表达,与对照阴性相比,2种MAP3K10突变蛋白及BRAF-V600E突变蛋白都可以激活细胞中MAPK通路的ERK激酶活性(磷酸化p-ERK表达明显增高),因而与LCH致病相关。

为了解表达FNBP1-BRAF融合蛋白的细胞对靶向药物的敏感性,分别将MAP3K10-A17T、MAP3K10-R823C突变表达质粒转染到HEK-293T细胞中,培养48h后,再分别加入DMSO(作为阴性对照)、10μM达拉菲尼或10μM曲美替尼,经药物处理48h后,收集细胞,并提取蛋白,进行Western 杂交检测,结果如图5B所示,表达MAP3K10-A17T或MAP3K10-R823C突变蛋白的细胞,仅对曲美替尼敏感(p-ERK表达明显下降),而对达拉非尼耐药(p-ERK表达无明显下降),这些结果为携带这两种突变患者应用靶向治疗提供了非常有价值的参考。

新的FNBP1-BRAF融合基因和MAP3K10-A17T、MAP3K10-R823C突变的检出过程,是样本经基因组合测序,得到的数据进行质控、注释,再根据测序深度等指标经过二次过滤,除去等位基因频率(VAF)极低的非热点突变位点,保留了VAF>0.05的可靠突变位点;重要的是,分析过程中将检出的基因突变经正常人群数据库包括千人基因组数据库(1000Genomes)、外显子组整合数据库(ExAC)、GenomAD数据库进行比对,排除了正常人群中可能存在的SNP位点,最后筛选出在正常人群中罕见的变异(频率<0.01)。

FNBP1-BRAF融合基因在病例LCH-147的病灶样本中检出的VAF为0.25,并且在上述正常人群数据库中均无检出。该融合基因形成的融合蛋白保留了BRAF蛋白激酶结构域和相关生物学功能。MAP3K10-A17T突变在病例LCH-176的病灶样本中检出的VAF为0.19,并且在上述正常数据库中均未检出正常人携带,属于稀有变异。该突变位于MAP3K10蛋白的SH3结构域,可能通过影响蛋白间的相互作用发挥生物学功能。MAP3K10-R823C突变在病例LCH-162的病灶样本中检出的VAF 为0.11,并且在千人基因组数据库(1000 Genomes)、GenomAD数据库中均未检出正常人携带,仅在ExAC数据库_EAS 东亚人群中的检出频率为0.0022,低于0.01,属于正常人群中罕见的变异。该突变位于MAP3K10蛋白的功能域及相关功能目前尚不清楚。我们经细胞学功能试验证明,FNBP1-BRAF融合基因、MAP3K10-A17T突变、MAP3K10-R823C突变产生的突变蛋白均可以激活细胞中MAPK通路的ERK激酶活性,并对MEK激酶抑制剂曲美替尼敏感,因此认为这些变异是具有生物学功能的罕见有害变异,随着未来阳性检出病例数的增多,将进一步明确这些变异的临床意义和生物学功能。

(4)基因突变与LCH患者临床分型、预后的相关性

如表4所示,将患者按检出的基因突变分为6组,分别为BRAF-V600E阳性组、BRAF其它突变、MAP2K1突变、ARAF突变、两种及以上基因突变、其它/未知突变,采用Fisher精确检验方法,分析不同类型的基因突变与LCH患者临床分型、治疗反应和预后的相关性(以统计学P值小于0.05为有统计学差异)。

结果显示:基因突变类型与LCH患者的受累部位包括皮肤、肝、脾、中枢神经系统、耳部、中枢神经系统危险器官受累明显相关,在有危险器官(肝、脾、骨髓)受累(高危型)患者中,BRAF-V600E突变阳性率(84.2%)明显高于无危险器官受累(低危型)患者(42.7%,P<0.001);皮肤受累的患儿中,BRAF-V600E突变阳性率(71.8%)明显高于无皮肤受累患儿(45.1%,P=0.014);中枢神经系统危险器官受累的患儿中,BRAF-V600E突变阳性率更高(61.4%,P=0.006)。发生出现进展/复发的患儿中,ARAF突变、两种及以上基因突变的频率较高(P=0.049)。

我们进一步分析了基因突变与LCH患儿预后的相关性。结果显示(图6),具有不同基因突变LCH患儿的预后存在显着差异,2年无进展生存率分别为:BRAF-V600E 70.9±5.3%,BRAF其他突变 87.8%±6.6%,MAP2K1突变 57.9%±17.7%,ARAF突变 25.0%±21.7%,两个及以上突变 31.3%±23.7%,其它/未知突变 66.5%±8.6%(P = 0.029);具有ARAF突变或者同时存在两个及以上突变的患儿组预后最差,明显低于其它组患儿。

多因素分析(表5)结果显示,诊断时年龄、ARAF突变、同时具有两个及以上基因突变是影响儿童LCH无进展生存的独立预后因素(ARAF突变:风险比4.250,P=0.019;两个及以上突变:风险比3.531, P=0.017;诊断时年龄< 3岁:风险比:2.437,P=0.003)。

(5)基因突变检测结果对LCH患者实施精准靶向治疗的指导意义

根据本发明检测LCH患者基因突变的结果,对于患者实施精准分层治疗、分子靶向治疗具有重要的指导价值。LCH目前主要采用以泼尼松与长春碱类联合应用作为一线化疗方案,对复发或无效的患者可采用克拉屈滨和/或阿糖胞苷为主的二线化疗方案,但因毒副作用较大,病情重或婴幼儿难以耐受;近年来,BRAF抑制剂如达拉非尼、维罗非尼、MEK激酶抑制剂如曲美替尼等分子靶向药物被尝试用于治疗复发或难治性LCH患者,显示出良好的治疗反应和安全性。

在这223例儿童LCH患者中,对24例BRAF-V600E突变阳性的高危型患者直接采用了BRAF抑制剂达拉非尼的靶向治疗,对9例BRAF-V600E突变阳性的难治性患儿在一线或二线治疗出现进展或复发后,也给予达拉非尼的靶向治疗;对2例具有BRAF-V600D突变和1例BRAF p.V600delinsDATV突变的难治/复发LCH患儿,给予了达拉非尼的靶向治疗;3例MAP2K1突变阳性的高危型/复发LCH患者采用MEK激酶抑制剂曲美替尼进行了靶向治疗。这些靶向治疗的患儿均获得了较好的短期疗效,靶向治疗1月和3月的反应率分别达到81.6%和76.3%,短期治疗反应良好,且未发生3级及以上严重的不良反应,安全性良好。

序列表

<110> 首都医科大学附属北京儿童医院

<120> 检测朗格罕细胞组织细胞增生症的融合基因和突变

<160> 14

<170> SIPOSequenceListing 1.0

<210> 1

<211> 871

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Met Ser Trp Gly Thr Glu Leu Trp Asp Gln Phe Asp Asn Leu Glu Lys

1 5 10 15

His Thr Gln Trp Gly Ile Asp Ile Leu Glu Lys Tyr Ile Lys Phe Val

20 25 30

Lys Glu Arg Thr Glu Ile Glu Leu Ser Tyr Ala Lys Gln Leu Arg Asn

35 40 45

Leu Ser Lys Lys Tyr Gln Pro Lys Lys Asn Ser Lys Glu Glu Glu Glu

50 55 60

Tyr Lys Tyr Thr Ser Cys Lys Ala Phe Ile Ser Asn Leu Asn Glu Met

65 70 75 80

Asn Asp Tyr Ala Gly Gln His Glu Val Ile Ser Glu Asn Met Ala Ser

85 90 95

Gln Ile Ile Val Asp Leu Ala Arg Tyr Val Gln Glu Leu Lys Gln Glu

100 105 110

Arg Lys Ser Asn Phe His Asp Gly Arg Lys Ala Gln Gln His Ile Glu

115 120 125

Thr Cys Trp Lys Gln Leu Glu Ser Ser Lys Arg Arg Phe Glu Arg Asp

130 135 140

Cys Lys Glu Ala Asp Arg Ala Gln Gln Tyr Phe Glu Lys Met Asp Ala

145 150 155 160

Asp Ile Asn Val Thr Lys Ala Asp Val Glu Lys Ala Arg Gln Gln Ala

165 170 175

Gln Ile Arg His Gln Met Ala Glu Asp Ser Lys Ala Asp Tyr Ser Ser

180 185 190

Ile Leu Gln Lys Phe Asn His Glu Gln His Glu Tyr Tyr His Thr His

195 200 205

Ile Pro Asn Ile Phe Gln Lys Ile Gln Glu Met Glu Glu Arg Arg Ile

210 215 220

Val Arg Met Gly Glu Ser Met Lys Thr Tyr Ala Glu Val Asp Arg Gln

225 230 235 240

Val Ile Pro Ile Ile Gly Lys Cys Leu Asp Gly Ile Val Lys Ala Ala

245 250 255

Glu Ser Ile Asp Gln Lys Asn Asp Ser Gln Leu Val Ile Glu Ala Tyr

260 265 270

Lys Ser Gly Phe Glu Pro Pro Gly Asp Ile Glu Phe Glu Asp Tyr Thr

275 280 285

Gln Pro Met Lys Arg Thr Val Ser Asp Asn Ser Leu Ser Asn Ser Arg

290 295 300

Gly Glu Gly Lys Pro Asp Leu Lys Phe Gly Gly Lys Ser Lys Gly Lys

305 310 315 320

Leu Trp Pro Phe Ile Lys Lys Asn Lys Leu Met Ser Leu Leu Thr Ser

325 330 335

Pro His Gln Pro Pro Pro Pro Pro Pro Ala Ser Ala Ser Pro Ser Ala

340 345 350

Val Pro Asn Gly Pro Gln Ser Pro Lys Gln Gln Lys Glu Pro Leu Ser

355 360 365

His Arg Phe Asn Glu Phe Met Thr Ser Lys Pro Lys Ile His Cys Phe

370 375 380

Arg Ser Leu Lys Arg Gly Leu Ser Leu Lys Leu Gly Ala Thr Pro Glu

385 390 395 400

Asp Phe Ser Asn Leu Pro Pro Glu Gln Arg Arg Lys Lys Leu Gln Gln

405 410 415

Lys Val Asp Glu Leu Asn Lys Glu Ile Gln Lys Glu Met Asp Gln Arg

420 425 430

Pro Gln Ile Leu Thr Ser Pro Ser Pro Ser Lys Ser Ile Pro Ile Pro

435 440 445

Gln Pro Phe Arg Pro Ala Asp Glu Asp His Arg Asn Gln Phe Gly Gln

450 455 460

Arg Asp Arg Ser Ser Ser Ala Pro Asn Val His Ile Asn Thr Ile Glu

465 470 475 480

Pro Val Asn Ile Asp Asp Leu Ile Arg Asp Gln Gly Phe Arg Gly Asp

485 490 495

Gly Gly Ser Thr Thr Gly Leu Ser Ala Thr Pro Pro Ala Ser Leu Pro

500 505 510

Gly Ser Leu Thr Asn Val Lys Ala Leu Gln Lys Ser Pro Gly Pro Gln

515 520 525

Arg Glu Arg Lys Ser Ser Ser Ser Ser Glu Asp Arg Asn Arg Met Lys

530 535 540

Thr Leu Gly Arg Arg Asp Ser Ser Asp Asp Trp Glu Ile Pro Asp Gly

545 550 555 560

Gln Ile Thr Val Gly Gln Arg Ile Gly Ser Gly Ser Phe Gly Thr Val

565 570 575

Tyr Lys Gly Lys Trp His Gly Asp Val Ala Val Lys Met Leu Asn Val

580 585 590

Thr Ala Pro Thr Pro Gln Gln Leu Gln Ala Phe Lys Asn Glu Val Gly

595 600 605

Val Leu Arg Lys Thr Arg His Val Asn Ile Leu Leu Phe Met Gly Tyr

610 615 620

Ser Thr Lys Pro Gln Leu Ala Ile Val Thr Gln Trp Cys Glu Gly Ser

625 630 635 640

Ser Leu Tyr His His Leu His Ile Ile Glu Thr Lys Phe Glu Met Ile

645 650 655

Lys Leu Ile Asp Ile Ala Arg Gln Thr Ala Gln Gly Met Asp Tyr Leu

660 665 670

His Ala Lys Ser Ile Ile His Arg Asp Leu Lys Ser Asn Asn Ile Phe

675 680 685

Leu His Glu Asp Leu Thr Val Lys Ile Gly Asp Phe Gly Leu Ala Thr

690 695 700

Val Lys Ser Arg Trp Ser Gly Ser His Gln Phe Glu Gln Leu Ser Gly

705 710 715 720

Ser Ile Leu Trp Met Ala Pro Glu Val Ile Arg Met Gln Asp Lys Asn

725 730 735

Pro Tyr Ser Phe Gln Ser Asp Val Tyr Ala Phe Gly Ile Val Leu Tyr

740 745 750

Glu Leu Met Thr Gly Gln Leu Pro Tyr Ser Asn Ile Asn Asn Arg Asp

755 760 765

Gln Ile Ile Phe Met Val Gly Arg Gly Tyr Leu Ser Pro Asp Leu Ser

770 775 780

Lys Val Arg Ser Asn Cys Pro Lys Ala Met Lys Arg Leu Met Ala Glu

785 790 795 800

Cys Leu Lys Lys Lys Arg Asp Glu Arg Pro Leu Phe Pro Gln Ile Leu

805 810 815

Ala Ser Ile Glu Leu Leu Ala Arg Ser Leu Pro Lys Ile His Arg Ser

820 825 830

Ala Ser Glu Pro Ser Leu Asn Arg Ala Gly Phe Gln Thr Glu Asp Phe

835 840 845

Ser Leu Tyr Ala Cys Ala Ser Pro Lys Thr Pro Ile Gln Ala Gly Gly

850 855 860

Tyr Gly Ala Phe Pro Val His

865 870

<210> 2

<211> 2616

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

atgagctggg gcaccgagct ctgggatcag tttgacaact tagaaaaaca cacacagtgg 60

ggaattgata ttcttgagaa atatatcaag tttgtgaaag aaaggacaga gattgaactc 120

agctatgcaa agcaactcag gaatctttca aagaagtacc aacctaaaaa gaactcgaag 180

gaggaagaag aatacaagta tacgtcatgt aaagctttca tttccaacct gaacgaaatg 240

aatgattacg cagggcagca tgaagttatc tccgagaaca tggcatcaca gatcattgtg 300

gacttggcac gctatgttca ggaactgaaa caggagagga aatcaaactt tcacgatggc 360

cgtaaagcac agcagcacat cgagacttgc tggaagcagc ttgaatctag taaaaggcga 420

tttgaacgcg attgcaaaga ggcggacagg gcgcagcagt actttgagaa aatggacgct 480

gacatcaatg tcacaaaagc ggatgttgaa aaggcccgac aacaagctca aatacgtcac 540

caaatggcag aggacagcaa agcagattac tcatccattc tccagaaatt caaccatgag 600

cagcatgaat attaccatac tcacatcccc aacatcttcc agaaaataca agagatggag 660

gaaaggagga ttgtgagaat gggagagtcc atgaagacat atgcagaggt tgatcggcag 720

gtgatcccaa tcattgggaa gtgcctggat ggaatagtaa aagcagccga atcaattgat 780

cagaaaaatg attcacagct ggtaatagaa gcttataaat cagggtttga gcctcctgga 840

gacattgaat ttgaggatta cactcagcca atgaagcgca ctgtgtcaga taacagcctt 900

tcaaattcca gaggagaagg caaaccagac ctcaaatttg gtggcaaatc caaaggaaag 960

ttatggccgt tcatcaaaaa aaataagctt atgtcccttt taacatcccc ccatcagcct 1020

ccccctcccc ctcctgcctc tgcctcaccc tctgctgttc ccaacggccc ccagtctccc 1080

aagcagcaaa aggaacccct ctcccatcgc ttcaacgagt tcatgacctc caaacccaaa 1140

atccactgct tcaggagcct aaagcgtggg ctttctctca agctgggtgc aacaccggag 1200

gatttcagca acctcccacc tgaacaaaga aggaaaaagc tgcagcagaa agtcgatgag 1260

ttaaataaag aaattcagaa ggagatggat caaaggcccc aaattctcac cagtccgtct 1320

ccttcaaaat ccattccaat tccacagccc ttccgaccag cagatgaaga tcatcgaaat 1380

caatttgggc aacgagaccg atcctcatca gctcccaatg tgcatataaa cacaatagaa 1440

cctgtcaata ttgatgactt gattagagac caaggatttc gtggtgatgg aggatcaacc 1500

acaggtttgt ctgctacccc ccctgcctca ttacctggct cactaactaa cgtgaaagcc 1560

ttacagaaat ctccaggacc tcagcgagaa aggaagtcat cttcatcctc agaagacagg 1620

aatcgaatga aaacacttgg tagacgggac tcgagtgatg attgggagat tcctgatggg 1680

cagattacag tgggacaaag aattggatct ggatcatttg gaacagtcta caagggaaag 1740

tggcatggtg atgtggcagt gaaaatgttg aatgtgacag cacctacacc tcagcagtta 1800

caagccttca aaaatgaagt aggagtactc aggaaaacac gacatgtgaa tatcctactc 1860

ttcatgggct attccacaaa gccacaactg gctattgtta cccagtggtg tgagggctcc 1920

agcttgtatc accatctcca tatcattgag accaaatttg agatgatcaa acttatagat 1980

attgcacgac agactgcaca gggcatggat tacttacacg ccaagtcaat catccacaga 2040

gacctcaaga gtaataatat atttcttcat gaagacctca cagtaaaaat aggtgatttt 2100

ggtctagcta cagtgaaatc tcgatggagt gggtcccatc agtttgaaca gttgtctgga 2160

tccattttgt ggatggcacc agaagtcatc agaatgcaag ataaaaatcc atacagcttt 2220

cagtcagatg tatatgcatt tggaattgtt ctgtatgaat tgatgactgg acagttacct 2280

tattcaaaca tcaacaacag ggaccagata atttttatgg tgggacgagg atacctgtct 2340

ccagatctca gtaaggtacg gagtaactgt ccaaaagcca tgaagagatt aatggcagag 2400

tgcctcaaaa agaaaagaga tgagagacca ctctttcccc aaattctcgc ctctattgag 2460

ctgctggccc gctcattgcc aaaaattcac cgcagtgcat cagaaccctc cttgaatcgg 2520

gctggtttcc aaacagagga ttttagtcta tatgcttgtg cttctccaaa aacacccatc 2580

caggcagggg gatatggtgc gtttcctgtc cactga 2616

<210> 3

<211> 954

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Met Glu Glu Glu Glu Gly Ala Val Ala Lys Glu Trp Gly Thr Thr Pro

1 5 10 15

Thr Gly Pro Val Trp Thr Ala Val Phe Asp Tyr Glu Ala Ala Gly Asp

20 25 30

Glu Glu Leu Thr Leu Arg Arg Gly Asp Arg Val Gln Val Leu Ser Gln

35 40 45

Asp Cys Ala Val Ser Gly Asp Glu Gly Trp Trp Thr Gly Gln Leu Pro

50 55 60

Ser Gly Arg Val Gly Val Phe Pro Ser Asn Tyr Val Ala Pro Gly Ala

65 70 75 80

Pro Ala Ala Pro Ala Gly Leu Gln Leu Pro Gln Glu Ile Pro Phe His

85 90 95

Glu Leu Gln Leu Glu Glu Ile Ile Gly Val Gly Gly Phe Gly Lys Val

100 105 110

Tyr Arg Ala Leu Trp Arg Gly Glu Glu Val Ala Val Lys Ala Ala Arg

115 120 125

Leu Asp Pro Glu Lys Asp Pro Ala Val Thr Ala Glu Gln Val Cys Gln

130 135 140

Glu Ala Arg Leu Phe Gly Ala Leu Gln His Pro Asn Ile Ile Ala Leu

145 150 155 160

Arg Gly Ala Cys Leu Asn Pro Pro His Leu Cys Leu Val Met Glu Tyr

165 170 175

Ala Arg Gly Gly Ala Leu Ser Arg Val Leu Ala Gly Arg Arg Val Pro

180 185 190

Pro His Val Leu Val Asn Trp Ala Val Gln Val Ala Arg Gly Met Asn

195 200 205

Tyr Leu His Asn Asp Ala Pro Val Pro Ile Ile His Arg Asp Leu Lys

210 215 220

Ser Ile Asn Ile Leu Ile Leu Glu Ala Ile Glu Asn His Asn Leu Ala

225 230 235 240

Asp Thr Val Leu Lys Ile Thr Asp Phe Gly Leu Ala Arg Glu Trp His

245 250 255

Lys Thr Thr Lys Met Ser Ala Ala Gly Thr Tyr Ala Trp Met Ala Pro

260 265 270

Glu Val Ile Arg Leu Ser Leu Phe Ser Lys Ser Ser Asp Val Trp Ser

275 280 285

Phe Gly Val Leu Leu Trp Glu Leu Leu Thr Gly Glu Val Pro Tyr Arg

290 295 300

Glu Ile Asp Ala Leu Ala Val Ala Tyr Gly Val Ala Met Asn Lys Leu

305 310 315 320

Thr Leu Pro Ile Pro Ser Thr Cys Pro Glu Pro Phe Ala Arg Leu Leu

325 330 335

Glu Glu Cys Trp Asp Pro Asp Pro His Gly Arg Pro Asp Phe Gly Ser

340 345 350

Ile Leu Lys Arg Leu Glu Val Ile Glu Gln Ser Ala Leu Phe Gln Met

355 360 365

Pro Leu Glu Ser Phe His Ser Leu Gln Glu Asp Trp Lys Leu Glu Ile

370 375 380

Gln His Met Phe Asp Asp Leu Arg Thr Lys Glu Lys Glu Leu Arg Ser

385 390 395 400

Arg Glu Glu Glu Leu Leu Arg Ala Ala Gln Glu Gln Arg Phe Gln Glu

405 410 415

Glu Gln Leu Arg Arg Arg Glu Gln Glu Leu Ala Glu Arg Glu Met Asp

420 425 430

Ile Val Glu Arg Glu Leu His Leu Leu Met Cys Gln Leu Ser Gln Glu

435 440 445

Lys Pro Arg Val Arg Lys Arg Lys Gly Asn Phe Lys Arg Ser Arg Leu

450 455 460

Leu Lys Leu Arg Glu Gly Gly Ser His Ile Ser Leu Pro Ser Gly Phe

465 470 475 480

Glu His Lys Ile Thr Val Gln Ala Ser Pro Thr Leu Asp Lys Arg Lys

485 490 495

Gly Ser Asp Gly Ala Ser Pro Pro Ala Ser Pro Ser Ile Ile Pro Arg

500 505 510

Leu Arg Ala Ile Arg Leu Thr Pro Val Asp Cys Gly Gly Ser Ser Ser

515 520 525

Gly Ser Ser Ser Gly Gly Ser Gly Thr Trp Ser Arg Gly Gly Pro Pro

530 535 540

Lys Lys Glu Glu Leu Val Gly Gly Lys Lys Lys Gly Arg Thr Trp Gly

545 550 555 560

Pro Ser Ser Thr Leu Gln Lys Glu Arg Val Gly Gly Glu Glu Arg Leu

565 570 575

Lys Gly Leu Gly Glu Gly Ser Lys Gln Trp Ser Ser Ser Ala Pro Asn

580 585 590

Leu Gly Lys Ser Pro Lys His Thr Pro Ile Ala Pro Gly Phe Ala Ser

595 600 605

Leu Asn Glu Met Glu Glu Phe Ala Glu Ala Glu Asp Gly Gly Ser Ser

610 615 620

Val Pro Pro Ser Pro Tyr Ser Thr Pro Ser Tyr Leu Ser Val Pro Leu

625 630 635 640

Pro Ala Glu Pro Ser Pro Gly Ala Arg Ala Pro Trp Glu Pro Thr Pro

645 650 655

Ser Ala Pro Pro Ala Arg Trp Gly His Gly Ala Arg Arg Arg Cys Asp

660 665 670

Leu Ala Leu Leu Gly Cys Ala Thr Leu Leu Gly Ala Val Gly Leu Gly

675 680 685

Ala Asp Val Ala Glu Ala Arg Ala Ala Asp Gly Glu Glu Gln Arg Arg

690 695 700

Trp Leu Asp Gly Leu Phe Phe Pro Arg Ala Gly Arg Phe Pro Arg Gly

705 710 715 720

Leu Ser Pro Pro Ala Arg Pro His Gly Arg Arg Glu Asp Val Gly Pro

725 730 735

Gly Leu Gly Leu Ala Pro Ser Ala Thr Leu Val Ser Leu Ser Ser Val

740 745 750

Ser Asp Cys Asn Ser Thr Arg Ser Leu Leu Arg Ser Asp Ser Asp Glu

755 760 765

Ala Ala Pro Ala Ala Pro Ser Pro Pro Pro Ser Pro Pro Ala Pro Thr

770 775 780

Pro Thr Pro Ser Pro Ser Thr Asn Pro Leu Val Asp Leu Glu Leu Glu

785 790 795 800

Ser Phe Lys Lys Asp Pro Arg Gln Ser Leu Thr Pro Thr His Val Thr

805 810 815

Ala Ala Cys Ala Val Ser Arg Gly His Arg Arg Thr Pro Ser Asp Gly

820 825 830

Ala Leu Gly Gln Arg Gly Pro Pro Glu Pro Ala Gly His Gly Pro Gly

835 840 845

Pro Arg Asp Leu Leu Asp Phe Pro Arg Leu Pro Asp Pro Gln Ala Leu

850 855 860

Phe Pro Ala Arg Arg Arg Pro Pro Glu Phe Pro Gly Arg Pro Thr Thr

865 870 875 880

Leu Thr Phe Ala Pro Arg Pro Arg Pro Ala Ala Ser Arg Pro Arg Leu

885 890 895

Asp Pro Trp Lys Leu Val Ser Phe Gly Arg Thr Leu Thr Ile Ser Pro

900 905 910

Pro Ser Arg Pro Asp Thr Pro Glu Ser Pro Gly Pro Pro Ser Val Gln

915 920 925

Pro Thr Leu Leu Asp Met Asp Met Glu Gly Gln Asn Gln Asp Ser Thr

930 935 940

Val Pro Leu Cys Gly Ala His Gly Ser His

945 950

<210> 4

<211> 2865

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggaggagg aggagggggc ggtggccaag gagtggggca cgacccccac ggggcccgtc 60

tggaccgcgg tgttcgacta cgaggcggcg ggcgacgagg agctgaccct gcggaggggc 120

gatcgcgtcc aggtgctttc ccaagactgt gcggtgtccg gcgacgaggg ctggtggacc 180

gggcagctcc ccagcggccg cgtgggcgtc ttccccagca actacgtggc ccccggcgcc 240

cccgctgcac ccgcgggcct ccagctgccc caggagatcc ccttccacga gctgcagcta 300

gaggagatca tcggtgtggg gggctttggc aaggtctatc gggccctgtg gcgtggcgag 360

gaggtggcag tcaaggccgc ccggctggac cctgagaagg acccggcagt gacagcggag 420

caggtgtgcc aggaagcccg gctctttgga gccctgcagc accccaacat aattgccctt 480

aggggcgcct gcctcaaccc cccacacctc tgcctagtga tggagtatgc ccggggtggt 540

gcactgagca gggtgctggc aggtcgccgg gtgccacctc acgtgctggt caactgggct 600

gtgcaggtgg cccggggcat gaactaccta cacaatgatg cccctgtgcc catcatccac 660

cgggacctca agtccatcaa catcctgatc ctggaggcca tcgagaacca caacctcgca 720

gacacggtgc tcaagatcac ggacttcggc ctcgcccgcg agtggcacaa gaccaccaag 780

atgagcgctg cggggaccta cgcctggatg gcgccggagg ttatccgtct ctccctcttc 840

tccaaaagca gtgatgtctg gagcttcggg gtgctgctgt gggagctgct gacgggggag 900

gtcccctacc gtgagatcga cgccttggcc gtggcgtatg gcgtggctat gaataagctg 960

acgctgccca ttccctccac gtgccccgag ccctttgccc gcctcctgga ggaatgctgg 1020

gacccagacc cccacgggcg gccagatttc ggtagcatct tgaagcggct tgaagtcatc 1080

gaacagtcag ccctgttcca gatgccactg gagtccttcc actcgctgca ggaagactgg 1140

aagctggaga ttcagcacat gtttgatgac cttcggacca aggagaagga gcttcggagc 1200

cgtgaggagg agctgctgcg ggcggcacag gagcagcgct tccaggagga gcagctgcgg 1260

cggcgggagc aggagctggc agaacgtgag atggacatcg tggaacggga gctgcacctg 1320

ctcatgtgcc agctgagcca ggagaagccc cgggtccgca agcgcaaggg caacttcaag 1380

cgcagccgcc tgctcaagct gcgggaaggc ggcagccaca tcagcctgcc ctctggcttt 1440

gagcataaga tcacagtcca ggcctctcca actctggata agcggaaagg atccgatggg 1500

gccagccccc ctgcaagccc cagcatcatc ccccggctga gggccattcg cctgactccc 1560

gtggactgtg gtggcagcag cagtggcagc agcagtggag gaagtgggac atggagccgc 1620

ggtgggcccc caaagaagga agaactggtc gggggcaaga agaagggacg aacgtggggg 1680

cccagctcca ccctgcagaa ggagcgggtg ggaggagagg agaggctgaa ggggctgggg 1740

gaaggaagca aacagtggtc atcaagtgcc cccaacctgg gcaagtcccc caaacacaca 1800

cccatcgccc ctggctttgc cagcctcaat gagatggagg agttcgcgga ggcagaggat 1860

ggaggcagca gcgtgccccc ttccccctac tcgaccccgt cctacctctc agtgccactg 1920

cctgccgagc cctccccggg ggcgcgggcg ccgtgggagc cgacgccgtc cgcgcccccc 1980

gctcggtggg gacacggcgc ccggcggcgc tgcgacctgg cgctgctagg ctgcgccacg 2040

ctgctggggg ctgtgggcct gggcgccgac gtggccgagg cgcgcgcggc cgacggtgag 2100

gagcagcggc gctggctcga cggcctcttc tttccccgcg ccggccgctt cccgcggggc 2160

ctcagcccac ccgcgcgtcc ccacggccgc cgcgaagacg tgggccccgg cctgggcctg 2220

gcgccctcgg ccaccctcgt gtcgctgtcg tccgtgtccg actgcaactc cacgcgttca 2280

ctgctgcgct ctgacagtga cgaggccgca ccggccgcgc cctccccacc accctccccg 2340

cccgcgccca cacccacgcc ctcgcccagc accaaccccc tggtggacct ggagctggag 2400

agcttcaaga aggacccccg ccagtcgctc acgcccaccc acgtcacggc tgcatgcgct 2460

gtgagccgcg ggcaccggcg gacgccatcg gacggggcgc tggggcagcg ggggccgccc 2520

gagcccgcgg gccatggccc tggccctcgt gaccttctgg acttcccccg cctgcccgac 2580

ccccaggccc tgttcccagc ccgccgccgg ccccctgagt tcccaggccg ccccaccacc 2640

ctgacctttg ccccgagacc tcggccggct gccagtcgcc cccgcttgga cccctggaaa 2700

ctggtctcct tcggccggac actcaccatc tcgcctccca gcaggccaga cactccggag 2760

agccctgggc cccccagcgt gcagcccaca ctgctggaca tggacatgga ggggcagaac 2820

caagacagca cagtgcccct gtgcggggcc cacggctccc actaa 2865

<210> 5

<211> 954

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 5

Met Glu Glu Glu Glu Gly Ala Val Ala Lys Glu Trp Gly Thr Thr Pro

1 5 10 15

Ala Gly Pro Val Trp Thr Ala Val Phe Asp Tyr Glu Ala Ala Gly Asp

20 25 30

Glu Glu Leu Thr Leu Arg Arg Gly Asp Arg Val Gln Val Leu Ser Gln

35 40 45

Asp Cys Ala Val Ser Gly Asp Glu Gly Trp Trp Thr Gly Gln Leu Pro

50 55 60

Ser Gly Arg Val Gly Val Phe Pro Ser Asn Tyr Val Ala Pro Gly Ala

65 70 75 80

Pro Ala Ala Pro Ala Gly Leu Gln Leu Pro Gln Glu Ile Pro Phe His

85 90 95

Glu Leu Gln Leu Glu Glu Ile Ile Gly Val Gly Gly Phe Gly Lys Val

100 105 110

Tyr Arg Ala Leu Trp Arg Gly Glu Glu Val Ala Val Lys Ala Ala Arg

115 120 125

Leu Asp Pro Glu Lys Asp Pro Ala Val Thr Ala Glu Gln Val Cys Gln

130 135 140

Glu Ala Arg Leu Phe Gly Ala Leu Gln His Pro Asn Ile Ile Ala Leu

145 150 155 160

Arg Gly Ala Cys Leu Asn Pro Pro His Leu Cys Leu Val Met Glu Tyr

165 170 175

Ala Arg Gly Gly Ala Leu Ser Arg Val Leu Ala Gly Arg Arg Val Pro

180 185 190

Pro His Val Leu Val Asn Trp Ala Val Gln Val Ala Arg Gly Met Asn

195 200 205

Tyr Leu His Asn Asp Ala Pro Val Pro Ile Ile His Arg Asp Leu Lys

210 215 220

Ser Ile Asn Ile Leu Ile Leu Glu Ala Ile Glu Asn His Asn Leu Ala

225 230 235 240

Asp Thr Val Leu Lys Ile Thr Asp Phe Gly Leu Ala Arg Glu Trp His

245 250 255

Lys Thr Thr Lys Met Ser Ala Ala Gly Thr Tyr Ala Trp Met Ala Pro

260 265 270

Glu Val Ile Arg Leu Ser Leu Phe Ser Lys Ser Ser Asp Val Trp Ser

275 280 285

Phe Gly Val Leu Leu Trp Glu Leu Leu Thr Gly Glu Val Pro Tyr Arg

290 295 300

Glu Ile Asp Ala Leu Ala Val Ala Tyr Gly Val Ala Met Asn Lys Leu

305 310 315 320

Thr Leu Pro Ile Pro Ser Thr Cys Pro Glu Pro Phe Ala Arg Leu Leu

325 330 335

Glu Glu Cys Trp Asp Pro Asp Pro His Gly Arg Pro Asp Phe Gly Ser

340 345 350

Ile Leu Lys Arg Leu Glu Val Ile Glu Gln Ser Ala Leu Phe Gln Met

355 360 365

Pro Leu Glu Ser Phe His Ser Leu Gln Glu Asp Trp Lys Leu Glu Ile

370 375 380

Gln His Met Phe Asp Asp Leu Arg Thr Lys Glu Lys Glu Leu Arg Ser

385 390 395 400

Arg Glu Glu Glu Leu Leu Arg Ala Ala Gln Glu Gln Arg Phe Gln Glu

405 410 415

Glu Gln Leu Arg Arg Arg Glu Gln Glu Leu Ala Glu Arg Glu Met Asp

420 425 430

Ile Val Glu Arg Glu Leu His Leu Leu Met Cys Gln Leu Ser Gln Glu

435 440 445

Lys Pro Arg Val Arg Lys Arg Lys Gly Asn Phe Lys Arg Ser Arg Leu

450 455 460

Leu Lys Leu Arg Glu Gly Gly Ser His Ile Ser Leu Pro Ser Gly Phe

465 470 475 480

Glu His Lys Ile Thr Val Gln Ala Ser Pro Thr Leu Asp Lys Arg Lys

485 490 495

Gly Ser Asp Gly Ala Ser Pro Pro Ala Ser Pro Ser Ile Ile Pro Arg

500 505 510

Leu Arg Ala Ile Arg Leu Thr Pro Val Asp Cys Gly Gly Ser Ser Ser

515 520 525

Gly Ser Ser Ser Gly Gly Ser Gly Thr Trp Ser Arg Gly Gly Pro Pro

530 535 540

Lys Lys Glu Glu Leu Val Gly Gly Lys Lys Lys Gly Arg Thr Trp Gly

545 550 555 560

Pro Ser Ser Thr Leu Gln Lys Glu Arg Val Gly Gly Glu Glu Arg Leu

565 570 575

Lys Gly Leu Gly Glu Gly Ser Lys Gln Trp Ser Ser Ser Ala Pro Asn

580 585 590

Leu Gly Lys Ser Pro Lys His Thr Pro Ile Ala Pro Gly Phe Ala Ser

595 600 605

Leu Asn Glu Met Glu Glu Phe Ala Glu Ala Glu Asp Gly Gly Ser Ser

610 615 620

Val Pro Pro Ser Pro Tyr Ser Thr Pro Ser Tyr Leu Ser Val Pro Leu

625 630 635 640

Pro Ala Glu Pro Ser Pro Gly Ala Arg Ala Pro Trp Glu Pro Thr Pro

645 650 655

Ser Ala Pro Pro Ala Arg Trp Gly His Gly Ala Arg Arg Arg Cys Asp

660 665 670

Leu Ala Leu Leu Gly Cys Ala Thr Leu Leu Gly Ala Val Gly Leu Gly

675 680 685

Ala Asp Val Ala Glu Ala Arg Ala Ala Asp Gly Glu Glu Gln Arg Arg

690 695 700

Trp Leu Asp Gly Leu Phe Phe Pro Arg Ala Gly Arg Phe Pro Arg Gly

705 710 715 720

Leu Ser Pro Pro Ala Arg Pro His Gly Arg Arg Glu Asp Val Gly Pro

725 730 735

Gly Leu Gly Leu Ala Pro Ser Ala Thr Leu Val Ser Leu Ser Ser Val

740 745 750

Ser Asp Cys Asn Ser Thr Arg Ser Leu Leu Arg Ser Asp Ser Asp Glu

755 760 765

Ala Ala Pro Ala Ala Pro Ser Pro Pro Pro Ser Pro Pro Ala Pro Thr

770 775 780

Pro Thr Pro Ser Pro Ser Thr Asn Pro Leu Val Asp Leu Glu Leu Glu

785 790 795 800

Ser Phe Lys Lys Asp Pro Arg Gln Ser Leu Thr Pro Thr His Val Thr

805 810 815

Ala Ala Cys Ala Val Ser Cys Gly His Arg Arg Thr Pro Ser Asp Gly

820 825 830

Ala Leu Gly Gln Arg Gly Pro Pro Glu Pro Ala Gly His Gly Pro Gly

835 840 845

Pro Arg Asp Leu Leu Asp Phe Pro Arg Leu Pro Asp Pro Gln Ala Leu

850 855 860

Phe Pro Ala Arg Arg Arg Pro Pro Glu Phe Pro Gly Arg Pro Thr Thr

865 870 875 880

Leu Thr Phe Ala Pro Arg Pro Arg Pro Ala Ala Ser Arg Pro Arg Leu

885 890 895

Asp Pro Trp Lys Leu Val Ser Phe Gly Arg Thr Leu Thr Ile Ser Pro

900 905 910

Pro Ser Arg Pro Asp Thr Pro Glu Ser Pro Gly Pro Pro Ser Val Gln

915 920 925

Pro Thr Leu Leu Asp Met Asp Met Glu Gly Gln Asn Gln Asp Ser Thr

930 935 940

Val Pro Leu Cys Gly Ala His Gly Ser His

945 950

<210> 6

<211> 2865

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atggaggagg aggagggggc ggtggccaag gagtggggca cgacccccgc ggggcccgtc 60

tggaccgcgg tgttcgacta cgaggcggcg ggcgacgagg agctgaccct gcggaggggc 120

gatcgcgtcc aggtgctttc ccaagactgt gcggtgtccg gcgacgaggg ctggtggacc 180

gggcagctcc ccagcggccg cgtgggcgtc ttccccagca actacgtggc ccccggcgcc 240

cccgctgcac ccgcgggcct ccagctgccc caggagatcc ccttccacga gctgcagcta 300

gaggagatca tcggtgtggg gggctttggc aaggtctatc gggccctgtg gcgtggcgag 360

gaggtggcag tcaaggccgc ccggctggac cctgagaagg acccggcagt gacagcggag 420

caggtgtgcc aggaagcccg gctctttgga gccctgcagc accccaacat aattgccctt 480

aggggcgcct gcctcaaccc cccacacctc tgcctagtga tggagtatgc ccggggtggt 540

gcactgagca gggtgctggc aggtcgccgg gtgccacctc acgtgctggt caactgggct 600

gtgcaggtgg cccggggcat gaactaccta cacaatgatg cccctgtgcc catcatccac 660

cgggacctca agtccatcaa catcctgatc ctggaggcca tcgagaacca caacctcgca 720

gacacggtgc tcaagatcac ggacttcggc ctcgcccgcg agtggcacaa gaccaccaag 780

atgagcgctg cggggaccta cgcctggatg gcgccggagg ttatccgtct ctccctcttc 840

tccaaaagca gtgatgtctg gagcttcggg gtgctgctgt gggagctgct gacgggggag 900

gtcccctacc gtgagatcga cgccttggcc gtggcgtatg gcgtggctat gaataagctg 960

acgctgccca ttccctccac gtgccccgag ccctttgccc gcctcctgga ggaatgctgg 1020

gacccagacc cccacgggcg gccagatttc ggtagcatct tgaagcggct tgaagtcatc 1080

gaacagtcag ccctgttcca gatgccactg gagtccttcc actcgctgca ggaagactgg 1140

aagctggaga ttcagcacat gtttgatgac cttcggacca aggagaagga gcttcggagc 1200

cgtgaggagg agctgctgcg ggcggcacag gagcagcgct tccaggagga gcagctgcgg 1260

cggcgggagc aggagctggc agaacgtgag atggacatcg tggaacggga gctgcacctg 1320

ctcatgtgcc agctgagcca ggagaagccc cgggtccgca agcgcaaggg caacttcaag 1380

cgcagccgcc tgctcaagct gcgggaaggc ggcagccaca tcagcctgcc ctctggcttt 1440

gagcataaga tcacagtcca ggcctctcca actctggata agcggaaagg atccgatggg 1500

gccagccccc ctgcaagccc cagcatcatc ccccggctga gggccattcg cctgactccc 1560

gtggactgtg gtggcagcag cagtggcagc agcagtggag gaagtgggac atggagccgc 1620

ggtgggcccc caaagaagga agaactggtc gggggcaaga agaagggacg aacgtggggg 1680

cccagctcca ccctgcagaa ggagcgggtg ggaggagagg agaggctgaa ggggctgggg 1740

gaaggaagca aacagtggtc atcaagtgcc cccaacctgg gcaagtcccc caaacacaca 1800

cccatcgccc ctggctttgc cagcctcaat gagatggagg agttcgcgga ggcagaggat 1860

ggaggcagca gcgtgccccc ttccccctac tcgaccccgt cctacctctc agtgccactg 1920

cctgccgagc cctccccggg ggcgcgggcg ccgtgggagc cgacgccgtc cgcgcccccc 1980

gctcggtggg gacacggcgc ccggcggcgc tgcgacctgg cgctgctagg ctgcgccacg 2040

ctgctggggg ctgtgggcct gggcgccgac gtggccgagg cgcgcgcggc cgacggtgag 2100

gagcagcggc gctggctcga cggcctcttc tttccccgcg ccggccgctt cccgcggggc 2160

ctcagcccac ccgcgcgtcc ccacggccgc cgcgaagacg tgggccccgg cctgggcctg 2220

gcgccctcgg ccaccctcgt gtcgctgtcg tccgtgtccg actgcaactc cacgcgttca 2280

ctgctgcgct ctgacagtga cgaggccgca ccggccgcgc cctccccacc accctccccg 2340

cccgcgccca cacccacgcc ctcgcccagc accaaccccc tggtggacct ggagctggag 2400

agcttcaaga aggacccccg ccagtcgctc acgcccaccc acgtcacggc tgcatgcgct 2460

gtgagctgcg ggcaccggcg gacgccatcg gacggggcgc tggggcagcg ggggccgccc 2520

gagcccgcgg gccatggccc tggccctcgt gaccttctgg acttcccccg cctgcccgac 2580

ccccaggccc tgttcccagc ccgccgccgg ccccctgagt tcccaggccg ccccaccacc 2640

ctgacctttg ccccgagacc tcggccggct gccagtcgcc cccgcttgga cccctggaaa 2700

ctggtctcct tcggccggac actcaccatc tcgcctccca gcaggccaga cactccggag 2760

agccctgggc cccccagcgt gcagcccaca ctgctggaca tggacatgga ggggcagaac 2820

caagacagca cagtgcccct gtgcggggcc cacggctccc actaa 2865

<210> 7

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

aggcatcatg gtctacagaa tct 23

<210> 8

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

acttctctag ggatgcctgc 20

<210> 9

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

acgggccctc tagactcgag cgccaccatg agctggggca ccgagctctg ggatc 55

<210> 10

<211> 45

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

agtcacttaa gcttggtacc gagtggacag gaaacgcacc atatc 45

<210> 11

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

acgggccctc tagactcgag cgccaccatg gaggaggagg agggggcggt ggcc 54

<210> 12

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

agtcacttaa gcttggtacc gagtgggagc cgtgggcccc gcacaggggc actgtg 56

<210> 13

<211> 54

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

acgggccctc tagactcgag cgccaccatg gaggaggagg agggggcggt ggcc 54

<210> 14

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

agtcacttaa gcttggtacc gagtgggagc cgtgggcccc gcacaggggc actgtg 56

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号