首页> 中国专利> 一种预测宫颈鳞癌化疗疗效的标志物及其筛选方法和应用

一种预测宫颈鳞癌化疗疗效的标志物及其筛选方法和应用

摘要

本发明公开了一种预测宫颈鳞癌化疗疗效的标志物及其筛选方法和应用。该标志物为SRSF7、SNRPB、SNRPA、SF3A2和PQBP1基因中的至少一种。一种检测预测宫颈鳞癌化疗疗效标志物的试剂在制备用于预测宫颈鳞癌基于顺铂联合放化疗效果的产品中的应用,该试剂为检测SRSF7、SNRPB、SNRPA、SF3A2或PQBP1基因频率或表达水平的试剂。本发明筛选得到的基因可以准确的将放化疗有反应者和无反应患者区分开来,利用所述基因可辅导患者选择不同的治疗方式。

著录项

  • 公开/公告号CN112458171A

    专利类型发明专利

  • 公开/公告日2021-03-09

    原文格式PDF

  • 申请/专利权人 西南医科大学;

    申请/专利号CN202011353407.4

  • 申请日2020-11-27

  • 分类号C12Q1/6886(20180101);G01N33/574(20060101);C12N15/11(20060101);G16B15/30(20190101);G16B20/30(20190101);G16B40/20(20190101);

  • 代理机构51229 成都正华专利代理事务所(普通合伙);

  • 代理人李蕊

  • 地址 646000 四川省泸州市龙马潭区香林路1段1号

  • 入库时间 2023-06-19 10:10:17

说明书

技术领域

本发明属于生物技术领域,具体涉及一种预测宫颈鳞癌化疗疗效的标志物,以及检测预测宫颈鳞癌化疗疗效标志物的试剂在制备用于预测宫颈鳞癌联合化疗效果的产品中的应用。

背景技术

宫颈癌是全世界妇女癌症死亡的主要原因之一。对于研究人员和医生来说,宫颈癌的治疗仍然是一个重大挑战。此外,与工业化国家相比,欠发达地区的死亡率显著增加,因为大多数患者在诊断时已经处于晚期。宫颈癌有鳞状细胞癌和腺癌两种,其中以鳞状细胞癌所占比例最大。目前,宫颈鳞癌的治疗主要包括手术、化疗、放疗或联合治疗。联合放化疗是局部晚期宫颈鳞癌的主要治疗方法。

在过去的工作中,临床发现联合放化疗对部分局部晚期宫颈鳞癌患者无效并表现出治疗耐药性。大约一半的患者在治疗后的头两年内会复发或转移,高达40%的患者对常规治疗无反应,目前联合放化疗治疗局部晚期宫颈鳞癌无效的原因尚不清楚。对于治疗无效的患者,我们需要采用其他有效的治疗方案。基因组失衡可导致癌细胞中癌基因和抑癌基因的不可控表达。因此,我们需要寻找与局部晚期宫颈鳞癌患者治疗相关的基因,以区分预后好的患者和预后差的患者。

临床上对于局部晚期宫颈鳞癌放化疗的治疗并没有考虑到患者个性化的差异,因此对于检测基因表达谱数据,建立预测模型,筛选出局部晚期宫颈鳞癌放化疗不敏感的病人是很重要的,可在一定程度上对病人的预后产生积极的作用。在治疗上,转录因子是一种结合特定DNA序列来控制从DNA到mRNA转录信息速率的蛋白质,可以通过改变转录因子来调节其影响的与放化疗疗效相关的基因,从而影响其作用的信号通路,提高放化疗敏感性,让更多的患者对放化疗治疗产生反应。

综上所述,筛选新的局部晚期宫颈鳞癌放化疗敏感性基因,将有助于提高放化疗疗效,实现更精准的风险评估,有助于开发有效的靶向治疗药物,推动局部晚期宫颈鳞癌的个性化治疗的开展。

发明内容

针对现有技术中的上述不足,本发明提供一种预测宫颈鳞癌化疗疗效的标志物,通过检测相关基因的表达量高低,可以区分预后好的患者和预后差的患者。

为实现上述目的,本发明解决其技术问题所采用的技术方案是:

一种预测宫颈鳞癌化疗疗效的标志物,该标志物为SRSF7、SNRPB、SNRPA、SF3A2和PQBP1基因中的至少一种。

一种检测预测宫颈鳞癌化疗疗效标志物的试剂在制备用于预测宫颈鳞癌基于顺铂联合放化疗效果的产品中的应用,该试剂为检测SRSF7、SNRPB、SNRPA、SF3A2或PQBP1基因频率或表达水平的试剂。

进一步地,基因频率的试剂包括使用免疫组库测序方法检测SRSF7、SNRPB、SNRPA、SF3A2或PQBP1基因基因频率的试剂。

进一步地,基因表达水平的试剂包括针对SRSF7、SNRPB、SNRPA、SF3A2或PQBP1基因的探针、引物、抗体或配体。

进一步地,产品还包括RNA提取试剂、GAPDH内参引物、PCR反应液、反转录试剂、阴性对照和阳性对照。

一种用于宫颈鳞癌辅助诊断或疗效预测的试剂盒,包括用于检测SRSF7、SNRPB、SNRPA、SF3A2或PQBP1基因表达量的引物;

引物序列为:

SRSF7-F:5’-CTATGAGTGTGGCGAAAAGGGAC-3’;(SEQ ID NO.1)

SRSF7-R:5’-GAGTATCGCCTTCCTCTGGATC-3’;(SEQ ID NO.2)

SNRPB-F:5’-TTGGCACCTTCAAGGCTTTTGAC-3’;(SEQ ID NO.3)

SNRPB-R:5’-AGACCGAGGACTCGCTTCTCTT-3’;(SEQ ID NO.4)

SNRPA-F:5’-CTGGTATCACGGAGCCTGAAGA-3’;(SEQ ID NO.5)

SNRPA-R:5’-TGAGTCGGTCTTGGCATACTGG-3’;(SEQ ID NO.6)

SF3A2-F:5’-GAAGAACCACCTGGGCTCCTAT-3’;(SEQ ID NO.7)

SF3A2-R:5’-CAGGTTGGTCTGGTGCTTCTTC-3’;(SEQ ID NO.8)

PQBP1-F:5’-ACTCCGTGGTTACCAAATCGGC-3’;(SEQ ID NO.9)

PQBP1-R:5’-CCCTGTCTAGTTTCTCATGGCTG-3’。(SEQ ID NO.10)

一种权利要求1所述预测宫颈鳞癌化疗疗效标志物的筛选方法,包括以下步骤:

(1)在GEO数据库(GEO,http://www.ncbi.nlm.nih.gov/geo/)中检索局部晚期宫颈鳞癌晚期放化疗治疗的表达谱数据集,共有3个数据集,分别是GSE56303-GPL10191,GSE56303-GPL16025和GSE56363;

(2)基于检索的数据集,采用R软件(https://www.r-project.org/)包含的RMA软件包对数据进行归一化处理,依据放化疗有效和放化疗无效进行分组,采用limma软件包筛选出差异基因,筛选标准为:P<0.05并且log|FC|>0.5;

(3)将步骤(2)中每个数据集获得的差异基因分别两两取交集基因,获得共同表达趋势的差异基因;

(4)利用DAVID(https://david.ncifcrf.gov/)工具对步骤(3)获得的共同上调基因进行GO(基因本体论)和KEGG信号通路富集分析,采用ANOVA检验基因本体论和KEGG信号通路的数据间差异。

(5)我们在STRING(https://string-db.org/)数据库中构建蛋白相互作用关系,利用Cytoscape的插件MCODE去找出功能模块和重要基因;

(6)在TCGA数据库(https://cancergenome.nih.gov/)中下载宫颈鳞癌患者的病理样本,对关键基因的表达量和临床数据进行分析,判断重要基因的预后及获得与预后相关的目标靶基因。利用HPA(https://www.proteinatlas.org/)分析重要基因与其数据库的交集基因;

(7)采用NetworkAnalyst(http://www.networkanalyst.ca)预测目标基因的转录因子,然后使用JASPAR转录因子与目标基因的结合位点。

进一步地,步骤(1)中检索关键词为“(locally advanced cervical squamouscell carcinoma)and(chemoradiotherapy OR radiotherapy OR radiation)”,限制研究类型为expression profiling by array,限制性物种为Homo sapiens。

进一步地,步骤(3)共同表达趋势的差异基因为相比于放化疗无反应者显著性共同上调基因和共同下调基因。

进一步地,步骤(4)中共同表达趋势的差异基因为共同上调基因。

进一步地,步骤(6)获得的目标靶基因包括SRSF7、SNRPB、SNRPA、SF3A2和PQBP1基因。

本发明的有益效果为:

本申请根据放化疗有反应者和无反应者,筛选得到与局部晚期宫颈鳞癌放化疗相关的差异基因,并对其进行GO和KEGG信号通路富集分析,以获得相应的信号通路。对共同上调的差异基因进行蛋白相互作用网络分析,分析功能模块,得到重要基因,然后将重要基因进行临床预后分析,筛选得到的基因可作为预测局部晚期宫颈鳞癌放化疗疗效的标志物。经过接收者操作特征曲线(ROC曲线)分析,本发明筛选得到的基因可以准确的将放化疗有反应者和无反应患者区分开来,利用所述基因可辅导患者选择不同的治疗方式。

附图说明

图1为本发明的流程示意图;

图2为晚期宫颈鳞癌放化疗有反应者与无反应者的差异基因识别;(A)为反应者与无反应者之间的差异基因火山图,在每个火山图中,左边方框里的基因表示下调基因,右边方框里的基因表示上调基因;

(B)为3个数据集中差异基因的维恩图,共筛选出427个上调差异基因和58个下调差异基因;

图3为上调差异基因的GO和KEGG信号通路分析结果图;(A)为427个上调差异基因的GO分析;(B)为差异基因富集的信号通路。

图4为差异基因的蛋白互作网络分析;通过Cytoscape的MCODE插件识别出PPI网络中排名前3位的功能模块,功能模块一的分数是10,功能模块二的分数是9.6,功能模块三的分数是9.294;

图5为功能模块一中10个重要基因分析;(A)为基于10个重要基因的GO的BP/MF/CC分析;(B)为10个关键基因之间的相关性,线越宽,相关性越强;(C)热图显示了基因之间的相关性。

图6为10个重要基因临床意义的验证及获得目标靶基因;(A)为SRSF7、SNRPB、SNRPA、SF3A2和PQBP1的表达量总生存期相关,即我们要的目标靶基因,High为高表达组,Low为低表达组,P<0.05表示具有显著性差异;(B)为Venn显示10个关键基因和HAP数据库基因的共同基因,SNRPA、PQBP1、SF3A2对宫颈鳞癌预后良好;

图7为预测SRSF7、SNRPB、SNRPA、SF3A2和PQBP1的潜在转录因子;(A)为转录因子和筛选出的5个上调基因网络示意图,圆形节点代表目标靶基因,四边形代表潜在的转录因子;(B)为转录因子ELF1、ZBTB7A和TFDP1在宫颈鳞癌患者和正常人中的表达水平;(C)为ELF1与SNRPB、SNRPA、SF3A2和PQBP1表达的相关性;(D)为转录因子ELF1的序列标志,其总高度越高,表示该位置碱基的保守类型越大,字母越大,出现该碱基出现的概率越大;(E)为转录因子ELF1在SNRPA、SNRPB和PQBP1基因序列中的结合位点预测;

图8为目标靶基因(SRSF7,SNRPB,SNRPA,SF3A2,PQBP1)对3个数据集(GSE56303-GPL10191,GSE56303-GPL16025,GSE56363)进行分类预测的ROC曲线,目标靶基因对GSE56303-GPL16025的AUC为0.935,目标靶基因对GSE56303-GPL10191的AUC为0.771,目标靶基因对GSE56363的AUC为0.935。

具体实施方式

下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

实施例1筛选获得与局部晚期宫颈鳞癌放化疗疗效相关的差异基因

1、在GEO数据库中检索局部晚期宫颈鳞癌放化疗相关的表达谱数据集,检索关键词为:“(locally advanced cervical squamous cell carcinoma)and(chemoradiotherapy OR radiotherapy OR radiation)”,限制研究类型为:expressionprofiling by array,限制性物种为:Homo sapiens。所选择的数据要符合以下条件:(1)数据集必须是整个宫颈癌基因组的表达mRNA芯片数据;(2)数据必须是联合放化疗对局部晚期宫颈鳞癌有效性和无效性的对照研究;(3)数据集case(responders)-control(non-responders)组必须包含或超过3个样本;(4)必须提供每个样品的处理结果信息。符合上述标准的数据集将纳入本研究。最后,有3个数据集满足我们的标准:GSE56303-GPL10191,GSE56303-GPL16025和GSE56363。如表1所示:

表1 与局部晚期宫颈鳞癌放化疗相关的数据集

2、基于检索到数据集,采用R分析平台下RMA软件包分别进行数据归一化。然后在每个数据集中将样本分为放化疗有反应者(实验组)和无反应者(对照组),利用limma软件包分别进行差异基因分析。选取差异基因的标准为p-value<0.05,|log2FC|>0.5,GSE56303-GPL10191中有显著差异基因690个,其中上调基因482个,下调基因208个。GSE56303-GPL16025基因中有3763个差异基因,其中2301个为上调基因,1462个为下调基因。GSE56363中差异表达基因4273个,其中上调基因2132个,下调基因2141个。

3、将步骤B获取的差异基因两两取交集,共有485个共同差异基因,其中427个表达上调,58个表达下调,如图2所示;

4、利用DAVID(https://david.ncifcrf.gov/)工具对步骤C得到的上调基因进行GO和KEGG信号通路富集分析,采用ANOVA检验GO和KEGG信号通路的数据间差异。427个上调差异基因的GO分析得到21类生物学过程注释信息,主要集中于positive regulation oftranscription from RNA polymerase II promoter和negative regulation oftranscription from RNA polymerase II promoter等;结果得到的细胞组分注释信息主要包括extracellular matrix,Golgi apparatus和endoplasmic reticulum等;结果共得到21类分子功能注释信息,主要集中于protein binding和identical protein binding,如图3所示。

5、利用String工具对步骤C得到的上调基因进行蛋白互作分析,利用MCODE插件得到3个功能模块,其中模块一的分数是10,模块二的分数是9.6,模块三的分数是9.294(图4)。

6、对得分最高的功能模块一的10个基因进行GO功能分析及KEGG信号通路分析,然后验证它们对临床的意义。发现这10个基因CPSF1、DHX38、HNRNPA0、SNRPB、SRSF7、SNRPA、NUDT21、SF3A2、PQBP1、POLR2E)的生物学过程主要富集到mRNA splicing,viaspliceosome,termination of RNA polymerase II transcription;细胞组成成分分析表明,这些基因大多富集于nucleoplasm,nucleus。在分子功能方面,这些基因与poly(A)RNAbinding显著相关(图5A)。分析这10个重要基因发现他们具有正相关性(图5B-C)。为了进一步验证关键基因的临床价值,我们评估了基因表达量与临床特征之间的关系。我们发现SRSF7、SNRPB、SNRPA、SF3A2、PQBP1高表达与高生存率相关(图6A),SNRPA、SF3A2和PQBP1在HPA数据库中显示在宫颈鳞癌患者中高表达具有良好的预后(图6B)。

实施例2预测目标基因的转录因子

1、进一步使用NetworkAnalyst工具预测能够调控SRSF7、SNRPB、SNRPA、SF3A2和PQBP1表达的转录因子。我们发现ZBTB7A、TFDP1和ELF1可以调控这5个基因的表达(图7A)。

2、相关分析显示ELF1与SNRPB、SNRPA、PQBP1呈负相关(图7C)。

3、为了找到ELF1序列,我们使用了JASPAR分析。从ELF1的序列标志可以看出,ELF1序列在第7-10号保守型中较高,且G和A碱基出现的频率很高(图7D)。

4、我们通过JASPAR预测ELF1与SNRPB、SNRPA和PQBP1的结合序列,结果显示ELF1与这些基因上游结合。本研究采用90%阈值进行评分,其中SNRPB的相对评分为0.9066,SNRPA的相对评分为0.9384,PQBP1的相对评分为0.9038(图7E)。

实施例3验证靶基因与局部晚期宫颈鳞癌放化疗疗效的相关性

1、靶基因在局部晚期宫颈鳞癌放化疗敏感与不敏感病人中的表达水平差异:

(1)分别在3个数据集(GSE56303-GPL10191,GSE56303-GPL16025,GSE56363)中筛选出靶基因的表达量;

(2)将3个数据集中的样本分别分为放化疗敏感组和不敏感祖;;

(3)进行统计分析,两组数据间的差异采用t检验,p-value<0.05并且log2|FC|>0.5被认为有统计学意义。

(4)靶基因在局部晚期宫颈鳞癌放化疗敏感与不敏感病人中的表达水平差异结果如表2所示:

表2 靶基因在局部晚期宫颈鳞癌放化疗敏感与不敏感病人中的表达水平差异

2、靶基因表达水平对局部晚期宫颈鳞癌放化疗疗效的评判分析:操作特征曲线(ROC)可以用来评判分类效果,ROC曲线下的面积(AUC)用于评价分类器的好坏。

(1)首先筛选出3个数据集(GSE56303-GPL10191,GSE56303-GPL16025,GSE56363)中目标基因的表达量;

(2)利用R平台的glmnet软件包建立Logistic回归模型,对数据进行预测;

(3)利用ROCR软件包绘制预测结果的ROC曲线,计算曲线下面积AUC值,结果如图8所示。

综上所述,本申请搜集了与局部晚期宫颈鳞癌放化疗疗效相关的数据集,通过生物信息学分析得到了5个目标基因,发现这些基因的功能注释以及所富集的信号转导通路与局部晚期宫颈鳞癌放化疗疗效相关,这为局部晚期宫颈鳞癌放化疗疗效差异的研究提供了理论依据。

序列表

<110> 西南医科大学

<120> 一种预测宫颈鳞癌化疗疗效的标志物及其筛选方法和应用

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ctatgagtgt ggcgaaaagg gac 23

<210> 2

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gagtatcgcc ttcctctgga tc 22

<210> 3

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ttggcacctt caaggctttt gac 23

<210> 4

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

agaccgagga ctcgcttctc tt 22

<210> 5

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ctggtatcac ggagcctgaa ga 22

<210> 6

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

tgagtcggtc ttggcatact gg 22

<210> 7

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

gaagaaccac ctgggctcct at 22

<210> 8

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

caggttggtc tggtgcttct tc 22

<210> 9

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

actccgtggt taccaaatcg gc 22

<210> 10

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ccctgtctag tttctcatgg ctg 23

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号