首页> 中国专利> 胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用

胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用

摘要

本发明涉及一种个体尿蛋白与胃癌及胃黏膜病变进展关联的分析方法;并通过计算尿蛋白表达与胃黏膜组织病理状态、胃黏膜病变进展的关系,从而建立胃癌以及胃黏膜病变进展相关的尿蛋白标志物数据库;进而建立胃黏膜病变样本疾病进展风险评分体系。本发明基于无创方法,通过分子流行病学研究手段,结合生物信息学分析及机器学习,整合微观与宏观胃癌病因危险因素,建立胃黏膜病变进展风险预测模型为胃癌早筛和精准预防打下基础。

著录项

  • 公开/公告号CN114822854A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利号CN202210733363.0

  • 发明设计人 李文庆;秦钧;潘凯枫;樊桦;

    申请日2022-06-27

  • 分类号G16H50/30(2018.01);G16B20/00(2019.01);

  • 代理机构北京中和立达知识产权代理有限公司 11756;

  • 代理人郑茹

  • 地址 100142 北京市海淀区阜成路52号

  • 入库时间 2023-06-19 16:11:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-24

    授权

    发明专利权授予

  • 2022-08-16

    实质审查的生效 IPC(主分类):G16H50/30 专利申请号:2022107333630 申请日:20220627

    实质审查的生效

说明书

技术领域

本发明涉及医学诊断领域,具体涉及一种胃黏膜病变进展及胃癌相关尿蛋白标志物及其应用。

背景技术

胃癌位居全球癌症相关死亡的第四位。早期胃癌预后良好,I期胃癌的5年生存率高达90%,但由于发病隐匿,大多数胃癌患者在中晚期才被诊断出来,导致胃癌的总体5年生存率很低。因此,识别胃癌发生的高风险人群并进行适宜干预,以及提高胃癌的早诊率,对于降低胃癌疾病负担至关重要。目前胃癌诊断的金标准是胃镜检查与活检样本病理诊断,尽管大规模的人群内窥镜筛查有助于提高胃癌早期检出率,但具有侵入性和高风险性,且费用高、耗时长、对专业队伍高度依赖,使得在大多数中低收入国家,基于全人群策略的胃镜筛查并不可行。基于非侵入性方法寻找生物标志物,对有效识别胃癌高危人群以利于分级干预和提高胃癌早期检出率、改善胃癌预后至关重要。

胃癌,尤其是常见的肠型胃癌,其发生经历胃黏膜病变长期复杂的演变过程,从轻度胃黏膜病变如浅表性胃炎(SG)和慢性萎缩性胃炎(CAG)到重度胃黏膜病变如肠上皮化生(IM)和低级别上皮内瘤变(LGIN),最后到高级别上皮内瘤变(HGIN)和浸润性胃癌。开展涵盖各级别胃黏膜病变和胃癌的分子流行病学研究,特别是依托胃黏膜病变的前瞻性随访,从而发现胃黏膜病变进展和胃癌发生风险相关的分子特征,这对胃癌的人群风险分层、分级干预和早期诊断有重要的意义。

尿液是常用的液体活检样本,与其他生物样本相比,其收集是无创的,而且能大量获得,可以用于大规模人群筛查的生物标志物检测。尿液中的蛋白质除了来自泌尿生殖道以外,还来自整体循环系统,携带着能够反映机体生理状况的重要信息。事实上,癌细胞、凋亡细胞和坏死细胞均可向微环境和血液中释放蛋白质,然后被肾脏过滤和重吸收,最终进入尿液。因此,尿液中含有稳定的多肽和含量低但功能重要的蛋白质,可以进行可靠测量。相比血液而言,尿液中的蛋白不会受到稳态机制的影响,能更敏感地反映机体变化,因而能够更好地观察丰度低的关键功能蛋白的变化。随着高通量技术的日趋成熟,尿液蛋白质组学研究为揭示胃黏膜病变进展为癌相关分子特征、探索胃癌新型生物标志物提供了新途径和机会。既往肾癌、膀胱癌和肺癌相关蛋白质组学研究表明尿液蛋白具备作为生物标志物的潜力。目前胃癌的尿蛋白质组学研究较少,且并无对胃癌发病机制模型中不同胃黏膜病变和早期胃癌相关尿蛋白质组学特征和差异性分子标签的系统探讨。

发明内容

针对目前胃癌早筛的无创蛋白标志物的缺乏,本发明提供如下的技术方案:

本发明第一个方面,提供一种胃黏膜病变样本疾病进展风险评分体系的建立方法,所述方法包括如下步骤:

1)利用尿蛋白标志物建立风险评分公式;所述尿蛋白标志物是既与胃癌显著相关又与胃黏膜病变进展显著相关的蛋白;所述风险评分公式为:

风险评分 =

2)分析风险评分与胃黏膜病变进展关系

对疾病进展结局进行判定,并将临床变量纳入关联分析,再基于多因素非条件Logistic回归建模分析风险评分与胃黏膜病变进展之间的关系。

在一种实施方式中,所述尿蛋白标志物通过如下方法筛选:

(1)分析蛋白表达与组织病理胃黏膜病变状态关系,筛选与胃癌显著相关蛋白:

a)胃黏膜病变状态根据组织病理诊断分为SG、CAG、IM、DYS、GC, 分别以轻度胃黏膜病变(SG/CAG)和重度胃黏膜病变(IM/DYS)为参照,及胃癌(GC)蛋白表达差异;

b)纳入关联分析的临床变量:性别、年龄;

c)关联分析方法:正交偏最小二乘法判别分析(OPLS-DA),多因素非条件Logistic回归;

其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄;选择OPLS-DA 分析VIP值>1且Logistic回归

(2)分析蛋白表达与胃黏膜病变进展关系,筛选与胃黏膜病变进展显著相关的蛋白:

a) 疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;

b) 纳入关联分析的临床变量:性别、年龄和基线组织病理诊断

c) 关联分析方法:多因素非条件Logistic回归;

其中,进行多因素非条件Logistic 回归所校正的临床变量是:性别、年龄和基线组织病理诊断,

在一种实施方式中,所述步骤2)分析风险评分与胃黏膜病变进展关系的具体方法为:

a)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为疾病非进展;

b)纳入关联分析的临床变量:性别、年龄和基线组织病理诊断;

c)关联分析方法:多因素非条件Logistic回归;

其中,所述多因素非条件Logistic回归所校正的临床变量是:性别、年龄和基线组织病理诊断。

在一种优选的实施方式中,所述风险评分公式为

0.311×ANXA11+0.936×CDC42+0.277×NAPA+0.243×SLC25A4。

本发明的第二个方面,提供一种尿蛋白标志物在制备胃癌高风险人群识别检测试剂盒和/或芯片中的应用,所述尿蛋白标志物选自ANXA11、CDC42、NAPA、SLC25A4、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANGPTL2、CAPG、CETP、COX4I1、CTSC、EEF1A1、EEF1A2、GOT2、GPRC5B、GUSB、HADHB、HNRNPA2B1、HSP90B1、HSPA5、HSPA6、HSPD1、IGFALS、LAP3、MFI2、NAGLU、PDXK、PHB、RHOA、SGSH、SLC25A5、SLC25A6、SUCLG2、TUBB、TUBB2A、TUBB3、TUBB4A、TUBB4B、TUBB6和/或UQCRC2。

本发明的第三个方面,一种尿蛋白标志物在制备胃粘膜病变进展检测试剂盒和/或芯片中的应用,所述尿蛋白标志物选自ACO1、AHSG、ALDH7A1、AMY1A、AMY1B、AMY1C、AMY2A、AMY2B、ANXA11、ANXA4、ANXA5、ANXA6、ARPC4、ASAH1、ATIC、ATP6V1A、ATP6V1B1、ATP6V1B2、BAIAP2、BASP1、CAB39、CAND1、CDC42、CNP、COL6A1、CRYL1、EHD4、EPS8、GALNS、GLB1、KRT77、LAMP2、LDHA、LDHB、MSN、MUC1、MXRA5、MYH9、NAPA、NAPRT1、PEBP1、PGM1、PIGR、PPIA、PPIC、PRCP、PRDX6、QSOX1、RBP5、RDX、RPS27A、SLC25A4、SLC44A2、TCP1、THY1、TSG101、UBA52、UBB、UBC、VASN、VDAC3、VPS4A、ZG16B、C1RL、LRP2、MFI2和/或SLC12A3。

本发明的第四个方面,提供一种尿蛋白标志物在诊断早期胃癌和/或胃黏膜病变的产品中的应用,所述生物标志物包括ANXA11、CDC42、NAPA、SLC25A4。

在一种实施方式中,所述产品包括检测所述生物标志物表达水平的试剂。

在一种实施方式中,所述检测所述生物标志物表达水平的试剂包括检测引物和/或探针。

在一种实施方式中,所述产品是试剂盒或基因芯片。

本发明的有益效果是:

1)本发明选择尿液作为样本,可以无创且大量的收集,适用于大规模筛查。

2)尿液中含有丰度低但重要的蛋白,能全面的反应机体生理、病理状态。

3)本发明采用高灵敏度、高分辨率、高精准的高通量质谱技术以更进一步地挖掘极低丰度蛋白质的特征信息,可以实现更高的检测效率。

4)通过病例对照结合前瞻性随访来探究与胃癌及胃黏膜病变进展相关尿蛋白标志物,为胃癌病因学探索提供了重要线索;

5)本发明基于高灵敏度、高分辨率、高精准的现代质谱技术,通过定量蛋白质组学研究筛选和寻找不同胃黏膜病变与胃癌组、胃黏膜病变进展与非进展组尿液样本之间的差异表达蛋白,经过多因素分析,建立胃癌及胃黏膜病变进展相关分子标志物数据库。通过分子流行病学研究手段,结合生物信息学分析及机器学习,整合微观与宏观胃癌病因危险因素,建立胃黏膜病变进展风险预测模型,为最终构建全面系统的胃癌预防策略提供理论依据。

附图说明

图1是SG/CAG、IM/LGIN和胃癌组中可检测到的蛋白质数量分布图。

图2是255例胃黏膜组织样本蛋白表达谱预处理结果。

图3是风险评分与胃黏膜病变进展风险关系-多因素非条件Logistic回归森林图。

图4是进展风险预测模型图-随机森林模型受试者工作特征曲线(ROC)图。

具体实施方式

下面结合具体实施例对本发明作示例性说明。下述实施例中的实验方法,如无特别说明,均为常规方法。下述实施例中所使用的材料、试剂等,如无特殊说明,均可通过商业途径获得。

实施例1. 获得不同胃黏膜病变和胃癌尿液样本的蛋白质表达谱数据

实验样本为来自本实验室在山东省临朐县所建立的胃癌高发流行病学现场及北京大学肿瘤医院胃肠肿瘤中心的255例不同胃黏膜病变和胃癌患者清晨中段尿液样本,所有患者均已签署知情同意书。

针对255例临床胃镜活检胃黏膜组织样本进行蛋白质提取和分析,通过该步骤获得每一样本对应的蛋白质组数据集,包括蛋白的种类、数量和各种蛋白的定量值。

一、样本获取步骤

1、取材:用15mL采尿杯收集约15mL清晨中段尿;

2、分装:用胶头滴管将尿液分装到5mL含硼酸防腐剂的冻存管中;

3、存储:将冻存管存储于-80℃低温冰箱中保存。

二、蛋白质定量步骤

1、解冻:将5mL解冻的尿液置于清洁的超滤管中;

2、离心:在200000 g转速下超速离心70分钟;

3、清洗:向离心沉淀物中加入0.5 mol/L 的DTT缓冲液在65℃下加热30分钟,以去除其中的尿调蛋白;再用洗涤缓冲液(10mM TEA,100mM NaCl,pH 7.4)洗涤沉淀物两次;

4、蛋白酶解:超滤管更换新的收集管,加入胰酶,消化过夜;

5、肽段收集:将超滤管离心,14,000g、20min,保留收集管中的肽段,再加入质谱水200ul,离心清洗一次,保留第二次收集的肽段,两次收集的肽段合并后真空抽干,得到的产物用于质谱检测。

三、质谱方法:

为Thermo公司新型液质联用-串联质谱(LC-MS/MS),预柱和分析柱均使用C18填料。所用的流动相为A液(H

四、质谱数据的解析与蛋白质定量

LC-MS/MS原始数据在Proteome Discoverer 1.4(Thermo Fisher Scientific)中处理,并使用Mascot搜索引擎(Matrix Science 2.3)针对NCBI human Refseq蛋白质数据库(2013年7月4日发布)进行搜索。将母离子质量偏差设为20ppm,子离子设置为50ppm,计算所鉴定到的肽段在的MS1峰下面积,错误发现率低于1%的肽段被保留下来。具体步骤参照CN108445097A中具体实施方式部分“四、胃癌蛋白样品的质谱数据分析”部分。

五、肽段质控:

筛选条件:

条件1: 唯一肽段数 >=1 并且高质量肽段数 >=2

条件2: 高质量肽段数 >=3

唯一肽段是指只在一个蛋白中存在的肽段;

高质量肽段是指Mascot评分在20分以上的肽段, 即二级谱鉴定时的严格程度;

满足上面条件1或2的蛋白保留进行下一步分析。

实施例2. 胃癌及胃黏膜病变进展相关分子标志物数据库的建立及诊断生物标志物的筛选

1、蛋白表达谱预处理和实验过滤

(1)高置信蛋白筛选:要求定量的蛋白含有至少一条专属肽段(unique peptide)且Mascot离子分值(ion score)大于等于20,且至少二条离子分值大于等于20的肽段,或者三条离子分值大于等于20的肽段;

(2)基于总和的定量数据标准化:采用基于峰面积的非标记定量iBAQ法,某个蛋白的iBAQ值即为该蛋白所有对应肽段峰面积之和与理论肽段数之商。通过计算鉴定到的每个蛋白iBAQ值与鉴定到的所有蛋白iBAQ值之和的比值对数据进行归一化处理,得到定量值(iFOT值);

(3)以实施例1的胃黏膜病变样本为例,剔除低于1/2以上样本中未检测到的蛋白,该步骤可根据不同癌症、不同样本类型的实际蛋白鉴定数进行调整。

结果如图1所示,实施例1的255例不同胃黏膜病变和胃癌尿液样本中共鉴定到3540个高可信度蛋白;图2为255例胃黏膜组织样本蛋白表达谱预处理结果。

2. 鉴定并验证蛋白表达与组织病理胃黏膜病变状态之间的关系

(1)以胃黏膜病变蛋白质组学数据为例,分别以轻度胃黏膜病变(SG/CAG)和重度胃黏膜病变(IM/LGIN)为参照,探索及胃癌(GC)蛋白表达差异;

(2)纳入关联分析的临床变量:患者性别及年龄;

(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄)和OPSL-DA。采用R语言glm函数,Logistic回归的公式为:病变分组~性别+年龄+蛋白(即,以病变分组为因变量,年龄、性别和蛋白为模型中的自变量,后文中均按照此格式表示Logistic回归公式),参数family设置为 binomial(link = "logit")进行Logistic回归分析;采用R语言ropls包opls函数进行OPLS-DA判别分析。

结果如表1所示:鉴定并验证43个蛋白与胃癌显著相关,其中28个蛋白正相关,15个蛋白负相关。

表1 胃癌相关尿蛋白

3. 鉴定并验证蛋白表达与胃黏膜病变进展之间的关系

(1)以胃黏膜病变尿蛋白质组学数据为例,疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG、IM、DYS、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降或不变者判定为非进展;

(2)纳入关联分析的临床变量:患者性别、年龄、基线组织病理诊断;

(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄、基线组织病理诊断),采用R语言glm函数,Logistic回归公式为:病变分组~性别+年龄+基线组织病理诊断+蛋白,参数family设置为 binomial(link = "logit")。

结果如表2所示:鉴定出67个尿蛋白与胃黏膜病变进展显著相关,66个为正相关,一个为负相关。

表2 胃黏膜病变进展显著相关蛋白

实施例3 胃黏膜病变样本疾病进展风险评分体系的建立

1. 胃黏膜病变进展及胃癌相关分子标志物筛选:根据实施例2获得的结果,选择既与胃癌显著相关又与胃黏膜病变进展显著相关且方向一致的蛋白——ANXA11、CDC42、NAPA、SLC25A4。

2. 胃黏膜病变进展风险评分体系的建立:将ANXA11、CDC42、NAPA、SLC25A4作为标志物,通过前述蛋白表达与胃黏膜病变进展关系回归系数及蛋白表达量建立风险评分公式:

风险评分 =

本实施例中,n为4,即为ANXA11、CDC42、NAPA、SLC25A4四种蛋白,

因此根据上面公式计算:

风险评分 = 0.311×ANXA11+0.936×CDC42+0.277×NAPA+0.243×SLC25A4.

3. 风险评分与胃黏膜病变进展关系

根据上述风险评分公式对疾病进展结局进行判定,并将临床变量(性别、年龄和基线组织病理诊断)纳入关联分析,再基于多因素非条件Logistic回归(校正性别、年龄和基线组织病理诊断)建模以分析胃黏膜病变风险评分与胃黏膜病变进展之间的关系,具体操作为:

(1)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG(轻度、中度、重度)、IM(轻度、中度、重度)、LGIN、HGIN、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降者或不变者判定为疾病非进展;

(2)纳入关联分析的临床变量:性别、年龄、基线组织病理诊断;

(3)关联分析方法:多因素非条件Logistic回归(校正性别、年龄、基线组织病理诊断),采用R语言glm函数,Logistic回归公式为:疾病进展与否~性别+年龄+基线组织病理诊断+风险评分,参数family设置为 binomial(link = "logit")。

结果如图3所示,风险评分与疾病进展显著正相关,风险评分每增加一个标准差,疾病进展风险增加2.63倍。

实施例4 利用风险评分构建胃黏膜病变进展风险预测模型

1、胃黏膜病变进展风险预测模型的构建具体过程为:

1)自变量筛选:性别、年龄、基线组织病理诊断和风险评分;

2)疾病进展结局判定:根据基线及随访终点临床组织病理诊断,按SG、CAG(轻度、中度、重度)、IM(轻度、中度、重度)、LGIN、HGIN、GC序列等级进行病理评分,随访终点与基线比较,评分上升者判定为疾病进展,评分下降者或不变者判定为疾病非进展;

3)病变进展风险分类器构建:选择R语言xgboost软件包,xgboost函数,纳入筛选后的变量,参数objective设置为binary:logistic,eval_metric设为logloss ,max_depth、eta、nround等参数可根据数据运行情况进行调整。

a)分类器选择:极端梯度提升算法;也可以选择支持随机森林等其他机器学习分类算法或者人工智能模型;

b)数据输入:筛选后纳入的自变量;

c)算法准确性测试:十折交叉验证。

构建结果如图4所示,分类器1包含性别、年龄和基线组织病理诊断,所获得的受试者工作特征曲线(ROC)下面积(AUC)=0.59;分类器2包含性别、年龄、基线组织病理诊断、风险评分,所获得的AUC=0.80。分类器2与分类器1比较,Delong’s test

4)分类器应用:

a)前处理:表达谱数据预处理,风险评分;

b)输入:筛选后纳入的自变量;

c)中间过程:分类器特征匹配,疾病进展预测:选择R语言xgboost软件包,xgboost函数,纳入筛选后的变量,公式:进展情况~性别+年龄+基线组织病理诊断+风险评分),参数objective设置为binary:logistic,eval_metric设为logloss,max_depth设为3、eta设为0.2、nround设为25,cv.nfold设为10。通过predict函数给出预测标签;

d)输出:疾病进展/非进展。

2. 结果

表3是以本研究中有胃黏膜病变进展信息的患者样本,通过上述步骤4)输出得到的结果,即我们所构建出的预测模型所得到的预测结果。

表3 十折交叉验证预测结果

需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号