首页> 中文学位 >鼻咽癌DNA修复基因、基因-环境交互作用系统性分析及个性化诊疗条码的探索性研究
【6h】

鼻咽癌DNA修复基因、基因-环境交互作用系统性分析及个性化诊疗条码的探索性研究

代理获取

目录

文摘

英文文摘

声明

第1章 前 言

1.1本研究的学术背景及理论与实际意义

1.2鼻咽癌遗传模式、易感基因、环境危险因素及其交互作用的国内外研究现状

1.3基于SNP组学数据的基因交互作用分析方法的国内外研究现状

1.4本课题的来源及主要研究内容

第2章材料与方法

2.1材料与数据

2.2分析方法

第3章分析结果

3.1数据预处理结果

3.2单因素关联分析结果

3.3构建鼻咽癌相关决策森林

3.4.树模型方法识别鼻咽癌显著相关变量

3.5树模型方法识别鼻咽癌显著相关变量对子

3.6从SNP数据中识别鼻咽癌显著相关SNP对子

3.7构建鼻咽癌特异性基因-环境网络图

3.8构建鼻咽痛特异性基因网络

3.9识别鼻咽癌核心基因

3.10核心基因的通路分析

3.11富集分析

3.12遗传算法的迭代与收敛情况

3.13通过遗传算法建立的鼻咽癌危险因素条码(barcode)

3.14不同特征变量选取方法构建barcode的比较

第4章讨论

4.1基于DNA修复通路选取候选基因,对于揭示鼻咽癌潜在分子致病机制具有重要意义

4.2树模型方法与传统单因素关联分析方法的比较

4.3树模型中F、AFV指标方法与SW、PW指标方法的比较

4.4不同特征变量选取方法构建barcode的比较

第5章 小 结

5.1本研究的意义

5.2本研究中存在的不足

5.3研究展望

参考文献

附 录

致 谢

展开▼

摘要

研究背景:
   鼻咽癌是高发于我国南方地区的恶性肿瘤,尤其以广东省的发病率为最高。以往对鼻咽癌致病机制的研究已揭示鼻咽癌的发生是多基因、多种环境危险因素以及基因间交互作用、基因-环境交互作用的结果。随着人类基因组计划的顺利实施、大规模单核苷酸多态性(Single Nucleotide Polymorphism,SNP)组学技术的飞速发展和相应高通量工业平台的建立,鼻咽癌易感基因的研究得以大规模地开展,许多鼻咽癌易感基因位点被研究发现。然而,目前大多数鼻咽癌相关基因的研究都是基于单因素关联分析的模式,而对于鼻咽癌发生中多基因间的交互作用及基因-环境交互作用的研究却甚少。本研究通过对一套鼻咽癌SNP数据的分析,揭示鼻咽癌发生中DNA修复基因间交互作用及基因-环境交互作用,进一步揭示鼻咽癌潜在的分子致病机制,并探讨基于SNP数据的基因交互作用分析方法以及建立个性化诊疗的基因条码(barcode)的可行性。
   材料与数据:
   数据来源于中山大学肿瘤防治中心的一项鼻咽癌相关病例-对照研究(763鼻咽癌病例/763对照)。组学数据包含多条重要人类基因修复通路的104个DNA修复基因的768个SNP位点以及包括年龄、性别、吸烟、咸鱼摄入等在内的12个重要鼻咽癌相关环境因素。
   主要分析方法及结果:
   (1)通过树模型分析,根据变量在决策森林中出现的频数(F指标)鉴定出20个鼻咽癌显著相关DNA修复基因:CCNH,NBN,CHEK2,RAD54B,RAD51L1,RAD52,CYP2E1,POLE,TLR10,ERCC5,XPC,MSH2,MRE11A,ATRIP,MSH3,MNAT1,XRCC1,DDB2,ATM,GTF2H1及9个鼻咽癌显著相关环境因素:吸烟是否深吸、儿童期咸鱼摄入、成年期成鱼摄入、吸烟状态、总吸烟量、吸烟密度、年龄、总吸烟时间、吸烟是否使用过滤嘴(经验P<0.05)。同时,利用决策森林中因子组合在同一棵树中出现的频率(AFV指标),提取出鼻咽癌显著相关变量对子12对(经验P<4.38E-05),均为环境交互作用对子。(2)进一步考虑变量在树结构中所处的位置与疾病间关联强度的关系,利用SW指标识别出18个鼻咽癌显著相关DNA修复基因:NBN,RAD51L1,CCNH,RAD52,RAD54B,CYP2E1,POLE,CHEK2,TLR10,ERCC5,MSH3,PNK,XRCC4,ATRIP,MRE11A,MSH2,MNAT1,ATM及10个鼻咽癌显著相关环境因素:儿童期咸鱼摄入、吸烟状态、成年期咸鱼摄入、吸烟是否深吸、总吸烟量、吸烟密度、总吸烟时间、年龄、吸烟是否使用过滤嘴、吸烟史(经验P<0.05)。同时,利用决策森林中因子组合在同一棵树的同一决策路径中出现的频数(PW指标)提取出30对鼻咽癌显著相关变量对子(经验P<1.18E-04),其中包括11对SNP-环境交互作用对子及19对环境交互作用对子。
   (3)利用PW指标从SNP数据中提取出30对鼻咽癌显著相关SNP交互作用对子(经验P<1.18E-04)。
   (4)利用SNP与基因之间的映射关系,反向重构了鼻咽癌特异性基因-环境网络、基因-基因网络,发现儿童期咸鱼摄入、成年期成鱼摄入、吸烟状态、总吸烟量、吸烟密度、吸烟方式(是否深吸)、总吸烟时间、年龄等环境因素与DNA修复基因NBN、CHEK2、CCNH之间的基因-环境交互作用与鼻咽癌显著相关。识别出鼻咽癌相关核心基因:NBN(P=0.0081)及RFC1(P=0.0081)。
   (5)针对鼻咽癌相关核心基因开展通路分析,构建了一个基于知识学习的基因网络图,图中显示鼻咽癌核心基因NBN和RFC1与核苷酸切除修复、DNA重组修复、非重组修复、DNA损伤识别、DNA损伤反应、有丝分裂、减数分裂重组、DNA组装、细胞分化、细胞凋亡等细胞过程密切相关。
   (6)将树模型识别出的鼻咽癌显著相关基因投入GO及KEGG数据库中进行富集分析,在进行了Bonferroni多重检验校正,并去除冗余节点后,得到11个显著富集的GO节点,发现核苷酸切除修复、DNA双链断裂修复等生物过程与鼻咽癌的发生相关。同时,经过Bonferroni多重检验校正后得到2条显著富集的KEGG通路:同源重组通路及核苷酸切除修复通路与鼻咽癌显著相关。
   (7)利用遗传算法,以logistic回归作为分类器,分别用分类准确度、灵敏度及特异度作为评估函数,生成了长短不等的鼻咽癌相关危险因素条码(即变量数目不等的危险因素组合)。以特异度为适应度函数,经过12代进化,特异度收敛到最大值0.8453,生成长短不等(7-418个变量)的危险因素条码(barcode),变量数目最少的barcode包含7个变量,其中包括6个SNP位点及1个环境变量fish-past(儿童期咸鱼摄入);以分类准确率作为适应度函数,经过25代进化,准确率收敛到最大值0.8375,生成长短不等(18-410个变量)的鼻咽癌危险因素条码(barcode),变量数目最少的barcode包含18个变量,其中包括17个SNP位点及1个环境变量fish-past(儿童期成鱼摄入);以灵敏度作为适应度函数,经过44代进化,灵敏度收敛到最大值0.8545,生成长短不等(71-416个变量)的危险因素条码(barcode),变量数目最少的barcode包含71个变量,其中包括67个SNP位点以及4个环境变量:smk-age(首次吸烟年龄)、smk-state(吸烟状态)、deep(吸烟是否深吸)及fish-past(儿童期咸鱼摄入)。
   结论:
   研究发现18个鼻咽癌显著相关DNA修复基因:NBN,RAD51L1,CCNH,RAD52,RAD54B,CYP2E1,POLE,CHEK2,TLR10,ERCC5,MSH3,PNK,XRCC4,ATRIP,MRE11A,MSH2,MNAT1,ATM及10个鼻咽癌显著相关环境因素:儿童期成鱼摄入、吸烟状态、成年期成鱼摄入、吸烟是否深吸、总吸烟量、吸烟密度、总吸烟时间、年龄、吸烟是否使用过滤嘴、吸烟史(依据SW指标,经验P<0.05)。
   DNA修复基因NBN、CHEK2、CCNH、咸鱼摄入、吸烟、年龄等环境因素之间的基因-环境交互作用与鼻咽癌显著相关。核苷酸切除修复、同源重组修复是与鼻咽癌显著相关的重要生物过程。
   树模型分析方法中,F指标与SW指标的分析结果具有较好的一致性(一致率85.71%),PW指标在识别疾病相关变量对子中较AFV指标具有更高的统计效能,并能给予分析结果更为合理的解释。
   传统关联分析方法鉴定出38个鼻咽癌显著相关变量(显著性水准α=0.05),经过Bonferroni多重检验校正后,仅能识别出4个鼻咽癌相关环境变量,树模型分析方法鉴定出35个鼻咽癌显著相关变量,其中包括10个环境变量及25个SNP位点(SW指标)。
   通过logistic回归分析,评价三种特征变量选取方法(传统关联分析方法、树模型方法及遗传算法)所构建的鼻咽癌危险因素条码(barcode)对疾病分类的灵敏度、特异度及准确率。结果显示遗传算法构建的barcode具有最高的疾病分类灵敏度(0.8545)、特异度(0.8453)及准确率(0.8375)。其次是树模型方法构建的由35个变量构成的barcode,其分类灵敏度为0.7350,特异度为0.7250,准确率为0.7300。传统关联分析方法构建的由38个鼻咽癌显著相关变量组成的barcode对疾病的分类灵敏度(0.6760)、特异度(0.7120)及准确率(0.6940)是三种方法中最低的。结果表明遗传算法及树模型分析方法(尤其遗传算法)在鉴定高维数据的疾病危险因子组合中相对于传统关联分析方法的优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号