首页> 中文学位 >疾病遗传网络构建中两整体基因间共关联作用的统计推断方法研究
【6h】

疾病遗传网络构建中两整体基因间共关联作用的统计推断方法研究

代理获取

目录

声明

摘要

符号说明

前言

原理与方法

一、两基因间共关联统计推断在疾病遗传网络构建中的科学意义

二、共关联统计量的构造

三、统计模拟实验

四、实例验证

结果

一、统计模拟结果

二、实例验证

讨论

一、基因间“交互作用”与“共关联”的联系与区别

二、PLSPM的优越性

三、PLSPM统计量的评价

结论

创新与不足

附录

附录1 gs2.0产生模拟数据的参数文件

参考文献

现场实践报告

致谢

学位论文评阅及答辩情况表

展开▼

摘要

全基因组关联分析指通过人类基因组中数以百万计的单核苷酸多态性为标记进行关联分析,从而发现影响复杂疾病发生的遗传特征的一种分析策略。目前,“GWAS第一次浪潮”初战告捷,已对一百多种疾病或表型进行了GWAS研究。然而,第一轮GWAS的成果与预期结果差距甚远,其结果难以解释大部分复杂疾病的遗传特征。总结GWAS的失败教训,其中一个重要原因是因为复杂疾病由多对基因共同作用发生,而单个基因效应微小。孤立分开的研究单个基因及其表达难以确切地反映生命现象本身及内在规律。相互作用的基因构成了复杂的疾病遗传网络,并通过基因网络调控大部分细胞活动和功能。因此从系统的角度出发通过研究多基因的遗传网络,才能阐明疾病发生的机理。目前,通过数据建模、统计模拟和推断等手段研究复杂的网络关系,揭示有关的作用机理,已成为后基因组时代研究的重要课题。
   构建疾病遗传网络的一个热点问题是采用标准化、系统化的方法来获得尽量精确的网络结构。在构建疾病遗传网络时,一个重要的问题是构建具有统计学意义的疾病遗传网络拓扑结构,其中,核心问题是在构建网络前需要对两两结点之间的连线是否具有统计学意义做出科学推断。理论上,检验两个结点(基因)之间的连接关系可以从两种方法入手,即检验两基因之间的交互作用(gene-geneinteraction)或共关联作用(gene-geneco-association),若两基因之间存在统计学上的交互作用或共关联作用,则可初步将两基因连接。从构建基因网络结构的角度,后者更合理。
   在流行病学中,基因之间的交互作用定义为,在两基因的突变分别独立地对某疾病表型具有作用的前提下,两基因同时突变时,对该疾病的联合作用[32]。从统计学的角度讲,该定义说明检验两基因G1和G2存在交互作用的前提是它们的作用相互独立。事实上,在构建遗传网络时,网络内两基因间是否应该连线,并非必须要求两基因对疾病的单独作用具有独立性;而恰恰相反,在基因作用通路和基因网络中,基因之间并非相互独立的对疾病起作用,而是彼此通过特定通路结点之间的相关联而发挥网络调控作用,即可能在通路中交互作用和关联作用共存。因此,本课题组提出了两基因间共关联的统计思想,即将两基因对疾病表型的共关联作用定义为两基因对疾病表型的联合作用,而不管它们的作用是否相互独立。从构建基因网络结构的角度来看,通过两基因间的共关联作用确定遗传网络的初始拓扑结构更为合理。
   因此,本文从构建疾病遗传网络的角度出发,论证了两两基因“共关联作用”在遗传网络构建中的科学意义,进而提出了基于偏最小二乘路径模型的检验两个整体基因区域间共关联作用的统计量。通过统计模拟和实例验证,主要结论如下:
   1、阐明了整体基因间共关联作用的概念和意义,以及与流行病学中两基因交互作用的区别与联系,指出在构建基因之间的遗传交互网络时,采用两两结点之间的共关联作为两基因连接的统计学依据,较采用两基因之间的交互作用更加合理。
   2、以PLSPM为基本工具,构建了检验整体基因间共关联作用的统计量。1)与单点SNP检验相比,PLSPM统计量以整体基因作为单位,检验两个基因之间的共关联作用,有利于从生物学意义解释基因对疾病的作用,避免了多重检验带来的假阳性或因校正而失效的问题。2)与基于单倍型的方法相比,PLSPM统计量避开了单倍型的推断问题,克服了因单倍型推断的不准确性而导致研究的偏性,提高了检验效能。3)与CCU统计量相比,基于PLSPM的共关联统计推断模型不仅充分利用了两基因之间的综合信息,而且有效避免了因SNP数据之间的多重共线性而导致的模型不收敛问题。
   3、统计模拟与实例验证表明:1)与单点的logistic回归方法和CCU统计量相比,基于PLSPM的共关联统计推断模型不仅稳定,且检验效能更高。2)当样本量、OR值以及致病位点频率和LD信息发生变化时,PLSPM统计量的分析结果更加有效。
   本研究创新点:
   1、从遗传网络构建和概率几何角度,论证了两整体基因间“共关联作用”与“交互作用”之间的联系与区别,指出采用两整体基因的共关联作用统计量作为两两基因之间连接的统计学依据,较采用交互作用更加合理。
   2、构建了推断整体基因间共关联作用的统计量,以统计模拟和实例验证证明了其稳定性和有效性,为遗传网络初始拓扑结构的构建提出了新方法。
   3、提出了综合基因区域内多SNP位点信息的新方法,避免了SNP之间的多重共线性所导致的模型不收敛问题,为基因组区域化统计推断方法的研究奠定了基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号