首页> 中文学位 >对含有缺失基因型数据的家系进行单倍型推断的EM方法
【6h】

对含有缺失基因型数据的家系进行单倍型推断的EM方法

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

引言

一、单倍型推断的传统方法

二、EM算法在家系数据中的应用

三、有缺失数据的家系的单倍型推断

四、计算参数估计标准差的Louis方法

五、关于同胞对数据的单倍型推断

结论

参考文献

致谢

展开▼

摘要

在现代生物遗传学中,生物体的单倍型信息起着非常关键的作用,可以提高连锁分析和关联分析的功效和准确度,是人类得以探究基因的多样性以及定位致病基因的重要手段之一.随着科学技术的不断发展,我们已经可以得到生物体的基因型数据,但是单倍型的信息却无法直接获得.十几年来很多学者都致力于这方面的研究,发展了一系列的研究方法,其中最主要的是利用统计方法进行推断,如:Clark's算法、EM算法、Bayesian方法、基于Bayesian模型或EM方法的PL算法等等. 以上的所有方法都是基于完全基因型数据而进行的单倍型推断,且没有过于详细的讨论家系数据,但是实际中的数据多是很庞大的、不完全的或是有部分缺失的,因此这些方法都不能用来很好的解决问题. 本文就是用来解决有缺失数据的多个家系的单倍型推断问题.首先,针对完全基因型的大的家系数据,利用传统的EM算法详细的给出其单倍型的推断方法,分别解决了核心家庭数据和一般的家系数据问题.在此基础之上,重点针对有缺失数据的家系进行研究,充分利用家系中个体之间的亲属关系,考虑各个核心家庭个体间的遗传制约机制.对于核心家庭中已知基因型的个体,引入Judge算子,排除不合理的双倍型向量.再利用Induce算子,为未知基因型的个体补充双倍型信息,由此得到所有个体的一切合理的双倍型向量.以此数据为基础,应用改进的EM方法得到参数的估计并得到了估计的标准差.再由极大似然的原则,分别就不同类型的个体,利用参数的估计(θ)给出单倍型的推断方法.最后讨论一个简单的例子,即同胞对家系数据.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号