首页> 外文期刊>Bioinformatics >Using genotype array data to compare multi- and single-sample variant calls and improve variant call sets from deep coverage whole-genome sequencing data
【24h】

Using genotype array data to compare multi- and single-sample variant calls and improve variant call sets from deep coverage whole-genome sequencing data

机译:使用基因型阵列数据进行比较多样和单样本变体调用,并从深度覆盖全基因组测序数据中改进变体呼叫集

获取原文
获取原文并翻译 | 示例
           

摘要

Motivation: Variant calling from next-generation sequencing (NGS) data is susceptible to false positive calls due to sequencing, mapping and other errors. To better distinguish true from false positive calls, we present a method that uses genotype array data from the sequenced samples, rather than public data such as HapMap or dbSNP, to train an accurate classifier using Random Forests. We demonstrate our method on a set of variant calls obtained from 642 African-ancestry genomes from the Consortium on Asthma among African-ancestry Populations in the Americas (CAAPA), sequenced to high depth (30X).
机译:动机:由于排序,映射和其他错误,从下一代测序(NGS)数据中的变体调用敏感的误报。 为了更好地区分真实的校验呼叫,我们提出了一种方法,该方法使用来自序列样本的基因型数组数据,而不是HapMap或DBSNP等公共数据,以使用随机林培训准确的分类器。 我们展示了我们在来自美洲(CAAPA)的非洲祖先群体中的联盟的642个非洲 - 祖先基因组中获得的一套变体呼叫的方法,对高深度(30倍)测序。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号