法律状态公告日
法律状态信息
法律状态
2022-11-01
未缴年费专利权终止 IPC(主分类):G06F19/22 专利号:ZL2015108285174 申请日:20151124 授权公告日:20180619
专利权的终止
2018-06-19
授权
授权
2016-03-23
实质审查的生效 IPC(主分类):G06F19/22 申请日:20151124
实质审查的生效
2016-02-24
公开
公开
技术领域
本发明涉及利用公共数据库中SNP分型数据筛查疾病易感SNP组合的方 法,特别涉及一种基于易感SNP筛查复杂疾病易感SNP组合的方法。
背景技术
复杂疾病,如2型糖尿病、肥胖、心脑血管病等,因其发病机制复杂,往 往不是一个或几个基因的影响造成。近十年,国际包括国内采用全基因组关联 分析方法(GWAS)对大量个体的全基因组范围内的SNP分型数据进行统计分 析,筛出了大量易感SNP位点,譬如DIAGRAM委员会整合以前所有2型糖尿 病GWAS的数据,鉴定出69个易感SNP(NatureGenetics,2014)。既然复杂疾 病是有多个基因共同影响造成,在评估SNP风险时不应该单独评估单个SNP的 影响。
发明内容
为了克服现有技术的缺点与不足,本发明的目的在于提供一种基于易感 SNP筛查复杂疾病易感SNP组合的方法。本发明采用了一种新的方法评估多个 SNP的组合风险。该方法可以应用于任何复杂疾病易感SNP组合的筛查。
本发明的另一目的在于提供上述方法的应用。
本发明的目的通过下述技术方案实现:
一种基于易感SNP筛查复杂疾病易感SNP组合的方法,包括如下步骤:
本发明首先从已知的文献中找出与特定疾病相关的易感SNP,下载大量个 体全基因组的SNP分型数据,把每个个体易感SNP位点的基因型数据分离出来, 然后将这些易感SNP位点按一个顺序排列,如果某个易感SNP位点含有一个以 上易感等位基因(即含有1或2个易感基因型),用特定的英文字母来标记,这 样每一个个体就会得到一个等于或少于易感SNP位点数的字母字符串。然后分 别统计患病组和对照组中各种字符串的个数,并在患病组中找出对照组所没有 的字符串,再从中选出个数明显较多的字符串,再反过来按顺序将字母转换为 基因型,最终得到易感SNP组合。
所述的对照组是指健康群体。
所述的患病组是指疾病群体。
本发明的方法可以迅速从大量数据中找到特定疾病的易感SNP组合。
所述的基于易感SNP筛查复杂疾病易感SNP组合的方法在筛查复杂疾病易 感SNP组合中的应用。
所述的基于易感SNP筛查复杂疾病易感SNP组合的方法在复杂疾病风险预 测中的应用。
本发明相对于现有技术,具有如下的优点及效果:
为了克服复杂疾病单位点易感SNP评价疾病风险的不足,本发明采用易感 SNP组合的方法旨在提供一种新的疾病风险评价的方法。易感SNP组合对于疾 病风险的评估可能更优于单一易感SNP位点的风险评估效果,类似于低频突变 导致遗传疾病效果。从具体实例结果看易感SNP组合的方法在复杂疾病风险预 测中的效果可能会达到1,这是单个易感SNP不可能达到的效果。该方法可以 应用于任何复杂疾病易感SNP组合的筛查和疾病遗传风险的预测。
附图说明
图1是个体基因型原始数据示意图。
图2是14个随机个体的个体字符串的示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式 不限于此。
实施例1
1、SNP的选定
选择Genome-widetrans-ancestrymeta-analysisprovidesinsightintothe geneticarchitectureoftype2diabetessusceptibility中的69个2型糖尿病易感SNP (NatureGenetics,2014),见表1。
表169个2型糖尿病易感SNP
2、数据来源
所有全基因组SNP分型数据均是从http://www.ebi.ac.uk/ega/下载。
对照组WTCCC1projectsamplesfrom1958BritishBirthCohort(1991个样)。
2型糖尿病组WTCCC1projectType2Diabetes(T2D)samples(1504个样)。 个体基因型原始数据示意图见图1。
3、筛选SNP位点
根据表1中易感SNP位点的rs编号,将下载数据中每个个体的所有易感SNP 位点的基因型提取出来,一共提取了18个2型糖尿病易感SNP位点的基因型, 这18个易感SNP见表2。
表218个2型糖尿病易感SNP位点的基因型
4、易感SNP位点的基因型标记
对于每个个体的这18个易感SNP位点的基因型,只要出现1个或2个易感 基因就标记如下,详见表3,无易感基因标记为缺省。
表3易感SNP基因型标记
5、得到字符串
按照表3中SNP顺序排列,对3945个个体(对照组1991个,2型糖尿病 组1504个)中每一个个体的18个位点基因型转换成字符串,得到一系列的字 符串,共3945个,从中随机选取14个个体,如图2所示。
6、统计筛查易感SNP组合
对3945个个体(对照组1991个,2型糖尿病组1504个)进行通过统计分 析发现在2型糖尿病组有但在对照组中没有的字符串即SNP组合,例如abcghp (即rs10203174、rs10811661、rs10842994、rs1359790、rs1801282、rs75937306 的SNP位点同时携带易感基因),出现的次数最多,却没在对照组中发现,结 果提示某个个体遗传检测只要出现以上组合,患2型糖尿病的风险可能为1。字 符串个数在5个以上的统计结果见表4。
表4字符串个数在5个以上的统计表
以本发明的数据显示易感SNP组合(频率很低)对于疾病风险的评估或许 更优于单一易感SNP位点的风险评估效果,类似于低频突变导致遗传疾病效果, 由于目前积累的大数据有限,如果积累到十万以上个体的数据时,用SNP组合 直接预测疾病的风险为100%或许成为可能。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施 例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替 代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
机译: “筛选或易感大肠肿瘤的方法或监测个别肿瘤进展的方法,使用培养基和/或化合物和组合物评估DNA区域的甲基化状态和相应的试剂盒。”
机译: 农药组合物,控制易感植物中螨虫,真菌或细菌侵染的方法,其制备方法,控制植物中细菌侵染的方法,细菌性农业组合物和生物活性衍生产品
机译: 具有针对反刍动物粪便中的易感和抗性寄生虫菌株的杀卵和杀幼虫活性的延迟释放的直通式兽用组合物,这些组合物的用途,延迟这些组合物释放的方法