公开/公告号CN101238222A
专利类型发明专利
公开/公告日2008-08-06
原文格式PDF
申请/专利权人 解码遗传学私营有限责任公司;
申请/专利号CN200680022129.6
发明设计人 斯特鲁安·F·A·格兰特;
申请日2006-06-16
分类号C12Q1/68(20060101);A61P3/10(20060101);
代理机构11219 中原信达知识产权代理有限责任公司;
代理人杨青;樊卫民
地址 冰岛雷克雅末
入库时间 2023-12-17 20:32:26
法律状态公告日
法律状态信息
法律状态
2022-05-27
未缴年费专利权终止 IPC(主分类):C12Q 1/68 专利号:ZL2006800221296 申请日:20060616 授权公告日:20130410
专利权的终止
2013-04-10
授权
授权
2008-10-01
实质审查的生效
实质审查的生效
2008-08-06
公开
公开
发明背景
糖尿病,一种糖利用减少、脂和蛋白利用增加的代谢疾病,由胰 岛素的绝对或者相对缺乏引起。在更严重的情况下,糖尿病的特点在 于长期高血糖,糖尿,水和电解质损失,酮酸中毒和昏迷。长期并发 症包括神经病变、视网膜病、肾病、大小血管全身退行性病变的发展 和感染易感性的增加。糖尿病最常见的类型是II型,非胰岛素依赖型 糖尿病,其特征在于高血糖由受损的胰岛素分泌和靶组织中胰岛素抵 抗造成。遗传和环境因素都对这种疾病有作用。例如,肥胖在疾病发 展过程中起着重要作用。II型糖尿病经常是渐进发病糖尿病的温和形 式。
II型糖尿病对健康的影响是巨大的。在1995年,全球范围内存在 1亿3500万成年糖尿病患者。预计在2025年接近3亿人将患有糖尿病 (King H.,等人,Diabetes Care,21(9):1414-1431(1998))。在冰岛,成年群 体中II型糖尿病的患病率是2.5%(Vilbergsson,S.,等人,Diabet.Med., 14(6):491-498(1997)),这包括大约5,000个年龄在34岁以上患有这种 疾病的人。这种疾病的高患病率和增加的患病人口数目显示,更精确 界定涉及II型糖尿病的遗传因素以定义相关风险系数的医疗需要还没 有得到满足。还需要用于预防II型糖尿病的治疗剂。
发明概述
本发明涉及通过评估某些与TCF7L2基因(转录因子7-样2(T- 细胞特定的,HMG-盒),过去称为TCF4基因(T-细胞转录因子4)) 有关的标记物或者单倍型,诊断II型糖尿病易感性增加的方法,以及 诊断II型糖尿病易感性降低或者诊断对II型糖尿病的防护的方法。该 方法包括检测与TCF7L2基因外显子4LD块相关的遗传标记物。
第一个方面,本发明涉及在个体中诊断II型糖尿病易感性的方法, 包括对从个体获得的核酸样品进行与TCF7L2外显子4LD块相关的标 记物或者单倍型的分析,其中标记物或者单倍型的存在指示II型糖尿 病易感性。在一个实施方式中,标记物或者单倍型包括至少一种选自 表6所列的标记物。在另一种实施方式中,标记物或者单倍型是标记 物。
在一个优选的实施方式中,标记物或者单倍型指示II型糖尿病易 感性的增加。易感性增加存在于一个实施方式中,表征为相对危险度 至少为1.2,包括相对危险度至少为1.3和相对危险度至少为1.4。在一 个实施方式中,标记物选自DG10S478,rs12255372,rs7895340, rs11196205,rs7901695,rs7903146,rs12243326,和rs4506565,其中 DG10S478的非-0等位基因(例如,-4,4,8,12,16,20,或者其他非-0等 位基因),rs 12255372的T等位基因;rs7895340的A等位基因; rs11196205的C等位基因;rs7901695的C等位基因rs7903146的T 等位基因;rs12243326的C等位基因;或者rs4506565的T等位基因 的存在,指示II型糖尿病易感性的增加。在一个优选的实施方式中, 标记物选自DG10S478和rs7903146,其中DG10S478的非-0等位基因 或者rs7903146的T等位基因的存在指示II型糖尿病易感性的增加。 在另一个优选的实施方式中,标记物是rs7903146,其中rs7903146的 T等位基因的存在指示II型糖尿病易感性的增加。
在另一个优选的实施方式中,标记物或者单倍型指示II型糖尿病 易感性降低。易感性的降低存在于一个实施方式中,表征为相对危险 度小于0.8,包括相对危险度小于0.7。在一个实施例中,标记物选自 DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146, rs12243326,和rs4506565,其中DG10S478的0等位基因,SNP rs12255372的G等位基因;rs7895340的G等位基因;rs11196205的G 等位基因;rs7901695的T等位基因;rs7903146的C等位基因; rs12243326的T等位基因;或者rs4506565的A等位基因的存在,指 示II型糖尿病易感性降低。在一个优选的实施方式中,标记物是 DG10S478,其中DG10S478的0等位基因的存在指示II型糖尿病易感 性降低。在另一个优选的实施方式中,标记物是rs7903146,其中 rs7903146的C等位基因的存在指示II型糖尿病易感性降低。
第二个方面,本发明涉及一种分析来自个体的样品以检测II型糖 尿病易感性的试剂盒,其中所述试剂盒包括用于检测与TCF7L2外显子 4LD块相关的一种或者多种标记物一或者多种的试剂。在一个实施方 式中,一种或者多种试剂包括至少一种连续核苷酸序列,所述核苷酸 序列与包括至少一种标记物的区域完全互补,所述标记物与TCF7L2 外显子4LD块相关。在一个实施方式中,一或者多种标记物选自 DG10S478,rs12255372,rs7895340,rs11196205,rs7901695,rs7903146, rs12243326,和rs4506565。在一个优选的实施方式中,一或者多种标 记物是DG10S478或者rs7903146。在另一个优选的实施方式中,标记 物是rs7903146的C等位基因。
另一方面,本发明涉及一种评定个体对TCF7L2治疗剂反应可能 性的方法,包括:检测与TCF7L2外显子4LD块相关的标记物,其中 所述标记物存在指示对TCF7L2治疗剂阳性反应的可能性。在一个实施 方式中,标记物选自DG10S478,rs12255372,rs7895340,rs11196205, rs7901695,rs7903146,rs12243326,和rs4506565。在另一个实施方式中, 标记是标记物DG10S478或者标记物rs7903146,其中DG10S478的非 -0等位基因或者rs7903146的T等位基因的存在指示对TCF7L2治疗剂 阳性反应的可能性。
本发明的另一个方面涉及利用TCF7L2治疗剂制备治疗II型糖尿 病的药物。在一个实施方式中,TCF7L2治疗剂是一种改变Wnt信号途 径或者钙粘蛋白途径中活性的药剂。在另一个实施例中,TCF7L2治疗 剂是一种选自药剂表中所列的组中的药剂。
附图简述
根据下列对本发明优选实施例更详细的说明,本发明的上述和其 他目标、特征和优点将更容易理解。
图1描述了在HapMap project Build 16中感兴趣的TCF7L2区域相 对SNPs的连锁不平衡(LD)。215.9kb基因跨越7个LD块,如黑色 箭头示意图所示(根据NCBI RefSeq),箭头显示转录的方向;外显子 被标识,外显子4被加亮。DG10S478位于染色体10上TCF7L2基因 内含子3内的114.46Mb(NCBI Build 34),在包括内含子3的一部分、 外显子4的全部和内含子4的一部分的74.9kb块内(此处称为″TCF7L2 外显子4LD块″)。等距而不是根据其物理位置绘制SNP标记物的曲 线。图显示LD的两个检测值-即D′(图左上部分)和r2(右下部分)。
发明详述
下面是本发明优选实施方式的说明。
与II型糖尿病相关的基因座
II型糖尿病的特点在于高血糖,这可能通过例如受损的胰岛素分 泌、周边组织中胰岛素抵抗和肝脏中增加的葡萄糖排出等机制发生。 大多数II型糖尿病患者患有长期高血糖的严重并发症,包括肾病、神 经病变、视网膜病和心血管疾病的加速发展。当前世界范围II型糖尿 病的患病率是6%,但预计在未来十年将会上升(1)。II型糖尿病患 病率的这种增加归因于人口年龄的增加和肥胖的上升。
有证据说明遗传组分与患II型糖尿病风险有关,包括不同种族的 组间患病率的差异(2,3),单卵双生比异卵双生双胞胎更高的同病 率(4,5)和欧洲人群中II型糖尿病的同胞(sibling)相对危险度(λ s)大约为3.5(6)。
迄今为止存在两种用于寻找II型糖尿病相关基因的方法。候选基 因内的单核苷酸多态性(SNPs)已经被用于检测相关性,并且通常, 不被复制或者只造成II型糖尿病轻型风险-最广泛报道的是过氧物酶 体增殖物激活的受体gamma基因(PPARG2)中保护性的Pro 12AIa多 态性(7)和内向矫正性钾通道,亚族J,成员11基因(KIR6.2)的风 险多态性(8)。
在患有常见型II型糖尿病家族中进行基因组范围的连锁扫描已经 得到几个基因座,国际科研社团的主要注意力集中于许多人群中观察 到的染色体1、12和20上的基因座(6)。这些基因座内的基因还有 待发掘。但是,在墨西哥裔美国人中,从染色体2q的基因座分离出钙 蛋白酶10(CAPN10)基因;这代表迄今为止通过位置克隆鉴定的与常 见型II型糖尿病有关的唯一基因(9)。罕见的孟德尔型II型糖尿病, 即青年发病的成人型糖尿病(MODY),通过位置克隆获得6个基因 (6)。
我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围 的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁 的指示性证据。在墨西哥裔美国人中也观察到与10q区域的连锁(11)。
与II型糖尿病相关的转录因子7-样2基因(TCF7L2)
本发明涉及编码T-细胞转录因子4(TCF4-官方基因命名TCF7L2) 基因内II型糖尿病相关LD块(“TCF7L2外显子4LD块”)的鉴定。 TCF7L2外显子4LD块内的几个标记物,包括微卫星DG10S478和SNP 标记物rs7903146和rs12255372,已经被发现与II型糖尿病有关。最先 在冰岛群体中发现DG10S478相关性(P=1.3×10-9;相对危险度=1.45; 人群归因危险度=22.7%)的原始观察,随后在丹麦II型糖尿病群体和 美国白种人群体中得到重复。DG10S478位于10q25.2上TCF7L2基因 的内含子3中,在明确限定的74.9kb LD块内,所述LD块包含内含子 3的一部分,外显子4的全部和内含子4的一部分。TCF7L2基因产物 是一种包含高迁移率族(HMG)盒的转录因子,它在Wnt信号途径亦 称为APC3/β-连环蛋白/TCF途径中起作用。通过Wnt途径成员β-连 环蛋白和糖原合酶激酶-3beta,TCF7L2介导胰高血糖素原基因表达(血 液葡萄糖稳态中的关键成员)细胞类型-特定的调节(12)。此外,通 过抑制生脂转录因子CCAAT/增强子结合蛋白alpha(C/EBPalpha)和 过氧物酶体增殖物激活的受体gamma(PPARgamma),Wnt信号维持 前成脂肪细胞在未分化状态(13)。当前成脂肪细胞中的Wnt信号被 显性失活TCF7L2的过表达阻止时,这些细胞分化成脂肪细胞(13)。 此外,有报道称,通过与结肠癌细胞中的β-连环蛋白和TCF7L2的物 理相互作用,Wnt/β-连环蛋白信号途径以PPARgamma活性作为靶标 (14)。多功能β-连环蛋白对通过结合钙粘蛋白介导细胞粘着也很重 要(15)。
作为这些发现的结果,现在已有II型糖尿病易感性的诊断方法, 以及II型糖尿病易感性降低的诊断方法和/或对II型糖尿病的防护的方 法。在本发明优选的实施方式中,诊断方法用于鉴定特定等位基因的 存在,包括标记物DG10S478的0等位基因(与II型糖尿病易感性降 低相关,是保护性抵抗II型糖尿病的等位基因);标记物DG10S478 的非-0等位基因(例如,-4,4,8,12,16或者20,或者其他等位基 因)(与II型糖尿病易感性相关)SNP rs12255372的G等位基因(与 II型糖尿病易感性降低相关,是保护性抵抗II型糖尿病的等位基因); SNP rs12255372的T等位基因(与II型糖尿病易感性相关)SNP rs7895340的G等位基因(与II型糖尿病易感性降低相关,是保护性抵 抗II型糖尿病的等位基因);SNP rs7895340的A等位基因(与II型 糖尿病易感性相关)SNP rs11196205的G等位基因(与II型糖尿病 易感性降低相关,是保护性抵抗II型糖尿病的等位基因);SNP rs11196205的C等位基因(与II型糖尿病易感性相关);SNP rs7901695 的T等位基因(与II型糖尿病易感性降低相关,是保护性抵抗II型糖 尿病的等位基因);SNP s7901695的C等位基因(与II型糖尿病易感 性相关)SNPrs7903146的C等位基因(与II型糖尿病易感性降低相 关,是保护性抵抗II型糖尿病的等位基因);SNP rs7903146的T等位 基因(与II型糖尿病易感性相关);SNP rs12243326的C等位基因(与 II型糖尿病易感性相关);和SNP rs4506565的T等位基因(与II型 糖尿病易感性相关)。在本发明的其他实施方式中,利用本文所述的 方法鉴定的其他标记物或者SNPs,可用于II型糖尿病易感性的诊断, 还可用于II型糖尿病易感性降低的诊断或者用于鉴定保护性抵抗II型 糖尿病的等位基因。下面介绍的诊断分析方法可用于鉴定这些特定特 定等位基因的存在或者缺失。
诊断分析
诸如本文所述的那些核酸、探针、引物和抗体可用于II型糖尿病 易感性的各种诊断方法,以及试剂盒(例如,用于II型糖尿病易感性 的诊断)。类似地,本文所述的核酸、探针、引物和抗体可用于II型 糖尿病易感性降低的各种诊断方法,以及保护性抵抗II型糖尿病的诊 断方法和试剂盒。一方面,试剂盒包括可用于扩增感兴趣的标记物的 引物。
在本发明的一个方面,通过检测本文所述的TCF7L2核酸的多态 性(例如,标记物DG10S478或者SNP rs12255372,rs7895340, rs11196205,rs7901695,rs7903146,rs12243326,rs4506565内的等位 基因),进行II型糖尿病易感性的诊断。多态性可以是TCF7L2核酸 的改变,例如单个核苷酸或者不止一个核苷酸的插入或者缺失,导致 移码;至少一个核苷酸的改变,导致编码的氨基酸的改变;至少一个 核苷酸的改变,导致终止密码子的提前产生;几个核苷酸的缺失,导 致核苷酸编码的一个或者多个氨基酸的缺失;一个或者几个核苷酸的 插入,例如通过不等重组或者基因转换,导致基因编码序列的中断; 全部或者部分基因的重复;全部或者部分基因的转座;或者全部或者 部分基因的重排。单个基因可以存在不止一种的这类改变。这类序列 改变引起TCF7L2核酸编码多肽的差异。例如,如果差异是移码改变, 移码可能导致编码氨基酸的改变,和/或可能导致终止密码子的提前产 生,产生截短多肽。此外,与疾病或者病症相关的多态性,或者对与 TCF7L2核酸相关的疾病或者病症相关的易感性,可能是一个或者多个 核苷酸的同义突变(即,不导致TCF7L2核酸编码多肽改变的突变)。 这类多态性可以改变剪接位点,影响mRNA的稳定性或者转运,或者 影响基因的转录或者翻译。具有上述任意改变或者突变的TCF7L2核酸 在此处被称为“突变的核酸”。
在诊断II型糖尿病易感性的第一种方法中,可以使用杂交方法, 例如Southern分析,Northern分析或者原位杂交(参见Current Protocols in Molecular Biology,Ausubel,F.等人,eds,John Wiley & Sons,包括 1999年所有增引)。例如,来自待测患者(“待测个体”)基因组DNA、 RNA或者cDNA的生物样品(“待测样品”),取自个体(RNA和cDNA 只能用于外显子标记物),例如怀疑患有II型糖尿病、对II型糖尿病 敏感或者易感,或者携带II型糖尿病缺陷的个体。个体可能是成年人, 儿童,或者胎儿。待测样品可以来自任何来源,包括基因组DNA,例 如血液样品,羊水样品,脑脊液样品,或者皮、肌肉、口腔或者结膜 粘膜、胎盘、胃肠道或者其他器官的组织样品。通过适当方法,例如 通过羊膜穿刺术或者绒膜绒毛取样,可以获得来自胎儿细胞或者组织 的DNA待测样品。然后检测DNA、RNA或者cDNA样品,确定TCF7L2 核酸是否存在多态性,和/或确定存在何种TCF7L2编码的剪接变体。 通过基因组DNA、RNA或者cDNA内基因与核酸探针的杂交,可以显 示多态性或者剪接变体的存在。此处使用的“核酸探针”,可以是DNA 探针或者RNA探针;核酸探针可以包含,例如至少一个TCF7L2核酸 多态性和/或包含编码TCF7L2核酸特定剪接变体的核酸。探针可以是 上述任意的核酸分子(例如,基因或者核酸,片段,包括基因或者核 酸的载体,探针或者引物,等等)。
为诊断II糖尿病型的易感性,将包含TCF7L2核酸的待测样品与 至少一种核酸探针接触,形成杂交样品。优选的检测mRNA或者基因 组DNA的探针是能够与本文所述的mRNA或者基因组DNA序列杂交 的标记核酸探针。核酸探针可以是,例如,全长核酸分子,或者其一 部分,例如长度至少为15、30、50、100、250或者500个核苷酸并且 在严谨条件下能够与合适的mRNA或者基因组DNA特定杂交的寡聚 核苷酸。用于本发明诊断方法的合适探针如上所述(参见例如,在标 题“本发明的核酸”下描述的探针和引物)。
杂交样品保存在允许核酸探针与TCF7L2核酸特定杂交的条件下。 此处使用的“特定杂交”表示准确杂交(例如,没有错配)。特定杂 交可以在高度严谨条件或者中度严谨条件下进行,例如上面所述。在 特别优选的方面,用于特定杂交的杂交条件是高严谨性。
如果存在特定杂交,则利用标准方法检测。如果核酸探针和待测 样品的TCF7L2核酸之间发生特定杂交,则TCF7L2具有多态性,或者 是存在于核酸探针中的剪接变体。在该方法中可以同时使用不止一个 核酸探针。任意一个核酸探针的特定杂交指示TCF7L2核酸的多态性, 或者编码特定剪接变体的TCF7L2核酸的存在,可用于诊断II型糖尿 病易感性,或者用于诊断II型糖尿病易感性的降低(或者指示抵抗II 型糖尿病的保护性等位基因)。
在Northern分析(参见Current Protocols in Molecular Biology, Ausubel,F.等人,eds.,John Wiley & Sons,supra)中,上述杂交方法被 用于鉴定多态性或者特定剪接变体的存在,所述多态性或者特定剪接 变体与II型糖尿病易感性相关或者与II型糖尿病易感性降低相关。对 Northern分析,RNA待测样品通过适当方法取自个体。如上所述的核 酸探针与个体RNA的特定杂交提示TCF7L2核酸的多态性,或者 TCF7L2核酸编码的特定剪接变体的存在,因此可用于诊断II型糖尿病 易感性,或者II型糖尿病易感性的降低(或者指示抵抗II型糖尿病的 保护性等位基因)。
使用核酸探针的典型实例,参见,例如,美国专利号5,288,611和 4,851,330。
此外,在上述杂交方法中可使用肽核酸(PNA)探针替代核酸探 针。PNA是一种DNA模拟物,具有肽-样无机骨架,例如N-(2-氨基乙 基)甘氨酸单位,一种有机碱(A,G,C,T或者U)通过甲叉羰基接 头与甘氨酸上的氮连接(参见,例如,Nielsen,P.E.等人,Bioconjugate Chemistry 5,American Chemical Society,p.1(1994))。可以设计PNA 探针与TCF7L2核酸特定杂交。PNA探针与TCF7L2核酸的杂交可以 用于诊断II型糖尿病的易感性或者II型糖尿病易感性的降低(或者指 示抵抗II型糖尿病的保护性等位基因)。
在本发明的另一种方法中,如果基因的改变(突变)或者多态性 导致限制性内切位点的产生或者消失,利用限制性消化的突变分析可 用于检测基因突变。包括基因组DNA的待测样品从个体获得。聚合酶 链式反应(PCR)可用于扩增来自待测个体测试样品基因组DNA中的 TCF7L2核酸(和,必要时,侧翼序列)。按所述(参见Current Protocols in Molecular Biology,supra)进行RFLP分析。相关DNA片段的消化 模式提示TCF7L2核酸突变或者多态性的存在或者缺失,因此指示II 型糖尿病易感性或者II型糖尿病易感性降低(或者指示抵抗II型糖尿 病的保护性等位基因)的存在或者缺失。
也可以用序列分析检测TCF7L2核酸的特定多态性。DNA或者 RNA待测样品取自待测个体。如果需要,也可以用PCR或者其他合适 的方法扩增基因或者核酸,和/或其侧翼序列。利用标准方法检测 TCF7L2核酸序列,或者核酸的片段,或者cDNA,或者cDNA的片段, 或者mRNA,或者mRNA的片段。根据情况,将核酸,核酸片段,cDNA, cDNA片段,mRNA或者mRNA片段的序列与基因或者cDNA或者 mRNA的已知核酸序列比较。TCF7L2多态性的存在指示个体具有II 型糖尿病易感性或者II型糖尿病易感性的降低(或者指示抵抗II型糖 尿病的保护性等位基因)。
通过利用扩增寡聚核苷酸与等位基因-特定寡聚核苷酸(ASO)探 针的斑点杂交,也可以使用等位基因-特定寡聚核苷酸检测TCF7L2核 酸多态性的存在(参见,例如,Saiki,R.等人,Nature 324:163-166 (1986))。“等位基因-特定寡聚核苷酸”(此处也称为“等位基因-特 定寡聚核苷酸探针”)是大约10-50碱基对的寡聚核苷酸,优选的大约 15-30碱基对,所述寡聚核苷酸与TCF7L2核酸特定杂交,并且包括与 II型糖尿病易感性相关的多态性或者与II型糖尿病易感性降低(或者 指示抵抗II型糖尿病保护性等位基因)相关的多态性。利用标准方法 (参见Current Protocols in Molecular Biology,supra)可以制备对特定 TCF7L2核酸多态性特定的等位基因-特定寡聚核苷酸探针。为鉴定与 II型糖尿病相关基因的多态性,从个体获得DNA待测样品。PCR可用 于扩增TCF7L2核酸及其侧翼序列的全部或者片段。利用标准方法(参 见Current Protocols in Molecular Biology,supra),包括扩增TCF7L2 核酸(或者基因或者核酸的片段)的DNA被斑点印迹,斑点与寡聚核 苷酸探针接触。然后检测探针与扩增的TCF7L2核酸特定杂交的存在。 等位基因-特定寡聚核苷酸探针与个体DNA的杂交提示TCF7L2核酸多 态性,因此指示II型糖尿病易感性或者指示II型糖尿病易感性的降低 (或者指示抵抗II型糖尿病的保护性等位基因)。
本发明还提供与基因或者核酸的对照或者变异等位基因杂交的等 位基因-特定寡聚核苷酸,所述基因或者核酸包括单核苷酸多态性或者 与其互补。这些寡聚核苷酸可以是探针或者引物。
等位基因-特定引物与靶DNA重叠多态性的位点杂交,只起始引 物显示完全互补的等位基因形式的扩增。参见Gibbs,Nucleic Acid Res. 17,2427-2448(1989)。这种引物与第二引物联用,所述第二引物在远端 位点杂交。扩增起始于两个引物,产生可检测的产物,这提示存在特 定等位基因形式。通常用第二对引物作为对照,其中一个在多态性位 点显示单个碱基错配,另一个显示与远端位点的完全互补。单碱基错 配阻止扩增,没有可检测的产物形成。当错配包括在与多态性比对的 寡聚核苷酸的3′-最远端位置内,这种方法最适用,因为这个位置对从 引物延伸是最具不稳定作用的(参见,例如,WO93/22456)。
通过添加这种类似物作为锁核酸(LNAs),引物和探针的大小可 以减少到只有8个碱基。LNAs是双环DNA类似物一个新的类型,其 中呋喃糖环的2′和4′位置通过O-甲叉(氧-LNA),S-甲叉(硫-LNA) 或者氨基甲叉(氨基-LNA)基团连接。所有这些LNA变异体的共同 点是对互补核酸的亲和力,据报道迄今为止这是DNA类似物中最高的。 例如,在分别与互补DNA或者RNA的复合物中,特定的所有氧-LNA 九聚物分别具有64EC和74EC的熔解温度,与此相对,相应DNA九 聚物的DNA和RNA的熔解温度均是28EC。当LNA单体与标准DNA 或者RNA单体联用时,Tm也有显著增加。对于引物和探针,根据在 何处包括LNA单体(例如,3′端,5′端,或者在中间),Tm可以显著 增加。
另一方面,与个体靶核酸序列片段互补的寡聚核苷酸探针的阵列 可用于鉴定TCF7L2核酸多态性。例如,一方面,可以使用寡聚核苷酸 阵列。寡聚核苷酸阵列通常包括大量不同的寡聚核苷酸探针,所述探 针偶联在底物表面不同的已知位置。这些寡核苷酸阵列,也称为 “GenechipsTM”,在本领域中被广泛描述,例如美国专利号5,143,854 和PCT专利公开号WO 90/15070和92/10092。通常利用机械合成法或 者光导向的合成法,包括照相平版印刷方法和固相寡聚核苷酸合成法 的组合,可以产生这些阵列。参见Fodor等人,Science 251:767-777 (1991),Pirrung等人,美国专利号5,143,854(还可参见PCT申请号 WO 90/15070)和Fodor等人,PCT公开号WO 92/10092和美国专利号 5,424,186,所有教导在此引入作为参考。利用机械合成法合成这些阵 列的技术描述于,例如美国专利号5,384,261;所有教导在此引入作为 参考。在另一个实施例中,可以使用线性阵列。
一旦制备出寡聚核苷酸阵列,将感兴趣的核酸与阵列杂交,扫描 多态性。杂交和扫描通常的按照此处的方法以及描述于,例如,公开 的PCT申请号WO92/10092和WO95/11995,和美国专利号5,424,186 的方法进行,所有教导在此引入作为参考,总之,包括一种或者多种先 前鉴定的多态性标记物的靶核酸序列通过公知的扩增技术进行扩增, 例如,PCR。通常,这涉及引物序列的使用,所述引物序列从多态性上 下游与靶序列的两条链互补。也可以使用不对称PCR技术。扩增的靶, 通常包括标记,然后在合适条件下与阵列杂交。当阵列杂交完成和洗 涤后,扫描阵列以检测与靶序列杂交的阵列上的位置。扫描获得的杂 交数据通常是作为阵列上位置的函数的荧光强度形式。
尽管主要以单一检测块方式描述,例如,用于检测单个多态性, 阵列可以包括多重检测块,因此能够分析多个、特定特定多态性。另 一方面,通常应理解检测块可以组合到单一阵列内或者多个、独立的 阵列,这样在靶与阵列杂交期间,可以使用变化的、最优条件。例如, 通常需要提供检测与那些位于基因组序列A-T富集片段区的多态性分 开的那些位于基因组序列G-C延伸区内的多态性。这允许对各种情况 杂交条件的单独进行最优化。
寡聚核苷酸阵列用于多态性检测的其他应用可见于,例如,在美 国专利号5,858,659和5,837,832,全部教导在此引入作为参考。可以使 用其他的核酸分析方法检测II型糖尿病基因或者II型糖尿病基因编码 变异体中的多态性。典型的方法包括直接人工测序(Church和Gilbert, Proc.Natl.Acad.Sci USA 81:1991-1995(1988);Sanger,F.等人,Proc. Natl.Acad.Sci USA 74:5463-5467(1977);Beavis等人,美国专利号 5,288,644);自动荧光测序;单链构象多态性检测(SSCP);夹板变性 凝胶电泳(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.C.等 人,Proc.Natl Acad.Sci USA 86:232-236(1989)),迁移率分析(Orita,M. 等人,Proc.Natl Acad.Sci USA 86:2766-2770(1989)),限制性酶切分析 (Flavell等人,Cell 15:25(1978);Geever,等人,Proc.Natl.Acad.Sci USA 78:5081(1981));异质双链分析;化学错配切割(CMC)(Cotton 等人,Proc.Natl.Acad.Sci USA 85:4397-4401(1985));RNase保护试验 (Myers,R.M.等人,Science 230:1242(1985));识别核苷酸错配的多肽 的使用,例如E.coli mutS蛋白;例如等位基因-特定PCR。
在本发明的一个方面,II型糖尿病易感性或者II型糖尿病易感性 降低(或者指示抵抗II型糖尿病的保护性等位基因)的诊断,也可以 通过定量PCR(动态热循环)的表达分析实现。利用检测, 这项技术可以鉴定TCF7L2核酸编码的多肽或者TCF7L2核酸编码的剪 接变体的表达或者组成中改变的存在。探针还可用于鉴定多态 性以及患者是纯合子还是杂合体。此外,变异体表达可以量化为物理 不同或者功能不同的。
在本发明的另一个方面,II型糖尿病易感性或者II型糖尿病易感 性降低(或者指示抵抗II型糖尿病保护性等位基因)的诊断,可以通 过各种方法,包括酶联免疫吸附(ELISAs),Western印迹,免测沉淀 和免疫荧光法,检测TCF7L2多肽的表达和/或组成来实现。对个体待 测样品分析TCF7L2核酸编码的多肽的表达中改变和/或组成中改变的 存在,或者TCF7L2核酸编码的特定特定变异体的存在。在TCF7L2 核酸编码多肽表达中的改变可能是,例如,定量的多肽表达(即,产 生多肽的数量)的改变;TCF7L2核酸编码多肽的组成的改变是定性的 多肽表达(例如,改变的TCF7L2多肽或者不同剪接变体的表达)的改 变。在一个优选的方面,II型糖尿病易感性或者II型糖尿病易感性降 低的诊断,可以通过检测TCF7L2核酸编码的特定特定剪接变体或者剪 接变体的特定模式来实现。
这两种改变(定量的和定性的)均可以存在。此处使用的术语多 肽表达或者组成中的“改变”,是指待测样品中表达或者组成的改变, 与对照样品中TCF7L2核酸编码多肽的表达或者组成比较。对照样品是 与待测样品对应的样品(例如,来自相同种类的细胞),并且来自不 受II型糖尿病易感性影响的个体。与对照样品相比,待测样品中多肽 的表达或者组成的改变指示II型糖尿病的易感性。类似地,与对照样 品相比,待测样品中一种或多种不同剪接变体的存在,或者待测样品 中不同剪接变体显著地不同数量的存在指示II型糖尿病的易感性。可 以使用检测TCF7L2核酸编码多肽的表达或者组成的不同的方法,包 括:光谱法,比色法,电泳,等电点聚焦,和免疫测定(例如,David 等人,美国专利号4,376,110),例如免疫印迹(还可参见Current Protocols in Molecular Biology,尤其是第10章)。例如,一方面,可以使用能 够结合多肽的抗体(例如,如上所述),优选具有可检测标记的抗体。 抗体可以是多克隆的,或者更优选的,单克隆的。可以使用完整的抗 体,或者其片段(例如,Fab或者F(ab′)2)。术语“标记的”,就探针 或者抗体而言,意图是包括探针或者抗体的直接标记,通过将可检测 物质偶联(即,物理连接)到探针或者抗体,以及探针或者抗体的间 接标记,通过与直接标记的另一种试剂的反应。间接标记的实例包括 利用荧光标记的第二抗体和用生物素末端标记DNA探针检测第一抗 体,因此它可以利用荧光标记的链亲和素进行检测。
利用如上所述的与突变TCF7L2核酸编码的多肽特定结合的抗体, 或者与非突变核酸编码多肽特定结合的抗体,或者与核酸编码的特定 特定剪接变体特定结合的抗体的Western印迹分析,可用于鉴定待测样 品中特定剪接变体或者多态性的或者突变的TCF7L2核酸编码的多肽 的存在,或者待测样品中特定剪接变体或者非多态性的或者非突变的 核酸编码多肽的缺失。多态性的或者突变的核酸编码多肽的存在,或 者非多态性的或者非突变的核酸编码多肽的缺失,以及TCF7L2核酸编 码的特定剪接变体的存在(或者缺失),可用于诊断II型糖尿病的易 感性。
在这种方法的一方面,待测样品中TCF7L2核酸编码多肽的水平 或者数量与对照样品中TCF7L2编码多肽的水平或者数量进行比较。待 测样品中多肽的水平或者数量比对照样品中多肽的水平或者数量更高 或者更低,以致差异是统计上有显著意义的,提示TCF7L2核酸编码多 肽表达的改变,可用于诊断II型糖尿病的易感性。此外,待测样品中 TCF7L2核酸编码的多肽的组成与对照样品中TCF7L2核酸编码多肽的 组成进行比较(例如,不同剪接变体的存在)。与对照样品中多肽组 成比较,待测样品中多肽组成的差异可用于诊断II型糖尿病的易感性。 在另一方面,在待测样品和对照样品中均可检定多肽的水平或者数量 和组成。待测样品中多肽的数量或者水平相对对照样品的差异;待测 样品中组成相对对照样品的差异;或者数量或者水平的差异,和组成 的差异,指示II型糖尿病的易感性。
当与对照(疾病)样品比较时,相同方法可以相反地用于鉴定差 异的存在。与对照的差异指示糖尿病易感性的降低,和/或指示抵抗II 型糖尿病的保护性等位基因。
标记物和单倍型的评估
显示遗传多样性个体的种群具有不相同的基因组。此外,基因组 在基因组许多位置显示个体之间的序列变化;换言之,在种群中存在 许多多态性位点。在有些情况下,没有选择参考等位基因,对多态性 位点的不同等位基因做出参考。此外,参考序列可指特定定多态性位 点。有时参考等位基因是指“野生型”等位基因,它通常被选作第一 个测序的等位基因或者作为来自“未患病”个体的等位基因(例如, 不显示疾病或者异常表型的个体)。不同于参考的等位基因称为“变 异”等位基因。
本文所述的“标记物”是指表征为特定的变异等位基因(即多态 性位点)的基因组序列。标记物可以包括基因组内发现的任意变异类 型的任意等位基因,包括SNPs,微卫星,插入,缺失,重复和易位。
此处报道的SNP命名是指官方参考SNP(rs)ID识别标签,由国 家生物技术信息中心(NCBI)分配给每个独特的SNP。
本文所述的“单倍型”是指基因组DNA链的片段,其特征在于沿 片段排列的遗传标记物(“等位基因”)的特定组合。在某一实施方 式中,单倍型可以包括一种或者更多等位基因,两种或者更多等位基 因,三种或者更多等位基因,四种或者更多等位基因,或者五种或者 更多等位基因。遗传标记物是在与TCF7L2外显子4LD块相关“多态 性位点”的特定特定“等位基因”。本文使用的“TCF7L2外显子4LD 块”是指Chr10q上的LD块,其中观察到变异与II型糖尿病的相关性。 该LD块的NCBI Build 34位置是114,413,084-114,488,013bp。本文所 述的术语“易感性”包括增加的易感性和降低的易感性。因此,本发 明的特定特定标记物和/或单倍型可以表征为II型糖尿病易感性的增 加,其特征是相对危险度大于1。造成II型糖尿病易感性增加的标记物 和/或单倍型还可以被认为是“具有风险”,因为它们显示疾病风险的 增加。此外,本发明的标记物和/或单倍型可以表征为II型糖尿病易感 性的降低,其特征是相对危险度小于1。
种群(或者自然群体或者合成群体,例如,合成分子文库)中其 位置上可能具有超过一个序列的核苷酸位置在本文中被称为“多态性 位点”。当多态性位点长度是单核苷酸时,该位点称为单核苷酸多态 性(SNP)。例如,如果在特定特定染色体位置,群体的一个成员具有 腺嘌呤而该群体的另一个成员在相同位置具有胸腺嘧啶,则这个位置 是多态性位点,和更具体地,该多态性位点是SNP。当它们位于SNP 检测中的多态性位点时,本文所述的SNP标记物的等位基因是指碱基 A、C、G或者T。本领域技术人员明白通过检测或者阅读相反链,各 种情况下都可以检测互补等位基因。因此,对包括A/G多态性的多态 性位点,采用的检测可以测定两个可能碱基的百分比或者比例,即A 和G。此外,通过设计测定DNA模板上相反链的检测法,可以测定互 补碱基T/C的百分比或者比例。定量的(例如,按照相对危险度)相 同结果将从任意DNA链(+链或者-链)的检测获得。多态性位点允许 基于取代、插入或者缺失的序列差异。例如,多态性微卫星在特定定 位点具有多个小碱基重复(例如CA重复),其中普通群体中重复长度 的数目不同。本文中与多态性位点有关的各种形式的序列被称为多态 性位点的“等位基因”。因此,在早先的实例中,SNP包括了腺嘌呤 等位基因和胸腺嘧啶等位基因。发现的位于TCF7L2外显子4LD块内, 与II型糖尿病相关的SNPs和微卫星标记物描述于表2-7。
通常,参考序列是指特定序列。不同于参考的等位基因称为“变 异”等位基因。例如,NCBI Build 34位置114413084和114488013之 间(等于74929bp,或者74.9kb)的参考基因组DNA序列,这是指染 色体10内的位置,本文中描述为SEQ ID NO:1。本文使用的变异序列, 是指不同于SEQ ID NO:1的序列,但基本上是相似的。组成与TCF7L2 外显子4LD块相关单倍型的遗传标记物是变异体。其他变异体可以包 括影响多肽例如TCF7L2基因编码多肽的变化。当与参考核苷酸序列比 较时,这些序列差异可以包括单个核苷酸或者不止一个核苷酸的插入 或者缺失。这种序列差异可以导致移码;至少一个核苷酸的改变,导 致编码氨基酸的改变;至少一个核苷酸的改变,导致终止密码子的提 前产生;几个核苷酸的缺失,可以导致一个或者多个核苷酸编码氨基 酸的缺失;一个或者几个核苷酸的插入,例如通过不等重组或者基因 转换,可以导致读码框编码序列的中断;全部或者部分序列的复制; 转座;或者核苷酸序列的重排,如本文详细所述。这种序列变化改变 核酸编码的多肽。例如,如果核酸序列的变化造成移码,移码可能导 致编码氨基酸的改变,和/或可能导致提前终止密码子的产生,产生截 短多肽。此外,II型糖尿病相关多态性或者II型糖尿病易感性可能是 一种或者多种核苷酸的同义变化(即,不导致氨基酸序列改变的变化)。 这类多态性可能,例如,改变剪接位点,影响mRNA的稳定性或者转 运,或者影响编码多肽的转录或者翻译。它还可能改变DNA来增加结 构变化的可能性,例如在肿瘤的体细胞水平发生的扩增或者缺失。参 考核苷酸序列编码的多肽是具有特定特定参考氨基酸序列的“参考” 多肽,变异等位基因编码的多肽是指具有变异氨基酸序列的“变异” 多肽。
多态性微卫星在特定特定位点具有长度在2-8个核苷酸(例如CA 重复)的多个小的碱基重复,,其中普通群体中重复长度的数目不同。 Indel是一种常见的多态性形式,包括小的插入或者缺失,通常只有几 个核苷酸长度。
本文描述的单倍型是在多态性位点具有特定等位基因的不同遗传 标记物的组合,例如SNPs和微卫星。单倍型可能包括不同遗传标记物 的组合,因此,可以通过本领域已知的检测多态性位点序列的方法检 测单倍型。例如,可以使用检测SNPs和/或微卫星标记物存在的基因 分型标准技术,例如基于荧光的技术(Chen,X.等人,Genome Res.9(5): 492-98(1999)),PCR,LCR,巢式PCR和用于核酸扩增的其他技术。 可以在风险单倍型中鉴定到这些标记物和SNPs。鉴定相关标记物和 SNPs的一些方法包括使用连锁不平衡(LD)和/或LOD值。
在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定 出风险标记物或者单倍型的个体。在一方面,风险标记物或者单倍型 是指造成II型糖尿病风险(或者易感性)显著增加的标记物或者单倍 型。在一个实施方式中,通过相对危险度测定标记物或者单倍型相关 的显著度。在另一个实施方式中,显著度利用百分比测定。在一个实 施方式中,显著增加的风险测定为相对危险度至少是约1.2,包括但不 限于:1.2,1.3,1.4,1.5,1.6,1.7,1.8和1.9。在另一个实施方式中, 至少为1.2的相对危险度是显著的。在另一个实施方式中,至少为大约 1.5的相对危险度是显著的。在另一个实施方式中,风险显著增加到至 少大约1.7是显著的。在另一个实施方式中,风险显著增加至少大约 20%,包括但不限于大约25%,30%,35%,40%,45%,50%,55%, 60%,65%,70%,75%,80%,85%,90%,95%和98%。在另一个实 施方式中,风险显著增加至少大约50%。
在本发明的其他实施方式中,标记物或者单倍型造成II型糖尿病 风险的降低(易感性降低)。在一个实施方式中,显著降低的风险测 定为相对危险度小于0.9,包括但不限于0.9,0.8,0.7,0.6,0.5和0.4。 在另一个实施方式中,显著的相对危险度小于0.7。在另一个实施方式 中,风险(或者易感性)降低至少大约20%,包括但不限于大约25%, 30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%, 85%,90%,95%和98%。在另一个实施方式中,风险显著下降至少大 约30%。
因此,术语“II型糖尿病易感性”表示II型糖尿病增加的风险或 者易感性或者降低的风险或者易感性,当某一等位基因、标记物、SNP 或者单倍型存在时,数量是显著的;显著度按上述方法测定。本文使 用的术语“降低的风险”、“降低的易感性”和“保护”表示当某一 其他等位基因、标记物、SNP和/或某一其他单倍型存在时,相对危险 度相应降低。但是应了解,鉴定增减的风险是否是医学显著的还依赖 于各种因素,包括特定疾病,标记物或者单倍型,并且通常还包括环 境因素。
TCF7L2基因内或者包括部分TCF7L2基因的风险标记物或者单倍 型,是相对于健康个体(对照)中存在的频率,在具有患II型糖尿病 风险个体(患病的)中存在频率更高的标记物或者单倍型,其中标记 物或者单倍型的存在指示II型糖尿病易感性。简单相关检验的一个实 例是对2×2表进行的Fisher精确检验。从大量染色体中构建染色体群 组的2×2表,所述染色体可以包括标记物或者单倍型两者,只包括标 记物或者单倍型中的一个而不包括另一个,和标记物或者单倍型都不 包括。
在本发明的某些方面,风险标记物或者单倍型是与II型糖尿病显 著相关的TCF7L2内或者邻近TCF7L2的风险标记物或者单倍型。在其 他方面,风险标记物或者单倍型包括TCF7L2内或者邻近TCF7L2的风 险标记物或者单倍型,TCF7L2与II型糖尿病易感性显著相关。在本发 明的特定实施方式中,如本文描述,标记物或者单倍型与TCF7L2外显 子4LD块相关。
可以使用检测SNPs和/或微卫星标记物存在的基因分型标准技术, 例如基于荧光的技术(Chen,等人,Genome Res.9,492(1999)),PCR, LCR,巢式PCR和用于核酸扩增的其他技术。在优选的方面,该方法 包括检定个体中SNPs和/或微卫星的存在或者频率,所述SNPs和/或 微卫星在TCF7L2基因内或者包括部分TCF7L2基因,其中SNPs和/ 或微卫星相对健康对照个体的过度或者更高频率指示个体是II型糖尿 病易感的。这种SNPs和标记物可以用作筛选工具的单倍型。可以在风 险单倍型中鉴定这些标记物和SNPs。例如,风险单倍型可以包括微卫 星标记物和/或SNPs,例如标记物DG10S478和/或SNP rs12255372, rs7895340,rs11196205,rs7901695,rs7903146,rs12243326或者 rs4506565。风险单倍型的存在指示II型糖尿病易感性的增加,从而提 示个体属于本文所述治疗方法的目标人群。
易感性变异体的鉴定
利用期望最大化算法可以估计患者组和对照组中单倍型的频率 (Dempster A.等人,J.R.Stat.Soc.B,39:1-38(1977))。可以使用能够 处理缺失基因型和相不确定性的这种实现算法。在零假设下,患者和 对照被认为具有相同频率。利用相似方法,检验另一种假设,其中可 能包括本文所述标记物的候选风险单倍型在患者中具有比对照更高的 频率,而这两组中其他单倍型频率的比例被认为是相同的。在这两个 假设下相似性分别被最大化,对应1-df似然比统计值被用于评定统计 显著性。
为了寻找连锁区域内的风险和保护性标记物和单倍型,例如,研 究基因分型的标记物所有可能组合的相关性,假设这些标记物跨越实 际区域。组合的患者和对照组可随机分成两组,与原始患者和对照组 规模相同。然后重复标记物和单倍型分析,确定记录的最显著的p-值。 可以重复这种随机化方案,例如,超过100次以构建p-值的经验分布。 在一个优选的实施方式中,<0.05的p-值提示显著的标记物和/或单倍型 关联。
下面详细讨论单倍型分析。
单倍型分析
单倍型分析的一种常用方法涉及利用NEsted MOdels的似然推断 (Gretarsdottir S.,等人,Nat.Genet.35:131-38(2003))。在程序NEMO 中进行该方法,适合多种多态性标记物、SNPs和微卫星。方法和软件 是特意设计用于病例对照研究,其目的是鉴定造成不同风险的单倍型 组。它还是研究LD结构的工具。在NEMO中,借助EM算法,对将 其作为缺失-数据问题的观测数据,直接计算最大似然估计值、似然比 和p-值。
检测信息
即使对观测数据直接计算基于相似性的似然比检验可以被信赖得 出正确的p-值,所述观测数据已捕获因为相不确定性和缺失基因型导 致的信息丢失,但仍有兴趣了解因为信息不完整导致多少信息丢失。 单倍型分析的信息测量法描述于Nicolae和Kong(Technical Report 537, Department of Statistics,University of Statistics,University of Chicago; Biometrics,60(2):368-75(2004)),作为设定用于连锁分析的信息测量 法的自然延伸,在NEMO中应用。
统计分析
对单一标记物与疾病的关联,Fisher精确检验可用于计算各个个 体等位基因的双边p-值。全部p-值表现为未校正的,用于多重比较, 除非特别标出。显示的频率(对微卫星,SNPs和单倍型)是与载体频 率相对的等位基因的频率。为了最小化患者亲缘性造成的任何偏差, 所述患者作为家族被征集用于连锁分析,一级和二级亲属可以从患者 列表中除去。此外,可以重复检验以通过延长差异调整过程而进行患 者中任意剩余亲缘性的关联修正,该过程描述于Risch,N.& Teng,J. (Genome Res.,8:1273-1288(1998)))),和对血缘关系进行DNA收集合 并(pooling)(ibid),这样它可以被用于普通家族关系,提供校正和 未校正的p-值用于比较。与预期一致,差异通常非常小。为了评定多 重检验修正的单一标记物关联的显著度,我们可以利用相同基因型数 据进行随机性检验。患者和对照的群组可以随机分配,多次重复关联 分析(例如,直到500,000次),p-值是重复检验的分数,所述重复检 验得到一些标记等位基因的p-值小于或者等于利用原始患者和对照群 组观察到的p-值。
对单一标记物和单倍型分析,相对危险度(RR)和群体归因危险 度(PAR)可以利用乘法模型(单倍型相对危险度模型)计算(Terwilliger, J.D.& Ott,J,Hum.Hered.42:337-46(1992)和FaIk,CT.& Rubinstein,P, Ann.Hum.Genet.51(Pt 5j:227-33(1987))),即,人携带两个等位基因/ 单倍型的风险倍增。例如,如果RR是A相对于a的风险,则纯合子 AA的风险是杂合子Aa风险的RR倍,是纯合子aa风险的RR2倍。乘 法模型具有良好特性,可以简化分析和计算-单倍型是独立的,即在 患病群体以及对照群体内Hardy-Weinberg平衡。因此,患病的和对照 的单倍型计数均具有多项分布,但在另外假设下具有不同的单倍型频 率。具体地,对两个单倍型hi和hj,风险(hi)/风险(hj)=风险(fi/pi) /风险(fj/pj),其中f和p分别表示在患病群体和对照群体中的频率。 如果真实模型不是倍增的,会存在一些功能损失,除极端情况外损失 倾向于适度的。最重要地,p值总是有效的,因为它们根据零假设计算。
利用NEMO的连锁不平衡
利用D′和R2的标准定义可以计算标记物对之间的LD(Lewontin, R.,Genetics 49:49-67(1964);Hill,W.G. & Robertson,A.Theor.Appl. Genet.22:226-231(1968))。利用NEMO,通过最大似然法估算两个标 记等位基因组合的频率,通过似然比检验计算连锁平衡的偏差。采用 边缘等位基因可能性加权,通过计算两个标记物所有可能等位基因组 合的平均值,将D′和R2的定义延伸至包括微卫星。当描绘出全部标记 物组合以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘 制在右下角。如果需要,在LD图中标记物可以绘制成等距离的而不是 根据它们的物理位置。
连锁分析的统计方法
多点、只在患者中有的等位基因-共用方法(Multipoint, affected-only allele-sharing methods)可用于分析来评定连锁证据。结果, LOD值和非参数的连锁(NPL)值,可以利用程序Allegro获得 (Gudbjartsson等人,Nat.Genet.25:12-3(2000))。我们的基线连锁分 析利用Spairs评分函数(Whittemore,A.S.,Halpern,J.Biometrics 50: 118-27(1994);Kruglyak L.等人,Am.J.Hum.Genet 55:1347-63(1996)), 指数等位基因-共用模式(Kong,A.和Cox,NJ.,Am.J.Hum.Genet. 61:1179-88(1997))和家族权重计算方法,所述权重计算方法是在log 级别,处于相同地加权各患病对和相同地加权各家族之间中途。我们 使用的信息测量是Allegro程序输出值的一部分,如果标记物基因型是 完全不提供信息的,则信息值等于零,如果在患病的亲属间基因型测 定了精确数量的共享等位基因,则信息值等于一(Gretarsdottir等人, Am.J.Hum.Genet.,70:593-603(2002))。用两种不同方法计算p-值, 这里报道的是较不显著的结果。第一个p-值可以根据大样本理论计算; 在无连锁的零假设下Z1r=□(2[loge(10)LOD])的分布大约是标准正 态变量(Kong,A.和Cox,N.J.,Am.J.Hum.Genet.61:1179-88 (1997))。通过观察到的LOD值与其在零假设下完整数据取样分布的 比较,可以计算第二个p值(例如,Gudbjartsson等人,Nat.Genet. 25:12-3(2000))。当数据由好几个家族组成时,这两个p值倾向于非 常相似。
易感性基因座的单倍型和“单倍型块”定义
在一些实施方式中,标记物和单倍型分析涉及定义基于“单倍型 块”的候选易感性基因座(也称为“LD块”)。已经有报道,部分人 基因组可以分解成包含一些常见单倍型的系列离散的单倍型块;对于 这些块,连锁不平衡数据几乎没有提供数据表明重组(参见,例如, Wall,J.D.和Pritchard,J.K.,Nature Reviews Genetics 4:587-597(2003); Daly,M.等人,Nature Genet.29:229-232(2001);Gabriel,S.B.等人, Science 296:2225-2229(2002);Patil,N.等人.,Science 294:1719-1723 (2001);Dawson,E.等人,Nature 418:544-548(2002);Phillips,M.S.等人, Nature Genet.35:382-387(2003))。
主要有两种定义这些单倍型块的方法:块可以定义为具有有限单 倍型多样性的DNA区域(参见,例如,Daly,M.等人,Nature Genet. 29:229-232(2001);Patil,N.等人,Science 294:1719-1723(2001);Dawson, E.等人,Nature 418:544-54%(2002);Zhang,K.等人,Proc.Natl.Acad. Sci.USA 99:7335-7339(2002)),或者是利用连锁不平衡鉴定的在过渡 带之间具有广泛历史重组的区域(参见,例如,Gabriel,S.B.等人, Science 296:2225-2229(2002);Phillips,M.S.等人,Nature Genet. 33:382-387(2003);Wang,N.等人,Am.J.Hum.Genet.77:1227-1234 (2002);Stumpf,M.P.,和Goldstein,D.B.,Curr.Biol.73:1-8(2003))。本 文使用的术语“单倍型块”或者“LD块”包括任意一种特征定义的块。
单倍型块鉴定的典型方法公开于,例如,美国公开的专利申请号 20030099964,20030170665,20040023237和20040146870。单倍型块 可以方便的用于对表型和单倍型情况之间的关联性作图。在各单倍型 块中可以鉴定主要单倍型,然后可以鉴定出一组“标签”SNPs或者标 记物(需要最小组的SNPs或者标记物以区别单倍型)。然后这些标签 SNPs或者标记物可用于鉴定来自各组个体的样品,以便鉴定表型和单 倍型之间的关联性。如果需要,相邻单倍型块可以同时评定,因为单 倍型块间可能存在连锁不平衡。
单倍型和诊断
如本文所述,包括这种标记物的一些标记物和单倍型被发现可用 于II型糖尿病易感性的测定-即发现它们可用于II型糖尿病易感性的 诊断。发现特定标记物和单倍型在患有II型糖尿病的个体中的频率比 没有II型糖尿病的个体中的频率更高。因此,这些标记物和单倍型具 有在个体中检测II型糖尿病或者II型糖尿病易感性的预测价值。发现 包括一些标签标记物的单倍型块(即TCF7L2外显子4LD块)在患有 II型糖尿病的个体中的频率比在没有II型糖尿病的个体中的频率更高。 因此,这些单倍型块内的“风险”标签标记物也具有在个体中检测II 型糖尿病或者II型糖尿病易感性的预测价值。单倍型或者LD块内的 “风险”标签标记物还可以包括区分单倍型的其他标记物,因为这些 标记物类似的具有检测II型糖尿病或者II型糖尿病易感性的预测价值。 作为人类基因组单倍型块结构的结果,与单倍型块(LD块)相关的大 量标记物或者其他变异体和/或包括这种标记物或者变异体的单倍型可 以被认为与某一特征和/或表型相关。因此,位于本文定义的TCF7L2 外显子4LD块内或者与TCF7L2外显子4LD块具有强LD(特征为r2大于0.2)的标记物和/或单倍型可能与II型糖尿病相关(即它们造成 增加或减少的II型糖尿病易感性)。这包括本文描述的标记物(表6), 但还可能包括与表6所列的一个或者多个标记物具有强LD(特征为r2大于0.2)的其他标记物。可以通过本领域技术人员公知的方法鉴定这 类其他变异体,例如通过对特定个体组LD块A基因组区域进行DNA 测序,本发明也包括这类其他变异体。
如本文所述,发现TCF7L2外显子4LD块内的一些标记物的频率 在患有II型糖尿病的个体中降低,包括两种或更多表13、20和21所 列的那些标记物的单倍型也被发现在患有II型糖尿病的个体中频率降 低。因此这些标记物和单倍型对II型糖尿病是保护性的,即它们造成 携带这些标记物和/或单倍型的个体患II型糖尿病的风险降低。
本文描述的单倍型和标记物,在一些情况下,是不同遗传标记物 的组合,例如,SNPs和微卫星。因此,可以通过本领域已知的和/或本 文所述的检测多态性位点序列的方法检测单倍型。此外,利用标准技 术可以验证某些单倍型或者标记物组和疾病表型之间的相关性。简单 的相关性检验的一个典型实例是对2×2表进行Fisher精确检验。
在特定实施方式中,与TCF7L2外显子4LD块相关的标记物或者 单倍型,是相对于其在健康个体(对照)中存在的频率,在具有患II 型糖尿病风险个体(患病的)中存在频率更高的标记物或者单倍型, 其中标记物或者单倍型的存在指示II型糖尿病或者II型糖尿病易感性。 在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者多个标 记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对照) 中存在的频率,在具有患II型糖尿病风险个体(患病的)中存在频率 更高的标签标记物,其中标签标记物的存在指示II型糖尿病增加的易 感性。在其他实施方式中,与TCF7L2外显子4LD块相关的一个或者 多个标记物具有连锁不平衡的风险标签标记物,是相对于健康个体(对 照)中存在的频率,在具有患II型糖尿病风险个体中存在频率更高的 标记物,其中标记物的存在指示II型糖尿病易感性。
在本文描述的一些方法中,具有患II型糖尿病风险的个体是鉴定 出风险标记物或者单倍型的个体。在一个实施方式中,标记物或者单 倍型关联性的强度采用相对危险度(RR)来测定。RR是携带标记物或 者单倍型的一个拷贝个体的发病率相对不携带标记物或者单倍型个体 的发病率的比例。这个比例相当于携带两个拷贝标记物或者单倍型个 体的发病率相对携带一个拷贝标记物或者单倍型个体的发病率的比 例。在一个实施方式中,标记物或者单倍型具有至少为1.2相对危险度。 在其他实施方式中,标记物或者单倍型具有至少1.3,至少1.4,至少 1.5,至少2.0,至少2.5,至少3.0,至少3.5,至少4.0,或者至少5.0 的相对危险度。
在本发明的其他方法中,患II型糖尿病风险降低(或者易感性降 低)的个体是鉴定出保护性标记物或者单倍型的个体。在这种情况下, 相对危险度(RR)小于1。在一个实施方式中,标记物或者单倍型具 有小于0.9的相对危险度。在另一个实施方式中,标记物或者单倍型具 有的相对危险度小于0.8,小于0.7,小于0.6,小于0.5或者小于0.4。
遗传检验的实用性
与造成发展II型糖尿病风险的遗传变异有关的知识,为能够区分 患病风险增加个体(即风险变异体携带者)和患病风险降低个体(即 保护性变异体的携带者)的遗传-检验提供了可能。对属于上述两组的 个体进行遗传检验的核心价值,是在早期诊断疾病的可能性,以及给 临床医生提供关于疾病预后/侵袭性信息,以便能够采用最合适的治疗 方法。例如,II型糖尿病遗传检验的应用使在早期检测疾病成为可能, 这导致在早期就可以进行治疗检查,从而可以最小化疾病的有害作用 和II型糖尿病造成的严重健康后果。
治疗方法
在本发明的另一个实施方式中,该方法可用于治疗II型糖尿病。 本文使用的术语“治疗”不仅指改善II型糖尿病相关症状,而且还指 预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重程度或 者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药物用来 改善II型糖尿病的相关症状。一方面,待接受治疗的个体是II型糖尿 病易感的(增加风险)的个体(例如,具有以下等位基因存在的个体: 标记物DG10S478除了0等位基因以外其他等位基因的存在;SNP rs12255372的T等位基因的存在;SNP rs7895340的A等位基因的存在; SNP rs11196205的C等位基因的存在;SNP rs7901695的C等位基因的 存在;SNP rs7903146的T等位基因的存在;SNP rs12243326的C等位 基因的存在;或者SNP rs4506565的T等位基因的存在)。
在本发明的其他实施方式中,该方法可用于治疗其他TCF7L2相 关的疾病或者病症。TCF7L2治疗剂可以用于II型糖尿病的治疗方法, 以及其他TCF7L2相关疾病或者病症的治疗方法。
治疗方法(预防和/或治疗的)使用TCF7L2治疗剂。“TCF7L2 治疗剂”是一种直接地或者间接改变(例如,增强或者抑制)TCF7L2 的多肽活性和/或核酸表达(例如,通过改变与TCF7L2相互作用蛋白 的活性或者核酸表达,例如Wnt信号途径或者钙粘蛋白途径中的蛋白 (例如,beta-连环蛋白))的药剂。在某些实施方式中,TCF7L2治疗 剂改变TCF7L2的活性和/或核酸表达。
TCF7L2治疗剂可以通过各种方法改变TCF7L2多肽活性或者核酸 表达,例如,通过提供额外TCF7L2多肽或者通过上调TCF7L2核酸的 转录或者翻译;通过改变TCF7L2多肽的翻译后加工;通过改变TCF7L2 剪接变异体的转录;或者通过干扰TCF7L2多肽活性(例如,通过结合 TCF7L2多肽),或者通过结合与TCF7L2相互作用的另一个多肽,通 过改变TCF7L2核酸的(例如,下调)表达、转录或者翻译,或者通过 改变(例如,激动或者拮抗)活性。
典型的TCF7L2治疗剂包括下列物质:本文描述的核酸或者其片 段或者其衍生物,特别是编码本文描述多肽的核苷酸和包括这类核酸 的载体(例如,基因,cDNA,和/或mRNA,例如编码TCF7L2多肽或 者活性片段或者其衍生物的核酸,或者寡聚核苷酸;或者其互补物, 或者片段或者其衍生物,和/或II型糖尿病核酸或者片段或者其衍生物 编码的其他剪接变异体);本文描述的多肽和/或TCF7L2核酸或者片 段或者其衍生物编码的剪接变异体;其他多肽(例如,TCF7L2受体); TCF7L2结合剂;或者影响(例如,增加或者降低)活性的药剂,抗体, 例如抗突变TCF7L2多肽的抗体,或者抗非突变TCF7L2多肽的抗体, 或者抗上述TCF7L2核酸编码的特定剪接变异体的抗体;模拟肽;融合 蛋白或者其前体药物;核酶;其他小分子;和其他改变(例如,增强 或者抑制)TCF7L2核酸表达的药剂,或者调节TCF7L2剪接变异体转 录的药剂(例如,影响那个剪接变异体表达,或者影响各剪接变异体 表达数量的药剂)。其他典型的TCF7L2治疗剂包括影响胰岛素信号和 /或胰高血糖素,GLP-1或者GIP信号的化合物。如果需要,可以同时 使用不止一种TCF7L2治疗剂。
在优选的实施方式中,TCF7L2治疗剂是干扰TCF7L2活性的药剂, 例如,干扰TCF7L2结合或者TCF7L2与beta-连环蛋白或其他蛋白相 互作用的药剂(参见,例如,Fasolini,等人,J.Biol.Chem 278(23):21092-06(2003))。其他TCF7L2治疗剂包括影响Wnt信号途 径的药剂或者影响钙粘蛋白途径的药剂。典型药剂包括例如那些用于 癌症治疗的药剂,包括,例如,蛋白例如DKK蛋白;APC的beta-连 环蛋白结合结构域或者Axin;因子例如IDAX,AXAM和ICAT;反义 寡聚核苷酸或者干扰RNA(RNAi),例如伴随Vitravene的使用;溶 瘤细胞病毒载体;和其他化合物(参见,例如,Luu等人,Current Cancer Drug Targets 4:6530671(2004));小分子拮抗剂,包括,例如,ZTM00990, PKF118-310,PKF118-744,PKF115-584,PKF222-815,CGPO49090, NPDDG39.024和NPDDG1.024,如Lepourcelet等人所述(参见,例如, Lepourcelet等人,Cancer Cell 5:91-102(2004));美国专利6,762,185中 描述的化合物;美国专利申请20040005313,20040072831,20040247593, 或者20050059628中描述的化合物。其他典型的TCF7L2治疗剂包括 gsk3抑制剂,包括,例如,在美国专利6,057,117;6,153,618;6,417,185; 6,465,231;6,489,344;6,512,102;6,608,063;6,716,624;6,800,632; 和公开的美国专利申请20030008866;20030077798;20030130289; 20030207883;2000092535;和200500851中描述的那些gsk3抑制剂。 说明书中引用的所有参考文献、专利和专利申请的全部教导在此完整 引入。
其他典型的TCF7L2治疗剂如下面药剂表所示。
药剂表
NSD=结构未公开(在Iddb3中)
以治疗有效量(即,如上述足以“治疗”的数量)的TCF7L2治 疗剂给药。对特定个体病症或者疾病治疗有效的剂量依赖于疾病的症 状和严重程度,这可以通过标准临床技术来确定。此外,可以选择体 外或者体内检测帮助确定最适剂量范围。剂型中使用的精确剂量还依 赖于给药途径和疾病或者病症的严重性,这应该根据医师的判断和各 个患者的情况来决定。可以从来白体外或者动物模型检测系统的剂量 反应曲线推断出有效剂量。
在一个实施方式中,可以使用核酸(例如,编码TCF7L2多肽的 核酸);或者编码TCF7L2多肽或者剪接变异体、衍生物或者其片段的 其他核酸,单独的或者在如上所述的药物组合物中。例如,编码TCF7L2 多肽的TCF7L2基因或者核酸或者cDNA,独立的或包括在载体内,可 以被导入细胞(体外或体内),这样细胞产生天然的TCF7L2多肽。必 要时,已经转化了基因或者cDNA或者包括基因、核酸或者cDNA的 载体的细胞可以被导入(或者再导入)患有疾病的个体。因此,本身 缺乏天然TCF7L2表达和活性,或者具有突变的TCF7L2表达和活性, 或者具有疾病相关TCF7L2剪接变异体表达的细胞,可以被工程化表达 TCF7L2多肽或者TCF7L2多肽的活性片段(或者TCF7L2多肽的不同 变异体)。在某些实施方式中,编码TCF7L2多肽或者活性片段或者其 衍生物的核酸,可以被导入表达载体,例如病毒载体,然后载体可以 导入动物的合适细胞中。可以使用其他基因转移系统,包括病毒和非 病毒转移系统。此外,还可以使用非病毒基因转移方法,例如磷酸钙 共沉淀,机械技术(例如,微量注射);经由脂质体膜融合介导的转 移;或者直接DNA吸收。
此外,在本发明的另一个实施方式中,本发明的核酸;与本发明 核酸互补的核酸;或者这类核酸的一部分(例如,如下所述的寡聚核 苷酸),可用于“反义”治疗,其中在原位给药或者产生与II型糖尿 病基因的mRNA和/或基因组DNA特异杂交的核酸(例如,寡聚核苷 酸)。与mRNA和/或DNA特异杂交的反义核酸抑制TCF7L2多肽的 表达,例如,通过抑制翻译和/或转录。反义核酸的结合可以通过常规 碱基对互补,或者,例如,就结合DNA双链而言,通过在双螺旋大沟 内的特异相互作用。
本发明的反义构建体可以例如作为上述表达质粒被输送。当质粒 在细胞中转录时,产生与编码TCF7L2多肽的mRNA和/或DNA的部 分片段互补的RNA。此外,反义构建体可以是离体产生并被导入细胞 的寡聚核苷酸探针;然后它通过与多肽的mRNA和/或基因组DNA的 杂交抑制表达。在一个实施方式中,寡聚核苷酸探针是修饰的寡聚核 苷酸,能够抵抗内源核酸酶,例如核酸外切酶和/或核酸内切酶,因此 它们在体内是稳定的。用作反义寡聚核苷酸的示例性核酸分子是DNA 的氨基磷酸酯,硫代磷酸酯和甲基膦酸酯类似物(还可参见美国专利 号5,176,996;5,264,564;和5,256,775)。此外,用于反义治疗的寡聚 物的常见构建方法还描述于,例如,Van der Krol等人,(BioTechniques 6:958-976(1988));和Stein等人,(Cancer Res.48:2659-2668(1988))。 就反义DNA而言,来自翻译起始位点的寡聚脱氧核糖核苷酸是优选的。
为进行反义治疗,设计与编码TCF7L2基因的mRNA互补的寡聚 核苷酸(mRNA,cDNA或者DNA)。反义寡聚核苷酸与TCF7L2mRNA 转录产物结合,并阻止翻译。完全互补,虽然是优选的,但不是必须 的。本文所指的与RNA部分“互补”的序列,表示序列具有足够的互 补性能够与RNA杂交形成稳定的双链;就双链反义核酸来说,因此可 以检测双链DNA的单链,或者也可以检测三链形成。杂交能力取决于 互补程度和反义核酸长度,如上面详细所述。通常,杂交核酸越长, 就可以包含与RNA更多的碱基错配,仍然能够形成稳定的双链(或者 三链,根据情况而定)。本领域技术人员能够利用标准方法确定可耐 受的错配度。
用于反义治疗的寡聚核苷酸可以是DNA,RNA或者其嵌合混合物 或者衍生物或者修饰形式,单链或者双链的。可以在例如碱基基团, 糖基团或者磷酸盐骨架上对寡聚核苷酸进行修饰,以提高分子、杂交 的稳定性。寡聚核苷酸可以包括其他附加基团例如肽(例如体内用于 定位到宿主细胞受体),或者促进穿过细胞膜转运(参见,例如,Letsinger 等人,Proc.Natl.Acad.Sci USA 86:6553-6556(1989);Lemaitre等人, Proc.Natl.Acad.Sci USA 84:648-652(1987);PCT国际公开号:WO 88/09810)或者(参见,例如,PCT国际公开号:WO 89/10134)血脑屏 障转运的药剂,或者杂交触发断裂剂(参加,例如,Krol等人, BioTechniques 6:958-976(1988))或者嵌入剂(参见,例如,Zon,Pharm. Res.5:539-549(1988))。所以,寡聚核苷酸可以结合到另一个分子上 (例如,肽,杂交触发交联剂,转运试剂,杂交触发断裂剂)。
反义分子被递送到体内表达TCF7L2的细胞。可以使用多种方法 将反义DNA或者RNA递送到细胞;例如,反义分子可以直接注射到 组织部位,或者设计定位到目标细胞的修饰反义分子(例如,与肽或 者抗体连接的反义分子,所述肽或者抗体特异结合目标细胞表面表达 的受体或者抗原)可以全身给药。此外,在一个优选的实施方式中, 使用重组DNA构建体,其中反义寡聚核苷酸置于强启动子控制下(例 如,pol III或者pol II)。利用这类构建体转染患者的靶细胞,可以引 起足量单链RNAs的转录,它们将与内源TCF7L2转录产物形成互补碱 基对,从而阻止TCF7L2 mRNA的翻译。例如,载体可以导入体内, 因此它被细胞摄取并指导反义RNA的转录。这类载体可以保留为附加 体或者与染色体整合,只要它能够转录产生所需的反义RNA。这类载 体可以通过本领域和上述的标准的DNA重组技术方法进行构建。例如, 质粒,粘粒,YAC或者病毒载体可用于制备能够直接导入组织部位的 重组DNA构建体。此外,可以使用选择性感染目标组织的病毒载体, 这种情况下可以通过其他途径实现给药(例如,全身性的)。
利用靶向同源重组,灭活或者“敲除”基因、核酸或者其启动子, 也也可以减少内源TCF7L2多肽的表达(例如,参见Smithies等人,Nature 317:230-234(1985);Thomas & Capecchi,Cell 51:503-512(1987); Thompson等人,Cell 5:313-321(1989))。例如,可以使用与内源基因或 者核酸(或者编码核酸区域或者调节区域)同源的DNA侧翼的突变、 无功能的基因或者核酸(或者完全无关的DNA序列),包括或者不包 括选择标记物和/或负选择标记物,转染体内表达基因或者核酸的细胞。 通过插入靶向同源重组的DNA构建体,引起基因或者核酸的灭活。重 组DNA构建体可以直接给药,或者利用如上所述的合适载体在体内定 位到所需部位。此外,利用相似方法可以增加非突变基因或者核酸的 表达:靶向同源重组可用于插入DNA构建体,所述DNA构建体在细 胞内包括非突变的功能基因或者核酸,代替上述突变的TCF7L2。在另 一个实施方式中,靶向同源重组可用于插入包括一种核酸的DNA构建 体,所述核酸编码与细胞中存在的不同的II型糖尿病多肽变异体。
此外,通过将互补脱氧核糖核苷酸序列定位到TCF7L2核酸的调 节区域(即,TCF7L2启动子和/或增强子)形成三螺旋结构,阻止体内 靶细胞中TCF7L2核酸的转录,内源TCF7L2核酸的表达可以被降低 (一般参见,Helene,C,Anticancer Drug Des.,6(6):569-84(1991); Helene,C.等人.,Ann.N.Y.Acad.Sci 660:27-36(1992);和Maher,L.J., Bioassays 14(12):807-15(1992))。同样地,本文描述的反义构建体, 通过拮抗TCF7L2蛋白的正常生物活性,可用于组织处理,例如,组织 分化,体内和体外组织培养。此外,反义技术(例如,反义分子的显 微注射,或者和质粒转染,所述质粒的转录产物是II型糖尿病基因 mRNA或者基因序列的反义序列),可用于研究疾病进展中的TCF7L2 功能或者TCF7L2与其结合剂的相互作用,以及成人组织中TCF7L2 的正常细胞功能或者TCF7L2与其结合剂的相互作用。这类技术可用于 细胞培养中,但也可用于转基因动物的制备。
在本发明的另一个实施方式中,本文描述的其他TCF7L2治疗剂 还可用于II型糖尿病基因的治疗。治疗剂可以在上述组合物中,或者 单独给药。它们可以全身给药,或者定位到特定组织。治疗剂可以通 过各种方法制备,包括化学合成;重组产生;体内产生(例如,转基 因动物,例如美国专利号:4,873,316,Meade等人),例如,并可以 用本文描述的那些标准方法分离。
还可以使用任意上述治疗方法的组合(例如,非突变多肽给药和 针对TCF7L2突变mRNA的反义治疗联用;TCF7L2核酸编码第一种剪 接变异体给药和针对TCF7L2核酸编码第二种剪接的反义治疗联用)。
评定对TCF7L2治疗剂反应可能性的方法
本发明还涉及评定个体对TCF7L2治疗剂反应可能性的方法。在 该方法中,评定和TCF7L2基因相关的标记物或者单倍型,如上所述涉 及评定个体对II型糖尿病的易感性。与II型糖尿病易感性(增加的风 险)相关的等位基因,标记物,SNP或者单倍型(例如,标记物DG10S478 除了0等位基因以外其他等位基因;SNP rs12255372的T等位基因; SNP rs7895340的A等位基因;SNP rs11196205的C等位基因;SNP rs7901695的C等位基因;SNP rs7903146的T等位基因;SNP rs12243326 的C等位基因;或者SNP rs4506565的T等位基因;TCF7L2外显子4 LD块相关标记物,例如TCF7L2外显子4LD块相关的风险单倍型); 指示对TCF7L2治疗剂阳性反应的可能性。“阳性反应的可能性”表示 个体比不具有本文所述II型糖尿病易感性(增加的风险)相关等位基 因、标记物、SNP或者单倍型的个体更可能对TCF7L2治疗剂显示阳 性反应。对TCF7L2治疗剂的“阳性反应”是显示II型糖尿病治疗的 生理反应。如上所述,“治疗”不仅指改善II型糖尿病相关症状,而 且还指预防或者延缓II型糖尿病的发病;减轻II型糖尿病症状的严重 程度或者频率;和/或减轻与其他药物联合治疗的必要性,所述其他药 物用来改善II型糖尿病的相关症状。
药物组合物
本发明还涉及药物组合物,包括改变TCF7L2活性或者另外影响 Wnt信号途径或者钙粘蛋白途径,或者可用作TCF7L2治疗剂的药物。 药物组合物还可以与生理上可接受的载体或者赋形剂一起制备成药物 组合物。载体和组合物是无菌的。剂型应当适合给药方式。
合适的药学可接受的载体包括但不限于,水,盐溶液(例如,NaCl), 盐水,缓冲盐水,醇,甘油,乙醇,阿拉伯树胶,植物油,苯甲醇, 聚乙二醇,明胶,糖例如乳糖,直链淀粉或者淀粉,葡萄糖,硬脂酸 镁,滑石,硅酸,粘性石蜡,芳香油,脂肪酸酯,羟甲纤维素,聚乙 烯吡咯烷酮,等等,以及其组合。如果需要,药物制剂可以与辅料混 合,例如,润滑剂,防腐剂,稳定剂,湿润剂,乳化剂,用于影响渗 透压的盐,缓冲液,着色剂,调味剂和/或芳香物质和类似物,它们均 不与活性药剂产生有害反应。
如果需要,组合物还可以包括少量湿润或者乳化剂,或者pH缓冲 剂。组合物可以是液体溶液,悬浮液,乳剂,片剂,药丸,胶囊,缓 释剂型,或者粉末。组合物可以与常规粘合剂和载体例如三酸甘油酯 制备为栓剂。口服剂型可以包括标准载体例如药物等级的甘露醇,乳 糖,淀粉,硬脂酸镁,聚乙烯吡咯烷酮,糖精钠,纤维素,碳酸镁, 等等。
导入这些组合物的方法包括,但不限于,真皮内的,肌肉的,腹 内的,眼内的,静脉内的,皮下的,局部的,口服的和鼻内的。其他 合适的导入方法还包括基因治疗(如下所述),可充电或者可生物降 解装置,粒子加速装置(“基因枪”)和缓释聚合装置。本发明的药 物组合物还可以作为与其他药剂联合治疗的一部分给药。
组合物可以按照常规步骤制备适于给药人类的药物组合物。例如, 用于静脉内给药的组合物通常是无菌等渗水相缓冲液中的溶液。当必 要时,组合物还可以包括增溶剂和局部麻醉剂,以便在注射部位镇痛。 通常,成分是被分别供给或者混合为单位剂型形式,例如,作为密闭 容器例如安瓿或者标记活性药剂数量的小袋(sachette)中的冻干粉末或 者无水浓缩物。当组合物通过输液给药时,它可以在包含无菌药物等 级水、盐水或者葡萄糖/水的输液瓶中配制。当组合物通过注射给药时, 可以提供包含灭菌注射水或者盐水的安瓿,这样在给药前就可以将成 分混合。
对于局部施用,可以使用非喷雾形式,包括一种载体的粘性的至 半固体或者固体形式,所述载体适于局部施用并且其动态粘滞度优选 的大于水。合适制剂包括但不限于溶液,悬浮液,乳剂,乳膏剂,软 膏,粉末,灌肠剂,洗液,溶胶,搽剂,油膏剂,气雾剂,等等,如 果需要,它们被灭菌或者与辅料混合,例如,防腐剂,稳定剂,湿润 剂,缓冲液或者用于影响渗透压的盐,等等。药剂可以整合到化妆品 制剂中。对于局部施用,可喷雾的气雾剂也是合适的,其中活性成分, 优选的与固体或者液体惰性载体材料组合,包装在挤瓶中或者与增压 的挥发性、通常是气体的喷射剂混合,例如压缩空气。
本文描述的药剂可以配制为中性或者盐形式。药学可接受的盐包 括那些与自由氨基形成的盐,例如源自盐酸,磷酸,醋酸,草酸,酒 石酸,等等的盐,和那些与自由羧基形成的盐,例如来自钠,钾,铵, 钙,氢氧化铁,异丙胺,三乙胺,2-乙基氨基乙醇,组氨酸,普鲁卡因, 等等的盐。
给药治疗有效量的药剂。药剂的治疗有效量部分取决于疾病的性 质和/或症状的程度,可以通过标准临床技术确定,此外,可以任选选 用体外或者体内检测帮助确定最适剂量范围。制剂中使用的精确剂量 还取决于给药途径和症状的严重性,这应该根据医师的判断和各个患 者的情况来决定。可以从来自体外或者动物模型检测系统的剂量反应 曲线外推出有效剂量。
本发明还提供药物包装或者试剂盒,包括一个或者多个装满本发 明药物组合物中一种或者多种成分的容器。可选的这类容器中还可以 包括管理药物或者生物制品生产、使用或者销售的政府部门出具的通 告,该通告表明政府批准用于人类给药的制备、使用或者销售。包装 或者试剂盒可以标注关于给药方式,药物给药顺序(例如,分别、连 续或者同时)或者类似的相关信息。包装或者试剂盒还可以包括一些 方法提醒患者采取治疗。包装或者试剂盒可以是组合治疗的单一单位 剂量,或者它可以是多个单位剂量。具体的,药剂可以是单独的,以 任意组合混合的,存在于单个小瓶或者片剂中的。药剂组装成泡状包 装或者其他配药装置中是优选的。对本发明的目的来说,单位剂量是 为了表示一种剂量,所述剂量取决于各种药剂的个体药效学,在标准 时程按FDA批准的剂量给药。
筛选试验和由此鉴定的药剂
本发明还提供鉴定药剂(例如,融合蛋白,多肽,模拟肽,前体 药物,受体,结合剂,抗体,小分子或者其他药物,或者核酶)的方 法,所述药剂改变(例如,增加或者降低)TCF7L2的活性,或者与 TCF7L2或者Wnt信号途径或者钙粘蛋白途径的其他成员(例如,beta- 连环蛋白)相互作用。例如,在某些实施方式中,这类药剂可以与 TCF7L2结合;对例如TCF7L2的活性具有刺激或者抑制效果;或者改 变(例如,增强或者抑制)TCF7L2与Wnt信号途径其他成员或者与钙 粘蛋白途径成员相互作用的能力,或者改变TCF7L2的翻译后加工。在 其他实施方式中,这类药剂改变Wnt信号途径或者钙粘蛋白途径的活 性或者功能。
在一个实施方式中,本发明提供筛选与TCF7L2蛋白(或者其生 物活性部分)结合或者改变其活性的候选或者待测药剂的方法,以及 通过该方法鉴定的药剂。待测药剂可以利用本领域已知的的组合文库 方法中的任意一种方法来获得,包括:生物文库;空间寻址平行固相 或者液相文库;需要去卷积(deconvolution)的合成文库方法;‘一- 珠一-化合物′(′one-bead one-compound′)文库方法;和利用亲和层析 选择法的合成文库。生物文库方法限于多肽文库,而其他4种方法适 于多肽、非肽寡聚物或者化合物的小分子文库(Lam,K.S.,Anticancer Drug Des.12:145(1997))。
在一个实施方式中,为鉴定改变TCF7L2活性的药剂,包含或者 表达TCF7L2或者其片段或者衍生物的细胞、细胞裂解产物或者溶液, 可以与待测药剂接触;或者,蛋白可以直接与待测药剂接触。TCF7L2 活性的水平(数量)被测定(例如,直接或者间接地检测TCF7L2活性 的水平(数量)),并与对照(即,在待测药剂不存在的条件下TCF7L2 蛋白或者其活性片段或者衍生物活性的水平)活性的水平比较。如果 药剂存在时活性水平不同于药剂不存在时的活性水平,并且差值是统 计上有显著意义的,则该药剂是改变TCF7L2活性的药剂。活性水平相 对于对照的增加,表示该药剂是增强活性的药剂(是激动剂)。类似 地,活性水平相对于对照的降低,表示该药剂是抑制活性的药剂(是 拮抗剂)。在另一个实施方式中,待测药剂存在条件下TCF7L2或者其 衍生物或者片段活性的水平与先前建立的对照水平进行比较。如果药 剂存在条件下活性水平与对照水平的差值统计上有显著意义,则表示 药剂改变TCF7L2的活性。
本发明还涉及鉴定药剂(例如,反义核酸,融合蛋白,多肽,模 拟肽,前体药物,受体,结合剂,抗体,小分子或者其他药物,或者 核酶)的检测法,所述药剂改变(例如,增加或者降低)TCF7L2基因 的表达(例如,转录或者翻译),或者与TCF7L2的相互作用,以及涉 及通过该检测法鉴定的药剂。例如,包含编码TCF7L2的核酸的溶液可 以与待测药剂接触。溶液可以包括,例如,包含核酸的细胞或者包含 核酸的细胞裂解产物;此外,溶液可以是包括核酸转录/翻译必需成分 的其他溶液。如果需要,还可以使用未悬浮在溶液中的细胞。TCF7L2 表达的水平和/或模式(例如,mRNA或者蛋白表达的水平和/或模式, 例如不同剪接变异体的水平和/或模式)被测定,与对照表达的水平和/ 或模式(即,待测药剂不存在时TCF7L2表达的水平和/或模式)进行 比较。如果药剂存在时的水平和/或模式与药剂不存在时的水平和/或模 式有差异,并且差值在统计上有显著意义或者以统计上有显著意义的 方式不同,则该药剂是改变II型糖尿病基因表达的药剂。TCF7L2表达 的增强表示该药剂是TCF7L2活性的激动剂。类似地,TCF7L2表达的 抑制表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测 药剂存在条件下TCF7L2多肽(例如,不同的剪接变异体)的水平和/ 或模式与先前建立的对照水平和/或模式进行比较。如果药剂存在条件 下水平和/或模式与对照水平和/或模式有差异,其差值在统计上有显著 意义或者以统计上有显著意义的方式不同,则表示药剂改变TCF7L2 表达。
在本发明的另一个实施方式中,利用包含编码TCF7L2基因启动 子区域的核酸或者与报告基因可操作连接的核酸的细胞、细胞裂解产 物或者溶液,可以鉴定出改变TCF7L2表达或者与TCF7L2或者与Wnt 信号途径或者钙粘蛋白途径其他成员相互作用的药剂。与待测药剂接 触后,测定报告基因的表达水平(例如,mRNA或者蛋白表达的水平), 与对照的表达水平(即,待测药剂不存在条件下报告基因的表达水平) 进行比较。如果药剂存在时水平与药剂不存在时的水平有差异,其差 值是统计上有显著意义的或者是以统计上有显著意义的方式不同,则 该药剂是改变TCF7L2表达的药剂,因为显示它具有改变基因表达的能 力,所述基因与TCF7L2基因启动子可操作的连接。报告基因表达的增 强表示该药剂是TCF7L2活性的激动剂。类似地,报告基因表达的抑制 表示该药剂是TCF7L2活性的拮抗剂。在另一个实施方式中,待测药剂 存在条件下报告基因表达的水平与先前建立的对照水平进行比较。如 果药剂存在条件下水平与对照水平有差异,其差值在统计上有显著意 义或者以统计上有显著意义的方式不同,表示该药剂改变表达。
利用上述这些方法可以轻易的鉴定改变TCF7L2编码的不同剪接 变异体量(例如,增强第一种剪接变异体活性的药剂,和抑制第二种 剪接变异体活性的药剂)的药剂,以及是第一种剪接变异体活性激动 剂和第二种剪接变异体活性拮抗剂的药剂。
在本发明的其他实施方式中,该检测可用于评定待测药剂对 TCF7L2结合剂相关多肽活性的影响。例如,表达与TCF7L2多肽相互 作用的化合物(本文中称为“TCF7L2结合剂”,它可以是与TCF7L2 多肽直接或者间接作用的多肽或者其他分子,例如Wnt信号途径的成 员或者钙粘蛋白途径的成员)的细胞,在待测药剂存在条件下与 TCF7L2接触,检测待测药剂改变TCF7L2和TCF7L2结合剂相互作用 的能力。此外,可以使用包含TCF7L2结合剂的细胞裂解产物或者溶液。 通过干扰或者增强TCF7L2与TCF7L2结合剂结合、交联或者另外相互 作用的能力,与TCF7L2或者TCF7L2结合剂结合的药剂可以改变相互 作用。检测待测药剂结合TCF7L2或者TCF7L2结合剂的能力可以通过 下述方法实现,例如,将待测药剂与放射性同位素或者酶标记物偶联, 这样的话待测药剂与多肽的结合可以通过直接或者间接检测125I,35S, 14C或者3H标记,和放射性直接计数或者闪烁计数的放射性同位素检 测。此外,待测药剂可以酶联标记有,例如,辣根过氧化酶,碱性磷 酸酶,或者荧光素酶,和通过测定适合底物向产物的转化检测的酶标 记物。在本发明范围内的还包括检测待测药剂与多肽相互作用的能力, 所述相互作用物都没有进行标记。例如,微生理计可用于检测待测药 剂与TCF7L2或者TCF7L2结合剂的相互作用,所述待测药剂,TCF7L2 或者TCF7L2结合剂都没有进行标记。McConnell,H.M.等人,Science 257:1906-1912(1992)。本文使用的“微生理计”(例如,CytosensorTM) 是一种分析仪器,利用光寻址电位传感器(LAPS)测量细胞酸化其环 境的速率。酸化速率的变化可用作配体和多肽之间相互作用的指示剂。
因此,这些受体可用于筛选作为激动剂或者拮抗剂的化合物,以 用于II型糖尿病易感性的治疗或者研究。可以设计药物调控TCF7L2 活化,从而可用于调控信号途径和下游基因的转录事件。
在本发明的另一个实施方式中,检测法可用于鉴定与TCF7L2相 互作用的多肽。例如,例如Fields和Song(Fields,S.和Song,O.,Nature 340:245-246(1989))描述的酵母双杂系统可用于鉴定与TCF7L2相互 作用的多肽。在这类酵母双杂系统中,载体的构建是基于转录因子的 灵活性,所述转录因子具有两个功能结构域(DNA结合结构域和转录 活化结构域)。如果两个结构域是分离的但融合到两个不同但彼此相 互作用的蛋白,可以实现转录激活,特定标记物(例如,营养标记物 的转录例如His和Ade,或者显色标记物例如lacZ)的转录可用于鉴定 相互作用和翻译激活的存在。例如,在本发明的方法中,使用的第一 种载体包括编码DNA结合结构域以及TCF7L2,剪接变异体,或者其 片段或者衍生物的核酸,使用的第二种载体包括编码转录激活结构域 的核酸以及编码一种多肽的核酸,所述多肽可能与TCF7L2或者剪接变 异体或者其片段或者衍生物相互作用。在合适条件(例如,例如Clontech (Palo Alto,California,USA)的MatchmakerTM系统中使用的交配条件) 下孵育包含第一种和第二种载体的酵母,就可以鉴定表达感兴趣的标 记物的菌落。检查这些菌落可以鉴定与TCF7L2或者其片段或者衍生物 相互作用的多肽。这类多肽可以用作改变TCF7L2表达活性的药剂,如 与治疗方法相关方面所述。
在本发明上述检测法的不止一个实施方式中,可能需要将TCF7L2 基因,TCF7L2蛋白,TCF7L2结合剂(例如,Wnt信号途径或者钙粘 蛋白途径的其他成员),或者检测法中的其他组分固定到固相支持物 上,以便促进一种或者两种蛋白复合与非复合形式的分离,以及适应 检测自动化。在待测药剂存在或者不存在的条件下,待测药剂与蛋白 的结合,或者蛋白与结合剂的相互作用,可以在任何适于包含反应物 的容器中进行。这类容器的实例包括微量滴定板,试管和微量离心管。 在一个实施方式中,可以提供融合蛋白(例如,谷胱甘肽-S-转移酶融 合蛋白),其添加一个TCF7L2,TCF7L2蛋白或者TCF7L2结合剂结 合到基质或者其他固相支持物上的结构域。
在另一个实施方式中,采用一种方法鉴定本发明核酸分子的表达 调节物,其中包含TCF7L2的细胞,细胞裂解产物或者溶液与待测药剂 接触,然后检测细胞,细胞裂解产物或者溶液中相应mRNA或者多肽 (例如剪接变异体)的表达。待测药剂存在条件下相应mRNA或者多 肽的表达水平与待测药剂不存在条件下mRNA或者多肽的表达水平进 行比较。基于这种比较,待测药剂可以被鉴定为表达调节物。例如, 待测药剂存在条件下比其缺失条件下mRNA或者多肽的表达更高(统 计上显著的更高),则待测药剂被鉴定为mRNA或者多肽表达的激发 剂或者增强剂。此外,待测药剂存在条件下比其缺失条件下mRNA或 者多肽的表达更低(统计上显著的更低),则待测药剂被鉴定为mRNA 或者多肽表达的抑制剂。可以采用本文描述的检测mRNA或者多肽的 方法检测细胞中mRNA或者多肽的表达水平。
本发明还涉及利用上述筛选检测方法鉴定的新的药剂。因此,在 本文所述治疗方法中进一步使用本文所述鉴定的药剂也在本发明的范 围内。例如,通过将蛋白或者核酸(或者包括多肽或者核酸的细胞) 与本文所述鉴定的药剂接触,本文所述鉴定的药剂可用于改变TCF7L2 基因编码蛋白的活性,或者改变TCF7L2的表达。
本发明的核酸
TCF7L2核酸,部分和变异体
本发明还涉及包括人TCF7L2的分离的核酸分子。本发明的 TCF7L2核酸分子可以是RNA,例如,mRNA,或者DNA,例如cDNA 和基因组DNA。DNA分子可以是双链或者单链;单链RNA或者DNA 可以是编码或者正义链,或者非编码或者反义链。核酸分子可以包括 全部或者部分基因编码序列,还可以包括其他非编码序列,例如内含 子和非编码3′和5′序列(例如,包括调控序列)。
此外,本发明的核酸分子可以融合到标记物序列,例如,编码一 种多肽的序列,其帮助多肽的分离或者纯化。这类序列包括,但不限 于,编码谷胱甘肽-S-转移酶(GST)融合蛋白和编码流感血凝素A(HA) 多肽标记物的序列。
本文使用的“分离的”核酸分子,是指那些与,通常位于基因或 者核苷酸序列(如在基因组序列内)侧翼的核酸分离和/或已经完全或 者部分从其他转录序列纯化(例如,在RNA文库内)。例如,本发明 的分离核酸,相对于其天然产生的复杂细胞环境,或者当通过重组技 术产生时的培养基,或者当化学合成时化学前体或者其他化学制剂, 是基本上分离的。在有些情况下,分离的材料将成为组合物(例如, 包含其他物质的粗提物),缓冲系统或者试剂混合物的一部分。在其 他情况下,材料可以纯化到例如通过PAGE或者柱层析法例如HPLC 检测基本均一的。优选的,分离的核酸分子包括至少大约50,80或者 90%(摩尔比)的所有存在的高分子种类。就基因组DNA而言,术语 “分离的”还指与染色体分离的核酸分子,所述染色体与基因组DNA 是天然关联的。例如,分离核酸分子可以包含小于大约5kb但不限于 4kb,3kb,2kb,1kb,0.5kb或者0.1kb的核苷酸,其在细胞基因组DNA 内核酸分子的侧翼,所述细胞是核酸分子的来源。
核酸分子可以融合到其他编码或者调控序列,仍然被看作是分离 的。因此,包括在载体内的重组DNA属于本文使用的“分离的”定义。 此外,分离核酸分子包括异源宿主细胞内的重组DNA分子,以及溶液 中部分或者基本上纯化的DNA分子。“分离的”核酸分子还包括本发 明DNA分子的体内和体外RNA转录产物。分离的核酸分子可以包括 化学或者重组方法合成的核酸分子或者核酸序列。因此,包括在载体 内的重组DNA属于本文使用的“分离的”定义。此外,分离的核酸分 子包括异源生物内的重组DNA分子,以及溶液中部分或者基本上纯化 的DNA分子。本发明DNA分子的体内和体外RNA转录产物也包括在 “分离的”核酸序列中。这类分离核酸分子可用于编码多肽的制备, 作为分离同源序列(例如,来自其他哺乳动物种类)的探针,用于基 因作图(例如,通过与染色体的原位杂交),或者用于检测组织中基 因的表达(例如,人组织),例如通过Northern或者Southern印迹分 析。
本发明还涉及核酸分子,所述核酸分子不必在自然界被发现,但 其编码TCF7L2多肽,或者TCF7L2多肽的其他剪接变异体或者其多态 性变异体。因此,例如,本发明涉及包括一种不同于天然存在的核苷 酸序列的DNA分子,所述序列由于遗传密码的简并性,编码本发明的 TCF7L2多肽。本发明还包括编码部分(片段)或者编码变异体多肽的 核酸分子,所述变异体多肽例如TCF7L2多肽的类似物或者衍生物。这 类变异体可以是天然存在的,例如等位基因变异或者单核苷酸多态性, 或者非天然存在的,例如通过不同诱变剂和诱变处理进行诱导。预计 的变异包括,但不限于,一个或多个核苷酸的添加,缺失和取代,这 引起保守或者非保守氨基酸的改变,包括添加和缺失。优选的核苷酸 (和/或生成的氨基酸)改变是沉默或者保守的;即,它们不改变TCF7L2 多肽的特征或者活性。一方面,核酸序列是包括一种或者多种多态性 微卫星标记物的片段。另一方面,核苷酸序列是包括一种或者多种 TCF7L2基因单核苷酸多态性的片段。
本发明核酸分子的其他改变可以包括,例如,标记,甲基化,核 苷酸间修饰例如无电荷键(例如,膦酸甲酯,磷酸三酯,磷酸酰胺, 氨基甲酸酯),带电荷键(例如,硫代磷酸酯,二硫代磷酸酯),侧 基(例如,多肽),嵌入剂(例如,吖啶,补骨脂素),螯合剂,烷 化剂(alkylators),和修饰键(例如,alpha异头核酸)。合成分子也 被包括在内,所述合成分子模拟核酸分子通过氢键作用和其他化学相 互作用与指定序列结合的能力。这类分子包括,例如,那些分子骨架 上肽键代替磷酸酯键的分子。
本发明还涉及在高严谨性杂交条件下与本文所述核苷酸序列杂交 的核酸分子(例如,与编码多肽的核苷酸序列特定杂交的核酸分子, 该多肽是本文描述的或者具有上述多肽的活性),例如选择性杂交。 一方面,本发明包括本文所述的变异体,该变异体在高严谨性杂交条 件(例如,选择性杂交)下与编码氨基酸序列或者其多态性变异体的 核苷酸序列杂交。另一方面,在高严谨性杂交条件下杂交的变异体具 有TCF7L2多肽的活性。
这类核酸分子可以通过特异杂交(例如,在高严谨性条件下)进 行检测和/或分离。本文使用的“特异杂交”是指第一种核酸与第二种 核酸以某种方式杂交的能力,所述方式使第一种核酸不与第二种核酸 以外的所有核酸杂交(例如,当样品中第一种核酸与第二种核酸的相 似性比任意其他核酸都要高时,才进行杂交)。杂交的“严谨性条件” 是本领域的术语,是指孵育和洗涤条件,例如温度和缓冲液浓度条件, 允许特定核酸与第二种核酸的杂交;第一种核酸可以与第二种核酸完 全(即,100%)互补,或者第一种和第二种核酸的互补程度比完全互 补低(例如,70%,75%,85%,90%,95%)。例如,某些高严谨性 条件可以区分完全互补的核酸和互补性稍低的核酸。“高严谨性条 件”,“中等严谨性条件”和“低严谨性条件”,以及核酸杂交方法 阐述于Current Protocols in Molecular Biology的2.10.1-2.10.16页和 6.3.1-6.3.6页(Ausubel,F.等人,″Current Protocols in Molecular Biology″,John Wiley & Sons,(1998)),和Kraus,M.和Aaronson,S., Methods Enzymol,200:546-556(1991)。
通过比对序列用于最优的比较目的(例如,缺口可以导入至第一 个序列的序列用于最优比对),可以确定两种核苷酸或者氨基酸序列 同源性或者同一性的百分比。然后比较对应位置的核苷酸或者氨基酸, 两个序列之间的百分相同比是序列共有的相同位置的数目的函数(即, %同一性=相同位置的数目/位置的总数×100)。当一个序列中的一个 位置被另一个序列对应位置上相同的核苷酸或者氨基酸残基占据时, 则上述分子在该位置是同源的。本文使用的核酸或者氨基酸“同源性” 等同于核酸或者氨基酸“同一性”。某些情况下,用于比较目的而比 对的序列的长度至少是参照序列长度的30%,例如,至少40%,某些 情况下至少60%,和其他情况下至少70%,80%,90%或者95%。两个 序列的有效比较可以利用公知方法进行,例如,利用一种数学算法。 这类数学算法一个优选的、非限制性实例描述于Karlin等人,Proc. Natl.Acad.Sci USA 90:5873-5877(1993)。这种算法被整合到NBLAST 和XBLAST程序(2.0版本),描述于Altschul等人,Nucleic Acids Res. 25:389-3402(1997)。当使用BLAST和Gapped BLAST程序时,可以 使用相应程序(例如,NBLAST)的缺省参数。一种情况下,序列比较 的参数设为值=100,字长(W)=12,或者可以改变(例如,W=5或 W=20)。
用于序列比较的数学算法的另一个优选、非限制性实例是Myers 和Miller的算法,CABIOS 4(1):11-17(1988)。这种算法被整合到 ALIGN程序(2.0版本),属于GCG序列比对程序包的一部分(Accelrys, Cambridge,UK)。当利用ALIGN程序比较氨基酸序列时,可以使用 PAM 120权重残差表(weight residue table),间隙长度罚分(gap length penalty)12,和缺口罚分(gap penalty)4。其他用于序列分析的算法 是本领域公知的,包括Torellis和Robotti描述的ADVANCE和ADAM, Comput.Appl.Biosci.10:3-5(1994);以及Pearson和Lipman描述的 FASTA,Proc.Natl.Acad.Sci.USA 85:2444-8(1988)。
另一方面,两个氨基酸序列间的同一性百分比可以利用GCG程序 包中的GAP程序计算,使用BLOSUM63矩阵或者PAM250矩阵,缺 口权重(gap weight)为12、10、8、6或者4,长度权重(length weight) 为2、3或者4。另一方面,两个核酸序列间的同一性百分比可以利用 GCG程序包中的GAP程序计算,使用缺口权重(gap weight)50和长 度权重(length weight)3。
本发明还提供分离的核酸分子,所述核酸分子包含在高严谨性条 件下与TCF7L2核苷酸序列或者这种序列的互补序列杂交的片段或者 部分,还提供分离的核酸分子,所述核酸分子包含在高严谨性条件下 与编码氨基酸序列或者其多态性变异体的核苷酸序列杂交的片段或者 部分。本发明的核酸片段长度是至少大约15,优选的至少大约18,20, 23或者25个核苷酸,并且长度可以是30,40,50,100,200或者更 多个核苷酸。越长的片段,例如,长度是30或者更多个核苷酸,其编 码本文所述抗原多肽,对例如下文所述的抗体生产是非常有用的。
探针和引物
在相关方面,本发明的核酸片段用作例如本文所述检测法中的探 针或者引物。“探针”或者“引物”是以碱基特异方式与核酸分子互 补链杂交的寡聚核苷酸。这类探针和引物包括多肽核酸,如Nielsen等 人描述,Science 254:1497-1500(1991)。
探针或者引物包括与核酸分子的至少大约15个,例如大约20-25 个,和在一些情况下大约40、50或者75个连续核苷酸杂交的核苷酸 序列区域,所述核酸分子包括TCF7L2或者其多态性变异体的连续核苷 酸序列。在其他情况下,探针或者引物包括100个或者更少的核苷酸, 在一些情况下从6到50个核苷酸,例如从12到30个核苷酸。在其他 情况下,探针或者引物与连续核苷酸序列或者连续核苷酸序列的互补 序列至少有70%的相似性,例如至少80%同一性,在一些情况下至少 90%同一性,和在其他情况下至少95%同一性,或者甚至能够与连续核 苷酸序列或者连续核苷酸序列的互补序列选择性杂交。通常,探针或 者引物还包括标记物,例如,放射性同位素,荧光化合物,酶,或者 酶辅因子。
利用标准分子生物学技术和本文提供的序列信息,可以鉴定和分 离如上所述的本发明核酸分子。例如,根据TCF7L2或者该序列的互补 序列设计的,或者根据编码本文提供的一种或者多种氨基酸序列的核 苷酸序列设计的合成寡聚核苷酸引物,利用聚合酶链式反应扩增和分 离核酸分子。通产参见PCR Technology:Principles and Applications for DNA Amplification(ed.H.A.Erlich,Freeman Press,NY,NY,1992); PCR Protocols:A Guide to Methods and Applications(Eds.Innis等人, Academic Press,San Diego,CA,1990);Mattila等人,Nucl.Acids Res.19: 4967(1991);Eckert等人,PCR Methods and Applications 1:17(1991); PCR(eds.McPherson等人,IRL Press,Oxford);和美国专利4,683,202。 可以利用cDNA,mRNA或者基因组DNA作为模板扩增核酸分子,克 隆到合适载体,通过DNA序列分析进行表征。
其他合适的扩增方法包括连接酶链式反应(LCR)(参见Wu和 Wallace,Genomics 4:560(1989),Landegren等人,Science 241:1077 (1988),转录扩增(Kwoh等人,Proc.Natl.Acad.Sd.USA 86:1173 (1989)),和自主序列复制(Guatelli等人,Proc.Nat.Acad.Sd.USA 87: 1874(1990))和依赖核酸的序列扩增(NASBA)。后两个扩增方法涉 及基于等温转录的等温反应,产生的扩增产物为单链RNA(ssRNA) 和双链DNA(dsDNA),比例分别为大约30或者100比1。
扩增的DNA可以被标记,例如,放射性标记,并用作筛选cDNA 文库的探针,所述cDNA文库来自人细胞,在zap表达,ZIPLOX或者 其他合适载体中的mRNA。可以分离相应克隆,体内切割后获得DNA, 利用本领域公知的方法可以对克隆的插入物进行单向或者双向测序, 鉴定编码合适分子量多肽的正确读码框。例如,利用商品化供应的公 知方法可以对本发明核酸分子的核苷酸序列进行直接分析。参见,例 如,Sambrook等人,Molecular Cloning,A Laboratory Manual(2nd Ed., CSHP,New York 1989);Zyskind等人.,Recombinant DNA Laboratory Manual,(Acad.Press,1988))。此外,荧光方法也可用于分析核酸(Chen 等人,Genome Res.9,492(1999))和多肽。利用这些或者相似方法,多 肽和编码多肽的DNA可以被分离、测序和表征。
本发明的反义核酸分子可以根据TCF7L2核苷酸序列和/或互补序 列或者部分核苷酸序列设计,按照本领域公知的步骤,利用化学合成 和酶连接反应构建。例如,反义核酸分子(例如,反义寡聚核苷酸) 可以利用天然存在的核苷酸或者不同修饰的核苷酸化学合成,所述修 饰是为了提高分子的生物稳定性或者提高反义和正义核酸之间形成的 双链的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的 核苷酸。此外,反义核酸分子可以利用表达载体生物合成,在所述载 体中沿反义方向已经亚克隆了核酸分子(即,从插入的核酸分子转录 的RNA对于感兴趣的靶核酸是反义方向)。
核酸序列还可以用于与患者的内源DNA序列进行比较,以鉴定如 上所述的一种或者多种病症,并且可以用作探针,这样就可以从样品 中杂交和发现相关DNA序列或者排除已知序列。核酸序列还可以用于 产生遗传指纹法的引物,利用DNA免疫技术生产抗-多肽抗体,以及 作为抗原产生抗-DNA抗体或者激发免疫应答。本文鉴定的核苷酸序 列的部分或者片段(和对应的完整基因序列)可在许多方面应用,例 如多核苷酸试剂。例如,这些序列可用于:(i)在染色体上对它们各 自的基因作图;和,因此,定位与遗传疾病相关的基因区域;(ii)从 少量生物样品中鉴定个体(组织分型);和(iii)帮助生物样品的法医 鉴定。此外,本发明的核苷酸序列可用于鉴定和表达重组多肽,所述 重组多肽用于分析、表征或者治疗用途,或者作为组织标记物,其中 对应多肽组成性表达,在组织分化期间表达或者在患病状态下表达。 该核酸序列还可用作本文所述筛选和/或诊断方法中的试剂,还可以作 为本文所述筛选和/或诊断方法所用试剂盒(例如,试剂盒)的组分。
用于诊断方法的试剂盒(例如,reagent kits)包括在本文所述任意 方法中适用的组分,包括例如,本文描述的杂交探针或者引物(例如, 标记的探针或者引物),检测标记分子的试剂,限制性酶(例如,用 于RFLP分析),等位基因特异的寡聚核苷酸,与突变或者非突变(天 然)TCF7L2多肽结合的抗体,包括TCF7L2核酸或者TCF7L2的一部 分的核酸扩增工具,或者如本文描述的分析TCF7L2核酸或者分析 TCF7L2多肽氨基酸序列的核酸序列的工具,等等。一方面,诊断II 型糖尿病易感性的试剂盒可以包括用于扩增TCF7L2核酸内区域的引 物,所述区域包含在患有II型糖尿病或者II型糖尿病易感的个体频率 更高的标记物DG10S478,SNP rs12255372,rs895340,rs11196205, rs7901695,rs7903146,rs12243326和/或rs4506565,或者风险单倍型。 可以根据SNPs侧翼的核酸部分设计引物,所述SNPs指示II型糖尿病。
载体和宿主细胞
本发明的另一方面涉及包含本文所述核酸分子和其互补序列(或 者其一部分)的核酸构建体。该构建体包括载体(例如,表达载体), 其中本发明的序列已经按正义或者反义方向插入载体中。本文使用的 术语“载体”是指能够转运与其连接的另一种核酸分子的核酸分子。 一类载体是“质粒”,指可以连接其他DNA片段的环状双链DNA环。 另一类载体是病毒载体,其中其他DNA片段可以连接到病毒基因组中。 某些载体能够在它们被导入的宿主细胞中自主复制(例如,具有细菌 复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非 附加型哺乳动物载体)在导入宿主细胞时整合到宿主细胞的基因组中, 从而随宿主基因组进行复制。表达载体能够指导与它们可操作连接的 基因的表达。重组DNA技术中表达载体的应用通常是采取质粒形式。 但是,本发明预期包括这类其他形式的表达载体,例如具有等同功能 的病毒载体(例如,复制缺陷型逆转录病毒,腺病毒和腺相关病毒)。
在一些情况下,本发明的重组表达载体包括本发明的核酸分子, 所述核酸分子的形式适于宿主细胞中的核酸分子表达。这表明重组表 达载体包括一种或者多种调控序列,根据待用于表达的宿主细胞进行 选择,所述载体与待表达的核酸序列可操作的连接。在重组表达载体 内,“可操作的连接”或者“操作的连接”是指感兴趣的核苷酸序列 以某种方式连接到调控序列,该方式允许该核苷酸序列的表达(例如, 在体外转录/翻译系统或者当载体导入宿主细胞时在宿主细胞中)。术 语“调控序列”包括启动子,增强子和其他表达控制元件,(例如, 多腺苷酸化信号)。这类调控序列描述于,例如,Goeddel,″Gene Expression Technology″,Methods in Enzymology 185,Academic Press, San Diego,CA(1990)。调控序列包括那些在许多类型的宿主细胞中指 导核苷酸序列组成性表达和只在某些宿主细胞中指导核苷酸序列表达 (例如,组织-特异调控序列)的序列。本领域技术人员应了解表达载 体的设计取决于这类因素,如待转化宿主细胞的选择和所需的多肽表 达水平。本发明的表达载体可以导入宿主细胞从而产生本文所述核酸 分子编码的多肽,包括融合多肽。
本发明的重组表达载体可以设计成在原核或者真核细胞中表达本 发明的多肽,例如,细菌细胞例如E.coli,昆虫细胞(利用杆状病毒表 达载体),酵母细胞或者哺乳动物细胞。合适的宿主细胞还描述于 Goeddel,supra。此外,重组表达载体可以在体外转录和翻译,例如利 用T7启动子调控序列和T7聚合酶。
本发明的另一方面涉及被导入本发明重组表达载体的宿主细胞。 术语“宿主细胞”和“重组宿主细胞”是在本文中是可以互换使用的。 应了解这类术语不仅指特定个体细胞而且还指这类细胞的后代或者潜 在后代。由于突变或者环境影响后继世代可能存在某些修饰,这类后 代实际上可能不同于母细胞,但仍然包括在本文使用的该术语范围内。
宿主细胞可以是任意的原核或者真核细胞。例如,本发明的核酸 分子可在细菌细胞(例如,E.coli),昆虫细胞,酵母或者哺乳动物细 胞(例如中国仓鼠卵巢细胞(CHO)或者COS细胞)中表达。其他合 适的宿主细胞是本领域技术人员公知的。
载体DNA可以通过常规转化或者转染技术导入原核或者真核细 胞。本文使用的的术语“转化”和“转染”是指将外源核酸分子(例 如,DNA)导入宿主细胞的本领域已知的各种技术,包括磷酸钙或者 氯化钙共沉淀,DEAE-葡聚糖介导的转染,脂质体转染或者电穿孔。 转化或者转染宿主细胞的合适方法可参见Sambrook等人(supra)和其 他实验手册。
对于哺乳动物细胞的稳定转染,众所周知,依赖于使用的表达载 体和转染技术,只有小部分细胞可以将外源DNA整合到它们的基因组 中。为了鉴定和选择这些整合体,编码选择性标记物(例如,抗生素 抗性)的基因通常和感兴趣的基因一起导入宿主细胞。优选的选择标 记物包括那些产生抗药性的标记物,例如G418,潮霉素和氨甲蝶呤。 编码选择性标记物的核酸分子可以与本发明的核酸分子在相同载体上 导入宿主细胞,或者在单独载体上导入。稳定转染有导入的核酸分子 的细胞可通过药物选择鉴定(例如,整合选择性标志物基因的细胞存 活,而其他细胞死亡)。
本发明的宿主细胞,例如培养的原核或者真核宿主细胞可用于产 生(即,表达)本发明的多肽。因此,本发明还提供利用本发明的宿 主细胞产生多肽的方法。一方面,该方法包括在合适培养基中培养本 发明的宿主细胞(其中已经导入编码本发明多肽的重组表达载体)以 产生多肽。另一方面,该方法还包括从培养基或者宿主细胞分离多肽。
本发明的抗体
本发明还提供与一种形式的基因产物特异结合而不与另一种形式 的基因产物结合的多克隆抗体和/或单克隆抗体。本发明还提供与变异 体或者参照基因产物的一部分结合的抗体,所述变异体或者参照基因 产物包含多态性位点。本文使用的术语“抗体”是指免疫球蛋白分子 和免疫球蛋白分子的免疫活性部分,即,包含特异结合抗原的抗原结 合位点的分子。特异结合本发明多肽的分子是与该多肽或者其片段结 合,但基本上不与样品中其他分子结合的分子,所述样品,例如,天 然包含多肽的生物样品。免疫球蛋白分子免疫活性部分的实例包括 F(ab)和F(ab′)2片段,这可以通过用酶例如胃蛋白酶处理抗体产生。本 发明提供结合本发明多肽的多克隆和单克隆抗体。本文使用的术语“单 克隆抗体”或者“单克隆抗体组合物”,是指只包含一种抗原结合位 点的抗体分子集合,所述抗原结合位点能够与本发明多肽特定抗原表 位发生免疫反应。因此单克隆抗体组合物通常对与其发生免疫反应的 本发明特定多肽显示单一结合亲和力。
多克隆抗体可以如上所述制备,利用所需免疫原,例如,本发明 的多肽或者其片段,免疫合适个体。通过标准技术可以随时间监控免 疫个体中的抗体滴度,例如利用固定多肽的酶联免疫吸附(ELISA)。 如果需要,可以从哺乳动物(例如,从血液)分离针对多肽的抗体分 子,采用公知技术进一步纯化,例如蛋白A层析法以获得IgG级分。 在免疫后的合适时间,例如,当抗体滴度最高时,抗体产生细胞可以 从个体获得,并用于通过标准技术制备单克隆抗体,例如杂交瘤技术, 最初描述于Kohler和Milstein,Nature 256:495-497(1975),人B细胞杂 交瘤技术(Kozbor等人,Immunol.Today 4:72(1983)),EBV-杂交瘤 技术(Cole等人,Monoclonal Antibodies and Cancer Therapy,Alan R. Liss,1985,Inc.,pp.77-96)或者三源杂交瘤技术。产生杂交瘤的技术是 已知的(通常参见Current Protocols in Immunology(1994)Coligan等人., (eds.)John Wiley & Sons,Inc.,New York,NY)。概括的说,永生化细 胞系(通常是骨髓瘤)与淋巴细胞(通常是脾细胞)融合,所述淋巴 细胞来自上述免疫原免疫的哺乳动物,筛选所得杂交瘤细胞的培养上 清液,鉴定产生与本发明多肽结合的单克隆抗体的杂交瘤。
大量公知的用于融合淋巴细胞和永生化细胞系的实验规程均可用 于产生本发明多肽的单克隆抗体的目的(参见,例如,Current Protocols in Immunology,supra;Galfre等人,Nature 266:55052(1977);R.H. Kenneth,in Monoclonal Antibodies:A New Dimension In Biological Analyses,Plenum Publishing Corp.,New York,New York(1980);和 Lerner,YaIe J.Biol.Med.54:387-402(1981))。此外,普通技术人员应 了解还存在这类方法的许多变形,它们也是有用的。
制备分泌单克隆抗体的杂交瘤的另外一种方法,利用多肽筛选重 组组合免疫球蛋白文库(例如,抗体噬菌体展示文库)从而分离结合 多肽的免疫球蛋白库成员,可以鉴定本发明多肽的单克隆抗体。用于 产生和筛选噬菌体展示文库的试剂盒是商品化供应的(例如,the Pharmacia Recombinant Phage Antibody System,Catalog No 27-9400-01; 和the Stratagene SurfZAPTM Phage Display Kit,Catalog No 240612)。此 外,特别适用于产生和筛选抗体展示文库的方法和试剂的实例可见于, 例如,美国专利号5,223,409;PCT公开号WO 92/18619;PCT公开号 WO 91/17271;PCT公开号WO 92/20791;PCT公开号WO 92/15679; PCT公开号WO 93/01288;PCT公开号WO 92/01047;PCT公开号WO 92/09690;PCT公开号WO 90/02809;Fuchs等人,Bio/Technology 9: 1370-1372(1991);Hay等人,Hum.Antibod.Hybridomas 3:81-85(1992); Huse等人,Science 1Aβ:1275-1281(1989);和Griffiths等人,EMBO J. 12:725-734(1993)。
此外,利用标准重组DNA技术产生的重组抗体,例如嵌合和人源 化单克隆抗体,包括人和非人部分,也包括在本发明的范围内。这类 嵌合和人源化单克隆抗体可以通过本领域已知的重组DNA技术产生。
通常,本发明的抗体(例如,单克隆抗体)可用于通过标准技术 分离本发明的多肽,例如亲和层析法或者免疫沉淀法。多肽特定抗体 可以帮助从细胞中纯化天然多肽,以及对宿主细胞中表达的重组多肽 进行纯化。此外,对本发明多肽特异的抗体可用于检测多肽(例如, 在细胞裂解产物,细胞上清液或者组织样品中),以便计算多肽的表 达丰度和模式。抗体可以用于诊断用途,作为临床检测方法的一部分 来监控组织中的蛋白水平,例如,确定给定治疗方法的效果。抗体可 以偶联到可检测的物质以帮助其检测。可检测物质的实例包括各种酶, 辅基,荧光材料,发光材料,生物发光材料,和放射性物质。合适酶 的实例包括辣根过氧化酶,碱性磷酸酶,beta-半乳糖苷酶,或者乙酰 胆碱酯酶;合适辅基复合物的实例包括链亲和素/生物素和亲和素/生物 素;合适荧光材料的实例包括伞形酮,荧光素,异硫氰酸荧光素,若 丹明,二氯三嗪胺荧光素,丹磺酰氯或者藻红蛋白;发光材料的实例 包括鲁米诺;生物发光材料的实例包括荧光素酶,荧光素,和水母发 光蛋白,和合适放射性物质的实例包括125I,131I,35S或者3H。
现在通过下列例证解释本发明,其不应当在任一方面被认为是限 制性的。
实施例
此处描述的是利用10q基因座内密集的微卫星标记物,通过单点 关联分析,鉴定转录因子7-样2(TCF7L2-原先的TCF4)为导致患II 型糖尿病风险的基因。
方法
冰岛群组
冰岛数据保护机构(Data Protection Authority of Iceland)和冰岛 国家生物伦理委员会(National Bioethics Committee of Iceland)批准了 此项研究。所有研究参与者都签署了知情同意书。与血液样品、医学 信息和家系相关的所有个人身份资料首先由数据保护机构利用第三方 加密系统(18)(Data Protection Authority)加密。
为了这项研究,2400名II型糖尿病患者被鉴别,他们或者在冰岛 心脏协会(Icelandic Heart Association)过去30年的长期流行病学研究 中被诊断,或者在过去12年中在雷克雅未克(Reykjavik)的两家主要 医院中被诊断。这些患者中的三分之二存活,代表现在已知的大约一 半的冰岛II型糖尿病患者人群。为了这项研究,我们和这些患者中的 大多数进行接触,合作比例超过80%。这项研究的所有参与者都访问 了冰岛心脏协会,在那里他们回答了一份问卷,进行了抽血和空腹血 糖检测。问卷包括关于药物治疗和诊断时年龄的问题。这项研究中的 II型糖尿病患者按照我们先前发表的连锁研究(10)所述的进行诊断。 简单地说,II型糖尿病的诊断由医生根据先前的医疗记录,药物治疗 历史和/或新的实验室测量方法来确认。对于先前确诊的II型糖尿病患 者,使用口服降糖药的报告证实II型糖尿病。当前接受胰岛素治疗的 个体,如果他们也使用或者以前使用口服降糖药,则被划分为患有II 型糖尿病。在这个群组里,大多数接受药物治疗的患者服用口服降糖 药,只有少部分(9%)需要胰岛素。对于至今未能诊断的个体,II 型糖尿病和空腹血糖受损(IFG)的诊断基于美国糖尿病协会(American Diabetes Association)制定的标准(Expert Committee on the Diagnosis and Classification of Diabetes Mellitus 1997)。这项研究中II型糖尿病 患者的平均年龄是69.7岁。
重复群组
丹麦研究组选自丹麦的PERF(Prospective Epidemiological Risk Factors,预期流行病学危险因素)研究(19)。228位女性已经先前确 诊患有II型糖尿病和/或检测出>=7mM血糖。作为对照,539位未患病 (相对II型糖尿病)女性从相同研究群组中随机抽出。
美国的PENN CATH研究是1998年7月至2003年3月期间在宾 夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接 受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉 粥样硬化关联性的抽样研究(cross sectional study)。II型糖尿病定义 为具有以下病史,空腹血糖>126mg/dl,餐后2小时血糖>200mg/dl,40 岁以上个体中使用口服降血糖药或者胰岛素。宾夕法尼亚大学机构审 查委员会(University of Pennsylvania Institutional Review Board)批准 了研究计划,所有参与者都签署了知情同意书。通过自述进行种族划 分。361个白种人II型糖尿病病例来自这个群组。530位未患病(相对 II型糖尿病和心肌梗死)的白种人对照从相同研究群组中随机抽出。
用于基因分型的DNA是利用GenomiPhi Amplification试剂盒 (Amersham),从丹麦和美国II型糖尿病患者和对照的外周血分离的 DNA的全基因组扩增产物。
基因分型
在94个对照中利用串联重复发现软件(20)鉴定新的序列重复(即 二核苷酸、三核苷酸和四核苷酸重复),检测多态性。CEPH样品1347-02 (CEPH基因组库)低频等位基因碱基对的大小被从微卫星扩增子的大 小中减去,用作参照。利用直接DNA测序(Applied BioSystems)或 者Centaurus平台(Nanogen)进行SNP基因分型。
关联分析的统计方法
对于单一标记物与II型糖尿病的关联,我们使用似然比检验计算 各等位基因的两侧p-值。对于使用的微卫星,我们提供等位基因频率 而不是携带者频率。
我们采用乘法模型(16,17)计算相对危险度(RR)和人群归因 危险度(PAR)。对于CEPH白种人HapMap数据,我们利用D′(21) 和R2(22)的标准定义计算SNPs配对之间的LD。当对全部SNP组合 作图以说明特定区域中的LD结构,我们将D′绘制在左上角,p-值绘制 在右下角。在我们展示的LD图中,标记物绘制成等距的,而不是根据 它们的物理位置。
结果
基因座范围的关联研究
我们过去报道了在冰岛人群中染色体5q与II型糖尿病基因组范围 的显著连锁(10);在相同的研究中,我们还报道与10q和12q连锁 的指示性证据。为了对10q基因座进行研究,我们采用关联方法,利 用对应这个基因座跨越10.5Mb区域(NCBI Build 34: Chr10:114.2-124.7Mb)的高密度的基因分型的微卫星标记物。我们鉴 定和分型了228个微卫星标记物--即一个标记物的平均密度为46kb(表 1)。全部标记物都分型到1185位冰岛II型糖尿病患者和931位无关 的人群对照。
表1:人类基因组集合NCBI Build 34中染色体10上228个基因 分型的微卫星的位置。
鉴定与DG10S478相关的微卫星标记物的单一标记物关联分析(表 2和图1)。
表2:在冰岛DG10S478与II型糖尿病的关联
6个等位基因中观察到这种四核苷酸重复,等位基因0,8和12 占人群对照中染色体的98%。相对于其他组合的等位基因,等位基因0 显示保护性关联(相对危险度(RR)=0.67;P=2.1×10-9)。这个P-值是 两侧的,考虑了一些患者彼此具有亲缘关系。DG10S478位于10q25.2 上转录因子7-样2(TCF7L2-原先的TCF4)基因的内含子3中。这个 标记物在明确定义的74.9kb LD块内(基于CEPH白种人HapMap Phase II),包含内含子3的一部分、外显子4的全部和内含子4的一部分(图 1)。
当在CEPH白种人HapMap家族DG10S478被基因分型时,清楚 的观察到SNP rs12255372的等位基因G与DG10S478的等位基因0几 乎完全相关(r2=0.95,P=5.53×10-38),rs12255372的等位基因T与 DG10S478的其他等位基因相关。此外,DG10S478的等位基因8和12 造成的风险一致(P=0.3)。因此很自然将DG10S478的所有非0等位 基因合并成一个复合等位基因,称为等位基因X。等位基因X在对照和 患者中的频率分别是27.6%和36.4%。采用乘法模型(16,17),相对 非携带者的风险,带有的每拷贝的等位基因X预测RR为1.50。
与II型糖尿病关联的DG10S478的重复
为了验证DG10S478与II型糖尿病的关联,在228个病例的丹麦 II型糖尿病群组和539个对照中对微卫星进行基因分型。丹麦群组选自 丹麦的PERF(Prospective Epidemiological Risk Factors,预期流行病学 危险因素)研究(19)。这个女性II型糖尿病群组先前已经确诊患有 II型糖尿病。冰岛观察到的关联被重复(表3)。
表3:在丹麦DG10S478与II型糖尿病的关联
复合风险等位基因X在对照中频率为26.0%,在II型糖尿病中为 33.1%,得到的估计RR为1.41(P=0.0048)。
随后,在PENN CATH研究的包括美国白种人361个II型糖尿病 群组病例和530个对照的中对微卫星进行基因分型。这项研究是在宾 夕法尼亚大学医疗中心(University of Pennsylvania Medical Center)接 受心导管插入术的患者连续群组中进行的生化和遗传因素与冠状动脉 粥样硬化关联性的横断研究。II型糖尿病定义为具有以下病史,空腹血 糖>126mg/dl,餐后2小时血糖>200mg/dl,40岁以上个体中使用口服 降血糖药或者胰岛素。在冰岛人中观察到的关联在这个种群中也被重 复(表4)。
表4:在美国DG10S478与II型糖尿病的关联
复合风险等位基因X在对照中频率为25.3%,在II型糖尿病中为 38.5%,得到的估计RR为1.85(P=3.3×10-9)。利用Mantel-Haneszel 模型(NOTE 3),从全部3个群组得到的组合得到总的两侧P是4.7 ×10-18。
3个种群中复合风险等位基因与II型糖尿病的关联构成强有力证 据,表明TCF7L2基因变异体增加患II型糖尿病风险。
在毫无疑问的建立等位基因X与II型糖尿病的关联之后,我们更 细致的研究了遗传方式。显性模型和隐性模型可以被拒绝,因为杂合 体携带者相对非携带者风险显著升高(P<1×10-6),相对纯合子携带 者风险显著降低(P<0.0001)。乘法模型提供更好拟合,但有证据说明 纯合子携带者相对杂合体携带者的风险大于杂合体携带者相对于非携 带者的风险。表5提供杂合体携带者和纯合子携带者相对非携带者的 相对危险度的无模型估算。
表5:相对危险度的无模型估算
3个群组对风险等位基因具有相似的种群频率,但RR估值不同; 美国群组中效应最强,丹麦群组中效应最弱。尽管在群组中RR相同是 没有理由的,应当注意估算相对危险度的差异不需要没达到统计显著 性(P>0.05)。对采用常用相对危险度从群组得到的结果进行组合,, 杂合体携带者和纯合子携带者相对非携带者的相对危险度据估算分别 为1.45和2.41(表5)。假设风险等位基因的种群频率是26%,则杂 合体和纯合子的携带者分别占种群的38%和7%。因此,这种变异体对 于临床使用具有良好的预测价值。对应种群归属风险是21%,这从公 共卫生观点来看是实质性的。
还应注意到等位基因X在空腹血糖受损(IFG)个体(空腹血糖 在6.1和6.9mM之间)中过量。复合风险等位基因X在1393个对照中 频率为27.7%,在278个IFG病例中为37.1%,得到估算的RR为1.54 (P=1.36×10-5)。
TCF7L2外显子4LD块内SNP标记物与II型糖尿病的关联
我们在表6中列出位于TCF7L2外显子4LD块内的微卫星和SNP 标记物。该表包括公布的SNPs,以及通过对整个LD块区域测序发现 的SNPs。该表还提供位于所述块内的多态性微卫星标记物。
表6.位于TCF7L2外显子4LD块内的多态性标记物(在标记物 rs4074720和rs7087006之间,定位在Build 34坐标:rs4074720(B34: 114413084)-rs7087006(B34:114488013)=74929bp。对序列识别索引进 行合适的标记,涉及各种情况下包括多态性的扩增引物和正反向引物 的SEQ ID号,如序列表所示。
A公共SNPs(包括全部HapMap种族)
B.发现的新SNPs,随后在TCF7L2外显子4LD块内验证(扩增 引物如下):
C.TCF7L2外显子4LD块内的多态性微卫星(扩增引物如下):
表7.TCF7L2外显子4LD块内选择性标记物的扩增引物和引物
>DG10S478
TTCAGGCCATTGGTGTTGTATATATTTCAAGATTTGCTCACAGGTCCAAAGCT
TAACTTAAGCTCCCTGAGACATATCATAAAATATGATTTGGGGAAAAACCCT
AATGGGCCATGATCAGAACATTATTATTCAACAAAGGATGAAATGCTTAAGC
CAAGATGGCCTTCTTTCTTTCTTTCTTTCTTTCTTTTTTTTTAATGAAAGTTGA
GCAGACTCCCGTCCAACAGTTTTCAATGTAGGAATTCCCACAGCCCCATTTG
ATTGCAGTTTGTTGAAAAGTTTAATGTTTTTGTAGGCAATTCATAATTTCCAC
ATTGAACAGCCTGAGAGGAAGAGAGCTGGAGCCCACTGTTGTTTTTGTAGTG
GGATGGTGGGAACTTT(SEQ ID NO:2)
引物:
F:TTCAGGCCATTGGTGTTGTA(SEQ ID NO:3)
R:AAAGTTCCCACCATCCCACT(SEQ ID NO:4)
>rs12255372
TTGTCCCTTGAGGTGTACTGGAAACTAAGGCGTGAGGGACTCATAGGGGT
CTGGCTTGGAAAGTGTATTGCTATGTCCAGTTTACACATAAGGATGTGCA
AATCCAGCAGGTTAGCTGAGCTGCCCAGGAATATCCAGGCAAGAAT
K
ACCATATTCTGATAATTACTCAGGCCTCTGCCTCATCTCCGCTGCCCCCC
CGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATGCCAA
ATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT
TCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA
ACAACATCGACCCATT(SEQ ID NO:5)
引物:
F:TTGTCCCTTGAGGTGTACTGG(SEQ ID NO:6)
R:AATGGGTCGATGTTGTTGAG(SEQ ID NO:7)
>rs12243326
GCTGTGAAATCCCCTGTGTAGTGGGAAGAAGAAATAGCAAATCTTAGCTGC
CTTGGACCTGATATAATTATTTGTCTTCATTTACATGGTT
Y
ATCCTTCAAGGTTGAATAAATGATGTGGGAGCTAGTCAAGGGGCTTTAGGTA
TGTGATTTCATGCCTACTTTTTTTTAGGTAGAGAAACTGAGGTCACAGGGTA
CTAGAGAATGGACTCTAAGATTCAGGTTTCTGAATTGCCTGTGGTTTTGTTG
ACTCAACTGCTCTTCTGTTGTTTTTTAGCCACATGCCTTGAAACAGTCCTCTT
TCCCATGTTTCTTCATCAGCACCATTAACCCAAGGTATACTGTCCTCTCTTAT
CTTTCACAAGGTCTTGGAGTTCCCATGCCTTTGTAAGCATCCCTCCCCGAGAT
TCAGCACCAACCAAAATCACATTTGGAAAAATTGCTTGTTTCCCAAGAAGCT
TTGGAGGATATGATTTTGTATAGAACGGGTTCACAGGTTTTCTGTTCATTCTT
CTATGGTGGAGTGTGTGTGTATGTGACTCTGTCTTCTCTCCATTCC(SEQ ID
NO:8)
引物:
F:GCTGTGAAATCCCCTGTGTAG(SEQ ID NO:9)
R:GGAATGGAGAGAAGACAGAGTCA(SEQ ID NO:10)
>rs7903146
AAGGGAGAAAGCAGGATTGAGCAGGGGGAGCCGTCAGATGGTAATGCAGA
TGTGATGAGATCTCTGCCGGACCAAAGAGAAGATTCCTTTTTAAATGGTGAC
AAATTCATGGGCTTTCTCTGCCTCAAAACCTAGCACAGCTGTTATTTACTGA
ACAATTAGAGAGCTAAGCACTTTTTAGATA
Y
TATATAATTTAATTGCCGTATGAGGCACCCTTAGTTTTCAGACGAGAAACCA
CAGTTACAGGGAAGGCAAGTAACTTAGTCAATGTCAGATAACTAGGAAAAG
GTTAGAGGGGCCCTGGACACAGGCCTGTGTGACTGAGAAGCTTGGGCACTTC
ACTGCTACATTTCATCTCTTCGCT(SEQ ID NO:11)
引物:
F:AAGGGAGAAAGCAGGATTGA(SEQID NO:12)
R:AGCGAAGAGATGAAATGTAGCA(SEQ ID NO:13)
>rs4506565
CTGATGAGGGTAGGGAGCATCTGTCTGCAGCTTCATCTTCATTGTCTAGGGG
CTCCAGAAATATCTGTGAGTAAATAAGTTATTTAATCTTTGCCTCAAATTTCC
AGTGACTGTAGGGATATAGCTGTGAGCCTCTAGGAGCTGAGATTTTTTAAAT
TTCCCACTTAAACATTTATTTAAAAATTTTGTGCTCAGCATGG
ACTAAGGACTTTACATTCATTAACTCATTTACAGCTTGATCCTATGCGGT
GGGCATTCATTTACAGAGGATCCCATTTTACAGGTGAGGAAGAGGCCAGC
TAGGGGTGCAGCCTAGGTTAGTATTCTAGAGCTCATCAGGCTGTGTTGTC
XCAGTGAAAGAATAAGCAAAGAAGTGAATGTTGTGCATTGAGAAAAATG
ACTCTCGGAGGAGGATGAGCCTCTCGGATATGGCGACCGAAGTGAT
W
TGGGGCCCTTGTCAAGGGTCTCTATTATGGCATCAAGAAAAGATGCTGCT
TTCGGTGATGCCCGAGGAGAGCCTCAATATTTTACATGGGAAACCTAAAA
AAGGGGCCATGTTGTGGTCTCTGCACCTAAGA(SEQ ID NO:14)
引物:
F:CTGATGAGGGTAGGGAGCA(SEQ ID NO:15)
R:TCTTAGGTGCAGAGACCACAAC(SEQ ID NO:16)
>rs7901695
TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT
CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT
TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT
TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT
TTCATATAAATGGTATCATAAAATCTA
Y
GGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACGGTTCTCAAGGTTCATCC
AGTATTGTAGCATCTATCAGTATGTCATTCCTTTTTATGGCCAAATAATATTT
TATTGTATGGATAGACATTTTGTTTATTCATTTATCTGTTTTTGGTTATTATGA
GTAACACTACTATGAACATTTTGCACAAATTTTTGTATTGACATGTTTTCATT
TCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG(SEQ ID NO:17)
引物:
F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:18)
R:CCAGCAATTCCACTCATAGGAC(SEQ ID NO:19)
>rs11196205
TTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCCTGTGATGATCATCTTTGTG
TGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTTATTATTTTCTTGGGATAGA
CCCCAGGACAAAAGGTAGAAAAGAACAAAGTGTTAAAAAATTTCTTGATAC
ATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTATAACTAC
S
AGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCTGGGGAAT
TTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGACATGCCCTTA
ACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAGTCAGCCTCCC
CAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTTGAATAATT
GGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:20)
引物:
F:TTGTCTCCTTTTGTTTCTGCTAC(SEQ ID NO:21)
R:AACATCTGACCTTGAAGCCTAC(SEQ ID NO:22)
>rs7895340
TCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTCTAATGC
AGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACAAATATA
CAGAGATTTTTTTTTTAAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAA
A
R
TGAAGAAGCCTGTTTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCC
AGGCTTTGAAATTTATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCA
CATTTATTTTTTAGCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTG
TTCTCTCTCTTTGA(SEQ ID NO:23)
引物:
F:TCAGGGACAGTGCATAGGTG(SEQ ID NO:24)
R:TCAAAGAGAGAGAACAACGAAGA(SEQ ID NO:25)
>SG10S405
TATTTAGAAACCATAAAATCCACCTATTTGAGGTGTACAATTGAGTGATTTT
CTGTATAGTCACAGATCTGTGCAGTCATCCACACCCTCTAACTCCAGGACAT
TTTCCTCACCCCCGAGGAGAAACCTCCCTTACCCATTAGCAGTCACTCCTCAT
TTCCTCTCCCCCCAGCCCCTGGCAATCACTGTGGATTTGCCTGTTCTTGACAT
TTCATATAAA
Y
GGTATCATAAAATCTATGGGCTTTTGTGTCTGTCTGCTTTCACTTAGCATACG
GTTCTCAAGGTTCATCCAGTATTGTAGCATCTATCAGTATGTCATTCCTTTTT
ATGGCCAAATAATATTTTATTGTATGGATAGACATTTTGTTTATTCATTTATC
TGTTTTTGGTTATTATGAGTAACACTACTATGAACATTTTGCACAAATTTTTG
TATTGACATGTTTTCATTTCTCCTGGGTATAGTCCTATGAGTGGAATTGCTGG
GTCATATAATAAATAACTGTTTAACATTTTGGGGAGCTGCCAAACTTTTAAA
ACCTTGGGTTCTGTGATGTACCAGTTGTGTTAGGCA(SEQ ID NO:26)
引物:
F:TATTTAGAAACCATAAAATCCACCTAT(SEQ ID NO:27)
R:TGCCTAACACAACTGGTACATC(SEQ IDNO:28)
>SG10S428
TGCCAGGGGTTTTATGGTTAATTTTCCTCCATTATGAGGGTTGACTCAGCCTT
GGGTATTAGATGTCTTTGAGAATCCAGGGTTCAAATACCACAGCTGGTAGAA
TGTTTCTCAACTTGGAGCCAATCTCCATCTACTGAAGGTACGCTGGTTTAGA
CAGACAACAGGGACATCAGCATTTTAAAAAGCGGTGGAAAAAGTTTGCTTG
TCTTGATTGGAGCCATGACATTTTATTTTGAAATTTCAAATAACATGAAGGG
AGGTTTGGAGCGGTTTTTGGTTTATCCAAAGGGCAGTGGATTGAAGGCTGAG
AAACACCAGGCTGAATGGGAGAGGGGTTGGGGTCCCCCTGTGAGATAGTGA
AACAATGGTAGTGCCATCCAATGATAGGCACTTTTCTGTCATTCAGAAGCAG
AAAGGGGGCCAGAGGCCCATTGGCCTTACTGGG
M
AGTAAGCTGTAGAGCTGCTGCCTTTTCGTGAAAGGGTTGACACCAACCTTCT
CCCCCAGGAAGAGTGACCAGGGACCTGAGGGGCATGGTCGAGCAGATGACA
GCCTTTGTAAAACATCTCC(SEQ ID NO:29)
引物:
F:TGCCAGGGGTTTTATGGTTA(SEQ ID NO:30)
R:GGAGATGTTTTACAAAGGCTGTC(SEQ ID NO:31)
>SG10S422
TTGGTAGAGATGGGGTCTCCTAGGCTGGTCTTGAACTCCTGG
R
CTCAAGCAATCTTCCTGCCTCAGCCTTCCAAAGTACTGGGATTACTGGCGTG
GGCCACCATGCCTGGCTTGAAATTTTTCTATGGCTTTATTCTTTCTCCAAGTA
CAGAGTCTACCCAACCTTCTGAGATCTTTGGTTTTCTTTTCCTAGGTAACTAT
AGTACATACTTATTTATGTTAAACAACAGCAATCACACATTTCTTTTTCTATA
CAGTCATGCTTTATAGGCAAATAAAGCCTCCGTCTTAGGCTTTCTGGATTTTT
TCAAAAGATGCAATTCCTGGAGTATGTTTTTACTTAGAGCAAAGCAGCCTAG
TCTCCTATACCTTCTGCATCTGCAGAAAAGTTGGTTAAACAGACTTTGTAAT
GATGCCCCTTACAATTCTGAAGGGACTTGTGAAATAGTTTCACAGAGTTTCA
GTGTTAGGTATATTTGATCAATGCTAACTTTTGGAAAACTTTGGTGCCTGTAT
GATTCAGAGGGTAGGGCAGAATATTAA
ATTAATCACAACTTCTTGTATTTTAACCATTCTGGGTAAATTGGGATTCC
GTGACGCCCAGGCAAAATTAT(SEQ ID NO:32)
引物:
F:TTGGTAGAGATGGGGTCTCC(SEQ ID NO:33)
R:ATAATTTTGCCTGGGCGTCA(SEQ ID NO:34)
>SG10S427
TATCTTATATCCCCTCCAAGCATTCATTAACTGATGGATTAGTGAGTTGG
XTTGAGAAGCATAAAGGCTCGTCTCCATGTGCTTCTAAGCATTGTGTCT
AAGTTCTGTTTGGTTTCCTGAGTGAAACTGTCTTAATGTTACCAACAGAAGTT
AAATGCCTAAGAG
W
TTCTTATACATGGGCTGAGTACCTCTGTGACTGGGCAAGCCACCTCACCTCA
TTTTACCTTGTCTGCAAAATGAGGAACTGGGTCAACTCATCGTTCAAATCTC
ACTGAAAGCTAATTGATCGCTTTTGACAGAAGTAGCTCCCTTGGGCCGTATA
TTTATTTCCTAGCTTGGAGGAAGGTGGGGACAGACAGAATTGATGTACACCT
TTATTTTTATCTCTATGGTAAACCTGTGCATACTAAAGCATTCCTCTGGTCTT
TTGAGATGAGTGTATACATTGTGTCTGGCCCTGTGCATTTTTTACCAAGAAGT
AAGTTTTGTTGAGTAAACTTGGGTTGTATGAAGAACTGCATGCTCACCGTAC
TCAAGTAGCTTTTGCTACCTAAAGGACAGCTGCTCATATGTACTTGACTTCCT
TTAAAGTGAAGGATGATGACATTTGAAAAACGGAGGTTGAAAAGGAG(SEQ
ID NO:35)
引物:
F:TATCTTATATCCCCTCCAAGCATTC(SEQ ID NO:36)
R:CTCCTTTTCAACCTCCGTTTT(SEQ ID NO:37)
>SG10S408
TTGAGCATGTGTTATTTAATGAGTTATACCTCTGTCATATGTGTGTGTTTATA
TCACAAAATAACTTATTTTTATAAAACCATATTTTGAGTCATCATTTGTGACA
ATGTCTTCTTTTCTCTGGTATAAATGAGGCATGTAGAAAGAAGATTGACATT
TGCTAGAAGCTTCCCCTTTCCTCTAACTCCACAATAAAATGGATGCTCATAA
TTACATCTGCTCCTATAAGGTCAAGATTTCAGGGCTGGAAGTGACCTTAGAT
CATTTAGGCCCAACTTGCCCTCAGGAAAGGAAACTGAGGCCCAGAGATGCC
TTAAGTGAATTGCCCAATGTCACACGCTGAGTCAGTGGCCAGAGCAAGGCTT
GGATCCAGTTCTCTGCTCCCTTTCCAGAGCCTTGTGATGTCTTCTCTCCTACA
GGAGGTGAAAATAACTGCTGTGGCTGGTTCTGTTTTGCTGACTGTAAATTGG
GTCATGGTCAGGGACAGTGCATAGGTGTAAAGAAGTTGCTGGTTGGGGGTTC
TAATGCAGGTTTCTCCAAAAGTGAATGCCCTGTTAAAAAAAAATTCTTAACA
AATATACAGAGATTTTTTTTT
W
AAAAAAGTGTGACAGTTCTAGACACCTAGAGAGTAAAGTGAAGAAGCCTGT
TTTCAGGTTTCCCGCCTCCCTGAATTTCCCAGCATGGTCCAGGCTTTGAAATT
TATTTATCTGCTTTTGGCAATGGTTGATGGGAATTTCCCACATTTATTTTTTA
GCTACAGAGAAAGGACATTATCTTTAAAATCTCTTCGTTGTTCTCTCTCTTTG
AGTGAGGAGAGAAGATGTGAATCCTGGCAGTGGTTCAGAGTGGACACAGCC
CCTGTGTTTGTGGCATAGGCTCTGTGGGCCCCATGCCAGGGAGCAGTACCCC
CGTGTAAAGGAGTGGGGGTTTGTCCATTTGGATAGAGCAAAGATCCTCCACC
TCAAATCCCACAAGAACAGTTGCCACAACCTGGGCCCTAAGCATCTCATTTT
CCTATGTAGAAATTAATGATCTGGAGGAGATGGCAAAACATTCCTTCCAGAG
CCTGTGTGGATTTTGG(SEQ ID NO:38)
引物:
F:TTGAGCATGTGTTATTTAATGAGTTA(SEQ ID NO:39)
R:CCAAAATCCACACAGGCTCT(SEQ ID NO:40)
>SG10S409
TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT
AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG
ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATG
ICATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAA
TGATCCTGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCC
TCCCCTTTTATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGA
ACAAAGTGTTAAA
M
AATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCTCAACATTTAT
AACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTTAATGTCTCT
GGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGAGA
CATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG
TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTC
TTGAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:41)
引物:
F:TAGTGCTCAGTATTTCCAACGTTCT(SEQID NO:42)
R:AACATCTGACCTTGAAGCCTACC(SEQ IDNO:43)
>SG10S406
TAGTGCTCAGTATTTCCAACGTTCTGTTTATTTAAGATGAAAATTGCTGT
AGTTAATAAGCACTTCCCCATGTCATTAAAATGCTTAAGGATTTTTAATG
ACCACATAACAGTCCATAATATGATTAAACCCCAATTTACTGAATCAATGCC
ATATTGTTGGGTCTTTAGATTGTCTCCTTTTGTTTCTGCTACTGTGAATGATCC
TGTGATGATCATCTTTGTGTGTAAATCTTTGTCCCCTCGCCCCCTCCCCTTTT
ATTATTTTCTTGGGATAGACCCCAGGACAAAAGGTAGAAAAGAACAAAGTG
TTAAAAAATTTCTTGATACATAGCCACAGATTATTTTCCTGAAAGTTCT
S
AACATTTATAACTACGAGCAGTATGTAAGAGAGTTATGGTTGGAATGATTTT
AATGTCTCTGGGGAATTTAACAACAAAAAAACTTTAGGCTTCTTTGGAGAGA
GACATGCCCTTAACTCCACCCCGCCCTAGAACAGAGACCCAGCCCATCCAAG
TCAGCCTCCCCAGGTCCTCCACCTTCAAAACAGGCAAACGAAATCATTTCTT
GAATAATTGGTAGGCTTCAAGGTCAGATGTT(SEQ ID NO:44)
引物:
F:TAGTGCTCAGTATTTCCAACGTTCT(SEQID NO:42)
R:AACATCTGACCTTGAAGCCTACC(SEQ ID NO:43)
>SG10S407
TGCTATGTCCAGTTTACACATAAGGATGTGCAAATCCAGCAGGTTAGCTGAG
CTGCCCAGGAATATCCAGGCAAGAATGACCATATTCTGATAATTACTCAGGC
CTCTGCCTCATCTCCGCTG
S
CCCCCCGCCCCCTGACTCTCTTCTGAGTGCCAGATTCAGCCTCCATTTGAATG
CCAAATAGACAGGAAATTAGCATGCCCAGAATCCACGTCTTTAGTGCACTCT
CTCCCCAGCTCCAAACCTGTTACTGCTTGTGTTCAACATCTCAGTAAAGCTCA
ACAACATCGACCCATTACTTAGGCCTCAAACCTTGGGTGGCATCGTCGATTG
CTCTTTTCTTTCATACCCCACATTCAACCCATCAGCCCATCCCACAGGCCCAA
GTGTGTCCTCTCTACCTTCAAAGCGTGTGTGGCATCCACCGCTTATCACCACC
TCTGCCATTACCACTGGAGTCCAGTGCCATCATC
TCTCACTTGGATGTGGCCAGAGTGTCTTTGCTGGTCTCCTTCTTGCTTCC
TACCTTTGTAACAGCCTATCATCTATCTCTGGTCTCCATAGCTCACTCCC
ATACTTTGAGAGGGCCTTTGAAAGCCTTAGACAGATCATATCACAGACCT
CTATACTGAAAGTCGGG(SEQ ID NO:45)
引物:
F:TGCTATGTCCAGTTTACACATAAGG(SEQ ID NO:46)
R:CCCGACTTTCAGTATAGAGGTCTG(SEQ ID NO:47)
>DG10S2164
CCATCTGTGGAGCAGAGTCACTGAAAGGAAATACTGGAAATACTGGAAGC
CACTTGGTGTTTTATCAAGGATGTGAGGTTTCCTGGCAACTTTGTCGCCA
TATCATCATCATCATCACCATCATCATCATCATCATCATCATCATCATCA
TCATCATCATCATCATCTGCCCTTTAAGTTTTCTGCTTGTTTAGAAAAGA
AATTTATACAGAGCCCCCAGTAGCAGCTGTAAGGGGGCAGGTTCTTGGAG
CAGCCCATCCTCAACATTCTTGCTGCTGATGGAA(SEQ ID NO:48)
引物:
F:CCATCTGTGGAGCAGAGTCA(SEQ ID NO:49)
R:TTCCATCAGCAGCAAGAATG(SEQ ID NO:50)
>DG10S479
TCCACGCAGAGAGGATCTAAATCTGGCTCTTTGCAATTGCCTTCATACAT
GTGCATACACACCACACACACACACACACACACACACACACACACACACA
CAGACACATACATATGCACACACCCCGACTCAATGGAGGACCCTC(SEQ ID NO:51)
引物:
F:TCCACGCAGAGAGGATCTAAA(SEQ ID NO:52)
R:GAGGGTCCTCCATTGAGTCG(SEQ ID NO:53)
为了进一步研究TCF7L2外显子4LD块内其他标记等位基因比等 位基因X显示更高的与II型糖尿病相关性的可能性,我们使用HapMap CEU样品中产生的DG10S478基因型数据。HapMap Phase I中与 DG10S478具有最强相关性的5个SNPs,按照递减顺序,是rs12255372 (r2=0.95),rs7903146(r2=0.78),rs7901695(r2=0.61),rs11196205(r2= 0.43),和rs7895340(r2=0.42)。我们将这5个SNPs在3个群组中进行 基因分型,5个SNPs和DG10S478的相关性与在CEU样品中观察到的 非常类似,DG10S478用作双等位基因标记物。全部5个SNPs显示与 II型糖尿病的关联。尽管一些SNPs在一个或者两个群组中显示稍微更 高的估算相对危险度和较低的p-值,当来自3个群组的结果利用 Mantel-Haenszel模型组合时,没有SNP比DG10S478显示更强的与II 型糖尿病的关联。但是,尽管相对等位基因X(RR=1.56,P=4.7×10-18), rs11196205和rs7895340与II型糖尿病的关联明显较弱,但rs12255372 的等位基因T(RR=1.52,p=2.5×10-16)和rs7903146的等位基因T (RR=1.54,p=2.1×10-17)与II型糖尿病关联的强度是相似的。
在2005年10月公开了HapMap Phase II之后,鉴定了两个其他的 SNPs,显示与微卫星DG10S478的强相关-rs12243326(r2=0.961)和 rs4506565(r2=0.716)。与II型糖尿病易感性相关的等位基因对 rs12243326来说是C(C/T SNP),和对rs4506565来说是T(A/T SNP)。
应当注意在那些载有rs7903146C等位基因的单倍型中间,那些载 有rs10885406A等位基因的单倍型相对那些载有rs10885406G等位基 因的单倍型的估算相对危险度是1.06,但该差异在统计上没有显著意 义(P=0.22)。
为了重复和改进II型糖尿病的这种关联,我们在一个大的追加丹 麦群组和一个遗传多样性更高的西非群组中对DG10S478,rs12255372 和rs7903146进行基因分型,所述丹麦群组由1111个病例和2315个对 照组成,所述西非群组由来自非裔美国人糖尿病研究的618个病例和 434个对照组成(23)。在丹麦人中,全部3个变异体都是与疾病风险 强相关的,和先前在冰岛观察到的一致。但是,rs7903146等位基因T 的关联(相对危险度=1.53,P=4.06×10-14,PAR=24.4%)显著的高于 其他两种变异体提供的关联。在西非研究组中,在对亲缘关系和种族 起源进行校正后,我们重复了rs7903146的等位基因T与II型糖尿病 的关联(相对危险度=1.45,95%C.I.=1.20-1.76,P=0.000146, PAR=22.2%),但另两种变异体不适用该情况。这表明rs7903146的等 位基因T或者其自身是风险变异体或者,或者是未知风险变异体的最 接近的已知相关物。西非组中标记物DG10S478和rs12255372被排除 为风险标记物是可能的,因为与欧洲祖先的种群不同,欧洲人中 rs7903146的T等位基因几乎只存在于同时载有DG10S478的等位基因 X和rs12255372的等位基因T的染色体上,在西非人中rs7903146的T 等位基因与DG10S478和rs12255372的两个等位基因同时存在。这与 观察到的一致,即T是rs7903146的祖先等位基因,而DG10S478的等 位基因X和rs12255372的等位基因T都不同于黑猩猩参照序列。一般 来说,这种发现也与预期相对多样性的种群,例如西非的种群,提供 了与在同质性更高的种群中强连锁不平衡区域发现的关联信号的改进 (refine)的关联性一致。
讨论
在这项研究中我们描述了一个新的II型糖尿病候选基因的鉴定, 所述基因位于先前报道的10q连锁区域内(10),编码10q25.2上的转 录因子7-样2(TCF7L2-原先的TCF4)。我们表明它在冰岛,丹麦和 美国以相似的频率和相对危险度造成II型糖尿病风险。当变异体不能 解释II型糖尿病家庭聚集性的实质部分时,从公共卫生观点来看,至 少为20%的种群归因风险是显著的。相对于非携带者,风险复合等位 基因的杂合体携带者(大约占种群的38%)和纯合子携带者(大约占 种群的7%)的相对危险度分别是1.45和2.41。因此,这种变异体对于 临床使用具有良好的预测价值。
我们报告了作为II型糖尿病相关微卫星的变异体,DG10S478,位 于TCF7L2基因的第三个内含子内。TCF7L2基因产物是一种包含高迁 移率族(HMG)盒的转录因子,在Wnt信号途径中起作用。这个途 径被认为是一个关键的细胞发育和生长的调节机制;它被称为Wnts的 分泌糖蛋白调节,在结合关连受体复合物时Wnts启动靶细胞内许多信 号级联反应,Wnts由Frizzled家族的成员和LDL受体家族的成员Lrp5/6 组成(24)。Wnt信号从降解复合物中分离在这个途径中主要成员β- 连环蛋白,将其转移到细胞核,在细胞核中它短暂的将TCF因子从阻 遏剂转化成翻译激活剂(25)。通过结合钙粘蛋白,β-连环蛋白对调 节细胞粘着也是非常重要的。
TCF7L2的NCBI RefSeq包括14个外显子。但是,Duval等人(26) 显示TCF7L2具有17个外显子,其中5个是选择性的;此外,还有报 导称3个选择性剪接受体位点被使用。这项研究还证明了位于TCF7L2 基因3′端的3个连续外显子的选择性使用,这改变了最后一个外显子中 使用的读码框,导致大量短的、中等长度的或者长的COOH-末端的合 成。
与TCF7L2类似,罕见的Mendelian型II型糖尿病即青年发病的 成人型糖尿病(MODY)的6个定位克隆基因中的5个,是转录因子 (27)。其他的转录因子也与II型糖尿病的发病有关,包括过氧物酶 体增殖物激活受体gamma(PPARγ)(7)和叉头基因家族(28,29)。 Noble等人描述了I型糖尿病相关TCF7基因中的一个错义突变 (C883A)(30)。但是,还不清楚TCF7和TCF7L2是否采用相同途 径对糖尿病的发病起作用。
已经有TCF7L2基因突变的报道,包括在(A)9编码重复(外显 子17)的A缺失(26,31-33)和结肠直肠细胞系中的大量突变(26)。 DG10S478位于明确定义的74.9kb LD块(CEPH Caucasian HapMap Phase II),包含外显子4和该外显子5′和3′端的侧翼内含子序列。有 可能DG10S478自身就是成因变异体;还有可能DG10S478是基础变异 体的替代物,所述基础变异体影响转录、剪接或者信息的稳定性。这 类变异体可能与DG10S478存在强连锁不平衡(LD),即变异体位于 TCF7L2外显子4LD块内。
多个证据表明这种基因在II型糖尿病发病中的肠内分泌功能。首 先,已知TCF7L2和结肠直肠癌的进展有关(54),致癌TCF/β-连环 蛋白复合物的小分子拮抗剂也已经被报道(35)。此外,出生后24小 时内死亡的TCF7L2-/-小鼠,缺乏肠上皮干细胞小室(36)。TCF7L2 基因的变异体可以通过改变促胰岛素激素类胰高血糖素肽1(GLP-1) 的水平影响II型糖尿病易感性,所述类胰高血糖素肽1是胰高血糖素 原基因编码的肽,所述高血糖素原基因在肠内分泌细胞的表达受 TCF7L2的转录调控。与胰岛素一样,GLP-1对血糖稳态产生重要影响 (12)。GLP-1类似物和二肽基肽酶IV的抑制剂当前用于临床开发。
尽管本发明进行了详细展示并参照其优选的实施方式进行了描 述,本领域技术人员应当了解其形式和细节可以做出不脱离附加权利 要求包括的本发明范围的各种改变。
参考文献
1.A.F.Amos,D.J.McCarty,P.Zimmet,Diabet Med 14 Suppl 5,Sl (1997).
2.P.Zimmet等人,Am J Epidemiol 118,673(Nov,1983).
3.W.C.Knowler,D.J.Pettitt,M.F.Saad,P.H.Bennett,Diabetes Metab Rev 6,1(Feb,1990).
4.B.Newman等人,Diabetologia 30,763(Oct,1987).
5.A.H.Barnett,C.Eff,R.D.Leslie,D.A.Pyke,Diabetologia 20, 87(Feb,1981).
6.A.L.Gloyn,Ageing Res Rev 2,111(Apr,2003).
7.D.Altshuler等人,Nat Genet 26,76(Sep,2000).
8.A.L.Gloyn等人,Diabetes 52,568(Feb,2003).
9.Y.Horikawa等人,Nat Genet 26,163(Oct,2000).
10.I.Reynisdottir等人,Am J Hum Genet 73,323(Aug,2003).
11.R.Duggirala等人,Am J Ham Genet 64,1127(Apr,1999).
12.F.Yi,P.L.Brubaker,T.Jin,J Biol Chem 280,1457(Jan 14, 2005).
13.S.E.Ross等人,Science 289,950(Aug 11,2000).
14.E.A.Jansson等人,Proc Natl Acad Sd USA 102,1460(Feb 1, 2005).
15.W.J.Nelson,R.Nusse,Science 303,1483(Mar 5,2004).
16.C T.Falk,P.Rubinstein,Ann Hum Genet 51(Pt 3),227(JuI, 1987).
17.J.D.Terwilliger,J.Ott,Hum Hered 42,337(1992).
18.J.R.Gulcher,K.Kristjansson,H.Gudbjartsson,K.Stefansson, Eur J Hum Genet 8,739(0ct,2000).
19.Y.Z.R.Bagger,B.J.;Alexandersen,P.;Tanko,L.B.; Christiansen,C,J Bone Miner Res Suppl 1,1(2001).
20.G.Benson,Nucleic Acids Res 27,573(Jan 15,1999).
21.R.C.Lewontin,Genetics 50,757(Oct,1964).
22.W.G.Hill,A.Robertson,Genetics 60,615(Nov,1968).
23.C.N.Rotimi等人,Ann Epidemiol 11,51(Jan,2001).
24.C.Prunier,B.A.Hocevar,P.H.Howe,Growth Factors 22,141 (Sep,2004).
25.J.Huelsken,W.Birchmeier,Curr Opin Genet Dev 11,547(Oct, 2001).
26.A.Duval等人,Cancer Res 60,3872(Jul 15,2000).
27.S.S.Fajans,G.I.Bell,K.S.Polonsky,N Engl J Med 345,971 (Sep 27,2001).
28.C.Wolfrum,E.Asilmaz,E.Luca,J.M.Friedman,M.Stoffel, Nature 432,1027(Dec 23,2004).
29.J.Nakae等人,Nat Genet 32,245(Oct,2002).
30.J.A.Noble等人,Diabetes 52,1579(Jun,2003).
31.A.Duval等人,Cancer Res 59,4213(Sep 1,1999).
32.A.Duval等人,Oncogene 18,6806(Nov 18,1999).
33.H.R.Chang等人,Cancer Lett(May 16,2005).
34.N.A.Wong,M.Pignatelli,Am J Pathol 160,389(Feb,2002).
35.M.Lepourcelet等人,Cancer Cell 5,91(Jan,2004).
36.V.Korinek等人,Nat Genet 19,379(Aug,1998).
<110>解码遗传学私营有限责任公司(DECODE GENETICS EHF.)
<120>作为2型糖尿病风险诊断标记物的TCF7L2基因的遗传变异体(GENETIC VARIANTS IN THE TCF7L2 GENE AS DIAGNOSTLC MARKERS FOR
RISK OF TYPE 2 DIABETES MELLITUS)
<130>SCT075777-47
<150>US 60/692,174
<151>2005-06-20
<150>US 60/757,155
<151>2006-01-06
<160>53
<170>PatentIn version 3.3
<210>1
<211>74930
<212>DNA
<213>Homo sapiens
<400>1
cttgtgtagg aactcacgct ttgtttattc agcaatcatt cctccagaaa taaccttaat 60
agcaacaaga aaaaagaata ggtgtttttt gagctctatc tgccagtttc tctatatatg 120
gacattatat attgcaacat aacactcaca atgcctttaa acatcatccc cgttatacag 180
ataagaaaac agaatttcaa agaaggtagg ggacttgccc agggatacat agctagcaag 240
tggcagcgct ggattgagtc tgggccttgt ctgaggctcg ggtcctgtca tgctctgcgg 300
ttgctatgtt gacatgcaaa gggagaggca gctgctggga gtctaggtgg gtttctcttt 360
gagaatgcta acgtgaaccc tcaaggtgaa tcagaatcct tttgcaagtg aataatcaga 420
tgtaggttcc tgtgtctccc tgtaaaatga aagcctcttt tttccaaggt ccagtataga 480
cctgaagctg ggttactctg gaatttccct ctctggctgg agtgactgag gccttgcacg 540
tgacattggt gaggactcgc agcctcaggt ctggcttccc ttagcaaccc ccctttcctg 600
tctctgcctc tggagttcac cattaaaaaa aaaaaaagaa aaaaagccaa aacactttat 660
aaagttacat gctgggtttc ttctatgtcc tagaaactgt cttaattcat cttccccttt 720
actcttatat gagcaggaag aaaaaaaaat tgctagtcaa tgctaataat tatggcatgt 780
aatgtaattg gaagtgtttc actgacatgc tcatgagagt ttgcggcttc atcttcaggc 840
tgggatgtag cactagactt gccttgagtg tctgcacaag cctttgatgc aggtagacca 900
tattataaat aggcgcgttg ctatggtgag gatggcagtc cttgcttgct gtgggtaacc 960
ttttctacct tctcggacac tgttttaaaa cacagcagcg tgatagcatt tcatttaatt 1020
tggaccaagg tggggtagat gaaatgttga gatttagatc taaaatgttg ttgtggtgtt 1080
tcagggggtt ctggctcacc tagtactatg gaagattttg cagattgggc ttcctcatga 1140
tttatttaga aatagatttt ctaatagatg gggtgagggg agggtggtgg gcagaaggct 1200
gggctttctt ctcttccccc tcctcctttc attgagcgct tctgcgaatg tgttggcttt 1260
gatgccccag gagctcatac agtgaaatgg aagttcaggt tggcacgttg cagaaatgat 1320
tattcctggt agtacgtttc ccattactgt taataatata aagacaattg cctgcctctc 1380
aggactcctg cacgtggcta cagtcatttc ttcatggaat tagacacata gcagtgggga 1440
ccaggagtgt tttattagtg attgtcctcc tgcaagtttc cagggtatct cagcttagac 1500
acatgaatta ttttttcctg ttgcttggag ggtatacttt taattatatt cattcaataa 1560
cagagcagtt caggtttgta aaatattttt tctcccccaa ccttttcccc agcatacatc 1620
cccgtcccgt aagtttctgg gcagagacaa tctcaggaac ctaaaggttg ctaaaaaatt 1680
agctagttgg ccaggcgcat gactcatgcc agtaatccca gcactttggg aggctgaggt 1740
gggtggatcg cttgagccca gaaattcgag accagcctag acaacatggc aaaaccctgt 1800
ctctacaaac aaaacaaaat ctagctgggc atggtggtgc atgcctgtag tcccagctac 1860
tggggaggct gaggtgggcg ggcgattgag ctcaggaggt ccaggctgca gtgagccgtg 1920
attgtgccac tgcactgcag cctggatgac tgagtgggac cctgtctcaa taataaataa 1980
ataaataaat aaaaaataaa aaaaattagc tagccaagct gcttataggt cttttacatg 2040
gccaagccac tttctcacct ttaaaatggt aataacgttt ccgtactcat ctcaatgggt 2100
tttgagtgcc aagacagacc gtttgatgga agccctctgg ggagaaaaat gctacccaag 2160
acaggctttt caattggaga ctgatccatt ggtgttttgg tcagttggtg ttgaaatccc 2220
tatttttcca gctcaggact gcctctctcc ctggaactct tcccgaggtg agttctgcag 2280
ccttccttgg gaactctcag cctctggatc ccttcttgcc aggtggagtg gacatgccaa 2340
agttgtgggc cagactcgga ctgcctggct tgtctcagca cctttgggga cccacttccc 2400
ctctctggga actggggaag ctaacagaga tcttgctagg ggggtggaat cctgtatcca 2460
tgtgaggttg tacccccagg ctcctgagtg gtttgaaagt ggggaaccct ggccgggcgc 2520
ggtggctcat gcctataatc ccagcacttt gggaggctga ggcgggcgga tcacaaggtc 2580
aggagatcga aaccatcctg gctaacacga tgaaaccccg tctctatgtg cgtggtggct 2640
ggcacctgta gtcccagctg ctcgggagtc tgaggcagga gaatggcgtg aacccgggag 2700
gcggagcttg cagtgagccg agatcgcccc actgcactcc agcctgggcg acagagcgag 2760
actccatctc aaaaaaaaaa agaaagaaaa aaaaagaaag tggggaaccc ctcccccagg 2820
atgagaagag ccatggggtg agtctctgcc accgccaagg ggagtcaggc tcagaggctg 2880
ctacagggac agccagctct ctttagatgg tccccaccat ctagtcaggg cttgttacat 2940
atggagcaga gacagcgcag gctgctgctg ttttcctgga gaaggcccct gtcggtctgt 3000
tcagctgtag ctgacctttc ctccttgtgc tttttgggga gggagccttg gaaggagtag 3060
ggcacgtggg gcactctgct tcccggcccc acactggcga acctatggat tctgcctctg 3120
attcctgagg aaacatcact gtgaaggtgg aatgagccac atacagaggt ggctgttggg 3180
gccggggagg ggtgaaacgc ccccagggtg tacattgcac caaaagccag gctgcatata 3240
gacctcagga tgggctggct tttctattta tttagaagta tttccagagg gtaacctcat 3300
tggctacaaa gcatgtctga acaagagctc cgttgttcat tcccagccct gttaccctgg 3360
caggatgcag actccaggcg gcctgttggt caggccttgg actcagagag cagtgaagcc 3420
tgaggagggg tggggggcag aggcgtgagt ggtctagggc ctcagtccct ccaggacacc 3480
ccttgccaag cgcagagaaa gctctgccca tccgtcccct caggcagtgg gattgggcaa 3540
cctgggaagc agtgaatgtg cgtcggtagc atagattcca ttccgcacgc caccctcgcc 3600
tccgcccccc agccctggga gggatgcatg ccctccggga gacacccaga cccgacagag 3660
aggcctttgt tggagctgga ggtgagaatc tgtgggcgtt gggattcctg ggttcgagtt 3720
ccagctcact gccaattgcc cgagtgctgg gcgaacattt ctggaatcaa aaggagtgca 3780
gcctgcccag cagggcctac gggagccgga ggctgcaggg tgctaagatt gcgttatctt 3840
taccaagtgc ccggagctcc tgggagggaa gagagagtcc taggactcag gataggaggt 3900
ggttggagtt tctcgaggaa gactccatgc tttggttctg gcccctggaa acccctcctg 3960
aggactggac ctccaagcag accccctctg tgactccgga atgcagtgtt actctcttat 4020
atttttcttt cttttttttt ttttgagacg gagtctcact ctgtcaccca ggctggagtg 4080
cagtggcacg atctcggctc actgcaacct ccgccctccg agttcaagcg attctcctgc 4140
ctcagcctcc caagtagctg ggattacagg tgcctgacac cgcgcctggc taattttttg 4200
tatttttagt agagatgggg ttttaccatc ttggccaggc tggtcttgaa ctcctgacct 4260
cataatccac ccgcctcggc ctccgaaagt gctgggatca caggcgtgag ccaccgcacc 4320
cggccactgt cttgtatttc taacgtcccc ctgacttttc tgatcatgta attcttaact 4380
ttctcaaaac tgagatttgt cacgtgtcct ctccccactc cattttgtga atcagagtct 4440
tccaggggca ggacctggag aatgggtctt tattaacaca catgtgaaaa tgcttttgcc 4500
agcaaggcgc ggtggctcat gcatgtaatc ccggcacttt gggaggccga ggcaggcgga 4560
tcacttgagg tcagcctggc caacatggta aaaccctgtc tctactaaaa atacaaaaat 4620
tagctgggtg tggtcgtggg cacctgtagt cccacctact cgagaggctg aggcatgaga 4680
atcactggaa cccaggaggt agaagttgca gtgagccgag atcacaccac tggactccag 4740
cttgggtgat agagtgagac tctgtctcaa aaaaagaaaa aaaaaagaaa atgcttttgc 4800
catgggctgt ctcctgcttc tgctttgcat tgggcctctg tacctaggtt gcaagattcc 4860
tcagggtgca cctgggctta tcgttatctg taagttatcc cagcaagcac ttaaaacaca 4920
gtgttggacg atgaatcccc tctacaagag agggacaggg caaaaacgac acctcttgcc 4980
tcgcaagctg tcttgggcca aacctcaggt ctattctttc ttttttttga aagtagtggc 5040
tgggcacggt ggcttacgcc tgtaatccta gcactttggg aggccaaggc gggcggatct 5100
tgaggtcagg agttcgagac cagcttggcc aacatggtaa aactccatct ctactaaaaa 5160
tacaaaaatt agctgggcgt ggtggcgcat gcctgtagac ccagctactc aggaggctga 5220
ggcaggagaa tcacttgaac ctgagaggca gaggttgcag ttagctgaga ccatgccatt 5280
gcactccagc ctgggcggca gagcgagact ctgtctcaaa aaaaaaaaaa aagaaagtag 5340
cagctctact gagatattta gaaaccataa aatccaccta tttgaggtgt acaattgagt 5400
gattttctgt atagtcacag atctgtgcag tcatccacac cctctaactc caggacattt 5460
tcctcacccc cgaggagaaa cctcccttac ccattagcag tcactcctca tttcctctcc 5520
ccccagcccc tggcaatcac tgtggatttg cctgttcttg acatttcata taaatggtat 5580
cataaaatct atgggctttt gtgtctgtct gctttcactt agcatacggt tctcaaggtt 5640
catccagtat tgtagcatct atcagtatgt cattcctttt tatggccaaa taatatttta 5700
ttgtatggat agacattttg tttattcatt tatctgtttt tggttattat gagtaacact 5760
actatgaaca ttttgcacaa atttttgtat tgacatgttt tcatttctcc tgggtatagt 5820
cctatgagtg gaattgctgg gtcatataat aaataactgt ttaacatttt ggggagctgc 5880
caaactttta aaaccttggg ttctgtgatg taccagttgt gttaggcagc acagcaaaat 5940
gtgacttttg attgccagaa acaatattta aaaagtggtt ataaaaagtg gtttgggagg 6000
ctgaggcagg aggatcactt gagcccagga gtttgagacc agcctgggca acatagtgag 6060
accctgttaa aaaaaaagaa ggccaggcac agtggctcat gcctgtaatc ccagcacttt 6120
gggagactga ggcgagcaga tcacctaagg tcaggagttc cagaccagcc tggccaacat 6180
ggcgaaaccc catctctact aaaaatacaa aaattagcca ggcctggtgg tgggcgcctg 6240
taatcccagc tactcaggag gcttgaggca ggagaatcgc ttgaacctgg gagactgagg 6300
ttgcagtgag cggagatcat gccattgcac tccagcctgg gcaacaagag cgaaactgtg 6360
tctcaaaaca aatgaaaaga aaaggctgtc atgttagatc caccctcctc ctcaggggaa 6420
cccctgggct gctctctggg tagagatggg aacccaggcc tcgggccagt gagtggaagg 6480
aaactttggg atgattgact tgggactggg ctagaggtga agaatctccc agtaggcaaa 6540
gttcggcctt acgttttttt gtttcaagca aaccacatca ttacccacag aggccattgg 6600
tgagatattt gtaagtctcc tgacagtggc tggagttcgt tgcttggttg ttgtttctct 6660
gtctcagccc tggagatggg agtgaccacc tgctctctct ggacagaggc tgtccacgtt 6720
catgcaattc cttggacacc ggtggtgcag cgggaggcgt aactgggagt gggagaccct 6780
gaactgtgcc ggttcttgca gagtatcact gtgacttcag gcgagtcacc ccacatcagg 6840
cagctcagaa caagggattg atctagaagg acctttcacc tgggctattc tgtgactcaa 6900
attatcttct cctaagccca ctactgcctg gtgtgttggt taaattagcc taaaggtcat 6960
tccctcggag aggccctctg ggaaacctcc ctttcctgag agtcactgct tgctggcgcc 7020
tgcccctggg gttccttcag agtcgtgatc atgccctggc ctcttccttt atttggcagt 7080
cccttccctt ccccatccct gatgagggta gggagcatct gtctgcagct tcatcttcat 7140
tgtctagggg ctccagaaat atctgtgagt aaataagtta tttaatcttt gcctcaaatt 7200
tccagtgact gtagggatat agctgtgagc ctctaggagc tgagattttt taaatttccc 7260
acttaaacat ttatttaaaa attttgtgct cagcatggac taaggacttt acattcatta 7320
actcatttac agcttgatcc tatgcggtgg gcattcattt acagaggatc ccattttaca 7380
ggtgaggaag aggccagcta ggggtgcagc ctaggttagt attctagagc tcatcaggct 7440
gtgttgtccc cagtgaaaga ataagcaaag aagtgaatgt tgtgcattga gaaaaatgac 7500
tctcggagga ggatgagcct ctcggatatg gcgaccgaag tgatatgggg cccttgtcaa 7560
gggtctctat tatggcatca agaaaagatg ctgctttcgg tgatgcccga ggagagcctc 7620
aatattttac atgggaaacc taaaaaaggg gccatgttgt ggtctctgca cctaagatac 7680
taaaggaaat attttatgga gagatgcaac atgtcaggcc ttggagggaa accccaggat 7740
ccagatggtt gcactctcaa accagggccc ccctcacctt ggccttcagc atttagtgtt 7800
ggaaccaata gcataagctt tggtcaggac ctttgatgga agccacagtg ctcattagtg 7860
accacggttg actaccttct ctctcctaag ctgacttctg gagggcacct gggatttccg 7920
gccagtgatc agtgctggtg aagcctgaag gccaatgtgt aggtttagct gttcagtcag 7980
aacccaaaag gggccaaaga gatggtttcc ttcaacctcc actgagggaa gtgaaagtca 8040
tggttcgtta aaaggctgag ctgggaccag agtctagggt tctagaggtg ggaatttcta 8100
cagctttggg ggaccttgca agggcatttg ctcttctggg actgcaggga gactgtgctt 8160
ctcagagatg ttagcatttg gcttggggag agagaggaaa ggagaggttc atgctccgcc 8220
atgatggtgg aaagtgatgt tggtgtggtg aggagctgag ctgaattcta agtggttcca 8280
gggaattaac aatgttcctg cccaagtgtc ctgttccccc acaaactaat gaggcagcag 8340
gtgtctgaag agaaacattg cagaatgtct gccaggggtt ttatggttaa ttttcctcca 8400
ttatgagggt tgactcagcc ttgggtatta gatgtctttg agaatccagg gttcaaatac 8460
cacagctggt agaatgtttc tcaacttgga gccaatctcc atctactgaa ggtacgctgg 8520
tttagacaga caacagggac atcagcattt taaaaagcgg tggaaaaagt ttgcttgtct 8580
tgattggagc catgacattt tattttgaaa tttcaaataa catgaaggga ggtttggagc 8640
ggtttttggt ttatccaaag ggcagtggat tgaaggctga gaaacaccag gctgaatggg 8700
agaggggttg gggtccccct gtgagatagt gaaacaatgg tagtgccatc caatgatagg 8760
cacttttctg tcattcagaa gcagaaaggg ggccagaggc ccattggcct tactgggcag 8820
taagctgtag agctgctgcc ttttcgtgaa agggttgaca ccaaccttct cccccaggaa 8880
gagtgaccag ggacctgagg ggcatggtcg agcagatgac agcctttgta aaacatctcc 8940
ctggtctcat cagcgatatt cgtcctgcct tccttctgag taatttccat cttaggactg 9000
gagtcaggtg gagcaagatt ccatgttggt ttctgttggg cctagagtgt cacactgaga 9060
cctaatttca tactttatga attctagtac tgctctcgaa ggtaagagcc gtcctctttg 9120
gctgaaggtt tttgcctgca accttgcatt gtaatccagt gacacctgac gtatctgtaa 9180
atttcttcaa atttctaagt gtattacaac cccgtgtgca aaagatgatt aattaattgc 9240
cttgacagta aaacaaaaaa caaaaaaaag gtgtgggggt atatggtatc cctgatttac 9300
tatagaagat gcagagagtg aagggagatg aggtggggag gaggggccca ggttctggtc 9360
ctactttttt tttttttttt ctaaagagat ggagtcttac catgttggcc agtctaggct 9420
tgaactcctg gcctcaagag gtgctctcac ctcagcctcc caaagtgctg ggattatagg 9480
cgtgagccac cgagtttagc ccaggttctg tttcttgctt agtcactttc tgtttgaaca 9540
aaattggaat ttcctttttg gatctgtttc tttaattgta aattgaatcg gactaaaacc 9600
tttccaattt tttcacatgt gaagacatac acaaaagttt tattggaggg ttgcacatgt 9660
gaaagaaaaa gggagaaagc aggattgagc agggggagcc gtcagatggt aatgcagatg 9720
tgatgagatc tctgccggac caaagagaag attccttttt aaatggtgac aaattcatgg 9780
gctttctctg cctcaaaacc tagcacagct gttatttact gaacaattag agagctaagc 9840
actttttaga tactatataa tttaattgcc gtatgaggca cccttagttt tcagacgaga 9900
aaccacagtt acagggaagg caagtaactt agtcaatgtc agataactag gaaaaggtta 9960
gaggggccct ggacacaggc ctgtgtgact gagaagcttg ggcacttcac tgctacattt 10020
catctcttcg ctataaacat tttagctttt tgtgtttgct gactggcaac aatacatagt 10080
gaaagttcta ataatttgta atgcttttgc atgtctttgt atttttcttg gttatcacat 10140
cacatcaaat taagatactg atcagcagtg tgagaggtta tttttccatg tcctcttcat 10200
tagtgttagc ttgtggatgg atttgaggct ctctgtgctt tccccccagc aaagtgaata 10260
ccagactttc ctattaaaaa aagtatttta tttttcagag acagggtctc attctgtctc 10320
ccaggctgga gtgcagtggc acaatcatag cccactgcag cctccaactc ttgggttcaa 10380
atgatcctcc tgcctcagcc tctcttaagc agtgcctttc cccattctca tgggactttc 10440
caatccatga gatactttgc tgcagggaag ccctgtctgt ccaggcctgt gtaatagacg 10500
acttcacatg gtcctgtgtt gttgtttgcc ttctgtgtgg ctaagtttcc atgacctggt 10560
ggcttggaag ccccatccct gatttgtggg agaggcaggg aggcaccttg tagcgcacta 10620
ggcgttgggc ctgaacaagt ctgtgtgctt ccaatgtctt tgtggggagg tttacgagtc 10680
cttcttatta tataatagta tcttgtctta gcttggtgcc tttcttctca gaagcttgag 10740
gcactctgca gataccatct caatttgctt tctgggagga ggagaggaag ctacccaaaa 10800
gatgaagttc tctgtgaggg gcttgaacac aggttgatag cgttgctggt tagttattct 10860
catggtgtgg atgaaaaatg gaatacgctg aaatttcagt tactcgtcac aaaaataagg 10920
cgtatgtaga aaacatcctg ggctaagggt ttgcatgctt ctagaacttc ctgttactta 10980
atggctgttg agtataaacc tcgggaacag tggggatcct tggagacccc aaataacttg 11040
tatttgtggt tactcctgtc ttgtctatca atacccctgt ctatatcgtg ttagaactag 11100
gacacacaga ctggattcag aagctggcct ggggtttagg agaacatggg acctaatcct 11160
ggccatctcg atttacctcc tggatcttgt tttctcatct gtaaaatgaa ttggggtgtg 11220
gactgtttat ggcctgtagg atgctagccc tgagaatttt ctccagatat tctacggtta 11280
agtaatttta ggggacactg tctaagcagt tgcctcttgg agaatgaaga tgttcattag 11340
gatattgaag gctctgagaa gtcctaaagt taaagaaaat ctgcaatgtt ctttgtggga 11400
ccgaataatg caacctggga aatgagggat tagatgacac ttgagtagcc ttccagatct 11460
gagacgagtc tcactctgtt tgtttactcc atctgtgatg ggtgtaggca ccatcttggg 11520
gagcaagctg tgatagagag ggaacaatac cttgttaatg tttgtctaat tcactaccca 11580
ggtgcatggt agtgaattag acactacttt gtaggttctg gagggaagaa gaaaagacga 11640
gacctgcctg gactggggct tgagaccact gtcaaataca agtacagttg tacaactggt 11700
agggagtggg tcatagtatg gccggtcttt ttaaaggtga ggaattctta ggcccagaaa 11760
ggcaaagtga cagatcctgg atttaaccag cagcccagat ttgaggccta gcacatagca 11820
aagcaccata gctattcaat agctgccaag tgggagtttg gatgatggct ttcctggaca 11880
gcgaaagcag tgatgtttgc ttaggatggc ctttggcagt gctgctgtta tccttaccac 11940
tggcaagcca tctcacgggc ccggagggga gggcaaggaa tcctaattct gtgagaaggc 12000
tctgggtaca tgagtgtgag atatggatac cctaggctct gcccctgaag acagtggcat 12060
cggatttact gcactattcc agtcggacag gcaccttaat ttttctcttt ctgggtgttt 12120
gatatggttg ggtcctattt cttctcctcc aaaccccgct agggccattc ccccaccctt 12180
cacttcccgg ccttccactg cagtctctaa ggattctgct tcatctttat gtgtgaacag 12240
ggttttgaca aacatgatta actgggtatt tttggaaggc tcaggaggaa cgcagagtgc 12300
tccggagggc aggcctggag tcaggaatgc ttcctgcaac ctgttcgtgc agtgagcgtg 12360
tcttcctcgc cctgcccttg gctggggaat gtgctggctt ggagggcagg agagtgacag 12420
gcggtttgag aactccgggc tctcccgtct tcggatggct cctgtgaaag cagggcctga 12480
aacttttatc gtcactgctg caggtgaaag actttcattt ggctgtagtg gtccaacaaa 12540
gagtatttta tttatgtgtt tccaagccct taaaaattct tttagggcac atcagtgggg 12600
agttaataga aactttgaaa taagaaaaat gcctgcaggg taagtagaac cccagccagc 12660
cagctccgag ttctgtgctg ttagctggta ggttggttct cagagaagtg gctggctggc 12720
tgggttacgg agcccacatc tctaatgcct tagtgttcaa tcattaagtg gatttttttt 12780
tttcccttct cttcttttgg tttggaggga ggactactct aaactttact cagggcaggg 12840
tagctcctga aagggctccc taacctttct ggtttatgac acaaagaaag tttggaggta 12900
ctgggataag agatggcttg ggtgaccccc ctatcatgcc ccctaacaca tacacagcaa 12960
accaaaccaa ctcacccttg atcatactcg ttgtttacac gaagggaatt tttattgtct 13020
tgtgagtgtt gagtgatgat taaacagaag agatgtgact ccaagcctgg cttcactaag 13080
atagtcttgt ttgtttcttt tcctccaaag taatttccta aagaattaaa agcccctttg 13140
aaacccagca ctaccttgtc tctgattatc agcataggca ggaagggctt ttaaggtctg 13200
agcccagctg tttagaggct acgagacgtg aggcaaatcc tggtatctct ctttgggcct 13260
cagtttcttc atctgtgaaa tggcacagta ctaccctcca ccaaggatga tgatgagaat 13320
taaatgggat gacaggtttc atccccagct cctgttctta ggaaggaaaa actgtgactt 13380
atgaagcctg taggttgtgt tcaggtttgt atgaggcctc ggacttcata caaaggtatc 13440
aaagtggcaa accctgatcc agatgttttc agttcagtca gctggtcctt gagcctgttg 13500
tgtgccagat atcctgacca aagaagctag atgggagctg ctgtgttgtt ccttggggct 13560
gctggatgca agttgtttag gtcggcggtt ttcaaatgct ggtgattttg ctcaccagag 13620
gacatttggc aatgtctaga gacatttagc atggccagtc attgggaggt actcctggca 13680
tctcgtgggc agaggctaag gatgctattg aacatcctgc aatgcccagg acagccccct 13740
gtgacaggag tcatccagcc caacatgtca ctagtgctgc agtggagaag ccctggctgt 13800
gtgtgggggt gtgtgtgtgt cctcttctac atttgataag gtaactcaca cttgctgccc 13860
ccatgatcgc tgtgggggat gcttatctat gccccagtcc tggtgttggt tgatgggaac 13920
atcaagattc aggcaagatg gaaaatagcc cttagaacta gcaggaaaag aatctccttt 13980
catttgtcta gaggttctgt taaagtgcct ttgcttctat tttgagactt gttcttaaaa 14040
aaaatgcgga tatgaaagaa aataaaaacc acattatccc tccacttttt cttggaggag 14100
gatgtgttga agaagtcaaa gttcaccatc cctttagata gaatcatttt gaacaatttc 14160
atatgtcaat acattttgct catctctaaa tttcatttta gagcctgtgg tgttctgtgc 14220
atggatatgt gtgcgtgtat gcacacaaaa ataaaaggaa atatttattc ttatgaataa 14280
gtatagaaat aaattaattt ttggaatctc aaactatcag agacttatgt aataaccaga 14340
ggcaggcctg attatgtatg ggcaaagcat ttgtgaacaa tgtctccatt gtataacata 14400
caaaacaagc ttttcttcca cattggatat gcaagtcggc cttctccaat aagggcctgt 14460
ctctttccaa ctccccccac ctcccacctt tgagcaaaca ttatttattg tggctgatgt 14520
gtgatcaggt cttgatttgg ggcctctttt tgatgccttc tctttgtggg atctcaccca 14580
cgtgcccctg gagacccttt ggctgccagg gcctttgttt cccagccacc catgtggtgc 14640
cagtagtgtc tgctttgtag cgagctgtcc ccagagcctc agcatggctt ggggatggtc 14700
tctgaggttg ggcttggatc cctcccactt ttgggctcag aaagaatgac tgccctctat 14760
ttccctgtcc ctgccctctc ttatcctgtt tcccagcccg catcatgtta tctttgcttc 14820
ttgtaactta ccaaacgatt tatgggcaag taggggaggt gaagagggaa ctcatctatc 14880
aagataacct actttgtgcc aaccactgag catagcaatt gtcccttctc cagccctctg 14940
aggaccgtgg atgggattct catgaaatga aacaggtgag gaacttttct tttagggaac 15000
ttgcttgagg tcccacaggc agcgagtatc aatcaacgtc aggatctgag ccctgttctg 15060
ttcggctgaa aatatactcc ctgagatggt gtaggccacc atggctttca gcaggctctg 15120
tgcttggtgg aaggaagctg gaagctgtgt acacacccac ggggaacagg gaccatagag 15180
gagcaccttt tgagtgcaga acctggcgaa acatacacct ttagagggat tttaggtacc 15240
cttgaggctg ggagaatcaa gcagagctaa gtttcccatt ggggtgtcac agactgaaga 15300
aacagagccc taggtagcac agggaagttg attgcccagt atcagttagt ttggctttaa 15360
tgactgagaa gagattccac cagttcattg aagagagggc ggacttttta ttggaggaaa 15420
gaagagtgcc tgtaagtaga gaagtctccg gggtgtagtg ctgtttgggg caggaagaac 15480
agtgtgagcc actgtggaga gaaagcccaa agagtcttgg cagggcaggg agtaggatgg 15540
atttgaagcc agaggaagta tggggtctct gtagactcca ggcaagccat gttaatattt 15600
taggaagccg tgatggagct gcagatgggt gtggaagtta aagtttaact gttcattcac 15660
cagtccttcc cctggagaat gtgcagcacg tggacagtgg aactttaagg tccttggctt 15720
gtatttcaca cccaagagat gaataggtcc aggtatgtca tagaccagac taatgaaata 15780
acaaatttct tttcaaaaat tttacttttt gtaggaaagc ttctctgtct ggcatttttc 15840
ttctcccagt tgtgactcaa tcttaaacgt cttcagacaa ttagcataaa atttcccaca 15900
gtgaattgac gtatactttt gagggttcca tttctttttt attttttttt tcttttgaga 15960
tggagtttct cgtcacccag gttggagtgc aatggtgcca tcttggctcg ctgcaacctc 16020
cgcctcccgg gttcaagcga ttctcctgcc tcagcctcct gagtagctgg gatgtcaggc 16080
acccgccacc atgcccggct aattttcgtg tgttttagta gagatggggt tccaccgtgt 16140
tggccaggct ggtcacaaac tcccgacctc aggcaatccg cccgcctcgg cctcccaaag 16200
gctgtgatta caggtgtgag ccactgtgcc cagcctaggg ttccatttct taacccctcc 16260
ttctgatgcc tcagaaagtc ttgctctgta agcctcttgt agctgcctcg gttcagggga 16320
agggggaggc ttttgtttta ggaccgtcca gaccatagac acatttcctg gcacctagca 16380
cgtgttgggt caaacaggaa tgatgaatgc atgcatgaat gaggttctta gcgctgaaga 16440
cggtgtcata ggtggtctac cacgccgcct gatcattcca atggcccatt atgaatgtgt 16500
gtgctgcagg gccctcccac gatcccgtca gcactgtgca tgttgtgggg aggtgctggg 16560
agaaagactg ggtctcagaa gatgggttag aggtgggtcc ttctctgctg ctggctagca 16620
gggtagctgt ggaggggtgc cccatcttgc tggtcttaaa ttttctcact gtaggcaggg 16680
agcatgacct ggctgaattc taagtccttt tctactctga ggttcattgt gggtgtgacc 16740
tgctgggctc agctctggct ttgggagaca ccctctcccc ttgatctcga caacccctta 16800
gcagagccca gtggctccta cagtgccctg agctgcttgc ccgaaggatg cggttgtggt 16860
tatctcaccc cctgccaccc tgtttgcgca agggtttgag attgtgtggc ccctccttgt 16920
acttcggggt gaggcttgct ccagaaaggt ggtctgcaaa ggggttggct gggggggagg 16980
aggaagtcat tctccaagtg tttgtcctca tcgttatccc aaattgcttg cctggaataa 17040
ggaaggaaag aaaaaaaaat actcttgagt ggtttgggcc aggattttag ctgatggatc 17100
tggtagttcc ctctgtcaga tttgttttct ttgaactgtc tgggccggtc acagtgtcat 17160
tgtttaaatg tggaatgtag gtgttctgtg ttctgggaaa taaaaaccaa aactggtcca 17220
ggggatccac agaggtaaga aaagaacatt ccaataggaa tgtttcagaa ccaggagggg 17280
aggagagaaa aacggctctg ttggtctcct agaggaagaa cttgttagat ttggggagag 17340
tcaggataaa tttgacccta agagtctctg attcctttta gagacttttc ttataagaaa 17400
taaaatggaa cttgggagag gcggcaactt gggaaacagc acattctgcc gtaatgaaag 17460
tcgtcccata agaatttctc tatcccttta gccaaatttc tgtttctaaa aggggaaaag 17520
gggctagaga taggcttgtt tgttttctta gttgaatctt actttttgta tttccagccc 17580
attctgcagg gtaagaacaa gcacagcccg agggctcact cagtgtgatg ttctagagcc 17640
tggctctgcc tcaatccctc acgctggagg atcaggcagc aggggccagt gatggatttt 17700
tttttcttcc tttcctcccc tattaatatt tactgaggta taaattacag caaagtgcgc 17760
agacctaggt atctaggact gtgaggtttt cctgtgttac ctgtgtaacc acgacccaga 17820
tcaagataag gaacttttct ggcatctcag aggctcttcc tgctcccttt cagactccgt 17880
ctcccagaag gaactacttc tgattcctat agccatagac tgaattttct tttccaactt 17940
catatgcata ggatcatcat gggtgtttta attttaattt catgtctgct tgccactccc 18000
aaatggaaat gtgttggcat ctctggatgt ttcttcataa gaaacatgcc ctgtggggca 18060
aagcccagga cagggctgtg ctgctgctgg aagtcctgtg cagctggcca gcctctgctc 18120
acccctccgg ccacgctggc actttcagct tctccagcct cctgcccttc ccacttccag 18180
tcctgcacct gctgtcctca ctgatgcacc tgcccttttc cttccgtcct ttatgtggca 18240
cacccttaag ggagacatct tcctgtctgt gttttgcacc ctcttaaaac tacattcctt 18300
tcccttcagc attggcatct ctgtccttgt gtattacctg ggatgactat tcagttaaca 18360
aatgctttct tcctaggctg tgagcccaag tttgttggat gattggatgg gggcacgttg 18420
tgtgagagaa ggatcatggg gtagcatctg gctctcttag aggtgtgtgg gggcgtgtga 18480
tgcctgccaa ggcgctttcg ttctgggggg ttctgtgtgt ttgaagcact tgggttgtgt 18540
gtccctgagg cctccgtcac gggcaacctc attccttctc tagcctccat cccctgcccc 18600
ctgcccaccc caggcctctg gagctggctc cctttcctgc tcactctctt ttggccagga 18660
ttttaacata tatcacaggc tggtaggcta agagcttggg acttcccctc accacactca 18720
aagcctttga tcttttgctt tggaggtaac atcaaaagga aggctgagga agacagccag 18780
gctgtgaagt tcaacgttca agttaatagc ttgactgaag gttgtgctgc gttgtggcag 18840
catcaccgag gctggagtaa acagagtgat tctgccacat tttcctggaa atgcacccca 18900
atattggaag agggcttctt ttacattcgg aatgaattca ggctgtagtc agagctgctt 18960
ttccctttcc ccattttcct tggaagtgtg aaaacttggg ggagaagatg tttgtaggag 19020
ggcatgatga ggggtagagg aagcccaaag agaggatctg gggaggggaa gccccatggg 19080
atgagactct gaagttatcc ttgccccgat tccgggactt gctatctgcc tgccttttgg 19140
cgtggtgtct ctgtgcccct gactgttcct gatttagcga ggtgtttctg aattctgatg 19200
gaattcaaag aagcctgggc aggcaggcag cttgacttgg ggcttgggga agcgtgcagc 19260
ccagacatag cagcgatgag agggcctcag ggctgagggc tgagatgaga atttcatcac 19320
atgcaaaagt gaaagcgacc catcgtcttc tccacttgat ctcttgctga gctttgcaga 19380
cactttggtt gttgtttaat ttaacatttt ctgcaatgct ccttttttca gattttcatc 19440
caaagctctg tatgagaggt tttcaaaccc attttggccc tgattctatt tggcatacga 19500
ttcaactctg gggatggtca tcttccccac acctgcgttg ggtacctttt tggtgtatgc 19560
tcagagcatc cttggacatc ttcctggtca gtgtccagca tcgtgaagct gccctttagc 19620
ctctcagtgc ccccagatac acctgtctct ctgcgtagcg gcactcagcg tcacctttct 19680
gtggggtctt gagaccctga tgatatcagc actatgctgc cagaattccc cttggattct 19740
ttagtgtggc ttctcaagca tcccttatcg ctataacgcc ttcatggttt ttggcataac 19800
tgtatactac ctgtgctatt atttatttga tgcattcaaa catttgattc atttatttaa 19860
actcagtctc actgtaatcc ttaattaaca cctgtgaaat tataggtttg atgtgctact 19920
tatttattta ttttttaata cacattagta taatcccgta acggctaaag taacactttg 19980
tactgcctaa aaccatgctt gggagcgcca cagtttgaga aagtgcttag ccttcctttc 20040
cctcctttag tgacttgtgg tttggggcat ctgttgactc ctagggctcc cttgttcatc 20100
tttctgttcc taagctcagg gattagttgc tcaacccagg tgtggcctca aaattctgct 20160
catggaatag cctcaggctt ctataaatct catctttttt gttttgtttt gtttttgttt 20220
ttgagactga gtcttgctct gttgcccagg ctggagcaca gtggcgcaat ccactgtaac 20280
cattgcgttc tgggttcaag cgatcctccc atctcagact cccaagtagc tgggactgta 20340
ggctggtacc accaggcccg actaattttt aaattttttg aagagatggg gtctcactat 20400
attgcccatg ccggaagtct agttttatag tgatgagaat tcatctgggg tccaaggggc 20460
cctcctgtgt tgcttcctgt gctcccctct aaataaagat actccttcca agttgtcctg 20520
attttcaggt catcaccatt ttttgagctg gatggggaag ttggcctgga gcagccttcc 20580
ctgtctccga gttgcattac ctcctgagag gtctcagcaa atcactgcca tctcttgatc 20640
agagttgctg gcaagagtcc tctgtggttc taggttttca gccctggaga ctctcgcctg 20700
cattcattat acatgtcctt ttggtgcctt gttgaaaggc atctcctgcc accgaagggt 20760
gtgggcttct ggaaattctc agaaaacaca atatgccagc ctccagggat gggtctccaa 20820
agcttcagga acatatcctg gggtgttgag gaaacaccca ccttaaaatg ttcctcaagg 20880
gggaatgtta ctgcttgccc taaccctctt gagctgatgc tcacatgacg tccctgagat 20940
gggcttcttt tttgcccgta cttaaagctg taaagggcca ttgtcaaatt tgtttagctt 21000
ctcaattcat gttccttaga ggatggtaaa ttaaagttag cattcctgga cagagccttt 21060
catacattga agacaacccg gtgagtctca aggggagagg taagggagag atgaaaggtt 21120
ttctccaggc ctgttcggca gcatggactg ttcttttagg taattaaggg agaccataaa 21180
agacaattgt gtgagtccat ttacctttca cttgggggtc ttaagtcttt ggttgggctt 21240
ctttaaccct gtgtgtcacc cacgggctcc tatgggtgct gttttcattg ttccgttatc 21300
tagttggctg gaacacacct ttggggattg gagaatggag ttctgggggc tttgggaact 21360
ttgagttttc ctgcaatgtc ctatagaagc ttgagtctgt gattcctggg cagggccttc 21420
tcctagttga gtgagattgg tggggcaggg cagccagtta gggggtcatg ggagcaggtg 21480
tggaaaaggt tatatgtctt agtaattctt tgtgacaatc accctcattc attgatatct 21540
tcttcctatc atgtattagg gcagtggttc ccccaatgtg ctgcacatta ggttcacctg 21600
gagagctttt ataaaaatgc caatgcccgg ggcccacttt gggaggagcc aggcatcagt 21660
aatttcaaag gtctctaaat gatttacagt ttgggaatca ccgtatgagg atagtaagct 21720
ctgagtccta tgcgttctgt gccgaacacc catgaagcag tcttccaagc attttacctg 21780
catcatctca attctcacac tgttaaggag atagacagta tcatctccat tttgtagaca 21840
agacaactga atctcagaga ggtttaagtc tcaggacacc aaggtcatta ttaatcaggg 21900
ggactgtgat tgctcccttt ataaaatgta ggagatattg tggagtacgg ttgagaaacc 21960
attgcaatag ttttcttact ttgttaagaa attaggctgg gcgtggtggc tcaggcctat 22020
aatcccagca cattgggaat ccgaggtgga cagatctctt gagctcggga gttccagacc 22080
agcttgggca acagggtgaa accccatctc gactaaaaat acaaaaatat tagccgggcc 22140
tggtggtgtg cacctgtagt ctcagctact tgagaggctg aggtgggagg atcacctgag 22200
tccggctgca gtgagctggc attgtgccac tgtactccag cctgggcaat gagagtgaga 22260
tcctgtctca aaaaaaagaa aaaaaaggaa attagtggtg gaaggtgact ttgcatctgg 22320
gcgtatctgc ctgcagagtt ggtgtcctta ccttgaagaa accctgcttt agttggagta 22380
tccttaatgg ttagtggcag gaggggagga gtggttcctg ggagactgga acaaaatatg 22440
gtacctgaat gcttaaggct tggcagatga gcagtcattt tcttacacag agcttaggaa 22500
agggcatcca ggtagaggaa tcagcatgaa caaaagcaca gggccataga gttctcagaa 22560
ggaaagatgg ggttaaccgg agccaagcca gagatctggt ggtagtgggg ggtttccaag 22620
ctagaatggt tgtgtggtat tctgtcctca ggggctttga actctgtgtg ctaatgaggc 22680
ctcaaattcttctggggctct ggttaaaatg tagattctga tatcagttgg cttgggtggg 22740
gccttgcatt tctgtaagcc cttagcagtt gcactgctgc tactaccgtg agtattgctg 22800
ttgagcatta ctaccttgag tattgctgtc aagtgttact accttgagta ttgctgttga 22860
gtattactgt cgaattttac taccttgagt gttgctgttg agtattacta ccttgagtgt 22920
tgctgttgaa tattactact ttgagtatta ctgttgagca taaccacttt gagtattgct 22980
cttgagtatt accaccttga gtattgcttt tgagtgctac tgccttgagt atcgctgttg 23040
agtattgcta ccttgaatat tactgttgag tattaccacc ttgagtattg ctcttgagta 23100
ttaccacctt gagttttgtt cttgagtatt gctaccttga gtattgctgt tgagcattac 23160
taccttgagt attgctgttg agcattacta ccttgagtat tgctgttgag cattactacc 23220
tcaaggattg ctcttgagct ttaccgcctc aagtattgct cttgagcgtt actgcctcga 23280
gtattgccgt tgagtattac tcccttgagt attgccattg agtttagtcc tgtgagtatt 23340
gctgctactg cgccttggca atggttttca aactttgcaa cacatcagaa tcacttggga 23400
aacctttaaa attctaacgc ccaggtcaca tcccattcca actagatcag aacatctggg 23460
gaatgcgagc catgcaccag tagttataaa acctgcccag gtgattccaa agtgtgggaa 23520
cctttgagaa gcactgcttt aggggttgga atagtcctgg ctgaatttta atcagggaag 23580
actgactgct ccgtttatga aacgtaggag agtggagcag ggttgagaaa ccatcgggat 23640
agtgttctta ctttgttacg tgagcaatat ttgttgagtc tctgtggtgg gttctagggg 23700
ttcagaggac agcagtgtgc tgctaggatg gtggtctgaa ctagtggaaa ggcactcaaa 23760
ggaagaaaga cagaattcta agaggagagg aattttagga aggagatacc caggactttt 23820
gaattacagg taatttgatc agaacccaaa actgaaatgt ctctgctctg tgatgaaagg 23880
gtttgctggc attgagtaag gagctgcagg aaggccttta acttgtctcc aggtctctta 23940
acagctttgt catttacata caagcacctg cctggctaaa ccattcattt ctgtagcttc 24000
cttctggatc tgtctaggga atatttgctt tgcatatttt ggggttatct taagtgtttg 24060
aaggaaccaa aatatttttc ttaaaaataa cactcaaatg tagttcacat gattaatttt 24120
gactgatttg tgagaatcag taagtgctga ctgactgagg cgccccacac atccggcttc 24180
cttctgttac tctacgcgtg ttgctgaaac ttaacgaacc catgtggggt cttctcgcct 24240
ggtgcagtcc ggcccagtat tcatactgag gtttgcagtg ggagaaagga aggtatttat 24300
ttgtaggtca ccaagcaggg caaatccagc agctcacgct taagacctga cctctcccat 24360
ggtttataag caagtggttt tttttttttt tttttttttc agactgagtc ttgctctgtc 24420
acccaggctg gagtgcagtg gcgtgatctc agctcactgc aacctccgcc tcccaggttc 24480
aagcgattct cctgcctcag cctcctgaat agctgggact acaggcgtgc gcccccacac 24540
ctggctaagt tttgtctttt tagtagagat ggggtttcac catgttgccc aggctagttt 24600
ccagctcctg acctcaagtg atcctcctgc cttgacctcc cagagtgctg ggattacggg 24660
catgagccac agtgcctggc ctgtaagcaa gtgtttttaa agaaaggggt aaattttagg 24720
gaaacagaag ttctaggcaa aatggtaaat taatacaggg aggtaagaca ttggtttggc 24780
ctaaaaagat gggatatttt gaagtggggg ctcataggtc ataagtggat ttaaagattt 24840
ttttggtttg taattggtta aggaagataa gctttgatta aagatttggg gtcagcagaa 24900
agaaatgtta ggtctggctc gtgggcatgt ctttttctag gcccctcctt ggaaagaact 24960
ttagagcaaa gaaaggcagt tggagcttag tccccacttt ctcctgatct gaggtctacg 25020
gaccactgga tccatttggt ggggtccatc tttctgaaaa acaagtcagg gacatgtatt 25080
gagatgatat tattggtatt tatagggaac caaacaacgc cccatgactc ttttttggct 25140
attgttttaa gccactgttt ttttttgttt attgagttgt taacttattt tttaaagcta 25200
gctagctgcc tggaatttct ttagaaggaa ctgaagtttt taaaaatttt tatgttgggg 25260
ggtattgccc tgcaggcccc taaaaggggt ccctgcgctg tctcaaaact tggatgcaaa 25320
aagaagttga gttaacacag gaggacaggg gtagacgcac caagggcatg tgcctcgagt 25380
gcgtggtcct tattaagaag ggtggttaga cagggaatgg gttagttccc aggtcggcat 25440
tcagctgaaa cagtgatggt taaaattctg aaaaatgtcc acgctctgca ttctcttcct 25500
aacacccagg acccagtaac tataaagccc cctaccctgg ggcatagcag ggggcttcag 25560
ggacccatga gaaggtcatc tgctgctagt tacactcctt ctgggacctg atttagacag 25620
tttggtggta gttttgcgag ggttaatttc agggccaagg atgcttctag aatggaaata 25680
ccttcttgac attgggagct ttattggttg attatgtcaa tgtgagaatt caggaagccc 25740
agtgctaatc ctccatccta aaaggagtag attggctggg cgtggtggcg catgcctgta 25800
atcccagcac tttgggaggc cgagggggcg cggatcacct gaggtcagga gttcaagacc 25860
aacatggcga aaccccgtct ctactaaaaa tacataaatt agccaggtgt ggtggtgggc 25920
gcctgtaatg ccacctactc gggaggctga ggcagggaga attgcttgat cccaggaggc 25980
ggaggctgca gtgagccaag attgtgccac tgccctccag cctgggcgac agagcgagac 26040
ttcatctcac aaaaacaaac aaacaaacaa acaaaaacta aaaggagatt tcctccttct 26100
gtcctttatg ggagacttca accttgggaa agtctggaat ccttggacat tagaaattct 26160
gaagttttgg ctggctgtag tggctcatgc ctataatccc agcacgctgg gaggccgagg 26220
caggtggtca cttaggccag gagtttgaga ccagcctggc caacatggtg aaaccccatc 26280
tctactaaaa atacaaaaat tagctgggcg tggtagcgga cgcctgtaag cccagctact 26340
tgggaggctg aggcaggaga atctccagaa cctatgaggt ggaggttgca gtgagctgag 26400
atcacaccat tgcactccag cctgggcaac agaacaagat tccgtttcaa gaaagcagaa 26460
actctgaaat ttttgcctgt ccaggccaca tcaatcccat tcctctgctg tctctgcagg 26520
attctgtgag gaataattag ttaatgtttg cagagcactt tgaaatcctc agatgaaagg 26580
caccggagaa gcacaaagta ttattattta ttattagctt gccccagaat ggaggcgcat 26640
gaggccctgg cagctccctg cctcgtgcca ggtgtgatcc tcctgctggg cttttcctgc 26700
ctgatgagct tttttttttt tttttttttt gagatcaggt tcagctctgt cgcccaggct 26760
ggagtgcagt ggcatgaaaa cagttcactg cacacagctc actgcactgc agcctcaaac 26820
acctgggctc aagcaatccc cctgcctcag cctcccaggt aactgggact atatactaca 26880
ggcatgcgcc accactcctg gctaattaaa aaaaattttt ttttgtagag atgggggtct 26940
cactatgttg cccaggctgg tctcaaactc ctgggcctca aagatgccaa aggttcacac 27000
cttggcctct caaagtgctg agatgacagg cgtgagccac tgtgcctgtg ctcaattgat 27060
tttctttatt aaagaaacat ggaagaaagt gaaggatgag aatcagtaac gtaacgtgtg 27120
cttcagattg tggacaagtg atgtgaagga aacacattgg tcccactgtg gtgacagagc 27180
aggggtttcc ttacctggca aggttgcggc tgccattcct tggggtctgg ggttaagacc 27240
atctgcctga gggtaacgca gtaataaatc agtactaaag ggcgtactaa agtactgtat 27300
tgctaggcta ggccatgctt ggtgtatttt tttttttttt taattgagac ggagtcttgc 27360
tttgttgccc aggctggagt gcagtggtgt gatctcggct cactacaacc tctgctgccc 27420
agtttcaagt gattctcctg ccttagcctc ctgagtagct gggattacag gcacgtgcta 27480
ccatgcttgg ctagttttaa aatattttta gtagagattg ggttttgccg tgttgtccaa 27540
gctggtctca aactcctgac ctcaagggat cagcccacct cggcctcccg aagtgctggg 27600
attacaggca tgagcctggc tggtgtattt gttttaaatt taaagtttac taaatttaat 27660
gatatctggg gaatcagctt gcttcctggg gatctggatg tacttgaggt gagagggtgg 27720
ggattcagaa ttatcctttc tatcgcagca tgttctggat tgattcatgt aggtctcaag 27780
tgtgtgtaat atttcatttc tttgtgcaat tttggcatgc cgaggcgggc accctgaagc 27840
tccggcagag cctggagaca gagtggggag ctctccgctc tttcccttcc ttcatcccag 27900
ctgacttcga ctggaattga attcatcagc tgctggagag ttgttttatt tgccctgctg 27960
gtggagaggg aggaaaggaa catcatgggg ccaggctttt tttttttaaa ggaaagattt 28020
gatttacttt cccccttagt agcatgatgg gcacctgcac ccgccagcta atcagaagcc 28080
actgtcccct gaatgcctcc gctgcccacc agatcctgac agcatcccac gcgggagcac 28140
tctcgtgtgc ccctggcagc ttctgctgcc tggcagttct ctaaacttgc tggtgtctct 28200
ctgcccggag gctcagaaac ccagaggact gaccacttct tgaggctcat gtccagtttg 28260
caaagagccc ccagcaagca gagaagggga tttttgtacc agcgatatct cttctccact 28320
cctcaacaca ctcctttcca ctctgtctcc tataaacatg gaacagccag gaatactcaa 28380
atcctagcct gtcatgaagc caaaaattga tagagatcta ctgtccagaa tgatttctta 28440
tagtgaccct gtgtttagtt ggtaagactt tcttaaacca tgagggattc tggtcccaca 28500
gggcagtaat atctggggca gagcctgaga cttttctcat tgatttcctc tgtgagccag 28560
gagtgactgc tctgatgcag ggtgctgtgt ggttggtaga agctggcgtt atcccatttt 28620
acccacgagg aaacaaatga ccagtggtgg agcgggagct cagcatccca tgtgcccact 28680
tcctcctcgg gtggactttt cacctgccca tgccgtcttc tttgcaaact ttactgcagt 28740
gacggagaca tctttaaata caaattcttg ggggaaccct gtgttccttg gctggagcct 28800
ggctgggaag gaggagggag cagagggctc tcttgggtgt ggcctattgc agttgagcca 28860
gggaaaggct ggtccactgg agacaccctc tctggtcacc gcagacttcc tgccctccat 28920
ccagtgtcct tctacttgca ggatgtgtgc ccagcagaga gaatctctga agccatgtca 28980
ttattgggat aacattcctg tcccagtcac cttatttctc agaaaaagga caatgggaaa 29040
caagttttta ttgaatccta tgctgggcct attaatgggg tctcttactt ttcatagcag 29100
cactgcaaac agagttacgt ttctattcat tttatggatt agaaagctga gatccagagc 29160
gggcagatgt aaacctgggg tctttaaaat gcatcctttt tgcaaacaaa taaacttagt 29220
gtattaaaag ggctggagag agcagagtaa ggtaacattt gggtggtcag catgtagttc 29280
tgggtcccca cagtggagat ggcacagtgc tgggtgctgg gggaactatg gtcactaaga 29340
gacactgaat aatttaatgc atgcccctga ttccatcact gactgttgag gtaacacata 29400
catttatatt gtcagtggtg gtgatgatta catgagctgc gtaaagcgtt tgaccagtgc 29460
ctgcacataa catagtaggt gctcaataaa gatcacccac tcttaagagg tgggaggagg 29520
tgaagtcatc tttctgggga gtgttgccct gttgttctct gctgcattct ttctgtcctt 29580
tgggctccga gaatgctggg ttgggcagtg tgagtggtct tctcaggcct ctgtgacatg 29640
ttgctttcat gaaaggttcc cctctagcca aagactgagt ggtccttgca ggctttctcc 29700
tgagtccttt tttttttttt tttttttttt ttaaagacag agactctgtt gccagattgg 29760
agtgcagtga cgcggtctcg gctcactgca accgctgcct cccaggttca agcaatctac 29820
aaaatgcatc tataaaatga tgcatcagcc tcctgagtat ttgggatcac aggtgcccac 29880
taccatgcct gggtattttt ttgtattttt agtagagaca gggtttcacc ctgttgacca 29940
gtttggtctc aaactcctga cctcgagtga tccgcctgtc ttgacctccc aaagtgctgg 30000
gattacaggc gtgagccact gcacctggcc tctctcctga gtccttttgt ttgtgcctgc 30060
tttggggatt ccctctggct ggggtggact gccgggatct gtttgtccag tgtacatttc 30120
ctggtcacct agcaccggcc agctgcggtg ctgggaggaa cagggcctgg ctctgggagg 30180
cagctgggag agtcaggaag tgaagaaagt tcttgtgggt gtgatggtgg aaacccaagc 30240
agcgtccaga gggagcacaa gagggaggga caaatcttgg gagggtcccg ggccaatggg 30300
acccagtgta agaaattgca cctgtcctgg cagatagaga aggtggaagc agtgaatggt 30360
agagcatcct cactcttctc tctgccagca agcacctttg gggaagtcct cacggacagg 30420
aatgtcgtgt gtcttggctt gagatgtcaa agaaacatgt tggacacacc atggtgacag 30480
agcaggagtc tcttaacccc ggcgtggttg aggctgccgt tctggtggga tctggggtca 30540
gtcaggggtt aacagtcgct cctgcttgcc tgattgacac agtaataaag gcagtgacac 30600
caaactaggt ctcaggaatg tgtcctcgtt agaaagactc actaatggtt gtgggggggt 30660
ggcccatgag tccttctggg tggtggcgag aagtagggga ccctttgggc tttgcccttt 30720
ttggtcatag gacttcactc cacagacata attgaaccgt tgggtttctg cagccaaatt 30780
caaatgtcac caatcttggt cacccctttc atctcttggg tcctctgtaa gttatagcta 30840
tctgatagtt tactgaaaaa taaactgaaa atatgtttta aattgtactt tcgatttaaa 30900
ataatgttta gagacaaaaa aaaagggtcc aatccacttg gagaaaagca ttgtcaaagg 30960
tggttgattt ttttcttttg ctgttttaaa gtggtaagtg gatgagtgtt ttggatatat 31020
tgatttttca ggtgtgcagg cggtcacatg aacagctgac attttttttt ttttcatgtg 31080
gacttcagcc agtcttgaca cctgcccctt aacgaaaagt aaaccatcgc cttgtttgac 31140
agtttaagtg cagtgatacg gatggaggca ggtttacgtt atgttaaagg cttgacaacc 31200
cagaaccccc ctgttggttt ctttgttgta acctttgagc cggtggcctg ctgaaatgtc 31260
acctttgccc ttctttaaaa gcaggaataa taggtggtga gtgggtggat gcctcttaaa 31320
atactggaaa gtgctgtggc ccgagggtaa gctttttaga agtgagtgtg tgtgttgtgt 31380
tgttttaatt aatgaatctt ctgggcctga agataatgag gtcagtgagg gcagccatgc 31440
tgcctcacag ctcaccttag ggtccttgtt gtccagaacg tgcctgacct actggagggg 31500
cctgggaatg cttctttgat tgacgtgggt aggaagacag atgtggcggc ctccatgctg 31560
atgggaggca gctgggaaga aggtcatggg caccatctca ggagtggcag agccacctcc 31620
ccctctcctc accccgtgtg tctggattct tccagctgtg tggtccttct tcctgcctgg 31680
aaatgagcat cctgcagagc tcggctcctg ttcacaccct cctcctaacc ccctactctc 31740
cctctccctt tcatccaggg ctggaggacc agatgggctt tacctgatgg agtgtgcttt 31800
gctgacatgg tgcaaagagc caattcctgg ttgcaaagag gcagctgggt gcagaggcgg 31860
ggtgcattcc tgtaataata ataacttgtg tttttataat actttacagt ctaagtactt 31920
ttcaaatact tgacctcatt tagttctcac cacagccctc tgaagggata ttactattac 31980
cttcatttta tagatgcgtt aaccagggct tgttttggga ggtagagggg gtgtgagggg 32040
gacagagggg agggaaccag tgttgaatga attctgaggc cctgccaaag cagccagcta 32100
gctaggtgtt gtttaatgga ctctttgcat ctacagaatg agggaggtgg gatgagggga 32160
aattatttca caataactga aggtcggaga gactaactct ctgctcattg tcacacagca 32220
gttgagtgcc agctgggatt tgtcacccag gtcacctgac tcctaagccc tgtgatcgtt 32280
ctcttctgtc tctagtatac ccagcataat gcccggcaaa gtgctggcat caataaatat 32340
ttgtcgaatg ttaaatgagg cttaaagaga accattcatg cttggcacag gggcacagtg 32400
agacaaacat gtttcctgcc ctcgtaacct tcgcttccaa attctgtgac cttgggcggg 32460
ttgcctgagc tcttttccag ctcagtttcc tgaaaactca tccggaaaat gggtaaaata 32520
tcagagtgca ttctgtatgg taagactgca aatgttagat gattctgcta cttattattg 32580
ttttcttttt ctcaccacac accttccctt tttatgtaca cctcctagga agtaagtttc 32640
tgataacata ctgcattgtt ggataacagc aacaaaaagc acttcctgac attattgccc 32700
aaatcaccaa atgaggcaat taccaacttt ggaataagaa tagcaacggt ggtaagagct 32760
gacatttctt gagcgcttgc catatgctgg gtgtactact ataagctgct gcctgcaatt 32820
atgatttggg aacaactctg aaagtagtta cctcccattt tatagaagag taaactgagg 32880
ttcagagagg ttaagtaacc cccccagggt ctctcaggaa gtagttggtg gcctgggatt 32940
caaacaccag aattggtctg acttcccact ctttaaacca cactcaaaac tgaactctcc 33000
acgtgtgtgt gttctgggca ttttcgcatc tcccttggct tgttgacagc gtggactttt 33060
gctttcccat tctcatagaa catggccagt gcaggaggag gaaatccaca ctggtctttg 33120
gactgaacca gaggctggcg atggtcccga aacagggtgc caagtggctg acccttgttt 33180
ttatgccttg cgctggtaag cttggggcac caggagttct ttgaatttct ctttcttgac 33240
tgtccacgcc ttctttaggc aatcttttaa caggctatgt tttaaatctt attgacatct 33300
ctgaagaaag aggaggaaaa aaaaatcaag acatggcctt agagaagtga caggttttct 33360
ttgagatttt gttttctgtt ttccttttta ttttgtgcac attgcaaaac ctctttggga 33420
tgatgatttc gtgtggtttc ttggtagccc ttgggcagct gctgccaggt ttcacccaaa 33480
tgcattgtga ccccctgttt cgtgggacgg ctttgcctcc acatggctga ttgtgctctg 33540
tgtgtccgct gtgggcagag tgtgattgta agaatcagaa ttctgctggg cttgcaagca 33600
tttaaaaaat ctctataagt ttgagaactg gttggaaggg agagatgcag cgacttagaa 33660
cacccggcct gcagctgagc ttccgtgtgc ctgggaggag cccatatgga gaaacaggaa 33720
aattccactt caccagaaag ctggggaaat gagtgggagt aggggccagg ctggttaact 33780
aggaagactt ttggtcactc tgctttactt agcctaaagt gttcatttcc cccttaagcg 33840
gtggttaata cgcgtatctg cagatttact ttttggatga tttaaaatct tgcaacatct 33900
caagggattg tatcctgatg atactgatta tattaataac aagataatag cttataatat 33960
aatagctagc aattaccaag cacttacctt acaccaggta caatgccagg catttgatcc 34020
ttacacgaac tctgagagat ggctgtttgt attcccattt tacagatgag ggaagctgtg 34080
ctgagagagg tgagttcatt tgcccaagct cacccacttt gagatggtct gcttttatat 34140
cctcttagcc caattctttt ggatgtcagc acttggcatg tattaggcac tggataagtg 34200
ttttgttgaa tgaacaaaat gatggaactt ggatttgaac ccaggtctga gctggctttg 34260
agtcttcaga atagtaggtc caattagtgg agtgggggct cagtagtcca aagggaaagg 34320
agcaaggaga cattgtgggg gccgagaaga gggcttctgg ggtgtttcct gggcacattg 34380
gcattaaagg catagtgtga agtgccattc aagaccatgt gctggattag tgtttttcct 34440
ctccacttga ggtgcttgcg attggctttg tgccccggtg tctgcaaagt gagttgggct 34500
gaactcagga agaccttttg gttgggatga ctgtgtattc acctgcacct gagtagggac 34560
tgagtttcac ttgccagttt taccgcagca agacctcgtt aagttggctt cctctcattt 34620
aggcatttgg gaaactttag gcggctggag tttaattctc aaggcaaagc cccttttcaa 34680
gggacatgaa gaaaggcaga gggatatatt taaaatacct gaatgaactg tttctttttc 34740
tttttatttt ttgagatgga gtctccctct gtcacccaag ctggagtgca gtggcacgat 34800
ctcagctcac tgcaaccttc acctcccagg ttcaagcgat tctcctgcct cagcctcccc 34860
agtagctggg actgcaggtg tgcaccacca cacccagcta atttttctat tgttttattt 34920
tattttattt attttttaat tttttttttg agacggagtc tcgctctgtt gcccaggctg 34980
gagtgcaatg gcgtgatctc ggctcactgc aagctccacc tcccgggttc atgccattct 35040
cctgaatcag cctcccaagt agctgggact acaggcacct gccaccacac ccggctcatt 35100
ttttgtattt ttagtagaga tggggtttca ccatgttggc caggtctctt gaccttgtga 35160
tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccact gcgacttgca 35220
tgtagacagt aatggcaggt cactatcagt gggtctgtta atcaggtgtc caacctggtg 35280
ctgggcttgg tggctcatgc ctgtaatcct agcactctgg gaggccaagg cgagtggatc 35340
atctgaggtc aggagtacaa gaccagcctg gccaacatag taaaacccca tctctactaa 35400
aaatacaaaa attagctagg catggtggga tgcatctgta gtcccagcta ctcaagaaga 35460
tgaggcagga gaatggcttg aacctgggag gcggagattg cagtgagcca agatcatgcc 35520
actgcactcc atccagcctg gacaacaaag cgagactctc acaacaaaac aaaacaaaca 35580
aacaaacaaa caaaaagtca cttgcttctt tttttgcttg cttatggaca taaaccctgt 35640
aaactatctc atacatcatg ggagtgagtt tgcagtgggt agactgctat tcacaaactc 35700
atatacatcc tatgaaggag tacaggttaa ataaccatta tccaaaatgc ttggggctga 35760
aagtgttttg gatttttaat ttttttcaga ttttggaata ttcgcatata cataatgaga 35820
tatcctgggg atgggaccca aatctgaaca ggaaattcat ttatgtttta tataaaccct 35880
tttttttttt tttttttttg agacagagtt tcacgcttgt tccccaggct ggaatgcagt 35940
ggtgtgatct cggctcactg caacctctac ctcccaggtc gaaacgattc tcctgcctca 36000
gcctcctgag tagctgagat tacaggggct tcccaccacg cacagctaat ttttgtattt 36060
ttagtagaga tgaggtttca ccctgttagc caggctggtc tcgaactcct gacctcaagt 36120
gatccacccg ctttggcctc ccaaagtgct gggattacaa tgtgagccac tgtgcatggc 36180
cttatataaa ccttaggtaa ttttatacaa tattttaaat aatttttgtg catgaaacag 36240
agttttgact gcattttgac tgtgactcct cacttgaggt caggtgtaga cttttccact 36300
tgtggtgtca aatttcagat tttgaagctt tatataatga gatagggtct tgctctgttg 36360
cccaggctga agtacggtgg cacaatcaca gctcactgca accatgacct cctgggctca 36420
agtgatcctc ccatctcagc cacctgagta gctgggacta caggcatgca ctgtgactgg 36480
attttttttt tttttttttt ttttgagacg gagtctggaa tctcaagtct cgctctggtg 36540
cccaggctgg agtgcaagtg gcgcgttctt ggctcactgc aatctccgcc tcctgggttc 36600
aagtgattct cctgtctcag cctcctgagt agctgggatt ataggcgtgt gccaccactt 36660
ctggctaatt tttgtagttt tagtagggtc ggagtttcac tgtgttggcc aggttggtct 36720
tgaactcctg aactgaagtg atctgcccac cttggcctcc cagagtgatg ggattatagg 36780
catgagccac cgtgcccagc cttggctaat tttttatatt ttttgtagag acagggtttc 36840
gctatgttgc ccaggttggt cttgaattcc tggactcaag caatctgccc accttggcct 36900
cgcaaagtgc tgggattaca ggtgtgagtc accgctcctg gcctgaagca ttttggattt 36960
ttgggttaga gttgcacagc ctttactgtt attatcctga tgttattatc cacattttac 37020
aggcaaggat ctggaggcgt agagaggtaa aatcattttt tcaaagcccc agaagtacta 37080
agccgcagat tctgaatttg aactcaggca ttctgggtca gaattagtga ggttttaagt 37140
taattttttt ttttttttta gatagagtct tgctctgtta cccagggtgg agtgacagtg 37200
gtgctatctc ggctcactgc aacctctgcc tcccgggttc aagtgattct cctgcctcag 37260
cttctagagt agctgggact acagacatgt gccaccacgc ctggctaatt tttgtatttt 37320
tattagagat ggtgtttcgc cacgttggcc aggctggtct tgaactcctg acctcaggtg 37380
atctaaccac ctcggcctcc agaagtgctg ggattacagg cgtgagccac tgcgcctggc 37440
ctaccccctg tcgcccaggc tggagtgcaa gtggcacagt ctcggctcac tgcaacctct 37500
gcctcccagg ttcaagcgat tctcctgcct cagcctcctg agtagctggg attacagata 37560
cccaccacca tgcctggcta attttttttt tttaagtatt tttagtagag acagagtttc 37620
aacaagttgg tcaggctcct cttgaacttc tgacctcatg atctgcctgc ctcggcctcc 37680
caaagtgctg ggattacagg catgagccac catgcctggc ctaagtttgg tttttaacca 37740
tgctgctttt tctagaccct tctgtcagcc agctccacaa tggtgaatca gggagttagg 37800
tccgtctgta agagagggcc caggagctgg gtcagatagg taaagagaca ttccttagtt 37860
cttatcctct gctaccaagc catttcttgg gatcaagccc tctttggcct gtgtcattcc 37920
acctccatta agttcagcct tctttccttc tttccacatc tttccactgc tgttgaaaac 37980
ttgagacctg aaatcccatc tcctgaattc ctgggagctc tagaagtgga gatggccagg 38040
ttctgtggtc agagctggtt gggattacaa ataaaccaaa gcctgggaaa ctttcttgct 38100
attaatagcg cagacctttt ggggagggaa tacccaaact cgatgctgtt ggaattgatt 38160
ttgcctgtct agatgacata ctaatgagct aagtggttag cttcggatca ttattgctct 38220
ttcccaagcc aagttctttt aaagactaaa accacaaaag cagagaacga gttgggttag 38280
agaggcatag tggctgggtc cagagaaggg agagtggtca gccctggcct taaacatgag 38340
aaaataaagg tggtccttgc tttggaatga gttagtggtg ctgactaatt caactggttt 38400
ttctttttct ttttggaagt ggaatttgat ttggtgtctg gattttgata gggccattta 38460
tatttcttca gcactttttg gttcttgcag aaagttacat tcctagttcc tcaactgctt 38520
atttcttttt ggtttttgaa gcaggaattt gatttggtgt ctgggttttg ataggggtgt 38580
ttatgtttca tcaatgtctt ttggttcttt cagcgtttct ctccttgtct gtcatgtgtc 38640
agagagggtg cctgtcaacg attctctctc tccagggaga aagtctttct taaaacagcc 38700
ctaagatcct tatctcctca aatcacccac tttgatgata atatccattg ttctcttctc 38760
tgcttcttgg catattctag tcagtctatg tatacaatta aaaaaacaaa acagccctct 38820
gtgtccaaag tgcttggaat atcccagtgt ttcacaggag actttggaag tggacaaaac 38880
tgtatttcct tccccaaatg aggttattgt gctcgaaata tctcctggta gtttattaaa 38940
ggaaaccgca ggcaggggta agagaggcag tttctacagc ctgcaaccct attatcttgc 39000
ctcttctttt cgaccctcct tcctccctct cctcttctct ccccccctca ccctattcaa 39060
cccagcccca catgtcatgc cgtccccagg aggtagccct gcagccctgc ttctctggga 39120
tggtctgttc ttgccacccg tcccatggaa cgtgaagaag gaatttgggg tgtggacttc 39180
cttgagtgac taggattaga cccgtcgggt ctgcagtcag acgagaagcg tgtgggcaaa 39240
gggaactatt gtgtgaggct tctctggaca gaaagcctgc cttcatcttt tactgtgcct 39300
aatggacaat tgagacattc agcttatgtc tgaaaggaaa gtgggccggg atggtctagc 39360
agacctccca gatgaaggct tgtaggagga gcaaatagag acaaggatta ccaacagggg 39420
gaacaactgg ggcagagtcc tgggagagaa tgtttatttc cttgctctct aggagggatt 39480
tggaaagagc cataatcctg ggttaggagt aatttgttac agcaagatga tacttgagtg 39540
acaggctgct tctggctgag gcagcaagac ttgcatgcag gggggtcgtg gggcctccag 39600
aaggtcagcc tcccgtaaat cttcaccctg gctttggggt ttgttcctcc ccaagcaaaa 39660
ttaaccagag gcactgctga cctttgggct tcctgggtgt agcgttacga agcatctcca 39720
catgtttgtc acagctagaa tttgacaata aaaatttgga cagggagacc ctgccagagc 39780
cactgacctc tttccaatgt gacaagggga aaaaaaacaa aaggaaaacg cagcacgggg 39840
tgcggtttca gttgaagttg gaggacacgg agcccagcct gtctcgcatt tgctgtctat 39900
gtagactcac taaagcaagt taattcattg ctctttgacc gccaagtctt tcgttgtctt 39960
ttgttgttgt ggaatggggg aaagaaatac agaatgggga ggagaaccta attagaaaaa 40020
tcaagccttg agagctccca gccatggaga aagaaaggga ttttttagaa gttgtgattt 40080
taatatctgc tgcaatctga tgattcatgg atttaaaata acccttccag gtcaccagga 40140
ccctgttact tgctggcttt gtacctctca aaggtcattt gttggcttcg tctcttaaca 40200
atttccatgg tagacctaaa atttctggct gtgaaatccc ctgtgtagtg ggaagaagaa 40260
atagcaaatc ttagctgcct tggacctgat ataattattt gtcttcattt acatggttta 40320
tccttcaagg ttgaataaat gatgtgggag ctagtcaagg ggctttaggt atgtgatttc 40380
atgcctactt ttttttaggt agagaaactg aggtcacagg gtactagaga atggactcta 40440
agattcaggt ttctgaattg cctgtggttt tgttgactca actgctcttc tgttgttttt 40500
tagccacatg ccttgaaaca gtcctctttc ccatgtttct tcatcagcac cattaaccca 40560
aggtatactg tcctctctta tctttcacaa ggtcttggag ttcccatgcc tttgtaagca 40620
tccctccccg agattcagca ccaaccaaaa tcacatttgg aaaaattgct tgtttcccaa 40680
gaagctttgg aggatatgat tttgtataga acgggttcac aggttttctg ttcattcttc 40740
tatggtggag tgtgtgtgta tgtgactctg tcttctctcc attcctcttt tttttttttt 40800
ttttttgaga tggaatttcg cttttgtggc ccaggcttga gtgcaatggc gtgatctcgg 40860
ctcactgcaa cctccacctc ctgggttcaa gcgattctcc tgtctcagcc tcgcaagtag 40920
ctaggattac aggcatgcgc caccacgtcc agctaatttt tgtattttta gtagagatgg 40980
agtttcatca ctttggtcag tctggtcaca caaactcctg acctcaggtg atccaaccgc 41040
ctcggcctcc caaagtgctg ggattacagg tgtgagccac cgcgccaagc ctccccatcc 41100
ccttttatct cttaaatgaa tgtggtcacc atcaaagatg gtgcctgact cttttttgtt 41160
ttcagttcat cttaaattca catataattc acacgtcata aaatgtaccc atttaaggtg 41220
tacagttcag tggtttttta gtctatttag tatatttaca agattgtaca aacataccag 41280
tatcttaata tttttatcat ccccaaaaga aacactgtaa ccctagcagc cagtctctac 41340
ccgccttccc catagctcct ggcaatcact aatttacttc ctgtctctat gaatttgcct 41400
attttggtta tttcatataa aaagaatcat acaccatgaa actttcttca tctgccttga 41460
agttagcata ttttcaaggg ctaccatgtt gtggcatgtg tcagtactcc atttgttttt 41520
attactgaat agtattccat tttatggctg taccgcattt tagttatcca gctatcggtt 41580
gagacttggt gcattcttat cccagaacat accatattca gctcccagtg acacccacat 41640
tcattcctgg gctgctcctt gtcttccagc tattttcctg gtctcctgtt gcctctgcct 41700
acttcagcat gctgtagaga catgggtagt aactaaaaca ttccaattaa ctgcattgta 41760
cttggccttt ttataagaag cagtaattag aaaatatggt ggccacaaga ttgatattaa 41820
agtgaaagat tgtaaatact tttctgcctg aaggtagatg gcctctggcc tgcctcttag 41880
tgggaggttc ttccaggagc ttgcaagcat ccattatttg ttagtcatca gcttagcggc 41940
caaggagcat tagcctgtct tgctctgtct gctgaagact ctgagagaca tgggagggca 42000
agggctgctc cttttgaatt cttccaatgt cttcatgtcc tttaacctcc tggcttaggg 42060
acttgtgtgc tggtggtgga gctgacattt gtttggaatc cacagccctt tgggtgggac 42120
tcaatcttgg ggttgcctga agactttgag atggctaggt ctgggcctct tttggtcact 42180
atggaacaag actgtctcag aggccagagt ctgtctcacc agctccctgt cttgggactg 42240
caccattgca gggtctttgc cctcccctgg agatttctct tcctgcctgg gcacccattg 42300
gccattctgc ccgtaagctc agtagggtgt aggcaaaaga gttctggcct ggaagtacca 42360
aagtcctgcg ttctggtttc agtccctcat aactgtgtat aactaagtca cttagttttc 42420
tgtgcctcac tttcttctgt tttaagatgg atttggagat tattggcttt gaccacctaa 42480
aaaggatgta gtgacaatca atttagaggt ctaaaagagc ctttgaggaa gtaaaatgga 42540
atcttcaaat ggactacatg ctgattattg acactgccct agcactgata gttgatgttg 42600
actgatggtc agaattgctt ggcaagttgg aaaaaagtac gtacagatcc tgggccacta 42660
ccaagtttca tttaacagat ctggagtgca tcaggaaaaa agtccctcta aacaagccag 42720
caaggtttgg atactgtgca accttttttt tttttttttt ttccttttga gatggagtct 42780
ggctctgttg cccaagctgg agtgcagttg cacaatcttg gctcactata acctctgcct 42840
cccaggttca agcaattctc ctgctttagc ctcccgagta gctggcataa caggcgcctg 42900
ccaccacacc cagctaattt ttatattttt tggagagatg gggtctcacc atgttggcca 42960
ggctggtctc gaactactga cctcaaagtg atccgcccac ctctgcctct taaagtgctg 43020
ggattacagg catgagccac tgtgtctggc cctacttacc ttctttgtgt taattcctgc 43080
accattgatt agcttattgt cccattgact gtgtctttag atgacttctc tgggcctcag 43140
aatatctagt ccatagctga cacagagcat ctgtttaatg gtaaatgctg caggaatcca 43200
tgcattggag tagaaagagt tttagatcat gttcctcatt tcttgctaca gacttaggca 43260
aagcgtggag aagaggttgt ccaatgaaga aatgaagtga catgccaggt cagtggcaga 43320
gctaggcctg gaaaataggt ttccagactc ttccctttct accatacttt tcctgggagt 43380
acgcactcgt aatttgaaga gcgacttttg ggagagggtg gaaggaaggc ctgggcctca 43440
gcctaagggg cccattggtt gtgagaggag ggtctggtga aattccatac cgattgtccg 43500
tgtgtgagct gctgtaccat agcctccctg cagaaccact aacctgtcaa atgcagaaat 43560
agttcaggga cagagctgtt aaaggattgg cgggttaaag aaaacagtga atcccaagtt 43620
ttgttaattg gatttttttg tttgttagtt atttgttttg cttcattgtc ttcatcacac 43680
caggggcctc cttaaatctg gtggaaaaat ttccttggaa aacaattcag tgtttgtcca 43740
tagacttggg agggagagat gctagatgct ggaaagtctt gcttattact ttggggacac 43800
tgagatgttc ccttcaccat gtactttgag acacacatcc tggttgagtt caggcaagga 43860
tgcctaacag ttgataagaa aactgggaaa gatagaaggg atttgtaagg taagtcaggg 43920
tgagtgaaaa cacatccggt atgctggaga cctagatgct tgactgccac tcgctcctgt 43980
cacctcagtc aatctgggtc ttgctctgtt ggccttagtt tcctccttgc taacaggtta 44040
gttccacctt tctgcccatt tattttgtag ggttattgtg gatgtcattc tgaactctaa 44100
aataccctct aaatatgaag tgatattagt gctctttaca ttgttatgat taaaaatatt 44160
tatgagaaaa aggttaactg taaggatttc attgaaaatc ttataacaac caactgatag 44220
agatagaaga taaggctatt aaattgttca cacagatgcc ttgatatcct acctttttcc 44280
ccctatattc cttttatgtg agaaatgaga tagtgattta agggaaaaac ttaaaagagt 44340
tccgactatg ttggtttttt ttcccccaag tcaaccttaa tatcttactt aaatcttttt 44400
cttttttatc ttttcttttc tttttttctt ttccctccct ccctcctttc ctcctcctcc 44460
ttcccttcct cctcctcctt ctgctgcttc tctctctctc tctcgtttcc ttttcttttc 44520
tattcttcct ttttcttttg agaccaggtc ttgctctgtt gctcaggctg gagtgcagtg 44580
gcaccttctt ggcttattgc aacctctgcc tcctgggctc aagtgatcct cccacctcag 44640
cctcccaagt agctgggacc acaggcacgc gccaccacac tcagctaatt tttttttttt 44700
ggtagagatg gggtctccta ggctggtctt gaactcctgg actcaagcaa tcttcctgcc 44760
tcagccttcc aaagtactgg gattactggc gtgggccacc atgcctggct tgaaattttt 44820
ctatggcttt attctttctc caagtacaga gtctacccaa ccttctgaga tctttggttt 44880
tcttttccta ggtaactata gtacatactt atttatgtta aacaacagca atcacacatt 44940
tctttttcta tacagtcatg ctttataggc aaataaagcc tccgtcttag gctttctgga 45000
ttttttcaaa agatgcaatt cctggagtat gtttttactt agagcaaagc agcctagtct 45060
cctatacctt ctgcatctgc agaaaagttg gttaaacaga ctttgtaatg atgcccctta 45120
caattctgaa gggacttgtg aaatagtttc acagagtttc agtgttaggt atatttgatc 45180
aatgctaact tttggaaaac tttggtgcct gtatgattca gagggtaggg cagaatatta 45240
aattaatcac aacttcttgt attttaacca ttctgggtaa attgggattc cgtgacgccc 45300
aggcaaaatt atttgtttat agaagatggg ctgaattttc catcgtccat ttctgagaaa 45360
tgaggtaggt ttagaaagag acaatcaggc ctcttcttta acagaaatgt ttgtgtctac 45420
taggtgtgtg tcacaatatg agttcctgaa gaaataagtg tccgctattg ggttgtatac 45480
ttgtacttcc tattttctta ttttgcacat ttttctggta tttccctttc tatggtgagt 45540
ggcttctgat cgtctttcct tttgtaaagt gtaatgatat gagaatcata atcgtggtgc 45600
ggtcttttgt gttgcatatt tgtagggggt cagtatgaat ggcccgtggt gaggctgcac 45660
tgaaagatta ggagcagcca ccttgatgcg gaggaggctt agtgactttg gacatgatgg 45720
gctatggctg gctatactct cagctttggg cgcataagca gagtattgat tttgtatttg 45780
gttaaaacca gaagtacaac tttctggcac cagaggatta ggaaaattta acagcggaaa 45840
gccatcatga ggatagtaac caattaattc gatttttttg gtcagacatg gctcccacct 45900
gtaatcccag cactttggga ggctgaggtg ggagggtcat ctgaggtcag gagtttgaga 45960
ccagcctgac caacatggta aaacccgatc tctactaaaa atacaaaaat tagcctggcg 46020
tggtgatacg cgcctgtaat cccagctact cgggaggctg aggcaggaga atcacttgaa 46080
gctggaaggt agaggttgca gtgagtcgag cttgcgtcac tgcactccag cctaggcaac 46140
agagtaagac tgtatctcaa aaataccata attcgttttg tcttttcttt acttttttct 46200
ttccttttcc ttcccctctc ccctcccctc cttccctttc ctcccctttc cttccctttc 46260
catctctttc cttcctttct tttctctctt tctctctttc tttcaacagg gtctcgctct 46320
gaaccttttc cagtcagaat tgctcaggga tttttagact tccattctgg aaaagagggg 46380
gtagttattt tggtgagatt gtggtcttgt ggttagacct tgtgatgggg gcctcagcca 46440
aagggttcag gatttttttc caagcttttc cctcacaact tgagttaatc cgaaacgttg 46500
ctattaggcc accggacatg cttttctgca tgcctgtgtt gggctgtttg gattgaaggc 46560
ccagcaaggg aaggcaccct cgcccatctg acacaggcag gcctctacaa ttttattccc 46620
taaccagggc atgacaaact atggcccata gaccaaaatt ggcttgccac gtgctttttt 46680
ctggccagtg agttaagaat gactttttat tatcattatt attaatattt tttgagccag 46740
gttctcattt tgtcacccag gctggagtgc agtggtgcaa tcacggctcc tgcagcgtga 46800
aactcctggg ctctagcaat cctcctgcta acttttttta tttttgtaca gtcttgctgt 46860
tgttgcccag gctggtctgg aactcctggc cttaagcaat cttccggcct tggccttcca 46920
aaatgttggg actacaggcc tgagccgctg catccagcac ttttattatt tttaaatggt 46980
tgaaacacat caagagagga ataatatttt ctgacacagg aaaatgatat gaaattcaca 47040
tttcagtatc tgtaaataag cttttattgg agcacagcca tgatacaaga catatactga 47100
ctgcctgtgg ctgctttcga gttacaatgg ctgagtcgag tagttatgac agagattgtg 47160
tgggccgcaa agcctaagat atttgctgtc tggcactttg cagaaaaagt ttgccaaccc 47220
tgccctgaac aaataaaggg acaaattcca cttgccccgt ccatctgtgg agcagagtca 47280
ctgaaaggaa atactggaaa tactggaagc cacttggtgt tttatcaagg atgtgaggtt 47340
tcctggcaac tttgtcgcca tatcatcatc atcatcacca tcatcatcat catcatcatc 47400
atcatcatca tcatcatcat catcatctgc cctttaagtt ttctgcttgt ttagaaaaga 47460
aatttataca gagcccccag tagcagctgt aagggggcag gttcttggag cagcccatcc 47520
tcaacattct tgctgctgat ggaagattct caaggatgaa ggcccctcta tgggagcagg 47580
atcagtctgg ctttagtaga tgccaatttc tgctaagact atttcctaaa ggagcctctc 47640
ctcatttgcc ttttctccct gttttcattg ggggaggtgg aagaggagaa aaataattag 47700
agatgctcac ctttttcttt ttgctggcaa tttaacagtc ttttcagctg ctttgattcc 47760
tttcaggcca ttggtgttgt atatatttca agatttgctc acaggtccaa agcttaactt 47820
aagctccctg agacatatca taaaatatga tttggggaaa aaccctaatg ggccatgatc 47880
agaacattat tattcaacaa aggatgaaat gcttaagcca agatggcctt ctttctttct 47940
ttctttcttt cttttttttt aatgaaagtt gagcagactc ccgtccaaca gttttcaatg 48000
taggaattcc cacagcccca tttgattgca gtttgttgaa aagtttaatg tttttgtagg 48060
caattcataa tttccacatt gaacagcctg agaggaagag agctggagcc cactgttgtt 48120
tttgtagtgg gatggtggga actttttttt tccctccccc aaaaggatat aaaactaagt 48180
cagatggttg ggaaaacgtg gcacagggtt ccagcccttt tgtaaatctg agatgccccc 48240
tcctttaggt cttcctttag gacccaacag aatagaaatt cctgctgctt aatgtctcca 48300
ggaaggaaaa aaattttcct ctaggctgta atagtaccta atttcctttt tcttctcttt 48360
atttatttat tttccctatt aataagcacc aattgtagaa gatgaaggaa gctgggaaac 48420
ccatcacttt tggagaaggt taatagcttc ctttagaaaa tcctgacata atacttattt 48480
ccccaaaagg cacttcatca gcctgaatgc cagttaagat tcaaggaatg ggcttggatt 48540
tgtgtgtacc cagcggttct gtggcatcaa gttgcactgg gaaggagagt ttggggctgt 48600
cactgtggag tccctgcaag tcagcaggac cagggctgtc ttcctgcacc atctggattt 48660
ggttagctct ctctgggcag tggggccgag tctcatttcc tccaacaata atgttatata 48720
ggcaatgatc ctgggctgcc ctaacataat tgaaaattat gtgtattgta ggcttggagt 48780
gctgaaatgt gggctcataa aaatatgtgg tgcaggtagc ctatggagat tggatgtggc 48840
acacaatgaa gcttttatgt aaagtaagaa ttataagtct ccatgttaat attgtattat 48900
gagtatgaca gttcttgggt gggtcctcag ggcaggtctg tcaccttcaa caaagcccga 48960
gtttcctaat tctacagagc tggtatttgg atgtaatcaa atcggttttg caggtggcca 49020
aagatgaaaa cttgtccacc aatccagctc tccccactga gggatagcat gggatgtaga 49080
tgggtttgac tccatttggc atttttgttc acgggttttt atgagatgga gaggtgagtg 49140
ttggtgggtg tccattttgg ttggcctcaa ggaaatgact ctattgagtg gttttgacca 49200
atgcagctca tatagttatg tggtaagtga gaatgggaag aagttgggat gagatggggc 49260
agtttagatt cccagagccc tctggcctgg gttacagatg gagactggaa atatttactt 49320
tagtggttct caacttgaga tgatactgct cccagagaag gtatttggaa gtgatgagat 49380
ggtaaggata accaaggggg ttcctgttgg tatttactgt ctgggggctt ggagtcctac 49440
aagtccttca gtgtttgggg cagactcccc acctaatacc ctgtcgcaga taggacaact 49500
cattcagtac acagatgaaa aaaacagaga tcactgaagc aaggggagtc gatgcagggt 49560
cttgtggcaa gatgcagaca caaccggact aataactagg ttgctcacca cgggaggcct 49620
ctaggtgaaa gctctgaatt tgtagcagac acacccacct cgtatagatc ctagacgtca 49680
tgggaaaatc gactgtgtac tttggcaagt agttcttggg caatgatctt ccagctttag 49740
gtataaccaa atttggtttg aatttgccaa gcagtcgtat cttcgaggaa ctccgtcggc 49800
tggcttgtgg atggctttgg cacttctgtc tctcgtggga tttgtgcaaa cccttctttc 49860
tgtattatcc tttcctgtct tttttctttc tattgaaatt gttctgacca tcaagaccta 49920
actctgtgca gccttcccca gtctattgtc ccagaaattc tgtcatcttt cttggcattt 49980
cctgagtccc tgagtctctg tcacagtgtc accatgttct gtcttgattt acctgtgtct 50040
gtaaggctcc tcatgctggc aaaactcccc gagagcggac atctttgtct ctcctagtgc 50100
ttgtcacagc ctgtacacaa agcaagtagt actcagtgtt cattgagtaa agttttctat 50160
agaattaata ttaaaaccag ccatttattt tgcttgagga ggtctccgaa atgaccaagg 50220
tgtctcctta tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg 50280
ccttgagaag cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt 50340
tggtttcctg agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagtttc 50400
ttatacatgg gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt 50460
ctgcaaaatg aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg 50520
cttttgacag aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg 50580
ggacagacag aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta 50640
aagcattcct ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt 50700
taccaagaag taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg 50760
tactcaagta gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa 50820
agtgaaggat gatgacattt gaaaaacgga ggttgaaaag gagcagattt ggaattgatg 50880
gtttcctagg acacttctgg cttgagattt gtgttttact ttcttccttt ggaatagctc 50940
tatattcttt cctctccctc cccacctctc ccactcccct ccagccccca ccaagttaag 51000
gtagtagtaa tgaaatcatt ttttctgaag ctaccctgta ctttgaatgc aaagacaaaa 51060
aatacagttg ctagtaacat taatcttcta tatgtgtact tactgaactt gagctctgag 51120
gaagacccta ttggaattgc atgctttttt atttttttaa tgattatttg catgcttgta 51180
tgtttttcag tttctgaccc atgtcacagt tatttcttgg gctagttgtt ctgcatttac 51240
tttctgaatt cattgttttt catttcactt ttgtttcctc tcgccagtat ctccagatga 51300
aatggccact gcttgatgtc caggcaggga gcctccagag tagacaagcc ctcaaggatg 51360
cccggtcccc atcaccggca cacattgtcg taagtaacct cccagagatg atggcttcct 51420
ttattgaggg ggtgaaaaag aaaatgcttt tttgatgata acaggcctta tttgtcattt 51480
ttttctttct ttaaacacat tttctttgga aatattgttg ggtatagttt atatctataa 51540
ggtattcatt ttctgctatt ggaccttaat gattgtaacc tacctggaaa ttttacaaac 51600
ctttcctcca ctcttttcca tgtatttggt taaaatctag ccttgtgggc tctagtttat 51660
aggacacaat caccatggta tggaggagac tagaggtggt atcaaagcag ttataaaaat 51720
acattcaggg caggtgaagt gaagaagagg gaattagaaa actcaaaagg gggtcctgga 51780
tttgaaactt gcctattatc ctctccccca atttatctta atatttgttg gcaacattct 51840
acactaacat tagaaaaatt tcatctgggc tggctgactt gtaaacctag agtagaaatg 51900
aactttgaaa ggctaaaatg gaatttaatc tatacatcca tggctttgaa agtatgtagg 51960
tttgatagag aaagcatttg tttttagtac taagagacta caagtgtgtg tctacatata 52020
tttttaatgt attttcttag ggttttgtag gctctaagag tggaatttat aaattaacct 52080
cttgagaaga tagctcagcc ttatttgaag attcccttct atgtatttat atcatgagct 52140
ggacttcata cttttgaaat aattaatgga aggcatattt ttataatgaa tccatccatg 52200
acaggtagaa ttatgcaaag catgaatcaa tcatgggttt ttcatttgag tatcacaaaa 52260
tgttaatcat aaatacattt tgcctctata ttgtaatttc taaaaattgc aaaataagtt 52320
tcttaagtag aaaaatctta agatgcattc tgccattttg ggctaactgc ctccttattt 52380
tggagcttgc tgtaattgag catgtgttat ttaatgagtt atacctctgt catatgtgtg 52440
tgtttatatc acaaaataac ttatttttat aaaaccatat tttgagtcat catttgtgac 52500
aatgtcttct tttctctggt ataaatgagg catgtagaaa gaagattgac atttgctaga 52560
agcttcccct ttcctctaac tccacaataa aatggatgct cataattaca tctgctccta 52620
taaggtcaag atttcagggc tggaagtgac cttagatcat ttaggcccaa cttgccctca 52680
ggaaaggaaa ctgaggccca gagatgcctt aagtgaattg cccaatgtca cacgctgagt 52740
cagtggccag agcaaggctt ggatccagtt ctctgctccc tttccagagc cttgtgatgt 52800
cttctctcct acaggaggtg aaaataactg ctgtggctgg ttctgttttg ctgactgtaa 52860
attgggtcat ggtcagggac agtgcatagg tgtaaagaag ttgctggttg ggggttctaa 52920
tgcaggtttc tccaaaagtg aatgccctgt taaaaaaaaa ttcttaacaa atatacagag 52980
attttttttt taaaaaagtg tgacagttct agacacctag agagtaaagt gaagaagcct 53040
gttttcaggt ttcccgcctc cctgaatttc ccagcatggt ccaggctttg aaatttattt 53100
atctgctttt ggcaatggtt gatgggaatt tcccacattt attttttagc tacagagaaa 53160
ggacattatc tttaaaatct cttcgttgtt ctctctcttt gagtgaggag agaagatgtg 53220
aatcctggca gtggttcaga gtggacacag cccctgtgtt tgtggcatag gctctgtggg 53280
ccccatgcca gggagcagta cccccgtgta aaggagtggg ggtttgtcca tttggataga 53340
gcaaagatcc tccacctcaa atcccacaag aacagttgcc acaacctggg ccctaagcat 53400
ctcattttcc tatgtagaaa ttaatgatct ggaggagatg gcaaaacatt ccttccagag 53460
cctgtgtgga ttttggccag gggtgcagca agggggctta ggcacctttt tcctctgctg 53520
tgtcttagca ggcgtgttga ccatagcaac tcccctgggg catacacacc ctcttgtaga 53580
tggagacctt tgtccaaagc agccacagct ggcaactgtc tacaatcttt tgggctttct 53640
gctgtgctca aggggatctg ggaatggcca ttgcctagag gggatgggct ggtggaggaa 53700
ggtgggctct gggagccggg gagaagggaa aagccatgaa tttggacaaa aggacaaatg 53760
tggtttacat ttgtgaaata cttgaatgct tgtcatgaat ggtgactttg gttctatgag 53820
tcagccctgt gatggggtat ttctgcagtc ttcacctgac accaggggtg agaaggagga 53880
tttctgggga ggaggaaaga gttgagggag ataggaaagt agagtggaag aaaggccttg 53940
cgttgttgac ctctatccac ctggtcacct atagtttttg ggattgagga tgcatacacc 54000
ttgagactac aaatttatga ttatattttt gctgaacata aggcaatgtg ccaaccaaaa 54060
ccagctgttc tttggctggt acagtgtgtc tttgtttgta aagggtgcat tctgaatggt 54120
ggctgataca tcatttgggt ctttgtacag ttaaacattg gccagagggt ctggttcgtg 54180
tttagagtcg ccgatgaagg gctaactttt ctccagacac ttggggctct tgttcacact 54240
ttgcttttca ctcttttaag taagacatag tcacatcaca gtgtttcatc agacatgttt 54300
caaaataatt gtctaaggat tgcttcttaa tttccccgaa atttggaatt gttgtaactt 54360
ttgggccaag ctatttcata attatttcta atgtctcgct tgaagaatag ggatgtattc 54420
agtgttgatt attaatcatt cgaaactaca actttacaga ttgctaagaa gaataacttc 54480
ttccagtacc catatggggc agaatcttca cgtgggaatt cagagcattt tgttggacta 54540
ttttaatctg attggattat tttcatgtgg tatgtgggtt accacattag aaacgattga 54600
tgtgtagaat aaatgttctt aacaagtgga ggtcaactta tcaaatgata tttacattaa 54660
gaatagactc cacaaatttt agttcctgta gctgatatag catctcattt gttatataat 54720
ccagtgattc ctaatctgtg ttcagaggag agaggaaatc gattgcaaca gggacgatgc 54780
cttcattggc tggcccaaaa ctgggagttt atacaaggcg tcagtctttg ccttcctcct 54840
ccctgccttc cctcttcctt cttccttccc catactcccc aacaaattca tggacttctt 54900
aacaactcag agacattagc cacaagttcc aagacacccc caccccccag cctccccagt 54960
cctattttcg cattcatata actaaactct ttttctttct tggtggagtt ttgaaattta 55020
tatttttaat tctttgctcc cttttttcct cttacaaaat gagtgccaag cagctaagtt 55080
gtgctgagtg gtagagtttg agtcagtctt ggctggtaag ctgtggggtt aggagccgct 55140
ccctggatac cacctctggt gtctttgcta tacaaagact ttcatttagc ctcctttgta 55200
tccagcaaaa aaagattcag tacccaaaat ggtggtattt tggtatagta tgtatcttac 55260
aaaacggcaa aagacttcaa aagttcctac aattttatct tgggggtttc cttttgaagt 55320
cgatgtagaa ttttaccttg gggtggattt tttgtacttc ttggtctggt gtgttttgtt 55380
gtgtaatgag catggaggtg tgggataaga aagcagactg aatcccgagg aacaaagcct 55440
gccagactgt ggtggtgtac ttttcttgtt gttattgctt aaatgctgca agagagtgga 55500
aaactcttac gaaataatgc acgatgggta gaacttcaga gaaaatctct gccgtctacc 55560
ctgtgcattt tcgaggaagc tcagagggca tgctgaacct ttgctttttg tttctgaaga 55620
gttcagggga acctacccat aattaatttt ttaaaacact acctagagag caccctcttg 55680
gttattaaac acatgcgctg tttcgatggg atgtttgacc tggattgtgg atgcttgctg 55740
ggacgtggca tgtgttggga ggctctgtgc tgcctgctga gcaccagcaa agccacagtg 55800
gcccctacct ctgtgggagg ccctgtgcca ggtgccctca aagagtaggg ggcccatgag 55860
ggtatgacca gggggacctg atttcggctg agaagttggc ggggattaca ggcctgggcg 55920
gctccctgag gaaattgcat taaaaatgag atctgaaggc ttgattgggg ttggcccaat 55980
gaagggatag gagaagggat ggggagtggg cagaaggaaa cacatgtgtg aaggtcctca 56040
agggaaaagt gcttggcttg gacagaggca ggaaatcagg taggaggcta gaggtcgggc 56100
agggctccgg gagagtgact tggggtgcag catatggtga ggatctgaca ctggggagtc 56160
atttgagcag gttggctgtt tctgtaggag cgtgtgttaa gctgctggca gtggggatgg 56220
tgaaaataga gatgtggagg aaacagcagc ggaacttgct gacaggttag atattggcat 56280
tgagggagaa aggagagtca aaggtaggta gatggagatg cttcactgag tggggagtat 56340
tggaggagga gcaggtttgg ggtggaagcg ttgtcctttt agagagattg tatttgccat 56400
tgattgattc attcattgtt tctgcaaata tttagtgtgg gaaaaagcat gctagacacc 66460
aagagagagt ggagtcaatg aagaacgata acagcaacaa agactgtagc gcttcctatg 56520
cgaggcttgt tccagttgct tcagaggctg tgttacccct gttctagaga ggaggaacta 56580
ggcccaggga ggtggggatt tgcccagtcg tgggagtcag gatgtgaaac aaggcaccct 56640
ggctccagag cacaccgtcc tctcaaccac tgcagagaag ctgggaaaga gacaaataag 56700
tgggtgctta gagcacaatg tgtgtggtgt gccaagagca gctgggagcc ctgggacccc 56760
cagggaaccc cagccccacc tgggcatggt gggcatggct ggaggaggcc tgctggcttt 56820
gctggagagt gggacatgca tcaaggtggc cagagactgg gcttctgggt gtcgtgctgt 56880
gactgctgca aagggctcat tgacatatgg tggggagggc cagcgtattt tctgcgggca 56940
ggacatttgg gggatatggg gtgtgaccct gtactatcta aaatctttta cttctggatt 57000
atctccactt tctctactgc atatatactt tgtttttatt tattttattc atttatctat 57060
gactcagcca gactctctaa aagagttgac ttgtgtttcc tagcagccac tgagtcagaa 57120
ctttcccatt tcgcagtcag ggctgtggtc agggtgtctg tgttgtctaa ggatataaag 57180
caagccttcg ggcactacca aaacattatt ttataaggag aactatgagt acctaatagg 57240
aagaaccagg caatcaggtt atcttttggt gaggaagaag tggtagatgg gatcattggt 57300
gctttgaagg gagtgggtgg tgtagactcc aaagtgtaca tggggccatg atagagtcta 57360
tgtcagatgt ccaaagcttc cttctctcct cccagaaact ctgtcctctg gtgaagagtt 57420
ttgaagtttc ctgaggtttg ggttcatggt gtggcaggtg ataccatggc aatagaaaat 57480
atcccatcaa gaaggattgt gtgacctcag ttgtagcccc tgcatgttgg aatcacaaca 57540
atttgcaggg ccttaaaatc aaatgccatt tcaccaactg ccctcccccg tttttttcag 57600
cactgtttgg tagctatctg tttcccctga tattcttgga cacttccaga gatgggggct 57660
ctatctcctg gtggtagact gtttcttttt ggtacaatat gaactcttaa gagagttcta 57720
cctttaggga gctgcagtct ctctcctgga aatgctcaac tccttaattc atgttttgct 57780
gttaaattct gctaatgcct caccttacat gtcttgacaa tttgaaggta gctattgtat 57840
tccccgcaac cccaagtctt ctcttcaaaa tgattattaa ttgtaattca aatcatcagt 57900
gactggtatc ttagactact taaggatggg aattgctaat tttgtattta aaagttgtac 57960
ctctaaagta agtgaaattt atttttaaac gtagctttct tcattcataa agtttatgtt 58020
cattgtaggc agtttggaaa acagcccata atctcaccac tcggagatta cattgtgaat 58080
aatttggtat atttcctttt agaaatatac caaattatcc ttttttcctc tgagtgtatg 58140
aatatttata tttgttttta acatacttga gctcatagtg ctcagtattt ccaacgttct 58200
gtttatttaa gatgaaaatt gctgtagtta ataagcactt ccccatgtca ttaaaatgct 58260
taaggatttt taatgaccac ataacagtcc ataatatgat taaaccccaa tttactgaat 58320
caatgccata ttgttgggtc tttagattgt ctccttttgt ttctgctact gtgaatgatc 58380
ctgtgatgat catctttgtg tgtaaatctt tgtcccctcg ccccctcccc ttttattatt 58440
ttcttgggat agaccccagg acaaaaggta gaaaagaaca aagtgttaaa aaatttcttg 58500
atacatagcc acagattatt ttcctgaaag ttctcaacat ttataactac gagcagtatg 58560
taagagagtt atggttggaa tgattttaat gtctctgggg aatttaacaa caaaaaaact 58620
ttaggcttct ttggagagag acatgccctt aactccaccc cgccctagaa cagagaccca 58680
gcccatccaa gtcagcctcc ccaggtcctc caccttcaaa acaggcaaac gaaatcattt 58740
cttgaataat tggtaggctt caaggtcaga tgtttatttt agataattca cagcataaat 58800
ttatatgttt taggtacctt agcccctgaa tatactcagt tcatttagga ctattttaga 58860
ggtcttgagt ttactcttat aacctcacat ttttttgtga atttttagtt ctattatctt 58920
tgttttcatg gcatattatt gggcaaagat actatttatt cgatgctatg tgtgagctgg 58980
gtcaggatta tgaccctgag ttatgtttct gggaaaatgt acccacttgt caaagatgcc 59040
gttggctcct gtgattaagg tcagcccaca atgaatgtgg ggagggctgg cagcctctca 59100
aatcagctct tgaccatttc tcaagctggg gcctgttgtg cttgggggaa gagtctttgg 59160
cagctcagct cggggctagc gtttcctgac atttgtttcg ctgaatgtta acaaggttac 59220
tggaaaaaag ggttctctcc taaaataggt ttagggaagc actgggatat gcgaagtgaa 59280
tgagtttctt tagggcagga tcttgactct gcagggggct tggaggcctt ccctagagtg 59340
gggcttccta acactgcaga gctcttccca ggacgagggg caagattggg acctactttg 59400
gaaggttgtt tttgtttcgg cacctgctct gtttacgaag cgtgggagcc tgttttaaat 59460
taatgtgcgc ctacttagag ctacactcat ggttttgact atgtttatct ttccagtaaa 59520
taaaacaaaa ttgttcattt ggcacccagc ctgtcctgct tgtcatttct tgtcttgctg 59580
attaactcta tggatggggc atgtttctcc aaccagattg taagtttctt gaagccaagg 59640
agccctgtgg ttgatttctt cacatgtggc tctctctcct cccacaatgg tgcttcgtta 59700
attaagcaga aaacccatct ctggttaggg actggagttg atttcgtttg gaatgagtgt 59760
gacttcatca tgacctgaaa gtgttcagaa ccatcttggt tagcacaagg gcgtggacgt 59820
gtgtctactt tctacctgat gggatagcat gtttaatttg gggttatgac actgaatggt 59880
ttgccagtaa cttgctaatc caaccttata cattccagct cacagtggag cgtgtctaat 59940
tgccacagca gcatttatgt ggaacgtggt tgcacaaaag ctccagaaag tcaggctgag 60000
ggctcctatc tctcctcaat cttggtttac gatgtctgtt tctgaggaat cctgggatgg 60060
ggccactggc tctttaagag agagcccgat ttggaaatct aggacttgat tgttgattat 60120
gggcaataga tacattttaa gaatgatgtt gtaggctgta tgaagtcatt tgatgattgt 60180
tttgttaatg gcttgcaggt cagattttca tctttttaaa ttaattatca tagaaggaga 60240
aaacaactgg atttcagaat tgtcccttga ggtgtactgg aaactaaggc gtgagggact 60300
cataggggtc tggcttggaa agtgtattgc tatgtccagt ttacacataa ggatgtgcaa 60360
atccagcagg ttagctgagc tgcccaggaa tatccaggca agaatgacca tattctgata 60420
attactcagg cctctgcctc atctccgctg cccccccgcc ccctgactct cttctgagtg 60480
ccagattcag cctccatttg aatgccaaat agacaggaaa ttagcatgcc cagaatccac 60540
gtctttagtg cactctctcc ccagctccaa acctgttact gcttgtgttc aacatctcag 60600
taaagctcaa caacatcgac ccattactta ggcctcaaac cttgggtggc atcgtcgatt 60660
gctcttttct ttcatacccc acattcaacc catcagccca tcccacaggc ccaagtgtgt 60720
cctctctacc ttcaaagcgt gtgtggcatc caccgcttat caccacctct gccattacca 60780
ctggagtcca gtgccatcat ctctcacttg gatgtggcca gagtgtcttt gctggtctcc 60840
ttcttgcttc ctacctttgt aacagcctat catctatctc tggtctccat agctcactcc 60900
catactttga gagggccttt gaaagcctta gacagatcat atcacagacc tctatactga 60960
aagtcgggat aaattttatc tctggaaaga gtcccaaagc agcgatgaac agatattttg 61020
tcctgtcact tgatgaagag gtggggcttt gagacccaag agcttagaat ggagagccta 61080
gatgccacta agcccaggca ctggccatgc ttcgagtgga gcttttgtgc tggtggagga 61140
gagatggctg ggggacacct gtaggctgag caagtccccg ttcatcagac cctggctcat 61200
ccagcagggc gtggctgatg ttttcaatgt tgtatcctga gtgggaccca gatgcttccc 61260
aactgtgcca catctgagcc ctgcatgcca tctgtccagt tgcagcctga ctgcaatgtg 61320
aggctgctga agagctctgg atggtgtgaa gcaatctgtt ttctagcccg agcctgcata 61380
gctggtggat cctggaccgt gattaagtgc atcacctagg cttcaatgag atggagtcac 61440
tgtgtgtcca aacagtggga taaaggcttt actctttgtc ttcctgctct gagggcacaa 61500
gctgcttgtt tctctcacaa ggacaccgtc tgtgttgctc aggtgctggg gtgaaaaaaa 61560
cagcaagcat ttgaaaaggc tgaagaagga aagaaagctg agagcggtac agccttgggg 61620
actgagccat cccattgtcc cagaggtggg ggtgttatca agacctgttt ttgagccata 61680
cctctgactc ttcctggaaa gttagaccca actcaagaac acactaagag aagtgtttcc 61740
ccctagccct ttcagattga aaggagacgc caaccttgat gggtggaggt agaaaataaa 61800
gtcccaaaac agtgtcttgt aagcgaaggg gaacatggct gggcagaggg cttctggtga 61860
aacttttggg agtattcagt tggaactcag gaaaaaaaaa ttgttttttt ggaaagaggt 61920
agcagccccc ttcagccaaa gctcataaat gaaggaatgt ctgagactca gaattacagt 61980
gaccaaggca agacattgtc aaaggctgaa taagtgagtt tgactgacag aggccatctc 62040
catttttagt atatggccaa gcatctttcc cacagtcttc cttgagcccc ttcccatccc 62100
acttctgaaa agcactgagt tggccattat tatgcttttt tcttaaatta tgaagttgtt 62160
ttcaggtatt gagaataaca cccaggtgct gaactcccag cataagaaat caaacattca 62220
aaatggagta aggttctgaa gctgacatct gtctctacac attttttttt ttctgataat 62280
ggcatttcct atctccaccc tcactctttt tgttgtggtg aactacactt cccttgttcc 62340
actcggttct gttgcacatg tgattaggca aggggcagat atgtgatatt tattatgagt 62400
cttttccacg cagagaggat ctaaatctgg ctctttgcaa ttgccttcat acatgtgcat 62460
acacaccaca cacacacaca cacacacaca cacacacaca cacacagaca catacatatg 62520
cacacacccc gactcaatgg aggaccctca tttgtagaag ggtaaaatgg gtgaggcgga 62580
aatgcctgta tggcaccatg gagttctgtg tagccagttc taatcctggg ctatttggta 62640
aggaatgaag ttggagatag tcttctgtcc cttacaacca aaggaattct aactaatagt 62700
ttgccaagtt ttatgtttat aataaaaaat gacatgcttt ttcttttgga tttttaatgc 62760
ttttgaatta aaaatgctag aacatgaact gattcttcta tcgctattta gatagagcct 62820
tgcaagagca gagcacgcat gctttcttta agaacaggtt ggtttgtggt cgtctgagga 62880
ctgttttaag gagacttatt atacacaatc atcccccaca aatgatttct aaagagaggc 62940
tggtatgaaa gaaggagttt ccatgattct gtcctgtggt tctggggaat tctgaaaatg 63000
aactttagat atttttgtga aattcttatt ttcatatttt tggtatctca gagttttctt 63060
ttctggcttc tgtttaacat actcttcttt gccctaaatc tctcttattt ttgctccttg 63120
ggacaactga agaatcctta gataattaat agtatgaaat actgcccttt tagttgaaaa 63180
atgtcacaat aatgtaataa gataaataag gaggtgtcgc tttaacctgt atcgtgtagt 63240
ctcctctact tactaacact tacttgtatt actagaagca ttatttttta aatcatggaa 63300
aattggtggc aagctgagca tacagttgtt tatttctgtt tgactgatta ttacaacttc 63360
attatttgat gaaggttctg tacgttttcc tttaagacac atagaaattg tgagaagatc 63420
ctgcagcccc gaaaggctac agtgttgatc caaggactct gagccgagtg cagggtttgt 63480
acttggacct gcaggctggg tggcgtctgt gggagcagtg tgttgagaga gattctgagg 63540
ctgtatgtgt cagggcctcc aggggaagga tgcattgatg gattaatttc tgccaaggct 63600
gaaagaggag agagtaagag gctgtagagg tgtcacagct gtcattgctg ttttaggcag 63660
tcaagctttt gggaaagtgt cagaaattga gccccctact ggatctatcg gagccctgtc 63720
aaatgtccat ttagatgtcc tggtgaacaa aagttctctg actcaccatt taaaaacttg 63780
ttccaaatga aattatggga gaaaggaaca tttttcatcc gaacccagaa tgaggatgta 63840
cccaaggaaa aggacgtagg ctcaggagct ggactgtggc tcagctggcc tgatgtatcc 63900
cactttgttc ctcccatggc tgggatgtct ctttgctctc catgacccat gtatcttgag 63960
gacatgacac atggaccaag cttgaactgc ggattcattt ttatgcattc tacctgtgaa 64020
tgattgcagc ggatctagtc gtatttctga gagttactca aactggactt cagcagtgaa 64080
ctctacagtt ctcttttcct cccacctttc tattagacat tgcatgatac aaaaatcaag 64140
atatttctaa gagggtgata acttcaatgt tatctaaact tttaatttgg aagaagaggg 64200
gttctttgtt ctttttaaaa agatacaaac gaacttcttt atctgattct ttttttggtg 64260
caaacccatg atgccttctt cctgattcat ctgctacact gtgagttcaa gcctggcgtg 64320
ggacacaggc acagctctca tgccaacgat ctcatggtta agttttggaa cataatttga 64380
aaaatgtaac ccattgagag gcagtaagga catacggtga gctagtgcgt gtttggacgt 64440
ctgtgtggaa taagtgagtg ggtagagagg acatttgtca aggagcggga gggcgggcca 64500
ttggcttggg ggaaatgggc tgagactcta ggggtggcca gcaccgcata cggaggccag 64560
cagggttggg cttggctaag tgctgtggtg tctggatgcc tatgtgagtt tcctccagaa 64620
gttttcagtt ggcaaagtag aacctgctgg atatgtagca agggtgtgga ttgtcgggat 64680
cctgctgggc gcaggcgtgt gataccagag gtcagaacag aagctgaggg atgaggcttt 64740
gggagctttt tgtcatgcac tgtcctggag cctcagttac tacaaagtct gcaaatgata 64800
gaccggagct ttggttctgc ctgatgctag ctcccctgtt cctgattttt cttttcaata 64860
ttagacttaa tcccagaatt cacatgttga aagaaaactt agaggtctag tgacataaaa 64920
gcctcatttt gatcgttaca gaactgatgc cttgagaaat ggagagagaa gtacacgatc 64980
atggtaatac tggatgttca ctgagcactc actagctcca ggccttttct aagtaattta 65040
tgaagttgtc aggtttaatc ctcacaacgc ccttatgaat gagctattgt tattatcccg 65100
atttggcaga tgaggaaact gaggcttgag gggaggatga cgtactcaag gtcacacagc 65160
tgggaggcgg caagctggaa gttgaaccca aggagtctca catcggagcc aggactctca 65220
cccttcagtg ttatgctgcc ttaatcaggc acacatacag gcggggagag gcaggtttcc 65280
ggacaccaga ctaggctggt gccggtcagg ctacaccagg gaacctggag gcctgtcatt 65340
cttttgtgat gctgttagtt cctgttgagg aagtgaggct ttgtgggttc ccaggaggaa 65400
aaggtatgaa ctcatggcaa aagaaaggaa ccaaaaaagg gagatttgca tcacaatgag 65460
ccttctattc atcctaaatt atacctcctt ttataccatg tgtgtctgca aacttgtggg 65520
taaatcacaa atctttctgg taagttacaa tggatggaag gtttttgcat ttctctcaaa 65580
tcaccaacca tttaatgcta tgtgtagtca ctccctaatc tatcttttgt ataaatttgg 65640
atctttgagt attggggttt tccatgatgt ttggcagttc cccttagggt gtctatctca 65700
aagtttgtca cactgacaag ctttggggag agaagttaga ggtgggcttc cctgttttta 65760
gtggctgtgt ctgattgttc tgtctgttct ccaggacagg agagattgat tgctttctag 65820
ctttttttaa aattaaaaca acaacaacaa aaaaatacag aaaggtacaa aggataacaa 65880
acacattcat gtacctgcca cctaaaataa caattactaa tcttttcacc ctcctagccc 65940
atgatcttcc ctcccaggct gttattaata tgaaaaccga gttcaggttt ttatactttt 66000
cgacatctat ttatattaac gtatgtatta taaataatct tagtagtttt taactttgac 66060
ataagtggct tcacattcca cataacattc tgcagcatgt tttcttttat ttttattttt 66120
ttctttattt ttaaattttt attttgcagc atgcttttct tattcaacat tacatttgaa 66180
ttttttcaac attgtacatt gaaatttagc tcattctttt taactgctct gtagtattta 66240
ttgtatgcat atactacagc tttctatttc tgtattgatg gttaattagg ttgcttacag 66300
ttttttaaga ttacagattc tgctgtaata accatccttt gggcaagtgt atgtaggtac 66360
ctatatatga gtttctctag gattcatacc aaagtagagg aattggtagg gcattggttt 66420
gctggtttta attttaattc acatgctatt gtcaagctct ccagaacaac tggatgagtt 66480
gattggatca atgagtattt ccatcaccag catataaact ctttcctcat aatcacacca 66540
atgcttgatc ctgttggact taaaattttt gccaatttgc tgggtatgca acggcatctt 66600
acctaatttg cctttatttg atgactcctg aggttgaaca tctggtcata tgtttatttt 66660
ctcctctgtg gcttgcctgg tttaatgcct tcttcatttt aaagaatcag atagttttct 66720
gttattgatt tataggaact ctttatataa gttgaaaact tgattatatg tgttggaaat 66780
actttttcta ggctgtgatg ttttaaaata ttgctttaga tgggttttca tttttacctt 66840
ttattttaga gatggagtct cactgcattg cccaggctgg attgcagtgg ctattcacag 66900
gaaagagcat agtatgttac agcctccacc tcctggtacc aagaggtcct cctgccccag 66960
cctcctgaat aggtgggacc acaggtgcac atcactgtgc ctagctttgg atgggttttg 67020
aaagaaagaa gttttaaatt ttaatgccct caaattcatc tgtattttcc tctgtgcttt 67080
tattttgtac ccactctaag tagctccgaa ttctgcagat agttggtgca ggaattctga 67140
ttttgagtgg acatctgctc tctaacagtc acattgaagg aaattaggtt tttttggtag 67200
gaatctaagc aaggggttga tttgtaaact aggctttaaa tatgatttta agcaactcac 67260
ttagaacaag atacaaaaat tgtggactgg acctatatct ggaaaacttg aaagtgctag 67320
ggcaataaat aattcttggt cacatacagc cgagatcctg ggctcctgac tctgggacag 67380
aagctttcta tattttatct catcagtctt tgcaacaggc tccttgaagc aattttatcc 67440
ccattttaga gataagaaaa ccagagctta aagcagttag ataatttatg aagtaagtgg 67500
cagagccaag attcaaatcc agacctttct gaccacaaag ctcgttgctg aataccgcgc 67560
ctcattgcct tcttgcgaat tacttgggat ttgtttgaat cccaaaatct ttatatgtta 67620
ttttaaattt gaatctaatt ggaagtgggg cagtgagggt agaggacaga aagaagggga 67680
agagcttgag actcaataat agaaacaaaa aacccgtctc caggagggcg gttcaaaagg 67740
aagaattcca tatttcatgt aactgaaacg ttaaaagccc aaataattgc atcatgcaag 67800
tctgatgctg agtaatcacc ctcccccata ttattgggga gagggggcaa gaagtctggg 67860
aagctgtttt tgcctaagga attacattcc aggggactct gaggatttag gtaaccacaa 67920
aagccattta tttcgagtac actgagattt ctaccacttt gatccctaat ccatagcata 67980
attaataaat gaaatgtgct gtagcatggg ttttttacaa agtgtacttt taaaatggct 68040
tttggtctga catgattcat ttgccacttg gaaaagcgtc atcgcctcag atgggcaggc 68100
tgggagaggc tgcctggtgg gtagctgagg gcggtttcct ggggcacagt tcctgccttg 68160
ggcctctaca gagcggtctc atccaaacat ctcccagact ctgcgttttc caggaagcgt 68220
gcagaaatag gaggccagta ctgaaatgct atctgctctg tgtatgtcag aagaccacaa 68280
accacttata acaaatgaag atctttttat ttgttcttat ccctttatgt cacttgagga 68340
aagttgctgt gagtaggtga tgatcattac agtgatcact ggttgcccaa actgagaagc 68400
cagacatttg gcttggtttc tctcccttcc tcttgtctct cctaccctgt aaacacatac 68460
ttggtgatta cccatgggga gacaagacag gctgggaata tatacttctg caacttcagc 68520
ctcctgggtt ccagcgattc tcctgcctca gtctccagaa gagctcggat tacaggtgtg 68580
caccaccagg cccagctaac tttttgtatt tttagtaaag atggggtttc atcatgttgg 68640
ccaggctggt ctcgaactcc tgacctcagg tgatctgccc ttctcggcct cccgaagtgg 68700
tgggattata ggcgtgagtc accgagcctg gccccaggca ataatatacc agtgggcaag 68760
aaaatattct tgctctcatg ggacttctgt tgggggtcag ggtataggga ggaaggcata 68820
gagatgaaaa ccagtaaata agtaacaggg gaaaacattt taaatacatt aataactaat 68880
aaaatagaaa taaatctgtt ggctacttaa caggatgtgc cacattccag atacattacg 68940
ttaatcctta tgatctttgg gggctaagta ttagtattcc attttacgga tgaagagact 69000
gaggctcaga gggaagggag gtggcttttc tcaggtggaa agccagacct tttcagtggt 69060
cattcagttc atagctaagg tcttattttc tgtgctctct gtcggctgaa aatgggcaag 69120
gtaatttcac atagtgacag gagccatgtc agagaaagag caggacagtg ggacagagag 69180
ggaccaggct gggggctgtt tgagatggag ggtcaggaag aaccaaacta agatgtgaac 69240
agtgggaggt gttggagctg tggtgcttgc ctagaaggac cctcatcgag caaatagaag 69300
cttctggcag gaagaagtta atgtcttgcg tgtgccctat gtaggttcat tagggccttt 69360
aaagggggaa gaaggtggtg gctataaatg ttacaatctt acctttggcc cctagggatt 69420
ctgtctttca accttggttc agtaacaact tgtgactgcc caacagggct tcctttcggg 69480
agagaatggc ttgttacatt caaatatgcc atgaaagtat caccatttat ttcagtgtct 69540
gatgccccag cttgggcagc ctgagcaggc tctgaatggg tctgaagagg ccctttagag 69600
tagagatgaa gagggggtgg ggaatcctca attctaaaca aagagtctgc aatgggaaga 69660
tggccaaatg ctgtttttgg agtgggtgag agggaaaaga aaggtataga tggttcgttg 69720
gaaaatgtgg ttttataccg ggttttggtg tcaggtcccc gagggcaaca tggactccac 69780
actgtgatcc tccgggcagc tcatagcccc agccccttcc ttttgcttcc tggtcagttt 69840
gtgagaagga ggggttgtgt ctccaatctg agcaataagg ggtctgaggg gggttggatc 69900
catgtggctt tcctgtgtct tgttccttgt aaaagttcca ggttttgggt cgtgagctgt 69960
gtgtgtgtgt gtgcgtgtgt gtgcgctgta cgttaatatg gagagatggg cttgggccag 70020
tgggaaatag agagacccgc aagcacagag tgacagggtt tgatagtaag cagcaggcca 70080
gcgttgctgc ttttattcct cggtaaatcc ttgcacaatg ccatatgctc ttgcattccg 70140
tagctgctgc atagggtgtg atttagttaa tgcccgctct gcaaacagga aacggtgctc 70200
actgctgtgt atgcttttca tggagataaa gtgtcaggag caagacccca aacctgcgaa 70260
atcactaatg caaccgcccc ccatgcccca aaaggtggga gtgggggata aaaagagtag 70320
gaaagtggtg tggggagggg aagctttagg gccataactc agacaatttg tcaggcagtg 70380
gcatcggttg ggaggaaaat attgatgtac actttttgtt tttgaacctg aagtttgggt 70440
tttttcggat gcattggagg acttttaaat gttttcggag tgccagagtt tggactgtta 70500
ggtcaccgta ggtaccggct tgcatatcat ttcagaggaa tattttcaaa actccataaa 70560
aacatgcggc tttcaaggct ggaccacttg ttcaggtcct cctcccaccc cccacccttt 70620
ttggcaaaac catgcaaaca ttggtattca aaaatatttt gttacttttc ttggcaaagt 70680
gttccaagaa ggaattgcaa cacagtctca gagttaggag gcaactttct ggggaaaagg 70740
cgggggttgg ggaggtttgg agtttgaatc aaaaacagac accgaagctt taataaaata 70800
aatgaagcgg agccctttca gctcacggtg gactgtgttg gtgcgcgggt caggctttaa 70860
cgtgcctagt ggaaattgac agtctgagaa ctgggacata aacaaaaatg tcagtccctg 70920
ggagtcttgt tcactggaca atgtctcaat tgttcctttg gttttcaagg cagcagggag 70980
agtggaatat taactgttta ctgcccaaag ctggctcgga aattgcttgg agaaggggag 71040
aaaaaagaca gaaaatcaca ttttttattt agaaactatt aaacatgtca gtaagagata 71100
ggaaaagagc agattgtttt ctccttaatt atctgccatt cacttccata tttctgcata 71160
ccatttttgg ggtgtgtgtg tgtgaaggaa cagcagggtg tttcttttta aatttgaatg 71220
ttagccttgc atattgtcag tttttaaagc ttgctggcat gtagattatc cgcccccggt 71280
ggatatgaca gtgggcttta ggaaaggaag tgtgatttct gataacattt acatcttagc 71340
tgttcagcgg ataccctgtt agtgtttgtt cttcagaatg ctcagataga acaaaaatca 71400
agtggttgga attttaaaaa acaaaatgta tttggctctc cataaaaatg catttagtga 71460
taaagggggg cagcaagtaa ctatgtctga gagaaggaat tgcaggcaca gaggagatcc 71520
agaattctgt tcacacttga atttacttga ttcgagaaac aaacagcaaa gcctggtgta 71580
ttggccttta tctgggcaaa gttcaaaact caactggtaa ttatgtcctt agaagcctta 71640
aaaggactgt gttgttacaa aagcagtgac tgagcttact tcttcaggac cgaatgcact 71700
cgagttgttt gttagataaa cttgttttaa taaatggggg ggtcagggga gaggtttctg 71760
ttcttggaag attccctgat aagtagcttt cttctcttgg agaacttcag gctttctctc 71820
caagcgaggg gtttgcaggc agctaaagtc agcttcggct tctgcttcct gtcagtcagg 71880
aagtcacttc cttaacccaa attacaagct agagcacaac tccccagcca taccgaaaag 71940
agcaggtttt tcccagaaga ctgtgtttct agatgcggaa gtgtaaattg gtacgctgtg 72000
tgatcatgga atgcccaaaa tacataggga acagtgttgt tggaaagagg cgctgtgtcc 72060
ccaaggagaa gacgccgccc agaatggctg gatcgcctgt tgtggctgag tgcgaggcag 72120
ctgtggctgg ctgctgtgtg acgatgacct agtagccacc catgtggagt cctggctgcc 72180
tcagaaccct atcacatcta ggcaaaatct tgcatttttt atctgggagg cctgaggact 72240
tcagggctgg tggatagtaa gctccttggt tatctcacag atacaagagg tcttgggaat 72300
ccacgatcaa acttgatgtg tgcgtttacc ctcctccctt tgaatctgtt attcaaatat 72360
ttaagcctcc aaccttgtgg cccctacctg caccacccct cacccccccg acaaaaatca 72420
agctcttgac ctcatggctt ctttcagtga cccttggggg acagggtttc ccaaggctgg 72480
ttgccagctg gcatggtccc ccgttggtga agtggagacc tgtgtttttt tggtcatttt 72540
gcaaagagct tatggatgac agcagttctc tgtgcctcgc tgggacagag tgtattctga 72600
ggtccagcgt ctgcatggag atctgcctat ccttcacttg gggtgctcag tagataacgc 72660
ggccactttc ctatacattt ccttaattta agggaacagc gtaaactcag cccaggtgga 72720
ttaatctctc cagtgacttt tgaaacttca atttccaatt tccctcttat gtctaggtgt 72780
gagtgaggat acgtgtagta attgtcgcag gtattagtga gaaagggtgc agatcacaca 72840
aatatttcac acgttattag ttggaccaga ctttggaggc aagggagggc cgtgtcacct 72900
aggaaatttg ctcttccgtg gagatgaaag ggcagtgaat taagtgcctg ctttttctcc 72960
ctttttccct ctgacggtta ttgatcctcc cctggaactg tacagttcac gttctgatct 73020
ttttcttgac aaagggaatt cccagtttgt tcgctggcga acgcactagc aggtgaggag 73080
ttaaaagttg gcaacgcctg ccctctcgag agtgtcagga tttttagtct cttccttgag 73140
agctagaaga tgtttctaaa agaatctctt tggtgactta gaagtggaga gagctttaga 73200
agcatggcac aaataaaagg aaagaggcaa acaccgtcat tctacatctg tttattttgt 73260
tattaacaaa aggcaaggcg attttcatta aagttttgct ggggttgggg ttgagggtgt 73320
agagagcaaa agtgtgagtt gtacaccatg actggaatcg cttggacata ctcttcagca 73380
gacatcgtgt gactgtggaa gaaatgagtt tcatgaagat gactgataga aggaagccac 73440
tgaaccagtc ctctatcacc tcttccaagg ctaaagtttg gagccacttg cagaaggctc 73500
tcctcaaacc cctgtgttct ttgcctaccc ctgctgttgc cacatcatct tggagagctg 73560
gctgcttccc tcctcaacta gaagttccta gtgcctgctt agttcttgtc tcttgcttcc 73620
caagtgctca caaaatacat ccatgttcgc tacgaggaaa tggaccacat aaggtttccg 73680
tgaaaacctt agcccttagg tctaacacag taggaacaga agttaatgtt ttcctgacgt 73740
agaagtttct cttgctgctt ctggtcacat ttctttcttg tgtggttctt ctatggctac 73800
tgcacttttt tttttttctt actgtctccc ccttccccca cacaccacct tttggggata 73860
gggtggcagg tgagaatata aacagataat ggttaagaga tagtttagtc tttctaggcc 73920
agattattta gtttttgcca tctaggtaaa attcggtcca attaagcgtc cattaagtgt 73980
tttaatataa gctggagaag gagttgaacc tggaggtcag ggctctgtgg tctattacag 74040
tccccctggg gtctctagcc caagggagac tccagggtct taataaatga ctgggggttt 74100
cattttgagg cctttactac caaagactga ataatacatt gggcatgatg gttttgtcct 74160
aaacattaac agccacaaaa ggtagagagt gtgtctgttt atagatacac atgtatcatg 74220
aataattagt tggggactgt gcatcaggtc tctcatttta cattcgagga agcaatgcac 74280
ggaatgaatt ctggacctgc gaactctgaa tttcaattct ctgtctccta cttttactgg 74340
agtgcttgca aacagtacag tgtttttgtt gtgaagttat accgtgcctg taatctctct 74400
gcgggtggcc ctcctaagcc ctacttcaag aaatagctct aagctcatga cacccgcccc 74460
acccgatgcc tacatatgtc ttatatcctt ggagtagtgt ttggggttgc aaatttgact 74520
ttagggagac atactctctg atgataggct aatgcttata tttactgata aacttccttt 74580
ttgacggtca tgggcttcgg gggccaccca accaaactgt gtggctgctt ttatgttggg 74640
ccaaaagaca ggctccttgt gtcctcccag tttcttaaac aatgaagtca tggcatttta 74700
cagtgctggt gaatggattg agattgtggt ggccctggaa tgtggcactg ctctggctgg 74760
agggaagatg agagtgaggg atggagagga gaggagagcg ggagatggga acctggtgga 74820
cacaggaggg agtgtgagtt ctgagggcca aaggaaactt gacaccggat gggacattaa 74880
tctgattctg ttatctgagg ctgtcaccag tcctccctgt cctcctggca 74930
<210>2
<211>384
<212>DNA
<213>Homo sapiens
<400>2
ttcaggccat tggtgttgta tatatttcaa gatttgctca caggtccaaa gcttaactta 60
agctccctga gacatatcat aaaatatgat ttggggaaaa accctaatgg gccatgatca 120
gaacattatt attcaacaaa ggatgaaatg cttaagccaa gatggccttc tttctttctt 180
tctttctttc ttttttttta atgaaagttg agcagactcc cgtccaacag ttttcaatgt 240
aggaattccc acagccccat ttgattgcag tttgttgaaa agtttaatgt ttttgtaggc 300
aattcataat ttccacattg aacagcctga gaggaagaga gctggagccc actgttgttt 360
ttgtagtggg atggtgggaa cttt 384
<210>3
<211>20
<212>DNA
<213>Homo sapiens
<400>3
ttcaggccat tggtgttgta 20
<210>4
<211>20
<212>DNA
<213>Homo sapiens
<400>4
aaagttccca ccatcccact 20
<210>5
<211>366
<212>DNA
<213>Homo sapiens
<400>5
ttgtcccttg aggtgtactg gaaactaagg cgtgagggac tcataggggt ctggcttgga 60
aagtgtattg ctatgtccag tttacacata aggatgtgca aatccagcag gttagctgag 120
ctgcccagga atatccaggc aagaatkacc atattctgat aattactcag gcctctgcct 180
catctccgct gcccccccgc cccctgactc tcttctgagt gccagattca gcctccattt 240
gaatgccaaa tagacaggaa attagcatgc ccagaatcca cgtctttagt gcactctctc 300
cccagctcca aacctgttac tgcttgtgtt caacatctca gtaaagctca acaacatcga 360
cccatt 366
<210>6
<211>21
<212>DNA
<213>Homo sapiens
<400>6
ttgtcccttg aggtgtactg g 21
<210>7
<211>20
<212>DNA
<213>Homo sapiens
<400>7
aatgggtcga tgttgttgag 20
<210>8
<211>558
<212>DNA
<213>Homo sapiens
<400>8
gctgtgaaat cccctgtgta gtgggaagaa gaaatagcaa atcttagctg ccttggacct 60
gatataatta tttgtcttca tttacatggt tyatccttca aggttgaata aatgatgtgg 120
gagctagtca aggggcttta ggtatgtgat ttcatgccta ctttttttta ggtagagaaa 180
ctgaggtcac agggtactag agaatggact ctaagattca ggtttctgaa ttgcctgtgg 240
ttttgttgac tcaactgctc ttctgttgtt ttttagccac atgccttgaa acagtcctct 300
ttcccatgtt tcttcatcag caccattaac ccaaggtata ctgtcctctc ttatctttca 360
caaggtcttg gagttcccat gcctttgtaa gcatccctcc ccgagattca gcaccaacca 420
aaatcacatt tggaaaaatt gcttgtttcc caagaagctt tggaggatat gattttgtat 480
agaacgggtt cacaggtttt ctgttcattc ttctatggtg gagtgtgtgt gtatgtgact 540
ctgtcttctc tccattcc 558
<210>9
<211>21
<212>DNA
<213>Homo sapiens
<400>9
gctgtgaaat cccctgtgta g 21
<210>10
<211>23
<212>DNA
<213>Homo sapiens
<400>10
ggaatggaga gaagacagag tca 23
<210>11
<211>364
<212>DNA
<213>Homo sapiens
<400>11
aagggagaaa gcaggattga gcagggggag ccgtcagatg gtaatgcaga tgtgatgaga 60
tctctgccgg accaaagaga agattccttt ttaaatggtg acaaattcat gggctttctc 120
tgcctcaaaa cctagcacag ctgttattta ctgaacaatt agagagctaa gcacttttta 180
gataytatat aatttaattg ccgtatgagg cacccttagt tttcagacga gaaaccacag 240
ttacagggaa ggcaagtaac ttagtcaatg tcagataact aggaaaaggt tagaggggcc 300
ctggacacag gcctgtgtga ctgagaagct tgggcacttc actgctacat ttcatctctt 360
cgct 364
<210>12
<211>20
<212>DNA
<213>Homo sapiens
<400>12
aagggagaaa gcaggattga 20
<210>13
<211>22
<212>DNA
<213>Homo sapiens
<400>13
agcgaagaga tgaaatgtag ca 22
<210>14
<211>579
<212>DNA
<213>Homo sapiens
<400>14
ctgatgaggg tagggagcat ctgtctgcag cttcatcttc attgtctagg ggctccagaa 60
atatctgtga gtaaataagt tatttaatct ttgcctcaaa tttccagtga ctgtagggat 120
atagctgtga gcctctagga gctgagattt tttaaatttc ccacttaaac atttatttaa 180
aaattttgtg ctcagcatgg actaaggact ttacattcat taactcattt acagcttgat 240
cctatgcggt gggcattcat ttacagagga tcccatttta caggtgagga agaggccagc 300
taggggtgca gcctaggtta gtattctaga gctcatcagg ctgtgttgtc cccagtgaaa 360
gaataagcaa agaagtgaat gttgtgcatt gagaaaaatg actctcggag gaggatgagc 420
ctctcggata tggcgaccga agtgatwtgg ggcccttgtc aagggtctct attatggcat 480
caagaaaaga tgctgctttc ggtgatgccc gaggagagcc tcaatatttt acatgggaaa 540
cctaaaaaag gggccatgtt gtggtctctg cacctaaga 579
<210>15
<211>19
<212>DNA
<213>Homo sapiens
<400>15
ctgatgaggg tagggagca 19
<210>16
<211>22
<212>DNA
<213>Homo sapiens
<400>16
tcttaggtgc agagaccaca ac 22
<210>17
<211>486
<212>DNA
<213>Homo sapiens
<400>17
tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag 60
tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag 120
gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc 180
aatcactgtg gatttgcctg ttcttgacat ttcatataaa tggtatcata aaatctaygg 240
gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta 300
gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac 360
attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt 420
gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat 480
tgctgg 486
<210>18
<211>27
<212>DNA
<213>Homo sapiens
<400>18
tatttagaaa ccataaaatc cacctat 27
<210>19
<211>22
<212>DNA
<213>Homo sapiens
<400>19
ccagcaattc cactcatagg ac 22
<210>20
<211>428
<212>DNA
<213>Homo sapiens
<400>20
ttgtctcctt ttgtttctgc tactgtgaat gatcctgtga tgatcatctt tgtgtgtaaa 60
tctttgtccc ctcgccccct ccccttttat tattttcttg ggatagaccc caggacaaaa 120
ggtagaaaag aacaaagtgt taaaaaattt cttgatacat agccacagat tattttcctg 180
aaagttctca acatttataa ctacsagcag tatgtaagag agttatggtt ggaatgattt 240
taatgtctct ggggaattta acaacaaaaa aactttaggc ttctttggag agagacatgc 300
ccttaactcc accccgccct agaacagaga cccagcccat ccaagtcagc ctccccaggt 360
cctccacctt caaaacaggc aaacgaaatc atttcttgaa taattggtag gcttcaaggt 420
cagatgtt 428
<210>21
<211>23
<212>DNA
<213>Homo sapiens
<400>21
ttgtctcctt ttgtttctgc tac 23
<210>22
<211>22
<212>DNA
<213>Homo sapiens
<400>22
aacatctgac cttgaagcct ac 22
<210>23
<211>330
<212>DNA
<213>Homo sapiens
<400>23
tcagggacag tgcataggtg taaagaagtt gctggttggg ggttctaatg caggtttctc 60
caaaagtgaa tgccctgtta aaaaaaaatt cttaacaaat atacagagat ttttttttta 120
aaaaagtgtg acagttctag acacctagag agtaaartga agaagcctgt tttcaggttt 180
cccgcctccc tgaatttccc agcatggtcc aggctttgaa atttatttat ctgcttttgg 240
caatggttga tgggaatttc ccacatttat tttttagcta cagagaaagg acattatctt 300
taaaatctct tcgttgttct ctctctttga 330
<210>24
<211>20
<212>DNA
<213>Homo sapiens
<400>24
tcagggacag tgcataggtg 20
<210>25
<211>23
<212>DNA
<213>Homo sapiens
<400>25
tcaaagagag agaacaacga aga 23
<210>26
<211>574
<212>DNA
<213>Homo sapiens
<400>26
tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag 60
tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag 120
gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc 180
aatcactgtg gatttgcctg ttcttgacat ttcatataaa yggtatcata aaatctatgg 240
gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta 300
gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac 360
attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt 420
gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat 480
tgctgggtca tataataaat aactgtttaa cattttgggg agctgccaaa cttttaaaac 540
cttgggttct gtgatgtacc agttgtgtta ggca 574
<210>27
<211>27
<212>DNA
<213>Homo sapiens
<400>27
tatttagaaa ccataaaatc cacctat 27
<210>28
<211>22
<212>DNA
<213>Homo sapiens
<400>28
tgcctaacac aactggtaca tc 22
<210>29
<211>571
<212>DNA
<213>Homo sapiens
<400>29
tgccaggggt tttatggtta attttcctcc attatgaggg ttgactcagc cttgggtatt 60
agatgtcttt gagaatccag ggttcaaata ccacagctgg tagaatgttt ctcaacttgg 120
agccaatctc catctactga aggtacgctg gtttagacag acaacaggga catcagcatt 180
ttaaaaagcg gtggaaaaag tttgcttgtc ttgattggag ccatgacatt ttattttgaa 240
atttcaaata acatgaaggg aggtttggag cggtttttgg tttatccaaa gggcagtgga 300
ttgaaggctg agaaacacca ggctgaatgg gagaggggtt ggggtccccc tgtgagatag 360
tgaaacaatg gtagtgccat ccaatgatag gcacttttct gtcattcaga agcagaaagg 420
gggccagagg cccattggcc ttactgggma gtaagctgta gagctgctgc cttttcgtga 480
aagggttgac accaaccttc tcccccagga agagtgacca gggacctgag gggcatggtc 540
gagcagatga cagcctttgt aaaacatctc c 571
<210>30
<211>20
<212>DNA
<213>Homo sapiens
<400>30
tgccaggggt tttatggtta 20
<210>31
<211>23
<212>DNA
<213>Homo sapiens
<400>31
ggagatgttt tacaaaggct gtc 23
<210>32
<211>614
<212>DNA
<213>Homo sapiens
<400>32
ttggtagaga tggggtctcc taggctggtc ttgaactcct ggrctcaagc aatcttcctg 60
cctcagcctt ccaaagtact gggattactg gcgtgggcca ccatgcctgg cttgaaattt 120
ttctatggct ttattctttc tccaagtaca gagtctaccc aaccttctga gatctttggt 180
tttcttttcc taggtaacta tagtacatac ttatttatgt taaacaacag caatcacaca 240
tttctttttc tatacagtca tgctttatag gcaaataaag cctccgtctt aggctttctg 300
gattttttca aaagatgcaa ttcctggagt atgtttttac ttagagcaaa gcagcctagt 360
ctcctatacc ttctgcatct gcagaaaagt tggttaaaca gactttgtaa tgatgcccct 420
tacaattctg aagggacttg tgaaatagtt tcacagagtt tcagtgttag gtatatttga 480
tcaatgctaa cttttggaaa actttggtgc ctgtatgatt cagagggtag ggcagaatat 540
taaattaatc acaacttctt gtattttaac cattctgggt aaattgggat tccgtgacgc 600
ccaggcaaaa ttat 614
<210>33
<211>20
<212>DNA
<213>Homo sapiens
<400>33
ttggtagaga tggggtctcc 20
<210>34
<211>20
<212>DNA
<213>Homo sapiens
<400>34
ataattttgc ctgggcgtca 20
<210>35
<211>633
<212>DNA
<213>Homo sapiens
<400>35
tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg ccttgagaag 60
cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt tggtttcctg 120
agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagwttc ttatacatgg 180
gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt ctgcaaaatg 240
aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg cttttgacag 300
aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg ggacagacag 360
aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta aagcattcct 420
ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt taccaagaag 480
taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg tactcaagta 540
gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa agtgaaggat 600
gatgacattt gaaaaacgga ggttgaaaag gag 633
<210>36
<211>25
<212>DNA
<213>Homo sapiens
<400>36
tatcttatat cccctccaag cattc 25
<210>37
<211>21
<212>DNA
<213>Homo sapiens
<400>37
ctccttttca acctccgttt t 21
<210>38
<211>1081
<212>DNA
<213>Homo sapiens
<400>38
ttgagcatgt gttatttaat gagttatacc tctgtcatat gtgtgtgttt atatcacaaa 60
ataacttatt tttataaaac catattttga gtcatcattt gtgacaatgt cttcttttct 120
ctggtataaa tgaggcatgt agaaagaaga ttgacatttg ctagaagctt cccctttcct 180
ctaactccac aataaaatgg atgctcataa ttacatctgc tcctataagg tcaagatttc 240
agggctggaa gtgaccttag atcatttagg cccaacttgc cctcaggaaa ggaaactgag 300
gcccagagat gccttaagtg aattgcccaa tgtcacacgc tgagtcagtg gccagagcaa 360
ggcttggatc cagttctctg ctccctttcc agagccttgt gatgtcttct ctcctacagg 420
aggtgaaaat aactgctgtg gctggttctg ttttgctgac tgtaaattgg gtcatggtca 480
gggacagtgc ataggtgtaa agaagttgct ggttgggggt tctaatgcag gtttctccaa 540
aagtgaatgc cctgttaaaa aaaaattctt aacaaatata cagagatttt tttttwaaaa 600
aagtgtgaca gttctagaca cctagagagt aaagtgaaga agcctgtttt caggtttccc 660
gcctccctga atttcccagc atggtccagg ctttgaaatt tatttatctg cttttggcaa 720
tggttgatgg gaatttccca catttatttt ttagctacag agaaaggaca ttatctttaa 780
aatctcttcg ttgttctctc tctttgagtg aggagagaag atgtgaatcc tggcagtggt 840
tcagagtgga cacagcccct gtgtttgtgg cataggctct gtgggcccca tgccagggag 900
cagtaccccc gtgtaaagga gtgggggttt gtccatttgg atagagcaaa gatcctccac 960
ctcaaatccc acaagaacag ttgccacaac ctgggcccta agcatctcat tttcctatgt 1020
agaaattaat gatctggagg agatggcaaa acattccttc cagagcctgt gtggattttg 1080
g 1081
<210>39
<211>26
<212>DNA
<213>Homo sapiens
<400>39
ttgagcatgt gttatttaat gagtta 26
<210>40
<211>20
<212>DNA
<213>Homo sapiens
<400>40
ccaaaatcca cacaggctct 20
<210>41
<211>599
<212>DNA
<213>Homo sapiens
<400>41
tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag 60
cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat 120
atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct 180
tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc 240
cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa 300
gaacaaagtg ttaaamaatt tcttgataca tagccacaga ttattttcct gaaagttctc 360
aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc 420
tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc 480
caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct 540
tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt 599
<210>42
<211>25
<212>DNA
<213>Homo sapiens
<400>42
tagtgctcag tatttccaac gttct 25
<210>43
<211>23
<212>DNA
<213>Homo sapiens
<400>43
aacatctgac cttgaagcct acc 23
<210>44
<211>599
<212>DNA
<213>Homo sapiens
<400>44
tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag 60
cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat 120
atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct 180
tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc 240
cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa 300
gaacaaagtg ttaaaaaatt tcttgataca tagccacaga ttattttcct gaaagttcts 360
aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc 420
tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc 480
caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct 540
tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt 599
<210>45
<211>641
<212>DNA
<213>Homo sapiens
<400>45
tgctatgtcc agtttacaca taaggatgtg caaatccagc aggttagctg agctgcccag 60
gaatatccag gcaagaatga ccatattctg ataattactc aggcctctgc ctcatctccg 120
ctgscccccc gccccctgac tctcttctga gtgccagatt cagcctccat ttgaatgcca 180
aatagacagg aaattagcat gcccagaatc cacgtcttta gtgcactctc tccccagctc 240
caaacctgtt actgcttgtg ttcaacatct cagtaaagct caacaacatc gacccattac 300
ttaggcctca aaccttgggt ggcatcgtcg attgctcttt tctttcatac cccacattca 360
acccatcagc ccatcccaca ggcccaagtg tgtcctctct accttcaaag cgtgtgtggc 420
atccaccgct tatcaccacc tctgccatta ccactggagt ccagtgccat catctctcac 480
ttggatgtgg ccagagtgtc tttgctggtc tccttcttgc ttcctacctt tgtaacagcc 540
tatcatctat ctctggtctc catagctcac tcccatactt tgagagggcc tttgaaagcc 600
ttagacagat catatcacag acctctatac tgaaagtcgg g 641
<210>46
<211>25
<212>DNA
<213>Homo sapiens
<400>46
tgctatgtcc agtttacaca taagg 25
<210>47
<211>24
<212>DNA
<213>Homo sapiens
<400>47
cccgactttc agtatagagg tctg 24
<210>48
<211>284
<212>DNA
<213>Homo sapiens
<400>48
ccatctgtgg agcagagtca ctgaaaggaa atactggaaa tactggaagc cacttggtgt 60
tttatcaagg atgtgaggtt tcctggcaac tttgtcgcca tatcatcatc atcatcacca 120
tcatcatcat catcatcatc atcatcatca tcatcatcat catcatctgc cctttaagtt 180
ttctgcttgt ttagaaaaga aatttataca gagcccccag tagcagctgt aagggggcag 240
gttcttggag cagcccatcc tcaacattct tgctgctgat ggaa 284
<210>49
<211>20
<212>DNA
<213>Homo sapiens
<400>49
ccatctgtgg agcagagtca 20
<210>50
<211>20
<212>DNA
<213>Homo sapiens
<400>50
ttccatcagc agcaagaatg 20
<210>51
<211>145
<212>DNA
<213>Homo sapiens
<400>51
tccacgcaga gaggatctaa atctggctct ttgcaattgc cttcatacat gtgcatacac 60
accacacaca cacacacaca cacacacaca cacacacaca cagacacata catatgcaca 120
caccccgact caatggagga ccctc 145
<210>52
<211>21
<212>DNA
<213>Homo sapiens
<400>52
tccacgcaga gaggatctaa a 21
<210>53
<211>20
<212>DNA
<213>Homo sapiens
<400>53
gagggtcctc cattgagtcg 20
机译: TCF7L2基因中的遗传变异作为2型糖尿病风险的诊断标志
机译: TCF7L2基因的遗传变异作为2型糖尿病风险的诊断标记
机译: TCF7L2基因中的遗传变异作为2型糖尿病风险的诊断标志