首页> 中国专利> 一种鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法

一种鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法

摘要

本发明涉及一种利用特别开发的软件GeneDecipher鉴定基因组中可用作药物靶点的蛋白质编码DNA序列(基因)的通用方法,所述方法包括用计算机处理字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得对应于每个读框的多肽;根据与肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中每条序列对应于一个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练为字母数字式序列;解密该测试基因组中的蛋白质编码区;从而鉴定对大量已知基因作图的肽的较长延伸段和它们对应的蛋白质;最后本发明涉及防治病原生物导致疾病的方法,包括通过抑制一种或多种本发明步骤鉴定到的蛋白质功能来评价提出的候选药物。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-20

    未缴年费专利权终止 IPC(主分类):G06F19/00 专利号:ZL2004800408373 申请日:20040109 授权公告日:20091216

    专利权的终止

  • 2009-12-16

    授权

    授权

  • 2007-04-11

    实质审查的生效

    实质审查的生效

  • 2007-02-14

    公开

    公开

说明书

                             发明领域

本发明涉及鉴定可用作药物靶点的蛋白质编码DNA序列的一种通用方法。更具体地说,本发明涉及鉴定各种生物基因组序列中鉴定可用作潜在药物靶点的新基因的方法。本发明还提供通过精确的氨基酸序列相同性标识(identity signature)说明(assignment)功能未知的推测的开放读框(蛋白质)的功能的方法。

已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供采用具有一输入层(input layer)、一含有30个神经元的隐藏层(hidden layer)和一输出层(output layer)的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数(learningfunction)来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分(fraction of zeroes)、最大连续性非零延伸段(maximum continuous non-zero stretch)和方差。

                         本发明背景和现有技术参考

鉴定新测序基因组中蛋白质编码DNA序列(基因)的最可靠方法是寻找其它生物中相接近的类似基因(BLAST(Altschul,S.F等,1990)和FASTA(Pearson,W.R.,1995))。DNA序列中的4种核苷酸不是随机分布的。编码区内核苷酸的统计学分布与非编码区明显不同(Bird,A.,1987)。以Hidden Markov模型(HMM)为基础的方法最有效地利用了这些统计学特性(Salzberg,S.L等,1998;Delcher,A.L等,1999;Lukashin,A.V.和Borodovsky,M.,1998),当将这些方法与发表的注释比较时,能预测到基因组中约97-98%的所有基因(Delcher,A.L等,1999)。已开发了利用HMM的各种算法,例如GeneMark、Glimmer等来预测原核生物的基因。所有现有方法中,Glimmer 2.0最为成功(Delcher,A.L等,1999)。然而,Glimmer也只能预测7-20%的额外基因(假阳性)。每种基因预测方法有其自身长处和弱点(Mathe,C.等,2002)。由于预测通常取决于训练组(training set),因各种交叉基因组之间编码区的不同而使这种统计学产生缺点。而且这些方法不能有效地预测长度短的基因(<100氨基酸),这是因为用类似的检索或统计学分析很难检测这些基因。就基因的水平转移而言,该问题愈加严重(Kehoe,M.A等,1996)。在此种情况中,基因组自身内这些基因的核苷酸序列的统计学分布也不同。

本发明所述的方法是基于以下的发现,即某给定长度肽的理论上可能的总数和实际上确实观察到的总数的差异随着该肽长度的增加而急剧上升。例如,在56个完全测序的原核生物基因组库中仅观察到理论上可能的七肽的约2%。在八肽水平上,该数字降低至小于0.1%。此外,有趣地注意到就其性质而言,大多数这些选出的肽仅发现于编码区中,而非常罕见于理论上可被翻译的非编码区中。此发现促使我们研究了蛋白质编码序列中的肽的这种天然选择排他性是否可用来区分编码区和非编码区。

从原理上讲,只有当得到了足够的数据用来估计训练(train)预测算法所需的统计学参数,才能总是优选用较长而非较短的肽给查询ORF评分(Salzberg,S.L.等,1998)。但当我们使用长度为8个或更多个氨基酸的肽时,难于得到足够的数据来估计这些训练参数。这是因为两种多肽之间共有一个八肽的可能性小于共有一个七肽。所以,我们认为7个氨基酸的长度对于ORF评分是最佳的。

本文所述方法的新颖性在于它是根据蛋白质编码序列的氨基酸水平,而非核苷酸水平进行工作。值得注意的是该方法无需生物特异性训练组,这点相对于其它方法具有明显优势。与其它方法不同,GeneDecipher不采用诸如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱等任何地标(landmark)来预测编码基因和它们的起始部位。此外,该方法克服了对较小基因组(Chen,L等,2003),如SARS-CoV作基因预测的困难。与基因预测不同,该方法也可用于多肽的相似性检索、蛋白质推测的功能说明(根据该寡肽基序的存在)和种系发生的结构域分析,表明该方法具有广泛应用性和通用性。

现有的计算方法,例如GeneMark.hmm(Lukashin和Borodovsky,1998)、Glimmer(Salzberg等,1998)等在分析小基因组,例如SARS时有困难。基于Hidden

Markov模型(HMM)的方法需要数千个训练参数。这使得这些方法不适于分析较小的基因组。就SARS-CoV基因组而言,所述化合物长度约30kb。迄今为止,即使最适用于预测病毒基因的方法-ZCURVE_CoV(Chen等,2003)也需要33种训练参数。GeneDecipher只需要5种参数即能分析较小的基因组。申请人在大肠杆菌-k12基因组编码和非编码区上训练了人工神经网络(ORF不报道为基因)。使用GeneDecipher预测病毒基因组上蛋白质编码基因无需额外的训练。这是该方法优于其它方法的一个明显优点。

本发明的目的

本发明的主要目的是提供基于计算机的方法来预测可用作药物靶点的蛋白质编码DNA序列(基因)。

本发明的另一主要目的是开发一种利用软件GeneDecipher的通用性方法,所述方法采用在其它基因组的ORF中发现的寡肽来鉴定基因。

本发明还有另一目的是开发一种适用于防治病原性生物所致疾病的方法。

本发明还有另一目的是开发一种执行上述方法的基于计算机的系统。

本发明还有另一目的是开发一种用于鉴定可用作潜在药物靶点的新蛋白质编码DNA序列的方法,该方法可用作广谱抗菌药物的药物筛选以及感染的特异性诊断。

本发明还有另一目的是鉴定菌株特异性或生物特异性的蛋白质编码基因。

本发明还有另一目的是鉴定真核生物的蛋白质编码DNA序列(外显子)。

本发明的另一目的是通过精确的氨基酸序列相同性标识说明功能未知的推测的开放读框(蛋白质)的功能。

本发明小结

本发明涉及利用软件GeneDecipher,采用在其它基因组的ORF中发现的寡肽来鉴定基因并且也适用于分析小基因组的通用性方法,所述方法包括以下步骤:用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的功能来评价所提出的候选药物步骤。

本发明详述

因此,本发明涉及利用专门开发的软件GeneDecipher鉴定基因组中可用作药物靶点的蛋白质编码DNA序列(基因)的通用性方法,所述方法包括以下步骤:用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的作用来评价所提出的候选药物步骤。

在本发明的一个实施方案中,鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法包括以下步骤:

·用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;

·人工翻译该测试基因组从而获得每个读框的多肽;

·根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;

·用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;

·解密该测试基因组中的蛋白质编码区,和

·鉴定用作功能性标识的对大量已知基因作图的肽的较长延伸段。

在本发明的另一实施方案中,所述人工神经网络具有一个或多个输入层、含有数目不同神经元的一个或多个隐藏层和一个或多个输出层。

在本发明还有的另一实施方案中,所述隐藏层中神经元的数量优选30。

在本发明还有的另一实施方案中,所述‘N’的值是4或更大。

在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。

在本发明还有的另一实施方案中,所述鉴定基因的方法采用发现存在于(但不限于)流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的其它基因组ORF中的寡肽。

在本发明还有的另一实施方案中,权利要求1所述的方法中的所述肽文库数据可取自任何生物,而不特别限于本发明所用的那些。

在本发明还有的另一实施方案中,SEQ ID No 1-44所示流感嗜血菌的一组基因用上述方法鉴定。

在本发明还有的另一实施方案中,SEQ ID No.170-213所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 1-44所示流感嗜血菌基因。

在本发明还有的另一实施方案中,SEQ ID No 45-60所示幽门螺杆菌的一组基因用上述方法鉴定。

在本发明还有的另一实施方案中,SEQ ID No.214-229所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 45-60所示幽门螺杆菌基因。

在本发明还有的另一实施方案中,SEQ ID No 61-165所示结核分枝杆菌的一组基因用上述方法鉴定。

在本发明还有的另一实施方案中,SEQ ID No.230-334所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 61-165所示结核分枝杆菌基因。

在本发明还有的另一实施方案中,SEQ ID No 166-169所示SARS-冠状病毒的一组基因用上述方法鉴定。

在本发明还有的另一实施方案中,SEQ ID No.335-338所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 166-169所示SARS-冠状病毒基因。

在本发明还有的另一实施方案中,对应于SEQ ID No 1-169所示基因的可作为药物靶点的SEQ ID No.170-338所示蛋白质用作防治需要这种防治的对象的病原生物所致疾病。

在本发明还有的另一实施方案中,所述病原性生物选自SARS-冠状病毒、流感嗜血菌、结核分枝杆菌就幽门螺杆菌。

在本发明还有的另一实施方案中,所述对象是动物。

在本发明还有的另一实施方案中,所述对象是人。

在本发明还有的另一实施方案中,所述应用可扩展至真核生物和多细胞生物。

已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供使用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差。

本申请人发明了通过与含有数百万个肽的经受了自然选择的肽文库作比较来鉴定蛋白质编码DNA序列的基于计算机的新方法,所述肽得自许多生物的蛋白质序列。该方法描述了一种可用于基因鉴定的可广泛使用的和通用性的新方法。该计算机处理的方法通过利用肽文库和人工神经网络能在某给定的DNA序列的所有可能的开放读框(ORF)中确定候选基因。所述肽文库由得自完全测序的56种或更多种原核生物基因组的蛋白质的所有可能的重叠七肽构成。根据文库七肽(文库中存在的七肽)沿着ORF的丰度和分布模式确定某给定的查询ORF是否为基因。该方法的性能特征在于灵敏度和特异性都很高。分析完全测序的10种原核生物基因组证明了本发明方法的效力。

本发明方法也可预测针对病原生物某特定肽基序的其它(alternate)靶点或负责疾病进程的任何宿主蛋白质靶点。可利用不同长度的肽扩展该方法来获得更大量的蛋白质编码基因以及用于真核生物与多细胞生物。

本发明涉及通过采用肽文库将DNA序列转变为字母数字式序列的新方法,本发明也提供采用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还涉及用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差,该方法可用于鉴定新的蛋白质编码区作为广谱抗菌药物的药物筛选以及感染的特异性诊断,此外可用于说明功能尚未知的新鉴定的蛋白质的功能。该方法可鉴定各物种或菌株的特异性蛋白质编码基因。该方法甚至也可扩展至对真核生物基因组中的任何蛋白质编码序列进行鉴定。

因此,本发明公开了鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的一种通用方法,所述方法包括以下步骤:

a.用计算机处理以字母顺序排列的长度为‘N’的寡肽从已知基因组产生肽文库;

b.人工翻译该测试基因组获得每个读框的多肽;

c.根据这些寡肽在该肽文库的存在将每条多肽序列转变为字母数字式序列,其中各条序列对应于各个读框;

d.用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;

e.解密该测试基因组中的蛋白质编码区,和

f.鉴定用作功能性标识的对大量已知基因作图的肽(进化上保守的寡肽)的较长延伸段。

在本发明的另一实施方案中,所述ANN具有一个或多个输入层、含有数量不同神经元的一个或多个隐藏层和一个或多个输出层。在本发明还有的另一实施方案中,所述隐藏层中神经元数目优选30。

在本发明还有的另一实施方案中,所述‘N’的值是4或更大。

在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。

本发明的再一个实施方案(涉及)鉴定具有进化上保守的肽序列的基因的方法,这些保守的肽序列存在于各种(生物)基因组的ORF中产生,包括,但不限于:流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的基因组。

在本发明还有的另一实施方案中,该方法在SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌的基因组中鉴定了169种SEQ ID 1-169所示的新基因。

本发明还有的实施方案(提供)防治病原生物,例如SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌所致疾病的方法,所述方法包括评价所提出的候选药物能否抑制一种或多种进化上保守的肽序列的功能,这些保守的肽序列可用本方法鉴定,选自对应于SEQ ID 1-169所示新基因(编码)的SEQ ID 170-338所示蛋白质。

在本发明还有另一实施方案中,该肽文库数据可取自任何生物而不特别限于本文所用的那些。

方法详述:

该方法主要有5步(如图1所示):

1.产生肽文库。

2.将某给定的基因组人工翻译成6个读框。

3.将每条翻译的序列转变为字母数字序列。(各条对应于各个读框)。

4.训练人工神经网络(ANN)。

5.使用经训练的ANN解密这些基因。

1.产生肽文库

本发明需要一个参比肽文库来预测某给定基因组中的基因。在本发明中,申请人采用了已完全测序的56种原核生物基因组(编码)的蛋白质。我们数据库的蛋白质文件从ftp://ftp.ncbi.nlm.nih.gov/genomes以FASTA格式获得。为制备用于解密某特定基因组中基因的肽文库,申请人排除了属于我们数据库的特定物种的蛋白质文件,目的是避免任何偏向性。例如,当分析大肠杆菌-k12基因组时,将对应于大肠杆菌所有菌株的蛋白质文件排除在用于产生该肽文库的数据库之外。当分析新测序的基因组时,必需这样做以除去得自该生物的肽的信号。这增强了该方法对不能得到其注释的蛋白质文件的新测序基因组的基因预测(能力)。产生肽文库时,通过将读窗移动一个氨基酸来包括所有可能的重叠七肽。从该肽文库中除去冗余肽,根据不同生物存在的肽数目给每个肽一个出现值。

该出现值是对编码区中七肽保守性的一种度量。ORF中存在高出现值的某七肽增加了该ORF是蛋白质编码基因的可能性。依据以下假设,如果某七肽在9种或更多种不同生物的蛋白质文件中存在,可认为它是高度保守的七肽,我们的算法将9或更大的出现值处理为9。用更高的值来进一步区分保守程度(amount)没有意义。

所述七肽文库由两列构成,第一列是七肽序列,第二列是该七肽的评分(出现值)。七肽按字典顺序分类。肽文库数据库也保留有关七肽的其它信息,例如所有包含特定七肽的蛋白质的登录号和NCBI注释。可利用其对某给定的ORF作假定的功能预测。同一方法也可用于种系发生结构域的分析。

2.将某给定基因组人工翻译成6个读框

该算法的第二步是用标准密码子表将全部查询基因组人工翻译成所有的6个读框。然而,当需要时可采用用户指定的密码子表。在人工翻译基因组时,申请人使用字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。

3.将每条翻译的序列转变为字母数字式序列(各条对应于各个读框)

我们的算法中下一步是将人工翻译,带有终止密码子(z)中断的氨基酸序列转变为字母数字式序列。申请人在肽文库中检索了每条重叠的七肽,分配了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于该文库中,申请人分配数值为0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子的位置。当某七肽含有符号‘z’时,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号说明存在非标准核苷酸符号并且不传送关于序列是基因还是非基因一部分的信息。因此,如此产生的字母数字式序列含有13个符号,即任何整数(0-9)、‘s’、‘*’和‘-’。申请人以该方式将所有6个翻译蛋白质的文件转变为6个字母数字式序列。

4.训练人工神经网络(ANN)

本文所用的神经网络具有多层正反馈拓扑学(结构)。它由一输入层、一隐藏层和一输出层构成。这是‘完全连接’的神经网络,其中每个神经元i与下一层的每个单元j相连(图2)。每个连接的权重以wij表示。输入层中每个神经元的状态Ii直接从输入数据指派,而隐藏层神经元的状态用S形(曲线)函数,hj=1/(1+exp-λ(wj0+∑wijIi))用计算机处理,其中wj0是偏置权重,λ=1。

采用了反向传播(back propagation)算法以尽可能降低计算机输出和所需输出之间的差异。进行了一千次轮(信号出现时间(epoch))迭代。然后鉴定确认组(validation set)中最小误差的信号出现时间,对应的权重(wij)指派为ANN的最终权重。该网络在训练组训练、核对误差并通过反向传播利用确认组优化。

‘训练组’由1610个NCBI列出的大肠杆菌-k12的蛋白质编码基因和还未报道为基因(非基因)的3000个大肠杆菌-k12 ORF(长度超过20个氨基酸并在同一框内含有起始密码子、终止密码子的序列延伸段)构成。‘确认组’具有大肠杆菌-k12的1000个已知基因和1000个非基因而与训练组所用的基因相区别。‘测试组’含有同一生物的另1000个基因和1000个非基因。为训练ANN,分别将基因和非基因的概率值指派为1和0。

为训练神经网络,申请人首先通过上述方法(步骤2和3)将大肠杆菌-k12所有的基因和非基因转变为对应的字母数字串。此时重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量某字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数:

(i).总评分

这是某给定的字母数字式序列的所有整数的代数和。经验法则方法是评分越高,成为基因的机会越大。

(ii).零部分

零部分等于字母数字式序列中零符号的总数除以该序列中符号的总数。零部分越多,成为基因的机会越低。

(iii).平均值

平均值等于总评分除以序列的总长度。平均值越高,成为基因的机会越高。实际上,该参数似乎与总评分相同,但由于该参数也包括了序列的长度(每单位长度的评分),它是重要的。

(iv).方差

是关于整个ORF的平均出现值的出现值方差。

(v).最大连续性非零延伸段的长度

该参数的值越高,成为基因的机会越高。设想如‘45’的序列区。这里,‘4’表示某七肽在4种生物中保守,其后的‘5’表示某重叠的七肽在5种生物中保守。因此,如果在这两组之间至少一种生物是共同的,申请人最终获得了在该生物和查询ORF之间有共同一个八肽。这提高了我们预测编码区的可信度。例如,当与序列‘s40540607000*******’比较时,序列‘s45467000000********’更可能是一个基因。这是因为在后一序列中更有可能存在较长的保守肽。前一序列的该参数值是2而后一序列的为5。然而,该算法中所用的其它参数不能区分这两条序列。

当计算该字母数字式序列的这些参数时,已排除了例如‘s’、‘*’和‘-’符号。

为找到最佳组合,采用所有的5个参数一起训练神经网络。计算对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。

输入层中神经元的数目等于输入数据点的数目。隐藏层中神经元的最佳数目由命中(hit)和试验所确定同时尽可能减少网络最佳信号出现时间的误差。计算所有5个参数的计算机程序和人工神经网络用C(语言)编写,在装有Red Hat Linux 7.3或8.0版的PC上执行。

训练ANN(该算法的步骤4)通常只进行一次,训练过的同一神经网络可用于对任何原核生物基因组执行该方法。虽然如果申请人采用生物特异性训练组,在一些情况中结果可能有所改善,但很勉强。这是因为我们的方法是根据ORF的字母数字式序列的数字分布来预测基因。所以,基因预测更依赖于所用的肽文库而非训练组。

5.使用训练过的ANN解密基因

虽然认为产生肽文库(步骤1)和训练ANN(步骤4)是执行本发明方法的预备阶段,但步骤2和步骤3对每个基因组测序而言是强制性的。用计算机处理将基因组翻译成所有的6个读框并将它们转变为6个字母数字式序列后,即可用ANN解密这些基因。该步骤还可分为以下5个小步骤:

1.将所有6条字母数字式序列截断成可能的ORF。(所有可能的片段始于‘s’,终于‘*’)

2.计算所有可能的ORF(所有的字母数字串在‘s’和‘*’之间)的所有5个参数(总评分、零部分、平均值、方差和连续性非零延伸段的长度)。

3.用训练过的ANN计算对应于某给定字母数字串的ORF成为蛋白质编码基因的概率。

4.采用一截断概率值从非编码ORF中滤出蛋白质编码ORF。

5.除去所有重叠(encapsulate)的蛋白质编码区(Shibuya,T.和Rigoutsos,I.,2002)

如果在不同的翻译框中预测了两个ORF,以致于一个延伸完全重叠了另一个,通常认为二者中只有一个可能是真正的基因。在这种情况中,申请人报告具有较高概率值的ORF为基因。当概率值相同时,申请人取较长的ORF为基因。

本发明的方法可预测对应于某查询ORF是蛋白质编码区的概率值。利用=1的S形(曲线)学习函数训练ANN(基因的概率为‘1’,非基因的概率为‘0’);因此,大多数时间此概率值低于0.1或高于0.9。由于该原因,0.1-0.9之间的任何截断值可能得到非常相似的结果。在我们的分析中,申请人使用的默认截断值为0.5。重要的是应注意,本发明无需在灵敏度和特异性之间寻求平衡,因为截断概率的选择对结果无重要影响。

本发明的其它方面、特征和优点将通过以下提出的出于公开目的本发明优选实施方案的描述而得以明了。

计算机程序简述:

1.文件名:genedcodchr.cxx

应用:将核苷酸序列(FASTA文件格式)翻译成6个独立框中的6个假设的多肽。

输入格式:<Program_name><Nucleotide_file><Output1><Output2><frame>例如,./genedcodchr ecoli.fna pf1 pr1 0

输出格式:AGTFYRYmGHVNMKIYTASLPTYRYGYFSHRED.....HGOIEKSDWEzDFGTRE

2.文件名:searchchr.cxx

应用:通过七肽文库(给定的输入)检索将多肽文件转变为字母数字式序列。

输入格式:<Program_name>7<peptide library file name>out Y<Input1><Input2><Output1><Output2>例如./searchchr 7 ecoli.peplib out Y pf1 pr1 bf1 br1

输出格式:

s1124500001090003000020000023000000000*******0001000..........

3.文件名:cutfc

应用:从正向链的字母数字式序列切除所有可能的ORF(即,所有的‘s’到‘*’区域),产生含有字母数字式序列中所有‘s’的位置的文件。

输入格式:<Program_name><Input file name><Output1><Output2>例如../cutf bf1 unknown_bf1 bf1_location

输出格式:output1-s1111000s00000000563*,output2-某列中‘s’的起始位置。

4.文件名:cutr.c

应用:从反向链的字母数字式序列切除所有可能的ORF(所有的‘s’到‘*’区域),产生含有字母数字式序列文件中对应于所有ORF的所有3个正向框的起始位置的文件。

输入格式:<Program_name><Input file name><Output1><Output2>例如../cutr br1 unknown_br1 br1_location

输出格式:output1-*010340000222200067900000s000001000200s00230000s,

output2-‘s’的起始位置

5.文件名:stat.c

应用:计算某给定的字母数字式序列的5个参数:零部分、平均值、总评分、最大连续性延伸段的长度和方差。

输入格式:<Program_name><Input file name><Output>1例如../statunknown_bf1 bf1.data 1

输出格式:0.334 3.2 48 15 0.452 1

6.文件名:train.c

应用:利用S形(曲线)(=1)作为学习函数以正反馈传播算法训练人工神经网络(一隐藏层、一输入和一输出层)。

输入格式:<Program_name><Input specification file name><Input1><Input2><Input3>>output

例如../train train.spec.fast trainset.data validateset.data testset.data>train.Net

输出格式:输出一单列中所含有的最终神经网络权重

7.文件名:recognize.c

应用:根据训练过的权重识别某给定的模式并产生概率值作为输出。

输入格式:<Program_name><Input specification file name><Input1><Input2><Output>例如../recognize recognize.spec bf1.data train.net f1.out

输出格式:pat1 probability<value>

8.文件名:Filter_prediction.c

应用:根据概率和长度参数滤除同一框中完全重叠的ORF。

输入格式:<Program_name)<Input1><Input2><Output>例如../Filter_prediction f1.out unknown_bf1 bf1.out.res

输出格式:pat1 probability<value><integer string>

9.文件名:locationf.c

应用:滤除长度<20个氨基酸的基因,报告含所有3个正向框字母数字式序列的其余基因的起始位置

输入格式:<Program_name><Input1><Output><Input2>例如../locationfbf1.out.res bf1.out.res bf1_location

输出格式:<Pattern No><Probability value><integer string><Start><End>

10.文件名:locationr.c

应用:滤除长度<20个氨基酸的基因,报告含与所有3个反向框的字母数字式序列的其余基因的起始位置

输入格式:<Program_name><Input1><Output><Input2>例如../locationrbr1.out.res br1.out.res1 br1_location

输出格式:<Pattern No><Probability value><integer string><Start><End>

11.文件名:finalf.c

应用:将字母数字式序列的起始和末端位置转变为3个正向框的相应的基因组位置

输入格式:<Program_name><Input1><Input2><Input3><Output>例如../finalf bf1.out.res1 bf2.out.res1 bf3.out.res1 Final_outputf

输出格式:<Start><End><frame><length><Probability value>integerstring>

12.文件名:finalr.c

应用:将字母数字式序列的起始和末端位置转变为3个反向框的相应的基因组位置

输入格式:<Program_name><Input1><Input2><Input3><Output>例如../finalf br1.out.res1 br2.out.res1 br3.out.res1 Final_outputr

输出格式:<Start><End><frame><length><Probability value><integerstring>

13.文件名:sort.c

文件名:sort.c

应用:将最终预测的基因打印为沿该基因组起始位置的递降顺序。

输入格式:<Program_name><Input1><Input2><Input3><Output>例如../sort Final_outputfFinal_outputr OUTPUTF_with_encap

OUTPUTR_with_encap OUTPUT

输出格式:<Start><End><Probability value>

14.文件名:removeencap.c

应用:除去在其它5个框中发现的重叠基因

输入格式:<Program_name><Input1><Input2><Input3><Output>例如../removeencap OUTPUTF_with_encap OUTPUTR_with_encap OUTPUTOUTPUTF OUTPUTR

输出格式:<Start><End><frame><length><Probability value>integerstring>

本发明涉及基于计算机的预测可用作药物靶点的蛋白质编码DNA序列的新方法。在该方法中,利用出现的寡肽标签(signature)作为探针。该方法是通用性的,不一定需要用于人工神经网络的生物特异性训练组。该方法不仅依赖于统计学分析,而且整合了经受过进化压力的保守肽中所保留的生物信息。可合乎逻辑地扩理地拓展该方法来预测真核生物基因组中的蛋白质编码DNA序列(外显子)。

附图简述

图1显示了GeneDecipher的逻辑电路。

图2显示了神经网络的结构。

图3显示了GeneDecipher对10种生物所得结果的分析。

下文给出了本发明所用生物的细节,包括名字、菌株、登录号和其它细节。

  菌株号  基因组菌株  登录号  总碱基  序列  完成日期  1  2  流感嗜血菌 Rd  生殖道枝原体--  NC_000907  NC_000908  1830138  580074  1996年9  月30日  2001年1  Fleischmann,R.D.等,Science  269(5223),496-512(1995)  Fraser,C.M.等,Science 270
   3   4   5   6   7   8   9   10   大肠杆菌K-12   枯草芽胞杆菌  168  闪烁古生球菌  DSM4304  结核分枝杆菌  H37RV  苍白密螺旋体--   海栖热袍菌--   集胞蓝细菌  PCC6803  幽门螺杆菌  26695   NC_000913   NC_000964   NC000917   NC_000962   NC~000919   NC_000853   NC_000911   NC_000915   4639221   4214814   2178400   4411529   1138011   1860725   3573470   1667867  月8日  2001年10  月15日  1997年11  月20日  1997年12  月17日  2001年9  月7日  2001年9  月7日  2001年9  月10日  1996年10  月30日  2001年9  月7日  (5235),397-403(1995)  Blattner,F.R.等,Science 277  (5331),1453-1474(1997)  Kunst,F.等,Nature 390  (6657),249-256(1997)  Klenk,H.P.等,Nature 390  (6658),364-370(1997)  Cole,S.T.等,Nature 393  (6685),537-544(1998)  Fraser,C.M.等,Science 281  (5375),375-388(1998)  Nelson,K.E.等,Nature 399  (6734),323-329(1999)  Kaneko,T.等,DNA Res.3(3),  109-136(1996)  Tomb,J.-F.等,Nature 388  (6642),539-547(1997)

给出以下实施例是为了说明本发明而不应理解为限制本发明的范围。

实施例1

将DNA序列转变为字母数字式序列

该模块在我们软件中的目的是经计算机处理利用特定的密码子表将整个查询基因组(DNA序列)翻译成所有的6个读框。人工翻译基因组时,申请人使用的字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。然后将翻译的基因组序列经计算机处理转变为字母数字式序列([0-9]、‘s’、‘*’和‘-’)。申请人在该肽文库中检索了每条重叠的七肽,指派了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于此文库中,申请人指派数值0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在该字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子位置。在某七肽含有符号‘z’的情况中,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(*******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号表明存在非标准核苷酸符号。

在下列6条序列的帮助下进一步精制了上述转变。

·SEQ ID No.12

 GDC_HINF_243018  243018  243215  65 +  细胞壁相关的水解酶

>gi_GDC_HINF_243018

GTGATGAGCCGACATCGAGGTGCCAAACACCGCCGTCGATATGAACTCTTGGG

CGGTATCAGCCTGTTATCCCCGGAGTACCTTTTATCCGTTGAGCGATGGCCCTT

CCATTCAGAACCACCGGATCACTATGACCTACTTTCGTACCTGCTCGACTTGTC

TGTCTCGCAGTTAAGCTTGCTTATACCATTGCACTAA

计算机翻译的蛋白质序列

>gi_GDC_HINF_243018

VMSRHRGAKHRRRYELLGGISLLSPEYLLSVERWPFHSEPPDHYDLLSYLL

DLSVSQLSLLIPLH

计算机产生的字母数字式序列

ss10000000000001s03111431000000000000000000110000100s001030*

·SEQ ID No.4

 GDC_HINF_170553  170553  170732  59-  二羧酸盐转运蛋白同  系物HI0153

>gi_GDC_HINF_170553

GTGTTTATGCTTTATTTAGAATTTTTATTTTTACTATTAATGCTCTATATCGGTA

GCCGTTACGGCGGTATCGGATTAGGTGTTGTTTCTGGTATCGGTCTTGCTATCG

AGGTTTTCGTATTTCGTATGCCAGTGGGGAAGCACCGATTGATGTTATGCTTAT

CATTCTTGCAGTGGTGA

计算机翻译的蛋白质序列

>gi_GDC_HINF_170553

VFMLYLEFLFLLLMLYIGSRYGGIGLGVVSGIGLAIEVFVFRMPVGKHRLMLCLSFLQW

计算机产生的字母数字式序列

s0s1131231142s1111445232254238000000000000s0s0000ss00*

·SEQ ID No.73

  GDC_MTUB_688806  688806  689060  84 +  MCE家族蛋白  MCE2B

>gi_GDC_MTUB_688806

TTGCTGCACAGCAGCTTCGGGCACCTCGAGGGCATCCAGCAGCCGCTCATAGA

CGAGCTGGCAGAACTCGACCACGTGTTGGGCAAGCTGCCGGACGCCTACCGGA

TCATCGGCCGCGCCGGCGGCATATACGGTGACTTCTTCAACTTCTATCTGTGTG

ACATCTCACTGAAAGTCAACGGATTACAGCCTGGAGGTCCGGTACGCACCGTC

AAGTTGTTCGGCCAGCCGACCGGCAGGTGCACACCGCAATGA

计算机翻译的蛋白质序列

>gi_GDC_MTUB_688806

LLHSSFGHLEGIQQPLIDELAELDHVLGKLPDAYRIIGRAGGIYGDFFNFYLCDISLKVNGLQPGGPVRTVKLFGQPTGRCTPQ

计算机产生的字母数字式序列

s000000000110110530100000ss000000000000100000000000000000001111210000000s00100*

·SEQ ID No.92

  GDC_MTUB_1286282  1286282  1286587 101-  喋呤-4-α-甲醇胺脱水酶

>gi_GDC_MTUB_1286282

GTGACGGTATACCGTCGAGGTATGGCTGTGTTAACGGATGAGCAGGTCGACGC

CGCACTGCACGACCTCAACGGCTGGCAGCGCGCCGGTGGTGTCCTGCGTAGGT

CAATCAAGTTTCCGACGTTTATGGCCGGTATCGACGCCGTACGCCGGGTGGCC

GAGCGAGCCGAGGAGGTAAATCATCATCCGGACATCGATATCCGTTGGCGAAC

AGTAACTTTCGCGCTGGTTACGCATGCGGTAGGTGGTATCACGGAAAACGACA

TTGCGATGGCGCACGATATCGACGCAATGTTTGGGGCCTAA

计算机翻译的蛋白质序列

>gi_GDC_MTUB_1286282

VTVYRRGMAVLTDEQVDAALHDLNGWQRAGGVLRRSIKFPTFMAGIDAVRRVAERAEEVNHHPDIDIRWRTVTFALVTHAVGGITENDIAMAHDIDAMFGA

计算机产生的字母数字式序列

s000000s0s21110001000000300000000011000000s01031100s00020000110000000030000000013310000000s0001*

·SEQ ID No.49

 GDC_HPYL_583607  583607  583876  89  + 可能的DNA解旋酶

>gi_GDC_HPYL_583607

TTGATGGAATTTGATGTTACCATCATAGATGAGACAGGCAGGGCCACAGCACC

AGAAATCTTGATTCCTGCACTTCGCACTAAAAAACTGATCTTAATAGGCGATC

ACAACCAGCTCCCACCTAGCATTGATAGGTACCTCCTAGAACAATTAGAGAGC

GATGATATTCAAAACTTGGATGCCATTGATCGCCAATTATTGGAAGAGAGTTT

TTTTGAAAATCTCTATAAGTATATTCCAGAGAGTAATAAGGCCATGCTTAATG

AGTAA

计算机翻译的蛋白质序列

>gi_GDC_HPYL_583607

LMEFDVTIIDETGRATAPEILIPALRTKKLILIGDHNQLPPSIDRYLLEQLESDDIQNL DAIDRQLLEESFFENLYKYIPESNKAMLNE

计算机产生的字母数字式序列

ss001000000000000000s0000011000020000000000030310000000002s0003020s0000000000000000*

·SEQ ID No.54

  GDC_HPYL_954846  954846  955217  123 -  磷酸转乙酰酶

>gi_GDC_HPYL_954846

GTGAGCCTGGTTTCAAGCGTGTTTTTAATGTGTTTAGACACTCAAGTGCTAGTC

TTTGGGGATTGCGCGATTATCCCTAACCCTAGCCCTAAAGAATTAGCCGAGAT

CGCTACCACTTCCGCACAAACCGCCAAGCAATTCAATATTGCGCCTAAAGTGG

CCTTGCTTTCTTATGCGACAGGCGATTCCGCTCAAGGCGAAATGATAGACAAA

ATCAACGAAGCTTTAACAATCGCTCAAAAGTTGGATCCCCAATTAGAAATTGA

TGGCCCCTTACAATTTGACGCTTCCATTGATAAAAGCGTAGCCAAGAAAAAAT

GCCTAACAGCCAAGTGGCTGGGCAAGCTAGCGTTTTTATTTTCCCGGATTTAA

计算机翻译的蛋白质序列

>gi_GDC_HPYL_954846

VSLVSSVFLMCLDTQVLVFGDCAIIPNPSPKELAEIATTSAQTAKQFNIAPKVALLSYATGDSAQGEMIDKINEALTIAQKLDPQLEIDGPLQFDASIDKSVAKKKCLTAKWL GKLAFLFSRI

计算机产生的字母数字式序列

s80000s00s00002s200222000000003100000000000000000010s0s100000000000s0000000100000s00000000000000000000000000030000010*

实施例2

训练人工神经网络(ANN)

该模块在软件中的目的是用特定的基因和非基因编号训练指定的神经网络(图2)。在该实施例中,训练组由1610个NCBI列出的大肠杆菌-k12蛋白质编码基因和还未报道为基因的3000个大肠杆菌-k12 ORF(非基因)构成。确认组具有大肠杆菌-k12的1000个已知基因和1000个非基因而和训练组所用的相区别。测试组含有同一生物的另外1000个基因和1000个非基因。为训练ANN,基因和非基因分别指派的概率值为1和0。为训练神经网络,申请人首先通过上述方法(步骤2和3)将所有大肠杆菌-k12基因和非基因转变为对应的字母数字式链。图3显示了字母数字式序列格式的两个大肠杆菌-k12基因和两个非基因的例子。这里重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量其字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数:

表1(a)和1(b)解释了总评分(某给定的字母数字式序列的所有整数的代数和)、零部分(该字母数字式序列中零符号的总数除以该序列中符号的总数)、平均值(总评分除以序列的总长度)、方差(关于整个ORF的平均出现值的出现值方差)、最大连续性非零延伸段的长度(表示无间断的非零数字在序列中的占位情况)。

表1(a):训练ANN(基因)

  序列号  零部分  总评分  平均值  最大连续  延伸段  方差  概率  1  0.663116  587  0.7816  19  2.10146  1
  2  0.693950  214  0.7616  18  2.43068  1  3  0.597436  412  1.0590  13  3.16832  1  4  0.898876  12  0.1348  4  0.20654  1

表1(b):训练ANN(非基因)

  序列号  零部分  总评分  平均值  最大连续  延伸段  方差  概率  1  0.946429  3  0.0536  0  0.05070  0  2  1.000000  0  0.0000  0  0.00000  0  3  0.955556  2  0.0444  1  0.04247  0  4  0.956522  2  0.0435  1  0.04159  0

当计算该字母数字式序列的这些参数时,排除符号‘s’、‘*’和‘-’。为确定每个参数对区分基因与非基因的作用,采用所有5个参数一起训练神经网络。计算出对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。

实施例3

申请人使用本发明的方法分析了10种原核生物基因组。该方法的效率定义为由所述方法预测的NCBI列出的蛋白质编码区的百分比。通过专门开发的程序自动除去所有重叠的蛋白质编码区。该方法能预测平均92.7%的NCBI列出的基因,标准差是2.8%。除结核分枝杆菌H37RV基因组外,该方法的灵敏度和特异性值均高(如图3所示)。

实施例4

预测蛋白质编码DNA序列的起始位置

本发明方法预测起始位置的正确率从结核分枝杆菌H37Rv的49.5%(特异性也是最低的)到幽门螺杆菌26695的81.1%。申请人的方法根据是否存在起始密码子加周围七肽的保守情况可确定该起始位置。也可利用该方法预测经一些其它方法预测的查询蛋白质编码DNA序列的起始位置。这可通过简单地将蛋白质序列转变为对应的整数序列,然后根据周围七肽确定正确的起始位置来实现。为举例说明起始位置的预测(如下所示),申请人报告了大肠杆菌K-12基因组的3个这样的情况(两个来自正向链,一个来自反向链)。

预测起始位置时,要兼顾数字丰富程度和ORF的长度。在情况1(PID 16132273)中,NCBI将该基因的起始位置从位置85540移至85630。目测对应于该基因的整数序列,可以明显看出较早的在‘s’后有充满0的区域;或者换言之它不是富含数字的区域(下图所示情况1中的黑体区域)。现在移动起始位点使它位于本发明方法预测的数字丰富区之前。情况2是该起始密码子向5’上游移动的一个例子,因为在该起始密码子的上游有数字丰富区(‘2011111’和一个‘3’和一个‘2’)。故该位点从位置4611194移至4611050。情况3是移动反向链中起始位点的另一例子,其中在较早的NCBI起始位置的上游有数字丰富区(该数字串中有‘16531311’和许多其它数字)。

情况1.PID 16132273

位置    较早的NCBI(85540……87354);    新的NCBI(85630……87354)

s0s0000000000000s000000000s000s2ss4222s111000000000999922224210000s00s40004

466442223s0s0120000000177s9999855553239888440s001111000113002s1116311112ss

22222s430100000000100s0100000639977100011100100000001000000000s2000010030

000011110111100000161171000000000s201s12s0000002ss10000000001099s76s621110

0s0s0000s00014444441111100000000000234331211000s033221s000000014s000s00000

002000000000001110000000000000000000s000001s000000s48976531s11111100012234

59999999s92554010010s0s0002s2236667778s75221001s000s000ss00000066ss11111s32

11100000s000002204332110000000000210010010000s00000s11000000354211s000000s

00s22*******

情况2.PID 16132266

位置    较早的NCBI(4611194……4611829);    新的NCBI(4611050……4611829)

s00020111110000000000000300000000020000010000030ss000000001110s0s000ss0000

0s102110000000100ss3s2000000000000000000000100021100011s110000000000s00000

000001s10100000010100002222222000000000000000010321002s3321111s1101111001

0000000s00s000s00101010100s00000*******

情况3.PID 16132224

位置较早的NCBI(2538824……2539273);    新的NCBI(253824……2539699)

                                                                  N

*******0000000000000ss000000001s2000104220300000000s00000000000100000s0s98

                                                                  ↓

889135120sss0001222000022512s0000223s123100000000ss0s000ss0022s30000ss00000s

00000000000001000000s0s0000s16531311000000101010000s00200101s1110000230ss0

                                            ↓

100000s0001000000s0000000s0000s0s00001100s0011000000000000000s00000s

                                  ←———— E

E:NCBI的较早的起始位点→正向读框

N:NCBI的较新的起始位点→反向读框

实施例5

预测蛋白质编码DNA序列

通过采用以下步骤利用该方法预测发表的可得到的数据库(NCBI)中各种基因组的蛋白质编码DNA序列:

i)从选择的生物的所有蛋白质序列经计算机处理产生重叠的肽文库,所述蛋白质序列得自http://www.ncbi.nlm.nih.gov;

ii)按字母顺序,根据单字母氨基酸密码用计算机拣选以上获得的长度为‘N’的肽;

iii)将每个肽和出现它们的不同特异性生物分类;

iv)利用步骤1和2获得的肽文库将DNA序列转变为字母数字式序列;

v)检索该字母数字式序列检索所有可能的开放读框(ORF);

vi)训练改进的神经网络来区分蛋白质编码和非编码DNA序列;

vii)利用训练过的神经网络预测该开放读框(步骤4中获得)中的DNA编码序列;

viii)除去重叠的蛋白质编码DNA序列(基因内的基因)。

如表2所详述的,本发明人使用本发明的方法从选自以下的生物的基因组中发现了169个新基因:SARS-冠状病毒、流感嗜血菌、结核分枝杆菌和幽门螺杆菌。表2显示了SEQ ID No.1-SEQ ID No.169所示序列中的所述新基因。

                                            表2

  1  GDC_HINF_5641  5641  6273  210  +  甲酸脱氢酶     的主要亚基  2   3   4    5    6    7    8    9   10  GDC_HINF_6322   GDC_HINF_124181   GDC_HINF_170553    GDC_HINF_231874    GDC_HINF_232170    GDC_HINF_232813    GDC_HINF_233190    GDC_HINF 235441   GDC_HINF_235913  6322   124181   170553    231874    232170    232813    233190    235441   235913  8748   124378   170732    232173    232991    233139    233393    235932   238519  808   65   59    99    273    108    67    163   868  +  甲酸脱氢酶     的主要亚基  +  细胞壁相关     的水解酶  +  二羧酸盐转     运蛋白同系     物HI0153  +  I型限制性系     统腺嘌呤甲     基化酶  +  I型限制性系     统腺嘌呤甲     基化酶  +  I型限制性系     统腺嘌呤甲     基化酶  +  I型限制性酶     EcoprrI M蛋     白  +  PrrD蛋白同     系物  +  I型限制性酶     EcoR124II R
   11   12   13   14   15  16  17   18    19   20    21   22  23   24   25   GDC_HINF_240336   GDC_HINF_243018   GDC_HINF_274892   GDC_HINF_276992   GDC_HINF_370413  GDC_HINF_370747  GDC_HINF_628407   GDC_HINF_654365    GDC_HINF_661444   GDC_HINF_737160    GDC_HINF_775792   GDC_HINF_848166  GDC_HINF_928073   GDC_HINF_929037   GDC_HINF_1018846   240336   243018   274892   276992   370413  370747  628407   654365    661444   737160    775792   848166  928073   929037   1018846   241379   243215   276853   279121   370808  372912  628604   655015    661641   737297    775989   848678  929080   929402   1021371   347   65   653   709   131  721  65   216    65   45    65   170  335   121   841     蛋白  -  需氧呼吸控     制传感蛋白  +  细胞壁相关     的水解酶  -  粘附和穿透     蛋白前体  -  粘附和穿透     蛋白前体  +  NapA  +  NapA  -  细胞壁相关     的水解酶  -  可能的D-甲     硫氨酸转运     系统通透酶  -  细胞壁相关     的水解酶  +  甘油磷酸二     酯磷酸二酯     酶  -  细胞壁相关     的水解酶  -  核糖体蛋白  +  肽酶B(氨肽     酶B)  +  肽酶B(氨肽     酶B)  -  异亮氨酰
    26    27    28   29   30   31    32  33  34   35  36    37    38    GDC_HINF_1021582    GDC_HINF_1082407    GDC_HINF_1144501   GDC_HINF_1279189   GDC_HINF_1347200   GDC_HINF_1347942    GDC_HINF_1476415  GDC_HINF_1476557  GDC_HINF_1505851   GDC_HINF_1524561  GDC_HINF_1568974    GDC_HINF_1586944    GDC_HINF_1594339    1021582    1082407    1144501   1279189   1347200   1347942    1476415  1476557  1505851   1524561  1568974    1586944    1594339    1021683    1082514    1145004   1279935   1347445   1348478    1476615  1477183  1506048   1525421  1569300    1587765    1594854    33    35    167   248   81   178    66  208  65   286  108    273    171     -tRNA合成     酶  -  异亮氨酰  -  tRNA合成     酶  -  蛋白V6,截     短的-流感嗜     血菌  -  PnuC转运蛋     白  -  肽链释放因     子B(RF-2)  +  假定的ABC     转运蛋白  +  假定的铁化     合物ABC转     运蛋白  -  PstB  -  PstB  -  末端酶的大     亚基  -  ThiI  +  DNA结合蛋     白rdgB的同     系物  +  假定的尾蛋     白(tail     protein)  -  NifC
  39     40    41    42    43   44   45    46    47   48    49  GDC_HINF_1634710     GDC_HINF_1638626    GDC_HINF_1639409    GDC_HINF_1660491    GDC_HINF_1807963   GDC_HINF_1817220   GDC_HPYL_51094    GDC_HPYL_155367    GDC_HPYL_447632   GDC_HPYL_506250    GDC_HPYL_583607  1634710     1638626    1639409    1660491    1807963   1817220   51094    155367    447632   506250    583607  1636722     1639372    1639726    1662080    1808859   1817417   51432    156164    447850   507134    583876  670     248    105    529    298   65   112    265    72   294    89     可能的血红     蛋白和血红     蛋白-触珠蛋     白  -  假定的整合     酶/重组酶     HI1572  -  假定的整合     酶/重组酶     HI1572  -  细胞分裂蛋     白ftsK同系     物  -  粘附同系物     HI1732  +  细胞壁相关     的水解酶  +  假定的     HP0052样蛋     白  -  2-氧化戊二     酸/苹果酸转     运蛋白  -  细胞壁相关     的水解酶  +  位点特异性     DNA-甲基转     移酶  +  可能的DNA
   50   51    52  53   54   55   56  57   58  59   60   61   62    63   GDC_HPYL_583883   GDC_HPYL_665045    GDC_HPYL_953783  GDC_HPYL_954679   GDC_HYPL_954846   GDC_HPYL_955261   GDC_HPYL_1068602  GDC_HPYL_1069456   GDC_HPYL_1376803  GDC_HPYL_1474291   GDC_HPYL_1600102   GDC_MTUB_26830   GDC_MTUB_36276    GDC_MTUB_76032   583883   665045    953783  954679   954846   955261   1068602  1069456   1376803  1474291   1600102   26830   36276    76032   584437   665695    954664  954900   955217   955557   1069459  1069929   1377126  1474509   1600689   27534   36785    76595   184   216    293  73   123   98   285  157   107  72   195   234   169    187     解旋酶  +  可能的DNA     解旋酶  +  假定的脂多     糖生物合成     蛋白  -  乙酸激酶  -  磷酸乙酰转     移酶  -  磷酸转乙酰     酶  -  磷酸乙酰转     移酶  -  IS606转座酶  -  转座酶样蛋     白,PS31S  +  核糖体蛋白  +  细胞壁相关     的水解酶  -  III型DNA修     饰酶  -  假定的原卟     啉原氧化酶  -  纤连蛋白附     着蛋白     FAP-P  +  成视网膜细     胞瘤抑制基     因1
  64  65   66  67   68   69  70    71   72    73   74  75   76   77    78  79  GDC_MTUB_80423  GDC_MTUB_167239   GDC_MTUB_214625  GDC_MTUB_424142   GDC_MTUB_459316   GDC_MTUB_549643  GDC_MTUB_566823    GDC_MTUB_591109   GDC_MTUB_663028    GDC_MTUB_688806   GDC_MTUB_701762  GDC_MTUB_731710   GDC_MTUB_772761   GDC_MTUB_868821    GDC_MTUB_890358  GDC_MTUB_904043  80423  167239   214625  424142   459316   549643  566823    591109   663028    688806   701762  731710   772761   868821    890358  904043  81214  168084   215116  424657   461076   550758  567284    591345   663426    689060   702643  731877   773402   869216    891254  904840  263  281   163  171   586   371  153    78   132    84   293  55   213   131    298  265  -  黏蛋白5  +  假定的分泌     的肽酶  -  糖蛋白gp2  -  PPE家族蛋     白  +  63kDa的蛋     白  -  carR  +  MAPK相互     作用和纺锤     体稳定蛋白  +  切除酶,假定     的  +  可能的核糖     核苷二磷酸     还原酶  +  MCE-家族蛋     白MCE2B  -  u1764ad  +  核糖体蛋白     L33  -  ENSANGP0     0000004917  -  冷激诱导的     Srp1p/Tip1p     蛋白  -  orf2  +  氨基咪唑核
     80  81    82   83   84   85  86  87   88  89  90  91    92   93     94     GDC_MTUB_1045383  GDC_MTUB_1068100    GDC_MTUB_1115707   GDC_MTUB_1124996   GDC_MTUB_1138949   GDC_MTUB_1170285  GDC_MTUB_1176592  GDC_MTUB_1202653   GDC_MTUB_1231843  GDC_MTUB_1241031  GDC_MTUB_1252888  GDC_MTUB_1264312    GDC_MTUB_1286282   GDC_MTUB_1301742     GDC_MTUB_1351907     1045383  1068100    1115707   1124996   1138949   1170285  1176592  1202653   1231843  1241031  1252888  1264312    1286282   1301742     1351907     1046129  1068726    1116369   1125712   1139665   1170749  1176858  1203198   1232460  1241468  1253748  1264554    1286587   1302053     1352614     248  208    220   238   238   154  88  181   205  145  286  80    101   103     235      (糖核)苷酸     合成酶  +  u650i  -  凝集素的锚     定亚基,     Aga1 p  -  黏蛋白7前     体,唾液的  -  假定的氧化     还原酶  -  血小板结合     蛋白GspB  -  MC8  +  gp85  -  s19绒毛膜蛋     白  +  羧酸酯酶  -  PE  -  ppg3  +  酮脂酰CoA     硫解酶相关     蛋白  -  喋呤-4-α-甲     醇胺脱水酶  -  与始于87的     ORF相似,     第一个起始     密码子  -  ppg3
  95   96    97    98     99    100    101   102   103  104  105  106   107  GDC_MTUB_1476279   GDC_MTUB_1485311    GDC_MTUB_1486309    GDC_MTUB_1515112     GDC_MTUB_1515464    GDC_MTUB_1596569    GDC_MTUB_1600905   GDC_MTUB_1616064   GDC_MTUB_1672449  GDC_MTUB_1673708  GDC_MTUB_1699549  GDC_MTUB_1742061   GDC_MTUB_1782153  1476279   1485311    1486309    1515112     1515464    1596569    1600905   1616064   1672449  1673708  1699549  1742061   1782153  1476647   1486399    1487727    1515846     1516198    1596892    1601861   1616951   1673216  1675000  1700226  1742858   1782932  122   362    472    244     244    107    318   295   255  430  225  265   259  -  细胞壁相关     的水解酶  -  4-羟基苯基     丙酮酸双加     氧酶C末端     细胞壁表面     锚定家族蛋     白  -  假定的ABC     转运蛋白     ATP结合蛋     白  -  胞外蛋白,     γ-D-谷氨酸-     内消旋-d...  -  假定的翻译     启动因子     IF-2  -  羧酸酯酶家     族蛋白  -  假定的转录     调节蛋白  +  MAV278  -  MAV301  +  gmdA  -  ENSANGP0     0000020758  +  GLP_26_546     03_52153
  108    109     110    111   112   113   114    115    116    117  118  119  GDC_MTUB_2060659    GDC_MTUB_2093062     GDC_MTUB_2105797    GDC_MTUB_2133554   GDC_MTUB_2183418   GDC_MTUB_2192571   GDC_MTUB_2234641    GDC_MTUB_2320829    GDC_MTUB_2321250    GDC_MTUB_2487508  GDC_MTUB_2567990  GDC_MTUB_2577106  2060659    2093062     2105797    2133554   2183418   2192571   2234641    2320829    2321250    2487508  2567990  2577106  2061114    2093994     2106912    2134069   2184026   2193488   2234889    2321062    2322509    2488524  2568457  2577699  151    310     371    171   202   305   82    77    419    338  155  197  +  κ轻(链)多肽     基因的核因     子  -  可能的6-磷     酸葡萄糖酸     脱氢酶     GNDI  +  ABC转运系     统的ATP-结     合亚基  -  KIAA0324     蛋白  -  假定的转运     蛋白  -  假定的氧化     还原酶  -  DNA结合蛋     白,CopG家     族  +  DNA结合蛋     白,CopG家     族  -  细胞壁表面     锚定家族蛋     白  -  ORF1  +  B1158F07.3  +  可能的保守     膜蛋白
  120   121   T22   123   124    125   126  127  128  129    130  131  132   133   134   135  GDC_MTUB_2577486   GDC_MTUB_2690012   GDC_MTUB_2698040   GDC_MTUB_2712275   GDC_MTUB_2725593    GDC_MTUB_2733212   GDC_MTUB_2828257  GDC_MTUB_2895354  GDC_MTUB_2983047  GDC_MTUB_3005316    GDC_MTUB_3048559  GDC_MTUB_3065095  GDC_MTUB_3100192   GDC_MTUB_3129118   GDC_MTUB_3237815   GDC_MTUB_3283182  2577486   2690012   2698040   2712275   2725593    2733212   2828257  2895354  2983047  3005316    3048559  3065095  3100192   3129118   3237815   3283182  2577920   2690509   2698243   2714008   2725859    2734420   2828937  2897222  2984033  3005696    3049095  3066549  3100452   3129594   3238096   3283718  144   165   67   577   88    402   226  622  328  126    178  484  86   158   93   178  +  可能的保守     膜蛋白  +  可能的保守     膜内在蛋白  -  可能的保守     膜蛋白  +  MLCL536.10     蛋白  -  可能的过氧     化氢诱导性     基因  -  糖蛋白(lycop     rotein)gp2  +  MC8  +  抗原T5  -  MC8  -  ABC转运蛋     白,ATP-结     合蛋白  -  recX蛋白  +  ppg3  -  IS1537,转座     酶  -  KIAA 1139     蛋白  -  酰基磷酸酯     酶  -  MAS 5’r...中     假定的三甲
     136   137  138  139      140  141    142  143   144  145    146   147   148     GDC_MTUB_3289702   GDC_MTUB_3319076  GDC_MTUB_3339006  GDC_MTUB_3356995      GDC_MTUB_3381198  GDC_MTUB_3388071    GDC_MTUB_3482312  GDC_MTUB_3581973   GDC_MTUB_3711717  GDC_MTUB_3716987    GDC_MTUB_3754581   GDC_MTUB_3794808   GDC_MTUB_3796793     3289702   3319076  3339006  3356995      3381198  3388071    3482312  3581973   3711717  3716987    3754581   3794808   3796793     3290232   3319546  3339851  3357831      3381755  3389003    3482770  3582620   3712613  3718534    3755711   3795026   3797512     176   156  281  278      185  310    152  215   298  515    376   72   239     基硬脂酰基     (mycocerosyl     )转移酶  +  可能的转座     酶  -  u0002d  -  膜糖蛋白  -  传感蛋白组     氨酸激酶     (sensor     histidine     kinase)  +  MC8  +  纤维素体支     架蛋白锚定     蛋白C  -  MC8  +  类似于黏蛋     白,颌下-pig  -  Orf2  -  类似于原聚     丝蛋白-人     (片段)  -  假定的转座     酶  -  脱氧木酮糖     -5-磷酸合酶  +  膜糖蛋白[输     入的]-马疱
   149   150     151  152  153    154     155    156   157    158    159   GDC_MTUB_3879013   GDC_MTUB_3921024     GDC_MTUB_3974481  GDC_MTUB_3994808  GDC_MTUB_3998938    GDC_MTUB_4021183     GDC_MTUB_4045946    GDC_MTUB_4053033   GDC_MTUB_4140236    GDC_MTUB_4169350    GDC_MTUB_4170798   3879013   3921024     3974481  3994808  3998938    4021183     4045946    4053033   4140236    4169350    4170798   3879534   3921665     3975056  3995446  3999642    4021425     4046290    4053635   4140460    4169706    4171211   173   213     191  212  234    80     114    200   74    118    137     疹病毒  -  核糖体蛋白     S11  -  3-氧代酰基  -  (酰基-运载     体蛋白)还原     酶  +  黏蛋白10  +  MAV278  -  蛋白酶抑制     剂/种子保藏/     脂质转移  -  假定的     TRNA/RRN     A甲基转移     酶  -  查尔酮/1,2-     二苯乙烯合     酶家族蛋白  +  假定的蛋白     (2G313)  -  DNA结合蛋     白,CopG家     族  +  可能的角质     蛋白酶前体     CUT5  +  假定的氧化     还原酶
  160    161   162  163    164   165  166      167      168    169  GDC_MTUB_4252190    GDC_MTUB_4260620   GDC_MTUB_4302166  GDC_MTUB_4317863    GDC_MTUB_4341852   GDC_MTUB_4391527  gi   !  Sars174_ref  seq_OUTPUT  F_GDC_701_1225    gi   !  Sars68_refs  eq_OUTPUTF_GDC_13  97_1603    gi   !  Sars61_refs  eq_OUTPUTF_GDC_88  28_9013  gi   !  Sars78_refs  eq_OUTPUTF_GDC_28  559_28795  4252190    4260620   4302166  4317863    4341852   4391527  701      1397       8828     24492  4252921    4261213   4302858  4318309    4342388   4391988  1225      1603      9013    24764  243    197   230  148    178   153  174      68      61    90  +  唾液腺分泌     物1     CG3047-PA  +  SPAPB15E9.     01c  +  u1764ad  +  可能的转座     酶[第二部    分]  -  GLP_49_644     09_65443  -  AT9S  +  ABC转运蛋     白ATP结合     蛋白/细胞色     素c氧化酶     折叠蛋白  +  超家族蛋白     或丝氨酸/苏     氨酸激酶2     的主要辅助     物  +  假定的蛋白    +  NADH脱氢     酶I链

对10种微生物基因组分析了GeneDecipher的系统灵敏度和特异性(图3)。以下给出了对病毒基因组的GeneDecipher进一步分析。

SAR-CoV基因组序列:从GenBank数据库(http://www.ncbi.nlm.nih.gov/Entrez/genomes/viruses)下载可利用的18 SARS-CoV毒株序列并分析。这些序列包括SARS-CoV Refseq(NC_004718.3)、SARS-CoV TWC(AY32118)、SIN2774(AY283798)、SIN2748(AY283797)、SIN267^(AY283796)、SIN2677(AY283794)、SIN25ti6(AY283794)、Frankfurt(A Y291315)、BJ04(AY279354)、BJ03(AY278490)、BJ02(AY278487)、GZ01(AY278848)、CUHKW 1(AY278554)、TOR2(AY274119)、TW1(AY291451)、BJ01(AY278488)、Urban(AY278741)、HKU-39849(AY278491)。其它蛋白质编码基因相关的信息检索得自http://www.nchi.nlm.nih.gov/genomes/SARS/SAks.html

对病毒基因组测试GeneDecipher:

为对病毒基因组测试我们的方法,申请人首先用GeneDecipher分析了人呼吸道合胞病毒(HRSV)的完全基因组。将GeneDecipher的结果与现有技术水平的方法ZCURVE_CoV进行了比较(表3)。ZCURVE_CoV能从11个NCBI报道的基因中预测8个注释的蛋白而无假阳性。ZCURVE_CoV不能预测以下3个基因:PID 9629200(位置626...1000,非结构蛋白2(NS2));PID 9629205(位置4690...5589,粘附性糖蛋白(G))和PID 9629208(位置8171...8443,基质蛋白2(M2))。GeneDecipher从总共11个注释的HRSV蛋白中预测了10个而无假阳性。注意到GeneDecipher遗漏的基因也是ZCURVE_CoV所遗漏的PID 9629208(位置8171...8443,基质蛋白2)。

成功预测了HRSV基因组中的蛋白质编码区提高了我们对预测新测序的SARS-CoV基因组中蛋白质编码区的信心。

用GeneDecipher分析SARS-CoV:

申请人用GeneDecipher分析了SARS-CoV的所有18个病毒株。(详细结果见以上给出的网址)。对18个病毒株中的每种而言,GeneDecipher在SARS-CoV基因组中预测了总共15个蛋白质编码区,包括多聚蛋白1a、1ab(多聚蛋白1ab的Sars2628 C末端)和所有4种已知的结构蛋白(M、N、S和E)。取决于所用病毒株的基因组序列,GeneDecipher也预测了6-8个额外的编码区。这些额外编码区的长度范围是61-274个氨基酸。

GeneDecipher预测的12个编码区是所有18个病毒株共有的(表4)和存在于5个病毒株中的一个编码区(NCBI refseq基因组中的Sars63、sars6)。GeneDecipher特别在GZ01病毒株中预测了基因Sars90,在BJ02病毒株中预测了Sars154(NCBIrefseq基因组中的Sars 3b)。

这12个共有蛋白质编码区由SARS-CoV的6个基础蛋白质(2个多聚蛋白和4个结构蛋白)构成:Sars274(NCBI refseq数据库中的Sars3a)、Sars 122(NCBI refseq数据库中的Sars7a)、Sars78(已报道TOR2病毒株中起始点转移为ORF14/Sars9c);和3个新预测到的(对NCBI的当前注释而言是假阳性)蛋白质编码区Sars174、Sars68和Sars61。这3个新预测的基因全部位于多聚蛋白1a基因组区域中。虽然在细菌基因组中我们的方法舍弃了这种基因,但不能排除在病毒基因组中发现这种基因的可能性。由于这些基因存在于所有18种病毒株中,它们可能是蛋白质编码区。

除了上述12个编码区以外,申请人还预测了3个编码区,Sars63、Sars154和Sars90。Sars63在5个病毒株中均鉴定到但未在其余13个病毒株中鉴定到。该编码区早已报道在NCBI refseq中(Sars6)。申请人不能在本文中过多评价Sars63(NCBIrefseq中的Sars6)的存在。因为它在5个并毒株中鉴定到而在其余13个病毒株中未鉴定到。这是因为病毒株之间该区域的非同义突变密度高。两个编码区Sars154(NCBI中的sars3b)和Sars90(在GZ01毒株中新预测的)只在一个病毒株中鉴定到。由于这两个编码区只在一个病毒株中鉴定到,它们不大可能是蛋白质编码区,ZCURVE CoV(Chen等,2003)分析也提出同一结论。该3个基因在不同病毒株中的位置见表5。

由于此肽文库从各种生物的基因组序列制备,故可以追踪某给定蛋白的进化起源。如果该蛋白富含发现在病毒基因组中的七肽,则可以认为该蛋白是病毒起源的。申请人发现5个核心蛋白(两个多聚蛋白和3个结构蛋白M、N和S)是病毒起源的。其余的(包括3个新预测的)是原核生物起源的。令人感兴趣的是从同一DNA区域申请人在不同读框中得到含有不同起源的肽的蛋白。同一DNA序列如何编码细菌和病毒起源的(蛋白)令人感兴趣。这或许可解释为何在依据与其它已知病毒基因组序列的同源性作的初步分析中未能检测到这些新的蛋白质编码基因。

与现有系统-ZCURVE_CoV的比较:

表6a和6b给出了用SARS-CoV的Urbani和TOR2病毒株的已知注释比较GeneDecipher和ZCURVE_CoV的结果。

GeneDecipher的结果与已知的注释相一致。就Urbani并毒株而言,GeneDecipher预测到除Sars84(X5)、Sars63(X3)和Sars154(X2)之外的所有已知基因。ZCURVE_CoV预测到Sars84(X5)和Sars63(X3),而两种方法均遗漏了Sars154(X2)。GeneDecipher在该病毒株中顺便预测了ZCURVE_CoV未预测到的4个新基因。要注意的是在这4个基因中Sars78是病毒株TOR2已知的ORF14/Sars9c。这支持了该基因存在于Urbani病毒株中的可能性。然而,ZCURVE_CoV也预测了GeneDecipher未预测到的两个新基因。

GeneDecipher对TOR2病毒株的预测与对Urbani病毒株的预测相同。在该病毒株中,GeneDecipher预测了9个已知基因,但未预测到6个具有已知注释的基因。这6个基因是:Sars154(ORF4)、Sars98(ORF13)、Sars63(ORF7)、Sars44(ORF9)、Sars39(ORF10)和Sars84(ORF11)。在这些基因中,Sars154(ORF4)和Sars98(ORF13)也为ZCURVE_CoV所遗漏。应注意Sars44(ORF9)和Sars39(ORF10)均是长度非常小(分别是44和39个氨基酸)的ORF,它们也不全存在于各种SARS病毒株中。GeneDecipher在其它5个病毒株而非在本文考虑的两个病毒株中预测到了Sars63(ORF7)。

突变分析:

使用多个序列比对(ClustalW)对所有18个病毒株的3个新预测的蛋白质编码基因Sars174、Sars68和Sars61进行分析显示:

1.SIN2677病毒株中Sars68在位置80具有一个点突变GAT->GGT(D->G)。

2.GZ01病毒株中Sars174在位置204具有同义点突变CGA->CGC和BJ04病毒株中在位置447具有同义突变CTG->CTT。

3.GZ01毒株中Sars61在位置119具有一个点突变CTG->CAG(L->Q)。

这3个新预测的基因存在于所有18个病菌株中而无明显的突变,并且在非冗余数据库中用BLASTP命中不明显。这表明该3个蛋白对SARS-CoV可能有特别重要的生物学功能。因此,这些编码序列可作为抗SARS的候选药物靶点,

功能指定:

申请人总共预测了SARS-CoV中的15个编码区,其中已指定了4个结构蛋白(M、N、S和E)的功能。虽然已指定了多聚蛋白1ab只有复制酶活性,我们的分析暗示该复制酶活性与Sars2628(ORF 1ab的C末端)片段相关。完整的1ab多聚蛋白含有6个功能标签,其中多聚蛋白1a含有与代谢酶相关的标签(表7a)。根据在至少5种不同生物中具有相似功能的蛋白中存在的肽(长度为7个或更多个氨基酸)给多聚蛋白指定功能。其它预测的基因/蛋白质编码区含有的肽存在于较少基因组中。根据这些肽,申请人提出了它们的功能,虽然不大肯定(表7b)。这些发现的生物相关性有待研究。

表3.就注释的基因而言,对HRSV基因组比较GeneDecipher与ZCURVE_CoV的结果

  注释的基因  ZCURVE_CoV  GeneDecipher  起始  终止  长度  起始  终止  长度  起始  终止  长度  99  518  139  99  518  139  99  518  139  626  1000  124  --  --  --  626  1000  124  1140  2315  391  1140  2315  391  1140  2315  391  2348  3073  241  2348  3073  241  2348  3076  241  3263  4033  256  3158  4033  291  3158  4033  291  4303  4500  65  4303  4500  65  4303  4500  65  4690  5589  299  --  --  --  4690  5589  299  5666  7390  574  5666  7390  574  5621  7390  589  7618  8205  195  7618  8205  195  7618  8205  195  8171  8443  90  --  --  --  --  --  --  8509  15009  2166  8443  15009  2188  8443  15009  2188

表4:GeneDecipher在所有18个病毒株共有的SARS-CoV Refseq中所预测的蛋白质编码基因

  序列号  起始  终止  读框  长度  特征  bp  aa  1  265  13413  1+  13149  4382  Sars1a多聚蛋白  2  701  1225  2+  525  174  Sars174(新预测)  3  1397  1603  2+  207  68  Sars68(新预测)
  4  8828  9013  2+  186  61  Sars61(新预测)  5  13599  21485  3+  7887  2628  Sars2628(多聚蛋白  1ab的C末端)  6  21492  25259  3+  3768  1255  Spike(S)蛋白  7  25268  26092  2+  825  274  Sars274(Sars3a)  8  26117  26347  2+  231  76  Sars76(Sars4)  9  26398  27063  1+  666  221  Sars221(Sars5)  10  27273  27641  3+  369  122  Sars122(Sars7a)  11  28120  29388  1+  1269  422  Sars422(Sars9a)  12  28559  28795  2+  237  78  Sars78(与TOR2中具  有移动起点的  ORF14/Sars9c相同)

表5:GeneDecipher在各种SARS-CoV中鉴定到的视为蛋白质编码基因的Sars90、Sars63和Sars154

  序列号  病毒株名  Sars90  (新预测)  Sars63(NCB  I中的Sars6)  Sars154(NCB  I中的Sars3b)  1  SIN2748  --  --  --  2  BJ01  --  27055..27246  --  3  BJ02  --  27074..27265  25689..26153  4  BJ03  --  27070..27261  --  5  BJ04  --  27058..27249  --  6  Frankfurrttl  --  --  --  7  Urabni  --  --  --  8  GZ01  24492..24764  27058..27249  --  9  SIN2500  --  --  --  10  SIN2677  --  --  --  11  SIN2679  --  --  --  12  SIN2774  --  --  --
  13  CHUKW1------  14  TW1------  15  TWC------  16  HKU-39849------  17  refseq------  18  TOR2------

表6(a).就注释的基因而言,对SARS-CoVUrbani病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果

  注释的基因  ZCURVE_CoV  GeneDecipher  特征  起始  终止  长度  起始  终止  长度  起始  终止  长度  265  13398  4377  265  13398  4377  265  13413  4382  ORF 1a  --  --  --  --  --  --  701  1225  174  Sars174(GeneDeciph  er新预测)  --  --  --  --  --  --  1397  1603  68  Sars68(GeneDeciphe  r新预测)  --  --  --  --  --  --  8828  9013  61  Sars61(GeneDeciphe  r新预测)  13398  21485  2695  13398  21854  2695  13599  21485  2628  ORF 1b  21492  25259  1255  21492  25259  1225  21492  25259  1255  S蛋白  25268  26092  274  25268  26092  274  25268  26092  274  Sars274(X1)  25689  26153  154  --  --  --  --  --  --  Sars154(X2)  26117  26347  76  26117  26347  76  26117  26347  76  E蛋白  26398  27063  221  26398  27063  221  26389  27063  224  M蛋白  27074  27265  63  27074  27265  63  --  --  --  Sars63(X3)  27273  27641  122  27273  27641  122  27273  27641  122  Sars122(X4)  --  --  --  27638  27772  44  --  --  --  Sars44  --  --  --  27779  27898  39  --  --  --  Sars39  27864  28118  84  27864  28118  84  --  --  --  Sars84(X5)
  28120  29388  422  28120  29388  422  28120  29388  422  N蛋白  --  --  --  --  --  --  28559  28795  78  Sars78(与TOR2中具  有移动起点的  ORF14/Sars9c相同)

表6(b).就注释的基因而言,对SARS-CoVTOR2病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果

  注释的基因  ZCURVE_CoV  预测的基因  GeneDecipher  预测的基因  特征  起始  终止  长度  起始  终止  长度  起始  终止  长度  265  13398  4377  265  13398  4377  265  13413  4382  ORF 1a  --  --  --   --  --  --  701  1225  174  Sars174(GeneDeciph  er新预测)  --  --  --   --  --  --  1397  1603  68  Sars68(GeneDeciphe  r新预测)  --  --  --   --  --  --  8828  9013  61  Sars61(GeneDeciphe  r新预测)  13398  21485  2695  13398  21854  2695  13599  21485  2628  ORF 1b  21492  25259  1255  21492  25259  1225  21492  25259  1255  S蛋白  25268  26092  274  25268  26092  274  25268  26092  274  ORF3(Sars274)  25689  26153  154  --  --  --  --  --  --  ORF4(Sars154)  26117  26347  76  26117  26347  76  26117  26347  76  E蛋白  26398  27063  221  26398  27063  221  26389  27063  224  M蛋白  27074  27265  63  27074  27265  63  --  --  --  Sars63(ORF7)  27273  27641  122  27273  27641  122  27273  27641  122  Sars122(ORF8)  27683  27772  44  27638  27772  44  --  --  --  Sars44(ORF9)  27779  27898  39  27779  27898  39  --  --  --  Sars39(ORF10)  27864  28118  84  27864  28118  84  --  --  --  Sars84(ORF11)  28120  29388  422  28120  29388  422  28120  29388  422  N蛋白
  28130  28426  98------  --  --  --  ORF13  28583  28795  70------  28559  28795  78  Sars78(与TOR2中具  有移动起点的  ORF14/Sars9c相同)

表7(a):用PLHOST指定SARS(Urbani)基因组中多聚蛋白的功能

  序列号  NCBI注释  保守的肽标签  指定的功能  1  Sars 1ab(多  聚蛋白1ab)  RIRASLPT  磷酸甘油酸激酶  RSETLLPL  亚硫酸盐还原酶(NADPH),  黄素蛋白β亚基  LDKLKSLL  可能的酰基CoA硫解酶  ATVVIGTS  细胞分裂蛋白ftsZ  NVAITRAK  DNA结合蛋白,可能的DNA  解旋酶  LQGPPGTGK  DNA解旋酶相关蛋白  2  Sars 1a多  聚蛋白1a  RIRASLPT  磷酸甘油酸激酶  RSETLLPL  亚硫酸盐还原酶(NADPH),  黄素蛋白β亚基  LDKLKSLL  可能的酰基CoA硫解酶  3  Sars2628(Sa  rs 1ab的C  末端)  ATVVIGTS  细胞分裂蛋白ftsZ  NVAITRAK  DNA结合蛋白,可能的DNA  解旋酶  LQGPPGTGK  DNA解旋酶相关蛋白

表7(b):用PLHOST提出SARS-CoV中一些非结构基因的功能

  序列号  基因  肽标签  提出的功能
    1    Sars174(新预测)    TLSKGNAQ    ABC转运蛋白ATP结合蛋白[乳    酸乳球菌乳亚种(Lactococcus    lactis subsp.lactis)]    VAQMGTLL    细胞色素c还原酶折叠蛋白[集    胞蓝细菌PCC    6803(Synechocystis sp.)]    2    Sars68(新预测)    LVLVLILA    假定的主要辅助物超家族蛋白    [(Schizosaccharomyces pombe)]    TQTLKLDS    丝氨酸/苏氨酸激酶2;丝氨酸/    苏氨酸蛋白激酶-2[智人(Homo    sapiens)]    3*    Sars90(只在    GZ01病毒株中    新预测)    GLLHRGT    NADH脱氢酶I链    4    Sars61(新预测)    LLPLLAFL    假定的蛋白(在两种生物中保守)    5    Sars274(Sars3a)    LLLFVTIY    多胺转运蛋白;Tpo1p[酿酒酵母    (Saccharomyces cerevisiae)]    6    Sars274(Sars3b)    QTLVLKML    K550.3p[秀丽新小杆线虫    (Caenorhabditis elegans)]    7    Sars274(Sars6)    DDEELMEL    延伸因子Tu[乳酸乳球菌乳亚种    (Lactococcus lactis subsp.lactis)]    8    Sars122(Sars7a)    LIVAALVF    假定的转运跨膜蛋白[苜蓿中华    根瘤菌(Sinorhizobium meliloti)]    RARSVSPK    Src同源性结构域3[秀丽新小杆    线虫(Caenorhabditis elegans)]    9*    Sars78(Sars9c)    QLLAAVG    γ-谷氨酸激酶(8种生物中保守)

*:未发现保守的八肽。然而,功能已根据仅有的高保守七肽指定。

如上所述,申请人公开了SARS-CoV中的4个新基因,包括Sars78。该分析进一步确证了ZCURVE_CoV的发现(Chen等,2003),即ORF Sars154(作为Sars3b列于Refseq中)不可能是编码区。申请人也给两个多聚蛋白1ab和1a指定了功能。除了1ab多聚蛋白C末端的复制相关功能外,申请人的分析提示多聚蛋白1a可能与代谢酶样的功能相关。总之,多聚蛋白1ab中存在6个肽标签。申请人给其它9个蛋白,包括通过GeneDecipher新预测到的提出了假定的功能。

优点:

1.本发明的主要优点是提供一种预测蛋白质编码DNA序列而不使用任何外部证据,例如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱的新方法。

2.本发明提供蛋白质编码DNA序列的统计学分析方法,所述方法利用经受了进化压力的保守肽中所留生物学信息。

3.本发明提供一种预测蛋白质编码基因的起始位点的简单方法。

4.本发明提供一种检测生物特异性、毒株特异性蛋白质编码DNA序列的方法。

5.本发明提供可用作潜在药物靶点的新蛋白质编码DNA序列。

参考文献

Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.,Lipman,D.J.,(1990)“局部序列比对基本检索工具”(Basic local alignment search tool),J.Mol Biol.,215,403-10

Bird,A,(1987),“CpG岛可作为脊椎动物核中的基因标记”(CpG islands asgene markers in the vertebrate nucleus),Trends Genet.,3,342-47

Chen,L.,Ou,H.,Zhang,R.和Zhang,C.,(2003),“ZCURVE_CoV:一种能识别冠状病毒蛋白质编码基因的新系统,及其在分析SARS-CoV基因组中的应用”(ZCURVE_CoV:a new system to recognize protein coding genes in coronavirus,and its applications in analyzing SARSCoV genomes),Biochemical and BiophysicalResearch Communications,307,382-8

Delcher,A.L.,Harmon,D.,Kasif,S.,White,O.和Salzberg,S.L.,(1999),“用GLIMMER改进的微生物基因鉴定”(Improved microbial gene identification withGLIMMER),Nucleic Acid Research,27,4636-41

Kehoe,M.A.等,(1996),“A族链球菌中的水平性基因转移:发病机理和流行病学的关系”(Horizontal gene transfer among group A streptococci:implications forpathogenesis and epidemiology),Trends Microbial.,4,436-43

Lukashin,A.V.和Borodovsky,M.,(1998),“GeneMark.hmm:寻找基因新方法”(GeneMark.hmm:New solution for gene finding),Nucleic Acid Research,26,1107-15

Mathe,C.,Sagot,M.F.,Schiex,T.和Rouze,P.,(2002),“当前基因预测方法的能力和应用”(Current Methods of gene prediction their strength and theapplicantsaknesses),Nucleic Acid Research,30,4103-17

Medigue,C.等,(1999),“检测和分析DNA测序的错误:为获得更高质量的枯草芽胞杆菌基因组序列”(Detecting and Analyzing DNA Sequencing Errors:Towarda Higher Quality of the Bacillus subtilis Genome Sequence),Genome Research,9,1116-27

Pearson,W.R.,(1995),“检索蛋白质序列数据库方法的比较”(Comparison ofmethods for searching protein sequence databases),Protein Science,4,1145-60

Salzberg,S.L.,Delcher,A.L.,Kasif,S.和White,O.,(1998),“使用内插Markov模型鉴定微生物基因”(Microbial gene identification using interpolatedMarkov models),Nucleic Acid Research,26,544-8

Shibuya,T.和Rigoutsos,I.,(2002),“词典驱动的寻找原核生物基因”(Dictionary-driven prokaryotic gene finding),Nucleic Acid Research,30,2710-25

Brahmachari,S.K.和Dash,D.,(2001),“一种鉴定用作药物靶点的肽的计算机方法”(a computer based method for identifving peptides useful as drug targets),PCT国际专利公布(WO01/74130 A2,2001年10月11日)

“所报道的严重急性呼吸道综合征(SARS)病例的累积数字”(Cumulativenumber of reported cases of severe acute respiratory syndrome(SARS)),日内瓦:国际卫生组织,2003,(2003年4月9日得自http://www.who.int/csr/sarscountry/20030404/en/)

Drosten,C.,Giinther,S.和Preiser,W.,(2003),“在严重急性呼吸道综合征患者中鉴定到新的冠状病毒”(Identification of a Novel Coronavirus in Patients withSevere Acute Respiratory Syndrome),N Engl J Med.,(www.nejm.org,2003年4月10日)

Ksiazek,T.G.,Dean Erdman,P.H.和Goldsmith,C.S.,(2003),“一种新的严重急性呼吸道综合征相关的冠状病毒”(A Novel Coronavirus Associated with SevereAcute Respiratory Syndrome),N Engl J Med,348,1947-58

Marra,M.A.,Jones,S.J.,Astell,C.R.,Holt,R.A.,Brooks-Wilson,A.,(2003),“SARS相关冠状病毒的基因组序列”(The Genome sequence of theSARS-associated coronavirus),Science,300,1399-404

Tsang,K.W.,Ho,P.L.和Ooi,G.C.,(2003),“香港的严重急性呼吸道综合征的一系列病例”(A cluster of cases of severe acute respiratory syndrome in HongKong),N Engl J Med,348,1977-85

申请组织

街道:Rafi Marg

市:新得里

省:得里

国:印度

邮编:110001

电话号码:

传真号码:

电子邮件地址:impd@vsnl.net

<110>组织名:科学工业研究委员会

申请项目

<120>名称:一种鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法

<130>申请文件参考:US 1729

<140>当前申请号:

<141>当前提交日期:--

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链(PreSequenceString):

ttgttgttga aaggagtgat tatgcaggtc tcaagaagaa aattcttcaa gatctgtgca

60 ggaggtatgg cgggaacgtc agctgcaatg ttgggctttg ctccagcaaa cgtattagct

120 gcgccacgcg aatataaatt attacgcgcg tttgaatccc gtaacacctg tacatattgc

180 gctgtaagtt gcggtatgtt gttatatagc acaggcaaac cttacaattc attaagcagc

240 catactggca caaatactcg ttcaaaactc tttcatattg agggtgatcc agatcatcca

300 gtcagtcgtg gtgcgctttg cccgaaaggt gctggctcac tcgattatgt caatagtgaa

360 agccgttctt tatatcctca atatcgtgcg ccaggttctg ataaatggga acgaatttct

420 tggaaagatg ccattaaacg tattgctcgt ttaatgaaag atgaccgaga tgccaacttt

480 gttgaaaaag attcaaatgg aaaaacggtt aatcgttggg caacgacagg aattatgact

540 gcatcagcaa tgagcaatga agctgcgtta ttaacacaaa agtggattag aatgctcggt

600 atggtgccag tatgtaacca agcgaatact tga

633

<212>类型:DNA

<211>长度:633

     序列名:SEQ ID 1:GDC_HINF_5641

     序列描述:

自定义密码子

序列名:SEQ ID 1:GDC_HINF_5641

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgacaaata actgggttga tattaaaaat gccaacttaa tcatcgttca aggcggtaac

60 cctgcagaag cccatcctgt tggcttccgt tgggcaattg aagcgaagaa aaacggtgcg

120 aaaatcatcg ttattgatcc gcgttttaac cgtacagcat ccgttgctga tcttcatgcg

180 ccaattcgtt ctggttctga tattacgttc ttaatgggcg tgatccgtta cctattggaa

240 acaaaccaaa ttcaacacga atatgttaaa cactatacca acgcatcatt cttaattgat

300 gaaggtttca aatttgaaga tggtttattt gtagggtata acgaagaaaa acgtaactac

360 gataaatcta aatggaacta ccaatttgat gaaaatggtc acgctaaacg tgatatgaca

420 ttacaacatc ctcgttgtgt cattaacatc ttaaaagagc acgtttctcg ttatacccca

480 gaaatggttg aacgtattac aggcgtaaaa caaaaactct tcttacaaat ctgtgaagaa

540 attggtaaaa cctctgtgcc aaataaaacg atgacgcatc tatatgcatt aggttttaca

600 gagcattcaa tcggtacaca aaatattcgc tcaatggcga taatccagtt acttttaggt

660 aatatgggga tgccaggtgg cggtattaac gcattacgtg gacactccaa tgtgcaaggt

720 acgacagata tgggcttatt gccaatgtct ttaccaggtt atatgcgttt gccaaacgat

780 aaagatacct cttacgatca atacattaac gcaattacac caaaagatat cgttccaaac

840 caagtgaact attatcgtca tacttcaaaa ttctttgtta gcatgatgaa aactttctac

900 ggagataatg ccactaagga aaatggctgg ggattcgatt tcttaccaaa agcagatcgc

960 ctatatgatc caattactca cgttaaattg atgaatgaag gcaaattaca cggttggatt

1020 ttac

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 2:GDC_HINF_6322

     序列描述:

自定义密码子

序列名:SEQ ID 2:GDC_HINF_6322

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 3:GDC_HINF_124181

     序列描述:

自定义密码子

序列名:SEQ ID 3:GDC_HINF_124181

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgtttatgc tttatttaga atttttattt ttactattaa tgctctatat cggtagccgt

60 tacggcggta tcggattagg tgttgtttct ggtatcggtc ttgctatcga ggttttcgta

120 tttcgtatgc cagtggggaa gcaccgattg atgttatgct tatcattctt gcagtggtga

180

<212>类型:DNA

<211>长度:180

     序列名:SEQ ID 4:GDC_HINF_170553

     序列描述:

自定义密码子

序列名:SEQ ID 4:GDC_HINF_170553

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atggctgctg caattcaaca acgtgccgaa cttcaacgcc gtatttggca aactgctaat

60 gatgtgcgag gctcggtcga tggctgggat ttcaaacaat atgtgcttgg cacacttttt

120 taccgtttta ttagcgaaaa ttttgccaat tacattgaag cgggcgatga aagcgtaaat

180 tatgcccaat tacctgatga aatcattaca cagatgccat taaaacgaaa ggctacttta

240 tttacccaag ccaattattt aagaatgttg cggctaatgc tggcagcaat cctaatttga

300

<212>类型:DNA

<211>长度:300

     序列名:SEQ ID 5:GDC_HINF_231874

     序列描述:

自定义密码子

序列名:SEQ ID 5:GDC_HINF_231874

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgaatactg atttaaaaca gatttttact gatattgaaa actcagcgac gggctttccg

60 tctgaacaag atattaaagg gttatttgcc gattttgata ccaccagcaa tcgcttaggc

120 aataccgtaa aagataaaaa cgaccgctta acggctgttt tgaaaggcgt ggctgaactt

180 gattttggca aatttgaaga taaccacatt gatttatttg gcgatgcata cgaatatctt

240 atttctaact atgccgccaa tgcaggcaaa tctggtggcg aattttttac cccacaaagt

300 gtttccaaac tcattgctca aattgcaatg cacgggcaaa cctcggtcaa taaaatttat

360 gaccctgcag caggttctgg ctcacttttg cttcaagcca aaaaacaatt tgatgaacat

420 attattgaag aaggcttttt cgggcaggaa attaaccata ccacatacaa ccttgcccgt

480 atgaatatgt ttttgcataa catcaactac gacaagtttg atattgcttt aggcaacacc

540 ttaatggaac cacaatttgg cgataataaa cctttcgatg ccattgtttc gaacccgcct

600 tactccgtga aatgggctgg ctccgacgat ccaacattga ttaatgatga acgatttgcc

660 ccccgcaggc gtgcttgcac caaaatccaa agcggacttt gcctttattt tacatgcgtt

720 aagttatctt tcagcaaaag gccgcgcggc gattgtttcc ttccctggta ttttttatcg

780 tggcggtgcc gagcaaaaaa ttcgtcaata tttggtggat aa

822

<212>类型:DNA

<211>长度:822

     序列名:SEQ ID 6:GDC_HINF_232170

     序列描述:

自定义密码子

序列名:SEQ ID 6:GDC_HINF_232170

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgatgaacg atttgccccc cgcaggcgtg cttgcaccaa aatccaaagc ggactttgcc

60 tttattttac atgcgttaag ttatctttca gcaaaaggcc gcgcggcgat tgtttccttc

120 cctggtattt tttatcgtgg cggtgccgag caaaaaattc gtcaatattt ggtggataat

180 aactatgtgg acgcggtgat tgcgcttgcg ccaaatctct tttttggcac cagtattgcg

240 gtgaatattt tggtgctttc caaacacaaa cccaatttat cgatgccagc ggtttattta

300 aatctgccac taataaccac attttag

327

<212>类型:DNA

<211>长度:327

     序列名:SEQ ID 7:GDC_HINF_232813

     序列描述:

自定义密码子

序列名:SEQ ID 7:GDC_HINF_232813

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgccgcatt tggcaaaatc catatccttt gaagaaatcg cccaaaatga ctacaacctt

60 gcagtaagtt cgtatgtgga acaaaaagac actcgtgaag tgattaatat tgatgaactc

120 aatgctcaaa ttcgtgaaac tgttaccaat attgaccact tgcgtgcgga aattgacaag

180 attgttgcag aaattgaagg gtaa

204

<212>类型:DNA

<211>长度:204

     序列名:SEQ ID 8:GDC_HINF_233190

     序列描述:

自定义密码子

序列名:SEQ ID 8:GDC_HINF_233190

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgacccaat acaaaactat cgctgaatcc aataatttta tcgttttaga tcaatataat

60 aaatttgtgg aagaatctaa tgctggttat caaacggaaa ggagccttga gcgtgagttt

120 attcgtgatt tacaggctca aggctatgag tatttacaat ggcttaataa tcacgatgaa

180 ctgattaaaa acttacgggc gcaattacaa cgcttaaata acgtggtttt ctccgatgca

240 gaatggcaac gttttttaga ggaatatttg gataaaccga gcgataatct gattgagaaa

300 acccgcaaaa ttcacgatga ttatatttat gattttgtgt tcgataacgg acgcattcag

360 aacatctatt tgcttgataa gaaaaatctt gccaataatt ctctgcaagt catcaatcaa

420 tttaagcaaa ctggcagcta tgataatcgt tatgatgtga caattttggt gaatggttta

480 cccctttatt ga

492

<212>类型:DNA

<211>长度:492

     序列名:SEQ ID 9:GDC_HINF_235441

     序列描述:

自定义密码子

序列名:SEQ ID 9:GDC_HINF_235441

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atggtttacc cctttattga attaaaaaaa cgcggcgtgg cgattcgtga agcctttaac

60 caaattcacc gttacagcaa agaaagtttc aataaagaaa attctctcttt aaatatatt

120 cagatttttg tcatttctaa tggcacggat actcgctatt ttgctaatac gactaaacgc

180 aataagaata gctacgactt cacaatgaat tgggcaacgg caaaaaatac tctgattaaa

240 gatttaaagg attttaccgc gactttcttg caaaagaata ctttgctcaa tgtgttggta

300 aattactgcg tgtttgatgt gagtgatacg ttgttaatta tgcgtccgta tcaaattgcc

360 gcaacagaac gtattttatg gaaaattcaa atttcttact tagcaaaaaa ttggagtaat

420 cgtgaaagtg gtggctatat ttggcatacc acaggttcag gcaaaaccct caccagtttt

480 aaagcctctc gccttgcgac tgaacttgat tttattgata aagtcttttt tgtggtcgat

540 cgtaaagact tagactacca aacgatgaaa gaatatcagc gtttttcgcc tgatagcgtg

600 aatgggtcgg aaagtaccgc tgggcttaaa cgcaatattg aaaaagatga taacaaaatt

660 atcgtaacca ccattcaaaa attgaataat ttaatgaaaa gtgaagaaaa cctgtctatt

720 tatcaaaaac aggtggtctt tattttcgat gaagcacatc gctctcaatt tggcgaagca

780 caaaaaaatc taaaacgtaa attcaaaaaa ttctatcaat ttggttttac tggcacgcct

840 attttccctg aaaacgcatt aggtgcggaa acgacagcaa gtgtgttcgg tgcggaattg

900 cattcttatg tgattaccga tgctattcgt gatgacaaag tactgaaatt caaagtcgat

960 tacaacgatg tccgcccaca atttaaagcc ttagaaacag aaaaagatcc tgaaaaattg

1020 accg

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 10:GDC_HINF_235913

     序列描述:

自定义密码子

序列名:SEQ ID 10:GDC_HINF_235913

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atggatataa taaagcctat atgcacaggt tttttttata acgataataa tgttttagga

60 gatttgatga aaaatttcaa atattttgct cagagttatg tggattgggt tattcgtctt

120 gggcgtcttc gtttttctct tttaggcgtg atgattctcg cggttttagc tctttgtact

180 cagattttat ttagtctatt tattgttcat cagatatctt gggtagatat ttttcgttcg

240 gtaacttttg gcttactcac tgcgcctttt gttatttatt ttttcacttt attagtagaa

300 aaacttgaac attctcgtct tgatctttct agctcggtta atcgattgga aaatgaggtc

360 gccgagcgaa ttgctgctca gaaaaaatta tcccaagcat tggaaaagtt agaaaaaaat

420 agccgtgata aaagtacctt acttgccaca ataagccatg aatttcgcac gccattgaat

480 gggattgtcg ggcttagcca gattttactt gatgatgaat tggatgatct ccagcgtaat

540 tatttaaaaa ctatcaacat aagtgcggtc agtttaggct atatttttag cgatattatt

600 gatttggaaa aaattgatgc cagccgaatt gaattaaatc gccagccaac agatttccct

660 gccttattaa acgatattta taattttgct agtttcctcg ccaaagaaaa aaatcttatt

720 ttttctttag agcttgaacc taatttgcct aattggttga atcttgatcg tgttcgcttg

780 agccaaattt tgtggaactt aattagtaat gcggtgaagt ttacggatca gggaaatatt

840 attcttaaaa ttatgagaaa tcaggattgt taccatttta ttgtgaaaga tacaggaatg

900 gggatttcac ctgaagaaca aaaacatatt tttgaaatgt attatcaagt gaaagaaagc

960 cgccagcaaa gtgcgggtag cggtattggg ttggctattt ctaaaaatct tgctcagtta

1020 atgg

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 11:GDC_HINF_240336

     序列描述:

自定义密码子

序列名:SEQ ID 11:GDC_HINF_240336

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 12:GDC_HINF_243018

     序列描述:

自定义密码子

序列名:SEQ ID 12:GDC_HINF_243018

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgaatattc atggtttagc aaaacttaat ggtaatgtca ctttaataga tcacagccaa

60 tttacattga gcaacaatgc cacccaaaca ggcaatatca aactttcaaa tcacgcaaat

120 gcaacggtaa ataatgccac gttaaacggc aatgtgcatt taacggattc tgctcaattt

180 tctttaaaaa acagccattt ttggcaccaa attcagggcg acaaagacac aacagtgacg

240 ttggaaaatg cgacttggac aatgcctagc gatactacat tgcagaattt aacgctaaat

300 aatagtactg ttacgttaaa ttcagcttat tcagctagct caaataatgc gccacgtcac

360 cgccgttcat tagagacgga aacaacgcca acatcggcag aacatcgttt caacacattg

420 acagtaaatg gtaaattgag cgggcaaggc acattccaat ttacttcatc tttatttggc

480 tataaaagcg ataaattaaa attatccaat gacgctgagg gcgattacac attatctgtt

540 cgcaacacag gcaaagaacc tgtgaccctt gagcaattaa ctttgattga aagcttagat

600 aataaaccgt tatcagataa gctcaaattt actttagaaa atgaccacgt tgatgcaggt

660 gcattacgtt ataaattagt gaagaataag ggcgaattcc gcttgcataa cccaataaaa

720 gagcaggaat tgctcaatga tttagtaaga gcagagcaag cagaacaaac attagaagcc

780 aaacaagttg aacagactgc tgaaaaacaa aaaagtaagg caaaagcgcg gtcaagaaga

840 gcggtgttgt ctgatacccc gtctgctcaa agcctgttaa acgcattaga agccaaacaa

900 gttgaacaga ctactgaaac acaaacaagt aagccaaaaa caaaaaaagg gcggtcaaaa

960 agagcattga gtgcagcgtt ttctgatacc ccgtttgatc taagccagtt aaaggtattc

1020 gaag

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 13:GDC_HINF_274892

     序列描述:

自定义密码子

序列名:SEQ ID 13:GDC_HINF_274892

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgaaaaaaa ctgtatttcg tcttaatttt ttaaccgctt gtgtttcatt agggatagca

60 tcacaagcct gggcaggtca tacttatttt gggattgact accaatatta tcgtgatttt

120 gccgagaata aagggaagtt cacagttggg gctaaaaata ttgaggttta taacaaagaa

180 gggcaattag ttggcacatc aatgacaaaa gccccgatga ttgatttttc cgtggtgtcg

240 cgtaacggcg tggcggcatt agtaggcgat cagtatattg tgagcgtggc acataacggc

300 ggatataacg atgttgattt tggtgcagaa ggacgaaacc ctgatcagca ccgctttact

360 tatcaaattg taaaaagaaa taattatcaa gcttgggaga gaaagcatcc ttatgatgga

420 gattatcata tgcctcgttt acataaattt gtaactgaag ctgaacctgt gggtatgaca

480 acaaatatgg atggaaaagt atatgctgat agagagaact atcctgagcg tgtacgtata

540 ggctcaggac gtcagtattg gcgtacagat aaagatgaag aaacgaatgt acatagttca

600 tattatgtct caggtgcata tcgttatctt actgcaggaa atacccatac tcagagtgga

660 aatggtaatg gtacagtcaa tcttagtggt aatgtagtta gccctaatca ttatggtcca

720 ttaccaacgg gtggttctaa aggcgatagc ggttcgccaa tgtttattta tgatgcgaag

780 aagaaacaat ggcttataaa tgctgtatta caaactgggc atcctttttt cggaagaggt

840 aatgggtttc agttaatacg tgaagaatgg ttttataatg aagttcttgc ggttgatacc

900 cctagtgttt ttcaacgcta tattccccca ataaatggac attattcctt tgtatcaaat

960 aatgatggta caggtaaatt aactttaact agacctagta aagatggctc taaagcaaaa

1020 tcag

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 14:GDC_HINF_276992

     序列描述:

自定义密码子

序列名:SEQ ID 14:GDC_HINF_276992

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgggggaaa acgcgatgaa tttaagtcgt cgagacttta tgaaagccaa tgcggctatg

60 gcagccgcaa cggcagcggg gctaaccatc ccagtcaaaa atgtggttgc ggctgaatcc

120 gaaattaaat gggacaaagc agtatgtcgt ttctgtggta ccggttgtgc agtattagtt

180 ggtactaaag atggacgtgt tgtggcatct caaggcgatc ctgatgcaga agtaaaccgt

240 ggtttaaact gtattaaagg ttatttcttg ccaaaaatta tgtacggtaa agaccgttta

300 acgcagccgc ttttacgtat gacaaacgga aaatttgata agaacggcga ttttgcgcca

360 gtttcttggg attttgccgt tcaaaacaat ggctga

396

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 15:GDC_HINF_370413

     序列描述:

自定义密码子

序列名:SEQ ID 15:GDC_HINF_370413

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgataagaa cggcgatttt gcgccagttt cttgggattt tgccgttcaa aacaatggct

60 gaaaaattca aagaagcgtt caaaaagaac ggtcaaaatg cagtaggtat gtttagttct

120 ggtcagtcta ccatttggga aggctatgca aagaacaaac tttggaaagc aggttttcgt

180 tctaacaacg tagacccgaa tgcgcgtcac tgtatggcat ctgcagcggt tgcgtttatg

240 cgcaccttcg gtatggatga acctatgggt tgttataacg acattgaaca ggcagatgct

300 tttgttcttt ggggctcaaa tatggcggaa atgcacccaa ttttgtggtc gcgtattact

360 gatcgccgta tttctaatcc tgatgttcgt gtcactgtac tttctactta cgaacatcgt

420 agttttgaac ttgccgatca cggtttgata tttacaccgc aaactgattt ggcaattatg

480 aactacatca tcaattatct tattcaaaat aatgcgatta attgggattt tgttaataaa

540 cataccaaat ttaaacgcgg agaaacgaat attggctatg gtttgcgtcc agagcatcca

600 ttagaaaaag acacgaatcg taaaacagct gggaaaatgc acgattcttc ttttgaagaa

660 ttaaagcaac ttgtatcaga atatacagtg gaaaaagtat cgaaaatgtc tgggttagat

720 aaagtccagt tagaaacttt agcgaaactt tatgctgatc caacgaagaa agtggtttcc

780 tactggacaa tgggctttaa ccaacataca cgtggtgtgt gggtaaacca attaatctac

840 aatattcatt tacttactgg aaaaatttca atcccaggtt gtgggccatt ttcattaact

900 ggtcagcctt ctgcttgtgg tacggcgcgt gaagtaggtt cattccctca tcgtttacct

960 gccgacttag tggtaactaa tccgaaacac cgtgaaattg ctgaacgtat ttggaaatta

1020 ccaa

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 16:GDC_HINF_370747

     序列描述:

自定义密码子

序列名:SEQ ID 16:GDC_HINF_370747

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 17:GDC_HINF_628407

     序列描述:

自定义密码子

序列名:SEQ ID 17:GDC_HINF_628407

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttggttatgt tcaatgattt tttggcaaca ttcagccagc aattaacacc tcaaatgtgg

60 ggcgttgtcg caaccgcaac ttatgaaact gtttatatca gttttgcatc taccctactt

120 gctgtactag tcggcgtgcc tgttggcata tggacttttt taactggaaa aaatgagatt

180 ttacaaaata accgcactca ttttgtgtta aacacgatta ttaatattgg gcgttccatt

240 ccatttatta ttttgctcct aatcttatta cctgtaactc gtttcatcgt gggaactgta

300 ttaggtacaa cagcagcaat tattccattg agtatttgtg caatgccatt cgtggctcgc

360 ttaactgcta atgcactaat ggaaattcca aatggtttaa ccgaagcagc tcaagcaatg

420 ggggctacta aatggcaaat tgttcgtaaa ttctatttgt cagaagctct acctacgcta

480 attaatggcg ttactcttac gctagtcact ttagttggtt attctgcaat ggcaggaaca

540 caagggggcg gtggtttagg tagcctcgct atcaactacg ggcgtatatc gcaatatgcc

600 ttatgtaact tgggtggcaa ccattattat tgtgctattc gttatgatta g

651

<212>类型:DNA

<211>长度:651

     序列名:SEQ ID 18:GDC_HINF_654365

     序列描述:

自定义密码子

序列名:SEQ ID 18:GDC_HINF_654365

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

      序列名:SEQ ID 19:GDC_HINF_661444

      序列描述:

自定义密码子

序列名:SEQ ID 19:GDC_HINF_661444

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgcgtaaag atgcactacc cgcatttttc acagacgtaa atcaaatgta tgatgcctta

60 ttgaataaat caggggcaac aggtgtattt actgatttcc cagatacttg cgtggaattc

120 ttaaaaggaa taaaataa

138

<212>类型:DNA

<211>长度:138

     序列名:SEQ ID 20:GDC_HINF_737160

     序列描述:

自定义密码子

序列名:SEQ ID 20:GDC_HINF_737160

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 21:GDC_HINF_775792

     序列描述:

自定义密码子

序列名:SEQ ID 21:GDC_HINF_775792

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgcctaaac ctgaaccaat accacgaccg aggcgtttagcactatgctt tgcaccttca

60 gccggagata gagtatttaa acgcatctct tactcctcca ctttaaccat gtatgaaact

120 tggttaatca taccacgtac tgcaggcgta tcaattaact caacagtgtg gtgtatatgg

180 cgaagaccaa gaccacgcaa ggtagcttta tgcttcggta aacgagcaat tgagctacga

240 acttgtgtta ctttaatagt tttagccatt attcattacc ccaagatttc atcaacagtt

300 ttaccgcgtt ttgcagcaac catttctggt gatttcatat ttgctaatgc atcaatagtt

360 gcacgaacaa cgttaattgg gttggtagaa ccatacgctt tagaaagaac gttacgtaca

420 cctgcaactt ccaataccgc acgcattgca ccaccagcga tgatacctgt accttcactt

480 gctggctgca taaatacacg tgaaccagta tga

513

<212>类型:DNA

<211>长度:513

   序列名:SEQ ID 22:GDC_HINF_848166

   序列描述:

自定义密码子

序列名:SEQ ID 22:GDC_HINF_848166

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgtttatat atgggggaat aaatatgcaa attacacttt caaatacctt agcgaatgat

60 gcttggggaa aaaatgcgat tttgagcttt gactctaata aagctatgat tcatttaaaa

120 aataatggaa aaactgaccg cactttagtt caacaagctg ctcgtaaatt gcgtgggcaa

180 ggaatcaaag aggtggagtt ggtcggcgag aaatgggatt tggaattttg ctgggcgttt

240 tatcaaggtt tttataccgc aaaacaagat tacgcgattg agtttccaca tttagatgat

300 gaaccgcaag atgaattgtt agcacgtatt gaatgtggcg attttgtgcg tggaattatt

360 aatgaaccag cacaaagttt aacgcctgtg aaattagtag agcgagcggc tgaatttatc

420 ttaaaccaag cggacattta taatgaaaaa agtgcggtaa gttttaagat tatttctggc

480 gaggaacttg agcaacaagg ttatcacgga atttggactg tgggtaaagg ctctgcgaac

540 ttgccagcca tgttgcaact tgatttcaat ccaacacagg attcgaatgc gcccgtgtta

600 gcttgtttag ttggtaaggg gattactttt gatagtggcg gctatagtat caaaccaagt

660 gatggtatga gtacaatgcg aactgatatg ggcggggctg cattattaac gggggcttta

720 ggtttcgcta tcgctcgtgg attaaatcaa cgcgttaagc tgtatttatg ttgcgcagaa

780 aatttggtaa gcaataatgc ctttaagcta ggcgatatta ttacttataa aaatggcgtg

840 agcgcagaag tactgaatac tgatgcggaa ggtcgtttgg tgttagctga tggattgatt

900 gaggctgata accaaaatcc aggttttatt attgattgcg cgactttaac tggcgcagca

960 aaaagtggct gtaggaaacg actatcattc tgtattatct atggatga

1008

<212>类型:DNA

<211>长度:1008

     序列名:SEQ ID 23:GDC_HINF_928073

     序列描述:

自定义密码子

序列名:SEQ ID 23:GDC_HINF_928073

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtggctgtag gaaacgacta tcattctgta ttatctatgg atgatgaact tgtgaaaaat

60 cttttccaat ccgcacaagc agaaaatgaa cctttctggc gtttaccatt tgaagatttt

120 catcgttcac aaattaattc atcttttgcc gatattgcta atattggttc ggttccagtt

180 ggagctgggg caagcactgc aacggcattt ttatcgtatt ttgtaaaaaa ttataaacaa

240 aattggttgc atattgattg ctccgcgact tatcgtaaat ctggtagtga tttatggtct

300 gttggggcaa caggaattgg tgtgcaaact ttagctaatt taatgttatc aagatcattg

360 aagtaa

366

<212>类型:DNA

<211>长度:366

     序列名:SEQ ID 24:GDC_HINF_929037

     序列描述:

自定义密码子

序列名:SEQ ID 24:GDC_HINF_929037

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgccaattg aattaaaagt agaaggttta gtgggtaaac caaacgagaa aatttctgcg

60 gcagaatttc gtcaaaaatg tcgtgaatac gcggcggaac aggtcgaggg tcaaaagaaa

120 gactttatcc gtttaggtgt gttgggcgat tgggataatc catatctcac gatgaatttc

180 gataccgaag cgaatattat ccgcacttta ggtaaagtga ttgaaaatgg tcatttgtat

240 aaaggctcaa aaccagttca ctggtgtttg gattgcggtt cttctttagc agaagcagaa

300 gtggaatatg aagacaaagt ttctccgtca atttacgttc gtttccctgc ggaaagtgcg

360 gatgaaattg aagctaaatt ttctgcacaa ggtagaggac aaggtaaatt atcagccatc

420 atttggacta ccacaccttg gacgatgcca tctaaccgtg cgattgcggt gaatgcagac

480 tcagaataca acttagtcca acttggcgat gagcgtgtaa ttttagctgc tgaattagtt

540 gagtcagtgg caaaagcggt gggtattgag cacattgaaa ttctgggttc tgtaaaaggt

600 gatgatcttg aattaagccg tttccatcat ccgttctatg attttactgt gccagtgatt

660 ttaggcgatc acgtaaccac tgatggcggt acaggtttag tacataccgc acctgatcac

720 ggtttagacg actttatcgt gggtaaacaa tatgatttac caatggcggg tcttgtatcg

780 aatgatggta aatttatttc aacgaccgaa ttctttgcag gcaaaggcgt atttgaagca

840 aatccgcttg tgatagaaaa attacaagaa gtaggtaact tattaaaagt tgaaaaaatc

900 aaacacagct atccacactg ctggcgtcac aaaacgccaa ttattttccg tgcaacaccg

960 caatggttta tcggcatgga aacgcaaggt ttacgccaac aagcattagg cgaaattaaa

1020 caag

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 25:GDC_HINF_1018846

     序列描述:

自定义密码子

序列名:SEQ ID 25:GDC_HINF_1018846

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttggaaaata aaatgacagt cgattacaaa aacactctta acctaccgga aaccagcttt

60 ccaatgcgcg gtgatttagc taagcgcgaa cctgataagt ag

102

<212>类型:DNA

<211>长度:102

     序列名:SEQ ID 26:GDC_HINF_1021582

     序列描述:

自定义密码子

序列名:SEQ ID 26:GDC_HINF_1021582

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgaagataa ctcattgtaa attaaagaaa tctatacaaa ataagctact tgaatttttt

60 gtattagaag ttacagcccg agcagcggct gatttactcg atatctaa

108

<212>类型:DNA

<211>长度:108

     序列名:SEQ ID 27:GDC_HINF_1082407

     序列描述:

自定义密码子

序列名:SEQ ID 27:GDC_HINF_1082407

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgtttctgg ttggaaacct tttgaggtgg gtttggcttg cgctttttat cattgcgcaa

60 atttgggctt atgtacaaac acctgattct tggttagcaa tgatttctgg tatttctggt

120 attttgtgtg tggtattggt aagtaaaggt aaaattagta attatttctt tggattgatt

180 tttgcctata cttattttta tgttgcttgg ggatcgaatt tcttaggcga aatgaacacc

240 gtactttacg tatatttgcc ctctcaattt attggttact ttatgtggaa agccaatatg

300 caaaatagcg atggtggaga aagcgtgatt gcaaaagcgt taactgttaa aggatggatg

360 acattaattg ttgtgactac ggttggtact ttgctttttg ttcaagcatt acaagcggct

420 ggtggtagct caacaggttt agatggtcta actacaatta ttacggttgc ggcacagatt

480 ttaatgattt tgccgttatc gtga

504

<212>类型:DNA

<211>长度:504

     序列名:SEQ ID 28:GDC_HINF_1144501

     序列描述:

自定义密码子

序列名:SEQ ID 28:GDC_HINF_1144501

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgtttagtg gcgaacatga tgcttgcgat tgctatgtgg acctacaagc aggttctggc

60 ggcaccgaag ctcaagattg gacagaaatg ttgctccgta tgtatctccg ttgggctgaa

120 agcaaaggtt ttaaaacaga actgatggaa gtctctgacg gcgatgtagc tggattgaaa

180 tcagcaacca ttaaagtgag cggtgaatat gcttttggtt ggttacgaac agaaacgggg

240 attcatcgtt tagtgcgtaa aagtccattt gattccaata accgtcgtca cacatcattc

300 agcgcagcat ttgtctaccc tgaaattgat gatgatattg atattgaaat caatcctgct

360 gatttacgta ttgatgttta tcgtgcatca ggggcaggtg gtcagcacgt aaacaaaact

420 gaaagtgcgg tgcgaattac ccatatgcca agtggcattg tggtgcaatg tcaaaacgac

480 cgttcacagc acaagaacaa agatcaagca atgaaacaat taaaagcgaa attgtatgag

540 cttgaattac aaaagaaaaa tgcggataaa caagcaatgg aagataataa atctgacatt

600 ggttggggaa gccaaattcg ctcttatgta ttagacgatt cacgcattaa agatttacgt

660 actggcgtag aaaaccgtaa tacgcaagcc gtattagacg gggatttaga tcgatttatt

720 gaagcgagtt taaaagcggg cttgtag

747

<212>类型:DNA

<211>长度:747

     序列名:SEQ ID 29:GDC_HINF_1279189

     序列描述:

自定义密码子

序列名:SEQ ID 29:GDC_HINF_1279189

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgcttggta acgaaaaaca agctgaagca caagctaaat atgcggaaga cacgctgaaa

60 caagcacgcg attttgctaa acaacatcat aaaacagcct atttagcgcg taatgcggat

120 ggcttacaaa ctggtcaaaa aggttcgatt catacggaag caatggaatt ggttggcttg

180 gaaaacgtcg cagagggaga acaaaaaggc ttaactcaag tttcaatgga acagctttta

240 ttgtga

246

<212>类型:DNA

<211>长度:246

     序列名:SEQ ID 30:GDC_HINF_1347200

     序列描述:

自定义密码子

序列名:SEQ ID 30:GDC_HINF_1347200

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgccacgta tttttgccgc ttgttttgtc ggggcggcgc ttgcttgtgg gggcgcaact

60 tatcaaggta tgtttaaaaa tccgcttgtt tcgccagata ttttgggtgt ttcagcgggg

120 gcaggttttg gggcaagttt ggcaattttt tataatttgc caatgattta tatccaattt

180 tttgctttta gcggtggcat tttagctgtg ttatgtgtat cgctcattgc ctcgcgtagt

240 cgtacacaag atcctatttt agtgctggtg ctttctggga ttgcaattgg ttctttactt

300 ggtgcaggca tttctttgtt aaaaattctt gcggatcctt tcactcaatt accttcaatc

360 actttttggc tacttggtag cctgacggct attaatcaac aagatttaat tcaattgatc

420 ccgatgttgt tgctagggat tgttcccatt tttttattac ttactgatac gctggctcgc

480 acgattgcac cgattgaact gccactcggt attctgactt ctgcttgtgg ttattag

537

<212>类型:DNA

<211>长度:537

     序列名:SEQ ID 31:GDC_HINF_1347942

     序列描述:

自定义密码子

序列名:SEQ ID 31:GDC_HINF_1347942

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgaagaact cattacggga gttaaaacnn gattatactg tggttatagt aactcataat

60 atgcaacaag ctacacgttg ctccgactat acggcattta tgtatttggg tgaattagtt

120 gaatttggtc aaacacaaca aatttttgat agacccaaga tacaacgtac agaagattat

180 attcgcggta aaatggggta g

201

<212>类型:DNA

<211>长度:201

     序列名:SEQ ID 32:GDC_HINF_1476415

     序列描述:

自定义密码子

序列名:SEQ ID 32:GDC_HINF_1476415

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgattagtc tacaagaaac caaaatagct gtgcaaaatc taaatttcta ctatgaggat

60 tttcatgcat taaaaaacat taatttacgt atcgctaaga ataaagtgac cgcctttatt

120 ggtccttcag gttgcggtaa atctacttta ttgcggagtt ttaatcggat gtttgaacta

180 tatccaaatc aaaaagctac tggtgaaatt aatttagacg gtgaaaattt actcacaaca

240 aagatggata tttctctgat tcgtgctaag gttggtatgg ttttccaaaa accaacgcca

300 tttccaatgt cgatttatga taatattgca ttcggtgttc gtttgtttga aaaattatta

360 aaagaaaaga tgaatgaacg agtagaatgg gcattgacta aggccgctct ttggaatgaa

420 gtgaaagata aattacataa aagcggagat agtttatctg gcggacaaca gcaacgcttg

480 tgcattgctc gagggattgc tattaaacct agtgtgttgt tgttagatga accttgttcg

540 gcattagatc ctatttcgac tatgaaaatt gaagaactca ttacgggagt taaaacnnga

600 ttatactgtg gttatagtaa ctcataa

627

<212>类型:DNA

<211>长度:627

     序列名:SEQ ID 33:GDC_HINF_1476557

     序列描述:

自定义密码子

序列名:SEQ ID 33:GDC_HINF_1476557

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgagccagc ttaatattca atttccgaca aaattcaaac cgctctttga atctatttgg

60 cggtttatta ttttctacgg tgggcgaggt tcaggtaaaa gttttagtat cgctagagca

120 ttagtattgc gagcctatca atcgcctgtt cgagttttgt gttccgtgaa attcagaaat

180 cgatttctga ttctgtga

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 34:GDC_HINF_1505851

     序列描述:

自定义密码子

序列名:SEQ ID 34:GDC_HINF_1505851

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtggttcccg agttcattat tgtttcttta atcttggtgg cacagtccat gaaattggcg

60 ttaaacaaat ggcttatcat atttggcaac gctatagctc ttcacataaa gtacgcttta

120 ttgcgattaa actttgaggg agttgttggt gagattttag agaaagtcga taacggccaa

180 atgggcgttg tattaaaacg gatgatggtg cgagccgcaa gtaaagtcgc tcaacgtttc

240 aatattgaag caattgtgac aggggaggca ttagggcaag tttctagcca aactttaacc

300 aatttacgct tgattgatga agccgctgat gccttagtat tgcgtccgtt aattacccat

360 gataaagaac aaattatcgc gatggcgaaa gaaattggca ctgatgatat tgcaaaatct

420 atgccagaat tttgtggcgt gatttcaaaa aatcctacga ttaaagcggt tcgtgaaaag

480 attcttaaag aagaagggca ttttaatttt gagattcttg aaagtgcggt acaaaatgca

540 aaatatttag atattcgcca gattgcagaa gaaacagnaa aagcagtcgt ggaagtcgag

600 gcaatttctg tgttaggtga aaatgaagtg attttggata ttcgtagccc agaagaaacg

660 gatgaaaagc catttgaatc aggtacacat gacgtcattc aaatgccgtt ctacaaactt

720 tcttctcaat ttggtagcct tgatcaaagt aaaagttacg tgttgtattg tgaacgtggt

780 gtgatgagta aattacaagc cttatatttg aaagaaaatg gtttttcaaa tgtgcgtgta

840 tttgcaaaaa acattcatta a

861

<212>类型:DNA

<211>长度:861

     序列名:SEQ ID 35:GDC_HINF_1524561

     序列描述:

自定义密码子

序列名:SEQ ID 35:GDC_HINF_1524561

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttggccatcg ctattggtgg aggtaataga ggtaatgcaa gcggagtatt gcgccaaaat

60 tttgcagaag ataaagcaaa aaagaccgct tcgaagctcg tgggcgtaat ggctcactat

120 tttggcggta agtcgtttta tctgcccgca ggtgataaaa tcaaagaagc cttacgagat

180 gcacaaattt atcaagaatt caacggtaag aatgtacctg acctaataaa aaaataccga

240 ttgtcagaaa gcacaattta tgcgatctta cgcaatcaac gaacgcttca aagaaagcga

300 catcagatgg attttaattt tagttag

327

<212>类型:DNA

<211>长度:327

     序列名:SEQ ID 36:GDC_HINF_1568974

     序列描述:

自定义密码子

序列名:SEQ ID 36:GDC_HINF_1568974

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgtttaggt ggcactacct tggaggtttt acagtaatgc cagatacaaa taacacagaa

60 accaataata agatcgaact ctatctaaat ggcaaaattt tatccggttg gaaaagcctt

120 aacctgcaac gctcgctgga atcaatgagt ggtcgttttg atttaggcat tgctgtgcga

180 cctgaagatg atatatcagt gcttgccgca ggttcgccac tggtgctgaa aatgggcggg

240 caaaccgtga ttaccggtta cttggatgaa atcaaacaac gcgtaagcgg taacgacaaa

300 actatctctg tgagtggacg agataaaact tgcgacttgg tggattgtgc cattatccac

360 aacagctacc aattcaaaaa ccaaactgcc aaacaaattg ccgaagccat ctgtaaacct

420 tttggcatta gcgtagtatg gcaagtgcaa gcccctgaag ccaatgaacg aatccctgtc

480 tggcaagtag aaccaggcga aaccgccttt gataatttaa gcaaaatcgc ccgacacaaa

540 ggcgtgttag tcaccagcga cgtggacggc aatttgcttt tcaccgagcc gagcaacaag

600 caagtcggta atcttaccct tggcgaaaac ttgctcgaac tggaacaaac cgacagctgg

660 ttgcaacgct tttcgctcta tcgcgtgatt ggtgacgcag aacaaggcgg cgccaaaggt

720 gataccaaaa ccaaaaacaa agcggcaaaa ggcaaggaaa aagatgatgg cgtggtagaa

780 gatcccgata tttacccagg accagcagaa ggaggcaagt aa

822

<212>类型:DNA

<211>长度:822

     序列名:SEQ ID 37:GDC_HINF_1586944

     序列描述:

自定义密码子

序列名:SEQ ID 37:GDC_HINF_1586944

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgaaggttt cttaccggct aaataattgt ctaagtttaa agttagcgct gatcccatta

60 ttaatactat tatttgttgt tatgggatcg gtgctttctt taatcgcaaa attagatttt

120 tatttttttc aacaaatatt atttaattcc gaattgcatt ttgcattgct aatgtcattg

180 ggaacgtctc ttttttcttt gatattagca ttatgtattg ctattccatc tgcatggcga

240 atgagtcaag tgcggttgcc ttttcaatca ttttttgaca ctttgtttga tttaccaatg

300 gttttgccac cattagtcac aggactaagt ttgcttctac tttttagttc acaagggata

360 ttggctgaac tacttccttt tataagtaaa tggatttttt cccctgtagg gatcattatt

420 gctcagactt atattgcgag ttcgatttta ttgcgttgta gcgagccatt aaaactgcga

480 aaaaaaacca ttaaaactac gaaaataaaa ccttga

516

<212>类型:DNA

<211>长度:516

     序列名:SEQ ID 38:GDC_HINF_1594339

     序列描述:

自定义密码子

序列名:SEQ ID 38:GDC_HINF_1594339

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgacaaaac gtaaaaatgt ttcctttact tatgaaaatt atactgttac gccattttgg

60 gatacgctca agttaagcta ttcacaacaa agaattacaa caagagcaag aacagaagat

120 tactgtgatg gtaatgaaaa atgtgactct tataagaatc ctttagggct tcaattaaaa

180 gagggaaaag tcgttgatcg gaatggtgat cctgttgagt tgaagcttgt tgaggatgaa

240 caaggtcaga aacgacatca agttgttgat aaatataata atccttttag tgtagcctct

300 ggaactaata atgatgcttt cgtaggtaaa caattatctc cttctgagtt ttggttagat

360 tgctctattt ttaattgtga taagcctgtc agggtttata aatatcagta tagcaaccaa

420 gaaccagagt cgaaggaagt tgagttaaat agaaccatgg aaattaatgg aaagaaattt

480 gctacttatg agtctaataa ttatagagat agataccata tgattttacc aaattctaaa

540 ggttacttgc ctttggatta taaagagcgt gatttaaata caaagacgaa acaaattaat

600 ttagatttaa caaaagcctt tactctcttt gagattgaaa atgaactttc ctatggtggt

660 gtttacgcga aaacgaccaa ggaaatggtg aataaagcag gatattatgg gcgtaatcct

720 acttggtggg cggagagaac gttagggaaa tcattgctta atggattgag aacgtgtaag

780 gaagattctt catataatgg gctactatgt cctcgtcatg aacctaaaac gtctttctta

840 attcctgtag aaacaacaac taagtcttta tattttgcag acaatatcaa gttgcacaat

900 atgttgagcg tagatttagg ttatcgttat gatgatatta aatatcagcc agagtatatt

960 cctggtgtaa cacctaagat tgcagatgat atggtcagag aattatttgt tccactccct

1020 ccag

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 39:GDC_HINF_1634710

     序列描述:

自定义密码子

序列名:SEQ ID 39:GDC_HINF_1634710

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

ttgcgtgaac gtagttcgct ttctgctcta atggccaaaa cgattgaatg ggattttata

60 acagaaaacc ccctaaaata tcttgagaaa ccaaaagcgc cagcaccaag aactcgtcga

120 tataatgaac atgaaattga gcgtctgatt tttgtgtcag gttatgatgt cgaacatatt

180 gaaccgccaa aaaccttaca aaattgcacg ggggcggcat ttctttttgc tatagagaca

240 gcaatgagag caggggaaat agcaagttta acttggaata atattaattt tgaaaagcgc

300 accacctttt tgccaattac taaaaatgga cattcacgca cggtgcctct ttcggtaaaa

360 gcaatagaga ttttacaaca tcttacttcg gtaaaaacag aaagtgatcc gcgagtattc

420 caaatggaag cacgccaact ggatcacaac ttccgcaagc tcaaaaagat ggaagggctt

480 gaaaatgcca atttacattt tcacgacacc cgccgtgaac gattggcaga aaaagtggat

540 gtaatggtat tagccaaaat atcgggccat agagatctca gtattctgca aaatacttat

600 tacgcacctg atatggcaga aggctataaa acaaaggcgg gttatgatct gaccccaacc

660 aaaggcttga gccaacggaa ttttttcttc tttaatgaaa acttcatcgt tttcacaaca

720 aatccaccga tagtcattaa gctgtaa

747

<212>类型:DNA

<211>长度:747

     序列名:SEQ ID 40:GDC_HINF_1638626

     序列描述:

自定义密码子

序列名:SEQ ID 40:GDC_HINF_1638626

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atggcgacaa ttatcaagaa tggcaagcgt tggcacgcac aagtgcgcaa gtttggcgtg

60 agcaaatcag ccattttttt gactcaagca gacgcaaaaa aatgggcaga aatgctcgaa

120 aaacagcttg aatcaggaaa gtataatgaa atccctgata ttacattgga tgaactcatt

180 gataagtatc taaaagaagt cactgtaacc aagcgcggga aacgtgaaga gcgcataaga

240 ctactgcgtc tttctcgaac tccgcttgcc gcaatatctt tacaagaaat aggaaaagca

300 cactttcgtg agtggtaa

318

<212>类型:DNA

<211>长度:318

     序列名:SEQ ID 41:GDC_HINF_1639409

     序列描述:

自定义密码子

序列名:SEQ ID 41:GDC_HINF_1639409

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atggaagccg ttcaattaga caaaaatcaa gagcctaatt ataaaggtta tagcggtagc

60 ttgattcatc ctgcatttca acagcaaaca acaaaacgtg aaaaaccgag tacaccatta

120 cctagtttgg atttgctttt aaaatatccg ccaaatgaac aacgcattac accagatgaa

180 ataatggaaa cctcacagcg tattgaacaa caattacgca attttaatgt aaaagccagc

240 gtaaaagatg tgcttgttgg ccctgttgtt acgcgttatg aattagaatt acagccgggt

300 gtgaaagcat caaaagtcac gagcatcgat accgatttag caagagcatt gatgtttcgt

360 tctattcgtg tggcagaggt gattccaggt aaaccttata ttggtattga aaccccaaat

420 cttcatcgtc aaatggtgcc attacgtgat gtattagata gcaatgaatt ccgtgatagc

480 aaggcaactt tacctattgc tttaggtaaa gatattagtg gcaaaccagt cattgttgat

540 ttagcgaaaa tgccacattt attggtagca ggttctacgg gatcaggtaa gtctgttggt

600 gtgaatacga tgattctaag tttactttat cgtgttcaac cagaagatgt gaaatttatt

660 atgattgatc ctaaagtcgt cgaactttct gtttataatg atattccaca tttactgaca

720 ccagttgtaa cggatatgaa aaaagccgct aatgcgttgc gttggtgcgt agatgaaatg

780 gaacgtcgtt atcagttgct ttcagcttta cgcgtacgaa acattgaagg ctttaatgaa

840 aaaattgatg aatacgaagc aatgggaatg cctgtgccaa atccaatttg gcgactgggc

900 gatacgatgg atgcaatgcc accagcgttg aaaaaattga gttatattgt ggttattgtc

960 gatgagtttg ctgatttaat gatggtagcg ggtaagcaaa tcgaagaact gattgcacgg

1020 ttgg

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 42:GDC_HINF_1660491

     序列描述:

自定义密码子

序列名:SEQ ID 42:GDC_HINF_1660491

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

atgaataaaa ttttaaagt tatttggaat gttgtgactc aaacttgggt tgtggtgtct

60 gaactcactc gcgcccacac caaacgcacc tccgcaaccg tggcaaccgc cgtattggcg

120 accgtattgt ctgcaacggt tcaggcgatt aacgacgcag gaactttcgt gaaagtgcaa

180 agtacggaag atgatattga agatagtgct gcaaccaaag atgacaataa aaaccaagct

240 ctcaaagcag gcgacacctt aaccttaaaa gcgggtaaaa acttaaaagc taagttagac

300 caaggtggta aatcagtaac ctttgcttta gcgaaagacc ttgatgtgaa aaccgcgaaa

360 gtgagtgata ctttaacgat cggcgggaat acgcctgctg cgggtggtgc tacgccaaaa

420 gtaagtatta ctagcacggc tgatggcttg aagttagcaa aaggcactaa tggagatact

480 gcagttcatt tgaatggctt ggcttcaact ttgcctgatg tgactacaaa tacaggtgcc

540 tcaacttcag taaccttttc gcctagtgac attgaaaaaa caagagctgc aactattaaa

600 gatgttttaa atgcaggttg gaatattaaa ggagctaaag ttgcgggggg taataccgag

660 aatgttgatt tagtggcggg ttatgacaat gttgagttta ttacaggaga taaaaacaca

720 cttgatgttg tattaacagc taaagaaaac ggtaaaacaa ccgaagtgaa gttcacaccg

780 aaaacttctg ttattaaaga taataatggt aagttgctta caggtaagca gttgaaggat

840 gcgaatactg gtacagcgac caatgcaact gaagatacag acgaggcaat ggcttag

897

<212>类型:DNA

<211>长度:897

     序列名:SEQ ID 43:GDC_HINF_1807963

     序列描述:

自定义密码子

序列名:SEQ ID 43:GDC_HINF_1807963

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc

60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca

120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg

180 cttataccat tgcactaa

198

<212>类型:DNA

<211>长度:198

     序列名:SEQ ID 44:GDC_HINF_1817220

     序列描述:

自定义密码子

序列名:SEQ ID 44:GDC_HINF_1817220

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgtttgcag tgcatgctgc gatgattacg acattaaaga aagaagtttt ctttctttac

60 ctttatatca aatcactcaa aatcccgatt cctactacac tgaaatacat gatttcttta

120 ggcaaaatca gagaattaga tgttttagca aatcttgcta aactttgccc tacttgtcat

180 agggctttaa aaaaaggatc tagcgaagag gagtttcaaa aacgcttgat tagaaacatt

240 ctcaatcgca ataaagacaa tttagagttt gcgcaattgc gttttgaaac cgatgatttt

300 tcaacgctta ttgatcgtat ttgtgaaagc ttgaaatga

339

<212>类型:DNA

<211>长度:339

     序列名:SEQ ID 45:GDC_HPYL_51094

     序列描述:

自定义密码子

序列名:SEQ ID 45:GDC_HPYL_51094

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgattaaac aaaccctcat cattcttgcc ccttttttta tcgcaacgct gttgtatttt

60 ttaggcgcac cggatgggtt aagacctaac gcttggcttt atttttgtat tttcatgggc

120 atgattatag ggctaatttt agagccggtg ccatcaggtt taatagcgct aagcgcgtta

180 gtgctgtgta tagcgttaaa aattggagcg agcgataaag tagcgagcgc taataaggct

240 atttcgtggg gtttgagcgg gtatgcgaat aaaacggtgt ggcttgtgtt tgtcgctttc

300 attttgggtt tagggtatga aaaaagcttg ttagggaaac ggatcgctct tttactgatt

360 aggtttttag ggcaaacccc tttaggttta ggctatgcga ttggtttgag cgaattgtgt

420 ctagcccctt ttatccctag caactccgct agaagtggag gcatactcta tcccatcgtt

480 tcatctatcc cgcctttaat gggatctact ccaaataata accctgacaa aatcggcgcg

540 tatttgatgt gggtcgcttt ggcttcaact tgcatcactt cgtccatgtt tttaaccgcg

600 ctcgctccta accccctagc aatggaaatc gctgccaaaa tgggcgtgaa tgaaatctca

660 tggttttcgt ggtttttagc gttcttgcct tgtggggtgg ttttgatctt gcttgtgcct

720 ttattggcgt ataaaacctg caaacccacc ttaaaaggct caaaagaagt gagtttgtgg

780 gccaaaaaaa ggaattag

798

<212>类型:DNA

<211>长度:798

     序列名:SEQ ID 46:GDC_HPYL_155367

     序列描述:

自定义密码子

序列名:SEQ ID 46:GDC_HPYL_155367

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc

60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg

120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt

180 gtgccattac actcaacttg cgatttccaa ccgcaatga

219

<212>类型:DNA

<211>长度:219

     序列名:SEQ ID 47:GDC_HPYL_447632

     序列描述:

自定义密码子

序列名:SEQ ID 47:GDC_HPYL_447632

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

gtgcaacttc attgccacaa cttgccatgc gtttcaattg atattctact aggcggacca

60 ccatgccaga gctattctac ccttggcaaa agaaaaatgg atgaaaaagc gaatctgttt

120 aaagaatatt tgcggctttt agatttagta aaaccaaaaa tatttgtttt tgaaaatgtg

180 gtgggtttaa tgtctatgca aaaagggcaa ttattcaaac aaatttgtaa cgcttttaaa

240 gagagagatt atattttaga gcatgccatt ttgaacgccc tagattatgg tgtgcctcaa

300 atgagagaac gagtgatttt agtgggcgtg cttaaaagct ttaaacaaaa attttacttc

360 cctaaaccca taaaaacgca tttttctctg aaagacgctt taggggattt accacccatt

420 caaagcggtg aaaatggtga tgctttaggt tatcttaaaa atgcggataa tgtttttttg

480 gaatttgtgc gaaattctaa agaattaagc gaacatagca gtcctaaaaa caatgaaaaa

540 ctgataaaaa tcatgcaaac gctaaaagac ggacagagta aagatgattt gccagaaagt

600 ctgcgtccca aaagtggtta tattaatacc tatgccaaaa tgtggtggga aaaaccagcc

660 cccaccatta caagaaattt ttctacccca agcagttcta ggtgtatcca tccaagagac

720 tctagagcgt taagcattag agagggggca agattgcaaa gctttcctga taattataaa

780 ttctgtggga gtggtagcgc taaaagattg caaattggca atgccgtgcc gcctttattg

840 agtgtagcgc tcgcgcaggc ggtctttgac tttttaaagg ggtaa

885

<212>类型:DNA

<211>长度:885

     序列名:SEQ ID 48:GDC_HPYL_506250

     序列描述:

自定义密码子

序列名:SEQ ID 48:GDC_HPYL_506250

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgatggaat ttgatgttac catcatagat gagacaggca gggccacagc accagaaatc

60 ttgattcctg cacttcgcac taaaaaactg atcttaatag gcgatcacaa ccagctccca

120 cctagcattg ataggtacct cctagaacaa ttagagagcg atgatattca aaacttggat

180 gccattgatc gccaattatt ggaagagagt ttttttgaaa atctctataa gtatattcca

240 gagagtaata aggccatgct taatgagtaa

270

<212>类型:DNA

<211>长度:270

     序列名:SEQ ID 49:GDC_HPYL_583607

     序列描述:

自定义密码子

序列名:SEQ ID 49:GDC_HPYL_583607

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgcctgctt ctattggatc gctagttagt cagctttttt ataaagagaa acttaagaat

60 ggagtgatca aaaatacctc gcaattttac gatcctaaga atattatccg ttggattaat

120 gttgaagggg agcatcaact agaaaaaaca agtagctata acaaaaatca agttcaaaaa

180 atcatagagc ttttagagca aatcaatcgc gttcttaatc aaagaaaaat cagaaaaacc

240 ataggaatta tcacacctta taatgcccaa aaaagatgct tgcgatcaga agtggaaaaa

300 tacggcttca agaattttga tgagctcaaa atagacactg tggatgcctt tcaaggcgag

360 aaggcagata ttattattta ttccaccgtg aaaacttatg gtaatctttc tttcttgata

420 gattctaaac gcttgaatgt agctatttct agggcaaaag aaaatctcat ttttgtgggc

480 aaaaagtctt tctttgagaa tttgcgaagc gatgagaaga atatctttag cgctattttg

540 caagtctgta gatag

555

<212>类型:DNA

<211>长度:555

     序列名:SEQ ID 50:GDC_HPYL_583883

     序列描述:

自定义密码子

序列名:SEQ ID 50:GDC_HPYL_583883

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgattattg aaacgcaaca agaccccaaa gaactacctg agtcttgcaa aataacgccc

60 caaaaaatct cttttaacca agtggttttt aaaaaaatta aaagaaaact caaccgcttc

120 attggaagca ttttagctcg gacagaagtg tataagaatc tcgtggcaaa atacgatgaa

180 ctcacaggaa aatacgaatc attattggca aaagaggcaa acatcaaaga gaccttttgg

240 gaaaggcgtg ctgatagcga aaaagaagcc ttttttttag agcattttta cctcactagc

300 gtgtatgtgg cttctacagc aggatactat atcacgccta agggcgctaa aacctttata

360 gaagccacgg agcgttttaa aatcatagag ccggtggata tgttcataaa caaccccact

420 taccatgatg tggctaattt tacctatttg ccttgccctg tttctttaaa caagcatgct

480 ctcaatagca ccattcaaaa tgcaaaaaag cctgacattt cattaaaacc ccctagaaaa

540 tcctattttg ataatctttt ttatgatcaa ttaaacacta gaaagtgctt aaaagccttt

600 cacaaataca gcagacgata cgctccttta aaaaccccta aagaggttta a

651

<212>类型:DNA

<211>长度:651

     序列名:SEQ ID 51:GDC_HPYL_665045

     序列描述:

自定义密码子

序列名:SEQ ID 51:GDC_HPYL_665045

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgatggaaa ttttagtgtt gaatctgggc agttcgtcta ttaagtttaa gttgtttgac

60 atgaaagaaa ataagccctt agcgagcggt ttggctgaaa aaatcggcga agaaataggg

120 cagttgaaaa ttaaatcgca tttgcaccat aacgatcaag aattaaaaga aaagtttgtg

180 attaaagatc atgcgagcgg acttttaatg attcgtgaga atttaacgaa aatggggatt

240 atcaaagatt ttaaccaaat tgacgctata gggcatcgtg tggttcaagg gggggataaa

300 ttccatgccc cagttctagt caatgaaaaa gtcatgcaag aaattggcaa tctttctatt

360 ttagccccct tacacaaccc ggcgaattta gccggtattg agtttgttca aaaagcgcac

420 ccccatatcc ctcaaatcgc tgtttttgac accgcattcc atgccactat gcccagttac

480 gcttacatgt atgcgttacc ttatgaattg tatgaaaagt atcaaatccg gcactatggt

540 ttccatagga cttcacacca ttatgtggcc aaagaagcgg cgaagttttt gaataccgct

600 tatgaggaat ttaacgcgat cagtttgcat ttagggaacg gctcaagtgc agccgccatt

660 caaaagggta aaagcgtgga tacttctatg gggctaaccc ctttagaagg cttgattatg

720 ggcacaaggt gtggggatat tgaccccact gtggtggaat atactgcgca atgcgcgaac

780 aagagcttag aagaagtgat gaaaatgtta aaccatgaaa gcggattgaa aggcatttgt

840 ggggataatg agaaacatag aagccagaaa agaaaaaggt ga

882

<212>类型:DNA

<211>长度:882

     序列名:SEQ ID 52:GDC_HPYL_953783

     序列描述:

自定义密码子

序列名:SEQ ID 52:GDC_HPYL_953783

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgcctaaca gccaagtggc tgggcaagct agcgttttta ttttcccgga tttaaacgct

60 gggaacatcg cttataaagc ggtgcaacgg agcgctaaag ccgtggcgat agggcccatt

120 ttacaaggtt tgaataagcc cattaacgat ttgagtaggg gcgctttagt ggaagatatt

180 attaacaccg ttttgattag cgcccttcaa gcgcaagatt aa

222

<212>类型:DNA

<211>长度:222

     序列名:SEQ ID 53:GDC_HPYL_954679

     序列描述:

自定义密码子

序列名:SEQ ID 53:GDC_HPYL_954679

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

gtgagcctgg tttcaagcgt gtttttaatg tgtttagaca ctcaagtgct agtctttggg

60 gattgcgcga ttatccctaa ccctagccct aaagaattag ccgagatcgc taccacttcc

120 gcacaaaccg ccaagcaatt caatattgcg cctaaagtgg ccttgctttc ttatgcgaca

180 ggcgattccg ctcaaggcga aatgatagac aaaatcaacg aagctttaac aatcgctcaa

240 aagttggatc cccaattaga aattgatggc cccttacaat ttgacgcttc cattgataaa

300 agcgtagcca agaaaaaatg cctaacagcc aagtggctgg gcaagctagc gtttttattt

360 tcccggtttt aa

372

<212>类型:DNA

<211>长度:372

     序列名:SEQ ID 54:GDC_HPYL_954846

     序列描述:

自定义密码子

序列名:SEQ ID 54:GDC_HPYL_954846

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgaaagctg cacatcgttt gaatttaatg ggcgcggtag gattgatctt atcaggcgat

60 aaagaagcca ttaattcgaa aaatttgaac ttgaatttag aaaatgtgga aatcattgat

120 cccaacactt ctcattatag agaagaattc gctaaaagct tgtatgaatt acgaaaatca

180 aagggcttga gtgagcaaga agctaagcaa ttagtgctgg ataagactta ttttgcgacc

240 atgctcgtgc attcaggcta tgtgcatgcg atggtttctg gggtgaatca cagctga

297

<212>类型:DNA

<211>长度:297

    序列名:SEQ ID 55:GDC_HPYL_955261

    序列描述:

自定义密码子

序列名:SEQ ID 55:GDC_HPYL_955261

序列

<213>生物名:幽门螺杆菌(Helicobacterpylori)-26695

<400>前序列链:

gtgaaacaaa ttagtatctc ttgcagccat agaaaatatt ttgttagctt tagcgtggaa

60 tacgaacaag acattactcc cataaaaaac actaaaaatg gtgtggggct agatttgaat

120 atccttgata tagcttgttc ttgtgagata aacaaccatg acaaactaac ggactttaag

180 caataccaaa cagacatgaa agaattacta gggatagaaa tagatgaaga gctggatact

240 aaacgactta tccctactta ttccaaattg tattctttaa aaaaatactc taaaaaattt

300 aaaagattac aaagaaaaca aagccgtagg gtgttaaagt ctaaacaaaa caaaaccaaa

360 ttaggaggta atttttacaa aacccaaaag aaattaaacc aagcctttga caagtctagt

420 catcaaaaaa cagacagata ccataaaatc acaagcgaac tttcaaagca atttgaattg

480 atagtagttg aagatttgca agtaaaaaac atgactaaaa gagctaaact caaaaatgtt

540 aaacaaaaga gtgggcttaa tcaatctatt ttaaacgctt cattctatca aatcatctct

600 tttttagact acaaacaaca gcataatggc aaattgttag tgaaagttcc cccacaatat

660 acgagtaaaa cttgccattg ttgtgggaat atcaaccaca agcttaaatt aaatcatagg

720 caatattggt gtttagaatg cgggtataga gaacacaggg acatcaacgc tgcgaacaac

780 attttaagca aagggttaag tctttttggg gtaggaaata tccatgcaga ctttaaagaa

840 caaagccttt cgtgttag

858

<212>类型:DNA

<211>长度:858

     序列名:SEQ ID 56:GDC_HPYL_1068602

     序列描述:

自定义密码子

序列名:SEQ ID 56:GDC_HPYL_1068602

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgaaagtca ataagggttt taaattccgc ttgtatccca ctaaagaaca acaagataag

60 ttgcaacact gcttttttgt ctataatcaa gcttataata ttggcttgaa tgaactgcaa

120 gagcaatatg aaaccaacaa agattcacca cctaaagaaa gaaaatacaa aaaatcaagc

180 gaattagaca atgcgatcaa acaatgcttg agagctaggg acttgccctt tagcgctgtg

240 atagcccaac aagcacgcat gaatgttgaa agggctttaa aagatgcttt taaagttaaa

300 aacagaggct ttcctaaatt caaaaactct aaatccgcta aacaatcttt ttcgtggaac

360 aatcaaggct tctctatcaa agagagcgat gatgagtgct tcaagacatt cactctgatg

420 aaaatgcctt tactcatgcg catgcataga gacttccccc taattttaaa gtga

474

<212>类型:DNA

<211>长度:474

   序列名:SEQ ID 57:GDC_HPYL_1069456

   序列描述:

自定义密码子

序列名:SEQ ID 57:GDC_HPYL_1069456

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgatattca tcacccattt ttccacagag cctttacctt tacccatcct ggtttctaag

60 ggtttagcgg tcaaaggctt atcagggaat actctaatcc acaccttacc cgctctttta

120 atgtgccttg tcatggccac ccttgcggat tcaatttggc gtgaatcaat cctcccatgc

180 tctatggctt taatcgcaat atccccaaac gcaatggagt taccccgatg ggctttccca

240 cgattgcgcc ctttcatttg ctttctgtat tttgttcttt ttggcattaa catgattatt

300 gcctccctct tctgcttctt ctag

324

<212>类型:DNA

<211>长度:324

     序列名:SEQ ID 58:GDC_HPYL_1376803

     序列描述:

自定义密码子

序列名:SEQ ID 58:GDC_HPYL_1376803

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc

60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg

120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt

180 gtgccattac actcaacttg cgatttccaa ccgcaatga

219

<212>类型:DNA

<211>长度:219

     序列名:SEQ ID 59:GDC_HPYL_1474291

     序列描述:

自定义密码子

序列名:SEQ ID 59:GDC_HPYL_1474291

序列

<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695

<400>前序列链:

ttgaacgccg catttaaaga aaggcgcttc attctcgtcc agttagatga aaaaattgat

60 cccaaggaag acaaaagcgc ttatgatttt tgtttgaaca ccttaaaatc accctcccca

120 agcatttttg acatcaccga agaaaggatt aaaagagcgg gggctaaaat caaagaagct

180 tgcgcgcatt tagatgtggg gtttagagcg tttgaaatca ttgatgatga aacgcatgct

240 aatgataaaa atctcagtca agcccatcaa aaggatttgt tcgcttattc taaccttgat

300 agaatggaaa cccaaacgat tttaattaag cttttaggct gcgagggttt ggagctcact

360 acccctataa cttgcttgat tgaaaacgcc ttgtatctgg ctttaaatac ggctttcatt

420 gtgggggata tagaaatgag cgaagtttta gaaaacttga aagataaagg ggtggaaaaa

480 atcagcatgt atatgcccgc tatcagtaac gataatttgt gtttggaatt gggcagtaat

540 ttgttggatt tgaaattaga gagtggcgat ttaaagatta gggggtag

588

<212>类型:DNA

<211>长度:588

     序列名:SEQ ID 60:GDC_HPYL_1600102

     序列描述:

自定义密码子

序列名:SEQ ID 60:GDC_HPYL_1600102

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtatatac gtttttatcg cgattctctt gcagagcccg ccacagacat atacgctttt

60 gcctatgttt cgttcaacaa ggaggccggc acatggcaca cccctgcgca accgacccgg

120 aactatggtt cgggtacccc gatgacgacg gcagcgacgg cgccgctaag gcacgcgcct

180 atgagcggtc ggccacccaa gcgcggatcc aatgcctgcg ccggtgcccg ctcctacagc

240 agcgccggtg tgctcaacac gcggtcgagc atcgggtgga gtacggcgta tgggccggca

300 tcaagcttcc cggcggccag taccgaaagc gcgaacagct cgcggcagcc cacgacgtgc

360 tgcgtcggat tgccggcggc gagatcaatt ccaggcagct cccggacaat gcggctctgc

420 tggcccgcaa cgaaggactc gaggtcaccc cggtgcccgg ggtcgtggtg cacctgccga

480 tcgcacaggt tggcccacaa ccggccgctt gatgcccggt cggcaagccc ggcagttgcc

540 aaacccagcg tgatcaggct cggctcgcga gttcggcgaa gaagtggctc gcctgatcac

600 ctaccatcgg ccaggatctg cgtgtcatca cgacgctcgc caaggaggtt gttgtggtgc

660 tatcgacggc ctttagccag atgttcggaa tcgactatcc gatag

705

<212>类型:DNA

<211>长度:705

     序列名:SEQ ID 61:GDC_MTUB_26830

     序列描述:

自定义密码子

序列名:SEQ ID 61:GDC_MTUB_26830

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgatgttct gtgcgtcgcg gaaagagatg gcgatgtcga attcgtcttc tagctcggtg

60 atcaactgga acagcttgag cgagtcaaaa cccaggtcgt cgacgagtac ctggttcgcg

120 gtgatgccgc ggtcggttcg caagatccgt tggatggtgg cgttgatggc ctctttcata

180 gcgcggctcc ttgcggggtc aggtcctcgg caaggccggc aaacacgtgc aaggcccggt

240 cgaggtcaga ttgtcggtgg tcggctaggt agctggtgcg gaatcccgaa cgctcctccg

300 gcacggctgg gggggccacc gggttcacat acaccccgga gcgcatcagc cgcagatagc

360 ccgcatgcgc cacggtcggg ttgcccagga tcaccggcac gatcgcggtt ccgtgatact

420 cggcctgata gccctgccgt gccaggccgg tggccatgta ctcggccgcg gccagcaccc

480 gagcccgccg gtcgggttca cgccgactga

510

<212>类型:DNA

<211>长度:510

     序列名:SEQ ID 62:GDC_MTUB_36276

     序列描述:

自定义密码子

序列名:SEQ ID 62:GDC_MTUB_36276

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgccgccac cgatcccgcg gtgcgcggcg gccagtactt cggacccgat ggcttcggtg

60 aaatacgggg ctacccgaag gtggtggcct ccagcgccca gtctcacgac gagcagctgc

120 agcgccgcct gtgggctgtg tccgaagagc tcaccggggt cgtctatccc gtcggatgag

180 ccggactcaa cggcaacggt tggtcaacac tcgacgatgt tgactgcgac gttgatggcg

240 agcccgccgg ccgaggtttc cttgtacttg gtgtgcatgt ccgcgccggt ggcgcgcatg

300 gtgtcgatga cctggtcgag ggtgacgcga tggatgccgt cgccgcgcaa tgccatccgt

360 gcggcgttga tggccttgcc ggcggaaatc gcgttgcgtt cgatgcaggg gatctgcacc

420 agcccggcga tggggtcaca ggtcaggccg aggctgtgtt ccatggcgat ctcggcggcg

480 ttttccactt gtcgcggtgt gccgccgagg atttcagcca atccggcggc ggccatggcg

540 gccgcggagc cgacctcgcc ctga

564

<212>类型:DNA

<211>长度:564

     序列名:SEQ ID 63:GDC_MTUB_76032

     序列描述:

自定义密码子

序列名:SEQ ID 63:GDC_MTUB_76032

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

60 gtcgtgagga agacattggg gatcttggcc agcgcggtgg aattcggcac aatgccaacg

120 acccgcaatc tgcgcgcgcc gacctcgaca gtgtcaccga ggtgtcggcc catcgtgctc

180 gatgccgcga cttcgtccgg tttcgacggt gaccgaccct ctgagacccg tggcatgcca

240 ggtccgtgct cgggcgcgcc gaagaccgtg acgtttcgcg tcgacgtgcc ttctttcatg

300 atcgtcccca cgctgcccaa cggggccgcg gccatgacac cgggttcagc ggccactcgg

360 gccaggtcaa catcgggaaa cggtattgaa cccagaaaag gtccagcagc gccggatctg

420 acgacgaata catcgacacc catggaatcg acggtgtgcc gggcctccac ccggaagccg

480 ttcgcgagtc cggtcaaaac aagcgtcatc ccgaagatca gcccggtgct gatgatcgtg

540 atgaccaggc ggcgctttct ccattgcatg tcacgcaggg ccgcgaagag cattcccaga

600 ggctaccaac gtggcgcact tgtggggcct ggtcttgacg ttttgtggtc agggcgcggc

660 ccgctagtgg tcgaagaggc gttcggggtg gtggtagtcg ttggtgtggg caccgcggtc

720 gaggtggggt ggcgggatcc attccgtttg gccgtcggac cgtttccttg tccgccagcc

780 tttcccgact ag

792

<212>类型:DNA

<211>长度:792

     序列名:SEQ ID 64:GDC_MTUB_80423

     序列描述:

自定义密码子

序列名:SEQ ID 64:GDC_MTUB_80423

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtcgcgtg ctatccggac aaagccgaaa tcagcatctt cccggggtag cgcaggctac

60 cgggtatacc tcggccaacg actgggtgtc gctgtattcg cgcagcgaga tgatcatccc

120 gtcacgggtc tcgaagatgc agacgaacgg gctgtcatat cgggtccggt cggcgctcac

180 accgtcgcaa tgcccctcga ccactaccgt ttcaccctcg ttgacgcagc ggatgagttc

240 gatgttgacc tcgaagacct gcttgcgccg ctcgactgct cgccgaaacg tcttcttgtc

300 caattccgta cgggtgacga tgctccagta ggtgaagtcg ttgctgagca gcgcgaagcc

360 ttcgtcgaga tctccgccct cgcagaggct ttgcaggaac atccaggcca gttcggcttg

420 cgggtcgtcg aacggcgtca tcacatcgcc atcttgtctc gggagacagc gtgcggtcaa

480 ttgacgtggt cgtcgaagcg gtggtcacct tcgcgggggc ggccggcttc gcgcacacct

540 tggcgccgtt gcgtcgcggt cagcaggatc catgctttcg ggtccccggt gacggcacta

600 tctggcggac cagcttgctg cccaccgggc cggtcaccgc gcggatcagc cgtgctgggc

660 gcgacgccgc ccgttgcgtg gcgtggggca gcggtgccga ggagtttgtc gacatggcgc

720 ccgccatgct gggcgccgcc gacgacgcca gcgatttcgt gccgctgcat ccggccgtgg

780 ccgccgcgca ccgccggctg ccgaacttgc gcctgggccg caccggccag gtgctggaag

840 ccttga

846

<212>类型:DNA

<211>长度:846

     序列名:SEQ ID 65:GDC_MTUB_167239

     序列描述:

自定义密码子

序列名:SEQ ID 65:GDC_MTUB_167239

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcgaccgg gccaccgcca ggtcgatgga tgccgccgtg gccaaccgtt gtgcggtgct

60 catgaacgcg tcggcctcgt gcgggttgtc ggtgccttcg gcctggcgca gcagggctgc

120 gatgcgggcc agcatcttgt cgttggtcat ggcgccaaaa ctagtggagg gctgcgacag

180 gtcggctcgg cctacaaccg ctcggtgagc caggcgacca catcgtcgag cacctggttg

240 cgctccggct cgttgaacac ctcgtggtac agcccgggat actccttcag ctgcacgtcg

300 gccgatccca cacattcgac caggcgacgg ctgccctcga tggggatcag ccggtcatcg

360 gtgccgtgca gcactagcag cggcgcggtc aatgccggtg ctcgccgcgg catggtctcg

420 cccacctgca gcagcgcgcg gccaatcccg gccggaaccc gtccgtggtg cacgagtggg

480 tcggtgttgt aa

492

<212>类型:DNA

<211>长度:492

     序列名:SEQ ID 66:GDC_MTUB_214625

     序列描述:

自定义密码子

序列名:SEQ ID 66:GDC_MTUB_214625

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgtgtaaag catgtctcgg tcaccatacc catcaccacc gaacatctcg gcccctacga

60 aatcgatgcc agcacgatca accccgacca gcccatcgac acggctttca cccaaaccct

120 cgatttcgcc ggcagcggca ccgtgggcgc gttccccttc ggcttcggct ggcagcagag

180 cccgggattc ttcaactcga ccacaacccc gtcgtcgggc ttcttcaact ccggcgccgg

240 tggcgcatcg ggcttcctca acgacgccgc agccgccgtg tcgggcctgg gaaacgtctt

300 caccgagact tcgggcttct tcaatgctgg cggcgtagga attcgggctt ccaaaacttc

360 ggcaacctgc tgtcgggctg ggcgaaccta ggcaataccg tctccggttt ctacaacacg

420 agcatgctgg acctcgcgac ccaagccctt atctccggct tcggcaacca cggagcccga

480 ctctccggca tcctcaacaa cggtagcgga ccctaa

516

<212>类型:DNA

<211>长度:516

     序列名:SEQ ID 67:GDC_MTUB_424142

     序列描述:

自定义密码子

序列名:SEQ ID 67:GDC_MTUB_424142

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcttagcc tatccgctgg cggcccggaa ccgagaatgc gaccaggtca caacccagtc

60 accttccacg ccgagcagac gaggaatcgc actgcgcgga cctcacgcgt gcgattccgc

120 gtctgctcgt cagacaaatc agcccaggat cagcgagtcg gcgtcggggc tgacgttgac

180 cggcacggta tcgccgtcgt gcacctggcc ggccaacagc atcttggcca gctggtcacc

240 gatggcctgc tgcaccagcc ggcgcaacgg ccgcgccccg tacaccgggt cgaatccgcg

300 ctgcgccaac cagcgcttgg ccggcagcga gacctgcagc tgcagccgcc gctgcgccag

360 ccgcttgccc agctgcgcca gctggatgtc gacgatgcgc accagctctt cggggttgag

420 accctcaaag atgagcacgt cgtcgagccg gttgatgaac tccggcttga acgtagcgcg

480 caccgcggcc agcacctgct cggcgctgcc acccgacccc aggttggacg tcaggatcaa

540 gatggtgttg cggaagtcga ccgtgcggcc gtgcccgtcg gtgagccggc cctcgtcgag

600 gacctgcagc agcacgtcga acacgtccgg gtgcgccttc tcgatctcgt cgaacagcac

660 caccgtgtag ggacgccggc gcaccgcctc ggtcagctga ccgcccgcct cgtatcccac

720 atagccgggc ggggcgccga tcaaccgagc cacggtgtgc ttctcgccgt actcgctcat

780 gtcgatgcgg accatcgccc gctcgtcgtc gaacaggaag tcggccagcg ccttggccag

840 ctcggtcttg ccgacaccgg tcgggccgag gaacatgaac gccccggtgg gccggttggg

900 gtcggacacc ccggcccggc tgcgccgcac cgcatcagag actgcggtaa ccgcggcctt

960 ctgcccgatg acccgcttgc ccagctcgtc ttccatgcgc agcagcttgg cggtctcgcc

1020 ttcc

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 68:GDC_MTUB_459316

     序列描述:

自定义密码子

序列名:SEQ ID 68:GDC_MTUB_459316

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcttgccg atttcgatgt aggacaacac cttttccagc tggtcgttgg aggcctggga

60 acccagcatg gtttcggtgt ccagcgggtc gccctgccgg accgccttgg tccggatcgc

120 cgccagctcc aggaactcgt cgtagatgtc ggcctggatc agactgcgcg acgggcaggt

180 gcacacctcg ccctggttga gggcgaacat ggtgaagcct tccagcgcct tgtcgcagaa

240 gtcgtcgtgg gcggccagca cgtcggcgaa gaagatgttg gggctcttgc cgccgagttc

300 cagggtgacc gggatcaggt tgtgcgaggc gtattgcatg atcagccgcc ccgtggtggt

360 ttccccggtg aacgcgacct tggcgatgcg gtcgctggag gccaacggct tgccggcctc

420 ggcgccgaat ccgttgacca cgttgaccac cccgggcggc aacagatcac cgatcagcga

480 catcaggtag agcaccgaag cgggtgtctg ctcggcgggt ttgagcaccg ccgtgttgcc

540 ggccgccaac gccggcgcca gcttccaggc cgccatcagg atggggaagt tccacggaat

600 gatctggccc accacgccga gcggctcgtg gaagtggtag gccacggtgt cctcgtcgat

660 ctggctcagc gcgccctcct gggcgcgaat cgccgcggcg aagtaccgga agtgatcgac

720 cgccaacggg atatcggcgg ccagcgcttc ccggaccggt ttcccgttgt cccagacctc

780 ggccaccgcc agcgcggcgg cgttcttgtc gatgcggtcg gcaatcatgt tgaggatcgc

840 cgcccgttcg gccggtgcgg tcttgcccca ccccggcgcc gccgcgtgcg cggcgtcgag

900 cgccttgtcg atgtcggccg cgtcggagcg cggcacctcg cagaacggct ggccggtcac

960 cggcgtcggg ttctcgaagt agcgcccatg gaccggcgcg acccactggc ccccgatgaa

1020 gttt

1024

<212>类型:DNA    

<211>长度:1024

     序列名:SEQ ID 69:GDC_MTUB_549643

     序列描述:

自定义密码子

序列名:SEQ ID 69:GDC_MTUB_549643

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgtatcttc cgcccaagct gatcccgagg cggatcccgg cgcaggtgag gccaactatg

60 gtggcccccc aagttcccca cgtcttgtcg atcacaccga atgggcgcag tggggaagtc

120 tgcccagcct ccgggtctac ccgtcccaag ttgggcgtac agcctcccgc cgcctcggga

180 tggccgctgc cgacgcggcc tgggccgagg ttctcgcgct gtcaccggag gccgacactg

240 ccggcatgcg cgcgcagttc atctgccact ggcagtacgc cgaaatcaga caacccggca

300 aacccagctg gaacctcgag ccgtggcggc cggtcgtcga cgactcggag atgttggctt

360 ccggctgcaa tccgggcagc cctgaagagt cgttttagtg ctcggccaac cgactcgggc

420 gcagttggcc gcgctggtag accacaccct gctcaagcct ga

462

<212>类型:DNA

<211>长度:462

     序列名:SEQ ID 70:GDC_MTUB_566823

     序列描述:

自定义密码子

序列名:SEQ ID 70:GDC_MTUB_566823

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgacgtcta cgaacgggcc atcggcgcgg gataccggtt ttgttgaggg ccagcaggcc

60 aagacacaac ttctcaccgt ggccgaagtg gcggccctga tgcgggtgtc caagatgacg

120 gtgtaccggc tggtgcacaa tggcgaactg cccgcggttc gggtcgggcg gtcattccgg

180 gtgcatgcca aggccgtcca cgacatgttg gagacttcgt acttcgacgc gggctag

237

<212>类型:DNA

<211>长度:237

     序列名:SEQ ID 71:GDC_MTUB_591109

     序列描述:

自定义密码子

序列名:SEQ ID 71:GDC_MTUB_591109

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggcggagt ccgtggctat ccgcggctgc ctgctgaggt gcgggccgcg ttcccgaccg

60 cggcggagat cgcgccgcag tggcatctgc gcatgcaggc cgcggtgcag cgccacgtcg

120 aggccgccgt gtccaagacg gtcaacttgc ccgccacggc gacggtcgat gacgtccgcg

180 ccatctatgt ggccgcctgg aaggcaaagg tcaagggcat cacggtgtat cgctacggca

240 gccgggaagg acaggtactg tcctacgccg cgccgaaacc gctactggcg caggctgaca

300 cggagttcag cggcggctgt gcgggccgct cctgcgagtt ctgacggcgg ctcccatggc

360 gcgagcagac gcagaatcgc acaaaatcag cgattttga

399

<212>类型:DNA

<211>长度:399

     序列名:SEQ ID 72:GDC_MTUB_663028

     序列描述:

自定义密码子

序列名:SEQ ID 72:GDC_MTUB_663028

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgctgcaca gcagcttcgg gcacctcgag ggcatccagc agccgctcat agacgagctg

60 gcagaactcg accacgtgtt gggcaagctg ccggacgcct accggatcat cggccgcgcc

120 ggcggcatat acggtgactt cttcaacttc tatctgtgtg acatctcact gaaagtcaac

180 ggattacagc ctggaggtcc ggtacgcacc gtcaagttgt tcggccagcc gaccggcagg

240 tgcacaccgc aatga

255

<212>类型:DNA

<211>长度:255

     序列名:SEQ ID 73:GDC_MTUB_688806

     序列描述:

自定义密码子

序列名:SEQ ID 73:GDC_MTUB_688806

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgctggggg cgctgcacca gtacccgcac actcgcatcc agccgggtgc cgttgcggcg

60 caccgtgatc gccagcaccc gcgcccggtc tttggcgatg aggcgctcga tgcggcgggt

120 gttctcatgc gtacgcacgc agccgatcac cggcaaagtg aggtgtctac ggtcgggctc

180 aacgcgcatc gcacccgtgg tgaacgacac gcgatcggcg tcgcggccct tcttcttgaa

240 tcgagggaag cccattctct tgccgtcgcg cttgccagca cgcctctgct gccagttcca

300 gtacgcgtcg accgcgcccg cgatcccgtc ggcgtaggcc tctttcgagc attccggcca

360 ccacacggtg ccagtctcgg cgttgacaca cacctcgtct ttcaccgtgt tccagcgttt

420 ccgcagtacc cgaagcgacg gcttcgccgt ctgggcgccg gtcgcgcgcc acgcttggat

480 atcggctttc agctgcgcga cggtccagtt gtaggccttg cggcgggcgc cgaaatgccg

540 cgccaacgcg tgtgcctgct cggcggtcgg atcgagtgtg aaccggaacg cttgcacaca

600 ccagccgttg gggatctcca aacgcggcat ctcaggccgc ctcatgatca tcgacagcgg

660 cagccgcgac ggcccgcttg gcccggttct gagcagcacg tttgccatac aaccttgcgc

720 acatcgaggt cagaatctcg gtcatatccc ataccaggtc atcgtcaacc tcggccgagt

780 ccaccacgac caactcccga ccctgagcgg ccagcgcagc gtggacatac tccgaaccga

840 accggcagaa ccgatcccga tgctcaacca caatccgcgt ga

882

<212>类型:DNA

<211>长度:882

     序列名:SEQ ID 74:GDC_MTUB_701762

     序列描述:

自定义密码子

序列名:SEQ ID 74:GDC_MTUB_701762

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atggcttcca gtaccgacgt gcggccgaag atcactttgg catgcgaggt gtgcaagcac

60 cgtaactaca tcaccaaaaa gaaccgccgc aacgacccgg accggctgga gctgaagaag

120 ttctgcccga attgcggcaa acaccaggcg caccgcgaga cgcggtaa

168

<212>类型:DNA

<211>长度:168

     序列名:SEQ ID 75:GDC_MTUB_731710

     序列描述:

自定义密码子

序列名:SEQ ID 75:GDC_MTUB_731710

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttggtatgcg ccgccgcccc cggtcgacga cgacccctcg gcgtaggcgg acaggtcgaa

60 gccggcacag aatccctcgc cgcgaccgga caccagaatg acatgcacgc ctggatccag

120 atcggcacgc tccaccagag cagacaactc cagcggggtg tctgcgatga tcgcgttgcc

180 cttctccggc cggttgaagg tgatccgcgc aatccgaccg gtgacctcat aggtcatcgt

240 cttcaggttg tcgaaatcga ccggcctgat cgcgtgtgtc atcagcggcc gctcagcctt

300 ttaccagcgc acgctcgagg atgggcgcga gatccagacc ggccggcatg gtgccgtacg

360 ctccgcccca ctggccgccg agccgagtgg ccagaaacgc ctcggcgacg gcgggatgtc

420 cgtggcgcac caacaacgat ccctgcaacg ccaggcagat gtcttcggca atcttgcggg

480 ctcgataacc gatcgtgtca agatcgccca gctgcggacg cagcctttcg acgtggccgt

540 ccagcctggg gtcctggcct gcgctgcggg ccagctcgtc aaacagcacc tcgacgcatg

600 cgggccgggt tgccatggcg cgcaaggtat ctagcgcgct ga

642

<212>类型:DNA

<211>长度:642

     序列名:SEQ ID 76:GDC_MTUB_772761

     序列描述:

自定义密码子

序列名:SEQ ID 76:GDC_MTUB_772761

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgggtctcg ttgcgccggc aggtgacggt cgcgcagcga aaaagcgacc tgcgggccgc

60 cgaggatccg atcgacgccg tcgtatgcgc ctacgtggcg ttgtacgccc aacgccggcc

120 cgccgatgtc acgatctatg gggacttcac caccgggtac attgtcacgc cgtcgctgcc

180 caccgacttc agaacggcac cggacgctgg tcgacgggcg cgagcacgtc gatgaggtcg

240 accaccgtcg ccagcgcagc ggcacgcggg tcccgccctt cgaccagcgc cgagaccacc

300 gatccgtcga ccgcacagat caacgtacac accagttcga tctgtgcgga gcggccggag

360 cgctcgatgg cctcggccac ggcctcagcg cgctga

396

<212>类型:DNA

<211>长度:396

     序列名:SEQ ID 77:GDC_MTUB_868821

     序列描述:

自定义密码子

序列名:SEQ ID 77:GDC_MTUB_868821

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg

60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct

120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc

180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc

240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg

300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg

360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag

420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac

480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcatc

540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac

600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt

660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg

720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg

780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac

840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga

897

<212>类型:DNA

<211>长度:897

     序列名:SEQ ID 78:GDC_MTUB_890358

     序列描述:

自定义密码子

序列名:SEQ ID 78:GDC_MTUB_890358

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcggcgcc gagccgctgt tcctgttgga ttacatcgcc gtcggtcgga tcgtgccgga

60 gcgactcagc gcgatcgtcg ccggtatcgc cgatgggtgc atgcgtgccg gctgtgcgct

120 gcttggcggc gagaccgcag aacatccggg cctgatcgag cccgatcact acgatatctc

180 tgccaccggc gtcggcgtcg tcgaggcgga caatgtgctg ggtcccgacc gggtcaaacc

240 cggcgacgtc atcatcgcga tgggctcgtc gggtctgcat tccaatgggt actcgctggt

300 ccgcaaggtg ttgctggaga tcgaccggat gaatctggcc ggtcatgtgg aggagttcgg

360 tcgcaccttg ggcgaagagt tattggagcc gactcgcatc tacgccaaag actgtttggc

420 cttggccgcc gaaacccgtg tccggacgtt ttgccacgtc accggcggcg ggctcgccgg

480 caacctgcaa cgggtcatcc cgcatggcct catcgccgag gtcgaccgcg gcacctggac

540 acccgcgccg gtattcacca tgattgccca gcgcggccgg gtcaggcgca cagagatgga

600 gaagacgttc aacatgggtg tcggcatgat cgccgtcgtt gcccccgaag acacgacgcg

660 cgccctggcc gtcctgaccg cgcggcacct ggactgctgg gtattgggaa ccgtctgcaa

720 aggcggaaaa caaggcccgc gggcaaaact ggttgggcag cacccgagat tctaagaacc

780 agacctaacc gggtctaa

798

<212>类型:DNA

<211>长度:798

     序列名:SEQ ID 79:GDC_MTUB_904043

     序列描述:

自定义密码子

序列名:SEQ ID 79:GDC_MTUB_904043

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggtagcgg tccggattga agtcgtcggc catcgagtcc accacctggc cggccatctt

60 gagttccgcg ggtttgatct ccaccttctg gtccagcacc gggaagtcgg ggtcgcggat

120 ctcatcgggc cacagcaacg tgtgcaccat catcacctct cgcttgccga aatccttgac

180 gcgcaacgcc gccagcctgg tcttgttgcg cagcgtgaaa tgcacgatcg ccatccggtc

240 ggtctcggcg agtgtcttag ccagcagcac atacgatttc gacgacttcg aatcaggctc

300 caaaaagtag ctgcggtcga acatcatcgg gtccacgtcg gcggcgggga cgaactccaa

360 cacctcgatc tcccggctgc gttcttcagg caagctggcg atgtcgtcgt cggtgatcgc

420 caccatttgg ccgtcgccgg actcgtaggc ccgggcaaga tcgcggtagt cgaccacctc

480 gccacacgcc tcgcagacgc gcttgtaccg gatgcgtccg ttgtccttgg cgtgcacctg

540 gtggaacctg atgtcgtggt ctgcggtagc gctgtacacc ttgaccggca cgttcaccag

600 cccgaaggcg atcgaacccg tccaaatggc tcgcatgtaa gtgagtatgc cttgattgtc

660 cgcgagcgga acgtcacggc gaaattccac gcgatatttg accgtgacgt tacgctcgcg

720 acttgtgtga ccgacaggct acgttga

747

<212>类型:DNA

<211>长度:747

     序列名:SEQ ID 80:GDC_MTUB_1045383

     序列描述:

自定义密码子

序列名:SEQ ID 80:GDC_MTUB_1045383

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcgctcgg cgagggtgaa tccgccggcg cgcagtgcgg caagcacgcc atggtaccca

60 agcggatcgg tgaccaccgc cgcgctggga tggtttttgg cggcggcccg caccatcgcc

120 ggcccgccga tatcaatctg ctcgacgcag tcgtcgacac tggcgccgga ttcgacggtc

180 tggctgaacg gatacaagtt gactacaacg agttcgaaag cctcgatccc gagttgctcg

240 agggccgcgg cgtgctcgga cttgcgcagg tcagccagca gcccggcatg cactcgtggg

300 tgcagtgtct tgacccggcc atcgagcacc tcgggaaagc cggtcagctg ctccacgggg

360 gtcaccggaa tcccggtgtc ggcaatggtc ttggccgttg acccagtcga gatgatctcg

420 acgccggccg cgctcaggcc ctgtgccagg tctaccagcc cggtcttgtc gtacacgctg

480 atcagcgcac ggcggatcgg ccgtcttccg tcgtcggtgc tcatcctatg gttacctttc

540 gtcccatcgt cgctgttcgt ccgaccaccg tcacgccatg ggtggccagt gcggccaccg

600 ccgctaccaa cagccgtcgt tcggtga

627

<212>类型:DNA

<211>长度:627

     序列名:SEQ ID 81:GDC_MTUB_1068100

     序列描述:

自定义密码子

序列名:SEQ ID 81:GDC_MTUB_1068100

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcgcgctg acccgccgac gaccgcctgc aacacgcgat gcacgcccag cgtctgtgtc

60 ccgtcgatgt gcggtacatc gaccacctcg atgccgcccc gcagctgcgt cccggaaaaa

120 gtcaccttgc tgcagtcttt cccggggctg ggggccggca gcggctggga cgtctccacc

180 gcgatgacga cgaaccggtt gccgttgccc tcggcggaga cggcggccat gttgccctgc

240 aacccggtcg gcagctgggg cccggccgcc acttgcgcac agttcgccgg atcgaaactc

300 agcccgtcgg gcagtttgcg ggcggaaaag aacccgggat cgatggccct gggagtgaca

360 tcggtgacgg tgtattcagg tccaaagccc gacttcactt cggccacctt ggcgatgtcg

420 ccggtcgagg cggtggtgga gctggcccct gatgagcagc cgacaagcca gcacaccgat

480 ccgactgcca gtaccgcctt gcgcatcgtg gtcaatctac ccaacgcagc ccctgagctg

540 cgcaacgtcg acaccgtttt gactagcaga tcagcggcga actgcggtgc cagcggcgga

600 cgcaccgacc cggggtcggt gatcagccga cggcctcgat cacttgccgg gctacccggt

660 tga

663

<212>类型:DNA

<211>长度:663

     序列名:SEQ ID 82:GDC_MTUB_1115707

     序列描述:

自定义密码子

序列名:SEQ ID 82:GDC_MTUB_1115707

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgggtactg cgcaagagcg agtccgaagc cgatcaggcc cggttccgca ccacgctcta

60 cgtcacctgc gaggtagtcc gcatcgcggc actgctgatc cagccggtga tgccggagtc

120 ggccggcaaa attttggacc tgctcggcca ggccccaaac cagcggtcgt tcgccgccgt

180 aggtgttcgg ctgacccccg gcacagcgct gccgccgccc accggggtat ttccccgcta

240 ccagccgccg caaccacccg aaggcaagtg agcggaccgc agcgacggga aagccaccta

300 cgaagcgttg accgcggtct gcgcgtcgcg tgggatgtcg agcgtggcga cgggataaaa

360 cccggaatcg tcgcggccgt cgcgggacaa cagcatgggc ggatagttca ccacatggga

420 gccgttcggt ttgtgctgtt gccagtcgat cgcggcccgc agcgtgtagt ggcccgcggg

480 caagccggac agatcaacgc gaaccgtctc ggcgaccgac gccggtgtcg gctggtcgct

540 gctgcgatcg ccgcgctggt cggagaccag cgtcttcagg tccaccgctg ccggcagcgt

600 ccgaaccacc tgtccggtgg aatccaccag ccggtagccg ggcacccact tttcggtggc

660 ggcagcagcg ccgtagttgg tccaggtgac cgagatcgtc gcgaccttgc ccgctag

717

<212>类型:DNA

<211>长度:717

     序列名:SEQ ID 83:GDC_MTUB_1124996

     序列描述:

自定义密码子

序列名:SEQ ID 83:GDC_MTUB_1124996

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtcgatct ccggaatcga gcgctggtcg gctaccgaga acatccgcat ctcggtgatc

60 tcgtcgcccc agaactcgac ccgcaccgga tgttcggccg tcggggcaaa gatgtccaga

120 atcccgccgc gcacagcgaa ctcgccgcgc cggccgacca tatccacccg ggtatatgcc

180 agctcgacca gccgcgccac cacgccgtcg aagggggatt cgtcgccaac ggtcagcgtg

240 aggggctcca tcatgcccag ctgcggcgtc atgggctgca gcagcgagcg caccgaggtc

300 accactaccc ccagcggtgg gcccagctgg gcatcgtcgg ggtgggccag ccggcgcagc

360 gccatcaggc gagtgccgac ggtgtcaaca ccgggtgaga gccgttcgtg cggcagtgtc

420 tcccaggacg gcaacaacgc caccgcatcc ccgaacacac cacgcagttc ggcggccagg

480 tcgtcggctt cccgcccggt ggcggtgacc accagcaatg gcccctgccg agccagcgca

540 ctggcgacca acagccgcgc gctggccggc gcgatgagcg tcaattcgtc gggtcgaccc

600 ccggcgcgct gcatgagctg ttggaatgtc ggcgcgctca gcgccaattc gacgagcccc

660 gcgatcgggg tatctgagca ggcaggcccc ggtgcggtca tgatgcggcc attctag

717

<212>类型:DNA

<211>长度:717

     序列名:SEQ ID 84:GDC_MTUB_1138949

     序列描述:

自定义密码子

序列名:SEQ ID 84:GDC_MTUB_1138949

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgctggcgt tctaccttcg gccaaggcca gggacgtggt gtacgagtga aggttcctcg

60 cgtgatcctt cgggtggcag tctaggtggt cagtgctggg gtgttggtgg tttgctgctt

120 ggcgggttct tcggtgctgg tcagtgctgc tcgggctcgg gtgaggacct cgaggcccag

180 gtagcgccgt ccttcgatcc attcgtcgtg ttgttcggcg aggacggctc cgacgaggcg

240 gatgatcgag gcgcggtcgg ggaagatgcc cacgacgtcg gttcggcgtc gtacctctcg

300 gttgaggcgt tcctgggggt tgttggacca gatttggcgc cagatctgct tggggaaggc

360 ggtgaacgcc agcaggtcgg tgcgggcggt gtcgaggtgc tcggccaccg cggggagttt

420 gtcggtcaga gcgtcgagta cccgatcata ttgggcaaca actga

465

<212>类型:DNA

<211>长度:465

     序列名:SEQ ID 85:GDC_MTUB_1170285

     序列描述:

自定义密码子

序列名:SEQ ID 85:GDC_MTUB_1170285

序列

<213>生物名:结核分枝(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgacgaccg ctggcataag cgggtcaaag ggccggacgg gaacaggcga accgtgcggt

60 ctgctgtctg cggcagggtt tcgcgctggc gcgtcaggtg ggttgacggc ggcggagagg

120 agcacagcaa gagcttccag cgcaaacctg acgcgcaggt acctgaccca tgccgaactg

180 ttgatgctcg ccagggccac gggccggttc gaaacgctca ccttggtgct cggctactgc

240 ggcttacggc ggtttacggt tcggtga

267

<212>类型:DNA

<211>长度:267

     序列名:SEQ ID 86:GDC_MTUB_1176592

     序列描述:

自定义密码子

序列名:SEQ ID 86:GDC_MTUB_1176592

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgggtcagt gcccacgacc tgtgcggcac tggccgcctg ccgtaattgt ttgtagccga

60 actaaattgc ggcgcgcctg cctgcgcgac taccgccgtc ccgccccctc cgacaagaag

120 cccaacaagt cgtaccgggt aatgacccca accggcttgc cttcctccac caccatcaac

180 gcatcccaat cacgcaacgc cttgccggcc gcactgacca attcaccggc gcctatcatc

240 cgcagcggcg ggctcatgtg tgccgacacg gcgtcggcca acttggcgcg gccctcgaac

300 acggccgaga gcagctcgcg ttccgagacg ctaccggcga cctcgccggc catcaccggc

360 ggctcggcgc cgaccaccgg catctgcgac accccgtact cgcgaagaat cccgatggcg

420 tcgcgcacgg tctccgacgg atgggtgtgc accagggcgg gcagcgcgcc ggacttgcgg

480 cgcaacacat caccgacggt ggattgctcg gtcgacccgt caaggcggct gcgcaggaac

540 ccatag

546

<212>类型:DNA

<211>长度:546

     序列名:SEQ ID 87:GDC_MTUB_1202653

     序列描述:

自定义密码子

序列名:SEQ ID 87:GDC_MTUB_1202653

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttggcggcga tcccgagaag gtcacgctgt tcggtgaatc cgcgcgggaa tcgtcacgac

60 cctgctcgcc accccggcgg ccgcgggtct gttcgcggcg gcgatcgccc agagctcacc

120 ggcgacatcg gtctacgacc aggtgagggc tcggcgcgtc gcggtttgcg tcctcgacaa

180 gctgggaatc gacccgtccg atgtgcacag gttcatgaag tgccgaccgc ggcaatcctt

240 tccgcgtcca gcgaagtgtt caacgaagtg ccggttcgta accccggcac gctggcgttc

300 gtcccgatcg tcgacggcga tctgctgccc gactacccgg tcaagctggc gcaggagggc

360 cgctcacacc cggttccctt gatcatcggc accaacaagc acgagtcggc gctctttcgg

420 ttgatgcgct cgccgctgat gccgatcacc ccgcgcgatc acgtcgatgt tcacccagat

480 tgccgccgaa cagcccgatc tgcaagtgcc aaccgaggag cagatcggct ccgcgtactc

540 gcgatggcgg cgcaaagcac gctcattgag tatggctacc gacgtcggct tccggatgcc

600 gtcggtgtgg ctcgctga

618

<212>类型:DNA

<211>长度:618

     序列名:SEQ ID 88:GDC_MTUB_1231843

     序列描述:

自定义密码子

序列名:SEQ ID 88:GDC_MTUB_1231843

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgctggcct tgaggcccca gcgtcatttc acccagagcc ggagcgcccg gcggctacgc

60 tgtgtgctcg acgatgacgt atgggtgccc tgggcacggt cagggggttg caggacagca

120 acacggcatt tgtcggtgcg ctgcatagcg ggaacctgtt gggggccacc ggtgcggttc

180 tgcaggctcc gggcaacgcc gtcaacggtt tcttgttcgg ccagacgtcg atatcgcagt

240 cgattgacgt gtcaccggag tacggatacg agttggtcgc tgtcagcgac ccggttggcg

300 gaactgctgg ctccgctcga gccggtcacg gttacgttca cgccgacctt cggtgaaccg

360 gacatggtcc atctgagtgg cacgaagttc gggggccttg tcccggccct cttcgaaggg

420 gtgcgcgccg gcttctaa

438

<212>类型:DNA

<211>长度:438

     序列名:SEQ ID 89:GDC_MTUB_1241031

     序列描述:

自定义密码子

序列名:SEQ ID 89:GDC_MTUB_1241031

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgaccagct cagcaccgaa gcccgcggcg tcgcgcgcat cggactggcc aactacttcg

60 ccggcgcctt cctgctcccc taccgcgaat tccaccgtgc cgcagagcag ttacgctatg

120 acatcgacct gctgggccgc cggttcggag tgggcttcga aaccgtctgc caccggctct

180 ccacactgca gcgcccgcgg cagcgaggga taccgttcat cttcgtccgc accgacaagg

240 ccggaaacat ctcaaagcga cagtccgcga cggcgtttca cttcagccgg gtcggcggca

300 gctgcccgct gtgggtggtc cacgacgcgt tcgcccagcc agagaggatc gtccgccagg

360 tggcgcaaat gcccgacggc aggtcgtact tctgggtggc caagaccacc gctgccgacg

420 ggctcgggta tctgggcccg cacaagaact tcgcggtcgg gctgggctgc gacctcgcgc

480 acgcccataa actcgtctac tccaccggtg tcgtcctgga cgacccgagc acggaggtcc

540 cgatcggggc gggctgcaag atctgcaacc gaacgtcgtg cgcccaacgt gcgttcccct

600 atctcggtgg tcgcgtcgcg gtcgacgaga acgcgggcag cagcttgcct tattcgtcga

660 ccgagcaatc ggtttgaccg cccgacgcca cagcagacaa cgaaacccct tatattactg

720 tggtttcagc aggctctggg caagcattgt tgtcggtgcc tgcacatagc attcagtcat

780 gtgttccact cgggaggaga tcacggaggc cttcgcgtca ttggctaccg cgctgtcccg

840 cgtgctgggg ctgacctttg a

861

<212>类型:DNA

<211>长度:861

     序列名:SEQ ID 90:GDC_MTUB_1252888

     序列描述:

自定义密码子

序列名:SEQ ID 90:GDC_MTUB_1252888

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcagcttg gcaatcaaaa cactatgaga ttcgcagggc ggcctcagcg ttttcgccaa

60 agcgcttacc ccctgttcaa ccccaacagc gcgatcgcgc ttggccaccc attcggcggc

120 tcgggggcac ggttgatgac tacagtgcta caccacatgc cggacaaggg aattcgctac

180 ggcttacaga cgatgtgcga gggccgcggc caagccaatg ccaccattgt ggagttgctg

240 tga

243

<212>类型:DNA

<211>长度:243

     序列名:SEQ ID 91:GDC_MTUB_1264312

     序列描述:

自定义密码子

序列名:SEQ ID 91:GDC_MTUB_1264312

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgacggtat accgtcgagg tatggctgtg ttaacggatg agcaggtcga cgccgcactg

60 cacgacctca acggctggca gcgcgccggt ggtgtcctgc gtaggtcaat caagtttccg

120 acgtttatgg ccggtatcga cgccgtacgc cgggtggccg agcgagccga ggaggtaaat

180 catcatccgg acatcgatat ccgttggcga acagtaactt tcgcgctggt tacgcatgcg

240 gtaggtggta tcacggaaaa cgacattgcg atggcgcacg atatcgacgc aatgtttggg

300 gcctaa

306

<212>类型:DNA

<211>长度:306

     序列名:SEQ ID 92:GDC_MTUB_1286282

     序列描述:

自定义密码子

序列名:SEQ ID 92:GDC_MTUB_1286282

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgggtgcag tacggcttca acctcaccgc atgggcggtg ggatggctgc cctacatcgg

60 catactggca ccgcagatca acttcttcta ttacctcggc gagcccatcg tgcaggcagt

120 cctgttcaat gcgatcgact tcgtggacgg gacagtcact ttcagccagg cactaaccaa

180 tatcgaaacg gccaccgcgg catcgatcaa ccaattcatc aacaccgaga tcaactggat

240 acgcggcttc ctgccgccgt tgccgccaat cagcccgccg ggattcccgt ctttgcccta

300 acttcggact ag

312

<212>类型:DNA

<211>长度:312

     序列名:SEQ ID 93:GDC_MTUB_1301742

     序列描述:

自定义密码子

序列名:SEQ ID 93:GDC_MTUB_1301742

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgccttcgc cggtgagcag cggaccgacc agccatggca caaacaaggg gtgcgggttg

60 atcaggtctg agtcgatgaa caccacgatg tcgccgctgg tggccgccag tgaacgccac

120 aatgcctcac ctttgccggg ccgtaccggc acctcgggca acgcctgttc acggctgaca

180 acccgggcgc cggaggcgat ggcccggatc tcggtgtcgt cggtggaacc ggagtccagc

240 acgatcaatt catcgaccag gccatcgacc agcggagaga tgctgtcgat caccgattcg

300 atggtcgctt cctcgttgag ggccggcagc accaccgaaa tcgtccgtcc ggcctttgcc

360 gcttccaact ccccgatcgt ccagccggga cggtgccaag tagtgtccaa gggcagcgcg

420 ccaggggccc tgccaccggc gagatcgccg gcgaccagct ccgatgctgt catgcgagtc

480 ctctcaccgt gcgcgtcggc ggccggaccc cctgaatcga tgccaccatt tccagcaccc

540 gccgggtggc ggcgacctca tgcacccgaa acatgcgcgc cccggcggcc gcagccaacg

600 cggtggctgc cagcgttccc tcaagccgtt cggtcaaatc cacgcccaga gtctccccga

660 caacgtcctt gttgctcaaa gccatcagca cgggccaccc ggtcataa

708

<212>类型:DNA

<211>长度:708

     序列名:SEQ ID 94:GDC_MTUB_1351907

     序列描述:

自定义密码子

序列名:SEQ ID 94:GDC_MTUB_1351907

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgctttcag cggttatcct gaccgaacgt ggctatccag cggtgcccct ggcgggacaa

60 ctggtgcacc agaggttcgt ccgtcccggt cctctcgtac tagggacagg tttcctcaag

120 tttctgacgc gcgcggcgga tagagaccga actgtctcac gacgttctaa acccagctcg

180 cgtgccgctt taatgggcga acagcccaac ccttgggacc tgctccagcc ccaggatgcg

240 acgagccgac atcgaggtgc caaaccatc ccgtcgatatg gactcttggg gaagatcagc

300 ctgttatccc cggggtacct tttatccgtt gagcgacacc ccttccactc gggggtgccg

360 gatcactaa

369

<212>类型:DNA

<211>长度:369

     序列名:SEQ ID 95:GDC_MTUB_1476279

     序列描述:

自定义密码子

序列名:SEQ ID 95:GDC_MTUB_1476279

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttggtgggac gcagccgcgt actcgtcctg ttcggagcgg gtgaacatgt cgacgtcgtt

60 gcgttgctcg gtgagcgcgc ccatcggctg atcggtgaac acgtcgtgca gaccgtcgta

120 ggccatgtgg tccaaaaccg taacgtcgcc gtacttgtaa cccgaccggc tattcatcaa

180 caggtggggc gccttcgtca tcgactcctg accgccggcc accaccacgt cgaactctct

240 ggcccgaatg agttgatcag ccagcgcgat tgcgtcgatg ccggacaggc acatcttgtt

300 gatcgtcagc gcagggacat cccaaccgat gccggccgcc actgccgcct gccgtgcggg

360 catttgcccg gcacccgcgg tcaacacctg gcccatgatc acgtactcga ccaaggacgc

420 cggcacgttg gccttctcca gggcgccctt aatggcgatg gcacccagct cgctggcgct

480 gaaatccttc agggagccca tcaacttgcc gatgggtgta cgcgcgccag caacaatcac

540 cgatgtcgtt atgactacct cctcagcgca cccgaaagcc gatctgaccg acccggagaa

600 gcagattctt tcccttcagg ttaccgttgt gtgatgacga ccgatcaagt ccacgcccgt

660 cacatgctgg ctacctcgtt ggtaactgga ctcgatcacg tcggtattgc ggtcgccgac

720 ctggacgttg ccatcgagtg gtatcacgac caccttggca tgatcctggt ccacgaggaa

780 atcaacgacg atcagggcat ccgcgaggca ctgctggcgg tgccgggctc cgcggcgcaa

840 atccagttga tggccccgct cgacgaatcc tcggtgatag cgaagttcct ggacaagcgc

900 gggccaggca tccaacagct ggcgtgccgg gtcagcgatc ttgacgccat gtgtcggcgg

960 ctgcgctccc agggcgtccg gctggtctac gagacggcca ggcgtggcac cgcgaactca

1020 cgga

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 96:GDC_MTUB_1485311

     序列描述:

自定义密码子

序列名:SEQ ID 96:GDC_MTUB_1485311

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcgcgcgg caacaaagtc gccatcctcg agctgctggc gcgcctgtgc caccgctgga

60 tcgacttcgg tggactcctc ggaactcgct gcgcccttga gctttccggc tgtcgcagac

120 aacagggaat ccacccagcg actcagttgg tccgcgggct ggaggccctg gaagctcgag

180 atcggctgtc ccgcagccaa ggccaccacg gtcggaaccg cttggacgcc gaatatctgt

240 gccaccctgg gtgcgacgtc aacgttaacc gacgccagcg accacttgcc cttagcggca

300 gcggccaagc cggacagcgt gtcaagcaag tcgacgcata cctcgctgcg gggtgaccac

360 agcaacacca ccaccggcac ttcgtcggac cggacgatca cctcgtcctc gaagttcgcc

420 tcggtgatct cggtcacacc ggacggcgtc gacagtgccc ggtcggcatc cgtgctcgcc

480 gcagcgtttt gctgggcacg ttgtttgatg ccggagaggt caacagcacc ggccatggcc

540 ggcccgagcg ggggtcgcgg acgcgtcacg ccgtcaagtc tgtcatgccg ctgcggtcat

600 cgatccaccc ggtggcgccg accctgcggc aggagccgac ataccgcgat cggttggtat

660 gaccaagatc acactggccg ccaccgaccc ctcaaccgct atccggcccg caatatcagt

720 gcgtcgccct gcccgccagc cccgcacaat gcggcaaccc cgacgcccga tccccggcgt

780 gccaactgca gcgccgcatg tagcgtgatt cgcgtccctg acatgccgag gggatgcccg

840 acggcaatcg caccaccgtt gacgttgacg atctgggggt tcagcccgag ttcgcgtatc

900 gaggccaatg ccaccgcagc gaacgcctcg ttgatctcca ccacgtcgag ctggtccacc

960 gagatgccct cgcgatccag cgccttgttg atcgcgttgg ccggctgcga ttgcagtgtg

1020 gaat

1024

<212>类型:DNA

<211>长度:1024

    序列名:SEQ ID 97:GDC_MTUB_1486309

    序列描述:

自定义密码子

序列名:SEQ ID 97:GDC_MTUB_1486309

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcggtcac ggcgtctagc acccacccgg ccacggtcgc ggcggacagc cagcccagcc

60 acagccacgc gcgctgcggc gcctccccga acaacgccgc catcagcggc accagcaaca

120 cggtgcccac cgctcgcgcg acaacggaac aaaacgcgag cagcgcaaag ccgattagcc

180 tggcgcggtg gtcgttcgga acaagggcta tccaggtgcg gatcatcggg tgccgtcctg

240 cgctgcggcg accgccaccc ggctgccctg gccggtgtcc cacagccggc agtagcgtcc

300 gcccgcggca agcaactcct cgtgggtgcc gcgttcgacg atccgaccat gatcgagcac

360 gacgatctgg tcggcccggg tgatggtatg cagtcgatgg gcgattacca gcacggtgcg

420 gtcccgggtc agccggttaa gcgcctgttg cacaaggtat tccgattccg gatcggcaaa

480 cgcggtggcc tcgtcgagga tgaggaccgg agtgtcgccg aggatggcac gggcaatggt

540 gagccgctgt cgctccccgc ccgaaagacc actgttggct ccgagcacgg tatcgtagcc

600 gtccggcagc cgaagcaccc ggtcgtggatt tgcgcttcg cgggccgcga cctggacctg

660 ttcggcgggg gcatccggta ccgccagcgc gatgttttcg gcggcggtgc catgcacaag

720 ctgggcttcc tgtag

735

<212>类型:DNA

<211>长度:735

     序列名:SEQ ID 98:GDC_MTUB_1515112

     序列描述:

自定义密码子

序列名:SEQ ID 98:GDC_MTUB_1515112

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgagcgcgg tattggcttt gtctgctgcg gtatcggcac gccgcgcaaa ggctgcggag

60 gcccacagcg cccccagcag caacggcacg ccggccagtg cagccacgcc gagctgccag

120 gagatcggca acagggccag cgcgatcact gccggcagca ggatcgcgct ggtcaacggt

180 gtcaccagat taaccaccag gccaacaagt tccggcccgg tggccgcgat cgcctgccgt

240 gccgtcgcgg tgttttcggc ggtaaaccaa tccaaccgga caaccggaag ccggtccgcc

300 acatcatgtt gggtgtggtt aaggacggcg aaacccagct cgataccgat gcgtgcggtc

360 acggcgtcta gcacccaccc ggccacggtc gcggcggaca gccagcccag ccacagccac

420 gcgcgctgcg gcgcctcccc gaacaacgcc gccatcagcg gcaccagcaa cacggtgccc

480 accgctcgcg cgacaacgga acaaaacgcg agcagcgcaa agccgattag cctggcgcgg

540 tggtcgttcg gaacaagggc tatccaggtg cggatcatcg ggtgccgtcc tgcgctgcgg

600 cgaccgccac ccggctgccc tggccggtgt cccacagccg gcagtagcgt ccgcccgcgg

660 caagcaactc ctcgtgggtg ccgcgttcga cgatccgacc atgatcgagc acgacgatct

720 ggtcggcccg ggtga

735

<212>类型:DNA

<211>长度:735

     序列名:SEQ ID 99:GDC_MTUB_1515464

     序列描述:

自定义密码子

序列名:SEQ ID 99:GDC_MTUB_1515464

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgccatcgg tcattcgcga cccagatccc ggtgcagcgc ccgcaccgac agttgctgat

60 cggagcgcag aagtcccatc agtgcttcag cgatcgcgac gctgcgatgc ttaccaccgg

120 tacagccgat ggcgattgtc atatagcgct tcccctctcg gcggtagccg tcgacaacca

180 gggatagcaa ccgatggtag gactcgagga actcagccgc gcccggccgg tgcagcacat

240 agtcgcgcac ggccggatgt tggccggtca gtggccgcaa ctcgtccacc cagtgcgggt

300 tcggcaggaa ccgcacgtcc atga

324

<212>类型:DNA

<211>长度:324

     序列名:SEQ ID 100:GDC_MTUB_1596569

     序列描述:

自定义密码子

序列名:SEQ ID 100:GDC_MTUB_1596569

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgctacggc ccatacgggc gggccaacct ggccgacatc tggcgccgcc gcgacctgcc

60 acgcgacgcc aaggcaccgg tgctggtaca ggtgcccggc ggcgcctggg tactggggtg

120 gcgccgcccg caggcgtatc cgttgatgag ccatctggct gcgcgcggct gggtatgcgt

180 gtcgctgaac taccgggtgt cgccgcgcca cacctggccc gaccacattg tcgacgtgaa

240 gcgcgcgctg gcgtgggtca aggaaaacat cgccgcctac ggcggggatc cgaatttcgt

300 tgccatcagc ggcggttcgg ccggcggcca tctgtgcgcc ctggcggcgt tgacccccaa

360 cgatccgcga tttcagcccg ggttcgaaca ggtcgacacc tcggtggcgg cagcggttcc

420 ggtatacggg cgttacgact ggtttacgac cgatgcgccg gggcgtcggg aattcgtcgg

480 gttgctcgaa acgttcgtgg tgaaacggaa attcagcacg caccgcgaca tcttcgtcga

540 tgcctcaccg atccaccatg tgcgggccga cgccccaccg ttcttcgttc tgcacggccg

600 ccacgactcc ctgatccccg tggccgaagc ccatgcgttc gtcgaggaac tgcgggcggt

660 gtcgaagtcg cccgtcgcct acgcggacct gccccacgcc caacacgcct tcgacgtctt

720 cggctccccg cgggcgcatc acaccgccga ggccgtggcc cgcttcctgt cttgggtgta

780 cgcgaccaac ccgccggcca cgtagtcagc tataggccag ctattgctat tccgcggcac

840 gctccagctc ggccagtgcc ggttcgatgg catcggccat ctcgtcgatg tcgttggcca

900 cctcgggtgt ggtcaccagg ccgaaatcca gataatcctg gtaggagaag  caggtga

957

<212>类型:DNA

<211>长度:957

     序列名:SEQ ID 101:GDC_MTUB_1600905

     序列描述:

自定义密码子

序列名:SEQ ID 101:GDC_MTUB_1600905

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgacggcca gcaggcgctc ggaccacacg gacgcgacgc gtcgagccct cgtcgacgct

60 ggccgttacc tattcgcgcg gcgcgactat ggtgacgtct cgatcgaaga catcgtcacc

120 cgtgcccgag tcacccgtgg cgccctggac taccacttcg acagcaagaa agatctgttc

180 cagacggtac tcgaggttgt cgaagccgac ctggtcgccg acgtcgaagc cgccatagcg

240 aaggtcaccg acgcctggat ctgctggtcg tcggcttcca cgccttcctt gacgcggcga

300 ccaaaccgga tgcgctgcag gtcattgcga ttgacggccc gtcagtgctc gggtggggcg

360 aatggcgccg gatcgacatg cgctagggct tggtctgctg gtcggggctc tcgaacgcgg

420 gatggccgcc ggggtgattc agcgcgtacc gttgccacca ctttcgcatc tgctgctggc

480 cgcgctaacc gaatccgcgc tgcagatcgc ggacgcgacg gacaaagacc ggaccagagt

540 cgaggtcgaa cgcgcattta tggccctact cgaaggtcta cgggtgtagc acgcccgcga

600 tccgctacgg caacggacca ccggccgcaa tcgcggccag cgtcgcgaaa tgctccccgt

660 ccagcgacgc cccgccgacc aggccaccat cgacgtcatc ctgggccacg atgtcgccga

720 cgtttttggc gttcaccgag ccgccgtaga gcacccgcac cgtatcggca atcctcggcg

780 aggccaacga ggccaactct tttcggatcg ccgcacacac ctcctgggcg tcggcggcgc

840 tggccacccg cccggtgccg atcgcccaga ccggttcgta ggcgatga

888

<212>类型:DNA

<211>长度:888

     序列名:SEQ ID 102:GDC_MTUB_1616064

     序列描述:

自定义密码子

序列名:SEQ ID 102:GDC_MTUB_1616064

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcggttac gctcggaaag cgcgggcctc gcccacgcgg cggatgatgt cagcggggtg

60 gtcctcggcg acgacccgga ccacgatcca cccgtagcgg tgctggactt tctcgtgccg

120 gaggatgtct ttccggtagt ggtagcgact ggtcagatgg tggtcgccgt catactcggc

180 cgcgaccttg atgtcttgcc agcccatatc caaatgggct tccgcccagc cccattcgtt

240 gcgcaccgcg atctgcgtct gggggcgcgg aaagccggcg cggatcaaca acaagcgcag

300 ccaggtttcc ttgggggact gggcaccgcc gtcgacgagg tccagagcgg ctcttgcggc

360 cttcatgcca cggcggcccc gatagcgctc gatcagcggc tcgacgtcgg ccaccttcaa

420 atcggtggcc tgtatcaggg cgtcgacggc cgcgacggcg gggtccaatg gaaatcgact

480 ggtcaggtcg agcgccgttc gctccggtgt ggtcacgcgc atgccctcga tgacgcagat

540 ctcgtcgggc tcgatgcgct cttcccagac ttgcagcccc ggggcacggc ggcggttggt

600 gtcgatgatc gcggcgggaa gatccgcgtc gatccacttg gcgccatgga aggcagaagc

660 cgagtagccg gccagcacgc cgcggcggcg cgagcgcagc cacagcgctt ttgcacgcaa

720 ttgcgcggtc agttccacac cctgcggcac gtacacgtct ttatgtag

768

<212>类型:DNA

<211>长度:768

     序列名:SEQ ID 103:GDC_MTUB_1672449

     序列描述:

自定义密码子

序列名:SEQ ID 103:GDC_MTUB_1672449

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgggtgtgc gcgccgccgt  cggcgtagat gatgtcaccc gtggtcgccg gcagccagtc

60 agacagcagc gcgcacaccg tcttggcgac cggcgtcgca tccttcatgt tccagccgat

120 cggagcgcgc tgatcccagc cctcctcgag cagctggatc tgggcgccgg cctcctcgcc

180 gagcgcaccg ccgacgatcg cactcatcgc cagcgtccgg atagggcctg cggcaacgag

240 attcgaacgc acaccgtact tgccggcctc gcgcgccacg aacctgttga ccgactccaa

300 cgcgctcttg gcgaccgtca tccagttgta ggccggcatc gcccggctcg ggtcgaagtc

360 catgccgacg atggaacctc cggggttcat gatcggcagc agcgccttgg ccatcgaagc

420 atacgaatac gccgagatgt ggatgccctt ggacacatcc gcgtagggcg cgtcgaagaa

480 cgggttgatg cccatcccgg tctgcggcat gaacccaatc gaatgcacca ccccgtcgag

540 cttgttgccc gccccgatcg cctcggtcac ccggccggcc aagctggcca ggtgctcctc

600 gttttgcacg tcgagttcga gcagcggggc ctttgccggc agccggtcgg tgatgcgctg

660 aatcagccgc agccggtcga acccggtgag caccagctgg gcgccctgct cctgggctac

720 ccgtgcgatg tgaaacgcga tcgacgagtc ggtgatgatt ccgctaacca gaatccgttt

790 gccgtccagc agtcctgtca tgtgcgtcct tgtgttgtgt cagtggccca tacccatgcc

840 gccgtcgacc gggatgaccg caccggagat atagctcgca tcctcggaag ccaggaagct

900 gaccaccccg gcgacctcgg cgggggtgcc gacccgcttc gctgggataa attgcagcgc

960 cccctgctga atccgctcat ccagcgcgcg ggtcatatcg gtgtcgatgt agcccggggc

1020 cacc

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 104:GDC_MTUB_1673708

     序列描述:

自定义密码子

序列名:SEQ ID 104:GDC_MTUB_1673708

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atggtgccga gcatgagggt gcgctcggat tgggagccga tcgcccagag ccgctcccgg

60 ctcgcggtca cggcaccgcg caacacctcc gggggtcgct tcatctggat tctcctcggt

120 tctgcgcgaa acggtagcag agcgccatgg ttgccaacgc ggtcgccggg cagtctagac

180 cggatcttcc tcgtggcaac cgacaacagg acgtcgttgc cgaaagggcg ctgggcaccg

240 acatctagga tgaacccaca gccacgcccc gacgttatgc catggcgaag agcgaccggc

300 aggagcggga acccagtgaa gcgagcgctc atcaccggaa tcacaggacc ggacggctcg

360 tatctcgcta agctcccgct gaagggatat gtggccgctg gtagcccggc cgaggtctat

420 ttctgctggg cgacacggaa ttatcgcgaa ttgtatgggt tgctcgcggt caacagcatc

480 tggttcaatc acgaatcacc gcgtcacggc gagacattca tgactcgtaa tcctgcacca

540 tatcgcggtc ggcaacgagg cgctgatcga tgcgcagacg ctgatgcgcc ggcccacccg

600 gataggtatc agtattgggg cgttccggcc agcgtacgag gcgtgatcga ccgcgcaatg

660 ggtgtttgcg ttgagtaa

678

<212>类型:DNA

<211>长度:678

     序列名:SEQ ID 105:GDC_MTUB_1699549

     序列描述:

自定义密码子

序列名:SEQ ID 105:GDC_MTUB_1699549

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgagcggtc agccatcggc tttgcgccga cctacggtgt ccccgtcggc gtgtcgccga

60 cctacggtgt cgaagtcaaa gccaaagatc gacaggatga ccagcaggat ggcgccaccg

120 actaccgacg gatcggcgac attgaacacc ggccaccagc cgaccgacaa gaaatcgacg

180 acgtgcccgc gcagcggccc cggtgcccga aagaagcgat caaccaggtt gcccatggca

240 ccgcccagga tcatcccaag acccagcgcc caccacggcg ataccagccg ccgccccatc

300 cagaaaattc cgaccacgac acccgtcgca atcagcgtca aaacccaggt gtatccggtc

360 gccatcgaga aggccgcccc agaattacgc accagagtcc aggtcaccgt gtcgccgata

420 atcgacaccg gctggccggg cggcaacagt tggacagcta ccaccttggt gacaatgtcg

480 agtgtgagca ccaccacagc gaccgacagc agcatgcgca gccgtcgcgg cggcgcggga

540 gcgttaggtt cccccgcccc cccggcttcc tcggtcgagg tcagcggatc agccgatcct

600 gttggttcgt caggcacacc atcatcatcc cctagggccg atatggcccg cccagacccc

660 gcggccggat gggagcaaac cacgtgcgca atgatcccat catggcccgc ctcaccgtca

720 tcactactgg agggacaatc tcgaccaccg ccggccccga tggggtgcta cggccaaccc

780 attgcggggc gacgctga

798

<212>类型:DNA

<211>长度:798

     序列名:SEQ ID 106:GDC_MTUB_1742061

     序列描述:

自定义密码子

序列名:SEQ ID 106:GDC_MTUB_1742061

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcccccga ataggccgga acgccggtta gggaaacctc taacagcgcc gcttcgacgc

60 gcaccagcac atccccttcg cgacggtccc ggatcggtcg gaaacccacc gaaaacgagt

120 cgacgacacc agcttttacg ttcgccaaag cctcgtcgcc gtccggggtg tccgcaatct

180 cgaacgcccc gaacaagccg tgaggctcct cccgcaactc aacggcccgg cccaccgggt

240 agcgggttcg agcgtcgtga gagaccagca gcttcaattt gtggccgcgc tcggcgatgg

300 agcgccgaaa agcgccagga gcgaacattt cctggaactc gccgtcgaag tcgcggacgg

360 tggtcgcctc gttgtagggc acgatggtgc cgtgcacggt tcggccttcg ccagaccgca

420 gctcggccat gcggaaaagg atgctactca aaattcggcc accacctagc agacgcaaga

480 aacgcgcgga atcgcttgtg gcgcatggcg gccgctatcc gggttccagc cgccccgcgg

540 cgactgcccg gcgtcagcgg atgccgagat gccaaactcg attgtatcac acacaaaagg

600 tcatcaccgg tccggggcaa acgggttgag cccgtcgccg tcgtcgcccg gcgccaccgc

660 cagtcgctgc tcggcggccg gggtcaggcc aaactcggag gccaagcgca gcagatgcat

720 gcgcgccgtc tccgcaaccg tcaccgccgg gttccggtgc acgacaccgg atttcggtga

780

<212>类型:DNA

<211>长度:780

     序列名:SEQ ID 107:GDC_MTUB_1782153

     序列描述:

自定义密码子

序列名:SEQ ID 107:GDC_MTUB_1782153

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgtggaaat ggaagccgcg cttggcattc caccgggcaa cctggcggcg acgctggacc

60 gctacaacgc ctacgccgcg cgcggcgcag atcccgattt ccacaagcag ccggaattcc

120 ttgcagcaca agacaacggg ccgtgggggg cgttcgacat gtcgctgggc aaggcgatgt

180 atgccggatt cactctgggc gggctggcca cgtcggtgga cggtcaagta ctgcgcgacg

240 acggcgcggt ggtggccggc ctgtacgcgg tcggggcatg cgcgtccaat atcgcccagg

300 acggcaaggg atatgccagc gggacccagc tgggtgaggg gtcgtttttc gggcgtcgcg

360 ccggagcgca tgcggcagcc cgagcgcagg gcatgtaagc ctcctcgcgc cgcgactggg

420 aatcctgcga cgcgacacgc cgacaaggcg tcgtga

456

<212>类型:DNA

<211>长度:456

     序列名:SEQ ID 108:GDC_MTUB_2060659

     序列描述:

自定义密码子

序列名:SEQ ID 108:GDC_MTUB_2060659

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgtggcccc gtatttccgc ggcgccgtcg aatcggcgat cgacagttgg cggcgtgtgg

60 tgtcgacggc ggcccaactg ggtatcccga ccccgggatt ctcgtcggcc ctgtcgtatt

120 acgacgcgct gcgcaccgcg cggctgcccg ctgcactcac ccaggcccag cgcgacttct

180 tcggcgcaca cacctacggc cggatcgacg aaccaggcaa gttccacaca ctatggagtt

240 cagaccgcac cgaagtaccg gtgtagcggg ctagaactaa aagggggtaa aggggtaagt

300 gatgagattt ctagacgggc acccacccgg gtacgacctg acatacaacg acgtgttcat

360 cgttccgaac cgatccgagg tcgcgtcgcg cttcgacgtc gatttgtcca ccgccgacgg

420 ctcgggcacc accattccgg tagtggtcgc caatatgacc gcggtagccg ggcggcggat

480 ggccgagacg gtcgcccgcc gcggtggcat cgtaatcctg ccgcaggatc tgccgatccc

540 ggcggtaaag cagacggtgg cgttcgtcaa aagccgggac ctggtgctcg acaccccagt

600 gacgctggca cccgacgatt cggtgtccga cgccatggcg ctcatccaca agcgcgcaca

660 tggcgtcgcg gtggtcatcc tcgagggtcg cccgatcgga ttggtgcgcg aatcgtcctg

720 cctgggcgtg gatcgcttca cccgggtgcg cgatatcgcc gtgacggact atgtgaccgc

780 tccagcggga accgagccac gcaagatctt cgacctgctg gagcacgccc cggtcgacgt

840 tgcggtgctg accgacgccg acggcacgtt ggcgggagtg ctaagccgca ccggggctat

900 ccgcgccggt atctacaccc cggccaccga tag

933

<212>类型:DNA

<211>长度:933

     序列名:SEQ ID 109:GDC_MTUB_2093062

     序列描述:

自定义密码子

序列名:SEQ ID 109:GDC_MTUB_2093062

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgggtatat ctcccggcga tcgcggggat cgtgttcgtg gcaatgccgc tggtcgcgat

60 cgccatccgg gtcgattggc cgcgtttctg ggcgctgatc actactccgt cttctcaaac

120 ggccctgctg ttgagcgtga agaccgccgc ggccagcacg gtgctgtgcg tactgctggg

180 cgtcccgatg gcgctggtgc tggcccgcag ccgcggacga ctggtgcggt cgttacgacc

240 gctgatcctg ttaccgctgg tgctgccgcc ggtagtcggg ggtatcgcgt tgctctacgc

300 gttcggccgg ctcggcctga tcgggcgcta cctggaggcg gccggcatca gcatcgcatt

360 cagtaccgcg gctgtggtgc tggcgcagac ctttgtctcg ctgccgtatc tggtgatttc

420 cctagagggt gcagcccgca ccgccggagc cgactacgag gtggtggcgg cgacacttgg

480 ggcgcggccc ggcactgtct ggtggcgcgt gaccctgccg ttgctgctcc cgggcgtggt

540 gtccggatca gtactggcgt ttgcccgctc gctcggagag tttggcgcga ccctaacctt

600 tgccggttcc cggcaagggg tcacccgtac ccttccgctg gagatttacc tgcagcgggt

660 gaccgatccg gacgcggcgg tggcattgtc actgctgctc gttgtggtag cggcactggt

720 ggtgctgggt gtgggtgctc gtacgccgat cgggaccgat accaggtagc cggtcatgag

780 caagctgcag ctgcgcgcgg tcgtcgccga ccggcgtttg gacgtcgaat tctcggtgtc

840 cgcgggcgag gtgcttgcag tgctcgggcc caacggtgcg ggcaagtcca ccgccctgca

900 tgttatcgcg gggctgcttc gccccgacgc gggcttggta cgtttggggg accgggtgtt

960 gaccgacacc gaggccgggg tgaatgtggc gacccacgac cgtcgagtcg ggctgctgtt

1020 gcaa

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 110:GDC_MTUB_2105797

     序列描述:

自定义密码子

序列名:SEQ ID 110:GDC_MTUB_2105797

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcccacgc cggtcccagc ccgaactggg acgccgtcgc gcagtgcgaa tccgggggca

60 actgggcggc caacaccgga aacggcaaat acggcggact gcagttcaag ccggccacct

120 gggccgcatt cggcggtgtc ggcaacccag cagctgcctc tcgggaacaa caaatcgcag

180 ttgccaatcg ggttctcgcc gaacagggat tggacgcgtg gccgacgtgc ggcgccgcct

240 ctggccttcc gatcgcactg tggtcgaaac ccgcgcaggg catcaagcaa atcatcaacg

300 agatcatttg ggcaggcatt caggcaagta ttccgcgctg acggttggcg gcgtgtgcgg

360 tctatgacca ggtcgacgta tgtgtttgga tcaggtcatg gaaggttcgg ccacagttca

420 catggcagcg ccgccggaca agatctggac attgatcgcg gatgtccgca ataccggccg

480 gttctcgccg gaaaccttcg aggccgagtg gcttga

516

<212>类型:DNA

<211>长度:516

     序列名:SEQ ID 111:GDC_MTUB_2133554

序列描述:

自定义密码子

序列名:SEQ ID 111:GDC_MTUB_2133554

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcgccggc tccgctcttc agatccacgg tgccatcgcc ttcacgtggg agcacgacct

60 gcacctgtat taccgccggg ccaagaccac cgaggcgctt ttcgggagca gcgctcgaaa

120 tcgtgcgctg ctcgccgaac gcgcggggct tgtgaaagcc taggcgccca gcgcggccag

180 cgccgcttcg tagttgggtt cttgcgcgat ttccggcacc aattccgtgt aggcgacgtt

240 gccgtccgcg ccgatcacca cgattgcgcg ggcgagcagc ccggccatcg gcccgtcggc

300 gatggtcacg ccgtaatcct cgccgaagct gtcccggaat gccgacgcgg gcatgacgtt

360 ttcggtgccc tcggcgccgc agaagcgctt ctgggcgaac ggcagatcct tcgagacaca

420 cagcacggta gcgccacttg ccgccgcacg ctcgtcgaag gttcgcacac tcgtcgcgca

480 caccggtgtg tccacggatg gaaagatgtt cagcaacacg gacttacccc ggaactggtc

540 gctgctgatc acccccagat cgcccccggt cagggtgaag gccggggccg gggatccgac

600 agcaggtag

609 

<212>类型:DNA

<211>长度:609

     序列名:SEQ ID 112:GDC_MTUB_2183418

     序列描述:

自定义密码子

序列名:SEQ ID 112:GDC_MTUB_2183418

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcgcgggt ccgggcggac gcagatacaa gaccacgccg ctgccctgag ccgacatcct

60 cgccagcgcg ccgttgagtt cctcgccgca gcggcacgcc gtcgagccga acacgtcgcc

120 cgtcaggcac tcgatgtgga cgtgcagcgg cacgggcacc ccggcaccga ccgcacccac

180 gatgaccgcc aaatgctcgc cgaggtcgta aacgtcacga aagccgatga cacgcgaggc

240 gccggcccag gtgggcagcg tcgctgccgt aaaccggacc acctggggct cgatccgccg

300 gcgatacgcc accagctccc cgatcgagac catggccagt ccgtgttcga cggcgaattc

360 gaccgactcg gcgtggtgcg ccatctggac gggattatcg ggcgagacga tctcgcagag

420 cgcggcggcc ggccgccgtt ccgccaggcg ggccaggtcg acggccgcct cggcgggtcc

480 ccgccgaccc agcacaccgt cggcttgcgc ctgcacgggc accacatggc ccggacgttg

540 gaaatcggcg gcgacggagg tggccgaagc cagtgccgcg atggtccagg cgcgatcgct

600 cgccgagatt ccggtgccgg tgccgcgaac gtcgaccgac acgcaatgcg tggtgtctcg

660 gtcacacatg ggcggcaggt gcagtcgctc gcattcggcg cccggcagcg cgacgcgcaa

720 ataacccgag gtgtgccgga ccgcaaaggc aaccagccgc ggcgtcgcgg cctgggcggc

780 gaagacgaga tagccatcgc cattggggtc gccggtcagg accacggcgt gaccgcccgc

840 catcgccgtg atcgcacgac gtacccgcac atcggtcgtc ttcatcgaga ctccaaccgg

900 cggaaccggc taccgtga

<212>类型:DNA

<211>长度:918

     序列名:SEQ ID 113:GDC_MTUB_2192571

     序列描述:

自定义密码子

序列名:SEQ ID 113:GDC_MTUB_2192571

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgaagacag ctatttctct gccggatgag acgttcgatc gggtatcgcg gcgtgcgagt

60 gagctcggca tgagtcggtc cgagttcttc acgaaggctg cgcagcgcta cctgcacgag

120 ctggacgccc aattgctcac gggccagatc gacagggctc tagagagcat ccatggcacc

180 gacgaagcgg aggccctcgc cgtggccaac gcataccgcg tgctagaaac catggacgat

240 gagtggtga

249

<212>类型:DNA

<211>长度:249

     序列名:SEQ ID 114:GDC_MTUB_2234641

     序列描述:

自定义密码子

序列名:SEQ ID 114:GDC_MTUB_2234641

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtctacat ccacgacgat  tagggtttca acccagactc gggatcgtct ggccgcccaa

60 gcccgcgaac ggggaatctc gatgtcggct ctgctcaccg aactggccgc ccaggccgag

120 cgccaggcaa tcttccgcgc cgaacgcgag gcctcgcacg ccgagacgac cacccaggca

180 gtccgcgacg aggaccgcga gtgggagggc acggtaggcg acggccttgg ctga

234

<212>类型:DNA

<211>长度:234

     序列名:SEQ ID 115:GDC_MTUB_2320829

     序列描述:

自定义密码子

序列名:SEQ ID 115:GDC_MTUB_2320829

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggcgacca gcacctcgcc ggccggtggg ctgccgcagg cccgctcgca gccgacgaaa

60 tgccgatgcc cggctgactc cacgttcagt gaccgcgcgg cgtcggcccg tacgtcggcg

120 gccgagtgcg cgcagccggg gctgccggtg caggcgctga tgttcagcca gggggagttc

180 tcgtcgaaca ccaggcccag cggcgccagc acccgcagcg cggcgtcggc cgtcgcgtcg

240 tcgaggtcgc agatcagcac cgatcgccac ggcgtgatca ccagcggggc ctcgatcgcg

300 gccaggcatt ccgcgacccg ggcgggcaag acccccagcg gcaccgcggc gcccagcgtt

360 acccggctgt catcctgggg tatccagccg acgggcgttt tggtgacggg ccgaacggat

420 gggcccagct cgacaccgga ctgcagctcg ccgatatcgg ctaattccgt tactcgccag

480 gcggtttcgc ggatcttgac gaaacgcaac gcgacctcga tcagggtctc ggcgacatcg

540 gccacccgca cgccggtgtc acgtccggtc aacagcagtc ggggaccgtc ggggaacacc

600 tgcacgccga cgtcggcacc caggccggac acgtcggcgc ggccgtcgtc gagaccgaac

660 cagaaccggc cgcccagttc cgccagccgg ggctcggcgc ggatcgccgc gtcgagctca

720 ccgacccatg cccgcacgtc ggctagcccg ccggcccggc cggacagcgg cgaggcgacg

780 atattgcgca cccgctcgtg tgttgccgac ggcagcagcc cggctttggc gaccgcgtcc

840 gcgaccgctg ccacgtcgcg gatcccgcgc aactggacat tgccgcgcgc ggtcagtccc

900 agtgtcgcgg agccgaagtc gctggcgacg ctggccagcg tcgccagttg tgccgcggtg

960 atcatcccgc cgggcagccg gatccgcgcc agcgccccgt cggcggcctg gtgcggccgc

1020 aacg

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 116:GDC_MTUB_2321250

     序列描述:

自定义密码子

序列名:SEQ ID 116:GDC_MTUB_2321250

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgacgggcc gtgtccgaca gaccggcata acccgtctcg tcgtacatca gcggggcccc

60 gtccttccac agcgactgat gacagtgcat gccggacccg ttgtcgccga acagcggctt

120 gggcatgaac gtgaccgttt tgccgttctg ccaggcggtg ttcttgatga tgtacttgta

180 caactgcatg tcgtcggcgg cgtgcagcag cgaattgaac tggtagttga tctcggcctg

240 tccgccgctg cccacctcgt ggtggccctt ctccaggatg aagccggagt tgatcaggtt

300 ggtcagcatc ttgtcgcgca ggtcgacgta ttggtcgttg ggggccactg ggaaataccc

360 gcccttgtgg cggaccttgt agccccggtt gggactgccg tcggcctcgg tcgccgcgcc

420 ggtgttccac caccccgaga tggcgtccac ctcgtagaag gagccgttgg cgcgcgagtc

480 gaagctcacc gaatcgaaaa tgtagaactc ggcctcggcg ccgaagtatg cggtgtcggc

540 gatgccagtg ctgatcaggt agttctcggc cttgcgggcg atgttgcgcg ggtcgcggga

600 gtacggctcc agggtgaacg ggtcgtgcac aaagaagttg atattcagcg tcttggccgc

660 gcggaacggg tcgatgcgcg ccgtctcggg atcgggaaga agcaacatgt cggattcgtg

720 gatcgactgg aacccgcgaa tcgacgagcc gtcaaaggcc aagccgtcgt caaacacgct

780 cttgtcaaag gccgaagccg gaatcgtgaa gtgctgcatg atgccaggca ggtcacagaa

840 ccggacgtcg acatattcga ccttctcgtc cttggcaagt ttgaagacgt cgtcgggcgt

900 cttttccgtc acagaatgct cctttactgt atccgcggcc gacgctatgg agccgatatt

960 gcccgtcagt caaccccgtg ttgcgcagac gttactgacc gtgccgccca ccactga

1017

<212>类型:DNA

<211>长度:1017

     序列名:SEQ ID 117:GDC_MTUB_2487508

     序列描述:

自定义密码子

序列名:SEQ ID 117:GDC_MTUB_2487508

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggcgggcg tttgcgcgct attctccggt gcttcccgct ggccgtctgg tgaacttcgg

60 caccgtccac agggttcccg ccggggtccg agccggctac gatgcacctt tccccgacaa

120 aacgtatcaa gccggcgccc gggcgttccc acggttggtg ccgacctcac ccgacgatcc

180 ggcggtaccg gccaaccgcg cggcatggga agccctgggc cggtgggaca aaccgttcct

240 tgccatcttc ggttatcgcg acccgatact cgggcaagcg gacggtccgc tgatcaagca

300 cattcccggc gcggcgggtc agccgcacgc ccgca caag gccagccact tcatccagga

360 ggacagcgga accgaactcg ccgaacgcat gctctcctgg cagcaggcaa cgtaaccgcg

420 acggctgcgg acgaaggatc ggcagaatgg cgatggagat ggcgatga

468

<212>类型:DNA

<211>长度:468

     序列名:SEQ ID 118:GDC_MTUB_2567990

     序列描述:

自定义密码子

序列名:SEQ ID 118:GDC_MTUB_2567990

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgaccgaca acgagtgccc ggccgacagc cgacggcgcc atgtcctgcg gctcgccctg

60 ttcgccggga ttttgctggg gctgttctac ctggttgcgg tggcacgagt catccacgtc

120 gacggggtcc gtagcgcgat cgtggtggcg acgggtccga tcgcacccct ggcgtacgtt

180 gtggtgtcgg ccgcactcgg cgcgttgttc gtcccgggcc cgatcctcgc cgccggcagc

240 ggggtgctgt tcgggccgct actagacacc tttgtgaccc tgccagcttt ctcggccggc

300 gcgcaggccg gaatgacgcc caggcgctgc tgggtgtcga tcgcgcccat cgcctcgatg

360 cacagatcga acggcgcgga ttgtgggcgg tggtcggtca gcgcttcgtc cccggcatct

420 cggatgcgct ggcctcgtac accttcgggg cgttcggagt tccgttgtgg cagatggtcg

480 ttgggtcgtt catcgggtcg gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga

540 tcaccaacct gtcgtcgccg ctggtttact cggcgatcgc ggtgtggtgc gtga

594

<212>类型:DNA

<211>长度:594

     序列名:SEQ ID 119:GDC_MTUB_2577106

     序列描述:

自定义密码子

序列名:SEQ ID 119:GDC_MTUB_2577106

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgtggggcgg tggtcggtca gcgcttcgtc cccggcatct cggatgcgct ggcctcgtac

60 accttcgggg cgttcggagt tccgttgtgg cagatggtcg ttgggtcgtt catcgggtcg

120 gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga tcaccaacct gtcgtcgccg

180 ctggtttact cggcgatcgc ggtgtggtgc gtgaccgcca tcatcggggc gttcgccgcg

240 cggcgttggt accggaagtg gcgtgcgcgc ccgcgccggc ggtgcggcct ggctcagctc

300 acgaccggta gtcagcaacg ccacacgagt caccggacac cggcgggcgt cgtcatgccc

360 ggttcactgt ccgagcaccg ccgtctccgt caagaagcgc cggatcgcat cgagcatcac

420 ccgcccatcg agtag

435

<212>类型:DNA

<211>长度:435

     序列名:SEQ ID 120:GDC_MTUB_2577486

     序列描述:

自定义密码子

序列名:SEQ ID 120:GDC_MTUB_2577486

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgtctgcgg ttttaccggc tcggtgcatt cgcgcgctag ccgatagggt ctatcgccat

60 gtccggtgcc acggtgggtg cgcgcgaaat caccatccgc ggagtcgtcc tgggcgcatt

120 gattaccttg gtgttcaccg cggccaacgt gtacctgggg ctaagggttg gattgacatt

180 cgccacttcc ataccggccg cggtgatctc gatgggcgtg ctgcggttgt tcgccaacca

240 ctcagtggtg gagaacaata ttgttcagac gatcgcgtcg gcggccggca cgctgtcgtc

300 gatcatcttc gtgttaccgg cactgctcat gatcggctgg tggagcgggt ttccgtactg

360 gacaacggcg gcggtgtgtg cactgggcgg gatccttggc gtcatgtact caattccgtt

420 gcgccgcgca ctcgtcaccg gatcagacct gccgtaccca gaaggcgttg ccggagccga

480 ggttctcaag atcggtga

498

<212>类型:DNA

<211>长度:498

     序列名:SEQ ID 121:GDC_MTUB_2690012

     序列描述:

自定义密码子

序列名:SEQ ID 121:GDC_MTUB_2690012

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgggcccga tgaacgggtt cctgagttgg tgggacggcg tcgagctgtg gctgtccgga

60 ctcccgttcg cgctgcaggc gttggcagtc atgccggtcg tgctggcttt ggcctatttc

120 accgcggcat tgctggatgc cctgctcggc cgggtcattc agttgattcg ccgcgcccgc

180 cgccccgatc aggcgcccag gtag

204

<212>类型:DNA

<211>长度:204

     序列名:SEQ ID 122:GDC_MTUB_2698040

     序列描述:

自定义密码子

序列名:SEQ ID 122:GDC_MTUB_2698040

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atggcggacg atgtgagcgg cgcggtgtac cgggccggca cggcccacgg tcggccgacc

60 ggtcgcattg aacaccgcga ccgtcaggtc gtgacgcgcc gggcgactga tacgcgcgcg

120 gaactggacg ggctgtccga ccatcagctc gccgaagtcc agcgctcgcg cgaaaaccac

180 tacccggccg gatgtctcgt catcccgcag ccgttgaacc gtcgcccgga acatcaaccg

240 gccccgcccc agcgacactg ggctctcgct gggggtgacc gtgaccagcg cggaggtgcc

300 aaatgccacg gtgattgggt ggcgatcgac cgcctcggag cgcaacgcga ccgcaagccc

360 gtaccccgcg cccaccatac cgaccgcgac caggccggcg ctgatcgaac ccagtcgcgg

420 agcgtgccac gaccggcgcg ccacacacca ccacagtgcg ccgccgccga gggccaccac

480 gacgcagcac aaggcacaca cgttgccgat cggccacacg atcccggccg ccgtcacaat

540 ccagctgacc agcgccgccg ggaccaggcg tacgtccaaa cgggacgcgc cgaagcccat

600 atggcgcacc ggtatcagac acggaccaga ttgcgccgct tgtccagccg cgccggaccg

660 atgccgtcga cgtcggcaag ctggtcgacg ctggtgaacc taccattgcg ctgccgccac

720 gccacaatcg ctgcggcggt gaccggcccg atgccgggca gggcgtccag ctgctccacg

780 gtcgcagtgt tgaggtcgag cacctcagct gtcttaggag ctgtcttagg gcctgtcgtg

840 gctgtgcccg aggtacccgc cggtcccggc gtccccgcac cgaccgagct gcccagcacc

900 ctcggctgtc ccgagggcgg agctagcccg accacgatct gctcaccgtc accaagctgc

960 cgagccatgt tcagtccgac ggtgtccgcg ccgtctaccg ctccgccggc ggcctgtagc

1020 gcat

1024

<212>类型:DNA

<211>长度:1204

     序列名:SEQ ID 123:GDC_MTUB_2712275

     序列描述:

自定义密码子

序列名:SEQ ID 123:GDC_MTUB_2712275

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

60 ctggccaccg tcgtgcagtg cgtgaccggc gggctggggg tgacactgat tccgcagacc

120 gcggccgccg tcgagaccac gcgaagccgg ctggaactcg cccgattcgt cgcccctgcc

180 cggcgcgacg aatcggtttg gtgtttagct ctttcggcgg ccgcgagaag tcctaccagc

240 gtcttgccgg gattatcggc aagctga

267

<212>类型:DNA

<211>长度:267

     序列名:SEQ ID 124:GDC_MTUB_2725593

     序列描述:

自定义密码子

序列名:SEQ ID 124:GDC_MTUB_2725593

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcgcagag tattcagcgg ttggacaacg ttggtccgct gcagcaccgc agcgaccacc

60 gtcacgatca gggcgatgac aaagcacgtc ccggtaatcc actccagcga accgacccgg

120 ccgctgacgc cgcgaaagcc ggtggatccg gtgcgtcggt gctgcagcca actgcgtcag

180 ccgaatccga ccacactgaa aaccgcgaag agtgccagcg ctaagtcggc cgcggtggtc

240 gttcgcatca gcgggtctcc ttcggtgcgt agcagtggtc atgaaccgtt gtggcggttg

300 gctcgcaggg ccgcatcgat cgcggcggcg gccggtgcgc agtcgccgac accggacacc

360 aaagttgcca gcgcacccgc agcgcaggcc cgccgcaatg cgcgcagtcg ctcggccggc

420 gaacctgggt tgcgcggcca attcgcagca aggaccccgg caaatacgtc gccggcgccg

480 gcggtatcca ctggcgttac cgttggggcg ggtacctcga acaccccgtc cgcgccgacg

540 taccgggcac cgcgcacacc cagggtgatc acgaaatgtg ttggtggcga cggccagtcg

600 tttgcctcat gctcgttggc gatcaccacg tcggcgatag cggccaagtc ctgcaaggag

660 cttcgatcct ggccggctgg ggaggcgttg accatgacaa ccgcatcggc cgactgggct

720 gcccgcgcgg ctgccagcgc ggttgcaaca ggaatctcca actgggtcaa cagtacatcg

780 cagttggcga cggccgaggg taccggagtc agatgtgcat tggcacccgg cgccaccagc

840 acggtgttct cggcgctggc atcgaccacg ataatcgccg tcccgctcgg tccgggcacc

900 gtgacggtcc tgtccagtcc aacggcgttg gcgcgcaggt gggcccgcag ctgggcggcg

960 gctggatcgt cgccgaatgc accggagaac tgtacctgcg cgcctgcgcg cgctgcggcc

1020 accg

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 125:GDC_MTUB_2733212

     序列描述:

自定义密码子

序列名:SEQ ID 125:GDC_MTUB_2733212

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

60 aaacagctcg cgtcagcgat tcgcaaccca tacggactcg tccgtgggtg gcgctgtcgc

120 atctgtaacg agcaccaagg ccagccggtc aagatggcgc aagaccacga agaggaggtc

180 cgcatccgtt ggggcgagac ggtggacgaa ctccacgctg cgctggaccg cgccgggcca

240 aggccaggga cgtggtgtac gagtgaaggt tcctcgcgtg atccttcggg tggcagtcta

300 ggtggtcagt gctggggtgt tggtggtttg ctgcttggcg ggttcttcgg tgctggtcag

360 tgctgctcgg gctcgggtga ggacctcgag gcccaggtag cgccgtcctt cgatccattc

420 gtcgtgttgt tcggcgagga cggctccgac gaggcggatg atcgaggcgc ggtcggggaa

480 gatgcccacg acgtcggttc ggcgtcgtac ctctcggttg aggcgttcct gggggttgtt

540 ggaccagatt tggcgccaga tctgcttggg gaaggcggtg aacgccagca ggtcggtgcg

600 ggcggtgtcg aggtgctcgg ccaccgcggg gagtttgtcg gtcagagcgt cgagtacccg

660 atcatattgg gcaacaactg a

681

<212>类型:DNA

<211>长度:681

     序列名:SEQ ID 126:GDC_MTUB_2828257

     序列描述:

自定义密码子

序列名:SEQ ID 126:GDC_MTUB_2828257

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgggatcgc tcaccgtgtt caccagctcg gcgaggatgt cgcgcacagc ggccaacacg

60 tcggcgcgcg cactgcacag catgaccacc gggtcgggcg ggaagagcag aatgctgaac

120 acgatagcca gcccaccacc gaccagcgcg tcgaagaggc gttcgaaaac cacactgccg

180 ttggacgcga agaccaagac cagcaccgcg gagacggcgg cctggttgat gaacattaag

240 ccttgcgcga ccaacccgcg tgcgcacagc accgcgaccg acaacgcgat gaacaccacc

300 acacccatgg cgatcggtcc ggaaccaagc agagcatgca cgccagcacc cagcacgatc

360 cccagcgcca ccccgacgat catctgttgg gcacgtcgtg cgcgcagcac gttggtcgcc

420 gacatgcaca ccacagccga aatcggcgcg aagaacgcct gcggatggtt gaacacgtca

480 tgggtgagat accacgcgag gccggcgacg accgatgtct gggtgatcgg ccacagcacg

540 gtgcgcaacc gttgggcgac cgcacggccg ccgcaggccg tcctgactag cagcgaagcg

600 ctcatgaacg cctatttatt cacactcggg tgcgacgtcg taaccgcaaa gatctggtca

660 tgcctgctgg acccgcttgg gctgggcatc tattccggac tccttacgtt gctgagcggt

720 aatgggcgcc ggcgcgtcgg tgagcggatc gacgccgccg ccggtcttcg ggaacgcgat

780 cacctcacgg atcgagtcca tcccggccag cagcgcggtg gtccggtccc acccgaacgc

840 gattccgccg tgcggcggtg cgccaaacat gaacgcctcc aacaggaatc cgaacttttc

900 ctccgcctcg gccttgtcca ggcccatcac cgcgaacacc cgttcctgga tatcacggcg

960 gtggatacgc accgagccgc caccgatctc gtggccgttg cagacgatgt cgtacgcgtc

1020 ggcc

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 127:GDC_MTUB_2895354

     序列描述:

自定义密码子

序列名:SEQ ID 127:GDC_MTUB_2895354

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgatcggcg atttcgccga gatgctcggc ggccaggacg gcgtcgctga gttggtccaa

60 cacgtcgctg tgcacccgtt tgatggcgtt gatgagctcg tcgaggcgga cggggtaggc

120 ggtgggtgtg ggctccggca tgacgtcaac agtaggttga cgttatgcat tgtgtcgacc

180 gtgattggct gcgtagtggg ttctgcagcg ctgccaggcc gctgcgggca gggtggcgcc

240 gatcgcggcc accaggccgg cgtgggcgtc gctggtgacc agcgcgaccc cggacaggcc

300 gcgggcgacc aggtcgcgga agaacgccag ccagccggcc ccgtcctcgg cggaggtgac

360 ctggatgccc aggatctctc ggtagccctc ggcgttgacg ccggtggcga tcaaggtgtg

420 caccccgacg acgcggcctg cctcgcgcac cttgagcacc agggcgtcgg cggcgaggaa

480 ggtatacggg ccggcatcga gcgggcgggt ccgaaacgcc tctacggctt cgtcgagctc

540 tttggccatg atcgacactt gcgacttgga aagctttgtc acaccaagtg tttcgaccag

600 gcgctccatc cggcgagtgg atactcccag caggtagcag gtcgccacca cgctggtcag

660 tgcgcgttca gctcgcttgc ggcgctgcag cagccagtcc gggaaatagc tgccctggcg

720 cagcttgggg atcgcgacgt cgatggttgc ggcacgggtg tcgaaatcac ggtggcggta

780 gccgttgcgc tgattggacc gctcatcgct gcgttcgcgg tagcccgccc cgcacagggc

840 gtcggcttca gcccccatca aggcggcgat gaacgtcgag agcagcccgc gcagcagatc

900 cgggctcgcc tgtgcgagtt ggtcagccag aagctgctcg gtgtcgataa gatgagaaga

960 ggtcattgcg tcatttcctt cgattga

987

<212>类型:DNA

<211>长度:987

     序列名:SEQ ID 128:GDC_MTUB_2983047

     序列描述:

自定义密码子

序列名:SEQ ID 128:GDC_MTUB_2983047

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttggatgagc cggcgcaccg cgctcgcccg aaagggaacg gagccaatca tgacggcgct

60 caaccgtgct gtggcatcgg cgcgtgtggg aaccgaggtg atccgcgtgc gcgggctcac

120 cttccgctac ccaaaggcgg ccgagccggc ggtgcgtggc atggagttca ccgtcggccg

180 cggcgaaatc ttcgggcttc taggtcccag cggcgcgggc aagtccacca cccagaagct

240 tctcatcggg ctgctgcgcg accacggcgg ccaggccacg gtgtgggaca aagagccggc

300 cgagtgggga cccgattact acgagcgcat cggggtctcc ttcgagctgc ccaaccacta

360 ccaaaagctc accgggtatg a

381

<212>类型:DNA

<211>长度:381

     序列名:SEQ ID 129:GDC_MTUB_3005316

     序列描述:

自定义密码子

序列名:SEQ ID 129:GDC_MTUB_3005316

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgatccctc aaatgacggt gtcctgcccg cccccgtcga cttctgagcg cgaagagcag

60 gcgcgggcac tgtgcctgcg cctgctcacc gcgcgatccc gcacccgcgc cgagttagcc

120 ggccagctgg ccaagcgcgg ctaccccgaa gacatcggca accgggtatt ggatcggctg

180 gccgccgttg gcctggtgga tgacaccgac ttcgccgaac aatgggttca gtccaggcgg

240 gcgaacgcag caaagagcaa gcgcgcgttg gctgccgagc tgcacgccaa gggcgtcgac

300 gacgacgtga tcaccacggt gctcgggggc atcgacgccg gtgccgaacg ggggcgggcg

360 gaaaagctgg tacgggccag gctgcggcgg gaggtgctga tcgacgacgg caccgacgaa

420 gcgcgggtga gccgcaggct ggtggcgatg ttggcgcgcc gtgggtacgg ccagaccttg

480 gcgtgcgagg tggttatcgc cgagctggcc gccgagcggg agcgccgacg cgtctaa

537

<212>类型:DNA

<211>长度:537

     序列名:SEQ ID 130:GDC_MTUB_3048559

     序列描述:

自定义密码子

序列名:SEQ ID 130:GDC_MTUB_3048559

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttggtgacga ctctggcgcc gatcttggac agtgcatcga tgactccgaa gaccgcctcc

60 tcgttgccgg ggatcagcga cgacgacaac acgatgagat caccagcagt caacgtgatg

120 ctgcgatgct ccccacgcga cattcgcgac aacgccgaca tcggctcgcc ttgggtgccg

180 gtggtgatca acacaacttg gtcgggcgcc atcgtttcgg cggcggcgat gtcgatgaga

240 tcggaatcag ccactcgtag gaagcccagt tgccttgcga cgcgcatgtt gcgcaccatc

300 gatcggccga cgaacgacac tcgccggccc aatgccactg cggcatcgat gatctgctgt

360 acccgatcca cgttggaggc gaaacacgca actatcaccc gtccgtcggc accccggatg

420 agccggtgca gcgttgggcc cacttcgctt tccgatggcc cgacaccggg gatctcggcg

480 ttcgtcgagt cgcacagcaa caggtccacg ccggtgtcgc cgagccgcga catgcccggt

540 agatcggtgg gacggccgtc cggtggcaat tggtcgaact tgatgtcgcc ggtgtgcagg

600 atggttcccg cgccggtata caccgcgatg gccaacgcgt ccggagtgga atggttgacg

660 gcgaagtact cgcactcaaa cacgccgtgc cgggtgctct ggccctcgcg gacctcgacg

720 aacaccggtg ttatgcggta ctcacgacat ttctctgcaa ccagagccaa ggtgaacttc

780 gagccgacga ccgggatgtc gggtcgcagc ttgagcagaa acggaatcgc cccgatgtgg

840 tcctcgtgcc cgtgggtcaa caccagcgcc tcgatgtcgt caagccggtc ttcgacatgg

900 cgcatgtccg gcaggatcag atcgacaccg ggctcgtcgt ggccaggaaa caacacaccg

960 cagtcgataa tcaacagtcg gcccaggtgt tcgaaaaccg tcatgttgcg gccgatttcg

1020 ttga

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 131:GDC_MTUB_3065095

     序列描述:

自定义密码子

序列名:SEQ ID 131:GDC_MTUB_3065095

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtccaaga gatcggatgg gccgagcact ggcaatgcga ttcgtgctcg gcatcgcatc

60 agcgtgatga ctgcgcagcg atcaacctcg cacgctacga ggacaccagt agcgtcgtcg

120 gcccagttgg ggccgccgtc aagcgtggag ccgaccgtaa gacccggcct ggccgggctg

180 gtggccgtga agcgcggaag ggaagcagcc gcaaggctgc cgaacaaccc cgagacgggg

240 tgcaagtcgc gtgaccacta a

261

<212>类型:DNA

<211>长度:261

     序列名:SEQ ID 132:GDC_MTUB_3100192

     序列描述:

自定义密码子

序列名:SEQ ID 132:GDC_MTUB_3100192

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggcaacga agaacgcggc atggccttca tctacaagct gctcgaacta ctcgccgaac

60 gcgacgatcg aatcacaaag gccagatggg tgtacttcct cacgcgcatg cgtaacccca

120 ccggtgacac agcgcctttt cagcagtttg ctaaccggct acaccaatgg ttccaagatc

180 cgacagacgc caagcaactc aagaccgcgc tgcacctcta catctatcgc actcgcaagg

240 aggagtccga atgagcgtca tccaagacga ctatgtgaaa caggccgaag taattcgcgg

300 cctgccaaag aaaaagaacg gcttcgagct gaccacaacc cagctgcggg tgctactcag

360 cctgaccgca cagctcttcg acgaggcgca gcagagcgcc aaccccacgc tcccgcgtca

420 gctgaaggag aaggtccagt acctgcgggt ccggttcgtc taccagtccg ggcgtga

477

<212>类型:DNA

<211>长度:477

     序列名:SEQ ID 133:GDC_MTUB_3129118

     序列描述:

自定义密码子

序列名:SEQ ID 133:GDC_MTUB_3129118

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

60 ttccgctggt ggacccgctg ccgagcgttg gagctcggcc tgaccggtta cgcggccaac

120 cacgccgacg gacgcgtgct ggtggtcgcc cagggtccgc gcgctgcgtg ccagaagctg

180 ctgcagctgc tgcagggcga cacgacaccg ggccgcgtcg ccaaagtcgt cgccgactgg

240 tcgcagtcga cggagcagat caccgggttc agcgagcggt aa

282

<212>类型:DNA

<211>长度:282

     序列名:SEQ ID 134:GDC_MTUB_3237815

     序列描述:

自定义密码子

序列名:SEQ ID 133:GDC_MTUB_3237815

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgttgcacg acgtcgtcca cggcagacga tgtagtgaga atggccaccg gcgacgaatc

60 actcagtacc gaatcggaac gttcatcggt aacgccgcct tgtggaaccg aaagcggcac

120 ggcgatgcgc ccggcctgca acgcgccgag aaaggcgacg acgtactcga gtccctgcgg

180 agcagagatc accacgcggt cacccgtgga accacaacgg ctcagctcct gtgccacatt

240 cagcgttcgc cgatacagct gcgaccacgt cagggttatc gcaacgccgt cccagtcctg

300 ttcgtaatcc ataaacgtga aggccgggtc atggggttgc agacgcgcac acgcgcgcaa

360 cgcagcggga agggaacgca cactcatggg catcacgtta ccggccacgc ttggagttgt

420 cgcagtcgcc gtcggggtgt gctcgcgctc cgcggtctta gccaagtcgc atctggccag

480 ctcagcaggg gtttgccggc tcgccatggg tccaccatcg gacacggtcg gatgtga

537

<212>类型:DNA

<211>长度:537

     序列名:SEQ ID 135:GDC_MTUB_3283182

     序列描述:

自定义密码子

序列名:SEQ ID 135:GDC_MTUB_3283182

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcccacca ccaaagccac ccagcgccgt gatgtttcca ccgagatcgc ttacctgaca

60 agagcattga aagctcccac cctgcgtgag tcagtgtccc ggctggccga tcgcgcccgc

120 gccgagaact ggagccacga agaatacctg gccgcctgcc tgcagcggga agtgtcagcc

180 cgggagtccc atggtggtga gggccgcatc cgcgccgccc gcttcccggc tcggaagtcg

240 ttggaagagt tcgactttga gcatgctcgt ggcctcaaac gcgacaccat cgcacatctg

300 ggcaccctgg atttcatcac cgcccgcgat aacgtcgtgt ttttgggccc cgcctggcac

360 cgggaagact catcttgcgg tcggcctggc gatacgcgcg tgtcaggccg gtcatcgggt

420 gctgttcgcc accgccgccg aatgggtagc acggctcgcc gaggctcacc acgccgggcg

480 catctacgcc gaactcaccc ggctttgccg ctatccgctc ctggtggttg a

531

<212>类型:DNA

<211>长度:531

     序列名:SEQ ID 136:GDC_MTUB_3289702

     序列描述:

自定义密码子

序列名:SEQ ID 136:GDC_MTUB_3289702

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcagtggg ggtaccgccc gcttgcgggg gacgaagcga tgaggtgggg gtaccgcccg

60 cttgcgaggg agagcggcgc acttgacccg gatcatcggc ggtgtcgccg gaggccggcg

120 cattgccgtc ccaccacgcg gaaccagacc taccaccgat cgggtgcgcg agtcgctatt

180 caacatcgtg actgcgcggc gggatctgac cggtctggcg gtgttggacc tctatgcggg

240 ttccggcgcc ctggggctgg aggcgttgtc gcggggagcg gcgtccgtgc tgttcgtgga

300 gtccgaccag cgcagcgcgg ccgtcattgc gcgcaacatc gaggccctag gtctctccgg

360 tgcgacgctg cgccggggcg cggtggcggc cgtcgtggcg gccgggacca cgtccccggt

420 ggatctggtg ttggccgacc cgccctacaa cgtcgactcc gccgacgttg a

471

<212>类型:DNA

<211>长度:471

     序列名:SEQ ID 137:GDC_MTUB_3319076

     序列描述:

自定义密码子

序列名:SEQ ID 137:GDC_MTUB_3319076

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgggtgggg ttgccagcac tcggcaggca tccgttcgcc gttggtctgc cgttcacccc

60 ctggatgcct cgccggcgtt gccccgtccc ggtcaacgat gtgcgaccgc tcgcgcggtc

120 gcgggcccta ccccgagctg gcgtgcggcc gtcaggtcgg cgggggtgtc gacatcgcag

180 cgcaggcccg gccaggctcc tgtcagctcg acagcgcccg aacggcggtg ccgcgcggac

240 gaatccggcc cgaaccgcgg gtgcagcgcg gtgccgaacg cacacagtac cgcggtgccg

300 gtcccaagcc ggtcggcgac gaagctgcgc cgatggtggc gtgcggccga gattgcctcg

360 gcgagttcct gtgtctgtaa tgccggcaaa tcgccttgca gcacaacgat gttggaggcc

420 ccttcggcaa ccacgcgttc ggcagcggtg atggcggtgt tcagtgggtc gggatcgtct

480 tcgggtgtcg ggtcggccag tacatcggcg cccagcccgg ccgccgcagc cgccgcggct

540 tcgtcggggg tgataacagt gatcgagcgc agtgaaccga cacccgccgc ggcggtcaac

600 gtgtcgacga gcatggccag caccacgttc tcgcgagtct gcgccgagaa caccggggcc

660 agcctggttt tggccgcggc caagcgcttg acggcgatga tcaagccgat atcgccgtcg

720 tccggtgtgc cgctcatgaa gtcatcctgc cagcgtcgat ccacgcggca cacttcgacg

780 gcattgccgc cacggtcgtg gccggggccc aggcacggtc ccgacggcaa ccgcggcgca

840 gattag

846

<212>类型:DNA

<211>长度:846

     序列名:SEQ ID 138:GDC_MTUB_3339006

     序列描述:

自定义密码子

序列名:SEQ ID 138:GDC_MTUB_3339006

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcgcggca ggttgatccg atacgcggtg ttgttgtctc cgagcttgcc gctacgtccc

60 agcgcgtcgg ccaccggctt ccagtcggca tcggtggtgg tcaccgccga acgagctttg

120 ccggcgtggc cgctgcccgc tccacccttg gagcccgaac tgcacgccgc cagtatcacc

180 gccgccgcgg tggtgatcgc gacgattctc ccagcatgtt tggcgcccgc catgcgcgtt

240 ccctccatcc gttgcatcca cggcgtggat ggcagttcgg ttagccatgg tctatcgggt

300 gattatgaaa ccacgatgaa gctcgatcgc accgatccgg gcacggccag acgtcctcat

360 cgacgccctg ggcgcgtatc tgctggccgc cgcggctctt cgacccgtgg aacgcatgcg

420 catccgcgcc gcgggcatca gcgccaccga cccacatgcc cgtctgccat tgccactggc

480 tcgagacgaa atccggtatc ttggaacaac attcaacgac cttctgcagc ggctgcaaga

540 cgcgctcgag cgagaacgtc aattcgtcag cgatgcgggc cacgaacttc gcaccccctt

600 agcctcctga ccaccgaact cgaactcgcc ctgcggcgtc cacgaagcaa ccccgaactg

660 ctcgccgcaa tccgctcggc tctcgcggaa accaccgaca ccgcgcgcac caccggcggc

720 accgggcttg gactggccat cgtcgacacc ctcagccaac gcaaccacgc cagcgtcacc

780 gcccgaaacc gcgccgcagg cggtgccgaa atctccctcc ggcttgctct tggctga

837

<212>类型:DNA

<211>长度:837

     序列名:SEQ ID 139:GDC_MTUB_3356995

     序列描述:

自定义密码子

序列名:SEQ ID 139:GDC_MTUB_3356995

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcttgggc tgcccgaccc ccgccccgtc ccacgcaacc cggctgcccg tcgtcgggcg

60 acatcccggt ctctatcggc ggacccgagc agccgcccgg ctagccagtc gcggccaagg

120 ccagggacgt ggtgtacgag tgaaggttcc tcgcgtgatc cttcgggtgg cagtctaggt

180 ggtcagtgct ggggtgttgg tggtttgctg cttggcgggt tcttcggtgc tggtcagtgc

240 tgctcgggct cgggtgagga cctcgaggcc caggtagcgc cgtccttcga tccattcgtc

300 gtgttgttcg gcgaggacgg ctccgacgag gcggatgatc gaggcgcggt cggggaagat

360 gcccacgacg tcggttcggc gtcgtacctc tcggttgagg cgttcctggg ggttgttgga

420 ccagatttgg cgccagatct gcttggggaa ggcggtgaac gccagcaggt cggtgcgggc

480 ggtgtcgagg tgctcggcca ccgcggggag tttgtcggtc agagcgtcga gtacccgatc

540 atattgggca acaactga

558

<212>类型:DNA

<211>长度:558

     序列名:SEQ ID 140:GDC_MTUB_3381198

     序列描述:

自定义密码子

序列名:SEQ ID 140:GDC_MTUB_3381198

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgattttct gggcaaccag gtactgcacg atctggttgc cgccttcacc ctcgtcggtg

60 accttctccc cggcagtctt ggccggtttg ggcgtcgacg ccagcacggt ggatccggcg

120 ttggccagcc ccacctcgtc gctctcgaca ccgatctcgg ccagggtcag cacggtaact

180 tccttcttct tggcggccat gatgcctttg aaggacggga agcgcggctc gttgatcttc

240 tcgttcacgc tgatcaccgc gggcagcgtg gcctcgaggg tgaatacgcc ctcatcggtc

300 tcacgctcgc cggtgatctt gccgccctcg atcgacactt tgcgcaggtg ggtgagctgc

360 ggcaggccca ggtactcggc gatgatggcc ggcaccgcac cgcccacccc gtcggtcgat

420 tcgttgtctg cgatcaccag ctcggtgccc tcgatggtgc ccaacgcgcg cgccaaagcc

480 cacccggttt ggatgacgtc cgagccgtgc atgccgtcgt cctttaggtg gacggccttg

540 tcggcaccca tcgacagcgc cttgcggatc gcctcggtgg cgcgctcggg gcccgccgtc

600 agcacggtta ccgacccttc gatgccgtcg gcggcctctt tctcccgaat ctgtagcgct

660 tcctccacgg cgcgctcgtt gatctcgtcc agcaccgcgt cggcggcctc gcggtccagc

720 gtgaaatcgc cgtcggtcag cttgcgctcc gaccaggtat ctgggacctg cttgatcagg

780 accacgatgt tcgtcatgac tgtggttcgt cctcctcgaa ggcggcccgc agcgctcgac

840 tgcggaacct cggtcacacg ttttgcaacc gcacagcgat attactattc ggtaagttcg

900 cgtggtgcgc cctcacacca tagcgggtgg tag

933

<212>类型:DNA

<211>长度:933

     序列名:SEQ ID 141:GDC_MTUB_3388071

     序列描述:

自定义密码子

序列名:SEQ ID 141:GDC_MTUB_3388071

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgctctcct cctggccaag gccagggacg tggtgtacga gtgaaggttc ctcgcgtgat

60 ccttcgggtg gcagtctagg tggtcagtgc tggggtgttg gtggtttgct gcttggcggg

120 ttcttcggtg ctggtcagtg ctgctcgggc tcgggtgagg acctcgaggc ccaggtagcg

180 ccgtccttcg atccattcgt cgtgttgttc ggcgaggacg gctccgacga ggcggatgat

240 cgaggcgcgg tcggggaaga tgcccacgac gtcggttcgg cgtcgtacct ctcggttgag

300 gcgttcctgg gggttgttgg accagatttg gcgccagatc tgcttgggga aggcggtgaa

360 cgccagcagg tcggtgcggg cggtgtcgag gtgctcggcc accgcgggga gtttgtcggt

420 cagagcgtcg agtacccgat catattgggc aacaactga

459

<212>类型:DNA

<211>长度:459

     序列名:SEQ ID 142:GDC_MTUB_3482312

     序列描述:

自定义密码子

序列名:SEQ ID 142:GDC_MTUB_3482312

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgatcagat cgatcgatcg ctgggggtcc gctgccgggg gggcggtcgg cacgcccggt

60 gggaccgact gtaatggccg ctcctcccac ccagctcggt ctgcggcgac gaacacatcg

120 atctcggccc agggcgccgc gggtccctgg gtcaagaatc gggggcgttc cagttttccg

180 gtggcctcat gcagccgcac cgccgccgag acgacctcat catgcctagg ctccggcgcg

240 ccggcgacga acgtgtctgc ccgccaacca gacaccacgt accggccgtc ggtcgatcgg

300 acgggccgag ccaggcgtac gccgtcgacg aacaacgtct cgcgcacccg ggccgaccag

360 gccgcgcggg cgttgtcggc caccatcgac aacaccacct cgccgcatcg ccagccacct

420 tcccaaccgg cacccaacag gatgggttgc gcacctgcca aaccgaacgc caccaacacg

480 tgctcgggcg gcggctcgac attcacaccg gtcagcctag tagagcccat cggggtgtat

540 tgggcctgta tcggtcctag tacatcacca tgtcgggctg catctgcttg gcccacgcga

600 cgatcccacc ctgcaggtgt accgcgtcgg agaaaccggc tttcttga

648

<212>类型:DNA

<211>长度:648

     序列名:SEQ ID 143:GDC_MTUB_3581973

     序列描述:

自定义密码子

序列名:SEQ ID 143:GDC_MTUB_3581973

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg

60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct

120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc

180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc

240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg

300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg

360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag

420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac

480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcagc

540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac

600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt

660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg

720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg

780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac

840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga

897

<212>类型:DNA

<211>长度:897

序列名:SEQ ID 144:GDC MTUB 3711717

序列描述:

自定义密码子

序列名:SEQ ID 144:GDC MTUB 3711717

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgccggatc tcctcgagtt tgcggccctt ggtctccggc gcaaagcggt acacgaccac

60 gaacgcgacg acggcgaacg tgccgaagac cgcgaaaacg cc tgcgccgc cgagcacacg

120 cagcatggtg agcgagaagg cggcaacgat cgcgttggcc gtcagtgtcg aggtgagcat

180 cgggctcgat cccatcgacc gcagccggga cgggaagctc tccgcggcgt acacccagac

240 cagcgagccg aatccgaagt tgaacccgat gatgaacagc agcacgccgg cgaaccccaa

300 caccagcccc gtgccaccat cggagtcgtt ggcgaatacg gtgatcagca cggcatctgc

360 ggtgatcatc gtcgcgatgc cggacaacag gatcgggcga cggcccagcc gatcgaccag

420 aaacagcgag gcacacaccg ccgccaagcc ggcgacttgc accatcgcgg gcagggcaag

480 catcgcgaaa tagcccgcga agcccatggc ggcgaaaagt cgcggactgt agtagatgat

540 cgcgttgatc ccggtgatct ggacgaggaa gccgagcgcg atgacgaaca gcgtggcccg

600 cagatacggc cgccgcacca tttcgccgat accgccgccg cgttcgtcga ccgcggccgc

660 catatcggcc agctcggcat cgatgtcggc ctccggctgg atccgccgca gcgcgctacg

720 cgcgtcggcg atccggccct tgagcagata ccagcgggcg gtatcgggca tgcgccacaa

780 caacggcaac agcagcgtgg ccggcgcggc ggccagcccg aacatcgcgc gccagccgtg

840 cgatccggcc aacaggtagc cgaccaggta accgacgacg atgccgctaa gcgtcgccag

900 ctgatacgcg gtcaccaacg acccacgcac cgccgccggc gccgactcgg ccacatacac

960 cggcaccacc accaccgaca ggccgattgt cacacccagc agcagacgcg ccaccaccag

1020 catc

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 145:GDC_MTUB_3716987

     序列描述:

自定义密码子

序列名:SEQ ID 145:GDC_MTUB_3716987

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgtctgacg ctacgacagt gttgttcggg ctgccaggag cacgggttga gcgtgtcgag

60 cgccgcagtg acgggacccg ggtggtcgat gtgatcaccg atgagccgac ggcggcggcg

120 tgcccgtcgt gcgggggtgg tctcgatatc agtgaaggaa tacgcggtta cctcaccgaa

180 agatctacct tatggcgaag accgcatcat ggtgcgctgg aacaaaattc gctggcgatg

240 ccgagaagac tactgcaagc tggggccgtt caccgaggcc atcacccagg tacctgcccg

300 cgtccgcagc acgctgcggc tgcgtcggca gatggccaag gcgatcgggg atgcggcccg

360 ctcggtgggc cgaggtcgcc caggctgacg ccgtgtcgtg gccgacggca catcgggcgt

420 ttgttgccta cgccgagacg ggtattgacc gagccgttgc ccaccccggt gctgggcgtt

480 gaccagacac ggcgaggaaa acccagatgg gagcgctgcg ccaagactgg ccggtgggta

540 cgggtcgacc cgtgggatac cgggttcgtc gacctggccg gtgatcaggg gtttatgggg

600 cagcatgaag gccgcggcgg cgcggcggtg ctggcatggc tgcaagcgcg cacaccgcag

660 ttccgggaga gcatccagta cggtggccat cgaccccgcc gctgcctacg cctcggcgat

720 ccgcacgccc gggctgctgc ccaacgccaa gctcgtcgtc gaccacttcc atgtgaccac

780 gctggccaac gacgcgctga ccgcggtgcg ccgccgggtg acctgggcgt tccacgaccg

840 gcgcggccgc aagatcgacc cgcagtgggc caaccgacgt cgcttgctga ccgcccggga

900 acgcttgtcg gacaaaagct tcgccaaaat gcggaatcgg atcaacgccg tcgacccccg

960 cgcgcagatt ctctcggcct ggatcgccaa agaggagctg cgcaccctgc tgtcgaccgt

1020 gcgc

1024

<212>类型:DNA

<211>长度:1024

     序列名:SEQ ID 146:GDC_MTUB_3754581

     序列描述:

自定义密码子

序列名:SEQ ID 146:GDC_MTUB_3754581

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcaggcat tgcccgaaag ccagctgcca gagctggccg tgcagatgcg tcggcggctc

60 atagaaacag tgacggctac cggtggccat ctcggcgcgg gacttggcat ggtagagctg

120 accatcgcat tgcatcgggt gttcacctcg ccacacgaca tcggtgttcg acaccgggca

180 ccaaacctat ccgcacaagc tgctcaccgg ccgcggtaa

219

<212>类型:DNA

<211>长度:219

     序列名:SEQ ID 147:GDC_MTUB_3794808

     序列描述:

自定义密码子

序列名:SEQ ID 147:GDC_MTUB_3794808

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgtcttcag aggggggttg gcccaacgtc ggaaacctcg cgcgcagcgc atcaatgaca

60 tcggcagttt catcaagtgc cagggttgtc tgggtcagat acgatagctg ggtaccctcg

120 ggcaggttca acgctgccac atcagcgggt gtctgcacca ataatgttga ccgcggagcg

180 acgccaagcg tgccttcggt ctcctcatgt ccggcgtgcc cgatgaagac caccgtgtca

240 ccgcgcgcgg caaaccgtgc ggcttcagcg tggactttcg ccaccagtgg gcaggtcgcg

300 tcgacgacct gcagtccccg ctcatcagcg cccgcgcgca ccgccgggga aaccccatgc

360 gcggagaaca ccacgaccgc ccccggcggc ggcggatcgg gaatctcgtc gagatcctcg

420 acgaacactg ctccccggtc ccgcaactcg gcaaccacaa cagtgttgtg cacgatttgc

480 ttgcgcacat acaccgggcc ttcggccacg tcaagcactc gcttgaccgt ctcgatagca

540 cgctctacac cggcgcaaaa cgaccgcggc gacgccaaca gcaccgtgac ttcacccgaa

600 gcgtatccct gtgcgaccgg tcccacgaac acctcagcca tcagcactcc cggcgacata

660 tcagttgcga caacgcgatc aggtctgggg atcgcaccgc atcgggcagt gccgcaatag

720

<212>类型:DNA

<211>长度:720

     序列名:SEQ ID 148:GDC_MTUB_3796793

     序列描述:

自定义密码子

序列名:SEQ ID 148:GDC_MTUB_3796793

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcctgggc atcgtcgggg cacgtcggct tcaagggttc ccggaaatcg accccgtttg

60 cggcccagct ggccgcggag aacgccgctc gcaaggccca agaccacggg gtgcgcaagg

120 tcgacgtgtt cgtcaagggc ccgggctcgg gccgcgagac cgcgatccgg tcgctgcagg

180 ccgccggcct ggaggtgggc gcgatctcgg atgtcacccc ccagccgcat aacggtgtcc

240 ggccccccaa gcgccggcgc gtctaggaga gaagatggct cgttacaccg gacccgtcac

300 ccgcaaatca cggcggttgc gcaccgacct cgtcggtggc gaccaggcct tcgagaagcg

360 tccctacccg cccggccaac acggtcgcgc gcggatcaag gaaagcgaat atctgcttca

420 gctgcaggag aagcagaagg cccgtttcac atacggcgta atggaaaagc agttccgccg

480 ctactacgaa gaggccgtgc ggcagcccgg caagacgggt ga

522

<212>类型:DNA

<211>长度:522

     序列名:SEQ ID 149:GDC_MTUB_3879013

     序列描述:

自定义密码子

序列名:SEQ ID 149:GDC_MTUB_3879013

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgggacgcc gtgatcgcgg tgcacctgcg cggccatttt ctgctcaccc gcaacgccgc

60 tgcctactgg cgggacaaag ccaaggatgc cgaaggggga tcggtcttcg gccggctcgt

120 caacacctcg tcggaggcgg gtctggtggg cccggtgggg caggcgaatt acgccgccgc

180 caaggctggc atcaccgcgc taaccctgtc ggcggcgcgg gcgctcgggc gctacggcgt

240 ttgcgccaat gtgatttgtc cgcgggcgcg caccgcgatg acggccgatg tcttcggcgc

300 cgcacccgat gtcgaagcgg gccagatcga cccgctgtcg ccgcagcatg tggtaagcct

360 ggtccagttt ctggcgtccc cggctgccgc ggaagtcaac ggtcaggtgt tcatcgtcta

420 cggtccgcag gtgacgctgg tgtcaccgcc gcacatggag cgccggttca gcgcggacgg

480 cacgtcctgg gatcccaccg agctcaccgc gacgctgcgg gactactttg ctggtcggga

540 tccggaacag agcttttcgg cgaccgatct gatgcgtcag tgacccgtgg atataggcgg

600 ccgattattg gaatcggtgt ccgaatcacc acgccaacat ag

642

<212>类型:DNA

<211>长度:642

     序列名:SEQ ID 150:GDC_MTUB_3921024

     序列描述:

自定义密码子

序列名:SEQ ID 150:GDC_MTUB_3921024

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgccttgga cggcatgttg ctccccttat tcgaacgaca accggaccaa acccagcccg

60 gtgaagtcgg cgacaaactc gtcgccggcc cgcgcctcga ccgcgaacgt gcatgacccg

120 ggtaacacga tgtcgccttt gcgcagccgc acgccgaaac tctcgacctt gccggccagc

180 caagccaccg cggtcgccgg gttacccaac accgcatcac tgcggccctc ggccaccacc

240 tcgccgttgc gggtcagctt cgcatcgatc gccctgacgt caagatcggc cggcggcacc

300 cgggccgcgc ccaacacgaa gcccgccgcc gaggcgttgt cggcgatggt gtcgcagatc

360 ttgatctgcc aatccttgat cctggtgtcg atcagctcga tggcgggcac cagggcctcg

420 gtggccgcca gcacgtcgtc ctcggtgcag cccgcacccg gtaggtcggc ggccaggatg

480 aagcccacct ccacctcaac ccgcggagac aggtaccggg acgcctggac cggcgtgtct

540 tcgaacacct gcatgtcgtc gagcaggtgt ccgtag

576

<212>类型:DNA

<211>长度:576

     序列名:SEQ ID 151:GDC_MTUB_3974481

     序列描述:

自定义密码子

序列名:SEQ ID 151:GDC_MTUB_3974481

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggttcact ctcggcgctc atgggcgcca tcccgccgcc cgcatcgcgg catcgacgcg

60 gccaacgaac gtgccccggc ggtaccagag cagctcactg gtgaccctga tgatcgtcca

120 gcccagatcc agcaacgcgg tggaccgctc gatgtcccga gcccgctgcg ccgggtctgt

180 ccaatgctgt ggcccgtcat actcgacacc gactcgcaat tgctcgtagc ccaggtcgat

240 gcgggcgacg aagtccccgt agtcgtcaaa cactctgatc tgtgtttgcg gcttcggcag

300 accggcatcg atcaacacca atcgggtcca cgtctcctgt ggggattccg cacccccgtc

360 gatcagcggc agcaccgcac ggaggcggac caggccgcgc gcaccggtat gttcggcaat

420 gacggcctgc acgtcggcga ccttgacatc ggtcgaattc gccaacgcgt ccagccgttg

480 aacggcctgc agccgcgagg gtgtgcgccg cccgatatcg aaggcggtgc gcgccggggt

540 ggttaccgcg acaccgtcaa ccgcaaccgt ctcgtgcggc gccaatcgat ccgtgtgcac

600 gacgatgcgc ggcggaggct ttcgattggc gtgcactaa

639

<212>类型:DNA

<211>长度:639

     序列名:SEQ ID 152:GDC_MTUB_3994808

     序列描述:

自定义密码子

序列名:SEQ ID 152:GDC_MTUB_3994808

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgtcgcgct accccaacag ctggcgcagg ttgaacaacc ccgatatggc ggtgcccatg

60 ttaaacaggc ccgtgttcaa gccgctccgg acggagccaa agagggtgcc cgggacgccg

120 atgttgccaa tgcccgaggt ctggccgttg atgacagtgc ccccgctggc cgtgttgaag

180 aacccggaga cgtcgacggc taaggggccg gtgggggtgt tgaagaagcc cgagacgtcg

240 gtgccggtgt tgccgaagcc cgagttggtc aggccgctgt cggtaatgat cccgaaaccg

300 gtgttcacat tgcccgcatt ccacgagccg gtgttgatgt tgcccgagtt cccattgccg

360 gtgttgacgt tgccggagtt gtcaaacccc gtgttgacga agcccgcgtt tccgaagccg

420 gtgtttaatt cacccgcgtt ccccaagccg gtgttgagga tgctcgcgtt cccgaagccg

480 gtgttgagaa cgcccgcgtt cccgaagccg atgttggcgt tgccggaatt cccgacgccc

540 aggttgttga ggtcgccagg caccagggta ttggctccgg tgttgaagac gccgatgttg

600 ccgctgccgg agttgaacaa gccgatgttg ttggtgccgg agttgccgat gccgatattg

660 ccgctgccgg agttcagcag cccggccagg ttgatgccca tctga

705

<212>类型:DNA

<211>长度:705

     序列名:SEQ ID 153:GDC_MTUB_3998938

     序列描述:

自定义密码子

序列名:SEQ ID 153:GDC_MTUB_3998938

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgagctcaa atcatgcgat tctgcgtctg ctcgcgccct tgcggctaga tccccagaac

60 ctgggcgctg gcccacagcg cgagcaccgc catcgccagg gccgcaggca cggtgcacag

120 tcccagtcgg gtgtactcgc cgacgctggc gtcgacgttg tgccggcgca gcacgccccg

180 ccacagcagg ttagacagcg aaccggcata ggtcaggttg ggtccgatgt tgaccccgag

240 tag

243

<212>类型:DNA

<211>长度:243

     序列名:SEQ ID 154:GDC_MTUB_4021183

     序列描述:

自定义密码子

序列名:SEQ ID 154:GDC_MTUB_4021183

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgtgccagg gtgtacccgc ccgattgccg ccggcaaccg acactgttgg tgtagtgacc

60 aaatcagcag tgccccgggt gggtcttgac gtgcaaatcg actacagtct tggtgaccgt

120 ccggtacccg ggcatgggac tggaacgaac caagaaacct gtgaggccgt ctgctatgga

180 gcggttcgac ggtttgcgtc cggccaggct caaggtgggg atcatctcgg ctggccgggt

240 cggcaccgcg ctaggggtcg cgctgcagcg cgccgaccat gttgtggtgg cgtgcagcgc

300 catctctcat gcgtcccggc ggcgcgcgca gcgccggctg cctga

345

<212>类型:DNA

<211>长度:345

     序列名:SEQ ID 155:GDC_MTUB_4045946

     序列描述:

自定义密码子

序列名:SEQ ID 155:GDC_MTUB_4045946

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcggcccg caaaacgggc cgaggaggag ccaggcaatc accccagagc cgggtgcagc

60 gggtcgccac catcagcccc gtggcgatcg caaaccccgc gcctggcgac aatgcggccc

120 gcaaaacggg ccgaggagga gccaggcaat caccccagag ccgggtgcag cgggtcgcca

180 ccatcagccc cgtggcgatc gcaaaccccg cgcctggcga caatgcggcc cgcaaaacgg

240 gccgaggagg agccaggcaa tcaccccaga gccgggtgca gcgggtcgcc accatcagcc

300 ccgtggcgat cgcaaacccc gcgcctggcg acaatgcggc ccgcaaaacg ggccgaggag

360 gagccaggca atcaccccag agccgggtgc agcgggtcgc caccatcagc cccgtggcga

420 tcgcaaaccc cgcgcctggc gacaatgcgg cccgcaaaac gggccgagga ggagccaggc

480 aatcacccca gagccgggtg cagcgggtcg ccactggcta gaccaacgac cggtagttcc

540 cgacggcgtc ggaaaatccg acagctgagc gttcgggtca aacacgcggt gcaccggacc

600 tga

603

<212>类型:DNA

<211>长度:603

     序列名:SEQ ID 156:GDC_MTUB_4053033

     序列描述:

自定义密码子

序列名:SEQ ID 156:GDC_MTUB_4053033

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atgcgcacta cgatcgacct cgatgacgac atactgcggg cgttgaaacg acgccagcgc

60 gaggagcgca aaacgttagg gcagctcgcc tccgaattgc ttgcgcaagc tctggcggcc

120 gagcctcctc caaacgttga catccgctgg tcgactgccg acttgcggcc ccgtgtggat

180 cttgacgaca aggacgctgt ttgggcgatt ttggaccgtg ggtga

225

<212>类型:DNA

<211>长度:225

     序列名:SEQ ID 157:GDC_MTUB_4140236

     序列描述:

自定义密码子

序列名:SEQ ID 157:GDC_MTUB_4140236

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgtcacgtt gtcggattca ctgtcgccgg ctagcgcttt cccgtcagaa gacgagaagc

60 ctccccgatc tccaactagc atcgagatcg ggcttgcgaa ggttgggttg caaaatggat

120 gtcatcagat gggctcgccg gcttgcggtg gtggcgggca cagcagcggc agtgaccact

180 cctgggctac tgagtgcgca cgttccgatg gtctccgccg aaccgtgtcc cgacgtcgag

240 gtggtgtttg cccgtggcac cggggagcca cctggtattg gcagcgtcgg aggactgttc

300 gtcgacgcac tgcgtttccc aggttggcgc caagtcactc ggggtctacg ccgttaa

357

<212>类型:DNA

<211>长度:357

     序列名:SEQ ID 158:GDC_MTUB_4169350

     序列描述:

自定义密码子

序列名:SEQ ID 158:GDC_MTUB_4169350

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtggatgcat gtcattcccg ggcgcggcgc ggcgtggttg atcgtcgacg tccgagatgt

60 ggcggcactg cacgcggcgt tgttggaatc cgggcgtggg ccgcgccgct acactgcggg

120 aggtcatcgg attccggtgc ccgagctcgc gaaaattctg ggcgggtcgc cggcaccacg

180 atgctggccg tcccggtgcc cgattccgcg ctgcgtgtcg cgggatcggt gctggatcaa

240 gccgggccct atctgccttt caatactccg ttcaccgcgg caggtatgca gtactacaca

300 cagatgccgg agtccgacga ttcgccgagc gaaaaagaac taggcatcac ctaccgcgat

360 ccgcgcgaca ccgtggccga caccgtcacg gccctgcgcg gcctgggcag ctaa

414

<212>类型:DNA

<211>长度:414

     序列名:SEQ ID 159:GDC_MTUB_4170798

     序列描述:

自定义密码子

序列名:SEQ ID 159:GDC_MTUB_4170798

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgatgtgga agccgcgctg gcgatggtgt tcgacggctt cggagcggcg aaccaccgcc

60 agcccagatg cctgccgcaa cgtatcgcgg tgccggtcac caagcttaag acttgccggc

120 tcgggatcac cgtggcatcg gatgcgatcg agatccacgg cggcaatggc tacatcgaga

180 cctggccggt ggcccggttg ctgcgtgacg cgcaagtcaa cacgatctgg gagggccccg

240 acaacatcct gtgtctggat gtgcggcgcg ggatcgagca gacgcgcgct cacgagacac

300 tgttggcgcg gctgcgcgat gcggtgtcgg tgtccgacga tgacgacacc acgcggctgg

360 tctcgcgccg cattgaggac ctcgacgcgg cgatcaccgc ttggaccaaa ctcgacaggc

420 agctggccga ggcgcggctg ttcccgctgg cccaattcat gggcgacgtc tacgccggcg

480 cgttgctcac cgagcaggcc gcctgggaac gggcaacccg cggcaccgac cgcaaggcac

540 tcgtcgcccg cctgtacgcg cgccggtatc tcgccgacca aggcccgctg cgcggtatcg

600 acgcagattg cgatgaggcg ctgcagcgtt tcgacgaact cgtggcgggc gcgttcactg

660 ccgagcagac gtaaaagccc ccaattcgtg gctcttctga cacttccgtg ggtgagtttg

720 tgtcctgagt ag

732

<212>类型:DNA

<211>长度:732

     序列名:SEQ ID 160:GDC_MTUB_4252190

     序列描述:

自定义密码子

序列名:SEQ ID 160:GDC_MTUB_4252190

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcgggccc cggcgacccg cgcggccagc cgcggctctt cgaggaattc cgaccagcgc

60 ccgtcgggca ggtcggtgat cccgtcgcgg ccttccagca gcgcctgcca ggtctgctcg

120 ggggtgttca tctcgcccgg gaagcgggtg gacaagccca cgatcgcgat gtcgacgcgc

180 tcggccgggc cggtgcgcga ccagtcttcg gcgtcatcgc ccgctaggtc ggtctccggc

240 tcgccctcga tgatccgggt ggccagcgat tcgatggtcg gatgcgcgaa cgccaccgcg

300 accgacagcg tgaccccggt caggtcttct atgtcggcgg ccatcgcgac ggcatcgcgc

360 gacgacagac ccagctccac catgggcacc gattcgtcga tcgagtccgg tgcctttccg

420 acggccttac ccacccagtt gcgcagccac tggcgcatct cggggaccgt tagctcggcc

480 ctttcggcgg gggcgttctc ctgggattcc gctacgtcag ccatgggtcc tcagtccgaa

540 gtggcgaaga ccgtcgggga acccacgcca ctgcgcaggc tgccgtcgag gtag

594

<212>类型:DNA

<211>长度:594

     序列名:SEQ ID 161:GDC_MTUB_4260620

     序列描述:

自定义密码子

序列名:SEQ ID 161:GDC_MTUB_4260620

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcacgagg acccgcacac tggcgtcgag ccgggtgccg ttacggcgca ccgagattgc

60 cagcacccgc gcccggcctg tggcgatgag ccgttcaatc cggcgtgtgt tctcgtgcgt

120 acggacggtc ccgacgaccg gaagtgtgag atgacggcga tcaggttcga cgcgcatcgc

180 tccggtcgtg aatgtcacgc ggtcctgatc gcggcctttc ttcttgaacc gggggaagcc

240 cattgtcttg ccctcacgtt taccggatcg ggagttctgc cagttccagt acgcatcgac

300 agcgccgcca atgccgtcgg cgtaagcctc tttcgagcac tccggccacc acaccgcccc

360 ggtctcggcg ttgacacaca cctcgtcctt gacggtgttc caccgtttac gaagcacccg

420 cagcgacggc ttgacagtcc cgataccagt aacgcgccac gcctcgatat cggctttcaa

480 agtagcgacc gcccagttgt aggccttgcg gcgagcgccg aaatgccgcg ccagcgcgcg

540 ggcctggtcc tcggttgggt ccagcgtgaa ccggaacgcc tgcacacacc agccttctgg

600 cacctcgaat ctggccatca agctgcctcc gcgtccccga ccgcagcagc aagggcacgc

660 ttggccccgt tctgtgcagc gcgttcacca tag

693

<212>类型:DNA

<211>长度:693

     序列名:SEQ ID 162:GDC_MTUB_4302166

     序列描述:

自定义密码子

序列名:SEQ ID 162:GDC_MTUB_4302166

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

ttgcgcccgt caaggtccac cctgatagcc aaatgcgcca gctggcggca accaccccgt

60 tgtcttcgat ccgcagccgt aaaccgtcgt tcgtcggcgc ccgtcgccca acgtgaactg

120 agggcggaga atcggccgga atctcgccct cagttcacgc tcggcgccgt ttggcctcac

180 ccagtcaatg tgatctgtgc gggcgggcgt tggcgcgtag cgaaccccag tggcgccggc

240 ccgccaagca cgccccggcg cggccagctc atcagcggct acgcaagcgc aacggcgccc

300 gcgatgggct gtggaagaac ccggaggatc tcaccgaaca ccagaatgcc aagctgtcgc

360 gctcatctac tcaaagaagg cctacggcac ctgttttcgg tcaaaggcga agagagtaag

420 caggcactgg accggttgat cttctag

447

<212>类型:DNA

<211>长度:447

     序列名:SEQ ID 163:GDC_MTUB_4317863

     序列描述:

自定义密码子

序列名:SEQ ID 163:GDC_MTUB_4317863

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

gtgcattcgg ctagctcggt tgccacaccc gtcaggggtt cgacgttggc gggttcggcg

60 ggccccagca ccgctgtcac catgcccgcc aagccgacct gcggcgccac caactgcagc

120 accagcatgt cgccgtcgcg cgccgcgatc acatggcggt cgcccctgcg gcacacgacg

180 aagcgcacca tgacgccgcc aatgtcgcgc cgccaccagc gaccctccaa ggtccgatct

240 ggcctgccca gggtttcgac catctccgcg accgtcggtt ggggctcccc gtggaggtcg

300 agcacccctt gcgctgtgag gtcacgctgc acctgttccc agacgatgtc tcgcagatcc

360 tcttgcggga tattcggccg aatcccaagc gtgacaggga aatcaaccag gtgtaaccga

420 tcggcgatca ccaacatgcc gtcgatggtt acctcgacgc cgaccacgtt gtcggcggtg

480 cccgcgcggc ctgcagcgga cggacccgtc atgatcaacc gaaaatcttg tcgataa

537

<212>类型:DNA

<211>长度:537

     序列名:SEQ ID 164:GDC_MTUB_4341852

     序列描述:

自定义密码子

序列名:SEQ ID 164:GDC_MTUB_4341852

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

atggaccgac tctgcggtgc gccgctatgt caccgacgcc ggggccctac tgccacggct

60 gcacaagctg gtgcgcgccg actgcacgac ccgcaacaag cgccgggccg cgcggttgca

120 ggccagttac gaccggctgg aagagcggat cgcggagctg gccgcccagg aggatctgga

180 tcgggtgcgc cccgacctgg acggcaacca gatcatggcg gtgctcgaca ttccggcggg

240 cccgcaagtc ggcgaggcgt ggcgctactt gaaggagctg cggctagagc gcggcccgtt

360 gcttgggagt cgcgtcagaa cggttgtgga gtactgcata gccggcgacg acggcagcgc

420 cgggatctgg aaccgcccgt tcgacgtcga cctcgacggt ga

462

<212>类型:DNA

<211>长度:462

     序列名:SEQ ID 165:GDC_MTUB_4391527

     序列描述:

自定义密码子

序列名:SEQ ID 165:GDC_MTUB_4391527

序列

<213>生物名:Sars冠状病毒(Sars Coronaviris)

<400>前序列链:

gtgacgagct tggcactgat cccattgaag attatgaaca aaactggaac actaagcatg

60 gcagtggtgc actccgtgaa ctcactcgtg agctcaatgg aggtgcagtc actcgctatg

120 tcgacaacaa tttctgtggc ccagatgggt accctcttga ttgcatcaaa gattttctcg

180 cacgcgcggg caagtcaatg tgcactcttt ccgaacaact tgattacatc gagtcgaaga

240 gaggtgtcta ctgctgccgt gaccatgagc atgaaattgc ctggttcact gagcgctctg

300 ataagagcta cgagcaccag acacccttcg aaattaagag tgccaagaaa tttgacactt

360 tcaaagggga atgcccaaag tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac

420 cacgtgttga aaagaaaaag actgagggtt tcatggggcg tatacgctct gtgtaccctg

480 ttgcatctcc acaggagtgt aacaatatgc acttgtctac cttga

525

<212>类型:DNA

<211>长度:525

     序列名:SEQ ID 166:GDC_Sars174_refseq

     序列描述:

自定义密码子

序列名:SEQ ID 166:GDC_Sars174_refseq

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

ttggacctga gcatagtgtt gcagattatc acaaccactc aaacattgaa actcgactcc

60 gcaagggagg taggactaga tgttttggag gctgtgtgtt tgcctatgtt ggctgctata

120 ataagcgtgc ctactgggtt cctcgtgcta gtgctgatat tggctcaggc catactggca

180 ttactggtga caatgtggag accttga

207

<212>类型:DNA

<211>长度:207

     序列名:SEQ ID 167:GDC_Sars68_refseq

     序列描述:

自定义密码子

序列名:SEQ ID 166:GDC_Sars68_refseq

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

atggtgactt cttgcatttt ctacctcgtg tttttagtgc tgttggcaac atttgctaca

60 caccttccaa actcattgag tatagtgatt ttgctacctc tgcttgcgtt cttgctgctg

120 agtgtacaat ttttaaggat gctatgggca aacctgtgcc atattgttat gacactaatt

180 tgctag

186

<212>类型:DNA

<211>长度:186

     序列名:SEQ ID 168:GDC_Sars61_refseq

     序列描述:

自定义密码子

序列名:SEQ ID 168:GDC_Sars61_refseq

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

ttggcacccg caatcctaat aacaatgctg ccaccgtgct acaacttcct caaggaacaa

60 cattgccaaa aggcttctac gcagagggaa gcagaggcgg cagtcaagcc tcttctcgct

120 cctcatcacg tagtcgcggt aattcaagaa attcaactcc tggcagcagt aggggaaatt

180 ctcctgctcg aatggctagc ggaggtggtg aaactgccct cgcgctattg ctgctag

237

<212>类型:DNA

<211>长度:237

     序列名:SEQ ID 169:GDC_Sars78_refseq

     序列描述:

自定义密码子

序列名:SEQ ID 169:GDC_Sars78_refseq

申请项目

<120>名称:

<130>申请文件参考:

<140>当前申请号:

<141>当前提交日期:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VTSLALIPLK IMNKTGTLSM AVVHSVNSLV SSMEVQSLAM STTISVAQMG TLLIASKIFS

60

HARASQCALF PNNLITSSRR EVSTAAVTMS MKLPGSLSAL IRATSTRHPS KLRVPRNLTL

120

SKGNAQSLCF LLTQKSKSFN HVLKRKRLRV SWGVYALCTL LHLHRSVTIC TCLP

174

<212>类型:PRT

<211>长度:174

     序列名:SEQ ID 170:GDC_HINF_5641

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LDLSIVLQII TTTQTLKLDS AREVGLDVLE AVCLPMLAAI ISVPTGFLVL VLILAQAILA

60

LLVTMWRP

68

<212>类型:PRT

<211>长度:68

     序列名:SEQ ID 171:GDC_HINF_6322

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MVTSCIFYLV FLVLLATFAT HLPNSLSIVI LLPLLAFLLL SVQFLRMLWA NLCHIVMTLI

60

C                                                                     6

1

<212>类型:PRT

<211>长度:61

     序列名:SEQ ID 172:GDC_HINF_124181

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LAPAILITML PPCYNFLKEQ HCQKASTQRE AEAAVKPLLA PHHVVAVIQE IQLLAAVGEI

60

LLLEWLAEVV KLPSRYCC

78

<212>类型:PRT

<211>长度:78

     序列名:SEQ ID 173:GDC_HINF_170553

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LLLKGVIMOV SRRKFFKICA GGMAGTSAAM LGFAPANVLA APREYKLLRA FESRNTCTYC

60

AVSCGMLLYS TGKPYNSLSS HTGTNTRSKL FHIEGDPDHP VSRGALCPKG AGSLDYVNSE

120

SRSLYPQYRA PGSDKWERIS WKDAIKRIAR LMKDDRDANF VEKDSNGKTV NRWATTGIMT

180

ASAMSNEAAL LTQKWIRMLG MVPVCNQANT

210

<212>类型:PRT

<211>长度:210

     序列名:SEQ ID 174:GDC_HINF_231874

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MTNNWVDIKN ANLIIVQGGN PAEAHPVGFR WAIEAKKNGA KIIVIDPRFN RTASVADLHA

60

PIRSGSDITF LMGVIRYLLE TNQIQHEYVK HYTNASFLID EGFKFEDGLF VGYNEEKRNY

120

DKSKWNYQFD ENGHAKRDMT LQHPRCVINI LKEHVSRYTP EMVERITGVK QKLFLQICEE

180

IGKTSVPNKT MTHLYALGFT EHSIGTQNIR SMAIIQLLLG NMGMPGGGIN ALRGHSNVQG

240

TTDMGLLPMS LPGYMRLPND KDTSYDQYIN AITPKDIVPN QVNYYRHTSK FFVSMMKTFY

300

GDNATKENGW GFDFLPKADR LYDPITHVKL MNEGKLHGWI LQGFNVLNSL PNKNKTLSGM

360

SKLKYLVVMD PLQTESSEFW RNFGESNNVN PAEIQTEVFR LPTTCFAEEE GSIVNSGRWT

420

QWHWKGCDQP GEALPDVDIL SMLREEMHEL YKKEGGQGIE SFEAMTWNYA QPHSPSAVEL

480

AKELNGYALE DLYDPNGNLM YKKGQLLNGF AHLRDDGTTT SGNWLYVGQW TEKGNQTANR

540

DNSDPSGLGC TIGWGFAWPA NRRVLYSRAS LDINGNPWDK NRQLIKWNGK NWNWFDIADY

600

GTQPPGSDTG PFIMSAEGVG RLFAVDKIAN GPMPEHYEPV ESPIDTNPFH PNVVTDPTLR

660

IYKEDREFIG SNKEYPFVAT TYRLTEHFHS WTAQSALNII AQPQQFVEIG EKLAAEKGIQ

720

KGDMVKITSR RGYIKAVAVV TKRLKDLEID GRVVHHIGLP IHWNMKALNG KGNRGFSTNT

780

LTPSWGEAIT QTPEYKTFLV NIEKVGEA

808

<212>类型:PRT

<211>长度:808

     序列名:SEQ ID 175:GDC_HINF_232170

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 176:GDC_HINF_232813

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VFMLYLEFLF LLLMLYIGSR YGGIGLGVVS GIGLAIEVFV FRMPVGKHRL MLCLSFLQW

59

<212>类型:PRT

<211>长度:59

     序列名:SEQ ID 177:GDC_HINF_233190

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MAAAIQQRAE LQRRIWQIAN DVRGSVDGWD FKQYVLGTLF YRFISENFAN YIEAGDESVN

60

YAQLPDEIIT QMPLKRKATL FTQANYLRML RLMLAAILI

99

<212>类型:PRT

<211>长度:99

     序列名:SEQ ID 178:GDC_HINF_235441

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LNTDLKQIFT DIENSATGFP SEQDIKGLFA DFDTTSNRLG NTVKDKNDRL TAVLKGVAEL

60

DFGKFEDNHI DLFGDAYEYL ISNYAANAGK SGGEFFTPQS VSKLIAQIAM HGQTSVNKIY

120

DPAAGSGSLL LQAKKQFDEH IIEEGFFGQE INHTTYNLAR MNMFLHNINY DKFDIALGNT

180

LMEPQFGDNK PFDAIVSNPP YSVKWAGSDD PTLINDERFA PRRRACTKIQ SGLCLYFTCV

240

KLSFSKRPRG DCFLPWYFLS WRCRAKNSSI FGG

273

<212>类型:PRT

<211>长度:273

     序列名:SEQ ID 179:GDC_HINF_235913

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MMNDLPPAGV LAPKSKADFA FILHALSYLS AKGRAAIVSF PGIFYRGGAE QKIRQYLVDN

60

NYVDAVIALA PNLFFGTSIA VNILVLSKHK PNLSMPAVYL NLPLITTF

108

<212>类型:PRT

<211>长度:108

     序列名:SEQ ID 180:GDC_HINF_240336

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VPHLAKSISF EEIAQNDYNL AVSSYVEQKD TREVINIDEL NAQIRETVTN IDHLRAEIDK

60

IVAEIEG

67

<212>类型:PRT

<211>长度:67

     序列名:SEQ ID 181:GDC_HINF_243018

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MTQYKTIAES NNFIVLDQYN KFVEESNAGY QTERSLEREF IRDLQAQGYE YLQWLNNHDE

60

LIKNLRAQLQ RLNNVVFSDA EWQRFLEEYL DKPSDNLIEK TRKIHDDYIY DFVFDNGRIQ

120

NIYLLDKKNL ANNSLQVINQ FKQTGSYDNR YDVTILVNGL PLY

163

<212>类型:PRT

<211>长度:163

     序列名:SEQ ID 182:GDC_HINF_274892

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MVYPFIELKK RGVAIREAFN QIHRYSKESF NKENSLFKYI QIFVISNGTD TRYFANTTKR

60

NKNSYDFTMN WATAKNTLIK DLKDFTATFL QKNTLLNVLV NYCVFDVSDT LLIMRPYQIA

120

ATERILWKIQ ISYLAKNWSN RESGGYIWHT TGSGKTLTSF KASRLATELD FIDKVFFVVD

180

RKDLDYQTMK EYQRFSPDSV NGSESTAGLK RNIEKDDNKI IVTTIQKLNN LMKSEENLSI

240

YQKQVVFIFD EAHRSQFGEA QKNLKRKFKK FYQFGFTGTP IFPENALGAE TTASVFGAEL

300

HSYVITDAIR DDKVLKFKVD YNDVRPQFKA LETEKDPEKL TALEQKQAFL HPERIKEISQ

360

YLLNNFKQKT HRLNATGKGF NAMFAVSSVE AAKRYYETLQ NLQAEQEYPL KIATIFSFAA

420

NEEQDAIGDI PDETFEPTAL NSTAKEFLTK AIDDYNHYFG TNYGVDSQSF QNYYRDLAKR

480

VKNQEVDLLI VVGMFLTGFD APTLNTLFVD KNLRYHGLMQ AFSRTNRIYD TTKTFGNIVT

540

FRDLEQNTID AITLFGDKNT KNVVLEKSYD SYFNGDDNQR GYAEIVKELK ESFPDPTEIE

600

TEQDKKEFVK LFGEYLRVEN ILQNYDEFAA LQALQAVDLN DPIAMEKFKQ VHYVNDEQIA

660

EMLKVPTLPV RAEQDYRSTY NDIRDWLRQR KEGNDKDNSP INWDDVVFEV DLLKSQEINL

720

DYILALIFEH HKKNQDKEVL IDEIRRTVRS SLGNRAKESL IVDFINQTNL DDIPDKATLI

780

DSFFLFAQAE QRKEAESLIQ EENLNVDAAK RYISTSLKRE YASENGTALN EVLPKMSLLK

840

PQYLTKKQKI FQKIAAFVEK FKGVGGKI

868

<212>类型:PRT

<211>长度:868

     序列名:SEQ ID 183:GDC_HINF_276992

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MDIIKPICTG FFYNDNNVLG DLMKNFKYFA QSYVDWVIRL GRLRFSLLGV MILAVLALCT

60

QILFSLFIVH QISWVDIFRS VTFGLLTAPF VIYFFTLLVE KLEHSRLDLS SSVNRLENEV

120

AERIAAQKKL SQALEKLEKN SRDKSTLLAT ISHEFRTPLN GIVGLSQILL DDELDDLQRN

180

YLKTINISAV SLGYIFSDII DLEKIDASRI ELNRQPTDFP ALLNDIYNFA SFLAKEKNLI

240

FSLELEPNLP NWLNLDRVRL SQILWNLISN AVKFTDQGNI ILKIMRNQDC YHFIVKDTGM

300

GISPEEQKHI FEMYYQVKES RQQSAGSGIG LAISKNLAQL MGRGFNS

347

<212>类型:PRT

<211>长度:347

     序列名:SEQ ID 184:GDC_HINF_370413

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 185:GDC_HINF_370747

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VNIHGLAKLN GNVTLIDHSQ FTLSNNATQT GNIKLSNHAN ATVNNATLNG NVHLTDSAQF

60

SLKNSHFWHQ IQGDKDTTVT LENATWTMPS DTTLQNLTLN NSTVTLNSAY SASSNNAPRH

120

RRSLETETTP TSAEHRFNTL TVNGKLSGQG TFQFTSSLFG YKSDKLKLSN DAEGDYTLSV

180

RNTGKEPVTL EQLTLIESLD NKPLSDKLKF TLENDHVDAG ALRYKLVKNK GEFRLHNPIK

240

EQELLNDLVR AEQAEQTLEA KQVEQTAEKQ KSKAKARSRR AVLSDTPSAQ SLLNALEAKQ

300

VEQTTETQTS KPKTKKGRSK RALSAAFSDT PFDLSQLKVF EVKLEVINAQ PQVKKEPQDQ

360

EEQGKQKELI SRYSNSALSE LSATVNSMFS VQDELDRLFV DQAQSALWTN IAQDKRRYDS

420

DAFRAYQQKT NLRQIGVQKA LDNGRIGAVF SHSRSDNTFD EQVKNHATLT MMSGFAQYQW

480

GDLQFGVNVG AGISASKMAE EQSRKIHRKA INYGVNASYQ FRLGQLGIQP YLGVNRYFIE

540

RENYQSEEVK VQTPSLAFNR YNAGIRVDYT FTPTNNISVK PYFFVNYVDV SNANVQTTVN

600

STMLQQSFGR YWQKEVGLKA EILHFQLSAF ISKSQGSQLG KQQNVGVKLG YRW

653

<212>类型:PRT

<211>长度:653

     序列名:SEQ ID 186:GDC_HINF_628407

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MKKTVFRLNF LTACVSLGIA SQAWAGHTYF GIDYQYYRDF AENKGKFTVG AKNIEVYNKE

60

GQLVGTSMTK APMIDFSVVS RNGVAALVGD QYIVSVAHNG GYNDVDFGAE GRNPDQHRFT

120

YQIVKRNNYQ AWERKHPYDG DYHMPRLHKF VTEAEPVGMT TNMDGKVYAD RENYPERVRI

180

GSGRQYWRTD KDEETNVHSS YYVSGAYRYL TAGNTHTQSG NGNGTVNLSG NVVSPNHYGP

240

LPTGGSKGDS GSPMFIYDAK KKQWLINAVL QTGHPFFGRG NGFQLIREEW FYNEVLAVDT

300

PSVFQRYIPP INGHYSFVSN NDGTGKLTLT RPSKDGSKAK SEVGTVKLFN PSLNQTAKEH

360

VKAAAGYNIY QPRMEYGKNI YLGDQGKGTL TIENNINQGA GGLYFEGNFV VKGKQNNITW

420

QGAGVSIGQD ATVEWKVHNP ENDRLSKIGI GTLLVNGKGK NLGSLSAGNG KVILDQQADE

480

AGQKQAFKEV GIVSGRATVQ LNSTDQVDPN NIYFGFRGGR LDLNGHSLTF KRIQNTDEGA

540

MIVNHNTTQV ANITITGNES ITAPSNKKNI NKLDYSKEIA YNGWFGETDK NKHNGRLNLI

600

YKPTTEDRTL LLSGGTNLKG DITQTKGKLF FSGRPTPHAY NHLDKRWSEM EGIPQGEIVW

660

DYDWINRTFK AENFQIKGGS AVVSRNVSSI EGNWTVSNNA NATFGVVPN

709

<212>类型:PRT

<211>长度:709

     序列名:SEQ ID 187:GDC_HINF_654365

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VGENAMNLSR RDFMKANAAM AAATAAGLTI PVKNVVAAES EIKWDKAVCR FCGTGCAVLV

60

GTKDGRVVAS QGDPDAEVNR GLNCIKGYFL PKIMYGKDRL TQPLLRMTNG KFDKNGDFAP

120

VSWDFAVQNN G

131

<212>类型:PRT

<211>长度:131

     序列名:SEQ ID 188:GDC_HINF_661444

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LIRTAILRQF LGILPFKTMA EKFKEAFKKN GQNAVGMFSS GQSTIWEGYA KNKLWKAGFR

60

SNNVDPNARH CMASAAVAFM RTFGMDEPMG CYNDIEQADA FVLWGSNMAE MHPILWSRIT

120

DRRISNPDVR VTVLSTYEHR SFELADHGLI FTPQTDLAIM NYIINYLIQN NAINWDFVNK

180

HTKFKRGETN IGYGLRPEHP LEKDTNRKTA GKMHDSSFEE LKQLVSEYTV EKVSKMSGLD

240

KVQLETLAKL YADPTKKVVS YWTMGFNQHT RGVWVNQLIY NIHLLTGKIS IPGCGPFSLT

300

GQPSACGTAR EVGSFPHRLP ADLVVTNPKH REIAERIWKL PKGTVSEKVG LHTIAQDRAM

360

NDGEMNVLWQ MCNNNMQAGP NINQERLPGW RKEGNFVIVS DPYPTVSALS ADLILPTAMW

420

VEKEGAYGNA ERRTQFWRQQ VKAPGEAKSD LWQLMEFAKY FTTDEMWTED LLAQMPEYRG

480

KTLYEVLFKN GQVDKFPLSE LAEGQLNDES EYFGYYVHKG LFEEYAEFGR GHGHDLAPFD

540

MYHKARGLRW PVVEGKETLW RYREGYDPYV KEGEGVAFYG YPDKKAIILA VPYEPPAESP

600

DNEYDLWLST GRVLEHWHTG TMTRRVPELH RAFPNNLVWM HPLDAQARGL RHGDKIKISS

660

RRGEMISYLD TRGRNKPPRG LVFTTFFDAG QLANSLTLDA TDPISKETDF KKCAVKVEKA

720

A                                                                     72

1

<212>类型:PRT

<211>长度:721

     序列名:SEQ ID 189:GDC_HINF_737160

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VMSRRRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 190:GDC_HINF_775792

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LVMFNDFLAT FSQQLTPQMW GVVATATYET VYISFASTLL AVLVGVPVGI WTFLTGKNEI

60

LQNNRTHFVL NTIINIGRSI PFIILLLILL PVTRFIVGTV LGTTAAIIPL SICAMPFVAR

120

LTANALMEIP NGLTEAAQAM GATKWQIVRK FYLSEALPTL INGVTLTLVT LVGYSAMAGT

180

QGGGGLGSLA INYGRISQYA LCNLGGNHYY CAIRYD

216

<212>类型:PRT

<211>长度:216

     序列名:SEQ ID 191:GDC_HINF_848166

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 192:GDC_HINF_928073

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LRKDALPAFF TDVNQMYDAL LNKSGATGVF TDFPDTCVEF LKGIK

45

<212>类型:PRT

<211>长度:45

     序列名:SEQ ID 193:GDC_HINF_929037

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 194:GDC_HINF_1018846

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LPKPEPIPRP RRLALCFAPS AGDRVFKRIS YSSTLTMYET WLIIPRTAGV SINSTVWCIW

60

RRPRPRKVAL CFGKRAIELR TCVTLIVLAI IHYPKISSTV LPRFAATISG DFIFANASIV

120

ARTTLIGLVE PYALERTLRT PATSNTARIA PPAMIPVPSL AGCINTREPV

170

<212>类型:PRT

<211>长度:170

     序列名:SEQ ID 195:GDC_HINF_1021582

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LFIYGGINMQ ITLSNTLAND AWGKNAILSF DSNKAMIHLK NNGKTDRTLV QQAARKLRGQ

60

GIKEVELVGE KWDLEFCWAF YQGFYTAKQD YAIEFPHLDD EPQDELLARI ECGDFVRGII

120

NEPAQSLTPV KLVERAAEEI LNQADIYNEK SAVSFKIISG EELEQQGYHG IWTVGKGSAN

180

LPAMLQLDFN PTQDSNAPVL ACLVGKGITF DSGGYSIKPS DGMSTMRTDM GGAALLTGAL

240

GFAIARGLNQ RVKLYLCCAE NLVSNNAFKL GDIITYKNGV SAEVLNTDAE GRLVLADGLI

300

EADNQNPGFI IDCATLTGAA KSGCRKRLSF CIIYG

335

<212>类型:PRT

<211>长度:335

     序列名:SEQ ID 196:GDC_HINF_1082407

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VAVGNDYHSV LSMDDELVKN LFQSAQAENE PFWRLPFEDF HRSQINSSFA DIANIGSVPV

60

GAGASTATAF LSYFVKNYKQ NWLHIDCSAT YRKSGSDLWS VGATGIGVQT LANLMLSRSL

120

K                                                                     12

1

<212>类型:PRT

<211>长度:121

     序列名:SEQ ID 197:GDC_HINF_1144501

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LPIELKVEGL VGKPNEKISA AEFRQKCREY AAEQVEGQKK DFIRLGVLGD WDNPYLTMNF

60

DTEANIIRTL GKVIENGHLY KGSKPVHWCL DCGSSLAEAE VEYEDKVSPS IYVRFPAESA

120

DEIEAKFSAQ GRGQGKLSAI IWTTTPWTMP SNRAIAVNAD LEYNLVQLGD ERVILAAELV

180

ESVAKAVGIE HIEILGSVKG DDLELSRFHH PFYDFTVPVI LGDHVTTDGG TGLVHTAPDH

240

GLDDFIVGKQ YDLPMAGLVS NDGKFISTTE FFAGKGVFEA NPLVIEKLQE VGNLLKVEKI

300

KHSYPHCWRH KTPIIFRATP QWFIGMETQG LRQQALGEIK QVRWIPDWGQ ARIEKMVENR

360

PDWCISRQRT WGVPMTLFVH KETEELHPRT LDLLEEVAKR VERAGIQAWW DLDEKELLGA

420

DAETYRKVPD TLDVWFDSGS TYSSVVANRL EFNGQDIDMY LEGSDQHRGW FMSSLMLSTA

480

TDSKAPYKQV LTHGFTVDGQ GRKMSKSIGN IVTPQEVMDK FGGDILRLWV ASTDYTGEMT

540

VSDEILKRAA DSYRRIRNTA RFLLANLNGF DPKRDLVKPE KMISLDRWAV ACALDAQNEI

600

KDAYDNYQFH TVVQRLMRFC SVEMGSFYLD IIKDRQYTTK ADSLARRSCQ TALWHIAEAL

660

VRWMAPILSF TADEIWQHLP QTESARAEFV FTEEFYQGLF GLGEDEKLDD AYWQQLIKVR

720

SEVNRVLEIS RNNKEIGGGL EAEVTVYAND EYRALLAQLG NELRFVLITS KVDVKSLSEK

780

PADLADSELE GIAVSVTRSN AEKCPRCWHY SDEIGVSPEH PTLCARCVEN VVGNGEVRYF

840

A                                                                     84

1

<212>类型:PRT

<211>长度:841

     序列名:SEQ ID 198:GDC_HINF_1279189

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LENKMTVDYK NTLNLPETSF PMRGDLAKRE PDK

33

<212>类型:PRT

<211>长度:33

     序列名:SEQ ID 199:GDC_HINF_1347200

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MKITHCKLKK SIQNKLLEFF VLEVTARAAA DLLDI

35

<212>类型:PRT

<211>长度:35

     序列名:SEQ ID 200:GDC_HINF_1347942

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LFLVGNLLRW VWLALFIIAQ IWAYVQTPDS WLAMISGISG ILCVVLVSKG KISNYFFGLI

60

FAYTYFYVAW GSNFLGEMNT VLYVYLPSQF IGYFMWKANM QNSDGGESVI AKALTVKGWM

120

TLIVVTTVGT LLFVQALQAA GGSSTGLDGL TTIITVAAQI LMILPLS

167

<212>类型:PRT

<211>长度:167

     序列名:SEQ ID 201:GDC_HINF_1476415

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MFSGEHDACD CYVDLQAGSG GTEAQDWTEM LLRMYLRWAE SKGFKTELME VSDGDVAGLK

60

SATIKVSGEY AFGWLRTETG IHRLVRKSPF DSNNRRHTSF SAAFVYPEID DDIDIEINPA

120

DLRIDVYRAS GAGGQHVNKT ESAVRITHMP SGIVVQCQND RSQHKNKDQA MKQLKAKLYE

180

LELQKKNADK QAMEDNKSDI GWGSQIRSYV LDDSRIKDLR TGVENRNTQA VLDGDLDRFI

240

EASLKAGL

248

<212>类型:PRT

<211>长度:248

     序列名:SEQ ID 202:GDC_HINF_1476557

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LLGNEKQAEA QAKYAEDTLK QARDFAKQHH KTAYLARNAD GLQTGQKGSI HTEAMELVGL

60

ENVAEGEQKG LTQVSMEQLL L

81

<212>类型:PRT

<211>长度:81

     序列名:SEQ ID 203:GDC_HINF_1505851

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LPRIFAACFV GAALACGGAT YQGMFKNPLV SPDILGVSAG AGFGASLAIF YNLPMIYIQF

60

FAFSGGILAV LCVSLIASRS RTQDPILVLV LSGIAIGSLL GAGISLLKIL ADPFTQLPSI

120

TFWLLGSLTA INQQDLIQLI PMLLLGIVPI FLLLTDTLAR TIAPIELPLG ILTSACGY

178

<212>类型:PRT

<211>长度:178

     序列名:SEQ ID 204:GDC_HINF_1524561

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LKNSLRELKD YTVVIVTHNM QQATRCSDYT AFMYLGELVE FGQTQQIFDR PKIQRTEDYI

60

RGKMG

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 205:GDC_HINF_1568974

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MISLQETKIA VQNLNFYYED FHALKNINLR IAKNKVTAFI GPSGCGKSTL LRSFNRMFEL

60

YPNQKATGEI NLDGENLLTT KMDISLIRAK VGMVFQKPTP FPMSIYDNIA FGVRLFEKLS

120

KEKMNERVEW ALTKAALWNE VKDKLHKSGD SLSGGQQQRL CIARGIAIKP SVLLLDEPCS

180

ALDPISTMKI EELITGVKLY CGYSNS

206

<212>类型:PRT

<211>长度:206

     序列名:SEQ ID 206:GDC_HINF_1586944

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MSQLNIQFPT KFKPLFESIW RFIIFYGGRG SGKSFSIARA LVLRAYQSPV RVLCSVKFRN

60

RFLIL

65

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 207:GDC_HINF_1594339

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

VVPEFIIVSL ILVAQSMKLA LNKWLIIFGN AIALHIKYAL LRLNFEGVVG EILEKVDNGQ

60

MGVVLKRMMV RAASKVAQRF NIEAIVTGEA LGQVSSQTLT NLRLIDEAAD ALVLRPLITH

120

DKEQIIAMAK EIGTDDIAKS MPEFCGVISK NPTIKAVREK ILKEEGHFNF EILESAVQNA

180

KYLDIRQIAE ETKAVVEVEA ISVLGENEVI LDIRSPEETD EKPFESGTHD VIQMPFYKLS

240

SQFGSLDQSK SYVLYCERGV MSKLQALYLK ENGFSNVRVF AKNIH

285

<212>类型:PRT

<211>长度:285

     序列名:SEQ ID 208:GDC_HINF_1634710

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LAIAIGGGNR GNASGVLRQN FAEDKAKKTA SKLVGVMAHY FGGKSFYLPA GDKIKEALRD

60

AQIYQEFNGK NVPDLIKKYR LSESTIYAIL RNQRTLQRKR HQMDFNFS

108

<212>类型:PRT

<211>长度:108

     序列名:SEQ ID 209:GDC_HINF_1638626

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LFRWHYLGGF TVMPDTNNTE TNNKIELYLN GKILSGWKSL NLQRSLESMS GRFDLGIAVR

60

PEDDISVLAA GSPLVLKMGG QTVITGYLDE IKQRVSGNDK TISVSGRDKT CDLVDCAIIH

120

NSYQFKNQTA KQIAEAICKP FGISVVWQVQ APEANERIPV WQVEPGETAF DNLSKIARHK

180

GVLVTSDVDG NLLFTEPSNK QVGNLTLGEN LLELEQTDSW LQRFSLYRVI GDAEQGGAKG

240

DTKTKNKAAK GKEKDDGVVE DPDIYPGPAE GGK

273

<212>类型:PRT

<211>长度:273

     序列名:SEQ ID 210:GDC_HINF_1639409

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

MKVSYRLNNC LSLKLALI PLLILLFVVMGS VLSLIAKLDF YFFQQILFNS ELHFALLMSL

60

GTSLFSLILA LCIAIPSAWR MSQVRLPFQS FFDTLFDLPM VLPPLVTGLS LLLLFSSQGI

120

LAELLPFISK WIFSPVGIII AQTYIASSIL LRCSEPLKLR KKTIKTTKIK P

171

<212>类型:PRT

<211>长度:171

     序列名:SEQ ID 211:GDC_HINF_1660491

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LTKRKNVSFT YENYTVTPFW DTLKLSYSQQ RITTRARTED YCDGNEKCDS YKNPLGLQLK

60

EGKVVDRNGD PVELKLVEDE QGQKRHQVVD KYNNPFSVAS GTNNDAFVGK QLSPSEFWLD

120

CSTFNCDKPV RVYKYQYSNQ EPESKEVELN RTMEINGKKF ATYESNNYRD RYHMILPNSK

180

GYLPLDYKER DLNTKTKQIN LDLTKAFTLF EIENELSYGG VYAKTTKEMV NKAGYYGRNP

240

TWWAERTLGK SLLNGLRTCK EDSSYNGLLC PRHEPKTSFL IPVETTTKSL YFADNIKLHN

300

MLSVDLGYRY DDIKYQPEYI PGVTPKIADD MVRELFVPLP PANGKDWQGN PVYTPEQIRK

360

NAEENIAYIA QEKRFKKHSY SLGATFDPLN FLRVQVKYSK GFRTPTSDEL YFTFKHPDFT

420

ILPNPNMKPE EAKNQEIALT FHHDWGFFST NVFQTKYRQF IDLAYLGSRN LSNSVGGQAQ

480

ARDFQVYQNV NVDRAKVKGV EINSRLNIGY FFEKLDGFNV SYKFTYQRGR LDGNRPMNAI

540

QPKTSVIGLG YDHKEQRFGA DLYVTHVSAK KAKDTYNMFY KEQGYKDSAV RWRSDDYTLV

600

DFVTYIKPVK NVTLQFGVYN LTDRKYLTWE SARSIKPFGT SNLINQGTGA GINRFYSPGR

660

NYKLSAEITF

670

<212>类型:PRT

<211>长度:670

     序列名:SEQ ID 212:GDC_HINF_1807963

     序列描述:

序列

<213>生物名:流感嗜血菌(Haemophilus influenzae)

<400>前序列链:

LRERSSLSAL MAKTIEWDFI TENPLKYLEK PKAPAPRTRR YNEHEIERLI FVSGYDVEHI

60

EPPKTLQNCT GAAFLFAIET AMRAGEIASL TWNNINFEKR TTFLPITKNG HSRTVPLSVK

120

AIEILQHLTS VKTESDPRVF QMEARQLDHN FRKLKKMEGL ENANLHFHDT RRERLAEKVD

180

VMVLAKISGH RDLSILQNTY YAPDMAEGYK TKAGYDLTPT KGLSQRNFFF FNENFIVFTT

240

NPPIVIKL

248

<212>类型:PRT

<211>长度:248

     序列名:SEQ ID 213:GDC_HINF_1817220

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MATIIKNGKR WHAQVRKFGV SKSAIFLTQA DAKKWAEMLE KQLESGKYNE IPDITLDELI

60

DKYLKEVTVT KRGKREERIR LLRLSRTPLA AISLQEIGKA HFREW

105

<212>类型:PRT

<211>长度:105

     序列名:SEQ ID 214:GDC_HPYL_51094

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MEAVQLDKNQ EPNYKGYSGS LIHPAFQQQT TKREKPSTPL PSLDLLLKYP PNEQRITPDE

60

IMETSQRIEQ QLRNFNVKAS VKDVLVGPVV TRYELELQPG VKASKVTSID TDLARALMFR

120

SIRVAEVIPG KPYIGIETPN LHRQMVPLRD VLDSNEFRDS KATLPIALGK DISGKPVIVD

180

LAKMPHLLVA GSTGSGKSVG VNTMILSLLY RVQPEDVKFI MIDPKVVELS VYNDIPHLLT

240

PVVTDMKKAA NALRWCVDEM ERRYQLLSAL RVRNIEGFNE KIDEYEAMGM PVPNPIWRLG

300

DTMDAMPPAL KKLSYIVVIV DEFADLMMVA GKQIEELIAR LAQKARAIGI HLILATQRPS

360

VDVITGLIKA NIPSRIAFTV ASKIDSRTIL DQGGAEALLG RGDMLYSGQG SSDLIRVHGA

420

YMSDDEVINI ADDWRARGKP DYIDGILESA DDEESSEKGI SSGGELDPLF DEVMDFVINT

480

GTTSVSSIQR KFSVGFNRAA RIMDQMEEQG IVSPMQNGKR EILSHRPEY

529

<212>类型:PRT

<211>长度:529

     序列名:SEQ ID 215:GDC_HPYL_155367

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MNKIFKVIWN VVTQTWVVVS ELTRAHTKRT SATVATAVLA TVLSATVQAI NDAGTFVKVQ

60

STEDDIEDSA ATKDDNKNQA LKAGDTLTLK AGKNLKAKLD QGGKSVTFAL AKDLDVKTAK

120

VSDTLTIGGN TPAAGGATPK VSITSTADGL KLAKGTNGDT AVHLNGLAST LPDVTTNTGA

180

STSVTFSPSD IEKTRAATIK DVLNAGWNIK GAKVAGGNTE NVDLVAGYDN VEFITGDKNT

240

LDVVLTAKEN GKTTEVKFTP KTSVIKDNNG KLLTGKQLKD ANTGTATNAT EDTDEAMA

298

<212>类型:PRT

<211>长度:298

     序列名:SEQ ID 216:GDC_HPYL_447632

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL

60

LIPLH

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 217:GDC_HPYL_506250

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MFAVHAAMIT TLKKEVFFLY LYIKSLKIPI PTTLKYMISL GKIRELDVLA NLAKLCPTCH

60

RALKKGSSEE EFQKRLIRNI LNRNKDNLEF AQLRFETDDF STLIDRICES LK

112

<212>类型:PRT

<211>长度:112

     序列名:SEQ ID 218:GDC_HPYL_583607

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MIKQTLIILA PFFIATLLYF LGAPDGLRPN AWLYFCIFMG MIIGLILEPV PSGLIALSAL

60

VLCIALKIGA SDKVASANKA ISWGLSGYAN KTVWLVFVAF ILGLGYEKSL LGKRIALLLI

120

RFLGQTPLGL GYAIGLSELC LAPFIPSNSA RSGGILYPIV SSIPPLMGST FNNNPDKIGA

180

YLMWVALAST CITSSMFLTA LAPNPLAMEI AAKMGVNEIS WFSWFLAFLP CGVVLILLVP

240

LLAYKTCKPT LKGSKEVSLW AKKRN

265

<212>类型:PRT

<211>长度:265

     序列名:SEQ ID 219:GDC_HPYL_583883

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL

60

VPLHSTCDFQ PQ

72

<212>类型:PRT

<211>长度:72

     序列名:SEQ ID 220:GDC_HPYL_665045

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

VQLHCHNLPC VSIDILLGGP PCQSYSTLGK RKMDEKANLF KEYLRLLDLV KPKIFVFENV

60

VGLMSMQKGQ LFKQICNAFK ERDYILEHAI LNALDYGVPQ MRERVILVGV LKSFKQKFYF

120

PKPIKTHFSL KDALGDLPPI QSGENGDALG YLKNADNVFL EFVRNSKELS EHSSPKNNEK

180

LIKIMQTLKD GQSKDDLPES LRPKSGYINT YAKMWWEKPA PTITRNFSTP SSSRCIHPRD

240

SRALSIREGA RLQSFPDNYK FCGSGSAKRL QIGNAVPPLL SVALAQAVFD FLKG

294

<212>类型:PRT

<211>长度:294

     序列名:SEQ ID 221:GDC_HPYL_953783

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

LMEFDVTIID ETGRATAPEI LIPALRTKKL ILIGDHNQLP PSIDRYLLEQ LESDDIQNLD

60

AIDRQLLEES FFENLYKYIP ESNKAMLNE

89

<212>类型:PRT

<211>长度:89

     序列名:SEQ ID 222:GDC_HPYL_954679

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MPASIGSLVS QLFYKEKLKN GVIKNTSQFY DPKNIIRWIN VEGEHQLEKT SSYNKNQVQK

60

IIELLEQINR VLNQRKIRKT IGIITPYNAQ KRCLRSEVEK YGFKNFDELK IDTVDAFQGE

120

KADIIIYSTV KTYGNLSFLI DSKRLNVAIS RAKENLIFVG KKSFFENLRS DEKNIFSAIL

180

QVCR

184

<212>类型:PRT

<211>长度:184

     序列名:SEQ ID 223:GDC_HPYL_954846

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

LIIETQQDPK ELPESCKITP QKISFNQVVF KKIKRKLNRF IGSILARTEV YKNLVAKYDE

60

LTGKYESLLA KEANIKETFW ERRADSEKEA FFLEHFYLTS VYVASTAGYY ITPKGAKTFI

120

EATERFKIIE PVDMFINNPT YHDVANFTYL PCPVSLNKHA FNSTIQNAKK PDISLKPPRK

180

SYFDNLFYDQ LNTRKCLKAF HKYSRRYAPL KTPKEV

216

<212>类型:PRT

<211>长度:216

     序列名:SEQ ID 224:GDC_HPYL_955261

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

LMEILVLNLG SSSIKFKLFD MKENKPLASG LAEKIGEEIG QLKIKSHLHH NDQELKEKFV

60

IKDHASGLLM IRENLTKMGI IKDFNQIDAI GHRVVQGGDK FHAPVLVNEK VMQEIGNLSI

120

LAPLHNPANL AGIEFVQKAH PHIPQIAVFD TAFHATMPSY AYMYALPYEL YEKYQIRHYG

180

FHRTSHHYVA KEAAKFLNTA YEEFNAISLH LGNGSSAAAI QKGKSVDTSM GLTPLEGLIM

240

GTRCGDIDPT VVEYTAQCAN KSLEEVMKML NHESGLKGIC GDNEKHRSQK RKR

293

<212>类型:PRT

<211>长度:293

     序列名:SEQ ID 225:GDC_HPYL_1068602

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

MPNSQVAGQA SVFIFPDLNA GNIAYKAVQR SAKAVAIGPI LQGLNKPIND LSRGALVEDI

60

INTVLISALQ AQD

73

<212>类型:PRT

<211>长度:73

     序列名:SEQ ID 226:GDC_HPYL_1069456

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

VSLVSSVFLM CLDTQVLVFG DCAIIPNPSP KELAEIATTS AQTAKQFNIA PKVALLSYAT

60

GDSAQGEMID KINEALTIAQ KLDPQLEIDG PLQFDASIDK SVAKKKCDTA KWLGKLAFLF

120

SRI

123

<212>类型:PRT

<211>长度:123

     序列名:SEQ ID 227:GDC_HPYL_1376803

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

LKAAHRLNLM GAVGLILLGD KEAINSKNLN LNLENVEIID PNTSHYREEF AKSLYELRKS

6Q

KGLSEQEAKQ LVLDKTYFAT MLVHSGYVHA MVSGVNHS

98

<212>类型:PRT

<211>长度:98

     序列名:SEQ ID 228:GDC_HPYL_1474291

     序列描述:

序列

<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695

<400>前序列链:

VKQISISCSH RKYFVSFSVE YEQDITPIKN TKNGVGLDLN ILDIACSCEI NNHDKLTDFK

60

QYQTDMKELL GIEIDEELDT KRLIPTYSKL YSLKKYSKKF KRLQRKQSRR VLKSKQNKTK

120

LGGNFYKTQK KLNQAFDKSS HQKTDRYHKI TSELSKQFEL IVVEDLQVKN MTKRAKLKNV

180

KQKSGLNQSI LNASFYQIIS FLDYKQQHNG KLLVKVPPQY TSKTCHCCGN INHKLKLNHR

240

QYWCLECGYR EHRDINAANN ILSKGLSLFG VGNIHADFKE QSLSC

285

<212>类型:PRT

<211>长度:285

     序列名:SEQ ID 229:GDC_HPYL_1600102

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MKVNKGFKFR LYPTKEQQDK LQHCFFVYNQ AYNIGLNELQ EQYETNKDSP PKERKYKKSS

60

ELDNAIKQCL RARDLPFSAV IAQQARMNVE RALKDAFKVK NRGFPKFKNS KSAKQSFSWN

120

NQGFSIKESD DECFKTFTLM KMPLLMRMHR DFPLILK

157

<212>类型:PRT

<211>长度:157

     序列名:SEQ ID 230:GDC_MTUB_26830

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LIFITHFSTE PLPLPILVSK GLAVKGLSGN TLIHTLPALL MCLVMATLAD SIWRESILPC

60

SMALIAISPN AMELPRWAFP RLRPFICFLY FVLFGINMII ASLFCFF

107

<212>类型:PRT

<211>长度:107

     序列名:SEQ ID 231:GDC_MTUB_36276

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL

60

VPLHSTCDFQ PQ

72

<212>类型:PRT

<211>长度:72

     序列名:SEQ ID 232:GDC_MTUB_76032

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LNAAFKERRF ILVQLDEKID PKEDKSAYDF CLNTLKSPSP SIFDITEERI KRAGAKIKEA

60

CAHLDVGFRA FEIIDDETHA NDKNLSQAHQ KDLFAYSNLD RMETQTILIK LLGCEGLELT

120

TPITCLIENA LYLALNTAFI VGDIEMSEVL ENLKDKGVEK ISMYMPAISN DNLCLELGSN

180

LLDLKLESGD LKIRG

195

<212>类型:PRT

<211>长度:195

     序列名:SEQ ID 233:GDC_MTUB_80423

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MYIRFYRDSL AEPATDIYAF AYVSFNKEAG TWHTPAQPTR NYGSGTPMTT AATAPLRHAP

60

MSGRPPKRGS NACAGARSYS SAGVLNTRSS IGWSTAYGPA SSFPAASTES ANSSRQPTTC

120

CVGLPAARSI PGSSRTMRLC WPATKDSRSP RCPGSWCTCR SHRLAHNRPL DARSASPAVA

180

KPSVIRLGSR VRRRSGSPDH LPSARICVSS RRSPRRLLWC YRRPLARCSE STIR

234

<212>类型:PRT

<211>长度:234

     序列名:SEQ ID 234:GDC_MTUB_167239

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LMFCASRKEM AMSNSSSSSV INWNSLSESK PRSSTSTWFA VMPRSVRKIR WMVALMASFI

60

ARLLAGSGPR QGRQTRARPG RGQIVGGRLG SWCGIPNAP PARLGGPPGSH TPRSASAADS

120

PHAPRSGCPG SPARSRFRDT RPDSPAVPGR WPCTRPRPAP EPAGRVHAD

169

<212>类型:PRT

<211>长度:169

     序列名:SEQ ID 235:GDC_MTUB_214625

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VPPPIPRCAA ASTSDPMASV KYGATRRWWP PAPSLTTSSC SAACGLCPKS SPGSSIPSDE

60

PDSTATVGQH STMLTATLMA SPPAEVSLYL VCMSAPVARM VSMTWSRVTR WMPSPRNAIR

120

AALMALPAEI ALRSMQGICT SPAMGSQVRP RLCSMAISAA FSTCRGVPPR ISANPAAAMA

180

AAEPTSP

187

<212>类型:PRT

<211>长度:187

     序列名:SEQ ID 236:GDC_MTUB_424142

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MIPMDVIFGC PLYANFCKPS VVRKTLGILA SAVEFGTMPT TRNLRAPTST VSPRCRPIVL

60

DAATSSGFDG DRPSETRGMP GPCSGAPKTV TFRVDVPSFM IVPTLPNGAA AMTPGSAATR

120

ARSTSGNGIE PRKGPAAPDL TTNTSTPMES TVCRASTRKP FASPVKTSVI PKISPVLMIV

180

MTRRRFLHCM SRRAAKSIPR GYQRGALVGP GLDVLWSGRG PLVVEEAFGV VVVVGVGTAV

240

EVGWRDPFRL AVGPFPCLPA FPD

263

<212>类型:PRT

<211>长度:263

     序列名:SEQ ID 237:GDC_MTUB_459316

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSRAIRTKPK SASSRGSAGY RVYLGQRLGV AVFAQRDDHP VTGLEDADER AVISGPVGAH

60

TVAMPLDHYR FTLVDAADEF DVDLEDLLAP LDCSPKRLLV QFRTGDDAPV GEVVAEQREA

120

FVEISALAEA LQEHPGQFGL RVVERRHHIA ILSRETACGQ LTWSSKRWSP SRGRPASRTP

180

WRRCVAVSRI HAFGSPVTAL SGGPACCPPG RSPRGSAVLG ATPPVAWRGA AVPRSLSTWR

240

PPCWAPPTTP AISCRCIRPW PPRTAGCRTC AWAAPARCWK P

281

<212>类型:PRT

<211>长度:281

     序列名:SEQ ID 238:GDC_MTUB_549643

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VRPGHRQVDG CRRGQPLCGA HERVGLVRVV GAFGLAQQGC DAGQHLVVGH GAKTSGGLRQ

60

VGSAYNRSVS QATTSSSTWL RSGSLNTSWY SPGYSFSCTS ADPTHSTRRR LPSMGISRSS

120

VPCSTSSGAV NAGARRGMVS PTCSSARPIP AGTRPWCTSG SVL

163

<212>类型:PRT

<211>长度:163

     序列名:SEQ ID 239:GDC_MTUB_566823

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VCKACLGHHT HHHRTSRPLR NRCQHDQPRP AHRHGFHPNP RFRRQRHRGR VPLRLRLAAE

60

PGILQLDHNP VVGLLQLRRR WRIGLPQRRR SRRVGPGKRL HRDFGLLQCW RRRNSGFQNF

120

GNLLSGWANL GNTVSGFYNT SMLDLATQAL ISGFGNHGAR LSGILNNGSG P

171

<212>类型:PRT

<211>长度:171

     序列名:SEQ ID 240:GDC_MTUB_591109

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VLSLSAGGPE PRMRPGHNPV TFHAEQTRNR TARTSRVRFR VCSSDKSAQD QRVGVGADVD

60

RHGIAVVHLA GQQHLGQLVT DGLLHQPAQR PRPVHRVESA LRQPALGRQR DLQLQPPLRQ

120

PLAQLRQLDV DDAHQLFGVE TLKDEHVVEP VDELRLERSA HRGQHLLGAA TRPQVGRQDQ

180

DGVAEVDRAA VPVGEPALVE DLQQHVEHVR VRLLDLVEQH HRVGTPAHRL GQLTARLVSH

240

IAGRGADQPS HGVLLAVLAH VDADHRPLVV EQEVGQRLGQ LGLADTGRAE EHERPGGPVG

300

VGHPGPAAPH RIRDCGNRGL LPDDPLAQLV FHAQQLGGLA FQQPTGRDAG PRRHHVGDVV

360

GTDLLLEHHL LPGLRLRQRR VELLLHLGDA SVAQLGGLGQ VAVAFGPLGF PAQGFQLLLE

420

VADDFDRVLL VLPAGGELGQ LLFLVGQLGA QLGQPLRRRL VFFFGQRHLF DLQPAHQPLD

480

LVDLDGPRVD LHPQPAGRLV DQVDGLVGQE AGGDIPVAQS GSCHQRRVGD AHPVVHLVAV

540

FEPAQDADGV LHRRLADVHL LETALERGVL LDVLAVFVQR GRPDQP

586

<212>类型:PRT

<211>长度:586

     序列名:SEQ ID 241:GDC_MTUB_663028

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LLADFDVGQH LFQLVVGGLG TQHGFGVQRV ALPDRLGPDR RQLQELVVDV GLDQTARRAG

60

AHLALVEGEH GEAFQRLVAE VVVGGQHVGE EDVGALAAEF QGDRDQVVRG VLHDQPPRGG

120

FPGERDLGDA VAGGQRLAGL GAESVDHVDH PGRQQITDQR HQVEHRSGCL LGGFEHRRVA

180

GRQRRRQLPG RHQDGEVPRN DLAHHAERLV EVVGHGVLVD LAQRALLGAN RRGEVPEVID

240

RQRDIGGQRF PDRFPVVPDL GHRQRGGVLV DAVGNHVEDR RPFGRCGLAP PRRRRVRGVE

300

RLVDVGRVGA RHLAERLAGH RRRVLEVAPM DRRDPLAPDE VLVPGFIGHQ RPGGTGTGKD

360

SHRIRLLVKI M

371

<212>类型:PRT

<211>长度:371

     序列名:SEQ ID 242:GDC_MTUB_688806

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VYLPPKLIPR RIPAQVRPTM VAPQVPHVLS ITPNGRSGEV CPASGSTRPK LGVQPPAASG

60

WPLPTRPGPR FSRCHRRPTL PACARSSSAT GSTPKSDNPA NPAGTSSRGG RSSTTRRCWL

120

PAAIRAALKS RFSARPTDSG AVGRAGRPHP AQA

153

<212>类型:PRT

<211>长度:153

     序列名:SEQ ID 243:GDC_MTUB_701762

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MTSTNGPSAR DTGFVEGQQA KTQLLTVAEV AALMRVSKMT VYRLVHNGEL PAVRVGRSFR

60

VHAKAVHDML ETSYFDAG

78

<212>类型:PRT

<211>长度:78

     序列名:SEQ ID 244:GDC_MTUB_731710

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VAESVAIRGC LLRCGPRSRP RRRSRRSGIC ACRPRCSATS RPPCPRRSTC PPRRRSMTSA

60

PSMWPPGRQR SRASRCIATA AGKDRYCPTP RRNRYWRRLT RSSAAAVRAA PASSDGGSHG

120

ASRRRIAQNQ RF

132

<212>类型:PRT

<211>长度:132

     序列名:SEQ ID 245:GDC_MTUB_772761

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LLHSSFGHLE GIQQPLIDEL AELDHVLGKL PDAYRIIGRA GGIYGDFFNF YLCDISLKVN

60

GLQPGGPVRT VKLFGQPTGR CTPQ

84

<212>类型:PRT

<211>长度:84

     序列名:SEQ ID 246:GDC_MTUB_868821

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LLGALHQYPH TRIQPGAVAA HRDRQHPRPV FGDEALDAAG VLMRTHAADH RQSEVSTVGL

60

NAHRTRGERH AIGVAALLLE SREAHSLAVA LASTPLLPVP VRVDRARDPV GVGLFRAFRP

120

PHGASLGVDT HLVFHRVPAF PQYPKRRLRR LGAGRAPRLD IGFQLRDGPV VGLAAGAEMP

180

RQRVCLLGGR IECEPERLHT PAVGDLQTRH LRPPHDHRQR QPRRPAWPGS EQHVCHTTLR

240

TSRSESRSYP IPGHRQPRPS PPRPTPDPER PAQRGHTPNR TGRTDPDAQP QSA

293

<212>类型:PRT

<211>长度:293

     序列名:SEQ ID 247:GDC_MTUB_890358

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MASSTDVRPK ITLACEVCKH RNYITKKNRR NDPDRLELKK FCPNCGKHQA HRETR

55

<212>类型:PRT

<211>长度:55

序列名:SEQ ID 248:GDC_MTUB_904043

序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LVCAAAPGRR RPLGVGGQVE AGTESLAATG HQNDMHAWIQ IGTLHQSRQL QRGVCDDRVA

60

LLRPVEGDPR NPTGDLIGHR LQVVEIDRPD RVCHQRPLSL LPAHARGWAR DPDRPAWCRT

120

LRPTGRRAEW PETPRRRRDV RGAPTTIPAT PGRCLRQSCG LDNRSCQDRP AADAAFRRGR

180

PAWG PGLRCG PARQTAPRRM RAGLPWRARY LAR

213

<212>类型:PRT

<211>长度:213

     序列名:SEQ ID 249:GDC_MTUB_1045383

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LGLVAPAGDG RAAKKRPAGR RGSDRRRRMR LRGVVRPTPA RRCHDLWGLH HRVHCHAVAA

60

HRLQNGTGRW STGASTSMRS TTVASAAARG SRPSTSAETT DPSTAQINVH TSSICAERPE

120

RSMASATASA R

131

<212>类型:PRT

<211>长度:131

     序列名:SEQ ID 250:GDC_MTUB_1068100

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS

60

AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL

120

AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRI

180

TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS

240

RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR

298

<212>类型:PRT

<211>长度:298

     序列名:SEQ ID 251:GDC_MTUB_1115707

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LRRRAAVPVG LHRRRSDRAG ATQRDRRRYR RWVHACRLCA AWRRDRRTSG PDRARSLRYL

60

CHRRRRRRGG QCAGSRPGQT RRRHHRDGLV GSAFQWVLAG PQGVAGDRPD ESGRSCGGVR

120

SHLGRRVIGA DSHLRQRLFG LGRRNPCPDV LPRHRRRARR QPATGHPAWP HRRGRPRHLD

180

TRAGIHHDCP ARPGQAHRDG EDVQHGCRHD RRRCPRRHDA RPGRPDRAAP GLLGIGNRLQ

240

RRKTRPAGKT GWAAPEILRT RPNRV

265

<212>类型:PRT

<211>长度:65

     序列名:SEQ ID 252:GDC_MTUB_1124996

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VVAVRIEVVG HRVHHLAGHL EFRGFDLHLL VQHREVGVAD LIGPQQRVHH HHLSLAEILD

60

AQRRQPGLVA QREMHDRHPV GLGECLSQQH IRFRRLRIRL QKVAAVEHHR VHVGGGDELQ

120

HLDLPAAFFR QAGDVVVGDR HHLAVAGLVG PGKIAVVDHL ATRLADALVP DASVVLGVHL

180

VEPDVVVCGS AVHLDRHVHQ PEGDRTRPNG SHVSEYALIV RERNVTAKFH AIFDRDVTLA

240

TCVTDRLR

248

<212>类型:PRT

<211>长度:248

     序列名:SEQ ID 253:GDC_MTUB_1138949

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LRSARVNPPA RSAASTPWYP SGSVTTAALG WFLAAARTIA GPPISICSTQ SSTLAPDSTV

60

WLNGYKLTTT SSKASIPSCS RAAACSDLRR SASSPACTRG CSVLTRPSST SGKPVSCSTG

120

VTGIPVSAMV LAVDPVEMIS TPAALRPCAR STSPVLSYTL ISARRIGRLP SSVLILWLPF

180

VPSSLFVRPP SRHGWPVRPP PLPTAVVR

208

<212>类型:PRT

<211>长度:208

     序列名:SEQ ID 254:GDC_MTUB_1170285

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VRADPPTTAC NTRCTPSVCV PSMCGTSTTS MPPRSCVPEK VTLLQSFPGL GAGSGWDVST

60

AMTTNRLPLP SAETAAMLPC NPVGSWGPAA TCAQFAGSKL SPSGSLRAEK NPGSMALGVT

120

SVTVYSGPKP DFTSATLAMS PVEAVVELAP DEQPTSQHTD PTASTALRIV VNLPNAAPEL

180

RNVDTVLTSR SAANCGASGG RTDPGSVISR RPRSLAGLPG

220

<212>类型:PRT

<211>长度:220

     序列名:SEQ ID 255:GDC_MTUB_1176592

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VGTAQERVRS RSGPVPHHAL RHLRGSPHRG TADPAGDAGV GRQNFGPARP GPKPAVVRRR

60

RCSADPRHSA AAAHRGISPL PAAATTRRQV SGPQRRESHL RSVDRGLRVA WDVERGDGIK

120

PGIVAAVAGQ QHGRIVHHMG AVRFVLLPVD RGPQRVVARG QAGQINANRL GDRRRCRLVA

180

AAIAALVGDQ RLQVHRCRQR PNHLSGGIHQ PVAGHPLFGG GSSAVVGPGD RDRRDLAR

238

<212>类型:PRT

<211>长度:238

     序列名:SEQ ID 256:GDC_MTUB_1202653

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSISGIERWS ATENIRISVI SSPQNSTRTG CSAVGAKMSR IPPRTANSPR RPTISTRVYA

60

SSTSRATTPS KGDSSPTVSV RGSIMPSCGV MGCSSERTEV TTTPSGGPSW ASSGWASRRS

120

AIRRVPTVST PGESRSCGSV SQDGNNATAS PNTPRSSAAR SSASRPVAVT TSNGPCRASA

180

LATNSRALAG AMSVNSSGRP PARCMSCWNV GALSANSTSP AIGVSEQAGP GAVMMRPF

238

<212>类型:PRT

<211>长度:238

     序列名:SEQ ID 257:GDC_MTUB_1231843

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VLAFYLRPRP GTWCTSEGSS RDPSGGSLGG QCWGVGGLLL GGFFGAGQCC SGSGEDLEAQ

60

VAPSFDPFVV LFGEDGSDEA DDRGAVGEDA HDVGSASYLS VEAFLGVVGP DLAPDLLGEG

120

GERQQVGAGG VEVLGHRGEF VGQSVEYPII LGNN

154

<212>类型:PRT

<211>长度:154

     序列名:SEQ ID 258:GDC_MTUB_1241031

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LTTAGISGSK GRTGTGEPCG LLSAAGFRAG ASGGLTAAER STARASSANL TRRYLTHAEL

60

LMLARATGRF ETLTLVLGYC GLRRFTVR

88

<212>类型:PRT

<211>长度:88

     序列名:SEQ ID 259:GDC_MTUB_1252888

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MGQCPRPVRH WPPAVIVCSR TKLRRACLRD YRRPAPSDKK PNKSYRVMTP TGLPSSTTIN

60

ASQSRNALPA ALTNSPAPII RSGGLMCADT ASANLARPSN TAESSSRSET LPATSPAITG

120

GSAPTTGICD TPYSRRIPMA SRTVSDGWVC TRAGSAPDLR RNTSPTVDCS VDPSRRLRRN

180

P

1

<212>类型:PRT

<211>长度:181

     序列名:SEQ ID 260:GDC_MTUB_1264312

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LAAIPRRSRC SVNPRGNRHD PARHPGGRGS VRGGDRPELT GDIGLRPGEG SARRGLRPRQ

60

AGNRPVRCAQ VHEVPTAAIL SASSEVFNEV PVRNPGTLAF VPIVDGDLLP DYPVKLAQEG

120

RSHPVPLIIG TNKHESALFR LMRSPLMPIT PRDHVDVHPD CRRTARSASA NRGADRLRVL

180

AMAAQSTLIE YGYRRRLPDA VGVAR

205

<212>类型:PRT

<211>长度:205

     序列名:SEQ ID 261:GDC_MTUB_1286282

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VLALRPQRHF TQSRSARRLR CVLDDDVWVP WARSGGCRTA TRHLSVRCIA GTCWGPPVRF

60

CRLRATPSTV SCSARRRYRS RLTCHRSTDT SWSLSATRLA ELLAPLEPVT VTFTPTFGEP

120

DMVHLSGTKF GGLVPALFEG VRAGF

145

<212>类型:PRT

<211>长度:145

     序列名:SEQ ID 262:GDC_MTUB_1301742

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MTSSAPKPAA SRASDWPTTS PAPSCSPTAN STVPQSSYAM TSTCWAAGSE WASKPSATGS

60

PHCSARGSEG YRSSSSAPTR PETSQSDSPR RRFTSAGSAA AARCGWSTTR SPSQRGSSAR

120

WRKCPTAGRT SGWPRPPLPT GSGIWARTRT SRSGWAATSR TPINSSTPPV SSWTTRARRS

180

RSGRAARSAT ERRAPNVRSP ISVVASRSTR TRAAACLIRR PSNRFDRPTP QQTTKPLILL

240

WFQQALGKHC CRCLHIAFSH VFHSGGDHGG LRVIGYRAVP RAGADL

286

<212>类型:PRT

<211>长度:286

     序列名:SEQ ID 263:GDC_MTUB_1351907

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MQLGNQNTMR FAGRPQRFRQ SAYPLFNPNS AIALGHPFGG SGARLMTTVL HHMPDKGIRY

60

GLQTMCEGRG QANATIVELL

80

<212>类型:PRT

<211>长度:80

     序列名:SEQ ID 264:GDC_MTUB_1476279

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VTVYRRGMAV LTDEQVDAAL HDLNGWQRAG GVLRRSIKFP TFMAGIDAVR RVAERAEEVN

60

HHPDIDIRWR TVTFALVTHA VGGITENDIA MAHDIDAMFG A

101

<212>类型:PRT

<211>长度:101

     序列名:SEQ ID 265:GDC_MTUB_1485311

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VGAVRLQPHR MGGGMAALHR HTGTADQLLL LPRRAHRAGS PVQCDRLRGR DSHFQPGTNQ

60

YRNGHRGIDQ PIHQHRDQLD TRLPAAVAAN QPAGIPVFAL TSD

103

<212>类型:PRT

<211>长度:103

     序列名:SEQ ID 266:GDC_MTUB_1486309

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MPSPVSSGPT SHGTNKGCGL IRSESMNTTM SPLVAASERH NASPLPGRTG TSGNACSRLT

60

TRAPEAMARI SVSSVEPESS TINSSTRPST SGEMLSITDS MVASSLRAGS TTEIVRPAFA

120

ASNSPIVQPG RCQVVSKGSA PGALPPARSP ATSSDAVMRV LSPCASAAGP PESMPPFPAP

180

AGWRRPHAPE TCAPRRPQPT RWLPAFPQAV RSNPRPESPR QRPCCSKPSA RATRS

235

<212>类型:PRT

<211>长度:235

     序列名:SEQ ID 267:GDC_MTUB_1515112

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MLSAVILTER GYPAVPLAGQ LVHQRFVRPG PLVLGTGFLK FLTRAADRDR TVSRRSKPSS

60

RAALMGEQPN PWDLLQPQDA TSRHRGAKPS RRYGLLGKIS LLSPGYLLSV ERHPFHSGVP

120

DH

122

<212>类型:PRT

<211>长度:122

     序列名:SEQ ID 268:GDC_MTUB_1515464

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LVGRSRVLVL FGAGEHVDVV ALLGERAHRL IGEHVVQTVV GHVVQNRNVA VLVTRPAIHQ

60

QVGRLRHRLL TAGHHHVELS GPNELISQRD CVDAGQAHLV DRQRRDIPTD AGRHCRLPCG

120

HLPGTRGQHL AHDHVLDQGR RHVGLLQGAL NGDGTQLAGA EILQGAHQLA DGCTRASNNH

180

RCRYDYLLSA PESRSDRPGE ADSFPSGYRC VMTTDQVHAR HMLATSLVTG LDHVGIAVAD

240

LDVAIEWYHD HLGMILVHEE INDDQGIREA LLAVPGSAAQ IQLMAPLDES SVIAKFLDKR

300

GPGIQQLACR VSDLDAMCRR LRSQGVRKVY ETARRGTANS RINFIHPKDA GGVLIELVEP

360

AP

362

<212>类型:PRT

<211>长度:362

     序列名:SEQ ID 269:GDC_MTUB_1596569

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LRAATKSPSS SCWRACATAG STSVDSSELA APLSFPAVAD NRESTQRLSW SAGWRPWKLE

60

IGCPAAKATT VGTAWTPNIC ATLGATSTLT DASDHLPLAA AAKPDSVSSK STHTSLRGDH

120

SNTTTGTSSD RTITSSSKFA SVISVTPDGV DSARSASVLA AAFCWARCLM PERSTAPAMA

180

GPSGGRGRVT PSSLSCRCGH RSTRWRRPCG RSRHTAIGWY DQDHTGRHRP LNRYPARNIS

240

ASPCPPAPHN AATPTPDPRR ANCSAACSVI RVPDMPRGCP TAIAPPLTLT IWGFSPSSRI

300

EANATAANAS LISTTSSWST EMPSRSSALL IALAGCDCSV ESGPATTPWA PISASQVSPS

360

SWAFSWFMTT TAAAPSEICD ADPAVMVPSP RNAGFRPASA AAVVLARIPS SSVNCSGSPV

420

RCGMFTGITS SANTPSFHAA AAFWWDAAAY SSCSERVNMS TSLRCSVSAP IG

472

<212>类型:PRT

<211>长度:472

     序列名:SEQ ID 270:GDC_MTUB_1600905

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VRSRRLAPTR PRSRRTASPA TATRAAAPPR TTPPSAAPAT RCPPLARQRN KTRAAQSRLA

60

WRGGRSEQGL SRCGSSGAVL RCGDRHPAAL AGVPQPAVAS ARGKQLLVGA AFDDPTMIEH

120

DDLVGPGDGM QSMGDYQHGA VPGQPVKRLL HKVFRFRIGK RGGLVEDEDR SVAEDGTGNG

180

EPLSLPARKT TVGSEHGIVA VRQPKHPVVD LRFAGRDLDL FGGGIRYRQR DVFGGGAMHK

240

LGFL

244

<212>类型:PRT

<211>长度:244

     序列名:SEQ ID 271:GDC_MTUB_1616064

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VSAVLALSAA VSARRAKAAE AHSAPSSNGT PASAATPSCQ EIGNRASAIT AGSRIALVNG

60

VTRLTTRPTS SGPVAAIACR AVAVFSAVNQ SNRTTGSRSA TSCWVWLRTA KPSSIPMRAV

120

TASSTHPATV AADSQPSHSH ARCGASPNNA AISGTSNTVP TARATTEQNA SSAKPISLAR

180

WSFGTRAIQV RIIGCRPALR RPPPGCPGRC PTAGSSVRPR QATPRGCRVR RSDHDRARRS

240

GRPG

244

<212>类型:PRT

<211>长度:244

     序列名:SEQ ID 272:GDC_MTUB_1672449

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MPSVIRDPDP GAAPAPTVAD RSAEVPSVLQ RSRRCDAYHR YSRWRLSYSA SPLGGSRRQP

60

GIATDGRTRG TQPRPAGAAH SRARPDVGRS VAATRPPSAG SAGTARP

107

<212>类型:PRT

<211>长度:107

     序列名:SEQ ID 273:GDC_MTUB_1673708

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VLRPIRAGQP GRHLAPPRPA TRRQGTGAGT GARRRLGTGV APPAGVSVDE PSGCARLGMR

60

VAELPGVAAP HLARPHCRRE ARAGVGQGKH RRLRRGSEFR CHQRRFGRRP SVRPGGVDPQ

120

RSAISARVRT GRHLGGGSGS GIRALRLVYD RCAGASGIRR VARNVRGETE IQHAPRHLRR

180

CLTDPPCAGR RPTVLRSARP PRLPDPRGRS PCVRRGTAGG VEVARRLRGP APRPTRLRRL

240

RLPAGASHRR GRGPLPVLGV RDQPAGHVVS YRPAIAIPRH APARPVPVRW HRPSRRCRWP

300

PRVWS PGRNP DNPGRRSR

318

<212>类型:PRT

<211>长度:318

     序列名:SEQ ID 274:GDC_MTUB_1699549

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MTASRRSDHT DATRRALVDA GRYLFARRDY GDVSIEDIVT RARVTRGALD YHFDSKKDLF

60

QTVLEVVEAD LVADVEAAIA KVTDAWICWS SASTPSLTRR PNRMRCRSLR LTARQCSGGA

120

NGAGSTCARA WSAGRGSRTR DGRRGDSART VATTFASAAG RANRIRAADR GRDGQRPDQS

180

RGRTRIYGPT RRSTGVARPR SATATDHRPQ SRPASRNAPR PATPRRPGHH RRHPGPRCRR

240

RFWRSPSRRR APAPYRQSSA RPTRPTLFGS PHTPPGRRRR WPPARCRSPR PVRRR

295

<212>类型:PRT

<211>长度:295

     序列名:SEQ ID 275:GDC_MTUB_1742061

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VRLRSESAGL AHAADDVSGV VLGDDPDHDP PVAVLDFLVP EDVFPVVVAT GQMVVAVILG

60

RDLDVLPAHI QMGFRPAPFV AHRDLRLGAR KAGADQQQAQ PGFLGGLGTA VDEVQSGSCG

120

LHATAAPIAL DQRLDVGHLQ IGGLYQGVDG RDGGVQWKST GQVERRSLRC GHAHALDDAD

180

LVGLDALFPD LQPRGTAAVG VDDRGGKIRV DPLGAMEGRS RVAGQHAAAA RAQPQRFCTQ

240

LRGQFHTLRH VHVFM

255

<212>类型:PRT

<211>长度:255

     序列名:SEQ ID 276:GDC_MTUB_1782153

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LGVRAAVGVD DVTRGRRQPV RQQRAHRLGD RRRILHVPAD RSALIPALLE QLDLGAGLLA

60

ERTADDRTHR QRPDRACGNE IRTHTVLAGL ARHEPVDRLQ RALGDRHPVV GRHRPARVEV

120

HADDGTSGVH DRQQRLGHRS IRIRRDVDAL GHIRVGRVEE RVDAHPGLRH EPNRMHHPVE

180

LVARPDRLGH PAGQAGQVLL VLHVEFEQRG LCRQPVGDAL NQPQPVEPGE HQLGALLLGY

240

PCDVKRDRRV GDDSANQNPF AVQQSCHVRP CVVSVAHTHA AVDRDDRTGD IARILGSQEA

300

DHPGDLGGGA DPLRWDKLQR PLLNPLIQRA GHIGVDVARG HHIRGHVCLR QLAGDRAGHA

360

NHSGLGGCVV GLVADAPAAG DRTYEYHSTE FVALHAARCP LSHPERPGEV GVDDLLELFL

420

GHPHEECVRG

430

<212>类型:PRT

<211>长度:430

     序列名:SEQ ID 277:GDC_MTUB_2060659

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MVPSMRVRSD WEPIAQSRSR LAVTAPRNTS GGRFIWILLG SARNGSRAPW LPTRSPGSLD

60

RIFLVATDNR TSLPKGRWAP TSRMNPQPRP DVMPWRRATG RSGNPVKRAL ITGITGPDGS

120

YLAKLPLKGY VAAGSPAEVY FCWATRNYRE LYGLLAVNSI WFNHESPRHG ETFMTRNPAP

180

YRGRQRGADR CADADAPAHP DRYQYWGVPA SVRGVIDRAM GVCVE

225

<212>类型:PRT

<211>长度:225

     序列名:SEQ ID 278:GDC_MTUB_2093062

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LSGQPSALRR PTVSPSACRR PTVSKSKPKI DRMTSRMAPP TTDGSATLNT GHQPTDKKST

60

TCPRSGPGAR KKRSTRLPMA PPRIIPRPSA HHGDTSRRPI QKIPTTTPVA ISVKTQVYPV

120

AIEKAAPELR TRVQVTVSPI IDTGWPGGNS WTATTLVTMS SVSTTTATDS SMRSRRGGAG

180

ALGSPAPPAS SVEVSGSADP VGSSGTPSSS PRADMARPDP AAGWEQTTCA MIPSWPASPS

240

SLLEGQSRPP PAPMGCYGQP IAGRR

265

<212>类型:PRT

<211>长度:265

     序列名:SEQ ID 279:GDC_MTUB_2105797

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VPPNRPERRL GKPLTAPLRR APAHPLRDGP GSVGNPPKTS RRHQLLRSPK PRRRPGCPQS

60

RTPRTSREAP PATQRPGPPG SGFERRERPA ASICGRARRW SAEKRQERTF PGTRRRSRGR

120

WSPRCRARWC RARFGLRQTA ARPCGKGCYS KFGHHLADAR NARNRLWRMA AAIRVPAAPR

180

RLPGVSGCRD AKLDCITHKR SSPVRGKRVE PVAVVARRHR QSLLGGRGQA KLGGQAQQMH

240

ARRLRNRHRR VPVHDTGFR

259

<212>类型:PRT

<211>长度:259

     序列名:SEQ ID 280:GDC_MTUB_2133554

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LWKWKPRLAF HRATWRRRWT ATTPTPRAAQ IPISTSSRNS LQHKTTGRGG RSTCRWARRC

60

MPDSLWAGWP RRWTVKYCAT TARWWPACTR SGHARPISPR TARDMPAGPS WVRGRFSGVA

120

PERMRQPERR ACKPPRAATG NPATRHADKA S

151

<212>类型:PRT

<211>长度:151

     序列名:SEQ ID 281:GDC_MTUB_2183418

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LWPRISAAPS NRRSTVGGVW CRRRPNWVSR PRDSRRPCRI TTRCAPRGCP LHSPRPSATS

60

SAHTPTAGST NQASSTHYGV QTAPKYRCSG LELKGGKGVS DEISRRAPTR VRPDIQRRVH

120

RSEPIRGRVA LRRRFVHRRR LGHHHSGSGR QYDRGSRAAD GRDGRPPRWH RNPAAGSADP

180

GGKADGGVRQ KPGPGARHPS DAGTRRFGVR RHGAHPQART WRRGGHPRGS PDRIGARIVL

240

PGRGSLHPGA RYRRDGLCDR SSGNRATQDL RPAGARPGRR CGADRRRRHV GGSAKPHRGY

300

PRRYLHPGHR

310

<212>类型:PRT

<211>长度:310

     序列名:SEQ ID 282:GDC_MTUB_2192571

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LGISPGDRGD RVRGNAAGRD RHPGRLAAFL GADHYSVFSN GPAVEREDRR GQHGAVRTAG

60

RPDGAGAGPQ PRTTGAVVTT ADPVTAGAAA GSRGYRVALR VRPARPDRAL PGGGRHQHRI

120

QYRGCGAGAD LCLAAVSGDF PRGCSPHRRS RLRGGGGDTW GAARHCLVAR DPAVAAPGRG

180

VRISTGVCPL ARRVWRDPNL CRFPARGHPY PSAGDLPAAG DRSGRGGGIV TAARCGSGTG

240

GAGCGCSYAD RDRYQVAGHE QAAAARGRRR PAFGRRILGV RGRGACSARA QRCGQVHRPA

300

CYRGAASPRR GLGTFGGPGV DRHRGRGECG DPRPSSRAAV ARPVVVSTPE RGQKRGLRTT

360

MPSRDVWVRA R

371

<212>类型:PRT

<211>长度:371

     序列名:SEQ ID 283:GDC_MTUB_2234641

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LPTPVPARTG TPSRSANPGA TGRPTPETAN TADCSSSRPP GPHSAVSATQ QLPLGNNKSQ

60

LPIGFSPNRD WTRGRRAAPP LAFRSHCGRN PRRASSKSST RSFGQAFRQV FRADGWRRVR

120

SMTRSTYVFG SGHGRFGHSS HGSAAGQDLD IDRGCPQYRP VLAGNLRGRV A

171

<212>类型:PRT

<211>长度:171

     序列名:SEQ ID 284:GDC_MTUB_2320829

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRRLRSSDPR CHRLHVGARP APVLPPGQDH RGAFREQRSK SCAARRTRGA CESLGAQRGQ

60

RRFVVGFLRD FRHQFRVGDV AVRADHHDCA GEQPGHRPVG DGHAVILAEA VPECRRGHDV

120

FGALGAAEAL LGERQILRDT QHGSATCRRT LVEGSHTRRA HRCVHGWKDV QQHGLTPELV

180

AADHPQIAPG QGEGRGRGSD SR

202

<212>类型:PRT

<211>长度:202

     序列名:SEQ ID 285:GDC_MTUB_2321250

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LRGSGRTQIQ DHAAALSRHP RQRAVEFLAA AARRRAEHVA RQALDVDVQR HGHPGTDRTH

6Q

DDRQMLAEVV NVTKADDTRG AGPGGQRRCR KPDHLGLDPP AIRHQLPDRD HGQSVFDGEF

120

DRLGVVRHLD GIIGRDDLAE RGGRPPFRQA GQVDGRLGGS PPTQHTVGLR LHGHHMARTL

180

EIGGDGGGRS QCRDGPGAIA RRDSGAGAAN VDRHAMRGVS VTHGRQVQSL AFGARQRDAQ

240

ITRGVPDRKG NQPRRRGLGG EDEIAIAIGV AGQDHGVTAR HRRDRTTYPH IGRLHRDSNR

300

RNRLP

305

<212>类型:PRT

<211>长度:305

     序列名:SEQ ID 286:GDC_MTUB_2487508

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MKTAISLPDE TFDRVSRRAS ELGMSRSEFF TKAAQRYLHE LDAQLLTGQI DRALESIHGT

60

DEAEALAVAN AYRVLETMDD EW

82

<212>类型:PRT

<211>长度:82

     序列名:SEQ ID 287:GDC_MTUB_2567990

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSTSTTIRVS TQTRDRLAAQ ARERGISMSA LLTELAAQAE RQAIFRAERE ASHAETTTQA

60

VRDEDREWEG TVGDGLG

77

<212>类型:PRT

<211>长度:77

     序列名:SEQ ID 288:GDC_MTUB_2577106

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VATSTSPAGG LPQARSQPTK CRCPADSTFS DRAASARTSA AECAQPGLPV QALMFSQGEF

60

SSNTRPSGAS TRSAASAVAS SRSQISTDRH GVITSGASIA ARHSATRAGK TPSGTAAPSV

120

TRLSSWGIQP TGVLVTGRTD GPSSTPDCSS PISANSVTRQ AVSRILTKRN ATSIRVSATS

180

ATRTPVSRPV NSSRGPSGNT CTPTSAPRPD TSARPSSRPN QNRPPSSASR GSARIAASSS

240

PTHARTSASP PARPDSGEAT ILRTRSCVAD GSSPALATAS ATAATSRIPR NWTLPRAVSS

300

SVAEPKSLAT LASVASCAAV IIPPGSRIRA SAPSAAWCGR NAPGQASASR VPATRPPYGR

360

MGRRLAALRS RREAEDQGQG VFDCAHRGGF EGAESLHESG TSDRADAAAH RDAIGSYTF

419

<212>类型:PRT

<211>长度:419

     序列名:SEQ ID 289:GDC_MTUB_2577486

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MTGRVRQTGI TRLVVHQRGP VLPQRLMTVH AGPVVAEQRL GHERDRFAVL PGGVLDDVLV

60

QLHVVGGVQQ RIELVVDLGL SAAAHLVVAL LQDEAGVDQV GQHLVAQVDV LVVGGHWEIP

120

ALVADLVAPV GTAVGLGRRA GVPPPRDGVH LVEGAVGARV EAHRIENVEL GLGAEVCGVG

180

DASADQVVLG LAGDVARVAG VRLQGERVVH KEVDIQRLGR AERVDARRLG IGKKQHVGFV

240

DRLEPANRRA VKGQAVVKHA LVKGRSRNRE VLHDARQVTE PDVDIFDLLV LGKFEDVVGR

300

LFRHRMLLYC IRGRRYGADI ARQSTPCCAD VTDRAAHH

338

<212>类型:PRT

<211>长度:338

     序列名:SEQ ID 290:GDC_MTUB_2690012

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VAGVCALFSG ASRWPSGELR HRPQGSRRGP SRLRCTFPRQ NVSSRRPGVP TVGADLTRRS

60

GGTGQPRGMG SPGPVGQTVP CHLRLSRPDT RASGRSADQA HSRRGGSAAR PHQGQPLHPG

120

GQRNRTRRTH ALLAAGNVTA TAADEGSAEW RWRWR

155

<212>类型:PRT

<211>长度:155

     序列名:SEQ ID 291:GDC_MTUB_2698040

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MTDNECPADS RRRHVLRLAL FAGILLGLFY LVAVARVIHV DGVRSAIVVA TGPIAPLAYV

60

VVSAALGALF VPGPILAAGS GVLFGPLLDT FVTLPAFSAG AQAGMTPRRC WVSIAPIASM

120

HRSNGADCGR WSVSASSPAS RMRWPRTPSG RSEFRCGRWS LGRSSGRRHG CSSTPRWARR

180

SPTCRRRWFT RRSRCGA

197

<212>类型:PRT

<211>长度:197

     序列名:SEQ ID 292:GDC_MTUB_2712275

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LWAVVGQRFV PGISDALASY TFGAFGVPLW QMVVGSFIGS APRVFVYTAL GASITNLSSP

60

LVYSAIAVWC VTAIIGAFAA RRWYRKWRAR PRRRCGLAQL TTGSQQRHTS HRTPAGVVMP

120

GSLSEHRRLR QEAPDRIEHH PPIE

144

<212>类型:PRT

<211>长度:144

     序列名:SEQ ID 293:GDC_MTUB_2725593

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LSAVLPARCI RALADRVYRH VRCHGGCARN HHPRSRPGRI DYLGVHRGQR VPGAKGWIDI

60

RHFHTGRGDL DGRAAVVRQP LSGGEQYCSD DRVGGRHAVV DHLRVTGTAH DRLVERVSVL

120

DNGGGVCTGR DPWRHVLNSV APRTRHRIRP AVPRRRCRSR GSQDR

165

<212>类型:PRT

<211>长度:165

     序列名:SEQ ID 294:GDC_MTUB_2733212

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VGPMNGFLSW WDGVELWLSG LPFALQALAV MPVVLALAYF TAALLDALLG RVIQLIRRAR

60

RPDQAPR

67

<212>类型:PRT

<211>长度:67

     序列名:SEQ ID 295:GDC_MTUB_2828257

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MADDVSGAVY RAGTAHGRPT GRIEHRDRQV VTRRATDTRA ELDGLSDHQL AEVQRSRENH

60

YPAGCLVIPQ PLNRRPEHQP APPQRHWALA GGDRDQRGGA KCHGDWVAID RLGAQRDRKP

120

VPRAHHTDRD QAGADRTQSR SVPRPARHTP PQCAAAEGHH DAAQGTHVAD RPHDPGRRHN

180

PADQRRRDQA YVQTGRAEAH MAHRYQTRTR LRRLSSRAGP MPSTSASWST LVNLPLRCRH

240

ATIAAAVTGP MPGRASSCST VAVLRSSTSA VLGAVLGPVV AVPEVPAGPG VPAPTELPST

300

LGCPEGGASP TTICSPSPSC RAMFSPTVSA PSTAPPAACS ASAIRAPGAR VTSPGVCTRP

360

TTLTTTGRPE RSGEPGLADD LGFVGETGST GGSLADITGS VRSRIKVNTV TSTARAAITA

420

NATAPARPGS ARILSAQPCP REVSGSQRGS SEFGSSRGSS WSGPSSVGSC GSGSKCADAA

480

CESISGTAPS RLCSRSAGSS VRMGRPQLRG PPEPARTTAS RCPAVDQSEA VDKPLWRWIK

540

MGQTAPTSPN NQHRAATSIR TRLTAIESVL GNAIREC

577

<212>类型:PRT

<211>长度:577

     序列名:SEQ ID 296:GDC_MTUB_2895354

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRGTAYATRR SMLPNTRAVW LATVVQCVTG GLGVTLIPQT AAAVETTRSR LELARFVAPA

60

RRDESVWCLA LSAAARSPTS VLPGLSAS

88

<212>类型:PRT

<211>长度:88

     序列名:SEQ ID 297:GDC_MTUB_2983047

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRRVFSGWTT LVRCSTAATT VTIRAMTKHV PVIHSSEPTR PLTPRKPVDP VRRCCSQLRQ

60

PNPTTLKTAK SASAKSAAVV VRISGSPSVR SSGHEPLWRL ARRAASIAAA AGAQSPTPDT

120

KVASAPAAQA RRNARSRSAG EPGLRGQFAA RTPANTSPAP AVSTGVTVGA GTSNTPSAPT

180

YRAPRTPRVI TKCVGGDGQS FASCSLAITT SAIAAKSCKE LRSWPAGEAL TMTTASADWA

240

ARAAASAVAT GISNWVNSTS QLATAEGTGV RCALAPGATS TVFSALASTT IIAVPLGPGT

300

VTVLSSPTAL ARRWARSWAA AGSSPNAPEN CTCAPARAAA TAWLAPFPPG VRVNDAASTV

360

SPGRGSASTT NVRSMFTLPT THTRGAMGPT LVSLAFAMLA VG

402

<212>类型:PRT

<211>长度:402

     序列名:SEQ ID 298:GDC_MTUB_3005316

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSASASADKV VCECCELCVP KQLASAIRNP YGLVRGWRCR ICNEHQGQPV KMAQDHEEEV

60

RIRWGETVDE LHAALDRAGP RPGTWCTSEG SSRDPSGGSL GGQCWGVGGL LLGGFFGAGQ

120

CCSGSGEDLE AQVAPSFDPF VVLFGEDGSD EADDRGAVGE DAHDVGSASY LSVEAFLGVV

180

GPDLAPDLLG EGGERQQVGA GGVEVLGHRG EFVGQSVEYP IILGNN

226

<212>类型:PRT

<211>长度:226

     序列名:SEQ ID 299:GDC_MTUB_3048559

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VGSLTVFTSS ARMSRTAANT SARALHSMTT GSGGKSRMLN TIASPPPTSA SKRRSKTTLP

60

LDAKTKTSTA ETAAWLMNIK PCATNPRAHS TATDNAMNTT TPMAIGPEPS RACTPAPSTI

120

PSATPTIICW ARRARSTLVA DMHTTAEIGA KNACGWLNTS WVRYHARPAT TDVWVIGHST

180

VRNRWATARP PQAVLTSSEA LMNAYLFTLG CDVVTAKIWS CLLDPLGLGI YSGLLTLLSG

240

NGRRRVGERI DAAAGLRERD HLTDRVHPGQ QRGGPVPPER DSAVRRCAKH ERLQQESELF

300

LRLGLVQAHH REHPFLDITA VDTHRAATDL VAVADDVVRV GQHAAGIGFD AVLPFRFRRG

360

EGMVHRGPGP RADRDLTGGG RFVGRLEQRR VNDPDECPRI GVNQAQPVGD LDAGRAQQCP

420

RRFDRTGREE DAIAGFGPDM VGQSGALGLG QVFGHRTAQR AVFGDQHVGQ SAVAALLGPV

480

LPAVQRAPRL RRPARHHHRA HIRCLEDTKC GVGEEIRAFD ELQPEPQVGF VRTESAHRFG

540

IADPRDGRRN PVAYQRPQLG QNFLGDRDDV LGVDEAHLHI ELGEFGLAVG AEVLVAVAAG

600

DLVVAFHPRH HQQLLEQLRA LR

622

<212>类型:PRT

<211>长度:622

     序列名:SEQ ID 300:GDC_MTUB_3065095

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VIGDFAEMLG GQDGVAELVQ HVAVHPFDGV DELVEADGVG GGCGLRHDVN SRLTLCIVST

60

VIGCVVGSAA LPGRCGQGGA DRGHQAGVGV AGDQRDPGQA AGDQVAEERQ PAGPVLGGGD

120

LDAQDLSVAL GVDAGGDQGV HPDDAACLAH LEHQGVGGEE GIRAGIERAG PKRLYGFVEL

180

FGHDRHLRLG KLCHTKCFDQ ALHPASGYSQ QVAGRHHAGQ CAFSSLAALQ QPVREIAALA

240

QLGDRDVDGC GTGVEITVAV AVALIGPLIA AFAVARPAQG VGFSPHQGGD ERREQPAQQI

300

RARLCELVSQ KLLGVDKMRR GHCVISFD

328

<212>类型:PRT

<211>长度:328

     序列名:SEQ ID 301:GDC_MTUB_3100192

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LDEPAHRARP KGNGANHDGA QPCCGIGACG NRGDPRARAH LPLPKGGRAG GAWHGVHRRP

60

RRNLRASRSQ RRGQVHHPEA SHRAAARPRR PGHGVGQRAG RVGTRLLRAH RGLLRAAQPL

120

PKAHRV

126

<212>类型:PRT

<211>长度:126

     序列名:SEQ ID 302:GDC_MTUB_3129118

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MIPQMTVSCP PPSTSEREEQ ARALCLRLLT ARSRTRAELA GQLAKRGYPE DIGNRVLDRL

60

AAVGLVDDTD FAEQWVQSRR ANAAKSKRAL AAELHAKGVD DDVITTVLGG IDAGAERGRA

120

EKLVRARLRR EVLIDDGTDE ARVSRRLVAM LARRGYGQTL ACEVVIAELA AERERRRV

178

<212>类型:PRT

<211>长度:178

     序列名:SEQ ID 303:GDC_MTUB_3237815

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LVTTLAPILD SASMTPKTAS SLPGISDDDN TMRSPAVNVM LRCSPRDIRD NADIGSPWVP

60

VVINTTWSGA IVSAAAMSMR SESATRRKPS CLATRMLRTI DRPTNDTRRP NATAASMICC

120

TRSTLEAKHA TITRPSAPRM SRCSVGPTSL SDGPTPGISA FVESHSNRST FVSPSRDMPG

180

RSVGRPSGGN WSNLMSPVCR MVPAPVYTAM ANASGVEWLT AKYSHSNTPC RVLWPSRTST

240

NTGVMRYSRH FSATRAKVNF EPTTGMSGRS LSRNGIAPMW SSCPWVNTSA SMSSSRSSTW

300

RMSGRIRSTP GSSWPGNNTP QSIINSRPRC SKTVMLRPIS LMPPSAVTRN PPEVRGPGGG

360

RSTSTSGPPF GSPLDHRSTE AARMSAANAS ICSGVAATWG SRGSPTSMPC SRKPALDNVT

420

PPRRLIALHS GATAMLILRA VAISPEPKAD NNSRSCPAAR WAITLMKPVA PMASQGRLSA

480

SSPE

484

<212>类型:PRT

<211>长度:484

     序列名:SEQ ID 304:GDC_MTUB_3283182

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSKRSDGPST GNAIRARHRI SVMTAQRSTS HATRTPVASS AQLGPPSSVE PTVRPGLAGL

60

VAVKRGREAA ARLPNNPETG CKSRDH

86

<212>类型:PRT

<211>长度:86

     序列名:SEQ ID 305:GDC_MTUB_3289702

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VATKNAAWPS STSCSNYSPN ATIESQRPDG CTSSRACVTP PVTQRLFSSL LTGYTNGSKI

60

RQTPSNSRPR CTSTSIALAR RSPNERHPRR LCETGRSNSR PAKEKERLRA DHNPAAGATQ

120

PDRTALRRGA AERQPHAPAS AEGEGPVPAG PVRLPVRA

158

<212>类型:PRT

<211>长度:158

     序列名:SEQ ID 306:GDC_MTUB_3319076

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSAPDVRLTA WVHGWVQGVG FRWWTRCRAL ELGLTGYAAN HADGRVLVVA QGPRAACQKL

60

LQLLQGDTTP GRVAKVVADW SQSTEQITGF SER

93

<212>类型:PRT

<211>长度:93

     序列名:SEQ ID 307:GDC_MTUB_3339006

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MLHDVVHGRR CSENGHRRRI TQYRIGTFIG NAALWNRKRH GDAPGLQRAE KGDDVLESLR

60

SRDHHAVTRG TTTAQLLCHI QRSPIQLRPR QGYRNAVPVL FVIHKREGRV MGLQTRTRAQ

120

RSGKGTHTHG HHVTGHAWSC RSRRRGVLAL RGLSQVASGQ LSRGLPARHG STIGHGRM

178

<212>类型:PRT

<211>长度:178

     序列名:SEQ ID 308:GDC_MTUB_3356995

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MPTTKATQRR DVSTEIAYLT RALKAPTLRE SVSRLADRAR AENWSHEEYL AACLQREVSA

60

RESHGGEGRI RAARFPARKS LEEFDFEHAR GLKRDTIAHL GTLDFITARD NVVFLGPAWH

120

REDSSCGRPG DTRVSGRSSG AVRHRRRMGS TARRGSPRRA HLRRTHPALP LSAPGG

176

<212>类型:PRT

<211>长度:176

     序列名:SEQ ID 309:GDC_MTUB_3381198

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MQWGYRPLAG DEAMRWGYRP LARESGALDP DHRRCRRRPA HCRPTTRNQT YHRSGARVAI

60

QHRDCAAGSD RSGGVGPLCG FRRPGAGGVV AGSGVRAVRG VRPAQRGRHC AQHRGPRSLR

120

CDAAPGRGGG RRGGRDHVPG GSGVGRPALQ RRLRRR

156

<212>类型:PRT

<211>长度:156

     序列名:SEQ ID 310:GDC_MTUB_3388071

     序列描述:

 序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LGGVASTRQA SVRRWSAVHP LDASPALPRP GQRCATARAV AGPTPSWRAA VRSAGVSTSQ

60

RRPGQAPVSS TAPERRCRAD ESGPNRGCSA VPNAHSTAVP VPSRSATKLR RWWRAAEIAS

120

ASSCVCNAGK SPCSTTMLEA PSATTRSAAV MAVFSGSGSS SGVGSASTSA PSPAAAAAAA

180

SSGVITVIER SEPTPAAAVN VSTSMASTTF SRVCAENTGA SLVLAAAKRL TAMIKPISPS

240

SGVPLMKSSC QRRSTRHTST ALPPRSWPGP RHGPDGNRGA D

281

<212>类型:PRT

<211>长度:281

     序列名:SEQ ID 311:GDC_MTUB_3482312

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LRGRLIRYAV LLSPSLPLRP SASATGFQSA SVVVTAERAL PAWPLPAPPL EPELHAASIT

60

AAAVVIATIL PACLAPAMRV PSIRCIHGVD GSSVSHGLSG DYETTMKLDR TDPGTARRPH

120

RRPGRVSAGR RGSSTRGTHA HPRRGHQRHR PTCPSAIATG SRRNPVSWNN IQRPSAAAAR

180

RARARTSIRQ RCGPRTSHPL SLLTTELELA LRRPRSNPEL LAAIRSALAE TTDTARTTGG

240

TGLGLAIVDT LSQRNHASVT ARNRAAGGAE ISLRLALG

278

<212>类型:PRT

<211>长度:278

     序列名:SEQ ID 312:GDC_MTUB_3581973

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LLGLPDPRPV PRNPAARRRA TSRSLSADPS SRPASQSRPR PGTWCTSEGS SRDPSGGSLG

60

GQCWGVGGLL LGGFFGAGQC CSGSGEDLEA QVAPSFDPFV VLFGEDGSDE ADDRGAVGED

120

AHDVGSASYL SVEAFLGVVG PDLAPDLLGE GGERQQVGAG GVEVLGHRGE FVGQSVEYPI

180

ILGNN

185

<212>类型:PRT

<211>长度:185

     序列名:SEQ ID 313:GDC_MTUB_3711717

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MIFWATRYCT IWLPPSPSSV TFSPAVLAGL GVDASTVDPA LASPTSSLST PISARVSTVT

60

SFFLAAMMPL KDGKRGSLIF SFTLITAGSV ASRVNTPSSV SRSPVILPPS IDTLRRWVSC

120

GRPRYSAMMA GTAPPTPSVD SLPAITSSVP SMVPNARAKA HPVWMTSEPC MPSSFRWTAL

180

SAPIDSALRI ASVARSGPAV STVTDPSMPS AASFSRICSA SSTARSLISS STASAASRSS

240

VKSPSVSLRS DQVSGTCLIR TTMFVMTVVR PPRRRPAALD CGTSVTRFAT AQRYYYSVSS

300

RGAPSHHSGW

310

<212>类型:PRT

<211>长度:310

     序列名:SEQ ID 314:GDC_MTUB_3716987

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LLSSWPRPGT WCTSEGSSRD PSGGSLGGQC WGVGGLLLGG FFGAGQCCSG SGEDLEAQVA

60

PSFDPFVVLF GEDGSDEADD RGAVGEDAHD VGSASYLSVE AFLGVVGPDL APDLLGEGGE

120

RQQVGAGGVE VLGHRGEFVG QSVEYPIILG NN

152

<212>类型:PRT

<211>长度:152

     序列名:SEQ ID 315:GDC_MTUB_3754581

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LIRSIDRWGS AAGGAVGTPG GTDCNGRSSH PARSAATNTS ISAQGAAGPW VKNRGRSSFP

60

VASCSRTAAE TTSSCLGSGA PATNVSARQP DTTYRPSVDR TGRARRTPST NNVSRTRADQ

120

AARALSATID NTTSPHRQPP SQPAPNRMGC APAKPNATNT CSGGGSTFTP VSLVEPIGVY

180

WACIGPSTSP CRAASAWPTR RSHPAGVPRR RNRLS

215

<212>类型:PRT

<211>长度:215

     序列名:SEQ ID 316:GDC_MTUB_3794808

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS

60

AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL

120

AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRS

180

TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS

240

RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR

298

<212>类型:PRT

<211>长度:298

     序列名:SEQ ID 317:GDC_MTUB_3796793

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VPDLLEFAAL GLRRKAVHDH ERDDGERAED RENACAAEHT QHGEREGGND RVGRQCRGEH

60

RARSHRPQPG REALRGVHPD QRAESEVEPD DEQQHAGEPQ HQPRATIGVV GEYGDQHGIC

120

GDHRRDAGQQ DRATAQPIDQ KQRGTHRRQA GDLHHRGQGK HREIAREAHG GEKSRTVVDD

180

RVDPGDLDEE AERDDEQRGP QIRPPHHFAD TAAAFVDRGR HIGQLGIDVG LRLDPPQRAT

240

RVGDPALEQI PAGGIGHAPQ QRQQQRGRRG GQPEHRAPAV RSGQQVADQV TDDDAAKRRQ

300

LIRGHQRPTH RRRRRLGHIH RHHHHRQADC HTQQQTRHHQ HRYGHRGRAE QGEHCVAGDD

360

EHHRFLASDR VGEDAAAKRP GDLAEHRRGG QQLLFSSGEF EFLAERQQRT RDGGKVVPVE

420

DADAGGGEPD EERPAPRSGQ LTGTGALSTS TTRSGSSGAP AGVNPASWYR AVVISMRLPQ

480

RRHAVNRWSS PDFGADQGRL GCPPANDAEG IGVSS

515

<212>类型:PRT

<211>长度:515

     序列名:SEQ ID 318:GDC_MTUB_3879013

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VSDATTVLFG LPGARVERVE RRSDGTRVVD VITDEPTAAA CPSCGGGLDI SEGIRGYLTE

60

RSTLWRRPHH GALEQNSLAM PRRLLQAGAV HRGHHPGTCP RPQHAAAASA DGQGDRGCGP

120

LGGPRSPRLT PCRGRRHIGR LLPTPRRVLT EPLPTPVLGV DQTRRGKPRW ERCAKTGRWV

180

RVDPWDTGFV DLAGDQGFMG QHEGRGGAAV LAWLQARTPQ FRESIQYGGH RPRRCLRLGD

240

PHARAAAQRQ ARRRPLPCDH AGQRRADRGA PPGDLGVPRP ARPQDRPAVG QPTSLADRPG

300

TLVGQKLRQN AESDQRRRPP RADSLGLDRQ RGAAHPAVDR AHRRGPPPGA PSPTPLPAWR

360

IDSQIPELLT LATTID

376

<212>类型:PRT

<211>长度:376

     序列名:SEQ ID 319:GDC_MTUB_3921024

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VQALPESQLP ELAVQMRRRL IETVTATGGH LGAGLGMVEL TIALHRVFTS PHDIGVRHRA

60

PNLSAQAAHR PR

72

<212>类型:PRT

<211>长度:72

     序列名:SEQ ID 320:GDC_MTUB_3974481

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MSSEGGWPNV GNLARSASMT SAVSSSARVV WVRYDSWVPS GRFNAATSAG VCTNNVDRGA

60

TPSVPSVSSC PACPMKTTVS PRAANRAASA WTFATSGQVA STTCSPRSSA PARTAGETPC

120

AENTTTAPGG GGSGISSRSS TNTAPRSRNS ATTTVLCTIC LRTYTGPSAT SSTRLTVSIA

180

RSTPAQNDRG DANSTVTSPE AYPCATGPTN TSAISTPGDI SVATTRSGLG IAPHRAVPQ

239

<212>类型:PRT

<211>长度:239

     序列名:SEQ ID 321:GDC_MTUB_3994808

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LPGHRRGTSA SRVPGNRPRL RPSWPRRTPL ARPKTTGCAR STCSSRARAR AARPRSGRCR

60

PPAWRWARSR MSPPSRITVS GPPSAGASRR EDGSLHRTRH PQITAVAHRP RRWRPGLREA

120

SLPARPTRSR ADQGKRISAS AAGEAEGPFH IRRNGKAVPP LLRRGRAAAR QDG

173

<212>类型:PRT

<211>长度:173

     序列名:SEQ ID 322:GDC_MTUB_3998938

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VGRRDRGAPA RPFSAHPQRR CLLAGQSQGc RRGIGLRPAR QHLVGGGSGG PGGAGELRRR

60

QGWHHRANPV GGAGARALRR LRQCDLSAGA HRDDGRCLRR RTRCRSGPDR PAVAAACGKP

120

GPVSGVPGCR GSQRSGVHRL RSAGDAGVTA AHGAPVQRGR HVLGSHRAHR DAAGLLCWSG

180

SGTELFGDRS DASVTRGYRR PIIGIGVRIT TPT

213

<212>类型:PRT

<211>长度:213

     序列名:SEQ ID 323:GDC_MTUB_4021183

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LPWTACCSPY SNDNRTKPSP VKSATNSSPA RASTANVHDP GNTMSPLRSR TPKLSTLPAS

60

QATAVAGLPN TASLRPSATT SPLRVSFASI ALTSRSAGGT RAAPNTKPAA EALSAMVSQI

120

LICQSLILVS ISSMAGTRAS VAASTSSSVQ PAPGRSAARM KPTSTSTRGD RYRDAWTGVS

180

SNTCMSSSRC P

191

<212>类型:PRT

<211>长度:191

     序列名:SEQ ID 324:GDC_MTUB_4045946

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VVHSRRSWAP SRRPHRGIDA ANERAPAVPE QLTGDPDDRP AQIQQRGGPL DVPSPLRRVC

60

PMLWPVILDT DSQLLVAQVD AGDEVPVVVK HSDLCLRLRQ TGIDQHQSGP RLLWGFRTPV

120

DQRQHRTEAD QAARTGMFGN DGLHVGDLDI GRIRQRVQPL NGLQPRGCAP PDIEGGARRG

180

GYRDTVNRNR LVRRQSIRVH DDARRRLSIG VH

212

<212>类型:PRT

<211>长度:212

     序列名:SEQ ID 325:GDC_MTUB_4053033

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VSRYPNSWRR LNNPDMAVPM LNRPVFKPLR TEPKRVPGTP MLPMPEVWPL MTVPPLAVLK

60

NPETSTAKGP VGVLKKPETS VPVLPKPELV RPLSVMIPKP VFTLPAFHEP VLMLPEFPLP

120

VLTLPELSNP VLTKPAFPKP VFNSPAFPKP VLRMLAFPKP VLRTPAFPKP MLALPEFPTP

180

RLLRSPGTRV LAPVLKTPML PLPELNKPML LVPELPMPIL PLPEFSSPAR LMPI

234

<212>类型:PRT

<211>长度:234

     序列名:SEQ ID 326:GDC_MTUB_4140236

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LSSNHAILRL LAPLRLDPQN LGAGPQREHR HRQGRRHGAQ SQSGVLADAG VDVVPAQHAP

60

PQQVRQRTGI GQVGSDVDPE

80

<212>类型:PRT

<211>长度:80

     序列名:SEQ ID 327:GDC_MTUB_4169350

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LCQGVPARLP PATDTVGVVT KSAVPRVGLD VQIDYSLGDR PVPGHGTGTN QETCEAVCYG

60

AVRRFASGQA QGGDHLGWPG RHRARGRAAA RRPCCGGVQR HLSCVPAARA APAA

114

<212>类型:PRT

<211>长度:114

     序列名:SEQ ID 328:GDC_MTUB_4170798

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRPAKRAEEE PGNHPRAGCS GSPPSAPWRS QTPRLATMRP AKRAEEEPGN HPRAGCSGSP

60

PSAPWRSQTP RLATMRPAKR AEEEPGNHPR AGCSGSPPSA PWRSQTPRLA TMRPAKRAEE

120

EPGNHPRAGC SGSPPSAPWR SQTPRLATMR PAKRAEEEPG NHPRAGCSGS PLARPTTGSS

180

RRRRKIRQLS VRVKHAVHRT

200

<212>类型:PRT

<211>长度:200

     序列名:SEQ ID 329:GDC_MTUB_4252190

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

MRTTIDLDDD ILRALKRRQR EERKTLGQLA SELLAQALAA EPPPNVDIRW STADLRPRVD

60

LDDKDAVWAI LDRG

74

<212>类型:PRT

<211>长度:74

     序列名:SEQ ID 330:GDC_MTUB_4260620

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VSRCRIHCRR LALSRQKTRS LPDLQLASRS GLRRLGCKMD VIRWARRLAV VAGTAAAVTT

60

PGLLSAHVPM VSAEPCPDVE VVFARGTGEP PGIGSVGGLF VDALRFPGWR QVTRGLRR

118

<212>类型:PRT

<211>长度:118

     序列名:SEQ ID 331:GDC_MTUB_4302166

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VDACHSRARR GVVDRRRPRC GGTARGVVGI RAWAAPLHCG RSSDSGARAR ENSGRVAGTT

60

MLAVPVPDSA LRVAGSVLDQ AGPYLPFNTP FTAAGMQYYT QMPESDDSPS EKELGITYRD

120

PRDTVADTVT ALRGLGS

137

<212>类型:PRT

<211>长度:137

     序列名:SEQ ID 332:GDC_MTUB_4317863

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

LMWKPRWRWC STASERRTTA SPDACRNVSR CRSPSLRLAG SGSPWHRMRS RSTAAMATSR

60

PGRWPGCCVT RKSTRSGRAP TTSCVWMCGA GSSRRALTRH CWRGCAMRCR CPTMTTPRGW

120

SRAALRTSTR RSPLGPNSTG SWPRRGCSRW PNSWATSTPA RCSPSRPPGN GQPAAPTARH

180

SSPACTRAGI SPTKARCAVS TQIAMRRCSV STNSWRARSL PSRRKSPQFV ALLTLPWVSL

240

CPE

243

<212>类型:PRT

<211>长度:243

     序列名:SEQ ID 333:GDC_MTUB_4341852

     序列描述:

序列

<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV

<400>前序列链:

VRAPATRAAS RGSSRNSDQR PSGRSVIPSR PSSSACQVCS GVFISPGKRV DKPTIAMSTR

60

SAGPVRDQSS ASSPARSVSG SPSMIRVASD SMVGCANATA TDSVTPVRSS MSAAIATASR

120

DDRPSSTMGT DSSIESGAFP TALPTQLRSH WRISGTVSSA LSAGAFSWDS ATSAMGPQSE

180

VAKTVGEPTP LRRLPSR

197

<212>类型:PRT

<222>长度:197

     序列名:SEQ ID 334:GDC_MTUB_4391527

     序列描述:

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

LHEDPHTGVE PGAVTAHRDC QHPRPACGDE PFNPACVLVR TDGPDDRKCE MTAIRFDAHR

60

SGRECHAVLI AAFLLEPGEA HCLALTFTGS GVLPVPVRID SAANAVGVSL FRALRPPHRP

120

GLGVDTHLVL DGVPPFTKHP QRRLDSPDTS NAPRLDIGFQ SSDRPVVGLA ASAEMPRQRA

180

GLVLGWVQRE PERLHTPAFW HLESGHQAAS ASPTAAARAR LAPFCAARSP

230

<212>类型:PRT

<211>长度:230

     序列名:SEQ ID 335:GDC_Sars174_refseq

     序列描述:

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

LRPSRSTLIA KCASWRQPPR CLRSAAVNRR SSAPVAQREL RAENRPESRP QFTLGAVWPH

60

PVNVICAGGR WRVANPSGAG PPSTPRRGQL ISGYASATAP AMGCGRTRRI SPNTRMPSCR

120

AHLLKEGLRH LFSVKGEESK QALDRLIF

148

<212>类型:PRT

<211>长度:148

     序列名:SEQ ID 336:GDC_Sars68_refseq

     序列描述:

序列

<213>生物名:Sars冠状病毒(Sars Coronavirus)

<400>前序列链:

VHSASSVATP VRGSTLAGSA GPSTAVTMPA KPTCGATNCS TSMSPSRAAI TWRSPLRHTT

60

KRTMTPPMSR RHQRPSKVRS GLPRVSTISA TVGWGSPWRS STPCAVRSRC TCSQTMSRRS

120

SCGIFGRIPS VTGKSTRCNR SAITNMPSMV TSTPTTLSAV PARPAADGPV MINRKSCR

178

<212>类型:PRT

<211>长度:178

     序列名:SEQ ID 337:GDC_Sars61_refseq

     序列描述:

序列

<213>生物名:Sars冠状病毒(Sars CoronaVirus)

<400>前序列链:

MDRLCGAPLC HRRRGPTATA AQAGARRLHD PQQAPGRAVA GQLRPAGRAD RGAGRPGGSG

60

SGAPRPGRQP DHGGARHSGG PASRRGVALL EGAAARARPV VHRGGDNRAA VLVEITGEPL

120

AWESRQNGCG VLHSRRRRQR RDLEPPVRRR PRR

153

<212>类型:PRT

<211>长度:153

     序列名:SEQ ID 338:GDC_Sars78_refseq

     序列描述:

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号