公开/公告号CN1914616A
专利类型发明专利
公开/公告日2007-02-14
原文格式PDF
申请/专利权人 科学工业研究委员会;
申请/专利号CN200480040837.3
申请日2004-01-09
分类号G06F19/00(20060101);
代理机构31100 上海专利商标事务所有限公司;
代理人范征
地址 印度新德里
入库时间 2023-12-17 18:12:30
法律状态公告日
法律状态信息
法律状态
2022-12-20
未缴年费专利权终止 IPC(主分类):G06F19/00 专利号:ZL2004800408373 申请日:20040109 授权公告日:20091216
专利权的终止
2009-12-16
授权
授权
2007-04-11
实质审查的生效
实质审查的生效
2007-02-14
公开
公开
发明领域
本发明涉及鉴定可用作药物靶点的蛋白质编码DNA序列的一种通用方法。更具体地说,本发明涉及鉴定各种生物基因组序列中鉴定可用作潜在药物靶点的新基因的方法。本发明还提供通过精确的氨基酸序列相同性标识(identity signature)说明(assignment)功能未知的推测的开放读框(蛋白质)的功能的方法。
已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供采用具有一输入层(input layer)、一含有30个神经元的隐藏层(hidden layer)和一输出层(output layer)的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数(learningfunction)来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分(fraction of zeroes)、最大连续性非零延伸段(maximum continuous non-zero stretch)和方差。
本发明背景和现有技术参考
鉴定新测序基因组中蛋白质编码DNA序列(基因)的最可靠方法是寻找其它生物中相接近的类似基因(BLAST(Altschul,S.F等,1990)和FASTA(Pearson,W.R.,1995))。DNA序列中的4种核苷酸不是随机分布的。编码区内核苷酸的统计学分布与非编码区明显不同(Bird,A.,1987)。以Hidden Markov模型(HMM)为基础的方法最有效地利用了这些统计学特性(Salzberg,S.L等,1998;Delcher,A.L等,1999;Lukashin,A.V.和Borodovsky,M.,1998),当将这些方法与发表的注释比较时,能预测到基因组中约97-98%的所有基因(Delcher,A.L等,1999)。已开发了利用HMM的各种算法,例如GeneMark、Glimmer等来预测原核生物的基因。所有现有方法中,Glimmer 2.0最为成功(Delcher,A.L等,1999)。然而,Glimmer也只能预测7-20%的额外基因(假阳性)。每种基因预测方法有其自身长处和弱点(Mathe,C.等,2002)。由于预测通常取决于训练组(training set),因各种交叉基因组之间编码区的不同而使这种统计学产生缺点。而且这些方法不能有效地预测长度短的基因(<100氨基酸),这是因为用类似的检索或统计学分析很难检测这些基因。就基因的水平转移而言,该问题愈加严重(Kehoe,M.A等,1996)。在此种情况中,基因组自身内这些基因的核苷酸序列的统计学分布也不同。
本发明所述的方法是基于以下的发现,即某给定长度肽的理论上可能的总数和实际上确实观察到的总数的差异随着该肽长度的增加而急剧上升。例如,在56个完全测序的原核生物基因组库中仅观察到理论上可能的七肽的约2%。在八肽水平上,该数字降低至小于0.1%。此外,有趣地注意到就其性质而言,大多数这些选出的肽仅发现于编码区中,而非常罕见于理论上可被翻译的非编码区中。此发现促使我们研究了蛋白质编码序列中的肽的这种天然选择排他性是否可用来区分编码区和非编码区。
从原理上讲,只有当得到了足够的数据用来估计训练(train)预测算法所需的统计学参数,才能总是优选用较长而非较短的肽给查询ORF评分(Salzberg,S.L.等,1998)。但当我们使用长度为8个或更多个氨基酸的肽时,难于得到足够的数据来估计这些训练参数。这是因为两种多肽之间共有一个八肽的可能性小于共有一个七肽。所以,我们认为7个氨基酸的长度对于ORF评分是最佳的。
本文所述方法的新颖性在于它是根据蛋白质编码序列的氨基酸水平,而非核苷酸水平进行工作。值得注意的是该方法无需生物特异性训练组,这点相对于其它方法具有明显优势。与其它方法不同,GeneDecipher不采用诸如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱等任何地标(landmark)来预测编码基因和它们的起始部位。此外,该方法克服了对较小基因组(Chen,L等,2003),如SARS-CoV作基因预测的困难。与基因预测不同,该方法也可用于多肽的相似性检索、蛋白质推测的功能说明(根据该寡肽基序的存在)和种系发生的结构域分析,表明该方法具有广泛应用性和通用性。
现有的计算方法,例如GeneMark.hmm(Lukashin和Borodovsky,1998)、Glimmer(Salzberg等,1998)等在分析小基因组,例如SARS时有困难。基于Hidden
Markov模型(HMM)的方法需要数千个训练参数。这使得这些方法不适于分析较小的基因组。就SARS-CoV基因组而言,所述化合物长度约30kb。迄今为止,即使最适用于预测病毒基因的方法-ZCURVE_CoV(Chen等,2003)也需要33种训练参数。GeneDecipher只需要5种参数即能分析较小的基因组。申请人在大肠杆菌-k12基因组编码和非编码区上训练了人工神经网络(ORF不报道为基因)。使用GeneDecipher预测病毒基因组上蛋白质编码基因无需额外的训练。这是该方法优于其它方法的一个明显优点。
本发明的目的
本发明的主要目的是提供基于计算机的方法来预测可用作药物靶点的蛋白质编码DNA序列(基因)。
本发明的另一主要目的是开发一种利用软件GeneDecipher的通用性方法,所述方法采用在其它基因组的ORF中发现的寡肽来鉴定基因。
本发明还有另一目的是开发一种适用于防治病原性生物所致疾病的方法。
本发明还有另一目的是开发一种执行上述方法的基于计算机的系统。
本发明还有另一目的是开发一种用于鉴定可用作潜在药物靶点的新蛋白质编码DNA序列的方法,该方法可用作广谱抗菌药物的药物筛选以及感染的特异性诊断。
本发明还有另一目的是鉴定菌株特异性或生物特异性的蛋白质编码基因。
本发明还有另一目的是鉴定真核生物的蛋白质编码DNA序列(外显子)。
本发明的另一目的是通过精确的氨基酸序列相同性标识说明功能未知的推测的开放读框(蛋白质)的功能。
本发明小结
本发明涉及利用软件GeneDecipher,采用在其它基因组的ORF中发现的寡肽来鉴定基因并且也适用于分析小基因组的通用性方法,所述方法包括以下步骤:用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的功能来评价所提出的候选药物步骤。
本发明详述
因此,本发明涉及利用专门开发的软件GeneDecipher鉴定基因组中可用作药物靶点的蛋白质编码DNA序列(基因)的通用性方法,所述方法包括以下步骤:用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;人工翻译该测试基因组获得每个读框的多肽;根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;用S形(曲线)学习函数将人工神经网络(ANN)训练成字母数字式序列;解密该测试基因组中的蛋白质编码区,从而鉴定对大量已知基因作图的肽的较长延伸段和它们所对应的蛋白质;最后本发明涉及防治病原性生物所致疾病的方法,所述方法包括通过抑制本发明上述步骤鉴定到的一种或多种蛋白质的作用来评价所提出的候选药物步骤。
在本发明的一个实施方案中,鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法包括以下步骤:
·用计算机处理以字母顺序排列的长度为‘N’的肽从已知基因组产生肽文库;
·人工翻译该测试基因组从而获得每个读框的多肽;
·根据与上述肽文库的重叠情况将每条多肽序列转变为字母数字式序列,其中各条序列对应于每个读框;
·用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;
·解密该测试基因组中的蛋白质编码区,和
·鉴定用作功能性标识的对大量已知基因作图的肽的较长延伸段。
在本发明的另一实施方案中,所述人工神经网络具有一个或多个输入层、含有数目不同神经元的一个或多个隐藏层和一个或多个输出层。
在本发明还有的另一实施方案中,所述隐藏层中神经元的数量优选30。
在本发明还有的另一实施方案中,所述‘N’的值是4或更大。
在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。
在本发明还有的另一实施方案中,所述鉴定基因的方法采用发现存在于(但不限于)流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的其它基因组ORF中的寡肽。
在本发明还有的另一实施方案中,权利要求1所述的方法中的所述肽文库数据可取自任何生物,而不特别限于本发明所用的那些。
在本发明还有的另一实施方案中,SEQ ID No 1-44所示流感嗜血菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.170-213所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 1-44所示流感嗜血菌基因。
在本发明还有的另一实施方案中,SEQ ID No 45-60所示幽门螺杆菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.214-229所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 45-60所示幽门螺杆菌基因。
在本发明还有的另一实施方案中,SEQ ID No 61-165所示结核分枝杆菌的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.230-334所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 61-165所示结核分枝杆菌基因。
在本发明还有的另一实施方案中,SEQ ID No 166-169所示SARS-冠状病毒的一组基因用上述方法鉴定。
在本发明还有的另一实施方案中,SEQ ID No.335-338所示的一组蛋白质对应于用上述方法鉴定的SEQ ID No 166-169所示SARS-冠状病毒基因。
在本发明还有的另一实施方案中,对应于SEQ ID No 1-169所示基因的可作为药物靶点的SEQ ID No.170-338所示蛋白质用作防治需要这种防治的对象的病原生物所致疾病。
在本发明还有的另一实施方案中,所述病原性生物选自SARS-冠状病毒、流感嗜血菌、结核分枝杆菌就幽门螺杆菌。
在本发明还有的另一实施方案中,所述对象是动物。
在本发明还有的另一实施方案中,所述对象是人。
在本发明还有的另一实施方案中,所述应用可扩展至真核生物和多细胞生物。
已出现的高通量测序技术需要鉴定新测序基因组中新的蛋白质编码DNA序列(基因)。本发明通过利用肽文库提供了将DNA序列转变为字母数字式序列的新方法。本发明也提供使用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还提供利用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差。
本申请人发明了通过与含有数百万个肽的经受了自然选择的肽文库作比较来鉴定蛋白质编码DNA序列的基于计算机的新方法,所述肽得自许多生物的蛋白质序列。该方法描述了一种可用于基因鉴定的可广泛使用的和通用性的新方法。该计算机处理的方法通过利用肽文库和人工神经网络能在某给定的DNA序列的所有可能的开放读框(ORF)中确定候选基因。所述肽文库由得自完全测序的56种或更多种原核生物基因组的蛋白质的所有可能的重叠七肽构成。根据文库七肽(文库中存在的七肽)沿着ORF的丰度和分布模式确定某给定的查询ORF是否为基因。该方法的性能特征在于灵敏度和特异性都很高。分析完全测序的10种原核生物基因组证明了本发明方法的效力。
本发明方法也可预测针对病原生物某特定肽基序的其它(alternate)靶点或负责疾病进程的任何宿主蛋白质靶点。可利用不同长度的肽扩展该方法来获得更大量的蛋白质编码基因以及用于真核生物与多细胞生物。
本发明涉及通过采用肽文库将DNA序列转变为字母数字式序列的新方法,本发明也提供采用具有一输入层、一含有30个神经元的隐藏层和一输出层的人工神经网络(正反馈传播拓扑学)来鉴定蛋白质编码DNA序列的方法。本发明还涉及用S形(曲线)作为学习函数来训练神经网络以鉴定蛋白质编码DNA序列的方法,所述学习函数具有5种参数,称为总得分、平均值、零部分、最大连续性非零延伸段和方差,该方法可用于鉴定新的蛋白质编码区作为广谱抗菌药物的药物筛选以及感染的特异性诊断,此外可用于说明功能尚未知的新鉴定的蛋白质的功能。该方法可鉴定各物种或菌株的特异性蛋白质编码基因。该方法甚至也可扩展至对真核生物基因组中的任何蛋白质编码序列进行鉴定。
因此,本发明公开了鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的一种通用方法,所述方法包括以下步骤:
a.用计算机处理以字母顺序排列的长度为‘N’的寡肽从已知基因组产生肽文库;
b.人工翻译该测试基因组获得每个读框的多肽;
c.根据这些寡肽在该肽文库的存在将每条多肽序列转变为字母数字式序列,其中各条序列对应于各个读框;
d.用S形(曲线)学习函数将人工神经网络(ANN)训练成对应于已知的蛋白质编码DNA序列和已知的非编码区的字母数字式序列;
e.解密该测试基因组中的蛋白质编码区,和
f.鉴定用作功能性标识的对大量已知基因作图的肽(进化上保守的寡肽)的较长延伸段。
在本发明的另一实施方案中,所述ANN具有一个或多个输入层、含有数量不同神经元的一个或多个隐藏层和一个或多个输出层。在本发明还有的另一实施方案中,所述隐藏层中神经元数目优选30。
在本发明还有的另一实施方案中,所述‘N’的值是4或更大。
在本发明还有的另一实施方案中,所述S形(曲线)学习函数具有5种参数,包括总得分、平均值、零部分、最大连续性非零延伸段和方差。
本发明的再一个实施方案(涉及)鉴定具有进化上保守的肽序列的基因的方法,这些保守的肽序列存在于各种(生物)基因组的ORF中产生,包括,但不限于:流感嗜血菌(H.influenzae)、生殖道枝原体(M.genitalium)、大肠杆菌(E.coli)、枯草芽胞杆菌(B.subtilis)、闪烁古生球菌(A.fulgidis)、结核分枝杆菌(M.tuberculosis)、苍白密螺旋体(T.pallidum)、海栖热袍菌(T.maritima)、集胞蓝细菌(Synechocystis)、幽门螺杆菌(H.pylori)和SARS-CoV的基因组。
在本发明还有的另一实施方案中,该方法在SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌的基因组中鉴定了169种SEQ ID 1-169所示的新基因。
本发明还有的实施方案(提供)防治病原生物,例如SARS-冠状病毒和流感嗜血菌、结核分枝杆菌、幽门螺杆菌所致疾病的方法,所述方法包括评价所提出的候选药物能否抑制一种或多种进化上保守的肽序列的功能,这些保守的肽序列可用本方法鉴定,选自对应于SEQ ID 1-169所示新基因(编码)的SEQ ID 170-338所示蛋白质。
在本发明还有另一实施方案中,该肽文库数据可取自任何生物而不特别限于本文所用的那些。
方法详述:
该方法主要有5步(如图1所示):
1.产生肽文库。
2.将某给定的基因组人工翻译成6个读框。
3.将每条翻译的序列转变为字母数字序列。(各条对应于各个读框)。
4.训练人工神经网络(ANN)。
5.使用经训练的ANN解密这些基因。
1.产生肽文库
本发明需要一个参比肽文库来预测某给定基因组中的基因。在本发明中,申请人采用了已完全测序的56种原核生物基因组(编码)的蛋白质。我们数据库的蛋白质文件从ftp://ftp.ncbi.nlm.nih.gov/genomes以FASTA格式获得。为制备用于解密某特定基因组中基因的肽文库,申请人排除了属于我们数据库的特定物种的蛋白质文件,目的是避免任何偏向性。例如,当分析大肠杆菌-k12基因组时,将对应于大肠杆菌所有菌株的蛋白质文件排除在用于产生该肽文库的数据库之外。当分析新测序的基因组时,必需这样做以除去得自该生物的肽的信号。这增强了该方法对不能得到其注释的蛋白质文件的新测序基因组的基因预测(能力)。产生肽文库时,通过将读窗移动一个氨基酸来包括所有可能的重叠七肽。从该肽文库中除去冗余肽,根据不同生物存在的肽数目给每个肽一个出现值。
该出现值是对编码区中七肽保守性的一种度量。ORF中存在高出现值的某七肽增加了该ORF是蛋白质编码基因的可能性。依据以下假设,如果某七肽在9种或更多种不同生物的蛋白质文件中存在,可认为它是高度保守的七肽,我们的算法将9或更大的出现值处理为9。用更高的值来进一步区分保守程度(amount)没有意义。
所述七肽文库由两列构成,第一列是七肽序列,第二列是该七肽的评分(出现值)。七肽按字典顺序分类。肽文库数据库也保留有关七肽的其它信息,例如所有包含特定七肽的蛋白质的登录号和NCBI注释。可利用其对某给定的ORF作假定的功能预测。同一方法也可用于种系发生结构域的分析。
2.将某给定基因组人工翻译成6个读框
该算法的第二步是用标准密码子表将全部查询基因组人工翻译成所有的6个读框。然而,当需要时可采用用户指定的密码子表。在人工翻译基因组时,申请人使用字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。
3.将每条翻译的序列转变为字母数字式序列(各条对应于各个读框)
我们的算法中下一步是将人工翻译,带有终止密码子(z)中断的氨基酸序列转变为字母数字式序列。申请人在肽文库中检索了每条重叠的七肽,分配了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于该文库中,申请人分配数值为0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子的位置。当某七肽含有符号‘z’时,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号说明存在非标准核苷酸符号并且不传送关于序列是基因还是非基因一部分的信息。因此,如此产生的字母数字式序列含有13个符号,即任何整数(0-9)、‘s’、‘*’和‘-’。申请人以该方式将所有6个翻译蛋白质的文件转变为6个字母数字式序列。
4.训练人工神经网络(ANN)
本文所用的神经网络具有多层正反馈拓扑学(结构)。它由一输入层、一隐藏层和一输出层构成。这是‘完全连接’的神经网络,其中每个神经元i与下一层的每个单元j相连(图2)。每个连接的权重以wij表示。输入层中每个神经元的状态Ii直接从输入数据指派,而隐藏层神经元的状态用S形(曲线)函数,hj=1/(1+exp-λ(wj0+∑wijIi))用计算机处理,其中wj0是偏置权重,λ=1。
采用了反向传播(back propagation)算法以尽可能降低计算机输出和所需输出之间的差异。进行了一千次轮(信号出现时间(epoch))迭代。然后鉴定确认组(validation set)中最小误差的信号出现时间,对应的权重(wij)指派为ANN的最终权重。该网络在训练组训练、核对误差并通过反向传播利用确认组优化。
‘训练组’由1610个NCBI列出的大肠杆菌-k12的蛋白质编码基因和还未报道为基因(非基因)的3000个大肠杆菌-k12 ORF(长度超过20个氨基酸并在同一框内含有起始密码子、终止密码子的序列延伸段)构成。‘确认组’具有大肠杆菌-k12的1000个已知基因和1000个非基因而与训练组所用的基因相区别。‘测试组’含有同一生物的另1000个基因和1000个非基因。为训练ANN,分别将基因和非基因的概率值指派为1和0。
为训练神经网络,申请人首先通过上述方法(步骤2和3)将大肠杆菌-k12所有的基因和非基因转变为对应的字母数字串。此时重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量某字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数:
(i).总评分
这是某给定的字母数字式序列的所有整数的代数和。经验法则方法是评分越高,成为基因的机会越大。
(ii).零部分
零部分等于字母数字式序列中零符号的总数除以该序列中符号的总数。零部分越多,成为基因的机会越低。
(iii).平均值
平均值等于总评分除以序列的总长度。平均值越高,成为基因的机会越高。实际上,该参数似乎与总评分相同,但由于该参数也包括了序列的长度(每单位长度的评分),它是重要的。
(iv).方差
是关于整个ORF的平均出现值的出现值方差。
(v).最大连续性非零延伸段的长度
该参数的值越高,成为基因的机会越高。设想如‘45’的序列区。这里,‘4’表示某七肽在4种生物中保守,其后的‘5’表示某重叠的七肽在5种生物中保守。因此,如果在这两组之间至少一种生物是共同的,申请人最终获得了在该生物和查询ORF之间有共同一个八肽。这提高了我们预测编码区的可信度。例如,当与序列‘s40540607000*******’比较时,序列‘s45467000000********’更可能是一个基因。这是因为在后一序列中更有可能存在较长的保守肽。前一序列的该参数值是2而后一序列的为5。然而,该算法中所用的其它参数不能区分这两条序列。
当计算该字母数字式序列的这些参数时,已排除了例如‘s’、‘*’和‘-’符号。
为找到最佳组合,采用所有的5个参数一起训练神经网络。计算对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。
输入层中神经元的数目等于输入数据点的数目。隐藏层中神经元的最佳数目由命中(hit)和试验所确定同时尽可能减少网络最佳信号出现时间的误差。计算所有5个参数的计算机程序和人工神经网络用C(语言)编写,在装有Red Hat Linux 7.3或8.0版的PC上执行。
训练ANN(该算法的步骤4)通常只进行一次,训练过的同一神经网络可用于对任何原核生物基因组执行该方法。虽然如果申请人采用生物特异性训练组,在一些情况中结果可能有所改善,但很勉强。这是因为我们的方法是根据ORF的字母数字式序列的数字分布来预测基因。所以,基因预测更依赖于所用的肽文库而非训练组。
5.使用训练过的ANN解密基因
虽然认为产生肽文库(步骤1)和训练ANN(步骤4)是执行本发明方法的预备阶段,但步骤2和步骤3对每个基因组测序而言是强制性的。用计算机处理将基因组翻译成所有的6个读框并将它们转变为6个字母数字式序列后,即可用ANN解密这些基因。该步骤还可分为以下5个小步骤:
1.将所有6条字母数字式序列截断成可能的ORF。(所有可能的片段始于‘s’,终于‘*’)
2.计算所有可能的ORF(所有的字母数字串在‘s’和‘*’之间)的所有5个参数(总评分、零部分、平均值、方差和连续性非零延伸段的长度)。
3.用训练过的ANN计算对应于某给定字母数字串的ORF成为蛋白质编码基因的概率。
4.采用一截断概率值从非编码ORF中滤出蛋白质编码ORF。
5.除去所有重叠(encapsulate)的蛋白质编码区(Shibuya,T.和Rigoutsos,I.,2002)
如果在不同的翻译框中预测了两个ORF,以致于一个延伸完全重叠了另一个,通常认为二者中只有一个可能是真正的基因。在这种情况中,申请人报告具有较高概率值的ORF为基因。当概率值相同时,申请人取较长的ORF为基因。
本发明的方法可预测对应于某查询ORF是蛋白质编码区的概率值。利用=1的S形(曲线)学习函数训练ANN(基因的概率为‘1’,非基因的概率为‘0’);因此,大多数时间此概率值低于0.1或高于0.9。由于该原因,0.1-0.9之间的任何截断值可能得到非常相似的结果。在我们的分析中,申请人使用的默认截断值为0.5。重要的是应注意,本发明无需在灵敏度和特异性之间寻求平衡,因为截断概率的选择对结果无重要影响。
本发明的其它方面、特征和优点将通过以下提出的出于公开目的本发明优选实施方案的描述而得以明了。
计算机程序简述:
1.文件名:genedcodchr.cxx
应用:将核苷酸序列(FASTA文件格式)翻译成6个独立框中的6个假设的多肽。
输入格式:<Program_name><Nucleotide_file><Output1><Output2><frame>例如,./genedcodchr ecoli.fna pf1 pr1 0
输出格式:AGTFYRYmGHVNMKIYTASLPTYRYGYFSHRED.....HGOIEKSDWEzDFGTRE
2.文件名:searchchr.cxx
应用:通过七肽文库(给定的输入)检索将多肽文件转变为字母数字式序列。
输入格式:<Program_name>7<peptide library file name>out Y<Input1><Input2><Output1><Output2>例如./searchchr 7 ecoli.peplib out Y pf1 pr1 bf1 br1
输出格式:
s1124500001090003000020000023000000000*******0001000..........
3.文件名:cutfc
应用:从正向链的字母数字式序列切除所有可能的ORF(即,所有的‘s’到‘*’区域),产生含有字母数字式序列中所有‘s’的位置的文件。
输入格式:<Program_name><Input file name><Output1><Output2>例如../cutf bf1 unknown_bf1 bf1_location
输出格式:output1-s1111000s00000000563*,output2-某列中‘s’的起始位置。
4.文件名:cutr.c
应用:从反向链的字母数字式序列切除所有可能的ORF(所有的‘s’到‘*’区域),产生含有字母数字式序列文件中对应于所有ORF的所有3个正向框的起始位置的文件。
输入格式:<Program_name><Input file name><Output1><Output2>例如../cutr br1 unknown_br1 br1_location
输出格式:output1-*010340000222200067900000s000001000200s00230000s,
output2-‘s’的起始位置
5.文件名:stat.c
应用:计算某给定的字母数字式序列的5个参数:零部分、平均值、总评分、最大连续性延伸段的长度和方差。
输入格式:<Program_name><Input file name><Output>1例如../statunknown_bf1 bf1.data 1
输出格式:0.334 3.2 48 15 0.452 1
6.文件名:train.c
应用:利用S形(曲线)(=1)作为学习函数以正反馈传播算法训练人工神经网络(一隐藏层、一输入和一输出层)。
输入格式:<Program_name><Input specification file name><Input1><Input2><Input3>>output
例如../train train.spec.fast trainset.data validateset.data testset.data>train.Net
输出格式:输出一单列中所含有的最终神经网络权重
7.文件名:recognize.c
应用:根据训练过的权重识别某给定的模式并产生概率值作为输出。
输入格式:<Program_name><Input specification file name><Input1><Input2><Output>例如../recognize recognize.spec bf1.data train.net f1.out
输出格式:pat1 probability<value>
8.文件名:Filter_prediction.c
应用:根据概率和长度参数滤除同一框中完全重叠的ORF。
输入格式:<Program_name)<Input1><Input2><Output>例如../Filter_prediction f1.out unknown_bf1 bf1.out.res
输出格式:pat1 probability<value><integer string>
9.文件名:locationf.c
应用:滤除长度<20个氨基酸的基因,报告含所有3个正向框字母数字式序列的其余基因的起始位置
输入格式:<Program_name><Input1><Output><Input2>例如../locationfbf1.out.res bf1.out.res bf1_location
输出格式:<Pattern No><Probability value><integer string><Start><End>
10.文件名:locationr.c
应用:滤除长度<20个氨基酸的基因,报告含与所有3个反向框的字母数字式序列的其余基因的起始位置
输入格式:<Program_name><Input1><Output><Input2>例如../locationrbr1.out.res br1.out.res1 br1_location
输出格式:<Pattern No><Probability value><integer string><Start><End>
11.文件名:finalf.c
应用:将字母数字式序列的起始和末端位置转变为3个正向框的相应的基因组位置
输入格式:<Program_name><Input1><Input2><Input3><Output>例如../finalf bf1.out.res1 bf2.out.res1 bf3.out.res1 Final_outputf
输出格式:<Start><End><frame><length><Probability value>integerstring>
12.文件名:finalr.c
应用:将字母数字式序列的起始和末端位置转变为3个反向框的相应的基因组位置
输入格式:<Program_name><Input1><Input2><Input3><Output>例如../finalf br1.out.res1 br2.out.res1 br3.out.res1 Final_outputr
输出格式:<Start><End><frame><length><Probability value><integerstring>
13.文件名:sort.c
文件名:sort.c
应用:将最终预测的基因打印为沿该基因组起始位置的递降顺序。
输入格式:<Program_name><Input1><Input2><Input3><Output>例如../sort Final_outputfFinal_outputr OUTPUTF_with_encap
OUTPUTR_with_encap OUTPUT
输出格式:<Start><End><Probability value>
14.文件名:removeencap.c
应用:除去在其它5个框中发现的重叠基因
输入格式:<Program_name><Input1><Input2><Input3><Output>例如../removeencap OUTPUTF_with_encap OUTPUTR_with_encap OUTPUTOUTPUTF OUTPUTR
输出格式:<Start><End><frame><length><Probability value>integerstring>
本发明涉及基于计算机的预测可用作药物靶点的蛋白质编码DNA序列的新方法。在该方法中,利用出现的寡肽标签(signature)作为探针。该方法是通用性的,不一定需要用于人工神经网络的生物特异性训练组。该方法不仅依赖于统计学分析,而且整合了经受过进化压力的保守肽中所保留的生物信息。可合乎逻辑地扩理地拓展该方法来预测真核生物基因组中的蛋白质编码DNA序列(外显子)。
附图简述
图1显示了GeneDecipher的逻辑电路。
图2显示了神经网络的结构。
图3显示了GeneDecipher对10种生物所得结果的分析。
下文给出了本发明所用生物的细节,包括名字、菌株、登录号和其它细节。
给出以下实施例是为了说明本发明而不应理解为限制本发明的范围。
实施例1
将DNA序列转变为字母数字式序列
该模块在我们软件中的目的是经计算机处理利用特定的密码子表将整个查询基因组(DNA序列)翻译成所有的6个读框。人工翻译基因组时,申请人使用的字母‘z’对应于终止密码子TTA、TAG和TGA,字母‘b’表示含有任何非标准核苷酸(K、N、W、R和S等)的所有三联密码子。然后将翻译的基因组序列经计算机处理转变为字母数字式序列([0-9]、‘s’、‘*’和‘-’)。申请人在该肽文库中检索了每条重叠的七肽,指派了对应的数值(出现值)并将其加在字母数字式序列后。如果某七肽不存在于此文库中,申请人指派数值0。如果某七肽以对应于起始密码子ATG、GTG和TTG之一的氨基酸开始,申请人在该字母数字式序列中加上符号‘s’。这有助于检测可能的起始密码子位置。在某七肽含有符号‘z’的情况中,申请人加上对应于该七肽的符号‘*’。因此,字母数字式序列中连续7个‘*’(*******)是终止密码子的信号。申请人给任何含有符号‘b’的七肽加上符号‘-’。该信号表明存在非标准核苷酸符号。
在下列6条序列的帮助下进一步精制了上述转变。
·SEQ ID No.12
>gi_GDC_HINF_243018
GTGATGAGCCGACATCGAGGTGCCAAACACCGCCGTCGATATGAACTCTTGGG
CGGTATCAGCCTGTTATCCCCGGAGTACCTTTTATCCGTTGAGCGATGGCCCTT
CCATTCAGAACCACCGGATCACTATGACCTACTTTCGTACCTGCTCGACTTGTC
TGTCTCGCAGTTAAGCTTGCTTATACCATTGCACTAA
计算机翻译的蛋白质序列
>gi_GDC_HINF_243018
VMSRHRGAKHRRRYELLGGISLLSPEYLLSVERWPFHSEPPDHYDLLSYLL
DLSVSQLSLLIPLH
计算机产生的字母数字式序列
ss10000000000001s03111431000000000000000000110000100s001030*
·SEQ ID No.4
>gi_GDC_HINF_170553
GTGTTTATGCTTTATTTAGAATTTTTATTTTTACTATTAATGCTCTATATCGGTA
GCCGTTACGGCGGTATCGGATTAGGTGTTGTTTCTGGTATCGGTCTTGCTATCG
AGGTTTTCGTATTTCGTATGCCAGTGGGGAAGCACCGATTGATGTTATGCTTAT
CATTCTTGCAGTGGTGA
计算机翻译的蛋白质序列
>gi_GDC_HINF_170553
VFMLYLEFLFLLLMLYIGSRYGGIGLGVVSGIGLAIEVFVFRMPVGKHRLMLCLSFLQW
计算机产生的字母数字式序列
s0s1131231142s1111445232254238000000000000s0s0000ss00*
·SEQ ID No.73
>gi_GDC_MTUB_688806
TTGCTGCACAGCAGCTTCGGGCACCTCGAGGGCATCCAGCAGCCGCTCATAGA
CGAGCTGGCAGAACTCGACCACGTGTTGGGCAAGCTGCCGGACGCCTACCGGA
TCATCGGCCGCGCCGGCGGCATATACGGTGACTTCTTCAACTTCTATCTGTGTG
ACATCTCACTGAAAGTCAACGGATTACAGCCTGGAGGTCCGGTACGCACCGTC
AAGTTGTTCGGCCAGCCGACCGGCAGGTGCACACCGCAATGA
计算机翻译的蛋白质序列
>gi_GDC_MTUB_688806
LLHSSFGHLEGIQQPLIDELAELDHVLGKLPDAYRIIGRAGGIYGDFFNFYLCDISLKVNGLQPGGPVRTVKLFGQPTGRCTPQ
计算机产生的字母数字式序列
s000000000110110530100000ss000000000000100000000000000000001111210000000s00100*
·SEQ ID No.92
>gi_GDC_MTUB_1286282
GTGACGGTATACCGTCGAGGTATGGCTGTGTTAACGGATGAGCAGGTCGACGC
CGCACTGCACGACCTCAACGGCTGGCAGCGCGCCGGTGGTGTCCTGCGTAGGT
CAATCAAGTTTCCGACGTTTATGGCCGGTATCGACGCCGTACGCCGGGTGGCC
GAGCGAGCCGAGGAGGTAAATCATCATCCGGACATCGATATCCGTTGGCGAAC
AGTAACTTTCGCGCTGGTTACGCATGCGGTAGGTGGTATCACGGAAAACGACA
TTGCGATGGCGCACGATATCGACGCAATGTTTGGGGCCTAA
计算机翻译的蛋白质序列
>gi_GDC_MTUB_1286282
VTVYRRGMAVLTDEQVDAALHDLNGWQRAGGVLRRSIKFPTFMAGIDAVRRVAERAEEVNHHPDIDIRWRTVTFALVTHAVGGITENDIAMAHDIDAMFGA
计算机产生的字母数字式序列
s000000s0s21110001000000300000000011000000s01031100s00020000110000000030000000013310000000s0001*
·SEQ ID No.49
>gi_GDC_HPYL_583607
TTGATGGAATTTGATGTTACCATCATAGATGAGACAGGCAGGGCCACAGCACC
AGAAATCTTGATTCCTGCACTTCGCACTAAAAAACTGATCTTAATAGGCGATC
ACAACCAGCTCCCACCTAGCATTGATAGGTACCTCCTAGAACAATTAGAGAGC
GATGATATTCAAAACTTGGATGCCATTGATCGCCAATTATTGGAAGAGAGTTT
TTTTGAAAATCTCTATAAGTATATTCCAGAGAGTAATAAGGCCATGCTTAATG
AGTAA
计算机翻译的蛋白质序列
>gi_GDC_HPYL_583607
LMEFDVTIIDETGRATAPEILIPALRTKKLILIGDHNQLPPSIDRYLLEQLESDDIQNL DAIDRQLLEESFFENLYKYIPESNKAMLNE
计算机产生的字母数字式序列
ss001000000000000000s0000011000020000000000030310000000002s0003020s0000000000000000*
·SEQ ID No.54
>gi_GDC_HPYL_954846
GTGAGCCTGGTTTCAAGCGTGTTTTTAATGTGTTTAGACACTCAAGTGCTAGTC
TTTGGGGATTGCGCGATTATCCCTAACCCTAGCCCTAAAGAATTAGCCGAGAT
CGCTACCACTTCCGCACAAACCGCCAAGCAATTCAATATTGCGCCTAAAGTGG
CCTTGCTTTCTTATGCGACAGGCGATTCCGCTCAAGGCGAAATGATAGACAAA
ATCAACGAAGCTTTAACAATCGCTCAAAAGTTGGATCCCCAATTAGAAATTGA
TGGCCCCTTACAATTTGACGCTTCCATTGATAAAAGCGTAGCCAAGAAAAAAT
GCCTAACAGCCAAGTGGCTGGGCAAGCTAGCGTTTTTATTTTCCCGGATTTAA
计算机翻译的蛋白质序列
>gi_GDC_HPYL_954846
VSLVSSVFLMCLDTQVLVFGDCAIIPNPSPKELAEIATTSAQTAKQFNIAPKVALLSYATGDSAQGEMIDKINEALTIAQKLDPQLEIDGPLQFDASIDKSVAKKKCLTAKWL GKLAFLFSRI
计算机产生的字母数字式序列
s80000s00s00002s200222000000003100000000000000000010s0s100000000000s0000000100000s00000000000000000000000000030000010*
实施例2
训练人工神经网络(ANN)
该模块在软件中的目的是用特定的基因和非基因编号训练指定的神经网络(图2)。在该实施例中,训练组由1610个NCBI列出的大肠杆菌-k12蛋白质编码基因和还未报道为基因的3000个大肠杆菌-k12 ORF(非基因)构成。确认组具有大肠杆菌-k12的1000个已知基因和1000个非基因而和训练组所用的相区别。测试组含有同一生物的另外1000个基因和1000个非基因。为训练ANN,基因和非基因分别指派的概率值为1和0。为训练神经网络,申请人首先通过上述方法(步骤2和3)将所有大肠杆菌-k12基因和非基因转变为对应的字母数字式链。图3显示了字母数字式序列格式的两个大肠杆菌-k12基因和两个非基因的例子。这里重要的是应注意与对应于非基因的字母数字式序列相比,对应于基因的字母数字式序列富含数字。为定量其字母数字式序列的这种数字丰富程度,从该字母数字式序列选择了5个参数。以下是这5个参数:
表1(a)和1(b)解释了总评分(某给定的字母数字式序列的所有整数的代数和)、零部分(该字母数字式序列中零符号的总数除以该序列中符号的总数)、平均值(总评分除以序列的总长度)、方差(关于整个ORF的平均出现值的出现值方差)、最大连续性非零延伸段的长度(表示无间断的非零数字在序列中的占位情况)。
表1(a):训练ANN(基因)
表1(b):训练ANN(非基因)
当计算该字母数字式序列的这些参数时,排除符号‘s’、‘*’和‘-’。为确定每个参数对区分基因与非基因的作用,采用所有5个参数一起训练神经网络。计算出对应于基因和非基因的字母数字式序列的参数。训练组、确认组和测试组包含6列,前5列包含5个参数的值,最后一列包含表示基因的数字‘1’和表示非基因的数字‘0’。
实施例3
申请人使用本发明的方法分析了10种原核生物基因组。该方法的效率定义为由所述方法预测的NCBI列出的蛋白质编码区的百分比。通过专门开发的程序自动除去所有重叠的蛋白质编码区。该方法能预测平均92.7%的NCBI列出的基因,标准差是2.8%。除结核分枝杆菌H37RV基因组外,该方法的灵敏度和特异性值均高(如图3所示)。
实施例4
预测蛋白质编码DNA序列的起始位置
本发明方法预测起始位置的正确率从结核分枝杆菌H37Rv的49.5%(特异性也是最低的)到幽门螺杆菌26695的81.1%。申请人的方法根据是否存在起始密码子加周围七肽的保守情况可确定该起始位置。也可利用该方法预测经一些其它方法预测的查询蛋白质编码DNA序列的起始位置。这可通过简单地将蛋白质序列转变为对应的整数序列,然后根据周围七肽确定正确的起始位置来实现。为举例说明起始位置的预测(如下所示),申请人报告了大肠杆菌K-12基因组的3个这样的情况(两个来自正向链,一个来自反向链)。
预测起始位置时,要兼顾数字丰富程度和ORF的长度。在情况1(PID 16132273)中,NCBI将该基因的起始位置从位置85540移至85630。目测对应于该基因的整数序列,可以明显看出较早的在‘s’后有充满0的区域;或者换言之它不是富含数字的区域(下图所示情况1中的黑体区域)。现在移动起始位点使它位于本发明方法预测的数字丰富区之前。情况2是该起始密码子向5’上游移动的一个例子,因为在该起始密码子的上游有数字丰富区(‘2011111’和一个‘3’和一个‘2’)。故该位点从位置4611194移至4611050。情况3是移动反向链中起始位点的另一例子,其中在较早的NCBI起始位置的上游有数字丰富区(该数字串中有‘16531311’和许多其它数字)。
情况1.PID 16132273
位置 较早的NCBI(85540……87354); 新的NCBI(85630……87354)
s0s0000000000000s000000000s000s2ss4222s111000000000999922224210000s00s40004
466442223s0s0120000000177s9999855553239888440s001111000113002s1116311112ss
22222s430100000000100s0100000639977100011100100000001000000000s2000010030
000011110111100000161171000000000s201s12s0000002ss10000000001099s76s621110
0s0s0000s00014444441111100000000000234331211000s033221s000000014s000s00000
002000000000001110000000000000000000s000001s000000s48976531s11111100012234
59999999s92554010010s0s0002s2236667778s75221001s000s000ss00000066ss11111s32
11100000s000002204332110000000000210010010000s00000s11000000354211s000000s
00s22*******
情况2.PID 16132266
位置 较早的NCBI(4611194……4611829); 新的NCBI(4611050……4611829)
s00020111110000000000000300000000020000010000030ss000000001110s0s000ss0000
0s102110000000100ss3s2000000000000000000000100021100011s110000000000s00000
000001s10100000010100002222222000000000000000010321002s3321111s1101111001
0000000s00s000s00101010100s00000*******
情况3.PID 16132224
位置较早的NCBI(2538824……2539273); 新的NCBI(253824……2539699)
N
*******0000000000000ss000000001s2000104220300000000s00000000000100000s0s98
↓
889135120sss0001222000022512s0000223s123100000000ss0s000ss0022s30000ss00000s
00000000000001000000s0s0000s16531311000000101010000s00200101s1110000230ss0
↓
100000s0001000000s0000000s0000s0s00001100s0011000000000000000s00000s
←———— E
E:NCBI的较早的起始位点→正向读框
N:NCBI的较新的起始位点→反向读框
实施例5
预测蛋白质编码DNA序列
通过采用以下步骤利用该方法预测发表的可得到的数据库(NCBI)中各种基因组的蛋白质编码DNA序列:
i)从选择的生物的所有蛋白质序列经计算机处理产生重叠的肽文库,所述蛋白质序列得自http://www.ncbi.nlm.nih.gov;
ii)按字母顺序,根据单字母氨基酸密码用计算机拣选以上获得的长度为‘N’的肽;
iii)将每个肽和出现它们的不同特异性生物分类;
iv)利用步骤1和2获得的肽文库将DNA序列转变为字母数字式序列;
v)检索该字母数字式序列检索所有可能的开放读框(ORF);
vi)训练改进的神经网络来区分蛋白质编码和非编码DNA序列;
vii)利用训练过的神经网络预测该开放读框(步骤4中获得)中的DNA编码序列;
viii)除去重叠的蛋白质编码DNA序列(基因内的基因)。
如表2所详述的,本发明人使用本发明的方法从选自以下的生物的基因组中发现了169个新基因:SARS-冠状病毒、流感嗜血菌、结核分枝杆菌和幽门螺杆菌。表2显示了SEQ ID No.1-SEQ ID No.169所示序列中的所述新基因。
表2
对10种微生物基因组分析了GeneDecipher的系统灵敏度和特异性(图3)。以下给出了对病毒基因组的GeneDecipher进一步分析。
SAR-CoV基因组序列:从GenBank数据库(http://www.ncbi.nlm.nih.gov/Entrez/genomes/viruses)下载可利用的18 SARS-CoV毒株序列并分析。这些序列包括SARS-CoV Refseq(NC_004718.3)、SARS-CoV TWC(AY32118)、SIN2774(AY283798)、SIN2748(AY283797)、SIN267^(AY283796)、SIN2677(AY283794)、SIN25ti6(AY283794)、Frankfurt(A Y291315)、BJ04(AY279354)、BJ03(AY278490)、BJ02(AY278487)、GZ01(AY278848)、CUHKW 1(AY278554)、TOR2(AY274119)、TW1(AY291451)、BJ01(AY278488)、Urban(AY278741)、HKU-39849(AY278491)。其它蛋白质编码基因相关的信息检索得自http://www.nchi.nlm.nih.gov/genomes/SARS/SAks.html。
对病毒基因组测试GeneDecipher:
为对病毒基因组测试我们的方法,申请人首先用GeneDecipher分析了人呼吸道合胞病毒(HRSV)的完全基因组。将GeneDecipher的结果与现有技术水平的方法ZCURVE_CoV进行了比较(表3)。ZCURVE_CoV能从11个NCBI报道的基因中预测8个注释的蛋白而无假阳性。ZCURVE_CoV不能预测以下3个基因:PID 9629200(位置626...1000,非结构蛋白2(NS2));PID 9629205(位置4690...5589,粘附性糖蛋白(G))和PID 9629208(位置8171...8443,基质蛋白2(M2))。GeneDecipher从总共11个注释的HRSV蛋白中预测了10个而无假阳性。注意到GeneDecipher遗漏的基因也是ZCURVE_CoV所遗漏的PID 9629208(位置8171...8443,基质蛋白2)。
成功预测了HRSV基因组中的蛋白质编码区提高了我们对预测新测序的SARS-CoV基因组中蛋白质编码区的信心。
用GeneDecipher分析SARS-CoV:
申请人用GeneDecipher分析了SARS-CoV的所有18个病毒株。(详细结果见以上给出的网址)。对18个病毒株中的每种而言,GeneDecipher在SARS-CoV基因组中预测了总共15个蛋白质编码区,包括多聚蛋白1a、1ab(多聚蛋白1ab的Sars2628 C末端)和所有4种已知的结构蛋白(M、N、S和E)。取决于所用病毒株的基因组序列,GeneDecipher也预测了6-8个额外的编码区。这些额外编码区的长度范围是61-274个氨基酸。
GeneDecipher预测的12个编码区是所有18个病毒株共有的(表4)和存在于5个病毒株中的一个编码区(NCBI refseq基因组中的Sars63、sars6)。GeneDecipher特别在GZ01病毒株中预测了基因Sars90,在BJ02病毒株中预测了Sars154(NCBIrefseq基因组中的Sars 3b)。
这12个共有蛋白质编码区由SARS-CoV的6个基础蛋白质(2个多聚蛋白和4个结构蛋白)构成:Sars274(NCBI refseq数据库中的Sars3a)、Sars 122(NCBI refseq数据库中的Sars7a)、Sars78(已报道TOR2病毒株中起始点转移为ORF14/Sars9c);和3个新预测到的(对NCBI的当前注释而言是假阳性)蛋白质编码区Sars174、Sars68和Sars61。这3个新预测的基因全部位于多聚蛋白1a基因组区域中。虽然在细菌基因组中我们的方法舍弃了这种基因,但不能排除在病毒基因组中发现这种基因的可能性。由于这些基因存在于所有18种病毒株中,它们可能是蛋白质编码区。
除了上述12个编码区以外,申请人还预测了3个编码区,Sars63、Sars154和Sars90。Sars63在5个病毒株中均鉴定到但未在其余13个病毒株中鉴定到。该编码区早已报道在NCBI refseq中(Sars6)。申请人不能在本文中过多评价Sars63(NCBIrefseq中的Sars6)的存在。因为它在5个并毒株中鉴定到而在其余13个病毒株中未鉴定到。这是因为病毒株之间该区域的非同义突变密度高。两个编码区Sars154(NCBI中的sars3b)和Sars90(在GZ01毒株中新预测的)只在一个病毒株中鉴定到。由于这两个编码区只在一个病毒株中鉴定到,它们不大可能是蛋白质编码区,ZCURVE CoV(Chen等,2003)分析也提出同一结论。该3个基因在不同病毒株中的位置见表5。
由于此肽文库从各种生物的基因组序列制备,故可以追踪某给定蛋白的进化起源。如果该蛋白富含发现在病毒基因组中的七肽,则可以认为该蛋白是病毒起源的。申请人发现5个核心蛋白(两个多聚蛋白和3个结构蛋白M、N和S)是病毒起源的。其余的(包括3个新预测的)是原核生物起源的。令人感兴趣的是从同一DNA区域申请人在不同读框中得到含有不同起源的肽的蛋白。同一DNA序列如何编码细菌和病毒起源的(蛋白)令人感兴趣。这或许可解释为何在依据与其它已知病毒基因组序列的同源性作的初步分析中未能检测到这些新的蛋白质编码基因。
与现有系统-ZCURVE_CoV的比较:
表6a和6b给出了用SARS-CoV的Urbani和TOR2病毒株的已知注释比较GeneDecipher和ZCURVE_CoV的结果。
GeneDecipher的结果与已知的注释相一致。就Urbani并毒株而言,GeneDecipher预测到除Sars84(X5)、Sars63(X3)和Sars154(X2)之外的所有已知基因。ZCURVE_CoV预测到Sars84(X5)和Sars63(X3),而两种方法均遗漏了Sars154(X2)。GeneDecipher在该病毒株中顺便预测了ZCURVE_CoV未预测到的4个新基因。要注意的是在这4个基因中Sars78是病毒株TOR2已知的ORF14/Sars9c。这支持了该基因存在于Urbani病毒株中的可能性。然而,ZCURVE_CoV也预测了GeneDecipher未预测到的两个新基因。
GeneDecipher对TOR2病毒株的预测与对Urbani病毒株的预测相同。在该病毒株中,GeneDecipher预测了9个已知基因,但未预测到6个具有已知注释的基因。这6个基因是:Sars154(ORF4)、Sars98(ORF13)、Sars63(ORF7)、Sars44(ORF9)、Sars39(ORF10)和Sars84(ORF11)。在这些基因中,Sars154(ORF4)和Sars98(ORF13)也为ZCURVE_CoV所遗漏。应注意Sars44(ORF9)和Sars39(ORF10)均是长度非常小(分别是44和39个氨基酸)的ORF,它们也不全存在于各种SARS病毒株中。GeneDecipher在其它5个病毒株而非在本文考虑的两个病毒株中预测到了Sars63(ORF7)。
突变分析:
使用多个序列比对(ClustalW)对所有18个病毒株的3个新预测的蛋白质编码基因Sars174、Sars68和Sars61进行分析显示:
1.SIN2677病毒株中Sars68在位置80具有一个点突变GAT->GGT(D->G)。
2.GZ01病毒株中Sars174在位置204具有同义点突变CGA->CGC和BJ04病毒株中在位置447具有同义突变CTG->CTT。
3.GZ01毒株中Sars61在位置119具有一个点突变CTG->CAG(L->Q)。
这3个新预测的基因存在于所有18个病菌株中而无明显的突变,并且在非冗余数据库中用BLASTP命中不明显。这表明该3个蛋白对SARS-CoV可能有特别重要的生物学功能。因此,这些编码序列可作为抗SARS的候选药物靶点,
功能指定:
申请人总共预测了SARS-CoV中的15个编码区,其中已指定了4个结构蛋白(M、N、S和E)的功能。虽然已指定了多聚蛋白1ab只有复制酶活性,我们的分析暗示该复制酶活性与Sars2628(ORF 1ab的C末端)片段相关。完整的1ab多聚蛋白含有6个功能标签,其中多聚蛋白1a含有与代谢酶相关的标签(表7a)。根据在至少5种不同生物中具有相似功能的蛋白中存在的肽(长度为7个或更多个氨基酸)给多聚蛋白指定功能。其它预测的基因/蛋白质编码区含有的肽存在于较少基因组中。根据这些肽,申请人提出了它们的功能,虽然不大肯定(表7b)。这些发现的生物相关性有待研究。
表3.就注释的基因而言,对HRSV基因组比较GeneDecipher与ZCURVE_CoV的结果
表4:GeneDecipher在所有18个病毒株共有的SARS-CoV Refseq中所预测的蛋白质编码基因
表5:GeneDecipher在各种SARS-CoV中鉴定到的视为蛋白质编码基因的Sars90、Sars63和Sars154
表6(a).就注释的基因而言,对SARS-CoVUrbani病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果
表6(b).就注释的基因而言,对SARS-CoVTOR2病毒株基因组比较GeneDecipher与ZCURVE_CoV的结果
表7(a):用PLHOST指定SARS(Urbani)基因组中多聚蛋白的功能
表7(b):用PLHOST提出SARS-CoV中一些非结构基因的功能
*:未发现保守的八肽。然而,功能已根据仅有的高保守七肽指定。
如上所述,申请人公开了SARS-CoV中的4个新基因,包括Sars78。该分析进一步确证了ZCURVE_CoV的发现(Chen等,2003),即ORF Sars154(作为Sars3b列于Refseq中)不可能是编码区。申请人也给两个多聚蛋白1ab和1a指定了功能。除了1ab多聚蛋白C末端的复制相关功能外,申请人的分析提示多聚蛋白1a可能与代谢酶样的功能相关。总之,多聚蛋白1ab中存在6个肽标签。申请人给其它9个蛋白,包括通过GeneDecipher新预测到的提出了假定的功能。
优点:
1.本发明的主要优点是提供一种预测蛋白质编码DNA序列而不使用任何外部证据,例如核糖体结合位点、启动子序列、转录起始位点或密码子使用偏爱的新方法。
2.本发明提供蛋白质编码DNA序列的统计学分析方法,所述方法利用经受了进化压力的保守肽中所留生物学信息。
3.本发明提供一种预测蛋白质编码基因的起始位点的简单方法。
4.本发明提供一种检测生物特异性、毒株特异性蛋白质编码DNA序列的方法。
5.本发明提供可用作潜在药物靶点的新蛋白质编码DNA序列。
参考文献
Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.,Lipman,D.J.,(1990)“局部序列比对基本检索工具”(Basic local alignment search tool),J.Mol Biol.,215,403-10
Bird,A,(1987),“CpG岛可作为脊椎动物核中的基因标记”(CpG islands asgene markers in the vertebrate nucleus),Trends Genet.,3,342-47
Chen,L.,Ou,H.,Zhang,R.和Zhang,C.,(2003),“ZCURVE_CoV:一种能识别冠状病毒蛋白质编码基因的新系统,及其在分析SARS-CoV基因组中的应用”(ZCURVE_CoV:a new system to recognize protein coding genes in coronavirus,and its applications in analyzing SARSCoV genomes),Biochemical and BiophysicalResearch Communications,307,382-8
Delcher,A.L.,Harmon,D.,Kasif,S.,White,O.和Salzberg,S.L.,(1999),“用GLIMMER改进的微生物基因鉴定”(Improved microbial gene identification withGLIMMER),Nucleic Acid Research,27,4636-41
Kehoe,M.A.等,(1996),“A族链球菌中的水平性基因转移:发病机理和流行病学的关系”(Horizontal gene transfer among group A streptococci:implications forpathogenesis and epidemiology),Trends Microbial.,4,436-43
Lukashin,A.V.和Borodovsky,M.,(1998),“GeneMark.hmm:寻找基因新方法”(GeneMark.hmm:New solution for gene finding),Nucleic Acid Research,26,1107-15
Mathe,C.,Sagot,M.F.,Schiex,T.和Rouze,P.,(2002),“当前基因预测方法的能力和应用”(Current Methods of gene prediction their strength and theapplicantsaknesses),Nucleic Acid Research,30,4103-17
Medigue,C.等,(1999),“检测和分析DNA测序的错误:为获得更高质量的枯草芽胞杆菌基因组序列”(Detecting and Analyzing DNA Sequencing Errors:Towarda Higher Quality of the Bacillus subtilis Genome Sequence),Genome Research,9,1116-27
Pearson,W.R.,(1995),“检索蛋白质序列数据库方法的比较”(Comparison ofmethods for searching protein sequence databases),Protein Science,4,1145-60
Salzberg,S.L.,Delcher,A.L.,Kasif,S.和White,O.,(1998),“使用内插Markov模型鉴定微生物基因”(Microbial gene identification using interpolatedMarkov models),Nucleic Acid Research,26,544-8
Shibuya,T.和Rigoutsos,I.,(2002),“词典驱动的寻找原核生物基因”(Dictionary-driven prokaryotic gene finding),Nucleic Acid Research,30,2710-25
Brahmachari,S.K.和Dash,D.,(2001),“一种鉴定用作药物靶点的肽的计算机方法”(a computer based method for identifving peptides useful as drug targets),PCT国际专利公布(WO01/74130 A2,2001年10月11日)
“所报道的严重急性呼吸道综合征(SARS)病例的累积数字”(Cumulativenumber of reported cases of severe acute respiratory syndrome(SARS)),日内瓦:国际卫生组织,2003,(2003年4月9日得自http://www.who.int/csr/sarscountry/20030404/en/)
Drosten,C.,Giinther,S.和Preiser,W.,(2003),“在严重急性呼吸道综合征患者中鉴定到新的冠状病毒”(Identification of a Novel Coronavirus in Patients withSevere Acute Respiratory Syndrome),N Engl J Med.,(www.nejm.org,2003年4月10日)
Ksiazek,T.G.,Dean Erdman,P.H.和Goldsmith,C.S.,(2003),“一种新的严重急性呼吸道综合征相关的冠状病毒”(A Novel Coronavirus Associated with SevereAcute Respiratory Syndrome),N Engl J Med,348,1947-58
Marra,M.A.,Jones,S.J.,Astell,C.R.,Holt,R.A.,Brooks-Wilson,A.,(2003),“SARS相关冠状病毒的基因组序列”(The Genome sequence of theSARS-associated coronavirus),Science,300,1399-404
Tsang,K.W.,Ho,P.L.和Ooi,G.C.,(2003),“香港的严重急性呼吸道综合征的一系列病例”(A cluster of cases of severe acute respiratory syndrome in HongKong),N Engl J Med,348,1977-85
申请组织
街道:Rafi Marg
市:新得里
省:得里
国:印度
邮编:110001
电话号码:
传真号码:
电子邮件地址:impd@vsnl.net
<110>组织名:科学工业研究委员会
申请项目
<120>名称:一种鉴定可用作药物靶点的蛋白质编码DNA序列的基于计算机的通用方法
<130>申请文件参考:US 1729
<140>当前申请号:
<141>当前提交日期:--
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链(PreSequenceString):
ttgttgttga aaggagtgat tatgcaggtc tcaagaagaa aattcttcaa gatctgtgca
60 ggaggtatgg cgggaacgtc agctgcaatg ttgggctttg ctccagcaaa cgtattagct
120 gcgccacgcg aatataaatt attacgcgcg tttgaatccc gtaacacctg tacatattgc
180 gctgtaagtt gcggtatgtt gttatatagc acaggcaaac cttacaattc attaagcagc
240 catactggca caaatactcg ttcaaaactc tttcatattg agggtgatcc agatcatcca
300 gtcagtcgtg gtgcgctttg cccgaaaggt gctggctcac tcgattatgt caatagtgaa
360 agccgttctt tatatcctca atatcgtgcg ccaggttctg ataaatggga acgaatttct
420 tggaaagatg ccattaaacg tattgctcgt ttaatgaaag atgaccgaga tgccaacttt
480 gttgaaaaag attcaaatgg aaaaacggtt aatcgttggg caacgacagg aattatgact
540 gcatcagcaa tgagcaatga agctgcgtta ttaacacaaa agtggattag aatgctcggt
600 atggtgccag tatgtaacca agcgaatact tga
633
<212>类型:DNA
<211>长度:633
序列名:SEQ ID 1:GDC_HINF_5641
序列描述:
自定义密码子
序列名:SEQ ID 1:GDC_HINF_5641
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgacaaata actgggttga tattaaaaat gccaacttaa tcatcgttca aggcggtaac
60 cctgcagaag cccatcctgt tggcttccgt tgggcaattg aagcgaagaa aaacggtgcg
120 aaaatcatcg ttattgatcc gcgttttaac cgtacagcat ccgttgctga tcttcatgcg
180 ccaattcgtt ctggttctga tattacgttc ttaatgggcg tgatccgtta cctattggaa
240 acaaaccaaa ttcaacacga atatgttaaa cactatacca acgcatcatt cttaattgat
300 gaaggtttca aatttgaaga tggtttattt gtagggtata acgaagaaaa acgtaactac
360 gataaatcta aatggaacta ccaatttgat gaaaatggtc acgctaaacg tgatatgaca
420 ttacaacatc ctcgttgtgt cattaacatc ttaaaagagc acgtttctcg ttatacccca
480 gaaatggttg aacgtattac aggcgtaaaa caaaaactct tcttacaaat ctgtgaagaa
540 attggtaaaa cctctgtgcc aaataaaacg atgacgcatc tatatgcatt aggttttaca
600 gagcattcaa tcggtacaca aaatattcgc tcaatggcga taatccagtt acttttaggt
660 aatatgggga tgccaggtgg cggtattaac gcattacgtg gacactccaa tgtgcaaggt
720 acgacagata tgggcttatt gccaatgtct ttaccaggtt atatgcgttt gccaaacgat
780 aaagatacct cttacgatca atacattaac gcaattacac caaaagatat cgttccaaac
840 caagtgaact attatcgtca tacttcaaaa ttctttgtta gcatgatgaa aactttctac
900 ggagataatg ccactaagga aaatggctgg ggattcgatt tcttaccaaa agcagatcgc
960 ctatatgatc caattactca cgttaaattg atgaatgaag gcaaattaca cggttggatt
1020 ttac
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 2:GDC_HINF_6322
序列描述:
自定义密码子
序列名:SEQ ID 2:GDC_HINF_6322
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 3:GDC_HINF_124181
序列描述:
自定义密码子
序列名:SEQ ID 3:GDC_HINF_124181
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgtttatgc tttatttaga atttttattt ttactattaa tgctctatat cggtagccgt
60 tacggcggta tcggattagg tgttgtttct ggtatcggtc ttgctatcga ggttttcgta
120 tttcgtatgc cagtggggaa gcaccgattg atgttatgct tatcattctt gcagtggtga
180
<212>类型:DNA
<211>长度:180
序列名:SEQ ID 4:GDC_HINF_170553
序列描述:
自定义密码子
序列名:SEQ ID 4:GDC_HINF_170553
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atggctgctg caattcaaca acgtgccgaa cttcaacgcc gtatttggca aactgctaat
60 gatgtgcgag gctcggtcga tggctgggat ttcaaacaat atgtgcttgg cacacttttt
120 taccgtttta ttagcgaaaa ttttgccaat tacattgaag cgggcgatga aagcgtaaat
180 tatgcccaat tacctgatga aatcattaca cagatgccat taaaacgaaa ggctacttta
240 tttacccaag ccaattattt aagaatgttg cggctaatgc tggcagcaat cctaatttga
300
<212>类型:DNA
<211>长度:300
序列名:SEQ ID 5:GDC_HINF_231874
序列描述:
自定义密码子
序列名:SEQ ID 5:GDC_HINF_231874
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgaatactg atttaaaaca gatttttact gatattgaaa actcagcgac gggctttccg
60 tctgaacaag atattaaagg gttatttgcc gattttgata ccaccagcaa tcgcttaggc
120 aataccgtaa aagataaaaa cgaccgctta acggctgttt tgaaaggcgt ggctgaactt
180 gattttggca aatttgaaga taaccacatt gatttatttg gcgatgcata cgaatatctt
240 atttctaact atgccgccaa tgcaggcaaa tctggtggcg aattttttac cccacaaagt
300 gtttccaaac tcattgctca aattgcaatg cacgggcaaa cctcggtcaa taaaatttat
360 gaccctgcag caggttctgg ctcacttttg cttcaagcca aaaaacaatt tgatgaacat
420 attattgaag aaggcttttt cgggcaggaa attaaccata ccacatacaa ccttgcccgt
480 atgaatatgt ttttgcataa catcaactac gacaagtttg atattgcttt aggcaacacc
540 ttaatggaac cacaatttgg cgataataaa cctttcgatg ccattgtttc gaacccgcct
600 tactccgtga aatgggctgg ctccgacgat ccaacattga ttaatgatga acgatttgcc
660 ccccgcaggc gtgcttgcac caaaatccaa agcggacttt gcctttattt tacatgcgtt
720 aagttatctt tcagcaaaag gccgcgcggc gattgtttcc ttccctggta ttttttatcg
780 tggcggtgcc gagcaaaaaa ttcgtcaata tttggtggat aa
822
<212>类型:DNA
<211>长度:822
序列名:SEQ ID 6:GDC_HINF_232170
序列描述:
自定义密码子
序列名:SEQ ID 6:GDC_HINF_232170
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgatgaacg atttgccccc cgcaggcgtg cttgcaccaa aatccaaagc ggactttgcc
60 tttattttac atgcgttaag ttatctttca gcaaaaggcc gcgcggcgat tgtttccttc
120 cctggtattt tttatcgtgg cggtgccgag caaaaaattc gtcaatattt ggtggataat
180 aactatgtgg acgcggtgat tgcgcttgcg ccaaatctct tttttggcac cagtattgcg
240 gtgaatattt tggtgctttc caaacacaaa cccaatttat cgatgccagc ggtttattta
300 aatctgccac taataaccac attttag
327
<212>类型:DNA
<211>长度:327
序列名:SEQ ID 7:GDC_HINF_232813
序列描述:
自定义密码子
序列名:SEQ ID 7:GDC_HINF_232813
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgccgcatt tggcaaaatc catatccttt gaagaaatcg cccaaaatga ctacaacctt
60 gcagtaagtt cgtatgtgga acaaaaagac actcgtgaag tgattaatat tgatgaactc
120 aatgctcaaa ttcgtgaaac tgttaccaat attgaccact tgcgtgcgga aattgacaag
180 attgttgcag aaattgaagg gtaa
204
<212>类型:DNA
<211>长度:204
序列名:SEQ ID 8:GDC_HINF_233190
序列描述:
自定义密码子
序列名:SEQ ID 8:GDC_HINF_233190
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgacccaat acaaaactat cgctgaatcc aataatttta tcgttttaga tcaatataat
60 aaatttgtgg aagaatctaa tgctggttat caaacggaaa ggagccttga gcgtgagttt
120 attcgtgatt tacaggctca aggctatgag tatttacaat ggcttaataa tcacgatgaa
180 ctgattaaaa acttacgggc gcaattacaa cgcttaaata acgtggtttt ctccgatgca
240 gaatggcaac gttttttaga ggaatatttg gataaaccga gcgataatct gattgagaaa
300 acccgcaaaa ttcacgatga ttatatttat gattttgtgt tcgataacgg acgcattcag
360 aacatctatt tgcttgataa gaaaaatctt gccaataatt ctctgcaagt catcaatcaa
420 tttaagcaaa ctggcagcta tgataatcgt tatgatgtga caattttggt gaatggttta
480 cccctttatt ga
492
<212>类型:DNA
<211>长度:492
序列名:SEQ ID 9:GDC_HINF_235441
序列描述:
自定义密码子
序列名:SEQ ID 9:GDC_HINF_235441
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atggtttacc cctttattga attaaaaaaa cgcggcgtgg cgattcgtga agcctttaac
60 caaattcacc gttacagcaa agaaagtttc aataaagaaa attctctcttt aaatatatt
120 cagatttttg tcatttctaa tggcacggat actcgctatt ttgctaatac gactaaacgc
180 aataagaata gctacgactt cacaatgaat tgggcaacgg caaaaaatac tctgattaaa
240 gatttaaagg attttaccgc gactttcttg caaaagaata ctttgctcaa tgtgttggta
300 aattactgcg tgtttgatgt gagtgatacg ttgttaatta tgcgtccgta tcaaattgcc
360 gcaacagaac gtattttatg gaaaattcaa atttcttact tagcaaaaaa ttggagtaat
420 cgtgaaagtg gtggctatat ttggcatacc acaggttcag gcaaaaccct caccagtttt
480 aaagcctctc gccttgcgac tgaacttgat tttattgata aagtcttttt tgtggtcgat
540 cgtaaagact tagactacca aacgatgaaa gaatatcagc gtttttcgcc tgatagcgtg
600 aatgggtcgg aaagtaccgc tgggcttaaa cgcaatattg aaaaagatga taacaaaatt
660 atcgtaacca ccattcaaaa attgaataat ttaatgaaaa gtgaagaaaa cctgtctatt
720 tatcaaaaac aggtggtctt tattttcgat gaagcacatc gctctcaatt tggcgaagca
780 caaaaaaatc taaaacgtaa attcaaaaaa ttctatcaat ttggttttac tggcacgcct
840 attttccctg aaaacgcatt aggtgcggaa acgacagcaa gtgtgttcgg tgcggaattg
900 cattcttatg tgattaccga tgctattcgt gatgacaaag tactgaaatt caaagtcgat
960 tacaacgatg tccgcccaca atttaaagcc ttagaaacag aaaaagatcc tgaaaaattg
1020 accg
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 10:GDC_HINF_235913
序列描述:
自定义密码子
序列名:SEQ ID 10:GDC_HINF_235913
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atggatataa taaagcctat atgcacaggt tttttttata acgataataa tgttttagga
60 gatttgatga aaaatttcaa atattttgct cagagttatg tggattgggt tattcgtctt
120 gggcgtcttc gtttttctct tttaggcgtg atgattctcg cggttttagc tctttgtact
180 cagattttat ttagtctatt tattgttcat cagatatctt gggtagatat ttttcgttcg
240 gtaacttttg gcttactcac tgcgcctttt gttatttatt ttttcacttt attagtagaa
300 aaacttgaac attctcgtct tgatctttct agctcggtta atcgattgga aaatgaggtc
360 gccgagcgaa ttgctgctca gaaaaaatta tcccaagcat tggaaaagtt agaaaaaaat
420 agccgtgata aaagtacctt acttgccaca ataagccatg aatttcgcac gccattgaat
480 gggattgtcg ggcttagcca gattttactt gatgatgaat tggatgatct ccagcgtaat
540 tatttaaaaa ctatcaacat aagtgcggtc agtttaggct atatttttag cgatattatt
600 gatttggaaa aaattgatgc cagccgaatt gaattaaatc gccagccaac agatttccct
660 gccttattaa acgatattta taattttgct agtttcctcg ccaaagaaaa aaatcttatt
720 ttttctttag agcttgaacc taatttgcct aattggttga atcttgatcg tgttcgcttg
780 agccaaattt tgtggaactt aattagtaat gcggtgaagt ttacggatca gggaaatatt
840 attcttaaaa ttatgagaaa tcaggattgt taccatttta ttgtgaaaga tacaggaatg
900 gggatttcac ctgaagaaca aaaacatatt tttgaaatgt attatcaagt gaaagaaagc
960 cgccagcaaa gtgcgggtag cggtattggg ttggctattt ctaaaaatct tgctcagtta
1020 atgg
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 11:GDC_HINF_240336
序列描述:
自定义密码子
序列名:SEQ ID 11:GDC_HINF_240336
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 12:GDC_HINF_243018
序列描述:
自定义密码子
序列名:SEQ ID 12:GDC_HINF_243018
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgaatattc atggtttagc aaaacttaat ggtaatgtca ctttaataga tcacagccaa
60 tttacattga gcaacaatgc cacccaaaca ggcaatatca aactttcaaa tcacgcaaat
120 gcaacggtaa ataatgccac gttaaacggc aatgtgcatt taacggattc tgctcaattt
180 tctttaaaaa acagccattt ttggcaccaa attcagggcg acaaagacac aacagtgacg
240 ttggaaaatg cgacttggac aatgcctagc gatactacat tgcagaattt aacgctaaat
300 aatagtactg ttacgttaaa ttcagcttat tcagctagct caaataatgc gccacgtcac
360 cgccgttcat tagagacgga aacaacgcca acatcggcag aacatcgttt caacacattg
420 acagtaaatg gtaaattgag cgggcaaggc acattccaat ttacttcatc tttatttggc
480 tataaaagcg ataaattaaa attatccaat gacgctgagg gcgattacac attatctgtt
540 cgcaacacag gcaaagaacc tgtgaccctt gagcaattaa ctttgattga aagcttagat
600 aataaaccgt tatcagataa gctcaaattt actttagaaa atgaccacgt tgatgcaggt
660 gcattacgtt ataaattagt gaagaataag ggcgaattcc gcttgcataa cccaataaaa
720 gagcaggaat tgctcaatga tttagtaaga gcagagcaag cagaacaaac attagaagcc
780 aaacaagttg aacagactgc tgaaaaacaa aaaagtaagg caaaagcgcg gtcaagaaga
840 gcggtgttgt ctgatacccc gtctgctcaa agcctgttaa acgcattaga agccaaacaa
900 gttgaacaga ctactgaaac acaaacaagt aagccaaaaa caaaaaaagg gcggtcaaaa
960 agagcattga gtgcagcgtt ttctgatacc ccgtttgatc taagccagtt aaaggtattc
1020 gaag
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 13:GDC_HINF_274892
序列描述:
自定义密码子
序列名:SEQ ID 13:GDC_HINF_274892
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgaaaaaaa ctgtatttcg tcttaatttt ttaaccgctt gtgtttcatt agggatagca
60 tcacaagcct gggcaggtca tacttatttt gggattgact accaatatta tcgtgatttt
120 gccgagaata aagggaagtt cacagttggg gctaaaaata ttgaggttta taacaaagaa
180 gggcaattag ttggcacatc aatgacaaaa gccccgatga ttgatttttc cgtggtgtcg
240 cgtaacggcg tggcggcatt agtaggcgat cagtatattg tgagcgtggc acataacggc
300 ggatataacg atgttgattt tggtgcagaa ggacgaaacc ctgatcagca ccgctttact
360 tatcaaattg taaaaagaaa taattatcaa gcttgggaga gaaagcatcc ttatgatgga
420 gattatcata tgcctcgttt acataaattt gtaactgaag ctgaacctgt gggtatgaca
480 acaaatatgg atggaaaagt atatgctgat agagagaact atcctgagcg tgtacgtata
540 ggctcaggac gtcagtattg gcgtacagat aaagatgaag aaacgaatgt acatagttca
600 tattatgtct caggtgcata tcgttatctt actgcaggaa atacccatac tcagagtgga
660 aatggtaatg gtacagtcaa tcttagtggt aatgtagtta gccctaatca ttatggtcca
720 ttaccaacgg gtggttctaa aggcgatagc ggttcgccaa tgtttattta tgatgcgaag
780 aagaaacaat ggcttataaa tgctgtatta caaactgggc atcctttttt cggaagaggt
840 aatgggtttc agttaatacg tgaagaatgg ttttataatg aagttcttgc ggttgatacc
900 cctagtgttt ttcaacgcta tattccccca ataaatggac attattcctt tgtatcaaat
960 aatgatggta caggtaaatt aactttaact agacctagta aagatggctc taaagcaaaa
1020 tcag
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 14:GDC_HINF_276992
序列描述:
自定义密码子
序列名:SEQ ID 14:GDC_HINF_276992
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgggggaaa acgcgatgaa tttaagtcgt cgagacttta tgaaagccaa tgcggctatg
60 gcagccgcaa cggcagcggg gctaaccatc ccagtcaaaa atgtggttgc ggctgaatcc
120 gaaattaaat gggacaaagc agtatgtcgt ttctgtggta ccggttgtgc agtattagtt
180 ggtactaaag atggacgtgt tgtggcatct caaggcgatc ctgatgcaga agtaaaccgt
240 ggtttaaact gtattaaagg ttatttcttg ccaaaaatta tgtacggtaa agaccgttta
300 acgcagccgc ttttacgtat gacaaacgga aaatttgata agaacggcga ttttgcgcca
360 gtttcttggg attttgccgt tcaaaacaat ggctga
396
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 15:GDC_HINF_370413
序列描述:
自定义密码子
序列名:SEQ ID 15:GDC_HINF_370413
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgataagaa cggcgatttt gcgccagttt cttgggattt tgccgttcaa aacaatggct
60 gaaaaattca aagaagcgtt caaaaagaac ggtcaaaatg cagtaggtat gtttagttct
120 ggtcagtcta ccatttggga aggctatgca aagaacaaac tttggaaagc aggttttcgt
180 tctaacaacg tagacccgaa tgcgcgtcac tgtatggcat ctgcagcggt tgcgtttatg
240 cgcaccttcg gtatggatga acctatgggt tgttataacg acattgaaca ggcagatgct
300 tttgttcttt ggggctcaaa tatggcggaa atgcacccaa ttttgtggtc gcgtattact
360 gatcgccgta tttctaatcc tgatgttcgt gtcactgtac tttctactta cgaacatcgt
420 agttttgaac ttgccgatca cggtttgata tttacaccgc aaactgattt ggcaattatg
480 aactacatca tcaattatct tattcaaaat aatgcgatta attgggattt tgttaataaa
540 cataccaaat ttaaacgcgg agaaacgaat attggctatg gtttgcgtcc agagcatcca
600 ttagaaaaag acacgaatcg taaaacagct gggaaaatgc acgattcttc ttttgaagaa
660 ttaaagcaac ttgtatcaga atatacagtg gaaaaagtat cgaaaatgtc tgggttagat
720 aaagtccagt tagaaacttt agcgaaactt tatgctgatc caacgaagaa agtggtttcc
780 tactggacaa tgggctttaa ccaacataca cgtggtgtgt gggtaaacca attaatctac
840 aatattcatt tacttactgg aaaaatttca atcccaggtt gtgggccatt ttcattaact
900 ggtcagcctt ctgcttgtgg tacggcgcgt gaagtaggtt cattccctca tcgtttacct
960 gccgacttag tggtaactaa tccgaaacac cgtgaaattg ctgaacgtat ttggaaatta
1020 ccaa
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 16:GDC_HINF_370747
序列描述:
自定义密码子
序列名:SEQ ID 16:GDC_HINF_370747
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 17:GDC_HINF_628407
序列描述:
自定义密码子
序列名:SEQ ID 17:GDC_HINF_628407
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttggttatgt tcaatgattt tttggcaaca ttcagccagc aattaacacc tcaaatgtgg
60 ggcgttgtcg caaccgcaac ttatgaaact gtttatatca gttttgcatc taccctactt
120 gctgtactag tcggcgtgcc tgttggcata tggacttttt taactggaaa aaatgagatt
180 ttacaaaata accgcactca ttttgtgtta aacacgatta ttaatattgg gcgttccatt
240 ccatttatta ttttgctcct aatcttatta cctgtaactc gtttcatcgt gggaactgta
300 ttaggtacaa cagcagcaat tattccattg agtatttgtg caatgccatt cgtggctcgc
360 ttaactgcta atgcactaat ggaaattcca aatggtttaa ccgaagcagc tcaagcaatg
420 ggggctacta aatggcaaat tgttcgtaaa ttctatttgt cagaagctct acctacgcta
480 attaatggcg ttactcttac gctagtcact ttagttggtt attctgcaat ggcaggaaca
540 caagggggcg gtggtttagg tagcctcgct atcaactacg ggcgtatatc gcaatatgcc
600 ttatgtaact tgggtggcaa ccattattat tgtgctattc gttatgatta g
651
<212>类型:DNA
<211>长度:651
序列名:SEQ ID 18:GDC_HINF_654365
序列描述:
自定义密码子
序列名:SEQ ID 18:GDC_HINF_654365
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 19:GDC_HINF_661444
序列描述:
自定义密码子
序列名:SEQ ID 19:GDC_HINF_661444
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgcgtaaag atgcactacc cgcatttttc acagacgtaa atcaaatgta tgatgcctta
60 ttgaataaat caggggcaac aggtgtattt actgatttcc cagatacttg cgtggaattc
120 ttaaaaggaa taaaataa
138
<212>类型:DNA
<211>长度:138
序列名:SEQ ID 20:GDC_HINF_737160
序列描述:
自定义密码子
序列名:SEQ ID 20:GDC_HINF_737160
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 21:GDC_HINF_775792
序列描述:
自定义密码子
序列名:SEQ ID 21:GDC_HINF_775792
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgcctaaac ctgaaccaat accacgaccg aggcgtttagcactatgctt tgcaccttca
60 gccggagata gagtatttaa acgcatctct tactcctcca ctttaaccat gtatgaaact
120 tggttaatca taccacgtac tgcaggcgta tcaattaact caacagtgtg gtgtatatgg
180 cgaagaccaa gaccacgcaa ggtagcttta tgcttcggta aacgagcaat tgagctacga
240 acttgtgtta ctttaatagt tttagccatt attcattacc ccaagatttc atcaacagtt
300 ttaccgcgtt ttgcagcaac catttctggt gatttcatat ttgctaatgc atcaatagtt
360 gcacgaacaa cgttaattgg gttggtagaa ccatacgctt tagaaagaac gttacgtaca
420 cctgcaactt ccaataccgc acgcattgca ccaccagcga tgatacctgt accttcactt
480 gctggctgca taaatacacg tgaaccagta tga
513
<212>类型:DNA
<211>长度:513
序列名:SEQ ID 22:GDC_HINF_848166
序列描述:
自定义密码子
序列名:SEQ ID 22:GDC_HINF_848166
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgtttatat atgggggaat aaatatgcaa attacacttt caaatacctt agcgaatgat
60 gcttggggaa aaaatgcgat tttgagcttt gactctaata aagctatgat tcatttaaaa
120 aataatggaa aaactgaccg cactttagtt caacaagctg ctcgtaaatt gcgtgggcaa
180 ggaatcaaag aggtggagtt ggtcggcgag aaatgggatt tggaattttg ctgggcgttt
240 tatcaaggtt tttataccgc aaaacaagat tacgcgattg agtttccaca tttagatgat
300 gaaccgcaag atgaattgtt agcacgtatt gaatgtggcg attttgtgcg tggaattatt
360 aatgaaccag cacaaagttt aacgcctgtg aaattagtag agcgagcggc tgaatttatc
420 ttaaaccaag cggacattta taatgaaaaa agtgcggtaa gttttaagat tatttctggc
480 gaggaacttg agcaacaagg ttatcacgga atttggactg tgggtaaagg ctctgcgaac
540 ttgccagcca tgttgcaact tgatttcaat ccaacacagg attcgaatgc gcccgtgtta
600 gcttgtttag ttggtaaggg gattactttt gatagtggcg gctatagtat caaaccaagt
660 gatggtatga gtacaatgcg aactgatatg ggcggggctg cattattaac gggggcttta
720 ggtttcgcta tcgctcgtgg attaaatcaa cgcgttaagc tgtatttatg ttgcgcagaa
780 aatttggtaa gcaataatgc ctttaagcta ggcgatatta ttacttataa aaatggcgtg
840 agcgcagaag tactgaatac tgatgcggaa ggtcgtttgg tgttagctga tggattgatt
900 gaggctgata accaaaatcc aggttttatt attgattgcg cgactttaac tggcgcagca
960 aaaagtggct gtaggaaacg actatcattc tgtattatct atggatga
1008
<212>类型:DNA
<211>长度:1008
序列名:SEQ ID 23:GDC_HINF_928073
序列描述:
自定义密码子
序列名:SEQ ID 23:GDC_HINF_928073
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtggctgtag gaaacgacta tcattctgta ttatctatgg atgatgaact tgtgaaaaat
60 cttttccaat ccgcacaagc agaaaatgaa cctttctggc gtttaccatt tgaagatttt
120 catcgttcac aaattaattc atcttttgcc gatattgcta atattggttc ggttccagtt
180 ggagctgggg caagcactgc aacggcattt ttatcgtatt ttgtaaaaaa ttataaacaa
240 aattggttgc atattgattg ctccgcgact tatcgtaaat ctggtagtga tttatggtct
300 gttggggcaa caggaattgg tgtgcaaact ttagctaatt taatgttatc aagatcattg
360 aagtaa
366
<212>类型:DNA
<211>长度:366
序列名:SEQ ID 24:GDC_HINF_929037
序列描述:
自定义密码子
序列名:SEQ ID 24:GDC_HINF_929037
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgccaattg aattaaaagt agaaggttta gtgggtaaac caaacgagaa aatttctgcg
60 gcagaatttc gtcaaaaatg tcgtgaatac gcggcggaac aggtcgaggg tcaaaagaaa
120 gactttatcc gtttaggtgt gttgggcgat tgggataatc catatctcac gatgaatttc
180 gataccgaag cgaatattat ccgcacttta ggtaaagtga ttgaaaatgg tcatttgtat
240 aaaggctcaa aaccagttca ctggtgtttg gattgcggtt cttctttagc agaagcagaa
300 gtggaatatg aagacaaagt ttctccgtca atttacgttc gtttccctgc ggaaagtgcg
360 gatgaaattg aagctaaatt ttctgcacaa ggtagaggac aaggtaaatt atcagccatc
420 atttggacta ccacaccttg gacgatgcca tctaaccgtg cgattgcggt gaatgcagac
480 tcagaataca acttagtcca acttggcgat gagcgtgtaa ttttagctgc tgaattagtt
540 gagtcagtgg caaaagcggt gggtattgag cacattgaaa ttctgggttc tgtaaaaggt
600 gatgatcttg aattaagccg tttccatcat ccgttctatg attttactgt gccagtgatt
660 ttaggcgatc acgtaaccac tgatggcggt acaggtttag tacataccgc acctgatcac
720 ggtttagacg actttatcgt gggtaaacaa tatgatttac caatggcggg tcttgtatcg
780 aatgatggta aatttatttc aacgaccgaa ttctttgcag gcaaaggcgt atttgaagca
840 aatccgcttg tgatagaaaa attacaagaa gtaggtaact tattaaaagt tgaaaaaatc
900 aaacacagct atccacactg ctggcgtcac aaaacgccaa ttattttccg tgcaacaccg
960 caatggttta tcggcatgga aacgcaaggt ttacgccaac aagcattagg cgaaattaaa
1020 caag
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 25:GDC_HINF_1018846
序列描述:
自定义密码子
序列名:SEQ ID 25:GDC_HINF_1018846
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttggaaaata aaatgacagt cgattacaaa aacactctta acctaccgga aaccagcttt
60 ccaatgcgcg gtgatttagc taagcgcgaa cctgataagt ag
102
<212>类型:DNA
<211>长度:102
序列名:SEQ ID 26:GDC_HINF_1021582
序列描述:
自定义密码子
序列名:SEQ ID 26:GDC_HINF_1021582
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgaagataa ctcattgtaa attaaagaaa tctatacaaa ataagctact tgaatttttt
60 gtattagaag ttacagcccg agcagcggct gatttactcg atatctaa
108
<212>类型:DNA
<211>长度:108
序列名:SEQ ID 27:GDC_HINF_1082407
序列描述:
自定义密码子
序列名:SEQ ID 27:GDC_HINF_1082407
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgtttctgg ttggaaacct tttgaggtgg gtttggcttg cgctttttat cattgcgcaa
60 atttgggctt atgtacaaac acctgattct tggttagcaa tgatttctgg tatttctggt
120 attttgtgtg tggtattggt aagtaaaggt aaaattagta attatttctt tggattgatt
180 tttgcctata cttattttta tgttgcttgg ggatcgaatt tcttaggcga aatgaacacc
240 gtactttacg tatatttgcc ctctcaattt attggttact ttatgtggaa agccaatatg
300 caaaatagcg atggtggaga aagcgtgatt gcaaaagcgt taactgttaa aggatggatg
360 acattaattg ttgtgactac ggttggtact ttgctttttg ttcaagcatt acaagcggct
420 ggtggtagct caacaggttt agatggtcta actacaatta ttacggttgc ggcacagatt
480 ttaatgattt tgccgttatc gtga
504
<212>类型:DNA
<211>长度:504
序列名:SEQ ID 28:GDC_HINF_1144501
序列描述:
自定义密码子
序列名:SEQ ID 28:GDC_HINF_1144501
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgtttagtg gcgaacatga tgcttgcgat tgctatgtgg acctacaagc aggttctggc
60 ggcaccgaag ctcaagattg gacagaaatg ttgctccgta tgtatctccg ttgggctgaa
120 agcaaaggtt ttaaaacaga actgatggaa gtctctgacg gcgatgtagc tggattgaaa
180 tcagcaacca ttaaagtgag cggtgaatat gcttttggtt ggttacgaac agaaacgggg
240 attcatcgtt tagtgcgtaa aagtccattt gattccaata accgtcgtca cacatcattc
300 agcgcagcat ttgtctaccc tgaaattgat gatgatattg atattgaaat caatcctgct
360 gatttacgta ttgatgttta tcgtgcatca ggggcaggtg gtcagcacgt aaacaaaact
420 gaaagtgcgg tgcgaattac ccatatgcca agtggcattg tggtgcaatg tcaaaacgac
480 cgttcacagc acaagaacaa agatcaagca atgaaacaat taaaagcgaa attgtatgag
540 cttgaattac aaaagaaaaa tgcggataaa caagcaatgg aagataataa atctgacatt
600 ggttggggaa gccaaattcg ctcttatgta ttagacgatt cacgcattaa agatttacgt
660 actggcgtag aaaaccgtaa tacgcaagcc gtattagacg gggatttaga tcgatttatt
720 gaagcgagtt taaaagcggg cttgtag
747
<212>类型:DNA
<211>长度:747
序列名:SEQ ID 29:GDC_HINF_1279189
序列描述:
自定义密码子
序列名:SEQ ID 29:GDC_HINF_1279189
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgcttggta acgaaaaaca agctgaagca caagctaaat atgcggaaga cacgctgaaa
60 caagcacgcg attttgctaa acaacatcat aaaacagcct atttagcgcg taatgcggat
120 ggcttacaaa ctggtcaaaa aggttcgatt catacggaag caatggaatt ggttggcttg
180 gaaaacgtcg cagagggaga acaaaaaggc ttaactcaag tttcaatgga acagctttta
240 ttgtga
246
<212>类型:DNA
<211>长度:246
序列名:SEQ ID 30:GDC_HINF_1347200
序列描述:
自定义密码子
序列名:SEQ ID 30:GDC_HINF_1347200
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgccacgta tttttgccgc ttgttttgtc ggggcggcgc ttgcttgtgg gggcgcaact
60 tatcaaggta tgtttaaaaa tccgcttgtt tcgccagata ttttgggtgt ttcagcgggg
120 gcaggttttg gggcaagttt ggcaattttt tataatttgc caatgattta tatccaattt
180 tttgctttta gcggtggcat tttagctgtg ttatgtgtat cgctcattgc ctcgcgtagt
240 cgtacacaag atcctatttt agtgctggtg ctttctggga ttgcaattgg ttctttactt
300 ggtgcaggca tttctttgtt aaaaattctt gcggatcctt tcactcaatt accttcaatc
360 actttttggc tacttggtag cctgacggct attaatcaac aagatttaat tcaattgatc
420 ccgatgttgt tgctagggat tgttcccatt tttttattac ttactgatac gctggctcgc
480 acgattgcac cgattgaact gccactcggt attctgactt ctgcttgtgg ttattag
537
<212>类型:DNA
<211>长度:537
序列名:SEQ ID 31:GDC_HINF_1347942
序列描述:
自定义密码子
序列名:SEQ ID 31:GDC_HINF_1347942
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgaagaact cattacggga gttaaaacnn gattatactg tggttatagt aactcataat
60 atgcaacaag ctacacgttg ctccgactat acggcattta tgtatttggg tgaattagtt
120 gaatttggtc aaacacaaca aatttttgat agacccaaga tacaacgtac agaagattat
180 attcgcggta aaatggggta g
201
<212>类型:DNA
<211>长度:201
序列名:SEQ ID 32:GDC_HINF_1476415
序列描述:
自定义密码子
序列名:SEQ ID 32:GDC_HINF_1476415
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgattagtc tacaagaaac caaaatagct gtgcaaaatc taaatttcta ctatgaggat
60 tttcatgcat taaaaaacat taatttacgt atcgctaaga ataaagtgac cgcctttatt
120 ggtccttcag gttgcggtaa atctacttta ttgcggagtt ttaatcggat gtttgaacta
180 tatccaaatc aaaaagctac tggtgaaatt aatttagacg gtgaaaattt actcacaaca
240 aagatggata tttctctgat tcgtgctaag gttggtatgg ttttccaaaa accaacgcca
300 tttccaatgt cgatttatga taatattgca ttcggtgttc gtttgtttga aaaattatta
360 aaagaaaaga tgaatgaacg agtagaatgg gcattgacta aggccgctct ttggaatgaa
420 gtgaaagata aattacataa aagcggagat agtttatctg gcggacaaca gcaacgcttg
480 tgcattgctc gagggattgc tattaaacct agtgtgttgt tgttagatga accttgttcg
540 gcattagatc ctatttcgac tatgaaaatt gaagaactca ttacgggagt taaaacnnga
600 ttatactgtg gttatagtaa ctcataa
627
<212>类型:DNA
<211>长度:627
序列名:SEQ ID 33:GDC_HINF_1476557
序列描述:
自定义密码子
序列名:SEQ ID 33:GDC_HINF_1476557
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgagccagc ttaatattca atttccgaca aaattcaaac cgctctttga atctatttgg
60 cggtttatta ttttctacgg tgggcgaggt tcaggtaaaa gttttagtat cgctagagca
120 ttagtattgc gagcctatca atcgcctgtt cgagttttgt gttccgtgaa attcagaaat
180 cgatttctga ttctgtga
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 34:GDC_HINF_1505851
序列描述:
自定义密码子
序列名:SEQ ID 34:GDC_HINF_1505851
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtggttcccg agttcattat tgtttcttta atcttggtgg cacagtccat gaaattggcg
60 ttaaacaaat ggcttatcat atttggcaac gctatagctc ttcacataaa gtacgcttta
120 ttgcgattaa actttgaggg agttgttggt gagattttag agaaagtcga taacggccaa
180 atgggcgttg tattaaaacg gatgatggtg cgagccgcaa gtaaagtcgc tcaacgtttc
240 aatattgaag caattgtgac aggggaggca ttagggcaag tttctagcca aactttaacc
300 aatttacgct tgattgatga agccgctgat gccttagtat tgcgtccgtt aattacccat
360 gataaagaac aaattatcgc gatggcgaaa gaaattggca ctgatgatat tgcaaaatct
420 atgccagaat tttgtggcgt gatttcaaaa aatcctacga ttaaagcggt tcgtgaaaag
480 attcttaaag aagaagggca ttttaatttt gagattcttg aaagtgcggt acaaaatgca
540 aaatatttag atattcgcca gattgcagaa gaaacagnaa aagcagtcgt ggaagtcgag
600 gcaatttctg tgttaggtga aaatgaagtg attttggata ttcgtagccc agaagaaacg
660 gatgaaaagc catttgaatc aggtacacat gacgtcattc aaatgccgtt ctacaaactt
720 tcttctcaat ttggtagcct tgatcaaagt aaaagttacg tgttgtattg tgaacgtggt
780 gtgatgagta aattacaagc cttatatttg aaagaaaatg gtttttcaaa tgtgcgtgta
840 tttgcaaaaa acattcatta a
861
<212>类型:DNA
<211>长度:861
序列名:SEQ ID 35:GDC_HINF_1524561
序列描述:
自定义密码子
序列名:SEQ ID 35:GDC_HINF_1524561
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttggccatcg ctattggtgg aggtaataga ggtaatgcaa gcggagtatt gcgccaaaat
60 tttgcagaag ataaagcaaa aaagaccgct tcgaagctcg tgggcgtaat ggctcactat
120 tttggcggta agtcgtttta tctgcccgca ggtgataaaa tcaaagaagc cttacgagat
180 gcacaaattt atcaagaatt caacggtaag aatgtacctg acctaataaa aaaataccga
240 ttgtcagaaa gcacaattta tgcgatctta cgcaatcaac gaacgcttca aagaaagcga
300 catcagatgg attttaattt tagttag
327
<212>类型:DNA
<211>长度:327
序列名:SEQ ID 36:GDC_HINF_1568974
序列描述:
自定义密码子
序列名:SEQ ID 36:GDC_HINF_1568974
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgtttaggt ggcactacct tggaggtttt acagtaatgc cagatacaaa taacacagaa
60 accaataata agatcgaact ctatctaaat ggcaaaattt tatccggttg gaaaagcctt
120 aacctgcaac gctcgctgga atcaatgagt ggtcgttttg atttaggcat tgctgtgcga
180 cctgaagatg atatatcagt gcttgccgca ggttcgccac tggtgctgaa aatgggcggg
240 caaaccgtga ttaccggtta cttggatgaa atcaaacaac gcgtaagcgg taacgacaaa
300 actatctctg tgagtggacg agataaaact tgcgacttgg tggattgtgc cattatccac
360 aacagctacc aattcaaaaa ccaaactgcc aaacaaattg ccgaagccat ctgtaaacct
420 tttggcatta gcgtagtatg gcaagtgcaa gcccctgaag ccaatgaacg aatccctgtc
480 tggcaagtag aaccaggcga aaccgccttt gataatttaa gcaaaatcgc ccgacacaaa
540 ggcgtgttag tcaccagcga cgtggacggc aatttgcttt tcaccgagcc gagcaacaag
600 caagtcggta atcttaccct tggcgaaaac ttgctcgaac tggaacaaac cgacagctgg
660 ttgcaacgct tttcgctcta tcgcgtgatt ggtgacgcag aacaaggcgg cgccaaaggt
720 gataccaaaa ccaaaaacaa agcggcaaaa ggcaaggaaa aagatgatgg cgtggtagaa
780 gatcccgata tttacccagg accagcagaa ggaggcaagt aa
822
<212>类型:DNA
<211>长度:822
序列名:SEQ ID 37:GDC_HINF_1586944
序列描述:
自定义密码子
序列名:SEQ ID 37:GDC_HINF_1586944
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgaaggttt cttaccggct aaataattgt ctaagtttaa agttagcgct gatcccatta
60 ttaatactat tatttgttgt tatgggatcg gtgctttctt taatcgcaaa attagatttt
120 tatttttttc aacaaatatt atttaattcc gaattgcatt ttgcattgct aatgtcattg
180 ggaacgtctc ttttttcttt gatattagca ttatgtattg ctattccatc tgcatggcga
240 atgagtcaag tgcggttgcc ttttcaatca ttttttgaca ctttgtttga tttaccaatg
300 gttttgccac cattagtcac aggactaagt ttgcttctac tttttagttc acaagggata
360 ttggctgaac tacttccttt tataagtaaa tggatttttt cccctgtagg gatcattatt
420 gctcagactt atattgcgag ttcgatttta ttgcgttgta gcgagccatt aaaactgcga
480 aaaaaaacca ttaaaactac gaaaataaaa ccttga
516
<212>类型:DNA
<211>长度:516
序列名:SEQ ID 38:GDC_HINF_1594339
序列描述:
自定义密码子
序列名:SEQ ID 38:GDC_HINF_1594339
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgacaaaac gtaaaaatgt ttcctttact tatgaaaatt atactgttac gccattttgg
60 gatacgctca agttaagcta ttcacaacaa agaattacaa caagagcaag aacagaagat
120 tactgtgatg gtaatgaaaa atgtgactct tataagaatc ctttagggct tcaattaaaa
180 gagggaaaag tcgttgatcg gaatggtgat cctgttgagt tgaagcttgt tgaggatgaa
240 caaggtcaga aacgacatca agttgttgat aaatataata atccttttag tgtagcctct
300 ggaactaata atgatgcttt cgtaggtaaa caattatctc cttctgagtt ttggttagat
360 tgctctattt ttaattgtga taagcctgtc agggtttata aatatcagta tagcaaccaa
420 gaaccagagt cgaaggaagt tgagttaaat agaaccatgg aaattaatgg aaagaaattt
480 gctacttatg agtctaataa ttatagagat agataccata tgattttacc aaattctaaa
540 ggttacttgc ctttggatta taaagagcgt gatttaaata caaagacgaa acaaattaat
600 ttagatttaa caaaagcctt tactctcttt gagattgaaa atgaactttc ctatggtggt
660 gtttacgcga aaacgaccaa ggaaatggtg aataaagcag gatattatgg gcgtaatcct
720 acttggtggg cggagagaac gttagggaaa tcattgctta atggattgag aacgtgtaag
780 gaagattctt catataatgg gctactatgt cctcgtcatg aacctaaaac gtctttctta
840 attcctgtag aaacaacaac taagtcttta tattttgcag acaatatcaa gttgcacaat
900 atgttgagcg tagatttagg ttatcgttat gatgatatta aatatcagcc agagtatatt
960 cctggtgtaa cacctaagat tgcagatgat atggtcagag aattatttgt tccactccct
1020 ccag
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 39:GDC_HINF_1634710
序列描述:
自定义密码子
序列名:SEQ ID 39:GDC_HINF_1634710
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
ttgcgtgaac gtagttcgct ttctgctcta atggccaaaa cgattgaatg ggattttata
60 acagaaaacc ccctaaaata tcttgagaaa ccaaaagcgc cagcaccaag aactcgtcga
120 tataatgaac atgaaattga gcgtctgatt tttgtgtcag gttatgatgt cgaacatatt
180 gaaccgccaa aaaccttaca aaattgcacg ggggcggcat ttctttttgc tatagagaca
240 gcaatgagag caggggaaat agcaagttta acttggaata atattaattt tgaaaagcgc
300 accacctttt tgccaattac taaaaatgga cattcacgca cggtgcctct ttcggtaaaa
360 gcaatagaga ttttacaaca tcttacttcg gtaaaaacag aaagtgatcc gcgagtattc
420 caaatggaag cacgccaact ggatcacaac ttccgcaagc tcaaaaagat ggaagggctt
480 gaaaatgcca atttacattt tcacgacacc cgccgtgaac gattggcaga aaaagtggat
540 gtaatggtat tagccaaaat atcgggccat agagatctca gtattctgca aaatacttat
600 tacgcacctg atatggcaga aggctataaa acaaaggcgg gttatgatct gaccccaacc
660 aaaggcttga gccaacggaa ttttttcttc tttaatgaaa acttcatcgt tttcacaaca
720 aatccaccga tagtcattaa gctgtaa
747
<212>类型:DNA
<211>长度:747
序列名:SEQ ID 40:GDC_HINF_1638626
序列描述:
自定义密码子
序列名:SEQ ID 40:GDC_HINF_1638626
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atggcgacaa ttatcaagaa tggcaagcgt tggcacgcac aagtgcgcaa gtttggcgtg
60 agcaaatcag ccattttttt gactcaagca gacgcaaaaa aatgggcaga aatgctcgaa
120 aaacagcttg aatcaggaaa gtataatgaa atccctgata ttacattgga tgaactcatt
180 gataagtatc taaaagaagt cactgtaacc aagcgcggga aacgtgaaga gcgcataaga
240 ctactgcgtc tttctcgaac tccgcttgcc gcaatatctt tacaagaaat aggaaaagca
300 cactttcgtg agtggtaa
318
<212>类型:DNA
<211>长度:318
序列名:SEQ ID 41:GDC_HINF_1639409
序列描述:
自定义密码子
序列名:SEQ ID 41:GDC_HINF_1639409
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atggaagccg ttcaattaga caaaaatcaa gagcctaatt ataaaggtta tagcggtagc
60 ttgattcatc ctgcatttca acagcaaaca acaaaacgtg aaaaaccgag tacaccatta
120 cctagtttgg atttgctttt aaaatatccg ccaaatgaac aacgcattac accagatgaa
180 ataatggaaa cctcacagcg tattgaacaa caattacgca attttaatgt aaaagccagc
240 gtaaaagatg tgcttgttgg ccctgttgtt acgcgttatg aattagaatt acagccgggt
300 gtgaaagcat caaaagtcac gagcatcgat accgatttag caagagcatt gatgtttcgt
360 tctattcgtg tggcagaggt gattccaggt aaaccttata ttggtattga aaccccaaat
420 cttcatcgtc aaatggtgcc attacgtgat gtattagata gcaatgaatt ccgtgatagc
480 aaggcaactt tacctattgc tttaggtaaa gatattagtg gcaaaccagt cattgttgat
540 ttagcgaaaa tgccacattt attggtagca ggttctacgg gatcaggtaa gtctgttggt
600 gtgaatacga tgattctaag tttactttat cgtgttcaac cagaagatgt gaaatttatt
660 atgattgatc ctaaagtcgt cgaactttct gtttataatg atattccaca tttactgaca
720 ccagttgtaa cggatatgaa aaaagccgct aatgcgttgc gttggtgcgt agatgaaatg
780 gaacgtcgtt atcagttgct ttcagcttta cgcgtacgaa acattgaagg ctttaatgaa
840 aaaattgatg aatacgaagc aatgggaatg cctgtgccaa atccaatttg gcgactgggc
900 gatacgatgg atgcaatgcc accagcgttg aaaaaattga gttatattgt ggttattgtc
960 gatgagtttg ctgatttaat gatggtagcg ggtaagcaaa tcgaagaact gattgcacgg
1020 ttgg
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 42:GDC_HINF_1660491
序列描述:
自定义密码子
序列名:SEQ ID 42:GDC_HINF_1660491
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
atgaataaaa ttttaaagt tatttggaat gttgtgactc aaacttgggt tgtggtgtct
60 gaactcactc gcgcccacac caaacgcacc tccgcaaccg tggcaaccgc cgtattggcg
120 accgtattgt ctgcaacggt tcaggcgatt aacgacgcag gaactttcgt gaaagtgcaa
180 agtacggaag atgatattga agatagtgct gcaaccaaag atgacaataa aaaccaagct
240 ctcaaagcag gcgacacctt aaccttaaaa gcgggtaaaa acttaaaagc taagttagac
300 caaggtggta aatcagtaac ctttgcttta gcgaaagacc ttgatgtgaa aaccgcgaaa
360 gtgagtgata ctttaacgat cggcgggaat acgcctgctg cgggtggtgc tacgccaaaa
420 gtaagtatta ctagcacggc tgatggcttg aagttagcaa aaggcactaa tggagatact
480 gcagttcatt tgaatggctt ggcttcaact ttgcctgatg tgactacaaa tacaggtgcc
540 tcaacttcag taaccttttc gcctagtgac attgaaaaaa caagagctgc aactattaaa
600 gatgttttaa atgcaggttg gaatattaaa ggagctaaag ttgcgggggg taataccgag
660 aatgttgatt tagtggcggg ttatgacaat gttgagttta ttacaggaga taaaaacaca
720 cttgatgttg tattaacagc taaagaaaac ggtaaaacaa ccgaagtgaa gttcacaccg
780 aaaacttctg ttattaaaga taataatggt aagttgctta caggtaagca gttgaaggat
840 gcgaatactg gtacagcgac caatgcaact gaagatacag acgaggcaat ggcttag
897
<212>类型:DNA
<211>长度:897
序列名:SEQ ID 43:GDC_HINF_1807963
序列描述:
自定义密码子
序列名:SEQ ID 43:GDC_HINF_1807963
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
gtgatgagcc gacatcgagg tgccaaacac cgccgtcgat atgaactctt gggcggtatc
60 agcctgttat ccccggagta ccttttatcc gttgagcgat ggcccttcca ttcagaacca
120 ccggatcact atgacctact ttcgtacctg ctcgacttgt ctgtctcgca gttaagcttg
180 cttataccat tgcactaa
198
<212>类型:DNA
<211>长度:198
序列名:SEQ ID 44:GDC_HINF_1817220
序列描述:
自定义密码子
序列名:SEQ ID 44:GDC_HINF_1817220
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgtttgcag tgcatgctgc gatgattacg acattaaaga aagaagtttt ctttctttac
60 ctttatatca aatcactcaa aatcccgatt cctactacac tgaaatacat gatttcttta
120 ggcaaaatca gagaattaga tgttttagca aatcttgcta aactttgccc tacttgtcat
180 agggctttaa aaaaaggatc tagcgaagag gagtttcaaa aacgcttgat tagaaacatt
240 ctcaatcgca ataaagacaa tttagagttt gcgcaattgc gttttgaaac cgatgatttt
300 tcaacgctta ttgatcgtat ttgtgaaagc ttgaaatga
339
<212>类型:DNA
<211>长度:339
序列名:SEQ ID 45:GDC_HPYL_51094
序列描述:
自定义密码子
序列名:SEQ ID 45:GDC_HPYL_51094
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgattaaac aaaccctcat cattcttgcc ccttttttta tcgcaacgct gttgtatttt
60 ttaggcgcac cggatgggtt aagacctaac gcttggcttt atttttgtat tttcatgggc
120 atgattatag ggctaatttt agagccggtg ccatcaggtt taatagcgct aagcgcgtta
180 gtgctgtgta tagcgttaaa aattggagcg agcgataaag tagcgagcgc taataaggct
240 atttcgtggg gtttgagcgg gtatgcgaat aaaacggtgt ggcttgtgtt tgtcgctttc
300 attttgggtt tagggtatga aaaaagcttg ttagggaaac ggatcgctct tttactgatt
360 aggtttttag ggcaaacccc tttaggttta ggctatgcga ttggtttgag cgaattgtgt
420 ctagcccctt ttatccctag caactccgct agaagtggag gcatactcta tcccatcgtt
480 tcatctatcc cgcctttaat gggatctact ccaaataata accctgacaa aatcggcgcg
540 tatttgatgt gggtcgcttt ggcttcaact tgcatcactt cgtccatgtt tttaaccgcg
600 ctcgctccta accccctagc aatggaaatc gctgccaaaa tgggcgtgaa tgaaatctca
660 tggttttcgt ggtttttagc gttcttgcct tgtggggtgg ttttgatctt gcttgtgcct
720 ttattggcgt ataaaacctg caaacccacc ttaaaaggct caaaagaagt gagtttgtgg
780 gccaaaaaaa ggaattag
798
<212>类型:DNA
<211>长度:798
序列名:SEQ ID 46:GDC_HPYL_155367
序列描述:
自定义密码子
序列名:SEQ ID 46:GDC_HPYL_155367
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc
60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg
120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt
180 gtgccattac actcaacttg cgatttccaa ccgcaatga
219
<212>类型:DNA
<211>长度:219
序列名:SEQ ID 47:GDC_HPYL_447632
序列描述:
自定义密码子
序列名:SEQ ID 47:GDC_HPYL_447632
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
gtgcaacttc attgccacaa cttgccatgc gtttcaattg atattctact aggcggacca
60 ccatgccaga gctattctac ccttggcaaa agaaaaatgg atgaaaaagc gaatctgttt
120 aaagaatatt tgcggctttt agatttagta aaaccaaaaa tatttgtttt tgaaaatgtg
180 gtgggtttaa tgtctatgca aaaagggcaa ttattcaaac aaatttgtaa cgcttttaaa
240 gagagagatt atattttaga gcatgccatt ttgaacgccc tagattatgg tgtgcctcaa
300 atgagagaac gagtgatttt agtgggcgtg cttaaaagct ttaaacaaaa attttacttc
360 cctaaaccca taaaaacgca tttttctctg aaagacgctt taggggattt accacccatt
420 caaagcggtg aaaatggtga tgctttaggt tatcttaaaa atgcggataa tgtttttttg
480 gaatttgtgc gaaattctaa agaattaagc gaacatagca gtcctaaaaa caatgaaaaa
540 ctgataaaaa tcatgcaaac gctaaaagac ggacagagta aagatgattt gccagaaagt
600 ctgcgtccca aaagtggtta tattaatacc tatgccaaaa tgtggtggga aaaaccagcc
660 cccaccatta caagaaattt ttctacccca agcagttcta ggtgtatcca tccaagagac
720 tctagagcgt taagcattag agagggggca agattgcaaa gctttcctga taattataaa
780 ttctgtggga gtggtagcgc taaaagattg caaattggca atgccgtgcc gcctttattg
840 agtgtagcgc tcgcgcaggc ggtctttgac tttttaaagg ggtaa
885
<212>类型:DNA
<211>长度:885
序列名:SEQ ID 48:GDC_HPYL_506250
序列描述:
自定义密码子
序列名:SEQ ID 48:GDC_HPYL_506250
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgatggaat ttgatgttac catcatagat gagacaggca gggccacagc accagaaatc
60 ttgattcctg cacttcgcac taaaaaactg atcttaatag gcgatcacaa ccagctccca
120 cctagcattg ataggtacct cctagaacaa ttagagagcg atgatattca aaacttggat
180 gccattgatc gccaattatt ggaagagagt ttttttgaaa atctctataa gtatattcca
240 gagagtaata aggccatgct taatgagtaa
270
<212>类型:DNA
<211>长度:270
序列名:SEQ ID 49:GDC_HPYL_583607
序列描述:
自定义密码子
序列名:SEQ ID 49:GDC_HPYL_583607
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgcctgctt ctattggatc gctagttagt cagctttttt ataaagagaa acttaagaat
60 ggagtgatca aaaatacctc gcaattttac gatcctaaga atattatccg ttggattaat
120 gttgaagggg agcatcaact agaaaaaaca agtagctata acaaaaatca agttcaaaaa
180 atcatagagc ttttagagca aatcaatcgc gttcttaatc aaagaaaaat cagaaaaacc
240 ataggaatta tcacacctta taatgcccaa aaaagatgct tgcgatcaga agtggaaaaa
300 tacggcttca agaattttga tgagctcaaa atagacactg tggatgcctt tcaaggcgag
360 aaggcagata ttattattta ttccaccgtg aaaacttatg gtaatctttc tttcttgata
420 gattctaaac gcttgaatgt agctatttct agggcaaaag aaaatctcat ttttgtgggc
480 aaaaagtctt tctttgagaa tttgcgaagc gatgagaaga atatctttag cgctattttg
540 caagtctgta gatag
555
<212>类型:DNA
<211>长度:555
序列名:SEQ ID 50:GDC_HPYL_583883
序列描述:
自定义密码子
序列名:SEQ ID 50:GDC_HPYL_583883
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgattattg aaacgcaaca agaccccaaa gaactacctg agtcttgcaa aataacgccc
60 caaaaaatct cttttaacca agtggttttt aaaaaaatta aaagaaaact caaccgcttc
120 attggaagca ttttagctcg gacagaagtg tataagaatc tcgtggcaaa atacgatgaa
180 ctcacaggaa aatacgaatc attattggca aaagaggcaa acatcaaaga gaccttttgg
240 gaaaggcgtg ctgatagcga aaaagaagcc ttttttttag agcattttta cctcactagc
300 gtgtatgtgg cttctacagc aggatactat atcacgccta agggcgctaa aacctttata
360 gaagccacgg agcgttttaa aatcatagag ccggtggata tgttcataaa caaccccact
420 taccatgatg tggctaattt tacctatttg ccttgccctg tttctttaaa caagcatgct
480 ctcaatagca ccattcaaaa tgcaaaaaag cctgacattt cattaaaacc ccctagaaaa
540 tcctattttg ataatctttt ttatgatcaa ttaaacacta gaaagtgctt aaaagccttt
600 cacaaataca gcagacgata cgctccttta aaaaccccta aagaggttta a
651
<212>类型:DNA
<211>长度:651
序列名:SEQ ID 51:GDC_HPYL_665045
序列描述:
自定义密码子
序列名:SEQ ID 51:GDC_HPYL_665045
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgatggaaa ttttagtgtt gaatctgggc agttcgtcta ttaagtttaa gttgtttgac
60 atgaaagaaa ataagccctt agcgagcggt ttggctgaaa aaatcggcga agaaataggg
120 cagttgaaaa ttaaatcgca tttgcaccat aacgatcaag aattaaaaga aaagtttgtg
180 attaaagatc atgcgagcgg acttttaatg attcgtgaga atttaacgaa aatggggatt
240 atcaaagatt ttaaccaaat tgacgctata gggcatcgtg tggttcaagg gggggataaa
300 ttccatgccc cagttctagt caatgaaaaa gtcatgcaag aaattggcaa tctttctatt
360 ttagccccct tacacaaccc ggcgaattta gccggtattg agtttgttca aaaagcgcac
420 ccccatatcc ctcaaatcgc tgtttttgac accgcattcc atgccactat gcccagttac
480 gcttacatgt atgcgttacc ttatgaattg tatgaaaagt atcaaatccg gcactatggt
540 ttccatagga cttcacacca ttatgtggcc aaagaagcgg cgaagttttt gaataccgct
600 tatgaggaat ttaacgcgat cagtttgcat ttagggaacg gctcaagtgc agccgccatt
660 caaaagggta aaagcgtgga tacttctatg gggctaaccc ctttagaagg cttgattatg
720 ggcacaaggt gtggggatat tgaccccact gtggtggaat atactgcgca atgcgcgaac
780 aagagcttag aagaagtgat gaaaatgtta aaccatgaaa gcggattgaa aggcatttgt
840 ggggataatg agaaacatag aagccagaaa agaaaaaggt ga
882
<212>类型:DNA
<211>长度:882
序列名:SEQ ID 52:GDC_HPYL_953783
序列描述:
自定义密码子
序列名:SEQ ID 52:GDC_HPYL_953783
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgcctaaca gccaagtggc tgggcaagct agcgttttta ttttcccgga tttaaacgct
60 gggaacatcg cttataaagc ggtgcaacgg agcgctaaag ccgtggcgat agggcccatt
120 ttacaaggtt tgaataagcc cattaacgat ttgagtaggg gcgctttagt ggaagatatt
180 attaacaccg ttttgattag cgcccttcaa gcgcaagatt aa
222
<212>类型:DNA
<211>长度:222
序列名:SEQ ID 53:GDC_HPYL_954679
序列描述:
自定义密码子
序列名:SEQ ID 53:GDC_HPYL_954679
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
gtgagcctgg tttcaagcgt gtttttaatg tgtttagaca ctcaagtgct agtctttggg
60 gattgcgcga ttatccctaa ccctagccct aaagaattag ccgagatcgc taccacttcc
120 gcacaaaccg ccaagcaatt caatattgcg cctaaagtgg ccttgctttc ttatgcgaca
180 ggcgattccg ctcaaggcga aatgatagac aaaatcaacg aagctttaac aatcgctcaa
240 aagttggatc cccaattaga aattgatggc cccttacaat ttgacgcttc cattgataaa
300 agcgtagcca agaaaaaatg cctaacagcc aagtggctgg gcaagctagc gtttttattt
360 tcccggtttt aa
372
<212>类型:DNA
<211>长度:372
序列名:SEQ ID 54:GDC_HPYL_954846
序列描述:
自定义密码子
序列名:SEQ ID 54:GDC_HPYL_954846
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgaaagctg cacatcgttt gaatttaatg ggcgcggtag gattgatctt atcaggcgat
60 aaagaagcca ttaattcgaa aaatttgaac ttgaatttag aaaatgtgga aatcattgat
120 cccaacactt ctcattatag agaagaattc gctaaaagct tgtatgaatt acgaaaatca
180 aagggcttga gtgagcaaga agctaagcaa ttagtgctgg ataagactta ttttgcgacc
240 atgctcgtgc attcaggcta tgtgcatgcg atggtttctg gggtgaatca cagctga
297
<212>类型:DNA
<211>长度:297
序列名:SEQ ID 55:GDC_HPYL_955261
序列描述:
自定义密码子
序列名:SEQ ID 55:GDC_HPYL_955261
序列
<213>生物名:幽门螺杆菌(Helicobacterpylori)-26695
<400>前序列链:
gtgaaacaaa ttagtatctc ttgcagccat agaaaatatt ttgttagctt tagcgtggaa
60 tacgaacaag acattactcc cataaaaaac actaaaaatg gtgtggggct agatttgaat
120 atccttgata tagcttgttc ttgtgagata aacaaccatg acaaactaac ggactttaag
180 caataccaaa cagacatgaa agaattacta gggatagaaa tagatgaaga gctggatact
240 aaacgactta tccctactta ttccaaattg tattctttaa aaaaatactc taaaaaattt
300 aaaagattac aaagaaaaca aagccgtagg gtgttaaagt ctaaacaaaa caaaaccaaa
360 ttaggaggta atttttacaa aacccaaaag aaattaaacc aagcctttga caagtctagt
420 catcaaaaaa cagacagata ccataaaatc acaagcgaac tttcaaagca atttgaattg
480 atagtagttg aagatttgca agtaaaaaac atgactaaaa gagctaaact caaaaatgtt
540 aaacaaaaga gtgggcttaa tcaatctatt ttaaacgctt cattctatca aatcatctct
600 tttttagact acaaacaaca gcataatggc aaattgttag tgaaagttcc cccacaatat
660 acgagtaaaa cttgccattg ttgtgggaat atcaaccaca agcttaaatt aaatcatagg
720 caatattggt gtttagaatg cgggtataga gaacacaggg acatcaacgc tgcgaacaac
780 attttaagca aagggttaag tctttttggg gtaggaaata tccatgcaga ctttaaagaa
840 caaagccttt cgtgttag
858
<212>类型:DNA
<211>长度:858
序列名:SEQ ID 56:GDC_HPYL_1068602
序列描述:
自定义密码子
序列名:SEQ ID 56:GDC_HPYL_1068602
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgaaagtca ataagggttt taaattccgc ttgtatccca ctaaagaaca acaagataag
60 ttgcaacact gcttttttgt ctataatcaa gcttataata ttggcttgaa tgaactgcaa
120 gagcaatatg aaaccaacaa agattcacca cctaaagaaa gaaaatacaa aaaatcaagc
180 gaattagaca atgcgatcaa acaatgcttg agagctaggg acttgccctt tagcgctgtg
240 atagcccaac aagcacgcat gaatgttgaa agggctttaa aagatgcttt taaagttaaa
300 aacagaggct ttcctaaatt caaaaactct aaatccgcta aacaatcttt ttcgtggaac
360 aatcaaggct tctctatcaa agagagcgat gatgagtgct tcaagacatt cactctgatg
420 aaaatgcctt tactcatgcg catgcataga gacttccccc taattttaaa gtga
474
<212>类型:DNA
<211>长度:474
序列名:SEQ ID 57:GDC_HPYL_1069456
序列描述:
自定义密码子
序列名:SEQ ID 57:GDC_HPYL_1069456
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgatattca tcacccattt ttccacagag cctttacctt tacccatcct ggtttctaag
60 ggtttagcgg tcaaaggctt atcagggaat actctaatcc acaccttacc cgctctttta
120 atgtgccttg tcatggccac ccttgcggat tcaatttggc gtgaatcaat cctcccatgc
180 tctatggctt taatcgcaat atccccaaac gcaatggagt taccccgatg ggctttccca
240 cgattgcgcc ctttcatttg ctttctgtat tttgttcttt ttggcattaa catgattatt
300 gcctccctct tctgcttctt ctag
324
<212>类型:DNA
<211>长度:324
序列名:SEQ ID 58:GDC_HPYL_1376803
序列描述:
自定义密码子
序列名:SEQ ID 58:GDC_HPYL_1376803
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
atgagccgac atcgaggtgc caaacctccc cgtcgatgtg agctcttggg ggagatcagc
60 ctgttatccc cggggtacct tttatccttt gagcgatggc ccttccacac agaaccaccg
120 gatcactatg accgactttc gtctctgctt gacttgtatg tcttacagtc aggctggctt
180 gtgccattac actcaacttg cgatttccaa ccgcaatga
219
<212>类型:DNA
<211>长度:219
序列名:SEQ ID 59:GDC_HPYL_1474291
序列描述:
自定义密码子
序列名:SEQ ID 59:GDC_HPYL_1474291
序列
<213>生物名:幽门螺杆菌(Helicobacter pylori)-26695
<400>前序列链:
ttgaacgccg catttaaaga aaggcgcttc attctcgtcc agttagatga aaaaattgat
60 cccaaggaag acaaaagcgc ttatgatttt tgtttgaaca ccttaaaatc accctcccca
120 agcatttttg acatcaccga agaaaggatt aaaagagcgg gggctaaaat caaagaagct
180 tgcgcgcatt tagatgtggg gtttagagcg tttgaaatca ttgatgatga aacgcatgct
240 aatgataaaa atctcagtca agcccatcaa aaggatttgt tcgcttattc taaccttgat
300 agaatggaaa cccaaacgat tttaattaag cttttaggct gcgagggttt ggagctcact
360 acccctataa cttgcttgat tgaaaacgcc ttgtatctgg ctttaaatac ggctttcatt
420 gtgggggata tagaaatgag cgaagtttta gaaaacttga aagataaagg ggtggaaaaa
480 atcagcatgt atatgcccgc tatcagtaac gataatttgt gtttggaatt gggcagtaat
540 ttgttggatt tgaaattaga gagtggcgat ttaaagatta gggggtag
588
<212>类型:DNA
<211>长度:588
序列名:SEQ ID 60:GDC_HPYL_1600102
序列描述:
自定义密码子
序列名:SEQ ID 60:GDC_HPYL_1600102
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtatatac gtttttatcg cgattctctt gcagagcccg ccacagacat atacgctttt
60 gcctatgttt cgttcaacaa ggaggccggc acatggcaca cccctgcgca accgacccgg
120 aactatggtt cgggtacccc gatgacgacg gcagcgacgg cgccgctaag gcacgcgcct
180 atgagcggtc ggccacccaa gcgcggatcc aatgcctgcg ccggtgcccg ctcctacagc
240 agcgccggtg tgctcaacac gcggtcgagc atcgggtgga gtacggcgta tgggccggca
300 tcaagcttcc cggcggccag taccgaaagc gcgaacagct cgcggcagcc cacgacgtgc
360 tgcgtcggat tgccggcggc gagatcaatt ccaggcagct cccggacaat gcggctctgc
420 tggcccgcaa cgaaggactc gaggtcaccc cggtgcccgg ggtcgtggtg cacctgccga
480 tcgcacaggt tggcccacaa ccggccgctt gatgcccggt cggcaagccc ggcagttgcc
540 aaacccagcg tgatcaggct cggctcgcga gttcggcgaa gaagtggctc gcctgatcac
600 ctaccatcgg ccaggatctg cgtgtcatca cgacgctcgc caaggaggtt gttgtggtgc
660 tatcgacggc ctttagccag atgttcggaa tcgactatcc gatag
705
<212>类型:DNA
<211>长度:705
序列名:SEQ ID 61:GDC_MTUB_26830
序列描述:
自定义密码子
序列名:SEQ ID 61:GDC_MTUB_26830
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgatgttct gtgcgtcgcg gaaagagatg gcgatgtcga attcgtcttc tagctcggtg
60 atcaactgga acagcttgag cgagtcaaaa cccaggtcgt cgacgagtac ctggttcgcg
120 gtgatgccgc ggtcggttcg caagatccgt tggatggtgg cgttgatggc ctctttcata
180 gcgcggctcc ttgcggggtc aggtcctcgg caaggccggc aaacacgtgc aaggcccggt
240 cgaggtcaga ttgtcggtgg tcggctaggt agctggtgcg gaatcccgaa cgctcctccg
300 gcacggctgg gggggccacc gggttcacat acaccccgga gcgcatcagc cgcagatagc
360 ccgcatgcgc cacggtcggg ttgcccagga tcaccggcac gatcgcggtt ccgtgatact
420 cggcctgata gccctgccgt gccaggccgg tggccatgta ctcggccgcg gccagcaccc
480 gagcccgccg gtcgggttca cgccgactga
510
<212>类型:DNA
<211>长度:510
序列名:SEQ ID 62:GDC_MTUB_36276
序列描述:
自定义密码子
序列名:SEQ ID 62:GDC_MTUB_36276
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgccgccac cgatcccgcg gtgcgcggcg gccagtactt cggacccgat ggcttcggtg
60 aaatacgggg ctacccgaag gtggtggcct ccagcgccca gtctcacgac gagcagctgc
120 agcgccgcct gtgggctgtg tccgaagagc tcaccggggt cgtctatccc gtcggatgag
180 ccggactcaa cggcaacggt tggtcaacac tcgacgatgt tgactgcgac gttgatggcg
240 agcccgccgg ccgaggtttc cttgtacttg gtgtgcatgt ccgcgccggt ggcgcgcatg
300 gtgtcgatga cctggtcgag ggtgacgcga tggatgccgt cgccgcgcaa tgccatccgt
360 gcggcgttga tggccttgcc ggcggaaatc gcgttgcgtt cgatgcaggg gatctgcacc
420 agcccggcga tggggtcaca ggtcaggccg aggctgtgtt ccatggcgat ctcggcggcg
480 ttttccactt gtcgcggtgt gccgccgagg atttcagcca atccggcggc ggccatggcg
540 gccgcggagc cgacctcgcc ctga
564
<212>类型:DNA
<211>长度:564
序列名:SEQ ID 63:GDC_MTUB_76032
序列描述:
自定义密码子
序列名:SEQ ID 63:GDC_MTUB_76032
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
60 gtcgtgagga agacattggg gatcttggcc agcgcggtgg aattcggcac aatgccaacg
120 acccgcaatc tgcgcgcgcc gacctcgaca gtgtcaccga ggtgtcggcc catcgtgctc
180 gatgccgcga cttcgtccgg tttcgacggt gaccgaccct ctgagacccg tggcatgcca
240 ggtccgtgct cgggcgcgcc gaagaccgtg acgtttcgcg tcgacgtgcc ttctttcatg
300 atcgtcccca cgctgcccaa cggggccgcg gccatgacac cgggttcagc ggccactcgg
360 gccaggtcaa catcgggaaa cggtattgaa cccagaaaag gtccagcagc gccggatctg
420 acgacgaata catcgacacc catggaatcg acggtgtgcc gggcctccac ccggaagccg
480 ttcgcgagtc cggtcaaaac aagcgtcatc ccgaagatca gcccggtgct gatgatcgtg
540 atgaccaggc ggcgctttct ccattgcatg tcacgcaggg ccgcgaagag cattcccaga
600 ggctaccaac gtggcgcact tgtggggcct ggtcttgacg ttttgtggtc agggcgcggc
660 ccgctagtgg tcgaagaggc gttcggggtg gtggtagtcg ttggtgtggg caccgcggtc
720 gaggtggggt ggcgggatcc attccgtttg gccgtcggac cgtttccttg tccgccagcc
780 tttcccgact ag
792
<212>类型:DNA
<211>长度:792
序列名:SEQ ID 64:GDC_MTUB_80423
序列描述:
自定义密码子
序列名:SEQ ID 64:GDC_MTUB_80423
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtcgcgtg ctatccggac aaagccgaaa tcagcatctt cccggggtag cgcaggctac
60 cgggtatacc tcggccaacg actgggtgtc gctgtattcg cgcagcgaga tgatcatccc
120 gtcacgggtc tcgaagatgc agacgaacgg gctgtcatat cgggtccggt cggcgctcac
180 accgtcgcaa tgcccctcga ccactaccgt ttcaccctcg ttgacgcagc ggatgagttc
240 gatgttgacc tcgaagacct gcttgcgccg ctcgactgct cgccgaaacg tcttcttgtc
300 caattccgta cgggtgacga tgctccagta ggtgaagtcg ttgctgagca gcgcgaagcc
360 ttcgtcgaga tctccgccct cgcagaggct ttgcaggaac atccaggcca gttcggcttg
420 cgggtcgtcg aacggcgtca tcacatcgcc atcttgtctc gggagacagc gtgcggtcaa
480 ttgacgtggt cgtcgaagcg gtggtcacct tcgcgggggc ggccggcttc gcgcacacct
540 tggcgccgtt gcgtcgcggt cagcaggatc catgctttcg ggtccccggt gacggcacta
600 tctggcggac cagcttgctg cccaccgggc cggtcaccgc gcggatcagc cgtgctgggc
660 gcgacgccgc ccgttgcgtg gcgtggggca gcggtgccga ggagtttgtc gacatggcgc
720 ccgccatgct gggcgccgcc gacgacgcca gcgatttcgt gccgctgcat ccggccgtgg
780 ccgccgcgca ccgccggctg ccgaacttgc gcctgggccg caccggccag gtgctggaag
840 ccttga
846
<212>类型:DNA
<211>长度:846
序列名:SEQ ID 65:GDC_MTUB_167239
序列描述:
自定义密码子
序列名:SEQ ID 65:GDC_MTUB_167239
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcgaccgg gccaccgcca ggtcgatgga tgccgccgtg gccaaccgtt gtgcggtgct
60 catgaacgcg tcggcctcgt gcgggttgtc ggtgccttcg gcctggcgca gcagggctgc
120 gatgcgggcc agcatcttgt cgttggtcat ggcgccaaaa ctagtggagg gctgcgacag
180 gtcggctcgg cctacaaccg ctcggtgagc caggcgacca catcgtcgag cacctggttg
240 cgctccggct cgttgaacac ctcgtggtac agcccgggat actccttcag ctgcacgtcg
300 gccgatccca cacattcgac caggcgacgg ctgccctcga tggggatcag ccggtcatcg
360 gtgccgtgca gcactagcag cggcgcggtc aatgccggtg ctcgccgcgg catggtctcg
420 cccacctgca gcagcgcgcg gccaatcccg gccggaaccc gtccgtggtg cacgagtggg
480 tcggtgttgt aa
492
<212>类型:DNA
<211>长度:492
序列名:SEQ ID 66:GDC_MTUB_214625
序列描述:
自定义密码子
序列名:SEQ ID 66:GDC_MTUB_214625
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgtgtaaag catgtctcgg tcaccatacc catcaccacc gaacatctcg gcccctacga
60 aatcgatgcc agcacgatca accccgacca gcccatcgac acggctttca cccaaaccct
120 cgatttcgcc ggcagcggca ccgtgggcgc gttccccttc ggcttcggct ggcagcagag
180 cccgggattc ttcaactcga ccacaacccc gtcgtcgggc ttcttcaact ccggcgccgg
240 tggcgcatcg ggcttcctca acgacgccgc agccgccgtg tcgggcctgg gaaacgtctt
300 caccgagact tcgggcttct tcaatgctgg cggcgtagga attcgggctt ccaaaacttc
360 ggcaacctgc tgtcgggctg ggcgaaccta ggcaataccg tctccggttt ctacaacacg
420 agcatgctgg acctcgcgac ccaagccctt atctccggct tcggcaacca cggagcccga
480 ctctccggca tcctcaacaa cggtagcgga ccctaa
516
<212>类型:DNA
<211>长度:516
序列名:SEQ ID 67:GDC_MTUB_424142
序列描述:
自定义密码子
序列名:SEQ ID 67:GDC_MTUB_424142
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcttagcc tatccgctgg cggcccggaa ccgagaatgc gaccaggtca caacccagtc
60 accttccacg ccgagcagac gaggaatcgc actgcgcgga cctcacgcgt gcgattccgc
120 gtctgctcgt cagacaaatc agcccaggat cagcgagtcg gcgtcggggc tgacgttgac
180 cggcacggta tcgccgtcgt gcacctggcc ggccaacagc atcttggcca gctggtcacc
240 gatggcctgc tgcaccagcc ggcgcaacgg ccgcgccccg tacaccgggt cgaatccgcg
300 ctgcgccaac cagcgcttgg ccggcagcga gacctgcagc tgcagccgcc gctgcgccag
360 ccgcttgccc agctgcgcca gctggatgtc gacgatgcgc accagctctt cggggttgag
420 accctcaaag atgagcacgt cgtcgagccg gttgatgaac tccggcttga acgtagcgcg
480 caccgcggcc agcacctgct cggcgctgcc acccgacccc aggttggacg tcaggatcaa
540 gatggtgttg cggaagtcga ccgtgcggcc gtgcccgtcg gtgagccggc cctcgtcgag
600 gacctgcagc agcacgtcga acacgtccgg gtgcgccttc tcgatctcgt cgaacagcac
660 caccgtgtag ggacgccggc gcaccgcctc ggtcagctga ccgcccgcct cgtatcccac
720 atagccgggc ggggcgccga tcaaccgagc cacggtgtgc ttctcgccgt actcgctcat
780 gtcgatgcgg accatcgccc gctcgtcgtc gaacaggaag tcggccagcg ccttggccag
840 ctcggtcttg ccgacaccgg tcgggccgag gaacatgaac gccccggtgg gccggttggg
900 gtcggacacc ccggcccggc tgcgccgcac cgcatcagag actgcggtaa ccgcggcctt
960 ctgcccgatg acccgcttgc ccagctcgtc ttccatgcgc agcagcttgg cggtctcgcc
1020 ttcc
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 68:GDC_MTUB_459316
序列描述:
自定义密码子
序列名:SEQ ID 68:GDC_MTUB_459316
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcttgccg atttcgatgt aggacaacac cttttccagc tggtcgttgg aggcctggga
60 acccagcatg gtttcggtgt ccagcgggtc gccctgccgg accgccttgg tccggatcgc
120 cgccagctcc aggaactcgt cgtagatgtc ggcctggatc agactgcgcg acgggcaggt
180 gcacacctcg ccctggttga gggcgaacat ggtgaagcct tccagcgcct tgtcgcagaa
240 gtcgtcgtgg gcggccagca cgtcggcgaa gaagatgttg gggctcttgc cgccgagttc
300 cagggtgacc gggatcaggt tgtgcgaggc gtattgcatg atcagccgcc ccgtggtggt
360 ttccccggtg aacgcgacct tggcgatgcg gtcgctggag gccaacggct tgccggcctc
420 ggcgccgaat ccgttgacca cgttgaccac cccgggcggc aacagatcac cgatcagcga
480 catcaggtag agcaccgaag cgggtgtctg ctcggcgggt ttgagcaccg ccgtgttgcc
540 ggccgccaac gccggcgcca gcttccaggc cgccatcagg atggggaagt tccacggaat
600 gatctggccc accacgccga gcggctcgtg gaagtggtag gccacggtgt cctcgtcgat
660 ctggctcagc gcgccctcct gggcgcgaat cgccgcggcg aagtaccgga agtgatcgac
720 cgccaacggg atatcggcgg ccagcgcttc ccggaccggt ttcccgttgt cccagacctc
780 ggccaccgcc agcgcggcgg cgttcttgtc gatgcggtcg gcaatcatgt tgaggatcgc
840 cgcccgttcg gccggtgcgg tcttgcccca ccccggcgcc gccgcgtgcg cggcgtcgag
900 cgccttgtcg atgtcggccg cgtcggagcg cggcacctcg cagaacggct ggccggtcac
960 cggcgtcggg ttctcgaagt agcgcccatg gaccggcgcg acccactggc ccccgatgaa
1020 gttt
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 69:GDC_MTUB_549643
序列描述:
自定义密码子
序列名:SEQ ID 69:GDC_MTUB_549643
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgtatcttc cgcccaagct gatcccgagg cggatcccgg cgcaggtgag gccaactatg
60 gtggcccccc aagttcccca cgtcttgtcg atcacaccga atgggcgcag tggggaagtc
120 tgcccagcct ccgggtctac ccgtcccaag ttgggcgtac agcctcccgc cgcctcggga
180 tggccgctgc cgacgcggcc tgggccgagg ttctcgcgct gtcaccggag gccgacactg
240 ccggcatgcg cgcgcagttc atctgccact ggcagtacgc cgaaatcaga caacccggca
300 aacccagctg gaacctcgag ccgtggcggc cggtcgtcga cgactcggag atgttggctt
360 ccggctgcaa tccgggcagc cctgaagagt cgttttagtg ctcggccaac cgactcgggc
420 gcagttggcc gcgctggtag accacaccct gctcaagcct ga
462
<212>类型:DNA
<211>长度:462
序列名:SEQ ID 70:GDC_MTUB_566823
序列描述:
自定义密码子
序列名:SEQ ID 70:GDC_MTUB_566823
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgacgtcta cgaacgggcc atcggcgcgg gataccggtt ttgttgaggg ccagcaggcc
60 aagacacaac ttctcaccgt ggccgaagtg gcggccctga tgcgggtgtc caagatgacg
120 gtgtaccggc tggtgcacaa tggcgaactg cccgcggttc gggtcgggcg gtcattccgg
180 gtgcatgcca aggccgtcca cgacatgttg gagacttcgt acttcgacgc gggctag
237
<212>类型:DNA
<211>长度:237
序列名:SEQ ID 71:GDC_MTUB_591109
序列描述:
自定义密码子
序列名:SEQ ID 71:GDC_MTUB_591109
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggcggagt ccgtggctat ccgcggctgc ctgctgaggt gcgggccgcg ttcccgaccg
60 cggcggagat cgcgccgcag tggcatctgc gcatgcaggc cgcggtgcag cgccacgtcg
120 aggccgccgt gtccaagacg gtcaacttgc ccgccacggc gacggtcgat gacgtccgcg
180 ccatctatgt ggccgcctgg aaggcaaagg tcaagggcat cacggtgtat cgctacggca
240 gccgggaagg acaggtactg tcctacgccg cgccgaaacc gctactggcg caggctgaca
300 cggagttcag cggcggctgt gcgggccgct cctgcgagtt ctgacggcgg ctcccatggc
360 gcgagcagac gcagaatcgc acaaaatcag cgattttga
399
<212>类型:DNA
<211>长度:399
序列名:SEQ ID 72:GDC_MTUB_663028
序列描述:
自定义密码子
序列名:SEQ ID 72:GDC_MTUB_663028
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgctgcaca gcagcttcgg gcacctcgag ggcatccagc agccgctcat agacgagctg
60 gcagaactcg accacgtgtt gggcaagctg ccggacgcct accggatcat cggccgcgcc
120 ggcggcatat acggtgactt cttcaacttc tatctgtgtg acatctcact gaaagtcaac
180 ggattacagc ctggaggtcc ggtacgcacc gtcaagttgt tcggccagcc gaccggcagg
240 tgcacaccgc aatga
255
<212>类型:DNA
<211>长度:255
序列名:SEQ ID 73:GDC_MTUB_688806
序列描述:
自定义密码子
序列名:SEQ ID 73:GDC_MTUB_688806
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgctggggg cgctgcacca gtacccgcac actcgcatcc agccgggtgc cgttgcggcg
60 caccgtgatc gccagcaccc gcgcccggtc tttggcgatg aggcgctcga tgcggcgggt
120 gttctcatgc gtacgcacgc agccgatcac cggcaaagtg aggtgtctac ggtcgggctc
180 aacgcgcatc gcacccgtgg tgaacgacac gcgatcggcg tcgcggccct tcttcttgaa
240 tcgagggaag cccattctct tgccgtcgcg cttgccagca cgcctctgct gccagttcca
300 gtacgcgtcg accgcgcccg cgatcccgtc ggcgtaggcc tctttcgagc attccggcca
360 ccacacggtg ccagtctcgg cgttgacaca cacctcgtct ttcaccgtgt tccagcgttt
420 ccgcagtacc cgaagcgacg gcttcgccgt ctgggcgccg gtcgcgcgcc acgcttggat
480 atcggctttc agctgcgcga cggtccagtt gtaggccttg cggcgggcgc cgaaatgccg
540 cgccaacgcg tgtgcctgct cggcggtcgg atcgagtgtg aaccggaacg cttgcacaca
600 ccagccgttg gggatctcca aacgcggcat ctcaggccgc ctcatgatca tcgacagcgg
660 cagccgcgac ggcccgcttg gcccggttct gagcagcacg tttgccatac aaccttgcgc
720 acatcgaggt cagaatctcg gtcatatccc ataccaggtc atcgtcaacc tcggccgagt
780 ccaccacgac caactcccga ccctgagcgg ccagcgcagc gtggacatac tccgaaccga
840 accggcagaa ccgatcccga tgctcaacca caatccgcgt ga
882
<212>类型:DNA
<211>长度:882
序列名:SEQ ID 74:GDC_MTUB_701762
序列描述:
自定义密码子
序列名:SEQ ID 74:GDC_MTUB_701762
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atggcttcca gtaccgacgt gcggccgaag atcactttgg catgcgaggt gtgcaagcac
60 cgtaactaca tcaccaaaaa gaaccgccgc aacgacccgg accggctgga gctgaagaag
120 ttctgcccga attgcggcaa acaccaggcg caccgcgaga cgcggtaa
168
<212>类型:DNA
<211>长度:168
序列名:SEQ ID 75:GDC_MTUB_731710
序列描述:
自定义密码子
序列名:SEQ ID 75:GDC_MTUB_731710
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttggtatgcg ccgccgcccc cggtcgacga cgacccctcg gcgtaggcgg acaggtcgaa
60 gccggcacag aatccctcgc cgcgaccgga caccagaatg acatgcacgc ctggatccag
120 atcggcacgc tccaccagag cagacaactc cagcggggtg tctgcgatga tcgcgttgcc
180 cttctccggc cggttgaagg tgatccgcgc aatccgaccg gtgacctcat aggtcatcgt
240 cttcaggttg tcgaaatcga ccggcctgat cgcgtgtgtc atcagcggcc gctcagcctt
300 ttaccagcgc acgctcgagg atgggcgcga gatccagacc ggccggcatg gtgccgtacg
360 ctccgcccca ctggccgccg agccgagtgg ccagaaacgc ctcggcgacg gcgggatgtc
420 cgtggcgcac caacaacgat ccctgcaacg ccaggcagat gtcttcggca atcttgcggg
480 ctcgataacc gatcgtgtca agatcgccca gctgcggacg cagcctttcg acgtggccgt
540 ccagcctggg gtcctggcct gcgctgcggg ccagctcgtc aaacagcacc tcgacgcatg
600 cgggccgggt tgccatggcg cgcaaggtat ctagcgcgct ga
642
<212>类型:DNA
<211>长度:642
序列名:SEQ ID 76:GDC_MTUB_772761
序列描述:
自定义密码子
序列名:SEQ ID 76:GDC_MTUB_772761
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgggtctcg ttgcgccggc aggtgacggt cgcgcagcga aaaagcgacc tgcgggccgc
60 cgaggatccg atcgacgccg tcgtatgcgc ctacgtggcg ttgtacgccc aacgccggcc
120 cgccgatgtc acgatctatg gggacttcac caccgggtac attgtcacgc cgtcgctgcc
180 caccgacttc agaacggcac cggacgctgg tcgacgggcg cgagcacgtc gatgaggtcg
240 accaccgtcg ccagcgcagc ggcacgcggg tcccgccctt cgaccagcgc cgagaccacc
300 gatccgtcga ccgcacagat caacgtacac accagttcga tctgtgcgga gcggccggag
360 cgctcgatgg cctcggccac ggcctcagcg cgctga
396
<212>类型:DNA
<211>长度:396
序列名:SEQ ID 77:GDC_MTUB_868821
序列描述:
自定义密码子
序列名:SEQ ID 77:GDC_MTUB_868821
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg
60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct
120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc
180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc
240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg
300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg
360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag
420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac
480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcatc
540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac
600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt
660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg
720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg
780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac
840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga
897
<212>类型:DNA
<211>长度:897
序列名:SEQ ID 78:GDC_MTUB_890358
序列描述:
自定义密码子
序列名:SEQ ID 78:GDC_MTUB_890358
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcggcgcc gagccgctgt tcctgttgga ttacatcgcc gtcggtcgga tcgtgccgga
60 gcgactcagc gcgatcgtcg ccggtatcgc cgatgggtgc atgcgtgccg gctgtgcgct
120 gcttggcggc gagaccgcag aacatccggg cctgatcgag cccgatcact acgatatctc
180 tgccaccggc gtcggcgtcg tcgaggcgga caatgtgctg ggtcccgacc gggtcaaacc
240 cggcgacgtc atcatcgcga tgggctcgtc gggtctgcat tccaatgggt actcgctggt
300 ccgcaaggtg ttgctggaga tcgaccggat gaatctggcc ggtcatgtgg aggagttcgg
360 tcgcaccttg ggcgaagagt tattggagcc gactcgcatc tacgccaaag actgtttggc
420 cttggccgcc gaaacccgtg tccggacgtt ttgccacgtc accggcggcg ggctcgccgg
480 caacctgcaa cgggtcatcc cgcatggcct catcgccgag gtcgaccgcg gcacctggac
540 acccgcgccg gtattcacca tgattgccca gcgcggccgg gtcaggcgca cagagatgga
600 gaagacgttc aacatgggtg tcggcatgat cgccgtcgtt gcccccgaag acacgacgcg
660 cgccctggcc gtcctgaccg cgcggcacct ggactgctgg gtattgggaa ccgtctgcaa
720 aggcggaaaa caaggcccgc gggcaaaact ggttgggcag cacccgagat tctaagaacc
780 agacctaacc gggtctaa
798
<212>类型:DNA
<211>长度:798
序列名:SEQ ID 79:GDC_MTUB_904043
序列描述:
自定义密码子
序列名:SEQ ID 79:GDC_MTUB_904043
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggtagcgg tccggattga agtcgtcggc catcgagtcc accacctggc cggccatctt
60 gagttccgcg ggtttgatct ccaccttctg gtccagcacc gggaagtcgg ggtcgcggat
120 ctcatcgggc cacagcaacg tgtgcaccat catcacctct cgcttgccga aatccttgac
180 gcgcaacgcc gccagcctgg tcttgttgcg cagcgtgaaa tgcacgatcg ccatccggtc
240 ggtctcggcg agtgtcttag ccagcagcac atacgatttc gacgacttcg aatcaggctc
300 caaaaagtag ctgcggtcga acatcatcgg gtccacgtcg gcggcgggga cgaactccaa
360 cacctcgatc tcccggctgc gttcttcagg caagctggcg atgtcgtcgt cggtgatcgc
420 caccatttgg ccgtcgccgg actcgtaggc ccgggcaaga tcgcggtagt cgaccacctc
480 gccacacgcc tcgcagacgc gcttgtaccg gatgcgtccg ttgtccttgg cgtgcacctg
540 gtggaacctg atgtcgtggt ctgcggtagc gctgtacacc ttgaccggca cgttcaccag
600 cccgaaggcg atcgaacccg tccaaatggc tcgcatgtaa gtgagtatgc cttgattgtc
660 cgcgagcgga acgtcacggc gaaattccac gcgatatttg accgtgacgt tacgctcgcg
720 acttgtgtga ccgacaggct acgttga
747
<212>类型:DNA
<211>长度:747
序列名:SEQ ID 80:GDC_MTUB_1045383
序列描述:
自定义密码子
序列名:SEQ ID 80:GDC_MTUB_1045383
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcgctcgg cgagggtgaa tccgccggcg cgcagtgcgg caagcacgcc atggtaccca
60 agcggatcgg tgaccaccgc cgcgctggga tggtttttgg cggcggcccg caccatcgcc
120 ggcccgccga tatcaatctg ctcgacgcag tcgtcgacac tggcgccgga ttcgacggtc
180 tggctgaacg gatacaagtt gactacaacg agttcgaaag cctcgatccc gagttgctcg
240 agggccgcgg cgtgctcgga cttgcgcagg tcagccagca gcccggcatg cactcgtggg
300 tgcagtgtct tgacccggcc atcgagcacc tcgggaaagc cggtcagctg ctccacgggg
360 gtcaccggaa tcccggtgtc ggcaatggtc ttggccgttg acccagtcga gatgatctcg
420 acgccggccg cgctcaggcc ctgtgccagg tctaccagcc cggtcttgtc gtacacgctg
480 atcagcgcac ggcggatcgg ccgtcttccg tcgtcggtgc tcatcctatg gttacctttc
540 gtcccatcgt cgctgttcgt ccgaccaccg tcacgccatg ggtggccagt gcggccaccg
600 ccgctaccaa cagccgtcgt tcggtga
627
<212>类型:DNA
<211>长度:627
序列名:SEQ ID 81:GDC_MTUB_1068100
序列描述:
自定义密码子
序列名:SEQ ID 81:GDC_MTUB_1068100
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcgcgctg acccgccgac gaccgcctgc aacacgcgat gcacgcccag cgtctgtgtc
60 ccgtcgatgt gcggtacatc gaccacctcg atgccgcccc gcagctgcgt cccggaaaaa
120 gtcaccttgc tgcagtcttt cccggggctg ggggccggca gcggctggga cgtctccacc
180 gcgatgacga cgaaccggtt gccgttgccc tcggcggaga cggcggccat gttgccctgc
240 aacccggtcg gcagctgggg cccggccgcc acttgcgcac agttcgccgg atcgaaactc
300 agcccgtcgg gcagtttgcg ggcggaaaag aacccgggat cgatggccct gggagtgaca
360 tcggtgacgg tgtattcagg tccaaagccc gacttcactt cggccacctt ggcgatgtcg
420 ccggtcgagg cggtggtgga gctggcccct gatgagcagc cgacaagcca gcacaccgat
480 ccgactgcca gtaccgcctt gcgcatcgtg gtcaatctac ccaacgcagc ccctgagctg
540 cgcaacgtcg acaccgtttt gactagcaga tcagcggcga actgcggtgc cagcggcgga
600 cgcaccgacc cggggtcggt gatcagccga cggcctcgat cacttgccgg gctacccggt
660 tga
663
<212>类型:DNA
<211>长度:663
序列名:SEQ ID 82:GDC_MTUB_1115707
序列描述:
自定义密码子
序列名:SEQ ID 82:GDC_MTUB_1115707
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgggtactg cgcaagagcg agtccgaagc cgatcaggcc cggttccgca ccacgctcta
60 cgtcacctgc gaggtagtcc gcatcgcggc actgctgatc cagccggtga tgccggagtc
120 ggccggcaaa attttggacc tgctcggcca ggccccaaac cagcggtcgt tcgccgccgt
180 aggtgttcgg ctgacccccg gcacagcgct gccgccgccc accggggtat ttccccgcta
240 ccagccgccg caaccacccg aaggcaagtg agcggaccgc agcgacggga aagccaccta
300 cgaagcgttg accgcggtct gcgcgtcgcg tgggatgtcg agcgtggcga cgggataaaa
360 cccggaatcg tcgcggccgt cgcgggacaa cagcatgggc ggatagttca ccacatggga
420 gccgttcggt ttgtgctgtt gccagtcgat cgcggcccgc agcgtgtagt ggcccgcggg
480 caagccggac agatcaacgc gaaccgtctc ggcgaccgac gccggtgtcg gctggtcgct
540 gctgcgatcg ccgcgctggt cggagaccag cgtcttcagg tccaccgctg ccggcagcgt
600 ccgaaccacc tgtccggtgg aatccaccag ccggtagccg ggcacccact tttcggtggc
660 ggcagcagcg ccgtagttgg tccaggtgac cgagatcgtc gcgaccttgc ccgctag
717
<212>类型:DNA
<211>长度:717
序列名:SEQ ID 83:GDC_MTUB_1124996
序列描述:
自定义密码子
序列名:SEQ ID 83:GDC_MTUB_1124996
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtcgatct ccggaatcga gcgctggtcg gctaccgaga acatccgcat ctcggtgatc
60 tcgtcgcccc agaactcgac ccgcaccgga tgttcggccg tcggggcaaa gatgtccaga
120 atcccgccgc gcacagcgaa ctcgccgcgc cggccgacca tatccacccg ggtatatgcc
180 agctcgacca gccgcgccac cacgccgtcg aagggggatt cgtcgccaac ggtcagcgtg
240 aggggctcca tcatgcccag ctgcggcgtc atgggctgca gcagcgagcg caccgaggtc
300 accactaccc ccagcggtgg gcccagctgg gcatcgtcgg ggtgggccag ccggcgcagc
360 gccatcaggc gagtgccgac ggtgtcaaca ccgggtgaga gccgttcgtg cggcagtgtc
420 tcccaggacg gcaacaacgc caccgcatcc ccgaacacac cacgcagttc ggcggccagg
480 tcgtcggctt cccgcccggt ggcggtgacc accagcaatg gcccctgccg agccagcgca
540 ctggcgacca acagccgcgc gctggccggc gcgatgagcg tcaattcgtc gggtcgaccc
600 ccggcgcgct gcatgagctg ttggaatgtc ggcgcgctca gcgccaattc gacgagcccc
660 gcgatcgggg tatctgagca ggcaggcccc ggtgcggtca tgatgcggcc attctag
717
<212>类型:DNA
<211>长度:717
序列名:SEQ ID 84:GDC_MTUB_1138949
序列描述:
自定义密码子
序列名:SEQ ID 84:GDC_MTUB_1138949
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgctggcgt tctaccttcg gccaaggcca gggacgtggt gtacgagtga aggttcctcg
60 cgtgatcctt cgggtggcag tctaggtggt cagtgctggg gtgttggtgg tttgctgctt
120 ggcgggttct tcggtgctgg tcagtgctgc tcgggctcgg gtgaggacct cgaggcccag
180 gtagcgccgt ccttcgatcc attcgtcgtg ttgttcggcg aggacggctc cgacgaggcg
240 gatgatcgag gcgcggtcgg ggaagatgcc cacgacgtcg gttcggcgtc gtacctctcg
300 gttgaggcgt tcctgggggt tgttggacca gatttggcgc cagatctgct tggggaaggc
360 ggtgaacgcc agcaggtcgg tgcgggcggt gtcgaggtgc tcggccaccg cggggagttt
420 gtcggtcaga gcgtcgagta cccgatcata ttgggcaaca actga
465
<212>类型:DNA
<211>长度:465
序列名:SEQ ID 85:GDC_MTUB_1170285
序列描述:
自定义密码子
序列名:SEQ ID 85:GDC_MTUB_1170285
序列
<213>生物名:结核分枝(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgacgaccg ctggcataag cgggtcaaag ggccggacgg gaacaggcga accgtgcggt
60 ctgctgtctg cggcagggtt tcgcgctggc gcgtcaggtg ggttgacggc ggcggagagg
120 agcacagcaa gagcttccag cgcaaacctg acgcgcaggt acctgaccca tgccgaactg
180 ttgatgctcg ccagggccac gggccggttc gaaacgctca ccttggtgct cggctactgc
240 ggcttacggc ggtttacggt tcggtga
267
<212>类型:DNA
<211>长度:267
序列名:SEQ ID 86:GDC_MTUB_1176592
序列描述:
自定义密码子
序列名:SEQ ID 86:GDC_MTUB_1176592
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgggtcagt gcccacgacc tgtgcggcac tggccgcctg ccgtaattgt ttgtagccga
60 actaaattgc ggcgcgcctg cctgcgcgac taccgccgtc ccgccccctc cgacaagaag
120 cccaacaagt cgtaccgggt aatgacccca accggcttgc cttcctccac caccatcaac
180 gcatcccaat cacgcaacgc cttgccggcc gcactgacca attcaccggc gcctatcatc
240 cgcagcggcg ggctcatgtg tgccgacacg gcgtcggcca acttggcgcg gccctcgaac
300 acggccgaga gcagctcgcg ttccgagacg ctaccggcga cctcgccggc catcaccggc
360 ggctcggcgc cgaccaccgg catctgcgac accccgtact cgcgaagaat cccgatggcg
420 tcgcgcacgg tctccgacgg atgggtgtgc accagggcgg gcagcgcgcc ggacttgcgg
480 cgcaacacat caccgacggt ggattgctcg gtcgacccgt caaggcggct gcgcaggaac
540 ccatag
546
<212>类型:DNA
<211>长度:546
序列名:SEQ ID 87:GDC_MTUB_1202653
序列描述:
自定义密码子
序列名:SEQ ID 87:GDC_MTUB_1202653
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttggcggcga tcccgagaag gtcacgctgt tcggtgaatc cgcgcgggaa tcgtcacgac
60 cctgctcgcc accccggcgg ccgcgggtct gttcgcggcg gcgatcgccc agagctcacc
120 ggcgacatcg gtctacgacc aggtgagggc tcggcgcgtc gcggtttgcg tcctcgacaa
180 gctgggaatc gacccgtccg atgtgcacag gttcatgaag tgccgaccgc ggcaatcctt
240 tccgcgtcca gcgaagtgtt caacgaagtg ccggttcgta accccggcac gctggcgttc
300 gtcccgatcg tcgacggcga tctgctgccc gactacccgg tcaagctggc gcaggagggc
360 cgctcacacc cggttccctt gatcatcggc accaacaagc acgagtcggc gctctttcgg
420 ttgatgcgct cgccgctgat gccgatcacc ccgcgcgatc acgtcgatgt tcacccagat
480 tgccgccgaa cagcccgatc tgcaagtgcc aaccgaggag cagatcggct ccgcgtactc
540 gcgatggcgg cgcaaagcac gctcattgag tatggctacc gacgtcggct tccggatgcc
600 gtcggtgtgg ctcgctga
618
<212>类型:DNA
<211>长度:618
序列名:SEQ ID 88:GDC_MTUB_1231843
序列描述:
自定义密码子
序列名:SEQ ID 88:GDC_MTUB_1231843
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgctggcct tgaggcccca gcgtcatttc acccagagcc ggagcgcccg gcggctacgc
60 tgtgtgctcg acgatgacgt atgggtgccc tgggcacggt cagggggttg caggacagca
120 acacggcatt tgtcggtgcg ctgcatagcg ggaacctgtt gggggccacc ggtgcggttc
180 tgcaggctcc gggcaacgcc gtcaacggtt tcttgttcgg ccagacgtcg atatcgcagt
240 cgattgacgt gtcaccggag tacggatacg agttggtcgc tgtcagcgac ccggttggcg
300 gaactgctgg ctccgctcga gccggtcacg gttacgttca cgccgacctt cggtgaaccg
360 gacatggtcc atctgagtgg cacgaagttc gggggccttg tcccggccct cttcgaaggg
420 gtgcgcgccg gcttctaa
438
<212>类型:DNA
<211>长度:438
序列名:SEQ ID 89:GDC_MTUB_1241031
序列描述:
自定义密码子
序列名:SEQ ID 89:GDC_MTUB_1241031
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgaccagct cagcaccgaa gcccgcggcg tcgcgcgcat cggactggcc aactacttcg
60 ccggcgcctt cctgctcccc taccgcgaat tccaccgtgc cgcagagcag ttacgctatg
120 acatcgacct gctgggccgc cggttcggag tgggcttcga aaccgtctgc caccggctct
180 ccacactgca gcgcccgcgg cagcgaggga taccgttcat cttcgtccgc accgacaagg
240 ccggaaacat ctcaaagcga cagtccgcga cggcgtttca cttcagccgg gtcggcggca
300 gctgcccgct gtgggtggtc cacgacgcgt tcgcccagcc agagaggatc gtccgccagg
360 tggcgcaaat gcccgacggc aggtcgtact tctgggtggc caagaccacc gctgccgacg
420 ggctcgggta tctgggcccg cacaagaact tcgcggtcgg gctgggctgc gacctcgcgc
480 acgcccataa actcgtctac tccaccggtg tcgtcctgga cgacccgagc acggaggtcc
540 cgatcggggc gggctgcaag atctgcaacc gaacgtcgtg cgcccaacgt gcgttcccct
600 atctcggtgg tcgcgtcgcg gtcgacgaga acgcgggcag cagcttgcct tattcgtcga
660 ccgagcaatc ggtttgaccg cccgacgcca cagcagacaa cgaaacccct tatattactg
720 tggtttcagc aggctctggg caagcattgt tgtcggtgcc tgcacatagc attcagtcat
780 gtgttccact cgggaggaga tcacggaggc cttcgcgtca ttggctaccg cgctgtcccg
840 cgtgctgggg ctgacctttg a
861
<212>类型:DNA
<211>长度:861
序列名:SEQ ID 90:GDC_MTUB_1252888
序列描述:
自定义密码子
序列名:SEQ ID 90:GDC_MTUB_1252888
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcagcttg gcaatcaaaa cactatgaga ttcgcagggc ggcctcagcg ttttcgccaa
60 agcgcttacc ccctgttcaa ccccaacagc gcgatcgcgc ttggccaccc attcggcggc
120 tcgggggcac ggttgatgac tacagtgcta caccacatgc cggacaaggg aattcgctac
180 ggcttacaga cgatgtgcga gggccgcggc caagccaatg ccaccattgt ggagttgctg
240 tga
243
<212>类型:DNA
<211>长度:243
序列名:SEQ ID 91:GDC_MTUB_1264312
序列描述:
自定义密码子
序列名:SEQ ID 91:GDC_MTUB_1264312
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgacggtat accgtcgagg tatggctgtg ttaacggatg agcaggtcga cgccgcactg
60 cacgacctca acggctggca gcgcgccggt ggtgtcctgc gtaggtcaat caagtttccg
120 acgtttatgg ccggtatcga cgccgtacgc cgggtggccg agcgagccga ggaggtaaat
180 catcatccgg acatcgatat ccgttggcga acagtaactt tcgcgctggt tacgcatgcg
240 gtaggtggta tcacggaaaa cgacattgcg atggcgcacg atatcgacgc aatgtttggg
300 gcctaa
306
<212>类型:DNA
<211>长度:306
序列名:SEQ ID 92:GDC_MTUB_1286282
序列描述:
自定义密码子
序列名:SEQ ID 92:GDC_MTUB_1286282
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgggtgcag tacggcttca acctcaccgc atgggcggtg ggatggctgc cctacatcgg
60 catactggca ccgcagatca acttcttcta ttacctcggc gagcccatcg tgcaggcagt
120 cctgttcaat gcgatcgact tcgtggacgg gacagtcact ttcagccagg cactaaccaa
180 tatcgaaacg gccaccgcgg catcgatcaa ccaattcatc aacaccgaga tcaactggat
240 acgcggcttc ctgccgccgt tgccgccaat cagcccgccg ggattcccgt ctttgcccta
300 acttcggact ag
312
<212>类型:DNA
<211>长度:312
序列名:SEQ ID 93:GDC_MTUB_1301742
序列描述:
自定义密码子
序列名:SEQ ID 93:GDC_MTUB_1301742
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgccttcgc cggtgagcag cggaccgacc agccatggca caaacaaggg gtgcgggttg
60 atcaggtctg agtcgatgaa caccacgatg tcgccgctgg tggccgccag tgaacgccac
120 aatgcctcac ctttgccggg ccgtaccggc acctcgggca acgcctgttc acggctgaca
180 acccgggcgc cggaggcgat ggcccggatc tcggtgtcgt cggtggaacc ggagtccagc
240 acgatcaatt catcgaccag gccatcgacc agcggagaga tgctgtcgat caccgattcg
300 atggtcgctt cctcgttgag ggccggcagc accaccgaaa tcgtccgtcc ggcctttgcc
360 gcttccaact ccccgatcgt ccagccggga cggtgccaag tagtgtccaa gggcagcgcg
420 ccaggggccc tgccaccggc gagatcgccg gcgaccagct ccgatgctgt catgcgagtc
480 ctctcaccgt gcgcgtcggc ggccggaccc cctgaatcga tgccaccatt tccagcaccc
540 gccgggtggc ggcgacctca tgcacccgaa acatgcgcgc cccggcggcc gcagccaacg
600 cggtggctgc cagcgttccc tcaagccgtt cggtcaaatc cacgcccaga gtctccccga
660 caacgtcctt gttgctcaaa gccatcagca cgggccaccc ggtcataa
708
<212>类型:DNA
<211>长度:708
序列名:SEQ ID 94:GDC_MTUB_1351907
序列描述:
自定义密码子
序列名:SEQ ID 94:GDC_MTUB_1351907
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgctttcag cggttatcct gaccgaacgt ggctatccag cggtgcccct ggcgggacaa
60 ctggtgcacc agaggttcgt ccgtcccggt cctctcgtac tagggacagg tttcctcaag
120 tttctgacgc gcgcggcgga tagagaccga actgtctcac gacgttctaa acccagctcg
180 cgtgccgctt taatgggcga acagcccaac ccttgggacc tgctccagcc ccaggatgcg
240 acgagccgac atcgaggtgc caaaccatc ccgtcgatatg gactcttggg gaagatcagc
300 ctgttatccc cggggtacct tttatccgtt gagcgacacc ccttccactc gggggtgccg
360 gatcactaa
369
<212>类型:DNA
<211>长度:369
序列名:SEQ ID 95:GDC_MTUB_1476279
序列描述:
自定义密码子
序列名:SEQ ID 95:GDC_MTUB_1476279
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttggtgggac gcagccgcgt actcgtcctg ttcggagcgg gtgaacatgt cgacgtcgtt
60 gcgttgctcg gtgagcgcgc ccatcggctg atcggtgaac acgtcgtgca gaccgtcgta
120 ggccatgtgg tccaaaaccg taacgtcgcc gtacttgtaa cccgaccggc tattcatcaa
180 caggtggggc gccttcgtca tcgactcctg accgccggcc accaccacgt cgaactctct
240 ggcccgaatg agttgatcag ccagcgcgat tgcgtcgatg ccggacaggc acatcttgtt
300 gatcgtcagc gcagggacat cccaaccgat gccggccgcc actgccgcct gccgtgcggg
360 catttgcccg gcacccgcgg tcaacacctg gcccatgatc acgtactcga ccaaggacgc
420 cggcacgttg gccttctcca gggcgccctt aatggcgatg gcacccagct cgctggcgct
480 gaaatccttc agggagccca tcaacttgcc gatgggtgta cgcgcgccag caacaatcac
540 cgatgtcgtt atgactacct cctcagcgca cccgaaagcc gatctgaccg acccggagaa
600 gcagattctt tcccttcagg ttaccgttgt gtgatgacga ccgatcaagt ccacgcccgt
660 cacatgctgg ctacctcgtt ggtaactgga ctcgatcacg tcggtattgc ggtcgccgac
720 ctggacgttg ccatcgagtg gtatcacgac caccttggca tgatcctggt ccacgaggaa
780 atcaacgacg atcagggcat ccgcgaggca ctgctggcgg tgccgggctc cgcggcgcaa
840 atccagttga tggccccgct cgacgaatcc tcggtgatag cgaagttcct ggacaagcgc
900 gggccaggca tccaacagct ggcgtgccgg gtcagcgatc ttgacgccat gtgtcggcgg
960 ctgcgctccc agggcgtccg gctggtctac gagacggcca ggcgtggcac cgcgaactca
1020 cgga
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 96:GDC_MTUB_1485311
序列描述:
自定义密码子
序列名:SEQ ID 96:GDC_MTUB_1485311
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcgcgcgg caacaaagtc gccatcctcg agctgctggc gcgcctgtgc caccgctgga
60 tcgacttcgg tggactcctc ggaactcgct gcgcccttga gctttccggc tgtcgcagac
120 aacagggaat ccacccagcg actcagttgg tccgcgggct ggaggccctg gaagctcgag
180 atcggctgtc ccgcagccaa ggccaccacg gtcggaaccg cttggacgcc gaatatctgt
240 gccaccctgg gtgcgacgtc aacgttaacc gacgccagcg accacttgcc cttagcggca
300 gcggccaagc cggacagcgt gtcaagcaag tcgacgcata cctcgctgcg gggtgaccac
360 agcaacacca ccaccggcac ttcgtcggac cggacgatca cctcgtcctc gaagttcgcc
420 tcggtgatct cggtcacacc ggacggcgtc gacagtgccc ggtcggcatc cgtgctcgcc
480 gcagcgtttt gctgggcacg ttgtttgatg ccggagaggt caacagcacc ggccatggcc
540 ggcccgagcg ggggtcgcgg acgcgtcacg ccgtcaagtc tgtcatgccg ctgcggtcat
600 cgatccaccc ggtggcgccg accctgcggc aggagccgac ataccgcgat cggttggtat
660 gaccaagatc acactggccg ccaccgaccc ctcaaccgct atccggcccg caatatcagt
720 gcgtcgccct gcccgccagc cccgcacaat gcggcaaccc cgacgcccga tccccggcgt
780 gccaactgca gcgccgcatg tagcgtgatt cgcgtccctg acatgccgag gggatgcccg
840 acggcaatcg caccaccgtt gacgttgacg atctgggggt tcagcccgag ttcgcgtatc
900 gaggccaatg ccaccgcagc gaacgcctcg ttgatctcca ccacgtcgag ctggtccacc
960 gagatgccct cgcgatccag cgccttgttg atcgcgttgg ccggctgcga ttgcagtgtg
1020 gaat
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 97:GDC_MTUB_1486309
序列描述:
自定义密码子
序列名:SEQ ID 97:GDC_MTUB_1486309
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcggtcac ggcgtctagc acccacccgg ccacggtcgc ggcggacagc cagcccagcc
60 acagccacgc gcgctgcggc gcctccccga acaacgccgc catcagcggc accagcaaca
120 cggtgcccac cgctcgcgcg acaacggaac aaaacgcgag cagcgcaaag ccgattagcc
180 tggcgcggtg gtcgttcgga acaagggcta tccaggtgcg gatcatcggg tgccgtcctg
240 cgctgcggcg accgccaccc ggctgccctg gccggtgtcc cacagccggc agtagcgtcc
300 gcccgcggca agcaactcct cgtgggtgcc gcgttcgacg atccgaccat gatcgagcac
360 gacgatctgg tcggcccggg tgatggtatg cagtcgatgg gcgattacca gcacggtgcg
420 gtcccgggtc agccggttaa gcgcctgttg cacaaggtat tccgattccg gatcggcaaa
480 cgcggtggcc tcgtcgagga tgaggaccgg agtgtcgccg aggatggcac gggcaatggt
540 gagccgctgt cgctccccgc ccgaaagacc actgttggct ccgagcacgg tatcgtagcc
600 gtccggcagc cgaagcaccc ggtcgtggatt tgcgcttcg cgggccgcga cctggacctg
660 ttcggcgggg gcatccggta ccgccagcgc gatgttttcg gcggcggtgc catgcacaag
720 ctgggcttcc tgtag
735
<212>类型:DNA
<211>长度:735
序列名:SEQ ID 98:GDC_MTUB_1515112
序列描述:
自定义密码子
序列名:SEQ ID 98:GDC_MTUB_1515112
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgagcgcgg tattggcttt gtctgctgcg gtatcggcac gccgcgcaaa ggctgcggag
60 gcccacagcg cccccagcag caacggcacg ccggccagtg cagccacgcc gagctgccag
120 gagatcggca acagggccag cgcgatcact gccggcagca ggatcgcgct ggtcaacggt
180 gtcaccagat taaccaccag gccaacaagt tccggcccgg tggccgcgat cgcctgccgt
240 gccgtcgcgg tgttttcggc ggtaaaccaa tccaaccgga caaccggaag ccggtccgcc
300 acatcatgtt gggtgtggtt aaggacggcg aaacccagct cgataccgat gcgtgcggtc
360 acggcgtcta gcacccaccc ggccacggtc gcggcggaca gccagcccag ccacagccac
420 gcgcgctgcg gcgcctcccc gaacaacgcc gccatcagcg gcaccagcaa cacggtgccc
480 accgctcgcg cgacaacgga acaaaacgcg agcagcgcaa agccgattag cctggcgcgg
540 tggtcgttcg gaacaagggc tatccaggtg cggatcatcg ggtgccgtcc tgcgctgcgg
600 cgaccgccac ccggctgccc tggccggtgt cccacagccg gcagtagcgt ccgcccgcgg
660 caagcaactc ctcgtgggtg ccgcgttcga cgatccgacc atgatcgagc acgacgatct
720 ggtcggcccg ggtga
735
<212>类型:DNA
<211>长度:735
序列名:SEQ ID 99:GDC_MTUB_1515464
序列描述:
自定义密码子
序列名:SEQ ID 99:GDC_MTUB_1515464
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgccatcgg tcattcgcga cccagatccc ggtgcagcgc ccgcaccgac agttgctgat
60 cggagcgcag aagtcccatc agtgcttcag cgatcgcgac gctgcgatgc ttaccaccgg
120 tacagccgat ggcgattgtc atatagcgct tcccctctcg gcggtagccg tcgacaacca
180 gggatagcaa ccgatggtag gactcgagga actcagccgc gcccggccgg tgcagcacat
240 agtcgcgcac ggccggatgt tggccggtca gtggccgcaa ctcgtccacc cagtgcgggt
300 tcggcaggaa ccgcacgtcc atga
324
<212>类型:DNA
<211>长度:324
序列名:SEQ ID 100:GDC_MTUB_1596569
序列描述:
自定义密码子
序列名:SEQ ID 100:GDC_MTUB_1596569
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgctacggc ccatacgggc gggccaacct ggccgacatc tggcgccgcc gcgacctgcc
60 acgcgacgcc aaggcaccgg tgctggtaca ggtgcccggc ggcgcctggg tactggggtg
120 gcgccgcccg caggcgtatc cgttgatgag ccatctggct gcgcgcggct gggtatgcgt
180 gtcgctgaac taccgggtgt cgccgcgcca cacctggccc gaccacattg tcgacgtgaa
240 gcgcgcgctg gcgtgggtca aggaaaacat cgccgcctac ggcggggatc cgaatttcgt
300 tgccatcagc ggcggttcgg ccggcggcca tctgtgcgcc ctggcggcgt tgacccccaa
360 cgatccgcga tttcagcccg ggttcgaaca ggtcgacacc tcggtggcgg cagcggttcc
420 ggtatacggg cgttacgact ggtttacgac cgatgcgccg gggcgtcggg aattcgtcgg
480 gttgctcgaa acgttcgtgg tgaaacggaa attcagcacg caccgcgaca tcttcgtcga
540 tgcctcaccg atccaccatg tgcgggccga cgccccaccg ttcttcgttc tgcacggccg
600 ccacgactcc ctgatccccg tggccgaagc ccatgcgttc gtcgaggaac tgcgggcggt
660 gtcgaagtcg cccgtcgcct acgcggacct gccccacgcc caacacgcct tcgacgtctt
720 cggctccccg cgggcgcatc acaccgccga ggccgtggcc cgcttcctgt cttgggtgta
780 cgcgaccaac ccgccggcca cgtagtcagc tataggccag ctattgctat tccgcggcac
840 gctccagctc ggccagtgcc ggttcgatgg catcggccat ctcgtcgatg tcgttggcca
900 cctcgggtgt ggtcaccagg ccgaaatcca gataatcctg gtaggagaag caggtga
957
<212>类型:DNA
<211>长度:957
序列名:SEQ ID 101:GDC_MTUB_1600905
序列描述:
自定义密码子
序列名:SEQ ID 101:GDC_MTUB_1600905
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgacggcca gcaggcgctc ggaccacacg gacgcgacgc gtcgagccct cgtcgacgct
60 ggccgttacc tattcgcgcg gcgcgactat ggtgacgtct cgatcgaaga catcgtcacc
120 cgtgcccgag tcacccgtgg cgccctggac taccacttcg acagcaagaa agatctgttc
180 cagacggtac tcgaggttgt cgaagccgac ctggtcgccg acgtcgaagc cgccatagcg
240 aaggtcaccg acgcctggat ctgctggtcg tcggcttcca cgccttcctt gacgcggcga
300 ccaaaccgga tgcgctgcag gtcattgcga ttgacggccc gtcagtgctc gggtggggcg
360 aatggcgccg gatcgacatg cgctagggct tggtctgctg gtcggggctc tcgaacgcgg
420 gatggccgcc ggggtgattc agcgcgtacc gttgccacca ctttcgcatc tgctgctggc
480 cgcgctaacc gaatccgcgc tgcagatcgc ggacgcgacg gacaaagacc ggaccagagt
540 cgaggtcgaa cgcgcattta tggccctact cgaaggtcta cgggtgtagc acgcccgcga
600 tccgctacgg caacggacca ccggccgcaa tcgcggccag cgtcgcgaaa tgctccccgt
660 ccagcgacgc cccgccgacc aggccaccat cgacgtcatc ctgggccacg atgtcgccga
720 cgtttttggc gttcaccgag ccgccgtaga gcacccgcac cgtatcggca atcctcggcg
780 aggccaacga ggccaactct tttcggatcg ccgcacacac ctcctgggcg tcggcggcgc
840 tggccacccg cccggtgccg atcgcccaga ccggttcgta ggcgatga
888
<212>类型:DNA
<211>长度:888
序列名:SEQ ID 102:GDC_MTUB_1616064
序列描述:
自定义密码子
序列名:SEQ ID 102:GDC_MTUB_1616064
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcggttac gctcggaaag cgcgggcctc gcccacgcgg cggatgatgt cagcggggtg
60 gtcctcggcg acgacccgga ccacgatcca cccgtagcgg tgctggactt tctcgtgccg
120 gaggatgtct ttccggtagt ggtagcgact ggtcagatgg tggtcgccgt catactcggc
180 cgcgaccttg atgtcttgcc agcccatatc caaatgggct tccgcccagc cccattcgtt
240 gcgcaccgcg atctgcgtct gggggcgcgg aaagccggcg cggatcaaca acaagcgcag
300 ccaggtttcc ttgggggact gggcaccgcc gtcgacgagg tccagagcgg ctcttgcggc
360 cttcatgcca cggcggcccc gatagcgctc gatcagcggc tcgacgtcgg ccaccttcaa
420 atcggtggcc tgtatcaggg cgtcgacggc cgcgacggcg gggtccaatg gaaatcgact
480 ggtcaggtcg agcgccgttc gctccggtgt ggtcacgcgc atgccctcga tgacgcagat
540 ctcgtcgggc tcgatgcgct cttcccagac ttgcagcccc ggggcacggc ggcggttggt
600 gtcgatgatc gcggcgggaa gatccgcgtc gatccacttg gcgccatgga aggcagaagc
660 cgagtagccg gccagcacgc cgcggcggcg cgagcgcagc cacagcgctt ttgcacgcaa
720 ttgcgcggtc agttccacac cctgcggcac gtacacgtct ttatgtag
768
<212>类型:DNA
<211>长度:768
序列名:SEQ ID 103:GDC_MTUB_1672449
序列描述:
自定义密码子
序列名:SEQ ID 103:GDC_MTUB_1672449
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgggtgtgc gcgccgccgt cggcgtagat gatgtcaccc gtggtcgccg gcagccagtc
60 agacagcagc gcgcacaccg tcttggcgac cggcgtcgca tccttcatgt tccagccgat
120 cggagcgcgc tgatcccagc cctcctcgag cagctggatc tgggcgccgg cctcctcgcc
180 gagcgcaccg ccgacgatcg cactcatcgc cagcgtccgg atagggcctg cggcaacgag
240 attcgaacgc acaccgtact tgccggcctc gcgcgccacg aacctgttga ccgactccaa
300 cgcgctcttg gcgaccgtca tccagttgta ggccggcatc gcccggctcg ggtcgaagtc
360 catgccgacg atggaacctc cggggttcat gatcggcagc agcgccttgg ccatcgaagc
420 atacgaatac gccgagatgt ggatgccctt ggacacatcc gcgtagggcg cgtcgaagaa
480 cgggttgatg cccatcccgg tctgcggcat gaacccaatc gaatgcacca ccccgtcgag
540 cttgttgccc gccccgatcg cctcggtcac ccggccggcc aagctggcca ggtgctcctc
600 gttttgcacg tcgagttcga gcagcggggc ctttgccggc agccggtcgg tgatgcgctg
660 aatcagccgc agccggtcga acccggtgag caccagctgg gcgccctgct cctgggctac
720 ccgtgcgatg tgaaacgcga tcgacgagtc ggtgatgatt ccgctaacca gaatccgttt
790 gccgtccagc agtcctgtca tgtgcgtcct tgtgttgtgt cagtggccca tacccatgcc
840 gccgtcgacc gggatgaccg caccggagat atagctcgca tcctcggaag ccaggaagct
900 gaccaccccg gcgacctcgg cgggggtgcc gacccgcttc gctgggataa attgcagcgc
960 cccctgctga atccgctcat ccagcgcgcg ggtcatatcg gtgtcgatgt agcccggggc
1020 cacc
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 104:GDC_MTUB_1673708
序列描述:
自定义密码子
序列名:SEQ ID 104:GDC_MTUB_1673708
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atggtgccga gcatgagggt gcgctcggat tgggagccga tcgcccagag ccgctcccgg
60 ctcgcggtca cggcaccgcg caacacctcc gggggtcgct tcatctggat tctcctcggt
120 tctgcgcgaa acggtagcag agcgccatgg ttgccaacgc ggtcgccggg cagtctagac
180 cggatcttcc tcgtggcaac cgacaacagg acgtcgttgc cgaaagggcg ctgggcaccg
240 acatctagga tgaacccaca gccacgcccc gacgttatgc catggcgaag agcgaccggc
300 aggagcggga acccagtgaa gcgagcgctc atcaccggaa tcacaggacc ggacggctcg
360 tatctcgcta agctcccgct gaagggatat gtggccgctg gtagcccggc cgaggtctat
420 ttctgctggg cgacacggaa ttatcgcgaa ttgtatgggt tgctcgcggt caacagcatc
480 tggttcaatc acgaatcacc gcgtcacggc gagacattca tgactcgtaa tcctgcacca
540 tatcgcggtc ggcaacgagg cgctgatcga tgcgcagacg ctgatgcgcc ggcccacccg
600 gataggtatc agtattgggg cgttccggcc agcgtacgag gcgtgatcga ccgcgcaatg
660 ggtgtttgcg ttgagtaa
678
<212>类型:DNA
<211>长度:678
序列名:SEQ ID 105:GDC_MTUB_1699549
序列描述:
自定义密码子
序列名:SEQ ID 105:GDC_MTUB_1699549
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgagcggtc agccatcggc tttgcgccga cctacggtgt ccccgtcggc gtgtcgccga
60 cctacggtgt cgaagtcaaa gccaaagatc gacaggatga ccagcaggat ggcgccaccg
120 actaccgacg gatcggcgac attgaacacc ggccaccagc cgaccgacaa gaaatcgacg
180 acgtgcccgc gcagcggccc cggtgcccga aagaagcgat caaccaggtt gcccatggca
240 ccgcccagga tcatcccaag acccagcgcc caccacggcg ataccagccg ccgccccatc
300 cagaaaattc cgaccacgac acccgtcgca atcagcgtca aaacccaggt gtatccggtc
360 gccatcgaga aggccgcccc agaattacgc accagagtcc aggtcaccgt gtcgccgata
420 atcgacaccg gctggccggg cggcaacagt tggacagcta ccaccttggt gacaatgtcg
480 agtgtgagca ccaccacagc gaccgacagc agcatgcgca gccgtcgcgg cggcgcggga
540 gcgttaggtt cccccgcccc cccggcttcc tcggtcgagg tcagcggatc agccgatcct
600 gttggttcgt caggcacacc atcatcatcc cctagggccg atatggcccg cccagacccc
660 gcggccggat gggagcaaac cacgtgcgca atgatcccat catggcccgc ctcaccgtca
720 tcactactgg agggacaatc tcgaccaccg ccggccccga tggggtgcta cggccaaccc
780 attgcggggc gacgctga
798
<212>类型:DNA
<211>长度:798
序列名:SEQ ID 106:GDC_MTUB_1742061
序列描述:
自定义密码子
序列名:SEQ ID 106:GDC_MTUB_1742061
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcccccga ataggccgga acgccggtta gggaaacctc taacagcgcc gcttcgacgc
60 gcaccagcac atccccttcg cgacggtccc ggatcggtcg gaaacccacc gaaaacgagt
120 cgacgacacc agcttttacg ttcgccaaag cctcgtcgcc gtccggggtg tccgcaatct
180 cgaacgcccc gaacaagccg tgaggctcct cccgcaactc aacggcccgg cccaccgggt
240 agcgggttcg agcgtcgtga gagaccagca gcttcaattt gtggccgcgc tcggcgatgg
300 agcgccgaaa agcgccagga gcgaacattt cctggaactc gccgtcgaag tcgcggacgg
360 tggtcgcctc gttgtagggc acgatggtgc cgtgcacggt tcggccttcg ccagaccgca
420 gctcggccat gcggaaaagg atgctactca aaattcggcc accacctagc agacgcaaga
480 aacgcgcgga atcgcttgtg gcgcatggcg gccgctatcc gggttccagc cgccccgcgg
540 cgactgcccg gcgtcagcgg atgccgagat gccaaactcg attgtatcac acacaaaagg
600 tcatcaccgg tccggggcaa acgggttgag cccgtcgccg tcgtcgcccg gcgccaccgc
660 cagtcgctgc tcggcggccg gggtcaggcc aaactcggag gccaagcgca gcagatgcat
720 gcgcgccgtc tccgcaaccg tcaccgccgg gttccggtgc acgacaccgg atttcggtga
780
<212>类型:DNA
<211>长度:780
序列名:SEQ ID 107:GDC_MTUB_1782153
序列描述:
自定义密码子
序列名:SEQ ID 107:GDC_MTUB_1782153
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgtggaaat ggaagccgcg cttggcattc caccgggcaa cctggcggcg acgctggacc
60 gctacaacgc ctacgccgcg cgcggcgcag atcccgattt ccacaagcag ccggaattcc
120 ttgcagcaca agacaacggg ccgtgggggg cgttcgacat gtcgctgggc aaggcgatgt
180 atgccggatt cactctgggc gggctggcca cgtcggtgga cggtcaagta ctgcgcgacg
240 acggcgcggt ggtggccggc ctgtacgcgg tcggggcatg cgcgtccaat atcgcccagg
300 acggcaaggg atatgccagc gggacccagc tgggtgaggg gtcgtttttc gggcgtcgcg
360 ccggagcgca tgcggcagcc cgagcgcagg gcatgtaagc ctcctcgcgc cgcgactggg
420 aatcctgcga cgcgacacgc cgacaaggcg tcgtga
456
<212>类型:DNA
<211>长度:456
序列名:SEQ ID 108:GDC_MTUB_2060659
序列描述:
自定义密码子
序列名:SEQ ID 108:GDC_MTUB_2060659
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgtggcccc gtatttccgc ggcgccgtcg aatcggcgat cgacagttgg cggcgtgtgg
60 tgtcgacggc ggcccaactg ggtatcccga ccccgggatt ctcgtcggcc ctgtcgtatt
120 acgacgcgct gcgcaccgcg cggctgcccg ctgcactcac ccaggcccag cgcgacttct
180 tcggcgcaca cacctacggc cggatcgacg aaccaggcaa gttccacaca ctatggagtt
240 cagaccgcac cgaagtaccg gtgtagcggg ctagaactaa aagggggtaa aggggtaagt
300 gatgagattt ctagacgggc acccacccgg gtacgacctg acatacaacg acgtgttcat
360 cgttccgaac cgatccgagg tcgcgtcgcg cttcgacgtc gatttgtcca ccgccgacgg
420 ctcgggcacc accattccgg tagtggtcgc caatatgacc gcggtagccg ggcggcggat
480 ggccgagacg gtcgcccgcc gcggtggcat cgtaatcctg ccgcaggatc tgccgatccc
540 ggcggtaaag cagacggtgg cgttcgtcaa aagccgggac ctggtgctcg acaccccagt
600 gacgctggca cccgacgatt cggtgtccga cgccatggcg ctcatccaca agcgcgcaca
660 tggcgtcgcg gtggtcatcc tcgagggtcg cccgatcgga ttggtgcgcg aatcgtcctg
720 cctgggcgtg gatcgcttca cccgggtgcg cgatatcgcc gtgacggact atgtgaccgc
780 tccagcggga accgagccac gcaagatctt cgacctgctg gagcacgccc cggtcgacgt
840 tgcggtgctg accgacgccg acggcacgtt ggcgggagtg ctaagccgca ccggggctat
900 ccgcgccggt atctacaccc cggccaccga tag
933
<212>类型:DNA
<211>长度:933
序列名:SEQ ID 109:GDC_MTUB_2093062
序列描述:
自定义密码子
序列名:SEQ ID 109:GDC_MTUB_2093062
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgggtatat ctcccggcga tcgcggggat cgtgttcgtg gcaatgccgc tggtcgcgat
60 cgccatccgg gtcgattggc cgcgtttctg ggcgctgatc actactccgt cttctcaaac
120 ggccctgctg ttgagcgtga agaccgccgc ggccagcacg gtgctgtgcg tactgctggg
180 cgtcccgatg gcgctggtgc tggcccgcag ccgcggacga ctggtgcggt cgttacgacc
240 gctgatcctg ttaccgctgg tgctgccgcc ggtagtcggg ggtatcgcgt tgctctacgc
300 gttcggccgg ctcggcctga tcgggcgcta cctggaggcg gccggcatca gcatcgcatt
360 cagtaccgcg gctgtggtgc tggcgcagac ctttgtctcg ctgccgtatc tggtgatttc
420 cctagagggt gcagcccgca ccgccggagc cgactacgag gtggtggcgg cgacacttgg
480 ggcgcggccc ggcactgtct ggtggcgcgt gaccctgccg ttgctgctcc cgggcgtggt
540 gtccggatca gtactggcgt ttgcccgctc gctcggagag tttggcgcga ccctaacctt
600 tgccggttcc cggcaagggg tcacccgtac ccttccgctg gagatttacc tgcagcgggt
660 gaccgatccg gacgcggcgg tggcattgtc actgctgctc gttgtggtag cggcactggt
720 ggtgctgggt gtgggtgctc gtacgccgat cgggaccgat accaggtagc cggtcatgag
780 caagctgcag ctgcgcgcgg tcgtcgccga ccggcgtttg gacgtcgaat tctcggtgtc
840 cgcgggcgag gtgcttgcag tgctcgggcc caacggtgcg ggcaagtcca ccgccctgca
900 tgttatcgcg gggctgcttc gccccgacgc gggcttggta cgtttggggg accgggtgtt
960 gaccgacacc gaggccgggg tgaatgtggc gacccacgac cgtcgagtcg ggctgctgtt
1020 gcaa
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 110:GDC_MTUB_2105797
序列描述:
自定义密码子
序列名:SEQ ID 110:GDC_MTUB_2105797
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcccacgc cggtcccagc ccgaactggg acgccgtcgc gcagtgcgaa tccgggggca
60 actgggcggc caacaccgga aacggcaaat acggcggact gcagttcaag ccggccacct
120 gggccgcatt cggcggtgtc ggcaacccag cagctgcctc tcgggaacaa caaatcgcag
180 ttgccaatcg ggttctcgcc gaacagggat tggacgcgtg gccgacgtgc ggcgccgcct
240 ctggccttcc gatcgcactg tggtcgaaac ccgcgcaggg catcaagcaa atcatcaacg
300 agatcatttg ggcaggcatt caggcaagta ttccgcgctg acggttggcg gcgtgtgcgg
360 tctatgacca ggtcgacgta tgtgtttgga tcaggtcatg gaaggttcgg ccacagttca
420 catggcagcg ccgccggaca agatctggac attgatcgcg gatgtccgca ataccggccg
480 gttctcgccg gaaaccttcg aggccgagtg gcttga
516
<212>类型:DNA
<211>长度:516
序列名:SEQ ID 111:GDC_MTUB_2133554
序列描述:
自定义密码子
序列名:SEQ ID 111:GDC_MTUB_2133554
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcgccggc tccgctcttc agatccacgg tgccatcgcc ttcacgtggg agcacgacct
60 gcacctgtat taccgccggg ccaagaccac cgaggcgctt ttcgggagca gcgctcgaaa
120 tcgtgcgctg ctcgccgaac gcgcggggct tgtgaaagcc taggcgccca gcgcggccag
180 cgccgcttcg tagttgggtt cttgcgcgat ttccggcacc aattccgtgt aggcgacgtt
240 gccgtccgcg ccgatcacca cgattgcgcg ggcgagcagc ccggccatcg gcccgtcggc
300 gatggtcacg ccgtaatcct cgccgaagct gtcccggaat gccgacgcgg gcatgacgtt
360 ttcggtgccc tcggcgccgc agaagcgctt ctgggcgaac ggcagatcct tcgagacaca
420 cagcacggta gcgccacttg ccgccgcacg ctcgtcgaag gttcgcacac tcgtcgcgca
480 caccggtgtg tccacggatg gaaagatgtt cagcaacacg gacttacccc ggaactggtc
540 gctgctgatc acccccagat cgcccccggt cagggtgaag gccggggccg gggatccgac
600 agcaggtag
609
<212>类型:DNA
<211>长度:609
序列名:SEQ ID 112:GDC_MTUB_2183418
序列描述:
自定义密码子
序列名:SEQ ID 112:GDC_MTUB_2183418
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcgcgggt ccgggcggac gcagatacaa gaccacgccg ctgccctgag ccgacatcct
60 cgccagcgcg ccgttgagtt cctcgccgca gcggcacgcc gtcgagccga acacgtcgcc
120 cgtcaggcac tcgatgtgga cgtgcagcgg cacgggcacc ccggcaccga ccgcacccac
180 gatgaccgcc aaatgctcgc cgaggtcgta aacgtcacga aagccgatga cacgcgaggc
240 gccggcccag gtgggcagcg tcgctgccgt aaaccggacc acctggggct cgatccgccg
300 gcgatacgcc accagctccc cgatcgagac catggccagt ccgtgttcga cggcgaattc
360 gaccgactcg gcgtggtgcg ccatctggac gggattatcg ggcgagacga tctcgcagag
420 cgcggcggcc ggccgccgtt ccgccaggcg ggccaggtcg acggccgcct cggcgggtcc
480 ccgccgaccc agcacaccgt cggcttgcgc ctgcacgggc accacatggc ccggacgttg
540 gaaatcggcg gcgacggagg tggccgaagc cagtgccgcg atggtccagg cgcgatcgct
600 cgccgagatt ccggtgccgg tgccgcgaac gtcgaccgac acgcaatgcg tggtgtctcg
660 gtcacacatg ggcggcaggt gcagtcgctc gcattcggcg cccggcagcg cgacgcgcaa
720 ataacccgag gtgtgccgga ccgcaaaggc aaccagccgc ggcgtcgcgg cctgggcggc
780 gaagacgaga tagccatcgc cattggggtc gccggtcagg accacggcgt gaccgcccgc
840 catcgccgtg atcgcacgac gtacccgcac atcggtcgtc ttcatcgaga ctccaaccgg
900 cggaaccggc taccgtga
<212>类型:DNA
<211>长度:918
序列名:SEQ ID 113:GDC_MTUB_2192571
序列描述:
自定义密码子
序列名:SEQ ID 113:GDC_MTUB_2192571
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgaagacag ctatttctct gccggatgag acgttcgatc gggtatcgcg gcgtgcgagt
60 gagctcggca tgagtcggtc cgagttcttc acgaaggctg cgcagcgcta cctgcacgag
120 ctggacgccc aattgctcac gggccagatc gacagggctc tagagagcat ccatggcacc
180 gacgaagcgg aggccctcgc cgtggccaac gcataccgcg tgctagaaac catggacgat
240 gagtggtga
249
<212>类型:DNA
<211>长度:249
序列名:SEQ ID 114:GDC_MTUB_2234641
序列描述:
自定义密码子
序列名:SEQ ID 114:GDC_MTUB_2234641
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtctacat ccacgacgat tagggtttca acccagactc gggatcgtct ggccgcccaa
60 gcccgcgaac ggggaatctc gatgtcggct ctgctcaccg aactggccgc ccaggccgag
120 cgccaggcaa tcttccgcgc cgaacgcgag gcctcgcacg ccgagacgac cacccaggca
180 gtccgcgacg aggaccgcga gtgggagggc acggtaggcg acggccttgg ctga
234
<212>类型:DNA
<211>长度:234
序列名:SEQ ID 115:GDC_MTUB_2320829
序列描述:
自定义密码子
序列名:SEQ ID 115:GDC_MTUB_2320829
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggcgacca gcacctcgcc ggccggtggg ctgccgcagg cccgctcgca gccgacgaaa
60 tgccgatgcc cggctgactc cacgttcagt gaccgcgcgg cgtcggcccg tacgtcggcg
120 gccgagtgcg cgcagccggg gctgccggtg caggcgctga tgttcagcca gggggagttc
180 tcgtcgaaca ccaggcccag cggcgccagc acccgcagcg cggcgtcggc cgtcgcgtcg
240 tcgaggtcgc agatcagcac cgatcgccac ggcgtgatca ccagcggggc ctcgatcgcg
300 gccaggcatt ccgcgacccg ggcgggcaag acccccagcg gcaccgcggc gcccagcgtt
360 acccggctgt catcctgggg tatccagccg acgggcgttt tggtgacggg ccgaacggat
420 gggcccagct cgacaccgga ctgcagctcg ccgatatcgg ctaattccgt tactcgccag
480 gcggtttcgc ggatcttgac gaaacgcaac gcgacctcga tcagggtctc ggcgacatcg
540 gccacccgca cgccggtgtc acgtccggtc aacagcagtc ggggaccgtc ggggaacacc
600 tgcacgccga cgtcggcacc caggccggac acgtcggcgc ggccgtcgtc gagaccgaac
660 cagaaccggc cgcccagttc cgccagccgg ggctcggcgc ggatcgccgc gtcgagctca
720 ccgacccatg cccgcacgtc ggctagcccg ccggcccggc cggacagcgg cgaggcgacg
780 atattgcgca cccgctcgtg tgttgccgac ggcagcagcc cggctttggc gaccgcgtcc
840 gcgaccgctg ccacgtcgcg gatcccgcgc aactggacat tgccgcgcgc ggtcagtccc
900 agtgtcgcgg agccgaagtc gctggcgacg ctggccagcg tcgccagttg tgccgcggtg
960 atcatcccgc cgggcagccg gatccgcgcc agcgccccgt cggcggcctg gtgcggccgc
1020 aacg
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 116:GDC_MTUB_2321250
序列描述:
自定义密码子
序列名:SEQ ID 116:GDC_MTUB_2321250
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgacgggcc gtgtccgaca gaccggcata acccgtctcg tcgtacatca gcggggcccc
60 gtccttccac agcgactgat gacagtgcat gccggacccg ttgtcgccga acagcggctt
120 gggcatgaac gtgaccgttt tgccgttctg ccaggcggtg ttcttgatga tgtacttgta
180 caactgcatg tcgtcggcgg cgtgcagcag cgaattgaac tggtagttga tctcggcctg
240 tccgccgctg cccacctcgt ggtggccctt ctccaggatg aagccggagt tgatcaggtt
300 ggtcagcatc ttgtcgcgca ggtcgacgta ttggtcgttg ggggccactg ggaaataccc
360 gcccttgtgg cggaccttgt agccccggtt gggactgccg tcggcctcgg tcgccgcgcc
420 ggtgttccac caccccgaga tggcgtccac ctcgtagaag gagccgttgg cgcgcgagtc
480 gaagctcacc gaatcgaaaa tgtagaactc ggcctcggcg ccgaagtatg cggtgtcggc
540 gatgccagtg ctgatcaggt agttctcggc cttgcgggcg atgttgcgcg ggtcgcggga
600 gtacggctcc agggtgaacg ggtcgtgcac aaagaagttg atattcagcg tcttggccgc
660 gcggaacggg tcgatgcgcg ccgtctcggg atcgggaaga agcaacatgt cggattcgtg
720 gatcgactgg aacccgcgaa tcgacgagcc gtcaaaggcc aagccgtcgt caaacacgct
780 cttgtcaaag gccgaagccg gaatcgtgaa gtgctgcatg atgccaggca ggtcacagaa
840 ccggacgtcg acatattcga ccttctcgtc cttggcaagt ttgaagacgt cgtcgggcgt
900 cttttccgtc acagaatgct cctttactgt atccgcggcc gacgctatgg agccgatatt
960 gcccgtcagt caaccccgtg ttgcgcagac gttactgacc gtgccgccca ccactga
1017
<212>类型:DNA
<211>长度:1017
序列名:SEQ ID 117:GDC_MTUB_2487508
序列描述:
自定义密码子
序列名:SEQ ID 117:GDC_MTUB_2487508
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggcgggcg tttgcgcgct attctccggt gcttcccgct ggccgtctgg tgaacttcgg
60 caccgtccac agggttcccg ccggggtccg agccggctac gatgcacctt tccccgacaa
120 aacgtatcaa gccggcgccc gggcgttccc acggttggtg ccgacctcac ccgacgatcc
180 ggcggtaccg gccaaccgcg cggcatggga agccctgggc cggtgggaca aaccgttcct
240 tgccatcttc ggttatcgcg acccgatact cgggcaagcg gacggtccgc tgatcaagca
300 cattcccggc gcggcgggtc agccgcacgc ccgca caag gccagccact tcatccagga
360 ggacagcgga accgaactcg ccgaacgcat gctctcctgg cagcaggcaa cgtaaccgcg
420 acggctgcgg acgaaggatc ggcagaatgg cgatggagat ggcgatga
468
<212>类型:DNA
<211>长度:468
序列名:SEQ ID 118:GDC_MTUB_2567990
序列描述:
自定义密码子
序列名:SEQ ID 118:GDC_MTUB_2567990
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgaccgaca acgagtgccc ggccgacagc cgacggcgcc atgtcctgcg gctcgccctg
60 ttcgccggga ttttgctggg gctgttctac ctggttgcgg tggcacgagt catccacgtc
120 gacggggtcc gtagcgcgat cgtggtggcg acgggtccga tcgcacccct ggcgtacgtt
180 gtggtgtcgg ccgcactcgg cgcgttgttc gtcccgggcc cgatcctcgc cgccggcagc
240 ggggtgctgt tcgggccgct actagacacc tttgtgaccc tgccagcttt ctcggccggc
300 gcgcaggccg gaatgacgcc caggcgctgc tgggtgtcga tcgcgcccat cgcctcgatg
360 cacagatcga acggcgcgga ttgtgggcgg tggtcggtca gcgcttcgtc cccggcatct
420 cggatgcgct ggcctcgtac accttcgggg cgttcggagt tccgttgtgg cagatggtcg
480 ttgggtcgtt catcgggtcg gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga
540 tcaccaacct gtcgtcgccg ctggtttact cggcgatcgc ggtgtggtgc gtga
594
<212>类型:DNA
<211>长度:594
序列名:SEQ ID 119:GDC_MTUB_2577106
序列描述:
自定义密码子
序列名:SEQ ID 119:GDC_MTUB_2577106
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgtggggcgg tggtcggtca gcgcttcgtc cccggcatct cggatgcgct ggcctcgtac
60 accttcgggg cgttcggagt tccgttgtgg cagatggtcg ttgggtcgtt catcgggtcg
120 gcgccacggg tgttcgtcta caccgcgctg ggcgcgtcga tcaccaacct gtcgtcgccg
180 ctggtttact cggcgatcgc ggtgtggtgc gtgaccgcca tcatcggggc gttcgccgcg
240 cggcgttggt accggaagtg gcgtgcgcgc ccgcgccggc ggtgcggcct ggctcagctc
300 acgaccggta gtcagcaacg ccacacgagt caccggacac cggcgggcgt cgtcatgccc
360 ggttcactgt ccgagcaccg ccgtctccgt caagaagcgc cggatcgcat cgagcatcac
420 ccgcccatcg agtag
435
<212>类型:DNA
<211>长度:435
序列名:SEQ ID 120:GDC_MTUB_2577486
序列描述:
自定义密码子
序列名:SEQ ID 120:GDC_MTUB_2577486
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgtctgcgg ttttaccggc tcggtgcatt cgcgcgctag ccgatagggt ctatcgccat
60 gtccggtgcc acggtgggtg cgcgcgaaat caccatccgc ggagtcgtcc tgggcgcatt
120 gattaccttg gtgttcaccg cggccaacgt gtacctgggg ctaagggttg gattgacatt
180 cgccacttcc ataccggccg cggtgatctc gatgggcgtg ctgcggttgt tcgccaacca
240 ctcagtggtg gagaacaata ttgttcagac gatcgcgtcg gcggccggca cgctgtcgtc
300 gatcatcttc gtgttaccgg cactgctcat gatcggctgg tggagcgggt ttccgtactg
360 gacaacggcg gcggtgtgtg cactgggcgg gatccttggc gtcatgtact caattccgtt
420 gcgccgcgca ctcgtcaccg gatcagacct gccgtaccca gaaggcgttg ccggagccga
480 ggttctcaag atcggtga
498
<212>类型:DNA
<211>长度:498
序列名:SEQ ID 121:GDC_MTUB_2690012
序列描述:
自定义密码子
序列名:SEQ ID 121:GDC_MTUB_2690012
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgggcccga tgaacgggtt cctgagttgg tgggacggcg tcgagctgtg gctgtccgga
60 ctcccgttcg cgctgcaggc gttggcagtc atgccggtcg tgctggcttt ggcctatttc
120 accgcggcat tgctggatgc cctgctcggc cgggtcattc agttgattcg ccgcgcccgc
180 cgccccgatc aggcgcccag gtag
204
<212>类型:DNA
<211>长度:204
序列名:SEQ ID 122:GDC_MTUB_2698040
序列描述:
自定义密码子
序列名:SEQ ID 122:GDC_MTUB_2698040
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atggcggacg atgtgagcgg cgcggtgtac cgggccggca cggcccacgg tcggccgacc
60 ggtcgcattg aacaccgcga ccgtcaggtc gtgacgcgcc gggcgactga tacgcgcgcg
120 gaactggacg ggctgtccga ccatcagctc gccgaagtcc agcgctcgcg cgaaaaccac
180 tacccggccg gatgtctcgt catcccgcag ccgttgaacc gtcgcccgga acatcaaccg
240 gccccgcccc agcgacactg ggctctcgct gggggtgacc gtgaccagcg cggaggtgcc
300 aaatgccacg gtgattgggt ggcgatcgac cgcctcggag cgcaacgcga ccgcaagccc
360 gtaccccgcg cccaccatac cgaccgcgac caggccggcg ctgatcgaac ccagtcgcgg
420 agcgtgccac gaccggcgcg ccacacacca ccacagtgcg ccgccgccga gggccaccac
480 gacgcagcac aaggcacaca cgttgccgat cggccacacg atcccggccg ccgtcacaat
540 ccagctgacc agcgccgccg ggaccaggcg tacgtccaaa cgggacgcgc cgaagcccat
600 atggcgcacc ggtatcagac acggaccaga ttgcgccgct tgtccagccg cgccggaccg
660 atgccgtcga cgtcggcaag ctggtcgacg ctggtgaacc taccattgcg ctgccgccac
720 gccacaatcg ctgcggcggt gaccggcccg atgccgggca gggcgtccag ctgctccacg
780 gtcgcagtgt tgaggtcgag cacctcagct gtcttaggag ctgtcttagg gcctgtcgtg
840 gctgtgcccg aggtacccgc cggtcccggc gtccccgcac cgaccgagct gcccagcacc
900 ctcggctgtc ccgagggcgg agctagcccg accacgatct gctcaccgtc accaagctgc
960 cgagccatgt tcagtccgac ggtgtccgcg ccgtctaccg ctccgccggc ggcctgtagc
1020 gcat
1024
<212>类型:DNA
<211>长度:1204
序列名:SEQ ID 123:GDC_MTUB_2712275
序列描述:
自定义密码子
序列名:SEQ ID 123:GDC_MTUB_2712275
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
60 ctggccaccg tcgtgcagtg cgtgaccggc gggctggggg tgacactgat tccgcagacc
120 gcggccgccg tcgagaccac gcgaagccgg ctggaactcg cccgattcgt cgcccctgcc
180 cggcgcgacg aatcggtttg gtgtttagct ctttcggcgg ccgcgagaag tcctaccagc
240 gtcttgccgg gattatcggc aagctga
267
<212>类型:DNA
<211>长度:267
序列名:SEQ ID 124:GDC_MTUB_2725593
序列描述:
自定义密码子
序列名:SEQ ID 124:GDC_MTUB_2725593
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcgcagag tattcagcgg ttggacaacg ttggtccgct gcagcaccgc agcgaccacc
60 gtcacgatca gggcgatgac aaagcacgtc ccggtaatcc actccagcga accgacccgg
120 ccgctgacgc cgcgaaagcc ggtggatccg gtgcgtcggt gctgcagcca actgcgtcag
180 ccgaatccga ccacactgaa aaccgcgaag agtgccagcg ctaagtcggc cgcggtggtc
240 gttcgcatca gcgggtctcc ttcggtgcgt agcagtggtc atgaaccgtt gtggcggttg
300 gctcgcaggg ccgcatcgat cgcggcggcg gccggtgcgc agtcgccgac accggacacc
360 aaagttgcca gcgcacccgc agcgcaggcc cgccgcaatg cgcgcagtcg ctcggccggc
420 gaacctgggt tgcgcggcca attcgcagca aggaccccgg caaatacgtc gccggcgccg
480 gcggtatcca ctggcgttac cgttggggcg ggtacctcga acaccccgtc cgcgccgacg
540 taccgggcac cgcgcacacc cagggtgatc acgaaatgtg ttggtggcga cggccagtcg
600 tttgcctcat gctcgttggc gatcaccacg tcggcgatag cggccaagtc ctgcaaggag
660 cttcgatcct ggccggctgg ggaggcgttg accatgacaa ccgcatcggc cgactgggct
720 gcccgcgcgg ctgccagcgc ggttgcaaca ggaatctcca actgggtcaa cagtacatcg
780 cagttggcga cggccgaggg taccggagtc agatgtgcat tggcacccgg cgccaccagc
840 acggtgttct cggcgctggc atcgaccacg ataatcgccg tcccgctcgg tccgggcacc
900 gtgacggtcc tgtccagtcc aacggcgttg gcgcgcaggt gggcccgcag ctgggcggcg
960 gctggatcgt cgccgaatgc accggagaac tgtacctgcg cgcctgcgcg cgctgcggcc
1020 accg
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 125:GDC_MTUB_2733212
序列描述:
自定义密码子
序列名:SEQ ID 125:GDC_MTUB_2733212
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
60 aaacagctcg cgtcagcgat tcgcaaccca tacggactcg tccgtgggtg gcgctgtcgc
120 atctgtaacg agcaccaagg ccagccggtc aagatggcgc aagaccacga agaggaggtc
180 cgcatccgtt ggggcgagac ggtggacgaa ctccacgctg cgctggaccg cgccgggcca
240 aggccaggga cgtggtgtac gagtgaaggt tcctcgcgtg atccttcggg tggcagtcta
300 ggtggtcagt gctggggtgt tggtggtttg ctgcttggcg ggttcttcgg tgctggtcag
360 tgctgctcgg gctcgggtga ggacctcgag gcccaggtag cgccgtcctt cgatccattc
420 gtcgtgttgt tcggcgagga cggctccgac gaggcggatg atcgaggcgc ggtcggggaa
480 gatgcccacg acgtcggttc ggcgtcgtac ctctcggttg aggcgttcct gggggttgtt
540 ggaccagatt tggcgccaga tctgcttggg gaaggcggtg aacgccagca ggtcggtgcg
600 ggcggtgtcg aggtgctcgg ccaccgcggg gagtttgtcg gtcagagcgt cgagtacccg
660 atcatattgg gcaacaactg a
681
<212>类型:DNA
<211>长度:681
序列名:SEQ ID 126:GDC_MTUB_2828257
序列描述:
自定义密码子
序列名:SEQ ID 126:GDC_MTUB_2828257
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgggatcgc tcaccgtgtt caccagctcg gcgaggatgt cgcgcacagc ggccaacacg
60 tcggcgcgcg cactgcacag catgaccacc gggtcgggcg ggaagagcag aatgctgaac
120 acgatagcca gcccaccacc gaccagcgcg tcgaagaggc gttcgaaaac cacactgccg
180 ttggacgcga agaccaagac cagcaccgcg gagacggcgg cctggttgat gaacattaag
240 ccttgcgcga ccaacccgcg tgcgcacagc accgcgaccg acaacgcgat gaacaccacc
300 acacccatgg cgatcggtcc ggaaccaagc agagcatgca cgccagcacc cagcacgatc
360 cccagcgcca ccccgacgat catctgttgg gcacgtcgtg cgcgcagcac gttggtcgcc
420 gacatgcaca ccacagccga aatcggcgcg aagaacgcct gcggatggtt gaacacgtca
480 tgggtgagat accacgcgag gccggcgacg accgatgtct gggtgatcgg ccacagcacg
540 gtgcgcaacc gttgggcgac cgcacggccg ccgcaggccg tcctgactag cagcgaagcg
600 ctcatgaacg cctatttatt cacactcggg tgcgacgtcg taaccgcaaa gatctggtca
660 tgcctgctgg acccgcttgg gctgggcatc tattccggac tccttacgtt gctgagcggt
720 aatgggcgcc ggcgcgtcgg tgagcggatc gacgccgccg ccggtcttcg ggaacgcgat
780 cacctcacgg atcgagtcca tcccggccag cagcgcggtg gtccggtccc acccgaacgc
840 gattccgccg tgcggcggtg cgccaaacat gaacgcctcc aacaggaatc cgaacttttc
900 ctccgcctcg gccttgtcca ggcccatcac cgcgaacacc cgttcctgga tatcacggcg
960 gtggatacgc accgagccgc caccgatctc gtggccgttg cagacgatgt cgtacgcgtc
1020 ggcc
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 127:GDC_MTUB_2895354
序列描述:
自定义密码子
序列名:SEQ ID 127:GDC_MTUB_2895354
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgatcggcg atttcgccga gatgctcggc ggccaggacg gcgtcgctga gttggtccaa
60 cacgtcgctg tgcacccgtt tgatggcgtt gatgagctcg tcgaggcgga cggggtaggc
120 ggtgggtgtg ggctccggca tgacgtcaac agtaggttga cgttatgcat tgtgtcgacc
180 gtgattggct gcgtagtggg ttctgcagcg ctgccaggcc gctgcgggca gggtggcgcc
240 gatcgcggcc accaggccgg cgtgggcgtc gctggtgacc agcgcgaccc cggacaggcc
300 gcgggcgacc aggtcgcgga agaacgccag ccagccggcc ccgtcctcgg cggaggtgac
360 ctggatgccc aggatctctc ggtagccctc ggcgttgacg ccggtggcga tcaaggtgtg
420 caccccgacg acgcggcctg cctcgcgcac cttgagcacc agggcgtcgg cggcgaggaa
480 ggtatacggg ccggcatcga gcgggcgggt ccgaaacgcc tctacggctt cgtcgagctc
540 tttggccatg atcgacactt gcgacttgga aagctttgtc acaccaagtg tttcgaccag
600 gcgctccatc cggcgagtgg atactcccag caggtagcag gtcgccacca cgctggtcag
660 tgcgcgttca gctcgcttgc ggcgctgcag cagccagtcc gggaaatagc tgccctggcg
720 cagcttgggg atcgcgacgt cgatggttgc ggcacgggtg tcgaaatcac ggtggcggta
780 gccgttgcgc tgattggacc gctcatcgct gcgttcgcgg tagcccgccc cgcacagggc
840 gtcggcttca gcccccatca aggcggcgat gaacgtcgag agcagcccgc gcagcagatc
900 cgggctcgcc tgtgcgagtt ggtcagccag aagctgctcg gtgtcgataa gatgagaaga
960 ggtcattgcg tcatttcctt cgattga
987
<212>类型:DNA
<211>长度:987
序列名:SEQ ID 128:GDC_MTUB_2983047
序列描述:
自定义密码子
序列名:SEQ ID 128:GDC_MTUB_2983047
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttggatgagc cggcgcaccg cgctcgcccg aaagggaacg gagccaatca tgacggcgct
60 caaccgtgct gtggcatcgg cgcgtgtggg aaccgaggtg atccgcgtgc gcgggctcac
120 cttccgctac ccaaaggcgg ccgagccggc ggtgcgtggc atggagttca ccgtcggccg
180 cggcgaaatc ttcgggcttc taggtcccag cggcgcgggc aagtccacca cccagaagct
240 tctcatcggg ctgctgcgcg accacggcgg ccaggccacg gtgtgggaca aagagccggc
300 cgagtgggga cccgattact acgagcgcat cggggtctcc ttcgagctgc ccaaccacta
360 ccaaaagctc accgggtatg a
381
<212>类型:DNA
<211>长度:381
序列名:SEQ ID 129:GDC_MTUB_3005316
序列描述:
自定义密码子
序列名:SEQ ID 129:GDC_MTUB_3005316
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgatccctc aaatgacggt gtcctgcccg cccccgtcga cttctgagcg cgaagagcag
60 gcgcgggcac tgtgcctgcg cctgctcacc gcgcgatccc gcacccgcgc cgagttagcc
120 ggccagctgg ccaagcgcgg ctaccccgaa gacatcggca accgggtatt ggatcggctg
180 gccgccgttg gcctggtgga tgacaccgac ttcgccgaac aatgggttca gtccaggcgg
240 gcgaacgcag caaagagcaa gcgcgcgttg gctgccgagc tgcacgccaa gggcgtcgac
300 gacgacgtga tcaccacggt gctcgggggc atcgacgccg gtgccgaacg ggggcgggcg
360 gaaaagctgg tacgggccag gctgcggcgg gaggtgctga tcgacgacgg caccgacgaa
420 gcgcgggtga gccgcaggct ggtggcgatg ttggcgcgcc gtgggtacgg ccagaccttg
480 gcgtgcgagg tggttatcgc cgagctggcc gccgagcggg agcgccgacg cgtctaa
537
<212>类型:DNA
<211>长度:537
序列名:SEQ ID 130:GDC_MTUB_3048559
序列描述:
自定义密码子
序列名:SEQ ID 130:GDC_MTUB_3048559
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttggtgacga ctctggcgcc gatcttggac agtgcatcga tgactccgaa gaccgcctcc
60 tcgttgccgg ggatcagcga cgacgacaac acgatgagat caccagcagt caacgtgatg
120 ctgcgatgct ccccacgcga cattcgcgac aacgccgaca tcggctcgcc ttgggtgccg
180 gtggtgatca acacaacttg gtcgggcgcc atcgtttcgg cggcggcgat gtcgatgaga
240 tcggaatcag ccactcgtag gaagcccagt tgccttgcga cgcgcatgtt gcgcaccatc
300 gatcggccga cgaacgacac tcgccggccc aatgccactg cggcatcgat gatctgctgt
360 acccgatcca cgttggaggc gaaacacgca actatcaccc gtccgtcggc accccggatg
420 agccggtgca gcgttgggcc cacttcgctt tccgatggcc cgacaccggg gatctcggcg
480 ttcgtcgagt cgcacagcaa caggtccacg ccggtgtcgc cgagccgcga catgcccggt
540 agatcggtgg gacggccgtc cggtggcaat tggtcgaact tgatgtcgcc ggtgtgcagg
600 atggttcccg cgccggtata caccgcgatg gccaacgcgt ccggagtgga atggttgacg
660 gcgaagtact cgcactcaaa cacgccgtgc cgggtgctct ggccctcgcg gacctcgacg
720 aacaccggtg ttatgcggta ctcacgacat ttctctgcaa ccagagccaa ggtgaacttc
780 gagccgacga ccgggatgtc gggtcgcagc ttgagcagaa acggaatcgc cccgatgtgg
840 tcctcgtgcc cgtgggtcaa caccagcgcc tcgatgtcgt caagccggtc ttcgacatgg
900 cgcatgtccg gcaggatcag atcgacaccg ggctcgtcgt ggccaggaaa caacacaccg
960 cagtcgataa tcaacagtcg gcccaggtgt tcgaaaaccg tcatgttgcg gccgatttcg
1020 ttga
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 131:GDC_MTUB_3065095
序列描述:
自定义密码子
序列名:SEQ ID 131:GDC_MTUB_3065095
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtccaaga gatcggatgg gccgagcact ggcaatgcga ttcgtgctcg gcatcgcatc
60 agcgtgatga ctgcgcagcg atcaacctcg cacgctacga ggacaccagt agcgtcgtcg
120 gcccagttgg ggccgccgtc aagcgtggag ccgaccgtaa gacccggcct ggccgggctg
180 gtggccgtga agcgcggaag ggaagcagcc gcaaggctgc cgaacaaccc cgagacgggg
240 tgcaagtcgc gtgaccacta a
261
<212>类型:DNA
<211>长度:261
序列名:SEQ ID 132:GDC_MTUB_3100192
序列描述:
自定义密码子
序列名:SEQ ID 132:GDC_MTUB_3100192
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggcaacga agaacgcggc atggccttca tctacaagct gctcgaacta ctcgccgaac
60 gcgacgatcg aatcacaaag gccagatggg tgtacttcct cacgcgcatg cgtaacccca
120 ccggtgacac agcgcctttt cagcagtttg ctaaccggct acaccaatgg ttccaagatc
180 cgacagacgc caagcaactc aagaccgcgc tgcacctcta catctatcgc actcgcaagg
240 aggagtccga atgagcgtca tccaagacga ctatgtgaaa caggccgaag taattcgcgg
300 cctgccaaag aaaaagaacg gcttcgagct gaccacaacc cagctgcggg tgctactcag
360 cctgaccgca cagctcttcg acgaggcgca gcagagcgcc aaccccacgc tcccgcgtca
420 gctgaaggag aaggtccagt acctgcgggt ccggttcgtc taccagtccg ggcgtga
477
<212>类型:DNA
<211>长度:477
序列名:SEQ ID 133:GDC_MTUB_3129118
序列描述:
自定义密码子
序列名:SEQ ID 133:GDC_MTUB_3129118
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
60 ttccgctggt ggacccgctg ccgagcgttg gagctcggcc tgaccggtta cgcggccaac
120 cacgccgacg gacgcgtgct ggtggtcgcc cagggtccgc gcgctgcgtg ccagaagctg
180 ctgcagctgc tgcagggcga cacgacaccg ggccgcgtcg ccaaagtcgt cgccgactgg
240 tcgcagtcga cggagcagat caccgggttc agcgagcggt aa
282
<212>类型:DNA
<211>长度:282
序列名:SEQ ID 134:GDC_MTUB_3237815
序列描述:
自定义密码子
序列名:SEQ ID 133:GDC_MTUB_3237815
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgttgcacg acgtcgtcca cggcagacga tgtagtgaga atggccaccg gcgacgaatc
60 actcagtacc gaatcggaac gttcatcggt aacgccgcct tgtggaaccg aaagcggcac
120 ggcgatgcgc ccggcctgca acgcgccgag aaaggcgacg acgtactcga gtccctgcgg
180 agcagagatc accacgcggt cacccgtgga accacaacgg ctcagctcct gtgccacatt
240 cagcgttcgc cgatacagct gcgaccacgt cagggttatc gcaacgccgt cccagtcctg
300 ttcgtaatcc ataaacgtga aggccgggtc atggggttgc agacgcgcac acgcgcgcaa
360 cgcagcggga agggaacgca cactcatggg catcacgtta ccggccacgc ttggagttgt
420 cgcagtcgcc gtcggggtgt gctcgcgctc cgcggtctta gccaagtcgc atctggccag
480 ctcagcaggg gtttgccggc tcgccatggg tccaccatcg gacacggtcg gatgtga
537
<212>类型:DNA
<211>长度:537
序列名:SEQ ID 135:GDC_MTUB_3283182
序列描述:
自定义密码子
序列名:SEQ ID 135:GDC_MTUB_3283182
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcccacca ccaaagccac ccagcgccgt gatgtttcca ccgagatcgc ttacctgaca
60 agagcattga aagctcccac cctgcgtgag tcagtgtccc ggctggccga tcgcgcccgc
120 gccgagaact ggagccacga agaatacctg gccgcctgcc tgcagcggga agtgtcagcc
180 cgggagtccc atggtggtga gggccgcatc cgcgccgccc gcttcccggc tcggaagtcg
240 ttggaagagt tcgactttga gcatgctcgt ggcctcaaac gcgacaccat cgcacatctg
300 ggcaccctgg atttcatcac cgcccgcgat aacgtcgtgt ttttgggccc cgcctggcac
360 cgggaagact catcttgcgg tcggcctggc gatacgcgcg tgtcaggccg gtcatcgggt
420 gctgttcgcc accgccgccg aatgggtagc acggctcgcc gaggctcacc acgccgggcg
480 catctacgcc gaactcaccc ggctttgccg ctatccgctc ctggtggttg a
531
<212>类型:DNA
<211>长度:531
序列名:SEQ ID 136:GDC_MTUB_3289702
序列描述:
自定义密码子
序列名:SEQ ID 136:GDC_MTUB_3289702
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcagtggg ggtaccgccc gcttgcgggg gacgaagcga tgaggtgggg gtaccgcccg
60 cttgcgaggg agagcggcgc acttgacccg gatcatcggc ggtgtcgccg gaggccggcg
120 cattgccgtc ccaccacgcg gaaccagacc taccaccgat cgggtgcgcg agtcgctatt
180 caacatcgtg actgcgcggc gggatctgac cggtctggcg gtgttggacc tctatgcggg
240 ttccggcgcc ctggggctgg aggcgttgtc gcggggagcg gcgtccgtgc tgttcgtgga
300 gtccgaccag cgcagcgcgg ccgtcattgc gcgcaacatc gaggccctag gtctctccgg
360 tgcgacgctg cgccggggcg cggtggcggc cgtcgtggcg gccgggacca cgtccccggt
420 ggatctggtg ttggccgacc cgccctacaa cgtcgactcc gccgacgttg a
471
<212>类型:DNA
<211>长度:471
序列名:SEQ ID 137:GDC_MTUB_3319076
序列描述:
自定义密码子
序列名:SEQ ID 137:GDC_MTUB_3319076
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgggtgggg ttgccagcac tcggcaggca tccgttcgcc gttggtctgc cgttcacccc
60 ctggatgcct cgccggcgtt gccccgtccc ggtcaacgat gtgcgaccgc tcgcgcggtc
120 gcgggcccta ccccgagctg gcgtgcggcc gtcaggtcgg cgggggtgtc gacatcgcag
180 cgcaggcccg gccaggctcc tgtcagctcg acagcgcccg aacggcggtg ccgcgcggac
240 gaatccggcc cgaaccgcgg gtgcagcgcg gtgccgaacg cacacagtac cgcggtgccg
300 gtcccaagcc ggtcggcgac gaagctgcgc cgatggtggc gtgcggccga gattgcctcg
360 gcgagttcct gtgtctgtaa tgccggcaaa tcgccttgca gcacaacgat gttggaggcc
420 ccttcggcaa ccacgcgttc ggcagcggtg atggcggtgt tcagtgggtc gggatcgtct
480 tcgggtgtcg ggtcggccag tacatcggcg cccagcccgg ccgccgcagc cgccgcggct
540 tcgtcggggg tgataacagt gatcgagcgc agtgaaccga cacccgccgc ggcggtcaac
600 gtgtcgacga gcatggccag caccacgttc tcgcgagtct gcgccgagaa caccggggcc
660 agcctggttt tggccgcggc caagcgcttg acggcgatga tcaagccgat atcgccgtcg
720 tccggtgtgc cgctcatgaa gtcatcctgc cagcgtcgat ccacgcggca cacttcgacg
780 gcattgccgc cacggtcgtg gccggggccc aggcacggtc ccgacggcaa ccgcggcgca
840 gattag
846
<212>类型:DNA
<211>长度:846
序列名:SEQ ID 138:GDC_MTUB_3339006
序列描述:
自定义密码子
序列名:SEQ ID 138:GDC_MTUB_3339006
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcgcggca ggttgatccg atacgcggtg ttgttgtctc cgagcttgcc gctacgtccc
60 agcgcgtcgg ccaccggctt ccagtcggca tcggtggtgg tcaccgccga acgagctttg
120 ccggcgtggc cgctgcccgc tccacccttg gagcccgaac tgcacgccgc cagtatcacc
180 gccgccgcgg tggtgatcgc gacgattctc ccagcatgtt tggcgcccgc catgcgcgtt
240 ccctccatcc gttgcatcca cggcgtggat ggcagttcgg ttagccatgg tctatcgggt
300 gattatgaaa ccacgatgaa gctcgatcgc accgatccgg gcacggccag acgtcctcat
360 cgacgccctg ggcgcgtatc tgctggccgc cgcggctctt cgacccgtgg aacgcatgcg
420 catccgcgcc gcgggcatca gcgccaccga cccacatgcc cgtctgccat tgccactggc
480 tcgagacgaa atccggtatc ttggaacaac attcaacgac cttctgcagc ggctgcaaga
540 cgcgctcgag cgagaacgtc aattcgtcag cgatgcgggc cacgaacttc gcaccccctt
600 agcctcctga ccaccgaact cgaactcgcc ctgcggcgtc cacgaagcaa ccccgaactg
660 ctcgccgcaa tccgctcggc tctcgcggaa accaccgaca ccgcgcgcac caccggcggc
720 accgggcttg gactggccat cgtcgacacc ctcagccaac gcaaccacgc cagcgtcacc
780 gcccgaaacc gcgccgcagg cggtgccgaa atctccctcc ggcttgctct tggctga
837
<212>类型:DNA
<211>长度:837
序列名:SEQ ID 139:GDC_MTUB_3356995
序列描述:
自定义密码子
序列名:SEQ ID 139:GDC_MTUB_3356995
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcttgggc tgcccgaccc ccgccccgtc ccacgcaacc cggctgcccg tcgtcgggcg
60 acatcccggt ctctatcggc ggacccgagc agccgcccgg ctagccagtc gcggccaagg
120 ccagggacgt ggtgtacgag tgaaggttcc tcgcgtgatc cttcgggtgg cagtctaggt
180 ggtcagtgct ggggtgttgg tggtttgctg cttggcgggt tcttcggtgc tggtcagtgc
240 tgctcgggct cgggtgagga cctcgaggcc caggtagcgc cgtccttcga tccattcgtc
300 gtgttgttcg gcgaggacgg ctccgacgag gcggatgatc gaggcgcggt cggggaagat
360 gcccacgacg tcggttcggc gtcgtacctc tcggttgagg cgttcctggg ggttgttgga
420 ccagatttgg cgccagatct gcttggggaa ggcggtgaac gccagcaggt cggtgcgggc
480 ggtgtcgagg tgctcggcca ccgcggggag tttgtcggtc agagcgtcga gtacccgatc
540 atattgggca acaactga
558
<212>类型:DNA
<211>长度:558
序列名:SEQ ID 140:GDC_MTUB_3381198
序列描述:
自定义密码子
序列名:SEQ ID 140:GDC_MTUB_3381198
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgattttct gggcaaccag gtactgcacg atctggttgc cgccttcacc ctcgtcggtg
60 accttctccc cggcagtctt ggccggtttg ggcgtcgacg ccagcacggt ggatccggcg
120 ttggccagcc ccacctcgtc gctctcgaca ccgatctcgg ccagggtcag cacggtaact
180 tccttcttct tggcggccat gatgcctttg aaggacggga agcgcggctc gttgatcttc
240 tcgttcacgc tgatcaccgc gggcagcgtg gcctcgaggg tgaatacgcc ctcatcggtc
300 tcacgctcgc cggtgatctt gccgccctcg atcgacactt tgcgcaggtg ggtgagctgc
360 ggcaggccca ggtactcggc gatgatggcc ggcaccgcac cgcccacccc gtcggtcgat
420 tcgttgtctg cgatcaccag ctcggtgccc tcgatggtgc ccaacgcgcg cgccaaagcc
480 cacccggttt ggatgacgtc cgagccgtgc atgccgtcgt cctttaggtg gacggccttg
540 tcggcaccca tcgacagcgc cttgcggatc gcctcggtgg cgcgctcggg gcccgccgtc
600 agcacggtta ccgacccttc gatgccgtcg gcggcctctt tctcccgaat ctgtagcgct
660 tcctccacgg cgcgctcgtt gatctcgtcc agcaccgcgt cggcggcctc gcggtccagc
720 gtgaaatcgc cgtcggtcag cttgcgctcc gaccaggtat ctgggacctg cttgatcagg
780 accacgatgt tcgtcatgac tgtggttcgt cctcctcgaa ggcggcccgc agcgctcgac
840 tgcggaacct cggtcacacg ttttgcaacc gcacagcgat attactattc ggtaagttcg
900 cgtggtgcgc cctcacacca tagcgggtgg tag
933
<212>类型:DNA
<211>长度:933
序列名:SEQ ID 141:GDC_MTUB_3388071
序列描述:
自定义密码子
序列名:SEQ ID 141:GDC_MTUB_3388071
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgctctcct cctggccaag gccagggacg tggtgtacga gtgaaggttc ctcgcgtgat
60 ccttcgggtg gcagtctagg tggtcagtgc tggggtgttg gtggtttgct gcttggcggg
120 ttcttcggtg ctggtcagtg ctgctcgggc tcgggtgagg acctcgaggc ccaggtagcg
180 ccgtccttcg atccattcgt cgtgttgttc ggcgaggacg gctccgacga ggcggatgat
240 cgaggcgcgg tcggggaaga tgcccacgac gtcggttcgg cgtcgtacct ctcggttgag
300 gcgttcctgg gggttgttgg accagatttg gcgccagatc tgcttgggga aggcggtgaa
360 cgccagcagg tcggtgcggg cggtgtcgag gtgctcggcc accgcgggga gtttgtcggt
420 cagagcgtcg agtacccgat catattgggc aacaactga
459
<212>类型:DNA
<211>长度:459
序列名:SEQ ID 142:GDC_MTUB_3482312
序列描述:
自定义密码子
序列名:SEQ ID 142:GDC_MTUB_3482312
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgatcagat cgatcgatcg ctgggggtcc gctgccgggg gggcggtcgg cacgcccggt
60 gggaccgact gtaatggccg ctcctcccac ccagctcggt ctgcggcgac gaacacatcg
120 atctcggccc agggcgccgc gggtccctgg gtcaagaatc gggggcgttc cagttttccg
180 gtggcctcat gcagccgcac cgccgccgag acgacctcat catgcctagg ctccggcgcg
240 ccggcgacga acgtgtctgc ccgccaacca gacaccacgt accggccgtc ggtcgatcgg
300 acgggccgag ccaggcgtac gccgtcgacg aacaacgtct cgcgcacccg ggccgaccag
360 gccgcgcggg cgttgtcggc caccatcgac aacaccacct cgccgcatcg ccagccacct
420 tcccaaccgg cacccaacag gatgggttgc gcacctgcca aaccgaacgc caccaacacg
480 tgctcgggcg gcggctcgac attcacaccg gtcagcctag tagagcccat cggggtgtat
540 tgggcctgta tcggtcctag tacatcacca tgtcgggctg catctgcttg gcccacgcga
600 cgatcccacc ctgcaggtgt accgcgtcgg agaaaccggc tttcttga
648
<212>类型:DNA
<211>长度:648
序列名:SEQ ID 143:GDC_MTUB_3581973
序列描述:
自定义密码子
序列名:SEQ ID 143:GDC_MTUB_3581973
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcggtgta gggcggcgtt gagctggcgg ttgcccgagc ggctgagccg catctggccg
60 gcggtgttgc ccgaccacac cgggatggga gccactgcgg catggcaggc gaaggcggct
120 tcgcttttga accgggtcac tccggcggct tcgccgacga ttttggctgc agtcagctcc
180 gcgcagccag ggatttccag cagtgcgggg gcgacctggt ggactcgggc gctgatgcgc
240 tgggctaggg tgttgatctc gccggtgagc cggatgatgt cggtcagctc ggcgcgcgcg
300 agttcggcga ccaatcctgg ctgggtgtcc agccaggtcc gcagggcctg ctggtgcttg
360 gcggcatcga gcgagcgtgc tgccggtgcc cgctcgggat cgagttcatg gacgagccag
420 cgcaaccggt tgatcgccga cgtgcgttgg gccacaagga catctcgacg gtcagtcaac
480 aacttcaact cccgcgacgt ctcgtcgtgg gtggccaggg gtaggtcggt ttcacgcagc
540 accgcccgcg ccaccgccag cgcatcgatc ggatccgact tgccccgact gcgcgccgac
600 ttgcgggtct gggccatcag cttggtgggt acccgcacca cctgctggcc ggccgccagt
660 aggtcacgct ccagacgcgc cgacatgttg cggcagtcct cgatgcccca gatcagctcg
720 aggccgaact gttcacgggc ccacatgatg gctgtggcgt gcccggccgt ggtggccttg
780 acggtcttct caccgagttg gcgacccact tcgtcggtgg ccacaaaggt gtggctgtac
840 ttgtgcgcat cggttccaac aacaaccatg gtggttgcct ctgaaccgcc ccggtga
897
<212>类型:DNA
<211>长度:897
序列名:SEQ ID 144:GDC MTUB 3711717
序列描述:
自定义密码子
序列名:SEQ ID 144:GDC MTUB 3711717
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgccggatc tcctcgagtt tgcggccctt ggtctccggc gcaaagcggt acacgaccac
60 gaacgcgacg acggcgaacg tgccgaagac cgcgaaaacg cc tgcgccgc cgagcacacg
120 cagcatggtg agcgagaagg cggcaacgat cgcgttggcc gtcagtgtcg aggtgagcat
180 cgggctcgat cccatcgacc gcagccggga cgggaagctc tccgcggcgt acacccagac
240 cagcgagccg aatccgaagt tgaacccgat gatgaacagc agcacgccgg cgaaccccaa
300 caccagcccc gtgccaccat cggagtcgtt ggcgaatacg gtgatcagca cggcatctgc
360 ggtgatcatc gtcgcgatgc cggacaacag gatcgggcga cggcccagcc gatcgaccag
420 aaacagcgag gcacacaccg ccgccaagcc ggcgacttgc accatcgcgg gcagggcaag
480 catcgcgaaa tagcccgcga agcccatggc ggcgaaaagt cgcggactgt agtagatgat
540 cgcgttgatc ccggtgatct ggacgaggaa gccgagcgcg atgacgaaca gcgtggcccg
600 cagatacggc cgccgcacca tttcgccgat accgccgccg cgttcgtcga ccgcggccgc
660 catatcggcc agctcggcat cgatgtcggc ctccggctgg atccgccgca gcgcgctacg
720 cgcgtcggcg atccggccct tgagcagata ccagcgggcg gtatcgggca tgcgccacaa
780 caacggcaac agcagcgtgg ccggcgcggc ggccagcccg aacatcgcgc gccagccgtg
840 cgatccggcc aacaggtagc cgaccaggta accgacgacg atgccgctaa gcgtcgccag
900 ctgatacgcg gtcaccaacg acccacgcac cgccgccggc gccgactcgg ccacatacac
960 cggcaccacc accaccgaca ggccgattgt cacacccagc agcagacgcg ccaccaccag
1020 catc
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 145:GDC_MTUB_3716987
序列描述:
自定义密码子
序列名:SEQ ID 145:GDC_MTUB_3716987
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgtctgacg ctacgacagt gttgttcggg ctgccaggag cacgggttga gcgtgtcgag
60 cgccgcagtg acgggacccg ggtggtcgat gtgatcaccg atgagccgac ggcggcggcg
120 tgcccgtcgt gcgggggtgg tctcgatatc agtgaaggaa tacgcggtta cctcaccgaa
180 agatctacct tatggcgaag accgcatcat ggtgcgctgg aacaaaattc gctggcgatg
240 ccgagaagac tactgcaagc tggggccgtt caccgaggcc atcacccagg tacctgcccg
300 cgtccgcagc acgctgcggc tgcgtcggca gatggccaag gcgatcgggg atgcggcccg
360 ctcggtgggc cgaggtcgcc caggctgacg ccgtgtcgtg gccgacggca catcgggcgt
420 ttgttgccta cgccgagacg ggtattgacc gagccgttgc ccaccccggt gctgggcgtt
480 gaccagacac ggcgaggaaa acccagatgg gagcgctgcg ccaagactgg ccggtgggta
540 cgggtcgacc cgtgggatac cgggttcgtc gacctggccg gtgatcaggg gtttatgggg
600 cagcatgaag gccgcggcgg cgcggcggtg ctggcatggc tgcaagcgcg cacaccgcag
660 ttccgggaga gcatccagta cggtggccat cgaccccgcc gctgcctacg cctcggcgat
720 ccgcacgccc gggctgctgc ccaacgccaa gctcgtcgtc gaccacttcc atgtgaccac
780 gctggccaac gacgcgctga ccgcggtgcg ccgccgggtg acctgggcgt tccacgaccg
840 gcgcggccgc aagatcgacc cgcagtgggc caaccgacgt cgcttgctga ccgcccggga
900 acgcttgtcg gacaaaagct tcgccaaaat gcggaatcgg atcaacgccg tcgacccccg
960 cgcgcagatt ctctcggcct ggatcgccaa agaggagctg cgcaccctgc tgtcgaccgt
1020 gcgc
1024
<212>类型:DNA
<211>长度:1024
序列名:SEQ ID 146:GDC_MTUB_3754581
序列描述:
自定义密码子
序列名:SEQ ID 146:GDC_MTUB_3754581
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcaggcat tgcccgaaag ccagctgcca gagctggccg tgcagatgcg tcggcggctc
60 atagaaacag tgacggctac cggtggccat ctcggcgcgg gacttggcat ggtagagctg
120 accatcgcat tgcatcgggt gttcacctcg ccacacgaca tcggtgttcg acaccgggca
180 ccaaacctat ccgcacaagc tgctcaccgg ccgcggtaa
219
<212>类型:DNA
<211>长度:219
序列名:SEQ ID 147:GDC_MTUB_3794808
序列描述:
自定义密码子
序列名:SEQ ID 147:GDC_MTUB_3794808
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgtcttcag aggggggttg gcccaacgtc ggaaacctcg cgcgcagcgc atcaatgaca
60 tcggcagttt catcaagtgc cagggttgtc tgggtcagat acgatagctg ggtaccctcg
120 ggcaggttca acgctgccac atcagcgggt gtctgcacca ataatgttga ccgcggagcg
180 acgccaagcg tgccttcggt ctcctcatgt ccggcgtgcc cgatgaagac caccgtgtca
240 ccgcgcgcgg caaaccgtgc ggcttcagcg tggactttcg ccaccagtgg gcaggtcgcg
300 tcgacgacct gcagtccccg ctcatcagcg cccgcgcgca ccgccgggga aaccccatgc
360 gcggagaaca ccacgaccgc ccccggcggc ggcggatcgg gaatctcgtc gagatcctcg
420 acgaacactg ctccccggtc ccgcaactcg gcaaccacaa cagtgttgtg cacgatttgc
480 ttgcgcacat acaccgggcc ttcggccacg tcaagcactc gcttgaccgt ctcgatagca
540 cgctctacac cggcgcaaaa cgaccgcggc gacgccaaca gcaccgtgac ttcacccgaa
600 gcgtatccct gtgcgaccgg tcccacgaac acctcagcca tcagcactcc cggcgacata
660 tcagttgcga caacgcgatc aggtctgggg atcgcaccgc atcgggcagt gccgcaatag
720
<212>类型:DNA
<211>长度:720
序列名:SEQ ID 148:GDC_MTUB_3796793
序列描述:
自定义密码子
序列名:SEQ ID 148:GDC_MTUB_3796793
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcctgggc atcgtcgggg cacgtcggct tcaagggttc ccggaaatcg accccgtttg
60 cggcccagct ggccgcggag aacgccgctc gcaaggccca agaccacggg gtgcgcaagg
120 tcgacgtgtt cgtcaagggc ccgggctcgg gccgcgagac cgcgatccgg tcgctgcagg
180 ccgccggcct ggaggtgggc gcgatctcgg atgtcacccc ccagccgcat aacggtgtcc
240 ggccccccaa gcgccggcgc gtctaggaga gaagatggct cgttacaccg gacccgtcac
300 ccgcaaatca cggcggttgc gcaccgacct cgtcggtggc gaccaggcct tcgagaagcg
360 tccctacccg cccggccaac acggtcgcgc gcggatcaag gaaagcgaat atctgcttca
420 gctgcaggag aagcagaagg cccgtttcac atacggcgta atggaaaagc agttccgccg
480 ctactacgaa gaggccgtgc ggcagcccgg caagacgggt ga
522
<212>类型:DNA
<211>长度:522
序列名:SEQ ID 149:GDC_MTUB_3879013
序列描述:
自定义密码子
序列名:SEQ ID 149:GDC_MTUB_3879013
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgggacgcc gtgatcgcgg tgcacctgcg cggccatttt ctgctcaccc gcaacgccgc
60 tgcctactgg cgggacaaag ccaaggatgc cgaaggggga tcggtcttcg gccggctcgt
120 caacacctcg tcggaggcgg gtctggtggg cccggtgggg caggcgaatt acgccgccgc
180 caaggctggc atcaccgcgc taaccctgtc ggcggcgcgg gcgctcgggc gctacggcgt
240 ttgcgccaat gtgatttgtc cgcgggcgcg caccgcgatg acggccgatg tcttcggcgc
300 cgcacccgat gtcgaagcgg gccagatcga cccgctgtcg ccgcagcatg tggtaagcct
360 ggtccagttt ctggcgtccc cggctgccgc ggaagtcaac ggtcaggtgt tcatcgtcta
420 cggtccgcag gtgacgctgg tgtcaccgcc gcacatggag cgccggttca gcgcggacgg
480 cacgtcctgg gatcccaccg agctcaccgc gacgctgcgg gactactttg ctggtcggga
540 tccggaacag agcttttcgg cgaccgatct gatgcgtcag tgacccgtgg atataggcgg
600 ccgattattg gaatcggtgt ccgaatcacc acgccaacat ag
642
<212>类型:DNA
<211>长度:642
序列名:SEQ ID 150:GDC_MTUB_3921024
序列描述:
自定义密码子
序列名:SEQ ID 150:GDC_MTUB_3921024
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgccttgga cggcatgttg ctccccttat tcgaacgaca accggaccaa acccagcccg
60 gtgaagtcgg cgacaaactc gtcgccggcc cgcgcctcga ccgcgaacgt gcatgacccg
120 ggtaacacga tgtcgccttt gcgcagccgc acgccgaaac tctcgacctt gccggccagc
180 caagccaccg cggtcgccgg gttacccaac accgcatcac tgcggccctc ggccaccacc
240 tcgccgttgc gggtcagctt cgcatcgatc gccctgacgt caagatcggc cggcggcacc
300 cgggccgcgc ccaacacgaa gcccgccgcc gaggcgttgt cggcgatggt gtcgcagatc
360 ttgatctgcc aatccttgat cctggtgtcg atcagctcga tggcgggcac cagggcctcg
420 gtggccgcca gcacgtcgtc ctcggtgcag cccgcacccg gtaggtcggc ggccaggatg
480 aagcccacct ccacctcaac ccgcggagac aggtaccggg acgcctggac cggcgtgtct
540 tcgaacacct gcatgtcgtc gagcaggtgt ccgtag
576
<212>类型:DNA
<211>长度:576
序列名:SEQ ID 151:GDC_MTUB_3974481
序列描述:
自定义密码子
序列名:SEQ ID 151:GDC_MTUB_3974481
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggttcact ctcggcgctc atgggcgcca tcccgccgcc cgcatcgcgg catcgacgcg
60 gccaacgaac gtgccccggc ggtaccagag cagctcactg gtgaccctga tgatcgtcca
120 gcccagatcc agcaacgcgg tggaccgctc gatgtcccga gcccgctgcg ccgggtctgt
180 ccaatgctgt ggcccgtcat actcgacacc gactcgcaat tgctcgtagc ccaggtcgat
240 gcgggcgacg aagtccccgt agtcgtcaaa cactctgatc tgtgtttgcg gcttcggcag
300 accggcatcg atcaacacca atcgggtcca cgtctcctgt ggggattccg cacccccgtc
360 gatcagcggc agcaccgcac ggaggcggac caggccgcgc gcaccggtat gttcggcaat
420 gacggcctgc acgtcggcga ccttgacatc ggtcgaattc gccaacgcgt ccagccgttg
480 aacggcctgc agccgcgagg gtgtgcgccg cccgatatcg aaggcggtgc gcgccggggt
540 ggttaccgcg acaccgtcaa ccgcaaccgt ctcgtgcggc gccaatcgat ccgtgtgcac
600 gacgatgcgc ggcggaggct ttcgattggc gtgcactaa
639
<212>类型:DNA
<211>长度:639
序列名:SEQ ID 152:GDC_MTUB_3994808
序列描述:
自定义密码子
序列名:SEQ ID 152:GDC_MTUB_3994808
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgtcgcgct accccaacag ctggcgcagg ttgaacaacc ccgatatggc ggtgcccatg
60 ttaaacaggc ccgtgttcaa gccgctccgg acggagccaa agagggtgcc cgggacgccg
120 atgttgccaa tgcccgaggt ctggccgttg atgacagtgc ccccgctggc cgtgttgaag
180 aacccggaga cgtcgacggc taaggggccg gtgggggtgt tgaagaagcc cgagacgtcg
240 gtgccggtgt tgccgaagcc cgagttggtc aggccgctgt cggtaatgat cccgaaaccg
300 gtgttcacat tgcccgcatt ccacgagccg gtgttgatgt tgcccgagtt cccattgccg
360 gtgttgacgt tgccggagtt gtcaaacccc gtgttgacga agcccgcgtt tccgaagccg
420 gtgtttaatt cacccgcgtt ccccaagccg gtgttgagga tgctcgcgtt cccgaagccg
480 gtgttgagaa cgcccgcgtt cccgaagccg atgttggcgt tgccggaatt cccgacgccc
540 aggttgttga ggtcgccagg caccagggta ttggctccgg tgttgaagac gccgatgttg
600 ccgctgccgg agttgaacaa gccgatgttg ttggtgccgg agttgccgat gccgatattg
660 ccgctgccgg agttcagcag cccggccagg ttgatgccca tctga
705
<212>类型:DNA
<211>长度:705
序列名:SEQ ID 153:GDC_MTUB_3998938
序列描述:
自定义密码子
序列名:SEQ ID 153:GDC_MTUB_3998938
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgagctcaa atcatgcgat tctgcgtctg ctcgcgccct tgcggctaga tccccagaac
60 ctgggcgctg gcccacagcg cgagcaccgc catcgccagg gccgcaggca cggtgcacag
120 tcccagtcgg gtgtactcgc cgacgctggc gtcgacgttg tgccggcgca gcacgccccg
180 ccacagcagg ttagacagcg aaccggcata ggtcaggttg ggtccgatgt tgaccccgag
240 tag
243
<212>类型:DNA
<211>长度:243
序列名:SEQ ID 154:GDC_MTUB_4021183
序列描述:
自定义密码子
序列名:SEQ ID 154:GDC_MTUB_4021183
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgtgccagg gtgtacccgc ccgattgccg ccggcaaccg acactgttgg tgtagtgacc
60 aaatcagcag tgccccgggt gggtcttgac gtgcaaatcg actacagtct tggtgaccgt
120 ccggtacccg ggcatgggac tggaacgaac caagaaacct gtgaggccgt ctgctatgga
180 gcggttcgac ggtttgcgtc cggccaggct caaggtgggg atcatctcgg ctggccgggt
240 cggcaccgcg ctaggggtcg cgctgcagcg cgccgaccat gttgtggtgg cgtgcagcgc
300 catctctcat gcgtcccggc ggcgcgcgca gcgccggctg cctga
345
<212>类型:DNA
<211>长度:345
序列名:SEQ ID 155:GDC_MTUB_4045946
序列描述:
自定义密码子
序列名:SEQ ID 155:GDC_MTUB_4045946
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcggcccg caaaacgggc cgaggaggag ccaggcaatc accccagagc cgggtgcagc
60 gggtcgccac catcagcccc gtggcgatcg caaaccccgc gcctggcgac aatgcggccc
120 gcaaaacggg ccgaggagga gccaggcaat caccccagag ccgggtgcag cgggtcgcca
180 ccatcagccc cgtggcgatc gcaaaccccg cgcctggcga caatgcggcc cgcaaaacgg
240 gccgaggagg agccaggcaa tcaccccaga gccgggtgca gcgggtcgcc accatcagcc
300 ccgtggcgat cgcaaacccc gcgcctggcg acaatgcggc ccgcaaaacg ggccgaggag
360 gagccaggca atcaccccag agccgggtgc agcgggtcgc caccatcagc cccgtggcga
420 tcgcaaaccc cgcgcctggc gacaatgcgg cccgcaaaac gggccgagga ggagccaggc
480 aatcacccca gagccgggtg cagcgggtcg ccactggcta gaccaacgac cggtagttcc
540 cgacggcgtc ggaaaatccg acagctgagc gttcgggtca aacacgcggt gcaccggacc
600 tga
603
<212>类型:DNA
<211>长度:603
序列名:SEQ ID 156:GDC_MTUB_4053033
序列描述:
自定义密码子
序列名:SEQ ID 156:GDC_MTUB_4053033
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atgcgcacta cgatcgacct cgatgacgac atactgcggg cgttgaaacg acgccagcgc
60 gaggagcgca aaacgttagg gcagctcgcc tccgaattgc ttgcgcaagc tctggcggcc
120 gagcctcctc caaacgttga catccgctgg tcgactgccg acttgcggcc ccgtgtggat
180 cttgacgaca aggacgctgt ttgggcgatt ttggaccgtg ggtga
225
<212>类型:DNA
<211>长度:225
序列名:SEQ ID 157:GDC_MTUB_4140236
序列描述:
自定义密码子
序列名:SEQ ID 157:GDC_MTUB_4140236
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgtcacgtt gtcggattca ctgtcgccgg ctagcgcttt cccgtcagaa gacgagaagc
60 ctccccgatc tccaactagc atcgagatcg ggcttgcgaa ggttgggttg caaaatggat
120 gtcatcagat gggctcgccg gcttgcggtg gtggcgggca cagcagcggc agtgaccact
180 cctgggctac tgagtgcgca cgttccgatg gtctccgccg aaccgtgtcc cgacgtcgag
240 gtggtgtttg cccgtggcac cggggagcca cctggtattg gcagcgtcgg aggactgttc
300 gtcgacgcac tgcgtttccc aggttggcgc caagtcactc ggggtctacg ccgttaa
357
<212>类型:DNA
<211>长度:357
序列名:SEQ ID 158:GDC_MTUB_4169350
序列描述:
自定义密码子
序列名:SEQ ID 158:GDC_MTUB_4169350
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtggatgcat gtcattcccg ggcgcggcgc ggcgtggttg atcgtcgacg tccgagatgt
60 ggcggcactg cacgcggcgt tgttggaatc cgggcgtggg ccgcgccgct acactgcggg
120 aggtcatcgg attccggtgc ccgagctcgc gaaaattctg ggcgggtcgc cggcaccacg
180 atgctggccg tcccggtgcc cgattccgcg ctgcgtgtcg cgggatcggt gctggatcaa
240 gccgggccct atctgccttt caatactccg ttcaccgcgg caggtatgca gtactacaca
300 cagatgccgg agtccgacga ttcgccgagc gaaaaagaac taggcatcac ctaccgcgat
360 ccgcgcgaca ccgtggccga caccgtcacg gccctgcgcg gcctgggcag ctaa
414
<212>类型:DNA
<211>长度:414
序列名:SEQ ID 159:GDC_MTUB_4170798
序列描述:
自定义密码子
序列名:SEQ ID 159:GDC_MTUB_4170798
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgatgtgga agccgcgctg gcgatggtgt tcgacggctt cggagcggcg aaccaccgcc
60 agcccagatg cctgccgcaa cgtatcgcgg tgccggtcac caagcttaag acttgccggc
120 tcgggatcac cgtggcatcg gatgcgatcg agatccacgg cggcaatggc tacatcgaga
180 cctggccggt ggcccggttg ctgcgtgacg cgcaagtcaa cacgatctgg gagggccccg
240 acaacatcct gtgtctggat gtgcggcgcg ggatcgagca gacgcgcgct cacgagacac
300 tgttggcgcg gctgcgcgat gcggtgtcgg tgtccgacga tgacgacacc acgcggctgg
360 tctcgcgccg cattgaggac ctcgacgcgg cgatcaccgc ttggaccaaa ctcgacaggc
420 agctggccga ggcgcggctg ttcccgctgg cccaattcat gggcgacgtc tacgccggcg
480 cgttgctcac cgagcaggcc gcctgggaac gggcaacccg cggcaccgac cgcaaggcac
540 tcgtcgcccg cctgtacgcg cgccggtatc tcgccgacca aggcccgctg cgcggtatcg
600 acgcagattg cgatgaggcg ctgcagcgtt tcgacgaact cgtggcgggc gcgttcactg
660 ccgagcagac gtaaaagccc ccaattcgtg gctcttctga cacttccgtg ggtgagtttg
720 tgtcctgagt ag
732
<212>类型:DNA
<211>长度:732
序列名:SEQ ID 160:GDC_MTUB_4252190
序列描述:
自定义密码子
序列名:SEQ ID 160:GDC_MTUB_4252190
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcgggccc cggcgacccg cgcggccagc cgcggctctt cgaggaattc cgaccagcgc
60 ccgtcgggca ggtcggtgat cccgtcgcgg ccttccagca gcgcctgcca ggtctgctcg
120 ggggtgttca tctcgcccgg gaagcgggtg gacaagccca cgatcgcgat gtcgacgcgc
180 tcggccgggc cggtgcgcga ccagtcttcg gcgtcatcgc ccgctaggtc ggtctccggc
240 tcgccctcga tgatccgggt ggccagcgat tcgatggtcg gatgcgcgaa cgccaccgcg
300 accgacagcg tgaccccggt caggtcttct atgtcggcgg ccatcgcgac ggcatcgcgc
360 gacgacagac ccagctccac catgggcacc gattcgtcga tcgagtccgg tgcctttccg
420 acggccttac ccacccagtt gcgcagccac tggcgcatct cggggaccgt tagctcggcc
480 ctttcggcgg gggcgttctc ctgggattcc gctacgtcag ccatgggtcc tcagtccgaa
540 gtggcgaaga ccgtcgggga acccacgcca ctgcgcaggc tgccgtcgag gtag
594
<212>类型:DNA
<211>长度:594
序列名:SEQ ID 161:GDC_MTUB_4260620
序列描述:
自定义密码子
序列名:SEQ ID 161:GDC_MTUB_4260620
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcacgagg acccgcacac tggcgtcgag ccgggtgccg ttacggcgca ccgagattgc
60 cagcacccgc gcccggcctg tggcgatgag ccgttcaatc cggcgtgtgt tctcgtgcgt
120 acggacggtc ccgacgaccg gaagtgtgag atgacggcga tcaggttcga cgcgcatcgc
180 tccggtcgtg aatgtcacgc ggtcctgatc gcggcctttc ttcttgaacc gggggaagcc
240 cattgtcttg ccctcacgtt taccggatcg ggagttctgc cagttccagt acgcatcgac
300 agcgccgcca atgccgtcgg cgtaagcctc tttcgagcac tccggccacc acaccgcccc
360 ggtctcggcg ttgacacaca cctcgtcctt gacggtgttc caccgtttac gaagcacccg
420 cagcgacggc ttgacagtcc cgataccagt aacgcgccac gcctcgatat cggctttcaa
480 agtagcgacc gcccagttgt aggccttgcg gcgagcgccg aaatgccgcg ccagcgcgcg
540 ggcctggtcc tcggttgggt ccagcgtgaa ccggaacgcc tgcacacacc agccttctgg
600 cacctcgaat ctggccatca agctgcctcc gcgtccccga ccgcagcagc aagggcacgc
660 ttggccccgt tctgtgcagc gcgttcacca tag
693
<212>类型:DNA
<211>长度:693
序列名:SEQ ID 162:GDC_MTUB_4302166
序列描述:
自定义密码子
序列名:SEQ ID 162:GDC_MTUB_4302166
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
ttgcgcccgt caaggtccac cctgatagcc aaatgcgcca gctggcggca accaccccgt
60 tgtcttcgat ccgcagccgt aaaccgtcgt tcgtcggcgc ccgtcgccca acgtgaactg
120 agggcggaga atcggccgga atctcgccct cagttcacgc tcggcgccgt ttggcctcac
180 ccagtcaatg tgatctgtgc gggcgggcgt tggcgcgtag cgaaccccag tggcgccggc
240 ccgccaagca cgccccggcg cggccagctc atcagcggct acgcaagcgc aacggcgccc
300 gcgatgggct gtggaagaac ccggaggatc tcaccgaaca ccagaatgcc aagctgtcgc
360 gctcatctac tcaaagaagg cctacggcac ctgttttcgg tcaaaggcga agagagtaag
420 caggcactgg accggttgat cttctag
447
<212>类型:DNA
<211>长度:447
序列名:SEQ ID 163:GDC_MTUB_4317863
序列描述:
自定义密码子
序列名:SEQ ID 163:GDC_MTUB_4317863
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
gtgcattcgg ctagctcggt tgccacaccc gtcaggggtt cgacgttggc gggttcggcg
60 ggccccagca ccgctgtcac catgcccgcc aagccgacct gcggcgccac caactgcagc
120 accagcatgt cgccgtcgcg cgccgcgatc acatggcggt cgcccctgcg gcacacgacg
180 aagcgcacca tgacgccgcc aatgtcgcgc cgccaccagc gaccctccaa ggtccgatct
240 ggcctgccca gggtttcgac catctccgcg accgtcggtt ggggctcccc gtggaggtcg
300 agcacccctt gcgctgtgag gtcacgctgc acctgttccc agacgatgtc tcgcagatcc
360 tcttgcggga tattcggccg aatcccaagc gtgacaggga aatcaaccag gtgtaaccga
420 tcggcgatca ccaacatgcc gtcgatggtt acctcgacgc cgaccacgtt gtcggcggtg
480 cccgcgcggc ctgcagcgga cggacccgtc atgatcaacc gaaaatcttg tcgataa
537
<212>类型:DNA
<211>长度:537
序列名:SEQ ID 164:GDC_MTUB_4341852
序列描述:
自定义密码子
序列名:SEQ ID 164:GDC_MTUB_4341852
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
atggaccgac tctgcggtgc gccgctatgt caccgacgcc ggggccctac tgccacggct
60 gcacaagctg gtgcgcgccg actgcacgac ccgcaacaag cgccgggccg cgcggttgca
120 ggccagttac gaccggctgg aagagcggat cgcggagctg gccgcccagg aggatctgga
180 tcgggtgcgc cccgacctgg acggcaacca gatcatggcg gtgctcgaca ttccggcggg
240 cccgcaagtc ggcgaggcgt ggcgctactt gaaggagctg cggctagagc gcggcccgtt
360 gcttgggagt cgcgtcagaa cggttgtgga gtactgcata gccggcgacg acggcagcgc
420 cgggatctgg aaccgcccgt tcgacgtcga cctcgacggt ga
462
<212>类型:DNA
<211>长度:462
序列名:SEQ ID 165:GDC_MTUB_4391527
序列描述:
自定义密码子
序列名:SEQ ID 165:GDC_MTUB_4391527
序列
<213>生物名:Sars冠状病毒(Sars Coronaviris)
<400>前序列链:
gtgacgagct tggcactgat cccattgaag attatgaaca aaactggaac actaagcatg
60 gcagtggtgc actccgtgaa ctcactcgtg agctcaatgg aggtgcagtc actcgctatg
120 tcgacaacaa tttctgtggc ccagatgggt accctcttga ttgcatcaaa gattttctcg
180 cacgcgcggg caagtcaatg tgcactcttt ccgaacaact tgattacatc gagtcgaaga
240 gaggtgtcta ctgctgccgt gaccatgagc atgaaattgc ctggttcact gagcgctctg
300 ataagagcta cgagcaccag acacccttcg aaattaagag tgccaagaaa tttgacactt
360 tcaaagggga atgcccaaag tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac
420 cacgtgttga aaagaaaaag actgagggtt tcatggggcg tatacgctct gtgtaccctg
480 ttgcatctcc acaggagtgt aacaatatgc acttgtctac cttga
525
<212>类型:DNA
<211>长度:525
序列名:SEQ ID 166:GDC_Sars174_refseq
序列描述:
自定义密码子
序列名:SEQ ID 166:GDC_Sars174_refseq
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
ttggacctga gcatagtgtt gcagattatc acaaccactc aaacattgaa actcgactcc
60 gcaagggagg taggactaga tgttttggag gctgtgtgtt tgcctatgtt ggctgctata
120 ataagcgtgc ctactgggtt cctcgtgcta gtgctgatat tggctcaggc catactggca
180 ttactggtga caatgtggag accttga
207
<212>类型:DNA
<211>长度:207
序列名:SEQ ID 167:GDC_Sars68_refseq
序列描述:
自定义密码子
序列名:SEQ ID 166:GDC_Sars68_refseq
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
atggtgactt cttgcatttt ctacctcgtg tttttagtgc tgttggcaac atttgctaca
60 caccttccaa actcattgag tatagtgatt ttgctacctc tgcttgcgtt cttgctgctg
120 agtgtacaat ttttaaggat gctatgggca aacctgtgcc atattgttat gacactaatt
180 tgctag
186
<212>类型:DNA
<211>长度:186
序列名:SEQ ID 168:GDC_Sars61_refseq
序列描述:
自定义密码子
序列名:SEQ ID 168:GDC_Sars61_refseq
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
ttggcacccg caatcctaat aacaatgctg ccaccgtgct acaacttcct caaggaacaa
60 cattgccaaa aggcttctac gcagagggaa gcagaggcgg cagtcaagcc tcttctcgct
120 cctcatcacg tagtcgcggt aattcaagaa attcaactcc tggcagcagt aggggaaatt
180 ctcctgctcg aatggctagc ggaggtggtg aaactgccct cgcgctattg ctgctag
237
<212>类型:DNA
<211>长度:237
序列名:SEQ ID 169:GDC_Sars78_refseq
序列描述:
自定义密码子
序列名:SEQ ID 169:GDC_Sars78_refseq
申请项目
<120>名称:
<130>申请文件参考:
<140>当前申请号:
<141>当前提交日期:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VTSLALIPLK IMNKTGTLSM AVVHSVNSLV SSMEVQSLAM STTISVAQMG TLLIASKIFS
60
HARASQCALF PNNLITSSRR EVSTAAVTMS MKLPGSLSAL IRATSTRHPS KLRVPRNLTL
120
SKGNAQSLCF LLTQKSKSFN HVLKRKRLRV SWGVYALCTL LHLHRSVTIC TCLP
174
<212>类型:PRT
<211>长度:174
序列名:SEQ ID 170:GDC_HINF_5641
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LDLSIVLQII TTTQTLKLDS AREVGLDVLE AVCLPMLAAI ISVPTGFLVL VLILAQAILA
60
LLVTMWRP
68
<212>类型:PRT
<211>长度:68
序列名:SEQ ID 171:GDC_HINF_6322
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MVTSCIFYLV FLVLLATFAT HLPNSLSIVI LLPLLAFLLL SVQFLRMLWA NLCHIVMTLI
60
C 6
1
<212>类型:PRT
<211>长度:61
序列名:SEQ ID 172:GDC_HINF_124181
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LAPAILITML PPCYNFLKEQ HCQKASTQRE AEAAVKPLLA PHHVVAVIQE IQLLAAVGEI
60
LLLEWLAEVV KLPSRYCC
78
<212>类型:PRT
<211>长度:78
序列名:SEQ ID 173:GDC_HINF_170553
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LLLKGVIMOV SRRKFFKICA GGMAGTSAAM LGFAPANVLA APREYKLLRA FESRNTCTYC
60
AVSCGMLLYS TGKPYNSLSS HTGTNTRSKL FHIEGDPDHP VSRGALCPKG AGSLDYVNSE
120
SRSLYPQYRA PGSDKWERIS WKDAIKRIAR LMKDDRDANF VEKDSNGKTV NRWATTGIMT
180
ASAMSNEAAL LTQKWIRMLG MVPVCNQANT
210
<212>类型:PRT
<211>长度:210
序列名:SEQ ID 174:GDC_HINF_231874
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MTNNWVDIKN ANLIIVQGGN PAEAHPVGFR WAIEAKKNGA KIIVIDPRFN RTASVADLHA
60
PIRSGSDITF LMGVIRYLLE TNQIQHEYVK HYTNASFLID EGFKFEDGLF VGYNEEKRNY
120
DKSKWNYQFD ENGHAKRDMT LQHPRCVINI LKEHVSRYTP EMVERITGVK QKLFLQICEE
180
IGKTSVPNKT MTHLYALGFT EHSIGTQNIR SMAIIQLLLG NMGMPGGGIN ALRGHSNVQG
240
TTDMGLLPMS LPGYMRLPND KDTSYDQYIN AITPKDIVPN QVNYYRHTSK FFVSMMKTFY
300
GDNATKENGW GFDFLPKADR LYDPITHVKL MNEGKLHGWI LQGFNVLNSL PNKNKTLSGM
360
SKLKYLVVMD PLQTESSEFW RNFGESNNVN PAEIQTEVFR LPTTCFAEEE GSIVNSGRWT
420
QWHWKGCDQP GEALPDVDIL SMLREEMHEL YKKEGGQGIE SFEAMTWNYA QPHSPSAVEL
480
AKELNGYALE DLYDPNGNLM YKKGQLLNGF AHLRDDGTTT SGNWLYVGQW TEKGNQTANR
540
DNSDPSGLGC TIGWGFAWPA NRRVLYSRAS LDINGNPWDK NRQLIKWNGK NWNWFDIADY
600
GTQPPGSDTG PFIMSAEGVG RLFAVDKIAN GPMPEHYEPV ESPIDTNPFH PNVVTDPTLR
660
IYKEDREFIG SNKEYPFVAT TYRLTEHFHS WTAQSALNII AQPQQFVEIG EKLAAEKGIQ
720
KGDMVKITSR RGYIKAVAVV TKRLKDLEID GRVVHHIGLP IHWNMKALNG KGNRGFSTNT
780
LTPSWGEAIT QTPEYKTFLV NIEKVGEA
808
<212>类型:PRT
<211>长度:808
序列名:SEQ ID 175:GDC_HINF_232170
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 176:GDC_HINF_232813
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VFMLYLEFLF LLLMLYIGSR YGGIGLGVVS GIGLAIEVFV FRMPVGKHRL MLCLSFLQW
59
<212>类型:PRT
<211>长度:59
序列名:SEQ ID 177:GDC_HINF_233190
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MAAAIQQRAE LQRRIWQIAN DVRGSVDGWD FKQYVLGTLF YRFISENFAN YIEAGDESVN
60
YAQLPDEIIT QMPLKRKATL FTQANYLRML RLMLAAILI
99
<212>类型:PRT
<211>长度:99
序列名:SEQ ID 178:GDC_HINF_235441
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LNTDLKQIFT DIENSATGFP SEQDIKGLFA DFDTTSNRLG NTVKDKNDRL TAVLKGVAEL
60
DFGKFEDNHI DLFGDAYEYL ISNYAANAGK SGGEFFTPQS VSKLIAQIAM HGQTSVNKIY
120
DPAAGSGSLL LQAKKQFDEH IIEEGFFGQE INHTTYNLAR MNMFLHNINY DKFDIALGNT
180
LMEPQFGDNK PFDAIVSNPP YSVKWAGSDD PTLINDERFA PRRRACTKIQ SGLCLYFTCV
240
KLSFSKRPRG DCFLPWYFLS WRCRAKNSSI FGG
273
<212>类型:PRT
<211>长度:273
序列名:SEQ ID 179:GDC_HINF_235913
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MMNDLPPAGV LAPKSKADFA FILHALSYLS AKGRAAIVSF PGIFYRGGAE QKIRQYLVDN
60
NYVDAVIALA PNLFFGTSIA VNILVLSKHK PNLSMPAVYL NLPLITTF
108
<212>类型:PRT
<211>长度:108
序列名:SEQ ID 180:GDC_HINF_240336
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VPHLAKSISF EEIAQNDYNL AVSSYVEQKD TREVINIDEL NAQIRETVTN IDHLRAEIDK
60
IVAEIEG
67
<212>类型:PRT
<211>长度:67
序列名:SEQ ID 181:GDC_HINF_243018
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MTQYKTIAES NNFIVLDQYN KFVEESNAGY QTERSLEREF IRDLQAQGYE YLQWLNNHDE
60
LIKNLRAQLQ RLNNVVFSDA EWQRFLEEYL DKPSDNLIEK TRKIHDDYIY DFVFDNGRIQ
120
NIYLLDKKNL ANNSLQVINQ FKQTGSYDNR YDVTILVNGL PLY
163
<212>类型:PRT
<211>长度:163
序列名:SEQ ID 182:GDC_HINF_274892
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MVYPFIELKK RGVAIREAFN QIHRYSKESF NKENSLFKYI QIFVISNGTD TRYFANTTKR
60
NKNSYDFTMN WATAKNTLIK DLKDFTATFL QKNTLLNVLV NYCVFDVSDT LLIMRPYQIA
120
ATERILWKIQ ISYLAKNWSN RESGGYIWHT TGSGKTLTSF KASRLATELD FIDKVFFVVD
180
RKDLDYQTMK EYQRFSPDSV NGSESTAGLK RNIEKDDNKI IVTTIQKLNN LMKSEENLSI
240
YQKQVVFIFD EAHRSQFGEA QKNLKRKFKK FYQFGFTGTP IFPENALGAE TTASVFGAEL
300
HSYVITDAIR DDKVLKFKVD YNDVRPQFKA LETEKDPEKL TALEQKQAFL HPERIKEISQ
360
YLLNNFKQKT HRLNATGKGF NAMFAVSSVE AAKRYYETLQ NLQAEQEYPL KIATIFSFAA
420
NEEQDAIGDI PDETFEPTAL NSTAKEFLTK AIDDYNHYFG TNYGVDSQSF QNYYRDLAKR
480
VKNQEVDLLI VVGMFLTGFD APTLNTLFVD KNLRYHGLMQ AFSRTNRIYD TTKTFGNIVT
540
FRDLEQNTID AITLFGDKNT KNVVLEKSYD SYFNGDDNQR GYAEIVKELK ESFPDPTEIE
600
TEQDKKEFVK LFGEYLRVEN ILQNYDEFAA LQALQAVDLN DPIAMEKFKQ VHYVNDEQIA
660
EMLKVPTLPV RAEQDYRSTY NDIRDWLRQR KEGNDKDNSP INWDDVVFEV DLLKSQEINL
720
DYILALIFEH HKKNQDKEVL IDEIRRTVRS SLGNRAKESL IVDFINQTNL DDIPDKATLI
780
DSFFLFAQAE QRKEAESLIQ EENLNVDAAK RYISTSLKRE YASENGTALN EVLPKMSLLK
840
PQYLTKKQKI FQKIAAFVEK FKGVGGKI
868
<212>类型:PRT
<211>长度:868
序列名:SEQ ID 183:GDC_HINF_276992
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MDIIKPICTG FFYNDNNVLG DLMKNFKYFA QSYVDWVIRL GRLRFSLLGV MILAVLALCT
60
QILFSLFIVH QISWVDIFRS VTFGLLTAPF VIYFFTLLVE KLEHSRLDLS SSVNRLENEV
120
AERIAAQKKL SQALEKLEKN SRDKSTLLAT ISHEFRTPLN GIVGLSQILL DDELDDLQRN
180
YLKTINISAV SLGYIFSDII DLEKIDASRI ELNRQPTDFP ALLNDIYNFA SFLAKEKNLI
240
FSLELEPNLP NWLNLDRVRL SQILWNLISN AVKFTDQGNI ILKIMRNQDC YHFIVKDTGM
300
GISPEEQKHI FEMYYQVKES RQQSAGSGIG LAISKNLAQL MGRGFNS
347
<212>类型:PRT
<211>长度:347
序列名:SEQ ID 184:GDC_HINF_370413
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 185:GDC_HINF_370747
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VNIHGLAKLN GNVTLIDHSQ FTLSNNATQT GNIKLSNHAN ATVNNATLNG NVHLTDSAQF
60
SLKNSHFWHQ IQGDKDTTVT LENATWTMPS DTTLQNLTLN NSTVTLNSAY SASSNNAPRH
120
RRSLETETTP TSAEHRFNTL TVNGKLSGQG TFQFTSSLFG YKSDKLKLSN DAEGDYTLSV
180
RNTGKEPVTL EQLTLIESLD NKPLSDKLKF TLENDHVDAG ALRYKLVKNK GEFRLHNPIK
240
EQELLNDLVR AEQAEQTLEA KQVEQTAEKQ KSKAKARSRR AVLSDTPSAQ SLLNALEAKQ
300
VEQTTETQTS KPKTKKGRSK RALSAAFSDT PFDLSQLKVF EVKLEVINAQ PQVKKEPQDQ
360
EEQGKQKELI SRYSNSALSE LSATVNSMFS VQDELDRLFV DQAQSALWTN IAQDKRRYDS
420
DAFRAYQQKT NLRQIGVQKA LDNGRIGAVF SHSRSDNTFD EQVKNHATLT MMSGFAQYQW
480
GDLQFGVNVG AGISASKMAE EQSRKIHRKA INYGVNASYQ FRLGQLGIQP YLGVNRYFIE
540
RENYQSEEVK VQTPSLAFNR YNAGIRVDYT FTPTNNISVK PYFFVNYVDV SNANVQTTVN
600
STMLQQSFGR YWQKEVGLKA EILHFQLSAF ISKSQGSQLG KQQNVGVKLG YRW
653
<212>类型:PRT
<211>长度:653
序列名:SEQ ID 186:GDC_HINF_628407
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MKKTVFRLNF LTACVSLGIA SQAWAGHTYF GIDYQYYRDF AENKGKFTVG AKNIEVYNKE
60
GQLVGTSMTK APMIDFSVVS RNGVAALVGD QYIVSVAHNG GYNDVDFGAE GRNPDQHRFT
120
YQIVKRNNYQ AWERKHPYDG DYHMPRLHKF VTEAEPVGMT TNMDGKVYAD RENYPERVRI
180
GSGRQYWRTD KDEETNVHSS YYVSGAYRYL TAGNTHTQSG NGNGTVNLSG NVVSPNHYGP
240
LPTGGSKGDS GSPMFIYDAK KKQWLINAVL QTGHPFFGRG NGFQLIREEW FYNEVLAVDT
300
PSVFQRYIPP INGHYSFVSN NDGTGKLTLT RPSKDGSKAK SEVGTVKLFN PSLNQTAKEH
360
VKAAAGYNIY QPRMEYGKNI YLGDQGKGTL TIENNINQGA GGLYFEGNFV VKGKQNNITW
420
QGAGVSIGQD ATVEWKVHNP ENDRLSKIGI GTLLVNGKGK NLGSLSAGNG KVILDQQADE
480
AGQKQAFKEV GIVSGRATVQ LNSTDQVDPN NIYFGFRGGR LDLNGHSLTF KRIQNTDEGA
540
MIVNHNTTQV ANITITGNES ITAPSNKKNI NKLDYSKEIA YNGWFGETDK NKHNGRLNLI
600
YKPTTEDRTL LLSGGTNLKG DITQTKGKLF FSGRPTPHAY NHLDKRWSEM EGIPQGEIVW
660
DYDWINRTFK AENFQIKGGS AVVSRNVSSI EGNWTVSNNA NATFGVVPN
709
<212>类型:PRT
<211>长度:709
序列名:SEQ ID 187:GDC_HINF_654365
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VGENAMNLSR RDFMKANAAM AAATAAGLTI PVKNVVAAES EIKWDKAVCR FCGTGCAVLV
60
GTKDGRVVAS QGDPDAEVNR GLNCIKGYFL PKIMYGKDRL TQPLLRMTNG KFDKNGDFAP
120
VSWDFAVQNN G
131
<212>类型:PRT
<211>长度:131
序列名:SEQ ID 188:GDC_HINF_661444
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LIRTAILRQF LGILPFKTMA EKFKEAFKKN GQNAVGMFSS GQSTIWEGYA KNKLWKAGFR
60
SNNVDPNARH CMASAAVAFM RTFGMDEPMG CYNDIEQADA FVLWGSNMAE MHPILWSRIT
120
DRRISNPDVR VTVLSTYEHR SFELADHGLI FTPQTDLAIM NYIINYLIQN NAINWDFVNK
180
HTKFKRGETN IGYGLRPEHP LEKDTNRKTA GKMHDSSFEE LKQLVSEYTV EKVSKMSGLD
240
KVQLETLAKL YADPTKKVVS YWTMGFNQHT RGVWVNQLIY NIHLLTGKIS IPGCGPFSLT
300
GQPSACGTAR EVGSFPHRLP ADLVVTNPKH REIAERIWKL PKGTVSEKVG LHTIAQDRAM
360
NDGEMNVLWQ MCNNNMQAGP NINQERLPGW RKEGNFVIVS DPYPTVSALS ADLILPTAMW
420
VEKEGAYGNA ERRTQFWRQQ VKAPGEAKSD LWQLMEFAKY FTTDEMWTED LLAQMPEYRG
480
KTLYEVLFKN GQVDKFPLSE LAEGQLNDES EYFGYYVHKG LFEEYAEFGR GHGHDLAPFD
540
MYHKARGLRW PVVEGKETLW RYREGYDPYV KEGEGVAFYG YPDKKAIILA VPYEPPAESP
600
DNEYDLWLST GRVLEHWHTG TMTRRVPELH RAFPNNLVWM HPLDAQARGL RHGDKIKISS
660
RRGEMISYLD TRGRNKPPRG LVFTTFFDAG QLANSLTLDA TDPISKETDF KKCAVKVEKA
720
A 72
1
<212>类型:PRT
<211>长度:721
序列名:SEQ ID 189:GDC_HINF_737160
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VMSRRRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 190:GDC_HINF_775792
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LVMFNDFLAT FSQQLTPQMW GVVATATYET VYISFASTLL AVLVGVPVGI WTFLTGKNEI
60
LQNNRTHFVL NTIINIGRSI PFIILLLILL PVTRFIVGTV LGTTAAIIPL SICAMPFVAR
120
LTANALMEIP NGLTEAAQAM GATKWQIVRK FYLSEALPTL INGVTLTLVT LVGYSAMAGT
180
QGGGGLGSLA INYGRISQYA LCNLGGNHYY CAIRYD
216
<212>类型:PRT
<211>长度:216
序列名:SEQ ID 191:GDC_HINF_848166
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 192:GDC_HINF_928073
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LRKDALPAFF TDVNQMYDAL LNKSGATGVF TDFPDTCVEF LKGIK
45
<212>类型:PRT
<211>长度:45
序列名:SEQ ID 193:GDC_HINF_929037
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 194:GDC_HINF_1018846
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LPKPEPIPRP RRLALCFAPS AGDRVFKRIS YSSTLTMYET WLIIPRTAGV SINSTVWCIW
60
RRPRPRKVAL CFGKRAIELR TCVTLIVLAI IHYPKISSTV LPRFAATISG DFIFANASIV
120
ARTTLIGLVE PYALERTLRT PATSNTARIA PPAMIPVPSL AGCINTREPV
170
<212>类型:PRT
<211>长度:170
序列名:SEQ ID 195:GDC_HINF_1021582
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LFIYGGINMQ ITLSNTLAND AWGKNAILSF DSNKAMIHLK NNGKTDRTLV QQAARKLRGQ
60
GIKEVELVGE KWDLEFCWAF YQGFYTAKQD YAIEFPHLDD EPQDELLARI ECGDFVRGII
120
NEPAQSLTPV KLVERAAEEI LNQADIYNEK SAVSFKIISG EELEQQGYHG IWTVGKGSAN
180
LPAMLQLDFN PTQDSNAPVL ACLVGKGITF DSGGYSIKPS DGMSTMRTDM GGAALLTGAL
240
GFAIARGLNQ RVKLYLCCAE NLVSNNAFKL GDIITYKNGV SAEVLNTDAE GRLVLADGLI
300
EADNQNPGFI IDCATLTGAA KSGCRKRLSF CIIYG
335
<212>类型:PRT
<211>长度:335
序列名:SEQ ID 196:GDC_HINF_1082407
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VAVGNDYHSV LSMDDELVKN LFQSAQAENE PFWRLPFEDF HRSQINSSFA DIANIGSVPV
60
GAGASTATAF LSYFVKNYKQ NWLHIDCSAT YRKSGSDLWS VGATGIGVQT LANLMLSRSL
120
K 12
1
<212>类型:PRT
<211>长度:121
序列名:SEQ ID 197:GDC_HINF_1144501
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LPIELKVEGL VGKPNEKISA AEFRQKCREY AAEQVEGQKK DFIRLGVLGD WDNPYLTMNF
60
DTEANIIRTL GKVIENGHLY KGSKPVHWCL DCGSSLAEAE VEYEDKVSPS IYVRFPAESA
120
DEIEAKFSAQ GRGQGKLSAI IWTTTPWTMP SNRAIAVNAD LEYNLVQLGD ERVILAAELV
180
ESVAKAVGIE HIEILGSVKG DDLELSRFHH PFYDFTVPVI LGDHVTTDGG TGLVHTAPDH
240
GLDDFIVGKQ YDLPMAGLVS NDGKFISTTE FFAGKGVFEA NPLVIEKLQE VGNLLKVEKI
300
KHSYPHCWRH KTPIIFRATP QWFIGMETQG LRQQALGEIK QVRWIPDWGQ ARIEKMVENR
360
PDWCISRQRT WGVPMTLFVH KETEELHPRT LDLLEEVAKR VERAGIQAWW DLDEKELLGA
420
DAETYRKVPD TLDVWFDSGS TYSSVVANRL EFNGQDIDMY LEGSDQHRGW FMSSLMLSTA
480
TDSKAPYKQV LTHGFTVDGQ GRKMSKSIGN IVTPQEVMDK FGGDILRLWV ASTDYTGEMT
540
VSDEILKRAA DSYRRIRNTA RFLLANLNGF DPKRDLVKPE KMISLDRWAV ACALDAQNEI
600
KDAYDNYQFH TVVQRLMRFC SVEMGSFYLD IIKDRQYTTK ADSLARRSCQ TALWHIAEAL
660
VRWMAPILSF TADEIWQHLP QTESARAEFV FTEEFYQGLF GLGEDEKLDD AYWQQLIKVR
720
SEVNRVLEIS RNNKEIGGGL EAEVTVYAND EYRALLAQLG NELRFVLITS KVDVKSLSEK
780
PADLADSELE GIAVSVTRSN AEKCPRCWHY SDEIGVSPEH PTLCARCVEN VVGNGEVRYF
840
A 84
1
<212>类型:PRT
<211>长度:841
序列名:SEQ ID 198:GDC_HINF_1279189
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LENKMTVDYK NTLNLPETSF PMRGDLAKRE PDK
33
<212>类型:PRT
<211>长度:33
序列名:SEQ ID 199:GDC_HINF_1347200
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MKITHCKLKK SIQNKLLEFF VLEVTARAAA DLLDI
35
<212>类型:PRT
<211>长度:35
序列名:SEQ ID 200:GDC_HINF_1347942
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LFLVGNLLRW VWLALFIIAQ IWAYVQTPDS WLAMISGISG ILCVVLVSKG KISNYFFGLI
60
FAYTYFYVAW GSNFLGEMNT VLYVYLPSQF IGYFMWKANM QNSDGGESVI AKALTVKGWM
120
TLIVVTTVGT LLFVQALQAA GGSSTGLDGL TTIITVAAQI LMILPLS
167
<212>类型:PRT
<211>长度:167
序列名:SEQ ID 201:GDC_HINF_1476415
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MFSGEHDACD CYVDLQAGSG GTEAQDWTEM LLRMYLRWAE SKGFKTELME VSDGDVAGLK
60
SATIKVSGEY AFGWLRTETG IHRLVRKSPF DSNNRRHTSF SAAFVYPEID DDIDIEINPA
120
DLRIDVYRAS GAGGQHVNKT ESAVRITHMP SGIVVQCQND RSQHKNKDQA MKQLKAKLYE
180
LELQKKNADK QAMEDNKSDI GWGSQIRSYV LDDSRIKDLR TGVENRNTQA VLDGDLDRFI
240
EASLKAGL
248
<212>类型:PRT
<211>长度:248
序列名:SEQ ID 202:GDC_HINF_1476557
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LLGNEKQAEA QAKYAEDTLK QARDFAKQHH KTAYLARNAD GLQTGQKGSI HTEAMELVGL
60
ENVAEGEQKG LTQVSMEQLL L
81
<212>类型:PRT
<211>长度:81
序列名:SEQ ID 203:GDC_HINF_1505851
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LPRIFAACFV GAALACGGAT YQGMFKNPLV SPDILGVSAG AGFGASLAIF YNLPMIYIQF
60
FAFSGGILAV LCVSLIASRS RTQDPILVLV LSGIAIGSLL GAGISLLKIL ADPFTQLPSI
120
TFWLLGSLTA INQQDLIQLI PMLLLGIVPI FLLLTDTLAR TIAPIELPLG ILTSACGY
178
<212>类型:PRT
<211>长度:178
序列名:SEQ ID 204:GDC_HINF_1524561
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LKNSLRELKD YTVVIVTHNM QQATRCSDYT AFMYLGELVE FGQTQQIFDR PKIQRTEDYI
60
RGKMG
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 205:GDC_HINF_1568974
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MISLQETKIA VQNLNFYYED FHALKNINLR IAKNKVTAFI GPSGCGKSTL LRSFNRMFEL
60
YPNQKATGEI NLDGENLLTT KMDISLIRAK VGMVFQKPTP FPMSIYDNIA FGVRLFEKLS
120
KEKMNERVEW ALTKAALWNE VKDKLHKSGD SLSGGQQQRL CIARGIAIKP SVLLLDEPCS
180
ALDPISTMKI EELITGVKLY CGYSNS
206
<212>类型:PRT
<211>长度:206
序列名:SEQ ID 206:GDC_HINF_1586944
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MSQLNIQFPT KFKPLFESIW RFIIFYGGRG SGKSFSIARA LVLRAYQSPV RVLCSVKFRN
60
RFLIL
65
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 207:GDC_HINF_1594339
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
VVPEFIIVSL ILVAQSMKLA LNKWLIIFGN AIALHIKYAL LRLNFEGVVG EILEKVDNGQ
60
MGVVLKRMMV RAASKVAQRF NIEAIVTGEA LGQVSSQTLT NLRLIDEAAD ALVLRPLITH
120
DKEQIIAMAK EIGTDDIAKS MPEFCGVISK NPTIKAVREK ILKEEGHFNF EILESAVQNA
180
KYLDIRQIAE ETKAVVEVEA ISVLGENEVI LDIRSPEETD EKPFESGTHD VIQMPFYKLS
240
SQFGSLDQSK SYVLYCERGV MSKLQALYLK ENGFSNVRVF AKNIH
285
<212>类型:PRT
<211>长度:285
序列名:SEQ ID 208:GDC_HINF_1634710
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LAIAIGGGNR GNASGVLRQN FAEDKAKKTA SKLVGVMAHY FGGKSFYLPA GDKIKEALRD
60
AQIYQEFNGK NVPDLIKKYR LSESTIYAIL RNQRTLQRKR HQMDFNFS
108
<212>类型:PRT
<211>长度:108
序列名:SEQ ID 209:GDC_HINF_1638626
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LFRWHYLGGF TVMPDTNNTE TNNKIELYLN GKILSGWKSL NLQRSLESMS GRFDLGIAVR
60
PEDDISVLAA GSPLVLKMGG QTVITGYLDE IKQRVSGNDK TISVSGRDKT CDLVDCAIIH
120
NSYQFKNQTA KQIAEAICKP FGISVVWQVQ APEANERIPV WQVEPGETAF DNLSKIARHK
180
GVLVTSDVDG NLLFTEPSNK QVGNLTLGEN LLELEQTDSW LQRFSLYRVI GDAEQGGAKG
240
DTKTKNKAAK GKEKDDGVVE DPDIYPGPAE GGK
273
<212>类型:PRT
<211>长度:273
序列名:SEQ ID 210:GDC_HINF_1639409
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
MKVSYRLNNC LSLKLALI PLLILLFVVMGS VLSLIAKLDF YFFQQILFNS ELHFALLMSL
60
GTSLFSLILA LCIAIPSAWR MSQVRLPFQS FFDTLFDLPM VLPPLVTGLS LLLLFSSQGI
120
LAELLPFISK WIFSPVGIII AQTYIASSIL LRCSEPLKLR KKTIKTTKIK P
171
<212>类型:PRT
<211>长度:171
序列名:SEQ ID 211:GDC_HINF_1660491
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LTKRKNVSFT YENYTVTPFW DTLKLSYSQQ RITTRARTED YCDGNEKCDS YKNPLGLQLK
60
EGKVVDRNGD PVELKLVEDE QGQKRHQVVD KYNNPFSVAS GTNNDAFVGK QLSPSEFWLD
120
CSTFNCDKPV RVYKYQYSNQ EPESKEVELN RTMEINGKKF ATYESNNYRD RYHMILPNSK
180
GYLPLDYKER DLNTKTKQIN LDLTKAFTLF EIENELSYGG VYAKTTKEMV NKAGYYGRNP
240
TWWAERTLGK SLLNGLRTCK EDSSYNGLLC PRHEPKTSFL IPVETTTKSL YFADNIKLHN
300
MLSVDLGYRY DDIKYQPEYI PGVTPKIADD MVRELFVPLP PANGKDWQGN PVYTPEQIRK
360
NAEENIAYIA QEKRFKKHSY SLGATFDPLN FLRVQVKYSK GFRTPTSDEL YFTFKHPDFT
420
ILPNPNMKPE EAKNQEIALT FHHDWGFFST NVFQTKYRQF IDLAYLGSRN LSNSVGGQAQ
480
ARDFQVYQNV NVDRAKVKGV EINSRLNIGY FFEKLDGFNV SYKFTYQRGR LDGNRPMNAI
540
QPKTSVIGLG YDHKEQRFGA DLYVTHVSAK KAKDTYNMFY KEQGYKDSAV RWRSDDYTLV
600
DFVTYIKPVK NVTLQFGVYN LTDRKYLTWE SARSIKPFGT SNLINQGTGA GINRFYSPGR
660
NYKLSAEITF
670
<212>类型:PRT
<211>长度:670
序列名:SEQ ID 212:GDC_HINF_1807963
序列描述:
序列
<213>生物名:流感嗜血菌(Haemophilus influenzae)
<400>前序列链:
LRERSSLSAL MAKTIEWDFI TENPLKYLEK PKAPAPRTRR YNEHEIERLI FVSGYDVEHI
60
EPPKTLQNCT GAAFLFAIET AMRAGEIASL TWNNINFEKR TTFLPITKNG HSRTVPLSVK
120
AIEILQHLTS VKTESDPRVF QMEARQLDHN FRKLKKMEGL ENANLHFHDT RRERLAEKVD
180
VMVLAKISGH RDLSILQNTY YAPDMAEGYK TKAGYDLTPT KGLSQRNFFF FNENFIVFTT
240
NPPIVIKL
248
<212>类型:PRT
<211>长度:248
序列名:SEQ ID 213:GDC_HINF_1817220
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MATIIKNGKR WHAQVRKFGV SKSAIFLTQA DAKKWAEMLE KQLESGKYNE IPDITLDELI
60
DKYLKEVTVT KRGKREERIR LLRLSRTPLA AISLQEIGKA HFREW
105
<212>类型:PRT
<211>长度:105
序列名:SEQ ID 214:GDC_HPYL_51094
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MEAVQLDKNQ EPNYKGYSGS LIHPAFQQQT TKREKPSTPL PSLDLLLKYP PNEQRITPDE
60
IMETSQRIEQ QLRNFNVKAS VKDVLVGPVV TRYELELQPG VKASKVTSID TDLARALMFR
120
SIRVAEVIPG KPYIGIETPN LHRQMVPLRD VLDSNEFRDS KATLPIALGK DISGKPVIVD
180
LAKMPHLLVA GSTGSGKSVG VNTMILSLLY RVQPEDVKFI MIDPKVVELS VYNDIPHLLT
240
PVVTDMKKAA NALRWCVDEM ERRYQLLSAL RVRNIEGFNE KIDEYEAMGM PVPNPIWRLG
300
DTMDAMPPAL KKLSYIVVIV DEFADLMMVA GKQIEELIAR LAQKARAIGI HLILATQRPS
360
VDVITGLIKA NIPSRIAFTV ASKIDSRTIL DQGGAEALLG RGDMLYSGQG SSDLIRVHGA
420
YMSDDEVINI ADDWRARGKP DYIDGILESA DDEESSEKGI SSGGELDPLF DEVMDFVINT
480
GTTSVSSIQR KFSVGFNRAA RIMDQMEEQG IVSPMQNGKR EILSHRPEY
529
<212>类型:PRT
<211>长度:529
序列名:SEQ ID 215:GDC_HPYL_155367
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MNKIFKVIWN VVTQTWVVVS ELTRAHTKRT SATVATAVLA TVLSATVQAI NDAGTFVKVQ
60
STEDDIEDSA ATKDDNKNQA LKAGDTLTLK AGKNLKAKLD QGGKSVTFAL AKDLDVKTAK
120
VSDTLTIGGN TPAAGGATPK VSITSTADGL KLAKGTNGDT AVHLNGLAST LPDVTTNTGA
180
STSVTFSPSD IEKTRAATIK DVLNAGWNIK GAKVAGGNTE NVDLVAGYDN VEFITGDKNT
240
LDVVLTAKEN GKTTEVKFTP KTSVIKDNNG KLLTGKQLKD ANTGTATNAT EDTDEAMA
298
<212>类型:PRT
<211>长度:298
序列名:SEQ ID 216:GDC_HPYL_447632
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
VMSRHRGAKH RRRYELLGGI SLLSPEYLLS VERWPFHSEP PDHYDLLSYL LDLSVSQLSL
60
LIPLH
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 217:GDC_HPYL_506250
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MFAVHAAMIT TLKKEVFFLY LYIKSLKIPI PTTLKYMISL GKIRELDVLA NLAKLCPTCH
60
RALKKGSSEE EFQKRLIRNI LNRNKDNLEF AQLRFETDDF STLIDRICES LK
112
<212>类型:PRT
<211>长度:112
序列名:SEQ ID 218:GDC_HPYL_583607
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MIKQTLIILA PFFIATLLYF LGAPDGLRPN AWLYFCIFMG MIIGLILEPV PSGLIALSAL
60
VLCIALKIGA SDKVASANKA ISWGLSGYAN KTVWLVFVAF ILGLGYEKSL LGKRIALLLI
120
RFLGQTPLGL GYAIGLSELC LAPFIPSNSA RSGGILYPIV SSIPPLMGST FNNNPDKIGA
180
YLMWVALAST CITSSMFLTA LAPNPLAMEI AAKMGVNEIS WFSWFLAFLP CGVVLILLVP
240
LLAYKTCKPT LKGSKEVSLW AKKRN
265
<212>类型:PRT
<211>长度:265
序列名:SEQ ID 219:GDC_HPYL_583883
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL
60
VPLHSTCDFQ PQ
72
<212>类型:PRT
<211>长度:72
序列名:SEQ ID 220:GDC_HPYL_665045
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
VQLHCHNLPC VSIDILLGGP PCQSYSTLGK RKMDEKANLF KEYLRLLDLV KPKIFVFENV
60
VGLMSMQKGQ LFKQICNAFK ERDYILEHAI LNALDYGVPQ MRERVILVGV LKSFKQKFYF
120
PKPIKTHFSL KDALGDLPPI QSGENGDALG YLKNADNVFL EFVRNSKELS EHSSPKNNEK
180
LIKIMQTLKD GQSKDDLPES LRPKSGYINT YAKMWWEKPA PTITRNFSTP SSSRCIHPRD
240
SRALSIREGA RLQSFPDNYK FCGSGSAKRL QIGNAVPPLL SVALAQAVFD FLKG
294
<212>类型:PRT
<211>长度:294
序列名:SEQ ID 221:GDC_HPYL_953783
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
LMEFDVTIID ETGRATAPEI LIPALRTKKL ILIGDHNQLP PSIDRYLLEQ LESDDIQNLD
60
AIDRQLLEES FFENLYKYIP ESNKAMLNE
89
<212>类型:PRT
<211>长度:89
序列名:SEQ ID 222:GDC_HPYL_954679
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MPASIGSLVS QLFYKEKLKN GVIKNTSQFY DPKNIIRWIN VEGEHQLEKT SSYNKNQVQK
60
IIELLEQINR VLNQRKIRKT IGIITPYNAQ KRCLRSEVEK YGFKNFDELK IDTVDAFQGE
120
KADIIIYSTV KTYGNLSFLI DSKRLNVAIS RAKENLIFVG KKSFFENLRS DEKNIFSAIL
180
QVCR
184
<212>类型:PRT
<211>长度:184
序列名:SEQ ID 223:GDC_HPYL_954846
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
LIIETQQDPK ELPESCKITP QKISFNQVVF KKIKRKLNRF IGSILARTEV YKNLVAKYDE
60
LTGKYESLLA KEANIKETFW ERRADSEKEA FFLEHFYLTS VYVASTAGYY ITPKGAKTFI
120
EATERFKIIE PVDMFINNPT YHDVANFTYL PCPVSLNKHA FNSTIQNAKK PDISLKPPRK
180
SYFDNLFYDQ LNTRKCLKAF HKYSRRYAPL KTPKEV
216
<212>类型:PRT
<211>长度:216
序列名:SEQ ID 224:GDC_HPYL_955261
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
LMEILVLNLG SSSIKFKLFD MKENKPLASG LAEKIGEEIG QLKIKSHLHH NDQELKEKFV
60
IKDHASGLLM IRENLTKMGI IKDFNQIDAI GHRVVQGGDK FHAPVLVNEK VMQEIGNLSI
120
LAPLHNPANL AGIEFVQKAH PHIPQIAVFD TAFHATMPSY AYMYALPYEL YEKYQIRHYG
180
FHRTSHHYVA KEAAKFLNTA YEEFNAISLH LGNGSSAAAI QKGKSVDTSM GLTPLEGLIM
240
GTRCGDIDPT VVEYTAQCAN KSLEEVMKML NHESGLKGIC GDNEKHRSQK RKR
293
<212>类型:PRT
<211>长度:293
序列名:SEQ ID 225:GDC_HPYL_1068602
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
MPNSQVAGQA SVFIFPDLNA GNIAYKAVQR SAKAVAIGPI LQGLNKPIND LSRGALVEDI
60
INTVLISALQ AQD
73
<212>类型:PRT
<211>长度:73
序列名:SEQ ID 226:GDC_HPYL_1069456
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
VSLVSSVFLM CLDTQVLVFG DCAIIPNPSP KELAEIATTS AQTAKQFNIA PKVALLSYAT
60
GDSAQGEMID KINEALTIAQ KLDPQLEIDG PLQFDASIDK SVAKKKCDTA KWLGKLAFLF
120
SRI
123
<212>类型:PRT
<211>长度:123
序列名:SEQ ID 227:GDC_HPYL_1376803
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
LKAAHRLNLM GAVGLILLGD KEAINSKNLN LNLENVEIID PNTSHYREEF AKSLYELRKS
6Q
KGLSEQEAKQ LVLDKTYFAT MLVHSGYVHA MVSGVNHS
98
<212>类型:PRT
<211>长度:98
序列名:SEQ ID 228:GDC_HPYL_1474291
序列描述:
序列
<213>生物名:幽门螺杆菌(Helicobactor pylori)-26695
<400>前序列链:
VKQISISCSH RKYFVSFSVE YEQDITPIKN TKNGVGLDLN ILDIACSCEI NNHDKLTDFK
60
QYQTDMKELL GIEIDEELDT KRLIPTYSKL YSLKKYSKKF KRLQRKQSRR VLKSKQNKTK
120
LGGNFYKTQK KLNQAFDKSS HQKTDRYHKI TSELSKQFEL IVVEDLQVKN MTKRAKLKNV
180
KQKSGLNQSI LNASFYQIIS FLDYKQQHNG KLLVKVPPQY TSKTCHCCGN INHKLKLNHR
240
QYWCLECGYR EHRDINAANN ILSKGLSLFG VGNIHADFKE QSLSC
285
<212>类型:PRT
<211>长度:285
序列名:SEQ ID 229:GDC_HPYL_1600102
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MKVNKGFKFR LYPTKEQQDK LQHCFFVYNQ AYNIGLNELQ EQYETNKDSP PKERKYKKSS
60
ELDNAIKQCL RARDLPFSAV IAQQARMNVE RALKDAFKVK NRGFPKFKNS KSAKQSFSWN
120
NQGFSIKESD DECFKTFTLM KMPLLMRMHR DFPLILK
157
<212>类型:PRT
<211>长度:157
序列名:SEQ ID 230:GDC_MTUB_26830
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LIFITHFSTE PLPLPILVSK GLAVKGLSGN TLIHTLPALL MCLVMATLAD SIWRESILPC
60
SMALIAISPN AMELPRWAFP RLRPFICFLY FVLFGINMII ASLFCFF
107
<212>类型:PRT
<211>长度:107
序列名:SEQ ID 231:GDC_MTUB_36276
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSRHRGAKPP RRCELLGEIS LLSPGYLLSF ERWPFHTEPP DHYDRLSSLL DLYVLQSGWL
60
VPLHSTCDFQ PQ
72
<212>类型:PRT
<211>长度:72
序列名:SEQ ID 232:GDC_MTUB_76032
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LNAAFKERRF ILVQLDEKID PKEDKSAYDF CLNTLKSPSP SIFDITEERI KRAGAKIKEA
60
CAHLDVGFRA FEIIDDETHA NDKNLSQAHQ KDLFAYSNLD RMETQTILIK LLGCEGLELT
120
TPITCLIENA LYLALNTAFI VGDIEMSEVL ENLKDKGVEK ISMYMPAISN DNLCLELGSN
180
LLDLKLESGD LKIRG
195
<212>类型:PRT
<211>长度:195
序列名:SEQ ID 233:GDC_MTUB_80423
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MYIRFYRDSL AEPATDIYAF AYVSFNKEAG TWHTPAQPTR NYGSGTPMTT AATAPLRHAP
60
MSGRPPKRGS NACAGARSYS SAGVLNTRSS IGWSTAYGPA SSFPAASTES ANSSRQPTTC
120
CVGLPAARSI PGSSRTMRLC WPATKDSRSP RCPGSWCTCR SHRLAHNRPL DARSASPAVA
180
KPSVIRLGSR VRRRSGSPDH LPSARICVSS RRSPRRLLWC YRRPLARCSE STIR
234
<212>类型:PRT
<211>长度:234
序列名:SEQ ID 234:GDC_MTUB_167239
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LMFCASRKEM AMSNSSSSSV INWNSLSESK PRSSTSTWFA VMPRSVRKIR WMVALMASFI
60
ARLLAGSGPR QGRQTRARPG RGQIVGGRLG SWCGIPNAP PARLGGPPGSH TPRSASAADS
120
PHAPRSGCPG SPARSRFRDT RPDSPAVPGR WPCTRPRPAP EPAGRVHAD
169
<212>类型:PRT
<211>长度:169
序列名:SEQ ID 235:GDC_MTUB_214625
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VPPPIPRCAA ASTSDPMASV KYGATRRWWP PAPSLTTSSC SAACGLCPKS SPGSSIPSDE
60
PDSTATVGQH STMLTATLMA SPPAEVSLYL VCMSAPVARM VSMTWSRVTR WMPSPRNAIR
120
AALMALPAEI ALRSMQGICT SPAMGSQVRP RLCSMAISAA FSTCRGVPPR ISANPAAAMA
180
AAEPTSP
187
<212>类型:PRT
<211>长度:187
序列名:SEQ ID 236:GDC_MTUB_424142
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MIPMDVIFGC PLYANFCKPS VVRKTLGILA SAVEFGTMPT TRNLRAPTST VSPRCRPIVL
60
DAATSSGFDG DRPSETRGMP GPCSGAPKTV TFRVDVPSFM IVPTLPNGAA AMTPGSAATR
120
ARSTSGNGIE PRKGPAAPDL TTNTSTPMES TVCRASTRKP FASPVKTSVI PKISPVLMIV
180
MTRRRFLHCM SRRAAKSIPR GYQRGALVGP GLDVLWSGRG PLVVEEAFGV VVVVGVGTAV
240
EVGWRDPFRL AVGPFPCLPA FPD
263
<212>类型:PRT
<211>长度:263
序列名:SEQ ID 237:GDC_MTUB_459316
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSRAIRTKPK SASSRGSAGY RVYLGQRLGV AVFAQRDDHP VTGLEDADER AVISGPVGAH
60
TVAMPLDHYR FTLVDAADEF DVDLEDLLAP LDCSPKRLLV QFRTGDDAPV GEVVAEQREA
120
FVEISALAEA LQEHPGQFGL RVVERRHHIA ILSRETACGQ LTWSSKRWSP SRGRPASRTP
180
WRRCVAVSRI HAFGSPVTAL SGGPACCPPG RSPRGSAVLG ATPPVAWRGA AVPRSLSTWR
240
PPCWAPPTTP AISCRCIRPW PPRTAGCRTC AWAAPARCWK P
281
<212>类型:PRT
<211>长度:281
序列名:SEQ ID 238:GDC_MTUB_549643
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VRPGHRQVDG CRRGQPLCGA HERVGLVRVV GAFGLAQQGC DAGQHLVVGH GAKTSGGLRQ
60
VGSAYNRSVS QATTSSSTWL RSGSLNTSWY SPGYSFSCTS ADPTHSTRRR LPSMGISRSS
120
VPCSTSSGAV NAGARRGMVS PTCSSARPIP AGTRPWCTSG SVL
163
<212>类型:PRT
<211>长度:163
序列名:SEQ ID 239:GDC_MTUB_566823
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VCKACLGHHT HHHRTSRPLR NRCQHDQPRP AHRHGFHPNP RFRRQRHRGR VPLRLRLAAE
60
PGILQLDHNP VVGLLQLRRR WRIGLPQRRR SRRVGPGKRL HRDFGLLQCW RRRNSGFQNF
120
GNLLSGWANL GNTVSGFYNT SMLDLATQAL ISGFGNHGAR LSGILNNGSG P
171
<212>类型:PRT
<211>长度:171
序列名:SEQ ID 240:GDC_MTUB_591109
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VLSLSAGGPE PRMRPGHNPV TFHAEQTRNR TARTSRVRFR VCSSDKSAQD QRVGVGADVD
60
RHGIAVVHLA GQQHLGQLVT DGLLHQPAQR PRPVHRVESA LRQPALGRQR DLQLQPPLRQ
120
PLAQLRQLDV DDAHQLFGVE TLKDEHVVEP VDELRLERSA HRGQHLLGAA TRPQVGRQDQ
180
DGVAEVDRAA VPVGEPALVE DLQQHVEHVR VRLLDLVEQH HRVGTPAHRL GQLTARLVSH
240
IAGRGADQPS HGVLLAVLAH VDADHRPLVV EQEVGQRLGQ LGLADTGRAE EHERPGGPVG
300
VGHPGPAAPH RIRDCGNRGL LPDDPLAQLV FHAQQLGGLA FQQPTGRDAG PRRHHVGDVV
360
GTDLLLEHHL LPGLRLRQRR VELLLHLGDA SVAQLGGLGQ VAVAFGPLGF PAQGFQLLLE
420
VADDFDRVLL VLPAGGELGQ LLFLVGQLGA QLGQPLRRRL VFFFGQRHLF DLQPAHQPLD
480
LVDLDGPRVD LHPQPAGRLV DQVDGLVGQE AGGDIPVAQS GSCHQRRVGD AHPVVHLVAV
540
FEPAQDADGV LHRRLADVHL LETALERGVL LDVLAVFVQR GRPDQP
586
<212>类型:PRT
<211>长度:586
序列名:SEQ ID 241:GDC_MTUB_663028
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LLADFDVGQH LFQLVVGGLG TQHGFGVQRV ALPDRLGPDR RQLQELVVDV GLDQTARRAG
60
AHLALVEGEH GEAFQRLVAE VVVGGQHVGE EDVGALAAEF QGDRDQVVRG VLHDQPPRGG
120
FPGERDLGDA VAGGQRLAGL GAESVDHVDH PGRQQITDQR HQVEHRSGCL LGGFEHRRVA
180
GRQRRRQLPG RHQDGEVPRN DLAHHAERLV EVVGHGVLVD LAQRALLGAN RRGEVPEVID
240
RQRDIGGQRF PDRFPVVPDL GHRQRGGVLV DAVGNHVEDR RPFGRCGLAP PRRRRVRGVE
300
RLVDVGRVGA RHLAERLAGH RRRVLEVAPM DRRDPLAPDE VLVPGFIGHQ RPGGTGTGKD
360
SHRIRLLVKI M
371
<212>类型:PRT
<211>长度:371
序列名:SEQ ID 242:GDC_MTUB_688806
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VYLPPKLIPR RIPAQVRPTM VAPQVPHVLS ITPNGRSGEV CPASGSTRPK LGVQPPAASG
60
WPLPTRPGPR FSRCHRRPTL PACARSSSAT GSTPKSDNPA NPAGTSSRGG RSSTTRRCWL
120
PAAIRAALKS RFSARPTDSG AVGRAGRPHP AQA
153
<212>类型:PRT
<211>长度:153
序列名:SEQ ID 243:GDC_MTUB_701762
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MTSTNGPSAR DTGFVEGQQA KTQLLTVAEV AALMRVSKMT VYRLVHNGEL PAVRVGRSFR
60
VHAKAVHDML ETSYFDAG
78
<212>类型:PRT
<211>长度:78
序列名:SEQ ID 244:GDC_MTUB_731710
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VAESVAIRGC LLRCGPRSRP RRRSRRSGIC ACRPRCSATS RPPCPRRSTC PPRRRSMTSA
60
PSMWPPGRQR SRASRCIATA AGKDRYCPTP RRNRYWRRLT RSSAAAVRAA PASSDGGSHG
120
ASRRRIAQNQ RF
132
<212>类型:PRT
<211>长度:132
序列名:SEQ ID 245:GDC_MTUB_772761
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LLHSSFGHLE GIQQPLIDEL AELDHVLGKL PDAYRIIGRA GGIYGDFFNF YLCDISLKVN
60
GLQPGGPVRT VKLFGQPTGR CTPQ
84
<212>类型:PRT
<211>长度:84
序列名:SEQ ID 246:GDC_MTUB_868821
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LLGALHQYPH TRIQPGAVAA HRDRQHPRPV FGDEALDAAG VLMRTHAADH RQSEVSTVGL
60
NAHRTRGERH AIGVAALLLE SREAHSLAVA LASTPLLPVP VRVDRARDPV GVGLFRAFRP
120
PHGASLGVDT HLVFHRVPAF PQYPKRRLRR LGAGRAPRLD IGFQLRDGPV VGLAAGAEMP
180
RQRVCLLGGR IECEPERLHT PAVGDLQTRH LRPPHDHRQR QPRRPAWPGS EQHVCHTTLR
240
TSRSESRSYP IPGHRQPRPS PPRPTPDPER PAQRGHTPNR TGRTDPDAQP QSA
293
<212>类型:PRT
<211>长度:293
序列名:SEQ ID 247:GDC_MTUB_890358
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MASSTDVRPK ITLACEVCKH RNYITKKNRR NDPDRLELKK FCPNCGKHQA HRETR
55
<212>类型:PRT
<211>长度:55
序列名:SEQ ID 248:GDC_MTUB_904043
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LVCAAAPGRR RPLGVGGQVE AGTESLAATG HQNDMHAWIQ IGTLHQSRQL QRGVCDDRVA
60
LLRPVEGDPR NPTGDLIGHR LQVVEIDRPD RVCHQRPLSL LPAHARGWAR DPDRPAWCRT
120
LRPTGRRAEW PETPRRRRDV RGAPTTIPAT PGRCLRQSCG LDNRSCQDRP AADAAFRRGR
180
PAWG PGLRCG PARQTAPRRM RAGLPWRARY LAR
213
<212>类型:PRT
<211>长度:213
序列名:SEQ ID 249:GDC_MTUB_1045383
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LGLVAPAGDG RAAKKRPAGR RGSDRRRRMR LRGVVRPTPA RRCHDLWGLH HRVHCHAVAA
60
HRLQNGTGRW STGASTSMRS TTVASAAARG SRPSTSAETT DPSTAQINVH TSSICAERPE
120
RSMASATASA R
131
<212>类型:PRT
<211>长度:131
序列名:SEQ ID 250:GDC_MTUB_1068100
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS
60
AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL
120
AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRI
180
TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS
240
RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR
298
<212>类型:PRT
<211>长度:298
序列名:SEQ ID 251:GDC_MTUB_1115707
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LRRRAAVPVG LHRRRSDRAG ATQRDRRRYR RWVHACRLCA AWRRDRRTSG PDRARSLRYL
60
CHRRRRRRGG QCAGSRPGQT RRRHHRDGLV GSAFQWVLAG PQGVAGDRPD ESGRSCGGVR
120
SHLGRRVIGA DSHLRQRLFG LGRRNPCPDV LPRHRRRARR QPATGHPAWP HRRGRPRHLD
180
TRAGIHHDCP ARPGQAHRDG EDVQHGCRHD RRRCPRRHDA RPGRPDRAAP GLLGIGNRLQ
240
RRKTRPAGKT GWAAPEILRT RPNRV
265
<212>类型:PRT
<211>长度:65
序列名:SEQ ID 252:GDC_MTUB_1124996
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VVAVRIEVVG HRVHHLAGHL EFRGFDLHLL VQHREVGVAD LIGPQQRVHH HHLSLAEILD
60
AQRRQPGLVA QREMHDRHPV GLGECLSQQH IRFRRLRIRL QKVAAVEHHR VHVGGGDELQ
120
HLDLPAAFFR QAGDVVVGDR HHLAVAGLVG PGKIAVVDHL ATRLADALVP DASVVLGVHL
180
VEPDVVVCGS AVHLDRHVHQ PEGDRTRPNG SHVSEYALIV RERNVTAKFH AIFDRDVTLA
240
TCVTDRLR
248
<212>类型:PRT
<211>长度:248
序列名:SEQ ID 253:GDC_MTUB_1138949
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LRSARVNPPA RSAASTPWYP SGSVTTAALG WFLAAARTIA GPPISICSTQ SSTLAPDSTV
60
WLNGYKLTTT SSKASIPSCS RAAACSDLRR SASSPACTRG CSVLTRPSST SGKPVSCSTG
120
VTGIPVSAMV LAVDPVEMIS TPAALRPCAR STSPVLSYTL ISARRIGRLP SSVLILWLPF
180
VPSSLFVRPP SRHGWPVRPP PLPTAVVR
208
<212>类型:PRT
<211>长度:208
序列名:SEQ ID 254:GDC_MTUB_1170285
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VRADPPTTAC NTRCTPSVCV PSMCGTSTTS MPPRSCVPEK VTLLQSFPGL GAGSGWDVST
60
AMTTNRLPLP SAETAAMLPC NPVGSWGPAA TCAQFAGSKL SPSGSLRAEK NPGSMALGVT
120
SVTVYSGPKP DFTSATLAMS PVEAVVELAP DEQPTSQHTD PTASTALRIV VNLPNAAPEL
180
RNVDTVLTSR SAANCGASGG RTDPGSVISR RPRSLAGLPG
220
<212>类型:PRT
<211>长度:220
序列名:SEQ ID 255:GDC_MTUB_1176592
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VGTAQERVRS RSGPVPHHAL RHLRGSPHRG TADPAGDAGV GRQNFGPARP GPKPAVVRRR
60
RCSADPRHSA AAAHRGISPL PAAATTRRQV SGPQRRESHL RSVDRGLRVA WDVERGDGIK
120
PGIVAAVAGQ QHGRIVHHMG AVRFVLLPVD RGPQRVVARG QAGQINANRL GDRRRCRLVA
180
AAIAALVGDQ RLQVHRCRQR PNHLSGGIHQ PVAGHPLFGG GSSAVVGPGD RDRRDLAR
238
<212>类型:PRT
<211>长度:238
序列名:SEQ ID 256:GDC_MTUB_1202653
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSISGIERWS ATENIRISVI SSPQNSTRTG CSAVGAKMSR IPPRTANSPR RPTISTRVYA
60
SSTSRATTPS KGDSSPTVSV RGSIMPSCGV MGCSSERTEV TTTPSGGPSW ASSGWASRRS
120
AIRRVPTVST PGESRSCGSV SQDGNNATAS PNTPRSSAAR SSASRPVAVT TSNGPCRASA
180
LATNSRALAG AMSVNSSGRP PARCMSCWNV GALSANSTSP AIGVSEQAGP GAVMMRPF
238
<212>类型:PRT
<211>长度:238
序列名:SEQ ID 257:GDC_MTUB_1231843
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VLAFYLRPRP GTWCTSEGSS RDPSGGSLGG QCWGVGGLLL GGFFGAGQCC SGSGEDLEAQ
60
VAPSFDPFVV LFGEDGSDEA DDRGAVGEDA HDVGSASYLS VEAFLGVVGP DLAPDLLGEG
120
GERQQVGAGG VEVLGHRGEF VGQSVEYPII LGNN
154
<212>类型:PRT
<211>长度:154
序列名:SEQ ID 258:GDC_MTUB_1241031
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LTTAGISGSK GRTGTGEPCG LLSAAGFRAG ASGGLTAAER STARASSANL TRRYLTHAEL
60
LMLARATGRF ETLTLVLGYC GLRRFTVR
88
<212>类型:PRT
<211>长度:88
序列名:SEQ ID 259:GDC_MTUB_1252888
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MGQCPRPVRH WPPAVIVCSR TKLRRACLRD YRRPAPSDKK PNKSYRVMTP TGLPSSTTIN
60
ASQSRNALPA ALTNSPAPII RSGGLMCADT ASANLARPSN TAESSSRSET LPATSPAITG
120
GSAPTTGICD TPYSRRIPMA SRTVSDGWVC TRAGSAPDLR RNTSPTVDCS VDPSRRLRRN
180
P
1
<212>类型:PRT
<211>长度:181
序列名:SEQ ID 260:GDC_MTUB_1264312
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LAAIPRRSRC SVNPRGNRHD PARHPGGRGS VRGGDRPELT GDIGLRPGEG SARRGLRPRQ
60
AGNRPVRCAQ VHEVPTAAIL SASSEVFNEV PVRNPGTLAF VPIVDGDLLP DYPVKLAQEG
120
RSHPVPLIIG TNKHESALFR LMRSPLMPIT PRDHVDVHPD CRRTARSASA NRGADRLRVL
180
AMAAQSTLIE YGYRRRLPDA VGVAR
205
<212>类型:PRT
<211>长度:205
序列名:SEQ ID 261:GDC_MTUB_1286282
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VLALRPQRHF TQSRSARRLR CVLDDDVWVP WARSGGCRTA TRHLSVRCIA GTCWGPPVRF
60
CRLRATPSTV SCSARRRYRS RLTCHRSTDT SWSLSATRLA ELLAPLEPVT VTFTPTFGEP
120
DMVHLSGTKF GGLVPALFEG VRAGF
145
<212>类型:PRT
<211>长度:145
序列名:SEQ ID 262:GDC_MTUB_1301742
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MTSSAPKPAA SRASDWPTTS PAPSCSPTAN STVPQSSYAM TSTCWAAGSE WASKPSATGS
60
PHCSARGSEG YRSSSSAPTR PETSQSDSPR RRFTSAGSAA AARCGWSTTR SPSQRGSSAR
120
WRKCPTAGRT SGWPRPPLPT GSGIWARTRT SRSGWAATSR TPINSSTPPV SSWTTRARRS
180
RSGRAARSAT ERRAPNVRSP ISVVASRSTR TRAAACLIRR PSNRFDRPTP QQTTKPLILL
240
WFQQALGKHC CRCLHIAFSH VFHSGGDHGG LRVIGYRAVP RAGADL
286
<212>类型:PRT
<211>长度:286
序列名:SEQ ID 263:GDC_MTUB_1351907
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MQLGNQNTMR FAGRPQRFRQ SAYPLFNPNS AIALGHPFGG SGARLMTTVL HHMPDKGIRY
60
GLQTMCEGRG QANATIVELL
80
<212>类型:PRT
<211>长度:80
序列名:SEQ ID 264:GDC_MTUB_1476279
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VTVYRRGMAV LTDEQVDAAL HDLNGWQRAG GVLRRSIKFP TFMAGIDAVR RVAERAEEVN
60
HHPDIDIRWR TVTFALVTHA VGGITENDIA MAHDIDAMFG A
101
<212>类型:PRT
<211>长度:101
序列名:SEQ ID 265:GDC_MTUB_1485311
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VGAVRLQPHR MGGGMAALHR HTGTADQLLL LPRRAHRAGS PVQCDRLRGR DSHFQPGTNQ
60
YRNGHRGIDQ PIHQHRDQLD TRLPAAVAAN QPAGIPVFAL TSD
103
<212>类型:PRT
<211>长度:103
序列名:SEQ ID 266:GDC_MTUB_1486309
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MPSPVSSGPT SHGTNKGCGL IRSESMNTTM SPLVAASERH NASPLPGRTG TSGNACSRLT
60
TRAPEAMARI SVSSVEPESS TINSSTRPST SGEMLSITDS MVASSLRAGS TTEIVRPAFA
120
ASNSPIVQPG RCQVVSKGSA PGALPPARSP ATSSDAVMRV LSPCASAAGP PESMPPFPAP
180
AGWRRPHAPE TCAPRRPQPT RWLPAFPQAV RSNPRPESPR QRPCCSKPSA RATRS
235
<212>类型:PRT
<211>长度:235
序列名:SEQ ID 267:GDC_MTUB_1515112
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MLSAVILTER GYPAVPLAGQ LVHQRFVRPG PLVLGTGFLK FLTRAADRDR TVSRRSKPSS
60
RAALMGEQPN PWDLLQPQDA TSRHRGAKPS RRYGLLGKIS LLSPGYLLSV ERHPFHSGVP
120
DH
122
<212>类型:PRT
<211>长度:122
序列名:SEQ ID 268:GDC_MTUB_1515464
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LVGRSRVLVL FGAGEHVDVV ALLGERAHRL IGEHVVQTVV GHVVQNRNVA VLVTRPAIHQ
60
QVGRLRHRLL TAGHHHVELS GPNELISQRD CVDAGQAHLV DRQRRDIPTD AGRHCRLPCG
120
HLPGTRGQHL AHDHVLDQGR RHVGLLQGAL NGDGTQLAGA EILQGAHQLA DGCTRASNNH
180
RCRYDYLLSA PESRSDRPGE ADSFPSGYRC VMTTDQVHAR HMLATSLVTG LDHVGIAVAD
240
LDVAIEWYHD HLGMILVHEE INDDQGIREA LLAVPGSAAQ IQLMAPLDES SVIAKFLDKR
300
GPGIQQLACR VSDLDAMCRR LRSQGVRKVY ETARRGTANS RINFIHPKDA GGVLIELVEP
360
AP
362
<212>类型:PRT
<211>长度:362
序列名:SEQ ID 269:GDC_MTUB_1596569
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LRAATKSPSS SCWRACATAG STSVDSSELA APLSFPAVAD NRESTQRLSW SAGWRPWKLE
60
IGCPAAKATT VGTAWTPNIC ATLGATSTLT DASDHLPLAA AAKPDSVSSK STHTSLRGDH
120
SNTTTGTSSD RTITSSSKFA SVISVTPDGV DSARSASVLA AAFCWARCLM PERSTAPAMA
180
GPSGGRGRVT PSSLSCRCGH RSTRWRRPCG RSRHTAIGWY DQDHTGRHRP LNRYPARNIS
240
ASPCPPAPHN AATPTPDPRR ANCSAACSVI RVPDMPRGCP TAIAPPLTLT IWGFSPSSRI
300
EANATAANAS LISTTSSWST EMPSRSSALL IALAGCDCSV ESGPATTPWA PISASQVSPS
360
SWAFSWFMTT TAAAPSEICD ADPAVMVPSP RNAGFRPASA AAVVLARIPS SSVNCSGSPV
420
RCGMFTGITS SANTPSFHAA AAFWWDAAAY SSCSERVNMS TSLRCSVSAP IG
472
<212>类型:PRT
<211>长度:472
序列名:SEQ ID 270:GDC_MTUB_1600905
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VRSRRLAPTR PRSRRTASPA TATRAAAPPR TTPPSAAPAT RCPPLARQRN KTRAAQSRLA
60
WRGGRSEQGL SRCGSSGAVL RCGDRHPAAL AGVPQPAVAS ARGKQLLVGA AFDDPTMIEH
120
DDLVGPGDGM QSMGDYQHGA VPGQPVKRLL HKVFRFRIGK RGGLVEDEDR SVAEDGTGNG
180
EPLSLPARKT TVGSEHGIVA VRQPKHPVVD LRFAGRDLDL FGGGIRYRQR DVFGGGAMHK
240
LGFL
244
<212>类型:PRT
<211>长度:244
序列名:SEQ ID 271:GDC_MTUB_1616064
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VSAVLALSAA VSARRAKAAE AHSAPSSNGT PASAATPSCQ EIGNRASAIT AGSRIALVNG
60
VTRLTTRPTS SGPVAAIACR AVAVFSAVNQ SNRTTGSRSA TSCWVWLRTA KPSSIPMRAV
120
TASSTHPATV AADSQPSHSH ARCGASPNNA AISGTSNTVP TARATTEQNA SSAKPISLAR
180
WSFGTRAIQV RIIGCRPALR RPPPGCPGRC PTAGSSVRPR QATPRGCRVR RSDHDRARRS
240
GRPG
244
<212>类型:PRT
<211>长度:244
序列名:SEQ ID 272:GDC_MTUB_1672449
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MPSVIRDPDP GAAPAPTVAD RSAEVPSVLQ RSRRCDAYHR YSRWRLSYSA SPLGGSRRQP
60
GIATDGRTRG TQPRPAGAAH SRARPDVGRS VAATRPPSAG SAGTARP
107
<212>类型:PRT
<211>长度:107
序列名:SEQ ID 273:GDC_MTUB_1673708
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VLRPIRAGQP GRHLAPPRPA TRRQGTGAGT GARRRLGTGV APPAGVSVDE PSGCARLGMR
60
VAELPGVAAP HLARPHCRRE ARAGVGQGKH RRLRRGSEFR CHQRRFGRRP SVRPGGVDPQ
120
RSAISARVRT GRHLGGGSGS GIRALRLVYD RCAGASGIRR VARNVRGETE IQHAPRHLRR
180
CLTDPPCAGR RPTVLRSARP PRLPDPRGRS PCVRRGTAGG VEVARRLRGP APRPTRLRRL
240
RLPAGASHRR GRGPLPVLGV RDQPAGHVVS YRPAIAIPRH APARPVPVRW HRPSRRCRWP
300
PRVWS PGRNP DNPGRRSR
318
<212>类型:PRT
<211>长度:318
序列名:SEQ ID 274:GDC_MTUB_1699549
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MTASRRSDHT DATRRALVDA GRYLFARRDY GDVSIEDIVT RARVTRGALD YHFDSKKDLF
60
QTVLEVVEAD LVADVEAAIA KVTDAWICWS SASTPSLTRR PNRMRCRSLR LTARQCSGGA
120
NGAGSTCARA WSAGRGSRTR DGRRGDSART VATTFASAAG RANRIRAADR GRDGQRPDQS
180
RGRTRIYGPT RRSTGVARPR SATATDHRPQ SRPASRNAPR PATPRRPGHH RRHPGPRCRR
240
RFWRSPSRRR APAPYRQSSA RPTRPTLFGS PHTPPGRRRR WPPARCRSPR PVRRR
295
<212>类型:PRT
<211>长度:295
序列名:SEQ ID 275:GDC_MTUB_1742061
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VRLRSESAGL AHAADDVSGV VLGDDPDHDP PVAVLDFLVP EDVFPVVVAT GQMVVAVILG
60
RDLDVLPAHI QMGFRPAPFV AHRDLRLGAR KAGADQQQAQ PGFLGGLGTA VDEVQSGSCG
120
LHATAAPIAL DQRLDVGHLQ IGGLYQGVDG RDGGVQWKST GQVERRSLRC GHAHALDDAD
180
LVGLDALFPD LQPRGTAAVG VDDRGGKIRV DPLGAMEGRS RVAGQHAAAA RAQPQRFCTQ
240
LRGQFHTLRH VHVFM
255
<212>类型:PRT
<211>长度:255
序列名:SEQ ID 276:GDC_MTUB_1782153
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LGVRAAVGVD DVTRGRRQPV RQQRAHRLGD RRRILHVPAD RSALIPALLE QLDLGAGLLA
60
ERTADDRTHR QRPDRACGNE IRTHTVLAGL ARHEPVDRLQ RALGDRHPVV GRHRPARVEV
120
HADDGTSGVH DRQQRLGHRS IRIRRDVDAL GHIRVGRVEE RVDAHPGLRH EPNRMHHPVE
180
LVARPDRLGH PAGQAGQVLL VLHVEFEQRG LCRQPVGDAL NQPQPVEPGE HQLGALLLGY
240
PCDVKRDRRV GDDSANQNPF AVQQSCHVRP CVVSVAHTHA AVDRDDRTGD IARILGSQEA
300
DHPGDLGGGA DPLRWDKLQR PLLNPLIQRA GHIGVDVARG HHIRGHVCLR QLAGDRAGHA
360
NHSGLGGCVV GLVADAPAAG DRTYEYHSTE FVALHAARCP LSHPERPGEV GVDDLLELFL
420
GHPHEECVRG
430
<212>类型:PRT
<211>长度:430
序列名:SEQ ID 277:GDC_MTUB_2060659
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MVPSMRVRSD WEPIAQSRSR LAVTAPRNTS GGRFIWILLG SARNGSRAPW LPTRSPGSLD
60
RIFLVATDNR TSLPKGRWAP TSRMNPQPRP DVMPWRRATG RSGNPVKRAL ITGITGPDGS
120
YLAKLPLKGY VAAGSPAEVY FCWATRNYRE LYGLLAVNSI WFNHESPRHG ETFMTRNPAP
180
YRGRQRGADR CADADAPAHP DRYQYWGVPA SVRGVIDRAM GVCVE
225
<212>类型:PRT
<211>长度:225
序列名:SEQ ID 278:GDC_MTUB_2093062
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LSGQPSALRR PTVSPSACRR PTVSKSKPKI DRMTSRMAPP TTDGSATLNT GHQPTDKKST
60
TCPRSGPGAR KKRSTRLPMA PPRIIPRPSA HHGDTSRRPI QKIPTTTPVA ISVKTQVYPV
120
AIEKAAPELR TRVQVTVSPI IDTGWPGGNS WTATTLVTMS SVSTTTATDS SMRSRRGGAG
180
ALGSPAPPAS SVEVSGSADP VGSSGTPSSS PRADMARPDP AAGWEQTTCA MIPSWPASPS
240
SLLEGQSRPP PAPMGCYGQP IAGRR
265
<212>类型:PRT
<211>长度:265
序列名:SEQ ID 279:GDC_MTUB_2105797
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VPPNRPERRL GKPLTAPLRR APAHPLRDGP GSVGNPPKTS RRHQLLRSPK PRRRPGCPQS
60
RTPRTSREAP PATQRPGPPG SGFERRERPA ASICGRARRW SAEKRQERTF PGTRRRSRGR
120
WSPRCRARWC RARFGLRQTA ARPCGKGCYS KFGHHLADAR NARNRLWRMA AAIRVPAAPR
180
RLPGVSGCRD AKLDCITHKR SSPVRGKRVE PVAVVARRHR QSLLGGRGQA KLGGQAQQMH
240
ARRLRNRHRR VPVHDTGFR
259
<212>类型:PRT
<211>长度:259
序列名:SEQ ID 280:GDC_MTUB_2133554
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LWKWKPRLAF HRATWRRRWT ATTPTPRAAQ IPISTSSRNS LQHKTTGRGG RSTCRWARRC
60
MPDSLWAGWP RRWTVKYCAT TARWWPACTR SGHARPISPR TARDMPAGPS WVRGRFSGVA
120
PERMRQPERR ACKPPRAATG NPATRHADKA S
151
<212>类型:PRT
<211>长度:151
序列名:SEQ ID 281:GDC_MTUB_2183418
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LWPRISAAPS NRRSTVGGVW CRRRPNWVSR PRDSRRPCRI TTRCAPRGCP LHSPRPSATS
60
SAHTPTAGST NQASSTHYGV QTAPKYRCSG LELKGGKGVS DEISRRAPTR VRPDIQRRVH
120
RSEPIRGRVA LRRRFVHRRR LGHHHSGSGR QYDRGSRAAD GRDGRPPRWH RNPAAGSADP
180
GGKADGGVRQ KPGPGARHPS DAGTRRFGVR RHGAHPQART WRRGGHPRGS PDRIGARIVL
240
PGRGSLHPGA RYRRDGLCDR SSGNRATQDL RPAGARPGRR CGADRRRRHV GGSAKPHRGY
300
PRRYLHPGHR
310
<212>类型:PRT
<211>长度:310
序列名:SEQ ID 282:GDC_MTUB_2192571
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LGISPGDRGD RVRGNAAGRD RHPGRLAAFL GADHYSVFSN GPAVEREDRR GQHGAVRTAG
60
RPDGAGAGPQ PRTTGAVVTT ADPVTAGAAA GSRGYRVALR VRPARPDRAL PGGGRHQHRI
120
QYRGCGAGAD LCLAAVSGDF PRGCSPHRRS RLRGGGGDTW GAARHCLVAR DPAVAAPGRG
180
VRISTGVCPL ARRVWRDPNL CRFPARGHPY PSAGDLPAAG DRSGRGGGIV TAARCGSGTG
240
GAGCGCSYAD RDRYQVAGHE QAAAARGRRR PAFGRRILGV RGRGACSARA QRCGQVHRPA
300
CYRGAASPRR GLGTFGGPGV DRHRGRGECG DPRPSSRAAV ARPVVVSTPE RGQKRGLRTT
360
MPSRDVWVRA R
371
<212>类型:PRT
<211>长度:371
序列名:SEQ ID 283:GDC_MTUB_2234641
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LPTPVPARTG TPSRSANPGA TGRPTPETAN TADCSSSRPP GPHSAVSATQ QLPLGNNKSQ
60
LPIGFSPNRD WTRGRRAAPP LAFRSHCGRN PRRASSKSST RSFGQAFRQV FRADGWRRVR
120
SMTRSTYVFG SGHGRFGHSS HGSAAGQDLD IDRGCPQYRP VLAGNLRGRV A
171
<212>类型:PRT
<211>长度:171
序列名:SEQ ID 284:GDC_MTUB_2320829
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRRLRSSDPR CHRLHVGARP APVLPPGQDH RGAFREQRSK SCAARRTRGA CESLGAQRGQ
60
RRFVVGFLRD FRHQFRVGDV AVRADHHDCA GEQPGHRPVG DGHAVILAEA VPECRRGHDV
120
FGALGAAEAL LGERQILRDT QHGSATCRRT LVEGSHTRRA HRCVHGWKDV QQHGLTPELV
180
AADHPQIAPG QGEGRGRGSD SR
202
<212>类型:PRT
<211>长度:202
序列名:SEQ ID 285:GDC_MTUB_2321250
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LRGSGRTQIQ DHAAALSRHP RQRAVEFLAA AARRRAEHVA RQALDVDVQR HGHPGTDRTH
6Q
DDRQMLAEVV NVTKADDTRG AGPGGQRRCR KPDHLGLDPP AIRHQLPDRD HGQSVFDGEF
120
DRLGVVRHLD GIIGRDDLAE RGGRPPFRQA GQVDGRLGGS PPTQHTVGLR LHGHHMARTL
180
EIGGDGGGRS QCRDGPGAIA RRDSGAGAAN VDRHAMRGVS VTHGRQVQSL AFGARQRDAQ
240
ITRGVPDRKG NQPRRRGLGG EDEIAIAIGV AGQDHGVTAR HRRDRTTYPH IGRLHRDSNR
300
RNRLP
305
<212>类型:PRT
<211>长度:305
序列名:SEQ ID 286:GDC_MTUB_2487508
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MKTAISLPDE TFDRVSRRAS ELGMSRSEFF TKAAQRYLHE LDAQLLTGQI DRALESIHGT
60
DEAEALAVAN AYRVLETMDD EW
82
<212>类型:PRT
<211>长度:82
序列名:SEQ ID 287:GDC_MTUB_2567990
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSTSTTIRVS TQTRDRLAAQ ARERGISMSA LLTELAAQAE RQAIFRAERE ASHAETTTQA
60
VRDEDREWEG TVGDGLG
77
<212>类型:PRT
<211>长度:77
序列名:SEQ ID 288:GDC_MTUB_2577106
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VATSTSPAGG LPQARSQPTK CRCPADSTFS DRAASARTSA AECAQPGLPV QALMFSQGEF
60
SSNTRPSGAS TRSAASAVAS SRSQISTDRH GVITSGASIA ARHSATRAGK TPSGTAAPSV
120
TRLSSWGIQP TGVLVTGRTD GPSSTPDCSS PISANSVTRQ AVSRILTKRN ATSIRVSATS
180
ATRTPVSRPV NSSRGPSGNT CTPTSAPRPD TSARPSSRPN QNRPPSSASR GSARIAASSS
240
PTHARTSASP PARPDSGEAT ILRTRSCVAD GSSPALATAS ATAATSRIPR NWTLPRAVSS
300
SVAEPKSLAT LASVASCAAV IIPPGSRIRA SAPSAAWCGR NAPGQASASR VPATRPPYGR
360
MGRRLAALRS RREAEDQGQG VFDCAHRGGF EGAESLHESG TSDRADAAAH RDAIGSYTF
419
<212>类型:PRT
<211>长度:419
序列名:SEQ ID 289:GDC_MTUB_2577486
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MTGRVRQTGI TRLVVHQRGP VLPQRLMTVH AGPVVAEQRL GHERDRFAVL PGGVLDDVLV
60
QLHVVGGVQQ RIELVVDLGL SAAAHLVVAL LQDEAGVDQV GQHLVAQVDV LVVGGHWEIP
120
ALVADLVAPV GTAVGLGRRA GVPPPRDGVH LVEGAVGARV EAHRIENVEL GLGAEVCGVG
180
DASADQVVLG LAGDVARVAG VRLQGERVVH KEVDIQRLGR AERVDARRLG IGKKQHVGFV
240
DRLEPANRRA VKGQAVVKHA LVKGRSRNRE VLHDARQVTE PDVDIFDLLV LGKFEDVVGR
300
LFRHRMLLYC IRGRRYGADI ARQSTPCCAD VTDRAAHH
338
<212>类型:PRT
<211>长度:338
序列名:SEQ ID 290:GDC_MTUB_2690012
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VAGVCALFSG ASRWPSGELR HRPQGSRRGP SRLRCTFPRQ NVSSRRPGVP TVGADLTRRS
60
GGTGQPRGMG SPGPVGQTVP CHLRLSRPDT RASGRSADQA HSRRGGSAAR PHQGQPLHPG
120
GQRNRTRRTH ALLAAGNVTA TAADEGSAEW RWRWR
155
<212>类型:PRT
<211>长度:155
序列名:SEQ ID 291:GDC_MTUB_2698040
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MTDNECPADS RRRHVLRLAL FAGILLGLFY LVAVARVIHV DGVRSAIVVA TGPIAPLAYV
60
VVSAALGALF VPGPILAAGS GVLFGPLLDT FVTLPAFSAG AQAGMTPRRC WVSIAPIASM
120
HRSNGADCGR WSVSASSPAS RMRWPRTPSG RSEFRCGRWS LGRSSGRRHG CSSTPRWARR
180
SPTCRRRWFT RRSRCGA
197
<212>类型:PRT
<211>长度:197
序列名:SEQ ID 292:GDC_MTUB_2712275
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LWAVVGQRFV PGISDALASY TFGAFGVPLW QMVVGSFIGS APRVFVYTAL GASITNLSSP
60
LVYSAIAVWC VTAIIGAFAA RRWYRKWRAR PRRRCGLAQL TTGSQQRHTS HRTPAGVVMP
120
GSLSEHRRLR QEAPDRIEHH PPIE
144
<212>类型:PRT
<211>长度:144
序列名:SEQ ID 293:GDC_MTUB_2725593
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LSAVLPARCI RALADRVYRH VRCHGGCARN HHPRSRPGRI DYLGVHRGQR VPGAKGWIDI
60
RHFHTGRGDL DGRAAVVRQP LSGGEQYCSD DRVGGRHAVV DHLRVTGTAH DRLVERVSVL
120
DNGGGVCTGR DPWRHVLNSV APRTRHRIRP AVPRRRCRSR GSQDR
165
<212>类型:PRT
<211>长度:165
序列名:SEQ ID 294:GDC_MTUB_2733212
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VGPMNGFLSW WDGVELWLSG LPFALQALAV MPVVLALAYF TAALLDALLG RVIQLIRRAR
60
RPDQAPR
67
<212>类型:PRT
<211>长度:67
序列名:SEQ ID 295:GDC_MTUB_2828257
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MADDVSGAVY RAGTAHGRPT GRIEHRDRQV VTRRATDTRA ELDGLSDHQL AEVQRSRENH
60
YPAGCLVIPQ PLNRRPEHQP APPQRHWALA GGDRDQRGGA KCHGDWVAID RLGAQRDRKP
120
VPRAHHTDRD QAGADRTQSR SVPRPARHTP PQCAAAEGHH DAAQGTHVAD RPHDPGRRHN
180
PADQRRRDQA YVQTGRAEAH MAHRYQTRTR LRRLSSRAGP MPSTSASWST LVNLPLRCRH
240
ATIAAAVTGP MPGRASSCST VAVLRSSTSA VLGAVLGPVV AVPEVPAGPG VPAPTELPST
300
LGCPEGGASP TTICSPSPSC RAMFSPTVSA PSTAPPAACS ASAIRAPGAR VTSPGVCTRP
360
TTLTTTGRPE RSGEPGLADD LGFVGETGST GGSLADITGS VRSRIKVNTV TSTARAAITA
420
NATAPARPGS ARILSAQPCP REVSGSQRGS SEFGSSRGSS WSGPSSVGSC GSGSKCADAA
480
CESISGTAPS RLCSRSAGSS VRMGRPQLRG PPEPARTTAS RCPAVDQSEA VDKPLWRWIK
540
MGQTAPTSPN NQHRAATSIR TRLTAIESVL GNAIREC
577
<212>类型:PRT
<211>长度:577
序列名:SEQ ID 296:GDC_MTUB_2895354
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRGTAYATRR SMLPNTRAVW LATVVQCVTG GLGVTLIPQT AAAVETTRSR LELARFVAPA
60
RRDESVWCLA LSAAARSPTS VLPGLSAS
88
<212>类型:PRT
<211>长度:88
序列名:SEQ ID 297:GDC_MTUB_2983047
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRRVFSGWTT LVRCSTAATT VTIRAMTKHV PVIHSSEPTR PLTPRKPVDP VRRCCSQLRQ
60
PNPTTLKTAK SASAKSAAVV VRISGSPSVR SSGHEPLWRL ARRAASIAAA AGAQSPTPDT
120
KVASAPAAQA RRNARSRSAG EPGLRGQFAA RTPANTSPAP AVSTGVTVGA GTSNTPSAPT
180
YRAPRTPRVI TKCVGGDGQS FASCSLAITT SAIAAKSCKE LRSWPAGEAL TMTTASADWA
240
ARAAASAVAT GISNWVNSTS QLATAEGTGV RCALAPGATS TVFSALASTT IIAVPLGPGT
300
VTVLSSPTAL ARRWARSWAA AGSSPNAPEN CTCAPARAAA TAWLAPFPPG VRVNDAASTV
360
SPGRGSASTT NVRSMFTLPT THTRGAMGPT LVSLAFAMLA VG
402
<212>类型:PRT
<211>长度:402
序列名:SEQ ID 298:GDC_MTUB_3005316
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSASASADKV VCECCELCVP KQLASAIRNP YGLVRGWRCR ICNEHQGQPV KMAQDHEEEV
60
RIRWGETVDE LHAALDRAGP RPGTWCTSEG SSRDPSGGSL GGQCWGVGGL LLGGFFGAGQ
120
CCSGSGEDLE AQVAPSFDPF VVLFGEDGSD EADDRGAVGE DAHDVGSASY LSVEAFLGVV
180
GPDLAPDLLG EGGERQQVGA GGVEVLGHRG EFVGQSVEYP IILGNN
226
<212>类型:PRT
<211>长度:226
序列名:SEQ ID 299:GDC_MTUB_3048559
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VGSLTVFTSS ARMSRTAANT SARALHSMTT GSGGKSRMLN TIASPPPTSA SKRRSKTTLP
60
LDAKTKTSTA ETAAWLMNIK PCATNPRAHS TATDNAMNTT TPMAIGPEPS RACTPAPSTI
120
PSATPTIICW ARRARSTLVA DMHTTAEIGA KNACGWLNTS WVRYHARPAT TDVWVIGHST
180
VRNRWATARP PQAVLTSSEA LMNAYLFTLG CDVVTAKIWS CLLDPLGLGI YSGLLTLLSG
240
NGRRRVGERI DAAAGLRERD HLTDRVHPGQ QRGGPVPPER DSAVRRCAKH ERLQQESELF
300
LRLGLVQAHH REHPFLDITA VDTHRAATDL VAVADDVVRV GQHAAGIGFD AVLPFRFRRG
360
EGMVHRGPGP RADRDLTGGG RFVGRLEQRR VNDPDECPRI GVNQAQPVGD LDAGRAQQCP
420
RRFDRTGREE DAIAGFGPDM VGQSGALGLG QVFGHRTAQR AVFGDQHVGQ SAVAALLGPV
480
LPAVQRAPRL RRPARHHHRA HIRCLEDTKC GVGEEIRAFD ELQPEPQVGF VRTESAHRFG
540
IADPRDGRRN PVAYQRPQLG QNFLGDRDDV LGVDEAHLHI ELGEFGLAVG AEVLVAVAAG
600
DLVVAFHPRH HQQLLEQLRA LR
622
<212>类型:PRT
<211>长度:622
序列名:SEQ ID 300:GDC_MTUB_3065095
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VIGDFAEMLG GQDGVAELVQ HVAVHPFDGV DELVEADGVG GGCGLRHDVN SRLTLCIVST
60
VIGCVVGSAA LPGRCGQGGA DRGHQAGVGV AGDQRDPGQA AGDQVAEERQ PAGPVLGGGD
120
LDAQDLSVAL GVDAGGDQGV HPDDAACLAH LEHQGVGGEE GIRAGIERAG PKRLYGFVEL
180
FGHDRHLRLG KLCHTKCFDQ ALHPASGYSQ QVAGRHHAGQ CAFSSLAALQ QPVREIAALA
240
QLGDRDVDGC GTGVEITVAV AVALIGPLIA AFAVARPAQG VGFSPHQGGD ERREQPAQQI
300
RARLCELVSQ KLLGVDKMRR GHCVISFD
328
<212>类型:PRT
<211>长度:328
序列名:SEQ ID 301:GDC_MTUB_3100192
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LDEPAHRARP KGNGANHDGA QPCCGIGACG NRGDPRARAH LPLPKGGRAG GAWHGVHRRP
60
RRNLRASRSQ RRGQVHHPEA SHRAAARPRR PGHGVGQRAG RVGTRLLRAH RGLLRAAQPL
120
PKAHRV
126
<212>类型:PRT
<211>长度:126
序列名:SEQ ID 302:GDC_MTUB_3129118
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MIPQMTVSCP PPSTSEREEQ ARALCLRLLT ARSRTRAELA GQLAKRGYPE DIGNRVLDRL
60
AAVGLVDDTD FAEQWVQSRR ANAAKSKRAL AAELHAKGVD DDVITTVLGG IDAGAERGRA
120
EKLVRARLRR EVLIDDGTDE ARVSRRLVAM LARRGYGQTL ACEVVIAELA AERERRRV
178
<212>类型:PRT
<211>长度:178
序列名:SEQ ID 303:GDC_MTUB_3237815
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LVTTLAPILD SASMTPKTAS SLPGISDDDN TMRSPAVNVM LRCSPRDIRD NADIGSPWVP
60
VVINTTWSGA IVSAAAMSMR SESATRRKPS CLATRMLRTI DRPTNDTRRP NATAASMICC
120
TRSTLEAKHA TITRPSAPRM SRCSVGPTSL SDGPTPGISA FVESHSNRST FVSPSRDMPG
180
RSVGRPSGGN WSNLMSPVCR MVPAPVYTAM ANASGVEWLT AKYSHSNTPC RVLWPSRTST
240
NTGVMRYSRH FSATRAKVNF EPTTGMSGRS LSRNGIAPMW SSCPWVNTSA SMSSSRSSTW
300
RMSGRIRSTP GSSWPGNNTP QSIINSRPRC SKTVMLRPIS LMPPSAVTRN PPEVRGPGGG
360
RSTSTSGPPF GSPLDHRSTE AARMSAANAS ICSGVAATWG SRGSPTSMPC SRKPALDNVT
420
PPRRLIALHS GATAMLILRA VAISPEPKAD NNSRSCPAAR WAITLMKPVA PMASQGRLSA
480
SSPE
484
<212>类型:PRT
<211>长度:484
序列名:SEQ ID 304:GDC_MTUB_3283182
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSKRSDGPST GNAIRARHRI SVMTAQRSTS HATRTPVASS AQLGPPSSVE PTVRPGLAGL
60
VAVKRGREAA ARLPNNPETG CKSRDH
86
<212>类型:PRT
<211>长度:86
序列名:SEQ ID 305:GDC_MTUB_3289702
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VATKNAAWPS STSCSNYSPN ATIESQRPDG CTSSRACVTP PVTQRLFSSL LTGYTNGSKI
60
RQTPSNSRPR CTSTSIALAR RSPNERHPRR LCETGRSNSR PAKEKERLRA DHNPAAGATQ
120
PDRTALRRGA AERQPHAPAS AEGEGPVPAG PVRLPVRA
158
<212>类型:PRT
<211>长度:158
序列名:SEQ ID 306:GDC_MTUB_3319076
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSAPDVRLTA WVHGWVQGVG FRWWTRCRAL ELGLTGYAAN HADGRVLVVA QGPRAACQKL
60
LQLLQGDTTP GRVAKVVADW SQSTEQITGF SER
93
<212>类型:PRT
<211>长度:93
序列名:SEQ ID 307:GDC_MTUB_3339006
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MLHDVVHGRR CSENGHRRRI TQYRIGTFIG NAALWNRKRH GDAPGLQRAE KGDDVLESLR
60
SRDHHAVTRG TTTAQLLCHI QRSPIQLRPR QGYRNAVPVL FVIHKREGRV MGLQTRTRAQ
120
RSGKGTHTHG HHVTGHAWSC RSRRRGVLAL RGLSQVASGQ LSRGLPARHG STIGHGRM
178
<212>类型:PRT
<211>长度:178
序列名:SEQ ID 308:GDC_MTUB_3356995
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MPTTKATQRR DVSTEIAYLT RALKAPTLRE SVSRLADRAR AENWSHEEYL AACLQREVSA
60
RESHGGEGRI RAARFPARKS LEEFDFEHAR GLKRDTIAHL GTLDFITARD NVVFLGPAWH
120
REDSSCGRPG DTRVSGRSSG AVRHRRRMGS TARRGSPRRA HLRRTHPALP LSAPGG
176
<212>类型:PRT
<211>长度:176
序列名:SEQ ID 309:GDC_MTUB_3381198
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MQWGYRPLAG DEAMRWGYRP LARESGALDP DHRRCRRRPA HCRPTTRNQT YHRSGARVAI
60
QHRDCAAGSD RSGGVGPLCG FRRPGAGGVV AGSGVRAVRG VRPAQRGRHC AQHRGPRSLR
120
CDAAPGRGGG RRGGRDHVPG GSGVGRPALQ RRLRRR
156
<212>类型:PRT
<211>长度:156
序列名:SEQ ID 310:GDC_MTUB_3388071
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LGGVASTRQA SVRRWSAVHP LDASPALPRP GQRCATARAV AGPTPSWRAA VRSAGVSTSQ
60
RRPGQAPVSS TAPERRCRAD ESGPNRGCSA VPNAHSTAVP VPSRSATKLR RWWRAAEIAS
120
ASSCVCNAGK SPCSTTMLEA PSATTRSAAV MAVFSGSGSS SGVGSASTSA PSPAAAAAAA
180
SSGVITVIER SEPTPAAAVN VSTSMASTTF SRVCAENTGA SLVLAAAKRL TAMIKPISPS
240
SGVPLMKSSC QRRSTRHTST ALPPRSWPGP RHGPDGNRGA D
281
<212>类型:PRT
<211>长度:281
序列名:SEQ ID 311:GDC_MTUB_3482312
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LRGRLIRYAV LLSPSLPLRP SASATGFQSA SVVVTAERAL PAWPLPAPPL EPELHAASIT
60
AAAVVIATIL PACLAPAMRV PSIRCIHGVD GSSVSHGLSG DYETTMKLDR TDPGTARRPH
120
RRPGRVSAGR RGSSTRGTHA HPRRGHQRHR PTCPSAIATG SRRNPVSWNN IQRPSAAAAR
180
RARARTSIRQ RCGPRTSHPL SLLTTELELA LRRPRSNPEL LAAIRSALAE TTDTARTTGG
240
TGLGLAIVDT LSQRNHASVT ARNRAAGGAE ISLRLALG
278
<212>类型:PRT
<211>长度:278
序列名:SEQ ID 312:GDC_MTUB_3581973
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LLGLPDPRPV PRNPAARRRA TSRSLSADPS SRPASQSRPR PGTWCTSEGS SRDPSGGSLG
60
GQCWGVGGLL LGGFFGAGQC CSGSGEDLEA QVAPSFDPFV VLFGEDGSDE ADDRGAVGED
120
AHDVGSASYL SVEAFLGVVG PDLAPDLLGE GGERQQVGAG GVEVLGHRGE FVGQSVEYPI
180
ILGNN
185
<212>类型:PRT
<211>长度:185
序列名:SEQ ID 313:GDC_MTUB_3711717
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MIFWATRYCT IWLPPSPSSV TFSPAVLAGL GVDASTVDPA LASPTSSLST PISARVSTVT
60
SFFLAAMMPL KDGKRGSLIF SFTLITAGSV ASRVNTPSSV SRSPVILPPS IDTLRRWVSC
120
GRPRYSAMMA GTAPPTPSVD SLPAITSSVP SMVPNARAKA HPVWMTSEPC MPSSFRWTAL
180
SAPIDSALRI ASVARSGPAV STVTDPSMPS AASFSRICSA SSTARSLISS STASAASRSS
240
VKSPSVSLRS DQVSGTCLIR TTMFVMTVVR PPRRRPAALD CGTSVTRFAT AQRYYYSVSS
300
RGAPSHHSGW
310
<212>类型:PRT
<211>长度:310
序列名:SEQ ID 314:GDC_MTUB_3716987
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LLSSWPRPGT WCTSEGSSRD PSGGSLGGQC WGVGGLLLGG FFGAGQCCSG SGEDLEAQVA
60
PSFDPFVVLF GEDGSDEADD RGAVGEDAHD VGSASYLSVE AFLGVVGPDL APDLLGEGGE
120
RQQVGAGGVE VLGHRGEFVG QSVEYPIILG NN
152
<212>类型:PRT
<211>长度:152
序列名:SEQ ID 315:GDC_MTUB_3754581
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LIRSIDRWGS AAGGAVGTPG GTDCNGRSSH PARSAATNTS ISAQGAAGPW VKNRGRSSFP
60
VASCSRTAAE TTSSCLGSGA PATNVSARQP DTTYRPSVDR TGRARRTPST NNVSRTRADQ
120
AARALSATID NTTSPHRQPP SQPAPNRMGC APAKPNATNT CSGGGSTFTP VSLVEPIGVY
180
WACIGPSTSP CRAASAWPTR RSHPAGVPRR RNRLS
215
<212>类型:PRT
<211>长度:215
序列名:SEQ ID 316:GDC_MTUB_3794808
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRCRAALSWR LPERLSRIWP AVLPDHTGMG ATAAWQAKAA SLLNRVTPAA SPTILAAVSS
60
AQPGISSSAG ATWWTRALMR WARVLISPVS RMMSVSSARA SSATNPGWVS SQVRRACWCL
120
AASSERAAGA RSGSSSWTSQ RNRLIADVRW ATRTSRRSVN NFNSRDVSSW VARGRSVSRS
180
TARATASASI GSDLPRLRAD LRVWAISLVG TRTTCWPAAS RSRSRRADML RQSSMPQISS
240
RPNCSRAHMM AVACPAVVAL TVFSPSWRPT SSVATKVWLY LCASVPTTTM VVASEPPR
298
<212>类型:PRT
<211>长度:298
序列名:SEQ ID 317:GDC_MTUB_3796793
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VPDLLEFAAL GLRRKAVHDH ERDDGERAED RENACAAEHT QHGEREGGND RVGRQCRGEH
60
RARSHRPQPG REALRGVHPD QRAESEVEPD DEQQHAGEPQ HQPRATIGVV GEYGDQHGIC
120
GDHRRDAGQQ DRATAQPIDQ KQRGTHRRQA GDLHHRGQGK HREIAREAHG GEKSRTVVDD
180
RVDPGDLDEE AERDDEQRGP QIRPPHHFAD TAAAFVDRGR HIGQLGIDVG LRLDPPQRAT
240
RVGDPALEQI PAGGIGHAPQ QRQQQRGRRG GQPEHRAPAV RSGQQVADQV TDDDAAKRRQ
300
LIRGHQRPTH RRRRRLGHIH RHHHHRQADC HTQQQTRHHQ HRYGHRGRAE QGEHCVAGDD
360
EHHRFLASDR VGEDAAAKRP GDLAEHRRGG QQLLFSSGEF EFLAERQQRT RDGGKVVPVE
420
DADAGGGEPD EERPAPRSGQ LTGTGALSTS TTRSGSSGAP AGVNPASWYR AVVISMRLPQ
480
RRHAVNRWSS PDFGADQGRL GCPPANDAEG IGVSS
515
<212>类型:PRT
<211>长度:515
序列名:SEQ ID 318:GDC_MTUB_3879013
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VSDATTVLFG LPGARVERVE RRSDGTRVVD VITDEPTAAA CPSCGGGLDI SEGIRGYLTE
60
RSTLWRRPHH GALEQNSLAM PRRLLQAGAV HRGHHPGTCP RPQHAAAASA DGQGDRGCGP
120
LGGPRSPRLT PCRGRRHIGR LLPTPRRVLT EPLPTPVLGV DQTRRGKPRW ERCAKTGRWV
180
RVDPWDTGFV DLAGDQGFMG QHEGRGGAAV LAWLQARTPQ FRESIQYGGH RPRRCLRLGD
240
PHARAAAQRQ ARRRPLPCDH AGQRRADRGA PPGDLGVPRP ARPQDRPAVG QPTSLADRPG
300
TLVGQKLRQN AESDQRRRPP RADSLGLDRQ RGAAHPAVDR AHRRGPPPGA PSPTPLPAWR
360
IDSQIPELLT LATTID
376
<212>类型:PRT
<211>长度:376
序列名:SEQ ID 319:GDC_MTUB_3921024
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VQALPESQLP ELAVQMRRRL IETVTATGGH LGAGLGMVEL TIALHRVFTS PHDIGVRHRA
60
PNLSAQAAHR PR
72
<212>类型:PRT
<211>长度:72
序列名:SEQ ID 320:GDC_MTUB_3974481
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MSSEGGWPNV GNLARSASMT SAVSSSARVV WVRYDSWVPS GRFNAATSAG VCTNNVDRGA
60
TPSVPSVSSC PACPMKTTVS PRAANRAASA WTFATSGQVA STTCSPRSSA PARTAGETPC
120
AENTTTAPGG GGSGISSRSS TNTAPRSRNS ATTTVLCTIC LRTYTGPSAT SSTRLTVSIA
180
RSTPAQNDRG DANSTVTSPE AYPCATGPTN TSAISTPGDI SVATTRSGLG IAPHRAVPQ
239
<212>类型:PRT
<211>长度:239
序列名:SEQ ID 321:GDC_MTUB_3994808
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LPGHRRGTSA SRVPGNRPRL RPSWPRRTPL ARPKTTGCAR STCSSRARAR AARPRSGRCR
60
PPAWRWARSR MSPPSRITVS GPPSAGASRR EDGSLHRTRH PQITAVAHRP RRWRPGLREA
120
SLPARPTRSR ADQGKRISAS AAGEAEGPFH IRRNGKAVPP LLRRGRAAAR QDG
173
<212>类型:PRT
<211>长度:173
序列名:SEQ ID 322:GDC_MTUB_3998938
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VGRRDRGAPA RPFSAHPQRR CLLAGQSQGc RRGIGLRPAR QHLVGGGSGG PGGAGELRRR
60
QGWHHRANPV GGAGARALRR LRQCDLSAGA HRDDGRCLRR RTRCRSGPDR PAVAAACGKP
120
GPVSGVPGCR GSQRSGVHRL RSAGDAGVTA AHGAPVQRGR HVLGSHRAHR DAAGLLCWSG
180
SGTELFGDRS DASVTRGYRR PIIGIGVRIT TPT
213
<212>类型:PRT
<211>长度:213
序列名:SEQ ID 323:GDC_MTUB_4021183
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LPWTACCSPY SNDNRTKPSP VKSATNSSPA RASTANVHDP GNTMSPLRSR TPKLSTLPAS
60
QATAVAGLPN TASLRPSATT SPLRVSFASI ALTSRSAGGT RAAPNTKPAA EALSAMVSQI
120
LICQSLILVS ISSMAGTRAS VAASTSSSVQ PAPGRSAARM KPTSTSTRGD RYRDAWTGVS
180
SNTCMSSSRC P
191
<212>类型:PRT
<211>长度:191
序列名:SEQ ID 324:GDC_MTUB_4045946
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VVHSRRSWAP SRRPHRGIDA ANERAPAVPE QLTGDPDDRP AQIQQRGGPL DVPSPLRRVC
60
PMLWPVILDT DSQLLVAQVD AGDEVPVVVK HSDLCLRLRQ TGIDQHQSGP RLLWGFRTPV
120
DQRQHRTEAD QAARTGMFGN DGLHVGDLDI GRIRQRVQPL NGLQPRGCAP PDIEGGARRG
180
GYRDTVNRNR LVRRQSIRVH DDARRRLSIG VH
212
<212>类型:PRT
<211>长度:212
序列名:SEQ ID 325:GDC_MTUB_4053033
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VSRYPNSWRR LNNPDMAVPM LNRPVFKPLR TEPKRVPGTP MLPMPEVWPL MTVPPLAVLK
60
NPETSTAKGP VGVLKKPETS VPVLPKPELV RPLSVMIPKP VFTLPAFHEP VLMLPEFPLP
120
VLTLPELSNP VLTKPAFPKP VFNSPAFPKP VLRMLAFPKP VLRTPAFPKP MLALPEFPTP
180
RLLRSPGTRV LAPVLKTPML PLPELNKPML LVPELPMPIL PLPEFSSPAR LMPI
234
<212>类型:PRT
<211>长度:234
序列名:SEQ ID 326:GDC_MTUB_4140236
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LSSNHAILRL LAPLRLDPQN LGAGPQREHR HRQGRRHGAQ SQSGVLADAG VDVVPAQHAP
60
PQQVRQRTGI GQVGSDVDPE
80
<212>类型:PRT
<211>长度:80
序列名:SEQ ID 327:GDC_MTUB_4169350
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LCQGVPARLP PATDTVGVVT KSAVPRVGLD VQIDYSLGDR PVPGHGTGTN QETCEAVCYG
60
AVRRFASGQA QGGDHLGWPG RHRARGRAAA RRPCCGGVQR HLSCVPAARA APAA
114
<212>类型:PRT
<211>长度:114
序列名:SEQ ID 328:GDC_MTUB_4170798
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRPAKRAEEE PGNHPRAGCS GSPPSAPWRS QTPRLATMRP AKRAEEEPGN HPRAGCSGSP
60
PSAPWRSQTP RLATMRPAKR AEEEPGNHPR AGCSGSPPSA PWRSQTPRLA TMRPAKRAEE
120
EPGNHPRAGC SGSPPSAPWR SQTPRLATMR PAKRAEEEPG NHPRAGCSGS PLARPTTGSS
180
RRRRKIRQLS VRVKHAVHRT
200
<212>类型:PRT
<211>长度:200
序列名:SEQ ID 329:GDC_MTUB_4252190
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
MRTTIDLDDD ILRALKRRQR EERKTLGQLA SELLAQALAA EPPPNVDIRW STADLRPRVD
60
LDDKDAVWAI LDRG
74
<212>类型:PRT
<211>长度:74
序列名:SEQ ID 330:GDC_MTUB_4260620
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VSRCRIHCRR LALSRQKTRS LPDLQLASRS GLRRLGCKMD VIRWARRLAV VAGTAAAVTT
60
PGLLSAHVPM VSAEPCPDVE VVFARGTGEP PGIGSVGGLF VDALRFPGWR QVTRGLRR
118
<212>类型:PRT
<211>长度:118
序列名:SEQ ID 331:GDC_MTUB_4302166
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VDACHSRARR GVVDRRRPRC GGTARGVVGI RAWAAPLHCG RSSDSGARAR ENSGRVAGTT
60
MLAVPVPDSA LRVAGSVLDQ AGPYLPFNTP FTAAGMQYYT QMPESDDSPS EKELGITYRD
120
PRDTVADTVT ALRGLGS
137
<212>类型:PRT
<211>长度:137
序列名:SEQ ID 332:GDC_MTUB_4317863
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
LMWKPRWRWC STASERRTTA SPDACRNVSR CRSPSLRLAG SGSPWHRMRS RSTAAMATSR
60
PGRWPGCCVT RKSTRSGRAP TTSCVWMCGA GSSRRALTRH CWRGCAMRCR CPTMTTPRGW
120
SRAALRTSTR RSPLGPNSTG SWPRRGCSRW PNSWATSTPA RCSPSRPPGN GQPAAPTARH
180
SSPACTRAGI SPTKARCAVS TQIAMRRCSV STNSWRARSL PSRRKSPQFV ALLTLPWVSL
240
CPE
243
<212>类型:PRT
<211>长度:243
序列名:SEQ ID 333:GDC_MTUB_4341852
序列描述:
序列
<213>生物名:结核分枝杆菌(Mycobacterium tuberculosis)-H37RV
<400>前序列链:
VRAPATRAAS RGSSRNSDQR PSGRSVIPSR PSSSACQVCS GVFISPGKRV DKPTIAMSTR
60
SAGPVRDQSS ASSPARSVSG SPSMIRVASD SMVGCANATA TDSVTPVRSS MSAAIATASR
120
DDRPSSTMGT DSSIESGAFP TALPTQLRSH WRISGTVSSA LSAGAFSWDS ATSAMGPQSE
180
VAKTVGEPTP LRRLPSR
197
<212>类型:PRT
<222>长度:197
序列名:SEQ ID 334:GDC_MTUB_4391527
序列描述:
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
LHEDPHTGVE PGAVTAHRDC QHPRPACGDE PFNPACVLVR TDGPDDRKCE MTAIRFDAHR
60
SGRECHAVLI AAFLLEPGEA HCLALTFTGS GVLPVPVRID SAANAVGVSL FRALRPPHRP
120
GLGVDTHLVL DGVPPFTKHP QRRLDSPDTS NAPRLDIGFQ SSDRPVVGLA ASAEMPRQRA
180
GLVLGWVQRE PERLHTPAFW HLESGHQAAS ASPTAAARAR LAPFCAARSP
230
<212>类型:PRT
<211>长度:230
序列名:SEQ ID 335:GDC_Sars174_refseq
序列描述:
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
LRPSRSTLIA KCASWRQPPR CLRSAAVNRR SSAPVAQREL RAENRPESRP QFTLGAVWPH
60
PVNVICAGGR WRVANPSGAG PPSTPRRGQL ISGYASATAP AMGCGRTRRI SPNTRMPSCR
120
AHLLKEGLRH LFSVKGEESK QALDRLIF
148
<212>类型:PRT
<211>长度:148
序列名:SEQ ID 336:GDC_Sars68_refseq
序列描述:
序列
<213>生物名:Sars冠状病毒(Sars Coronavirus)
<400>前序列链:
VHSASSVATP VRGSTLAGSA GPSTAVTMPA KPTCGATNCS TSMSPSRAAI TWRSPLRHTT
60
KRTMTPPMSR RHQRPSKVRS GLPRVSTISA TVGWGSPWRS STPCAVRSRC TCSQTMSRRS
120
SCGIFGRIPS VTGKSTRCNR SAITNMPSMV TSTPTTLSAV PARPAADGPV MINRKSCR
178
<212>类型:PRT
<211>长度:178
序列名:SEQ ID 337:GDC_Sars61_refseq
序列描述:
序列
<213>生物名:Sars冠状病毒(Sars CoronaVirus)
<400>前序列链:
MDRLCGAPLC HRRRGPTATA AQAGARRLHD PQQAPGRAVA GQLRPAGRAD RGAGRPGGSG
60
SGAPRPGRQP DHGGARHSGG PASRRGVALL EGAAARARPV VHRGGDNRAA VLVEITGEPL
120
AWESRQNGCG VLHSRRRRQR RDLEPPVRRR PRR
153
<212>类型:PRT
<211>长度:153
序列名:SEQ ID 338:GDC_Sars78_refseq
序列描述:
机译: 一种基于计算机的通用方法,用于鉴定可用作药物靶标的蛋白质编码DNA序列
机译: 一种基于计算机的通用方法,用于鉴定可用作药物靶标的蛋白质编码DNA序列
机译: 基于计算机的通用方法,用于鉴定可用作药物靶标的蛋白质编码DNA序列