公开/公告号CN101558166A
专利类型发明专利
公开/公告日2009-10-14
原文格式PDF
申请/专利权人 二进国际(美国)有限公司;
申请/专利号CN200680055623.2
申请日2006-10-06
分类号C12P19/04(20060101);C12N9/14(20060101);
代理机构31100 上海专利商标事务所有限公司;
代理人陶家蓉
地址 美国佛罗里达州
入库时间 2023-12-17 22:48:43
法律状态公告日
法律状态信息
法律状态
2019-09-24
未缴年费专利权终止 IPC(主分类):C07K14/37 授权公告日:20140716 终止日期:20181006 申请日:20061006
专利权的终止
2016-10-26
专利权的转移 IPC(主分类):C07K14/37 登记生效日:20161009 变更前: 变更后: 申请日:20061006
专利申请权、专利权的转移
2014-07-16
授权
授权
2009-12-09
实质审查的生效
实质审查的生效
2009-10-14
公开
公开
本申请是2003年3月21日提交的美国专利申请10/394,568的部分继续申请,其要求2000年4月13日提交的美国专利申请09/548,938(现在是美国专利6,573,086)的优先权,美国专利申请09/548,938是1999年10月6日提交的国际申请PCT/NL99/00618的部分继续申请,PCT/NL99/00618是1998年10月6日提交的国际申请PCT/EP98/06496的部分继续申请。本申请也是1999年4月8日提交的美国专利申请09/284,152的部分继续申请,美国专利申请09/284,152是1996年10月10日提交的08/731,170的部分继续申请。要求优先权的所有在先申请通过引用全文纳入本文。
发明领域
本发明涉及由木质纤维素生物质或纤维素物质产生生物能量或其它增值产品的组合物和方法。具体说,本发明提供能够将各种纤维素底物或木质纤维素生物质转变为可发酵糖的酶组合物。本发明也提供使用这类酶组合物的方法。
介绍
1970年代(OPEC降低石油产量而爆发石油危机时)以来,将可再生木质纤维素生物质生物转化成可发酵糖,随后发酵生产替代液体燃料的醇(如乙醇)已经吸引了研究人员的广泛注意(Bungay H.R.,“Energy:the biomassoptions”(能源:生物质选择),NY:Wiley;1981;Olsson L,Hahn-
可认为是潜在的可再生原料的主要多糖含有不同木质纤维素残基,这些多糖是纤维素和半纤维素(木聚糖)。在不同酶的共同作用下,这些多糖酶促水解成可溶性糖,如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖和其它己糖和戊糖。内切-1,4-β-葡聚糖酶(EG)和外切-纤维二糖水解酶(exo-cellobiohydrolase,CBH)能催化不溶性纤维素水解成纤维寡糖(纤维二糖是主要产物),而β-葡糖苷酶(BGL)将该寡糖转变为葡萄糖。木聚糖酶与其它辅助酶(非限制性例子包括α-L-阿拉伯呋喃糖酶、阿魏酸酯酶和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β-木糖苷酶)一起催化水解半纤维素。
无论是何种类型的纤维素原料,酶的成本和水解效率是限制生物质生物转化过程商品化的主要因素。微生物产生酶的生产成本与产生酶的菌株的生产力和发酵培养基中的最终活性产率密切相关。木质纤维素糖化过程中多酶复合物的水解效率取决于各酶的特性、它们之间的协同作用和它们在多酶混合物中的比例。
鲁克文金孢子菌(Chrysosporium lucknowense)是已知能产生各种纤维素酶、半纤维素酶和其它可能的辅助酶的真菌。鲁克文金孢子菌也分泌至少五种不同的内切葡聚糖酶,其中EGII(51kDa,Cel5A)最有活性。而且,现已开发了鲁克文金孢子菌突变菌株(包括UV18-25)用于产生织物、纸浆和纸张、去污剂和其它领域所用的酶,但不产生用于纤维素酶促糖化的酶;这些菌株也可用于高水平产生同源和异源蛋白质。在低粘度发酵中,最好的鲁克文金孢子菌突变体菌株能分泌至少50-80gl-1的胞外蛋白。在2005年对鲁克文金孢子菌的完整真菌基因组进行了测序(参见http://WorldWideWeb.dyadic-group.com/wt/dyad/pr_1115654417),现在正在进行基因组注释。
粗制的鲁克文金孢子菌多酶复合物在纤维素糖化中表现出的结果平平,在测试条件下只有一部分纤维素转化为葡萄糖。以前已经分离并研究了属于糖苷水解酶家族7和6的鲁克文金孢子菌的两种纤维二糖水解酶。CBH Ia以前在美国专利号6,573,086中称为CBH I,是70(60)kD的蛋白质。培养基中存在的CBH Ia是全长酶(经过SDS-PAGE观察到的分子量为65kDa),它由通过柔性肽接头连接的核心催化结构域和纤维素结合模块(CBM)组成,其截短形式(52kDa)代表该酶的催化结构域。与里氏木霉(T.reesei)的CBH I相比,鲁克文金孢子菌的CBH I(Cel7A)水解结晶纤维素的效率略低,但热稳定性更高。以前认为CBH IIa是内切葡聚糖酶,曾称为43kD Endo和EG6。参见例如,美国专利6,573,086。CBH IIa(43kDa)没有CBM,即其分子只含有催化结构域。
尽管在过去几十年中不断进行研究以理解酶促木质纤维素生物质降解和纤维素酶产生过程,但仍需要发现或工程改造新型高活性纤维素酶和半纤维素酶。也非常需要构建能够对木质纤维素材料进行快速有效生物降解的高效酶组合物。
发明内容
本发明提供了几种从鲁克文金孢子菌新鉴定和分离的酶。所述新酶包括两种新型纤维二糖水解酶(CBH Ib和IIb,或Cel7B和Cel6B)、内切葡聚糖酶(EG VI)(不要与CBH IIa混淆,CBH IIa以前称为EG 6)、β-葡糖苷酶(BGL)和木聚糖酶(Xyl II)。CBH IIb对微晶纤维素和棉花有高活性,与其它鲁克文金孢子菌纤维素酶显示明显的协同作用。使用这些新酶时,本发明提供用于纤维素水解的高度有效的酶组合物。
本发明的一个目的是提供酶制剂,其包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶。分离的纤维二糖水解酶可以是CBH Ib和IIb。该酶制剂可任选地含有内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地含有半纤维素酶。
本发明的另一目的是提供由纤维素产生葡萄糖的方法。该方法包括产生包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。任选地,该酶制剂可包含内切葡聚糖酶和/或β-葡糖苷酶。可将该酶制剂施用于纤维素,形成葡萄糖。
本发明的另一方面是提供产生乙醇的方法。该方法包括提供包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。任选地,该酶制剂可包含内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地包含半纤维素酶。该方法还包括将该酶制剂施用于纤维素,以产生葡萄糖,随后发酵该葡萄糖产生乙醇。
本发明还提供由乙醇产生能量的方法。该方法包括提供包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。该酶制剂可任选地包含内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地包含半纤维素酶。该方法还包括将该酶制剂施用于纤维素以产生葡萄糖,使葡萄糖发酵产生乙醇,使所述乙醇燃烧产生能量。
本发明的另一方面是提供与相应非突变菌株相比,在相同条件下能够以较高水平表达至少一种纤维二糖水解酶和至少一种内切-1,4-β-葡聚糖酶的突变的鲁克文金孢子菌菌株。所述纤维二糖水解酶选自CBH Ia、CBH IIa、CBH Ib或CBH IIb;所述内切-1,4-β-葡聚糖酶选自EG II、EG V或EG VI。
本发明的另一方面是提供经BLAST算法测定,分别与SEQ ID NO:2、4、16、12和18所示的CBH Ib、CBH IIb、EG VI、BGL和Xyl II氨基酸序列的相同性至少为65%的蛋白质,或至少含有20个毗连氨基酸的该蛋白的一部分。本发明也考虑编码这一蛋白的相应核酸序列。
本发明一方面提供包含至少一种酶的酶制剂,该酶选自CBH Ib、CBHIIb、EG II、EG VI、BGL或Xyl II。
本发明另一方面提供由木质纤维素材料产生可发酵糖的方法。该方法包括(a)提供包含至少一种酶的酶制剂,所述酶选自CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II;和(b)将所述酶制剂施用于木质纤维素材料以产生可发酵糖。
本发明也提供产生发酵产物的方法或由可发酵糖产生发酵产物的原料。该方法包括(a)提供酶制剂,其中该酶制剂含有至少一种酶,所述酶选自CBHIb、CBH IIb、EG II、EG VI、BGL或Xyl II;(b)将所述酶制剂施用于木质纤维素材料,产生可发酵糖;和(c)使所述可发酵糖发酵产生发酵产物。
在另一方面,本发明提供由可发酵糖产生能量的方法。该方法包括(a)提供酶制剂,其中该酶制剂含有至少一种酶,所述酶选自CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II;(b)将所述酶制剂施用于木质纤维素材料,产生可发酵糖;和(c)使所述可发酵糖发酵产生可燃性发酵产物;和(d)燃烧所述可燃性发酵产物,产生能量。
本发明的一个目的是提供与相应非突变菌株相比,在相同条件下能够以较高水平表达至少一种纤维二糖水解酶和至少一种内切-1,4-β-葡聚糖酶的突变的鲁克文金孢子菌菌株。所述纤维二糖水解酶选自CBH Ia、CBH Ib、CBH IIa或CBH IIb;所述内切-1,4-β-葡聚糖酶选自EG II、EG V或EG VI。
本发明也提供经BLAST算法测定,与本文所述CBH Ib、IIb、EG VI、BGL、Xyl II氨基酸序列相同性为至少65%的蛋白质,或含有至少20个毗连氨基酸的该蛋白的一部分。
本发明另一方面提供与本文所述编码CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II的核酸序列同源性为至少80%的核酸序列。
本发明也提供将木质纤维素材料降解成可发酵糖的方法。该方法包括使木质纤维素材料与有效量的衍生自微生物的多酶产物相接触,以产生至少一种可发酵糖。多酶产物中至少一种酶选自CBH Ia、CBH Ib、CBH IIa、CBHIIb、EG II、EG V、EG VI、BGL或Xyl II。
在另一方面,本发明提供能够表达选自下组的一种或多种酶的微生物或植物:CBH Ia、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL和Xyl II。
附图简要说明
图1:由鲁克文金孢子菌纯化的纤维二糖水解酶的SDS/PAGE(A)和等电聚焦(B)。泳道:1,具有不同分子量的标记物;泳道2和5,CBH Ib;泳道3和6,CBH IIb;泳道4,具有不同pI的标记物。
图2:在纯化日本曲霉(A.japonicus)BGL(0.5U ml-1)存在下,在40℃、pH 5.0下,纯化的纤维二糖水解酶(0.1mg ml-1)对微晶纤维素(5mg ml-1)进行水解的过程动力学(progress kinetics)。
图3:在纯化的日本曲霉BGL(0.5U ml-1)存在下,40℃、pH 5.0下棉花纤维素(5mg ml-1)水解期间,CBH IIb和其它鲁克文金孢子菌纯化酶之间的协同作用。CBH和EG浓度分别为0.15和0.05mg ml-1。用空心符号表示酶对的实验数据(连续曲线);用实心符号表示单个酶作用下获得的葡萄糖总浓度的理论值(虚线)。
图4:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE L-600的组合#1水解棉花(25mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE L-600是市售鲁克文金孢子菌多酶纤维素酶制剂(详见文中和表4)。
图5:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE-L的组合#1水解微晶纤维素(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE L是市售鲁克文金孢子菌多酶纤维素酶制剂(详见文中和表4)。
图6:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE-L 600的组合#1水解预处理的花旗松(Douglas fir)木材(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE-L 600是市售鲁克文金孢子菌(详见文中和表4)。
图7:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶的不同组合水解预处理的花旗松(Douglas fir)木材(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1(详见文中和表5)。
图8:编码CBH IB的cbh2基因。
图9:编码CBH IIb的cbh4基因。
图10:编码CBH Ia的cbh1基因。
图11:编码CBH IIa的EG6基因。
图12:编码EG II的eg2基因。
图13:编码BGL的bgl1基因。
图14:编码EGV的eg5基因。
图15:编码EG VI的eg7基因。
图16:编码Xyl II的xyl2基因。
发明详述
本发明提供将植物生物质转变为可发酵糖的方法和组合物,所述可发酵糖可转变为有用产品。该方法包括利用酶混合物降解木质纤维素材料以释放糖的方法。本发明组合物包括能降解木质纤维素的酶组合。本文所用术语″生物质″或″木质纤维素材料″包括含有纤维素和/或半纤维素的材料。通常,这些材料也含有木聚糖、木素、蛋白质和糖,如淀粉和糖。木质纤维素通常存在于,例如植物的茎、叶、荚、皮和穗轴中,或者树木的叶、枝干和木材中。在本文中,复杂糖(如淀粉、纤维素或半纤维素)转变为可发酵糖的过程也称为″糖化″。本文所用的可发酵糖指单糖,如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、鼠李糖、蔗糖和果糖。
生物质可包括原始生物质和/或非原始生物质,如农业生物质、市售有机产品、建筑和拆毁废料、市政固体废料、废纸和家庭垃圾。普通形式的生物质包括树木、灌木和禾本植物(grasses),小麦、麦杆、甘蔗渣、玉米、玉米壳、玉米仁(包括来自玉米仁的纤维),谷物如玉米、小麦和大麦的研磨(包括湿磨和干磨)产品和副产品以及市政固体废料、废纸和家庭垃圾。生物质可以是,但不限于草本材料、农业残料、林业残料、市政固体废料、废纸和纸浆、以及造纸厂残料。“农业生物质”包括树枝、灌木、藤条(canes)、玉米和玉米壳、能源作物、林木、水果、花、谷粒、禾本植物、草本作物、叶、树皮、针叶、原木、根、树苗、短期轮作木本作物、灌木、柳枝稷(switch grasses)、树、蔬菜、果皮、蔓生植物、甜菜粕、次粉(wheat midlings)、燕麦壳以及硬木和软木(不包括含有害材料的木材)。此外,农业生物质包括由农业加工(包括农事和林事活动)产生的有机废料,特别包括林木废料。农业生物质可以是任何上述单一物质或其组合或混合物。
可将可发酵糖转变为有用的增值发酵产品,其非限制性例子包括氨基酸、维生素、药品、动物饲料补充剂、专业化学品、化学原料、塑料、溶剂、燃料或其它有机聚合物、乳酸和乙醇,包括燃料乙醇。可通过本发明方法产生的特定增值产品包括但不限于:生物燃料(包括乙醇和丁醇);乳酸;塑料;专业化学品;有机酸,包括柠檬酸、琥珀酸和马来酸;溶剂;动物饲料补充剂;药品;维生素;氨基酸,如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸;工业酶,如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、酯酶、裂合酶、氧化还原酶、转移酶和木聚糖酶;和化学原料。
本文所用的多酶产物可获自或衍生自微生物、植物或其它来源或其组合,含有能够降解木质纤维素材料的酶。本发明多酶产物中包含的酶的例子包括纤维素酶(如纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶、半纤维素酶(如木聚糖酶、包括内切木聚糖酶、外切木聚糖酶和β-木糖苷酶)、木质酶、淀粉酶、α-阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、α-葡糖醛酸糖苷酶、阿拉伯糖酶、葡糖醛酸糖苷酶、蛋白酶、酯酶(包括阿魏酸酯酶和乙酰木聚糖酯酶)、脂酶、葡萄糖甘露聚糖酶和木糖葡糖酸酶。
在一些实施方式中,所述多酶产物包含半纤维素酶。半纤维素是一种复杂的聚合物,在不同生物中、不同组织类型中其组成迥然不同。通常,半纤维素的主要组分是β-1,4-连接的木糖(一种五碳糖)。然而,这种木糖常常以β-1,3连接的形式分枝,可用阿拉伯糖、半乳糖、甘露糖、葡糖醛酸的连接取代,或通过酯化连接于乙酸。半纤维素也可含有葡聚糖,葡聚糖是β-连接的六碳糖的总称。这些半纤维素包括木糖葡聚糖、葡甘露聚糖和半乳甘露聚糖。
与单子叶植物(单子叶植物是种子包含一个子叶的植物,如玉米、小麦、水稻、禾本植物、大麦)相比,双子叶植物(双子叶植物是种子包含两个子叶的植物,如菜豆,花生,杏仁,豌豆,四季豆)中半纤维素的组成、取代特性和分枝程度非常不同。在双子叶植物中,半纤维素主要由木糖葡聚糖组成,木糖葡聚糖是具有1,6-β-连接的木糖基侧链的1,4-β-连接的葡萄糖链。在单子叶植物,包括大部分谷物中,半纤维素的主要组分是异木聚糖(heteroxylan)。它们主要由1,4-β-连接的木糖主链聚合物和酯连接乙酸修饰的木糖组成,木糖主链聚合物通过1,3-β连接于阿拉伯糖、半乳糖和甘露糖。也存在分枝的β葡聚糖,它由1,3-和1,4-β-连接的葡糖基链组成。在单子叶植物中,纤维素、异木聚糖和β葡聚糖的含量基本相等,各自占细胞壁干物质的约15-25%。
半纤维素裂解酶,即半纤维素酶包括外切水解酶和内切水解酶,如木聚糖酶、β-木糖苷酶和酯酶,它们通过水解主动切割半纤维素物质。这些木聚糖酶和酯酶切割木聚糖和木聚糖的乙酰基侧链,其余木糖-寡聚体是未取代的,因此仅可用P木糖苷酶水解。此外,在水解半纤维素的酶制剂中发现几种了解较少的次要活性。虽然多酶产物可包含许多类型的酶,但优选包含能提高或增强生物质的糖释放的酶,包括半纤维素酶的混合物。在一个实施方式中,半纤维素酶是木聚糖酶、阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、葡糖醛酸糖苷酶、内切半乳糖酶(endo-galactanase)、甘露聚糖酶、内切拉伯糖酶、外切阿拉伯糖酶、外切半乳糖酶(exo-galactanase)、阿魏酸酯酶、半乳甘露聚糖酶、木糖葡糖酸酶、或其混合物。具体说,该酶可包括葡糖淀粉酶、β-木糖苷酶和/或β-葡糖苷酶。可通过各种来源提供多酶产物的酶。在一个实施方式中,通过培养天然产生酶或经遗传修饰表达酶的微生物或植物来生产所述酶。在另一实施方式中,可从市场上购得多酶产物的至少一种酶。
本发明的一个实施方式涉及催化木质纤维素材料转变为本文所述可发酵糖、其同源物和/或其片段的一种分离酶。本发明也包括编码任何这类蛋白质、其同源物或片段的分离的核酸分子。根据本发明,分离的蛋白质或多肽是从其天然环境取出(即经人工操作)的蛋白质,可包括(例如)纯化的蛋白质、部分纯化的蛋白质、重组产生的蛋白质和合成产生的蛋白质。因此,″分离″不反应蛋白质的纯化程度。优选地,本发明分离蛋白是重组产生的。可通过合成(例如化学合成,如肽合成)或重组途径产生分离肽。也可以利用本领域已知的蛋白质纯化方案,以粗发酵产物或部分纯化或纯化(例如,从微生物纯化)的蛋白质制剂的形式提供分离的蛋白质。此外和例如,称为衍生自或来自特定生物体的蛋白质,如″鲁克文金孢子菌纤维素酶和/或半纤维素酶″指来自鲁克文金孢子菌微生物的纤维素酶和/或半纤维素酶(通常包括天然产生的纤维素和/或半纤维素酶的同源物),或从鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶的结构(如序列)、也可能是功能的知识而产生的纤维素酶和/或半纤维素酶。换言之,通常述及鲁克文金孢子菌纤维素酶和/或半纤维素酶或者衍生自鲁克文金孢子菌的纤维素酶和/或半纤维素酶包括与鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶结构和功能基本类似的任何纤维素酶和/或半纤维素酶,或者鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶的生物学活(即具有生物学活性的)同源物,如下文所详述。因此,鲁克文金孢子菌纤维素酶和/或半纤维素酶可包括纯化、部分纯化、重组、突变/修饰和合成的蛋白质。相同描述用于指本文所述的其它蛋白质或肽以及这类蛋白质或肽的其它微生物来源。
本发明的一个实施方式涉及分离的核酸分子,其包含编码本文所述任何酶,包括这类酶的同源物或片段的核酸序列,以及与其完全互补的核酸序列,或基本由其组成,或由其组成。按照本发明,分离的核酸分子是从其天然环境取出(即经人工操作)的核酸分子,其天然环境是天然发现该核酸分子的基因组或染色体。因此,″分离″不一定反映核酸分子的纯化程度,但表明该分子不包含天然发现该核酸分子的完整基因组或完整染色体。分离的核酸分子可包含基因。包含基因的分离核酸分子不是包含这个基因的染色体片段,而包含与该基因有关的编码区和调控区,但不含同一染色体上天然发现的其它基因。分离核酸分子也可包含侧接(即在该序列的5′和/或3′末端侧接)其它核酸的特定核酸序列,所述其它核酸在天然情况下通常不侧接所述的特定核酸序列(即,异源序列)。分离的核酸分子可包括DNA、RNA(如mRNA),或者DNA或RNA的衍生物(如cDNA)。优选地,本发明的分离核酸分子是用重组DNA技术(如,聚合酶链反应(PCR)扩增,克隆)或化学合成产生。可利用本领域技术人员已知的许多方法产生核酸分子同源物(参见例如,Sambrook等,《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),冷泉港实验室出版社(Cold Spring Harbor Labs Press)(1989))。例如,可利用各种技术修饰核酸分子,这些技术包括但不限于:经典诱变技术和重组DNA技术,如定点诱变、对核酸分子进行化学处理以诱导突变、对核酸片段进行限制性酶切、连接核酸片段、PCR扩增和/或对核酸序列所选区域进行诱变、合成寡核苷酸混合物和连接混合基团以“构建”核酸分子混合物,以及上述技术的组合。可通过筛选核酸编码蛋白的功能和/或与野生型基因杂交,从修饰核酸的混合物中选择核酸分子同源物。
本发明另一实施方式包括包含重组载体和编码蛋白质或肽的核酸序列的重组核酸分子,所述蛋白质或肽具有可用于催化木质纤维素材料转变为可发酵糖的至少一种酶活性。按照本发明,重组载体是工程改造(即人工产生)的核酸分子,它用作操作所选核酸序列和将这类核酸序列引入宿主细胞的工具。因此,重组载体适用于对所选核酸序列进行克隆、测序和/或其它操作,例如表达所选核酸序列和/或将其递送至宿主细胞中形成重组细胞。这类载体一般含有异源核酸序列,即天然情况下不与所克隆或所递送核酸序列相邻的核酸序列,但该载体也可含有天然情况下与本发明核酸分子相邻或可用于表达本发明核酸分子的调控核酸序列(如启动子、非翻译区)(详述见下)。该载体可以是真核或原核的RNA或DNA,一般是质粒。该载体可以染色体外元件的形式(如质粒)维持,或者可整合到重组生物体(如微生物或植物)的染色体。完整载体可保持在宿主细胞中,或者在某些条件下,可缺失该质粒DNA,留下本发明核酸分子。整合的核酸分子可以在染色体启动子控制下、在天然或质粒启动子控制下,或在几个启动子的联合控制下。可将一个或多个拷贝的核酸分子整合到染色体中。本发明重组载体可含有至少一个可选择标记物。
一般地,重组核酸分子包括操作性连接于一个或多个表达控制序列的至少一个本发明核酸分子。按照本发明,术语“操作性连接”指将核酸分子连接于表达控制序列(如,转录控制序列和/或翻译控制序列),从而在转染(即转化、转导、转染、偶联或导入)宿主细胞时,可表达该分子。转录控制序列是控制转录的启动、延长或终止的序列。特别重要的转录控制序列是控制转录启动的序列,如启动子、增强子、操纵子和阻抑物序列。
合适的转录控制序列包括能在要引入重组核酸分子的宿主细胞或生物体内行使功能的转录控制序列。
酶和编码酶的核酸
如实施例所述,本发明提供了几种纯化酶,包括两种纤维二糖水解酶(CBH Ib,SEQ ID NO.2;CBH IIb,SEQ ID NO.4)、内切葡聚糖酶(EG VI,SEQ ID NO.16)、β-葡糖苷酶(BGL,SEQ ID NO.12)和木聚糖酶(Xyl II,SEQ ID NO.18)。本发明也考虑这些酶的变体,包括通常用BLAST算法测定到氨基酸序列与这些酶的氨基酸相同性为至少65%、70%或75%的变体。
此外,本发明提供编码这些序列的核酸,包括基因cbh2(SEQ ID NO.1,编码CBH Ib),基因cbh4(SEQ ID NO.3,编码CBH IIb);基因eg7(SEQ IDNO.15,编码EG VI),基因bgl1(SEQ ID NO.11,编码BGL)和基因xyl2(SEQ ID NO.17,编码Xyl II)。本发明也考虑这些核酸的变体,包括与这些核酸的同源性为至少80%、85%或90%的变体。
如本文所述,本发明新鉴定和分离的酶可与促进纤维素材料糖化的至少一种其它酶联用。在优选实施方式中,这种酶衍生自鲁克文金孢子菌。例如,该酶可以是CBH Ia(SEQ ID NO.6)、CBH IIa(SEQ ID NO.8)、EG II(SEQID NO.10)或EG V(SEQ ID NO.14)。然而需要注意的是,在某些优选实施方式中,通过遗传修饰微生物或植物使其表达cbh1(SEQ ID NO.5,编码CBH Ia)、EG6(SEQ ID NO.7,编码CBH IIa)、eg2(SEQ ID NO.9,编码EG II)和/或EG5(SEQ ID NO.13,编码EG V),可获得CBH Ia、CBH IIa、EG II和EG V。一个特别有用的糖化组合是CBH Ia、CBH Ib、CBH IIb、EGII、EG V、BGL和Xyl II。
在某些实施方式中,通过分子进化技术,使本发明的多核苷酸和多肽进化从而产生和鉴定具有所需结构、功能和/或物理特征的新变体。分子进化技术可以是“DNA改组”或“有性PCR(sexual PCR)”(WPC,Stemmer,PNAS,91:10747,(1994)),也称为“定向分子进化”、“外显子改组”、“定向酶进化”、“体外进化”和“人工进化”。本领域已知提到的这些术语,它们包括在本发明范围内。可改变特征如活性、蛋白质的酶动力学,蛋白质的Ki、Kcat、Km、Vmax、Kd、热稳定性、最优pH等。在某些实施方式中,可使本发明多核苷酸和/或多肽进化从而赋予对原位酶促糖化和发酵有利的特性。例如,可使酶进化从而能在适合糖发酵的环境中最佳地行使功能。在一个例子中,使酶进化从而能在高温和高乙醇含量的环境,例如生物体如酵母正在发酵糖的环境中具有最高活性。以此方式,木质纤维素糖化和发酵在一个工艺步骤中进行。在另一个例子中,使该酶进化从而能耐受严苛的化学或热学环境,例如在木质纤维素预处理过程中可能经历的环境(如本文所述)。在这些实施方式中,在加入酶之前不一定要对木质纤维素进行化学或热学预处理。另外,这些处理和酶促糖化可同时进行。当然,本发明也考虑涉及木质纤维素产生糖的多个步骤的方法,如进化的酶首先糖化木质纤维素,随后由生物如酵母发酵。
在其它实施方式中,提高蛋白质特定特性的能力也可用于将酶的特征性活性改变为与其最初鉴定的活性完全无关的活性。本发明其它理想的改进可能是每种蛋白质所特有的,因此为本领域所熟知且属于本发明范围。
酶的表达
用于本发明和/或用作本发明所用酶来源的微生物包括产生能够降解木质纤维素材料的酶的任何微生物,包括细菌、酵母和丝状真菌。为简明和方便起见,本文讨论丝状真菌微生物;然而,本领域技术人员应认识到其它微生物也可用于本发明。丝状真菌已经广泛用于蛋白质制造工业。这些真菌因其生物学小生境(biological niche)可用作微生物清除剂而极其适合于蛋白质的生产和分泌。在富含生物聚合物的环境,例如枯枝落叶层中,真菌通过分泌降解这些聚合物的酶,产生容易用作生长营养物的单体来竞争。已广泛研究了真菌产生蛋白质的天然能力,主要用于生产工业酶。改良菌株的蛋白质生产水平可高于天然分离物几个数量级;通常每升发酵培养物能产生几十克蛋白质。
本发明考虑了各种真菌菌株,包括但不限于:踝节菌属(Talaromyces)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、青霉属(Penicillium)、镰孢霉属(Fusarium)、腐质霉属(Humicola)、毁丝霉属(Myceliophthora)、棒囊壳属(Corynascus)、毛壳菌属(Chaetomium)、弯颈霉属(Tolypocladium)、梭孢壳菌属(Thielavia)、支顶孢属(Acremonium)、侧孢霉属(Sporotrichum)、耐热子囊菌属(Thermoascus)和金孢子菌属(Chrysosporium)。这些是许多可能用作酶来源和/或适合用作生产这种酶混合物的宿主生物的真菌属中的一部分。这些真菌可获自,例如,各种保藏机构,例如美国典型培养物保藏中心(ATCC)、俄罗斯科学院全俄微生物保藏中心(All Russian Collection of Microorganisms of the Russian Academy ofSciences,VKM)和席梅尔培养物中心局(Centraalbureau voorSchimmelcultures)。
鲁克文金孢子菌(C.lucknowense)的突变株
金孢子菌属(Chrysosporium)的特定菌株能表达极大量的蛋白质,这些菌株的天然表达调节序列特别感兴趣。这些菌株称为金孢子菌菌株C1、菌株UV13-6、菌株NG7C-19和菌株UV18-25。按照布达佩斯条约,它们保藏在位于莫斯科的全俄保藏中心(VKM)保藏所。按照布达佩斯条约,野生型C1菌株的保藏号为VKM F-3500D,保藏日期为1996年8月29日,C1 UV13-6突变体的保藏号为VKM F-3632D,保藏日期为1998年2月9日,C1 NG7c-19突变体的保藏号为VKM F-3633D,保藏日期为1998年2月9日,C1 UV18-25突变体的保藏号为VKM F-3631D,保藏日期为1998年2月9日。
优选应用能在所选宿主中高表达的表达调节区。这也可以是衍生自异源宿主的高表达调节区,如本领域所熟知。已知大量表达并为本发明提供合适的表达调节序列的蛋白质的具体例子包括但不限于:疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶(如内切-葡聚糖酶、纤维二糖水解酶)和聚半乳糖醛酸酶。在固体状态和浸没式发酵条件下均确定有高产量。本领域熟知评估这类蛋白质的存在或产生的实验。
异源表达调节序列在金孢子菌中的工作效率与天然金孢子菌序列相同。这使得能够将熟知的构建物和载体用于转化金孢子菌并提供多种其它可能性以在此种新型表达和分泌宿主中构建表达速率良好的载体。由于已经确定金孢子菌菌株的纤维素酶表达速率极高,所以特别优选这类蛋白质的表达调节区。
包含鲁克文金孢子菌的核酸表达调节区或其衍生物的核酸构建物形成了本发明一个单独的实施方式,包含操作性连接于待表达多肽编码基因的这一区域的突变金孢子菌菌株也是这样。在优选实施方式中,这种核酸构建物是与纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶和/或木聚糖酶表达有关的金孢子菌的表达调节区。
本发明也包括遗传工程改造的金孢子菌菌株,其中引入的序列可以是金孢子菌来源的。然而,这种菌株可能与天然产生菌株的不同之处在于,例如,用于转化或转染金孢子菌的核酸序列中存在的异源序列,存在多个编码感兴趣多肽的序列拷贝或它们的表达量超过了相同条件下非工程改造菌株的表达量或在正常的非表达条件下发生表达。后者可能是与非重组情况相反,由诱导型启动子调节感兴趣序列的情况,或与非工程改造菌株相比是由另一因素诱导表达的情况。根据前述实施方式中的定义,本发明不应涵盖天然产生的金孢子菌菌株。本发明涉及利用经典遗传学技术或遗传学工程改造方法进行工程改造产生的菌株。
产生重组微生物或植物的方法也是本发明的一部分。该方法包括将编码异源或同源多肽的核酸序列稳定引入微生物菌株或植物,所述核酸序列操作性连接于表达调节区。曾报道过这类方法用于转化丝状真菌。在一个优选的实施方式中,突变的鲁克文金孢子菌衍生自经工程改造过度表达Xyl II基因的UV18-25(登录号VKM F-3631D)。
遗传修饰的生物体
本文所用的遗传修饰的微生物可包括遗传修饰的细菌、酵母、真菌或其它微生物。这类遗传修饰的微生物具有与正常(即野生型或天然产生的)形式相比,经过修饰(即突变或改变)的基因组,以便实现所需结果(如,提高或改变将木质纤维素材料转变为可发酵糖的至少一种酶或多酶产物的活性和/或产量)。可采用经典的菌株发育(strain development)和/或分子遗传学技术来遗传修饰微生物。本领域已知用于微生物的这类技术,通常参见,例如,Sambrook等,1989,《分子克隆:实验室手册》(Molecular Cloning:A LaboratoryManual),冷泉港实验室出版社(Cold Spring Harbor Labs Press)。参考文献Sambrook等,同上,通过引用全文纳入本文。遗传修饰的微生物可包括插入、缺失或修饰(即,突变的;例如,通过核苷酸的插入、缺失、取代和/或反转)核酸分子的微生物,这种遗传修饰方式能在所述微生物中提供所需效果。
在本发明的一个方面,遗传修饰的微生物可内源性地包含和表达酶或多酶产物,以便将木质纤维素材料转变为可发酵糖,所述遗传修饰可以是一种或多种这类内源性酶的遗传修饰,所述修饰对所述微生物将木质纤维素材料转变为可发酵糖的能力产生一些影响。
在本发明的另一方面,遗传修饰的微生物可内源性地包含和表达酶或多酶产物,以便将木质纤维素材料转变为可发酵糖,所述遗传修饰可以是引入至少一种外源性核酸序列(如重组核酸分子),其中所述外源性核酸序列编码可用于将木质纤维素材料转变为可发酵糖的至少一种其它酶和/或提高酶或多酶产物将木质纤维素材料转变为可发酵糖的效率的蛋白质。在本发明的这一方面,所述微生物也可含有对一个或多个基因的至少一个修饰,包括对将木质纤维素材料转变为可发酵糖的内源性酶的基因修饰。
在本发明的另一方面,遗传修饰的微生物不一定内源性(天然)包含将木质纤维素材料转变为可发酵糖的酶或多酶产物,但经过遗传修饰能引入编码将木质纤维素材料转变为可发酵糖的至少一种酶、多种酶或多酶产物的至少一种重组核酸分子。这类微生物可用于本发明方法,或可用作粗发酵产物、部分纯化的重组酶和/或纯化的重组酶的生产微生物,其中任何一种均可用于本发明方法。
遗传修饰的植物
本发明也考虑到含有这种基因的遗传修饰的植物。可利用这些植物产生该酶,或作为木质纤维素材料而用作本发明方法底物。本领域了解产生重组植物的方法。例如,已经开发了许多植物转化方法,包括生物学和物理学的转化方法。参见例如,Miki等,将外来DNA引入植物的方法(Procedures forIntroducing Foreign DNA into Plants),刊于《植物分子生物学和生物技术方法》(Methods in Plant Molecular Biology and Biotechnology),Glick,B.R.和Thompson,J.E.编(CRC出版社,伯克莱屯(Boca Raton),1993)第67-88页。此外,可获得用于植物细胞或组织的转化和植物再生的载体和体外培养方法。参见例如,Gruber等,植物转化载体(Vectors for Plant Transformation),刊于《植物分子生物学和生物技术方法》(Methods in Plant Molecular Biologyand Biotechnology),Glick,B.R.和Thompson,J.E.编(CRC出版社,伯克莱屯,1993)第89-119页。
在本发明的某些实施方式中,根据土壤杆菌(Agrobacterium)的天然转化系统,将表达载体引入植物,以获得表达本发明酶的遗传修饰的植物。参见例如,Horsch等,Science,227:1229(1985)。根癌土壤杆菌(A.tumefaciens)和毛根土壤杆菌(A.rhizogenes)是植物致病性土壤细菌,其能遗传转化植物细胞。根癌土壤杆菌和毛根土壤杆菌的Ti和Ri质粒分别携带负责遗传转化植物的基因。参见例如,Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。许多参考文献描述了土壤杆菌载体系统和土壤杆菌介导的基因转移方法,包括Gruber等,同上,Miki等,同上,Moloney等,Plant Cell Reports 8:238(1989)和美国专利4,940,838和5,464,763,通过引用全文纳入本文。
在其它实施方式中,通过微粒轰击介导的转化获得遗传修饰的植物,其中DNA装载在微粒表面上。用生物射弹设备将微粒加速到足以穿透植物细胞壁和细胞膜的速度,以便将表达载体引入植物组织。Sanford等,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988),Sanford,J.C.,Physiol.Plant 79:206(1990),Klein等,Biotechnology 10:268(1992)。
本发明考虑的通过物理途径将DNA递送给植物的另一种方法是超声处理靶细胞。Zhang等,Bio Technology 9:996(1991)。或者,利用脂质体或原生质球融合将表达载体引入植物中。Deshayes等,EMBO J.,4:2731(1985),Christou等,Proc Natl.Acad.Sci.USA 84:3962(1987)。利用CaCh沉淀、聚乙烯醇或聚-L-鸟氨酸将DNA直接摄入原生质体己见诸报道。Hain等,Mol.Gen.Genet.199:161(1985)和Draper等,Plant Cell Physiol.23:451(1982)。对原生质体以及完整的细胞和组织进行电穿孔也已见诸报道。Donn等,第七届国际植物细胞和组织培养会议摘要(Abstracts of VIIth InternationalCongress on Plant Cell and Tissue Culture)IAPTC,A2-38,第53页(1990);D′Halluin等,Plant Cell 4:1495-1505(1992)和Spencer等,PlantMol.Biol.24:51-61(1994)。
使用鲁克文金孢子菌的酶和突变菌株的方法
本发明也提供对纤维素材料进行酶促糖化的方法。任何含纤维素的材料均可用本发明酶处理,其非限制性例子包括果园修枝物、灌木丛、工厂废料、城市废木料、庭园废料(yard waste)、市政废料、砍伐废料、森林疏伐品(thinning)、短期轮作木本作物、工业废料、小麦杆、燕麦杆、稻杆、大麦杆、黑麦杆、亚麻杆、甘蔗、玉米秸、玉米杆、玉米芯、玉米壳、大网茅草、鸭茅状磨擦禾、狐尾草;甜菜渣、柑桔渣、种子壳、纤维素动物废料、草坪修剪物、棉花和海草。
在某些优选实施方式中,先预处理木质纤维素材料再接触本发明的酶或酶混合物。通常,预处理是使木质纤维素材料的后续酶促糖化更有效率(即耗时较短或成本较低)的任何方法。例如,可通过以下方法预处理木质纤维素材料,所述方法包括但不限于:先接触酸、碱、溶剂、热、过氧化物、臭氧或其组合,然后进行酶促糖化。这些预处理也可与其它加工形式联合使用,其它加工形式包括例如:机械粉碎、粉碎、研磨或快速减压(如蒸汽喷发(steamexplosion))。
通常,本发明酶促糖化包括使用CBH Ia、CBH IIb、EG VI、BGL、XylII或其混合物。这些酶中的一种或多种可进一步与能够促进酶促糖化的其它酶组合,所述其它酶可能衍生自鲁克文金孢子菌、突变菌株或另一种生物体。例如,在一个实施方式中,酶促糖化涉及含有CBH Ia、CBH Ib、CBH IIb、EG II、EG V、BGL和Xyl II的酶混合物。在其它优选的实施方式中,酶混合物含有纤维二糖水解酶与β-葡糖苷酶如BGL,纤维二糖水解酶可以是CBH Ia、CBH Ib、CBH IIa、CBH IIb、和其混合物。
在某些实施方式中,酶组合物是含有纯化形式的CBH Ia、CBH Ib、CBHIIb、EG II、EG VI、BGL或Xyl II的人工酶组合物。这些酶的纯化形式可单独使用或混合在一起使用。在某些优选实施方式中,所选的纯化酶的含量高于野生型鲁克文金孢子菌的酶分泌情况。
在某些实施方式中,本发明提供能够表达CBH Ia、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL或Xyl II或其混合物的鲁克文金孢子菌突变株,其表达比例高于野生型生物体的酶分泌情况。这类鲁克文金孢子菌突变株的分泌酶可用作产生纯化形式的CBH Ia、CBH Ib、CBH IIa、CBHIIb、EG II、EG V、EG VI、BGL或Xyl II的原料。或者,这类突变株的分泌酶也可直接应用于准备糖化的纤维素材料。在特别优选的实施方式中,在有助于鲁克文金孢子菌突变株增殖的环境,如生物反应器中,使纤维素材料直接接触鲁克文金孢子菌突变株。鲁克文金孢子菌突变株原位分泌的CBIa、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL或Xyl II或其混合物的比例高于野生型生物体的酶分泌,导致纤维素材料的原位糖化增加。
通过本发明的酶组合物进行酶处理后,产生的可发酵糖可接触天然产生或遗传工程改造的微生物,从而能使糖发酵产生乙醇或其它增值发酵产品。优选地,将基本上所有葡萄糖转变为乙醇,乙醇随后可用作燃料、溶剂或化学反应物。在优选实施方式中,乙醇用作推动运输车辆的燃料,运输车辆的非限制性例子包括汽车、卡车、公交车、机动脚踏两用车和摩托车。来自葡萄糖的其它潜在发酵产品包括但不限于:生物燃料(包括乙醇);乳酸;塑料;专业化学品;有机酸,包括柠檬酸、琥珀酸和马来酸;溶剂;动物饲料补充剂;药品;维生素;氨基酸,如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸;工业酶,如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂合酶、氧化还原酶和转移酶;和化学原料。
实施例
实施例1:酶分离
利用鲁克文金孢子菌突变菌株产生的培养物滤出液分离单独的酶。市售制剂NCE-L600(鲁克文金孢子菌)来自美国戴阿迪克国际公司(DyadicInternational,Inc.,USA)。
由市售制剂获得来自日本曲霉(Aspergillus japonicus)的高度纯化的BGL(纤维二糖酶),纤维二糖酶比活为50U mg-1蛋白质(pH 5.0,40℃),用于水解不溶性纤维素的实验。
实施例2:酶纯化
在法玛西亚FPLC系统(瑞典)上进行层析,以便纯化酶。纤维二糖水解酶和内切葡聚糖酶BGL和Xyl II分离自鲁克文金孢子菌UV18-25培养物滤出液。BGL和Xyl II(木聚糖酶II)分别分离自克文金孢子菌UV18ΔCbh1#10和Xyl2-18突变菌株产生的培养物滤出液。
在所有情况下,第一个纯化阶段是在Source 15Q柱(40ml体积)上进行阴离子-交换层析。用0.02M双Tris-HCl缓冲液,pH 6.8平衡该柱。首先将初始培养物滤出液脱盐,并通过在阿克莱斯(Acrylex)P4(匈牙利瑞纳公司(Reanal,Hungary))上进行凝胶过滤转移到初始缓冲液中。将样品(400mg蛋白质)应用于Source 15Q柱,用0-1M的NaCl进行梯度洗脱,流速为10ml/分钟。
Source 15Q(以0.05M NaCl洗脱)后,第一种蛋白质组分具有高微晶纤维素酶活性,将该组分在Source 15异丙基柱(瑞典法玛西亚公司(Pharmacia,Sweden))上进行疏水相互作用层析。用50mM乙酸钠缓冲液,pH 5.0配制的1.7M硫酸铵平衡该柱。用1.7-0M硫酸铵反向线性梯度洗脱蛋白质,流速为4ml/分钟。对微晶纤维素活性最高的蛋白质组分(洗脱的盐浓度为0.30-0.35M)含有分子量为70kDa的同源蛋白(CBH IIb,参见图1)。
Source 15Q(以0.22M NaCI洗脱)后,蛋白质组分对微晶纤维素和p-NP-β-D-纤维二糖苷有活性,将该组分在Mono P HR 5/20柱(瑞典法玛西亚公司)上进行色谱聚焦,以便进一步纯化。用0.025M甲酸钠缓冲液,pH 4.0平衡该柱。用pH 4.5-3.0(用Polybuffer 74)梯度洗脱蛋白质,流速为0.5ml/分钟。色谱聚焦结果获得同源60kDa CBH Ib(图1)。
根据SDS-AGE和等电聚焦,两种新分离的纤维二糖水解酶同源(图1),发现其分子量分别为60和70kDa,pI为3.8和5.6。使用MALDI-TOF质谱进行肽质量指纹(数据未显示)显示,这些蛋白质不同于上述纤维二糖水解酶(Cel6A和Cel7A)以及以前分离的其它鲁克文金孢子菌酶。随后,利用串联TOF/TOF质谱(MS/MS)对由新纤维二糖水解酶产生的胰蛋白酶水解肽进行从头测序,然后利用BLAST检索SWISS-PROT(UniProtKB)数据库,显示60kDa和70kDa的蛋白质与来自GH家族7和6的纤维二糖水解酶具有序列相似性(表1,家族分类参见HTTP://afmb.cnrs-mrs.fr/CAZY/)。因此,它们的分类分别为Cel7B(CBH Ib)和Cel6B(CBH IIb)。因此,鲁克文金孢子菌真菌分泌不同基因编码的至少四种纤维二糖水解酶,其中两种属于糖基水解酶家族6(GH6),另外两种酶属于GH7家族(表2)。CBH Ia(Cel7A)和CBH IIb(Cel6B)的分子代表由柔性肽接头连接的催化域和CBM组成的典型纤维素酶。CBH Ib(Cel7B)和CBH IIa(Cel6A)的分子仅由催化域组成(它们缺少CBM)。应注意到,研究最充分的真菌里氏木霉只有两种纤维二糖水解酶:I(Cel7A)和II(Cel6A)。其它真菌,如特异腐质霉(Humicola insolens)也分泌两种纤维二糖水解酶(Cel7A和Cel6A),而黄孢原毛平革菌(Phanerochaetechrysosporium)产生至少七种不同的细胞生物水解酶,其中六种酶属于GH7家族。除黄孢原毛平革菌CBH 1-1(Cel7A)外,所有上述酶均具有CBM。
Source 15Q(以0.10M NaCl洗脱)后,由对p-NP-β-D-吡喃葡糖苷和纤维二糖具有最高活性的蛋白质组分分离BGL。对该组分进行上述疏水相互作用层析,以1.3M硫酸铵洗脱分子量为106kDa和pI为4.8的同源BGL。发现BGL对p-NP-β-D-吡喃葡糖苷和纤维二糖的比活分别为11和26U mg-1蛋白(40℃,pH 5.0)。纯化的BGL在pH 4.0时具有最优活性,在pH 2.5-6.5的范围内保持>50%的活性。最优温度为40℃。在60℃、50℃和40℃加热3小时后,该酶分别保持10%、64%和100%的活性。该酶对底物纤维二糖、龙胆二糖和昆布二糖具有高活性。利用槐糖、纤维三糖、纤维四糖、纤维五糖和纤维六糖作底物,也观察到弱活性。用乳糖或海藻糖作底物,没有观察到活性。
进行阴离子交换层析,然后进行上述疏水相互作用层析,并在Superose12HR 10/30柱(瑞典法玛西亚公司)上进行凝胶过滤,获得同源Xyl II(24kDa,pI7.9)。利用0.1M乙酸钠缓冲液,pH 5.0,流速为0.3ml/分钟进行最后层析阶段的洗脱。Xyl II的木聚糖酶比活为395U mg-1蛋白质(50℃,pH5.0,桦木木聚糖作底物)。该酶的最优pH为6.0,最优温度为70℃。Xyl II对底物木聚糖高度特异,对羧甲基纤维素(CMC)或大麦
如其它文献所述纯化鲁克文金孢子菌CBH Ia(65kDa)、CBH IIa(43kDa)、EG II(51kDa)、EG V(25kDa)、EG VI(47kDa)(参见Gusakov AV,Sinitsyn AP,Salanovich TN,Bukhtojarov FE,Markov AV,Ustinov BB,vanZeijl C,Punt P,Burlingame R.“鲁克文金孢子菌工业菌株产生的两种形式的热稳定性和高活性纤维二糖水解酶I(Cel7A)的纯化、克隆和鉴定(Purification,cloning and characterisation of two forms of thermostable andhighly active cellobiohydrolase I(Cel7A)produced by the industrial strain ofChrysosporium lucknowense)”Enzyme Microb Technol 2005;36:57-69;Bukhtojarov FE,Ustinov BB,Salanovich TN,Antonov AI,Gusakov AV,Okunev ON,Sinitsyn AP.“真菌鲁克文金孢子菌的纤维素酶复合物:内切葡聚糖酶和纤维二糖水解酶的分离和鉴定(Cellulase complex of the fungusChrysosporium lucknowense:isolation and characterization of endoglucanasesand cellobiohydrolases)”,Biochemistry(莫斯科)2004;69:542-51。
通过SDS-PAGE和等电聚焦鉴定酶纯度。利用Mini Protean II设备(美国伯乐实验室公司(Bio-Rad Laboratories,USA))在12%凝胶中进行SDS-PAGE。在111型IEF小单位(IEF Cell)(美国伯乐实验室公司)上进行等电聚焦。用考马斯蓝对蛋白质染色。
实施例3:肽的MALDI-TOF和串联TOF/TOF质谱
基本如Smith所述(Smith BE.蛋白质测序方法(Protein sequencingprotocols).Totowa:休曼出版社(Humana Press);1997)进行SDS-PAGE后,在凝胶中对蛋白质条带进行胰蛋白酶消化。将50mM NH4HCO3配制的胰蛋白酶(普洛麦格公司(Promega),改良的,5μg/mL)用于蛋白质消化。用含有0.1%三氟乙酸的20%乙腈水溶液提取凝胶中得到的肽,并进行MALDI-TOFMS(参见James P.(编)蛋白酶体研究:质谱(Proteome research:massspectrometry).柏林:施普林格弗莱格公司(Springer-Verlag);2001)。通过串联质谱分析CBH Ib和IIb的胰蛋白酶消化物的质谱选择肽,以便从头测定其序列。用Ultraflex TOF/TOF质谱仪(德国BD有限公司(Bruker DaltonikGmbh,Germany))进行MS实验。
实施例4:酶活性实验
在pH 5.0和50℃时,酶与0.5%羧甲基纤维素(CMC,中等粘度,美国西格玛公司(Sigma,USA))进行5分钟反应后测定释放的还原糖,以确定CMC酶活性(Sinitsyn AP,Chernoglazov VM,Gusakov AV.“细胞裂解酶的研究方法和特性(Methods of investigation and properties of cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990)。以与CMC酶活性相同的方式测定对大麦β-葡聚糖(澳大利亚麦格酶公司(Megazyme,Australia))和桦木木聚糖(美国西格玛公司(Sigma,USA))的酶活性,不同之处在于培育时间是10分钟。在pH 5.0和40℃时,酶与5mg ml-1微晶纤维素PH 105(德国色瓦公司(Serva,Germany))反应60分钟后分析释放的还原糖,以确定微晶纤维素酶活性。通过索莫奇-尼尔森(Somogyi-Nelson)方法分析还原糖(Sinitsyn AP,Chernoglazov VM,GusakovAV,“细胞裂解酶的研究方法和特性(Methods of investigation and propertiesof cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990;Somogyi M.,糖测定的注释(Notes onsugar determination)J Biol Chem 1952;195:19-23。按照Ghose的推荐方法测定滤纸活性(FPA)(Ghose TK.“纤维素酶活性的测定(Measurement of cellulaseactivities)”,Pure Appl Chem 1987;59:257-68)。
如其它文献所述,在pH 5.0和40℃测定对p-NP-β-D-吡喃葡糖苷、p-NP-β-D-纤维二糖和p-NP-β-D-乳糖苷(美国西格玛公司)的活性(GusakovAV,Sinitsyn AP,Salanovich TN,Bukhtojarov FE,Markov AV,Ustinov BB,van Zeijl C,Punt P,Burlingame R.“鲁克文金孢子菌工业菌株产生的两种形式的热稳定性和高活性纤维二糖水解酶I(Cel7A)的纯化、克隆和鉴定”,Enzyme Microb Technol 2005;36:57-69)。
通过葡萄糖氧化酶-过氧化物酶方法测定2mM纤维二糖释放葡萄糖的初始速率,以确定pH 5.0和40℃条件下的纤维二糖酶活性(Sinitsyn AP,Chernoglazov VM,Gusakov AV,“细胞裂解酶的研究方法和特性(Methods ofinvestigation and properties of cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990)。
所有活性均以国际单位表示,即1个活性单位对应于每分钟水解1微摩尔底物或释放1微摩尔还原糖(以葡萄糖计算)的酶量。
实施例5:纤维素底物的酶促水解
在磁力搅拌下,在pH 5.0的条件下对纤维素底物进行酶促水解。将微晶纤维素PH 105(德国色瓦公司)、用丙酮-乙醇混合物(1∶1)预处理2天以去除纤维素纤维表面的蜡的棉花和用有机溶剂预处理的花旗松木用作底物。
有关纯化的各纤维二糖水解酶水解微晶纤维素的过程动力学的实验和有关鲁克文金孢子菌纤维素酶(用棉花作底物)之间的协同相互作用的实验在40℃进行。这些实验中的底物浓度为5mg ml-1。为了消除产物(纤维二糖)对动力学的抑制作用并且将所有纤维素寡糖转变为葡萄糖,在来自日本曲霉的纯化BGL(纤维二糖酶)存在下进行水解,纯化BGL是额外过量(0.5U ml-1)加入该反应体系的。
通过纯化的鲁克文金孢子菌酶和粗制多酶制剂的组合对微晶纤维素、棉花和预处理的花旗松木进行酶促糖化的实验在50℃进行。这些实验中微晶纤维素和预处理木材的浓度为50mg ml-1,而棉花的浓度为25mg ml-1。
用以下方式进行典型的实验。称取一定量的干纤维素底物加入2-ml塑料试管中,然后加入0.5-1ml含有1mM NaN3的0.05M乙酸钠缓冲液,以防止微生物污染,将底物浸入该缓冲液1小时。然后,将该试管放入位于磁力搅拌器上的恒温水浴中,将相同缓冲液适当稀释的酶溶液加入底物悬液中,以将该反应体系的总体积调整至2ml并启动水解。用盖子密封该试管,通过磁力搅拌进行水解。在反应中的确定时间上,取等份悬液(0.05-0.1ml),稀释,15000rpm离心3分钟,通过葡萄糖氧化酶-过氧化物酶和索莫奇-尼尔森方法测定上清液中的葡萄糖和还原糖浓度。在这些情况下,当葡萄糖是该反应的单一产物时,用下式计算底物转化程度(对于微晶纤维素和棉花,代表纯纤维素底物):
一式两份地进行动力学实验。蛋白质浓度是反应体系中酶载量的衡量。在纯化酶的情况下,利用ProtParam工具(http://www.expasy.ch/tools/protparam.超文本标记语言)预测的酶消光系数,由280nmUV吸光度计算蛋白质浓度。对粗制多酶制剂而言,通过Lowry法,利用牛血清白蛋白作为标准品测定蛋白质浓度。
CBH Ib和IIb在pH 4.7和5.0显示最大活性。在pH 5.0和50℃培育24小时期间,这两种酶是稳定的。pH 5.0和6℃条件下,微晶纤维素上酶吸附的研究表明,只有CBH IIb具有CBM。用微晶纤维素(25mg ml-1)搅拌培育CBH Ib和IIb(1mg ml-1)30分钟后,蛋白质吸附程度分别为65和99%。应该注意到,在相同条件下鲁克文金孢子菌CBH Ia的催化结构域的吸附程度为59%,而完整大小的鲁克文金孢子菌CBH Ia(含有CBM的酶)为89%。
CBH IIb对微晶纤维素具有高活性,并具有非常低的CMC酶活性,而对合成的二糖的对-硝基苯基衍生物完全没有活性(表2)。CBH Ib具有较低的微晶纤维素酶活性,但能水解对-NP-β-D-纤维二糖苷和对-NP-β-D-乳糖苷,它是纤维素酶家族7中的典型酶。为了进行比较,表2也给出以前分离的鲁克文金孢子菌纤维二糖水解酶(现在称为CBH Ia和CBH IIa)的比活。
图2显示所有纯化的鲁克文金孢子菌纤维二糖水解酶水解微晶纤维素的过程动力学,其中这些酶被蛋白质浓度(0.1mg ml-1)所平衡。为了消除产物(纤维二糖)对动力学的抑制作用,在来自日本曲霉的纯化BGL(纤维二糖酶)存在下进行水解,而纯化BGL过量(0.5U ml-1)加入该反应体系。
在所检测的几种纤维二糖水解酶,包括其它三种鲁克文金孢子菌酶(CBH Ia、Ib、IIa)中,观察到鲁克文金孢子菌CBH IIb的水解速率最高:3.2mg ml-1葡萄糖,即水解5天后实现58%纤维素转化(参见图2)。鲁克文金孢子菌CBH Ia(具有CBM)的效率明显较低(5天后葡萄糖产率为2.5mg ml-1,它对应的纤维素转化程度为46%)。不出所料,无CBM的鲁克文金孢子菌纤维二糖水解酶(CBH Ib和IIa)水解微晶纤维素的能力最低:相同反应时间后只有23和21%纤维素被转化。
具有CBM的两种鲁克文金孢子菌纤维二糖水解酶(Ia和IIb)与来自同一真菌的三种主要内切葡聚糖酶(EG II、EG V、EG VI)在棉花水解中有明显协同作用,它们之间也有强烈的协同作用(表3)。在这些研究中,在所有情况下,棉花的浓度为5mg ml-1,CBH浓度为0.15mg ml-1,而EG浓度总是0.05mg ml-1。为了消除产物对动力学的抑制作用并且将中间体寡糖转变为葡萄糖,在来自日本曲霉的纯化BGL存在下进行水解,而纯化BGL过量(0.5Uml-1)加入该反应体系。该实验在pH 5.0和40℃进行140小时。
如表3所示,单独的纤维二糖水解酶CBH Ia和CBH IIb,以及单独的内切葡聚糖酶在所测定条件下不能完全水解棉花。在水解140小时后,CBHIIb的葡萄糖产率最高:1.18mg ml-1,其对应的底物转化程度为21%。然而,当任一纤维二糖水解酶与内切葡聚糖酶共同培育时,均观察到显著的协同作用。CBH Ia或CBH IIb与EG II联用时获得最高的葡萄糖产率(4.1-4.7mgml-1),协同系数的范围是2.6-2.8。在CBH Ia和CBH IIb之间也观察到强烈的协同作用(Ksyn=2.75)。实际上,两种纤维二糖水解酶(重量比1∶1)与BGL联用时,水解140小时后能够将棉花纤维素基本上完全转化(98.6%)为葡萄糖。
例如,CBH IIb与其它鲁克文金孢子菌酶联用时水解棉花的过程动力学见图3,其中实际实验数据用空心符号(连续曲线)表示,而在单独酶作用下获得的理论葡萄糖浓度和用实心符号表示(虚线)。在单独的纤维二糖水解酶和内切葡聚糖酶和其组合的作用下,棉花水解140小时后获得的葡萄糖产率小结于表3。通过实验葡萄糖浓度(表3的第2列)与理论葡萄糖浓度和(第3列)的比例计算协同系数(Ksyn)。
使用四种纯化的鲁克文金孢子菌酶(CBH Ia和IIb、EG II、BGL),构建人工纤维素酶复合物(C.l.组合#1),该复合物显示将不同纤维素底物转变为葡萄糖的能力极高(图4-6)。与粗制的鲁克文金孢子菌多酶制剂NCE-L600相比,此种多酶组合物水解纯结晶纤维素(棉花和微晶纤维素)的效率明显更高。在木质纤维素底物(有机溶剂预处理的花旗松木)的72小时水解过程中,C.l.组合#1也能非常有效地水解纤维素。
在鲁克文金孢子菌组合#1中,酶由两种纤维二糖水解酶CBH Ia和CBHIb以及内切葡聚糖酶EG II组成,该酶对结晶纤维素有强烈的吸附能力(这些酶的分子具有CBM)。在不溶性纤维素水解过程中,酶沿底物表面的迁移受限或无价值结合(所谓的假灭活)导致紧密吸附的纤维素酶的活性逐渐降低。如果不希望受理论束缚,应相信紧密和疏松吸附的纤维素酶之间可能存在协同作用,其中疏松结合的纤维素酶(无CBM的酶)可能破坏阻碍紧密吸附的纤维二糖水解酶持续作用的障碍,从而帮助它们移动到下一个纤维素反应性位点。反应体系中的蛋白质总浓度为0.5mg ml-1。多酶组合物(C.l.组合#1)的组成如下:0.2mg ml-1CBH Ia+0.2mg ml-1CBH IIb+0.08mg ml-1EG II+0.02mg ml-1BGL。这些实验中用微晶纤维素(50mg ml-1)和棉花(25mg ml-1)作为底物,代表纯的结晶纤维素。用有机溶剂预处理的花旗松木样品(50mgml-1)用作可用于生物转化为乙醇的实际木质纤维素原料的例子。这些研究中取粗制的鲁克文金孢子菌多酶纤维素酶制剂NCE L-600(通过稀释使反应体系中的蛋白质浓度也为0.5mg ml-1)进行比较。也在额外添加的日本曲霉BGL(0.5U ml-1)的存在下进行使用它们的水解实验。
通过不同纤维素酶多酶制剂水解棉花、微晶纤维素和花旗松的过程动力学见图4-6。应注意到,在所有情况下,在具体实验中水解24-72小时后葡萄糖和还原糖的浓度基本相同,即葡萄糖占总可溶糖的>96%。因此,葡萄糖产率可用作比较不同多酶样品的水解效率的可靠标准。
在棉花水解中(图4),反应72小时后,纯化的鲁克文金孢子菌酶的组合#1的葡萄糖产率(23.4mg ml-1,即底物转化程度为84%)远远高于NCE-L600的4.2mg ml-1。在微晶纤维素水解中(图5),C.l.组合#1也较优(45.0mg ml-1葡萄糖,或者水解72小时后底物转化率81%)。在预处理的花旗松的情况下(图6),C.l.组合#1也是有效的(28.8mg ml-1葡萄糖,72小时后转化率为63%)。
与微晶纤维素和棉花不同,预处理的木材样品不仅含有纤维素(~85%),而且含有木素(13%)和半纤维素(2%)。人工鲁克文金孢子菌四种酶的组合#1仅由纤维素酶组成;除BGL外,所有这些酶均具有CBM。所有其它多酶样品不仅具有纤维素酶,而且具有木聚糖酶和其它类型的糖酶活性,即它们含有非纤维素酶附属酶。这可以解释与疣孢青霉(P.verruculosum)#151制剂相比,C.l.组合#1对预处理的花旗松的效率相对较低(图6)。
在一组实验中(图7),纯化鲁克文金孢子菌酶的不同组合物水解预处理的木材样品,该组合物中包含缺少CBM的纤维素酶(EG V或者EG V和CBHIb组合)。将反应体系中的总蛋白质浓度维持在相同水平0.5mg ml-1(表5)。实际上,与C.l.组合#1相比,含有弱吸附酶的两种C.l.组合(#3和#4)在酶反应72小时后葡萄糖产率显著提高。
在两个实验中,将高活性的鲁克文金孢子菌Xyl II(Xyn11A)加入上述四种酶(C.l.组合#2和#4)中。由于紧密和松散吸附的纤维素酶之间的协同作用已有描述[38],所以在C.l.组合#3和#4中使用EG V或者EG V与CBH Ib(两种酶均缺少CBM)。
如图7所示,从C.l.组合#1至组合#4,葡萄糖的初始形成速率逐步降低,然而水解2-3天后葡萄糖产率以相同顺序提高。Xyl II证明对葡萄糖产率只有轻微的正效应,而与C.l.组合#1(29mg ml-1)相比,EG V或EG V与CBH Ib在水解木材72小时后产物浓度明显提高(分别为37和41mg ml-1),即组合#3和#4的效果显著优于所有粗制多酶样品(图6)。
需要特别关注粗制鲁克文金孢子菌制剂(NCE-L600)在水解不同纤维素底物中的低性能(图4-6)。如果不希望受理论束缚,可解释为在NCE-L600中不同纤维素生物水解酶的总含量低(占总蛋白质含量的35-40%)。而且,四种鲁克文金孢子菌纤维二糖水解酶中的两种(Ib和IIa)缺少CBM,而另外两种酶(CBH Ia和IIb)在发酵过程中也部分丢失了CBM。NCE-L600中大部分纤维二糖水解酶缺少CBM可能导致粗制剂对结晶纤维素的活性较低。
表3
pH 5.0和40℃,有0.5U ml-1日本曲霉BGL存在下,鲁克文金孢子菌纤维素酶水解棉花纤维素(5mg ml-1)时的协同作用。在所有情况下,CBH浓度为0.15mg ml-1,EG浓度为0.05mg ml-1。
a按照单个酶作用下获得的葡萄糖浓度和进行计算。
表4
在pH 5.0和50℃下多酶制剂对不同底物的比活(U mg-1蛋白质)
a在40℃测定活性。
表5
基于纯化的鲁克文金孢子菌酶的人工多酶组合的组成和pH 5.0、50℃水解预处理的花旗松木(50mg ml-1)72小时后的葡萄糖产率。反应体系中的蛋白质总浓度为0.5mg ml-1,各组分浓度和葡萄糖产率的单位是mg ml-1。
序列表
<110>二进国际(美国)有限公司(Dyadic International,Inc.)
A.V.乌萨科夫(GUSAKOV,Alexander V.)
T.N.萨拉诺维奇(SALANOVICH,Tatyana N.)
A.I.安托诺夫(ANTONOV,Alexey I.)
B.B.乌斯季诺夫(USTINOV,Boris B.)
O.N.奥库涅夫(OKUNEV,Oleg N.)
R.伯林盖姆(BURLINGAME,Richard P.)
M.艾玛尔法伯(EMALFARB,Mark A.)
M.巴埃斯(BAEZ,Marco)
A.P.西尼岑(SINITSYN,Arkady P.)
<120>用于酶促水解纤维素的高效纤维素酶组合物的构建
<130>3123-4008PC
<140>PCT/US2006/027347
<141>2006-07-13
<160>18
<170>PatentIn 3.3版
<210>1
<211>6360
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>1
ctcagattct aggggtaggg cgggagcaga ggcgaaaatt gggttgtaga atatgaggag 60
ctagggttgt taaactcaaa gaacttcttg ctcttgttct tagtcttctc tcctgggaaa 120
agggggtttt tccgaaagcg gcgctatacg aagccagagg ctactttcct tgctttggat 180
ggcccttgtc caccgttctt gtttcccgtt tgtcaattgc gacgttgccg gcaacctagg 240
tcctaataat taggtagata tttcggtaga ggtagtttaa ttatgcttca gtagagaaat 300
cgttgtctcc acgtctcgca accttgcgaa acttcgccac attgaagata gcattgtctg 360
agttgatttt aaccctttcc agagacgata taatagtgca agtttctttg atcggaatca 420
tcgacattcg gattttccct taattatatg aagtattcgg cccacggaac cgggccccga 480
gcaggttgaa ccgcgcaaaa cctcaaccga gtcacctcgc gtccatgttt gtcatggaat 540
caggctccga atcccgtcag atcagtcagt tctggtggct atggacgcgg gagttacggc 600
cagtcgtccc gttgttctgg ggggttgatc aacaggagga agagatctga gatcgaacta 660
cacccattga tttatcgacg cataatcaag tttaataaaa accaaacagc gtgtttggtg 720
ctaccaccga atgcgagatc cgggctagcc cgcggaagga tgatggccac agatctagcg 780
tcatgtatga ttattaccta tgcatctatc ttcgtatctg cctcgggttg gcaacacctg 840
accgagagac gactcgacaa cctgacactt ggcaaaagac atttcggttg acagcgggag 900
aactccagcg aggaagtcgc ccagagatgc ggatgagaag acaacgccga gacgtgccgg 960
cgttggctct ccacgaatcg gagccgactc ttccgtttgg ccaatctccg ggataaatcc 1020
cagcggcggg tcacgtcacg tttcatgggg aggcgcggac agccatccca gccaggccat 1080
ggaagagaac aattcttggg ggtagcgacc gagccaaaag gggggggggg gaagcgggag 1140
gggaagaagt ggtattagag cacgcaccgg aaaacgcatt tgggcccttg ccaacaaaca 1200
ccacaccccg cgtcctggga gcaagacatc caggatgcaa cccagtaggg gatgccaaga 1260
agcatctacg gcaccatctg ccggcgcctc gcctgttaga gtcccggcac ccgccaatgg 1320
ggccgtgctg ggccctgccc ggcaatgctg gcgcagcggc atcaacaaca ttgctcgggg 1380
aggggcccga ttttattgat tagcaaaaaa acaattaaat tacccttcca ttccagcaga 1440
gcttctcctc cacgcggcgg cgggaccgct tgtggacggc ggtacactac aaccgcgggg 1500
ctccagtctc cgtgctgggc gtgcagatca cgacccggaa gagaaatgat cgcggtctga 1560
cgccgggtac ggagtactga gccgccaacc acagccgatg gaccgtgata tctcaatgcg 1620
ttcaagcaac acagcaacac cctggacgag tctctcctcc cctaccaccc cctccccccc 1680
tgccctggcc gcgaacgggg cgcgtacccc agatttctac tccgtactga caccccaatc 1740
tattcccgct ggcgtcgccc agtctggggc ggtccggcca agactctcgg tgcacgatac 1800
cgcgacgaaa tcggattaac cgttggctga tcaattccaa gtcaagggag aagtggtatg 1860
gaaagtcggc tcagttttcc actgcccccg acaggcaggt tccggatctg gacagcagtc 1920
ttccgaatct ttggcagaga ctcatgataa tataaaaagg caaatgaggc ggcgccttgg 1980
acaggtccat tctcccaccg ctcaaccagc ctccaattcc tcagaagtct gttgctctct 2040
cgcagtcgca gtcaagatga agcagtacct ccagtacctc gcggcgaccc tgcccctggt 2100
gggcctggcc acggcccagc aggcgggtaa cctgcagacc gagactcacc ccaagctcac 2160
ttggtcgaag tgcacggccc cgggatcctg ccaacaggtc aacggcgagg tcgtcatcga 2220
ctccaactgg cgctgggtgc acgacgagaa cgcgcagaac tgctacgacg gcaaccagtg 2280
gaccaacgct tgcagctctg ccaccgactg cgccgagaat tgcgcgctcg agggtgccga 2340
ctaccagggc acctatggcg cctcgaccag cggcaatgcc ctgacgctca ccttcgtcac 2400
taagcacgag tacggcacca acattggttc gcgcctctac ctcatgaacg gcgcgaacaa 2460
gtaccagatg ttcaccctca agggcaacga gctggccttc gacgtcgacc tctcggccgt 2520
cgagtgcggc ctcaacagcg ccctctactt cgtggccatg gaggaggatg gcggtgtgtc 2580
gagctacccg accaacacgg ccggtgctaa gttcggcact ggggtaagtt caacgacccg 2640
agacgggtgc ccttattatc tgctgcgaaa acggacggtc cccttttgct aactaccctc 2700
ctccaaacag tactgcgacg cccaatgcgc acgcgacctc aagttcgtcg gcggcaaggg 2760
caacatcgag ggctggaagc cgtccaccaa cgatgccaat gccggtgtcg gtccttatgg 2820
cgggtgctgc gctgagatcg acgtctggta agttttgttg cctgggcagc aatggtatat 2880
tagctcgagt ggttcccgtc gttgctgacc ctctcttacc agggagtcga acaagtatgc 2940
tttcgctttc accccgcacg gttgcgagaa ccctaaatac cacgtctgcg agaccaccaa 3000
ctgcggtggc acctactccg aggaccgctt cgctggtgac tgcgatgcca acggctgcga 3060
ctacaacccc taccgcatgg gcaaccagga cttctacggt cccggcttga cggtcgatac 3120
cagcaagaag ttcacgtgag tacaccgtgc ttgaagcccc ctcccccccc ccccccaaaa 3180
aaaaaaagaa aaaagaagtc aaatgattga tgctaaccaa atcaaataac agcgtcgtca 3240
gccagttcga ggagaacaag ctcacccagt tcttcgtcca ggacggcaag aagattgaga 3300
tccccggccc caaggtcgag ggcatcgatg cggacagcgc cgctatcacc cctgagctgt 3360
gcagtgccct gttcaaggcc ttcgatgacc gtgaccgctt ctcggaggtt ggcggcttcg 3420
atgccatcaa cacggccctc agcactccca tggtcctcgt catgtccatc tgggatgatg 3480
tacgttacct aacccccccc cccttttttt ttcccgcttc tctccccgaa actgccacta 3540
cttatatacg tcccgcgtcc atgatgctta ccttttctcc ttccagcact acgccaatat 3600
gctctggctc gactcgagct acccccctga gaaggctggc cagcctggcg gtgaccgtgg 3660
cccgtgtcct caggactctg gcgtcccggc cgacgttgag gctcagtacc ctaatgcgtg 3720
agtcgaaacc gtaaaatgtc gggcaaaaaa aagatcgctc aagctaacga aataatatga 3780
ttagcaaggt catctggtcc aacatccgct tcggccccat cggctcgact gtcaacgtct 3840
aaactgcaac ctgaccgggc cctttctctc cacccccacc cctctcaagt tctctctggt 3900
ggagccctcg tgtccttctt ttcctaggtt cgcgaacctt tgagcttgtg tatcgtaggg 3960
tcattgtgta catacacaaa aacttaacat ctgctaccaa gatcttggcg ctttgccagg 4020
tcttctcaaa cctcgaagca ctgagccttt gtcctccgag tgaagtagga tgactattta 4080
cgttgcaaga ctacgcggta aaggggacgg agcagacctg ccacagatat tcgtttggtt 4140
gcttgattta tagcagagtc cgaacgtaga catggcccct gaaggtgcca accctagata 4200
gccagaagcc ttgttttacg aaagggtggt caaccaacgg tgctcctcgc tcagcgaatc 4260
tacccgcacg caatgtatcg taagaatgtg aactaaaggg aacgacgagg catagggaaa 4320
cgtcaatgtg gcttgaataa cagagttaaa tacctaatag aagaaattag catgccaaga 4380
ttgagccagc aacacatggt agaatagcca gcaaaggacg cttgttcgct tgatctcgaa 4440
ccgtccaacc tgattcgaag gaggagggaa aagttgaaga ataccggcaa taattactcg 4500
aggttcctat gccctgcaga gtctaattaa tattaaaggc accacccgca tgattccgca 4560
attataagca taataagctc gcgggcccca cacgtgcctt caccctccca tgtgtataca 4620
atctgtacct cgttattgtc gaatcgctat tccgatagcg aaggtctggc actcatcaga 4680
taccgtgaca tcgattgaga tttggccggg ccaccggtag taagcgatga gttggtcatc 4740
aattatcaac aatgcgctca atcagcgata atcagcctat caaccgcgaa atcatacgcg 4800
catcaacgaa ttgtccatca tgcacgtagc ttgtcggcag tgccgcatac cctccagagc 4860
atcatagccg ggatagaaag ctcgctttca gccgtcccag agtccgagat gcaggtagca 4920
agccttcaag accagttata tgtgacccgg gtaaaatact tggtgagatg caatgggcgt 4980
agcttcgggc acttataagc tttactagat attatctcaa ggtttctttt tgaactcctc 5040
ctagacattt actataaact accgagcttc aatgctagac gccctccttc tgttaaatag 5100
tcttttcctt ctaagagcat ctgccttttt tcccttaggc ttagaggata gggcccctcc 5160
atcttgctgc gacggcctta gccttgggga gtaattattg gtatccgcgt acctgtttcc 5220
cagacagccg aagtttcgac gacaaagtaa ttattgcgac aataccaccg ccatatgcta 5280
ttccgagtgg gtgagccccg aaaacatcgc ttaccgcatc gccatcccag acgacagagg 5340
gcgactttga tgtcttgctc cagatcgccg cacctaacac ggtgggatgg gctggtatcg 5400
tatgggacgg catcatggtc aacaaccccc tgacggggtg ttgggccaat ggaaacacca 5460
ccgttgtctc gagccggatc gcaaggtaag ccgaagagga caaatgacga tgagactttc 5520
tttctttttt attttatttt tttttaaatt tcttttttaa gcgtaatgaa aagagctaca 5580
tatctgtggt tcgttcctca atttcagcga cctctccacc gaagcatcgt caaataagaa 5640
gttgtcggaa acaaagggtg tcagaagcta tagagcttct aaggatatta gccacataca 5700
tgccatagct gtataaggct atttaacgct ttggccagct cctttgtcta taaatattag 5760
tcgttttgtc tcctttgtag ataattttaa caaggcactc ttttccttta tatagccacc 5820
tactatagac tgctttcaac gctcccggaa gcttattact acgttcggca gttataagcc 5880
tggcgccttg actactcctc tgccgacgta tctttaatat tagtagtagc ttcttctatt 5940
acgaactctc ttaccctgct ttaatacgct ttcgacgacg tgtctattat atctaagatc 6000
ctagtcgaga cttctatatg ccttactagg cctagttctt agaacttgta gtatattaaa 6060
ctatagttat aggctaaatt tgctagtata tagagatttg ttaaccttaa tagtaattat 6120
aaactagatc tagaagtttt atagtgccta acctataaat aagctagaga taaccttatt 6180
ttagcttcct aggagtaatt cctagaagga gtattacctt taatatctat agatttgata 6240
ccttctaata tagctatcat agctaaattt atataattat aagattcctt ttataaaaat 6300
attatatata ctatagatat tagtaagtag ataggatagc tataatacta gctagtatat 6360
<210>2
<211>450
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>2
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1 5 10 15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
20 25 30
Lys Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
35 40 45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
50 55 60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65 70 75 80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
85 90 95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
100 105 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
115 120 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
130 135 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145 150 155 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
165 170 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
195 200 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
210 215 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225 230 235 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
245 250 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
260 265 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
275 280 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
290 295 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305 310 315 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
325 330 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
340 345 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
355 360 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
370 375 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385 390 395 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
405 410 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
420 425 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
435 440 445
Asn Val
450
<210>3
<211>3900
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>3
ccgcaagtga atatgtaatt actcaatgga agttctcgaa acggagtcca gaaatgatgt 60
ggttctgtgg gaatgcggca agaggcgacg ttgccgtgaa tgcgtgaaca ttcccgcctc 120
ttcttcttct cgtcttcttc cttcttcttc tttcgggtcg cggatggttg acggccagcg 180
tgcgcacggc tgcgtgttat cgagcgtcgg tacgtctagc caacatcccg tagacacgac 240
gaccaagcgt cttgagaatg caacaacgtc tcggaacctg gcacgcatct tccgccgcag 300
gtcggcagac gccgcctggg caataccacc cctgtccagg ccctttcccc gcaggcagag 360
ccgcgctctt cctttcatgg ttattcagga acgtggcttc cgagattctc gcctgttctc 420
ccccagtcaa cctgccgacc gtaacccggt tccaccaccg cggactgtcc gcaaaacctg 480
gttcgcccga gattaatatg ctatttccgg actaagtgca caacacacaa gcaccccttc 540
cgcctcgcgc tctagaatct gctttctaac ccggttctcg ggcccttccc tttcgcgacg 600
cctccgctct ccttaccagg caccatccgc aataggtaag gtagccaacc gttttggagc 660
gtgattctgc caaggaccgc atccttgcat tcgccatctg gtcaaggacc cctctttccc 720
gctccattct ggtggctcta tcgggacggc gttccccatg gctctccagg agagtgatgt 780
gcgagtctgg agagccgggg ttggcgtcac gatgctgccc acctagggcc ggccagcccg 840
gcactgcgct cccgttgatc cgtctatccc cgtcaagagc accagccccg gcgctcgtga 900
attttcgact tgttcgactt gctacaggtg ataaagagga tgcacgccgc cctcgatcgg 960
cctgtgtggt ttctctccct cgtgccaaac cactcccacc tcccgccccg agatagttgc 1020
ttgtttcgct ccgtgagagg gacacacacc aatggccaag aagcttttca tcaccgccgc 1080
gcttgcggct gccgtgttgg cggcccccgt cattgaggag cgccagaact gcggcgctgt 1140
gtggtaagaa agcccggtcc gagtctccca tgattttctc gtcgagtaat ggcataaggg 1200
ccaccccttc gactgaccgt gagaatcgat caaatccagg actcaatgcg gcggtaacgg 1260
gtggcaaggt cccacatgct gcgcctcggg ctcgacctgc gttgcgcaga acgagtggta 1320
ctctcagtgc ctgcccaaca gccaggtgac gagttccacc actccgtcgt cgacttccac 1380
ctcgcagcgc agcaccagca cctccagcag caccaccagg agcggcagct cctcctcctc 1440
ctccaccacg cccccgcccg tctccagccc cgtgaccagc attcccggcg gtgcgacctc 1500
cacggcgagc tactctggca accccttctc gggcgtccgg ctcttcgcca acgactacta 1560
caggtccgag gtccacaatc tcgccattcc tagcatgact ggtactctgg cggccaaggc 1620
ttccgccgtc gccgaagtcc ctagcttcca gtggctcgac cggaacgtca ccatcgacac 1680
cctgatggtc cagactctgt cccaggtccg ggctctcaat aaggccggtg ccaatcctcc 1740
ctatgctggt gagttacatg gcgacttgcc ttctcgtccc ctacctttct tgacgggatc 1800
ggttacctga cctggaggca aaacaacaac agcccaactc gtcgtctacg acctccccga 1860
ccgtgactgt gccgccgctg cgtccaacgg cgagttttcg attgcaaacg gcggcgccgc 1920
caactacagg agctacatcg acgctatccg caagcacatc attgagtact cggacatccg 1980
gatcatcctg gttatcgagc ccgactcgat ggccaacatg gtgaccaaca tgaacgtggc 2040
caagtgcagc aacgccgcgt cgacgtacca cgagttgacc gtgtacgcgc tcaagcagct 2100
gaacctgccc aacgtcgcca tgtatctcga cgccggccac gccggctggc tcggctggcc 2160
cgccaacatc cagcccgccg ccgagctgtt tgccggcatc tacaatgatg ccggcaagcc 2220
ggctgccgtc cgcggcctgg ccactaacgt cgccaactac aacgcctgga gcatcgcttc 2280
ggccccgtcg tacacgtcgc ctaaccctaa ctacgacgag aagcactaca tcgaggcctt 2340
cagcccgctc ttgaactcgg ccggcttccc cgcacgcttc attgtcgaca ctggccgcaa 2400
cggcaaacaa cctaccggta tgtttttttt tcttttgtct ctgtcccccc cttttctccc 2460
ccttcagttg gcgtccacaa ggtctcttag tcctgcttca tctgtgacca acctcccccc 2520
ccccggcacc gcccacaacc gtttgactct atactcttgg gaatgggcgc cgaaactgac 2580
cgttccacag gccaacaaca gtggggtgac tggtgcaatg tcaagggcac cggctttggc 2640
gtgcgcccga cggccaacac gggccacgag ctggtcgatg cctttgtctg ggtcaagccc 2700
ggcggcgagt ccgacggcac aagcgacacc agcgccgccc gctacgacta ccactgcggc 2760
ctgtccgatg ccctgcagcc tgcccccgag gctggacagt ggttccaggc ctacttcgag 2820
cagctgctca ccaacgccaa cccgcccttc taaacctcgt cataaagaga gagagatggc 2880
gggcatgggc ctgattgggt tcattgacca tgcggctctt ctgggggtac atattttacc 2940
tacctaccta taaataaggc ggcctatcgg gctctcgctt cgtttattag gtacttgttc 3000
ttgtacatac tttgtttata catacagcag ttagcatcca ctattcgttt cgacaaagcg 3060
gaactttcca gaaaaaaaaa ggttgtacat aattagtctt taggcttcga ttctttgtgc 3120
ctttcttttt ggtaaaaaaa aaattttttt tgaggcatga ttaccttagg tacgttcgtc 3180
gttgtattgg tccccctgca ttttggcgcg agagcagctc agccccttgc aaatccctca 3240
acgggcgttc aattccctcc actcgggtct tcagcgagac cagccgtcca gagtatccca 3300
gcgtgtagtt gccccacgaa ccagtcgtcc tcgtaagcct cgtcaaagtg tccaagagca 3360
gtatagaagc aacgacctcc gtcaaaagtc tggcaccatg cgatcgggtg gtcctccccg 3420
tgcgccccgc cctcgtagga cttctcatcc acgccaagga gcacgtgcag gccgtcggac 3480
gtcgcccgcg ggtgcgcctt gaagttgtac cattcgtcct tccagacgcg ctccagctgc 3540
gcctgcttgg gttcctgcgg ttcctgcggt tcctgcgctg gccggtcggc gccgccgtct 3600
tggtcacacg cccgcagcga catgactggg tgtttcgggt cgagcagctt gacgagcccg 3660
acctggggtt ccgggtggtt gtcgaacacg gcgccaatga ggtggccgta ccattcggat 3720
gactgcatgg cgaagctggc gcagtgtacc gccacgatcc cgccgcccgc ctggacgaaa 3780
ccccgcaggg cgcccagctg cgcgccgtcc aggaactcgc ccgagcactg caggaggacg 3840
atgacgcgat acgccgagag ggagccgggg ctgaacacgg cgggatcctc gctgtcgtcc 3900
<210>4
<211>481
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>4
Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu
1 5 10 15
Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Thr Gln
20 25 30
Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly Ser
35 40 45
Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn Ser
50 55 60
Gln Val Thr Ser Ser Thr Thr Pro Ser Ser Thr Ser Thr Ser Gln Arg
65 70 75 80
Ser Thr Ser Thr Ser Ser Ser Thr Thr Arg Ser Gly Ser Ser Ser Ser
85 90 95
Ser Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile Pro
100 105 110
Gly Gly Ala Thr Ser Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala Val
145 150 155 160
Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Met Val Gln Thr Leu Ser Gln Val Arg Ala Leu Asn Lys Ala
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg Lys
225 230 235 240
His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu Pro
245 250 255
Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys Ser
260 265 270
Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala
305 310 315 320
Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro Ser
340 345 350
Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala
355 360 365
Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg Phe Ile Val
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala
405 410 415
Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Gln
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210>5
<211>1648
<212>DNA
<213>鲁克文金孢子菌(Chyrsosporium lucknowense)
<220>
<221>misc_feature
<222>(812)..(812)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(1162)..(1162)
<223>n是a、c、g或t
<400>5
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc 60
tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc 120
agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg 180
accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat 240
ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc 300
atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc 360
aacatcggct cgcgtaccta cctgatggag agcgacacca agtaccagag taagttcctc 420
tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt 480
ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct 540
caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg 600
caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct 660
caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa 720
cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa 780
catggccgcc gccttcactc cccacccttg cnccgtgatc ggccagtcgc gctgcgaggg 840
cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg 900
atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt 960
cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct 1020
ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac 1080
catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc 1140
cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct 1200
cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg 1260
gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg 1320
ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat 1380
cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg 1440
cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac 1500
atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg 1560
aggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct 1620
gaatgactgg tactcgcagt gcctgtaa 1648
<210>6
<211>526
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<220>
<221>misc_feature
<222>(249)..(249)
<223>Xaa可以是任何天然产生的氨基酸
<220>
<221>misc_feature
<222>(365)..(365)
<223>Xaa可以是任何天然产生的氨基酸
<400>6
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1 5 10 15
Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser
35 40 45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala
50 55 60
Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp
65 70 75 80
Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser
85 90 95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Asn Leu Lys Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
195 200 205
Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225 230 235 240
Ala Ala Phe Thr Pro His Pro Cys Xaa Val Ile Gly Gln Ser Arg Cys
245 250 255
Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
275 280 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
290 295 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
325 330 335
Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys
340 345 350
Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys
355 360 365
Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu
370 375 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly
405 410 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala
420 425 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro
450 455 460
Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser
465 470 475 480
Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu
485 490 495
Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro
500 505 510
Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210>7
<211>4376
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>7
ggatccacac ctaccatacc ggatagtatg ctacccaagt gacatagggt tggtaaagta 60
atacgagaac tcagagagca ctgcccatat ggctcgccaa tgacctcaag tgccaggtca 120
gctttgcgag acagacctga gcgcgtcgga tgtgtgacat ggaacgcgcc ggatcgcctt 180
gttgattaat tatagggaag tagcgaggaa ggtttcagca attgacgtga gcgtacatta 240
aaagctgtat gatttcagga agacgagcca tggaccaggt ttcaaggctg aatggcttga 300
cgacttaagc accgaacgag gaatgaaaga atgaaaagtg ggggatcatt ctggcccctc 360
ctcgtatgtc gagtgttaaa gaaggcggtt ctacggagga cctaaagagc tccaatttgc 420
tctgttgagc ttaagccaca tatctcaaga tgaatacatg tcaggcatag tcaccctgat 480
cttgttcatc agtccacaca cttttcagtt cagcatgttg attcctcatc catatcactt 540
tccattacta tctctttatg tccttggtca agactccaag gaaccgatag gtgagcatcg 600
gtgaggctcc ctcaaggtac caaagtagcc atcatcaccg aggtctggga atggcgccgt 660
gcccgatctg agtcctccaa ctccacggta cgacgacagc acgtcacatt gacgcaccac 720
ggttgaacaa gcagagaggg acacgtcttg ctacgcgaat cctggcactg gatggagacg 780
cgtgtgagca ggtttccgga accatgacgg cctggtccgg cttctcgaac aaagaagtgg 840
aacacaaaaa gaaccgaaac ggaaacgcag gcacggcatc gacgaccgga ttgtcccacg 900
gggacctcgg ccagtcaagc gttgccctgg ccgtcagctc cctggcgacg gggattcagc 960
acatctcacg ttataggcga cctcatcccc cttccgtctt gtgcggtcgt tgctccgtgc 1020
cgagtaccca ggcgtgccgg ggcctttagc cggggcggaa tcagagtcaa gatgcggccg 1080
aattggacgg cagacgaagt ttcgtagagg gtcatgatcg gcactgacga cacccacccc 1140
tgcgtgatcc cgtggccctg ggctgggaat tgccggctaa taatctacgg cttaatagat 1200
atgcactttg cacgcggtgc agataaataa gctgtggttt caaacactgg cctccgtact 1260
ttacccacca actgccgctt agcgccggga cctgagtctt gggagtgcgc ggagcggcag 1320
ccacctcggg ttagcgtaca cacgacggct gcatgcgggg atgccgcgtg catggcttca 1380
tagtgtacga cagaccgtca agtccaaatc tgggtgatgc ttgatgagat gacagcgagc 1440
cccgtcggcg gcaccccggc tatgcatcgc gaattgacaa cactctcagc tctattgcga 1500
cccatcggat aaaagaagaa gaaaaaaatg gaccttgagt acgggcgtca gaaaccaaaa 1560
aaaaactccg gaaccaaata tgtcgggcat ggccggggtg aacgaccgct actccccgtt 1620
cccttcttcg caaacagaac gctacagagg gttttctggt ttgtcaaaga gttcggaggt 1680
cctctgctcc gcgaatgcgt ggtgaaccca ccagcagcca ttgttcttgc atgcgtggcg 1740
gaccgttagc cgctgatcga catggcgagc ttcccacctc agacctggag cagacggttg 1800
cgaggagcaa ggggctgccc tccccctgac ggtcggaccc caatgacttc cccaaacggg 1860
gacatcgagg gtcgtgcatg atggtggaaa gtagttgcag tatgggaagt accccgggtt 1920
gccaggaacc gttgttcggc cccccacatt ttctctctgc catgtcaact gtgtgtcgtt 1980
cgagagttcc tggctccggc cccccgtcca attccctaac gggaccgcgg ggcatcgcct 2040
gtaactaact tccaaatgaa gccggatatg agggagggag attggatctg gcaagccagc 2100
cattcgctgc gatcggcact cgtccgtcag ccccgcagtc catatcccca aaggcaactg 2160
ctcggcgcgg ctcaagtctt cttcggaacg tccagcccga aggcgcgcgc cagcaccggc 2220
cctatgttcc tgattgcgat cctcgatctc cagagacggg tcacctcgcc tcgaggacgg 2280
tgcaggggca tcggcttcgc ttcctagagc tccgggctgt gtgtggtcaa ggggagaagg 2340
cggcggcgcc aaggtgcgtc tcggcgcact cacccatcgc ctttaccccc ctccccccca 2400
gtatataaaa gatggccatc gtctcctcgt ctgcttggga agaaaggatc tctcgaccat 2460
gcaccacagc ctagctctaa cccagcttgt cgtgtgttgt tgcccagcat gaagttcgtg 2520
cagtccgcca ccctggcgtt cgccgccacg gccctcgctg cgccctcgcg cacgactccc 2580
cagaagcccc gccaggcctc ggcgggctgc gcgtcggccg tgacgctcga tgccagcacc 2640
aacgtgttcc agcagtacac gctgcacccc aacaacttct accgtgccga ggtcgaggct 2700
gccgccgagg ccatctccga ctcggcgctg gccgagaagg cccgcaaggt cgccgacgtc 2760
ggtaccttcc tgtggctcga caccatcgag aacattggcc ggctggagcc cgcgctcgag 2820
gacgtgccct gcgagaacat cgtgggtctc gtcatctacg acctcccggg ccgtgactgc 2880
gcggccaagg cctccaacgg cgagctcaag gtcggcgagc tcgacaggta caagaccgag 2940
tacatcgaca gtgagttaac cctttgtggc cccttctttt cccccgagag agcgtctggt 3000
tgagtggggt tgtgagagag aaaatggggc gagcttaaag actgacgtgt tggctcgcag 3060
agatcgccga gatcctcaag gcccactcca acacggcctt cgccctcgtc atcgagcccg 3120
actcgctccc caacctggtc accaatagcg acctgcagac gtgccagcag agcgcttccg 3180
gctaccgcga gggtgtcgcc tatgccctca agcagctcaa cctccccaac gtggtcatgt 3240
acatcgatgc cggccacggt ggctggctcg gctgggacgc caacctcaag cccggcgccc 3300
aggagctcgc cagcgtctac aagtctgctg gttcgccctc gcaagtccgc ggtatctcca 3360
ccaacgtggc tggttggaac gcctggtaag acactctatg tccccctcgt cggtcaatgg 3420
cgagcggaat ggcgtgaaat gcatggtgct gacctttgat cttttccccc tcctataggg 3480
accaggagcc cggtgagttc tcggacgcct cggatgccca gtacaacaag tgccagaacg 3540
agaagatcta catcaacacc tttggcgctg agctcaagtc tgccggcatg cccaaccacg 3600
ccatcatcga cactggccgc aacggtgtca ccggtctccg cgacgagtgg ggtgactggt 3660
gcaacgtcaa cggcgccggc ttcggtgtgc gcccgactgc caacactggc gacgagctcg 3720
ccgacgcctt cgtgtgggtc aagcccggtg gcgagtccga cggcaccagc gactcgtcgg 3780
cggcgcgcta cgacagcttc tgcggcaagc ccgacgcctt caagcccagc cccgaggccg 3840
gtacctggaa ccaggcctac ttcgagatgc tcctcaagaa cgccaacccg tccttctaag 3900
ctcctcgacg gcttcttgct gtcagtcgct ctgacggtgg tgtgctggtg gtgcccctgc 3960
tcctgctgct gctgctccgc ggggagggga ggcaacgaaa atgaagtcct gcttcaaaac 4020
aaaacagaaa caagcgaggc gcggtgcaat ggtcgtgcgt tcgtcttttt tcatgttccc 4080
ttctagtgta gtagtttgat agtcgtacat aaggggtttc agaaccgtct ctctgtctcg 4140
gtctttttgc gagttgttgc gactcgtgat tatggccttt gttgctcgtt gcggcagagt 4200
agaaccacag cgtgttgggg tagcagcttg ctccgtagga cgtagggaaa caacctgaga 4260
ctctggaatt gcagtcagcc tgcgtcgccc ctctaggaaa cgaaggggag aaccagtagt 4320
ggctgcagct tacaaacgcg agcatggtga acatctccga gaaaagggag ggatcc 4376
<210>8
<211>395
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>8
Met Lys Phe Val Gln Ser Ala Thr Leu Ala Phe Ala Ala Thr Ala Leu
1 5 10 15
Ala Ala Pro Ser Arg Thr Thr Pro Gln Lys Pro Arg Gln Ala Ser Ala
20 25 30
Gly Cys Ala Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Phe Gln
35 40 45
Gln Tyr Thr Leu His Pro Asn Asn Phe Tyr Arg Ala Glu Val Glu Ala
50 55 60
Ala Ala Glu Ala Ile Ser Asp Ser Ala Leu Ala Glu Lys Ala Arg Lys
65 70 75 80
Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Thr Ile Glu Asn Ile
85 90 95
Gly Arg Leu Glu Pro Ala Leu Glu Asp Val Pro Cys Glu Asn Ile Val
100 105 110
Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys Ala
115 120 125
Ser Asn Gly Glu Leu Lys Val Gly Glu Leu Asp Arg Tyr Lys Thr Glu
130 135 140
Tyr Ile Asp Lys Ile Ala Glu Ile Leu Lys Ala His Ser Asn Thr Ala
145 150 155 160
Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr Asn
165 170 175
Ser Asp Leu Gln Thr Cys Gln Gln Ser Ala Ser Gly Tyr Arg Glu Gly
180 185 190
Val Ala Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Val Met Tyr
195 200 205
Ile Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu Lys
210 215 220
Pro Gly Ala Gln Glu Leu Ala Ser Val Tyr Lys Ser Ala Gly Ser Pro
225 230 235 240
Ser Gln Val Arg Gly Ile Ser Thr Asn Val Ala Gly Trp Asn Ala Trp
245 250 255
Asp Gln Glu Pro Gly Glu Phe Ser Asp Ala Ser Asp Ala Gln Tyr Asn
260 265 270
Lys Cys Gln Asn Glu Lys Ile Tyr Ile Asn Thr Phe Gly Ala Glu Leu
275 280 285
Lys Ser Ala Gly Met Pro Asn His Ala Ile Ile Asp Thr Gly Arg Asn
290 295 300
Gly Val Thr Gly Leu Arg Asp Glu Trp Gly Asp Trp Cys Asn Val Asn
305 310 315 320
Gly Ala Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly Asp Glu Leu
325 330 335
Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr
340 345 350
Ser Asp Ser Ser Ala Ala Arg Tyr Asp Ser Phe Cys Gly Lys Pro Asp
355 360 365
Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Gln Ala Tyr Phe
370 375 380
Glu Met Leu Leu Lys Asn Ala Asn Pro Ser Phe
385 390 395
<210>9
<211>5777
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>9
tgctgctctg atgtgctgat gcacagcttc ccctcgcgat tgccggcagg atctccaacc 60
ctctggatcg gagcagacga tcagcgggca caatggccag cttgccagcg ttcaactcca 120
agttgacccg cttttatcac gcccaagctg gacatgcaca ggcttggctt ctcgtgttcc 180
tacgatctgc acagtaggtt tgactgctga tcttcgcttt cctgtgcgcc ctccccctcc 240
ctcacgggta ccttatcctt gcctgtaacc ccgcgttatg tcaaacttga gtttgaccaa 300
tgctagcgca aaagtaccta catagtacta tgtaataagg taggtacata catcagtagg 360
cgtttatcta gtaaattttg gctttttgaa actcaattgc tcctctcctc gcctccacct 420
ctgcttggca attgacaacc ctggctgtgc ctagaggtag catcgacgat caatcaaatc 480
taaagtattc gagattgacc tttctgctct aattatatta attatccgca caatgctgta 540
gtcattgact ctcctttcaa gttgccttct cgtttatgta tgtacaatgg gcggtcatgc 600
ttcatgccaa cagatggttc tatcggaaca atgtttgact ttctggtcgc cccgtcgaac 660
tgttttgatt tcgcacggga agtgttctta ccaaagctaa gtcgactcgt ggagcttcgt 720
aacggccagt gatcgttgat cgcttttgga ggagttgcga tggagcgaga ccggctacga 780
gcacgttcgc aaaggcagca cgatagacga ccctccgtgg cgccattcgg gagatgcaca 840
tgacataagc atatcaatac tcacctgaac tcatcggccg atgcctcgca ggtagttaca 900
agacatattt gtgtgggtat attatcccaa cccgtacctt tgtcgcgtca tttcggtatg 960
tgctgatgcc tacttaggga gcaaagacgc ctctcctcac ctgcgggtta cttacttact 1020
gtgcagcatg gccttatgtt ctcccgggtc ttgcttgcgc gaatgaacaa aaacgcccga 1080
agaaaagccg cttcttcgag ttgtgtctac ccgaacataa gaggttattg tcgcagaccg 1140
ccagcaaatg tcaacaaccc acccacggcg ttccagaacc ttcgaaatat catctagttt 1200
aagtttaaat gacggcccga gtcccagccg agattcccat attggccgat accagcgttc 1260
ccttgttttt ccaaggttgt ctcgtcaact ggcgcatctg cctacaacga gatataatta 1320
ccgttttctt ttgcaaaagg gcatgcatgg atgtatatta tttatgcctg cagaacgaga 1380
agcaatcatg gtgtaggttt tgtgcggtat ggagctaata atattgaacg gatctctggt 1440
ccgtcctaaa tcgttgaaac gctaggccca ggaggacctg ctcgacttgg cgaacggaga 1500
tttccaggat gaaaggtcgg aacatgtcca tccgcggcca gcctgaacac ttttgctcgt 1560
ttccggacca tcgacccacg aaaacagtgc ggttgctggc acagtcagca ctcacgatgg 1620
cgatggtcca gcccgttccc gcccgatgcc cacttgcagc gcaactctcc ttcattcggc 1680
ggcccggcgg tgtctggcct attagtacga ttttggatac cggcttggtc gccgccgcgg 1740
tttttcttgg ccgatacggg aatctcggtg gtcccaactc cacctgggca cgctctggtg 1800
ccaacatgga acttcgggat gccgctccgg gcacagtcaa gcgctttaaa atacgacttt 1860
accccacaag aatcgaggcg taacccggaa ttagggacac ctggacggcg caacccctgg 1920
accgaagggc ctcgctaacc gggttcctgg agccgcatgc gcggctgccc gcttgcccgc 1980
tcttgagatg acacttcttt tcagcgaggg atggtcgggc agggaaatga tgtattataa 2040
gaagcgagcc gattccgaag gactcgaccc cctctctcgc cctgtgtccg ccagctaatt 2100
acagcactcc ttctcgactt gaaacgcccg agatgaagtc ctccatcctc gccagcgtct 2160
tcgccacggg cgccgtggct caaagtggtc cgtggcagca atgtggtggc atcggatggc 2220
aaggatcgac cgactgtgtg tcgggttacc actgcgtcta ccagaatgat tggtacagcc 2280
agtgcgtgcc tggcgcggcg tcgacaacgc tccagacatc taccacgtcc aggcccaccg 2340
ccaccagcac cgcccctccg tcgtccacca cctcgcctag caagggcaag ctcaagtggc 2400
tcggcagcaa cgagtcgggc gccgagttcg gggagggcaa ctaccccggc ctctggggaa 2460
agcacttcat cttcccgtcg acttcggcga ttcaggtacg ggccaataat aatatattat 2520
tatagcaggc aggagggagc aggagaagaa gggaggggca ggtggccaac aatcggaaga 2580
agaccgggag gcactgaccg ttgattcctt tgtgtaatag acgctcatca atgatggata 2640
caacatcttc cggatcgact tctcgatgga gcgtctggtg cccaaccagt tgacgtcgtc 2700
cttcgacgag ggctacctcc gcaacctgac cgaggtggtc aacttcgtga cgaacgcggg 2760
caagtacgcc gtcctggacc cgcacaacta cggccggtac tacggcaacg tcatcacgga 2820
cacgaacgcg ttccggacct tctggaccaa cctggccaag cagttcgcct ccaactcgct 2880
cgtcatcttc gacaccaaca acgagtacaa cacgatggac cagaccctgg tgctcaacct 2940
caaccaggcc gccatcgacg gcatccgggc cgccggcgcg acctcgcagt acatcttcgt 3000
cgagggcaac gcgtggagcg gggcctggag ctggaacacg accaacacca acatggccgc 3060
cctgacggac ccgcagaaca agatcgtgta cgagatgcac cagtacctcg actcggacag 3120
ctcgggcacc cacgccgagt gcgtcagcag caacatcggc gcccagcgcg tcgtcggagc 3180
cacccagtgg ctccgcgcca acggcaagct cggcgtcctc ggcgagttcg ccggcggcgc 3240
caacgccgtc tgccagcagg ccgtcaccgg cctcctcgac cacctccagg acaacagcga 3300
ggtctggctg ggtgccctct ggtgggccgc cggtccctgg tggggcgact acatgtactc 3360
gttcggtaag tttctccctt gttcttggct ttccccccag taagggagtc aggcaacatg 3420
cccaagaccg gctcggcttc gcttcaaggc gttcgttgta cacactgaag agttccaact 3480
tccaaccctg ttcgtgtcct ccgatcagct tcgacggggt gaagggggaa gggatttggg 3540
agtgaggtgg aggtcaaaag gagggatatc cccagatctc cacaaacggc cctgagccaa 3600
caacagcctc tggggtcaaa atgggcgcca accatacggt cattcactca ggacacctgc 3660
taacgcgtct cttttttttg tttccagagc ctccttcggg caccggctat gtcaactaca 3720
actcgatcct aaagaagtac ttgccgtaag gggcatgcag caaggtcgag cgagcattat 3780
tcagggccat ctgcttgtgt cggcaggcat cacgtcaacc catcgaatcg gacagcggaa 3840
tgctccgaga tgccatacac taagtctggt gatgacgtga gaatgctggc cctggtcggg 3900
ggttaccgcc aacaaaaagc acccggacgc tgccgcgccc ggataccatg gtttcatgta 3960
catattggtt ctttgctttc ttacgggggg gggggggggg gggggctctg cagcgttgct 4020
gagcgattcg tttccaagta tatactttgt ctggaattga attttgagtg acattgaccc 4080
aatcaaccag ctcggtgtgc tcacctcccg ttaccccccc tcttctcccc ctgctcggct 4140
tggctttcct ctccggtgtg gagcacggcc acggcggtcc caatccatat aagatcgatg 4200
gtatactatg gtatacacta gcttgggaat aaactaatcc atacgctaac taatggacgg 4260
attatcctaa gggtcaccgg ctcaccgttg gatataacac ctaggatacg ggagagctga 4320
tagaaaggga tgtactccgt attgtactgt acaatacaaa gtacagatag cacacgaagt 4380
acggtaggtg gtcccgccta gtccggacca acaatagaac atgcgttcct ggggacctgc 4440
aggaaagaag gggggggggg ttgccaagac gcccggggtt caaagaaagc cccgggccgc 4500
cgatgagatg agacggacgc cggcccaagg agaggccggt ggtcgatcct gcaaatgcca 4560
gcaaaaaaaa tccataccat aatccagtca actttcgtca cactcctgtg aaacgagctg 4620
gagggactgc tggaaaggtt ttgcaggtta atcactgtat gtggagcatg ccgtacctac 4680
tgtgcttcgt taacagatag agttccagtt gaacacacaa agttctgccc cgcctgccag 4740
acgtgaaaag aagctcctcc gggggagctt taggcaactg ggagggctct ctcccaggtt 4800
catggtgtct gctcttcttc aaatttttat gctgccaccc catttgacag aggtgtgcac 4860
accgttgcca ggtcttgcca tccggcaaaa agcagaaaag tcgacccatc gcctaagaaa 4920
ggcggtcgga aggggatcgg atgctcattg cggcttagcg tctgcccatt ctgacgctgc 4980
ccattgtttt gtgtcgcatt cgtcttcgga tgtcggatca agagtcccgg attttttccc 5040
ctgtgcttcc agcctaatct gagcgggagc tggctcggtt tcgagtggag ttgccttgtt 5100
ggtggagcag caaccagcca attcactccc ccgcattttc gcggccgccc aggcatcccc 5160
ggcatgcgtt tgggcggtaa ctactccgta ctggggtagg tgaaattggt tctcccgtcg 5220
caggaggctc gtgctcggtc aggggagaac aaagtccaac tgctccttcc tggcaacaat 5280
gagagggggt tctattgcca acgttgcacg aaaggagcag ccacaaaacc caaaagcagg 5340
ttaccttact gtacctgagc ttgaacgtcg cgtagcattg gagctctcgt ctaccggcgg 5400
cgtcacactc cattggcagg tcaaggcagt cagtggcagc gacccaacaa cgtcaatgct 5460
tgttacccca gaattacccc gggctgcaac actgcagggg ccgccgccga tgttgatcac 5520
cggttgatta cttctcggcc cgcaaccggg agatgagaag cagaactttg ttctcctttc 5580
aaaaaggacc tgacttgcgg ggaacgcact gccggcagtg gagtggatgc acgctagtta 5640
tatgtttccc gccatcccca gtccgcccgt cgcgtccgtg aggctcagtt tggcttcccg 5700
tgccgccgac aaacgagcgg tgcataatta catttcgctc catgtaccgt gcaccctccc 5760
cgttcgcgac cgtagta 5777
<210>10
<211>389
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>10
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Ash Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Glu Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Val Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Asn Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Glu Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Ash Tyr Ash Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210>11
<211>6060
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>11
ccggcctcca gttccaggag cttggctctg ccgacatact gtgtacacta ggaattctct 60
tatgcggggt gtgcgcgggg aaatgttggg gaactcgagt tgggtcatgt ggacaagacc 120
aatgggagct gacatcattg tgcgacccgt taaaccggaa gctacaacaa cattctggat 180
tctacactag tggaagaggt aagtaattga cgacaagcaa gaagcattgc catgttctgc 240
gaaggatgcg ggtgtttttg catgagcagg aagctgtggc tttttagtgc tcctttgtgc 300
tcgccgggcg cgcagaacac taccgaaacg caggggactg cgtgcctctg gggtcgaatg 360
ccgatcccca tcttcacatt cccaccatcg tgttctgtta acgaagccgg agcggcggga 420
actcgaagct ccactacgta tggatacttg ggaccgtacg gagtgtgttg gtacggatgc 480
ctgcacaagt gttgtgcttc ctacgaagac gccaacccac ataatacaca aaagctgttg 540
taagtcgagt tacctcaggc acgttcgggc aactcgggca acctgacgag atttccccgc 600
cattccgcca agaggccggc gcctgccctg attaggcagc tcttggaaca atactatgta 660
gaatggaagc tccatccata gtcagctcca ttggcggtcc cagtgatctc gatggctgga 720
tggctgctct gtacggtaca tacatagtaa gttctcgcct tgagagccca attcgctgca 780
atagcatctt tccccgcagt gcgccggccg ccctgggtcc cgctccacaa tgaccttgct 840
tctggagctt ctcgacgaac agatcggccc gtttcttctc cacaccaatc cgaaccagtc 900
gggagcatgg ctgcggatgc gacgcagcct tccttcgcgc tgtacaaaca gctccgggaa 960
cgtcgactgg tatgtacgga ctacagtaag tacactacga gtgcacatac tgacgaatac 1020
cggcctcaga ggaacctggc aggaccctac cccacacgaa accacagcga gaaagcgcaa 1080
tggatcagta actactgcga agtaaccgtg gtcccgggca aaggatctga gggccgatcg 1140
ctcgtggggc tgcgaggcga gggagagcaa acaagccagt cctcccgcga acctggaaaa 1200
tcacttataa acacacgtca ccggcgccgg ggtgcgcgcc atgtgtcacc tccaggctcc 1260
tcccgggcga tgatctctgc cggtgccatc aatcatctcg gttcgccgca gctgcttctt 1320
tctgtgcagt gaacgctctc aaactgcaac gacgctgtcc gacatgaagg ctgctgcgct 1380
ttcctgcctc ttcggcagta cccttgccgt tgcaggcgcc attgaatcga gaaaggtatg 1440
gacgggcttt cgtcaaagac tcgctccccg atcaacttcc cctttcatcc agaccacccc 1500
aaccctccca gtcctgcttc gagcacgatc tcttcgggca gcaccccacc cacatccact 1560
cagattagcg gcgacaccgt tgactgttgc aatccgcaat cgacatgcaa cttccagccg 1620
cagcccaatg gctgctcacg cttcccgcga aagcctcact tgctgacaat catcgtcagg 1680
ttcaccagaa gcccctcgcg agatctgaac ctttttaccc gtcgccatgg atgaatccca 1740
acgccgacgg ctgggcggag gcctatgccc aggccaagtc ctttgtctcc caaatgactc 1800
tgctagagaa ggtcaacttg accacgggag tcgggtaagt tttgtcattt tgtccaggta 1860
acatgcaaat ggttctgcta acaataactt accgtagctg gggggctgag cagtgcgtcg 1920
gccaagtggg cgcgatccct cgccttggac ttcgcagtct gtgcatgcat gactcccctc 1980
tcggcatccg aggagccgac tacaactcag cgttcccctc tggccagacc gttgctgcta 2040
cctgggatcg cggtctgatg taccgtcgcg gctacgcaat gggccaggag gccaaaggca 2100
agggcatcaa tgtccttctc ggaccagtcg ccggccccct tggccgcatg cccgagggcg 2160
gtcgtaactg ggaaggcttc gctccggatc ccgtccttac cggcatcggc atgtccgaga 2220
cgatcaaggg cattcaggat gctggcgtca tcgcttgtgc gaagcacttt attggaaacg 2280
agcagggtga gtagtcaaag acgggccgtc tcggacccgc ggcttcaagc tgctgactct 2340
gctgcagagc acttcagaca ggtgccagaa gcccagggat acggttacaa catcagcgaa 2400
accctctcct ccaacattga cgacaagacc atgcacgagc tctacctttg gccgtttgcc 2460
gatgccgtcc gggccggcgt cggctctgtc atgtgctcgt accagcaggt caacaactcg 2520
tacgcctgcc agaactcgaa gctgctgaac gacctcctca agaacgagct tgggtttcag 2580
ggcttcgtca tgagcgactg gcaggcacag cacactggcg cagcaagcgc cgtggctggt 2640
ctcgatatgt ccatgccggg cgacacccag ttcaacactg gcgtcagttt ctggggcgcc 2700
aatctcaccc tcgccgtcct caacggcaca gtccctgcct accgtctcga cgacatggcc 2760
atgcgcatca tggccgccct cttcaaggtc accaagacca cccacctgga acccatcaac 2820
ttctccttct ggaccgacga cacttatggc ccgatccact gggccgccaa gcatggctac 2880
cagaagatta attcccacgt tgacgtccgc gccgaccacg gcaacctcat ccgggagatt 2940
gccgccaagg gtacggtgct gctgaagaat accggctctc tacccctgaa caagccaaag 3000
ttcgtggccg tcatcggcga ggatgctggg tcgagcccca acgggcccaa cggctgcagc 3060
gaccgcggct gtaacgaagg cacgctcgcc atgggctggg gatccggcac agccaactat 3120
ccgtacctcg tttcccccga cgccgcgctc caggcccggg ccatccagga cggcacgagg 3180
tacgagagcg tcctgtccaa ctacgccgag gaaaagacaa aggctctggt ctcgcaggcc 3240
aatgcaaccg ccatcgtctt cgtcaatgcc gactcaggcg agggctacat caacgtggac 3300
ggtaacgagg gcgaccgtaa gaacctgact ctctggaaca acggtgatac tctggtcaag 3360
aacgtctcga gctggtgcag caacaccatc gtcgtcatcc actcggtcgg cccggtcctc 3420
ctgaccgatt ggtacgacaa ccccaacatc acggccattc tctgggctgg tcttccgggc 3480
caggagtcgg gcaactccat caccgacgtg ctttacggca aggtcaaccc cgccgcccgc 3540
tcgcccttca cttggggcaa gacccgcgaa agctatggcg cggacgtcct gtacaagccg 3600
aataatggca atggtgcgcc ccaacaggac ttcaccgagg gcgtcttcat cgactaccgc 3660
tacttcgaca aggttgacga tgactcggtc atctacgagt tcggccacgg cctgagctac 3720
accaccttcg agtacagcaa catccgcgtc gtcaagtcca acgtcagcga gtaccggccc 3780
acgacgggca ccacggccca ggccccgacg tttggcaact tctccaccga cctcgaggac 3840
tatctcttcc ccaaggacga gttcccctac atctaccagt acatctaccc gtacctcaac 3900
acgaccgacc cccggagggc ctcggccgat ccccactacg gccagaccgc cgaggagttc 3960
ctcccgcccc acgccaccga tgacgacccc cagccgctcc tccggtcctc gggcggaaac 4020
tcccccggcg gcaaccgcca gctgtacgac attgtctaca caatcacggc cgacatcacg 4080
aatacgggct ccgttgtagg cgaggaggta ccgcagctct acgtctcgct gggcggtccc 4140
gaggatccca aggtgcagct gcgcgacttt gacaggatgc ggatcgaacc cggcgagacg 4200
aggcagttca ccggccgcct gacgcgcaga gatctgagca actgggacgt cacggtgcag 4260
gactgggtca tcagcaggta tcccaagacg gcatatgttg ggaggagcag ccggaagttg 4320
gatctcaaga ttgagcttcc ttgaatgagt ttcatcaggg gctgcagagg gatggtaaca 4380
cgttcttaat cagaagtatg atggagaaaa gcacttggca agttccggtg agcaaaaaga 4440
aggcacttat taagtgtagg gcggtgttct atgtttaata ggtgctatgt ttacatataa 4500
ttagtatata atgatttaat aattatgttt agcagttgct aatgtcgtaa atttcggcgt 4560
gtgatgactg ctacaacact ggttctgtct tctagtcgcc attgttaatt atgaaggtta 4620
ttgtctacaa tttctaatac cttatggatg attgcccagc tggtttcaaa ctcgttacgc 4680
gcaaatggta cgattgaggt attattcatt gtaagtacct ccgtacagcg tccccaacta 4740
tttccattca cgagatgcct cgcttttcgg tgctttcgga acagggctgg cagcggatca 4800
tggcgcgatc aaaacatggc gagcagctgt ccaggacgga ggacaggttg gggactgatg 4860
cctcccggac gcattaaggt cagaagatag acacgtttta cacagcgttg agaccgacaa 4920
gccacattag gcagcgccgg ttgcaccacc gccgtcacgg gcaacggttc aatcaatcga 4980
caacagtgga agacaaagta ctgaagatca ggtattaata gtgtgagaga gaaacagacg 5040
gtggaactag ggtgctaata tttctcttga tttcggtgtc catggtagta cagaacacaa 5100
gaaaaagaag gaggagtgag cggagaagga ggagggggaa gccagaaaaa agaacatgaa 5160
aaagcataca cattggagtc ggtcagtcgg ttgattggtt tggtagagag cgaaaaagca 5220
agcgtcacct gtaggattcg aacctacgct cccgaaggaa ctgcctaaga acgctaagca 5280
aggttagcag ggcagcgcgt taaccactcc gccaaagtga ctgtcgttga tcatggtcga 5340
attcaagtag cttataggag ttcaaccaga tcacaaatgc ataggtgctc gtagaacggt 5400
ctaagtatga gttgattata agcaaccgaa tggctctcag cggcaacacc gtagctgaag 5460
taacaaaacg cacctttggt tactttctga ctataaaaat gggatatttg gaaatgacca 5520
cccgataagg tgtcaaattc taaatgactg tctgggtgtg aagatgttac tgtggttcca 5580
ccacgaacca gttttagtat ccgcatgctt cagtctctgc gcctcgacag gcggagggtg 5640
tgtgttagat cagaatcgat gtgacgctgt gaccgcgagg ctctcgagcc taggtgcggt 5700
agttctgttc aaaaagaagt gtgtggccgg gtttgggcgc ccttatagcc taccatcctg 5760
gctgtggttc ccgagcggga gccggttctc cgttttggtt ccgataaagt gtcatatctg 5820
cctcccggtt tcgcatctaa tttctgactt cgttcgggac ctctggagac gtagggatag 5880
gtatgggata tgcccggcat ttcgtaaatg tccatagtct ctttcgggac gaggcggcaa 5940
gctctcagag ctatctaagc ttaaccaacc cctgatcctt aaccctccca gaccacacct 6000
cctgggagaa taaaccgggc tccaagatcg aaatcgaaat cagtgcgcga acttgaaatc 6060
<210>12
<211>871
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>12
Met Gln Leu Pro Ala Ala Ala Gln Trp Leu Leu Thr Leu Pro Ala Lys
1 5 10 15
Ala Ser Leu Ala Asp Asn His Arg Gln Val His Gln Lys Pro Leu Ala
20 25 30
Arg Ser Glu Pro Phe Tyr Pro Ser Pro Trp Met Asn Pro Asn Ala Asp
35 40 45
Gly Trp Ala Glu Ala Tyr Ala Gln Ala Lys Ser Phe Val Ser Gln Met
50 55 60
Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gly Ala
65 70 75 80
Glu Gln Cys Val Gly Gln Val Gly Ala Ile Pro Arg Leu Gly Leu Arg
85 90 95
Ser Leu Cys Met His Asp Ser Pro Leu Gly Ile Arg Gly Ala Asp Tyr
100 105 110
Asn Ser Ala Phe Pro Ser Gly Gln Thr Val Ala Ala Thr Trp Asp Arg
115 120 125
Gly Leu Met Tyr Arg Arg Gly Tyr Ala Met Gly Gln Glu Ala Lys Gly
130 135 140
Lys Gly Ile Asn Val Leu Leu Gly Pro Val Ala Gly Pro Leu Gly Arg
145 150 155 160
Met Pro Glu Gly Gly Arg Asn Trp Glu Gly Phe Ala Pro Asp Pro Val
165 170 175
Leu Thr Gly Ile Gly Met Ser Glu Thr Ile Lys Gly Ile Gln Asp Ala
180 185 190
Gly Val Ile Ala Cys Ala Lys His Phe Ile Gly Asn Glu Gln Glu His
195 200 205
Phe Arg Gln Val Pro Glu Ala Gln Gly Tyr Gly Tyr Asn Ile Ser Glu
210 215 220
Thr Leu Ser Ser Asn Ile Asp Asp Lys Thr Met His Glu Leu Tyr Leu
225 230 235 240
Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met Cys
245 250 255
Ser Tyr Gln Gln Val Asn Asn Ser Tyr Ala Cys Gln Asn Ser Lys Leu
260 265 270
Leu Asn Asp Leu Leu Lys Asn Glu Leu Gly Phe Gln Gly Phe Val Met
275 280 285
Ser Asp Trp Gln Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala Gly
290 295 300
Leu Asp Met Ser Met Pro Gly Asp Thr Gln Phe Asn Thr Gly Val Ser
305 310 315 320
Phe Trp Gly Ala Asn Leu Thr Leu Ala Val Leu Asn Gly Thr Val Pro
325 330 335
Ala Tyr Arg Leu Asp Asp Met Ala Met Arg Ile Met Ala Ala Leu Phe
340 345 350
Lys Val Thr Lys Thr Thr His Leu Glu Pro Ile Asn Phe Ser Phe Trp
355 360 365
Thr Asp Asp Thr Tyr Gly Pro Ile His Trp Ala Ala Lys His Gly Tyr
370 375 380
Leu
Gln Lys Ile Asn Ser His Val Asp Val Arg Ala Asp His Gly Asn Leu
385 390 395 400
Ile Arg Glu Ile Ala Ala Lys Gly Thr Val Leu Leu Lys Asn Thr Gly
405 410 415
Ser Leu Pro Leu Asn Lys Pro Lys Phe Val Ala Val Ile Gly Glu Asp
420 425 430
Ala Gly Ser Ser Pro Asn Gly Pro Asn Gly Cys Ser Asp Arg Gly Cys
435 440 445
Asn Glu Gly Thr Leu Ala Met Gly Trp Gly Ser Gly Thr Ala Asn Tyr
450 455 460
Pro Tyr Leu Val Ser Pro Asp Ala Ala Leu Gln Ala Arg Ala Ile Gln
465 470 475 480
Asp Gly Thr Arg Tyr Glu Ser Val Leu Ser Asn Tyr Ala Glu Glu Lys
485 490 495
Thr Lys Ala Leu Val Ser Gln Ala Asn Ala Thr Ala Ile Val Phe Val
500 505 510
Asn Ala Asp Ser Gly Glu Gly Tyr Ile Asn Val Asp Gly Asn Glu Gly
515 520 525
Asp Arg Lys Asn Leu Thr Leu Trp Asn Asn Gly Asp Thr Leu Val Lys
530 535 540
Asn Val Ser Ser Trp Cys Ser Asn Thr lle Val Val Ile His Ser Val
545 550 555 560
Gly Pro Val Leu Leu Thr Asp Trp Tyr Asp Asn Pro Asn Ile Thr Ala
565 570 575
Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ser Ile Thr
580 585 590
Asp Val Leu Tyr Gly Lys Val Asn Pro Ala Ala Arg Ser Pro Phe Thr
595 600 605
Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ala Asp Val Leu Tyr Lys Pro
610 615 620
Asn Asn Gly Asn Gly Ala Pro Gln Gln Asp Phe Thr Glu Gly Val Phe
625 630 635 640
Ile Asp Tyr Arg Tyr Phe Asp Lys Val Asp Asp Asp Ser Val Ile Tyr
645 650 655
Glu Phe Gly His Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ser Asn Ile
660 665 670
Arg Val Val Lys Ser Asn Val Ser Glu Tyr Arg Pro Thr Thr Gly Thr
675 680 685
Thr Ala Gln Ala Pro Thr Phe Gly Asn Phe Ser Thr Asp Leu Glu Asp
690 695 700
Tyr Leu Phe Pro Lys Asp Glu Phe Pro Tyr Ile Tyr Gln Tyr Ile Tyr
705 710 715 720
Pro Tyr Leu Asn Thr Thr Asp Pro Arg Arg Ala Ser Ala Asp Pro His
725 730 735
Tyr Gly Gln Thr Ala Glu Glu Phe Leu Pro Pro His Ala Thr Asp Asp
740 745 750
Asp Pro Gln Pro Leu Leu Arg Ser Ser Gly Gly Asn Ser Pro Gly Gly
755 760 765
Asn Arg Gln Leu Tyr Asp Ile Val Tyr Thr Ile Thr Ala Asp Ile Thr
770 775 780
Asn Thr Gly Ser Val Val Gly Glu Glu Val Pro Gln Leu Tyr Val Ser
785 790 795 800
Leu Gly Gly Pro Glu Asp Pro Lys Val Gln Leu Arg Asp Phe Asp Arg
805 810 815
Met Arg Ile Glu Pro Gly Glu Thr Arg Gln Phe Thr Gly Arg Leu Thr
820 825 830
Arg Arg Asp Leu Ser Asn Trp Asp Val Thr Val Gln Asp Trp Val Ile
835 840 845
Ser Arg Tyr Pro Lys Thr Ala Tyr Val Gly Arg Ser Ser Arg Lys Leu
850 855 860
Asp Leu Lys Ile Glu Leu Pro
865 870
<210>13
<211>998
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>13
atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc 60
tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc 120
ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac 180
ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag 240
agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc 300
agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc 360
gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac 420
tttgacctgg ccgtgagttg cctccccttc tccccggacc gctcagatta gatgagatta 480
gactttgctc gtaaatcggt ccaagattcc cttgactgac caacaaacat catacgggca 540
gatccccggt ggcggtgtcg gtattttcaa cggtaagctg gtgcccccgg acccctcccc 600
ggacccctcc cccttttcct ccagcgagcc gagttgggat cgccgagatc gagaactcac 660
acaacttctc tctcgacagc ctgcaccgac cagtacggcg ctcccccgaa cggctggggc 720
gaccgctacg gcggcatcca ttccaaggaa gagtgcgaat ccttcccgga ggccctcaag 780
cccggctgca actggcgctt cgactggtac gttgctttga cataccggaa cccaattcct 840
ccaacccccc cccttttctc ccccaactcc gggggtagtc ggaatgtcgc gactgaccct 900
atttcaggtt ccaaaacgcc gacaacccgt cggtcacctt ccaggaggtg gcctgcccgt 960
cggagctcac gtccaagagc ggctgctccc gttaa 995
<210>14
<211>225
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>14
Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala
1 5 10 15
Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val
35 40 45
Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr
50 55 60
Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln
65 70 75 80
Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val
85 90 95
Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln
115 120 125
Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr
145 150 155 160
Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser
165 170 175
Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn
180 185 190
Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe
195 200 205
Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser
210 215 220
Arg
225
<210>15
<211>4190
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>15
gcgcttccgg cctgggcgag taaaatgacg gaagccgggc cccgtccgac tgcgtttgtc 60
ccaactcgga agcaggcatc gttttttggg cgggaggaag cgttgcaaca cgcactatcg 120
ccaaggtgga ctcggcgcaa tctggaggtt cggcccgcgg aggacggaat ccgggctgaa 180
tctgcgcaaa ggctgaccct gcgatggtgg gaaaatgtaa atatgtgaag ttataggcat 240
ataggactca gcgatgacat ggaaattgca gaggcatgtg ggatttcagc gtttggcatg 300
cattggtcgg atctctcgcc ttgtctgatg tgatcccgcc ggaggtgttt cggtctctgg 360
ggaagggacc ccccctggcc ccccacctgc cccgcatcat gcctcgccac gactcccgcg 420
cgccgaggaa gaacttcggg tctttgtgac gggagattcc actgagtgag cattggccaa 480
ccaagcacac aattactccg tacatacaca gtacttctga ctccgtaaag taaaccgtgt 540
gtttcaaaga tcggtaatcc gtaacaggta ctccgtatct aaggtaaatt taccctgtgc 600
acggagcaga acctgaactt cttcccccct cttactcgag tagtcaccct actccaacca 660
gcggcttttc aactcgcaaa gtcttgttta taacagtgca tatacctgca tttcgtatct 720
cgctagtgta aagacgacca cacgcggaca aagaaagaaa aatccaattg cccgatggct 780
cttagtttga ggacagcagc gaaggactac actgcgccgt agtgaccagg ccaagaaacg 840
cgaatcgtat attaacggca aatcaaaatg gattatatgc catttcgctt ccgggttgcg 900
tgctcgtccg aagtctggtg ccgatcgatt gcgaaccccc ggaatcgcgg gatgattcct 960
acagccgccg aaaggggggg ggggggaggg gggtctggac gggacgtgca taacttcgaa 1020
tttctagaat attgcggatt gggttccctt cagccctgcg agcgcgcccc cttctggaac 1080
cgcacccttc accggttcca cacacagagg acatgggtgg aaatgtgtac ctgacggttg 1140
cccctttggg acagtggaga ggcggatgtt cggataacca tccggagccg cagtgtcgac 1200
caagatcttg gcttaccatc gacaccaaca tgcggactcg tccctcagtc atggagcctt 1260
ggctcgcgga gcctccgttc gaagcggcta tcccgtcctg ccagcggagg atctcgtacc 1320
gcttccgcga actgtgaatg tcctgggtat aagagcatgg cgcgaccttg tctcgtcagg 1380
aacggggagg aggagggctt ggttagggtc gcgttcgttt ggagattgct gagctctgag 1440
ccttcggtcc ttggatccct gcggtccccg gtctcctctc tctctctctc tctctctctc 1500
tctctctctt cttcccacgc tcgttcgaca gacgcctccc cttcttcgct ctcctttccc 1560
tcgcacgtag cacactaata gtgcaccatg cgcgtctcta gtttggtcgc ggcccttgct 1620
accggtggtc ttgtcgccgc cacgcctaag cccaaggggt cgtcgccccc tggggccgtg 1680
gacgcgaacc ctttcaaggg caagacgcag ttcgtcaacc cggcatgggc ggccaagctg 1740
gaacagacca aaaaggcgtt cctggccagg aacgacaccg tcaatgccgc caagacggag 1800
aaggtccagc agaccagctc gttcgtctgg gtctcgagga tcgccgagct ctccaacatc 1860
gacgacgcca tcgcggctgc ccgcaaggcg cagaagaaga cgggcaggag gcagatcgtc 1920
ggcctggtgc tctacaacct tccggaccgc gactgcagcg cgggcgagag cgcgggcgag 1980
ctcagcagcg acaagaacgg gctcgagatc tacaagactg agttcgtcaa gcccttcgcc 2040
gacaaggtgg cggccgcaaa ggacctcgac ttcgccatcg tcctggagcc cgactcgctg 2100
gccaacctgg tcaccaacct gggcatcgag ttctgcgcca acgccgcccc cgtctaccgc 2160
gagggcatcg cctatgccat ctccagcctt cagcagccaa acgtgcactt gtacatcgat 2220
gctgcccacg gcggctggct cggctgggac gacaacctgc cgctggccgc caaggagttt 2280
gccgaggtgg tcaagcttgc cggcgagggc aagaagatcc gcggcttcgt caccaacgtg 2340
tccaactaca accccttcca cgccgtcgtg cgcgagaact ttaccgagtg gagcaactcg 2400
tgggacgagt ctcactacgc ctcctcgctc acaccgttcc tcgagaaaga ggggctgccg 2460
gcacgcttca tcgtcgacca gggtcgcgtt gccctcccgg gagcccgcaa ggagtggtga 2520
gtttcgacca gattgaccct cgacccatgc gaccgagatt gctgacgatt gaattgcgtg 2580
tcccgtcccc caggggtgaa tggtgcaacg tggcacccgc cggatttggc cccgcgccca 2640
cgaccagggt caacaacacc gtcgtcgatg ctctcgtctg ggtcaagcct ggcggcgaga 2700
gcgacggcga gtgtggcttg gctggcgccc ccaaggccgg ccagtggttc gacgagtacg 2760
cccagatgct ggtcgagaat gcccacccgt ctgtcgtcca caagtggtag ataaattttg 2820
gagtccgaga agggtcccag atagactttt gttttaaaac aaaatgcaag gtgtcgacag 2880
atactggctt aacattaacc aagcaccatg aacatgactt gtcaacatat tgatacattc 2940
cgctgctttc ccatacgtgc tctcaggtct cagggatcaa atggataggt cggtaatgca 3000
aaacgatcca ttggatatcc agaagagaga aaaaaaaaag gacatgcatg ccttgtctgt 3060
catcatgagg aaacaaagga aaaacaaacg atcgtcgtgt tccaacaagc tttccaagac 3120
cacaagaccc atccaccaac acaaccaaac gacaagcaat acgatggacc gccgttgttc 3180
catctctcaa gagctgacta aacgaacagt cgttgaaatc atcctacatg agtacgccgc 3240
accacctgtt atcgtgtaaa ccaaatcgcc tgttaaagtg catcatctct taggtatgat 3300
cgtaagttcc ggtcacggtc acggatcagg gatggttctc aattcgtgtg tcgcgtagcc 3360
gccgccgtat ctggacaaga cttcttgtat tgctccgaaa ccgcttttgc cgccctaata 3420
atctgtagcc ttcttacctg gtggtgcctt gaaagacgcg gcaggcaaca cttcgcaggt 3480
ctgtggcgca ccagcaccag gctgtggtga tgccccggaa ccggtcgtcg acttgctcgc 3540
ggtgtcctcg gctggtgggg atgggggtga tgagggcttg gagggtgttg ttgcgcccgc 3600
aacatccggc tccggctccg gaccgtccac agacattgga cctgcgagca tgactcgtgc 3660
cttcagccag accaaagcca tgccatcatc gcctctgccg acgctgttga gcgggaggct 3720
gatgttctca gccagaactg cgggctgtac ggccatgacc atgggctgtt cggtctggcc 3780
gtcttgcggc ggtttctccc tgccagcttg ttgtgcgcgg tgcctgcgag attcgacttc 3840
gacctgggcg tggcagaggg tgacgaggga cgttgacgcc ttgatctcct tgctccccat 3900
gtccttccac ccgtacaggc ggacgggtgc catacgcgtc cacagcctgc acgagaacct 3960
cagggcgtcg tcaatgagtt ctgtcaactt gctctccagc ctctctatgc cgcgagcatc 4020
ctgatcctgg agcagaaacc gtgccgagcc tccgaggaaa cgctccttca gcttccgcgc 4080
gtagtttagg cgtgattcaa caaacgtccg gcgggactcg ttgttgcccg cagcagcgac 4140
gtccttgatg ctgaagccgc cgtcggcgaa caggcgcatc atctgggccc 4190
<210>16
<211>381
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>16
Met Arg Val Ser Ser Leu Val Ala Ala Leu Ala Thr Gly Gly Leu Val
1 5 10 15
Ala Ala Thr Pro Lys Pro Lys Gly Ser Ser Pro Pro Gly Ala Val Asp
20 25 30
Ala Asn Pro Phe Lys Gly Lys Thr Gln Phe Val Asn Pro Ala Trp Ala
35 40 45
Ala Lys Leu Glu Gln Thr Lys Lys Ala Phe Leu Ala Arg Asn Asp Thr
50 55 60
Val Asn Ala Ala Lys Thr Glu Lys Val Gln Gln Thr Ser Ser Phe Val
65 70 75 80
Trp Val Ser Arg Ile Ala Glu Leu Ser Asn Ile Asp Asp Ala Ile Ala
85 90 95
Ala Ala Arg Lys Ala Gln Lys Lys Thr Gly Arg Arg Gln Ile Val Gly
100 105 110
Leu Val Leu Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Gly Glu Ser
115 120 125
Ala Gly Glu Leu Ser Ser Asp Lys Asn Gly Leu Glu Ile Tyr Lys Thr
130 135 140
Glu Phe Val Lys Pro Phe Ala Asp Lys Val Ala Ala Ala Lys Asp Leu
145 150 155 160
Asp Phe Ala Ile Val Leu Glu Pro Asp Ser Leu Ala Asn Leu Val Thr
165 170 175
Asn Leu Gly Ile Glu Phe Cys Ala Asn Ala Ala Pro Val Tyr Arg Glu
180 185 190
Gly Ile Ala Tyr Ala Ile Ser Ser Leu Gln Gln Pro Asn Val His Leu
195 200 205
Tyr Ile Asp Ala Ala His Gly Gly Trp Leu Gly Trp Asp Asp Asn Leu
210 215 220
Pro Leu Ala Ala Lys Glu Phe Ala Glu Val Val Lys Leu Ala Gly Glu
225 230 235 240
Gly Lys Lys Ile Arg Gly Phe Val Thr Asn Val Ser Asn Tyr Asn Pro
245 250 255
Phe His Ala Val Val Arg Glu Asn Phe Thr Glu Trp Ser Asn Ser Trp
260 265 270
Asp Glu Ser His Tyr Ala Ser Ser Leu Thr Pro Phe Leu Glu Lys Glu
275 280 285
Gly Leu Pro Ala Arg Phe Ile Val Asp Gln Gly Arg Val Ala Leu Pro
290 295 300
Gly Ala Arg Lys Glu Trp Gly Glu Trp Cys Asn Val Ala Pro Ala Gly
305 310 315 320
Phe Gly Pro Ala Pro Thr Thr Arg Val Asn Asn Thr Val Val Asp Ala
325 330 335
Leu Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Glu Cys Gly Leu
340 345 350
Ala Gly Ala Pro Lys Ala Gly Gln Trp Phe Asp Glu Tyr Ala Gln Met
355 360 365
Leu Val Glu Asn Ala His Pro Ser Val Val His Lys Trp
370 375 380
<210>17
<211>3000
<212>DNA
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>17
cgcggccccg tctttgaacg cttgagaagc gcacggtgaa gaaccatcaa ctccgattcc 60
gctcctcatc ctcccacgaa gccgattgaa atagccacag cggctatgta cggattactc 120
tgctccgttt gcacatccat acacagcgct atttttaaaa gttcaggacg gccaagcccg 180
gttcttggaa cggacgaccc ggattccgaa agctccagcg ctcaatgcgg tcagtcgtgg 240
cgctgatcct gctgatctgc tgatctcata aacccgcaac ttcaactttt cactttgaag 300
cgtatacacg cagcgcctct ttcaccggcg cattcatact cgcaaattaa ccgctaatat 360
cctcgcactt ggataatgtg tagccgacac ggaggagggg ggttgggggg gggttggggg 420
gagacatgat ggtctgccca acggatatta ttattttgtt gttttgtata attactgcgg 480
caacattctc aaaggggccg tgcctcgcgg cgggaaagcc catgacagag aattggacag 540
ctccaagctc gcgatatact ctaacaacgg cgtgactcgg caatgaaggc ctgccgctcg 600
agtgataggg cgaagtaaaa cggacgttac atgcggcact tagccggctg atgccggaga 660
atacgggatt caacgataca atcacacgat gcgacacacc tcggcgactt ggcgctctat 720
ggaagaaggc tgggttaaag ctggcgtaga ttttgcgcgt cttggtttct taaccgggtt 780
atttctattt ctcatatgcc gcgagcgaat gcggggtgca gagcgcccgg gagtcgatgg 840
tcctatcaga caagagcctg gccccggaac ctgggataat agaagccaaa ttaagccatg 900
ggagtatcgt ccgggggtag gaaccgcacg ggcaactaga ggaggaagaa tttggtataa 960
agggaggacg gcggaacagg cttgatggac atgaatcaga agacgacact gggcaactaa 1020
acagcttgca gcagagtttt gtgccttgca taggccctcg atatcatggt ctcgttcact 1080
ctcctcctca cggtcatcgc cgctgcggtg acgacggcca gccctctcga ggtggtcaag 1140
cgcggcatcc agccgggcac gggcacccac gaggggtact tctactcgtt ctggaccgac 1200
ggccgtggct cggtcgactt caaccccggg ccccgcggct cgtacagcgt cacctggaac 1260
aacgtcaaca actgggttgg cggcaagggc tggaacccgg gcccgccgcg caagattgcg 1320
tacaacggca cctggaacaa ctacaacgtg aacagctgtg cgttgtcctc ctctttctcc 1380
ctttcgcttg ttttccttga tgattgggat ccattttaaa agagaaggaa aaaaaaaaca 1440
aaggaaaata gaagataact aacgccaagc tctggcagac ctcgccctgt acggctggac 1500
tcgcaacccg ctggtcgagt attacatcgt ggaggcatac ggcacgtaca acccctcgtc 1560
gggcacggcg cggctgggca ccatcgagga cgacggcggc gtgtacgaca tctacaagac 1620
gacgcggtac aaccagccgt ccatcgaggg gacctccacc ttcgaccagt actggtccgt 1680
ccgccgccag aagcgcgtcg gcggcactat cgacacgggc aagcactttg acgagtggaa 1740
gcgccagggc aacctccagc tcggcacctg gaactacatg atcatggcca ccgagggcta 1800
ccagagctct ggttcggcca ctatcgaggt ccgggaggcc taaagaagcc aggcgccttt 1860
cttttgtttt gcaggagggg gtagaggggg ggggggaggg aaaacgaaaa gtagcagggt 1920
ggttttatgc cggcagccgt gggccattcg agtgcaacct gtatctctct ctctcccaag 1980
tctccgggct ccttctcaga gaacttcaat atgtctgggg acaaaccacc ttgtgaaata 2040
caacggtaat tatctaagtt tgagtgccct atcgtatgct tctgaaaatt tcctgctcct 2100
tgatacaagt cggtttgagc cgagccaatg agactgtgtc gattgataga ggccctgaag 2160
gatcaagcgc gatgcaacaa ttaagcatga ctacgtgcct agctgcagat aaatggaagc 2220
cactcaccaa ggtcaacccc gcatactggc acgtaagaac cttccgtgta caaggcccaa 2280
ccgactcaca tatctatctg cttgggtttt gggatgcggt tttttaccca caaaacaaat 2340
ttgatacaat gctctgctgt gcccgggttg ctgagaccaa gccgtaatca gcgggcaggg 2400
aatcgagtag gtcacgcctg ttgcttggtc tagaacaaac taatattaaa aagccttgtg 2460
ctcggcacac atacagaact cgacctgagg catgttcttg gaaggcggct agccagtcaa 2520
gtctggcacc aggccttggt ctcgtcgagg ataccgaggg cgaggaggat gaggaagacc 2580
tctttctcgc ctcagatctc ttaggggacg aagaagacaa cgccggagcc acacaataat 2640
taggtctcat atcagacgtt tcggcctggc cgagctaata tgtctaatta tgcccatcag 2700
ccgtatgtcg aggcaggttg caccgatacg ctcgccgcgc cgcctcattc atctccgact 2760
gggcacaatg tcgccatctc ggccgtcaag gtggtgcaag atacctatta tgcaagcaga 2820
ggatcagatg gcgggccgat acgagcggct gctccggctt gcgagaaagc cgcttcgcag 2880
caaggtatcg tggcaggccg ccattttcgg ttgggtattc tttgtcttgt ttgcttcgta 2940
attatgtcct ggctggcatt gtgggaaggg gcgaacctct tgatttccga tgggggtcga 3000
<210>18
<211>218
<212>PRT
<213>鲁克文金孢子菌(Chrysosporium lucknowense)
<400>18
Met Val Ser Phe Thr Leu Leu Leu Thr Val Ile Ala Ala Ala Val Thr
1 5 10 15
Thr Ala Ser Pro Leu Glu Val Val Lys Arg Gly Ile Gln Pro Gly Thr
20 25 30
Gly Thr His Glu Gly Tyr Phe Tyr Ser Phe Trp Thr Asp Gly Arg Gly
35 40 45
Ser Val Asp Phe Asn Pro Gly Pro Arg Gly Ser Tyr Ser Val Thr Trp
50 55 60
Asn Asn Val Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Pro
65 70 75 80
Pro Arg Lys Ile Ala Tyr Asn Gly Thr Trp Asn Asn Tyr Asn Val Asn
85 90 95
Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Val Glu Tyr
100 105 110
Tyr Ile Val Glu Ala Tyr Gly Thr Tyr Asn Pro Ser Ser Gly Thr Ala
115 120 125
Arg Leu Gly Thr Ile Glu Asp Asp Gly Gly Val Tyr Asp Ile Tyr Lys
130 135 140
Thr Thr Arg Tyr Asn Gln Pro Ser Ile Glu Gly Thr Ser Thr Phe Asp
145 150 155 160
Gln Tyr Trp Ser Val Arg Arg Gln Lys Arg Val Gly Gly Thr Ile Asp
165 170 175
Thr Gly Lys His Phe Asp Glu Trp Lys Arg Gln Gly Asn Leu Gln Leu
180 185 190
Gly Thr Trp Asn Tyr Met Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser
195 200 205
Gly Ser Ala Thr Ile Glu Val Arg Glu Ala
210 215
机译: 用于纤维素酶水解的高效纤维素酶组合物的构建
机译: 用于纤维素酶水解的高效纤维素酶组合物的构建
机译: 用于纤维素酶水解的高效纤维素酶组合物的构建