首页> 中国专利> 用于酶促水解纤维素的高效纤维素酶组合物的构建

用于酶促水解纤维素的高效纤维素酶组合物的构建

摘要

本发明提供了使用新鉴定和分离的鲁克文金孢子菌酶与以前鉴定的酶的新型酶组合物,所述新鉴定和分离的酶包括CBH Ib、CBH IIb、EG II、EG VI、β-葡糖苷酶和木聚糖酶II,所述以前鉴定的酶包括CBH Ia、CBHIIa(以前称为Endo 43)和EG V。这些酶组合物显示将木质纤维素生物质(如微晶纤维素、棉花、有机溶剂预处理的花旗松木)转化为葡萄糖的能力极高。在棉花水解中,具有纤维素结合模块(CBM)的CBH Ia和IIb与来自相同真菌的三种主要内切葡聚糖酶(EG II、EG V、EG VI)表现出显著的协同作用,它们之间也有强烈的协同作用。所述酶组合物能有效水解木质纤维素生物质。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-24

    未缴年费专利权终止 IPC(主分类):C07K14/37 授权公告日:20140716 终止日期:20181006 申请日:20061006

    专利权的终止

  • 2016-10-26

    专利权的转移 IPC(主分类):C07K14/37 登记生效日:20161009 变更前: 变更后: 申请日:20061006

    专利申请权、专利权的转移

  • 2014-07-16

    授权

    授权

  • 2009-12-09

    实质审查的生效

    实质审查的生效

  • 2009-10-14

    公开

    公开

说明书

本申请是2003年3月21日提交的美国专利申请10/394,568的部分继续申请,其要求2000年4月13日提交的美国专利申请09/548,938(现在是美国专利6,573,086)的优先权,美国专利申请09/548,938是1999年10月6日提交的国际申请PCT/NL99/00618的部分继续申请,PCT/NL99/00618是1998年10月6日提交的国际申请PCT/EP98/06496的部分继续申请。本申请也是1999年4月8日提交的美国专利申请09/284,152的部分继续申请,美国专利申请09/284,152是1996年10月10日提交的08/731,170的部分继续申请。要求优先权的所有在先申请通过引用全文纳入本文。

发明领域

本发明涉及由木质纤维素生物质或纤维素物质产生生物能量或其它增值产品的组合物和方法。具体说,本发明提供能够将各种纤维素底物或木质纤维素生物质转变为可发酵糖的酶组合物。本发明也提供使用这类酶组合物的方法。

介绍

1970年代(OPEC降低石油产量而爆发石油危机时)以来,将可再生木质纤维素生物质生物转化成可发酵糖,随后发酵生产替代液体燃料的醇(如乙醇)已经吸引了研究人员的广泛注意(Bungay H.R.,“Energy:the biomassoptions”(能源:生物质选择),NY:Wiley;1981;Olsson L,Hahn-B.“木质纤维素水解物发酵生产乙醇”(Fermentation of lignocellulosichydrolysates for ethanol production),Enzyme Microb Technol 1996;18:312-31;Zaldivar J,Nielsen J,Olsson L.“由木质纤维素生产燃料乙醇:代谢工程和工艺整合的挑战”(Fuel ethanol production from lignocellulose:a challengefor metabolic engineering and process integration),Appl Microbiol Biotechnol2001;56:17-34;Galbe M,Zacchi G.,“由针叶树材生产乙醇的综述”(A reviewof the production of ethanol from softwood),Appl Microbiol Biotechnol 2002;59:618-28)。乙醇已在美国以10%汽油共混物的形式广泛使用,或在巴西作为纯净燃料供车辆使用。随着油料价格猛涨和资源逐渐耗竭,生物乙醇燃料的重要性将逐步提高。此外,可发酵糖目前用于生产塑料、聚合物和其它生物基产品,预计这一工业将明显增长,从而提高对大量低成本可发酵糖(可用作代替石油基原料的原料)的需求(例如,参见2006年7月24日《福布斯》发表的“The Rise Of Industrial Biotech”(工业生物技术的发展))。

可认为是潜在的可再生原料的主要多糖含有不同木质纤维素残基,这些多糖是纤维素和半纤维素(木聚糖)。在不同酶的共同作用下,这些多糖酶促水解成可溶性糖,如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖和其它己糖和戊糖。内切-1,4-β-葡聚糖酶(EG)和外切-纤维二糖水解酶(exo-cellobiohydrolase,CBH)能催化不溶性纤维素水解成纤维寡糖(纤维二糖是主要产物),而β-葡糖苷酶(BGL)将该寡糖转变为葡萄糖。木聚糖酶与其它辅助酶(非限制性例子包括α-L-阿拉伯呋喃糖酶、阿魏酸酯酶和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β-木糖苷酶)一起催化水解半纤维素。

无论是何种类型的纤维素原料,酶的成本和水解效率是限制生物质生物转化过程商品化的主要因素。微生物产生酶的生产成本与产生酶的菌株的生产力和发酵培养基中的最终活性产率密切相关。木质纤维素糖化过程中多酶复合物的水解效率取决于各酶的特性、它们之间的协同作用和它们在多酶混合物中的比例。

鲁克文金孢子菌(Chrysosporium lucknowense)是已知能产生各种纤维素酶、半纤维素酶和其它可能的辅助酶的真菌。鲁克文金孢子菌也分泌至少五种不同的内切葡聚糖酶,其中EGII(51kDa,Cel5A)最有活性。而且,现已开发了鲁克文金孢子菌突变菌株(包括UV18-25)用于产生织物、纸浆和纸张、去污剂和其它领域所用的酶,但不产生用于纤维素酶促糖化的酶;这些菌株也可用于高水平产生同源和异源蛋白质。在低粘度发酵中,最好的鲁克文金孢子菌突变体菌株能分泌至少50-80gl-1的胞外蛋白。在2005年对鲁克文金孢子菌的完整真菌基因组进行了测序(参见http://WorldWideWeb.dyadic-group.com/wt/dyad/pr_1115654417),现在正在进行基因组注释。

粗制的鲁克文金孢子菌多酶复合物在纤维素糖化中表现出的结果平平,在测试条件下只有一部分纤维素转化为葡萄糖。以前已经分离并研究了属于糖苷水解酶家族7和6的鲁克文金孢子菌的两种纤维二糖水解酶。CBH Ia以前在美国专利号6,573,086中称为CBH I,是70(60)kD的蛋白质。培养基中存在的CBH Ia是全长酶(经过SDS-PAGE观察到的分子量为65kDa),它由通过柔性肽接头连接的核心催化结构域和纤维素结合模块(CBM)组成,其截短形式(52kDa)代表该酶的催化结构域。与里氏木霉(T.reesei)的CBH I相比,鲁克文金孢子菌的CBH I(Cel7A)水解结晶纤维素的效率略低,但热稳定性更高。以前认为CBH IIa是内切葡聚糖酶,曾称为43kD Endo和EG6。参见例如,美国专利6,573,086。CBH IIa(43kDa)没有CBM,即其分子只含有催化结构域。

尽管在过去几十年中不断进行研究以理解酶促木质纤维素生物质降解和纤维素酶产生过程,但仍需要发现或工程改造新型高活性纤维素酶和半纤维素酶。也非常需要构建能够对木质纤维素材料进行快速有效生物降解的高效酶组合物。

发明内容

本发明提供了几种从鲁克文金孢子菌新鉴定和分离的酶。所述新酶包括两种新型纤维二糖水解酶(CBH Ib和IIb,或Cel7B和Cel6B)、内切葡聚糖酶(EG VI)(不要与CBH IIa混淆,CBH IIa以前称为EG 6)、β-葡糖苷酶(BGL)和木聚糖酶(Xyl II)。CBH IIb对微晶纤维素和棉花有高活性,与其它鲁克文金孢子菌纤维素酶显示明显的协同作用。使用这些新酶时,本发明提供用于纤维素水解的高度有效的酶组合物。

本发明的一个目的是提供酶制剂,其包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶。分离的纤维二糖水解酶可以是CBH Ib和IIb。该酶制剂可任选地含有内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地含有半纤维素酶。

本发明的另一目的是提供由纤维素产生葡萄糖的方法。该方法包括产生包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。任选地,该酶制剂可包含内切葡聚糖酶和/或β-葡糖苷酶。可将该酶制剂施用于纤维素,形成葡萄糖。

本发明的另一方面是提供产生乙醇的方法。该方法包括提供包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。任选地,该酶制剂可包含内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地包含半纤维素酶。该方法还包括将该酶制剂施用于纤维素,以产生葡萄糖,随后发酵该葡萄糖产生乙醇。

本发明还提供由乙醇产生能量的方法。该方法包括提供包含至少一种获自鲁克文金孢子菌的分离的纤维二糖水解酶的酶制剂,所述纤维二糖水解酶可以是CBH Ib或IIb。该酶制剂可任选地包含内切葡聚糖酶和/或β-葡糖苷酶。而且,该酶制剂可任选地包含半纤维素酶。该方法还包括将该酶制剂施用于纤维素以产生葡萄糖,使葡萄糖发酵产生乙醇,使所述乙醇燃烧产生能量。

本发明的另一方面是提供与相应非突变菌株相比,在相同条件下能够以较高水平表达至少一种纤维二糖水解酶和至少一种内切-1,4-β-葡聚糖酶的突变的鲁克文金孢子菌菌株。所述纤维二糖水解酶选自CBH Ia、CBH IIa、CBH Ib或CBH IIb;所述内切-1,4-β-葡聚糖酶选自EG II、EG V或EG VI。

本发明的另一方面是提供经BLAST算法测定,分别与SEQ ID NO:2、4、16、12和18所示的CBH Ib、CBH IIb、EG VI、BGL和Xyl II氨基酸序列的相同性至少为65%的蛋白质,或至少含有20个毗连氨基酸的该蛋白的一部分。本发明也考虑编码这一蛋白的相应核酸序列。

本发明一方面提供包含至少一种酶的酶制剂,该酶选自CBH Ib、CBHIIb、EG II、EG VI、BGL或Xyl II。

本发明另一方面提供由木质纤维素材料产生可发酵糖的方法。该方法包括(a)提供包含至少一种酶的酶制剂,所述酶选自CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II;和(b)将所述酶制剂施用于木质纤维素材料以产生可发酵糖。

本发明也提供产生发酵产物的方法或由可发酵糖产生发酵产物的原料。该方法包括(a)提供酶制剂,其中该酶制剂含有至少一种酶,所述酶选自CBHIb、CBH IIb、EG II、EG VI、BGL或Xyl II;(b)将所述酶制剂施用于木质纤维素材料,产生可发酵糖;和(c)使所述可发酵糖发酵产生发酵产物。

在另一方面,本发明提供由可发酵糖产生能量的方法。该方法包括(a)提供酶制剂,其中该酶制剂含有至少一种酶,所述酶选自CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II;(b)将所述酶制剂施用于木质纤维素材料,产生可发酵糖;和(c)使所述可发酵糖发酵产生可燃性发酵产物;和(d)燃烧所述可燃性发酵产物,产生能量。

本发明的一个目的是提供与相应非突变菌株相比,在相同条件下能够以较高水平表达至少一种纤维二糖水解酶和至少一种内切-1,4-β-葡聚糖酶的突变的鲁克文金孢子菌菌株。所述纤维二糖水解酶选自CBH Ia、CBH Ib、CBH IIa或CBH IIb;所述内切-1,4-β-葡聚糖酶选自EG II、EG V或EG VI。

本发明也提供经BLAST算法测定,与本文所述CBH Ib、IIb、EG VI、BGL、Xyl II氨基酸序列相同性为至少65%的蛋白质,或含有至少20个毗连氨基酸的该蛋白的一部分。

本发明另一方面提供与本文所述编码CBH Ib、CBH IIb、EG II、EG VI、BGL或Xyl II的核酸序列同源性为至少80%的核酸序列。

本发明也提供将木质纤维素材料降解成可发酵糖的方法。该方法包括使木质纤维素材料与有效量的衍生自微生物的多酶产物相接触,以产生至少一种可发酵糖。多酶产物中至少一种酶选自CBH Ia、CBH Ib、CBH IIa、CBHIIb、EG II、EG V、EG VI、BGL或Xyl II。

在另一方面,本发明提供能够表达选自下组的一种或多种酶的微生物或植物:CBH Ia、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL和Xyl II。

附图简要说明

图1:由鲁克文金孢子菌纯化的纤维二糖水解酶的SDS/PAGE(A)和等电聚焦(B)。泳道:1,具有不同分子量的标记物;泳道2和5,CBH Ib;泳道3和6,CBH IIb;泳道4,具有不同pI的标记物。

图2:在纯化日本曲霉(A.japonicus)BGL(0.5U ml-1)存在下,在40℃、pH 5.0下,纯化的纤维二糖水解酶(0.1mg ml-1)对微晶纤维素(5mg ml-1)进行水解的过程动力学(progress kinetics)。

图3:在纯化的日本曲霉BGL(0.5U ml-1)存在下,40℃、pH 5.0下棉花纤维素(5mg ml-1)水解期间,CBH IIb和其它鲁克文金孢子菌纯化酶之间的协同作用。CBH和EG浓度分别为0.15和0.05mg ml-1。用空心符号表示酶对的实验数据(连续曲线);用实心符号表示单个酶作用下获得的葡萄糖总浓度的理论值(虚线)。

图4:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE L-600的组合#1水解棉花(25mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE L-600是市售鲁克文金孢子菌多酶纤维素酶制剂(详见文中和表4)。

图5:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE-L的组合#1水解微晶纤维素(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE L是市售鲁克文金孢子菌多酶纤维素酶制剂(详见文中和表4)。

图6:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶和NCE-L 600的组合#1水解预处理的花旗松(Douglas fir)木材(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1,其中NCE-L 600是市售鲁克文金孢子菌(详见文中和表4)。

图7:在50℃,pH 5.0下,纯化的鲁克文金孢子菌酶的不同组合水解预处理的花旗松(Douglas fir)木材(50mg ml-1)的过程动力学,其蛋白质载量为0.5mg ml-1(详见文中和表5)。

图8:编码CBH IB的cbh2基因。

图9:编码CBH IIb的cbh4基因。

图10:编码CBH Ia的cbh1基因。

图11:编码CBH IIa的EG6基因。

图12:编码EG II的eg2基因。

图13:编码BGL的bgl1基因。

图14:编码EGV的eg5基因。

图15:编码EG VI的eg7基因。

图16:编码Xyl II的xyl2基因。

发明详述

本发明提供将植物生物质转变为可发酵糖的方法和组合物,所述可发酵糖可转变为有用产品。该方法包括利用酶混合物降解木质纤维素材料以释放糖的方法。本发明组合物包括能降解木质纤维素的酶组合。本文所用术语″生物质″或″木质纤维素材料″包括含有纤维素和/或半纤维素的材料。通常,这些材料也含有木聚糖、木素、蛋白质和糖,如淀粉和糖。木质纤维素通常存在于,例如植物的茎、叶、荚、皮和穗轴中,或者树木的叶、枝干和木材中。在本文中,复杂糖(如淀粉、纤维素或半纤维素)转变为可发酵糖的过程也称为″糖化″。本文所用的可发酵糖指单糖,如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖、鼠李糖、蔗糖和果糖。

生物质可包括原始生物质和/或非原始生物质,如农业生物质、市售有机产品、建筑和拆毁废料、市政固体废料、废纸和家庭垃圾。普通形式的生物质包括树木、灌木和禾本植物(grasses),小麦、麦杆、甘蔗渣、玉米、玉米壳、玉米仁(包括来自玉米仁的纤维),谷物如玉米、小麦和大麦的研磨(包括湿磨和干磨)产品和副产品以及市政固体废料、废纸和家庭垃圾。生物质可以是,但不限于草本材料、农业残料、林业残料、市政固体废料、废纸和纸浆、以及造纸厂残料。“农业生物质”包括树枝、灌木、藤条(canes)、玉米和玉米壳、能源作物、林木、水果、花、谷粒、禾本植物、草本作物、叶、树皮、针叶、原木、根、树苗、短期轮作木本作物、灌木、柳枝稷(switch grasses)、树、蔬菜、果皮、蔓生植物、甜菜粕、次粉(wheat midlings)、燕麦壳以及硬木和软木(不包括含有害材料的木材)。此外,农业生物质包括由农业加工(包括农事和林事活动)产生的有机废料,特别包括林木废料。农业生物质可以是任何上述单一物质或其组合或混合物。

可将可发酵糖转变为有用的增值发酵产品,其非限制性例子包括氨基酸、维生素、药品、动物饲料补充剂、专业化学品、化学原料、塑料、溶剂、燃料或其它有机聚合物、乳酸和乙醇,包括燃料乙醇。可通过本发明方法产生的特定增值产品包括但不限于:生物燃料(包括乙醇和丁醇);乳酸;塑料;专业化学品;有机酸,包括柠檬酸、琥珀酸和马来酸;溶剂;动物饲料补充剂;药品;维生素;氨基酸,如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸;工业酶,如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、酯酶、裂合酶、氧化还原酶、转移酶和木聚糖酶;和化学原料。

本文所用的多酶产物可获自或衍生自微生物、植物或其它来源或其组合,含有能够降解木质纤维素材料的酶。本发明多酶产物中包含的酶的例子包括纤维素酶(如纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶、半纤维素酶(如木聚糖酶、包括内切木聚糖酶、外切木聚糖酶和β-木糖苷酶)、木质酶、淀粉酶、α-阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、α-葡糖醛酸糖苷酶、阿拉伯糖酶、葡糖醛酸糖苷酶、蛋白酶、酯酶(包括阿魏酸酯酶和乙酰木聚糖酯酶)、脂酶、葡萄糖甘露聚糖酶和木糖葡糖酸酶。

在一些实施方式中,所述多酶产物包含半纤维素酶。半纤维素是一种复杂的聚合物,在不同生物中、不同组织类型中其组成迥然不同。通常,半纤维素的主要组分是β-1,4-连接的木糖(一种五碳糖)。然而,这种木糖常常以β-1,3连接的形式分枝,可用阿拉伯糖、半乳糖、甘露糖、葡糖醛酸的连接取代,或通过酯化连接于乙酸。半纤维素也可含有葡聚糖,葡聚糖是β-连接的六碳糖的总称。这些半纤维素包括木糖葡聚糖、葡甘露聚糖和半乳甘露聚糖。

与单子叶植物(单子叶植物是种子包含一个子叶的植物,如玉米、小麦、水稻、禾本植物、大麦)相比,双子叶植物(双子叶植物是种子包含两个子叶的植物,如菜豆,花生,杏仁,豌豆,四季豆)中半纤维素的组成、取代特性和分枝程度非常不同。在双子叶植物中,半纤维素主要由木糖葡聚糖组成,木糖葡聚糖是具有1,6-β-连接的木糖基侧链的1,4-β-连接的葡萄糖链。在单子叶植物,包括大部分谷物中,半纤维素的主要组分是异木聚糖(heteroxylan)。它们主要由1,4-β-连接的木糖主链聚合物和酯连接乙酸修饰的木糖组成,木糖主链聚合物通过1,3-β连接于阿拉伯糖、半乳糖和甘露糖。也存在分枝的β葡聚糖,它由1,3-和1,4-β-连接的葡糖基链组成。在单子叶植物中,纤维素、异木聚糖和β葡聚糖的含量基本相等,各自占细胞壁干物质的约15-25%。

半纤维素裂解酶,即半纤维素酶包括外切水解酶和内切水解酶,如木聚糖酶、β-木糖苷酶和酯酶,它们通过水解主动切割半纤维素物质。这些木聚糖酶和酯酶切割木聚糖和木聚糖的乙酰基侧链,其余木糖-寡聚体是未取代的,因此仅可用P木糖苷酶水解。此外,在水解半纤维素的酶制剂中发现几种了解较少的次要活性。虽然多酶产物可包含许多类型的酶,但优选包含能提高或增强生物质的糖释放的酶,包括半纤维素酶的混合物。在一个实施方式中,半纤维素酶是木聚糖酶、阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、葡糖醛酸糖苷酶、内切半乳糖酶(endo-galactanase)、甘露聚糖酶、内切拉伯糖酶、外切阿拉伯糖酶、外切半乳糖酶(exo-galactanase)、阿魏酸酯酶、半乳甘露聚糖酶、木糖葡糖酸酶、或其混合物。具体说,该酶可包括葡糖淀粉酶、β-木糖苷酶和/或β-葡糖苷酶。可通过各种来源提供多酶产物的酶。在一个实施方式中,通过培养天然产生酶或经遗传修饰表达酶的微生物或植物来生产所述酶。在另一实施方式中,可从市场上购得多酶产物的至少一种酶。

本发明的一个实施方式涉及催化木质纤维素材料转变为本文所述可发酵糖、其同源物和/或其片段的一种分离酶。本发明也包括编码任何这类蛋白质、其同源物或片段的分离的核酸分子。根据本发明,分离的蛋白质或多肽是从其天然环境取出(即经人工操作)的蛋白质,可包括(例如)纯化的蛋白质、部分纯化的蛋白质、重组产生的蛋白质和合成产生的蛋白质。因此,″分离″不反应蛋白质的纯化程度。优选地,本发明分离蛋白是重组产生的。可通过合成(例如化学合成,如肽合成)或重组途径产生分离肽。也可以利用本领域已知的蛋白质纯化方案,以粗发酵产物或部分纯化或纯化(例如,从微生物纯化)的蛋白质制剂的形式提供分离的蛋白质。此外和例如,称为衍生自或来自特定生物体的蛋白质,如″鲁克文金孢子菌纤维素酶和/或半纤维素酶″指来自鲁克文金孢子菌微生物的纤维素酶和/或半纤维素酶(通常包括天然产生的纤维素和/或半纤维素酶的同源物),或从鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶的结构(如序列)、也可能是功能的知识而产生的纤维素酶和/或半纤维素酶。换言之,通常述及鲁克文金孢子菌纤维素酶和/或半纤维素酶或者衍生自鲁克文金孢子菌的纤维素酶和/或半纤维素酶包括与鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶结构和功能基本类似的任何纤维素酶和/或半纤维素酶,或者鲁克文金孢子菌天然产生的纤维素酶和/或半纤维素酶的生物学活(即具有生物学活性的)同源物,如下文所详述。因此,鲁克文金孢子菌纤维素酶和/或半纤维素酶可包括纯化、部分纯化、重组、突变/修饰和合成的蛋白质。相同描述用于指本文所述的其它蛋白质或肽以及这类蛋白质或肽的其它微生物来源。

本发明的一个实施方式涉及分离的核酸分子,其包含编码本文所述任何酶,包括这类酶的同源物或片段的核酸序列,以及与其完全互补的核酸序列,或基本由其组成,或由其组成。按照本发明,分离的核酸分子是从其天然环境取出(即经人工操作)的核酸分子,其天然环境是天然发现该核酸分子的基因组或染色体。因此,″分离″不一定反映核酸分子的纯化程度,但表明该分子不包含天然发现该核酸分子的完整基因组或完整染色体。分离的核酸分子可包含基因。包含基因的分离核酸分子不是包含这个基因的染色体片段,而包含与该基因有关的编码区和调控区,但不含同一染色体上天然发现的其它基因。分离核酸分子也可包含侧接(即在该序列的5′和/或3′末端侧接)其它核酸的特定核酸序列,所述其它核酸在天然情况下通常不侧接所述的特定核酸序列(即,异源序列)。分离的核酸分子可包括DNA、RNA(如mRNA),或者DNA或RNA的衍生物(如cDNA)。优选地,本发明的分离核酸分子是用重组DNA技术(如,聚合酶链反应(PCR)扩增,克隆)或化学合成产生。可利用本领域技术人员已知的许多方法产生核酸分子同源物(参见例如,Sambrook等,《分子克隆:实验室手册》(Molecular Cloning:A Laboratory Manual),冷泉港实验室出版社(Cold Spring Harbor Labs Press)(1989))。例如,可利用各种技术修饰核酸分子,这些技术包括但不限于:经典诱变技术和重组DNA技术,如定点诱变、对核酸分子进行化学处理以诱导突变、对核酸片段进行限制性酶切、连接核酸片段、PCR扩增和/或对核酸序列所选区域进行诱变、合成寡核苷酸混合物和连接混合基团以“构建”核酸分子混合物,以及上述技术的组合。可通过筛选核酸编码蛋白的功能和/或与野生型基因杂交,从修饰核酸的混合物中选择核酸分子同源物。

本发明另一实施方式包括包含重组载体和编码蛋白质或肽的核酸序列的重组核酸分子,所述蛋白质或肽具有可用于催化木质纤维素材料转变为可发酵糖的至少一种酶活性。按照本发明,重组载体是工程改造(即人工产生)的核酸分子,它用作操作所选核酸序列和将这类核酸序列引入宿主细胞的工具。因此,重组载体适用于对所选核酸序列进行克隆、测序和/或其它操作,例如表达所选核酸序列和/或将其递送至宿主细胞中形成重组细胞。这类载体一般含有异源核酸序列,即天然情况下不与所克隆或所递送核酸序列相邻的核酸序列,但该载体也可含有天然情况下与本发明核酸分子相邻或可用于表达本发明核酸分子的调控核酸序列(如启动子、非翻译区)(详述见下)。该载体可以是真核或原核的RNA或DNA,一般是质粒。该载体可以染色体外元件的形式(如质粒)维持,或者可整合到重组生物体(如微生物或植物)的染色体。完整载体可保持在宿主细胞中,或者在某些条件下,可缺失该质粒DNA,留下本发明核酸分子。整合的核酸分子可以在染色体启动子控制下、在天然或质粒启动子控制下,或在几个启动子的联合控制下。可将一个或多个拷贝的核酸分子整合到染色体中。本发明重组载体可含有至少一个可选择标记物。

一般地,重组核酸分子包括操作性连接于一个或多个表达控制序列的至少一个本发明核酸分子。按照本发明,术语“操作性连接”指将核酸分子连接于表达控制序列(如,转录控制序列和/或翻译控制序列),从而在转染(即转化、转导、转染、偶联或导入)宿主细胞时,可表达该分子。转录控制序列是控制转录的启动、延长或终止的序列。特别重要的转录控制序列是控制转录启动的序列,如启动子、增强子、操纵子和阻抑物序列。

合适的转录控制序列包括能在要引入重组核酸分子的宿主细胞或生物体内行使功能的转录控制序列。

酶和编码酶的核酸

如实施例所述,本发明提供了几种纯化酶,包括两种纤维二糖水解酶(CBH Ib,SEQ ID NO.2;CBH IIb,SEQ ID NO.4)、内切葡聚糖酶(EG VI,SEQ ID NO.16)、β-葡糖苷酶(BGL,SEQ ID NO.12)和木聚糖酶(Xyl II,SEQ ID NO.18)。本发明也考虑这些酶的变体,包括通常用BLAST算法测定到氨基酸序列与这些酶的氨基酸相同性为至少65%、70%或75%的变体。

此外,本发明提供编码这些序列的核酸,包括基因cbh2(SEQ ID NO.1,编码CBH Ib),基因cbh4(SEQ ID NO.3,编码CBH IIb);基因eg7(SEQ IDNO.15,编码EG VI),基因bgl1(SEQ ID NO.11,编码BGL)和基因xyl2(SEQ ID NO.17,编码Xyl II)。本发明也考虑这些核酸的变体,包括与这些核酸的同源性为至少80%、85%或90%的变体。

如本文所述,本发明新鉴定和分离的酶可与促进纤维素材料糖化的至少一种其它酶联用。在优选实施方式中,这种酶衍生自鲁克文金孢子菌。例如,该酶可以是CBH Ia(SEQ ID NO.6)、CBH IIa(SEQ ID NO.8)、EG II(SEQID NO.10)或EG V(SEQ ID NO.14)。然而需要注意的是,在某些优选实施方式中,通过遗传修饰微生物或植物使其表达cbh1(SEQ ID NO.5,编码CBH Ia)、EG6(SEQ ID NO.7,编码CBH IIa)、eg2(SEQ ID NO.9,编码EG II)和/或EG5(SEQ ID NO.13,编码EG V),可获得CBH Ia、CBH IIa、EG II和EG V。一个特别有用的糖化组合是CBH Ia、CBH Ib、CBH IIb、EGII、EG V、BGL和Xyl II。

在某些实施方式中,通过分子进化技术,使本发明的多核苷酸和多肽进化从而产生和鉴定具有所需结构、功能和/或物理特征的新变体。分子进化技术可以是“DNA改组”或“有性PCR(sexual PCR)”(WPC,Stemmer,PNAS,91:10747,(1994)),也称为“定向分子进化”、“外显子改组”、“定向酶进化”、“体外进化”和“人工进化”。本领域已知提到的这些术语,它们包括在本发明范围内。可改变特征如活性、蛋白质的酶动力学,蛋白质的Ki、Kcat、Km、Vmax、Kd、热稳定性、最优pH等。在某些实施方式中,可使本发明多核苷酸和/或多肽进化从而赋予对原位酶促糖化和发酵有利的特性。例如,可使酶进化从而能在适合糖发酵的环境中最佳地行使功能。在一个例子中,使酶进化从而能在高温和高乙醇含量的环境,例如生物体如酵母正在发酵糖的环境中具有最高活性。以此方式,木质纤维素糖化和发酵在一个工艺步骤中进行。在另一个例子中,使该酶进化从而能耐受严苛的化学或热学环境,例如在木质纤维素预处理过程中可能经历的环境(如本文所述)。在这些实施方式中,在加入酶之前不一定要对木质纤维素进行化学或热学预处理。另外,这些处理和酶促糖化可同时进行。当然,本发明也考虑涉及木质纤维素产生糖的多个步骤的方法,如进化的酶首先糖化木质纤维素,随后由生物如酵母发酵。

在其它实施方式中,提高蛋白质特定特性的能力也可用于将酶的特征性活性改变为与其最初鉴定的活性完全无关的活性。本发明其它理想的改进可能是每种蛋白质所特有的,因此为本领域所熟知且属于本发明范围。

酶的表达

用于本发明和/或用作本发明所用酶来源的微生物包括产生能够降解木质纤维素材料的酶的任何微生物,包括细菌、酵母和丝状真菌。为简明和方便起见,本文讨论丝状真菌微生物;然而,本领域技术人员应认识到其它微生物也可用于本发明。丝状真菌已经广泛用于蛋白质制造工业。这些真菌因其生物学小生境(biological niche)可用作微生物清除剂而极其适合于蛋白质的生产和分泌。在富含生物聚合物的环境,例如枯枝落叶层中,真菌通过分泌降解这些聚合物的酶,产生容易用作生长营养物的单体来竞争。已广泛研究了真菌产生蛋白质的天然能力,主要用于生产工业酶。改良菌株的蛋白质生产水平可高于天然分离物几个数量级;通常每升发酵培养物能产生几十克蛋白质。

本发明考虑了各种真菌菌株,包括但不限于:踝节菌属(Talaromyces)、曲霉属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、青霉属(Penicillium)、镰孢霉属(Fusarium)、腐质霉属(Humicola)、毁丝霉属(Myceliophthora)、棒囊壳属(Corynascus)、毛壳菌属(Chaetomium)、弯颈霉属(Tolypocladium)、梭孢壳菌属(Thielavia)、支顶孢属(Acremonium)、侧孢霉属(Sporotrichum)、耐热子囊菌属(Thermoascus)和金孢子菌属(Chrysosporium)。这些是许多可能用作酶来源和/或适合用作生产这种酶混合物的宿主生物的真菌属中的一部分。这些真菌可获自,例如,各种保藏机构,例如美国典型培养物保藏中心(ATCC)、俄罗斯科学院全俄微生物保藏中心(All Russian Collection of Microorganisms of the Russian Academy ofSciences,VKM)和席梅尔培养物中心局(Centraalbureau voorSchimmelcultures)。

鲁克文金孢子菌(C.lucknowense)的突变株

金孢子菌属(Chrysosporium)的特定菌株能表达极大量的蛋白质,这些菌株的天然表达调节序列特别感兴趣。这些菌株称为金孢子菌菌株C1、菌株UV13-6、菌株NG7C-19和菌株UV18-25。按照布达佩斯条约,它们保藏在位于莫斯科的全俄保藏中心(VKM)保藏所。按照布达佩斯条约,野生型C1菌株的保藏号为VKM F-3500D,保藏日期为1996年8月29日,C1 UV13-6突变体的保藏号为VKM F-3632D,保藏日期为1998年2月9日,C1 NG7c-19突变体的保藏号为VKM F-3633D,保藏日期为1998年2月9日,C1 UV18-25突变体的保藏号为VKM F-3631D,保藏日期为1998年2月9日。

优选应用能在所选宿主中高表达的表达调节区。这也可以是衍生自异源宿主的高表达调节区,如本领域所熟知。已知大量表达并为本发明提供合适的表达调节序列的蛋白质的具体例子包括但不限于:疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶(如内切-葡聚糖酶、纤维二糖水解酶)和聚半乳糖醛酸酶。在固体状态和浸没式发酵条件下均确定有高产量。本领域熟知评估这类蛋白质的存在或产生的实验。

异源表达调节序列在金孢子菌中的工作效率与天然金孢子菌序列相同。这使得能够将熟知的构建物和载体用于转化金孢子菌并提供多种其它可能性以在此种新型表达和分泌宿主中构建表达速率良好的载体。由于已经确定金孢子菌菌株的纤维素酶表达速率极高,所以特别优选这类蛋白质的表达调节区。

包含鲁克文金孢子菌的核酸表达调节区或其衍生物的核酸构建物形成了本发明一个单独的实施方式,包含操作性连接于待表达多肽编码基因的这一区域的突变金孢子菌菌株也是这样。在优选实施方式中,这种核酸构建物是与纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶和/或木聚糖酶表达有关的金孢子菌的表达调节区。

本发明也包括遗传工程改造的金孢子菌菌株,其中引入的序列可以是金孢子菌来源的。然而,这种菌株可能与天然产生菌株的不同之处在于,例如,用于转化或转染金孢子菌的核酸序列中存在的异源序列,存在多个编码感兴趣多肽的序列拷贝或它们的表达量超过了相同条件下非工程改造菌株的表达量或在正常的非表达条件下发生表达。后者可能是与非重组情况相反,由诱导型启动子调节感兴趣序列的情况,或与非工程改造菌株相比是由另一因素诱导表达的情况。根据前述实施方式中的定义,本发明不应涵盖天然产生的金孢子菌菌株。本发明涉及利用经典遗传学技术或遗传学工程改造方法进行工程改造产生的菌株。

产生重组微生物或植物的方法也是本发明的一部分。该方法包括将编码异源或同源多肽的核酸序列稳定引入微生物菌株或植物,所述核酸序列操作性连接于表达调节区。曾报道过这类方法用于转化丝状真菌。在一个优选的实施方式中,突变的鲁克文金孢子菌衍生自经工程改造过度表达Xyl II基因的UV18-25(登录号VKM F-3631D)。

遗传修饰的生物体

本文所用的遗传修饰的微生物可包括遗传修饰的细菌、酵母、真菌或其它微生物。这类遗传修饰的微生物具有与正常(即野生型或天然产生的)形式相比,经过修饰(即突变或改变)的基因组,以便实现所需结果(如,提高或改变将木质纤维素材料转变为可发酵糖的至少一种酶或多酶产物的活性和/或产量)。可采用经典的菌株发育(strain development)和/或分子遗传学技术来遗传修饰微生物。本领域已知用于微生物的这类技术,通常参见,例如,Sambrook等,1989,《分子克隆:实验室手册》(Molecular Cloning:A LaboratoryManual),冷泉港实验室出版社(Cold Spring Harbor Labs Press)。参考文献Sambrook等,同上,通过引用全文纳入本文。遗传修饰的微生物可包括插入、缺失或修饰(即,突变的;例如,通过核苷酸的插入、缺失、取代和/或反转)核酸分子的微生物,这种遗传修饰方式能在所述微生物中提供所需效果。

在本发明的一个方面,遗传修饰的微生物可内源性地包含和表达酶或多酶产物,以便将木质纤维素材料转变为可发酵糖,所述遗传修饰可以是一种或多种这类内源性酶的遗传修饰,所述修饰对所述微生物将木质纤维素材料转变为可发酵糖的能力产生一些影响。

在本发明的另一方面,遗传修饰的微生物可内源性地包含和表达酶或多酶产物,以便将木质纤维素材料转变为可发酵糖,所述遗传修饰可以是引入至少一种外源性核酸序列(如重组核酸分子),其中所述外源性核酸序列编码可用于将木质纤维素材料转变为可发酵糖的至少一种其它酶和/或提高酶或多酶产物将木质纤维素材料转变为可发酵糖的效率的蛋白质。在本发明的这一方面,所述微生物也可含有对一个或多个基因的至少一个修饰,包括对将木质纤维素材料转变为可发酵糖的内源性酶的基因修饰。

在本发明的另一方面,遗传修饰的微生物不一定内源性(天然)包含将木质纤维素材料转变为可发酵糖的酶或多酶产物,但经过遗传修饰能引入编码将木质纤维素材料转变为可发酵糖的至少一种酶、多种酶或多酶产物的至少一种重组核酸分子。这类微生物可用于本发明方法,或可用作粗发酵产物、部分纯化的重组酶和/或纯化的重组酶的生产微生物,其中任何一种均可用于本发明方法。

遗传修饰的植物

本发明也考虑到含有这种基因的遗传修饰的植物。可利用这些植物产生该酶,或作为木质纤维素材料而用作本发明方法底物。本领域了解产生重组植物的方法。例如,已经开发了许多植物转化方法,包括生物学和物理学的转化方法。参见例如,Miki等,将外来DNA引入植物的方法(Procedures forIntroducing Foreign DNA into Plants),刊于《植物分子生物学和生物技术方法》(Methods in Plant Molecular Biology and Biotechnology),Glick,B.R.和Thompson,J.E.编(CRC出版社,伯克莱屯(Boca Raton),1993)第67-88页。此外,可获得用于植物细胞或组织的转化和植物再生的载体和体外培养方法。参见例如,Gruber等,植物转化载体(Vectors for Plant Transformation),刊于《植物分子生物学和生物技术方法》(Methods in Plant Molecular Biologyand Biotechnology),Glick,B.R.和Thompson,J.E.编(CRC出版社,伯克莱屯,1993)第89-119页。

在本发明的某些实施方式中,根据土壤杆菌(Agrobacterium)的天然转化系统,将表达载体引入植物,以获得表达本发明酶的遗传修饰的植物。参见例如,Horsch等,Science,227:1229(1985)。根癌土壤杆菌(A.tumefaciens)和毛根土壤杆菌(A.rhizogenes)是植物致病性土壤细菌,其能遗传转化植物细胞。根癌土壤杆菌和毛根土壤杆菌的Ti和Ri质粒分别携带负责遗传转化植物的基因。参见例如,Kado,C.I.,Crit.Rev.Plant.Sci.10:1(1991)。许多参考文献描述了土壤杆菌载体系统和土壤杆菌介导的基因转移方法,包括Gruber等,同上,Miki等,同上,Moloney等,Plant Cell Reports 8:238(1989)和美国专利4,940,838和5,464,763,通过引用全文纳入本文。

在其它实施方式中,通过微粒轰击介导的转化获得遗传修饰的植物,其中DNA装载在微粒表面上。用生物射弹设备将微粒加速到足以穿透植物细胞壁和细胞膜的速度,以便将表达载体引入植物组织。Sanford等,Part.Sci.Technol.5:27(1987),Sanford,J.C.,Trends Biotech.6:299(1988),Sanford,J.C.,Physiol.Plant 79:206(1990),Klein等,Biotechnology 10:268(1992)。

本发明考虑的通过物理途径将DNA递送给植物的另一种方法是超声处理靶细胞。Zhang等,Bio Technology 9:996(1991)。或者,利用脂质体或原生质球融合将表达载体引入植物中。Deshayes等,EMBO J.,4:2731(1985),Christou等,Proc Natl.Acad.Sci.USA 84:3962(1987)。利用CaCh沉淀、聚乙烯醇或聚-L-鸟氨酸将DNA直接摄入原生质体己见诸报道。Hain等,Mol.Gen.Genet.199:161(1985)和Draper等,Plant Cell Physiol.23:451(1982)。对原生质体以及完整的细胞和组织进行电穿孔也已见诸报道。Donn等,第七届国际植物细胞和组织培养会议摘要(Abstracts of VIIth InternationalCongress on Plant Cell and Tissue Culture)IAPTC,A2-38,第53页(1990);D′Halluin等,Plant Cell 4:1495-1505(1992)和Spencer等,PlantMol.Biol.24:51-61(1994)。

使用鲁克文金孢子菌的酶和突变菌株的方法

本发明也提供对纤维素材料进行酶促糖化的方法。任何含纤维素的材料均可用本发明酶处理,其非限制性例子包括果园修枝物、灌木丛、工厂废料、城市废木料、庭园废料(yard waste)、市政废料、砍伐废料、森林疏伐品(thinning)、短期轮作木本作物、工业废料、小麦杆、燕麦杆、稻杆、大麦杆、黑麦杆、亚麻杆、甘蔗、玉米秸、玉米杆、玉米芯、玉米壳、大网茅草、鸭茅状磨擦禾、狐尾草;甜菜渣、柑桔渣、种子壳、纤维素动物废料、草坪修剪物、棉花和海草。

在某些优选实施方式中,先预处理木质纤维素材料再接触本发明的酶或酶混合物。通常,预处理是使木质纤维素材料的后续酶促糖化更有效率(即耗时较短或成本较低)的任何方法。例如,可通过以下方法预处理木质纤维素材料,所述方法包括但不限于:先接触酸、碱、溶剂、热、过氧化物、臭氧或其组合,然后进行酶促糖化。这些预处理也可与其它加工形式联合使用,其它加工形式包括例如:机械粉碎、粉碎、研磨或快速减压(如蒸汽喷发(steamexplosion))。

通常,本发明酶促糖化包括使用CBH Ia、CBH IIb、EG VI、BGL、XylII或其混合物。这些酶中的一种或多种可进一步与能够促进酶促糖化的其它酶组合,所述其它酶可能衍生自鲁克文金孢子菌、突变菌株或另一种生物体。例如,在一个实施方式中,酶促糖化涉及含有CBH Ia、CBH Ib、CBH IIb、EG II、EG V、BGL和Xyl II的酶混合物。在其它优选的实施方式中,酶混合物含有纤维二糖水解酶与β-葡糖苷酶如BGL,纤维二糖水解酶可以是CBH Ia、CBH Ib、CBH IIa、CBH IIb、和其混合物。

在某些实施方式中,酶组合物是含有纯化形式的CBH Ia、CBH Ib、CBHIIb、EG II、EG VI、BGL或Xyl II的人工酶组合物。这些酶的纯化形式可单独使用或混合在一起使用。在某些优选实施方式中,所选的纯化酶的含量高于野生型鲁克文金孢子菌的酶分泌情况。

在某些实施方式中,本发明提供能够表达CBH Ia、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL或Xyl II或其混合物的鲁克文金孢子菌突变株,其表达比例高于野生型生物体的酶分泌情况。这类鲁克文金孢子菌突变株的分泌酶可用作产生纯化形式的CBH Ia、CBH Ib、CBH IIa、CBHIIb、EG II、EG V、EG VI、BGL或Xyl II的原料。或者,这类突变株的分泌酶也可直接应用于准备糖化的纤维素材料。在特别优选的实施方式中,在有助于鲁克文金孢子菌突变株增殖的环境,如生物反应器中,使纤维素材料直接接触鲁克文金孢子菌突变株。鲁克文金孢子菌突变株原位分泌的CBIa、CBH Ib、CBH IIa、CBH IIb、EG II、EG V、EG VI、BGL或Xyl II或其混合物的比例高于野生型生物体的酶分泌,导致纤维素材料的原位糖化增加。

通过本发明的酶组合物进行酶处理后,产生的可发酵糖可接触天然产生或遗传工程改造的微生物,从而能使糖发酵产生乙醇或其它增值发酵产品。优选地,将基本上所有葡萄糖转变为乙醇,乙醇随后可用作燃料、溶剂或化学反应物。在优选实施方式中,乙醇用作推动运输车辆的燃料,运输车辆的非限制性例子包括汽车、卡车、公交车、机动脚踏两用车和摩托车。来自葡萄糖的其它潜在发酵产品包括但不限于:生物燃料(包括乙醇);乳酸;塑料;专业化学品;有机酸,包括柠檬酸、琥珀酸和马来酸;溶剂;动物饲料补充剂;药品;维生素;氨基酸,如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸;工业酶,如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂合酶、氧化还原酶和转移酶;和化学原料。

实施例

实施例1:酶分离

利用鲁克文金孢子菌突变菌株产生的培养物滤出液分离单独的酶。市售制剂NCE-L600(鲁克文金孢子菌)来自美国戴阿迪克国际公司(DyadicInternational,Inc.,USA)。

由市售制剂获得来自日本曲霉(Aspergillus japonicus)的高度纯化的BGL(纤维二糖酶),纤维二糖酶比活为50U mg-1蛋白质(pH 5.0,40℃),用于水解不溶性纤维素的实验。

实施例2:酶纯化

在法玛西亚FPLC系统(瑞典)上进行层析,以便纯化酶。纤维二糖水解酶和内切葡聚糖酶BGL和Xyl II分离自鲁克文金孢子菌UV18-25培养物滤出液。BGL和Xyl II(木聚糖酶II)分别分离自克文金孢子菌UV18ΔCbh1#10和Xyl2-18突变菌株产生的培养物滤出液。

在所有情况下,第一个纯化阶段是在Source 15Q柱(40ml体积)上进行阴离子-交换层析。用0.02M双Tris-HCl缓冲液,pH 6.8平衡该柱。首先将初始培养物滤出液脱盐,并通过在阿克莱斯(Acrylex)P4(匈牙利瑞纳公司(Reanal,Hungary))上进行凝胶过滤转移到初始缓冲液中。将样品(400mg蛋白质)应用于Source 15Q柱,用0-1M的NaCl进行梯度洗脱,流速为10ml/分钟。

Source 15Q(以0.05M NaCl洗脱)后,第一种蛋白质组分具有高微晶纤维素酶活性,将该组分在Source 15异丙基柱(瑞典法玛西亚公司(Pharmacia,Sweden))上进行疏水相互作用层析。用50mM乙酸钠缓冲液,pH 5.0配制的1.7M硫酸铵平衡该柱。用1.7-0M硫酸铵反向线性梯度洗脱蛋白质,流速为4ml/分钟。对微晶纤维素活性最高的蛋白质组分(洗脱的盐浓度为0.30-0.35M)含有分子量为70kDa的同源蛋白(CBH IIb,参见图1)。

Source 15Q(以0.22M NaCI洗脱)后,蛋白质组分对微晶纤维素和p-NP-β-D-纤维二糖苷有活性,将该组分在Mono P HR 5/20柱(瑞典法玛西亚公司)上进行色谱聚焦,以便进一步纯化。用0.025M甲酸钠缓冲液,pH 4.0平衡该柱。用pH 4.5-3.0(用Polybuffer 74)梯度洗脱蛋白质,流速为0.5ml/分钟。色谱聚焦结果获得同源60kDa CBH Ib(图1)。

根据SDS-AGE和等电聚焦,两种新分离的纤维二糖水解酶同源(图1),发现其分子量分别为60和70kDa,pI为3.8和5.6。使用MALDI-TOF质谱进行肽质量指纹(数据未显示)显示,这些蛋白质不同于上述纤维二糖水解酶(Cel6A和Cel7A)以及以前分离的其它鲁克文金孢子菌酶。随后,利用串联TOF/TOF质谱(MS/MS)对由新纤维二糖水解酶产生的胰蛋白酶水解肽进行从头测序,然后利用BLAST检索SWISS-PROT(UniProtKB)数据库,显示60kDa和70kDa的蛋白质与来自GH家族7和6的纤维二糖水解酶具有序列相似性(表1,家族分类参见HTTP://afmb.cnrs-mrs.fr/CAZY/)。因此,它们的分类分别为Cel7B(CBH Ib)和Cel6B(CBH IIb)。因此,鲁克文金孢子菌真菌分泌不同基因编码的至少四种纤维二糖水解酶,其中两种属于糖基水解酶家族6(GH6),另外两种酶属于GH7家族(表2)。CBH Ia(Cel7A)和CBH IIb(Cel6B)的分子代表由柔性肽接头连接的催化域和CBM组成的典型纤维素酶。CBH Ib(Cel7B)和CBH IIa(Cel6A)的分子仅由催化域组成(它们缺少CBM)。应注意到,研究最充分的真菌里氏木霉只有两种纤维二糖水解酶:I(Cel7A)和II(Cel6A)。其它真菌,如特异腐质霉(Humicola insolens)也分泌两种纤维二糖水解酶(Cel7A和Cel6A),而黄孢原毛平革菌(Phanerochaetechrysosporium)产生至少七种不同的细胞生物水解酶,其中六种酶属于GH7家族。除黄孢原毛平革菌CBH 1-1(Cel7A)外,所有上述酶均具有CBM。

Source 15Q(以0.10M NaCl洗脱)后,由对p-NP-β-D-吡喃葡糖苷和纤维二糖具有最高活性的蛋白质组分分离BGL。对该组分进行上述疏水相互作用层析,以1.3M硫酸铵洗脱分子量为106kDa和pI为4.8的同源BGL。发现BGL对p-NP-β-D-吡喃葡糖苷和纤维二糖的比活分别为11和26U mg-1蛋白(40℃,pH 5.0)。纯化的BGL在pH 4.0时具有最优活性,在pH 2.5-6.5的范围内保持>50%的活性。最优温度为40℃。在60℃、50℃和40℃加热3小时后,该酶分别保持10%、64%和100%的活性。该酶对底物纤维二糖、龙胆二糖和昆布二糖具有高活性。利用槐糖、纤维三糖、纤维四糖、纤维五糖和纤维六糖作底物,也观察到弱活性。用乳糖或海藻糖作底物,没有观察到活性。

进行阴离子交换层析,然后进行上述疏水相互作用层析,并在Superose12HR 10/30柱(瑞典法玛西亚公司)上进行凝胶过滤,获得同源Xyl II(24kDa,pI7.9)。利用0.1M乙酸钠缓冲液,pH 5.0,流速为0.3ml/分钟进行最后层析阶段的洗脱。Xyl II的木聚糖酶比活为395U mg-1蛋白质(50℃,pH5.0,桦木木聚糖作底物)。该酶的最优pH为6.0,最优温度为70℃。Xyl II对底物木聚糖高度特异,对羧甲基纤维素(CMC)或大麦葡聚糖无活性。

如其它文献所述纯化鲁克文金孢子菌CBH Ia(65kDa)、CBH IIa(43kDa)、EG II(51kDa)、EG V(25kDa)、EG VI(47kDa)(参见Gusakov AV,Sinitsyn AP,Salanovich TN,Bukhtojarov FE,Markov AV,Ustinov BB,vanZeijl C,Punt P,Burlingame R.“鲁克文金孢子菌工业菌株产生的两种形式的热稳定性和高活性纤维二糖水解酶I(Cel7A)的纯化、克隆和鉴定(Purification,cloning and characterisation of two forms of thermostable andhighly active cellobiohydrolase I(Cel7A)produced by the industrial strain ofChrysosporium lucknowense)”Enzyme Microb Technol 2005;36:57-69;Bukhtojarov FE,Ustinov BB,Salanovich TN,Antonov AI,Gusakov AV,Okunev ON,Sinitsyn AP.“真菌鲁克文金孢子菌的纤维素酶复合物:内切葡聚糖酶和纤维二糖水解酶的分离和鉴定(Cellulase complex of the fungusChrysosporium lucknowense:isolation and characterization of endoglucanasesand cellobiohydrolases)”,Biochemistry(莫斯科)2004;69:542-51。

通过SDS-PAGE和等电聚焦鉴定酶纯度。利用Mini Protean II设备(美国伯乐实验室公司(Bio-Rad Laboratories,USA))在12%凝胶中进行SDS-PAGE。在111型IEF小单位(IEF Cell)(美国伯乐实验室公司)上进行等电聚焦。用考马斯蓝对蛋白质染色。

实施例3:肽的MALDI-TOF和串联TOF/TOF质谱

基本如Smith所述(Smith BE.蛋白质测序方法(Protein sequencingprotocols).Totowa:休曼出版社(Humana Press);1997)进行SDS-PAGE后,在凝胶中对蛋白质条带进行胰蛋白酶消化。将50mM NH4HCO3配制的胰蛋白酶(普洛麦格公司(Promega),改良的,5μg/mL)用于蛋白质消化。用含有0.1%三氟乙酸的20%乙腈水溶液提取凝胶中得到的肽,并进行MALDI-TOFMS(参见James P.(编)蛋白酶体研究:质谱(Proteome research:massspectrometry).柏林:施普林格弗莱格公司(Springer-Verlag);2001)。通过串联质谱分析CBH Ib和IIb的胰蛋白酶消化物的质谱选择肽,以便从头测定其序列。用Ultraflex TOF/TOF质谱仪(德国BD有限公司(Bruker DaltonikGmbh,Germany))进行MS实验。

实施例4:酶活性实验

在pH 5.0和50℃时,酶与0.5%羧甲基纤维素(CMC,中等粘度,美国西格玛公司(Sigma,USA))进行5分钟反应后测定释放的还原糖,以确定CMC酶活性(Sinitsyn AP,Chernoglazov VM,Gusakov AV.“细胞裂解酶的研究方法和特性(Methods of investigation and properties of cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990)。以与CMC酶活性相同的方式测定对大麦β-葡聚糖(澳大利亚麦格酶公司(Megazyme,Australia))和桦木木聚糖(美国西格玛公司(Sigma,USA))的酶活性,不同之处在于培育时间是10分钟。在pH 5.0和40℃时,酶与5mg ml-1微晶纤维素PH 105(德国色瓦公司(Serva,Germany))反应60分钟后分析释放的还原糖,以确定微晶纤维素酶活性。通过索莫奇-尼尔森(Somogyi-Nelson)方法分析还原糖(Sinitsyn AP,Chernoglazov VM,GusakovAV,“细胞裂解酶的研究方法和特性(Methods of investigation and propertiesof cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990;Somogyi M.,糖测定的注释(Notes onsugar determination)J Biol Chem 1952;195:19-23。按照Ghose的推荐方法测定滤纸活性(FPA)(Ghose TK.“纤维素酶活性的测定(Measurement of cellulaseactivities)”,Pure Appl Chem 1987;59:257-68)。

如其它文献所述,在pH 5.0和40℃测定对p-NP-β-D-吡喃葡糖苷、p-NP-β-D-纤维二糖和p-NP-β-D-乳糖苷(美国西格玛公司)的活性(GusakovAV,Sinitsyn AP,Salanovich TN,Bukhtojarov FE,Markov AV,Ustinov BB,van Zeijl C,Punt P,Burlingame R.“鲁克文金孢子菌工业菌株产生的两种形式的热稳定性和高活性纤维二糖水解酶I(Cel7A)的纯化、克隆和鉴定”,Enzyme Microb Technol 2005;36:57-69)。

通过葡萄糖氧化酶-过氧化物酶方法测定2mM纤维二糖释放葡萄糖的初始速率,以确定pH 5.0和40℃条件下的纤维二糖酶活性(Sinitsyn AP,Chernoglazov VM,Gusakov AV,“细胞裂解酶的研究方法和特性(Methods ofinvestigation and properties of cellulolytic enzymes)”(俄文),生物技术丛书(Biotechnology Series),第25卷.莫斯科:VINITI出版社;1990)。

所有活性均以国际单位表示,即1个活性单位对应于每分钟水解1微摩尔底物或释放1微摩尔还原糖(以葡萄糖计算)的酶量。

实施例5:纤维素底物的酶促水解

在磁力搅拌下,在pH 5.0的条件下对纤维素底物进行酶促水解。将微晶纤维素PH 105(德国色瓦公司)、用丙酮-乙醇混合物(1∶1)预处理2天以去除纤维素纤维表面的蜡的棉花和用有机溶剂预处理的花旗松木用作底物。

有关纯化的各纤维二糖水解酶水解微晶纤维素的过程动力学的实验和有关鲁克文金孢子菌纤维素酶(用棉花作底物)之间的协同相互作用的实验在40℃进行。这些实验中的底物浓度为5mg ml-1。为了消除产物(纤维二糖)对动力学的抑制作用并且将所有纤维素寡糖转变为葡萄糖,在来自日本曲霉的纯化BGL(纤维二糖酶)存在下进行水解,纯化BGL是额外过量(0.5U ml-1)加入该反应体系的。

通过纯化的鲁克文金孢子菌酶和粗制多酶制剂的组合对微晶纤维素、棉花和预处理的花旗松木进行酶促糖化的实验在50℃进行。这些实验中微晶纤维素和预处理木材的浓度为50mg ml-1,而棉花的浓度为25mg ml-1

用以下方式进行典型的实验。称取一定量的干纤维素底物加入2-ml塑料试管中,然后加入0.5-1ml含有1mM NaN3的0.05M乙酸钠缓冲液,以防止微生物污染,将底物浸入该缓冲液1小时。然后,将该试管放入位于磁力搅拌器上的恒温水浴中,将相同缓冲液适当稀释的酶溶液加入底物悬液中,以将该反应体系的总体积调整至2ml并启动水解。用盖子密封该试管,通过磁力搅拌进行水解。在反应中的确定时间上,取等份悬液(0.05-0.1ml),稀释,15000rpm离心3分钟,通过葡萄糖氧化酶-过氧化物酶和索莫奇-尼尔森方法测定上清液中的葡萄糖和还原糖浓度。在这些情况下,当葡萄糖是该反应的单一产物时,用下式计算底物转化程度(对于微晶纤维素和棉花,代表纯纤维素底物):

一式两份地进行动力学实验。蛋白质浓度是反应体系中酶载量的衡量。在纯化酶的情况下,利用ProtParam工具(http://www.expasy.ch/tools/protparam.超文本标记语言)预测的酶消光系数,由280nmUV吸光度计算蛋白质浓度。对粗制多酶制剂而言,通过Lowry法,利用牛血清白蛋白作为标准品测定蛋白质浓度。

CBH Ib和IIb在pH 4.7和5.0显示最大活性。在pH 5.0和50℃培育24小时期间,这两种酶是稳定的。pH 5.0和6℃条件下,微晶纤维素上酶吸附的研究表明,只有CBH IIb具有CBM。用微晶纤维素(25mg ml-1)搅拌培育CBH Ib和IIb(1mg ml-1)30分钟后,蛋白质吸附程度分别为65和99%。应该注意到,在相同条件下鲁克文金孢子菌CBH Ia的催化结构域的吸附程度为59%,而完整大小的鲁克文金孢子菌CBH Ia(含有CBM的酶)为89%。

CBH IIb对微晶纤维素具有高活性,并具有非常低的CMC酶活性,而对合成的二糖的对-硝基苯基衍生物完全没有活性(表2)。CBH Ib具有较低的微晶纤维素酶活性,但能水解对-NP-β-D-纤维二糖苷和对-NP-β-D-乳糖苷,它是纤维素酶家族7中的典型酶。为了进行比较,表2也给出以前分离的鲁克文金孢子菌纤维二糖水解酶(现在称为CBH Ia和CBH IIa)的比活。

图2显示所有纯化的鲁克文金孢子菌纤维二糖水解酶水解微晶纤维素的过程动力学,其中这些酶被蛋白质浓度(0.1mg ml-1)所平衡。为了消除产物(纤维二糖)对动力学的抑制作用,在来自日本曲霉的纯化BGL(纤维二糖酶)存在下进行水解,而纯化BGL过量(0.5U ml-1)加入该反应体系。

在所检测的几种纤维二糖水解酶,包括其它三种鲁克文金孢子菌酶(CBH Ia、Ib、IIa)中,观察到鲁克文金孢子菌CBH IIb的水解速率最高:3.2mg ml-1葡萄糖,即水解5天后实现58%纤维素转化(参见图2)。鲁克文金孢子菌CBH Ia(具有CBM)的效率明显较低(5天后葡萄糖产率为2.5mg ml-1,它对应的纤维素转化程度为46%)。不出所料,无CBM的鲁克文金孢子菌纤维二糖水解酶(CBH Ib和IIa)水解微晶纤维素的能力最低:相同反应时间后只有23和21%纤维素被转化。

具有CBM的两种鲁克文金孢子菌纤维二糖水解酶(Ia和IIb)与来自同一真菌的三种主要内切葡聚糖酶(EG II、EG V、EG VI)在棉花水解中有明显协同作用,它们之间也有强烈的协同作用(表3)。在这些研究中,在所有情况下,棉花的浓度为5mg ml-1,CBH浓度为0.15mg ml-1,而EG浓度总是0.05mg ml-1。为了消除产物对动力学的抑制作用并且将中间体寡糖转变为葡萄糖,在来自日本曲霉的纯化BGL存在下进行水解,而纯化BGL过量(0.5Uml-1)加入该反应体系。该实验在pH 5.0和40℃进行140小时。

如表3所示,单独的纤维二糖水解酶CBH Ia和CBH IIb,以及单独的内切葡聚糖酶在所测定条件下不能完全水解棉花。在水解140小时后,CBHIIb的葡萄糖产率最高:1.18mg ml-1,其对应的底物转化程度为21%。然而,当任一纤维二糖水解酶与内切葡聚糖酶共同培育时,均观察到显著的协同作用。CBH Ia或CBH IIb与EG II联用时获得最高的葡萄糖产率(4.1-4.7mgml-1),协同系数的范围是2.6-2.8。在CBH Ia和CBH IIb之间也观察到强烈的协同作用(Ksyn=2.75)。实际上,两种纤维二糖水解酶(重量比1∶1)与BGL联用时,水解140小时后能够将棉花纤维素基本上完全转化(98.6%)为葡萄糖。

例如,CBH IIb与其它鲁克文金孢子菌酶联用时水解棉花的过程动力学见图3,其中实际实验数据用空心符号(连续曲线)表示,而在单独酶作用下获得的理论葡萄糖浓度和用实心符号表示(虚线)。在单独的纤维二糖水解酶和内切葡聚糖酶和其组合的作用下,棉花水解140小时后获得的葡萄糖产率小结于表3。通过实验葡萄糖浓度(表3的第2列)与理论葡萄糖浓度和(第3列)的比例计算协同系数(Ksyn)。

使用四种纯化的鲁克文金孢子菌酶(CBH Ia和IIb、EG II、BGL),构建人工纤维素酶复合物(C.l.组合#1),该复合物显示将不同纤维素底物转变为葡萄糖的能力极高(图4-6)。与粗制的鲁克文金孢子菌多酶制剂NCE-L600相比,此种多酶组合物水解纯结晶纤维素(棉花和微晶纤维素)的效率明显更高。在木质纤维素底物(有机溶剂预处理的花旗松木)的72小时水解过程中,C.l.组合#1也能非常有效地水解纤维素。

在鲁克文金孢子菌组合#1中,酶由两种纤维二糖水解酶CBH Ia和CBHIb以及内切葡聚糖酶EG II组成,该酶对结晶纤维素有强烈的吸附能力(这些酶的分子具有CBM)。在不溶性纤维素水解过程中,酶沿底物表面的迁移受限或无价值结合(所谓的假灭活)导致紧密吸附的纤维素酶的活性逐渐降低。如果不希望受理论束缚,应相信紧密和疏松吸附的纤维素酶之间可能存在协同作用,其中疏松结合的纤维素酶(无CBM的酶)可能破坏阻碍紧密吸附的纤维二糖水解酶持续作用的障碍,从而帮助它们移动到下一个纤维素反应性位点。反应体系中的蛋白质总浓度为0.5mg ml-1。多酶组合物(C.l.组合#1)的组成如下:0.2mg ml-1CBH Ia+0.2mg ml-1CBH IIb+0.08mg ml-1EG II+0.02mg ml-1BGL。这些实验中用微晶纤维素(50mg ml-1)和棉花(25mg ml-1)作为底物,代表纯的结晶纤维素。用有机溶剂预处理的花旗松木样品(50mgml-1)用作可用于生物转化为乙醇的实际木质纤维素原料的例子。这些研究中取粗制的鲁克文金孢子菌多酶纤维素酶制剂NCE L-600(通过稀释使反应体系中的蛋白质浓度也为0.5mg ml-1)进行比较。也在额外添加的日本曲霉BGL(0.5U ml-1)的存在下进行使用它们的水解实验。

通过不同纤维素酶多酶制剂水解棉花、微晶纤维素和花旗松的过程动力学见图4-6。应注意到,在所有情况下,在具体实验中水解24-72小时后葡萄糖和还原糖的浓度基本相同,即葡萄糖占总可溶糖的>96%。因此,葡萄糖产率可用作比较不同多酶样品的水解效率的可靠标准。

在棉花水解中(图4),反应72小时后,纯化的鲁克文金孢子菌酶的组合#1的葡萄糖产率(23.4mg ml-1,即底物转化程度为84%)远远高于NCE-L600的4.2mg ml-1。在微晶纤维素水解中(图5),C.l.组合#1也较优(45.0mg ml-1葡萄糖,或者水解72小时后底物转化率81%)。在预处理的花旗松的情况下(图6),C.l.组合#1也是有效的(28.8mg ml-1葡萄糖,72小时后转化率为63%)。

与微晶纤维素和棉花不同,预处理的木材样品不仅含有纤维素(~85%),而且含有木素(13%)和半纤维素(2%)。人工鲁克文金孢子菌四种酶的组合#1仅由纤维素酶组成;除BGL外,所有这些酶均具有CBM。所有其它多酶样品不仅具有纤维素酶,而且具有木聚糖酶和其它类型的糖酶活性,即它们含有非纤维素酶附属酶。这可以解释与疣孢青霉(P.verruculosum)#151制剂相比,C.l.组合#1对预处理的花旗松的效率相对较低(图6)。

在一组实验中(图7),纯化鲁克文金孢子菌酶的不同组合物水解预处理的木材样品,该组合物中包含缺少CBM的纤维素酶(EG V或者EG V和CBHIb组合)。将反应体系中的总蛋白质浓度维持在相同水平0.5mg ml-1(表5)。实际上,与C.l.组合#1相比,含有弱吸附酶的两种C.l.组合(#3和#4)在酶反应72小时后葡萄糖产率显著提高。

在两个实验中,将高活性的鲁克文金孢子菌Xyl II(Xyn11A)加入上述四种酶(C.l.组合#2和#4)中。由于紧密和松散吸附的纤维素酶之间的协同作用已有描述[38],所以在C.l.组合#3和#4中使用EG V或者EG V与CBH Ib(两种酶均缺少CBM)。

如图7所示,从C.l.组合#1至组合#4,葡萄糖的初始形成速率逐步降低,然而水解2-3天后葡萄糖产率以相同顺序提高。Xyl II证明对葡萄糖产率只有轻微的正效应,而与C.l.组合#1(29mg ml-1)相比,EG V或EG V与CBH Ib在水解木材72小时后产物浓度明显提高(分别为37和41mg ml-1),即组合#3和#4的效果显著优于所有粗制多酶样品(图6)。

需要特别关注粗制鲁克文金孢子菌制剂(NCE-L600)在水解不同纤维素底物中的低性能(图4-6)。如果不希望受理论束缚,可解释为在NCE-L600中不同纤维素生物水解酶的总含量低(占总蛋白质含量的35-40%)。而且,四种鲁克文金孢子菌纤维二糖水解酶中的两种(Ib和IIa)缺少CBM,而另外两种酶(CBH Ia和IIb)在发酵过程中也部分丢失了CBM。NCE-L600中大部分纤维二糖水解酶缺少CBM可能导致粗制剂对结晶纤维素的活性较低。

表3

pH 5.0和40℃,有0.5U ml-1日本曲霉BGL存在下,鲁克文金孢子菌纤维素酶水解棉花纤维素(5mg ml-1)时的协同作用。在所有情况下,CBH浓度为0.15mg ml-1,EG浓度为0.05mg ml-1

a按照单个酶作用下获得的葡萄糖浓度和进行计算。

表4

在pH 5.0和50℃下多酶制剂对不同底物的比活(U mg-1蛋白质)

a在40℃测定活性。

表5

基于纯化的鲁克文金孢子菌酶的人工多酶组合的组成和pH 5.0、50℃水解预处理的花旗松木(50mg ml-1)72小时后的葡萄糖产率。反应体系中的蛋白质总浓度为0.5mg ml-1,各组分浓度和葡萄糖产率的单位是mg ml-1

序列表

<110>二进国际(美国)有限公司(Dyadic International,Inc.)

     A.V.乌萨科夫(GUSAKOV,Alexander V.)

     T.N.萨拉诺维奇(SALANOVICH,Tatyana N.)

     A.I.安托诺夫(ANTONOV,Alexey I.)

     B.B.乌斯季诺夫(USTINOV,Boris B.)

     O.N.奥库涅夫(OKUNEV,Oleg N.)

     R.伯林盖姆(BURLINGAME,Richard P.)

     M.艾玛尔法伯(EMALFARB,Mark A.)

     M.巴埃斯(BAEZ,Marco)

     A.P.西尼岑(SINITSYN,Arkady P.)

<120>用于酶促水解纤维素的高效纤维素酶组合物的构建

<130>3123-4008PC

<140>PCT/US2006/027347

<141>2006-07-13

<160>18

<170>PatentIn 3.3版

<210>1

<211>6360

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>1

ctcagattct aggggtaggg cgggagcaga ggcgaaaatt gggttgtaga atatgaggag      60

ctagggttgt taaactcaaa gaacttcttg ctcttgttct tagtcttctc tcctgggaaa     120

agggggtttt tccgaaagcg gcgctatacg aagccagagg ctactttcct tgctttggat     180

ggcccttgtc caccgttctt gtttcccgtt tgtcaattgc gacgttgccg gcaacctagg     240

tcctaataat taggtagata tttcggtaga ggtagtttaa ttatgcttca gtagagaaat     300

cgttgtctcc acgtctcgca accttgcgaa acttcgccac attgaagata gcattgtctg     360

agttgatttt aaccctttcc agagacgata taatagtgca agtttctttg atcggaatca     420

tcgacattcg gattttccct taattatatg aagtattcgg cccacggaac cgggccccga     480

gcaggttgaa ccgcgcaaaa cctcaaccga gtcacctcgc gtccatgttt gtcatggaat     540

caggctccga atcccgtcag atcagtcagt tctggtggct atggacgcgg gagttacggc     600

cagtcgtccc gttgttctgg ggggttgatc aacaggagga agagatctga gatcgaacta     660

cacccattga tttatcgacg cataatcaag tttaataaaa accaaacagc gtgtttggtg     720

ctaccaccga atgcgagatc cgggctagcc cgcggaagga tgatggccac agatctagcg     780

tcatgtatga ttattaccta tgcatctatc ttcgtatctg cctcgggttg gcaacacctg     840

accgagagac gactcgacaa cctgacactt ggcaaaagac atttcggttg acagcgggag     900

aactccagcg aggaagtcgc ccagagatgc ggatgagaag acaacgccga gacgtgccgg     960

cgttggctct ccacgaatcg gagccgactc ttccgtttgg ccaatctccg ggataaatcc    1020

cagcggcggg tcacgtcacg tttcatgggg aggcgcggac agccatccca gccaggccat    1080

ggaagagaac aattcttggg ggtagcgacc gagccaaaag gggggggggg gaagcgggag    1140

gggaagaagt ggtattagag cacgcaccgg aaaacgcatt tgggcccttg ccaacaaaca    1200

ccacaccccg cgtcctggga gcaagacatc caggatgcaa cccagtaggg gatgccaaga    1260

agcatctacg gcaccatctg ccggcgcctc gcctgttaga gtcccggcac ccgccaatgg    1320

ggccgtgctg ggccctgccc ggcaatgctg gcgcagcggc atcaacaaca ttgctcgggg    1380

aggggcccga ttttattgat tagcaaaaaa acaattaaat tacccttcca ttccagcaga    1440

gcttctcctc cacgcggcgg cgggaccgct tgtggacggc ggtacactac aaccgcgggg    1500

ctccagtctc cgtgctgggc gtgcagatca cgacccggaa gagaaatgat cgcggtctga    1560

cgccgggtac ggagtactga gccgccaacc acagccgatg gaccgtgata tctcaatgcg    1620

ttcaagcaac acagcaacac cctggacgag tctctcctcc cctaccaccc cctccccccc    1680

tgccctggcc gcgaacgggg cgcgtacccc agatttctac tccgtactga caccccaatc    1740

tattcccgct ggcgtcgccc agtctggggc ggtccggcca agactctcgg tgcacgatac    1800

cgcgacgaaa tcggattaac cgttggctga tcaattccaa gtcaagggag aagtggtatg    1860

gaaagtcggc tcagttttcc actgcccccg acaggcaggt tccggatctg gacagcagtc    1920

ttccgaatct ttggcagaga ctcatgataa tataaaaagg caaatgaggc ggcgccttgg    1980

acaggtccat tctcccaccg ctcaaccagc ctccaattcc tcagaagtct gttgctctct    2040

cgcagtcgca gtcaagatga agcagtacct ccagtacctc gcggcgaccc tgcccctggt    2100

gggcctggcc acggcccagc aggcgggtaa cctgcagacc gagactcacc ccaagctcac    2160

ttggtcgaag tgcacggccc cgggatcctg ccaacaggtc aacggcgagg tcgtcatcga    2220

ctccaactgg cgctgggtgc acgacgagaa cgcgcagaac tgctacgacg gcaaccagtg    2280

gaccaacgct tgcagctctg ccaccgactg cgccgagaat tgcgcgctcg agggtgccga    2340

ctaccagggc acctatggcg cctcgaccag cggcaatgcc ctgacgctca ccttcgtcac    2400

taagcacgag tacggcacca acattggttc gcgcctctac ctcatgaacg gcgcgaacaa    2460

gtaccagatg ttcaccctca agggcaacga gctggccttc gacgtcgacc tctcggccgt    2520

cgagtgcggc ctcaacagcg ccctctactt cgtggccatg gaggaggatg gcggtgtgtc    2580

gagctacccg accaacacgg ccggtgctaa gttcggcact ggggtaagtt caacgacccg    2640

agacgggtgc ccttattatc tgctgcgaaa acggacggtc cccttttgct aactaccctc    2700

ctccaaacag tactgcgacg cccaatgcgc acgcgacctc aagttcgtcg gcggcaaggg    2760

caacatcgag ggctggaagc cgtccaccaa cgatgccaat gccggtgtcg gtccttatgg    2820

cgggtgctgc gctgagatcg acgtctggta agttttgttg cctgggcagc aatggtatat    2880

tagctcgagt ggttcccgtc gttgctgacc ctctcttacc agggagtcga acaagtatgc    2940

tttcgctttc accccgcacg gttgcgagaa ccctaaatac cacgtctgcg agaccaccaa    3000

ctgcggtggc acctactccg aggaccgctt cgctggtgac tgcgatgcca acggctgcga    3060

ctacaacccc taccgcatgg gcaaccagga cttctacggt cccggcttga cggtcgatac    3120

cagcaagaag ttcacgtgag tacaccgtgc ttgaagcccc ctcccccccc ccccccaaaa    3180

aaaaaaagaa aaaagaagtc aaatgattga tgctaaccaa atcaaataac agcgtcgtca    3240

gccagttcga ggagaacaag ctcacccagt tcttcgtcca ggacggcaag aagattgaga    3300

tccccggccc caaggtcgag ggcatcgatg cggacagcgc cgctatcacc cctgagctgt    3360

gcagtgccct gttcaaggcc ttcgatgacc gtgaccgctt ctcggaggtt ggcggcttcg    3420

atgccatcaa cacggccctc agcactccca tggtcctcgt catgtccatc tgggatgatg    3480

tacgttacct aacccccccc cccttttttt ttcccgcttc tctccccgaa actgccacta    3540

cttatatacg tcccgcgtcc atgatgctta ccttttctcc ttccagcact acgccaatat    3600

gctctggctc gactcgagct acccccctga gaaggctggc cagcctggcg gtgaccgtgg    3660

cccgtgtcct caggactctg gcgtcccggc cgacgttgag gctcagtacc ctaatgcgtg    3720

agtcgaaacc gtaaaatgtc gggcaaaaaa aagatcgctc aagctaacga aataatatga    3780

ttagcaaggt catctggtcc aacatccgct tcggccccat cggctcgact gtcaacgtct    3840

aaactgcaac ctgaccgggc cctttctctc cacccccacc cctctcaagt tctctctggt    3900

ggagccctcg tgtccttctt ttcctaggtt cgcgaacctt tgagcttgtg tatcgtaggg    3960

tcattgtgta catacacaaa aacttaacat ctgctaccaa gatcttggcg ctttgccagg    4020

tcttctcaaa cctcgaagca ctgagccttt gtcctccgag tgaagtagga tgactattta    4080

cgttgcaaga ctacgcggta aaggggacgg agcagacctg ccacagatat tcgtttggtt    4140

gcttgattta tagcagagtc cgaacgtaga catggcccct gaaggtgcca accctagata    4200

gccagaagcc ttgttttacg aaagggtggt caaccaacgg tgctcctcgc tcagcgaatc    4260

tacccgcacg caatgtatcg taagaatgtg aactaaaggg aacgacgagg catagggaaa    4320

cgtcaatgtg gcttgaataa cagagttaaa tacctaatag aagaaattag catgccaaga    4380

ttgagccagc aacacatggt agaatagcca gcaaaggacg cttgttcgct tgatctcgaa    4440

ccgtccaacc tgattcgaag gaggagggaa aagttgaaga ataccggcaa taattactcg    4500

aggttcctat gccctgcaga gtctaattaa tattaaaggc accacccgca tgattccgca    4560

attataagca taataagctc gcgggcccca cacgtgcctt caccctccca tgtgtataca    4620

atctgtacct cgttattgtc gaatcgctat tccgatagcg aaggtctggc actcatcaga    4680

taccgtgaca tcgattgaga tttggccggg ccaccggtag taagcgatga gttggtcatc    4740

aattatcaac aatgcgctca atcagcgata atcagcctat caaccgcgaa atcatacgcg    4800

catcaacgaa ttgtccatca tgcacgtagc ttgtcggcag tgccgcatac cctccagagc    4860

atcatagccg ggatagaaag ctcgctttca gccgtcccag agtccgagat gcaggtagca    4920

agccttcaag accagttata tgtgacccgg gtaaaatact tggtgagatg caatgggcgt    4980

agcttcgggc acttataagc tttactagat attatctcaa ggtttctttt tgaactcctc    5040

ctagacattt actataaact accgagcttc aatgctagac gccctccttc tgttaaatag    5100

tcttttcctt ctaagagcat ctgccttttt tcccttaggc ttagaggata gggcccctcc    5160

atcttgctgc gacggcctta gccttgggga gtaattattg gtatccgcgt acctgtttcc    5220

cagacagccg aagtttcgac gacaaagtaa ttattgcgac aataccaccg ccatatgcta    5280

ttccgagtgg gtgagccccg aaaacatcgc ttaccgcatc gccatcccag acgacagagg    5340

gcgactttga tgtcttgctc cagatcgccg cacctaacac ggtgggatgg gctggtatcg    5400

tatgggacgg catcatggtc aacaaccccc tgacggggtg ttgggccaat ggaaacacca    5460

ccgttgtctc gagccggatc gcaaggtaag ccgaagagga caaatgacga tgagactttc    5520

tttctttttt attttatttt tttttaaatt tcttttttaa gcgtaatgaa aagagctaca    5580

tatctgtggt tcgttcctca atttcagcga cctctccacc gaagcatcgt caaataagaa    5640

gttgtcggaa acaaagggtg tcagaagcta tagagcttct aaggatatta gccacataca    5700

tgccatagct gtataaggct atttaacgct ttggccagct cctttgtcta taaatattag    5760

tcgttttgtc tcctttgtag ataattttaa caaggcactc ttttccttta tatagccacc    5820

tactatagac tgctttcaac gctcccggaa gcttattact acgttcggca gttataagcc    5880

tggcgccttg actactcctc tgccgacgta tctttaatat tagtagtagc ttcttctatt    5940

acgaactctc ttaccctgct ttaatacgct ttcgacgacg tgtctattat atctaagatc    6000

ctagtcgaga cttctatatg ccttactagg cctagttctt agaacttgta gtatattaaa    6060

ctatagttat aggctaaatt tgctagtata tagagatttg ttaaccttaa tagtaattat    6120

aaactagatc tagaagtttt atagtgccta acctataaat aagctagaga taaccttatt    6180

ttagcttcct aggagtaatt cctagaagga gtattacctt taatatctat agatttgata    6240

ccttctaata tagctatcat agctaaattt atataattat aagattcctt ttataaaaat    6300

attatatata ctatagatat tagtaagtag ataggatagc tataatacta gctagtatat    6360

<210>2

<211>450

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>2

Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly

1               5                   10                  15

Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro

            20                  25                  30

Lys Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val

        35                  40                  45

Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu

    50                  55                  60

Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser

65                  70                  75                  80

Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr

                85                  90                  95

Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr

            100                 105                 110

Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr

        115                 120                 125

Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn

    130                 135                 140

Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn

145                 150                 155                 160

Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser

                165                 170                 175

Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp

            180                 185                 190

Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile

        195                 200                 205

Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro

    210                 215                 220

Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr

225                 230                 235                 240

Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val

                245                 250                 255

Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala

            260                 265                 270

Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly

        275                 280                 285

Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys

    290                 295                 300

Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe

305                 310                 315                 320

Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly

                325                 330                 335

Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu

            340                 345                 350

Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe

        355                 360                 365

Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser

    370                 375                 380

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr

385                 390                 395                 400

Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro

                405                 410                 415

Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala

            420                 425                 430

Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val

        435                 440                 445

Asn Val

    450

<210>3

<211>3900

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>3

ccgcaagtga atatgtaatt actcaatgga agttctcgaa acggagtcca gaaatgatgt      60

ggttctgtgg gaatgcggca agaggcgacg ttgccgtgaa tgcgtgaaca ttcccgcctc     120

ttcttcttct cgtcttcttc cttcttcttc tttcgggtcg cggatggttg acggccagcg     180

tgcgcacggc tgcgtgttat cgagcgtcgg tacgtctagc caacatcccg tagacacgac     240

gaccaagcgt cttgagaatg caacaacgtc tcggaacctg gcacgcatct tccgccgcag     300

gtcggcagac gccgcctggg caataccacc cctgtccagg ccctttcccc gcaggcagag     360

ccgcgctctt cctttcatgg ttattcagga acgtggcttc cgagattctc gcctgttctc     420

ccccagtcaa cctgccgacc gtaacccggt tccaccaccg cggactgtcc gcaaaacctg     480

gttcgcccga gattaatatg ctatttccgg actaagtgca caacacacaa gcaccccttc     540

cgcctcgcgc tctagaatct gctttctaac ccggttctcg ggcccttccc tttcgcgacg     600

cctccgctct ccttaccagg caccatccgc aataggtaag gtagccaacc gttttggagc     660

gtgattctgc caaggaccgc atccttgcat tcgccatctg gtcaaggacc cctctttccc     720

gctccattct ggtggctcta tcgggacggc gttccccatg gctctccagg agagtgatgt     780

gcgagtctgg agagccgggg ttggcgtcac gatgctgccc acctagggcc ggccagcccg     840

gcactgcgct cccgttgatc cgtctatccc cgtcaagagc accagccccg gcgctcgtga     900

attttcgact tgttcgactt gctacaggtg ataaagagga tgcacgccgc cctcgatcgg     960

cctgtgtggt ttctctccct cgtgccaaac cactcccacc tcccgccccg agatagttgc    1020

ttgtttcgct ccgtgagagg gacacacacc aatggccaag aagcttttca tcaccgccgc    1080

gcttgcggct gccgtgttgg cggcccccgt cattgaggag cgccagaact gcggcgctgt    1140

gtggtaagaa agcccggtcc gagtctccca tgattttctc gtcgagtaat ggcataaggg    1200

ccaccccttc gactgaccgt gagaatcgat caaatccagg actcaatgcg gcggtaacgg    1260

gtggcaaggt cccacatgct gcgcctcggg ctcgacctgc gttgcgcaga acgagtggta    1320

ctctcagtgc ctgcccaaca gccaggtgac gagttccacc actccgtcgt cgacttccac    1380

ctcgcagcgc agcaccagca cctccagcag caccaccagg agcggcagct cctcctcctc    1440

ctccaccacg cccccgcccg tctccagccc cgtgaccagc attcccggcg gtgcgacctc    1500

cacggcgagc tactctggca accccttctc gggcgtccgg ctcttcgcca acgactacta    1560

caggtccgag gtccacaatc tcgccattcc tagcatgact ggtactctgg cggccaaggc    1620

ttccgccgtc gccgaagtcc ctagcttcca gtggctcgac cggaacgtca ccatcgacac    1680

cctgatggtc cagactctgt cccaggtccg ggctctcaat aaggccggtg ccaatcctcc    1740

ctatgctggt gagttacatg gcgacttgcc ttctcgtccc ctacctttct tgacgggatc    1800

ggttacctga cctggaggca aaacaacaac agcccaactc gtcgtctacg acctccccga    1860

ccgtgactgt gccgccgctg cgtccaacgg cgagttttcg attgcaaacg gcggcgccgc    1920

caactacagg agctacatcg acgctatccg caagcacatc attgagtact cggacatccg    1980

gatcatcctg gttatcgagc ccgactcgat ggccaacatg gtgaccaaca tgaacgtggc    2040

caagtgcagc aacgccgcgt cgacgtacca cgagttgacc gtgtacgcgc tcaagcagct    2100

gaacctgccc aacgtcgcca tgtatctcga cgccggccac gccggctggc tcggctggcc    2160

cgccaacatc cagcccgccg ccgagctgtt tgccggcatc tacaatgatg ccggcaagcc    2220

ggctgccgtc cgcggcctgg ccactaacgt cgccaactac aacgcctgga gcatcgcttc    2280

ggccccgtcg tacacgtcgc ctaaccctaa ctacgacgag aagcactaca tcgaggcctt    2340

cagcccgctc ttgaactcgg ccggcttccc cgcacgcttc attgtcgaca ctggccgcaa    2400

cggcaaacaa cctaccggta tgtttttttt tcttttgtct ctgtcccccc cttttctccc    2460

ccttcagttg gcgtccacaa ggtctcttag tcctgcttca tctgtgacca acctcccccc    2520

ccccggcacc gcccacaacc gtttgactct atactcttgg gaatgggcgc cgaaactgac    2580

cgttccacag gccaacaaca gtggggtgac tggtgcaatg tcaagggcac cggctttggc    2640

gtgcgcccga cggccaacac gggccacgag ctggtcgatg cctttgtctg ggtcaagccc    2700

ggcggcgagt ccgacggcac aagcgacacc agcgccgccc gctacgacta ccactgcggc    2760

ctgtccgatg ccctgcagcc tgcccccgag gctggacagt ggttccaggc ctacttcgag    2820

cagctgctca ccaacgccaa cccgcccttc taaacctcgt cataaagaga gagagatggc    2880

gggcatgggc ctgattgggt tcattgacca tgcggctctt ctgggggtac atattttacc    2940

tacctaccta taaataaggc ggcctatcgg gctctcgctt cgtttattag gtacttgttc    3000

ttgtacatac tttgtttata catacagcag ttagcatcca ctattcgttt cgacaaagcg    3060

gaactttcca gaaaaaaaaa ggttgtacat aattagtctt taggcttcga ttctttgtgc    3120

ctttcttttt ggtaaaaaaa aaattttttt tgaggcatga ttaccttagg tacgttcgtc    3180

gttgtattgg tccccctgca ttttggcgcg agagcagctc agccccttgc aaatccctca    3240

acgggcgttc aattccctcc actcgggtct tcagcgagac cagccgtcca gagtatccca    3300

gcgtgtagtt gccccacgaa ccagtcgtcc tcgtaagcct cgtcaaagtg tccaagagca    3360

gtatagaagc aacgacctcc gtcaaaagtc tggcaccatg cgatcgggtg gtcctccccg    3420

tgcgccccgc cctcgtagga cttctcatcc acgccaagga gcacgtgcag gccgtcggac    3480

gtcgcccgcg ggtgcgcctt gaagttgtac cattcgtcct tccagacgcg ctccagctgc    3540

gcctgcttgg gttcctgcgg ttcctgcggt tcctgcgctg gccggtcggc gccgccgtct    3600

tggtcacacg cccgcagcga catgactggg tgtttcgggt cgagcagctt gacgagcccg    3660

acctggggtt ccgggtggtt gtcgaacacg gcgccaatga ggtggccgta ccattcggat    3720

gactgcatgg cgaagctggc gcagtgtacc gccacgatcc cgccgcccgc ctggacgaaa    3780

ccccgcaggg cgcccagctg cgcgccgtcc aggaactcgc ccgagcactg caggaggacg    3840

atgacgcgat acgccgagag ggagccgggg ctgaacacgg cgggatcctc gctgtcgtcc    3900

<210>4

<211>481

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>4

Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu

1               5                   10                  15

Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Thr Gln

            20                  25                  30

Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly Ser

        35                  40                  45

Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn Ser

    50                  55                  60

Gln Val Thr Ser Ser Thr Thr Pro Ser Ser Thr Ser Thr Ser Gln Arg

65                  70                  75                  80

Ser Thr Ser Thr Ser Ser Ser Thr Thr Arg Ser Gly Ser Ser Ser Ser

                85                  90                  95

Ser Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile Pro

            100                 105                 110

Gly Gly Ala Thr Ser Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser Gly

        115                 120                 125

Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn Leu

    130                 135                 140

Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala Val

145                 150                 155                 160

Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp

                165                 170                 175

Thr Leu Met Val Gln Thr Leu Ser Gln Val Arg Ala Leu Asn Lys Ala

            180                 185                 190

Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu Pro

        195                 200                 205

Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala

    210                 215                 220

Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg Lys

225                 230                 235                 240

His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu Pro

                245                 250                 255

Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys Ser

            260                 265                 270

Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys Gln

        275                 280                 285

Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly

    290                 295                 300

Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala

305                 310                 315                 320

Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala

                325                 330                 335

Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro Ser

            340                 345                 350

Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala

        355                 360                 365

Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg Phe Ile Val

    370                 375                 380

Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp Gly

385                 390                 395                 400

Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala

                405                 410                 415

Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly

            420                 425                 430

Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp Tyr

        435                 440                 445

His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Gln

    450                 455                 460

Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro

465                 470                 475                 480

Phe

<210>5

<211>1648

<212>DNA

<213>鲁克文金孢子菌(Chyrsosporium lucknowense)

<220>

<221>misc_feature

<222>(812)..(812)

<223>n是a、c、g或t

<220>

<221>misc_feature

<222>(1162)..(1162)

<223>n是a、c、g或t

<400>5

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc      60

tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc     120

agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg     180

accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat     240

ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc     300

atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc     360

aacatcggct cgcgtaccta cctgatggag agcgacacca agtaccagag taagttcctc     420

tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt     480

ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct     540

caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg     600

caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct     660

caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa     720

cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa     780

catggccgcc gccttcactc cccacccttg cnccgtgatc ggccagtcgc gctgcgaggg     840

cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg     900

atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt     960

cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct    1020

ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac    1080

catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc    1140

cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct    1200

cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg    1260

gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg    1320

ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat    1380

cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg    1440

cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac    1500

atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg    1560

aggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct    1620

gaatgactgg tactcgcagt gcctgtaa                                       1648

<210>6

<211>526

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<220>

<221>misc_feature

<222>(249)..(249)

<223>Xaa可以是任何天然产生的氨基酸

<220>

<221>misc_feature

<222>(365)..(365)

<223>Xaa可以是任何天然产生的氨基酸

<400>6

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1               5                   10                  15

Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr

            20                  25                  30

Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser

        35                  40                  45

Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala

    50                  55                  60

Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp

65                  70                  75                  80

Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser

                85                  90                  95

Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Asn Leu Lys Phe

            100                 105                 110

Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

        115                 120                 125

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu

    130                 135                 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145                 150                 155                 160

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

                165                 170                 175

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

            180                 185                 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu

        195                 200                 205

Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr

    210                 215                 220

Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala

225                 230                 235                 240

Ala Ala Phe Thr Pro His Pro Cys Xaa Val Ile Gly Gln Ser Arg Cys

                245                 250                 255

Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly

            260                 265                 270

Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn

        275                 280                 285

Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile

    290                 295                 300

Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu

305                 310                 315                 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu

                325                 330                 335

Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys

            340                 345                 350

Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys

        355                 360                 365

Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu

    370                 375                 380

Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385                 390                 395                 400

Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly

                405                 410                 415

Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala

            420                 425                 430

Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly

        435                 440                 445

Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro

    450                 455                 460

Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser

465                 470                 475                 480

Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu

                485                 490                 495

Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro

            500                 505                 510

Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu

        515                 520                 525

<210>7

<211>4376

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>7

ggatccacac ctaccatacc ggatagtatg ctacccaagt gacatagggt tggtaaagta      60

atacgagaac tcagagagca ctgcccatat ggctcgccaa tgacctcaag tgccaggtca     120

gctttgcgag acagacctga gcgcgtcgga tgtgtgacat ggaacgcgcc ggatcgcctt     180

gttgattaat tatagggaag tagcgaggaa ggtttcagca attgacgtga gcgtacatta     240

aaagctgtat gatttcagga agacgagcca tggaccaggt ttcaaggctg aatggcttga     300

cgacttaagc accgaacgag gaatgaaaga atgaaaagtg ggggatcatt ctggcccctc     360

ctcgtatgtc gagtgttaaa gaaggcggtt ctacggagga cctaaagagc tccaatttgc     420

tctgttgagc ttaagccaca tatctcaaga tgaatacatg tcaggcatag tcaccctgat     480

cttgttcatc agtccacaca cttttcagtt cagcatgttg attcctcatc catatcactt     540

tccattacta tctctttatg tccttggtca agactccaag gaaccgatag gtgagcatcg     600

gtgaggctcc ctcaaggtac caaagtagcc atcatcaccg aggtctggga atggcgccgt     660

gcccgatctg agtcctccaa ctccacggta cgacgacagc acgtcacatt gacgcaccac     720

ggttgaacaa gcagagaggg acacgtcttg ctacgcgaat cctggcactg gatggagacg     780

cgtgtgagca ggtttccgga accatgacgg cctggtccgg cttctcgaac aaagaagtgg     840

aacacaaaaa gaaccgaaac ggaaacgcag gcacggcatc gacgaccgga ttgtcccacg     900

gggacctcgg ccagtcaagc gttgccctgg ccgtcagctc cctggcgacg gggattcagc     960

acatctcacg ttataggcga cctcatcccc cttccgtctt gtgcggtcgt tgctccgtgc    1020

cgagtaccca ggcgtgccgg ggcctttagc cggggcggaa tcagagtcaa gatgcggccg    1080

aattggacgg cagacgaagt ttcgtagagg gtcatgatcg gcactgacga cacccacccc    1140

tgcgtgatcc cgtggccctg ggctgggaat tgccggctaa taatctacgg cttaatagat    1200

atgcactttg cacgcggtgc agataaataa gctgtggttt caaacactgg cctccgtact    1260

ttacccacca actgccgctt agcgccggga cctgagtctt gggagtgcgc ggagcggcag    1320

ccacctcggg ttagcgtaca cacgacggct gcatgcgggg atgccgcgtg catggcttca    1380

tagtgtacga cagaccgtca agtccaaatc tgggtgatgc ttgatgagat gacagcgagc    1440

cccgtcggcg gcaccccggc tatgcatcgc gaattgacaa cactctcagc tctattgcga    1500

cccatcggat aaaagaagaa gaaaaaaatg gaccttgagt acgggcgtca gaaaccaaaa    1560

aaaaactccg gaaccaaata tgtcgggcat ggccggggtg aacgaccgct actccccgtt    1620

cccttcttcg caaacagaac gctacagagg gttttctggt ttgtcaaaga gttcggaggt    1680

cctctgctcc gcgaatgcgt ggtgaaccca ccagcagcca ttgttcttgc atgcgtggcg    1740

gaccgttagc cgctgatcga catggcgagc ttcccacctc agacctggag cagacggttg    1800

cgaggagcaa ggggctgccc tccccctgac ggtcggaccc caatgacttc cccaaacggg    1860

gacatcgagg gtcgtgcatg atggtggaaa gtagttgcag tatgggaagt accccgggtt    1920

gccaggaacc gttgttcggc cccccacatt ttctctctgc catgtcaact gtgtgtcgtt    1980

cgagagttcc tggctccggc cccccgtcca attccctaac gggaccgcgg ggcatcgcct    2040

gtaactaact tccaaatgaa gccggatatg agggagggag attggatctg gcaagccagc    2100

cattcgctgc gatcggcact cgtccgtcag ccccgcagtc catatcccca aaggcaactg    2160

ctcggcgcgg ctcaagtctt cttcggaacg tccagcccga aggcgcgcgc cagcaccggc    2220

cctatgttcc tgattgcgat cctcgatctc cagagacggg tcacctcgcc tcgaggacgg    2280

tgcaggggca tcggcttcgc ttcctagagc tccgggctgt gtgtggtcaa ggggagaagg    2340

cggcggcgcc aaggtgcgtc tcggcgcact cacccatcgc ctttaccccc ctccccccca    2400

gtatataaaa gatggccatc gtctcctcgt ctgcttggga agaaaggatc tctcgaccat    2460

gcaccacagc ctagctctaa cccagcttgt cgtgtgttgt tgcccagcat gaagttcgtg    2520

cagtccgcca ccctggcgtt cgccgccacg gccctcgctg cgccctcgcg cacgactccc    2580

cagaagcccc gccaggcctc ggcgggctgc gcgtcggccg tgacgctcga tgccagcacc    2640

aacgtgttcc agcagtacac gctgcacccc aacaacttct accgtgccga ggtcgaggct    2700

gccgccgagg ccatctccga ctcggcgctg gccgagaagg cccgcaaggt cgccgacgtc    2760

ggtaccttcc tgtggctcga caccatcgag aacattggcc ggctggagcc cgcgctcgag    2820

gacgtgccct gcgagaacat cgtgggtctc gtcatctacg acctcccggg ccgtgactgc    2880

gcggccaagg cctccaacgg cgagctcaag gtcggcgagc tcgacaggta caagaccgag    2940

tacatcgaca gtgagttaac cctttgtggc cccttctttt cccccgagag agcgtctggt    3000

tgagtggggt tgtgagagag aaaatggggc gagcttaaag actgacgtgt tggctcgcag    3060

agatcgccga gatcctcaag gcccactcca acacggcctt cgccctcgtc atcgagcccg    3120

actcgctccc caacctggtc accaatagcg acctgcagac gtgccagcag agcgcttccg    3180

gctaccgcga gggtgtcgcc tatgccctca agcagctcaa cctccccaac gtggtcatgt    3240

acatcgatgc cggccacggt ggctggctcg gctgggacgc caacctcaag cccggcgccc    3300

aggagctcgc cagcgtctac aagtctgctg gttcgccctc gcaagtccgc ggtatctcca    3360

ccaacgtggc tggttggaac gcctggtaag acactctatg tccccctcgt cggtcaatgg    3420

cgagcggaat ggcgtgaaat gcatggtgct gacctttgat cttttccccc tcctataggg    3480

accaggagcc cggtgagttc tcggacgcct cggatgccca gtacaacaag tgccagaacg    3540

agaagatcta catcaacacc tttggcgctg agctcaagtc tgccggcatg cccaaccacg    3600

ccatcatcga cactggccgc aacggtgtca ccggtctccg cgacgagtgg ggtgactggt    3660

gcaacgtcaa cggcgccggc ttcggtgtgc gcccgactgc caacactggc gacgagctcg    3720

ccgacgcctt cgtgtgggtc aagcccggtg gcgagtccga cggcaccagc gactcgtcgg    3780

cggcgcgcta cgacagcttc tgcggcaagc ccgacgcctt caagcccagc cccgaggccg    3840

gtacctggaa ccaggcctac ttcgagatgc tcctcaagaa cgccaacccg tccttctaag    3900

ctcctcgacg gcttcttgct gtcagtcgct ctgacggtgg tgtgctggtg gtgcccctgc    3960

tcctgctgct gctgctccgc ggggagggga ggcaacgaaa atgaagtcct gcttcaaaac    4020

aaaacagaaa caagcgaggc gcggtgcaat ggtcgtgcgt tcgtcttttt tcatgttccc    4080

ttctagtgta gtagtttgat agtcgtacat aaggggtttc agaaccgtct ctctgtctcg    4140

gtctttttgc gagttgttgc gactcgtgat tatggccttt gttgctcgtt gcggcagagt    4200

agaaccacag cgtgttgggg tagcagcttg ctccgtagga cgtagggaaa caacctgaga    4260

ctctggaatt gcagtcagcc tgcgtcgccc ctctaggaaa cgaaggggag aaccagtagt    4320

ggctgcagct tacaaacgcg agcatggtga acatctccga gaaaagggag ggatcc        4376

<210>8

<211>395

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>8

Met Lys Phe Val Gln Ser Ala Thr Leu Ala Phe Ala Ala Thr Ala Leu

1               5                   10                  15

Ala Ala Pro Ser Arg Thr Thr Pro Gln Lys Pro Arg Gln Ala Ser Ala

            20                  25                  30

Gly Cys Ala Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Phe Gln

        35                  40                  45

Gln Tyr Thr Leu His Pro Asn Asn Phe Tyr Arg Ala Glu Val Glu Ala

    50                  55                  60

Ala Ala Glu Ala Ile Ser Asp Ser Ala Leu Ala Glu Lys Ala Arg Lys

65                  70                  75                  80

Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Thr Ile Glu Asn Ile

                85                  90                  95

Gly Arg Leu Glu Pro Ala Leu Glu Asp Val Pro Cys Glu Asn Ile Val

            100                 105                 110

Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys Ala

        115                 120                 125

Ser Asn Gly Glu Leu Lys Val Gly Glu Leu Asp Arg Tyr Lys Thr Glu

    130                 135                 140

Tyr Ile Asp Lys Ile Ala Glu Ile Leu Lys Ala His Ser Asn Thr Ala

145                 150                 155                 160

Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr Asn

                165                 170                 175

Ser Asp Leu Gln Thr Cys Gln Gln Ser Ala Ser Gly Tyr Arg Glu Gly

            180                 185                 190

Val Ala Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Val Met Tyr

        195                 200                 205

Ile Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu Lys

    210                 215                 220

Pro Gly Ala Gln Glu Leu Ala Ser Val Tyr Lys Ser Ala Gly Ser Pro

225                 230                 235                 240

Ser Gln Val Arg Gly Ile Ser Thr Asn Val Ala Gly Trp Asn Ala Trp

                245                 250                 255

Asp Gln Glu Pro Gly Glu Phe Ser Asp Ala Ser Asp Ala Gln Tyr Asn

            260                 265                 270

Lys Cys Gln Asn Glu Lys Ile Tyr Ile Asn Thr Phe Gly Ala Glu Leu

        275                 280                 285

Lys Ser Ala Gly Met Pro Asn His Ala Ile Ile Asp Thr Gly Arg Asn

    290                 295                 300

Gly Val Thr Gly Leu Arg Asp Glu Trp Gly Asp Trp Cys Asn Val Asn

305                 310                 315                 320

Gly Ala Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly Asp Glu Leu

                325                 330                 335

Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Thr

            340                 345                 350

Ser Asp Ser Ser Ala Ala Arg Tyr Asp Ser Phe Cys Gly Lys Pro Asp

        355                 360                 365

Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Gln Ala Tyr Phe

    370                 375                 380

Glu Met Leu Leu Lys Asn Ala Asn Pro Ser Phe

385                 390                 395

<210>9

<211>5777

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>9

tgctgctctg atgtgctgat gcacagcttc ccctcgcgat tgccggcagg atctccaacc      60

ctctggatcg gagcagacga tcagcgggca caatggccag cttgccagcg ttcaactcca     120

agttgacccg cttttatcac gcccaagctg gacatgcaca ggcttggctt ctcgtgttcc     180

tacgatctgc acagtaggtt tgactgctga tcttcgcttt cctgtgcgcc ctccccctcc     240

ctcacgggta ccttatcctt gcctgtaacc ccgcgttatg tcaaacttga gtttgaccaa     300

tgctagcgca aaagtaccta catagtacta tgtaataagg taggtacata catcagtagg     360

cgtttatcta gtaaattttg gctttttgaa actcaattgc tcctctcctc gcctccacct     420

ctgcttggca attgacaacc ctggctgtgc ctagaggtag catcgacgat caatcaaatc     480

taaagtattc gagattgacc tttctgctct aattatatta attatccgca caatgctgta     540

gtcattgact ctcctttcaa gttgccttct cgtttatgta tgtacaatgg gcggtcatgc     600

ttcatgccaa cagatggttc tatcggaaca atgtttgact ttctggtcgc cccgtcgaac     660

tgttttgatt tcgcacggga agtgttctta ccaaagctaa gtcgactcgt ggagcttcgt     720

aacggccagt gatcgttgat cgcttttgga ggagttgcga tggagcgaga ccggctacga     780

gcacgttcgc aaaggcagca cgatagacga ccctccgtgg cgccattcgg gagatgcaca     840

tgacataagc atatcaatac tcacctgaac tcatcggccg atgcctcgca ggtagttaca     900

agacatattt gtgtgggtat attatcccaa cccgtacctt tgtcgcgtca tttcggtatg     960

tgctgatgcc tacttaggga gcaaagacgc ctctcctcac ctgcgggtta cttacttact    1020

gtgcagcatg gccttatgtt ctcccgggtc ttgcttgcgc gaatgaacaa aaacgcccga    1080

agaaaagccg cttcttcgag ttgtgtctac ccgaacataa gaggttattg tcgcagaccg    1140

ccagcaaatg tcaacaaccc acccacggcg ttccagaacc ttcgaaatat catctagttt    1200

aagtttaaat gacggcccga gtcccagccg agattcccat attggccgat accagcgttc    1260

ccttgttttt ccaaggttgt ctcgtcaact ggcgcatctg cctacaacga gatataatta    1320

ccgttttctt ttgcaaaagg gcatgcatgg atgtatatta tttatgcctg cagaacgaga    1380

agcaatcatg gtgtaggttt tgtgcggtat ggagctaata atattgaacg gatctctggt    1440

ccgtcctaaa tcgttgaaac gctaggccca ggaggacctg ctcgacttgg cgaacggaga    1500

tttccaggat gaaaggtcgg aacatgtcca tccgcggcca gcctgaacac ttttgctcgt    1560

ttccggacca tcgacccacg aaaacagtgc ggttgctggc acagtcagca ctcacgatgg    1620

cgatggtcca gcccgttccc gcccgatgcc cacttgcagc gcaactctcc ttcattcggc    1680

ggcccggcgg tgtctggcct attagtacga ttttggatac cggcttggtc gccgccgcgg    1740

tttttcttgg ccgatacggg aatctcggtg gtcccaactc cacctgggca cgctctggtg    1800

ccaacatgga acttcgggat gccgctccgg gcacagtcaa gcgctttaaa atacgacttt    1860

accccacaag aatcgaggcg taacccggaa ttagggacac ctggacggcg caacccctgg    1920

accgaagggc ctcgctaacc gggttcctgg agccgcatgc gcggctgccc gcttgcccgc    1980

tcttgagatg acacttcttt tcagcgaggg atggtcgggc agggaaatga tgtattataa    2040

gaagcgagcc gattccgaag gactcgaccc cctctctcgc cctgtgtccg ccagctaatt    2100

acagcactcc ttctcgactt gaaacgcccg agatgaagtc ctccatcctc gccagcgtct    2160

tcgccacggg cgccgtggct caaagtggtc cgtggcagca atgtggtggc atcggatggc    2220

aaggatcgac cgactgtgtg tcgggttacc actgcgtcta ccagaatgat tggtacagcc    2280

agtgcgtgcc tggcgcggcg tcgacaacgc tccagacatc taccacgtcc aggcccaccg    2340

ccaccagcac cgcccctccg tcgtccacca cctcgcctag caagggcaag ctcaagtggc    2400

tcggcagcaa cgagtcgggc gccgagttcg gggagggcaa ctaccccggc ctctggggaa    2460

agcacttcat cttcccgtcg acttcggcga ttcaggtacg ggccaataat aatatattat    2520

tatagcaggc aggagggagc aggagaagaa gggaggggca ggtggccaac aatcggaaga    2580

agaccgggag gcactgaccg ttgattcctt tgtgtaatag acgctcatca atgatggata    2640

caacatcttc cggatcgact tctcgatgga gcgtctggtg cccaaccagt tgacgtcgtc    2700

cttcgacgag ggctacctcc gcaacctgac cgaggtggtc aacttcgtga cgaacgcggg    2760

caagtacgcc gtcctggacc cgcacaacta cggccggtac tacggcaacg tcatcacgga    2820

cacgaacgcg ttccggacct tctggaccaa cctggccaag cagttcgcct ccaactcgct    2880

cgtcatcttc gacaccaaca acgagtacaa cacgatggac cagaccctgg tgctcaacct    2940

caaccaggcc gccatcgacg gcatccgggc cgccggcgcg acctcgcagt acatcttcgt    3000

cgagggcaac gcgtggagcg gggcctggag ctggaacacg accaacacca acatggccgc    3060

cctgacggac ccgcagaaca agatcgtgta cgagatgcac cagtacctcg actcggacag    3120

ctcgggcacc cacgccgagt gcgtcagcag caacatcggc gcccagcgcg tcgtcggagc    3180

cacccagtgg ctccgcgcca acggcaagct cggcgtcctc ggcgagttcg ccggcggcgc    3240

caacgccgtc tgccagcagg ccgtcaccgg cctcctcgac cacctccagg acaacagcga    3300

ggtctggctg ggtgccctct ggtgggccgc cggtccctgg tggggcgact acatgtactc    3360

gttcggtaag tttctccctt gttcttggct ttccccccag taagggagtc aggcaacatg    3420

cccaagaccg gctcggcttc gcttcaaggc gttcgttgta cacactgaag agttccaact    3480

tccaaccctg ttcgtgtcct ccgatcagct tcgacggggt gaagggggaa gggatttggg    3540

agtgaggtgg aggtcaaaag gagggatatc cccagatctc cacaaacggc cctgagccaa    3600

caacagcctc tggggtcaaa atgggcgcca accatacggt cattcactca ggacacctgc    3660

taacgcgtct cttttttttg tttccagagc ctccttcggg caccggctat gtcaactaca    3720

actcgatcct aaagaagtac ttgccgtaag gggcatgcag caaggtcgag cgagcattat    3780

tcagggccat ctgcttgtgt cggcaggcat cacgtcaacc catcgaatcg gacagcggaa    3840

tgctccgaga tgccatacac taagtctggt gatgacgtga gaatgctggc cctggtcggg    3900

ggttaccgcc aacaaaaagc acccggacgc tgccgcgccc ggataccatg gtttcatgta    3960

catattggtt ctttgctttc ttacgggggg gggggggggg gggggctctg cagcgttgct    4020

gagcgattcg tttccaagta tatactttgt ctggaattga attttgagtg acattgaccc    4080

aatcaaccag ctcggtgtgc tcacctcccg ttaccccccc tcttctcccc ctgctcggct    4140

tggctttcct ctccggtgtg gagcacggcc acggcggtcc caatccatat aagatcgatg    4200

gtatactatg gtatacacta gcttgggaat aaactaatcc atacgctaac taatggacgg    4260

attatcctaa gggtcaccgg ctcaccgttg gatataacac ctaggatacg ggagagctga    4320

tagaaaggga tgtactccgt attgtactgt acaatacaaa gtacagatag cacacgaagt    4380

acggtaggtg gtcccgccta gtccggacca acaatagaac atgcgttcct ggggacctgc    4440

aggaaagaag gggggggggg ttgccaagac gcccggggtt caaagaaagc cccgggccgc    4500

cgatgagatg agacggacgc cggcccaagg agaggccggt ggtcgatcct gcaaatgcca    4560

gcaaaaaaaa tccataccat aatccagtca actttcgtca cactcctgtg aaacgagctg    4620

gagggactgc tggaaaggtt ttgcaggtta atcactgtat gtggagcatg ccgtacctac    4680

tgtgcttcgt taacagatag agttccagtt gaacacacaa agttctgccc cgcctgccag    4740

acgtgaaaag aagctcctcc gggggagctt taggcaactg ggagggctct ctcccaggtt    4800

catggtgtct gctcttcttc aaatttttat gctgccaccc catttgacag aggtgtgcac    4860

accgttgcca ggtcttgcca tccggcaaaa agcagaaaag tcgacccatc gcctaagaaa    4920

ggcggtcgga aggggatcgg atgctcattg cggcttagcg tctgcccatt ctgacgctgc    4980

ccattgtttt gtgtcgcatt cgtcttcgga tgtcggatca agagtcccgg attttttccc    5040

ctgtgcttcc agcctaatct gagcgggagc tggctcggtt tcgagtggag ttgccttgtt    5100

ggtggagcag caaccagcca attcactccc ccgcattttc gcggccgccc aggcatcccc    5160

ggcatgcgtt tgggcggtaa ctactccgta ctggggtagg tgaaattggt tctcccgtcg    5220

caggaggctc gtgctcggtc aggggagaac aaagtccaac tgctccttcc tggcaacaat    5280

gagagggggt tctattgcca acgttgcacg aaaggagcag ccacaaaacc caaaagcagg    5340

ttaccttact gtacctgagc ttgaacgtcg cgtagcattg gagctctcgt ctaccggcgg    5400

cgtcacactc cattggcagg tcaaggcagt cagtggcagc gacccaacaa cgtcaatgct    5460

tgttacccca gaattacccc gggctgcaac actgcagggg ccgccgccga tgttgatcac    5520

cggttgatta cttctcggcc cgcaaccggg agatgagaag cagaactttg ttctcctttc    5580

aaaaaggacc tgacttgcgg ggaacgcact gccggcagtg gagtggatgc acgctagtta    5640

tatgtttccc gccatcccca gtccgcccgt cgcgtccgtg aggctcagtt tggcttcccg    5700

tgccgccgac aaacgagcgg tgcataatta catttcgctc catgtaccgt gcaccctccc    5760

cgttcgcgac cgtagta                                                   5777

<210>10

<211>389

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>10

Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala

1               5                   10                  15

Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser

            20                  25                  30

Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr

        35                  40                  45

Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr

    50                  55                  60

Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr

65                  70                  75                  80

Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly

                85                  90                  95

Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe

            100                 105                 110

Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr

        115                 120                 125

Ash Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln

    130                 135                 140

Leu Thr Ser Ser Phe Asp Glu Gly Tyr Leu Arg Asn Leu Thr Glu Val

145                 150                 155                 160

Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His

                165                 170                 175

Asn Tyr Gly Arg Tyr Tyr Gly Asn Val Ile Thr Asp Thr Asn Ala Phe

            180                 185                 190

Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu

        195                 200                 205

Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu

    210                 215                 220

Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly

225                 230                 235                 240

Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala

                245                 250                 255

Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro

            260                 265                 270

Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser

        275                 280                 285

Ser Gly Thr His Ala Glu Cys Val Ser Ser Asn Ile Gly Ala Gln Arg

    290                 295                 300

Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val

305                 310                 315                 320

Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val

                325                 330                 335

Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Glu Val Trp Leu Gly

            340                 345                 350

Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser

        355                 360                 365

Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Ash Tyr Ash Ser Ile Leu

    370                 375                 380

Lys Lys Tyr Leu Pro

385

<210>11

<211>6060

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>11

ccggcctcca gttccaggag cttggctctg ccgacatact gtgtacacta ggaattctct      60

tatgcggggt gtgcgcgggg aaatgttggg gaactcgagt tgggtcatgt ggacaagacc     120

aatgggagct gacatcattg tgcgacccgt taaaccggaa gctacaacaa cattctggat     180

tctacactag tggaagaggt aagtaattga cgacaagcaa gaagcattgc catgttctgc     240

gaaggatgcg ggtgtttttg catgagcagg aagctgtggc tttttagtgc tcctttgtgc     300

tcgccgggcg cgcagaacac taccgaaacg caggggactg cgtgcctctg gggtcgaatg     360

ccgatcccca tcttcacatt cccaccatcg tgttctgtta acgaagccgg agcggcggga     420

actcgaagct ccactacgta tggatacttg ggaccgtacg gagtgtgttg gtacggatgc     480

ctgcacaagt gttgtgcttc ctacgaagac gccaacccac ataatacaca aaagctgttg     540

taagtcgagt tacctcaggc acgttcgggc aactcgggca acctgacgag atttccccgc     600

cattccgcca agaggccggc gcctgccctg attaggcagc tcttggaaca atactatgta     660

gaatggaagc tccatccata gtcagctcca ttggcggtcc cagtgatctc gatggctgga     720

tggctgctct gtacggtaca tacatagtaa gttctcgcct tgagagccca attcgctgca     780

atagcatctt tccccgcagt gcgccggccg ccctgggtcc cgctccacaa tgaccttgct     840

tctggagctt ctcgacgaac agatcggccc gtttcttctc cacaccaatc cgaaccagtc     900

gggagcatgg ctgcggatgc gacgcagcct tccttcgcgc tgtacaaaca gctccgggaa     960

cgtcgactgg tatgtacgga ctacagtaag tacactacga gtgcacatac tgacgaatac    1020

cggcctcaga ggaacctggc aggaccctac cccacacgaa accacagcga gaaagcgcaa    1080

tggatcagta actactgcga agtaaccgtg gtcccgggca aaggatctga gggccgatcg    1140

ctcgtggggc tgcgaggcga gggagagcaa acaagccagt cctcccgcga acctggaaaa    1200

tcacttataa acacacgtca ccggcgccgg ggtgcgcgcc atgtgtcacc tccaggctcc    1260

tcccgggcga tgatctctgc cggtgccatc aatcatctcg gttcgccgca gctgcttctt    1320

tctgtgcagt gaacgctctc aaactgcaac gacgctgtcc gacatgaagg ctgctgcgct    1380

ttcctgcctc ttcggcagta cccttgccgt tgcaggcgcc attgaatcga gaaaggtatg    1440

gacgggcttt cgtcaaagac tcgctccccg atcaacttcc cctttcatcc agaccacccc    1500

aaccctccca gtcctgcttc gagcacgatc tcttcgggca gcaccccacc cacatccact    1560

cagattagcg gcgacaccgt tgactgttgc aatccgcaat cgacatgcaa cttccagccg    1620

cagcccaatg gctgctcacg cttcccgcga aagcctcact tgctgacaat catcgtcagg    1680

ttcaccagaa gcccctcgcg agatctgaac ctttttaccc gtcgccatgg atgaatccca    1740

acgccgacgg ctgggcggag gcctatgccc aggccaagtc ctttgtctcc caaatgactc    1800

tgctagagaa ggtcaacttg accacgggag tcgggtaagt tttgtcattt tgtccaggta    1860

acatgcaaat ggttctgcta acaataactt accgtagctg gggggctgag cagtgcgtcg    1920

gccaagtggg cgcgatccct cgccttggac ttcgcagtct gtgcatgcat gactcccctc    1980

tcggcatccg aggagccgac tacaactcag cgttcccctc tggccagacc gttgctgcta    2040

cctgggatcg cggtctgatg taccgtcgcg gctacgcaat gggccaggag gccaaaggca    2100

agggcatcaa tgtccttctc ggaccagtcg ccggccccct tggccgcatg cccgagggcg    2160

gtcgtaactg ggaaggcttc gctccggatc ccgtccttac cggcatcggc atgtccgaga    2220

cgatcaaggg cattcaggat gctggcgtca tcgcttgtgc gaagcacttt attggaaacg    2280

agcagggtga gtagtcaaag acgggccgtc tcggacccgc ggcttcaagc tgctgactct    2340

gctgcagagc acttcagaca ggtgccagaa gcccagggat acggttacaa catcagcgaa    2400

accctctcct ccaacattga cgacaagacc atgcacgagc tctacctttg gccgtttgcc    2460

gatgccgtcc gggccggcgt cggctctgtc atgtgctcgt accagcaggt caacaactcg    2520

tacgcctgcc agaactcgaa gctgctgaac gacctcctca agaacgagct tgggtttcag    2580

ggcttcgtca tgagcgactg gcaggcacag cacactggcg cagcaagcgc cgtggctggt    2640

ctcgatatgt ccatgccggg cgacacccag ttcaacactg gcgtcagttt ctggggcgcc    2700

aatctcaccc tcgccgtcct caacggcaca gtccctgcct accgtctcga cgacatggcc    2760

atgcgcatca tggccgccct cttcaaggtc accaagacca cccacctgga acccatcaac    2820

ttctccttct ggaccgacga cacttatggc ccgatccact gggccgccaa gcatggctac    2880

cagaagatta attcccacgt tgacgtccgc gccgaccacg gcaacctcat ccgggagatt    2940

gccgccaagg gtacggtgct gctgaagaat accggctctc tacccctgaa caagccaaag    3000

ttcgtggccg tcatcggcga ggatgctggg tcgagcccca acgggcccaa cggctgcagc    3060

gaccgcggct gtaacgaagg cacgctcgcc atgggctggg gatccggcac agccaactat    3120

ccgtacctcg tttcccccga cgccgcgctc caggcccggg ccatccagga cggcacgagg    3180

tacgagagcg tcctgtccaa ctacgccgag gaaaagacaa aggctctggt ctcgcaggcc    3240

aatgcaaccg ccatcgtctt cgtcaatgcc gactcaggcg agggctacat caacgtggac    3300

ggtaacgagg gcgaccgtaa gaacctgact ctctggaaca acggtgatac tctggtcaag    3360

aacgtctcga gctggtgcag caacaccatc gtcgtcatcc actcggtcgg cccggtcctc    3420

ctgaccgatt ggtacgacaa ccccaacatc acggccattc tctgggctgg tcttccgggc    3480

caggagtcgg gcaactccat  caccgacgtg ctttacggca aggtcaaccc cgccgcccgc   3540

tcgcccttca cttggggcaa gacccgcgaa agctatggcg cggacgtcct gtacaagccg    3600

aataatggca atggtgcgcc ccaacaggac ttcaccgagg gcgtcttcat cgactaccgc    3660

tacttcgaca aggttgacga tgactcggtc atctacgagt tcggccacgg cctgagctac    3720

accaccttcg agtacagcaa catccgcgtc gtcaagtcca acgtcagcga gtaccggccc    3780

acgacgggca ccacggccca ggccccgacg tttggcaact tctccaccga cctcgaggac    3840

tatctcttcc ccaaggacga gttcccctac atctaccagt acatctaccc gtacctcaac    3900

acgaccgacc cccggagggc ctcggccgat ccccactacg gccagaccgc cgaggagttc    3960

ctcccgcccc acgccaccga tgacgacccc cagccgctcc tccggtcctc gggcggaaac    4020

tcccccggcg gcaaccgcca gctgtacgac attgtctaca caatcacggc cgacatcacg    4080

aatacgggct ccgttgtagg cgaggaggta ccgcagctct acgtctcgct gggcggtccc    4140

gaggatccca aggtgcagct gcgcgacttt gacaggatgc ggatcgaacc cggcgagacg    4200

aggcagttca ccggccgcct gacgcgcaga gatctgagca actgggacgt cacggtgcag    4260

gactgggtca tcagcaggta tcccaagacg gcatatgttg ggaggagcag ccggaagttg    4320

gatctcaaga ttgagcttcc ttgaatgagt ttcatcaggg gctgcagagg gatggtaaca    4380

cgttcttaat cagaagtatg atggagaaaa gcacttggca agttccggtg agcaaaaaga    4440

aggcacttat taagtgtagg gcggtgttct atgtttaata ggtgctatgt ttacatataa    4500

ttagtatata atgatttaat aattatgttt agcagttgct aatgtcgtaa atttcggcgt    4560

gtgatgactg ctacaacact ggttctgtct tctagtcgcc attgttaatt atgaaggtta    4620

ttgtctacaa tttctaatac cttatggatg attgcccagc tggtttcaaa ctcgttacgc    4680

gcaaatggta cgattgaggt attattcatt gtaagtacct ccgtacagcg tccccaacta    4740

tttccattca cgagatgcct cgcttttcgg tgctttcgga acagggctgg cagcggatca    4800

tggcgcgatc aaaacatggc gagcagctgt ccaggacgga ggacaggttg gggactgatg    4860

cctcccggac gcattaaggt cagaagatag acacgtttta cacagcgttg agaccgacaa    4920

gccacattag gcagcgccgg ttgcaccacc gccgtcacgg gcaacggttc aatcaatcga    4980

caacagtgga agacaaagta ctgaagatca ggtattaata gtgtgagaga gaaacagacg    5040

gtggaactag ggtgctaata tttctcttga tttcggtgtc catggtagta cagaacacaa    5100

gaaaaagaag gaggagtgag cggagaagga ggagggggaa gccagaaaaa agaacatgaa    5160

aaagcataca cattggagtc ggtcagtcgg ttgattggtt tggtagagag cgaaaaagca    5220

agcgtcacct gtaggattcg aacctacgct cccgaaggaa ctgcctaaga acgctaagca    5280

aggttagcag ggcagcgcgt taaccactcc gccaaagtga ctgtcgttga tcatggtcga    5340

attcaagtag cttataggag ttcaaccaga tcacaaatgc ataggtgctc gtagaacggt    5400

ctaagtatga gttgattata agcaaccgaa tggctctcag cggcaacacc gtagctgaag    5460

taacaaaacg cacctttggt tactttctga ctataaaaat gggatatttg gaaatgacca    5520

cccgataagg tgtcaaattc taaatgactg tctgggtgtg aagatgttac tgtggttcca    5580

ccacgaacca gttttagtat ccgcatgctt cagtctctgc gcctcgacag gcggagggtg    5640

tgtgttagat cagaatcgat gtgacgctgt gaccgcgagg ctctcgagcc taggtgcggt    5700

agttctgttc aaaaagaagt gtgtggccgg gtttgggcgc ccttatagcc taccatcctg    5760

gctgtggttc ccgagcggga gccggttctc cgttttggtt ccgataaagt gtcatatctg    5820

cctcccggtt tcgcatctaa tttctgactt cgttcgggac ctctggagac gtagggatag    5880

gtatgggata tgcccggcat ttcgtaaatg tccatagtct ctttcgggac gaggcggcaa    5940

gctctcagag ctatctaagc ttaaccaacc cctgatcctt aaccctccca gaccacacct    6000

cctgggagaa taaaccgggc tccaagatcg aaatcgaaat cagtgcgcga acttgaaatc    6060

<210>12

<211>871

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>12

Met Gln Leu Pro Ala Ala Ala Gln Trp Leu Leu Thr Leu Pro Ala Lys

1               5                   10                  15

Ala Ser Leu Ala Asp Asn His Arg Gln Val His Gln Lys Pro Leu Ala

            20                  25                  30

Arg Ser Glu Pro Phe Tyr Pro Ser Pro Trp Met Asn Pro Asn Ala Asp

        35                  40                  45

Gly Trp Ala Glu Ala Tyr Ala Gln Ala Lys Ser Phe Val Ser Gln Met

    50                  55                  60

Thr Leu Leu Glu Lys Val Asn Leu Thr Thr Gly Val Gly Trp Gly Ala

65                  70                  75                  80

Glu Gln Cys Val Gly Gln Val Gly Ala Ile Pro Arg Leu Gly Leu Arg

                85                  90                  95

Ser Leu Cys Met His Asp Ser Pro Leu Gly Ile Arg Gly Ala Asp Tyr

            100                 105                 110

Asn Ser Ala Phe Pro Ser Gly Gln Thr Val Ala Ala Thr Trp Asp Arg

        115                 120                 125

Gly Leu Met Tyr Arg Arg Gly Tyr Ala Met Gly Gln Glu Ala Lys Gly

    130                 135                 140

Lys Gly Ile Asn Val Leu Leu Gly Pro Val Ala Gly Pro Leu Gly Arg

145                 150                 155                 160

Met Pro Glu Gly Gly Arg Asn Trp Glu Gly Phe Ala Pro Asp Pro Val

                165                 170                 175

Leu Thr Gly Ile Gly Met Ser Glu Thr Ile Lys Gly Ile Gln Asp Ala

            180                 185                 190

Gly Val Ile Ala Cys Ala Lys His Phe Ile Gly Asn Glu Gln Glu His

        195                 200                 205

Phe Arg Gln Val Pro Glu Ala Gln Gly Tyr Gly Tyr Asn Ile Ser Glu

    210                 215                 220

Thr Leu Ser Ser Asn Ile Asp Asp Lys Thr Met His Glu Leu Tyr Leu

225                 230                 235                 240

Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ser Val Met Cys

                245                 250                 255

Ser Tyr Gln Gln Val Asn Asn Ser Tyr Ala Cys Gln Asn Ser Lys Leu

            260                 265                 270

Leu Asn Asp Leu Leu Lys Asn Glu Leu Gly Phe Gln Gly Phe Val Met

        275                 280                 285

Ser Asp Trp Gln Ala Gln His Thr Gly Ala Ala Ser Ala Val Ala Gly

    290                 295                 300

Leu Asp Met Ser Met Pro Gly Asp Thr Gln Phe Asn Thr Gly Val Ser

305                 310                 315                 320

Phe Trp Gly Ala Asn Leu Thr Leu Ala Val Leu Asn Gly Thr Val Pro

                325                 330                 335

Ala Tyr Arg Leu Asp Asp Met Ala Met Arg Ile Met Ala Ala Leu Phe

            340                 345                 350

Lys Val Thr Lys Thr Thr His Leu Glu Pro Ile Asn Phe Ser Phe Trp

        355                 360                 365

Thr Asp Asp Thr Tyr Gly Pro Ile His Trp Ala Ala Lys His Gly Tyr

    370                 375                 380

Leu

Gln Lys Ile Asn Ser His Val Asp Val Arg Ala Asp His Gly Asn Leu

385                 390                 395                 400

Ile Arg Glu Ile Ala Ala Lys Gly Thr Val Leu Leu Lys Asn Thr Gly

                405                 410                 415

Ser Leu Pro Leu Asn Lys Pro Lys Phe Val Ala Val Ile Gly Glu Asp

            420                 425                 430

Ala Gly Ser Ser Pro Asn Gly Pro Asn Gly Cys Ser Asp Arg Gly Cys

        435                 440                 445

Asn Glu Gly Thr Leu Ala Met Gly Trp Gly Ser Gly Thr Ala Asn Tyr

    450                 455                 460

Pro Tyr Leu Val Ser Pro Asp Ala Ala Leu Gln Ala Arg Ala Ile Gln

465                 470                 475                 480

Asp Gly Thr Arg Tyr Glu Ser Val Leu Ser Asn Tyr Ala Glu Glu Lys

                485                 490                 495

Thr Lys Ala Leu Val Ser Gln Ala Asn Ala Thr Ala Ile Val Phe Val

            500                 505                 510

Asn Ala Asp Ser Gly Glu Gly Tyr Ile Asn Val Asp Gly Asn Glu Gly

        515                 520                 525

Asp Arg Lys Asn Leu Thr Leu Trp Asn Asn Gly Asp Thr Leu Val Lys

    530                 535                 540

Asn Val Ser Ser Trp Cys Ser Asn Thr lle Val Val Ile His Ser Val

545                 550                 555                 560

Gly Pro Val Leu Leu Thr Asp Trp Tyr Asp Asn Pro Asn Ile Thr Ala

                565                 570                 575

Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly Asn Ser Ile Thr

            580                 585                 590

Asp Val Leu Tyr Gly Lys Val Asn Pro Ala Ala Arg Ser Pro Phe Thr

        595                 600                 605

Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ala Asp Val Leu Tyr Lys Pro

    610                 615                 620

Asn Asn Gly Asn Gly Ala Pro Gln Gln Asp Phe Thr Glu Gly Val Phe

625                 630                 635                 640

Ile Asp Tyr Arg Tyr Phe Asp Lys Val Asp Asp Asp Ser Val Ile Tyr

                645                 650                 655

Glu Phe Gly His Gly Leu Ser Tyr Thr Thr Phe Glu Tyr Ser Asn Ile

            660                 665                 670

Arg Val Val Lys Ser Asn Val Ser Glu Tyr Arg Pro Thr Thr Gly Thr

        675                 680                 685

Thr Ala Gln Ala Pro Thr Phe Gly Asn Phe Ser Thr Asp Leu Glu Asp

    690                 695                 700

Tyr Leu Phe Pro Lys Asp Glu Phe Pro Tyr Ile Tyr Gln Tyr Ile Tyr

705                 710                 715                 720

Pro Tyr Leu Asn Thr Thr Asp Pro Arg Arg Ala Ser Ala Asp Pro His

                725                 730                 735

Tyr Gly Gln Thr Ala Glu Glu Phe Leu Pro Pro His Ala Thr Asp Asp

            740                 745                 750

Asp Pro Gln Pro Leu Leu Arg Ser Ser Gly Gly Asn Ser Pro Gly Gly

        755                 760                 765

Asn Arg Gln Leu Tyr Asp Ile Val Tyr Thr Ile Thr Ala Asp Ile Thr

    770                 775                 780

Asn Thr Gly Ser Val Val Gly Glu Glu Val Pro Gln Leu Tyr Val Ser

785                 790                 795                 800

Leu Gly Gly Pro Glu Asp Pro Lys Val Gln Leu Arg Asp Phe Asp Arg

                805                 810                 815

Met Arg Ile Glu Pro Gly Glu Thr Arg Gln Phe Thr Gly Arg Leu Thr

            820                 825                 830

Arg Arg Asp Leu Ser Asn Trp Asp Val Thr Val Gln Asp Trp Val Ile

        835                 840                 845

Ser Arg Tyr Pro Lys Thr Ala Tyr Val Gly Arg Ser Ser Arg Lys Leu

    850                 855                 860

Asp Leu Lys Ile Glu Leu Pro

865                 870

<210>13

<211>998

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>13

atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc     60

tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc    120

ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac    180

ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag    240

agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc    300

agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc    360

gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac    420

tttgacctgg ccgtgagttg cctccccttc tccccggacc gctcagatta gatgagatta    480

gactttgctc gtaaatcggt ccaagattcc cttgactgac caacaaacat catacgggca    540

gatccccggt ggcggtgtcg gtattttcaa cggtaagctg gtgcccccgg acccctcccc    600

ggacccctcc cccttttcct ccagcgagcc gagttgggat cgccgagatc gagaactcac    660

acaacttctc tctcgacagc ctgcaccgac cagtacggcg ctcccccgaa cggctggggc    720

gaccgctacg gcggcatcca ttccaaggaa gagtgcgaat ccttcccgga ggccctcaag    780

cccggctgca actggcgctt cgactggtac gttgctttga cataccggaa cccaattcct    840

ccaacccccc cccttttctc ccccaactcc gggggtagtc ggaatgtcgc gactgaccct    900

atttcaggtt ccaaaacgcc gacaacccgt cggtcacctt ccaggaggtg gcctgcccgt    960

cggagctcac gtccaagagc ggctgctccc gttaa                               995

<210>14

<211>225

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>14

Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala

1               5                   10                  15

Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys

            20                  25                  30

Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val

        35                  40                  45

Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr

    50                  55                  60

Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln

65                  70                  75                  80

Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val

                85                  90                  95

Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu

            100                 105                 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln

        115                 120                 125

Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala

    130                 135                 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr

145                 150                 155                 160

Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser

                165                 170                 175

Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn

            180                 185                 190

Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe

        195                 200                 205

Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser

    210                 215                 220

Arg

225

<210>15

<211>4190

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>15

gcgcttccgg cctgggcgag taaaatgacg gaagccgggc cccgtccgac tgcgtttgtc      60

ccaactcgga agcaggcatc gttttttggg cgggaggaag cgttgcaaca cgcactatcg     120

ccaaggtgga ctcggcgcaa tctggaggtt cggcccgcgg aggacggaat ccgggctgaa     180

tctgcgcaaa ggctgaccct gcgatggtgg gaaaatgtaa atatgtgaag ttataggcat     240

ataggactca gcgatgacat ggaaattgca gaggcatgtg ggatttcagc gtttggcatg     300

cattggtcgg atctctcgcc ttgtctgatg tgatcccgcc ggaggtgttt cggtctctgg     360

ggaagggacc ccccctggcc ccccacctgc cccgcatcat gcctcgccac gactcccgcg     420

cgccgaggaa gaacttcggg tctttgtgac gggagattcc actgagtgag cattggccaa     480

ccaagcacac aattactccg tacatacaca gtacttctga ctccgtaaag taaaccgtgt     540

gtttcaaaga tcggtaatcc gtaacaggta ctccgtatct aaggtaaatt taccctgtgc     600

acggagcaga acctgaactt cttcccccct cttactcgag tagtcaccct actccaacca     660

gcggcttttc aactcgcaaa gtcttgttta taacagtgca tatacctgca tttcgtatct     720

cgctagtgta aagacgacca cacgcggaca aagaaagaaa aatccaattg cccgatggct     780

cttagtttga ggacagcagc gaaggactac actgcgccgt agtgaccagg ccaagaaacg     840

cgaatcgtat attaacggca aatcaaaatg gattatatgc catttcgctt ccgggttgcg     900

tgctcgtccg aagtctggtg ccgatcgatt gcgaaccccc ggaatcgcgg gatgattcct     960

acagccgccg aaaggggggg ggggggaggg gggtctggac gggacgtgca taacttcgaa    1020

tttctagaat attgcggatt gggttccctt cagccctgcg agcgcgcccc cttctggaac    1080

cgcacccttc accggttcca cacacagagg acatgggtgg aaatgtgtac ctgacggttg    1140

cccctttggg acagtggaga ggcggatgtt cggataacca tccggagccg cagtgtcgac    1200

caagatcttg gcttaccatc gacaccaaca tgcggactcg tccctcagtc atggagcctt    1260

ggctcgcgga gcctccgttc gaagcggcta tcccgtcctg ccagcggagg atctcgtacc    1320

gcttccgcga actgtgaatg tcctgggtat aagagcatgg cgcgaccttg tctcgtcagg    1380

aacggggagg aggagggctt ggttagggtc gcgttcgttt ggagattgct gagctctgag    1440

ccttcggtcc ttggatccct gcggtccccg gtctcctctc tctctctctc tctctctctc    1500

tctctctctt cttcccacgc tcgttcgaca gacgcctccc cttcttcgct ctcctttccc    1560

tcgcacgtag cacactaata gtgcaccatg cgcgtctcta gtttggtcgc ggcccttgct    1620

accggtggtc ttgtcgccgc cacgcctaag cccaaggggt cgtcgccccc tggggccgtg    1680

gacgcgaacc ctttcaaggg caagacgcag ttcgtcaacc cggcatgggc ggccaagctg    1740

gaacagacca aaaaggcgtt cctggccagg aacgacaccg tcaatgccgc caagacggag    1800

aaggtccagc agaccagctc gttcgtctgg gtctcgagga tcgccgagct ctccaacatc    1860

gacgacgcca tcgcggctgc ccgcaaggcg cagaagaaga cgggcaggag gcagatcgtc    1920

ggcctggtgc tctacaacct tccggaccgc gactgcagcg cgggcgagag cgcgggcgag    1980

ctcagcagcg acaagaacgg gctcgagatc tacaagactg agttcgtcaa gcccttcgcc    2040

gacaaggtgg cggccgcaaa ggacctcgac ttcgccatcg tcctggagcc cgactcgctg    2100

gccaacctgg tcaccaacct gggcatcgag ttctgcgcca acgccgcccc cgtctaccgc    2160

gagggcatcg cctatgccat ctccagcctt cagcagccaa acgtgcactt gtacatcgat    2220

gctgcccacg gcggctggct cggctgggac gacaacctgc cgctggccgc caaggagttt    2280

gccgaggtgg tcaagcttgc cggcgagggc aagaagatcc gcggcttcgt caccaacgtg    2340

tccaactaca accccttcca cgccgtcgtg cgcgagaact ttaccgagtg gagcaactcg    2400

tgggacgagt ctcactacgc ctcctcgctc acaccgttcc tcgagaaaga ggggctgccg    2460

gcacgcttca tcgtcgacca gggtcgcgtt gccctcccgg gagcccgcaa ggagtggtga    2520

gtttcgacca gattgaccct cgacccatgc gaccgagatt gctgacgatt gaattgcgtg    2580

tcccgtcccc caggggtgaa tggtgcaacg tggcacccgc cggatttggc cccgcgccca    2640

cgaccagggt caacaacacc gtcgtcgatg ctctcgtctg ggtcaagcct ggcggcgaga    2700

gcgacggcga gtgtggcttg gctggcgccc ccaaggccgg ccagtggttc gacgagtacg    2760

cccagatgct ggtcgagaat gcccacccgt ctgtcgtcca caagtggtag ataaattttg    2820

gagtccgaga agggtcccag atagactttt gttttaaaac aaaatgcaag gtgtcgacag    2880

atactggctt aacattaacc aagcaccatg aacatgactt gtcaacatat tgatacattc    2940

cgctgctttc ccatacgtgc tctcaggtct cagggatcaa atggataggt cggtaatgca    3000

aaacgatcca ttggatatcc agaagagaga aaaaaaaaag gacatgcatg ccttgtctgt    3060

catcatgagg aaacaaagga aaaacaaacg atcgtcgtgt tccaacaagc tttccaagac    3120

cacaagaccc atccaccaac acaaccaaac gacaagcaat acgatggacc gccgttgttc    3180

catctctcaa gagctgacta aacgaacagt cgttgaaatc atcctacatg agtacgccgc    3240

accacctgtt atcgtgtaaa ccaaatcgcc tgttaaagtg catcatctct taggtatgat    3300

cgtaagttcc ggtcacggtc acggatcagg gatggttctc aattcgtgtg tcgcgtagcc    3360

gccgccgtat ctggacaaga cttcttgtat tgctccgaaa ccgcttttgc cgccctaata    3420

atctgtagcc ttcttacctg gtggtgcctt gaaagacgcg gcaggcaaca cttcgcaggt    3480

ctgtggcgca ccagcaccag gctgtggtga tgccccggaa ccggtcgtcg acttgctcgc    3540

ggtgtcctcg gctggtgggg atgggggtga tgagggcttg gagggtgttg ttgcgcccgc    3600

aacatccggc tccggctccg gaccgtccac agacattgga cctgcgagca tgactcgtgc    3660

cttcagccag accaaagcca tgccatcatc gcctctgccg acgctgttga gcgggaggct    3720

gatgttctca gccagaactg cgggctgtac ggccatgacc atgggctgtt cggtctggcc    3780

gtcttgcggc ggtttctccc tgccagcttg ttgtgcgcgg tgcctgcgag attcgacttc    3840

gacctgggcg tggcagaggg tgacgaggga cgttgacgcc ttgatctcct tgctccccat    3900

gtccttccac ccgtacaggc ggacgggtgc catacgcgtc cacagcctgc acgagaacct    3960

cagggcgtcg tcaatgagtt ctgtcaactt gctctccagc ctctctatgc cgcgagcatc    4020

ctgatcctgg agcagaaacc gtgccgagcc tccgaggaaa cgctccttca gcttccgcgc    4080

gtagtttagg cgtgattcaa caaacgtccg gcgggactcg ttgttgcccg cagcagcgac    4140

gtccttgatg ctgaagccgc cgtcggcgaa caggcgcatc atctgggccc               4190

<210>16

<211>381

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>16

Met Arg Val Ser Ser Leu Val Ala Ala Leu Ala Thr Gly Gly Leu Val

1               5                   10                  15

Ala Ala Thr Pro Lys Pro Lys Gly Ser Ser Pro Pro Gly Ala Val Asp

            20                  25                  30

Ala Asn Pro Phe Lys Gly Lys Thr Gln Phe Val Asn Pro Ala Trp Ala

        35                  40                  45

Ala Lys Leu Glu Gln Thr Lys Lys Ala Phe Leu Ala Arg Asn Asp Thr

    50                  55                  60

Val Asn Ala Ala Lys Thr Glu Lys Val Gln Gln Thr Ser Ser Phe Val

65                  70                  75                  80

Trp Val Ser Arg Ile Ala Glu Leu Ser Asn Ile Asp Asp Ala Ile Ala

                85                  90                  95

Ala Ala Arg Lys Ala Gln Lys Lys Thr Gly Arg Arg Gln Ile Val Gly

            100                 105                 110

Leu Val Leu Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Gly Glu Ser

        115                 120                 125

Ala Gly Glu Leu Ser Ser Asp Lys Asn Gly Leu Glu Ile Tyr Lys Thr

    130                 135                 140

Glu Phe Val Lys Pro Phe Ala Asp Lys Val Ala Ala Ala Lys Asp Leu

145                 150                 155                 160

Asp Phe Ala Ile Val Leu Glu Pro Asp Ser Leu Ala Asn Leu Val Thr

                165                 170                 175

Asn Leu Gly Ile Glu Phe Cys Ala Asn Ala Ala Pro Val Tyr Arg Glu

            180                 185                 190

Gly Ile Ala Tyr Ala Ile Ser Ser Leu Gln Gln Pro Asn Val His Leu

        195                 200                 205

Tyr Ile Asp Ala Ala His Gly Gly Trp Leu Gly Trp Asp Asp Asn Leu

    210                 215                 220

Pro Leu Ala Ala Lys Glu Phe Ala Glu Val Val Lys Leu Ala Gly Glu

225                 230                 235                 240

Gly Lys Lys Ile Arg Gly Phe Val Thr Asn Val Ser Asn Tyr Asn Pro

                245                 250                 255

Phe His Ala Val Val Arg Glu Asn Phe Thr Glu Trp Ser Asn Ser Trp

            260                 265                 270

Asp Glu Ser His Tyr Ala Ser Ser Leu Thr Pro Phe Leu Glu Lys Glu

        275                 280                 285

Gly Leu Pro Ala Arg Phe Ile Val Asp Gln Gly Arg Val Ala Leu Pro

    290                 295                 300

Gly Ala Arg Lys Glu Trp Gly Glu Trp Cys Asn Val Ala Pro Ala Gly

305                 310                 315                 320

Phe Gly Pro Ala Pro Thr Thr Arg Val Asn Asn Thr Val Val Asp Ala

                325                 330                 335

Leu Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly Glu Cys Gly Leu

            340                 345                 350

Ala Gly Ala Pro Lys Ala Gly Gln Trp Phe Asp Glu Tyr Ala Gln Met

        355                 360                 365

Leu Val Glu Asn Ala His Pro Ser Val Val His Lys Trp

    370                 375                 380

<210>17

<211>3000

<212>DNA

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>17

cgcggccccg tctttgaacg cttgagaagc gcacggtgaa gaaccatcaa ctccgattcc      60

gctcctcatc ctcccacgaa gccgattgaa atagccacag cggctatgta cggattactc     120

tgctccgttt gcacatccat acacagcgct atttttaaaa gttcaggacg gccaagcccg     180

gttcttggaa cggacgaccc ggattccgaa agctccagcg ctcaatgcgg tcagtcgtgg     240

cgctgatcct gctgatctgc tgatctcata aacccgcaac ttcaactttt cactttgaag     300

cgtatacacg cagcgcctct ttcaccggcg cattcatact cgcaaattaa ccgctaatat     360

cctcgcactt ggataatgtg tagccgacac ggaggagggg ggttgggggg gggttggggg     420

gagacatgat ggtctgccca acggatatta ttattttgtt gttttgtata attactgcgg     480

caacattctc aaaggggccg tgcctcgcgg cgggaaagcc catgacagag aattggacag     540

ctccaagctc gcgatatact ctaacaacgg cgtgactcgg caatgaaggc ctgccgctcg     600

agtgataggg cgaagtaaaa cggacgttac atgcggcact tagccggctg atgccggaga     660

atacgggatt caacgataca atcacacgat gcgacacacc tcggcgactt ggcgctctat     720

ggaagaaggc tgggttaaag ctggcgtaga ttttgcgcgt cttggtttct taaccgggtt     780

atttctattt ctcatatgcc gcgagcgaat gcggggtgca gagcgcccgg gagtcgatgg     840

tcctatcaga caagagcctg gccccggaac ctgggataat agaagccaaa ttaagccatg     900

ggagtatcgt ccgggggtag gaaccgcacg ggcaactaga ggaggaagaa tttggtataa     960

agggaggacg gcggaacagg cttgatggac atgaatcaga agacgacact gggcaactaa    1020

acagcttgca gcagagtttt gtgccttgca taggccctcg atatcatggt ctcgttcact    1080

ctcctcctca cggtcatcgc cgctgcggtg acgacggcca gccctctcga ggtggtcaag    1140

cgcggcatcc agccgggcac gggcacccac gaggggtact tctactcgtt ctggaccgac    1200

ggccgtggct cggtcgactt caaccccggg ccccgcggct cgtacagcgt cacctggaac    1260

aacgtcaaca actgggttgg cggcaagggc tggaacccgg gcccgccgcg caagattgcg    1320

tacaacggca cctggaacaa ctacaacgtg aacagctgtg cgttgtcctc ctctttctcc    1380

ctttcgcttg ttttccttga tgattgggat ccattttaaa agagaaggaa aaaaaaaaca    1440

aaggaaaata gaagataact aacgccaagc tctggcagac ctcgccctgt acggctggac    1500

tcgcaacccg ctggtcgagt attacatcgt ggaggcatac ggcacgtaca acccctcgtc    1560

gggcacggcg cggctgggca ccatcgagga cgacggcggc gtgtacgaca tctacaagac    1620

gacgcggtac aaccagccgt ccatcgaggg gacctccacc ttcgaccagt actggtccgt    1680

ccgccgccag aagcgcgtcg gcggcactat cgacacgggc aagcactttg acgagtggaa    1740

gcgccagggc aacctccagc tcggcacctg gaactacatg atcatggcca ccgagggcta    1800

ccagagctct ggttcggcca ctatcgaggt ccgggaggcc taaagaagcc aggcgccttt    1860

cttttgtttt gcaggagggg gtagaggggg ggggggaggg aaaacgaaaa gtagcagggt    1920

ggttttatgc cggcagccgt gggccattcg agtgcaacct gtatctctct ctctcccaag    1980

tctccgggct ccttctcaga gaacttcaat atgtctgggg acaaaccacc ttgtgaaata    2040

caacggtaat tatctaagtt tgagtgccct atcgtatgct tctgaaaatt tcctgctcct    2100

tgatacaagt cggtttgagc cgagccaatg agactgtgtc gattgataga ggccctgaag    2160

gatcaagcgc gatgcaacaa ttaagcatga ctacgtgcct agctgcagat aaatggaagc    2220

cactcaccaa ggtcaacccc gcatactggc acgtaagaac cttccgtgta caaggcccaa    2280

ccgactcaca tatctatctg cttgggtttt gggatgcggt tttttaccca caaaacaaat    2340

ttgatacaat gctctgctgt gcccgggttg ctgagaccaa gccgtaatca gcgggcaggg    2400

aatcgagtag gtcacgcctg ttgcttggtc tagaacaaac taatattaaa aagccttgtg    2460

ctcggcacac atacagaact cgacctgagg catgttcttg gaaggcggct agccagtcaa    2520

gtctggcacc aggccttggt ctcgtcgagg ataccgaggg cgaggaggat gaggaagacc    2580

tctttctcgc ctcagatctc ttaggggacg aagaagacaa cgccggagcc acacaataat    2640

taggtctcat atcagacgtt tcggcctggc cgagctaata tgtctaatta tgcccatcag    2700

ccgtatgtcg aggcaggttg caccgatacg ctcgccgcgc cgcctcattc atctccgact    2760

gggcacaatg tcgccatctc ggccgtcaag gtggtgcaag atacctatta tgcaagcaga    2820

ggatcagatg gcgggccgat acgagcggct gctccggctt gcgagaaagc cgcttcgcag    2880

caaggtatcg tggcaggccg ccattttcgg ttgggtattc tttgtcttgt ttgcttcgta    2940

attatgtcct ggctggcatt gtgggaaggg gcgaacctct tgatttccga tgggggtcga    3000

<210>18

<211>218

<212>PRT

<213>鲁克文金孢子菌(Chrysosporium lucknowense)

<400>18

Met Val Ser Phe Thr Leu Leu Leu Thr Val Ile Ala Ala Ala Val Thr

1               5                   10                  15

Thr Ala Ser Pro Leu Glu Val Val Lys Arg Gly Ile Gln Pro Gly Thr

            20                  25                  30

Gly Thr His Glu Gly Tyr Phe Tyr Ser Phe Trp Thr Asp Gly Arg Gly

        35                  40                  45

Ser Val Asp Phe Asn Pro Gly Pro Arg Gly Ser Tyr Ser Val Thr Trp

    50                  55                  60

Asn Asn Val Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Pro

65                  70                  75                  80

Pro Arg Lys Ile Ala Tyr Asn Gly Thr Trp Asn Asn Tyr Asn Val Asn

                85                  90                  95

Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Val Glu Tyr

            100                 105                 110

Tyr Ile Val Glu Ala Tyr Gly Thr Tyr Asn Pro Ser Ser Gly Thr Ala

        115                 120                 125

Arg Leu Gly Thr Ile Glu Asp Asp Gly Gly Val Tyr Asp Ile Tyr Lys

    130                 135                 140

Thr Thr Arg Tyr Asn Gln Pro Ser Ile Glu Gly Thr Ser Thr Phe Asp

145                 150                 155                 160

Gln Tyr Trp Ser Val Arg Arg Gln Lys Arg Val Gly Gly Thr Ile Asp

                165                 170                 175

Thr Gly Lys His Phe Asp Glu Trp Lys Arg Gln Gly Asn Leu Gln Leu

            180                 185                 190

Gly Thr Trp Asn Tyr Met Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser

        195                 200                 205

Gly Ser Ala Thr Ile Glu Val Arg Glu Ala

    210                 215

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号