首页> 中国专利> 二酰基甘油酰基转移酶(DGA1)多核苷酸,和通过异源DGA1的超量表达增加酵母细胞脂质生产的方法

二酰基甘油酰基转移酶(DGA1)多核苷酸,和通过异源DGA1的超量表达增加酵母细胞脂质生产的方法

摘要

本发明涉及二酰基甘油酰基转移酶(DGA1)多核苷酸,和通过异源DGA1的超量表达增加酵母细胞脂质生产的方法。DGA1催化在酵母中将酰基‑CoA和1,2‑二酰基甘油转化成三酰甘油(TAG)和CoA的最终酶步骤。公开了在产油酵母宿主中表达编码来自圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉或麦角菌的DGA1的多核苷酸序列的方法。本文还描述了解脂耶氏酵母的改造的重组宿主细胞,其包含编码DGA1蛋白的异源DGA1多核苷酸或其功能活性部分,具有产生增加的脂质产量的能力并具有提高的葡萄糖消耗效率的特征。

著录项

  • 公开/公告号CN113151319A

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 银杏生物制品公司;

    申请/专利号CN202110290143.0

  • 申请日2015-02-24

  • 分类号C12N15/54(20060101);C12N9/10(20060101);C12N15/81(20060101);C12N1/19(20060101);C12P7/64(20060101);C12R1/645(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人罗文锋;黄希贵

  • 地址 美国马萨诸塞州

  • 入库时间 2023-06-19 11:59:12

说明书

本申请为分案申请,原申请的申请日为2015年2月24日,申请号为201580021065.7(PCT/US2015/017227),发明名称为“二酰基甘油酰基转移酶(DGA1)多核苷酸,和通过异源DGA1的超量表达增加酵母细胞脂质生产的方法”。

相关申请

本申请要求2014年2月24号提交的美国临时申请号61/943,664的权益;其内容通过引用由此并入。

发明领域

本发明的领域是产油和/或耐高温酵母的基因工程。编码异源DGA1的多核苷酸在酵母(例如,选自圆红冬孢酵母(Rhodosporidium toruloides)、斯达油脂酵母(Lipomycesstarkeyi)、裂殖壶菌(Aurantiochytrium limacinum)、土曲霉(Aspergillus terreus)或麦角菌(Clavicepspurpurea))中的超量表达导致酵母细胞的改造的菌株,例如解脂耶氏酵母(Yarrowialipolytica),其能够有效地产生高浓度的脂质。

发明背景

脂质具有多种工业应用,包括在化妆品工业和食品工业中的应用,以及用作生物柴油和各种生物化学品的前体。微生物脂质由许多产油有机体产生,所述产油有机体包括解脂耶氏酵母(Beopoulos A等人,Y.lipolytica as a model for bio-oilproduction.Prog Lipid Res.2009年11月;48(6):375-87)。产油有机体中的脂质产量可通过正调节和/或负调节或删除脂质通道中所涉及的基因来增加(Tai M等人,Engineeringthe push and pull of lipid biosynthesis in oleaginous yeast Y.lipolytica forbiofuel production.Metab Eng.2013年1月;15:1-9;Beopoulos A等人,Control oflipid accumulation in the yeast Y.lipolytica.Appl Environ Microbiol.2008年12月;74(24):7779–7789)。例如,据报道天然解脂耶氏酵母DGA1的正调节显著增加脂质产量和生产率(Tai M等人,Metab Eng.2013年1月;15:1-9)。DGA1(二酰基甘油酰基转移酶)是三酰甘油(TAG)合成的最终步骤中所涉及的脂质通道的关键组分之一,三酰甘油是脂质的主要组分(Beopoulos A等人,Identification and characterization of DGA2,anacyltransferase of the DGAT1 acyl-CoA:diacylglycerol acyltransferase familyin the oleaginous yeast Y.lipolytica.New insights into the storage lipidmetabolism of oleaginous yeasts.Appl Microbiol Biotechnol.2012年2月;93(4):1523-37)。Tai 2013出版物公开了数据,其表明DGA1效率可能是对于产油有机体中的高水平脂质累积而言关键的重要因素。除了同源基因的操纵以外,异源基因也可被引入宿主基因组中并对脂质生产和组成具有显著影响(Courchesne NM等人,Enhancement of lipidproduction using biochemical,genetic and transcription factor engineeringapproaches.J Biotechnol.2009年4月20号141(1-2):31-41)。另外,其它产油酵母,例如圆红冬孢酵母和斯达油脂酵母,能够累积与野生型解脂耶氏酵母菌株相比显著更多的脂质(Sitepu IR等人,Manipulation of culture conditions alters lipid content andfatty acid profiles of a wide variety of known and new oleaginous yeastspecies.Bioresour Technol.2013年9月;144:360-9;Liang MH等人,Advancingoleaginous microorganisms to produce lipid via metabolic engineeringtechnology.Prog Lipid Res.2013年10月;52(4):395-408;Ageitos JM等人,Oily yeastsas oleaginous cell factories.Appl Microbiol Biotechnol.2011年5月;90(4):1219-27;Papanikolaou S等人,Lipids of oleaginous yeasts.Part I:Biochemistry ofsingle cell oil production.European Journal of Lipid Science and Technology2011年6月;113(8):1031-1051;Pan LX等人,Isolation of Oleaginous Yeasts,FoodTechnol.Biotechnol.200947(2):215–220;Ratledge C等人,The biochemistry andmolecular biology of lipid accumulation in oleaginous microorganisms.Adv ApplMicrobiol.200251:1-51;Kaneko H等人,Lipid composition of 30 species ofyeast.Lipids.1976年12月;11(12):837-44)。尽管尝试通过来自高山被孢霉(Mortierellaalpine)的异源DGA1的超量表达来增加解脂耶氏酵母中的脂质产量,但是未报道对于脂质生产水平有显著影响(美国专利7,198,937)。

值得注意地,申请人已通过超量表达编码来自高度产油有机体的DGA1的多核苷酸解决了长期存在的问题。这些多核苷酸,当被引入酵母(例如解脂耶氏酵母)中时,产生与超量表达原生解脂耶氏酵母DGA1的菌株相比能够具有增加的脂质产量的改造的酵母菌株。

发明内容

本发明涉及在酵母(例如解脂耶氏酵母)中编码来自高度产油有机体的DGA1的多核苷酸的超量表达,所述有机体例如圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉和麦角菌。所述DGA1和编码的多肽可用于操纵生产商业可用油、三酰甘油和微生物(特别是酵母)中的脂质。具体地,本发明涉及通过引入异源DGA1多核苷酸来增加酵母(例如解脂耶氏酵母)中的脂质的产量。数种来自最有效的脂质生产有机体的DGA1基因在解脂耶氏酵母中的超量表达导致当与解脂耶氏酵母中的原生DGA1的超量表达相比时解脂耶氏酵母脂质产量的显著增加。

本发明的一个方面涉及用于产生重组酵母细胞的方法,所述方法包括以下步骤:

a)将重组DNA构建物引入酵母细胞中,所述构建物包含选自以下的异源多核苷酸:

i)包含SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体的核酸分子;和

ii)与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体具有至少80%序列同一性的核酸分子;和

b)表达选自以下的异源多肽:i)SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17中所列的氨基酸序列或其生物活性部分;和

ii)与SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQID NO:13,SEQ ID NO:15或SEQ ID NO:17中所列的氨基酸序列或其生物活性部分具有至少80%序列同一性的多肽;和

c)在用于增加脂质产量的条件下培养酵母细胞。

在某些实施方式中,所述酵母细胞是解脂耶氏酵母菌株。

在某些实施方式中,所述多核苷酸选自与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16和SEQ ID NO:18中所列的核苷酸序列具有至少95%序列同一性的核酸分子。

在某些实施方式中,所述多核苷酸选自SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10。

在某些实施方式中,所述多肽选自与SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15和SEQ ID NO:17中所列的氨基酸序列具有至少95%序列同一性的多肽。

在某些实施方式中,所述多肽选自SEQ ID NO:5,SEQ ID NO:7和SEQ ID NO:9。

本发明的另一方面涉及包含选自以下的异源多核苷酸的分离的宿主细胞:

a)包含SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体的核酸分子;和

b)包含与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体具有至少80%序列同一性的核苷酸序列的核酸分子。

在某些实施方式中,所述多核苷酸选自与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16和SEQ ID NO:18中所列的核苷酸序列具有至少95%序列同一性的核酸分子。

在某些实施方式中,所述多核苷酸选自SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10。

在某些实施方式中,所述分离的宿主细胞是酵母或真菌。

在某些实施方式中,所述分离的宿主细胞是酵母,且所述酵母是产油和/或耐高温的。

在某些实施方式中,所述酵母是产油酵母细胞,且所述产油酵母细胞选自圆红冬孢酵母、Rhodosporidium babjevae、海洋红酵母(Rhodosporidium paludigenum)、斯达油脂酵母、子囊菌油脂酵母(Lipomyces tetrasporus)、产油油脂酵母(Lipomyces lipofer)、弯曲隐球酵母(Cryptococcus curvatus)、浅白隐球酵母(Cryptococcus albidus)、地生隐球酵母(Cryptococcus terreus)、Cryptococcus ramirezgomezianus、威氏隐球酵母(Cryptococcus wieringae)、粘红酵母(Rhodotorula glutinis)、胶红酵母(Rhodotorulamucilaginosa)、皮状丝孢酵母(Trichosporon cutaneum)、刺孢小克银汉霉(Cunninghamella echinulata)、深黄被孢霉(Mortierella isabellina)、发酵性丝孢酵母(Trichosporon fermentans)、山茶小克银汉霉(Cunninghamella japonica)、裂殖壶菌、少根根霉(Rhizopus arrhizus)、土曲霉、麦角菌、Leucosporidiella creatinivora、Tremella enchepala、解脂耶氏酵母和左氏无绿藻(Prototheca zopfii)。

在某些实施方式中,所述产油酵母细胞是解脂耶氏酵母。

在某些实施方式中,所述分离的宿主细胞是产油的、耐高温酵母细胞,且所述产油的、耐高温酵母细胞是Arxula adeniovorans。

在某些实施方式中,所述分离的宿主细胞是耐高温酵母细胞,且所述耐高温酵母细胞是马克斯克鲁维酵母(Kluyveromyces marxianus)。

在某些实施方式中,本发明涉及由本文描述的经修饰的宿主细胞生产的产物。

在某些实施方式中,所述产物是油、脂质或三酰甘油。

本发明的另一方面涉及增加转化的宿主细胞中的脂质含量的方法,所述方法包括:

a)提供转化的宿主细胞,其包含:

i.选自以下的异源多核苷酸:

1.SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体;和

2.与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQID NO:14,SEQ ID NO:16或SEQ ID NO:18中所列的核苷酸序列或其补体具有至少80%序列同一性的核苷酸分子;

其中所述多核苷酸编码选自以下的DGA1多肽:i)SEQ ID NO:3,SEQ ID NO:5,SEQID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17中所列的氨基酸序列或其生物活性部分;和ii)与SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17中所列的氨基酸序列或其生物活性部分具有至少80%序列同一性的多肽;

b)在由此表达编码DGA1多肽的核酸分子的条件下使步骤(a)的细胞生长,导致脂质的产生;和

c)回收步骤(b)的脂质。

在某些实施方式中,所述宿主细胞是解脂耶氏酵母。

在某些实施方式中,所述多核苷酸选自与SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16和SEQ ID NO:18中所列的核苷酸序列具有至少95%序列同一性的核酸分子。

在某些实施方式中,所述多核苷酸选自SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10。

在某些实施方式中,所述多肽选自与SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15和SEQ ID NO:17中所列的氨基酸序列具有至少95%序列同一性的多肽。

在某些实施方式中,所述多肽选自SEQ ID NO:5,SEQ ID NO:7和SEQ ID NO:9。

在某些实施方式中,所述分离的宿主细胞在选自葡萄糖、乙醇、木糖、蔗糖、淀粉、淀粉糊精、甘油、纤维素和乙酸的基质的存在下生长。

在某些实施方式中,本发明涉及由增加转化的宿主细胞中的脂质含量的方法生产的产物。

在某些实施方式中,所述产物是油、脂质或三酰甘油。

本领域技术人员将容易理解本发明很好地适于实现目标和获得所提及的结果(ends)和优势,以及其中蕴含的那些。本文描述的实施方式不意欲作为对于本发明范围的限制。

本发明的这些和其它特征、方面和优势将参考以下说明书、附图和权利要求书而变得更好理解。

附图简述

图1显示用于超量表达解脂耶氏酵母菌株NS18(获自ARSCulture Collection,NRRL#YB 392)中的NG66基因的pNC243构建物的图谱。载体pNC243在转化前通过PacI/NotI限制酶切消化线性化。“2u ori”代表从2μ圆形质粒开始的酿酒酵母(S.cerevisiae)复制起点;“pMB1 ori”代表从pBR322质粒开始的大肠杆菌(E.coli)复制起点;“AmpR”代表用作用氨苄西林选择的标志物的bla基因;“PR2”代表解脂耶氏酵母GPD1启动子-931至-1;“NG66”代表通过GenScript合成的天然圆红冬孢酵母DGA1cDNA;“TER1”代表停止之后的解脂耶氏酵母CYC1终止子300bp;“PR22”代表酿酒酵母TEF1启动子-412至-1;“NG3”代表用作用诺尔斯菌素选择的标志物的诺尔斯链霉菌(Streptomyces noursei)Nat1基因;“TER2”代表停止之后的酿酒酵母CYC1终止子275bp;和“Sc URA3”代表用于在酵母中选择的酿酒酵母URA3营养缺陷型标志物。

图2显示具有随机整合的DGA1基因的NS18转化体的96-孔板脂质分析的结果。所述DGA1基因描述于表2中。解脂耶氏酵母NS18菌株用作亲本菌株。用于将DGA1基因随机整合至NS18基因组中的表达构建物显示于图1。图1显示具有NG66的表达构建物pNC243。用于所有其它DGA1基因的表达构建物与pNC243相同,除了DGA1ORF以外。对于各构建物,通过脂质分析来分析8个转化体。“亲本”菌株NS18一式两份进行分析,并显示具有标准偏差的结果。如实施例4中所述进行脂质分析。使细胞在96-孔板中在诱导脂质产生的介质中生长72小时之后分析样品。结果显示在图2中。

图3显示具有随机整合的NG15基因(NS249菌株)和NG66基因的NS18转化体的摇瓶脂质分析的结果。NS249通过脂质分析被选为50个筛选的转化体中的最佳NS18+NS15转化体(数据未显示)。8个NS18+NG66转化体通过脂质分析从80个筛选的转化体中选出(数据未显示)。用于将DGA1基因随机整合至NS18基因组中的表达构建物显示于图1中。图1显示具有NG66的表达构建物pNC243。用于NG15基因的表达构建物(pNC201)与pNC243相同,除了DGA1ORF以外。NS249菌株一式两份进行分析,并显示具有标准偏差的结果。如实施例4中所述进行脂质分析。使细胞在摇瓶中在诱导脂质产生的介质中生长72小时之后分析样品。通过标准HPLC方法测量相同样品中的葡萄糖。结果显示在图3中。

发明详述

本文提供的定义和/或方法指导本领域普通技术人员实践本发明。除了另外说明的地方以外,应当根据相关领域普通技术人员的常规用法来理解术语。到发现任何定义和/或方法与本文并入的任何专利或非专利参考或任何在别处发现的参考中提供的任何定义和/或方法不一致的程度,应当理解本文将使用在本申请中已明确提供/采用的所述定义和/或方法。单数形式“一”("a","an")和“所述”("the")包括复数指代,除非上下文另外清楚地指出。类似地,单词“或”意欲包括“和”,除非上下文另外清楚地指出。因此,“包含A或B”意为包括A,或B,或A和B。进一步应理解针对核酸或多肽给出的所有碱基尺寸或氨基酸尺寸,和所有分子重量或分子质量值均为近似值,并且提供其用于描述。尽管与本文描述的那些类似或等价的方法和材料可用于本公开的实践或测试,合适的方法和材料描述如下。

本发明涉及在宿主细胞(例如酵母和真菌)中超量表达编码衍生自圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉或麦角菌的DGA1和衍生自其中的相应的多肽的多核苷酸。所述酵母宿主细胞特征在于它们是产油和/或耐高温的。本文描述的是解脂耶氏酵母的改造的重组宿主细胞,其包含编码DGA1蛋白或其功能活性部分的异源DGA1多核苷酸,具有增加脂质产量的能力并具有提高的葡萄糖效率的特征。任何宿主细胞可用的菌株,例如解脂耶氏酵母,均可用于本发明方法。所述重组宿主细胞可繁殖以生产商业量的脂质。

在本申请的上下文中,贯穿说明书使用的若干术语具有所指出的意义,除非明确指出其具有不同的意义。

如本文使用的,“生物活性部分”可指具有用于在酵母中将酰基-CoA和1,2-二酰基甘油转化成TAG和CoA的生物活性的DGA1的片段。DGA1的生物活性部分包括肽或多肽,所述肽或多肽包含与DGA1蛋白的氨基酸序列足够相同或衍生自DGA1蛋白的氨基酸序列的氨基酸序列,例如SEQ ID NO:3,5,7,9,11,13,15或17中所列的氨基酸序列,其包括比全长DGA1少的氨基酸,并展现DGA1蛋白的至少一种活性。典型地,生物活性部分包含具有将酰基-CoA和1,2-二酰基甘油转化成TAG和CoA的催化活性的结构域或基元。DGA1蛋白的生物活性部分可为例如,278个氨基酸长度的多肽。

所述DGA1可具有SEQ ID NO:3,5,7,9,11,13,15或17中所列的氨基酸序列。在其它实施方式中,所述DGA1与SEQ ID NO:3,5,7,9,11,13,15或17基本相同,并保留SEQ ID NO:3,5,7,9,11,13,15或17的蛋白的功能活性,而由于天然等位基因变异或诱变在氨基酸序列上不同。在另一实施方式中,所述DGA1蛋白包含与SEQ ID NO:1,3,5,7,9,11,13,15或17至少约80%,82%,84%,85%,87%,88%,90%,92%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%或更多相同的氨基酸序列。

所述DGA1多肽可包含保守型置换、缺失或插入,同时仍然维持功能DGA1活性。保守型置换表在本领域中是众所周知的(参见,例如,Creighton(1984)Proteins.W.H.Freemanand Company(编)和下表3)。

表3:保守型氨基酸置换的实例

氨基酸置换、缺失和/或插入可容易地使用本领域中众所周知的肽合成技术(例如固相肽合成和/或任何其它合成技术)或通过重组DNA操纵来获得。用于操纵DNA序列以产生蛋白的置换、插入或缺失变异的方法在本领域中是众所周知的。例如,用于在DNA中的预定位点上制造置换突变的技术对于本领域技术人员是众所周知的,并包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、快速变化定点诱变(Stratagene,San Diego,CA)、PCR-介导的定点诱变或其它定点诱变方案。

为了确定两个氨基酸序列或两个核酸序列的百分比同一性,可将所述序列进行比对用于最佳比较目的(例如,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位用于最佳比对,并可忽视不同的序列用于比较目的)。用于比较目的比对的参考序列的长度可为该参考序列长度的至少95%。随后可比较在相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的一个位置被与第二序列中的相应位置相同的氨基酸残基或核苷酸占据时,那么分子在那个位置处是相同的(如本文使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的百分比同一性是由所述序列共享的相同位置数量的函数,考虑到空位数量和各空位的长度,需要引入所述空位用于两个序列的最佳比对。

序列的比较和两个序列之间的百分比同一性的确定可使用数学算法来完成。在一个实施方式中,两个氨基酸序列之间的百分比同一性可使用Needleman和Wunsch(J.Mol.Biol.48:444-453(1970))算法来确定,所述算法已并入GCG软件包(可获自http://www.gcg.com)中的GAP程序,其使用Blosum 62矩阵或PAM250矩阵,和16,14,12,10,8,6或4的空位权重(gap weight)以及1,2,3,4,5或6的长度权重(length weight)。在另一实施方式中,两个核苷酸序列之间的百分比同一性可使用GCG软件包(可获自http://www.gcg.com)中的GAP程序来确定,其使用NWSgapdna.CMP矩阵和40,50,60,70或80的空位权重以及1,2,3,4,5或6的长度权重。在另一实施方式中,两个氨基酸或核苷酸序列之间的百分比同一性可使用E.Meyers和W.Miller(Comput.Appl.Biosci.4:11-17(1988))的算法来确定,所述算法已并入ALIGN程序(2.0或2.0U版本),其使用PAM120权重残基表(weightresidue table),12的空位长度罚分(gap length penalty)和4的空位罚分(gappenalty)。

可用于确定两个序列之间的同一性的示例性计算机程序包括,但不限于,BLAST程序套件,例如BLASTN、BLASTX和TBLASTX、BLASTP和TBLASTN,可公开获自www.ncbi.nlm.nih.gov/BLAST。

当相对GenBank DNA Sequences和其它公共数据库中的核酸序列来评价给定的核酸序列时,通常使用BLASTN程序进行序列搜索。所述BLASTX程序有效用于搜索核酸序列,所述序列已相对GenBank Protein Sequences和其它公共数据库中的氨基酸序列在所有阅读框中被翻译。

使用,例如,CLUSTAL-W程序进行所选序列的比对以确定两个或更多个序列之间的“%同一性”。

“编码序列”或“编码区域”是指当序列被表达时,具有产生蛋白产物,例如氨基酸或多肽所必需的序列信息的核酸分子。所述编码序列可包含在翻译区内的非翻译序列(包括内含子或5'或3'非翻译区)和/或由其组成,或可缺乏此类插入的非翻译序列(例如,在cDNA中)。

贯穿本说明书的用于指包含核苷酸序列和/或由核苷酸序列组成的核酸的缩写是常规的单字母缩写。因此当包括在核酸中时,天然存在的编码核苷酸缩写如下:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。同样,除非另外规定,否则本文呈现的核酸序列是5'→3'方向。

如本文使用的,术语“互补的”及其派生词关于核酸通过众所周知的规则(A与T或U配对和C与G配对)进行配对来使用。补体可为“部分的”或“完全的”。在部分补体中,仅一些核酸碱基根据碱基配对规则进行匹配;而在完全或全部补体中,所有碱基都根据配对规则进行匹配。核酸链之间补体的程度可对如本领域中众所周知的核酸链之间杂化的效率和强度具有显著效果。所述杂化的效率和强度取决于检测方法。

如本文使用的,“DGA1”意为二酰基甘油酰基转移酶2型(DGAT2)。DGA1是一种整合膜蛋白,其催化植物、真菌和哺乳动物中油生物合成和的三酰甘油产生中的最后酶步骤。所述DGA1可在改变产油有机体的油中产生的长链多不饱和脂肪酸的量方面起关键作用。DGA1涉及酰基辅酶A:胆固醇酰基转移酶("ACAT")。该酶负责将酰基从酰基辅酶A转移至1,2-二酰基甘油("DAG")的sn-3位以形成三酰甘油("TAG")(由此涉及TAG生物合成的最终步骤)。DGA1与植物和真菌,特别是油籽中的膜和脂质体部分相关,其中DGA1有助于用作能量储备的碳的储存。TAG据信是用于细胞中能量储存的重要的化学物质。DGA1已知为调节TAG结构并指导TAG合成。

所述DGA1多核苷酸和多肽序列可衍生自高度产油有机体,所述有机体具有非常高的、天然水平的脂质累积。(Sitepu等人,2013;Liang等人,2013;Ageitos等人,2011;Papanikolaou等人,2011;Pan等人,2009;Ratledge等人,2002;Kaneko等人,1976)。具有报道的约50%及以上的脂质含量的有机体的清单显示于表1中。圆红冬孢酵母和斯达油脂酵母具有最高的脂质含量。在表1中的有机体中,仅5种具有可公开获得的DGA1序列(表1中以粗体显示)。使用来自5种所选供体:圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉和麦角菌的DGA1。

表1.具有报道的约50%及以上的脂质含量的产油真菌的清单(Sitepu等人,2013;Liang等人,2013;Ageitos等人,2011;Papanikolaou等人,2011;Pan等人,2009;Ratledge等人,2002;Kaneko等人,1977)。具有可公开获得的DGA1基因的序列的有机体以粗体显示。

如本文使用的,术语“结构域”是指在沿着进化相关蛋白的序列比对的特定位置处保守的一组氨基酸。虽然在其它位置处的氨基酸可在同系物之间变化,但是在特定位置处高度保守的氨基酸表明可能在蛋白质的结构、稳定性或功能中必需的氨基酸。通过它们在一族蛋白同系物的比对序列中的高保守度来鉴定,它们可用作确定考虑中的任何多肽是否属于之前鉴定的多肽家族的鉴定物。

如本文使用的,术语“基因”可包括含有内含子的DGA1的基因组序列,特别是编码将酰基-CoA和1,2-二酰基甘油转化成TAG和CoA的催化活性中所涉及的DGA1的多肽序列的多核苷酸序列。该术语进一步包括不是衍生自基因组序列的合成核酸。在某些实施方式中,所述DGA1基因缺乏内含子,因为它们是基于已知的cDNA的DNA序列和蛋白序列合成的。在其它实施方式中,所述DGA1基因是合成的、非原生的cDNA,其中密码子已基于密码子使用针对解脂耶氏酵母中的表达进行优化。该术语可进一步包括包含上游、下游和/或内含子核苷酸序列的核酸分子。

高度产油有机体的基因组数据可获自圆红冬孢酵母(Kumar S等人,Genomesequence of the oleaginous red yeast Rhodosporidium toruloides MTCC457.Eukaryot Cell.2012年8月;11(8):1083-4)和斯达油脂酵母(http://genome.jgi-psf.org/)。DGA1序列可使用BLAST或注释为“二酰基甘油酰基转移酶”的基因基于与解脂耶氏酵母DGA1的同源性进行鉴定。

如本文使用的,术语“异源的”是指DGA1多核苷酸或多肽,其不同于其中引入DGA1多核苷酸或产生多肽的宿主细胞。例如,本发明的分离的宿主细胞通过将来自一个属的DGA1多核苷酸引入具有与DGA1多核苷酸不同属的宿主细胞中来产生。所述DGA1多核苷酸可为合成的或来自不同的种类,只要该多核苷酸对于宿主细胞而言是非原生的。

如本文使用的,术语“宿主细胞”包括任何细胞类型,其对于用包含本发明的异源多核苷酸和/或由其组成的核酸构建物或表达载体转化、转染、转导、表达等等敏感。合适的宿主细胞包括真菌、植物和酵母细胞。所述酵母细胞可具有产油和/或耐高温的特征。在某些实施方式中,所述宿主细胞可包含圆红冬孢酵母、R.babjevae、海洋红酵母、斯达油脂酵母、子囊菌油脂酵母、产油油脂酵母、弯曲隐球酵母、浅白隐球酵母、地生隐球酵母、C.ramirezgomezianus、威氏隐球酵母、粘红酵母、胶红酵母、皮状丝孢酵母、刺孢小克银汉霉、深黄被孢霉、发酵性丝孢酵母、山茶小克银汉霉、裂殖壶菌、少根根霉、土曲霉、麦角菌、L.creatinivora、T.enchepala、解脂耶氏酵母或左氏无绿藻。在某些实施方式中,所述酵母细胞是解脂耶氏酵母的任何菌株。在优选的实施方式中,所述酵母细胞是解脂耶氏酵母菌株NS18。本发明的重组解脂耶氏酵母宿主细胞适合用于制造脂质。所述重组解脂耶氏酵母宿主细胞可进一步通过增强的葡萄糖效率和增加的用于商业用途的脂质、油和TAG的产量来表征。

如本文使用的,术语“同源的”是指蛋白质包括肽、寡肽、多肽、蛋白质和酶,其相对于在研究中的未修饰蛋白具有氨基酸置换、缺失和/或插入并具有与它们衍生自的未修饰蛋白相类似的生物活性和功能活性。

“分离的”意为“通过人类之手”由天然状态改变。若组合物或物质在自然中存在,则如果其被从其原始环境中改变和/或移除,其被“分离”。例如,如本文所用的术语,天然存在于活酵母中的多核苷酸或多肽不是“分离的”,但是从其天然状态的共存材料中分离的相同多核苷酸或多肽是“分离的”。

如本文使用的,术语“基元”是指进化相关蛋白的序列中的短保守区域。基元常常是结构域的高度保守部分,但还可包括结构域的一小部分,或位于保守结构域的外部(若基元的所有氨基酸落在限定结构域的外部)。

存在用于鉴定结构域的专家数据库,例如SMART(Schultz等人,(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等人,(2002)Nucleic Acids Res 30,242-244),InterPro(Mulder等人,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher和Bairoch(1994),Ageneralized profile syntax for biomolecular sequences motifsand its function in automatic sequence interpretation.(In)ISMB-94;Proceedings2nd International Conference on Intelligent Systems for MolecularBiology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,编,第53-61页,AAAIPress,Menlo Park;Hulo等人,Nucl.Acids.Res.32:D134-D137,(2004)),或Pfam(Bateman等人,Nucleic Acids Research30(1):276-280(2002))。用于蛋白质序列的计算机模拟分析的一组工具可在ExPASy蛋白质组学服务器上获得(Swiss Institute ofBioinformatics(Gasteiger等人,ExPASy:The Proteomics Server for In-DepthProtein Knowledge and Analysis,Nucleic Acids Res.31:3784-3788(2003))。结构域或基元还可使用常规技术,例如通过序列比对进行鉴定。

术语“核酸构建物”或“DNA构建物”有时用于指可操作地连接至适当的调节序列并插入载体以用于转化细胞的一个或更多个编码序列。该术语可与术语“转化DNA”或“转基因”互换使用。

术语“可操作地连接”在本文中通常表示其中控制序列放置在相对于多核苷酸序列的编码序列的适当位置使得该控制序列指导多肽的编码序列的表达的构型。例如,当启动子影响编码序列的表达时,即,该编码序列在该启动子的转录控制下,其可与该编码序列可操作地连接。

如本文所使用的“多核苷酸”是核苷酸序列,例如全长或核酸片段。多核苷酸可为单链或双链RNA或DNA的聚合物,其任选地包含合成的、非天然的或改变的核苷酸碱基。以DNA的聚合物形式的多核苷酸可包含一个或更多个cDNA、基因组DNA、合成DNA的片段或其混合物/组合,或由其组成。本发明的分离的多核苷酸可包括衍生自SEQ ID NO:4,6,8,10,12,14,16,18或此类序列的补体的150种连接的核苷酸(上游和下游两者)中的至少一种。

本发明的一个实施方式是超量表达编码衍生自圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉、麦角菌或解脂耶氏酵母的DGA1多肽的多核苷酸的方法,所述多核苷酸包含在SEQ ID NO:4,6,8,10,12,14,16或18中所列的核苷酸序列和/或由其组成。相应地,被这些核苷酸序列编码的分别的DGA1多肽应当具有如在SEQ ID NO:3,5,7,9,11,13,15或17中所列的氨基酸序列并具有将酰基从酰基-辅酶A转移至1,2-二酰基甘油("DAG")的sn-3位以形成三酰甘油("TAG")的催化活性(由此涉及TAG生物合成的最终步骤)。

DGA1多核苷酸能够编码DGA1多肽,或其生物活性部分,并可包含核苷酸序列,该核苷酸序列与SEQ ID NO:2,4,6,8,10,12,14,16或18中所列的全长的核苷酸序列或其任何补体至少约80%,82%,84%,85%,87%,88%,90%,92%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%或更多相同。

根据本发明,在表2的SEQ ID NO:4,6,8,10,12,14,16或18或其任何补体中例示的分离的多核苷酸可使用分离自圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉、麦角菌或解脂耶氏酵母的酵母的总RNA、通过基因组DNA的保守区域的PCR扩增获得。在某些实施方式中,DGA1 cDNA通过GenScript合成。在其它实施方式中,DGA1的cDNA密码子针对在解脂耶氏酵母中表达进行优化并通过GenScript合成。通过本发明提供的多核苷酸还可用作预备材料用于具有使得酶在高要求过程中能够表现更佳的特征的新型DGA1酶的理性修饰或设计。

如本文使用的,“多肽”是通过肽键键合在一起的氨基酸的单线性链,并通常具有大于277个氨基酸长度的序列。在某些实施方式中,DGA1多肽包含如在SEQ ID NO:3,5,7,9,11,13,15,17中所列的氨基酸序列或其生物活性部分。所述DGA1多肽或其生物活性部分具有在酵母中将酰基-CoA和1,2-二酰基甘油转化成TAG和CoA的催化能力。

如本文使用的,术语“启动子”是指用于下游基因的直接转录的核酸序列。所述启动子将通常适于其中靶基因被表达的宿主细胞。启动子与其它转录和翻译调节核酸序列(也称为“控制序列”)一起对于表达给定基因是必要的。一般而言,所述转录和翻译调节序列包括,但不限于启动子序列、核糖体结合位点、转录起始和结束序列、翻译起始和结束序列以及增强子或激活因子序列。在某些实施方式中,所述启动子可为解脂耶氏酵母GPD1。

术语“合成的”意为由原生或天然状态进行化学、酶或重组改造的。若组合物或物质在自然中存在,则如果其被从其原始环境进行制造、改造或操纵或两者,其为“合成的”。例如,如本文所用的术语,天然存在于活酵母中的多核苷酸或多肽不是“合成的”,但是化学合成或重组改造的相同的多核苷酸或多肽是“合成的”。

如本文所使用的“终止子”是指在转录期间标记基因或转录单元的末端的核酸序列。所述序列通过引起RNA聚合酶停止转录和新合成的mRNA从转录复合物中释放来介导转录终止。在某些实施方式中,用于本发明的终止子衍生自酵母。在某些实施方式中,所述终止子是解脂耶氏酵母或酿酒酵母CYC1终止子。

“载体”通常是指复制子,例如质粒、噬菌体、黏粒、酵母或病毒,其可能可操作地插入另一核酸片段以便引起该片段的复制或表达。术语“载体”还意欲指核酸分子,其能够转运其连接的另一核酸。一类载体是“质粒”,其指其中可连接另外的DNA片段的环状双链DNA环。另一类载体是病毒载体,其中另外的DNA片段可连接到病毒基因组中。某些载体能够在它们被引入的宿主细胞中进行自主复制。可将其它载体在引入到宿主细胞中之后整合到宿主细胞的基因组中,并因此与宿主基因组一起被复制。此外,某些载体能够指导可操作连接它们的基因的表达。此类载体在本文中称作“重组表达载体”(或简单地,“表达载体”)。一般而言,重组DNA技术中利用的表达载体通常是质粒的形式。在本说明书中,“质粒”和“载体”可互换使用,因为质粒是载体的最常用形式。但是,本发明意欲包括此类其它形式的表达载体,其可提供等效功能。

用于本发明的目的,“转基因”("transgenic","transgene")或“重组”意为关于,例如,核酸序列、表达盒、DNA构建物或包含多核苷酸和/或由其组成的载体或用根据本发明的多核苷酸、表达盒或载体转化的有机体,通过重组方法产生所有那些构建,在所述方法中:(a)编码可用于本发明的方法的蛋白的多核苷酸或(b)与根据本发明的多核苷酸可操作地连接的基因控制序列,例如启动子或终止子,或(c)a)和b)不会位于它们的天然基因环境中或已通过重组方法修饰。

所述修饰可采取,例如,置换、添加、缺失、倒位或插入一个或更多个核苷酸残基的形式。天然基因环境应理解为表示原始酵母中的天然基因组或染色体座位或在基因组文库中的存在。在基因组文库的情况下,优选至少部分保留核酸序列的天然基因环境。所述环境在至少一侧上位于核酸序列的侧翼,并具有约50bp,优选约500bp的序列长度。天然存在的表达盒-例如核酸序列的天然启动子与相应的编码可用于本发明方法的多肽的核酸序列(如上所定义)的天然存在的组合-变成转基因表达盒,当该表达盒通过非天然的、合成的(“人工的”)方法(诸如,例如诱变处理或重组克隆)修饰时。

用于本发明目的的转基因酵母因此理解为包括其中用于本发明方法的多核苷酸不处于它们在所述酵母的基因组中的天然座位的那些酵母,并因此该多核苷酸可能进行异源表达。但是,如所提到的,转基因还表示,当根据本发明或用于本发明方法的核酸处于它们在酵母的基因组中的天然位置时,所述序列已关于天然序列进行修饰,和/或已修饰天然序列的调节序列。转基因优选理解为表示根据本发明的多核苷酸在基因组中的非天然座位上的表达,或多核苷酸在非原生宿主细胞中的异源表达。

在一个实施方式中,公开了包含具有在SEQ ID NO:4,6,8,10,12,14,16或18中所列的核苷酸序列或其任何补体的多核苷酸和/或由其组成的重组DNA构建物,其中所述多核苷酸在宿主细胞中是可表达的,并且是可翻译的以产生解脂耶氏酵母的酵母细胞中的DGA1蛋白的同系物或生物活性部分。用于扩增和克隆来自圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉、麦角菌或解脂耶氏酵母的DGA1的过程在实施例1中进一步详述。重组DNA构建物可进一步包含可操作连接以增强多核苷酸模板的表达的启动子区域。在特异性启动子的转录控制下,可随后增强含有本发明的DGA1多核苷酸的重组DNA构建物内的编码区域的表达,导致更高的DGA1蛋白的产量。用于增加多核苷酸的表达的方法提供在定义部分中,并包括DGA1密码子的优化、内含子序列的引入或保留。重组DNA构建物可进一步包含用于转录调节的终止子序列,例如解脂耶氏酵母或酿酒酵母CYC1终止子。

如本文使用的,术语“转化”或“引入”包涵将外源多核苷酸转移至宿主细胞中,不考虑用于转移的方法。能够随后进行克隆繁殖的酵母可用本发明的基因构建物和由其产生的整个酵母来转化。可将多核苷酸瞬时或稳定地引入宿主细胞中,并可将其维持为非整合的,例如,作为质粒。或者,可将其整合到宿主基因组中。所得的转化的酵母细胞可随后进行繁殖并用于脂质的商业生产。

外源基因至酵母的基因组中的转移称为转化。

酵母种类的转化目前是一种相当常规的技术。有利地,数种转化方法中的任何种可用于将感兴趣的基因引入合适的祖细胞中。针对酵母细胞的转化描述的方法可用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔和增加游离DNA摄取的化学品、将DNA直接注入酵母细胞中、基因枪轰击和使用病毒或花粉进行转化以及显微映像。

通常在转化之后,针对一种或更多种标志物的存在选择酵母,所述标志物由用感兴趣的基因共转移的酵母可表达基因编码,接着将转化材料再生到整个酵母中。为了选择转化的酵母,使转化中获得的酵母经受选择性条件使得可将转化酵母与未转化酵母区分开来。例如,使用合适的选择剂(例如诺尔斯菌素(NAT))在YPD板上使转化酵母生长。随后,通过实施例3中描述的荧光染色脂质分析针对累积脂质的能力来筛选转化体。

在DNA转移和转化之后,也可评价推定转化的酵母克隆,例如使用Southern分析,针对感兴趣的基因的存在、拷贝数和/或基因组结构。替代地或另外,新引入的DNA的表达水平可使用Northern和/或Western分析来监控,上述两种技术均是本领域普通技术人员众所周知的。

具有增强的葡萄糖消耗效率和增加的脂质产量的转化酵母细胞可通过包括以下的方法来产生:(i)在酵母细胞中引入和表达DGA1多肽编码核酸或包含DGA1多肽编码核酸和/或由其组成的基因DNA构建物;和(ii)在促进生长和脂质产生的条件下培养酵母细胞。在某些实施方式中,在培养步骤期间添加外源脂肪酸、葡萄糖、乙醇、木糖、蔗糖、淀粉、淀粉糊精、甘油、纤维素或乙酸,其可增加脂质产量。此类脂肪酸可包括硬脂酸、油酸、亚油酸、γ-亚油酸、二高-γ-亚油酸、花生四烯酸、α-亚油酸、十八碳四烯酸、二十碳四烯酸、二十碳五烯酸、二十二碳五烯酸、二十碳二烯酸或二十碳三烯酸。在某些实施方式中,所述生长条件在实施例4中陈述。

如本文使用的,术语“增加的表达”或“超量表达”是指除了使用原生的解脂耶氏酵母DGA1在其原生的解脂耶氏酵母宿主中的原始野生型表达水平之外的任何形式的表达。为进一步在本发明的宿主细胞中补充增加的脂质酵母,可利用另外的方法来进一步增加DGA1蛋白的表达。此类方法充分记载于本领域中并包括,例如,通过适当的启动子驱动的超量表达、转录增强子或翻译增强子的使用。可在非异源形式的多核苷酸的适当位置(通常在上游)中引入用作启动子或增强子元件的分离的核酸,以便正调节编码感兴趣的多肽的核酸的表达。例如,内源启动子可通过突变、缺失和/或置换在体内改变,或者分离的启动子可与本发明的DGA1多核苷酸呈适当取向和距离被引入酵母细胞中,以便控制DGA1多核苷酸的表达。

还可将内含子序列添加至5'非翻译区(UTR)或保留在全长或部分编码序列的编码序列中以增加在细胞溶质中累积的成熟信息的量。将可剪接的内含子3’或5’包含到表达构建物中的转录单元中已显示在mRNA和蛋白质水平两者上使基因表达增至高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等人,(1987)Genes Dev1:1183-1200)。

本发明进一步提供增加转化的解脂耶氏酵母宿主细胞中的脂质含量的方法,该方法包括以下步骤或由其组成,在酵母细胞中引入和表达多核苷酸,所述多核苷酸具有SEQID NO:4,6,8,10,12,14,16或18中所列的核苷酸序列或其任何补体,能够编码具有SEQ IDNO:3,5,7,9,11,13,15或17中所列的氨基酸序列或其生物活性部分的DGA1多肽。所述转化的解脂耶氏酵母宿主细胞可包含核苷酸序列,其与SEQ ID NO:4,6,8,10,12,14,16或18中所列的核苷酸序列或其任何补体的整个长度至少约80%,82%,84%,85%,87%,88%,90%,92%,95%,96%,97%,98%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%或更多相同。

本说明书通过以下实施例进一步说明,其不应当解释为以任何方式进行限制。由此明确通过引用并入所有引用的参考(包括文献参考、已授权专利、公开的专利申请和如贯穿本申请引用的GenBank登记号)的内容。当通过引用并入本文的文件中的术语定义与本文所使用的那些相冲突时,以本文所使用的定义为准。

实施例

实施例1:DGA1多核苷酸和多肽的鉴定

为了测试来自高度产油有机体的DGA1可显著增加解脂耶氏酵母中的脂质产量的假设,回顾了据报道为具有非常高的脂质累积水平的有机体。(Sitepu等人,2013;Liang等人,2013;Ageitos等人,2011;Papanikolaou等人,2011;Pan等人,2009;Ratledge等人,2002;Kaneko等人,1976)。具有约50%及以上的报道脂质含量的有机体的清单显示在表1中。圆红冬孢酵母和斯达油脂酵母据报道具有最高脂质含量。在表1中的有机体中,仅5种具有可公开获得的DGA1基因的序列(在表1中为粗体)。因此使来自5种所选供体(圆红冬孢酵母、斯达油脂酵母、裂殖壶菌、土曲霉和麦角菌)的DGA1基因在解脂耶氏酵母启动子和终止子的控制下在解脂耶氏酵母中表达。用于解脂耶氏酵母(包括用作对照的原生解脂耶氏酵母DGA1)中的超量表达的DGA1序列描述于表2中。对于圆红冬孢酵母,在解脂耶氏酵母中表达三种版本的DGA1基因:1)NG49–从圆红冬孢酵母基因组DNA扩增的原生圆红冬孢酵母DGA1基因(SEQ ID NO:2);2)NG66–含有圆红冬孢酵母DGA1 cDNA而没有内含子的合成基因(SEQID NO:6);和3)NG67–含有圆红冬孢酵母DGA1 cDNA而没有为在解脂耶氏酵母中的表达而优化的内含子密码子的合成基因(SEQ ID NO:8)。对于斯达油脂酵母,在解脂耶氏酵母中表达两种版本的DGA1基因:1)NG68–含有斯达油脂酵母DGA1 cDNA而没有内含子的合成基因(SEQID NO:10);和2)NG69–含有斯达油脂酵母DGA1 cDNA而没有为在解脂耶氏酵母中的表达而优化的内含子密码子的合成基因(SEQ ID NO:12)。对于裂殖壶菌、土曲霉和麦角菌,在解脂耶氏酵母中表达编码cDNA而没有为在解脂耶氏酵母中表达而优化的内含子密码子的合成DGA1基因(SEQ ID NO:14,16和18)。

表2.本文所使用的DGA1基因和表达构建物的表征。用于表达DGA1基因的表达构建物的图谱显示在图1中,使用NG66作为示例。用于所有其它DGA1基因的构建物均相同,除了DGA1 ORF以外。

基因ID:NG15

表达构建物ID:pNC201

供体有机体:解脂耶氏酵母

基因:DGA1

功能:二酰基甘油酰基转移酶

序列来源:KEGG数据库YALI0E32769g

DNA来源:由解脂耶氏酵母NRRL YB-437的gDNA扩增

蛋白质序列(SEQ ID NO:1):

MTIDSQYYKSRDKNDTAPKIAGIRYAPLSTPLLNRCETFSLVWHIFSIPTFLTIFMLCCAIPLLWPFVIAYVVYAVKDDSPSNGGVVKRYSPISRNFFIWKLFGRYFPITLHKTVDLEPTHTYYPLDVQEYHLIAERYWPQNKYLRAIITTIEYFLPAFMKRSLSINEQEQPAERDPLLSPVSPSSPGSQPDKWINHDSRYSRGESSGSNGHASGSELNGNGNNGTTNRRPLSSASAGSTASDSTLLNGSLNSYANQIIGENDPQLSPTKLKPTGRKYIFGYHPHGIIGMGAFGGIATEGAGWSKLFPGIPVSLMTLTNNFRVPLYREYLMSLGVASVSKKSCKALLKRNQSICIVVGGAQESLLARPGVMDLVLLKRKGFVRLGMEVGNVALVPIMAFGENDLYDQVSNDKSSKLYRFQQFVKNFLGFTLPLMHARGVFNYDVGLVPYRRPVNIVVGSPIDLPYLPHPTDEEVSEYHDRYIAELQRIYNEHKDEYFIDWTEEGKGAPEFRMIE

DNA序列(SEQ ID NO:2):

ATGACTATCGACTCACAATACTACAAGTCGCGAGACAAAAACGACACGGCACCCAAAATCGCGGGAATCCGATATGCCCCGCTATCGACACCATTACTCAACCGATGTGAGACCTTCTCTCTGGTCTGGCACATTTTCAGCATTCCCACTTTCCTCACAATTTTCATGCTATGCTGCGCAATTCCACTGCTCTGGCCATTTGTGATTGCGTATGTAGTGTACGCTGTTAAAGACGACTCCCCGTCCAACGGAGGAGTGGTCAAGCGATACTCGCCTATTTCAAGAAACTTCTTCATCTGGAAGCTCTTTGGCCGCTACTTCCCCATAACTCTGCACAAGACGGTGGATCTGGAGCCCACGCACACATACTACCCTCTGGACGTCCAGGAGTATCACCTGATTGCTGAGAGATACTGGCCGCAGAACAAGTACCTCCGAGCAATCATCaCCACCATCGAGTACTTTCTGCCCGCCTTCATGAAACGGTCTCTTTCTATCAACGAGCAGGAGCAGCCTGCCGAGCGAGATCCTCTCCTGTCTCCCGTTTCTCCCAGCTCTCCGGGTTCTCAACCTGACAAGTGGATTAACCACGACAGCAGATATAGCCGTGGAGAATCATCTGGCTCCAACGGCCACGCCTCGGGCTCCGAACTTAACGGCAACGGCAACAATGGCACCACTAACCGACGACCTTTGTCGTCCGCCTCTGCTGGCTCCACTGCATCTGATTCCACGCTTCTTAACGGGTCCCTCAACTCCTACGCCAACCAGATCATTGGCGAAAACGACCCACAGCTGTCGCCCACAAAACTCAAGCCCACTGGCAGAAAATACATCTTCGGCTACCACCCCCACGGCATTATCGGCATGGGAGCCTTTGGTGGAATTGCCACCGAGGGAGCTGGATGGTCCAAGCTCTTTCCGGGCATCCCTGTTTCTCTTATGACTCTCACCAACAACTTCCGAGTGCCTCTCTACAGAGAGTACCTCATGAGTCTGGGAGTCGCTTCTGTCTCCAAGAAGTCCTGCAAGGCCCTCCTCAAGCGAAACCAGTCTATCTGCATTGTCGTTGGTGGAGCACAGGAAAGTCTTCTGGCCAGACCCGGTGTCATGGACCTGGTGCTACTCAAGCGAAAGGGTTTTGTTCGACTTGGTATGGAGGTCGGAAATGTCGCCCTTGTTCCCATCATGGCCTTTGGTGAGAACGACCTCTATGACCAGGTTAGCAACGACAAGTCGTCCAAGCTGTACCGATTCCAGCAGTTTGTCAAGAACTTCCTTGGATTCACCCTTCCTTTGATGCATGCCCGAGGCGTCTTCAACTACGATGTCGGTCTTGTCCCCTACAGGCGACCCGTCAACATTGTGGTTGGTTCCCCCATTGACTTGCCTTATCTCCCACACCCCACCGACGAAGAAGTGTCCGAATACCACGACCGATACATCGCCGAGCTGCAGCGAATCTACAACGAGCACAAGGATGAATATTTCATCGATTGGACCGAGGAGGGCAAAGGAGCCCCAGAGTTCCGAATGATTGAGTAA

基因ID:NG49

表达构建物ID:pNC241

供体有机体:圆红冬孢酵母

基因:DGA1

功能:二酰基甘油酰基转移酶

序列来源:GenBankBAH85840.1

DNA来源:由圆红冬孢酵母NRRL Y-6987的gDNA扩增

蛋白质序列(SEQ ID NO:3):

MGQQATPEELYTRSEISKIKFAPFGVPRSRRLQTFSVFAWTTALPILLGVFFLLCSFPPLWPAVIAYLTWVFFIDQAPIHGGRAQSWLRKSRIWVWFAGYYPVSLIKSADLPPDRKYVFGYHPHGVIGMGAIANFATDATGFSTLFPGLNPHLLTLQSNFKLPLYRELLLALGICSVSMKSCQNILRQGPGSALTIVVGGAAESLSAHPGTADLTLKRRKGFIKLAIRQGADLVPVFSFGENDIFGQLRNERGTRLYKLQKRFQGVFGFTLPLFYGRGLFNYNVGLMPYRHPIVSVVGRPISVEQKDHPTTADLEEVQARYIAELKRIWEEYKDAYAKSRTRELNIIA

gDNA序列(SEQ ID NO:4):

ATGGGCCAGCAGGCGACGCCCGAGGAGCTATACACACGCTCAGAGATCTCCAAGATCAAGcaagtcgagccagctcttctcctcaccaccccacaacataccccgcagcccacgacagccctcccacagcacctgcagcctgctgaccagctcgagaacacccacagaTTCGCACCCTTTGGCGTCCCGCGGTCGCGCCGGCTGCAGACCTTCTCCGTCTTTGCCTGGACGACGGCACTGCCCATCCTACTCGGCGTCTTCTTCCTCCTCTGgtgcgtcaggcttggcgtgatctgagagtagcgggcggatcatctgacctgcttcttcgctgcagCTCGTTCCCACCGCTCTGGCCGGCTGTCATTGCCTACCTCACCTGGGTCTTTTTCATTGACCAGGCGCCGATTCACGGTGGACGGGCGCAGTCTTGGCTGCGGAAGAGTCGGATATGGGTCTGGTTTGCAGGATACTATCCCGTCaggtgcgtcctctttccaagcctgcgtctcgaggcctcgctcacggccaactcgcccgaccggctacctccgaactttccgtcaacAGCTTGATCAAGgtcagtctgcgcgtctctcgacttcagtgctctgtggaggagctgcgccattgggcccgacctgcggagggcctcaaaggacgatgccgctgacttcctttcctccgacagAGCGCCGACTTGCCGCCTGACCGGAAGTACGTCTTTGGCTACCACCCGCACGGCGTCATAGGCATGGGCGCCATCGCCAACTTCGCGACCGACGCAACCGGCTTCTCGACACTCTTCCCCGGCTTGAACCCTCACCTCCTCACCCTCCAAAGCAACTTCAAGCTCCCGCTCTACCGCGAGTTGCTGCTCGCTCTCGGCATATGCTCCGTCTCGATGAAGAGCTGTCAGAACATTCTGCGACAAGGTgagcggtatgcgcaagacgggcggtcaagcgtgaacgcagtgaacgagaagagctgaccttccgccttactccatccgtgcaggtCCTGGCTCGGCTCTCACTATCGTCGTCGGTGGCGCCGCCGAGAGCTTGAGTGCGCATCCCGGAACCGCCGATCTTACGCTCAAGCGACGAAAAGGCTTCATCAAACTCGCGATCCGGCAAGGCGCCGACCTTGTGCCCGTCTTTTCGTTCGGCGAGAACGACgtgcgcacgctctccgagtctctaaaccggaagcgaatgctgaccgctgcccaattctctctccagATCTTTGGCCAGCTGCGAAACGAGCGAGGAACGCGGCTGTACAAGTTGCAGAAGCGTTTCCAAGGCGTGTTTGGCTTCACCCTCCgtacgtctcaccgcgccgtcttgccgaactgctcgttcagtcgctcacgcagctttcactcgcgcagCTCTCTTCTACGGCCGGGGACTCTTCAACTgtgcgctcgagttcaccgcttcgccaacagcgaggaatgcctccgagtacagcccagctgacgccccatctcttctcatagACAACGTCGGATTGATGCCGTATCGCCATCCGATCGTCTCTGTCggtgtgaacccgctctgtcgctcctacctgcgttccttaggctgacaccactcgcgtcaaacaGTCGGTCGACCAATCTCGGTAGAGCAGAAGGACCACCCGACCACGGCGGACCTCGAAGAAGTTCAGGCGCGGTATATCGCAGAACTCAAGCGGtacgttccaagtcgtctgcctccgcttgccgcctcaaataagctgaggcgtgctgaccgtatctgccgaaccgtacagcATCTGGGAAGAATACAAGGACGCCTACGCCAAAAGTCGCACGCGGGAGCTCAATATTATCGCCTGA

基因ID:NG66

表达构建物ID:pNC243

供体有机体:圆红冬孢酵母

基因:DGA1

长度:348(氨基酸);1047(DNA)

功能:二酰基甘油酰基转移酶

序列来源:GenBankBAH85840.1

DNA来源:通过GenScript合成的原生cDNA

蛋白质序列(SEQ ID NO:5):

MGQQATPEELYTRSEISKIKFAPFGVPRSRRLQTFSVFAWTTALPILLGVFFLLCSFPPLWPAVIAYLTWVFFIDQAPIHGGRAQSWLRKSRIWVWFAGYYPVSLIKSADLPPDRKYVFGYHPHGVIGMGAIANFATDATGFSTLFPGLNPHLLTLQSNFKLPLYRELLLALGICSVSMKSCQNILRQGPGSALTIVVGGAAESLSAHPGTADLTLKRRKGFIKLAIRQGADLVPVFSFGENDIFGQLRNERGTRLYKLQKRFQGVFGFTLPLFYGRGLFNYNVGLMPYRHPIVSVVGRPISVEQKDHPTTADLEEVQARYIAELKRIWEEYKDAYAKSRTRELNIIA

DNA序列(SEQ ID NO:6):

ATGGGCCAGCAGGCGACGCCCGAGGAGCTATACACACGCTCAGAGATCTCCAAGATCAAGTTCGCACCCTTTGGCGTCCCGCGGTCGCGCCGGCTGCAGACCTTCTCCGTCTTTGCCTGGACGACGGCACTGCCCATCCTACTCGGCGTCTTCTTCCTCCTCTGCTCGTTCCCACCGCTCTGGCCGGCTGTCATTGCCTACCTCACCTGGGTCTTTTTCATTGACCAGGCGCCGATTCACGGTGGACGGGCGCAGTCTTGGCTGCGGAAGAGTCGGATATGGGTCTGGTTTGCAGGATACTATCCCGTCAGCTTGATCAAGAGCGCCGACTTGCCGCCTGACCGGAAGTACGTCTTTGGCTACCACCCGCACGGCGTCATAGGCATGGGCGCCATCGCCAACTTCGCGACCGACGCAACCGGCTTCTCGACACTCTTCCCCGGCTTGAACCCTCACCTCCTCACCCTCCAAAGCAACTTCAAGCTCCCGCTCTACCGCGAGTTGCTGCTCGCTCTCGGCATATGCTCCGTCTCGATGAAGAGCTGTCAGAACATTCTGCGACAAGGTCCTGGCTCGGCTCTCACTATCGTCGTCGGTGGCGCCGCCGAGAGCTTGAGTGCGCATCCCGGAACCGCCGATCTTACGCTCAAGCGACGAAAAGGCTTCATCAAACTCGCGATCCGGCAAGGCGCCGACCTTGTGCCCGTCTTTTCGTTCGGCGAGAACGACATCTTTGGCCAGCTGCGAAACGAGCGAGGAACGCGGCTGTACAAGTTGCAGAAGCGTTTCCAAGGCGTGTTTGGCTTCACCCTCCCTCTCTTCTACGGCCGGGGACTCTTCAACTACAACGTCGGATTGATGCCGTATCGCCATCCGATCGTCTCTGTCGTCGGTCGACCAATCTCGGTAGAGCAGAAGGACCACCCGACCACGGCGGACCTCGAAGAAGTTCAGGCGCGGTATATCGCAGAACTCAAGCGGATCTGGGAAGAATACAAGGACGCCTACGCCAAAAGTCGCACGCGGGAGCTCAATATTATCGCCTGA

基因ID:NG67

表达构建物ID:pNC244

供体有机体:圆红冬孢酵母

基因:DGA1

长度:348(氨基酸);1047(DNA)

功能:二酰基甘油酰基转移酶

序列来源:GenBankBAH85840.1

DNA来源:为在解脂耶氏酵母中表达而优化并通过GenScript合成的cDNA密码子

蛋白质序列(SEQ ID NO:7):

MGQQATPEELYTRSEISKIKFAPFGVPRSRRLQTFSVFAWTTALPILLGVFFLLCSFPPLWPAVIAYLTWVFFIDQAPIHGGRAQSWLRKSRIWVWFAGYYPVSLIKSADLPPDRKYVFGYHPHGVIGMGAIANFATDATGFSTLFPGLNPHLLTLQSNFKLPLYRELLLALGICSVSMKSCQNILRQGPGSALTIVVGGAAESLSAHPGTADLTLKRRKGFIKLAIRQGADLVPVFSFGENDIFGQLRNERGTRLYKLQKRFQGVFGFTLPLFYGRGLFNYNVGLMPYRHPIVSVVGRPISVEQKDHPTTADLEEVQARYIAELKRIWEEYKDAYAKSRTRELNIIA

DNA序列(SEQ ID NO:8):

ATGGGACAGCAGGCTACCCCCGAGGAGCTCTACACCCGATCCGAGATTTCTAAGATTAAGTTCGCCCCTTTTGGAGTGCCCCGATCCCGACGACTCCAGACCTTCTCCGTTTTTGCCTGGACCACTGCTCTGCCCATTCTGCTCGGCGTCTTCTTTCTGCTCTGCTCTTTCCCCCCTCTCTGGCCCGCCGTCATCGCTTACCTGACCTGGGTGTTCTTTATCGACCAGGCCCCTATTCACGGCGGTCGAGCTCAGTCCTGGCTGCGAAAGTCTCGAATTTGGGTTTGGTTCGCCGGTTACTACCCCGTCTCTCTCATCAAGTCGGCTGACCTGCCCCCTGATCGAAAGTACGTGTTCGGCTACCACCCTCATGGTGTTATCGGTATGGGAGCCATTGCTAACTTTGCCACCGATGCTACTGGTTTCTCCACCCTCTTTCCCGGACTGAACCCTCACCTGCTCACTCTCCAGTCTAACTTCAAGCTCCCCCTGTACCGAGAGCTGCTCCTGGCCCTGGGTATCTGCTCCGTCTCTATGAAGTCTTGTCAGAACATTCTCCGACAGGGACCTGGTTCGGCTCTGACCATCGTCGTGGGAGGAGCTGCTGAGTCGCTCTCCGCCCATCCTGGAACCGCTGACCTCACTCTGAAGCGACGAAAGGGCTTCATCAAGCTCGCCATTCGACAGGGTGCTGACCTGGTGCCCGTTTTCTCCTTTGGAGAGAACGATATTTTCGGCCAGCTGCGAAACGAGCGAGGAACCCGACTCTACAAGCTGCAGAAGCGATTTCAGGGTGTGTTCGGCTTCACCCTCCCTCTGTTCTACGGACGAGGCCTCTTTAACTACAACGTTGGACTGATGCCCTACCGACACCCTATCGTCTCGGTTGTCGGCCGACCCATTTCCGTGGAGCAGAAGGACCATCCTACCACTGCCGATCTCGAGGAGGTGCAGGCCCGATACATCGCTGAGCTGAAGCGAATTTGGGAGGAGTACAAGGACGCCTACGCTAAGTCTCGAACCCGAGAGCTGAACATCATTGCCTAA

基因ID:NG68

表达构建物ID:pNC245

供体有机体:斯达油脂酵母

基因:DGA1

长度:410(氨基酸);1233(DNA)

功能:二酰基甘油酰基转移酶

序列来源:http://genome.jgi-psf.org/

DNA来源:通过GenScript合成的原生cDNA

蛋白质序列(SEQ ID NO:9):

MSEKAEIEVPPQKSTFPRSVHFAPLHIPLERRLQTLAVLFHTVALPYCIGLFFLMLAFPPFWPLLVMYVIYAYGFDHSSSNGEISRRRSPLFRRLPLFRLYCDYFPIHIHREVPLEPTFPGRLREPSGLVERWIAKMFGVQDAVVEGNESDVKATANGNGTTKEIGPTYVFGYHPHGIVSLGAFGAIGTEGAGWEKLFPGIPVSLLTLETNFSLPFYREYLLSLGIASVSRRSCTNLLKHDQSICIVIGGAQESLLAEPGTLDLILVKRRGFVKLAMSTARVSDQPICLVPILSFGENDVYDQVRGDRSSKLYKIQTFIKKAAGFTLPLMYARGIFNYDFGLMPYRRQMTLVVGKPIAVPYVAQPTEAEIEVYHKQYMDELRRLWDTYKDDYFVDHKGKGVKNSEMRFVE

DNA序列(SEQ ID NO:10):

ATGAGTGAGAAGGCAGAGATCGAGGTTCCGCCGCAAAAATCGACATTCCCTCGCAGTGTGCACTTCGCTCCACTTCATATTCCACTGGAGAGACGCCTACAGACTTTGGCAGTCTTATTCCACACTGTCGCGCTACCATACTGCATCGGTCTGTTCTTTCTCATGCTCGCGTTCCCTCCTTTTTGGCCATTATTGGTAATGTATGTCATATACGCATACGGGTTCGACCACTCGAGCTCGAACGGAGAGATCTCCCGCCGGCGATCGCCGCTGTTTCGAAGACTCCCGTTGTTCAGGCTGTATTGTGATTACTTCCCCATCCACATTCACCGGGAGGTTCCGCTCGAGCCGACGTTTCCTGGTCGCCTTCGCGAACCGAGTGGCCTTGTCGAGCGGTGGATTGCGAAGATGTTCGGCGTGCAGGACGCTGTTGTCGAGGGAAATGAATCTGACGTTAAGGCCACGGCCAACGGCAATGGGACGACGAAAGAAATCGGACCGACGTATGTTTTCGGCTATCATCCGCATGGAATTGTTAGCTTGGGTGCGTTTGGTGCTATTGGTACGGAAGGCGCTGGATGGGAGAAGCTCTTTCCTGGGATCCCGGTGTCACTGCTGACTCTCGAAACAAATTTCAGCCTTCCATTTTACAGAGAGTATTTGCTGTCACTTGGGATTGCTTCAGTATCTCGACGGTCTTGTACCAATCTCCTCAAACACGACCAATCCATCTGCATCGTTATCGGCGGCGCCCAAGAGTCGCTCTTAGCGGAACCAGGCACTCTAGATCTGATCCTCGTTAAACGTCGCGGTTTTGTCAAACTTGCAATGTCAACGGCGCGGGTATCTGACCAACCGATTTGTCTTGTTCCGATCCTCAGTTTCGGCGAGAACGACGTGTACGACCAAGTCCGCGGGGACCGATCGTCGAAGTTGTATAAGATCCAGACTTTTATCAAGAAAGCGGCCGGGTTTACGCTACCATTGATGTATGCGCGCGGTATATTTAATTACGACTTTGGGCTGATGCCGTACCGCAGGCAAATGACGCTCGTGGTCGGCAAGCCGATTGCAGTGCCGTACGTGGCCCAGCCTACGGAGGCTGAAATCGAAGTGTATCACAAGCAGTACATGGATGAATTGAGGAGGTTATGGGACACGTATAAGGACGACTATTTTGTAGACCACAAGGGCAAGGGGGTCAAGAATTCCGAGATGCGTTTTGTGGAGTAA

基因ID:NG69

表达构建物ID:pNC270

供体有机体:斯达油脂酵母

基因:DGA1

长度:410(氨基酸);1233(DNA)

功能:二酰基甘油酰基转移酶

序列来源:http://genome.jgi-psf.org/

DNA来源:为在解脂耶氏酵母中表达而优化并通过GenScript合成的cDNA密码子

蛋白质序列(SEQ ID NO:11):

MSEKAEIEVPPQKSTFPRSVHFAPLHIPLERRLQTLAVLFHTVALPYCIGLFFLMLAFPPFWPLLVMYVIYAYGFDHSSSNGEISRRRSPLFRRLPLFRLYCDYFPIHIHREVPLEPTFPGRLREPSGLVERWIAKMFGVQDAVVEGNESDVKATANGNGTTKEIGPTYVFGYHPHGIVSLGAFGAIGTEGAGWEKLFPGIPVSLLTLETNFSLPFYREYLLSLGIASVSRRSCTNLLKHDQSICIVIGGAQESLLAEPGTLDLILVKRRGFVKLAMSTARVSDQPICLVPILSFGENDVYDQVRGDRSSKLYKIQTFIKKAAGFTLPLMYARGIFNYDFGLMPYRRQMTLVVGKPIAVPYVAQPTEAEIEVYHKQYMDELRRLWDTYKDDYFVDHKGKGVKNSEMRFVE

DNA序列(SEQ ID NO:12):

ATGTCCGAGAAGGCTGAGATTGAGGTGCCCCCCCAGAAGTCTACTTTCCCTCGATCCGTTCATTTCGCCCCCCTGCATATCCCCCTGGAGCGACGACTCCAGACCCTGGCTGTGCTCTTCCACACTGTTGCCCTGCCTTACTGCATCGGACTCTTCTTTCTGATGCTCGCTTTCCCCCCTTTTTGGCCCCTGCTCGTGATGTACGTTATCTACGCCTACGGATTCGACCATTCCTCTTCGAACGGCGAGATCTCTCGACGACGATCGCCTCTGTTCCGACGACTGCCCCTCTTTCGACTCTACTGTGATTACTTCCCTATCCACATTCATCGAGAGGTCCCCCTGGAGCCTACCTTTCCTGGTCGACTGCGAGAGCCTTCCGGACTCGTTGAGCGATGGATTGCTAAGATGTTCGGTGTCCAGGACGCCGTCGTGGAGGGAAACGAGTCTGATGTGAAGGCCACCGCTAACGGAAACGGCACCACTAAGGAGATCGGCCCTACTTACGTCTTCGGATACCACCCCCATGGCATTGTGTCCCTGGGAGCCTTTGGCGCTATCGGTACCGAGGGTGCTGGATGGGAGAAGCTCTTCCCTGGTATTCCCGTCTCGCTGCTCACCCTGGAGACTAACTTCTCCCTCCCCTTTTACCGAGAGTACCTGCTCTCTCTGGGAATCGCCTCGGTGTCCCGACGATCGTGCACCAACCTGCTCAAGCACGACCAGTCTATCTGTATTGTTATCGGAGGTGCTCAGGAGTCCCTGCTCGCTGAGCCTGGAACCCTGGACCTCATTCTGGTCAAGCGACGAGGCTTCGTGAAGCTGGCCATGTCCACTGCTCGAGTGTCTGATCAGCCTATTTGCCTGGTTCCCATCCTCTCTTTCGGCGAGAACGACGTTTACGATCAGGTCCGAGGTGACCGATCCTCTAAGCTGTACAAGATTCAGACCTTCATCAAGAAGGCCGCTGGCTTTACTCTCCCTCTGATGTACGCCCGAGGCATCTTCAACTACGACTTTGGTCTGATGCCCTACCGACGACAGATGACCCTCGTTGTCGGCAAGCCTATTGCCGTCCCCTACGTGGCTCAGCCCACTGAGGCCGAGATCGAGGTCTACCACAAGCAGTACATGGACGAGCTGCGACGACTCTGGGATACCTACAAGGACGATTACTTCGTTGACCATAAGGGCAAGGGTGTCAAGAACTCTGAGATGCGATTTGTGGAGTAA

基因ID:NG70

表达构建物ID:pNC246

供体有机体:土曲霉

基因:DGA1

长度:380(氨基酸);1143(DNA)

功能:二酰基甘油酰基转移酶

序列来源:GenBankXP_001211961.1

DNA来源:为在解脂耶氏酵母中表达而优化并通过GenScript合成的cDNA密码子

蛋白质序列(SEQ ID NO:13):

MPRNTHPPANNAGPNASHKKDRKRQGRLFQHTVPNKYSRIRWAPLNIGLERRLQTLVVLCHTLTIALFLAFFFFTCAIPLTWPLLFPYLVYITLFSTAPTSGTLKGRSDFLRSLPIWKLYTAYFPAKLHRSEPLLPTRKYIFGYHPHGIISHGAFAAFATDALGFSKLFPGITNTLLTLDSNFRIPFYREYAMAMGVASVSRESCENLLTKGGADGEGMGRAITIVVGGARESLDALPHTMRLVLKRRKGFIKLAIRTGADLVPVLAFGENDLYEQVRSDQHPLIYKVQMLVKRFLGFTVPLFHARGIFNYDVGLMPYRRPLNIVVGRPIQVVRQQDRDKIDDEYIDRLHAEYVRELESLWDQWKDVYAKDRISELEIVA

DNA序列(SEQ ID NO:14):

ATGCCCCGAAACACCCACCCCCCCGCCAACAACGCCGGACCTAACGCCTCTCACAAGAAGGACCGAAAGCGACAGGGACGACTCTTTCAGCACACCGTTCCTAACAAGTACTCTCGAATCCGATGGGCCCCCCTCAACATTGGCCTGGAGCGACGACTGCAGACCCTCGTCGTGCTGTGCCATACCCTCACTATCGCCCTGTTCCTCGCTTTCTTTTTCTTTACTTGTGCCATTCCCCTGACCTGGCCTCTGCTCTTCCCCTACCTCGTGTACATCACCCTGTTTTCGACCGCTCCTACTTCCGGTACCCTGAAGGGACGATCTGACTTCCTCCGATCGCTGCCTATTTGGAAGCTCTACACTGCCTACTTTCCCGCTAAGCTGCACCGATCCGAGCCTCTGCTCCCTACCCGAAAGTACATCTTCGGCTACCACCCCCATGGTATCATTTCCCATGGAGCCTTCGCCGCTTTTGCCACTGACGCTCTCGGCTTCTCTAAGCTGTTTCCTGGTATCACCAACACTCTGCTCACCCTGGATTCGAACTTCCGAATTCCCTTTTACCGAGAGTACGCCATGGCTATGGGAGTGGCTTCCGTTTCTCGAGAGTCGTGCGAGAACCTGCTCACTAAGGGAGGTGCTGACGGAGAGGGAATGGGCCGAGCTATCACCATTGTTGTCGGAGGCGCCCGAGAGTCCCTCGATGCTCTGCCTCACACTATGCGACTGGTCCTCAAGCGACGAAAGGGTTTCATCAAGCTGGCCATTCGAACCGGAGCTGACCTCGTTCCCGTCCTGGCCTTCGGCGAGAACGACCTCTACGAGCAGGTGCGATCTGATCAGCACCCTCTGATCTACAAGGTCCAGATGCTCGTGAAGCGATTCCTGGGTTTTACCGTGCCCCTGTTCCATGCTCGAGGAATTTTTAACTACGACGTTGGCCTCATGCCTTACCGACGACCCCTGAACATCGTGGTTGGTCGACCCATTCAGGTCGTGCGACAGCAGGACCGAGATAAGATCGACGATGAGTACATTGACCGACTCCACGCCGAGTACGTCCGAGAGCTCGAGTCCCTGTGGGACCAGTGGAAGGATGTTTACGCCAAGGACCGAATCTCTGAGCTGGAGATTGTCGCTTAA

基因ID:NG71

表达构建物ID:pNC247

供体有机体:麦角菌

基因:DGA1

长度:437(氨基酸);1314(DNA)

功能:二酰基甘油酰基转移酶

序列来源:GenBank CCE28309.1

DNA来源:为在解脂耶氏酵母中表达而优化并通过GenScript合成的cDNA密码子

蛋白质序列(SEQ ID NO:15):

MAAVQVARPVPPHHHDGAGREHKGERAHSPERGEKTVHNGYGLAETHEPLELNGSAVQDGKHDSDETITNGDYSPYPELDCGKERAAHEKEAWTAGGVRFAPLRVPFKRRMQTAAVLFHCMSIILISSCFWFSLANPITWPILVPYLVHLSLSNASTDGKLSYRSEWLRSLPLWRLFAGYFPAKLHKTFDLPPNRKYIFGYHPHGIISHGAWCAFATNALGFVEKFPGITNSLLTLDSNFRVPFYRDWILAMGIRSVSRESIRNILSKGGPDSNGQGRAVTIVIGGARESLEAQPGTLRLILQGRKGFIKVALRAGADLVPVIGFGENDLYDQLSPKTHPLVHKIQMFFLKVFKFTIPALHGRGLLNYDVGLLPYRRAVNIVVGRPIQIDETYGEQPPQEVIDRYHELYVQEVERLYAAYKEQFSNGKKTPELQILS

DNA序列(SEQ ID NO:16):

ATGGCTGCTGTTCAGGTTGCCCGACCCGTTCCCCCCCACCACCACGATGGCGCTGGCCGAGAGCACAAGGGAGAGCGAGCCCATTCCCCTGAGCGAGGAGAGAAGACCGTCCACAACGGCTACGGTCTGGCCGAGACTCATGAGCCCCTGGAGCTCAACGGTTCTGCTGTGCAGGACGGAAAGCACGACTCGGATGAGACCATCACTAACGGTGACTACTCTCCCTACCCTGAGCTCGATTGCGGAAAGGAGCGAGCCGCTCATGAGAAGGAGGCTTGGACCGCTGGAGGTGTGCGATTCGCTCCTCTGCGAGTTCCTTTTAAGCGACGAATGCAGACTGCCGCTGTCCTCTTCCACTGCATGTCCATCATTCTGATTTCCTCTTGTTTCTGGTTTTCTCTCGCCAACCCCATCACCTGGCCTATTCTCGTTCCCTACCTGGTCCACCTGTCGCTCTCCAACGCTTCTACTGACGGCAAGCTCTCCTACCGATCTGAGTGGCTGCGATCCCTGCCTCTCTGGCGACTGTTCGCCGGTTACTTTCCCGCTAAGCTCCACAAGACCTTCGATCTGCCCCCTAACCGAAAGTACATCTTTGGTTACCACCCCCATGGAATCATTTCCCATGGCGCCTGGTGTGCCTTCGCTACCAACGCTCTGGGCTTCGTTGAGAAGTTTCCTGGTATTACCAACTCGCTGCTCACTCTCGACTCCAACTTCCGAGTGCCCTTTTACCGAGATTGGATCCTGGCCATGGGCATTCGATCTGTTTCGCGAGAGTCTATCCGAAACATTCTCTCGAAGGGAGGACCTGACTCCAACGGACAGGGCCGAGCTGTGACCATCGTTATTGGTGGAGCCCGAGAGTCTCTGGAGGCTCAGCCCGGAACTCTGCGACTCATTCTGCAGGGCCGAAAGGGCTTCATTAAGGTGGCTCTCCGAGCTGGAGCTGACCTGGTTCCCGTCATCGGTTTCGGAGAGAACGACCTCTACGATCAGCTGTCCCCTAAGACCCACCCCCTCGTTCATAAGATCCAGATGTTCTTTCTGAAGGTCTTCAAGTTTACTATTCCTGCTCTGCACGGACGAGGTCTGCTCAACTACGACGTCGGTCTGCTCCCTTACCGACGAGCTGTGAACATCGTCGTGGGACGACCCATCCAGATTGACGAGACCTACGGCGAGCAGCCCCCTCAGGAGGTCATCGATCGATACCACGAGCTCTACGTCCAGGAGGTGGAGCGACTGTACGCCGCTTACAAGGAGCAGTTCTCGAACGGAAAGAAGACCCCCGAGCTCCAGATCCTGTCCTAA

基因ID:NG72

表达构建物ID:pNC248

供体有机体:裂殖壶菌

基因:DGA1

长度:351(氨基酸);1056(DNA)

功能:二酰基甘油酰基转移酶

序列来源:http://genome.jgi-psf.org/

DNA来源:为在解脂耶氏酵母中表达而优化并通过GenScript合成的cDNA密码子

蛋白质序列(SEQ ID NO:17):

MLAWMPVLIALPRRKQTAVVLLFVMLLPMIMVVYSWTLILLIFPLTTLPTLSYLIWIMYIDKSHETGKRKPFMRYWKMWRHFANYFPLRLIRTTPLDPRRKYVFCYHPHGIISLGAFGNFATDSTGFSRKFPGIDLRLLTLQINFYCPIIRELLLYMGLCSAAKKSCNQILQRGPGSAIMLVVGGAAESLDSQPGTYRLTLGRKGFVRVALDNGADLVPVLGFGENDVFDTVYLPPNSWARNVQEFVRKKLGFATPIFSGRGIFQYNMGLMPHRKPIIVVVGKPIKIPKIPDELKGRALSTTAEGVALVDKYHEKYVRALRELWNLYKEEYATEPKAAYLEPNSIRKNQNV

DNA序列(SEQ ID NO:18):

ATGCTCGCCTGGATGCCTGTCCTCATTGCCCTCCCCCGACGAAAGCAGACCGCTGTTGTTCTCCTGTTTGTGATGCTCCTCCCTATGATCATGGTCGTGTACTCCTGGACCCTGATCCTGCTCATTTTCCCCCTCACCACTCTGCCTACTCTCTCCTACCTGATCTGGATTATGTACATTGACAAGTCTCACGAGACCGGAAAGCGAAAGCCCTTTATGCGATACTGGAAGATGTGGCGACATTTCGCCAACTACTTTCCTCTCCGACTGATCCGAACCACTCCCCTGGACCCTCGACGAAAGTACGTGTTCTGCTACCACCCCCATGGCATCATTTCCCTCGGAGCCTTCGGCAACTTTGCTACCGACTCGACTGGCTTCTCCCGAAAGTTTCCCGGTATCGATCTGCGACTGCTCACCCTCCAGATTAACTTCTACTGTCCTATCATTCGAGAGCTGCTCCTGTACATGGGTCTGTGCTCTGCCGCTAAGAAGTCGTGTAACCAGATCCTCCAGCGAGGACCCGGCTCTGCTATTATGCTGGTTGTCGGCGGTGCCGCTGAGTCCCTCGACTCTCAGCCTGGCACCTACCGACTCACTCTGGGTCGAAAGGGATTCGTGCGAGTTGCCCTGGACAACGGTGCTGATCTGGTCCCCGTGCTCGGTTTCGGAGAGAACGACGTGTTTGATACCGTTTACCTGCCCCCTAACTCGTGGGCCCGAAACGTCCAGGAGTTCGTGCGAAAGAAGCTCGGATTCGCTACCCCCATCTTTTCCGGCCGAGGTATTTTTCAGTACAACATGGGTCTGATGCCCCACCGAAAGCCTATCATTGTGGTTGTCGGAAAGCCCATCAAGATTCCCAAGATCCCTGACGAGCTGAAGGGACGAGCCCTCTCTACCACTGCCGAGGGCGTTGCTCTGGTCGATAAGTACCATGAGAAGTACGTTCGAGCCCTCCGAGAGCTGTGGAACCTCTACAAGGAGGAGTACGCTACCGAGCCCAAGGCCGCTTACCTCGAGCCTAACTCGATTCGAAAGAACCAGAACGTCTAA

实施例2:具有增加的脂质产量的重组酵母宿主细胞

在相同的强解脂耶氏酵母GPD1启动子之下在解脂耶氏酵母中表达总共9种不同的DGA1基因(表2和图1)。图1显示用于圆红冬孢酵母DGA1基因NG66在解脂耶氏酵母中的超量表达的表达构建物pNC243。所有其它的DGA1表达构建物均与pNC243相同,除了在表2中描述的DGA1 ORF以外。DGA1表达构建物在转化前被PacI/NotI限制酶切消化线性化(图1)。线性表达构建物各自包括DGA1基因和Nat1基因的表达盒,所述Nat1基因用作用诺尔斯菌素(NAT)选择的标志物。使用如在Chen(Chen DC等人,One-step transformation of thedimorphic yeast Yarrowia lipolytica.Appl Microbiol Biotechnol.1997年8月;48(2):232-5.)中所述的转化方案将表达构建物随机整合到解脂耶氏酵母菌株NS18(获自ARSCulture Collection,NRRL#YB 392)的基因组中。在具有500μg/mLNAT的YPD板上选择转化体并通过下述的荧光染色脂质分析针对累积脂质的能力进行筛选。对于各表达构建物而言,分析8个转化体。脂质分析的结果显示在图2上。在该实验中,解脂耶氏酵母中的异源DGA1的存在不通过菌落PCR确认。对于大多数构建物而言,在转化体之间存在显著的菌落差异,可能是由于在一些仅获得功能Nat1盒的转化体中缺乏功能DGA1表达盒,或由于DGA1整合位点对于DGA1表达的负面影响。尽管如此,图2中的数据展示所有9种DGA1基因都对解脂耶氏酵母中的脂质含量具有显著的积极影响。与亲本菌株NS18相比较,在强启动子之下的原生解脂耶氏酵母DGA1的超量表达使通过细胞荧光测定的脂质含量增加约2倍。展示最高荧光的转化体(与NS18相比较约高3倍)通过圆红冬孢酵母DGA1(NG66,NG67)和斯达油脂酵母DGA1(NG68)的超量表达产生。最有效的DGA1基因来自被重复报道在其它产油酵母菌株中为最产油的酵母的供体。该结果可表明在产油酵母DGA1基因中,产物活性和/或表达水平可能是决定脂质生产水平的因素。在某些实验中,原生圆红冬孢酵母DGA1(NG49)超量表达对于解脂耶氏酵母中的脂质产量的影响不像不含内含子的圆红冬孢酵母DGA1基因的合成版本的影响那么大。该结果可能表明解脂耶氏酵母中的异源圆红冬孢酵母DGA1基因的基因剪接不是非常有效。在某些实验中,用于在解脂耶氏酵母中表达的圆红冬孢酵母和斯达油脂酵母DGA1基因的密码子优化对于脂质产量不具有积极影响。对于斯达油脂酵母DGA1而言,基因的密码子优化版本(NG69)不如具有原生密码子的斯达油脂酵母cDNA序列NG68有效。

为了确认显示在图2上的数据并选择具有最高脂质生产水平的转化体,针对解脂耶氏酵母DGA1基因NG15和圆红冬孢酵母DGA1基因NG66筛选更多转化体。对于NG15,通过脂质分析针对最高脂质累积筛选约50个菌落,并将最佳转化体命名为NS249(数据未显示)。对于NG66而言,筛选80个菌落并选择8个最佳菌落用于进一步分析(数据未显示)。菌株NS249和8种表达NG66的所选转化体在摇瓶中生长,并且通过用于脂质含量的脂质分析和用于葡萄糖消耗的HPLC进行分析(实施例6)。实验结果显示在图3上。图3展示与NS249(其中原生解脂耶氏酵母DGA1基因在与圆红冬孢酵母DGA1相同的启动子之下表达)相比较,超量表达圆红冬孢酵母DGA1的解脂耶氏酵母菌株具有显著更高的脂质含量。同时,与NS249相比较,NG66转化体具有显著较少的葡萄糖留在培养基中,证明NG66在将葡萄糖转化成脂质方面比解脂耶氏酵母DGA1基因NG15更加有效。两种DGA1基因之间的效率差异可能归因于圆红冬孢酵母DGA1在解脂耶氏酵母中的表达水平更高和/或圆红冬孢酵母DGA1特异性活性的水平更高。

实施例4:脂质分析

1.制备生长培养基:

2.在YPD或其它适当的培养基中将菌株进行铺板以进行分析并在30℃下培养1-2天

3.在热压处理过的250mL烧瓶、24-,48-或96-孔板中填充培养基:

·烧瓶:50mL每烧瓶

·96-孔板:300μL每孔

4.用铝箔覆盖烧瓶并用多孔覆盖物覆盖板。

5.伴随振荡在30℃下培养72至96小时

·烧瓶:在New Brunswick Scientific中200rpm

·摇动板:在Infors Multitron ATR shaker中900rpm,70-90%湿度

6.在分析微板中混合20μL细胞与20μL的100%乙醇并在4℃下培养30分钟

7.建立预混液(mastermix)(80μL每个反应):

8.将预混液等分到Costar Black孔/透明底板中(800μL/孔)

9.添加20μL的乙醇/细胞混合物并用透明密封物覆盖

10.用SpectraMax M2分光光度计(Molecular Devices)遵循以下方案测量荧光:

·动力学分析

·采用495的截断值读取FL 485/510

·在各次读取之前混合5秒

·选择Costar Black孔/透明底板

·取消选定自动校正

·30min实验,每分钟进行读取

·将腔室加热至30℃

11.遵循以下方案在相同的板中测量OD:

·吸光度600nm

·在各次读取之前混合5秒

·选择Costar Black孔/透明底板

·取消选定自动校正

·将腔室加热至30℃

通过用30min处的荧光除以OD来计算归一化的荧光。

通过引用并入

本文所引用的所有美国专利、美国公开专利申请和公开PCT申请通过引用由此并入。

等同物

尽管本文已描述并说明了本发明的数种实施方式,本领域普通技术人员将容易设想各种其它手段和/或结构来实施功能和/或获得本文描述的结果和/或一种或更多种优势,并且此类变型和/或改变各自被视为在本发明的范围内。仅仅使用常规实验方法,本领域技术人员将意识到或能够确定本文描述的本发明的具体实施方式的许多等同物。因此,应理解前述实施方式是仅通过举例方式呈现并且在其所附权利要求书和等同物的范围内;可采取与具体描述和要求保护的不同方式实践本发明。

<110> 诺沃吉公司Novogy Corporation

<120> 二酰基甘油酰基转移酶(DGA1)多核苷酸,和通过异源DGA1的超量表达增加酵母细胞脂质生产的方法

<130> NGX-025.25

<140> PCT/US15/017227

<141> 2015-02-24

<150> US 61/943664

<151> 2014-02-24

<160> 18

<170> PatentIn version 3.5

<210> 1

<211> 514

<212> PRT

<213> 解脂耶氏酵母

<400> 1

Met Thr Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr

1 5 10 15

Ala Pro Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu

20 25 30

Leu Asn Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile

35 40 45

Pro Thr Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu

50 55 60

Trp Pro Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser

65 70 75 80

Pro Ser Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn

85 90 95

Phe Phe Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His

100 105 110

Lys Thr Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val

115 120 125

Gln Glu Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr

130 135 140

Leu Arg Ala Ile Ile Thr Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met

145 150 155 160

Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp

165 170 175

Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp

180 185 190

Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly

195 200 205

Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn

210 215 220

Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr

225 230 235 240

Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn

245 250 255

Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys

260 265 270

Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile

275 280 285

Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser

290 295 300

Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn

305 310 315 320

Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala

325 330 335

Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser

340 345 350

Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro

355 360 365

Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu

370 375 380

Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly

385 390 395 400

Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu

405 410 415

Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro

420 425 430

Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro

435 440 445

Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro

450 455 460

Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg

465 470 475 480

Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr

485 490 495

Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met

500 505 510

Ile Glu

<210> 2

<211> 1545

<212> DNA

<213> 解脂耶氏酵母

<400> 2

atgactatcg actcacaata ctacaagtcg cgagacaaaa acgacacggc acccaaaatc 60

gcgggaatcc gatatgcccc gctatcgaca ccattactca accgatgtga gaccttctct 120

ctggtctggc acattttcag cattcccact ttcctcacaa ttttcatgct atgctgcgca 180

attccactgc tctggccatt tgtgattgcg tatgtagtgt acgctgttaa agacgactcc 240

ccgtccaacg gaggagtggt caagcgatac tcgcctattt caagaaactt cttcatctgg 300

aagctctttg gccgctactt ccccataact ctgcacaaga cggtggatct ggagcccacg 360

cacacatact accctctgga cgtccaggag tatcacctga ttgctgagag atactggccg 420

cagaacaagt acctccgagc aatcatcacc accatcgagt actttctgcc cgccttcatg 480

aaacggtctc tttctatcaa cgagcaggag cagcctgccg agcgagatcc tctcctgtct 540

cccgtttctc ccagctctcc gggttctcaa cctgacaagt ggattaacca cgacagcaga 600

tatagccgtg gagaatcatc tggctccaac ggccacgcct cgggctccga acttaacggc 660

aacggcaaca atggcaccac taaccgacga cctttgtcgt ccgcctctgc tggctccact 720

gcatctgatt ccacgcttct taacgggtcc ctcaactcct acgccaacca gatcattggc 780

gaaaacgacc cacagctgtc gcccacaaaa ctcaagccca ctggcagaaa atacatcttc 840

ggctaccacc cccacggcat tatcggcatg ggagcctttg gtggaattgc caccgaggga 900

gctggatggt ccaagctctt tccgggcatc cctgtttctc ttatgactct caccaacaac 960

ttccgagtgc ctctctacag agagtacctc atgagtctgg gagtcgcttc tgtctccaag 1020

aagtcctgca aggccctcct caagcgaaac cagtctatct gcattgtcgt tggtggagca 1080

caggaaagtc ttctggccag acccggtgtc atggacctgg tgctactcaa gcgaaagggt 1140

tttgttcgac ttggtatgga ggtcggaaat gtcgcccttg ttcccatcat ggcctttggt 1200

gagaacgacc tctatgacca ggttagcaac gacaagtcgt ccaagctgta ccgattccag 1260

cagtttgtca agaacttcct tggattcacc cttcctttga tgcatgcccg aggcgtcttc 1320

aactacgatg tcggtcttgt cccctacagg cgacccgtca acattgtggt tggttccccc 1380

attgacttgc cttatctccc acaccccacc gacgaagaag tgtccgaata ccacgaccga 1440

tacatcgccg agctgcagcg aatctacaac gagcacaagg atgaatattt catcgattgg 1500

accgaggagg gcaaaggagc cccagagttc cgaatgattg agtaa 1545

<210> 3

<211> 348

<212> PRT

<213> 圆红冬孢酵母

<400> 3

Met Gly Gln Gln Ala Thr Pro Glu Glu Leu Tyr Thr Arg Ser Glu Ile

1 5 10 15

Ser Lys Ile Lys Phe Ala Pro Phe Gly Val Pro Arg Ser Arg Arg Leu

20 25 30

Gln Thr Phe Ser Val Phe Ala Trp Thr Thr Ala Leu Pro Ile Leu Leu

35 40 45

Gly Val Phe Phe Leu Leu Cys Ser Phe Pro Pro Leu Trp Pro Ala Val

50 55 60

Ile Ala Tyr Leu Thr Trp Val Phe Phe Ile Asp Gln Ala Pro Ile His

65 70 75 80

Gly Gly Arg Ala Gln Ser Trp Leu Arg Lys Ser Arg Ile Trp Val Trp

85 90 95

Phe Ala Gly Tyr Tyr Pro Val Ser Leu Ile Lys Ser Ala Asp Leu Pro

100 105 110

Pro Asp Arg Lys Tyr Val Phe Gly Tyr His Pro His Gly Val Ile Gly

115 120 125

Met Gly Ala Ile Ala Asn Phe Ala Thr Asp Ala Thr Gly Phe Ser Thr

130 135 140

Leu Phe Pro Gly Leu Asn Pro His Leu Leu Thr Leu Gln Ser Asn Phe

145 150 155 160

Lys Leu Pro Leu Tyr Arg Glu Leu Leu Leu Ala Leu Gly Ile Cys Ser

165 170 175

Val Ser Met Lys Ser Cys Gln Asn Ile Leu Arg Gln Gly Pro Gly Ser

180 185 190

Ala Leu Thr Ile Val Val Gly Gly Ala Ala Glu Ser Leu Ser Ala His

195 200 205

Pro Gly Thr Ala Asp Leu Thr Leu Lys Arg Arg Lys Gly Phe Ile Lys

210 215 220

Leu Ala Ile Arg Gln Gly Ala Asp Leu Val Pro Val Phe Ser Phe Gly

225 230 235 240

Glu Asn Asp Ile Phe Gly Gln Leu Arg Asn Glu Arg Gly Thr Arg Leu

245 250 255

Tyr Lys Leu Gln Lys Arg Phe Gln Gly Val Phe Gly Phe Thr Leu Pro

260 265 270

Leu Phe Tyr Gly Arg Gly Leu Phe Asn Tyr Asn Val Gly Leu Met Pro

275 280 285

Tyr Arg His Pro Ile Val Ser Val Val Gly Arg Pro Ile Ser Val Glu

290 295 300

Gln Lys Asp His Pro Thr Thr Ala Asp Leu Glu Glu Val Gln Ala Arg

305 310 315 320

Tyr Ile Ala Glu Leu Lys Arg Ile Trp Glu Glu Tyr Lys Asp Ala Tyr

325 330 335

Ala Lys Ser Arg Thr Arg Glu Leu Asn Ile Ile Ala

340 345

<210> 4

<211> 1858

<212> DNA

<213> 圆红冬孢酵母

<400> 4

atgggccagc aggcgacgcc cgaggagcta tacacacgct cagagatctc caagatcaag 60

caagtcgagc cagctcttct cctcaccacc ccacaacata ccccgcagcc cacgacagcc 120

ctcccacagc acctgcagcc tgctgaccag ctcgagaaca cccacagatt cgcacccttt 180

ggcgtcccgc ggtcgcgccg gctgcagacc ttctccgtct ttgcctggac gacggcactg 240

cccatcctac tcggcgtctt cttcctcctc tggtgcgtca ggcttggcgt gatctgagag 300

tagcgggcgg atcatctgac ctgcttcttc gctgcagctc gttcccaccg ctctggccgg 360

ctgtcattgc ctacctcacc tgggtctttt tcattgacca ggcgccgatt cacggtggac 420

gggcgcagtc ttggctgcgg aagagtcgga tatgggtctg gtttgcagga tactatcccg 480

tcaggtgcgt cctctttcca agcctgcgtc tcgaggcctc gctcacggcc aactcgcccg 540

accggctacc tccgaacttt ccgtcaacag cttgatcaag gtcagtctgc gcgtctctcg 600

acttcagtgc tctgtggagg agctgcgcca ttgggcccga cctgcggagg gcctcaaagg 660

acgatgccgc tgacttcctt tcctccgaca gagcgccgac ttgccgcctg accggaagta 720

cgtctttggc taccacccgc acggcgtcat aggcatgggc gccatcgcca acttcgcgac 780

cgacgcaacc ggcttctcga cactcttccc cggcttgaac cctcacctcc tcaccctcca 840

aagcaacttc aagctcccgc tctaccgcga gttgctgctc gctctcggca tatgctccgt 900

ctcgatgaag agctgtcaga acattctgcg acaaggtgag cggtatgcgc aagacgggcg 960

gtcaagcgtg aacgcagtga acgagaagag ctgaccttcc gccttactcc atccgtgcag 1020

gtcctggctc ggctctcact atcgtcgtcg gtggcgccgc cgagagcttg agtgcgcatc 1080

ccggaaccgc cgatcttacg ctcaagcgac gaaaaggctt catcaaactc gcgatccggc 1140

aaggcgccga ccttgtgccc gtcttttcgt tcggcgagaa cgacgtgcgc acgctctccg 1200

agtctctaaa ccggaagcga atgctgaccg ctgcccaatt ctctctccag atctttggcc 1260

agctgcgaaa cgagcgagga acgcggctgt acaagttgca gaagcgtttc caaggcgtgt 1320

ttggcttcac cctccgtacg tctcaccgcg ccgtcttgcc gaactgctcg ttcagtcgct 1380

cacgcagctt tcactcgcgc agctctcttc tacggccggg gactcttcaa ctgtgcgctc 1440

gagttcaccg cttcgccaac agcgaggaat gcctccgagt acagcccagc tgacgcccca 1500

tctcttctca tagacaacgt cggattgatg ccgtatcgcc atccgatcgt ctctgtcggt 1560

gtgaacccgc tctgtcgctc ctacctgcgt tccttaggct gacaccactc gcgtcaaaca 1620

gtcggtcgac caatctcggt agagcagaag gaccacccga ccacggcgga cctcgaagaa 1680

gttcaggcgc ggtatatcgc agaactcaag cggtacgttc caagtcgtct gcctccgctt 1740

gccgcctcaa ataagctgag gcgtgctgac cgtatctgcc gaaccgtaca gcatctggga 1800

agaatacaag gacgcctacg ccaaaagtcg cacgcgggag ctcaatatta tcgcctga 1858

<210> 5

<211> 348

<212> PRT

<213> 圆红冬孢酵母

<400> 5

Met Gly Gln Gln Ala Thr Pro Glu Glu Leu Tyr Thr Arg Ser Glu Ile

1 5 10 15

Ser Lys Ile Lys Phe Ala Pro Phe Gly Val Pro Arg Ser Arg Arg Leu

20 25 30

Gln Thr Phe Ser Val Phe Ala Trp Thr Thr Ala Leu Pro Ile Leu Leu

35 40 45

Gly Val Phe Phe Leu Leu Cys Ser Phe Pro Pro Leu Trp Pro Ala Val

50 55 60

Ile Ala Tyr Leu Thr Trp Val Phe Phe Ile Asp Gln Ala Pro Ile His

65 70 75 80

Gly Gly Arg Ala Gln Ser Trp Leu Arg Lys Ser Arg Ile Trp Val Trp

85 90 95

Phe Ala Gly Tyr Tyr Pro Val Ser Leu Ile Lys Ser Ala Asp Leu Pro

100 105 110

Pro Asp Arg Lys Tyr Val Phe Gly Tyr His Pro His Gly Val Ile Gly

115 120 125

Met Gly Ala Ile Ala Asn Phe Ala Thr Asp Ala Thr Gly Phe Ser Thr

130 135 140

Leu Phe Pro Gly Leu Asn Pro His Leu Leu Thr Leu Gln Ser Asn Phe

145 150 155 160

Lys Leu Pro Leu Tyr Arg Glu Leu Leu Leu Ala Leu Gly Ile Cys Ser

165 170 175

Val Ser Met Lys Ser Cys Gln Asn Ile Leu Arg Gln Gly Pro Gly Ser

180 185 190

Ala Leu Thr Ile Val Val Gly Gly Ala Ala Glu Ser Leu Ser Ala His

195 200 205

Pro Gly Thr Ala Asp Leu Thr Leu Lys Arg Arg Lys Gly Phe Ile Lys

210 215 220

Leu Ala Ile Arg Gln Gly Ala Asp Leu Val Pro Val Phe Ser Phe Gly

225 230 235 240

Glu Asn Asp Ile Phe Gly Gln Leu Arg Asn Glu Arg Gly Thr Arg Leu

245 250 255

Tyr Lys Leu Gln Lys Arg Phe Gln Gly Val Phe Gly Phe Thr Leu Pro

260 265 270

Leu Phe Tyr Gly Arg Gly Leu Phe Asn Tyr Asn Val Gly Leu Met Pro

275 280 285

Tyr Arg His Pro Ile Val Ser Val Val Gly Arg Pro Ile Ser Val Glu

290 295 300

Gln Lys Asp His Pro Thr Thr Ala Asp Leu Glu Glu Val Gln Ala Arg

305 310 315 320

Tyr Ile Ala Glu Leu Lys Arg Ile Trp Glu Glu Tyr Lys Asp Ala Tyr

325 330 335

Ala Lys Ser Arg Thr Arg Glu Leu Asn Ile Ile Ala

340 345

<210> 6

<211> 1047

<212> DNA

<213> 圆红冬孢酵母

<400> 6

atgggccagc aggcgacgcc cgaggagcta tacacacgct cagagatctc caagatcaag 60

ttcgcaccct ttggcgtccc gcggtcgcgc cggctgcaga ccttctccgt ctttgcctgg 120

acgacggcac tgcccatcct actcggcgtc ttcttcctcc tctgctcgtt cccaccgctc 180

tggccggctg tcattgccta cctcacctgg gtctttttca ttgaccaggc gccgattcac 240

ggtggacggg cgcagtcttg gctgcggaag agtcggatat gggtctggtt tgcaggatac 300

tatcccgtca gcttgatcaa gagcgccgac ttgccgcctg accggaagta cgtctttggc 360

taccacccgc acggcgtcat aggcatgggc gccatcgcca acttcgcgac cgacgcaacc 420

ggcttctcga cactcttccc cggcttgaac cctcacctcc tcaccctcca aagcaacttc 480

aagctcccgc tctaccgcga gttgctgctc gctctcggca tatgctccgt ctcgatgaag 540

agctgtcaga acattctgcg acaaggtcct ggctcggctc tcactatcgt cgtcggtggc 600

gccgccgaga gcttgagtgc gcatcccgga accgccgatc ttacgctcaa gcgacgaaaa 660

ggcttcatca aactcgcgat ccggcaaggc gccgaccttg tgcccgtctt ttcgttcggc 720

gagaacgaca tctttggcca gctgcgaaac gagcgaggaa cgcggctgta caagttgcag 780

aagcgtttcc aaggcgtgtt tggcttcacc ctccctctct tctacggccg gggactcttc 840

aactacaacg tcggattgat gccgtatcgc catccgatcg tctctgtcgt cggtcgacca 900

atctcggtag agcagaagga ccacccgacc acggcggacc tcgaagaagt tcaggcgcgg 960

tatatcgcag aactcaagcg gatctgggaa gaatacaagg acgcctacgc caaaagtcgc 1020

acgcgggagc tcaatattat cgcctga 1047

<210> 7

<211> 348

<212> PRT

<213> 圆红冬孢酵母

<400> 7

Met Gly Gln Gln Ala Thr Pro Glu Glu Leu Tyr Thr Arg Ser Glu Ile

1 5 10 15

Ser Lys Ile Lys Phe Ala Pro Phe Gly Val Pro Arg Ser Arg Arg Leu

20 25 30

Gln Thr Phe Ser Val Phe Ala Trp Thr Thr Ala Leu Pro Ile Leu Leu

35 40 45

Gly Val Phe Phe Leu Leu Cys Ser Phe Pro Pro Leu Trp Pro Ala Val

50 55 60

Ile Ala Tyr Leu Thr Trp Val Phe Phe Ile Asp Gln Ala Pro Ile His

65 70 75 80

Gly Gly Arg Ala Gln Ser Trp Leu Arg Lys Ser Arg Ile Trp Val Trp

85 90 95

Phe Ala Gly Tyr Tyr Pro Val Ser Leu Ile Lys Ser Ala Asp Leu Pro

100 105 110

Pro Asp Arg Lys Tyr Val Phe Gly Tyr His Pro His Gly Val Ile Gly

115 120 125

Met Gly Ala Ile Ala Asn Phe Ala Thr Asp Ala Thr Gly Phe Ser Thr

130 135 140

Leu Phe Pro Gly Leu Asn Pro His Leu Leu Thr Leu Gln Ser Asn Phe

145 150 155 160

Lys Leu Pro Leu Tyr Arg Glu Leu Leu Leu Ala Leu Gly Ile Cys Ser

165 170 175

Val Ser Met Lys Ser Cys Gln Asn Ile Leu Arg Gln Gly Pro Gly Ser

180 185 190

Ala Leu Thr Ile Val Val Gly Gly Ala Ala Glu Ser Leu Ser Ala His

195 200 205

Pro Gly Thr Ala Asp Leu Thr Leu Lys Arg Arg Lys Gly Phe Ile Lys

210 215 220

Leu Ala Ile Arg Gln Gly Ala Asp Leu Val Pro Val Phe Ser Phe Gly

225 230 235 240

Glu Asn Asp Ile Phe Gly Gln Leu Arg Asn Glu Arg Gly Thr Arg Leu

245 250 255

Tyr Lys Leu Gln Lys Arg Phe Gln Gly Val Phe Gly Phe Thr Leu Pro

260 265 270

Leu Phe Tyr Gly Arg Gly Leu Phe Asn Tyr Asn Val Gly Leu Met Pro

275 280 285

Tyr Arg His Pro Ile Val Ser Val Val Gly Arg Pro Ile Ser Val Glu

290 295 300

Gln Lys Asp His Pro Thr Thr Ala Asp Leu Glu Glu Val Gln Ala Arg

305 310 315 320

Tyr Ile Ala Glu Leu Lys Arg Ile Trp Glu Glu Tyr Lys Asp Ala Tyr

325 330 335

Ala Lys Ser Arg Thr Arg Glu Leu Asn Ile Ile Ala

340 345

<210> 8

<211> 1047

<212> DNA

<213> 圆红冬孢酵母

<400> 8

atgggacagc aggctacccc cgaggagctc tacacccgat ccgagatttc taagattaag 60

ttcgcccctt ttggagtgcc ccgatcccga cgactccaga ccttctccgt ttttgcctgg 120

accactgctc tgcccattct gctcggcgtc ttctttctgc tctgctcttt cccccctctc 180

tggcccgccg tcatcgctta cctgacctgg gtgttcttta tcgaccaggc ccctattcac 240

ggcggtcgag ctcagtcctg gctgcgaaag tctcgaattt gggtttggtt cgccggttac 300

taccccgtct ctctcatcaa gtcggctgac ctgccccctg atcgaaagta cgtgttcggc 360

taccaccctc atggtgttat cggtatggga gccattgcta actttgccac cgatgctact 420

ggtttctcca ccctctttcc cggactgaac cctcacctgc tcactctcca gtctaacttc 480

aagctccccc tgtaccgaga gctgctcctg gccctgggta tctgctccgt ctctatgaag 540

tcttgtcaga acattctccg acagggacct ggttcggctc tgaccatcgt cgtgggagga 600

gctgctgagt cgctctccgc ccatcctgga accgctgacc tcactctgaa gcgacgaaag 660

ggcttcatca agctcgccat tcgacagggt gctgacctgg tgcccgtttt ctcctttgga 720

gagaacgata ttttcggcca gctgcgaaac gagcgaggaa cccgactcta caagctgcag 780

aagcgatttc agggtgtgtt cggcttcacc ctccctctgt tctacggacg aggcctcttt 840

aactacaacg ttggactgat gccctaccga caccctatcg tctcggttgt cggccgaccc 900

atttccgtgg agcagaagga ccatcctacc actgccgatc tcgaggaggt gcaggcccga 960

tacatcgctg agctgaagcg aatttgggag gagtacaagg acgcctacgc taagtctcga 1020

acccgagagc tgaacatcat tgcctaa 1047

<210> 9

<211> 410

<212> PRT

<213> 斯达油脂酵母

<400> 9

Met Ser Glu Lys Ala Glu Ile Glu Val Pro Pro Gln Lys Ser Thr Phe

1 5 10 15

Pro Arg Ser Val His Phe Ala Pro Leu His Ile Pro Leu Glu Arg Arg

20 25 30

Leu Gln Thr Leu Ala Val Leu Phe His Thr Val Ala Leu Pro Tyr Cys

35 40 45

Ile Gly Leu Phe Phe Leu Met Leu Ala Phe Pro Pro Phe Trp Pro Leu

50 55 60

Leu Val Met Tyr Val Ile Tyr Ala Tyr Gly Phe Asp His Ser Ser Ser

65 70 75 80

Asn Gly Glu Ile Ser Arg Arg Arg Ser Pro Leu Phe Arg Arg Leu Pro

85 90 95

Leu Phe Arg Leu Tyr Cys Asp Tyr Phe Pro Ile His Ile His Arg Glu

100 105 110

Val Pro Leu Glu Pro Thr Phe Pro Gly Arg Leu Arg Glu Pro Ser Gly

115 120 125

Leu Val Glu Arg Trp Ile Ala Lys Met Phe Gly Val Gln Asp Ala Val

130 135 140

Val Glu Gly Asn Glu Ser Asp Val Lys Ala Thr Ala Asn Gly Asn Gly

145 150 155 160

Thr Thr Lys Glu Ile Gly Pro Thr Tyr Val Phe Gly Tyr His Pro His

165 170 175

Gly Ile Val Ser Leu Gly Ala Phe Gly Ala Ile Gly Thr Glu Gly Ala

180 185 190

Gly Trp Glu Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Leu Thr Leu

195 200 205

Glu Thr Asn Phe Ser Leu Pro Phe Tyr Arg Glu Tyr Leu Leu Ser Leu

210 215 220

Gly Ile Ala Ser Val Ser Arg Arg Ser Cys Thr Asn Leu Leu Lys His

225 230 235 240

Asp Gln Ser Ile Cys Ile Val Ile Gly Gly Ala Gln Glu Ser Leu Leu

245 250 255

Ala Glu Pro Gly Thr Leu Asp Leu Ile Leu Val Lys Arg Arg Gly Phe

260 265 270

Val Lys Leu Ala Met Ser Thr Ala Arg Val Ser Asp Gln Pro Ile Cys

275 280 285

Leu Val Pro Ile Leu Ser Phe Gly Glu Asn Asp Val Tyr Asp Gln Val

290 295 300

Arg Gly Asp Arg Ser Ser Lys Leu Tyr Lys Ile Gln Thr Phe Ile Lys

305 310 315 320

Lys Ala Ala Gly Phe Thr Leu Pro Leu Met Tyr Ala Arg Gly Ile Phe

325 330 335

Asn Tyr Asp Phe Gly Leu Met Pro Tyr Arg Arg Gln Met Thr Leu Val

340 345 350

Val Gly Lys Pro Ile Ala Val Pro Tyr Val Ala Gln Pro Thr Glu Ala

355 360 365

Glu Ile Glu Val Tyr His Lys Gln Tyr Met Asp Glu Leu Arg Arg Leu

370 375 380

Trp Asp Thr Tyr Lys Asp Asp Tyr Phe Val Asp His Lys Gly Lys Gly

385 390 395 400

Val Lys Asn Ser Glu Met Arg Phe Val Glu

405 410

<210> 10

<211> 1233

<212> DNA

<213> 斯达油脂酵母

<400> 10

atgagtgaga aggcagagat cgaggttccg ccgcaaaaat cgacattccc tcgcagtgtg 60

cacttcgctc cacttcatat tccactggag agacgcctac agactttggc agtcttattc 120

cacactgtcg cgctaccata ctgcatcggt ctgttctttc tcatgctcgc gttccctcct 180

ttttggccat tattggtaat gtatgtcata tacgcatacg ggttcgacca ctcgagctcg 240

aacggagaga tctcccgccg gcgatcgccg ctgtttcgaa gactcccgtt gttcaggctg 300

tattgtgatt acttccccat ccacattcac cgggaggttc cgctcgagcc gacgtttcct 360

ggtcgccttc gcgaaccgag tggccttgtc gagcggtgga ttgcgaagat gttcggcgtg 420

caggacgctg ttgtcgaggg aaatgaatct gacgttaagg ccacggccaa cggcaatggg 480

acgacgaaag aaatcggacc gacgtatgtt ttcggctatc atccgcatgg aattgttagc 540

ttgggtgcgt ttggtgctat tggtacggaa ggcgctggat gggagaagct ctttcctggg 600

atcccggtgt cactgctgac tctcgaaaca aatttcagcc ttccatttta cagagagtat 660

ttgctgtcac ttgggattgc ttcagtatct cgacggtctt gtaccaatct cctcaaacac 720

gaccaatcca tctgcatcgt tatcggcggc gcccaagagt cgctcttagc ggaaccaggc 780

actctagatc tgatcctcgt taaacgtcgc ggttttgtca aacttgcaat gtcaacggcg 840

cgggtatctg accaaccgat ttgtcttgtt ccgatcctca gtttcggcga gaacgacgtg 900

tacgaccaag tccgcgggga ccgatcgtcg aagttgtata agatccagac ttttatcaag 960

aaagcggccg ggtttacgct accattgatg tatgcgcgcg gtatatttaa ttacgacttt 1020

gggctgatgc cgtaccgcag gcaaatgacg ctcgtggtcg gcaagccgat tgcagtgccg 1080

tacgtggccc agcctacgga ggctgaaatc gaagtgtatc acaagcagta catggatgaa 1140

ttgaggaggt tatgggacac gtataaggac gactattttg tagaccacaa gggcaagggg 1200

gtcaagaatt ccgagatgcg ttttgtggag taa 1233

<210> 11

<211> 410

<212> PRT

<213> 斯达油脂酵母

<400> 11

Met Ser Glu Lys Ala Glu Ile Glu Val Pro Pro Gln Lys Ser Thr Phe

1 5 10 15

Pro Arg Ser Val His Phe Ala Pro Leu His Ile Pro Leu Glu Arg Arg

20 25 30

Leu Gln Thr Leu Ala Val Leu Phe His Thr Val Ala Leu Pro Tyr Cys

35 40 45

Ile Gly Leu Phe Phe Leu Met Leu Ala Phe Pro Pro Phe Trp Pro Leu

50 55 60

Leu Val Met Tyr Val Ile Tyr Ala Tyr Gly Phe Asp His Ser Ser Ser

65 70 75 80

Asn Gly Glu Ile Ser Arg Arg Arg Ser Pro Leu Phe Arg Arg Leu Pro

85 90 95

Leu Phe Arg Leu Tyr Cys Asp Tyr Phe Pro Ile His Ile His Arg Glu

100 105 110

Val Pro Leu Glu Pro Thr Phe Pro Gly Arg Leu Arg Glu Pro Ser Gly

115 120 125

Leu Val Glu Arg Trp Ile Ala Lys Met Phe Gly Val Gln Asp Ala Val

130 135 140

Val Glu Gly Asn Glu Ser Asp Val Lys Ala Thr Ala Asn Gly Asn Gly

145 150 155 160

Thr Thr Lys Glu Ile Gly Pro Thr Tyr Val Phe Gly Tyr His Pro His

165 170 175

Gly Ile Val Ser Leu Gly Ala Phe Gly Ala Ile Gly Thr Glu Gly Ala

180 185 190

Gly Trp Glu Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Leu Thr Leu

195 200 205

Glu Thr Asn Phe Ser Leu Pro Phe Tyr Arg Glu Tyr Leu Leu Ser Leu

210 215 220

Gly Ile Ala Ser Val Ser Arg Arg Ser Cys Thr Asn Leu Leu Lys His

225 230 235 240

Asp Gln Ser Ile Cys Ile Val Ile Gly Gly Ala Gln Glu Ser Leu Leu

245 250 255

Ala Glu Pro Gly Thr Leu Asp Leu Ile Leu Val Lys Arg Arg Gly Phe

260 265 270

Val Lys Leu Ala Met Ser Thr Ala Arg Val Ser Asp Gln Pro Ile Cys

275 280 285

Leu Val Pro Ile Leu Ser Phe Gly Glu Asn Asp Val Tyr Asp Gln Val

290 295 300

Arg Gly Asp Arg Ser Ser Lys Leu Tyr Lys Ile Gln Thr Phe Ile Lys

305 310 315 320

Lys Ala Ala Gly Phe Thr Leu Pro Leu Met Tyr Ala Arg Gly Ile Phe

325 330 335

Asn Tyr Asp Phe Gly Leu Met Pro Tyr Arg Arg Gln Met Thr Leu Val

340 345 350

Val Gly Lys Pro Ile Ala Val Pro Tyr Val Ala Gln Pro Thr Glu Ala

355 360 365

Glu Ile Glu Val Tyr His Lys Gln Tyr Met Asp Glu Leu Arg Arg Leu

370 375 380

Trp Asp Thr Tyr Lys Asp Asp Tyr Phe Val Asp His Lys Gly Lys Gly

385 390 395 400

Val Lys Asn Ser Glu Met Arg Phe Val Glu

405 410

<210> 12

<211> 1233

<212> DNA

<213> 斯达油脂酵母

<400> 12

atgtccgaga aggctgagat tgaggtgccc ccccagaagt ctactttccc tcgatccgtt 60

catttcgccc ccctgcatat ccccctggag cgacgactcc agaccctggc tgtgctcttc 120

cacactgttg ccctgcctta ctgcatcgga ctcttctttc tgatgctcgc tttcccccct 180

ttttggcccc tgctcgtgat gtacgttatc tacgcctacg gattcgacca ttcctcttcg 240

aacggcgaga tctctcgacg acgatcgcct ctgttccgac gactgcccct ctttcgactc 300

tactgtgatt acttccctat ccacattcat cgagaggtcc ccctggagcc tacctttcct 360

ggtcgactgc gagagccttc cggactcgtt gagcgatgga ttgctaagat gttcggtgtc 420

caggacgccg tcgtggaggg aaacgagtct gatgtgaagg ccaccgctaa cggaaacggc 480

accactaagg agatcggccc tacttacgtc ttcggatacc acccccatgg cattgtgtcc 540

ctgggagcct ttggcgctat cggtaccgag ggtgctggat gggagaagct cttccctggt 600

attcccgtct cgctgctcac cctggagact aacttctccc tcccctttta ccgagagtac 660

ctgctctctc tgggaatcgc ctcggtgtcc cgacgatcgt gcaccaacct gctcaagcac 720

gaccagtcta tctgtattgt tatcggaggt gctcaggagt ccctgctcgc tgagcctgga 780

accctggacc tcattctggt caagcgacga ggcttcgtga agctggccat gtccactgct 840

cgagtgtctg atcagcctat ttgcctggtt cccatcctct ctttcggcga gaacgacgtt 900

tacgatcagg tccgaggtga ccgatcctct aagctgtaca agattcagac cttcatcaag 960

aaggccgctg gctttactct ccctctgatg tacgcccgag gcatcttcaa ctacgacttt 1020

ggtctgatgc cctaccgacg acagatgacc ctcgttgtcg gcaagcctat tgccgtcccc 1080

tacgtggctc agcccactga ggccgagatc gaggtctacc acaagcagta catggacgag 1140

ctgcgacgac tctgggatac ctacaaggac gattacttcg ttgaccataa gggcaagggt 1200

gtcaagaact ctgagatgcg atttgtggag taa 1233

<210> 13

<211> 380

<212> PRT

<213> 土曲霉

<400> 13

Met Pro Arg Asn Thr His Pro Pro Ala Asn Asn Ala Gly Pro Asn Ala

1 5 10 15

Ser His Lys Lys Asp Arg Lys Arg Gln Gly Arg Leu Phe Gln His Thr

20 25 30

Val Pro Asn Lys Tyr Ser Arg Ile Arg Trp Ala Pro Leu Asn Ile Gly

35 40 45

Leu Glu Arg Arg Leu Gln Thr Leu Val Val Leu Cys His Thr Leu Thr

50 55 60

Ile Ala Leu Phe Leu Ala Phe Phe Phe Phe Thr Cys Ala Ile Pro Leu

65 70 75 80

Thr Trp Pro Leu Leu Phe Pro Tyr Leu Val Tyr Ile Thr Leu Phe Ser

85 90 95

Thr Ala Pro Thr Ser Gly Thr Leu Lys Gly Arg Ser Asp Phe Leu Arg

100 105 110

Ser Leu Pro Ile Trp Lys Leu Tyr Thr Ala Tyr Phe Pro Ala Lys Leu

115 120 125

His Arg Ser Glu Pro Leu Leu Pro Thr Arg Lys Tyr Ile Phe Gly Tyr

130 135 140

His Pro His Gly Ile Ile Ser His Gly Ala Phe Ala Ala Phe Ala Thr

145 150 155 160

Asp Ala Leu Gly Phe Ser Lys Leu Phe Pro Gly Ile Thr Asn Thr Leu

165 170 175

Leu Thr Leu Asp Ser Asn Phe Arg Ile Pro Phe Tyr Arg Glu Tyr Ala

180 185 190

Met Ala Met Gly Val Ala Ser Val Ser Arg Glu Ser Cys Glu Asn Leu

195 200 205

Leu Thr Lys Gly Gly Ala Asp Gly Glu Gly Met Gly Arg Ala Ile Thr

210 215 220

Ile Val Val Gly Gly Ala Arg Glu Ser Leu Asp Ala Leu Pro His Thr

225 230 235 240

Met Arg Leu Val Leu Lys Arg Arg Lys Gly Phe Ile Lys Leu Ala Ile

245 250 255

Arg Thr Gly Ala Asp Leu Val Pro Val Leu Ala Phe Gly Glu Asn Asp

260 265 270

Leu Tyr Glu Gln Val Arg Ser Asp Gln His Pro Leu Ile Tyr Lys Val

275 280 285

Gln Met Leu Val Lys Arg Phe Leu Gly Phe Thr Val Pro Leu Phe His

290 295 300

Ala Arg Gly Ile Phe Asn Tyr Asp Val Gly Leu Met Pro Tyr Arg Arg

305 310 315 320

Pro Leu Asn Ile Val Val Gly Arg Pro Ile Gln Val Val Arg Gln Gln

325 330 335

Asp Arg Asp Lys Ile Asp Asp Glu Tyr Ile Asp Arg Leu His Ala Glu

340 345 350

Tyr Val Arg Glu Leu Glu Ser Leu Trp Asp Gln Trp Lys Asp Val Tyr

355 360 365

Ala Lys Asp Arg Ile Ser Glu Leu Glu Ile Val Ala

370 375 380

<210> 14

<211> 1143

<212> DNA

<213> 土曲霉

<400> 14

atgccccgaa acacccaccc ccccgccaac aacgccggac ctaacgcctc tcacaagaag 60

gaccgaaagc gacagggacg actctttcag cacaccgttc ctaacaagta ctctcgaatc 120

cgatgggccc ccctcaacat tggcctggag cgacgactgc agaccctcgt cgtgctgtgc 180

cataccctca ctatcgccct gttcctcgct ttctttttct ttacttgtgc cattcccctg 240

acctggcctc tgctcttccc ctacctcgtg tacatcaccc tgttttcgac cgctcctact 300

tccggtaccc tgaagggacg atctgacttc ctccgatcgc tgcctatttg gaagctctac 360

actgcctact ttcccgctaa gctgcaccga tccgagcctc tgctccctac ccgaaagtac 420

atcttcggct accaccccca tggtatcatt tcccatggag ccttcgccgc ttttgccact 480

gacgctctcg gcttctctaa gctgtttcct ggtatcacca acactctgct caccctggat 540

tcgaacttcc gaattccctt ttaccgagag tacgccatgg ctatgggagt ggcttccgtt 600

tctcgagagt cgtgcgagaa cctgctcact aagggaggtg ctgacggaga gggaatgggc 660

cgagctatca ccattgttgt cggaggcgcc cgagagtccc tcgatgctct gcctcacact 720

atgcgactgg tcctcaagcg acgaaagggt ttcatcaagc tggccattcg aaccggagct 780

gacctcgttc ccgtcctggc cttcggcgag aacgacctct acgagcaggt gcgatctgat 840

cagcaccctc tgatctacaa ggtccagatg ctcgtgaagc gattcctggg ttttaccgtg 900

cccctgttcc atgctcgagg aatttttaac tacgacgttg gcctcatgcc ttaccgacga 960

cccctgaaca tcgtggttgg tcgacccatt caggtcgtgc gacagcagga ccgagataag 1020

atcgacgatg agtacattga ccgactccac gccgagtacg tccgagagct cgagtccctg 1080

tgggaccagt ggaaggatgt ttacgccaag gaccgaatct ctgagctgga gattgtcgct 1140

taa 1143

<210> 15

<211> 437

<212> PRT

<213> 麦角菌

<400> 15

Met Ala Ala Val Gln Val Ala Arg Pro Val Pro Pro His His His Asp

1 5 10 15

Gly Ala Gly Arg Glu His Lys Gly Glu Arg Ala His Ser Pro Glu Arg

20 25 30

Gly Glu Lys Thr Val His Asn Gly Tyr Gly Leu Ala Glu Thr His Glu

35 40 45

Pro Leu Glu Leu Asn Gly Ser Ala Val Gln Asp Gly Lys His Asp Ser

50 55 60

Asp Glu Thr Ile Thr Asn Gly Asp Tyr Ser Pro Tyr Pro Glu Leu Asp

65 70 75 80

Cys Gly Lys Glu Arg Ala Ala His Glu Lys Glu Ala Trp Thr Ala Gly

85 90 95

Gly Val Arg Phe Ala Pro Leu Arg Val Pro Phe Lys Arg Arg Met Gln

100 105 110

Thr Ala Ala Val Leu Phe His Cys Met Ser Ile Ile Leu Ile Ser Ser

115 120 125

Cys Phe Trp Phe Ser Leu Ala Asn Pro Ile Thr Trp Pro Ile Leu Val

130 135 140

Pro Tyr Leu Val His Leu Ser Leu Ser Asn Ala Ser Thr Asp Gly Lys

145 150 155 160

Leu Ser Tyr Arg Ser Glu Trp Leu Arg Ser Leu Pro Leu Trp Arg Leu

165 170 175

Phe Ala Gly Tyr Phe Pro Ala Lys Leu His Lys Thr Phe Asp Leu Pro

180 185 190

Pro Asn Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile Ser

195 200 205

His Gly Ala Trp Cys Ala Phe Ala Thr Asn Ala Leu Gly Phe Val Glu

210 215 220

Lys Phe Pro Gly Ile Thr Asn Ser Leu Leu Thr Leu Asp Ser Asn Phe

225 230 235 240

Arg Val Pro Phe Tyr Arg Asp Trp Ile Leu Ala Met Gly Ile Arg Ser

245 250 255

Val Ser Arg Glu Ser Ile Arg Asn Ile Leu Ser Lys Gly Gly Pro Asp

260 265 270

Ser Asn Gly Gln Gly Arg Ala Val Thr Ile Val Ile Gly Gly Ala Arg

275 280 285

Glu Ser Leu Glu Ala Gln Pro Gly Thr Leu Arg Leu Ile Leu Gln Gly

290 295 300

Arg Lys Gly Phe Ile Lys Val Ala Leu Arg Ala Gly Ala Asp Leu Val

305 310 315 320

Pro Val Ile Gly Phe Gly Glu Asn Asp Leu Tyr Asp Gln Leu Ser Pro

325 330 335

Lys Thr His Pro Leu Val His Lys Ile Gln Met Phe Phe Leu Lys Val

340 345 350

Phe Lys Phe Thr Ile Pro Ala Leu His Gly Arg Gly Leu Leu Asn Tyr

355 360 365

Asp Val Gly Leu Leu Pro Tyr Arg Arg Ala Val Asn Ile Val Val Gly

370 375 380

Arg Pro Ile Gln Ile Asp Glu Thr Tyr Gly Glu Gln Pro Pro Gln Glu

385 390 395 400

Val Ile Asp Arg Tyr His Glu Leu Tyr Val Gln Glu Val Glu Arg Leu

405 410 415

Tyr Ala Ala Tyr Lys Glu Gln Phe Ser Asn Gly Lys Lys Thr Pro Glu

420 425 430

Leu Gln Ile Leu Ser

435

<210> 16

<211> 1314

<212> DNA

<213> 麦角菌

<400> 16

atggctgctg ttcaggttgc ccgacccgtt cccccccacc accacgatgg cgctggccga 60

gagcacaagg gagagcgagc ccattcccct gagcgaggag agaagaccgt ccacaacggc 120

tacggtctgg ccgagactca tgagcccctg gagctcaacg gttctgctgt gcaggacgga 180

aagcacgact cggatgagac catcactaac ggtgactact ctccctaccc tgagctcgat 240

tgcggaaagg agcgagccgc tcatgagaag gaggcttgga ccgctggagg tgtgcgattc 300

gctcctctgc gagttccttt taagcgacga atgcagactg ccgctgtcct cttccactgc 360

atgtccatca ttctgatttc ctcttgtttc tggttttctc tcgccaaccc catcacctgg 420

cctattctcg ttccctacct ggtccacctg tcgctctcca acgcttctac tgacggcaag 480

ctctcctacc gatctgagtg gctgcgatcc ctgcctctct ggcgactgtt cgccggttac 540

tttcccgcta agctccacaa gaccttcgat ctgcccccta accgaaagta catctttggt 600

taccaccccc atggaatcat ttcccatggc gcctggtgtg ccttcgctac caacgctctg 660

ggcttcgttg agaagtttcc tggtattacc aactcgctgc tcactctcga ctccaacttc 720

cgagtgccct tttaccgaga ttggatcctg gccatgggca ttcgatctgt ttcgcgagag 780

tctatccgaa acattctctc gaagggagga cctgactcca acggacaggg ccgagctgtg 840

accatcgtta ttggtggagc ccgagagtct ctggaggctc agcccggaac tctgcgactc 900

attctgcagg gccgaaaggg cttcattaag gtggctctcc gagctggagc tgacctggtt 960

cccgtcatcg gtttcggaga gaacgacctc tacgatcagc tgtcccctaa gacccacccc 1020

ctcgttcata agatccagat gttctttctg aaggtcttca agtttactat tcctgctctg 1080

cacggacgag gtctgctcaa ctacgacgtc ggtctgctcc cttaccgacg agctgtgaac 1140

atcgtcgtgg gacgacccat ccagattgac gagacctacg gcgagcagcc ccctcaggag 1200

gtcatcgatc gataccacga gctctacgtc caggaggtgg agcgactgta cgccgcttac 1260

aaggagcagt tctcgaacgg aaagaagacc cccgagctcc agatcctgtc ctaa 1314

<210> 17

<211> 351

<212> PRT

<213> 裂殖壶菌

<400> 17

Met Leu Ala Trp Met Pro Val Leu Ile Ala Leu Pro Arg Arg Lys Gln

1 5 10 15

Thr Ala Val Val Leu Leu Phe Val Met Leu Leu Pro Met Ile Met Val

20 25 30

Val Tyr Ser Trp Thr Leu Ile Leu Leu Ile Phe Pro Leu Thr Thr Leu

35 40 45

Pro Thr Leu Ser Tyr Leu Ile Trp Ile Met Tyr Ile Asp Lys Ser His

50 55 60

Glu Thr Gly Lys Arg Lys Pro Phe Met Arg Tyr Trp Lys Met Trp Arg

65 70 75 80

His Phe Ala Asn Tyr Phe Pro Leu Arg Leu Ile Arg Thr Thr Pro Leu

85 90 95

Asp Pro Arg Arg Lys Tyr Val Phe Cys Tyr His Pro His Gly Ile Ile

100 105 110

Ser Leu Gly Ala Phe Gly Asn Phe Ala Thr Asp Ser Thr Gly Phe Ser

115 120 125

Arg Lys Phe Pro Gly Ile Asp Leu Arg Leu Leu Thr Leu Gln Ile Asn

130 135 140

Phe Tyr Cys Pro Ile Ile Arg Glu Leu Leu Leu Tyr Met Gly Leu Cys

145 150 155 160

Ser Ala Ala Lys Lys Ser Cys Asn Gln Ile Leu Gln Arg Gly Pro Gly

165 170 175

Ser Ala Ile Met Leu Val Val Gly Gly Ala Ala Glu Ser Leu Asp Ser

180 185 190

Gln Pro Gly Thr Tyr Arg Leu Thr Leu Gly Arg Lys Gly Phe Val Arg

195 200 205

Val Ala Leu Asp Asn Gly Ala Asp Leu Val Pro Val Leu Gly Phe Gly

210 215 220

Glu Asn Asp Val Phe Asp Thr Val Tyr Leu Pro Pro Asn Ser Trp Ala

225 230 235 240

Arg Asn Val Gln Glu Phe Val Arg Lys Lys Leu Gly Phe Ala Thr Pro

245 250 255

Ile Phe Ser Gly Arg Gly Ile Phe Gln Tyr Asn Met Gly Leu Met Pro

260 265 270

His Arg Lys Pro Ile Ile Val Val Val Gly Lys Pro Ile Lys Ile Pro

275 280 285

Lys Ile Pro Asp Glu Leu Lys Gly Arg Ala Leu Ser Thr Thr Ala Glu

290 295 300

Gly Val Ala Leu Val Asp Lys Tyr His Glu Lys Tyr Val Arg Ala Leu

305 310 315 320

Arg Glu Leu Trp Asn Leu Tyr Lys Glu Glu Tyr Ala Thr Glu Pro Lys

325 330 335

Ala Ala Tyr Leu Glu Pro Asn Ser Ile Arg Lys Asn Gln Asn Val

340 345 350

<210> 18

<211> 1056

<212> DNA

<213> 裂殖壶菌

<400> 18

atgctcgcct ggatgcctgt cctcattgcc ctcccccgac gaaagcagac cgctgttgtt 60

ctcctgtttg tgatgctcct ccctatgatc atggtcgtgt actcctggac cctgatcctg 120

ctcattttcc ccctcaccac tctgcctact ctctcctacc tgatctggat tatgtacatt 180

gacaagtctc acgagaccgg aaagcgaaag ccctttatgc gatactggaa gatgtggcga 240

catttcgcca actactttcc tctccgactg atccgaacca ctcccctgga ccctcgacga 300

aagtacgtgt tctgctacca cccccatggc atcatttccc tcggagcctt cggcaacttt 360

gctaccgact cgactggctt ctcccgaaag tttcccggta tcgatctgcg actgctcacc 420

ctccagatta acttctactg tcctatcatt cgagagctgc tcctgtacat gggtctgtgc 480

tctgccgcta agaagtcgtg taaccagatc ctccagcgag gacccggctc tgctattatg 540

ctggttgtcg gcggtgccgc tgagtccctc gactctcagc ctggcaccta ccgactcact 600

ctgggtcgaa agggattcgt gcgagttgcc ctggacaacg gtgctgatct ggtccccgtg 660

ctcggtttcg gagagaacga cgtgtttgat accgtttacc tgccccctaa ctcgtgggcc 720

cgaaacgtcc aggagttcgt gcgaaagaag ctcggattcg ctacccccat cttttccggc 780

cgaggtattt ttcagtacaa catgggtctg atgccccacc gaaagcctat cattgtggtt 840

gtcggaaagc ccatcaagat tcccaagatc cctgacgagc tgaagggacg agccctctct 900

accactgccg agggcgttgc tctggtcgat aagtaccatg agaagtacgt tcgagccctc 960

cgagagctgt ggaacctcta caaggaggag tacgctaccg agcccaaggc cgcttacctc 1020

gagcctaact cgattcgaaa gaaccagaac gtctaa 1056

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号