首页> 中国专利> 单子叶植物中的淀粉胚乳特异性和/或萌芽胚特异性表达

单子叶植物中的淀粉胚乳特异性和/或萌芽胚特异性表达

摘要

本发明涉及农业生物技术领域。在本文中公开了具有淀粉胚乳和/或萌芽胚的表达特异性的表达构建体、包含此类表达构建体的转基因植物以及制备和使用此类DNA构建体和转基因植物的方法。

著录项

  • 公开/公告号CN101198701A

    专利类型发明专利

  • 公开/公告日2008-06-11

    原文格式PDF

  • 申请/专利权人 巴斯福植物科学有限公司;

    申请/专利号CN200680021586.3

  • 发明设计人 H-S·宋;C·E·罗奇;C·达曼;

    申请日2006-04-13

  • 分类号C12N15/82;A01H5/00;

  • 代理机构北京市中咨律师事务所;

  • 代理人黄革生

  • 地址 德国路德维希港

  • 入库时间 2023-12-17 20:15:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-31

    未缴年费专利权终止 IPC(主分类):C12N15/82 授权公告日:20130424 终止日期:20160413 申请日:20060413

    专利权的终止

  • 2013-04-24

    授权

    授权

  • 2008-08-06

    实质审查的生效

    实质审查的生效

  • 2008-06-11

    公开

    公开

说明书

发明邻域

本发明涉及农业生物技术领域。在本文中公开了对淀粉胚乳和/或萌芽 胚具有表达特异性的表达构建体、包含此类表达构建体的转基因植物以及 产生和使用此类DNA构建体和转基因植物的方法。

发明背景

在农学重要的谷物作物中,种子形成是植物发育的最终目标。收获种 子用于食品、饲料及工业产品。这些种子的用途和价值由种子中所含有的 蛋白质、油及淀粉决定。于是,所产生种子的质量和数量可能在受精前至 种子成熟的任何时点上受环境条件影响。尤其,在受精时刻及其附近的胁 迫可以明显影响种子发育。包括谷类在内的禾本科(Poaceae)成员产生干燥 的单种子果实。严格说,这种类型的果实是颖果,但通常叫做谷粒(kernal 或grain)。颖果的果皮或囊果皮包围种子并且与种皮紧密结合。种子由胚 或胚原基构成并且胚乳由珠心表皮和种皮包裹。因此,谷粒包含种子和种 子的外衣或囊果皮。种子包含胚及胚乳。(R.Carl Hoseney in“Principles of Cereal Science and Technology”特意地完整引用作为参考)。

能育的谷物植物含有通常分别称作雄花穗和谷穗的雄性繁殖组织和雌 性繁殖组织。雄花穗组织形成单倍体花粉粒,每一花粉粒内具有两个核, 其中在花开期被散播时,所述的花粉粒与雌性谷穗的穗丝接触。谷穗可以 位于散播花粉的相同植物上,或位于不同植物上。花粉细胞发育成称作花 粉管的结构,其中所述的花粉管向下延伸经单个雌性穗丝抵达胚珠。两个 雄性核移动穿过花粉管以抵达位于穗丝基部的单倍体雌性卵。两个雄性核 中的一个雄性核与单倍体雌性卵核融合并且使该卵核受精以形成合子,其 中所述的合子在染色体数目上是二倍体并且将变成谷粒内的胚。另一个雄 性核与第二个雌性卵核融合并且使该卵核受精以形成初生胚乳核,其中所 述的初生胚乳核在染色体数目上是三倍体并且将变成谷物植物谷粒或种子 中的胚乳。未受精的胚珠不产生谷粒并且未受精的组织最终退化。

谷粒由多个部分组成,其中某些部分衍生自母体组织并且其它部分来 自受精过程。谷粒从母体继承多种组织,包括保护性周边囊果皮和花梗。 花梗是将谷粒连接至穗轴并且提供从母体组织至谷粒的营养转移的短柱样 组织。谷粒含有因受精活动而产生的组织,包括新胚和胚乳。胚是下一世 代的缩微祖先,含有用于新生幼龄谷物植物的根和枝条生长的细胞。胚还 是谷粒内贮藏油和蛋白质的一种组织。胚乳也充当营养组织并且提供为胚 萌发及初期生长所需的贮藏淀粉、蛋白质和油形式的能量。

鉴于高等植物中在胚及谷粒发育期间存在的复杂调节,以及鉴于谷粒 通常是动物及人类营养的主要来源,为改善此类营养源所需要的重要工具 包括可以驱动营养增强基因表达的遗传启动子。另一方面,胚对胁迫高度 敏感。对植物的胁迫可以因生物介质和非生物介质引起。例如,胁迫的生 物原因包括病原体感染、昆虫采食及由另一种植物(如槲寄生)寄生以及反 刍动物啃食。非生物性胁迫例如包括过量或不充分的可用水、不充分光照、 极端温度、合成性化学品(如除草剂)、大风、土壤极端pH、有限的营养获 得性和空气污染。然而,利用多种躲避或忍受胁迫的内部机制及外部机制, 植物存活下来并且经常枝繁叶茂,甚至在不利条件下也是如此。植物对胁 迫的生理应答反应反映了在基因表达上的改变。

尽管操作胁迫诱导型基因可能在改善植物对胁迫耐受方面发挥重要作 用,然而已经证实当胁迫不存在时,胁迫诱导型基因的组成型表达不利地 影响植物生长及发育(Kasuga 1999)。因此,本领域需要具有驱动时间差 异表达和/或空间差异表达的启动子,以提供在特定细胞或特定组织中在关 键时间处控制并指导基因表达的手段,尤其旨在提供胁迫耐受性或回避性。 尤其,玉米的干旱胁迫和/或密度胁迫经常导致减产,一般是因植物不能在 谷穗顶端内结实并填充种子,这是一种称作“顶端谷粒流产”或俗称为 “nosing back”的病症。为了在不利环境下稳定植物发育及谷物产量,调 节对发育着的谷穗及其谷粒的激素和碳供应是有意义的。因此,需要在非 生物胁迫条件下在雌性繁殖组织中驱动基因表达的启动子。

植物生物技术领域内另一个众所周知的问题是标记缺失 (marker-deletion)。选择性标记在转化过程用于选择并鉴定转化的生物, 然而在已经鉴定转化的生物后,该选择性标记一般不提供有用功能并且成 为消费者不接受这些“基因食品”产品的主要原因(Kuiper 2001),并且几 乎得不到不以这些机制为基础的标记(Hare 2002)。因此,反复尝试以开发 这样的技术,其中借助此技术可以从植物基因组中切除标记DNA(Ow 1995;Gleave 1999)。本领域技术人员熟悉用于位点定向地去除已重组导 入的核酸序列的多种系统。这些系统主要基于使用序列特异性的重组酶。 已描述多种序列特异性重组系统,如噬菌体P1的Cre/lox系统(Dale 1991; Russell 1992;Osborne 1995)、酵母FLP/FRT系统(Kilby 1995; Lyznik1996)、Mu噬菌体Gin重组酶、大肠杆菌Pin重组酶、质粒pSR1 的R/RS系统(Onouchi1995;Sugita2000)、attP/噬菌体λ系统(Zubko 2000)。这些已知方法在现有技术内的一个已知缺点是在整个植物范围内切 除的不均一性,因此导致嵌合式的切除模式,这需要繁琐的额外选择和再 生轮次。

还描述了在种子或谷粒成熟期间赋予表达增强的启动子(如大麦 (barley)的大麦醇溶蛋白启动子;见美国专利申请20040088754)。在双子 叶植物中指导胚特异性或种子特异性表达的启动子(例如大豆(soybean)伴 大豆球蛋白启动子;Chen 1988;油菜籽蛋白启动子,Kridl 1991)通常不能 在单子叶植物中指导相似的表达。不幸地是,相当少的启动子被鉴定为特 异性指导此方面的生理学(见例如US20040163144)。

章鱼碱合酶(ocs)基因启动子和甘露氨酸合酶(mas)基因启动子已经用 来在转基因植物中指导表达连接的基因。然而,这些启动子的应用已经因 为在转基因植物某些组织中的弱表达水平而受到限制(DiRita1987; Harpster 1988;Sanger 1990)。例如,ocs启动子在转基因烟草中指导差异 明显的细胞特异性表达模式(Kononowicz 1992)。mas基因在叶和茎内显示 弱表达,但在根中具有较强的表达并且显示一定程度的伤口诱导性和植物 生长素诱导性(Langridge 1989;Teeri 1989;;Saito 1991;Guevara-Garcia 1993)。描述了用于在植物中表达基因的嵌合启动子,其中所述的嵌合启动 子包含与根癌农杆菌(Agrobactrium tumerfeciens)冠瘿碱合酶启动子有效连 接的根癌农杆菌冠瘿碱合酶上游激活序列(Ni 1995;US 5,955,646)。表征最 充分的序列是所谓“超级启动子”,这种嵌合构建体包含衍生自根癌农杆菌 章鱼碱合酶基因的三个上游激活序列并与衍生自根癌农杆菌甘露氨酸合酶 基因启动子的转录调节核苷酸序列有效连接。虽然广泛用于双子叶植物, 然而该启动子对单子叶植物的应用经验非常有限。Kononov等(A Comparative Study of the Activity of the Super-promoter with Other Promoters in Maize(1999)第20届crown gall年会,德克萨斯-豪斯顿大学 医学院;摘要集,第36页;Comparative Study of the Activity of the Super-promoter and Other Promoters in Maize(1998)第19届crown gall 年会,普渡大学,West Lafayette,印第安纳州])证实在多种类型组织中的 表达。表达在全部组织内是几乎相同的,但在根内升高。与遍在蛋白启动 子相反,据报道内含子序列存在与否不影响超级启动子的转录活性。

因此本领域中首要需要如此启动子序列,该序列允许在种子发育期间 在淀粉胚乳中的表达以及在种子早期萌发期间在胚中的表达。另外,本领 域中其次迫切需要这样的启动子序列,该序列允许以如此方式强烈地表达 介导切除的酶以至所得植物基本上没有标记。

对于本领域中的首要需要,描述了一些种子特异性启动子或谷粒特异 性启动子,包括与编码植物种子贮藏蛋白的基因(如编码大麦醇溶蛋白、稻 (rice)的稻谷蛋白、水稻素、谷醇溶蛋白或球蛋白;小麦(wheat)的麦醇溶蛋 白或麦谷蛋白;玉米(maize)的玉米醇溶蛋白或谷蛋白;燕麦(oat)的谷蛋白; 高粱(sorghum)的高粱醇溶蛋白;黍(millet)pennisetins或黑麦(rye)的裸麦 醇溶蛋白的基因)连接的那些启动子。然而,这些启动子的表达经常具有泄 露性或其表达水平低。此外,已经指出用多重转基因(“堆积”)对作物植物 改良正越来越有意义。例如,单个玉米杂交体可以包含赋予昆虫抗性和特 定除草剂抗性的重组DNA构建体。需要适宜的调节序列以驱动这些转基 因或其它目的转基因按需要表达。此外,重要的是调节性元件应当彼此明 显不同。与利用相似调节序列驱动多重基因表达相关的担忧包括,但不限 于:(a)整合前在质粒内或整合后在植物基因组中,沿同源区域的配对、交 叉及间插区域丢失;(b)由相反方向彼此邻近的序列的两个拷贝导致的发夹 环,以及切除和丢失这些调节区域的可能性;(c)相同启动子区域的不同拷 贝间对结合启动子特异性转录因子或其它调节性DNA结合蛋白的竞争。

因此,本领域中迫切需要鉴定可以用于在经济重要的植物尤其在单子 叶植物中表达选择的转基因的新序列。因此,本发明目的是提供用于胚乳 和/或胚偏好性或特异性表达的新颖和备选的表达盒。该目的由本发明实 现。

发明概述

本发明的第一实施方案涉及包含表达盒的单子叶植物,所述表达盒包 含

a)嵌合的转录调节核苷酸序列,包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列,

与该嵌合的转录调节核苷酸序列有效连接

b)至少一个核酸序列,其相对于所述嵌合的转录调节核苷酸序列为异 源的并且适用于赋予植物选自如下的性状或特性

i)抗至少一种胁迫因子的增强抗性,

ii)提高的种子营养质量或籽苗营养质量,

iii)提高的产量,和

iv)靶向的序列切除。

优选地,衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序 列和/或衍生自农杆菌章鱼碱合酶基因的上游激活序列源自根癌农杆菌菌 株。

优选地,嵌合的转录调节核苷酸序列引起所述的异源DNA主要在淀 粉胚乳或萌芽胚中表达。

形成本发明的嵌合的转录调节核苷酸序列可能有多种形式。优选地, 所述嵌合的转录调节核苷酸序列包含至少三个衍生自根癌农杆菌章鱼碱合 酶基因的上游激活序列,其中所述的上游激活序列与至少一个衍生自根癌 农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列有效连接。更优选 地,所述嵌合的转录调节核苷酸序列还包含至少一个衍生自根癌农杆菌甘 露氨酸合酶基因的上游激活序列。

在一个优选的实施方案中,衍生自根癌农杆菌的甘露氨酸合酶基因启 动子的转录调节核苷酸序列由选自如下的序列描述:

i)SEQ ID NO:2或3描述的序列,

ii)SEQ ID NO:2或3所述序列中至少50个连续碱基的片段,

iii)与SEQ ID NO:2或3所述的序列具有至少60%序列同一性的核苷 酸序列,

iv)能够与SEQ ID NO:2或3所述的序列、或其互补序列(优选地在 等同于如此条件下,即在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交及在50℃于2×SSC、0.1%SDS中洗涤,更希望是在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃在1×SSC、0.1%SDS中洗涤,还更希望是在50℃在7%十二烷 基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、 0.1%SDS中洗涤,优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更 希望是在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在65℃于0.1×SSC、0.1%SDS中洗涤下)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:2或3所述序列、或其互补序列中50个 至200个或更多个连续核苷酸的核酸(优选地在等同于如此条件下,即在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及 在50℃于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、 0.1%SDS中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤, 优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于 0.1×SSC、0.1%SDS中洗涤下)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补 序列或反向互补序列。

在另一个优选的实施方案中,衍生自根癌农杆菌的章鱼碱合酶基因的 上游激活序列由选自如下的序列描述:

i)SEQ ID NO:1描述的序列,

ii)SEQ ID NO:1所述序列的至少50个连续碱基的片段,

iii)与SEQ ID NO:1所述的序列具有至少60%序列同一性的核苷酸 序列,

iv)能够与SEQ ID NO:1所述序列、或其互补序列(优选地在等同于 如此条件下,即在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃于2×SSC、0.1%SDS中洗涤,更希望是在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 在1×SSC、0.1%SDS中洗涤,还更希望是在50℃在7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS 中洗涤,优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃ 于0.1×SSC、0.1%SDS中洗涤下)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:1所述的序列、或其互补序列中50个至 200个或更多个连续核苷酸的核酸(优选地在等同于如此条件下,即在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及 在50℃于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、 0.1%SDS中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤, 优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于 0.1×SSC、0.1%SDS中洗涤下)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补 序列或反向互补序列.

在更优选的实施方案中,嵌合的转录调节核苷酸序列包含来自章鱼碱 合酶基因的上游激活序列和来自甘露氨酸合酶基因的转录调节核苷酸序列 的特定组合。

在更优选的实施方案中,嵌合的转录调节核苷酸序列由选自如下的序 列描述:

i)SEQ ID NO:4描述的序列,

ii)SEQ ID NO:4所述序列的至少50个连续碱基的片段,

iii)与SEQ ID NO:4所述序列具有至少60%序列同一性的核苷酸序 列,

iv)能够与SEQ ID NO:4所述序列、或其互补序列(优选地在等同于 如此条件下,即在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃于2×SSC、0.1%SDS中洗涤,更希望是在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 在1×SSC、0.1%SDS中洗涤,还更希望是在50℃在7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS 中洗涤,优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃ 于0.1×SSC、0.1%SDS中洗涤下)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:4所述序列、或其互补序列中50个至200 个或更多个连续核苷酸的核酸(优选地在等同于如此条件下,即在50℃于 7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃ 于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS 中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、 0.1%SDS中洗涤下)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补 序列或反向互补序列。

在ii)、iii)、iv)、v)和vi)下所述的序列优选地能够在单子叶植物细胞 或单子叶植物生物中调节转录,它们更优选地能够诱导淀粉胚乳特异性表 达和/或胚特异性表达。优选地,在iv)或v)下所述的序列在严格条件下与 所述的靶序列杂交。

在另一个优选的实施方案中,本发明的表达盒不包含具有表达增强特 性的与所述嵌合的转录调节性序列有效连接的内含子。有效连接的多核苷 酸可以编码如任一SEQ ID NO:6、8、10、12、14、16、18、20、22、43、 45、47、49、50、51或53所述的多肽或其功能等同物,其中所述的功能 等同物能够带来与任一所述多肽所致的相同表型。下文给出更多实例。

核酸序列在嵌合的转录调节性序列控制下的表达可以导致表达蛋白质 或表达反义RNA、有义RNA或双链RNA。

可以有利获得的胁迫抗性优选地对抗非生物性或生物性胁迫因子。生 物性胁迫因子可以选自真菌抗性、线虫抗性、昆虫抗性、病毒抗性和细菌 抗性。优选地,生物性胁迫因子是种子携带的(主要是真菌疾病,例如主要 在小麦中的普通腥黑穗病(小麦光腥黑穗菌(Tilletia tritici));主要在大麦中 的条纹病条纹病(大麦条纹病菌(Pyrenophora graminea))和散黑穗病(麦 散黑粉菌(Ustilago nuda))。

非生物性胁迫因子可以选自水胁迫抗性、干旱抗性、寒冷抗性、盐抗 性、高的植物群体密度和紫外线抗性。优选地,胁迫抗性通过诱导早期萌 发势而实现。

本领域技术人员已知可获得此类胁迫抗性的多种核酸序列。所述的序 列可以包括,但不限于编码参与植物激素生物合成、植物激素调节、细胞 周期调节或糖代谢的多肽的多核苷酸。

本发明可应用于全部单子叶植物如玉米、小麦、稻、大麦、燕麦、黑 麦、高粱、黍、tricalate、香蕉(banana)、黑麦草(ryegrass)或薏苡(coix), 然而优选地适用于禾本科中产生谷粒的谷类植物如玉米、小麦、稻、大麦、 燕麦、黑麦、高粱、黍或tricalate,优选玉米、大麦和小麦,最优选玉米。

本发明的又一实施方案涉及本发明单子叶植物的种子、部分和细胞。 优选地,植物部分选自:细胞、原生质体、细胞组织培养物、愈伤组织、 细胞团块、胚、花粉、胚珠、种子、花、谷粒、谷穗、穗轴、叶、外壳、 柄、根、根尖、花药和穗丝。

本发明的又一个实施方案涉及用于赋予单子叶植物增强的胁迫抗性的 方法,该方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并且适用于赋予植物增强的抗胁迫抗性的至少一 个核酸序列,并且

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述的 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述的转基因植物与不包含所述表达盒但是 在其它方面与该转基因植物相同的植物相比,表现出对至少一个胁迫因子 的增强的抗性。

本领域技术人员已知可获得此类胁迫抗性的多种核酸序列。所述序列 可以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期 调节或糖代谢的多肽的多核苷酸。胁迫因子优选地如上定义。待表达(例如 表达为有义RNA、反义RNA或双链RNA)的异源核酸序列可以编码如任 一SEQ ID NO:6、8、16、18、20、43、45、47、49、50、51或53所述 的多肽(或其部分;优选地是至少5个、更优选至少10个、最优选至少30 个连续氨基酸的部分),或其功能等同物,其中所述的功能等同物能够带来 与任一所述多肽所致的相同表型。优选的嵌合的转录调节核苷酸序列如上 所述,最优选超级启动子。

本发明的又一个实施方案涉及用于赋予单子叶植物提高的种子营养质 量或籽苗营养质量的方法,所述方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并且适用于赋予植物提高的种子营养质量或籽苗 营养质量的至少一个核酸序列,并且

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述的 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述转基因植物与不包含所述的表达盒但是 在其它方面与该转基因植物相同的植物相比,表现出提高的种子营养质量 或籽苗营养质量。

营养质量可以包含选自维生素、类胡萝卜素、抗氧化剂、不饱和脂肪 酸和多不饱和脂肪酸的至少一种化合物的增加的含量。待表达(例如表达为 有义RNA、反义RNA或双链RNA)的异源核酸序列可以编码如任一的SEQ ID NO:10、12或14所述的多肽(或其部分;优选地是至少5个、更优选至 少10个、最优选至少30个连续氨基酸的部分),或其功能等同物,其中所 述的功能等同物能够带来与任一所述多肽所致的相同表型。

营养质量及待表达的相应异源核酸序列如上定义。更具体的实例在下 文给出。优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。

本发明的又一个实施方案涉及用于赋予单子叶植物提高的产量的方法, 所述方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并且适用于赋予植物提高的产量的至少一个核酸 序列,并且

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述的 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述转基因植物与不包含所述的表达盒但是 在其它方面与该转基因植物相同的植物相比,表现提高的产量。

提高的产量及待表达的相应异源核酸序列如上定义。提高的产量可以 因较高的胁迫抗性引起。因此,待表达的异源核酸序列可以编码如任一 SEQ ID NO:6、8、16、18、20、43、45、47、49、50、51或53所述的多 肽(或其部分;优选地是至少5个、更优选至少10个、最优选至少30个连 续氨基酸的部分),或其功能等同物,其中所述的功能等同物能够带来与任 一所述多肽所致的相同表型。优选的嵌合的转录调节核苷酸序列如上所述, 最优选超级启动子。

本发明的又一个实施方案涉及用于从单子叶植物中切除靶序列(例如 标记序列)的方法,所述方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并且适合于诱导从单子叶植物中切除标记序列的 至少一个核酸序列,并且

b)将所述的表达盒插入包含至少一个标记序列的单子叶植物中以提 供转基因植物,其中所述的植物表达所述的异源核酸序列,和

c)选择显示切除所述标记的转基因植物。

通过多种方法实现切除,所述方法包括但不限于:

-使用位点特异性重组酶通过位点特异性重组而诱导序列缺失,其中 所述的位点特异性重组酶由本发明的嵌合的转录调节核苷酸序列表达,

-通过诱导的同源重组而诱导序列缺失,其中待缺失的序列在侧翼分 布有这样的序列,所述序列具有允许在序列间发生同源重组的方向、足够 长度和相互同源性,其中同源重组由位点特异性内切核酸酶(优选归巢内切 核酸酶、更优选归巢内切核酸酶I-SceI)所产生的位点特异性双链断口而诱 导,其中所述的位点特异性内切核酸酶由本发明的嵌合的转录调节核苷酸 序列表达。

待表达的异源核酸序列编码如SEQ ID NO:22所述的多肽(或其部分; 优选至少5个、更优选至少10个、最优选至少30个连续氨基酸的部分), 或其功能等同物,其中所述的功能等同物能够带来与任一所述多肽所致的 相同表型。优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动 子。下文描述为实现序列切除而待表达的优选异源核酸序列(例如编码位点 特异性重组酶或内切核酸酶)。

本发明的又一个实施方案涉及用于核酸序列在单子叶植物中的淀粉胚 乳和/或萌芽胚特异性或偏好地表达的方法,所述方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节 核苷酸序列,

ii)至少一个衍生自根癌农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列是异源的至少一个核酸序列,和

b)将所述的表达盒插入单子叶植物中以提供转基因植物,以及

c)选择转基因植物,其中所述转基因植物表现出所述异源核酸序列的 淀粉胚乳和/或萌芽胚特异性或偏好性表达。

本发明用于淀粉胚乳和/或萌芽胚特异性或偏好性表达的方法将导致 表达异源核酸序列,其中所述异源核酸序列赋予单子叶植物选自如下的至 少一个性状或特性

i)抗至少一个胁迫因子的增强抗性,

ii)提高的种子营养质量或籽苗营养质量,

iii)提高的产量,和

iv)选择标记切除。

优选的所述性状及实现这些性状的序列在下文中详述。

优选应用本发明方法的单子叶植物可以选自玉米、小麦、稻、大麦、 燕麦、黑麦、高粱、香蕉、黑麦草或薏苡。植物优选地是选自玉米、小麦、 大麦、稻、燕麦、黑麦和高粱,甚至更优选地来自玉米、小麦和稻的谷类 植物,植物最优选地是玉米植物。

在本发明的一个优选的实施方案中,从本发明的嵌合的转录调节性序 列中表达的核苷酸序列不编码β-葡糖醛酸糖苷酶(GUS),或不是用于实现 GUS介导性染色目的而表达GUS基因的方法。

附图简述

图1超级启动子∷GUS∷终止子融合构建体(pBPSMM225)的图谱。该 质粒包含有表达构建体,其中所述的表达构建体含有与β-葡糖醛酸糖苷酶 基因(GUS包括马铃薯转化酶[PIV]2内含子)有效连接的超级启动子,以及 胭脂碱合酶(NOS)终止子。SM盒表示选择标记(ahas)盒。

图2在不同发育阶段(A-F)的玉米中受超级启动子控制的GUS表达。 用虚线标出具有明显GUS染色的区域。

(A)在5叶期的叶和根

(B)谷穗(授粉前)

(C)在谷穗上的谷粒(授粉后5日)

(D)谷粒(授粉后20日)

(E)谷粒(授粉后30日)

(F)谷粒(干燥)

本图代表来自15个T1单拷贝株系的可重复性表达图式。

图3在不同萌发期的的玉米谷粒内受超级启动子控制的GUS表达。 转基因植物的谷粒在潮湿滤纸上温育后进行评价。用虚线标出具有明显 GUS染色的区域。

在潮湿滤纸上温育(水吸涨)后的(G)谷粒;G1至G8:水吸涨的第0、3、 5、8、16、24、120和168小时。

本图代表来自15个T1单拷贝株系的可重复性表达图式。

定义

除非另外指明,技术术语根据常规用法使用。分子生物学中常见术语 的定义可以在Lewin,Genes V,Oxford University Press出版,1994年 (ISBN 0-19-854187-9);Kendrew等(编者),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994年(ISBN 0-632-02182-9)以及 Robert A.Meyers(编辑),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,VCH Publishers,Inc.出版,1995年(ISBN 1-56081-569-8)中找到。

应当理解本发明不限于如此所述的特定方法学,方案,细胞系,植物 种或植物属,构建体及试剂。还应当理解本文中所用术语的目的仅是描述 具体的实施方案,并且不意图限制本发明范围,本发明的范围仅受后续权 利要求书限制。必须指出的是如本文中所用并且在后续权利要求书中,单 数形式“一”、“一个”和“该”包括复数指称,除非上下文另外清楚声 明。因此例如,对“一个载体”的指称是对一个或多个载体的指称并包括 本领域技术人员已知的它的等同物等。

术语“约”在本文中用来意指大约、粗略地、左右或在范围内。当术 语“约”随数字范围使用时,该术语通过使界限值扩展高于及低于前述值 而修饰该范围。通常,在本文中使用术语“约”来以(高于或低于)20%、 优选10%以上或以下的变异而修饰高于和低于所述值的数字值。

如本文中所用,词汇“或”意指特定列表的任一成员并且还包括该列 表中成员的任一组合。

术语“基因”广义地用来指与生物学功能相关的任何核酸节段。因此, 基因包括编码序列和/或为表达这些编码序列所需要的调节序列。例如,基 因指表达mRNA或功能性RNA的或编码特定蛋白质的核酸片段,并且包 括调节序列。基因还包括例如形成对其它蛋白质的识别序列的非表达DNA 节段。基因可以获得自多种来源,包括自目的来源克隆或或自已知或预测 的序列信息合成,并且可以包括设计以具有所需要参数的序列。

术语“天然的”或“野生型”基因指在未转化细胞(即不具有已知突变 的细胞)的基因组中存在的基因。

“标记基因”编码可选择或可筛选的性状。

术语“嵌合基因”指任何基因,其中该基因含有

1)包括自然界中不一起存在的调节性序列和编码序列的DNA序列, 或

2)编码不天然地结合在一起的蛋白质的部分的序列,或

3)不天然地结合在一起的启动子的部分。

因此,嵌合基因可以包含源自不同来源的调节序列和编码序列,或包 含源自相同来源,但是以不同于自然界中存在的方式排列的调节序列和编 码序列。

“转基因”指已经通过转化而导入基因组并且得以稳定维持的基因。 转基因可以包括例如对待转化的特定植物的基因为异源或同源的基因。此 外,转基因可以包含插入至非本原生物的天然基因或包含嵌合基因。术语 “内源基因”指位于其在生物基因组中天然位置中的天然基因。“外来的” 基因指通常不存在于宿主细胞内,但通过基因转移而导入的基因。

例如用于探测或扩增反应中的与本发明核苷酸序列相对应的“寡核苷 酸”可以是约30个或更少核苷酸长度(例如9、12、15、18、20、21或24 个或在9和30个之间的任一数目)。通常,特异性引物多达14个核苷酸长 度。为了最佳的特异性和成本效率,可以优选16至24个核苷酸长度的引 物。本领域中技术人员完全能够针对使用方法如PCR法设计引物。根据需 要,可以用本文中公开的基因的整个限制性片段完成探测,其中所述的限 制性片可以是100个或甚至1,000个核苷酸长度。

在本文中可互换地使用术语“多肽”、“肽”、“寡肽”、“多肽”、“基因 产物”、“表达产物”和“蛋白质”,以指示连续氨基酸残基的聚合物或寡聚体。 如本文中所用,术语“氨基酸序列”或“多肽序列”指代表氨基酸残基的一 系列缩写、字母、字符或词。氨基酸可以由其通常已知的三字母符号或由 IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号在本文中指称。本文中所用的缩写是用于 氨基酸的常规单字母代码氨基酸:A,丙氨酸;B,天冬氨酸(asparagine) 或天冬氨酸;C,半胱氨酸;D天冬氨酸;E,谷氨酸(glutamate),谷氨酸 (glutamic acid);F,苯丙氨酸;G,甘氨酸;H组氨酸;I异亮氨酸;K, 赖氨酸;L,亮氨酸;M,甲硫氨酸;N,天冬氨酸;P,脯氨酸;Q,谷 氨酰胺;R,精氨酸;S,丝氨酸;T,苏氨酸;V,缬氨酸;W,色氨酸; Y,酪氨酸;Z,谷氨酰胺或谷氨酸(见L.Stryer,Biochemistry,1988, W.H.Freeman and Company,New York)。如本文中所用的氨基酸序列中 的字母“X”可以代表任一氨基酸残基。

“编码序列”指编码特定氨基酸序列并且不包括非编码序列的DNA序 列或RNA序列。它可以形成“未打断的编码序列”(即无内含子),如在 cDNA中的情况,或它可以包括通过适宜的剪接点界定的一个或多个内含 子。“内含子”是RNA中这样的序列,该序列包含于初级转录物内,但在 细胞内经切割和RNA再连接而被去除,以产生可以翻译成蛋白质的成熟 mRNA。

术语“可读框”和“ORF”指在编码序列的翻译起始密码子和终止密 码子之间所编码的氨基酸序列。术语“起始密码子”和“终止密码子”指 编码序列内分别指示蛋白质合成(mRNA翻译)起始和链终止的毗邻三核苷 酸单元(“密码子”)。

“功能性RNA”指反义RNA、核酶或其它非翻译的RNA。

术语“RNA转录物”指通过RNA聚合酶催化的DNA序列转录所产生 的产物。当RNA转录物是该DNA序列的完全互补性拷贝时,此RNA称 作初级转录物,或RNA转录物可以是衍生自初级转录物的翻译后加工中 的RNA序列并且称作成熟RNA。“信使RNA”(mRNA)指没有内含子并可 以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补并且衍生自其 中的单链DNA或双链DNA。

“转录调节核苷酸序列”、“调节序列”和”合适的调节序列”均指可影 响已接合(或功能性连接)的待转录核苷酸序列的转录、RNA加工或稳定性 或者翻译的核苷酸序列。转录调节核苷酸序列可以相对于待转录的核苷酸 序列具有多种定位。转录调节核苷酸序列可以位于待转录序列(例如编码序 列)的上游(5’非编码序列),在其内或下游(3’非编码序列)。转录调节核苷酸 序列可以选自增强子、启动子、翻译前导序列、内含子、5’-非翻译序列、 3’-非翻译序列和加A信号序列。它们包括天然序列及合成性序列以及可以 是合成性序列与天然序列组合的序列。如以上指出,术语“转录调节核苷酸 序列”不限于启动子。然而,本发明的转录调节核苷酸序列优选地包含至少 一个启动子序列(例如位于能够诱导下游序列转录的基因的转录起始处上 游的序列)。在一个优选的实施方案中,本发明的转录调节核苷酸序列包含 相应基因的启动子序列和(任选地且优选地)所述基因的天然5’非翻译区。 此外,还可以采用所述基因的3’非翻译区和/或聚腺苷酸化区域。

“启动子”指通过提供对RNA聚合酶和为正确转录所需要的其它因子 (例如反式作用转录因子)的识别而控制编码序列表达的核苷酸序列,通常 位于其编码序列的上游(5′)。“启动子”包括对其添加调节性元件(例如顺 式元件)以控制表达的最小启动子,其中所述的最小启动子是包含起到指示 转录起点作用的TATA盒和其它序列的短DNA序列。“启动子”还指包 括最小启动子和能够控制编码序列或功能性RNA表达的调节性元件的核 苷酸序列。这种类型的启动子序列由近端的上游元件和更远的上游元件组 成。更远的上游元件常称作增强子。因此,“增强子”是这样的DNA序列, 该DNA序列可以刺激启动子活性并且可以是启动子的固有元件或是为增 强启动子的水平或组织特异性而插入的异源元件。增强子能够在(正常或倒 转)两个方向上发挥作用,并且甚至当被移到启动子的上游或下游时还能够 履行功能。增强子和其他上游启动子元件结合介导其效应的序列特异性 DNA结合蛋白。启动子可以完整地衍生自天然基因或包含源自自然界发现 的不同启动子的不同元件,或甚至包含合成性DNA节段。启动子还可以 含有参与蛋白质因子结合的DNA序列,其中所述的蛋白质因子控制应答 于生理条件或发育条件的转录起始的效率。如本文中所用,术语“顺式元件” 指赋予整体控制基因表达某个方面的顺式作用转录调节元件。顺式元件可 以起到结合转录因子、结合调节转录的反式作用蛋白质因子的作用。一些 顺式元件结合多于一种转录因子,并且转录因子可以与多于一种的顺式元 件以不同亲和力相互作用。本发明的启动子受欢迎地含有可以导致或调节 基因表达的顺式元件。可以通过多种技术鉴定顺式元件,其中所述的技术 包括缺失分析(即从启动子的5’端或内部缺失一个或多个核苷酸;使用DNA 酶I足迹法的DNA结合蛋白分析、甲基化干扰、电泳迁移率移动分析、通 过连接介导的PCR进行体内(in vivo)基因组足迹法和其它常规分析;或通 过与已知顺式元件基序的常规DNA序列比较方法的DNA序列相似性分 析。顺式元件的精细结构可以通过诱变(或替换)一个或多个核苷酸或通过 其它常规方法进一步研究。顺式元件可以通过化学合成或通过从包含如此 元件的启动子中分离而得到,并且可以合成具有额外的侧翼核苷酸的顺式 元件,其中所述的额外侧翼核苷酸含有用于促进亚序列操作的限制酶位点。

“起始位点”是在作为已转录序列的部分的环绕第一核苷酸的位置,其 中所述的位置又定义为位置+1。相对于该位点,对基因及其调控区域的全 部其它序列进行编号。下游序列(即3’方向的其它蛋白质编码序列)命名为 正数,而上游序列(大部分是5’方向的调控区域)命名为负数。

在上游激活作用缺乏时无活性或具有明显降低的启动子活性的启动子 元件、特别是TATA元件称作“最小启动子或核心启动子”。在合适的转录 因子存在下,最小启动子起到允许转录的作用。“最小启动子或核心启动子” 因此仅由对于转录起始所需要的全部基础元件组成,例如TATA盒和/或起 始子。

术语“内含子”指在基因中DNA的部分(间插序列),其中所述的部分不 编码由基因所产生蛋白质的部分并且在转录自该基因的mRNA输出离开 细胞核之前,从该mRNA中被剪接出来。内含子序列指内含子的核酸序列。 因此,内含子是DNA序列中这样的区域,该区域随编码序列(外显子)一起 转录但是在成熟mRNA形成期间被去除。内含子可以位于实际的编码区域 内或位于前mRNA(未剪接mRNA)的5’或3’非翻译前导序列中。初级转录 物中的内含子被切除并且编码序列同时而精确地被连接以形成成熟的 mRNA。内含子与外显子的接点形成剪接位点。内含子的序列始于GU并 且止于AG。此外,已经描述植物中AU-AC内含子的两个实例:来自拟南 芥菜(Arabidopsis thaliana)的RecA样蛋白质基因的内含子14和G5基因 的内含子7是AT-AC内含子。除了其它序列之外,含有内含子的前mRNA 还具有对于精确剪接内含子所必需的三个短序列。这些序列是5’剪接位点、 3’剪接位点和分枝点。mRNA剪接是在初级mRNA转录物内存在的间插序 列(内含子)的去除和外显子序列的接合或连接。这又称作顺式剪接,其中 所述的顺式剪接使同一RNA上的两个外显子接合,并去除间插序列(内含 子)。内含子的功能性元件包含由剪接体中(例如剪接在内含子末端的共有 序列的)特定蛋白质成分结合和识别的序列。功能性元件与剪接体的相互作 用导致从成熟前mRNA中去除内含子序列并使外显子序列再连接。内含子 具有对于精确剪接内含子所必需(尽管不充分)的三个短序列。这些序列序 列是5’剪接位点、3’剪接位点和分枝点。分枝点序列对于植物中剪接和剪 接位点的选择是重要的。分枝点序列通常位于3’剪接位点上游10-60个核 苷酸。植物序列在分枝点处显示序列变异性,共有序列是CURAY或 YURAY。

“组成型表达”指使用组成型启动子或可调节启动子的表达。“条件性 表达”和“可调型表达”指受可调节启动子控制的表达。

“组成型启动子”指这样的启动子,该启动子能够使受该启动子控制的 可读框(ORF)在全部或几乎全部植物组织中在全部或几乎全部植物发育 期期间表达。每一转录激活元件均不显示绝对的组织特异性,但是以其中 转录最活跃的植物部分中所达到水平的至少1%的水平在植物的绝大部分 中介导转录激活。

“可调节启动子”指这样的启动子,该启动子不以组成型方式而以时间 调节方式和/或空间调节方式指导基因表达,并且包括组织特异性启动子和 诱导型启动子。可调节启动子包括天然序列、合成性序列以及这样的序列, 其可以是合成性序列与天然序列的组合。不同启动子可以指导基因在不同 的组织或细胞类型中或在不同发育期或应答于不同环境条件的表达。不断 发现多种类型用于植物细胞的新启动子,众多实例可以在Okamuro等 (1989)的编著内找到。植物中有用的常见可调节启动子包括,但不限于安 全剂诱导型启动子、衍生自四环素诱导型系统的启动子、衍生自水杨酸诱 导型系统的启动子、衍生自醇诱导型系统的启动子、衍生自糖皮质激素诱 导型系统的启动子、衍生自病原体诱导型系统的启动子和衍生自蜕皮激素 诱导型系统的启动子。

“组织特异性启动子”指并非在全部植物细胞中表达而仅在特定器官 (如叶或种子)、在特定组织(如胚或子叶)的一种或多种细胞类型中,或在特 定细胞类型(如叶薄壁组织细胞或种子贮藏细胞)中表达的可调节启动子。 这些启动子还包括例如在早期或晚期胚发生、在正在发育的种子或果实的 果实成熟期间、在充分分化的叶或在衰老发生时,以时间方式调节的启动 子。

“诱导型启动子”指可以由外部的刺激(如化学品、光线、激素、胁迫 或病原体)在一种或多种细胞类型中开启的那些可调节启动子。

“有效连接的”或“功能性连接的”优选地指将多个核酸序列连接为单 个核酸片段,以至于一个核酸序列的功能受另一个核酸序列的影响。例如, 将调节性DNA序列称作与编码RNA或多肽的DNA序列“有效连接”或“连 接”,如果这样安放这两种序列以至于调节性DNA序列影响编码性DNA 序列的表达(即编码序列或功能性RNA受启动子的转录性控制)。编码序列 可以有义方向或反义方向与调节序列有效连接。

“表达”指植物中内源基因、ORF或其部分或转基因的转录和/或翻译。 例如,在反义构建体的例子中,表达可以仅指反义DNA的转录。此外, 表达指有义RNA(mRNA)或功能性RNA的转录和稳定累积。表达还可以 指蛋白质的产生。

“特异性表达”是限于一种或一些植物组织(空间限制)和/或一个或一些 植物发育期(时间限制)的基因产物的表达。已知几乎不存在真正的特异 性:启动子似乎优选地在某些组织中开启,而在其它组织中可能不存在活 性或仅有少量活性。这种现象称作渗漏表达。然而,本发明中的特异性表 达意指在一种或一些植物组织中的优选表达。

(具有或没有增强子的)启动子的“表达模式”是显示所述启动子在植物 中何处及在哪个发育期启动转录的表达水平模式。将一组启动子的表达模 式称为是互补性的,当一个启动子的表达模式与另一个启动子的表达模式 显示很少重叠时。启动子的表达水平可以通过测量已转录的标准报道 mRNA的‘稳态’浓度来确定。该测量是间接的,因为报道mRNA的浓度不 仅仅取决于它的合成速率,还取决于mRNA降解速率。因此,稳态水平是 合成速率和降解速率的结果。然而当转录的序列相同时,可以认为降解速 率以固定速率进行,并且该值因此可以起到测量合成速率的作用。当以这 种方式比较启动子时,本领域中技术人员可用的技术是杂交、S1-RNA酶 分析法、RNA印迹法和竞争性RT-PCR。所列技术无论如何不代表全部可 用的技术,仅描述了用来分析mRNA的转录活性和表达水平的常用方法。 在几乎全部启动子中的转录开始点分析已经揭示通常在转录开始处不存在 单个碱基,而是存在或多或少簇集的起始位点集合,其中每个起始位点构 成mRNA的一些开始点。因为这种分布在启动子与启动子之间不同,故每 一群体内的报道mRNA序列将彼此不同。由于每一mRNA种类或多或少 地倾向于降解,因而不能对不同的报道mRNA预期单一的降解速率。已经 证实对于多种真核生物启动子序列,起始位点(“起始子”)周围的序列在 决定由所述特定启动子指导的RNA表达水平中发挥重要作用。这种序列 还包括已转录序列的部分。因此,启动子与报道序列的直接融合将导致次 优水平的转录。通常用于分析表达模式和表达水平的方法是测定细胞内蛋 白质累积的‘稳态’水平。本领域中技术人员已知通常使用的候选报道基因 是β-葡糖醛酸糖苷酶(GUS)、氯霉素乙酰基转移酶(CAT)和具有荧光特性 的蛋白质如来自维多利亚水母(Aequora victoria)的绿色荧光蛋白(GFP)。 然而原则上,众多其它蛋白质是合适用于此目的,只要蛋白质不干扰重要 的植物功能。多种工具适用于定量和确定定位。可以轻易地产生或获得这 样的检测系统,该检测系统基于例如免疫化学、酶、荧光的检测和定量。 蛋白质水平可以使用蛋白质表达的原位分析法在植物组织提取物或在完整 组织中测定。通常,用一种嵌合启动子报道构建体转化的单个株系在它们 的报道基因表达水平上不同。还经常观察到此类转化体不表达任何可检测 产物(RNA或蛋白质)的现象。通常将表达的变异性归咎于‘位置效应’,虽 然决定这种无活性的分子机制往往不明。

“过量表达”指转基因细胞或转基因生物中这样的表达水平,其超过在 正常或未转化(非转基因)细胞或生物中的表达水平。

“5’非编码序列”或“5’-非翻译序列”或“-区域”指位于编码序列5’(上 游)的核苷酸序列。该核苷酸序列存在于完全加工的mRNA的起始密码子 上游并且可以影响初级转录物至mRNA的加工、mRNA稳定性或翻译效 率(Turner 1995)。

“3’非编码序列”或“3’-非翻译序列”或“-区域”指位于编码序列3’(下 游)的核苷酸序列并且包括加A信号序列和其它序列,其中所述的其它序列 编码能够影响mRNA加工或基因表达的调节信号。加A信号通常以影响 聚腺苷酸添加至mRNA前体的3’末端。对不同3’非编码序列的使用由 Ingelbrecht等,1989示例。

术语“翻译前导序列”指基因在启动子和编码序列之间的DNA序列部 分,该部分转录成RNA并且存在于完全加工的mRNA的翻译起始密码子 的上游(5′)。翻译前导序列可以影响初级转录物至mRNA的加工、mRNA 稳定性或翻译效率。

“信号肽”指多肽的氨基末端延伸,其与多肽一起被翻译形成前体肽并 且是前体肽进入分泌途径内所需要的。术语“信号序列”指编码信号肽的核 苷酸序列。如本文中所用的术语“转运肽”指已表达多肽的部分(优选地在多 肽的氨基末端延伸),该部分与多肽一起被翻译形成前体肽并且是前体肽进 入细胞器(如质体(例如叶绿体)或线粒体)内所需要的。术语“转运序列”指编 码转运肽的核苷酸序列。

“反义抑制”指产生能够抑制来自内源基因或转基因的蛋白质表达的 反义RNA转录物。

“基因沉默”指病毒基因、转基因或内源核基因的同源依赖性抑制。基 因沉默可以是转录水平的,此时抑制是因受影响基因转录降低所致,或是 转录后的,此时抑制是因与受影响基因同源的RNA种类的周转(降解)增加 所致(English 1996)。基因沉默包括病毒诱导的基因沉默(Ruiz等1998)。

如本文中所用的术语“异源DNA序列”、“外源DNA节段”或“异源核 酸”均指源自对特定宿主细胞为外来的来源中的序列,或若来自相同来源, 则相对于其原初形式受到了修饰。因此,宿主细胞内的异源基因包括对特 定宿主细胞是内源性的,但已经(例如通过利用DNA改组)被修饰的基因。 该术语还包括天然存在的DNA序列的非天然存在的多重拷贝。因此,本 术语指这样的DNA节段,其对于细胞是外来或异源的,或虽然对该细胞 是同源的,但是处于宿主细胞核酸中该节段通常不存在的位置内。表达外 源DNA节段以便产生外源多肽。“同源”DNA序列是这样的DNA序列, 其与导入该DNA序列的宿主细胞天然地相关。

在核苷酸序列同一性上下文中“同源于”指两种核酸分子的核苷酸序列 之间或两种蛋白质分子的氨基酸序列之间的相似性。此类同源性的评估通 过在如本领域中技术人员充分理解的严格条件下(如在Haines和Higgins (编者),Nucleic Acid Hybridization,IRL Press,Oxford,U.K.中描述)的 DNA-DNA杂交或DNA-RNA杂交或通过两种核酸或两种蛋白质之间的序 列相似性比较而提供。

术语“基本上相似”指代表本文中所公开的拟南芥菜序列或欧洲油菜 (Brassica napus)序列的功能性和/或结构性等同物或直向同源物的核苷酸 和氨基酸序列。

在最广泛的意义上,当在本文中用于核苷酸序列时,术语“基本上相 似”意指核苷酸序列是编码这样的多肽的基因的部分,其中所述多肽基本 上具有如作为参考核苷酸序列的基因所编码的多肽那样的相同结构和功 能,例如,该核苷酸序列包含来自基因(其中该基因是对应于参考核苷酸序 列的基因的直向同系物)的启动子以及与本文中特别例举启动子序列在结 构上相关的启动子序列,即基本上相似的启动子序列与本文中例举的启动 子序列的互补序列在高严格条件或极高严格条件下杂交。例如,仅反映遗 传密码子简并性而总是编码与特定氨基酸序列相同的氨基酸序列的改变的 核苷酸序列与编码这种特定氨基酸序列的核苷酸序列基本上相似。术语“基 本上相似”还包括在其中例如序列已经被修饰以优化在特定细胞中表达的 核苷酸序列以及编码相对于参考序列所编码(未修饰)多肽,具有一个或多 个氨基酸替换的变体多肽的核苷酸序列,其中所述的替换不改变变体多肽 相对于未修饰多肽的活性。

在最广义的含义上,当本文中用于多肽时,术语“基本上相似”意指 多肽基本上具有与参考多肽相同的结构和功能。此外,与特定序列基本上 相似的氨基酸序列是这样的氨基酸序列,其中整体氨基酸同一性是本发明 序列的至少60%或更高。产生等效核苷酸或氨基酸序列的修饰完全处于本 领域的常规技术范围内。基本上相似的多肽与参考多肽之间的氨基酸序列 同一性百分数是至少60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%、例如71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%并且甚至是90%或更高、例如91%、92%、93%、94%、95%、96%、 97%、98%、高达至少99%。除了具有基本上相同的功能以外,两种多肽 彼此基本上相似的一个指标是与所述一种多肽特异性结合的物质(例如抗 体)也与另一种多肽特异性结合。

序列比较可以使用Smith-Waterman序列比对算法(见例如 Waterman(1995))开展。优选地使用具有如下参数的localS程序(1.16版本): 匹配:1、错配罚分:0.33,开放空位罚分:2,空位延伸罚分:2。

此外,将与参考核苷酸序列“基本上相似”的核苷酸序列称作与参考核 苷酸序列“等效”。技术人员认识到本发明所包括的等效核苷酸序列还可以 由它们在低严格、中等严格和/或严格条件(例如0.1×SSC、0.1%SDS、65℃) 下与本权利要求书字面意思范围内的核苷酸序列杂交的能力加以定义。

当谈及多核苷酸或多肽片段时,“基本上相同活性”的含义是该片段具 有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、例如71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%并且甚 至90%或更高,例如91%、92%、93%、94%、95%、96%、97%、98%、 高达至少99%的全长多核苷酸或全长多肽的活性。

“靶基因”指在复制子上表达所需要的靶编码序列、功能性RNA或蛋 白质的基因。靶基因对复制子的复制不是必需的。此外,靶基因可以包含 插入非本源生物中的非病毒天然基因,或嵌合基因,并且将受合适的调节 序列控制。因此,靶基因内的调节序列可以来自任何来源,包括病毒。靶 基因可以包括对待转化特定植物的基因为异源的或同源的编码序列。然而, 靶基因不包括天然病毒基因。一般的靶基因包括,但不限于编码结构蛋白、 种子贮藏蛋白、赋予除草剂抗性的蛋白质和赋予昆虫抗性的蛋白质的基因。 由靶基因编码的蛋白质称作“外来蛋白质”。植物中靶基因的表达通常产生 改变的植物性状。

术语“改变的植物性状”意指转基因植物中相对于野生型或非转基因 植物宿主的任何表型改变或基因型改变。

“复制基因”指编码病毒复制蛋白的基因。除了复制蛋白的ORF之外, 复制基因还可以含有其它的交叠或非交叠的ORF,如在自然界中病毒序列 内所发现那样。尽管对复制是非必需的,这些额外的ORF可以增强复制 和/或病毒的DNA累积。此类额外ORF的实例分别是ACMV和TGMV 双粒病毒组中的AC3和AL3。

“嵌合的反式作用复制基因”指例如这样的复制基因,在该复制基因中 复制蛋白的编码序列处在修饰的植物启动子而不是病毒天然复制基因的启 动子控制下,或指修饰的病毒天然复制基因,例如在其中位点特定的序列 插入受转录而不翻译的5’区域内。此类嵌合基因还包括插入结合在减弱病 毒复制蛋白基因转录的启动子与转录起点之间的复制蛋白的已知位点。

“染色体整合的”指外来基因或DNA构建体通过共价键整合至宿主 DNA。在基因未发生“染色体整合”时,它们可以进行“瞬时表达”。基因 的瞬时表达指这样的基因表达,其中所述的基因未整合至宿主染色体中, 但是例如作为自主复制的质粒或表达盒的部分或作为另一种生物系统(如 病毒)的部分独立地发挥作用。

术语“转化”指核酸片段转移至宿主细胞的基因组中,产生遗传稳定的 遗传。含有已转化的核酸片段的宿主细胞称作“转基因”细胞并且包含转 基因细胞的生物称作“转基因生物”。植物和植物细胞的转化方法实例包括 农杆菌介导性转化(De Blaere 1987)和粒子轰击技术(US 4,945,050)。完整 植物可以通过技术人员众所周知的方法自转基因细胞再生(见例如,Fromm 1990)。

“转化的”、“转基因的”和”重组的”指其中已经导入异源核酸分子的 宿主生物如细菌或植物。核酸分子可以稳定整合至通常本领域中已知并公 开的基因组中(Sambrook 1989;Innis 1995;Gelfand 1995;Innis & Gelfand 1999)。PCR的已知方法包括,但不限于使用成对引物、巢式引物、单特 异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物 等的方法。例如,“转化的”、“转化体”和“转基因”植物或愈伤组织已 经通过转化方法产生并含有整合至其染色体内的外来基因。术语“未转化 的”指未经历转化过程的正常植物。

“瞬时转化的”指其中转基因和外来DNA(例如通过如农杆菌介导性 转化或生物射弹轰击的方法)已经导入,但是没有对稳定维持加以选择的细 胞。

“稳定转化”指转化后已经在选择性培养基上进行选择并再生的细胞。

“瞬时表达”指在其中病毒或转基因在由病毒感染或由如农杆菌介导 性转化、电穿孔或生物射弹轰击的方法而导入,但是没有对稳定维持进行 选择的细胞内的表达。

“遗传稳定的”和“可遗传的”指稳定维持于植物中并经过连续世代由 子代稳定遗传的染色体性整合的遗传元件。

“原代转化体”和”T0世代”指具有如最初所转化组织(即转化以来没有 经历减数分裂和受精)那样相同的遗传世代的转基因植物。

“次代转化体”和”T1、T2、T3等世代”指源自经历一个或多个减数分 裂循环和受精循环的原代转化体的转基因植物。它们可以通过原代转化体 或次代转化体的自我受精或原代转化体或次代转化体与其它已转化或未转 化的植物杂交而衍生。

“野生型”指没有任何已知突变的天然存在的病毒或生物。

术语“基因组”或“基因组DNA”指宿主生物的可遗传性遗传信息。所述 基因组DNA包含细胞核DNA(又称作染色体DNA),还包含质体(例如叶绿 体)和其它细胞器(例如线粒体)的DNA。术语“基因组”或“基因组DNA”优 选地指细胞核的染色体DNA。

术语“染色体DNA”或“染色体DNA序列”应当理解为独立于细胞周期 状态的细胞核的基因组DNA。染色体DNA因此可以组织在染色体或染色 单体中,它们可是是压缩的或松散的。可以通过本领域中已知的多种方法 例如聚合酶链式反应(PCR)分析、DNA印迹分析、荧光原位杂交(FISH) 和原位PCR证实和分析对染色体DNA的插入。

术语“核酸”指脱氧核糖核苷酸或核糖核苷酸及其单链或双链形式的由 含有糖、磷酸酯和碱基(嘌呤或嘧啶)的单体(核苷酸)组成的聚合物。除非专 门界定,否则该术语包括含有天然核苷酸的已知类似物的核酸,其中所述 的核酸具有如参考核酸那样的相似结合特性并且以如天然存在的核苷酸那 样的相似方式进行代谢。除非另外说明,特定的核酸序列还内在地包括其 保守性修饰的变体(例如简并密码子替换)和互补性序列和明确说明的序 列。具体地,简并密码子替换可以通过生成这样的序列而实现,在所述的 序列中一个或多个所选择(或全部)密码子的第三位置由混合的碱基和/或脱 氧次黄苷残基替换(Batzer 1991;Ohtsuka 1985;Rossolini 1994)。“核酸 片段”是给定的核酸分子的部分。在高等植物中,脱氧核糖核酸(DNA)是遗 传材料,而核糖核酸(RNA)参与将DNA内所包含的信息转移至蛋白质。术 语“核苷酸序列”指可能是单链或双链的DNA或RNA的聚合物,其中所 述的聚合物任选地含有能够掺入DNA或RNA聚合物中的合成的、非天然 的或改变的核苷酸碱基。术语“核酸”或“核酸序列”还可以与基因、cDNA、 DNA和由基因编码的RNA互换地使用。

本发明包括分离的或基本上纯化的核酸或蛋白质组合物。在本发明的 上下文中,“分离的”或“纯化的”DNA分子或“分离的”或“纯化的”多肽是 这样的DNA分子或多肽,其因人为作用而脱离其天然环境存在并且因此 不是自然的产物。分离的DNA分子或多肽可以以纯化的形式存在或可以 存在于非天然环境(例如转基因宿主细胞)内。例如“分离的”或“纯化的” 核酸分子或蛋白质或其生物活性部分在通过重组技术产生时,基本上没有 其它的细胞材料或培养基,或在化学地合成时,基本上没有化学前体或其 它化学品。优选地,“分离的”核酸(优选地是蛋白质编码序列)没有在该核 酸来源的生物的基因组DNA中天然分布在该核酸侧翼的序列(即所述序列 位于所述核酸的5′和3′末端)。例如,在多种实施方案中,分离的核酸分子 可以含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该核 酸来源的细胞的基因组DNA内天然分布在该核酸分子侧翼的核苷酸序列。 基本上没有细胞材料的蛋白质包括这样的蛋白质制品或多肽制品,所述制 品具有少于约30%、20%、10%、5%(干重)的杂质蛋白质。当重组产生 本发明的蛋白质或其生物活性部分时,培养基优选地占少于约30%、20%、 10%、或5%(干重)的化学前体或非目的蛋白质化学品。本发明的核苷酸 序列包括天然存在的序列和突变(变体)形式。此类变体将仍具有所需要的 活性,即启动子活性或由未变异核苷酸序列中可读框所编码的产物的活性。

关于序列(例如多肽或核酸序列例如本发明的转录调节核苷酸序列), 术语“变体”意指基本上相似的序列。对于包含可读框的核苷酸序列,变体 包括因遗传密码子简并性而编码天然蛋白质中相同氨基酸序列的序列。诸 如此类的天然存在的等位变体可以用众所周知的分子生物学技术(例如用 聚合酶链式反应(PCR)和杂交技术)鉴定。变体核苷酸序列还包括以合成方 式衍生的核苷酸序列,例如通过使用位点定向诱变生成并编码天然蛋白质 (对于可读框而言)的那些核苷酸序列,以及编码相对于天然蛋白质,具有 氨基酸替换的多肽的那些核苷酸序列。通常,本发明的核苷酸序列变体对 天然(野生型或内源性)核苷酸序列具有至少40、50、60,至70%,例如 优选71%、72%、73%、74%、75%、76%、77%、78%、至79%,通常 至少80%,例如81%-84%、至少85%,例如86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%,至98%和99%的 核苷酸序列同一性。

特定核酸序列的“保守性修饰的变异”指编码相同或基本上相同的氨基 酸序列的那些核酸序列,或当核酸序列不编码氨基酸序列时,涉及基本上 相同的序列。因为遗传密码子简并性,大量的功能相同的核酸编码任何给 定的多肽。例如,密码子CGT、CGC、CGA、CGG、AGA和AGG均 编码氨基酸精氨酸。因此,在密码子指定为精氨酸的位置上,可以将该密 码子改变成所述的任何对应密码子,而不改变所编码的蛋白质。此类核酸 变异是“沉默变异”,其为“保守性修饰的变异”中的一种类型。除非另外 指出,本文中所述的编码多肽的每种核酸序列还描述了每种可能的沉默变 异。技术人员将认识到可以通过标准技术在核酸中修饰每个密码子(ATG 例外,该密码子通常是仅用于甲硫氨酸的密码子)以产生功能性相同的分 子,因此,编码多肽的核酸的每种“沉默变异”包含在每种所描述的序列中。

可以“优化”本发明的核酸分子以增强在目的植物中的表达(见例如, WO 91/16432;Perlak 1991;Murray 1989)。以此方式,可以利用植物优 选的密码子合成基因或基因片段内的可读框(见例如,Campbell和Gowri, 1990年对宿主-优选的密码子用途的讨论)。因此,可以优化核苷酸序列用 于在任何植物中的表达。已经认识到基因序列的全部或任何部分可以是优 化的或合成性的,也即还可以使用合成性或部分优化的序列。变异的核苷 酸序列和蛋白质还包括衍生自诱变方法和重组方法(如DNA改组)的序列和 蛋白质。用这种方法,可以操作一种或多种不同的编码序列以产生具有所 需特性的新多肽。以这种方式,从相关序列的多核苷酸群体中生成重组多 核苷酸文库,其中所述的多核苷酸群体包含具有相当的序列同一性并可以 进行体外(in vitro)或体内同源重组的序列区域。本领域中已知用于这种 DNA改组的策略(见例如,Stemmer 1994;Stemmer 1994;Crameri 1997; Moore 1997;Zhang 1997;Crameri 1998和US 5,605,797,9,11,13,15 和17,837,458)。

就“变体”多肽而言,意指通过蛋白质氨基末端和/或羧基末端缺失(所 谓截短)或添加一个或多个氨基酸;在天然蛋白质内一个或多个位点处缺失 或添加一个或多个氨基酸或在天然蛋白质内一个或多个位点处替换一个或 多个氨基酸而衍生自天然蛋白质的肽。此类变体可以因遗传多态性或因人 类操作产生。用于此类操作的方法通常在本领域中是已知的。

因此,多肽可以通过多种方法(包括氨基酸替换、缺失、截短和插入) 改变。用于此类操作的方法通常在本领域中是已知的。例如,多肽的氨基 酸序列变体可以通过DNA突变而制备。用于诱变和核苷酸序列变异的方 法在本领域中是众所周知的(见例如,Kunkel 1985;Kunkel 1987;US 4,873,192;Walker和Gaastra,1983及其中引用的参考文献)。可以在 Dayhoff等(1978)的模型中找到对没有影响目的蛋白生物学活性的适宜氨 基酸替换的指导。优选是保守性替换,如将一个氨基酸交换为具相似特性 的其它氨基酸。在编码的序列中改变、增加或缺失单个氨基酸或小百分比 例的氨基酸(一般少于5%,更一般地少于1%)的分别的替换、缺失或添加 是“保守性修饰的变异”,其中改变导致氨基酸用化学相似的氨基酸替换。 本技术领域众所周知提供功能相似的氨基酸的保守性替换表。如下五个组 分别含有可以相互实施保守性替换的氨基酸:脂肪族:甘氨酸(G)、丙氨酸 (A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I);芳族:苯丙氨酸(F)、酪氨酸(Y)、 色氨酸(W);含硫:甲硫氨酸(M)、半胱氨酸(C);碱性:精氨酸(R)、赖氨 酸(K)、组氨酸(H);酸性:天冬氨酸(D)、谷氨酸(E)、天冬氨酸(N)、谷氨 酰胺(Q)。还见Creighton,1984。此外,在所编码序列中改变、增加或缺 失单个氨基酸或小百分数的氨基酸的分别的替换、缺失或添加也是“保守性 修饰的变异”。

“表达盒”或“表达构建体”如本文中所用意指能够指导特定核苷酸序 列在适宜宿主细胞中表达的DNA序列,所述的DNA序列包含与目的核苷 酸序列有效连接的启动子,该启动子任选地与终止信号和/或其它调节性元 件有效连接。表达盒还可以包含对于正确翻译核苷酸序列所需要的序列。 编码区域通常编码目的蛋白,然而还可以从有义方向或反义方向编码功能 性目的RNA(例如反义RNA)或非翻译的RNA。包含目的核苷酸序列表达 盒可以是嵌合的,这意味表达盒的成分中的至少一个成分相对于表达盒其 它成分中的至少一个成分是异源的。表达盒还可以是这样表达盒,该表达 盒天然存在,但是已经以用来异源表达的重组形式获得。表达盒可以完全 在细胞外进行装配(例如通过重组克隆技术)。然而,表达盒还可以部分地 使用内源性成分进行装配。例如,可以通过在内源性序列的上游放置(或插 入)启动子序列而获得表达盒,其中所述的内源性序列因此与所述的启动子 序列功能性连接并受其控制。类似地,可以在内源性启动子序列下游放置 (或插入)待表达的核酸序列,因而形成表达盒。表达盒中的核苷酸序列的 表达可以受组成型启动子控制或受诱导型启动子控制,其中所述的诱导型 启动子仅在宿主细胞接触某些特定外部刺激时才启动转录。在多细胞生物 的例子中,启动子还可以对特定组织或特定器官或特定发育阶段特定(例 如,本发明的种子特异性或种子偏好性启动子)是特异性的。在优选的实施 方案中,此类表达盒将包含与本发明的目的核苷酸序列连接的转录起始区。 优选提供这样的表达盒,其具有多个用于插入将受调节区域转录性调节的 目的基因的限制性位点。表达盒还可以含有可选择标记基因。该盒将包括 在5′-3′方向的转录、转录和翻译起始区、目的DNA序列以及在植物中有 功能的转录和翻译终止区。终止区可以是转录起始区本身的,可以是目的 DNA序列本身的或可以衍生自其它来源。便于使用的终止区可以从根癌农 杆菌的Ti-质粒获得,如章鱼碱合酶终止区和胭脂碱合酶终止区并且如下描 述其它终止区(还见Guerineau 1991;Proudfoot 1991;Sanfacon 1991; Mogen 1990;Munroe 1990;Ballas 1989;Joshi 1987)。

将“载体”定义为尤其包括处于双链或单链的直链或环状形式的任何质 粒、粘粒、噬菌体或农杆菌双元载体,其可能或不可能自我传播或运动, 并且可以通过整合至细胞基因组中而转化原核生物宿主或真核生物宿主, 或者以染色体外方式存在(例如具有复制起点的自主复制性质粒)。

具体包括穿梭载体,该载体意指能够天然地或因设计而在两种不同宿 主生物中复制的DNA载体,其中所述的宿主生物可以自放线菌 (actinomycete)及相关物种、细菌和真核生物(例如高等植物、哺乳动物、 酵母或真菌细胞)。

载体中的核酸优选地受到用于在宿主细胞(如微生物细胞例如细菌细 胞或植物细胞)内转录的适宜启动子或其它调节性元件控制并与之有效连 接。载体可以是在多种宿主中有功能的双功能表达载体。在基因组DNA 的例子中,载体可以含有自身的启动子或其它调节性元件,并且在cDNA 的例子中,载体可以受用于在宿主细胞中表达的适宜启动子或其它调节性 元件控制。

“克隆载体”通常含有一个或少数限制性内切核酸酶识别位点(其中可 以以可确定的方式在所述的限制性内切核酸酶识别位点内插入外来DNA 序列而不丢失载体的基本生物学功能)和适用于鉴定并选择用该克隆载体 已转化的细胞的标记基因。标记基因一般包括提供四环素抗性、潮霉素抗 性或氨苄青霉素抗性的基因。

“转基因植物”是具有一个或多个含有表达载体的植物细胞的植物。

“植物组织”包括分化和未分化的组织或植物,包括但不限于根、茎、 枝条、叶、花粉、种子、肿瘤组织和多种形式的细胞及培养物,如单个细 胞、原生质体、胚和愈伤组织。植物组织可以位于植物中或位于器官、组 织或细胞培养物中。

如下术语用来描述在两种或多种核酸或多核苷酸之间的序列关系: (a)“参考序列”、(b)“比较窗口”、(c)“序列同一性”、(d)“序列同一性百分数” 和(e)“相当的同一性”。

(a)如本文中所用,“参考序列”是用作序列比较基础的已定义的序列。 参考序列可以是指定序列的部分或整体;例如,作为全长cDNA或基因序 列的节段或完整的cDNA或基因序列。

(b)如本文中所用,“比较窗口”指多核苷酸序列中连续的指定节段, 其中与参考序列(其不包含添加或缺失)相比,在比较窗口中的多核苷酸序 列可以包含添加或缺失(即空位)以便最佳比对两种序列。通常,比较窗口 是至少20个连续核苷酸长度并且任选地可以是30、40、50、100个连续 核苷酸长度或更长。本领域技术人员理解为了避免因在多核苷酸序列中包 含空位而与参考序列的高度相似性,通常导入并从匹配数中扣减空位罚分。

用于比较的序列比对方法在本领域中是众所周知的。因此,可以使用 数学算法完成对任一两种序列间同一性百分数的确定。优选的非限制性的 数学算法实例是Myers和Miller(1988)算法;Smith等(1981)局部同源性算 法;Needleman和Wunschde(1970)同源性比对算法;Pearson和Lipman (1988)搜索相似性方法;Karlin和Altschul,(1990)算法,改良的Karlin和 Altschul(1993)算法。

可以利用这些数学算法的计算机执行以比较序列而确定序列同一性。 这类执行包括,但不限于:在PC/Gene程序(可从Intelligenetics,Mountain View,Calif.获得)的CLUSTAL;ALIGN程序(版本2.0)和在Wisconsin Genetics Software Package,版本8(可从Genetics计算机Group(GCG), 575 Science Drive,Madison,Wis.,USA获得)内的GAP、BESTFIT、 BLAST、FASTA和TFASTA。使用默认执行参数,可以开展使用这些程 序的比对。已充分描述了CLUSTAL程序(Higgins 1988,1989;Corpet 1988; Huang 1992;Pearson 1994)。ALIGN程序以上述Myers和Miller的算法 为基础。Altschul等,1990的BLAST程序以上述Karlin和Altschul的算 法为基础。优选地使用Clustal W算法(Thompson 1994;例如在软件 Vector NTITM,版本9;Invitrogen Inc.),记分矩阵BLOSUM62MT2,默 认设置(空位开口罚分15/19,空位延伸罚分6.66/0.05;空位分离罚分范围 8;比对延误的%同一性40;使用残基特异性空位和亲水性残基空位)开展 多重比对(即多于2种序列)。

用于开展BLAST分析的软件可从National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)公开获得。该算法包括首先通 过确定提交序列中的短字长度W而确定高记分序列对(HSP),其中在与数 据库序列内长度相同的字比对时,所述的提交序列达到或满足某些正值的 阈值记分T。T称作邻近字记分阈值(Altschul 1990)。这些初始邻近字命 中充当种子,其中所述的种子启动了搜索以发现含有这些种子的更长HSP。 字命中随后在两个方向上沿着每个序列尽可能远地延伸,只要可以增加累 积性比对记分。对核苷酸序列,使用参数M(对一对匹配残基的反向记分; 总是>0)和N(对错配残基的罚分记分;总是<0)计算累积性记分。对于氨 基酸序列,使用记分计分矩阵来计算累积性记分。当累积性比对记分从最 大的已实现值上以量X降低时,停止在每一方向上字命中延伸,累积性记 分因一个或多个负记分性残基比对的累积或抵达两种序列中任一序列的末 尾而变成零或以下。

除了计算序列同一性百分数之外,BLAST算法还开展两种序列之间 相似性的统计分析(见例如Karlin和Altschul(1993).One measure of similarity provided by the BLAST algorithm is the smallest sum probability(P(N)),这提供两种核苷酸序列或氨基酸序列之间的匹配可能 偶然发生的概率指示。例如,若在测试核酸序列与参考核酸序列的比较中 的最小总和概率少于约0.1,更优选地少于约0.01和最优选地少于约 0.001,则认为测试核酸序列与参考序列是相似的。

为获得用于比较目的的空位比对,可以利用如A.ltschul等1997所述 的Gapped BLAST(在BLAST 2.0内)。或者,可以使用PSI-BLAST(在 BLAST 2.0内)来开展探测分子间远缘关系的多重搜索。见上述Altschul 等。当利用BLAST、Gapped BLAST、PSI-BLAST时,可以使用各自程 序的默认执行参数(例如BLASTN用于核苷酸序列、BLASTX用于蛋白质)。 BLASTN程序(用于核苷酸序列)默认使用字长度(W)11、期望(E)10、界 限值100、M=5、N=-4并比较两条链。对于氨基酸序列,BLASTP程序默 认使用字长度(W)3、期望(E)10和BLOSUM62记分矩阵(见Henikoff和 Henikoff,1989)。见http://www.ncbi.nlm.nih.gov。比对还可以通过目测以 人工方式开展。

为了本发明的目的,优选地使用具有默认执行参数的BlastN程序 (版本1.4.7或更新版本)或任何等效程序开展核苷酸序列的比较,以确定与 本文中公开的启动子序列的序列同一性百分数。“等效程序”意指任一序列 比较程序,即与优选程序所生成的对应比对相比,所述任一的序列比较程 序对所询问的任何两种序列生成了具有相同核苷酸匹配或相同氨基酸残基 匹配和相同序列同一性百分数的比对。

(c)如本文中所用,“序列同一性”或”同一性”在两种核酸或两种多肽 序列上下文中,意指在两种序列中,当在指定的比较窗口范围内进行最大 一致性比对时的相同的残基。当谈及蛋白质时使用序列同一性百分数,认 识到不相同的残基位置经常因保守性氨基酸替换而不同,其中氨基酸残基 被替换为具有相似化学特性(例如电荷或疏水性)的其它氨基酸残基并且因 此不改变分子的功能特性。当序列在保守性替换上相异时,可以上调序列 同一性百分数以校正替换的保守性本质。由于此类保守性替换而相异的序 列称作具有“序列相似性”或“相似性”。本领域技术人员众所周知进行这种 调整的方法。通常,这种方法包括计算保守性替换为部分错配而非完全错 配,因此增加序列同一性百分数。因此例如,当给予相同的氨基酸1记分 并且给予非保守性替换0记分时,则给予保守性替换在0和1之间的记分。 例如如在程序PC/GENE(Intelligenetics,Mountain View,Calif.)所执行的 那样进行保守性替换分值的计算。

(d)如本文中所用,“序列同一性百分数”意指通过在比较窗口中比 较两个优化比对的序列所测定的值,其中与用于优化比对两种序列的参考 序列(其不包含添加或缺失)相比时,多核苷酸序列在比较窗口中的部分可 以包含添加或缺失(即空位)。如此计算该百分数,即通过确定在两种序列 内均存在相同核酸碱基或相同氨基酸残基的位置数来产生匹配位置,匹配 的位置数除以在比较窗口中的总位置数,并将结果乘以100以产生序列同 一性百分数。

(e)(i)术语多核苷酸序列的“相当同一性”意指包含如此序列的多核 苷酸,其中所述的序列在使用所述比对程序之一,使用标准参数与参考序 列比较时,具有至少60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78% 或79%,优选至少80%、81%、82%、83%、84%、85%、86%、87%、 88%或89%,更优选至少90%、91%、92%、93%或94%并且最优选至 少95%、96%、97%、98%或99%的序列同一性。考虑到密码子简并性、 氨基酸相似性、读码框位置等,本领域技术人员将认识到可以适当调整这 些值以确定两种核苷酸序列所编码的蛋白质的相应同一性。用于这些目的 氨基酸序列的相当同一性通常意指至少60%或70%、更优选至少80%、 90%以及最优选至少95%的序列同一性。

核苷酸序列是基本相同的另一个指标是两种分子是否在严格条件下 (见下文)彼此杂交。通常,选择的严格条件是在定义的离子强度和pH上低 于特定序列的热解链温度(Tm)约5℃。然而,严格条件包括范围在约1℃ 至约20℃的温度,这取决于如本文中另外定义的所需要的严格程度。若 核酸编码的多肽基本上相同,则在严格条件下彼此不杂交的核酸仍是基本 上相同的。例如当核酸拷贝使用遗传密码子所允许的最大密码子简并性产 生时,这种情况可以存在。当第一种核酸所编码的多肽与第二种核酸所编 码的多肽发生免疫交叉反应时,即为两种核酸序列是基本相同的一个指标。

(ii)术语“相当的同一性”在肽的上下文中是指肽包含这样的序列,该 序列对指定比较窗口中的参考序列具有至少60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、 76%、77%、78%或79%、优选地80%、81%、82%、83%、84%、85%、 86%、87%、88%或89%、更优选至少90%、91%、92%、93%或94% 或甚至更优选是95%、96%、97%、98%或99%的序列同一性。优选地, 使用Needleman和Wunsch(1970)的同源性比对算法实施优化比对。当一 种肽与针对第二种肽的抗体发生免疫交叉反应时,即为两种肽序列是基本 相同的一个指标。因此,例如在两种肽仅因保守性替换而相异时,这种肽 与第二种肽基本上相同。

对于序列比较,通常一种序列充当对受试序列加以比较的参考序列。 当使用序列比较算法时,将受试序列和参考序列输入计算机,根据需要指 定亚序列坐标,并指定序列算法程序参数。基于指定的程序参数,序列比 较算法随后计算受试序列相对于参考序列的序列同一性百分数。

如上指出,核苷酸序列是基本相同的另一个指标是两种分子在严格条 件下彼此杂交。短语“特异性杂交至”指一种分子仅与特定核苷酸序列(此 时所述序列存在于(例如总细胞的)DNA或RNA的复杂混合物中在严格条 件下结合、配对或杂交。“基本上结合”指探针核酸与靶核酸之间的互补性 杂交并且包括可通过降低杂交介质的严格性而容忍的少量错配,以实现所 需要的检测靶核酸序列。

“严格杂交条件”和“严格杂交洗涤条件”在核酸杂交实验如Southern 和Northern杂交的上下文中是序列依赖性的,并且在不同环境参数下不 同。Tm是(在定义的离子强度和pH下)50%靶序列与完全匹配的探针杂交 的温度。特异性通常是杂交后洗涤的函数,关键因子是终末洗涤溶液的离 子强度和温度。对DNA-DNA杂交体,Tm可以从Meinkoth和Wahl,1984 的等式中估计:

Tm=81.5℃+16.6(log10M)+0.41(%GC)-0.61(%form)-500/L

其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟嘌呤和胞 嘧啶的百分含量。%form是杂交溶液中的甲酰胺百分含量并且L是杂交 体的碱基对长度。对于每1%的错配,Tm降低约1℃;因此,可以调节 Tm、杂交条件和/或洗涤条件以便与具有目的同一性的序列杂交。例如,若 寻求具有>90%同一性的序列,则Tm可以减少10℃。通常,选择的严格条 件是在定义的离子强度和pH处低于特定序列及其互补序列的热解链温度 约5℃。然而,非常严格的条件可以使用在比热解链温度I低1、2、3或 4℃的杂交和/或洗涤;中等严格的条件可以使用在比热解链温度I低6、7、 8、9或10℃的杂交和/或洗涤;低严格条件可以使用在比热解链温度I低 11、12、13、14、15或20℃的杂交和/或洗涤。使用该等式、杂交组合物 和洗涤组合物以及需要的T,技术人员将理解杂交溶液和/或洗涤溶液的严 格性的变化被内在地描述。若所需的错配程度导致T小于45℃(水溶液) 或32℃(甲酰胺溶液),优选增加SSC的浓度以至可以使用较高的温度。 对核酸杂交的全面指南可在Tijssen,1993中找到。通常,所选的高度严格 杂交条件和洗涤条件是在定义的离子强度和pH处低于特定序列的热解链 温度Tm约5℃。

高度严格洗涤条件的实例是0.15M NaCl,在72℃洗涤约15分钟。 严格洗涤条件的实例是0.2×SSC,在65℃洗涤15分钟(见Sambrook,下 文对于SSC缓冲液的描述)。低严格性洗涤往往先于高严格性洗涤进行, 以去除背景探针信号。对双链体(例如超过100个核苷酸)的中等严格洗涤 的实例是1×SSC,在45℃洗涤15分钟。对双链体(例如超过100个核苷 酸)的低严格性洗涤的实例是4×至6×SSC,在40℃洗涤15分钟。对于 短探针(例如约10个至50个核苷酸),严格条件通常包括于pH7.0至8.3 处低于约1.5M的盐浓度,更优选地是约0.01至1.0M的Na离子浓度(或 其它盐),并且温度一般是至少约30℃并且对于长探针(例如>50个核苷酸) 是至少约60℃。严格条件还可以通过添加去稳定剂(如甲酰胺)实现。通常, 当信号与噪音比是在特定杂交分析中对不相关的探针所观察到的信号与噪 音比2倍(或更高)时,表明检测到特异性杂交。在严格条件下彼此不杂交 的核酸,如果它们所编码的多肽是基本上相同的,则它们仍基本上是相同 的。例如当使用遗传密码子所允许的最大密码子简并性产生核酸的拷贝时, 这种情况可以出现。

选择极严格条件等同于对特定探针的Tm。用于具有多于100个互补性 残基的互补性核酸在滤纸上在Southern或RNA印迹中杂交的严格条件的 实例是50%甲酰胺,例如在50%甲酰胺、1M NaCl、1%SDS中在37℃ 杂交并在0.1×SSC在60℃至65℃洗涤。示例性的低严格条件包括使用 含30%至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)缓冲溶液 在37℃杂交并在1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中 在50℃至55℃洗涤。示例性的中度严格条件包括使用含40%至45%甲 酰胺、1.0M NaCl、1%SDS在37℃杂交并在0.5X至1×SSC中在55℃ 至60℃洗涤。

如下是可以用来克隆直向同源性核苷酸序列的成组杂交/洗涤条件的 实例,其中所述的直向同源性核苷酸序列与本发明的参考核苷酸序列基本 上相同:直向同源性核苷酸序列优选地与参考核苷酸序列在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS中洗 涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC、0.1%SDS中洗涤,更优选是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、0.1%SDS 中洗涤。

“DNA改组”是在DNA分子中导入、优选地随机导入突变或重排的方 法或在两种或多种DNA分子之间产生、优选地随机产生DNA序列交换的 方法。因DNA改组产生的DNA分子是改组的DNA分子,该DNA分子 是衍生自至少一个模板DNA分子的非天然存在的DNA分子。改组的DNA 优选地编码变体多肽,其中所述的变体多肽相对于模板DNA所编码的多 肽受到修饰并可以具有相对于模板DNA所编码多肽的改变的生物学活性。

“重组DNA分子”是使用例如在Sambrook等,1989中所述的重组DNA 技术和方法而连接的DNA序列的组合,其中使用所述的重组DNA技术和 方法将DNA序列连接在一起。

本发明尤其用于单子叶植物中的应用。术语“单子叶植物”包括具有 多个倍性水平的植物,所述的倍性水平包括非整倍体、多倍体、二倍体、 单倍体和半合子。还包括成熟的植物、种子、枝条和幼苗,和部分、繁殖 材料(例如种子和果实)以及衍生自其中的培养物,例如细胞培养物。一年 生和多年生单子叶植物是用于产生转基因植物的优选宿主生物。本发明的 单子叶植物优选地是禾本科植物(Gramineae)。

术语“禾本科(Gramineae或Graminaceae)”如本文中所用意图包含 禾本科的全部植物物种,尤其用作食品原料或饲料原料的那些植物物种, 如稻、玉米、小麦或其它的谷类物种如麦、黍和高粱、黑麦、triticale或燕 麦,和甘蔗以及全部牧草物种。此外包括成熟植物、种子、枝条和幼苗, 和部分、繁殖材料以及衍生自其中的培养物,例如细胞培养物。成熟的植 物指超过幼苗发育期的任何发育期的植物。术语“幼苗”指处在早期发育 阶段的不成熟年幼植物,在所述的发育早期幼苗仍依赖种子中(例如在胚 乳、外胚乳或子叶内)所贮藏的同化产物。包括竹亚科(Bambusoideae)(例如 bamboo属)、Andropogonoideae(例如甘蔗属(Saccharum)、高粱属 (Sorghum)或玉蜀黍属(Zea))、芦竹族(Arundineae)(例如芦苇属 (Phragmites))、稻亚科(Oryzoideae)(例如稻属(Oryza))、黍亚科Panicoideae (例如黍属(Panicum)、狼尾草属Pennisetum和狗尾草属Setaria)、早熟禾 亚科(Pooideae)(羊茅亚科(Festuciadeae))(例如早熟禾属(Poa)、羊茅属 (Festuca)、黑麦草属(Lolium)、三毛草属(Trisetum)、剪股颖属(Agrostis)、 梯牧草属(Phleum)、鸭茅属(Dactylis)、看麦娘属(Alopecurus)、燕麦属 (Avena)、小麦属(Triticum)、黑麦属(Secale)和大麦属(Hordeum))的全部属。 优选燕麦(Avena sativa)(燕麦)、簕竹属(Bambusa sp.)某些种和印度箣 (Bambusa bambos)(bamboo)、甘蔗(Saccharum officinarum)(甘蔗 sugarcane)、栽培二粒小麦(Triticum dicoccum)(二粒小麦(Emmer wheat))、 栽培一粒小麦(Triticum monococcum)(一粒小麦(Einkorn wheat))、斯卑尔 脱小麦(Triticum spelta)(斯卑尔脱小麦(spelta wheat))、硬粒小麦(Triticum durum)(小麦)、圆锥小麦(Triticum turgidum)、普通小麦(Triticum aestivum)(小麦)、玉蜀黍(玉米(maize)/玉米(corn))、稷(Panicum miliaceum)(普通黍)、Pennisetum thiphoides(Bulrush millet)、大麦 (Hordeum vulgare或H.sativum)(大麦)、稻(Oryza sativa)(稻)、水生菰 (Zizania aquatica)(野生稻(wild rice))、黑麦(Secale cereale)(黑麦)、高粱 (Sorghum bicolor)(S.vulgare)(高粱)。更优选小麦(Triticum spp.)、稻 (Oryza spp.)、大麦(Hordeum spp.)、燕麦(Avena spp.)、黑麦(Secale spp.)、 玉米(玉蜀黍)、高粱和黍(Pennisettum spp)。优选小麦家族的全部小麦种 (包冬小麦和春小麦)、更具体地是普通小麦(Triticum spp.:common(T. aestivum))、硬粒小麦(T.durum)、斯卑尔脱小麦(T.spelta)、栽培二粒小 麦、圆锥小麦和栽培一粒小麦并特别优选普通小麦。本发明的方法可以用 来产生来自春小麦(例如Bobwhite、Marshall、PIVOT1、UC702和 Panewawa)和来自冬小麦(例如HY368、Neeley、FL302、RH91、R332、 R1269和R585)的转基因植物。其它合适的小麦基因型包括,不限于Yecora Rojo、Karl和Anza。然而,应当指出本发明不限于某些品种,而是高度 基因型非依赖性的。

词语“植物”指任何植物,尤其指农学有用的植物(例如种子植物), 并且“植物细胞”是植物的结构单元和生理单元,其包含细胞壁,然而还可 以指原生质体。植物细胞可以是分离的单个细胞或培养的细胞形式,或作 为更高级有机体单元的部分,其中更高级有机体单元例如是植物组织,或 分化成为植物任何发育期上均存在的结构的植物器官。此类结构包括一种 或多种植物器官,包括,但不限于果实、枝条、茎、叶、花瓣等。优选地、 术语“植物”包括完整植物、枝条营养器官/结构(例如叶、茎和块茎)、根、 花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种 子(包括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如维管组织、基 本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等),和前述对象的子代。

“显著增加”是大于测量技术内固有误差的增加,优选地是约2倍或更 多倍的增加。

“明显少于”意指减少大于测量技术内固有的误差,优选地是约2倍或 更多倍的减少。

发明详述

本发明提供了用于在单子叶植物、尤其在玉米(zea mays)中实现淀粉 胚乳特异性和胚特异性表达谱的方法和主题。

本发明的第一个实施方案涉及包含表达盒的单子叶植物,所述表达盒 包含

a)嵌合的转录调节核苷酸序列,其包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸 序列,

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列,

与该嵌合的转录调节核苷酸序列有效连接

b)至少一个核酸序列,其相对于所述嵌合的转录调节核苷酸序列为异 源的并适用于赋予植物选自如下的性状或特性

i)抗至少一个胁迫因子的增强抗性,

ii)提高的种子营养质量或籽苗营养质量,

iii)提高的产量,和

iv)靶向的序列切除。

表达构建体中所采用的嵌合的转录调节核酸序列(例如超级启动子)令 人惊讶地在种子(谷粒)发育和萌发中展示出高度特异性。这与本领域在双 子叶植物和单子叶植物中所报导的表达模式形成鲜明对比,其中组成型表 达模式在所有组织中均得到报导(Ni M等(1995)Plant J 7(4):661-676;US 5,955,646;Kononov等,A Comparative Study of the Activity of the Super-promoter with Other Promoters in Maize(1999)第20届crown gall 年会,德克萨斯-豪斯顿大学医学院;摘要集,第36页;Comparative Study of the Activity of the Super-promoter and Other Promoters in Maize(1998) 第19届crown gall年会,普渡大学,West Lafayette,印第安纳州])。然 而,对于单子叶植物,先前仅用GUS基因测试了表达。

优选地,嵌合的转录调节核苷酸序列引起所述异源DNA主要在淀粉 胚乳或萌芽胚中表达。由嵌合的转录调节核酸序列(例如超级启动子)调节 的表达存在于在授粉后5日和20日之间种子(谷粒)发育开始期间的淀粉胚 乳中。因为该情况,所述序列具有种子成熟或谷粒成熟特异性。本文中“种 子成熟或谷粒成熟”指起于受精并止于种子干燥的时期,其中在受精中可代 谢的食物储备(例如蛋白质、脂类、淀粉等)沉积在正在发育的种子中,尤 其在包括胚乳的种子贮藏器官内,导致种子增大和填充。转录活性随后在 萌发期期间,又首先在淀粉胚乳中启动到极高水平,并且随后在16小时与 24小时吸涨之间几乎完全“关闭”直至萌芽胚具有极高表达水平。表达随 后在萌发开始后约7日停止。萌发期间除淀粉胚乳和胚以外,在任何组织 内检测不到明显表达。这种表达模式对如下应用特别有用:

i)增强胁迫因子抗性:现有技术中如上所述,胚对各种生物性和非生物 性胁迫因子(干旱、寒冷、疾病等)非常敏感。这些胁迫因子直接影响产量 和作物质量。本领域中已知的绝大多数启动子在胚期没有表达能力或具有 低表达能力。本文中公开的转录调节特异性尤其用来按需要表达胁迫抗性 基因,即在合适时间到达高水平。此外,由于淀粉胚乳中的特异性,有可 能寻求解决胁迫抗性的新途径。因为淀粉胚乳是滋养胚的组织,故可以通 过改善胚的养分补充而提高胁迫抗性。

ii)提高的种子营养质量或籽苗营养质量:嵌合的转录调节核酸序列(例 如超级启动子)的表达模式允许转化种子(谷粒)成分或允许改变种子中成分 的分布。例如,可以将糖类(淀粉)转化成油或其它高价值成分(例如维生素) 或可以使成分从胚乳转移至胚,因而提供具有改善的营养价值的籽苗。

iii)提高产量:提高的产量部分地与胁迫抗性(见以上i))相关。然而, 嵌合的转录调节核酸序列(例如超级启动子)的表达模式甚至允许在无胁迫 因子下通过优化胚生长而增加产量,其中胚的生长将直接影响幼苗生长。 还可以实现田间条件下更早的萌发以及会引起更高或更早产量的其它性 状。

iv)靶向的序列切除。如上所述,均一地切除序列(尤其标记序列)是生 物技术领域内未解决的问题。绝大多数植物表现出嵌合样切除模式,既有 成功切除的区域,又有未切除的区域。当生物不是由众多植物组成时,为 实现均一或基本均一的切除,优选地需要在发育早期激活切除机制。此外 需要强烈的激活(即切除介导酶的表达)。这两种要求均由本文中公开的嵌 合的转录调节核酸序列(例如超级启动子)的表达模式满足。早期胚萌发中 的强烈转录活性允许在该时期有效地切除标记,由此产生无靶序列(例如无 标记)的植物。

取决于发育时间,嵌合的转录调节核酸序列(例如超级启动子)的表达 模式分别对淀粉胚乳或胚是特异性的。

“萌芽胚特异性转录”在本发明上下文中意指转录调节元件以如此方 式转录核酸序列,以至于所述核酸序列在萌发植物、优选在萌芽胚中的转 录占RNA总量大于90%,优选地大于95%,更优选地大于99%,其中 所述的RNA从整个植物、种子或籽苗中的特定发育期期间的所述核酸序 列转录。

“淀粉胚乳特异性转录”在本发明上下文中意指转录调节元件以如此方 式转录核酸序列,以至于所述核酸序列在淀粉胚乳中的转录占RNA总量 大于90%,优选地大于95%,更优选地大于99%,其中所述的RNA从 整个植物、种子或籽苗中的特定发育期期间的所述核酸序列转录。

1.嵌合的转录调节核酸序列

在最常见的形式下,嵌合的转录调节核苷酸序列包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列.

术语“衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列” 意指这样的序列,其至少包含在农杆菌、优选在根癌农杆菌中负责调节甘 露氨酸合酶表达的功能性元件。

优选地,衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序 列和/或衍生自农杆菌章鱼碱合酶基因的上游激活序列源自根癌农杆菌菌 株。

甘露氨酸合酶基因的启动子序列在本领域中众所周知。例如,甘露氨 酸合酶基因mas 1′和2′共有双重的双向启动子和479bp基因间区。这些 基因编码用于合成甘露氨酸的两步骤途径的酶(Ellis 1984;Komro 1985)。 mas基因的转录是趋异的,并且基因间区含有转录两种基因所必需的全部 顺式作用元件(DiRita 1987;Fox 1992;Leung 1991;Guevara-Garcia 1993)。 用于甘露氨酸合酶基因的转录元件公开于DiRita 1987,Gelvin,见上文, Fox 1992;Leung 1991;Langridge 1989。此外,T-DNA的全部序列公开 于Barker 1983。

术语“上游激活序列”(UAS)指在天然状态下优选地在天然转录起点之 前至少100碱基对并可以影响表达的序列。T-DNA基因含有在植物环境 中有功能并与植物调节区域具有相似性的区域。例如,绝大多数植物启动 子含有通过结合反式作用因子而限定或影响启动子的强度和组织特异性表 达模式的顺式作用元件,如上游激活序列(“UAS”)(常称作“增强子”)。 Atchison,(1988)Annu.Rev.Cell Biol.4:127-53。给定启动子的整体强度以 及其表达模式可以受顺式作用元件的组合和空间方向以及存在与这些元件 相互作用的核因子影响。Dynan,(1989)Cell 58:1-4。虽然最初在原核生物 质粒中,然而T-DNA基因具有在植物中转录所需要的全部序列元件(启动 子和UAS)。例如,T-DNA基因含有设定转录起点的TATA盒并经常含有 距转录起点大于100bp的调节转录水平的上游元件。见Gelvin, TRANSGENIC PLANTS(Academic Press 1993)。章鱼碱合酶基因和甘露 氨酸合酶基因的UAS在此方面特别有用。这些UAS可以随后与启动子序 列或与衍生自不同根癌农杆菌的冠瘿碱合酶基因中的上游激活序列及启动 子序列有效连接。具有上游激活序列的两种T-DNA基因是章鱼碱合酶(ocs) 基因和甘露氨酸合酶(mas)基因。ocs基因编码使精氨酸与焦磷酸缩合以形 成章鱼碱产物。Hack和Kemp,(1980)Plant Physiol.65:949-55。位于ocs基 因上游的16个碱基对回文序列能够激活瞬时表达系统内异源性玉米adh1 启动子。Ellis等,(1987)EMBO J.6:11-16;Ellis等,(1987)EMBO J. 6:3203-08。该回文序列对稳定转化的烟草(tobacco)愈伤组织中的ocs启动 子活性也是必需的。Leisner和Gelvin,(1988)Proc.Nat′l Acad.Sci.USA 85:2553-57;Leisner和Gelvin,(1989)Plant Cell 1:925-36。

转录元件,如冠瘿碱合酶基因的启动子和上游激活序列可以基于可获 得的序列信息而轻易得到。例如,用于章鱼碱合酶基因的转录元件公布于 Leisner等,(1988)Proc.Nat′l Acad.Sci USA 85:2553-57;Leisner等,(1989) Plant Cell 1:925-936。

形成本发明的嵌合的转录调节核苷酸序列可能有多种形式。优选地, 所述嵌合的转录调节核苷酸序列包含至少三个衍生自根癌农杆菌章鱼碱合 酶基因的上游激活序列,与至少一个衍生自根癌农杆菌甘露氨酸合酶基因 启动子的转录调节核苷酸序列有效连接。更优选地,所述嵌合的转录调节 核苷酸序列还包含至少一个衍生自根癌农杆菌甘露氨酸合酶基因的上游激 活序列。

在更优选的实施方案中,嵌合的转录调节核苷酸序列包含来自章鱼碱 合酶基因的上游激活序列和来自甘露氨酸合酶基因的转录调节核苷酸序列 的特定组合。在更优选的实施方案中,嵌合的转录调节核苷酸序列是超级 启动子。术语“超级启动子”如本文中所用意指如SEQ ID NO:4所述的来 自章鱼碱合酶基因的上游激活序列与来自甘露氨酸合酶基因的转录调节核 苷酸序列的特定组合,如本文中所用,该术语还包含如SEQ ID NO:4所 述的超级启动子的衍生物和变体。

术语“衍生”当在DNA区域如启动子、转录调节性核酸序列或上游激 活序列的上下文中使用时,指如此情况,其中“衍生的”DNA区域从天然存 在的DNA区域或其它来源的DNA区域中或者以它们为基础而获得。“衍 生的”DNA区域可以通常因设计的突变而与天然存在的DNA区域或其它 来源的DNA区域相异。

短语“有效连接的”指第一个序列与第二个序列在位置上充分接近以 至于第一个序列可以影响第二个序列或影响受第二个序列控制下的区域。 例如,UAS可以有效地与转录调节性核酸序列(例如启动子)连接,因而UAS 增强启动子的转录强度。在这种情况下,UAS通常在启动子的5′处。接下 来,UAS和启动子可以有效地与基因连接以至于该基因将在通常位于该基 因5′的UAS/启动子组合的控制下表达。通常,启动子总是在距离转录起点 约30-50个碱基对范围内并且距离翻译起点数百个碱基对范围内。激活性 序列通常位于启动子的数百个碱基对范围内。例如,激活性最强的序列位 于受增强的启动子约300至400个碱基对范围内。在其中采用多于一种激 活性序列的本发明实施方案中,激活性序列通常地彼此距离约100至200 个碱基对范围内。

1.1本发明的嵌合的转录调节核苷酸序列及其功能性元件的衍生物 和变体

除本文中公开的具体嵌合的转录调节核苷酸序列(例如超级启动子)及 其特定元件(例如UAS序列和启动子序列)之外,本文中公开的本发明预计 还可以采用所述序列的衍生物和变体。

“变体”或“衍生物”意指基本上相似的序列,在所述序列中已经修饰、 去除或添加一个或多个碱基。这类衍生物和变体包括这样的序列,其与原 始序列(例如如SEQ ID NO:4所述的序列)相比受到修饰或衍生自相似但 不同的生物。因此,变体或衍生物可以包含一个或多个突变(包括但不限于 一个或多个核苷酸的插入、缺失、替换、变异、倒置等)。对于核苷酸序列, 天然存在的变体可以使用众所周知的分子生物学技术(例如用如下文概述 的聚合酶链式反应(PCR)和杂交技术)进行鉴定。变异的核苷酸序列还包括 合成衍生的核苷酸序列,如通过位点定向诱变生成的那些核苷酸序列。通 常,本发明特定核苷酸序列的变体与特定核苷酸序列在使用默认执行参数, 通过本文其它处所述的序列比对程序时所确定的具有至少约60%、70%, 通常至少约75%、80%、85%、优选地至少约90%、91%、92%、93%、 94%、95%、96%、97%并且更优选地至少约98%、99%或更多的序列同 一性。

特定的嵌合的转录调节核苷酸序列(例如超级启动子)及其特定元件(例 如UAS序列和启动子序列)的衍生物可以包括,但不限于序列缺失、单个 或多个点突变、在特定限制酶位点处的改变、添加功能性元件或分子性修 饰的其它方法。这种修饰可以增强或可以不增强,或可以改变或可以不改 变所述序列的转录调节活性。

例如,本领域技术人员可以界定序列中的功能性元件并缺失任何非必 需元件。可以修饰或组合功能性元件以便为任何的具体应用而增加本发明 序列的应用或表达。本发明转录调节核苷酸序列的功能等效片段还可以通 过去除或缺失非必需序列,但不缺失必需序列来获得。缩小转录调节核苷 酸序列至其必需的转录介导性元件可以通过在体外trial-and-arrow缺失突 变或在计算机(in silico)上使用启动子元件搜索常用程序来实现。对启动子 活性必需的区域经常表现出某些已知启动子元件的簇集。此类分析可以使 用可获得的计算机算法如PLACE(“Plant Cis-acting Regulatory DNA Elements”;Higo 1999,BIOBASE数据库“Transfac”(Biologische Datenbanken GmbH,Braunschweig;Wingender 2001)或数据库 PlantCARE(Lescot 2002)开展。尤其优选转录调节核苷酸序列的等效片段, 其中所述的等效片段通过缺失编码mRNA 5’非翻译区的区域获得,由此仅 提供(非转录的)启动子区域。5’非翻译区可以轻易地通过本领域中已知方法 (如5’-RACE分析)确定。因此,一些本发明的转录调节核苷酸序列是其它 序列的等效片段(见下文表2)。

如上所示,还可能随机地制备并随后分析本发明启动子的缺失突变 体。采用这种策略,制备了一系列构建体,其中每种构建体含有克隆的不 同部分(亚克隆),并且随后筛选这些构建体的活性。用于筛选活性的合适 方法是将含有已缺失节段的缺失型启动子构建体与可选择标记或可筛选标 记连接,并且仅分离表达标记基因的那些细胞。以这种方式,鉴定多个不 同的缺失型启动子构建体,其中所述的缺失型启动子构建体保留所需要的 或甚至增强的活性。因此通过比较所选择的构建体而鉴定对活性为必需的 最小节段。随后该节段可以用来构建载体用于表达外源基因。

用于在编码任何启动子序列的DNA节段中诱变或产生缺失的方法对 于本领域技术人员是众所周知并且公开于例如US 6,583,338,其中所述文 献在本文中完整引用作为参考。本发明的某些变异核苷酸序列保留生物学 活性(即调节具有如以上所定义表达模式的转录)。调节性序列变体的一个 实例是通过从较长的启动子中开展一个或多个缺失而形成的启动子。有时 候可以缺失启动子的5’部分直至接近转录起点的TATA盒,而不取消启动 子活性,如Zhu等,(1995)The Plant Cell 7:1681-1689所述。去除DNA序 列的部分的常规方法是使用外切核酸酶并结合DNA扩增以便产生双链 DNA克隆的单方向巢式缺失。用于此目的的商业试剂盒以商品名 Exo-SizeTM(New England Biolabs,Beverly,Mass.)出售。生物学活性的变体 还例如包括具有一个或多个核苷酸替换、缺失或插入的本发明天然启动子 序列。

衍生物和变体还包括来自农杆菌(例如根癌农杆菌)和其它物种(如其它 土源细菌)的同系物、旁向同源物和直向同源物。“同系物”是本领域中用来 指示与参考序列具有高度序列相关性的多核苷酸或多肽序列的类属性术 语。这种相关性可以通过确定如前文定义的同一性和/或相似性的程度加以 定量。术语“直向同系物”和“旁向同源物”属于这个类属性术语。“旁向同 源物”指相同物种内功能相似的多核苷酸或多肽。“直向同源物”指这样的 多核苷酸或多肽,其是在另一个物种中该多核苷酸或多肽的功能等同物。 直向同源基因优选地意指编码直向同源蛋白质的基因。更具体地,术语“直 向同系物”指从一个物种内获得的多肽或蛋白质,其中所述的多肽或蛋白 质是来自不同物种的多肽或蛋白质的功能性对应物。直向同源物之间的序 列差异是物种形成的结果。

优选地,嵌合的转录调节核苷酸序列(例如超级启动子)的变体或衍生 物的转录调节活性基本上与本文中具体公开的嵌合的转录调节核苷酸序列 (例如超级启动子)的转录调节活性(即以如上所述的淀粉胚乳特异性和萌芽 胚特异性方式调节表达)相同(或等效)。除了这种转录调节活性以外,衍生 物或变体的转录调节活性还可以与其亲本序列的活性不同,尤其在表达水 平方面。表达水平可以高于或低于亲本序列的表达水平。这两种偏离可能 是有利的,这取决于待表达的目的核酸序列。优选这类功能性等效序列, 其与亲本序列相比,偏离亲本序列表达水平不大于50%、优选25%、更 优选10%(如优选地通过mRNA表达或蛋白质(例如报道基因)表达加以判 断)。更优选这样的等效序列,该等效序列与它的亲本序列相比表现增加的 表达,优选地增加至少50%,更优选地至少100%,最优选地至少500%。 此类表达模式优选地使用有效地与所述转录调节核苷酸序列连接的报道基 因证实。在本上下文中的优选报道基因(Schenborn 1999)是绿色荧光蛋白 (GFP)(Chui 1996;Leffel 1997)、氯霉素乙酰转移酶、萤光素酶(Millar 1992)、 β-葡糖醛酸糖苷酶或β-半乳糖苷酶。尤其优选β-葡糖醛酸糖苷酶(Jefferson 1987)。分析转录性调节的其它方法在本领域众所周知并且包括RNA印迹 和RT-PCR(见例如以上提到的本文中引用作为参考的Sambrook等)。

在一个优选的实施方案中,衍生自根癌农杆菌甘露氨酸合酶基因启动 子的转录调节核苷酸序列由选自如下的序列描述

i)SEQ ID NO:2或3描述的序列,

ii)SEQ ID NO:2或3所述序列中至少50个连续碱基、优选地至少100 个连续碱基,更优选地200个连续碱基的片段,

iii)与SEQ ID NO:2或3所述的序列具有至少60%、优选至少70%或 80%、更优选至少85%或90%、最优选至少95%或98%的序列同一性的 核苷酸序列,

iv)能够与SEQ ID NO:2或3所述的序列、或其互补序列(在如定义部 分中所定义的优选地在低严格条件下,更优选地在中等严格条件下,最优 选地在高严格条件下,例如在这样的条件下,其中所述的条件等同于在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及 在50℃于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、 0.1%SDS中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤, 优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤,更优选地在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于 0.1×SSC、0.1%SDS中洗涤)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:2或3所述序列、或其互补序列中50个至 200个或更多个连续核苷酸(如50或100个、优选地150或200个、更优选 地250或400个连续核苷酸、最优选地全部序列)的核酸(在如定义部分中 所定义的优选地在低严格条件下,更优选地在中等严格条件下,最优选地 在高严格条件下;例如在这样的条件下,其中所述的条件等同于在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃ 于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS 中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃于0.1×SSC、0.1%SDS中洗涤,更优选地在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、 0.1%SDS中洗涤)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补序 列或反向互补序列。

在另一个优选的实施方案中,衍生自根癌农杆菌章鱼碱合酶基因的上 游激活序列由选自如下的序列描述

i)SEQ ID NO:1描述的序列,

ii)SEQ ID NO:1所述序列中至少50个连续碱基、优选地至少100个 连续碱基,更优选地200个连续碱基的片段,

iii)与SEQ ID NO:1所述的序列具有至少60%、优选至少70%或80%、 更优选至少85%或90%、最优选至少95%或98%的序列同一性的核苷酸 序列,

iv)能够与SEQ ID NO:1所述的序列、或其互补序列(在如定义部分中 所定义的优选地在低严格条件下,更优选地在中等严格条件下,最优选地 在高严格条件下;例如在这样的条件下,其中所述的条件等同于在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃ 于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS 中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃于0.1×SSC、0.1%SDS中洗涤,更优选地在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、 0.1%SDS中洗涤)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:1所述序列、或其互补序列中50个至200 个或更多个连续核苷酸(如50或100个、优选地150或200个、更优选地 250或400个连续核苷酸、最优选地全部序列)的核酸(在如定义部分中所定 义的优选地在低严格条件下,更优选地在中等严格条件下,最优选地在高 严格条件下;例如在这样的条件下,其中所述的条件等同于在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃于 2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS中洗 涤,还更优选地是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1 mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC、0.1%SDS中洗涤,更优选地在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、0.1%SDS 中洗涤)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补序 列或反向互补序列。

因此,在更优选的实施方案中,嵌合的转录调节核苷酸序列由选自如 下的序列描述

i)SEQ ID NO:4描述的序列,

ii)SEQ ID NO:4所述序列中至少50个连续碱基、优选地至少100个 连续碱基,更优选地200个连续碱基的片段,

iii)与SEQ ID NO:4所述的序列具有至少60%、优选至少70%或80%、 更优选至少85%或90%、最优选至少95%或98%的序列同一性的核苷酸 序列

iv)能够与SEQ ID NO:4所述的序列、或其互补序列(在如定义部分中 所定义的优选地在低严格条件下,更优选地在中等严格条件下,最优选地 在高严格条件下;例如在这样的条件下,其中所述的条件等同于在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃ 于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS 中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃于0.1×SSC、0.1%SDS中洗涤,更优选地在50℃于7%十二烷基 硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、 0.1%SDS中洗涤)杂交的核苷酸序列;

v)能够与包含SEQ ID NO:4所述的序列、或其互补序列中50个至200 个或更多个连续核苷酸(如50或100个、优选地150或200个、更优选地 250或400个连续核苷酸、最优选地全部序列)的核酸(在如定义部分中所 定义的优选地在低严格条件下,更优选地在中等严格条件下,最优选地在 高严格条件下;例如在这样的条件下,其中所述的条件等同于在50℃于 7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交及在50℃ 于2×SSC、0.1%SDS中洗涤,更希望是在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃在1×SSC、0.1%SDS 中洗涤,还更希望是在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于0.5×SSC、0.1%SDS中洗涤,优选地在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃于0.1×SSC、0.1%SDS中洗涤,更优选地是在50℃于7%十二烷 基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC、 0.1%SDS中洗涤)杂交的核苷酸序列;

vi)核苷酸序列,其是上述在i)至v)下提及的任一核苷酸序列的互补序 列或反向互补序列。

任一以上定义的所述嵌合的转录调节性序列的在ii)、iii)、iv)、v)和vi) 下所述的序列优选地能够调节在单子叶植物细胞或单子叶植物生物中的转 录,它们更优选地能够诱导淀粉胚乳特异性表达和/或胚特异性表达。优选 地,在iv)或v)下所述的序列在严格条件下与所述的靶序列杂交。

优选地,核苷酸序列同一性通过使用具有默认执行参数(字长度 (W)11、期望(E)10、截止值100、M=5、N=-4并比较两条链)的BlastN程 序(版本1.4.7或更新版本)或任何等效程序来确定。

在杂交技术中,使用已知核苷酸序列的全部或部分作为与其它相应核 苷酸序列选择性杂交的探针,其中所述的其它相应核苷酸序列在来自所选 生物的已克隆的基因组DNA片段或cDNA片段(即基因组文库或cDNA文 库)群体中存在。杂交探针可以是基因组DNA片段、cDNA片段、RNA片 段或其它的寡核苷酸,并且可以用可检测基团如32P或任何其它可检测标 记物加以标记。因此,例如,用于杂交的探针可以通过标记基于本发明序 列的合成性寡核苷酸来制造。用于制备杂交探针的方法和用于构建cDNA 文库和基因组文库的方法通常在本领域中已知并且公布在Sambrook等 (1989)中。通常,与本文中所公开序列杂交的序列将与已公开的序列具有 至少约60%至70%并且甚至约80%、85%、90%、95%至98%或更多 的同一性。即,序列的序列相似性可以变化,共有至少约60%至70%并 且甚至约80%、85%、90%、95%至98%的序列相似性。

1.2本发明的嵌合的转录调节核苷酸序列的可诱导型变体

在一个优选的实施方案中,本发明的嵌合的转录调节核苷酸序列(例如 超级启动子)以如此方式加以修饰,以至于该序列因应用外在的化合物或其 它刺激物而变成可诱导的。

当用于启动子时,术语“可诱导的”为本领域技术人员所充分理解。 大体上,处于诱导型启动子控制下的表达在应答所施加的刺激(所述刺激可 以在细胞内产生或外在地提供)时“开启”或增加。刺激的本质在启动子之 间相异。无论表达水平在刺激不存在下是多少,来自任一诱导型启动子的 表达在合适刺激存在下增加。优选的情况是在其中表达水平因有效改变表 型特征的量的相关刺激存在而增加。因此可以使用这样的诱导型(或“可开 启的”)启动子,该启动子在刺激不存在下产生过于低下而不能带来所需表 型的基础表达水平(并且实际上可能是零水平)。在施加刺激时,增加(或开 启)表达至导致表达的水平。诱导型启动子的众多实例对本领域技术人员将 是已知的,这些诱导型启动子可以与本发明的嵌合的转录调节核苷酸序列 (例如超级启动子)组合。

诱导物可以是物理刺激,如光、热、干旱(低湿度)、创伤等。然而, 诱导物优选地是外部施加的化学物质。优选当外在地施加这种化学诱导物 时,可诱导的切除启动子仅导致有效连接的内切核酸酶基因的功能性表达, 这导致受控的、可掌握的表达和缺失。

已经开发用于植物中的诱导型启动子和阻遏型启动子(综述:Gatz, Annu Rev Plant Physiol Plant Mol Biol 1997,48:89-108),所述启动子基于 例如细菌阻遏物(Gatz C和Quail PH(1988)Proc.Natl Acad.Sci.USA 85:1394-1397)、动物类固醇(Aoyarna T和Chua NH(1997)Plant J. 11:605-612;Martinez A等(1999)Plant J.19:97-106)或真菌调节性元件 (Caddick MX等(1998)Nature Biotechnol 16:177-180)。受化学配体正调控 的启动子系统(诱导型系统)包括四环素(脱氧土霉素)诱导型′Triple-Op′启 动子(Gatz C和Quail PH(1988)Proc Natl Acad Sci USA 85:1394-1397; Gatz C等(1991)Mol Gen Genet 277:229-237;Gatz C等(1992)Plant J. 2:397-404)、糖皮质激素诱导型′GAL4-UAS′启动子(Aoyarna T和Chua NH (1997)Plant J.11:605-612)、蜕皮激素诱导型′GRHEcR′启动子(Martinez A 等(1999)Plant J.19:97-106)和乙醇诱导型alcA启动子(Caddick MX等(1998) Nature Biotechnol 16:177-180)。已经用来调节基因表达的激素例如包括雌 激素、三苯氧胺、托瑞米芬和蜕皮激素(Ramkumar和Adler (1995)Endocrinology 136:536-542)。还见,Gossen和Bujard(1992)Proc. Natl.Acad.Sci.USA 89:5547;Gossen等(1995)Science 268:1766。在四环 素诱导型系统中,四环素或脱氧土霉素调节阻遏物与启动子的结合,因而 调节来自该启动子的表达。

诱导型表达系统可以划分为正调节系统和负调节系统。对于正调节系 统,通过添加相应的诱导物诱导表达,对于负调节系统,通过移去诱导物 (此时称作阻遏物更合适)诱导表达。负调节(可阻遏的)系统的实例是四环素 失活的′Top10′启动子和衍生物(Bohner S等(1999)Plant J.19:87-95; Weinmann P等(1994)Plant J 5:559-569)。Top10启动子序列含有紧密地结 合四环素阻遏物多肽TetR的Tn10tet操纵基因(tet-OP)DNA序列的7个拷 贝串联重复(Lederer T等(1995)Anal Biochem 232:190-196)。该元件与例如 CaMV 35S启动子的截短形式(核苷酸位置-53至0)融合。Top10启动子序列 由有效充当人造转录因子的反式激活蛋白识别。该反式激活蛋白是TetR的 氨基酸1-207(Postle K等(1984)Nucl Acids Res 12:4849-4963)与来自单纯疱 疹病毒的转录激活结构域(VP16)的氨基酸363-490(Triezenberg SJ等(1988) Gene Dev.2:718-729)间的嵌合融合蛋白,并标记为′TetR/VP16′或tTA(四 环素反式激活蛋白)。在四环素不存在时,tTA的TetR部分以高亲和力结 合Top10启动子中的tet-OP DNA序列(Hinrichs W等(1994)Science 264:418-420;Lederer T等(1995)Anal Biochem 232:190-196;Lederer T等 (1996)Biochemistry 35:7439-7446)。这种相互作用使tTA的VP16结构域在 位置上接近于Top10启动子TATA盒,促使转基因转录。然而,在四环素存 在时,TetR发生降低其对Top10启动子的亲和力至非特异性结合水平 (Lederer T等(1996)Biochemistry 35:7439-7446)的构象改变(Hinrichs W等 (1994)Science 264:418-420;Orth P等(1998)J Mol Biol 279:439-447)。因 此,抑制tTA与Top10启动子的结合,并关闭转录。在植物中使用Top10 启动子系统尤其有利。首先,Top10启动子在tTA不存在下无功能。第二, 转录性控制是严格的并受四环素的严密控制。第三,四环素在植物细胞中 没有天然存在的类似物,否则这种类似物将干扰启动子的调节作用。第四, 用来阻遏Top10启动子的四环素水平极低,通常是1μg/ml数量级,并且对 植物没有明显的次级效应(Weinmann P等(1994)Plant J 5:559-569)。最后, 可以如此实现对启动子功能所需要的两种转化的偶联,即同一植物通过首 先用35S∷tTA质粒构建体转化并随后用驱动目的基因的Top10启动子转 化,或者通过使已用适宜构建体独立地进行转化的转基因植物交配。Top10 启动子已经成功地用于烟属(Nicotiana sp.)(Weinmann P等(1994)Plant J 5:559-569)以及小立碗藓(Physcomitrella patens)(Zeidler M等(1996)Plant Mol Biol 30:199-205)。或者,可以采用正调节的基于四环素的诱导型表达 系统。尤其优选诱导型可逆四环素系统,该系统允许仅在添加四环素或四 环素的脂可溶性衍生物即强力霉素(dox,Gossen M.等(1995)Science 268:1766-1769;Jiang DM等(2001)J.Neurochem.76(6);1745-1755)时上调 表达。

还可以采用直接应答于生理活性刺激如热休克(Prandl R等(1995) Plant Mol.Biol.28:73-82;1995;Severin K和Schoeffl F(1990)Plant Mol. Biol.15:827-834)、胁迫信号作用分子(Suehara KI等(1996)J.Ferm.Bioeng. 82,51-55)或重金属(McKenzie,MJ等(1998)Plant Physiol.116,969-977)的 诱导型启动子。不过,优选化学诱导型启动子系统。

诱导型表达系统已经在数个植物物种中使用,包括烟草(Gatz C等 (1991)Mol.Gen.Genet.277:229-237)、马铃薯(potato)(Kumar A等(1996) Plant J.9:147-158)、番茄(Thompson AJ和Myatt SC(1997)Plant Mol.Biol. 34:687-692)和拟南芥菜(Aoyarna T和Chua NH(1997)Plant J. 11:605-612)。

其它实例包括蜕皮激素应答元件(No等,(1997)Proc.Natl.Acad.Sci. USA 93:3346)。诱导型启动子的其它实例包括在用化学安全剂如N,N-二烯 丙基-2,2-二氯乙酰胺(PCT申请号WO 90/08826和WO 93/01294)处理时被 特异性诱导的谷胱苷肽-S-转移酶II启动子以及来自曲霉属(Aspergillus)的 在alcR基因产物存在下用环己酮(Lockington等,(1985)Gene 33:137-149;Felenbok等(1988)Gene 73:385-396;Gwynne等(1987)Gene 51:205-216)以及乙醇诱导的alcA启动子。启动子的化学诱导物可以与其它 活性化学品或惰性载体在施用至生物之前进行组合。例如,农学有用的其 它化学组合物如杀虫剂或肥料以及载体和溶剂可以与诱导物进行组合。

同样可以使用诱导型启动子的其它实例,包括PRP1启动子(Ward等, (1993)Plant.Mol.Biol.22:361-366)、水杨酸诱导型启动子(WO 95/19443)、 苯磺酰胺诱导型启动子(EP-A-0388186)、四环素诱导型启动子(Gatz等, (1992)Plant J.2:397-404)、脱落酸诱导型启动子(EP-A 335528)、水杨酸诱 导型启动子(WO 95/19443)或乙醇诱导型(Salter MG等(1998)Plant J. 16:127-132)或环己酮诱导型(WO 93/21334)启动子。

其它优选的启动子是受生物性或非生物胁迫诱导的启动子,例如, PRP1基因的病原体诱导型启动子(Ward等,Plant Mol Biol 1993, 22:361-366)、番茄热诱导型hsp80启动子(US 5,187,267)、马铃薯寒冷诱导 型α-淀粉酶启动子(WO 96/12814)或创伤诱导的pinII启动子(EP375091)。

1.3用于本发明的表达盒和载体的额外调节性元件和功能性元件

本发明的表达盒可以包含其它调节性元件。该术语在此上下文中应当 广义地理解为意指包含可以影响表达盒的构建或功能的所有序列。调节性 元件可以例如调节原核生物生物或真核生物生物中的转录和/或翻译。在优 选的实施方案中,本发明的表达盒包含位于待表达的核酸序列下游(在3’- 方向上)的转录终止序列和任选额外的调节性元件,其中所述的转录终止序 列和调节性元件分别与待表达的核酸序列(或转录调节核苷酸序列)有效连 接。

其它的调节性元件可以包含可调节表达调节特性的其它启动子、最小 启动子或启动子元件。尤其优选的是以上更为详细描述的可诱导性。例如 可以使表达依赖于某些胁迫因子,如水胁迫、脱落素(Lam 1991)或热胁迫 (Schoffl 1989)。此外,可以采用可实现在其它生物(如大肠杆菌(E.coli)或农 杆菌)中表达的其它启动子或启动子元件。此类调节性元件可以在细菌启动 子如amy和SPO2的启动子序列或在酵母启动子或真菌启动子(如ADC1、 MFa、AC、P-60、CYC1、GAPDH、TEF、rp28和ADH)的启动子序列中 找到。

此外,考虑了可以使用与来自多于一种启动子中的元件结合的启动子。 例如,US 5,491,288公开了花椰菜花叶病毒启动子与组蛋白启动子组合, 因此,来自本文中所公开启动子的元件可以与来自其它启动子的元件组合。 用于植物转基因表达的启动子包括诱导型启动子、病毒启动子、合成性启 动子、组成型启动子(Odell 1985)、时间调节的启动子、空间调节的启动子、 组织特异性启动子和空间-时间调节的启动子。

多种5’和3’转录调节序列可用于本发明。转录终止子负责终止转录和 正确的mRNA多聚腺苷酸作用。3’非翻译的调节性DNA序列优选地包括 约50至约1,000个、更优选约100至约1,000个核苷酸碱基对并含有植 物转录终止序列和翻译终止序列。适宜的转录终止子和已知在植物中有功 能的那些转录终止子包括CaMV 35S终止子、tml终止子、胭脂碱合酶终 止子、豌豆(pea)rbcS E9终止子、用于T7转录物的来自根癌农杆菌章鱼 碱合酶基因的终止子和来自马铃薯或番茄的蛋白酶抑制物I或II基因的 3’端,不过,还可以采用本领域技术人员已知的其它3’元件。或者,还可 以使用γ薏苡醇溶蛋白终止子、油质蛋白3终止子或来自薏苡属(Coix) 的其它终止子。

优选的3’元件包括根癌农杆菌胭脂碱合酶基因(Bevan 1983)的那些3’ 元件、用于T7转录物的来自根癌农杆菌章鱼碱合酶基因的终止子和来自 马铃薯或番茄的蛋白酶抑制物I或II基因的3’端。

由于转录起点与编码序列起点之间的DNA序列,即非翻译的前导序 列,可以影响基因表达,还可以希望采用特定的前导序列。预计优选的前 导序列包括这样的前导序列,其包括预测将指导所连接基因最佳表达的序 列,即包括可以增加或维持mRNA稳定性并防止不恰当的翻译启动的优 选的共有前导序列。本领域技术人员因本公开而知道选择此类序列。最优 选衍生自植物中高表达基因的序列。

优选的调节性元件还包括基因的5’非翻译区、内含子和3’非翻译区。

已经发现在转基因植物中增强基因表达的此类序列包括内含子序列 (详见下文)和病毒前导序列(例如来自TMV、MCMV和AMV;Gallie 1987)。 例如,已知衍生自病毒的许多非翻译的前导序列增强表达。具体而言,已 经证实来自烟草花叶病毒(TMV)、玉米褪绿斑驳病毒(MCMV)和苜蓿花 叶病毒(AMV)的前导序列有效地增强表达(例如Gallie 1987;Skuzeski 1990)。本领域中已知的其它前导序列包括但不限于:微小RNA病毒前导 序列,例如EMCV前导序列(脑心肌炎病毒5’非编码区)(Elroy-Stein 1989);马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀纹病毒); MDMV前导序列(玉米矮花叶病毒);人免疫球蛋白重链结合蛋白(BiP)前 导序列(Macejak 1991);来自苜蓿花叶病毒衣壳蛋白mRNA(AMV RNA 4) 的非翻译前导序列(Jobling 1987);烟草花叶病毒前导序列(TMV),(Gallie 1989)和玉米褪绿斑驳病毒前导序列(MCMV)(Lommel 1991)。还见 Della-Cioppa 1987。根据需要还可以包括调节性元件如TMVΩ元件(Gallie 1989)。增强子的额外实例包括来自CaMV 35S启动子、章鱼碱合酶基因 (Ellis等,1987)、稻肌动蛋白I基因、玉米醇脱氢酶基因(Callis 1987)、玉 米皱缩I基因(Vasil 1989)的元件、TMVΩ元件(Gallie 1989)和来自非植 物的真核生物(例如酵母;Ma 1988)的启动子。可以构建根据本发明使用的 载体以包括ocs增强子元件。ocs增强子元件首先被鉴定为来自ultilane 的章鱼碱合酶(ocs)基因中的16bp回文增强子(Ellis 1987)并且在至少10种 其它启动子中存在(Bouchez 1989)。当在植物转化中应用时,增强子元件如 ocs元件并且特别该元件多重拷贝的使用将起到增加来自临近启动子的转 录水平的作用。

表达盒还可以含有增强翻译和/或mRNA稳定性的序列如内含子(例 如来自Adh1、bronze1、肌动蛋白1、肌动蛋白2(WO 00/760067)或蔗糖 合酶内含子;见The Maize Handbook,第116章,编者Freeling和Walbot, Springer,New York(1994))。在一个实施方案中,增强子内含子是稻肌动 蛋白1内含子1(US 5,641,876,在本文中完整引用作为参考)、稻肌动蛋白 2内含子1(US 6,429,357,在本文中完整引用作为参考)、Adh内含子1 (Callis 1987)或蔗糖合酶内含子(Vasil 1989)。

然而,内含子序列对于实现本文中所述的表达模式并非必需。记住内 含子的总体表达调节特性,这是令人惊讶的观察结果。在另一个优选的实 施方案中,本发明的表达盒不包含具有表达增强特性的与所述嵌合的转录 调节性序列(例如超级启动子)有效连接的内含子。

额外的优选调节性元件是增强子序列或多聚腺苷酸作用序列。优选的 多聚腺苷酸作用序列是来自植物基因或农杆菌T-DNA基因(例如OCS (章鱼碱合酶)基因或NOS(胭脂碱合酶)基因的终止子序列)的那些序列。

本发明的表达盒(或衍生自其的载体)可以包含额外的功能性元件,其 中应当将所述的功能性元件广义地理解为影响表达盒或载体或包含表达盒 或载体的转基因生物的构建、增殖或功能的所有元件。此类功能性元件可 以包括复制起点(以允许在细菌中的复制;pBR322的ORI或P15A ori; Sambrook 1989),或农杆菌T-DNA转移所需要的元件(例如T-DNA左边 界和/或右边界)。

此外,表达盒可以构建并用于转基因植物细胞中的特定基因产物的细 胞内靶向或指导蛋白质移至细胞外环境。这通常通过将编码转运肽或信号 肽序列的DNA序列与特定基因的编码序列连接而实现。得到的转运肽或 信号肽将使蛋白质分别转运至特定的细胞内或细胞外目的地并随后以翻译 后方式被切除。转运肽或信号肽通过促进蛋白质穿过细胞内膜(液泡、囊泡、 质体和线粒体膜)的转运而起作用,而信号肽指导蛋白质穿过细胞外膜。通 过促进蛋白质转运至内部区室和细胞外部,这些序列可以增加基因产物累 积,保护基因产物免遭蛋白分解性降解。这些序列还允许来自高表达基因 的其它mRNA序列与基因的编码序列连接。由于经核糖体翻译的mRNA 比裸mRNA更稳定,基因前面存在可翻译的mRNA可以增加来自该基因 的mRNA转录物的整体稳定性并且因而增加基因产物合成。因为通常从初 始翻译产物中以翻译后方式去除转运序列和信号序列,故使用这些序列允 许添加可以不存在于最终多肽中的被额外翻译的序列。为增强蛋白质的稳 定性,可能需要某些蛋白质的靶向性分布(US 5,545,818)。

1.4本发明的嵌合的转录调节核酸序列、表达盒和载体的装配

就本发明的任一嵌合的转录调节核酸序列、表达盒或载体而言,有效 连接可以通过多种本领域中已知方法(包括体外方法和体内方法)实现。因 此,本发明的任一嵌合的转录调节核酸序列、表达盒或载体可以通过使用本 领域中众所周知的标准重组技术和克隆技术实现(见例如Maniatis 1989; Silhavy 1984;Ausubel 1987)。众多方式或方法已经得到开发并用于基因克 隆。这些方法的实例是通过限制酶消化并连接匹配末端的克隆法、直接从 PCR产物的T-A克隆法、TOPO-连接的单向克隆法和基于重组的克隆法。 基于重组的克隆法是可得到的最通用克隆方法之一,原因是其克隆效率高 及广泛应用于克隆多种基因,而无论是否存在可用限制酶位点。重组克隆 法使用λ重组系统来将基因克隆至含有用于λ重组酶装置的重组序列的 载体内。重组克隆法使用位点特异性重组酶,这种重组酶(在某些情况下连 同相关的蛋白质)识别核酸分子中的特定碱基序列并交换在这些序列侧翼 的核酸节段。重组酶和相关蛋白统称为“重组蛋白”。位点特异性重组酶是 存在于众多生物(例如病毒和细菌)内并已经表征为同时具有内切核酸酶特 性和连接酶特性的蛋白质。多种已知的位点特异性重组酶属于重组酶的整 合酶家族,包括来自噬菌体λ的整合酶/att系统。来自噬菌体λ的整合酶/att 系统的一个应用实例是如公布于US 5,888,732和US 6,277,608和美国公开的 专利申请2002/0007051A1和国际申请WO 02/081711A1中的LR克隆反 应,其中所述文献在本文中引用作为参考。LR克隆反应可作为 GATEWAYTM克隆技术(可从Invitrogen Corporation,Carlsbad, California获得)自商业途径获得。LR克隆反应由包含λ重组蛋白Int、Xis 和大肠杆菌编码的蛋白质IHF的LR克隆酶酶混合物催化。

表达盒还可以通过将本发明的嵌合的转录调节核酸序列(例如超级启 动子)插入植物基因组中得以装配。这种插入将产生与已经存在于基因组中 的目的核酸序列的有效连接。通过插入,目的核酸因嵌合的转录调节核苷 酸序列的转录调节特性而以淀粉胚乳特异性和萌芽胚特异性方式得到表 达。插入可以是定向的或随机的。优选地,插入是定向的并且通过例如同 源重组实现。通过这种方法,天然启动子可以替换为本发明的嵌合的转录 调节核苷酸序列,因而调节了内源基因的表达模式。转录调节核苷酸序列 还可以用如此方式插入以至表达内源基因的反义mRNA,从而诱导基因沉 默。

例如,有效连接可以包含以如此方式依次地排列具有待表达核酸序列 的本发明嵌合的转录调节核苷酸序列(例如超级启动子)和任选额外的调节 性元件,例如多聚腺苷酸作用元件或转录终止元件、增强子、内含子等, 以至于转录调节核苷酸序列可以实现在适宜条件下在表达目的核酸序列的 过程中的功能。术语“适宜条件”优选地意指植物细胞中存在表达盒。优选 这样的排列,在其中待表达的目的核酸序列以如此方式放置在本发明嵌合 的转录调节核苷酸序列的下游(即在3’-方向上),以至共价地连接这两种序 列。任选地,额外的序列可以插入这两种序列之间。此类序列可以例如是 接头或多克隆位点。此外,可以插入编码融合蛋白的部分的序列(此时将表 达由目的核酸所编码蛋白质的融合蛋白)。优选地,待表达的目的核酸序列 与本发明的转录调节核苷酸序列之间的距离不大于200碱基对,优选地不 大于100碱基对,更优选地不大于50碱基对。

实际上,任一DNA组合物可以用于递送到受体单子叶植物或单子叶 植物细胞内,以便最终产生本发明能育的转基因植物。例如,可以采用载 体或质粒形式的DNA节段或片段或直链DNA节段或片段等,在某些例子 中,它们含有仅在植物中表达的DNA元件。本领域技术人员因本公开而 知道构建可与本发明组合使用的载体(见例如Sambrook 1989;Gelvin 1990)。

本发明还提供了含有本发明表达盒的适用于植物转化的重组载体或其 它DNA构建体(包括但不限于粘粒、YAC(酵母人工染色体)、BAC(细菌 人工染色体)和植物人工染色体)以及包含表达盒或载体(例如包含质粒)的 单子叶植物宿主细胞。表达盒或载体可以(优选地)增大已转化单子叶植物 的基因组或可以在染色体外得以维持。本发明的表达盒或载体可以存在于 植物细胞的细胞核、叶绿体、线粒体和/或质体中。优选地本发明的表达盒 或载体包含在植物细胞核的染色体DNA中。在某些实施方案中,考虑了 人们可能希望在单子叶植物转化中利用胜任复制(replication-competent) 的病毒载体。此类载体包括例如,小麦矮化病毒(WDV)“穿梭”载体,如 pW1-11和PW1-GUS(Ugaki 1991)。这些载体能够在玉米细胞和大肠杆菌 中自主复制,并且可以为检测递送至转基因细胞内的DNA提供增加的灵 敏度。复制型载体还可以用于递送在侧翼具有来自转座元件(如Ac、Ds或 Mu)的DNA序列的基因。

本发明的DNA构建体及衍生自其的任一载体可以包含其它功能性元 件。术语“其它功能性元件”应当作广义的理解。该术语优选地指所有这样 的元件,其影响所述DNA构建体或包含所述DNA构建体的载体或包含所 述DNA构建体和载体的细胞或生物的产生、繁殖、功能、用途或价值。这 些其它功能性元件可以包括,但是决不应当限于:

i)确保本发明表达盒或载体在例如大肠杆菌中复制的复制起点。可以 提到的实例是ORI(DNA复制起点、pBR322ori或P15A ori(Sambrook等: Molecular Cloning.A Laboratory Manual,第二版.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989),

ii)能够并且促进插入一个或多个核酸序列的多克隆位点(MCS),

iii)使同源重组或向宿主生物基因组中插入成为可能的序列,

iv)用于向植物基因组中转移和整合的元件(例如使植物细胞中的农杆 菌介导性转移成为可能的边界序列),例如T-DNA的右边界或左边界或vir 区。

用于本文转化的导入的重组DNA分子可以是环状或直链的、双链或 单链的。通常,DNA为嵌合DNA(如质粒DNA)形式,其中所述的嵌合DNA 也可以含有侧翼存在调节序列的编码区,所述的调节序列促进存在于所得 植物中的重组DNA表达。通常,导入的重组DNA分子相对较小,即小于 约30kb以使对任何物理的、化学的或酶的降解的易感性最小化,其中所 述降解的易感性随核苷酸分子大小增加而升高。如上指出,优选地预先选 择并限定导入植物基因组中的蛋白质、RNA转录物或其混合物的数量,例 如,可以形成所导入DNA的1个至约5-10个此类产物。

本发明还提供单子叶植物(优选转基因植物)、来自这种植物的种子和 部分和来自这种植物的子代植物,包括杂交种和近交种。

本发明还提供植物育种方法,例如旨在制备杂交的能育转基因植物。 该方法包括使包含本发明特定表达盒的能育转基因植物与自身杂交或与第 二种植物(例如缺少这种特定表达盒的植物)杂交,以制备包含特定表达盒 的杂交的能育转基因植物的种子。随后种植该种子以获得杂交的能育转基 因植物。植物优选地可以是单子叶植物(优选地如以上定义)。杂交的能育 转基因植物可以具有经雌性亲代或经雄性亲代遗传的特定表达盒。第二种 植物可以是近交植物。杂交的能育转基因植物可以是杂交种。本发明还包 括任一这些杂交的能育转基因植物的种子。

2.通过本发明的表达盒所表达的有利性状或特性

本发明的嵌合的转录调节核苷酸序列(例如超级启动子)用来调节植物 的表型。需要并且可使用本文中公开的转录调节核苷酸序列的有利表达模 式(即淀粉胚乳和萌芽胚-特异性表达)实现转基因植物表型的多种改变。这 些结果可以通过在植物中表达异源产物或增加内源性产物的表达而实现。 或者,这些结果可以通过在植物中减少一种或多种内源性产物(尤其酶或辅 因子)的表达而实现。通常,可以使用嵌合的转录调节核苷酸序列来表达植 物中与所述启动子有效连接的核酸节段(例如可读框)或其部分、反义序列、 编码有义RNA序列或双链RNA序列的序列或转基因。这些改变导致转化 植物的表型改变。

对用于在本发明的单子叶植物宿主细胞中表达的异源DNA的选择取 决于转化目的。转化作物植物的主要目的之一是增加植物在商业上需要、 农学重要的性状或终产物性状。

虽然众多核酸序列适合由本发明的嵌合的转录调节核酸序列(例如超 级启动子)表达,最优选地,核酸在表达时赋予单子叶植物选自如下的性状 或特性:

i)抗至少一个胁迫因子的增强的抗性,

ii)提高的种子营养质量或籽苗营养质量,

iii)提高的产量,和

iv)选择标记切除。

2.1基本原理

已知用于控制表达的两种基本方法:过量表达和过低表达。过量表达 可以通过插入所选择基因的一个或多于一个的额外拷贝实现,然而,不清 楚最初用核苷酸序列的一个或多于一个的额外拷贝转化的植物或其子代是 否影响过低表达和过量表达。对于过低表达,存在两种基本方法,它们通 常在本领域中称作“反义下调”和“有义下调”(有义下调还称作“共抑制”)。 通常将这些方法称作“基因沉默”。这两种方法导致靶基因表达的抑制。

因此,受嵌合的转录调节性序列控制的核酸序列的表达可以导致蛋白 质表达,或反义RNA、有义RNA或双链RNA表达。

备选地,外源DNA序列可以设计旨在下调特定的核酸序列。这一般 通过将处于反义方向的外源DNA或DNA(其设计目的是在转录后产生形成 发夹的RNA分子)与本发明的嵌合的转录调节核酸序列(例如超级启动子) 有效连接而完成。基因抑制可以有效对抗与性状相关的天然植物基因,例 如旨在向植物提供天然基因编码的蛋白质的降低水平或受影响的代谢物增 加或减少的水平。例如,本发明的嵌合的转录调节核酸序列(例如超级启动 子)可以有效地与设计的异源DNA连接以至于形成抑制玉米胚中天然基因 的发夹形RNA。

如本文中所用的“基因抑制”意指众所周知的任一方法,其中所述方 法用于抑制RNA转录物或抑制翻译自RNA转录物的蛋白质产生,包括转 录后基因抑制和转录性抑制。转录后基因抑制由双链RNA介导,其中所 述的双链RNA与作为抑制靶向的基因具有同源性。称作反义抑制、共抑 制和RNA干扰的基因抑制方法的共同特征是这样的基因抑制,其中所述 的基因抑制通过从包含至少部分转录单位的反向重复序列的外源DNA构 建体中转录的RNA引起。转录性抑制可以由已转录的与执行所谓启动子 反式抑制的启动子DNA序列具有同源性的双链RNA介导。

更具体地,在US 5,107,065和US 5,759,829中公开了通过插入具有反 义方向DNA的外源DNA构建体来调节植物细胞中基因表达的转录后基 因抑制,其中所述文献在本文中完整引用作为参考。使用此类用于基因抑 制的反义方向DNA构建体所转化的转基因植物可以包含排列为反向重复 序列的DNA,如Redenbaugh等在“Safety Assessment of Genetically Engineered Flavr Savr TM Tomato,CRC Press,Inc.(1992)中所公开。反向 重复序列插入物可以包含T-DNA构建体的部分或全部,例如转录终止子 序列的反向重复序列。

在US 5,283,184和US 5,231,020中公开了通过插入具有有义方向DNA 的外源DNA构建体来调节植物细胞中基因表达的转录后基因抑制,其中 所述每一篇文献在本文中引用作为参考。

导致基因抑制的不同类型的外源DNA排列对本领域技术人员而言 是已知的并且包括但不限于如下内容。国际公开WO 94/01550公开了在 其中用自我互补的3’节段进行稳定的反义RNA的DNA构建体。在转录的 RNA中形成发夹的其它双链元件在国际公开号98/05770中公布,其中反 义RNA由形成发夹的聚(CG)核苷酸重复序列稳定,并且专利申请公开号 2002/0048814A1描述了由聚(T)-聚(A)尾稳定的有义RNA或反义RNA。 美国专利申请公开号2003/0018993A1公开了由NOS基因3’非翻译区的 亚序列的反向重复序列稳定的有义RNA或反义RNA。美国专利申请公开 号2003/0036197A1描述了通过与靶序列具有同源性的两个互补RNA区 域稳定的RNA。

基因沉默还可以通过自有义DNA方向和反义方向排列的DNA转录 RNA而实施,例如在US 5,107,065及如下其它实例中所公开的那样。US 6,326,193公开了与对立启动子(opposing promotor)有效连接的基因靶 向性DNA。Sijen等(Plant Cell,第8卷,2277-2294(1996))公开了携带豇 豆(cowpea)花叶病毒基因反向重复序列的构建体在转基因植物中介导病毒 抗性的用途。此类用于通过双链RNA在植物中产生转录后基因抑制的构 建体还公布在国际公开号WO 99/53050、国际公开号WO 99/49029、美国 专利申请公开号2003/0175965A1、美国专利申请系列号10/465,800和US 6,506,559中。还参见美国申请系列号10/393,347,其公开用于在转基因植 物同时表达一个或多个重组基因而同时抑制一个或多个天然基因的构建体 和方法。还参见US 6,448,473,其公开了用于植物中的多基因抑制载体。 以上所述的公开了用于植物中转录后基因抑制的材料和方法的所有专利、 专利申请和国际公开在本文中引用作为参考。

转录性抑制如启动子反式抑制可以通过表达如此DNA构建体而实施, 其中所述的DNA构建体包含与针对靶基因的启动子DNA的反向重复序列 有效连接的启动子。Mette等,(EMBO J 18(1):241-148(1999))和Mette等 (EMBO J.19(19):5194-5201(2000))公开了用于由启动子反式抑制介导的 此种基因抑制的构建体,所述两篇文献在本文中引用作为参考。

2.2农学相关的性状

可以优选地利用嵌合的转录调节核苷酸序列(例如超级启动子)来对转 化的单子叶植物赋予农学相关的性状。此类性状包括,但不限于除草剂抗 性、除草剂耐受性、昆虫抗性、昆虫耐受性、疾病抗性、(病毒性、细菌性、 真菌性、线虫)疾病耐受性、胁迫耐受性、胁迫抗性、例如对干旱、热、寒 冷、冰冻、过量水分、盐胁迫和氧化胁迫的抗性或耐受性、提高的产量、 食物含量和价值、增加的饲料含量和价值、体态、雄性不育性、雌性不育 性、脱水性、直立性、多育性、淀粉的数量和质量、油的数量和质量、蛋 白质的质量和数量、氨基酸组成等。然而,众多核酸序列适合由本发明的 嵌合的转录调节核酸序列(例如超级启动子)表达,最优选地,核酸在表达 时赋予单子叶植物选自如下的农学相关的性状,

iv)对至少一个胁迫因子增强的抗性或耐受性,

v)提高的种子营养质量或籽苗营养质量,

vi)提高的产量。

经济上最相关的性状之一是产量。任一类型对胚及幼苗的损伤严重地 影响产量。因此,保护幼苗和胚或增强其性能的任一类型性状对产量是有 利的。所以产生胁迫抗性的性状(见下文)也可以导致产量提高。因此,本 发明的又一个实施方案涉及用于赋予单子叶植物提高的产量的方法,所述 方法包括步骤

a)构建表达盒,为将包含

iii)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

iv)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并适用于赋予植物提高的产量的至少一个核酸序 列,和

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述转基因植物与不包含所述的表达盒但 是在其它方面与该转基因植物相同的植物相比,表现提高的产量。

提高的产量及待表达的相应异源核酸序列如上定义。下文给出更具体 的实例。优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。

2.2.1增加的胁迫抗性或耐受性

可以优选地施用嵌合的转录调节核苷酸序列(例如超级启动子)以便赋 予转化的单子叶植物增加(或增强)的胁迫抗性(优选地来得到胁迫抗性或胁 迫耐受性植物)。“抗性”意指这样的植物,该植物不因药剂施用、病原体感 染或接触胁迫而表现明显的表型改变。“耐受性”意这样的植物,虽然该植 物可以因感染而表现某些表型改变,但是没有明显降低的繁殖能力或明显 改变的代谢。

因此本发明的又一个实施方案涉及用于赋予单子叶植物增强的胁迫抗 性或耐受性的方法,所述方法包括步骤:

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸 序列,

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并适用于赋予植物增强的胁迫抗性的至少一个核 酸序列,和

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述的 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述转基因植物与不包含所述表达盒但是在 其它方面与所述转基因植物相同的植物相比,表现出对至少一个胁迫因子 的增强的抗性或耐受性。

本领域技术人员已知获得此类胁迫抗性的多种核酸序列。所述序列可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽的多核苷酸。胁迫因子优选地如上定义。待表达(例如表 达为有义RNA、反义RNA或双链RNA)的异源核酸序列可以编码如任一 SEQ ID NO:6、8、16、18、20、43、45、47、49、50、51或53所述的多 肽(或其部分;优选地是至少5个、更优选至少10个、最优选至少30个连 续氨基酸的部分),或其功能等同物,其中所述的功能等同物能够带来与任 一所述多肽所致的相同表型。优选的嵌合的转录调节核苷酸序列如上所述, 最优选超级启动子。

优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。

胁迫因子和待表达的异源核酸序列优选地如上定义。优选的嵌合的转 录调节核苷酸序列如上所述,最优选超级启动子。

可以有利地获得的胁迫抗性优选地对抗非生物性或生物性胁迫因子。 生物性胁迫因子可以选自真菌抗性、线虫抗性、昆虫抗性、病毒抗性和细 菌抗性。优选地,生物性胁迫因子是种子携带的疾病(主要是真菌疾病,例 如主要在小麦中的普通腥黑穗病(Tilletia tritici);主要在大麦中的条纹病 (Pyrenophora graminea)和散黑穗病(Ustilago nuda))。

非生物性胁迫因子可以选自水胁迫和过量水分抗性、干旱和热抗性、 寒冷、冰冻和寒冷抗性、盐胁迫抗性、高的植物群体密度和紫外线及氧化 胁迫抗性。优选地,胁迫抗性由诱导早期萌发势(vigor)而实现。

本领域技术人员已知获得此类胁迫抗性的多种核酸序列。所述序列可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽的多核苷酸。下文给出更具体的实例。

本发明适用于所有单子叶植物如玉米、小麦、稻、大麦、燕麦、黑麦、 高粱、黍、tricalate、香蕉、黑麦草或薏苡,然而优选地适用于禾本科中产 生谷粒的谷类植物,如玉米、小麦、稻、大麦、燕麦、黑麦、高粱、黍或 tricalate,优选地适用于玉米、大麦和小麦,最优选地适用于玉米.

本发明的又一实施方案涉及本发明单子叶植物的种子、部分和细胞。 优选地,植物部分选自:细胞、原生质体、细胞组织培养物、愈伤组织、 细胞团块、胚、花粉、胚珠、种子、花、谷粒、谷穗、穗轴、叶、外壳、 柄、根、根尖、花药和穗丝。

增加的胁迫耐受性可以引起促进增强的谷粒农学特征、谷粒填充、减 少谷粒败育、养分转运增加等的一种或多种性状。

2.2.1.1昆虫抗性和耐受性

本发明的一个重要方面涉及导入赋予昆虫抗性的基因至植物中。可以 导入的潜在昆虫抗性基因包括苏云金芽孢杆菌(Bacillus thuringiensis)结晶 毒素基因或Bt基因(Watrud 1985)。Bt基因可以提供对鳞翅目(lepidopteran) 害虫或鞘翅目(coleopteran)害虫如欧洲玉米螟(European Maize Borer, ECB))和南瓜十二星叶甲(corn rootworm,CRW)的抗性。用于此类实施方 案的优选Bt毒素基因包括CryIA(b)和CryIA(c)基因。就此方面而言,还 可以使用来自苏云金芽孢杆菌的其它种中影响昆虫生长或发育的内毒素基 因。蛋白酶抑制物也可以提供昆虫抗性(Johnson 1989)并且因此用于植物转 化。预期使用来自番茄或马铃薯的蛋白酶抑制物II基因即pinII特别有用。 甚至更有利的是使用与Bt毒素基因组合的pinII基因,本发明人已经发 现该组合的联合效应产生协同性杀昆虫活性。还可以使用编码昆虫消化系 统抑制物的其它基因或编码促进抑制物产生的酶或辅因子的那些基因。如 那些来自小麦和大麦的半胱氨酸蛋白酶抑制物和淀粉酶抑制物可以作为本 组的示例。

另外,编码凝集素的基因可以赋予额外的或备选的杀昆虫特性。凝集 素(最初称作植物血凝素)是多价的糖结合蛋白,具有凝集来自多个物种中 的红细胞。最近已经确定凝集素作为具有抗象甲(weevil)、ECB和根虫的 杀虫剂(Murdock 1990;Czapla & Lang,1990)。预计有用的凝集素基因包 括例如,大麦和小麦胚凝集素(WGA)和稻凝集素(Gatehouse 1984),优选 WGA。

在导入昆虫害虫时控制具有抗昆虫活性的大多肽或小多肽(例如裂解 肽、肽激素和毒素及毒物)产生的基因形成了本发明的另一方面。例如, 预计表达针对特定昆虫害虫的保幼激素酯酶还可以产生杀昆虫活性或可能 引起变态中止(Hammock 1990)。

表达编码影响昆虫角质层完整性的酶的基因的转基因植物又形成本发 明的另外方面。此类基因包括编码例如几丁质酶、蛋白酶、脂肪酶的那些 基因并且还是产生日光霉素(一种抑制几丁质合成的化合物)的基因,其中 导入所述的任一基因预计产生抗昆虫的玉米植物。编码影响昆虫蜕皮活性 的基因,如影响蜕皮激素UDP-葡糖基转移酶产生的那些基因也处于本发 明的有用转基因范围内。

本发明还包括这样的基因,其中所述的基因编码促进对害虫而言降低 宿主植物营养质量的化合物产生的酶。有可能例如通过改变甾醇组成而赋 予植物杀昆虫活性。甾醇由昆虫从它们的肠道中获得并用于激素合成和膜 稳定性。因此,通过表达新基因改变植物甾醇组成可能对昆虫生长和/或发 育产生不利影响并赋予植物杀昆虫活性,其中所述的新基因例如是直接促 进不想要的甾醇产生的基因和使所需要的甾醇转化成不利形式的甾醇的基 因。脂肪氧化酶是已经证实对昆虫表现抗营养效应并降低昆虫膳食的营养 质量的天然存在的植物酶。因此,本发明的又一实施方案涉及具有增强的 脂肪氧化酶活性的可以抗昆虫采食的转基因植物。

本发明还提供了借此实现植物次级代谢产物的定性或定量改变的方法 和组合物。一个实例涉及转化植物以便产生预计将赋予抗欧洲玉米螟、南 瓜十二星叶甲和其它数种玉米害虫抗性的DIMBOA。特别考虑用于该方面 的候选基因包括已知参与DIMBOA合成途径的在bx基因座内的那些基因 (Dunn 1981)。还预计导入可以调节黄酮甙(maysin)产生的基因以及在高 粱内参与蜀黍苷产生的基因分别用于促进棉铃虫(earworm)抗性和根虫 抗性。

鸭茅状摩擦禾(Tripsacum dactyloides)是抗某些昆虫(包括南瓜十二星 叶甲)的禾草物种。预计将从摩擦禾中分离编码这样的蛋白质的基因,其中 所述的蛋白质对昆虫有毒或参与对昆虫有毒的化合物的生物合成,并且这 些新基因将用于赋予抗昆虫抗性。已知摩擦禾中的昆虫抗性基础是遗传性 的,因为所述的抗性已经通过有性交配转移至玉米中(Branson和Guss, 1972)。

编码表征为具有有效杀虫活性的蛋白质的其它基因还可以用作本文中 的转基因。此类基因包括例如编码可以用作根虫拒食剂的豇豆胰蛋白酶抑 制物(CpTI;Hilder 1987)的基因;编码可以特别用作南瓜十二星叶甲拒食 剂的阿维菌素(Campbell 1989;Ikeda 1987)的基因;核糖体失活蛋白基因 和甚至调节植物结构的基因。还考虑了包括抗昆虫抗体基因和编码这样的 酶的基因的转基因玉米,其中所述的酶可以将施加在植物外部的无毒杀虫 剂(杀虫剂原)转变成植物中的杀虫剂。

2.2.1.2环境或胁迫抗性和耐受性

对植物耐受多种环境胁迫(如但不限于干旱、过度潮湿、寒冷、冰冻、 高温、盐和氧化胁迫)能力的改善还可以通过表达异源基因或过量表达同源 基因实施。可以通过导入如Winter Flounder(Cutler 1989)所述的“抗冻” 蛋白或其合成性基因衍生物实现增加的抗冰冻温度抗性而受益。还可以通 过增加叶绿体中甘油-3-磷酸乙酰基转移酶的表达赋予改善的寒冷耐受性 (Murata 1992;Wolter 1992)。对氧化胁迫(常由于如寒冷温度加高光照强 度恶化)的抗性可以通过表达超氧化物歧化酶(Gupta 1993)赋予并可以通过 谷胱甘肽还原酶加以改善(Bowler 1992)。此类策略可以允许在新出田地中 耐受冰冻并允许将产量较高的较晚成熟品种延伸到相对较早熟的地带内。

表达有利地影响植物水含量、总水势、渗透势和膨压的新基因可以增 强植物耐受干旱的能力。如本文中所用,术语“干旱抗性”和“干旱耐受性” 用来指与正常环境相比,植物增加对降低的有效水诱导的胁迫的抗性或耐 受性,以及植物在缺水环境中发挥功能并存活,以及性能相对优异的能力。 在本发明的这个方面,提出例如表达编码渗透活性溶质生物合成的基因可 以赋予抗干旱保护。在这类基因中包括编码甘露醇脱氢酶(Lee和Saier, 1982)和海藻糖-6-磷酸合酶(Kaasen 1992)的DNA。通过细胞内天然磷酸酶 的后续作用或通过导入并共表达特定的磷酸酶,这些导入的基因将分别导 致甘露醇累积或海藻糖累积,甘露醇和海藻糖均已充分报道为能够减轻胁 迫效应的保护性化合物。已经验证在转基因烟草中的甘露醇累积并且初步 结果表明表达高水平甘露醇的植物能够耐受所施加的渗透胁迫 (Tarezynski 1992)。

类似地,已经报道其它代谢物在保护酶功能(例如2,2亚氨双丙氨酸 (alanopine)或丙酸)或膜完整性(例如2,2亚氨双丙氨酸)(Loomis 1989)方面 的效力并且因此表达编码这些化合物生物合成的基因可以按照与甘露醇相 似或互补的方式赋予干旱抗性。在干旱和/或脱水期间有渗透活性和/或提供 某些直接保护效应的天然存在的代谢物的其它实例包括糖和糖衍生物,如 果糖、赤藓醇(Coxson 1992)、山梨醇、卫矛醇(Karsten 1992)、葡糖基甘 油(Reed 1984;Erdmann 1992)、蔗糖、水苏糖(Koster和Leopold 1988; Blackman 1992)、芒柄醇和松醇(Vernon和Bohnert 1992)和棉子糖 (Bernal-Lugo和Leopold 1992)。其它不是糖的渗透活性溶质包括,但不限 于脯氨酸和甘氨酸-甜菜碱(Wyn-Jones和Storey,1981)。在胁迫期间的冠 继续生长和生殖适合度增加可以通过导入并表达如控制以上所讨论的渗透 活性化合物和此类其它化合物的那些基因(如在一个示例性实施方案由肌 醇O-甲基转移酶代表的基因)而增强。

考虑了特定蛋白质的表达也可以增加干旱耐受性。基于结构相似性, 将晚期胚蛋白划分为三组(见Dure 1989)。全部三组这些蛋白质已经在正在 成熟(即正在干燥)的种子中得到证实。在这3类蛋白质中,II型(dehydrin- 型)通常在植物营养部分中在干旱和/或干燥耐受性方面发挥作用(例如 Mundy和Chua,1988;Piatkowski 1990;Yamaguchi-Shinozaki 1992)。最 近,发现烟草中表达的III型LEA(HVA-1)可影响植物高度、成熟度和干 旱耐受性(Fitzpatrick,1993)。因此,表达来自全部三组的结构基因可以赋 予干旱耐受性。在水胁迫期间被诱导的其他类型蛋白质包括可以在干旱胁 迫期间赋予多种保护型功能和/或修复型功能的巯基蛋白酶、醛缩酶和跨膜 转运蛋白(Guerrero 1990)。执行脂类生物合成因此影响膜组成的基因的表 达还可以用来赋予植物干旱抗性。

改善干旱抗性的众多基因具有互补性作用模式。因此,这些基因的组 合可能在改善玉米的干旱抗性方面具有加成效应和/或协同效应。众多的这 些基因还改善冰冻耐受性(或抗性);在冰冻和干旱期间发生的物理胁迫在 本质上是相似的并且可以以类似方式减轻。可以通过这些基因的组成型表 达或组织特异性表达而受益,但是表达这些新基因的优选方式可以是利用 膨压诱导型启动子(如用于膨压诱导型基因的启动子在Guerrero等1990和 Shagan 1993中描述)。这些基因的空间和时间表达模式可以使玉米更好地 忍受胁迫。

表达这样的基因是有益的,其中所述的基因参与允许增加从干燥土壤 中汲取水的特定形态学性状。例如,导入并表达改变根特征的基因可以增 强水摄取。表达在胁迫期间增强生殖适合度的基因将有明显的价值。例如, 表达改善花粉散播的同步性和雌性花部分(即穗丝)的接受性的DNA将有意 义。此外,表达在胁迫期间使谷粒败育最小化的基因将增加待收获的谷粒 量并且是有价值的。通过导入并表达具有适宜调节序列的异戊烯基转移酶 基因而调节单子叶植物(如玉米)中的细胞分裂素水平可以改善单子叶植物 的胁迫抗性和产量(Gan 1995)。

鉴于水在决定产量方面的重要作用,预计能够通过导入并表达新基因 而使植物更有效地利用水将改善整体性能,甚至当土壤水可用性无限制时 也是如此。通过导入这样的基因可以实现产量稳定性或均匀,其中所述的 基因改善植物在与水可用性有关的严重程度胁迫期间最大程度利用水的能 力。

改善植物免受非生物性胁迫因子如干旱、热或寒冷作用还可以如此实 现-例如通过过量表达来自短角床杜父鱼(Myoxocephalus Scorpius)(WO 00/00512)、多刺床杜父鱼(Myoxocephalus octodecemspinosus)的抗冻多肽、 拟南芥菜转录激活物CBF1、谷氨酸脱氢酶(WO 97/12983,WO 98/11240)、 钙依赖性蛋白激酶基因(WO 98/26045)、钙依赖性磷酸酶(WO 99/05902)、 来自酵母的酪蛋白激酶(WO 02/052012)、法尼基转移酶(WO 99/06580; Pei ZM等(1998)Science 282:287-290)、铁蛋白(Deak M等(1999)Nature Biotechnology 17:192-196)、草酸氧化酶(WO 99/04013;Dunwell JM (1998)Biotechn Genet Eng Rev 15:1-32)、DREB1A因子(“dehydration response element B 1A”;Kasuga M等(1999)Nature Biotech 17:276-286)、 甘露醇或海藻糖合成的基因如海藻糖-磷酸合酶基因或海藻糖-磷酸磷酸酶 基因(WO 97/42326)或通过对基因如海藻糖酶抑制(WO 97/50561)。

嵌合的转录调节性序列(例如超级启动子)的一个用途是保护胚在萌发 期间免受冷损伤。一个重要因子是氧化损害。超级启动子能够驱动即过氧 化氢酶、抗坏血酸过氧化物酶、超氧化物歧化酶等。寒冷还通过使膜硬化 而影响COX酶活性。对于干旱胁迫,表达谷氨酰胺合酶和甘氨酸甜菜碱 合酶可能是有益的。例如序列参见上文。

2.2.1.3疾病抗性和耐受性

提出可以通过将基因导入植物中实现疾病抗性增加。有可能对病毒、 细菌、真菌、根病原体、昆虫和线虫所引起的疾病产生抗性。还预计可以 通过表达导入的基因而实现控制产生霉菌毒素的生物。

病毒抗性可以通过表达新基因产生。例如,已经证实在转基因植物中 表达病毒衣壳蛋白可以赋予对病毒及可能其它亲缘关系密切的病毒感染植 物的抗性(Cuozzo 1988、Hemenway 1988、Abel 1986)。预计表达靶向病毒 必需功能的反义基因可以赋予对该病毒的抗性。例如,以负责复制病毒核 酸的基因为靶的反义基因可以抑制所述复制并产生病毒抗性。认为通过使 用反义基因而干扰病毒的其它功能还可以增加病毒抗性。另外,提出有可 能通过其它方法(包括,但不限于使用卫星病毒)实现病毒抗性。

提出可以通过导入新基因实现对细菌和真菌所致疾病的抗性的增加。 预计可使用编码所谓“肽抗生素”、致病相关蛋白(PR)、毒素抗性和影响宿 主-病原体相互作用如形态学特征的蛋白质的基因。肽抗生素是抑制细菌和 其它微生物生长的多肽序列。例如,称作杀菌肽和蛙皮素的肽类抑制众多 种类的细菌和真菌生长,提出PR蛋白在植物中的表达可以用于赋予细菌 性疾病抗性。这些基因在病原体侵袭宿主植物后被诱导并且分成至少5类 蛋白质(Bol 1990)。在PR蛋白中包括β-1,3-葡聚糖酶、几丁质酶和渗透蛋 白以及认为对植物抵抗病原生物有作用的其它蛋白质。已经鉴定了具有抗 真菌特性的其它基因,例如UDA(荨麻(stinging nettle)凝集素)和橡胶蛋白 (Broakgert 1989;Barkai-Golan 1978)。已知某些植物疾病因植物毒素的产 生而引起。可以通过如此方式实现对这些疾病的抗性,即表达编码能够降 解植物毒素或使植物毒素失活的酶的新基因。表达改变宿主植物与病原体 之间相互作用的新基因可以用于减少疾病生物侵入宿主植物组织的能力, 例如增加叶角质层蜡质或其它形态学特征。

植物寄生性线虫是众多植物中的病因。提出有可能通过表达新基因而 使植物抵抗这些生物。预期控制线虫感染将通过改变线虫识别或黏着宿主 植物的能力和/或使植物能够产生杀线虫化合物(包括但不限于蛋白质)而完 成。

此外,对真菌、昆虫、线虫和疾病的抗性可以通过定向地累积某些代 谢物或蛋白质而实现。此类蛋白质包括但不限于芥子油苷(抗食草动物防 御)、几丁质酶或葡聚糖酶和摧毁寄生虫细胞壁的其它酶、核糖体失活蛋白 (RIP)和(如当植物受到伤害或微生物侵袭时或化学方式(例如通过水杨酸、 茉莉酮酸或乙烯)所诱导的)植物抗性和胁迫反应的其它蛋白质,或来自非 植物源的溶菌酶例如T4-溶菌酶或来自多种哺乳动物的溶菌酶、杀虫蛋白 如苏云金芽孢杆菌内毒素、α-淀粉酶抑制物或蛋白酶抑制物(豇豆胰蛋白酶 抑制物)、集素如小麦胚凝集素、RNA酶或核酶。其它实例是编码哈茨木 霉(Trichoderma harzianum)chit42内切几丁质酶(GenBank登录号: S78423)或来自高粱的N-羟基化多功能细胞色素P-450(CYP79)蛋白质 (GenBank登录号:U32624),或这些蛋白质的功能等同物的核酸。累积作 为抗害虫保护的芥子油苷(Rask L等(2000)Plant Mol Biol 42:93-113; Menard R等(1999)Phytochemistry 52:29-35)、表达苏云金芽孢杆菌内毒素 (Vaeck等(1987)Nature 328:33-37)或通过表达几丁质酶(例如来自绿豆 (bean))而保护免受真菌侵袭(Broglie等(1991)Science 254:1194-1197)是有 利的。害虫(例如稻植物中的稻害虫褐稻虱(Nilaparvata lugens))抗性可以通 过表达雪钟花(Galanthus nivalis)凝集素(agglutinin)(Rao等(1998)Plant J 15(4):469-77)而实现。表达编码鳞翅目昆虫特异性苏云金芽孢杆菌D-内毒 素的合成性基因cryIA(b)和cryIA(c)可以在多种植物中引起害虫抗性 (Goyal RK等(2000)Crop Protection 19(5):307-312)。适用于防御病原体的 其它靶基因包含“聚半乳糖醛酸酶抑制蛋白”(PGIP)、非洲甜果素、转化 酶和抗微生物肽(如乳铁蛋白)(Lee TJ等(2002)J Amer Soc Horticult Sci 127(2):158-164)。可以利用于本文中的其它核酸序列包括用于昆虫控制的 性状(美国专利号6,063,597;6,063,756;6,093,695;5,942,664及6,110,464)、 真菌疾病抗性(美国专利号5,516,671;5,773,696;6,121,436;6,316,407及 6,506,962)、病毒抗性(美国专利号5,304,730及6,013,864)、线虫抗性(US 6,228,992)和细菌疾病抗性(US 5,516,671)。

待表达的异源核酸序列可以编码如任一SEQ ID NO:6、8、16、18、 20、43、45、47、49、50、51或53所述的多肽(或其部分;优选地是至少 5个、更优选至少10个、最优选至少30个连续氨基酸的部分),或其功能 等同物,其中所述的功能等同物能够带来与任一所述多肽所致的相同表型。 优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。优选赋 予真菌抗性的序列,例如由任一SEQ ID NO:43、45、47、49、50、51或 53所示的序列。

2.2.2提高的种子营养质量或籽苗营养质量

嵌合的转录调节核苷酸序列(例如超级启动子)可以优选地用来向转化 的单子叶植物赋予增加(或增强)的种子营养质量或籽苗营养质量。因此本 发明的又一个实施方案涉及用于赋予单子叶植物提高的种子营养质量或籽 苗营养质量的方法,所述方法包括步骤

a)构建表达盒,为将包含

i)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

ii)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并适用于赋予植物提高的种子营养质量或籽苗营 养质量的至少一个核酸序列,和

b)将所述的表达盒插入单子叶植物中以提供转基因植物,其中所述的 植物表达所述的异源核酸序列,和

c)选择转基因植物,其中所述转基因植物与不包含所述的表达盒但是 在其它方面与该转基因植物相同的植物相比,表现提高的种子营养质量或 籽苗营养质量.

营养质量可以包含选自维生素、类胡萝卜素、抗氧化剂、不饱和脂肪 酸和多不饱和脂肪酸的至少一个化合物的增加的含量。待表达(例如表达为 有义RNA、反义RNA或双链RNA)的异源核酸序列可以编码如任一SEQ ID NO:10、12或14所述的多肽(或其部分;优选地是至少5个、更优选至 少10个、最优选至少30个连续氨基酸的部分),或其功能等同物,其中所 述的功能等同物能够带来与任一所述多肽所致的相同表型.

优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。

营养质量和待表达的相应异源核酸序列在下文中定义.优选的嵌合的 转录调节核苷酸序列如上所述,最优选超级启动子。优选应用本发明方法 的单子叶植物可以选自玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、 黑麦草或薏苡。优选地,植物是谷类植物选自玉米、小麦、大麦、稻、燕 麦、黑麦和高粱,甚至更优选地来自玉米、小麦和稻,植物最优选地是玉 米植物。

增加的营养质量例如可以导致一种或多种如下特性:调节植物中的脂 肪酸组成、改变植物的氨基酸含量、增加植物代谢物的浓度。

可以将基因导入单子叶植物,尤其是商业重要的谷类如玉米、小麦或 稻中以便改良种植谷类主要想要得到的谷粒。根据谷粒的具体最终用途可 以预见以此方式产生的多种新颖转基因植物。

例如,玉米谷粒的最大用途是饲料或食品。导入改变谷粒成分的基因 可以明显增强饲料价值或食品价值。玉米谷粒的主要成分是淀粉、蛋白质 和油。玉米谷粒的这些主要成分中的每一种可以通过改变其水平或组成加 以改良。可以提及数个用于说明目的的实例,但是无论如何不是提供对可 能性的穷举。

就饲料和食品目的而言,多种谷物的蛋白质是次优的,尤其用于猪、 家禽和人食用时。蛋白质在这些物种的饮食中的数种必需氨基酸上有缺陷, 需要向谷物添加补充物。受限的必需氨基酸可以包括赖氨酸、甲硫氨酸、 色氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。某些氨基酸仅在谷物以用于 饲料配合的其它输入物补充后才变成受限的。例如,当时谷物用豆粕补充 以满足赖氨酸要求时,甲硫氨酸变成受限的。种子和谷粒内这些必需氨基 酸的水平可以通过如此机制提高,所述的机制包括,但不限于导入增加氨 基酸生物合成的基因、减少氨基酸降解、增加蛋白质中氨基酸的贮藏或增 加氨基酸转运至种子或谷粒内。

用于增加氨基酸生物合成的一个机制是导入解除氨基酸生物合成性途 径中受控制的基因以至于植物不再能够充分控制氨基酸的产生水平。这可 以通过解除控制氨基酸生物合成性途径中通常受途径内氨基酸终产物水平 调节的步骤或绕过所述步骤而完成。实例包括导入编码用于增加赖氨酸和 苏氨酸产生的解除控制形式的天冬氨酸激酶或二氢吡啶二羧酸(DHDP)合 酶和用于增加色氨酸产生的邻氨基苯甲酸合酶的基因。减少氨基酸的代谢 可以通过导入减少或消除编码酶的基因表达的DNA序列完成,其中所述 的酶催化分解代谢途径中的步骤,如赖氨酸-酮戊二酸还原酶。

谷粒的蛋白质组成可以用多种方式加以改变以改善氨基酸的平衡,所 述方式包括提高天然蛋白质的表达、降低那些具有不良组成的天然蛋白质 的表达、改变天然蛋白质的组成或导入编码具有优异组成的全新蛋白质的 基因。可以导入降低贮藏蛋白中玉米醇溶蛋白家族成员表达的DNA。这种 DNA可以编码旨在破坏玉米醇溶蛋白表达或破坏玉米醇溶蛋白表达的调 节物(如不透明-2基因产物)表达的核酶或反义序列。谷粒的蛋白质组成可 以通过共抑制现象(即通过表达经转化作用导入的相同结构性基因或基因 片段而抑制内源基因的表达)进行修饰(Goring 1991)。此外,导入的DNA 可以编码降解玉米醇溶蛋白的酶。所实现的玉米醇溶蛋白表达降低可以伴 随增加具有更希望的氨基酸组成的蛋白质以及增加种子其它主要成分如淀 粉。或者,可以导入嵌合基因,其中该嵌合基因包含具有适当氨基酸组成 的天然蛋白质(如玉米中球蛋白的一种或10kD玉米醇溶蛋白)的编码序列 以及设计旨在提高所述蛋白质表达的启动子或其它调节序列。所述基因的 编码序列可以包括必需氨基酸的额外密码子或替换密码子。此外,可以使 用从其它物种中获得的编码序列,或编码完全独特的肽序列的部分或完全 合成的序列,其中所述肽序列的设计目的旨在增强种子的氨基酸组成。

导入改变谷粒含油量的基因可以是有价值的。含油量增加可以导致增 加用于饲料和食品中的种子的可代谢能量含量及密度。导入的基因可以编 码移除或减弱脂肪酸或脂类生物合成中限速步骤或受调节步骤的酶。此类 基因可以包括,但不限于编码乙酰CoA羧化酶、ACP-酰基转移酶、β-酮 酰基-ACP合酶和其它众所周知的脂肪酸生物合成活性的那些基因。其它 可能基因是编码无酶活性的蛋白质如酰基载体蛋白的基因。额外的实例包 括2-乙酰基转移酶、油质蛋白丙酮酸脱氢酶复合体、乙酰CoA合成酶、 ATP柠檬酸裂合酶、ADP-葡萄糖焦磷酸化酶和涉及肉碱CoA-乙酰-CoA 穿梭的基因。预计使用质体转运肽序列并且优选地在种子胚中表达,将使 与油生物合成有关的基因的表达导向质体。可以导入改变存在于油中的脂 肪酸平衡的基因,提供更有益健康或更有营养的饲料原料。导入的DNA 还可以编码这样的序列,该序列阻遏参与脂肪酸生物合成的酶的表达,从 而如下所述改变存在于谷物内的脂肪酸的比例。

可以导入增强谷物中淀粉成分的营养价值的基因,例如通过增加分支 程度,从而因延缓淀粉代谢而导致淀粉在奶牛中利用的改善。

除了影响谷物的主要成分之外,可以导入影响饲料或食品用谷物的多 种其它养分方面、加工方面或其它品质方面的基因。例如,可以增加或减 少谷物的色素形成。某些动物饲料中黄色色素形成的增强和稳定性是受到 欢迎的并可以通过导入这样的基因而实现,其中所述的基因通过消除叶黄 素及胡萝卜素产生中的限速步骤而导致增强产生叶黄素和胡萝卜素。此类 基因可以编码改变形式的八氢番茄红素合酶、八氢番茄红素去饱和酶或番 茄红素合酶。或者,无色素的白色玉米是众多食品产品产生所需要的并且 可以通过导入阻遏或消除色素产生途径中的步骤的DNA而产生。

包含一些谷物的饲料或食品谷粒具有不充分量的维生素并且必须进行 补足以提供合适的营养价值。可以设想导入增强种子中维生素生物合成的 基因,包括例如维生素A、E、B12、胆碱等。例如,玉米谷粒也不具有用 于最佳营养价值的充分矿物质含量。影响含磷、硫、钙、锰、锌和铁等的 化合物累积或可用性的基因是有价值的。实例可以是导入减少植酸生产或 编码植酸酶的基因,这增强植酸分解。这些基因将增加食物中的可用磷酸 盐水平,减少用矿物磷酸盐作补充的需要。

可描述为饲料和食品目的而改良谷物的众多其它实例。改良可以实际 上甚至不涉及谷粒,然而可以例如改善谷物的青贮价值。为此目的所导入 的DNA可以包括改变木质素产生的序列,如导致与牛的优良饲用价值相 关的“棕色中脉(brown midrib)”表型的那些序列。

除了指导改良饲料价值或食品价值外,还可以导入这样的基因,该基 因改善谷物加工并改善从加工中所产生产品的价值。加工某些谷物如玉米 的主要方法是湿磨法。玉米可以通过新基因的表达受到改良,其中所述的 新基因提高加工效率并降低加工成本(如通过减少浸泡时间)。

改善湿磨法产物的价值可以包括改变淀粉、油、玉米面筋粉的数量或 质量或玉米淀粉渣的成分。可以如此实现淀粉的升高,即通过鉴定并消除 淀粉生物合成中的限速步骤或通过降低谷粒其它成分水平,从而导致成比 例地增加淀粉。前者的实例可以是导入这样的基因,该基因编码具有改变 的调节活性或在更高水平上表达的ADP-葡萄糖焦磷酸化酶。后者的实例 可以包括在谷粒发育晚期期间表达的例如蛋白质生物合成或油生物合成的 选择性抑制物。

淀粉特性可以通过改变直链淀粉/支链淀粉比、淀粉分子大小或其分 支模式进行有益地改变。通过这些改变,可以改良多种特性,包括,但不 限于在凝胶化温度、凝胶化热、膜和糊的透明度、Theological特性等方面 的改变。为实现这些特性改变,可以单独或组合地导入编码颗粒结合的或 可溶的淀粉合酶活性或分支酶活性的基因。DNA如反义构建体还可以用 来降低这些酶的内源性活性水平。导入的基因或构建体可以具有将基因或 构建体的表达设定在淀粉生物合成和淀粉颗粒发育中的特定时间间隔的调 节序列。此外,可以建议导入并表达引起淀粉分子的糖部分发生体内衍生 作用或其它修饰的基因。可以构想使糖部分共价地连接任一分子,其中这 种连接仅因衍生作用催化酶的存在性或淀粉颗粒内合适底物的可接近性受 限。重要的衍生实例可以包括官能团如胺基、羧基或磷酸酯基的添加,其 中所述的添加为后续体外衍生化作用提供位点或因导入离子型电荷而影响 淀粉特性。其它修饰的实例可以包括直接改变葡萄糖单元,如丢失羟基或 羟基至醛基或羧基的氧化作用。

油是玉米和其它谷物的另一种湿磨法产物,其价值可以通过导入并表 达基因加以改善。能够通过湿磨法提取的油量可以通过如以上对饲料和食 品所述的方法加以提高。也可以改变油的特性以改善油在食用油、起酥油、 润滑油或其它的油衍生性产物的生产和使用中的性能或改善其在用于食品 相关性应用中的健康特性。还可以合成可在提取后充当化学合成原材料的 新脂肪酸。油特性的改变可以通过改变存在于油中的脂肪酸的类型、水平 或脂类排列而实现。这又可以通过添加编码酶的基因(其中所述的酶催化新 脂肪酸和含有新脂肪酸的脂类合成)或通过提高天然脂肪酸的水平,与此同 时可能降低前体的水平而完成。或者,可以导入这样的DNA序列,其延 缓或阻断脂肪酸生物合成中的步骤,导致前体脂肪酸中间体增加。可以添 加的基因包括去饱和酶、环氧酶、水合酶、脱水酶和催化涉及脂肪酸中间 体的反应的其它酶。可以被阻断的催化步骤的代表性实例包括从硬脂酸至 油酸和从油酸至亚麻酸的去饱和步骤,阻断所述步骤导致相应地累积硬脂 酸酸和油酸。

也可以通过导入用来获得新植物的基因实现改良其它的谷物湿磨法产 物、面筋粉和玉米淀粉渣。代表性的可能方式包括但不限于以上对改善食 品价值和饲料价值所述的那些方式。

此外,还可以考虑应当使用植物来产生或制造植物中先前根本不产生 或不以这个水平产生的有用生物化合物。可能通过转化方法导入并表达基 因而制备产生这些化合物的新植物。有可能包括,但不限于目前通过任何 生物所产生的任一生物化合物,如蛋白质、核酸、初级代谢物和中间代谢 物、糖类聚合物等。化合物可以由植物产生、在收获和/或加工后提取并且 用于任何目前认识到的有用目的,如药物、香料、工业用酶,不一而足。

作为由转基因植物中导入的基因所潜在编码的谷粒性状或特性范围的 其它可能例证包括因导入增强γ-玉米醇溶蛋白合成的基因而具有较少易 断性的出口用谷粒或在干磨法加工时具有较大粒度的谷粒、因增加囊果皮 厚度的基因而具有改良的爆裂性、质量和膨胀体积的爆花玉米、因导入有 效阻断参与色素产生途径的酶发生表达的基因而具有食品用白色谷粒的玉 米以及因导入影响风味的基因如甜玉米矮缩基因(编码蔗糖合酶)而改善的 酒精饮料或甜玉米质量。

可以与本发明的启动子核酸序列组合并改良终产物性状的有用核酸序 列包括但不限于编码种子贮藏蛋白、脂肪酸途径酶、生育酚生物合成酶、 氨基酸生物合成酶和淀粉分支酶的那些基因。对用于改良植物表型的示例 性异源DNA的讨论可以在例如美国专利号6,194,636;6,207,879; 6,232,526;6,426,446;6,429,357;6,433,252;6,437,217;6,515,201;和6,583,338 以及PCT公开WO 02/057471中找到,所述每篇文献具体地在本文中完整 引用作为参考。所述性状包括但不限于:

-用于食品和饲料领域内的代谢酶(如植酸酶和纤维素酶)的表达。尤 其优选核酸,如编码微生物植酸酶的人工cDNA(GenBank登录号:A19451) 或其功能等同物。

-引起精细化学品如生育酚、生育三烯酚或类胡萝卜素累积的基因的 表达。可以提到的实例是八氢番茄红素去饱和酶。优选编码黄水仙 (Narcissus pseudonarcissus)八氢番茄红素去饱和酶的核酸(GenBank登录 号:X78815)或其功能等同物。优选的生育酚生物合成酶包括tyrA、slr1736、 ATPT2、dxs、dxr、GGPPS、HPPD、GMT、MT1、tMT2、AANT1、slr 1737和对尿黑酸双加氧酶的反义构建体(Kridl等(1991)Seed Sci.Res., 1:209:219;Keegstra(1989)Cell,56(2):247-53;Nawrath等(1994)Proc.Natl. Acad.Sci.USA,91:12760-12764;Xia等(1992)J.Gen.Microbiol., 138:1309-1316;Lois等(1998)Proc.Natl.Acad.Sci.USA,95(5):2105-2110; Takahashi等(1998)Proc.Natl.Acad.Sci.USA,95(17):9879-9884;Norris 等(1998)Plant Physiol.,117:1317-1323;Bartley和Scolnik(1994)Plant Physiol.,104:1469-1470;Smith等(1997)Plant J.,11:83-92;WO 00/32757; WO 00/10380;Saint Guily等(1992)Plant Physiol.,100(2):1069-1071;Sato 等(2000)J.DNA Res.,7(1):31-63),全部文献在本文中引用作为参考。

-淀粉生产(美国专利号5,750,876和6,476,295)、高量蛋白质生产(US 6,380,466)、果实成熟(US 5,512,466)、增强的动物及人营养(美国专利号 5,985,605和6,171,640)、生物聚合物(US 5,958,745和美国专利公开号 2003/0028917)、环境胁迫抗性(US 6,072,103)、药学肽(US 6,080,560)、改 良的加工性状(US 6,476,295)、改善的消化性(US 6,531,648)、低棉子糖(US 6,166,292)、工业用酶生产(US 5,543,576)、改善的风味(US 6,011,199)、固 氮(US 5,229,114)、杂交种子生产(US 5,689,041)和生物燃料生产(US 5,998,700),其中在以上所列专利中描述的遗传元件和转基因在本文中引用 作为参考。优选的淀粉分支酶(用于改良淀粉特性)包括在美国专利号 6,232,122和6,147,279;和PCT公开WO 97/22703中所述的那些淀粉分支 酶,全部文献在本文中引用作为参考。

-改变的油生产(US 6,444,876)、高量油生产(美国专利号5,608,149 和6,476,295)或改变的脂肪酸含量(US 6,537,750)。优选的脂肪酸途径酶包 括硫酯酶(美国专利号5,512,482;5,530,186;5,945,585;5,639,790; 5,807,893;5,955,650;5,955,329;5,759,829;5,147,792;5,304,481;5,298,421; 5,344,771;和5,760,206)、二酰甘油酰基转移酶(美国专利公开 20030115632A1和20030028923A1)和去饱和酶(美国专利号5,689,050; 5,663,068;5,614,393;5,856,157;6,117,677;6,043,411;6,194,167;5,705,391; 5,663,068;5,552,306;6,075,183;6,051,754;5,689,050;5,789,220;5,057,419; 5,654,402;5,659,645;6,100,091;5,760,206;6,172,106;5,952,544;5,866,789; 5,443,974和5,093,249),其中全部文献在本文中引用作为参考。

-优选的氨基酸生物合成酶包括邻氨基苯甲酸合酶(US 5,965,727和 PCT公开WO 97/26366,WO 99/11800,WO 99/49058)、色氨酸脱羧酶(PCT 公开WO 99/06581)、苏氨酸脱羧酶(美国专利号5,534,421和5,942,660; PCT公开WO 95/19442)、苏氨酸脱氨酶(PCT公开WO 99/02656和WO 98/55601)、二氢吡啶二羧酸合酶(US 5,258,300)和天冬氨酸激酶(美国专利 号5,367,110;5,858,749和6,040,160),其中全部文献在本文中引用作为参 考。

-通过脂肪酸延伸酶和/或去饱和酶的表达生产营养品,例如多不饱 和脂肪酸(例如花生四烯酸、二十碳五烯酸或二十二碳六烯酸),或产生具 有改良的营养价值例如具有高含量的必需氨基酸(例如巴西坚果树(brazil nut)的高-甲硫氨酸2S白蛋白基因)的蛋白质。优选这样的核酸,其编码巴 西坚果树(Bertholletia excelsa)高-甲硫氨酸2S白蛋白(GenBank登录号: AB044391)、小立碗藓Δ6-酰基-脂去饱和酶(GenBank登录号:AJ222980; Girke等(1998)Plant J 15:39-48)、高山被孢霉(Mortierella alpina)Δ6-去饱 和酶(Sakuradani等(1999)Gene 238:445-453)、秀丽隐杆线虫 (Caenorhabditis elegan)Δ5-去饱和酶(Michaelson等(1998)FEBS Letters 439:215-218)、秀丽隐杆线虫Δ5-脂肪酸去饱和酶(des-5)(GenBank登录号: AF078796)、高山被孢霉Δ5-去饱和酶(Michaelson等JBC 273:19055-19059)、秀丽隐杆线虫Δ6-延伸酶(Beaudoin等2000,PNAS 97:6421-6426)、小立碗藓Δ6-延伸酶(Zank等2000,Biochemical Society Transactions 28:654-657)或这些蛋白质的功能等同物。

-产生用于工业目的的高质量蛋白质和酶(例如酶,如脂肪酶)或药物 (例如,抗体、凝血因子、干扰素、淋巴因子、集落刺激因子、纤溶酶原激 活剂、激素或疫苗,如Hood EE和Jilka JM(1999)Curr Opin Biotechnol 10(4):382-6;Ma JK和Vine ND(1999)Curr Top Microbiol Immunol 236:275-92)所述的。例如,已经有可能在转基因玉米植物中大规模产生来 自鸡卵清内的重组抗生物素蛋白和细菌的β-葡糖醛酸糖苷酶(GUS)(Hood 等(1999)Adv Exp Med Biol 464:127-47.综述)。

-例如通过表达乙酰CoA羧化酶获得在通常包含较少贮藏蛋白或贮藏 脂类的细胞内增加的贮藏性,其目的是增加这些物质的产量。优选的核酸 是编码紫花苜蓿(Medicago sativa)乙酰CoA羧化酶(ACC酶)(GenBank登 录号:L25042)的那些核酸,或其功能等同物。或者,在某些情况下,增加 贮藏蛋白含量可能对生产高量蛋白质产物有利。优选的种子贮藏蛋白包括 玉米醇溶蛋白(美国专利号4,886,878;4,885,357;5,215,912;5,589,616; 5,508,468;5,939,599;5,633,436;和5,990,384;PCT公开WO 90/01869、 WO 91/13993、WO 92/14822、WO 93/08682、WO 94/20628、WO 97/28247、 WO 98/26064和WO 99/40209)、7S蛋白质(美国专利号5,003,045和 5,576,203)、巴西坚果树蛋白(US 5,850,024)、无苯丙氨酸的蛋白质(PCT公 开WO 96/17064)、白蛋白(PCT公开WO 97/35023)、β-伴大豆球蛋白(PCT 公开WO 00/19839)、11S(US 6,107,051)、α-大麦硫素(hordothionin)(美国 专利号5,885,802和5,88,5801)、arcelin种子贮藏蛋白(US 5,270,200)、凝 集素(US 6,110,891)和麦谷蛋白(美国专利号5,990,389和5,914,450),其中 全部文献在本文中引用作为参考。

-降低α-葡聚糖L-型块茎磷酸化酶(GLTP)或α-葡聚糖H-型块茎磷酸 化酶(GHTP)酶活性的水平,优选地是在马铃薯块茎内(见US 5,998,701)。 马铃薯块茎内淀粉至糖的转化在表现降低的GLTP或GHTP酶活性的块茎 内减少,尤其马铃薯块茎在低于7℃贮藏时。减少马铃薯内的冷致甜作用 允许在更凉的温度下贮藏马铃薯,导致休眠延长、降低疾病发生率并增加 贮藏期。降低马铃薯块茎内GLTP或GHTP的活性可以通过如使用同源性反 义RNA或双链RNA抑制基因表达、利用共抑制、调节性沉默序列的技术而 实现。具有改良冷贮藏特征的马铃薯植物包含用如此表达盒转化的马铃薯 植物,其中所述的表达盒具有与DNA序列有效连接的TPT启动子序列,其 中所述的DNA序列包含编码选自α-葡聚糖L-型块茎磷酸化酶(GLTP)和α- 葡聚糖H-型磷酸化酶(GHTP)的α-葡聚糖磷酸化酶的基因的至少20个核苷 酸。

有利基因的其它实例在例如Dunwell JM,Transgenic approaches to crop improvement,J Exp Bot.2000;51 Spec NO第487-96页提到。对用 于改良植物表型的示例性异源DNA的讨论可以在例如美国专利号 6,194,636中找到。

本发明的另一个方面提供这样的DNA构建体,在其中具有淀粉胚乳 特异性或偏好性表达和/或萌芽胚特异性或偏好性表达的启动子驱动基因 抑制性DNA元件,其目的是例如抑制氨基酸分解代谢酶。

种子成熟:种子成熟或谷粒发育指起于受精并止于种子干燥的时期, 其中在受精中可代谢的食物储备(例如蛋白质、脂类、淀粉等)沉积在发育 着的种子中,尤其在包括胚乳胚乳、种皮、糊粉层、胚和盾片上皮的种子 贮藏器官内,导致种子的增大和填充。

本发明提供用于使转基因在植物中、尤其在萌芽胚中高效表达的新方 法和组合物。本文中所述的启动子代表发育可调节型启动子,来自所述启 动的表达在种子发育的大部分时期对淀粉胚乳呈特异性并且在水中吸涨后 在胚中增加多达16小时。淀粉胚乳中的表达“转换”到胚24小时,直至萌 发后7日。

本发明的表达特异性启动子可以用于使产量滞后和对玉米生长和发育 的其它潜在不利生理影响最小化,其中所述的不利生理影响可能因在植物 中转基因蛋白质或其它分子的高水平非诱导的组成型表达而遭遇。当每种 转基因与本发明启动子融合时,可以使DNA序列同源依赖性转基因失活 (共抑制)的风险最小化。

使DNA本身定位在细胞内可能有用。例如,导入的DNA定位在细胞 核内可能是有用的,因为这可以增加转化频率。在细胞核内,为了实现位 点特异性整合,以基因为靶是有用的。例如,使经过转化作用所导入的基 因替换细胞内现存的基因将是有用的。其它元件包括可以受内源性介质或 外源性物质(例如受锌指蛋白,包括天然存在的锌指蛋白或嵌合的锌指蛋白 (见,例如US 5,789,538,WO 99/48909;WO 99/45132;WO 98/53060;WO 98/53057;WO 98/53058;WO 00/23464;WO 95/19431和WO 98/54311) 或Myb样转录因子)调节的那些元件。嵌合的锌指蛋白可以包括结合至特 定DNA序列的氨基酸序列(锌指)以及激活(例如GAL 4序列)或抑制与这 种特定DNA序列连接的序列转录的氨基酸序列。

为本发明目的,对目的基因的一般分类例如包括与信息有关的那些基 因如锌指基因、与通信有关的那些基因如激酶基因,和与持家有关的那些 基因如热休克蛋白基因。更具体的转基因分类包括这样的基因,其编码对 农学品质、昆虫抗性、疾病抗性、除草剂抗性和谷粒特征重要的性状。其 它的转基因分类包括诱导来自植物和其它真核生物以及来自原核生物的外 源产物(如酶、辅因子和激素)表达的基因。已经认识到任一目的基因可以 有效地与本发明的启动子连接并在胁迫下得以表达。

在更优选的实施方案中,本发明的启动子调节这样的基因,该基因编 码充当细胞周期调节物或控制糖代谢或植物激素水平的蛋白质,这一点已 经在具有另外的组织优选启动子的烟草和卡诺拉油菜(canola)中证实(Ma, Q.H.等,(1998)Australian Journal of Plant Physiology 25(1):53-59;Roeckel, P.等,(1997)Transgenic Research 6(2):133-141)。例如,编码异戊烯基转移 酶或IAA-M的基因可以用于调节雌性小花枝的发育。其它重要的基因编 码生长因子和转录因子。表达受启动子指导的所选择内源核苷酸或异源核 苷酸可以引起雌性小花枝在不利条件下持续或改善的发育。

种子产生可以通过改变基因的表达得到改善,其中所述的基因在环境 胁迫期间影响种子生长及发育应答(Cheikh-N等(1994)Plant Physiol. 106(1):45-51)并且控制糖代谢以在玉米中减少种子败育(Zinselmeier等 (1995)Plant Physiol.107(2):385-391)。

2.3靶向的序列切除

本发明的嵌合的转录调节核酸序列(例如超级启动子)在单子叶植物中 的特异性使其特别用于从所述单子叶植物的基因组中定向地切除或缺失序 列(如标记序列)。现有技术中已知方法的一个已知缺点是在整个植物范围 内切除的不均一性,因此导致嵌合样的切除模式,这需要繁琐的额外选择 和再生轮次。本发明启动子在早期胚中的特异性允许遍及整个胚的均一性 切除,随后将提供无植物同源靶序列(例如标记)的植物。

本发明的又一个实施方案涉及用于从单子叶植物中切除靶序列(例如 标记序列)的方法,所述方法包括步骤

a)构建表达盒,为将包含

iii)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核苷 酸序列,和

iv)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列为异源的并适合于诱导从单子叶植物中切除标记序列的至 少一个核酸序列,和

b)将所述的表达盒插入包含至少一个标记序列的单子叶植物中以提 供转基因植物,其中所述的植物表达所述的异源核酸序列,和

c)选择显示切除所述标记的转基因植物。

通过多种方法实现切除,所述方法包括但不限于:

-使用位点特异性重组酶通过位点特异性重组而诱导序列缺失,其 中所述的位点特异性重组酶由本发明的嵌合的转录调节核苷酸序列表达,

-通过诱导的同源重组而诱导序列缺失,其中待缺失的序列在侧翼 分布有这样的序列,所述序列具有允许在它们之间发生同源重组的方向、 足够长度和相互同源性,其中同源重组因位点特异性内切核酸酶(优选归巢 内切核酸酶、更优选归巢内切核酸酶I-SceI)所产生的位点特异性双链断口 而诱导,其中所述的位点特异性内切核酸酶由本发明的嵌合的转录调节核 苷酸序列表达。

本发明的又一个实施方案涉及单子叶植物或单子叶植物细胞,包含

i)稳定插入植物基因组中的至少一个靶序列,其中所述靶序列的侧 翼为切除序列,这种切除序列能够在与序列特异性切除介导酶相互作用时 介导从植物基因组中切除所述靶序列,和

ii)包含与嵌合的转录调节核苷酸序列有效连接的至少一个核酸序列 的表达盒,其中所述的核酸序列编码能够与i)所述的切除序列相互作用的 切除介导酶,所述嵌合的转录调节核苷酸序列包含如下序列:

a)至少一个衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节 核苷酸序列,

b)衍生自根癌农杆菌章鱼碱合酶基因的至少一个上游激活序列.

优选的嵌合的转录调节核苷酸序列如上所述,最优选超级启动子。待 表达以实现序列切除的优选异源核酸序列(例如编码位点特异性重组酶或 内切核酸酶)在下文描述。

优选应用本发明方法的单子叶植物可以选自玉米、小麦、稻、大麦、 燕麦、黑麦、高粱、香蕉、黑麦草或薏苡。植物优选地是选自玉米、小麦、 大麦、稻、燕麦、黑麦和高粱,甚至更优选地来自玉米、小麦和稻的谷类 植物,植物最优选地是玉米植物。

嵌合的转录调节核苷酸序列优选地如上定义并且最优选地是超级启动 子。在以上定义的单子叶植物或单子叶植物细胞中的靶序列将被切除,只 要所述植物的种子萌发和胚开始生长。从这种胚中,将产生无靶序列的植 物。

靶序列和用于切除介导酶的表达盒可以组合于一个DNA中或在不同 的构建体上。不同DNA构建体可以通过其它方法于单子叶植物或单子叶 植物细胞的基因组中组合-例如,使分别包含所述靶序列和所述的用于切除 介导酶的表达盒的不同亲代株系杂交,或共转化或后继转化。

因此,本发明的又一个实施方案涉及用于从单子叶植物或单子叶植物 细胞的基因组中切除至少一个靶序列的方法,包括步骤

i)将包含至少一个靶序列的核酸构建体稳定插入基因组其中所述核 酸构建体稳定插入植物基因组中,其中所述靶序列的侧翼为切除序列,该 切除序列能够在与序列特异性切除介导酶相互作用时介导从植物基因组中 切除所述靶序列,和

ii)将包含至少一个核酸序列的表达盒导入所述的单子叶植物或单子叶 植物细胞,其中所述的核酸序列编码能够与i)所述的切除序列相互作用的 切除介导酶,与包含如下序列的嵌合的转录调节核苷酸序列有效地连接

a)至少一个衍生自农杆菌甘露氨酸合酶基因启动子的转录调节核 苷酸序列,和

b)至少一个衍生自农杆菌章鱼碱合酶基因的上游激活序列,

iii)产生包含所述靶序列和所述表达盒的所述单子叶植物或单子叶 植物细胞的种子,萌发该种子并自该种子生长植物,和

iv)选择从中所述靶序列已经被切除的植物。

在优选的实施方案中,本发明方法还包含再生能育植物的步骤。该方 法还可以包括有性繁殖或无性繁殖或培育从所述植物细胞再生的植物的子 孙或后代。

优选地,靶序列的切除(或缺失)可以通过本领域已知的多种方法实 现,包括但不限于一个或多个如下的方法:

a)通过序列特异性重组酶诱导的重组,其中所述的靶序列以如此方式 在侧翼具有相应的重组位点,以至于在所述的侧翼重组位点之间的重组导 致从基因组中缺失侧翼重组位点之间的靶序列,

b)在所述靶序列侧翼分布的同源序列A和A’之间同源重组,其中在同 源序列之间的所述同源重组优选地由序列特异性内切核酸酶所产生的序列 特异性双链断口诱导,其中所述的同源序列A和A’具有足够长度和同源性 以便确保A和A’之间发生同源重组,并具有这样的方向,当A和A’之间重组 时,所述方向将导致从所述植物的基因组中切除所述序列。

优选的切除序列和切除酶在以下详细描述。在另一个优选的实施方案 中,可以以如此方式诱导或激活缺失/切除机制以防止过早地缺失/切除双功 能标记。优选地,因此优选采用的序列特异性重组酶或内切核酸酶的表达 和/或活性可以被诱导和/或激活,优选地通过选自如下的方法:

a)因编码所述切除酶(例如重组酶或内切核酸酶)的序列有效连接至与 诱导型启动子或启动子元件组合的嵌合的转录调节性序列而可诱导的表 达,

b)因利用可诱导的、经修饰(例如包含配体结合结构域)的切除酶(例如 重组酶或内切核酸酶)而可诱导的激活,其中所述经修饰切除酶的活性可以 通过用具有对所述配体结合结构域的结合活性的化合物处理受到调节。

优选地,靶序列是标记,更优选地是选择标记(优选的标记序列下文详 述)。因此,本发明方法产生无选择标记的单子叶植物细胞或单子叶植物。

2.3.1优选的切除序列和切除酶

为确保靶序列缺失/切除,靶序列在侧翼具有在与序列特异性切除介导 酶相互作用时能够介导从植物基因组中切除所述靶序列的切除序列。优选 地,靶序列的缺失可以通过本领域已知的多种方法实现,包括但不限于一 个或多个如下的方法:

a)通过序列特异性重组酶诱导的重组,其中所述的靶序列以如此方式 在侧翼具有相应的重组位点,以至于在所述的侧翼重组位点之间的重组导 致从基因组中缺失在侧翼重组位点之间的靶序列,

b)在所述靶序列侧翼分布的同源序列A和A’之间同源重组,其中在同 源序列之间的所述同源重组优选地由序列特异性内切核酸酶所产生的序列 特异性双链断口诱导,其中所述的同源序列A和A’具有足够长度和同源性 以便确保A和A’之间发生同源重组,并具有这样的方向,当A和A’之间重组 时,所述方向将导致从所述植物的基因组中切除所述序列。

因此,为确保靶序列缺失/切除,靶序列在侧翼具有允许特异性地缺失 所述表达盒的序列。所述的序列可以是序列特异性重组酶的重组位点,其 中以如此方式安置所述的重组位点以至于在所述的侧翼重组位点之间的重 组导致从基因组中缺失所述靶序列。存在本领域中已知的多种重组位点和 相应的序列特异性重组酶(描述于下文),可以为本发明的目的而采用。

在另一个优选的实施方案中,靶序列的缺失/切除通过分子内(优选在 染色体内的)同源重组开展。同源重组可以天然发生,但是优选地由序列特 异性双链断口(例如在同源序列之间)诱导。基本原理在WO 03/004659中公 开。为此目的,靶序列在侧翼具有同源序列A和A’,其中所述的同源序列A 和A’具有足够长度和同源性以便确保A和A’之间发生同源重组,并具有这 样的方向,当A和A’之间重组时,所述方向将导致从所述基因组中切除所 述序列。此外,在侧翼有所述同源序列的序列还包含具有至少10个碱基对 的至少一个识别序列,其中所述的识别序列用于通过序列特异性DNA双链 断口诱导酶、优选序列特异性DNA内切核酸酶、更优选归巢内切核酸酶、 最优选选自I-SceI、I-CpaI、I-CpaII、I-CreI和I-ChuI的内切核酸酶或其具 有配体结合结构域的嵌合体而位点定向地诱导DNA双链断口。合适的内切 核酸酶在下文描述。

2.3.1.1重组位点和重组酶

在本发明中适合的序列特异性重组酶及它们的相应的重组位点可以包 括但不限于噬菌体P1的Cre/lox系统(Dale EC和Ow DW(1991)Proc Natl Acad Sci USA 88:10558-10562;Russell SH等(1992)Mol Gene Genet 234: 49-59;Osborne BI等(1995)Plant J.7,687-701)、酵母FLP/FRT系统 (Kilby NJ等(1995)Plant J 8:637-652;Lyznik LA等(1996)Nucleic Acids Res 24:3784-3789)、Mu噬菌体Gin重组酶、大肠杆菌Pin重组酶或质粒 pSR1的R/RS系统(Onouchi H等(1995)Mol Gene Genet 247:653-660; Sugita Ket等(2000)PlantJ.22:461-469)。重组酶(例如Cre或FLP)特异地与 重组酶的相应重组序列(分别是34bp lox序列和47bp FRT序列)相互作用 以便缺失或倒转位于重组序列间的序列。描述了通过Cre在植物中缺失侧 翼具有两个lox序列的标准选择标记(Dale EC和Ow DW(1991)Proc Natl Acad Sci USA 88:10558-10562)。下表1中描述用于合适的重组酶的优选重 组位点:

表1.合适的序列特异性重组酶

  重组酶   生物来源   重组位点   CRE   噬菌体P1   5’-AACTCTCATCGCTTCGGATAACTTCCTGTT   ATCCGAAACATATCACTCACTTTGGTGATTT   CACCGTAACTGTCTATGATTAATG-3’   FLP   酿酒酵母   (Saccharomyces   cerevisiae)   5’-GAAGTTCCTATTCCGAAGTTCCTATTCTCT   AGAA AGTATAGGAACTTC-3’   R   pSR1质粒   5’-CGAGATCATATCACTGTGGACGTTGATGA   AAGAATAC GTTATTCTTTCATCAAATCGT

2.3.1.2同源序列

就同源序列(例如A,A’)而言,“足够长度”优选指具有至少20碱基对、 优选至少50碱基对、特别优选至少100碱基对、非常特别优选至少250碱基 对、最优选至少500碱基对长度的序列。

就同源序列(例如A,A’)而言,“足够同源性”优选指这样的序列,所 述的序列在这些同源序列中在至少20碱基对、优选至少50碱基对、特别 优选至少100碱基对、非常特别优选至少250碱基对、最优选至少500碱 基对长度的范围内具有至少70%、优选地80%、优选至少90%、特别优选 至少95%、非常特别优选地至少99%、最优选地100%同源性。

同源序列A和A’优选地以同向重复序列的形式排列。术语“同向重复 序列”意指两种序列在DNA分子的同一链上在相同方向上的连续定位,其 中这两种序列满足以上所给出的所述两个序列之间发生同源重组的条件。

在优选的实施方案中,同源序列可以是DNA构建体中具有额外用途的 序列的复制。例如,同源序列可以是两个转录终止子序列。这两个终止子 序列中的一个序列可以有效地与具有农学价值的性状基因连接,而另一个 序列可以与存在于性状基因3’方向的双功能选择标记连接。在两个终止子 序列之间的重组将切除靶序列(例如标记基因),但是将重构性状基因的终 止子。在另一个实例中,同源序列可以是两个启动子序列。这两个启动子 序列中的一个序列可以有效地与具有农学价值的性状基因连接,而另一个 序列可以与性状基因5’-方向存在的靶序列(例如选择标记)连接。在两个启 动子序列之间的重组将切除靶序列(例如标记基因),但是将重构性状基因 的启动子。本领域技术人员知道同源序列没有必要限于单一功能性元件(例 如启动子或终止子),而可以包含或扩展到其它的序列(例如作为性状基因 编码区域的部分和所述性状基因的分别的终止子序列的部分)。

2.3.1.3.双链断口诱导酶

优选地,靶序列(例如标记基因)的缺失/切除通过在以上所述同源序列 之间、优选在应当发生重组的同源序列之间由序列特异性双链断口所诱导 的同源重组而实现。一般方法在例如WO 03/004659中公开,所述文献在本 文中完整引用作为参考。本领域中已知适用于诱导序列特异性双链断口的 多种酶(本文以下统称为“内切核酸酶”)。内切核酸酶可以例如选自:

1.限制性内切核酸酶(II型),优选如本文以下详述的归巢内切核酸酶。

2.转座酶,例如p-元件转座酶(Kaufman PD和Rio DC(1992)Cell 69(1):27-39)或AcDs(Xiao YL和Peterson T(2000)Mol Gene Genet 263(1):22-29)。原则上,所有转座酶或整合酶是合适的,只要它们具有序 列特异性(Haren L等(1999)Annu Rev Microbiol.1999;53:245-281;Beall全 部EL,Rio DC(1997)Gene Dev.11(16):2137-2151).

3.如本文以下详述的嵌合核酸酶。

4.免疫系统中诱导双链断口的酶,如RAG1/RAG2系统(Agrawal A等 (1998)Nature 394(6695):744-451)。

5.II组内含子内切核酸酶。对内含子序列的修饰允许将II组内含子指 向双链DNA内的几乎任一序列,其中II组内含子可以随后借助逆剪接机制 插入(Mohr等(2000)Genes & Development 14:559-573;Guo等(2000) Science 289:452-457)。在这种逆剪接机制期间,双链断口被导入靶DNA内, 已切除的内含子RNA切割有义链,同时II组内含子内切核酸酶的蛋白质部 分水解反义链(Guo等(1997)EMBO J 16:6835-6848)。当仅需要诱导双链断 口而不实现彻底的逆剪接时,正如本发明的情况,有可能借助例如无逆转 录酶活性的II组内含子内切核酸酶。尽管这未阻止产生双链断口,然而逆 剪接机制不能推进至完成。

合适的酶是天然酶和合成酶。优选的酶是其识别序列已知并且可以以 其蛋白质形式获得(例如通过纯化)或使用其核酸序列加以表达的全部内切 核酸酶。

在优选的实施方案中,使用序列特异性内切核酸酶用于特异性诱导双 链断口并随后诱导同源重组。术语“序列特异性DNA内切核酸酶”通常指全 部的如此内切核酸酶,这些酶能够在双链DNA中于一个或多个识别序列处 以序列特异性方式生成双链断口。所述的DNA切割可以产生DNA的平端或 所谓“粘端”(具有5’-或3’-突出端)。切割位点可以位于识别序列内部或外 部。可以采用多种类型的内切核酸酶。内切核酸酶可以属于例如II类或IIs 类型。IIs类R-M限制性内切核酸酶在识别位点之外的序列处催化DNA切 割,即它们在距离识别序列特定数目的核苷酸的DNA序列处切割(Szybalski 等(1991)Gene 100:13-26)。可以通过举例方式,但不是限制性方式提到如 下酶:

1.限制性内切核酸酶(例如II型或IIs型),优选如本文以下详述的归巢 内切核酸酶。

2.如本文以下详述的嵌合核酸酶或合成核酸酶。

与重组酶不同,限制酶通常不连接DNA,而仅切割DNA。限制酶例 如在New England Biolabs在线目录(www.neb.com),Promega在线目录 (www.promega.com)和Rao等(2000)Prog Nucleic Acid Res Mol Biol 64:1-63中描述。在本发明中,“连接”因内切核酸酶切割产生的DNA末端 通过同源序列同源重组所致的融合而实现。

优选地,以如此方式选择内切核酸酶,以至于该酶的相应识别序列在 靶植物生物的未修饰基因组中是稀有的,甚至从未发现过。理想地,在基 因组中导入识别序列的拷贝仅由本发明的DNA构建体导入,因而排除在 表达这种序列特异性内切核酸酶时切除或重排基因组中其它DNA的可能 性。

选择合适的内切核酸酶的一个标准是该酶的相应识别序列长度。所述 识别序列具有适宜的长度以允许稀有切割,更优选地是仅在包含于本发明 的DNA构建体中的识别位点处发生切割识别序列。从统计观点看,决定 所述识别序列最小长度的一个因素是宿主生物基因组的大小。在优选的实 施方案中,识别序列的长度是至少10碱基对、优选至少14碱基对、更优 选至少16碱基对、尤其优选至少18碱基对、最优选至少20碱基对。

切割10碱基对识别序列的限制酶在Huang B等(1996)J Protein Chem 15(5):481-9中描述。

合适的酶是天然酶和合成酶。优选的酶是其识别序列已知并且可以以 其蛋白质形式获得(例如通过纯化)或使用其核酸序列加以表达的全部序列 特异性DNA内切核酸酶。

尤其优选除在转基因重组构建体内存在的识别序列之外,在特定真核 生物的染色体DNA序列内没有或仅有少量识别序列的限制性内切核酸酶 (限制酶)。这避免了在基因组中在不需要的基因座处的其它双链断口。这 是尤其优选归巢内切核酸酶的原因(综述:(Belfort M和Roberts RJ(1997) Nucleic Acids Res 25:3379-3388;Jasin M(1996)Trends Genet. 12:224-228;Internet:http://rebase.neb.com/rebase/rebase.homing.html)。 由于归巢内切核酸酶的长识别序列,大多数情况下,它们在真核生物的染 色体DNA序列中没有或仅有几个额外识别序列。

编码此类归巢内切核酸酶的序列可以分离例如自衣藻 (Chlamydomonas)的叶绿体基因组(Turmel M等(1993)J Mol Biol 232: 446-467)。它们是小分子(18至26kD)并且它们的可读框(ORF)具有直接适 用于在真核生物中进行核表达的“密码子选择”(Monnat RJ Jr等(1999) Biochemtl Biophys Res Com 255:88-93)。非常特别优选地加以分离的归 巢内切核酸酶是归巢内切核酸酶I-SceI(WO96/14408)、I-SceII(Sarguiel B 等(1990)Nucleic Acids Res 18:5659-5665)、I-SceIII(Sarguiel B等(1991) Mol Gene Genet.255:340-341)、I-CeuI(Marshall(1991)Gene 104:241-245)、I-CreI(Wang J等(1997)Nucleic Acids Res 25:3767-3776)、 I-ChuI(Cote V等(1993)Gene 129:69-76)、I-TevI(Chu等(1990)Proc Natl Acad Sci USA 87:3574-3578;Bell-Pedersen等(1990)Nucleic Acids Res18:3763-3770)、I-TevII(Bell-Pedersen等(1990)Nucleic Acids Res18:3763-3770)、I-TevIII(Eddy等(1991)Gene Dev.5:1032-1041)、Endo SceI(Kawasaki等(1991)J Biol Chem 266:5342-5347)、I-CpaI(Turmel M等 (1995a)Nucleic Acids Res 23:2519-2525)和I-CpaII(Turmel M等 (1995b)Mol.Biol.Evol.12,533-545)。

其它归巢内切核酸酶在以上提及的互联网站点详细描述,并且可以提 到的实例是归巢内切核酸酶如F-SceI、F-SceII、F-SuvI、F-TevI、 F-TevII、I-AmaI、I-AniI、I-CeuI、I-CeuAIIP、I-ChuI、I-CmoeI、 I-CpaI、I-CpaII、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、 I-CrepsbIVP、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、 I-DmoI、I-HmuI、I-HmuII、I-HspNIP、I-LlaI、I-MsoI、I-NaaI、 I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、 I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、 I-PorIIP、I-PpbIP、I-PpoI、I-SPBetaIP、I-ScaI、I-SceI、I-SceII、 I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-SexIP、I-SneIP、 I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、 I-SthPhiST3P、I-SthPhiS3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、 I-UarAP、I-UarHGPA1P、I-UarHGPA13P、I-VinIP、I-ZbiIP、 PI-MtuI、PI-MtuHIP、PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、 PI-PkoII、PI-PspI、PI-Rma43812IP、PI-SPBetaIP、PI-SceI、PI-TfuI、 PI-TfuII、PI-ThyI、PI-TliI、PI-TliII、H-DreI、I-BasI、I-BmoI、 I-PogI、I-TwoI、PI-MgaI、PI-PabI、PI-PabII.

在此上下文中优选已经获知基因序列的归巢内切核酸酶,例如 F-SceI、I-CeuI、I-ChuI、I-DmoI、I-CpaI、I-CpaII、I-CreI、I-CsmI、 F-TevI、F-TevII、I-TevI、I-TevII、I-AniI、I-CvuI、I-DdiI、I-HmuI、 I-HmuII、I-LlaI、I-NanI、I-MsoI、I-NitI、I-NjaI、I-PakI、I-PorI、 I-PpoI、I-ScaI、I-Ssp6803I、PI-PkoI、PI-PkoII、PI-PspI、PI-TfuI、 PI-TliI。尤其优选可商业获得的归巢内切核酸酶,如I-CeuI、I-SceI、I-DmoI、 I-PpoI、PI-PspI或PI-SceI。具有特别长的识别序列并且因而在基因组中仅 稀有(若有的话)切割的内切核酸酶包括:I-CeuI(26bp识别序列)、PI-PspI (30bp识别序列)、PI-SceI(39bp识别序列)、I-SceI(18bp识别序列)和 I-PpoI(15bp识别序列)。这类酶可以以技术人员熟悉的方式从其源头生物 中分离,和/或可以克隆其编码核酸序列。GenBank积累了多种酶的提交序 列。尤其更优选归巢内切核酸酶I-SceI、I-CpaI、I-CpaII、I-CreI和I-ChuI。 编码所述核酸酶的序列在本领域中是已知的并且例如在WO 03/004659详 述(如WP 03/004659的SEQ ID NO:2、4、6、8和10,该文献文中引用作为 参考)。

待表达的异源核酸序列可以优选地编码如SEQ ID NO:22所述的多肽 或其功能等同物,其中所述的功能等同物能够带来与任一所述多肽所致的 相同表型。最优选地,待表达的核酸序列由SEQ ID NO 21或23描述。

在优选的实施方案中,编码所述归巢内切核酸酶的序列可以通过插入 内含子序列进行修饰。这防止在原核宿主生物内表达功能性酶并且因而促 进(例如基于大肠杆菌或农杆菌)克隆和转化过程。在植物生物中实现功能 性酶的表达,因为植物能够识别并“剪接”出内含子。优选地,内含子插入 以上提到作为优选的归巢内切核酸酶(例如I-SceI或I-CreI)的基因中。

在本发明的一些方面,可以利用分子演化来产生改良的内切核酸酶。 编码候选内切核酸酶的多核苷酸例如可以用DNA改组方法进行调整。DNA 改组是递归性重组和突变的过程,通过使相关基因集合的随机片段化而进 行,随后通过聚合酶链式反应样过程使片段再装配。见例如Stemmer(1994) Proc Natl Acad Sci USA 91:10747-10751;Stemmer(1994)Nature 370:389-391以及US 5,605,793、US 5,837,458、US 5,830,721和US 5,811,238。

可以通过举例方式提到的其它合成的内切核酸酶是包含非特异性核酸 酶结构域和序列特异性DNA结合结构域的嵌合核酸酶,其中所述的序列特 异性DNA结合结构域由锌指组成(Bibikova M等(2001)Mol Cell Biol. 21:289-297)。可以使这些DNA结合锌指结构域改变而适应于任一的DNA序 列。适用于制备合适的锌指结构域的方法已描述并为技术人员所知(Beerli RR等(2000)Proc Natl Acad Sci U S A.97(4):1495-1500;Beerli RR等(2000) J Biol Chem 275(42):32617-32627;Segal DJ和Barbas CF第三版,Curr Opin Chem Biol(2000)4(1):34-39;Kang JS和Kim JS(2000)J Biol Chem 275(12):8742-8748;Beerli RR等(1998)Proc Natl Acad Sci USA 95(25):14628-14633;Kim JS等(1997)Proc Natl Acad Sci USA 94(8):3616-3620;Klug A(1999)J Mol Biol 293(2):215-218;Tsai SY等 (1998)Adv Drug Deliv Rev 30(1-3):23-31;Mapp AK等(2000)Proc Natl Acad Sci USA 97(8):3930-3935;Sharrocks AD等(1997)Int J Biochem Cell Biol 29(12):1371-1387;Zhang L等(2000)J Biol Chem 275(43):33850-33860)。

内切核酸酶优选地表达为具有核定位序列(NLS)的融合蛋白。这种NLS 序列能促进运输至细胞核并增加重组系统的效率。多种NLS序列为技术 人员言所知并尤其由Jicks GR和Raikhel NV(1995)Annu.Rev.Cell Biol. 11:155-188描述。例如,优选用于植物生物的是SV40大抗原的NLS序列。 实例在WO 03/060133中提供。然而,由于许多DSBI酶(例如归巢内切核酸 酶)小,NLS序列不是必需要的。这些酶甚至在无任何协助时就能够穿过 核孔。

在又一个优选的实施方案中,可以诱导内切核酸酶的活性。已经描述 适用于序列特异性重组酶的方法(Angrand PO等(1998)Nucl.Acids Res. 26(13):3263-3269;Logie C和Stewart AF(1995)Proc Natl Acad Sci USA 92(13):5940-5944;Imai T等(2001)Proc Natl Acad Sci USA 98(1):224-228)。 这些方法利用内切核酸酶与类固醇激素受体(例如,人雄激素受体或如本 文中描述的人雌激素受体的突变变体)的配体结合结构域的融合蛋白。引入 可以用配体实现,例如雌二醇、地塞米松、4-羟基他莫昔芬或雷洛昔芬。一 些内切核酸酶作为二聚体(同二聚体或异二聚体;I-CreI形成同二聚体; I-SecIV形成异二聚体)才有活性(Wernette CM(1998)Biochemical & Biophysical Research Communications 248(1):127-333))。可以将二聚体化 设计为可诱导型特征,例如通过将天然二聚体化结构域变换成低分子量配 体的结合结构域。添加二聚体配体随后导致融合蛋白的二聚体化。已经描 述了相应的可诱导型二聚体化的方法和二聚体配体的制备Amara JF等 (1997)Proc Natl Acad Sci USA 94(20):10618-1623;Muthuswamy SK等 (1999)Mol Cell Biol 19(10):6845-685;Schultz LW和Clardy J(1998)Bioorg Med Chem Lett.8(1):1-6;Keenan T等(1998)Bioorg Med Chem. 6(8):1309-1335)。

本领域中描述了序列特异性DNA内切核酸酶(例如归巢内切核酸酶)的 识别序列。“识别序列”指由本发明的序列特异性DNA内切核酸酶所识别 的DNA序列。识别序列的长度通常至少10碱基对,更通常是10至30碱基对 长度并且在绝大多数实施方案中,长度少于50碱基对。

“识别序列”通常指在本发明内所用植物细胞中的条件下能够由序列特 异性DNA-内切核酸酶识别并切割的那些序列。各种序列特异性DNA-内切 核酸酶的识别序列在下文表2中以举例的方式提及,但不是限制性的。

表2.内切核酸酶的识别序列和来源生物(例如归巢内切核酸酶;“^” 指示序列特异性DNA-内切核酸酶在识别序列中的切割位点).

  DSBI酶   来源生物   识别序列   P-元件   转座酶   果蝇(Drosophila)   5’-CTAGATGAAATAACATAAGGTGG-3’

  I-AniI   构巢曲霉   (Aspergillus   nidulans)   5’-TTGAGGAGGTT^TCTCTGTAAATAANNNNNNNN   NNNNNNN   3’-AACTCCTCCAAAGAGACATTTATTNNNNNNNNN   NNNNNN^   I-DdiI   盘基网柄菌   (Dictyostelium   discoideum)AX3   5’-TTTTTTGGTCATCCAGAAGTATAT   3’-AAAAAACCAG^TAGGTCTTCATATA   I-CvuI   小球藻(Chlorella   vulgaris)   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-CsmI   史氏衣藻   (Chlamydomonas   smithii)   5’-GTACTAGCATGGGGTCAAATGTCTTTCTGG   I-CmoeI   淡水衣藻   (Chlamydomonas   moewusii)   5’-TCGTAGCAGCT^CACGGTT   3’-AGCATCG^TCGAGTGCCAA   I-CreI   莱菌衣藻   (Chlamydomonas   reinhardtii)   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-ChuI   土生衣藻   (Chlamydomonas   humicola)   5’-GAAGGTTTGGCACCTCG^ATGTCGGCTCATC   3’-CTTCCAAACCGTG^GAGCTACAGCCGAGTAG   I-CpaI   大斑衣藻   (Chlamydomonas   pallidostigmatica)   5’-CGATCCTAAGGTAGCGAA^ATTCA   3’-GCTAGGATTCCATC^GCTTTAAGT   I-CpaII   大斑衣藻   5’-CCCGGCTAACTC^TGTGCCAG   3’-GGGCCGAT^TGAGACACGGTC   I-CeuI   Chlamydomonas   eugametos   5’-CGTAACTATAACGGTCCTAA^GGTAGCGAA   3’-GCATTGATATTGCCAG^GATTCCATCGCTT   I-DmoI   运动脱硫球菌   (Desulfurococcus   mobilis)   5’-ATGCCTTGCCGGGTAA^GTTCCGGCGCGCAT   3’-TACGGAACGGCC^CATTCAAGGCCGCGCGTA   I-SceI   酿酒酵母   5’-AGTTACGCTAGGGATAA^CAGGGTAATATAG   3’-TCAATGCGATCCC^TATTGTCCCATTATATC   5’-TAGGGATAA^CAGGGTAAT   3’-ATCCC^TATTGTCCCATTA(“Core”-序列)

  I-SceII  酿酒酵母   5’-TTTTGATTCTTTGGTCACCC^TGAAGTATA   3’-AAAACTAAGAAACCAG^TGGGACTTCATAT   I-SceIII  酿酒酵母   5’-ATTGGAGGTTTTGGTAAC^TATTTATTACC   3’-TAACCTCCAAAACC^ATTGATAAATAATGG   I-SceIV  酿酒酵母   5’-TCTTTTCTCTTGATTA^GCCCTAATCTACG   3’-AGAAAAGAGAAC^TAATCGGGATTAGATGC   I-SceV  酿酒酵母   5’-AATAATTTTCT^TCTTAGTAATGCC   3’-TTATTAAAAGAAGAATCATTA^CGG   I-SceVI  酿酒酵母   5’-GTTATTTAATG^TTTTAGTAGTTGG   3’-CAATAAATTACAAAATCATCA^ACC   I-SceVII  酿酒酵母   5’-TGTCACATTGAGGTGCACTAGTTATTAC   PI-SceI  酿酒酵母   5’-ATCTATGTCGGGTGC^GGAGAAAGAGGTAAT   3’-TAGATACAGCC^CACGCCTCTTTCTCCATTA   F-SceI  酿酒酵母   5’-GATGCTGTAGGC^ATAGGCTTGGTT   3’-CTACGACA^TCCGTATCCGAACCAA   F-SceII  酿酒酵母   5’-CTTTCCGCAACA^GTAAAATT   3’-GAAAGGCG^TTGTCATTTTAA   I-HmuI  枯草芽孢杆菌  (Bacillus subtilis)噬  菌体SPO1   5’-AGTAATGAGCCTAACGCTCAGCAA   3’-TCATTACTCGGATTGC^GAGTCGTT   I-HmuII  枯草芽孢杆菌噬菌  体SP82   5’-AGTAATGAGCCTAACGCTCAACAANNNNNNNNN   NNNNNNN-NNNNNNNNNNNNNNNNNNNNNNN   I-LlaI  乳酸乳球菌  (Lactococcus lactis)   5’-CACATCCATAAC^CATATCATTTTT   3’-GTGTAGGTATTGGTATAGTAA^AAA   I-MsoI  Monomastix物种   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-NanI  安氏纤毛虫  (Naegleria  andersoni)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG   I-NitI  斜纤毛虫(Naegleria  italica)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG   I-NjaI  加米纤毛虫  (Naegleria  jamiesoni)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG   I-PakI  Pseudendoclonium  akinetum   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC

  I-PorI  Pyrobaculum  organotrophum   5’-GCGAGCCCGTAAGGGT^GTGTACGGG   3’-CGCTCGGGCATT^CCCACACATGCCC   I-PpoI  多头绒泡菌  (Physarum  polycephalum)   5’-TAACTATGACTCTCTTAA^GGTAGCCAAAT   3’-ATTGATACTGAGAG^AATTCCATCGGTTTA   I-ScaI  好望角酵母  (Saccharomyces  capensis)   5’-TGTCACATTGAGGTGCACT^AGTTATTAC   3’-ACAGTGTAACTCCAC^GTGATCAATAATG   I-Ssp680   3I  集胞藻  (Synechocystis  species)   5’-GTCGGGCT^CATAACCCGAA   3’-CAGCCCGAGTA^TTGGGCTT   PI-PfuI  激烈热球菌  (Pyrococcus  furiosus)Vc1   5’-GAAGATGGGAGGAGGG^ACCGGACTCAACTT   3’-CTTCTACCCTCC^TCCCTGGCCTGAGTTGAA   PI-PfuII  激烈热球菌Vc1   5’-ACGAATCCATGTGGAGA^AGAGCCTCTATA   3’-TGCTTAGGTACAC^CTCTTCTCGGAGATAT   PI-PkoI  Pyrococcus  kodakaraensis  KOD1   5’-GATTTTAGAT^CCCTGTACC   3’-CTAAAA^TCTAGGGACATGG   PI-PkoII  Pyrococcus  kodakaraensis  KOD1   5’-CAGTACTACG^GTTAC   3’-GTCATG^ATGCCAATG   PI-PspI  热球菌(Pyrococcus  sp.)   5’-AAAATCCTGGCAAACAGCTATTAT^GGGTAT   3’-TTTTAGGACCGTTTGTCGAT^AATACCCATA   PI-TfuI  Thermococcus  fumicolans ST557   5’-TAGATTTTAGGT^CGCTATATCCTTCC   3’-ATCTAAAA^TCCAGCGATATAGGAAGG   PI-TfuII  Thermococcus  fumicolans ST557   5’-TAYGCNGAYACN^GACGGYTTYT   3’-ATRCGNCT^RTGNCTGCCRAARA   PI-ThyI  Thermococcus  hydrothermalis   5’-TAYGCNGAYACN^GACGGYTTYT   3’-ATRCGNCT^RTGNCTGCCRAARA   PI-TliI  Thermococcus  litoralis   5’-TAYGCNGAYACNGACGG^YTTYT   3’-ATRCGNCTRTGNC^TGCCRAARA   PI-TliII  Thermococcus  litoralis   5’-AAATTGCTTGCAAACAGCTATTACGGCTAT   I-TevI  噬菌体T4   5’-AGTGGTATCAAC^GCTCAGTAGATG   3’-TCACCATAGT^TGCGAGTCATCTAC

  I-TevII   噬菌体T4   5’-GCTTATGAGTATGAAGTGAACACGT^TATTC   3’-CGAATACTCATACTTCACTTGTG^CAATAAG   F-TevI   噬菌体T4   5’-GAAACACAAGA^AATGTTTAGTAAANNNNNNNN   NNNNNN   3’-CTTTGTGTTCTTTACAAATCATTTNNNNNNNNN   NNNNN^   F-TevII   噬菌体T4   5’-TTTAATCCTCGCTTC^AGATATGGCAACTG   3’-AAATTAGGAGCGA^AGTCTATACCGTTGAC   H-DreI   大肠杆菌pI-DreI   5’-CAAAACGTCGTAA^GTTCCGGCGCG   3’-GTTTTGCAG^CATTCAAGGCCGCGC   I-BasI   苏云金芽孢杆菌噬   菌体Bastille   5’AGTAATGAGCCTAACGCTCAGCAA   3’-TCATTACGAGTCGAACTCGGATTG   I-BmoI   莫哈维芽胞杆菌   (Bacillus   mojavensis)s87-18   5’-GAGTAAGAGCCCG^TAGTAATGACATGGC   3’-CTCATTCTCG^GGCATCATTACTGTACCG   I-PogI   Pyrobaculum   oguniense   5’-CTTCAGTAT^GCCCCGAAAC   3’-GAAGT^CATACGGGGCTTTG   I-TwoI   金黄色葡萄球菌   (Staphylococcus   aureus)噬菌体   Twort   5’-TCTTGCACCTACACAATCCA   3’-AGAACGTGGATGTGTTAGGT   PI-MgaI   胃分支杆菌   (Mycobacterium   gastri)   5’-CGTAGCTGCCCAGTATGAGTCA   3’-GCATCGACGGGTCATACTCAGT   PI-PabI   Pyrococcus abyssi   5’-GGGGGCAGCCAGTGGTCCCGTT   3’-CCCCCGTCGGTCACCAGGGCAA   PI-PabII   Pyrococcus abyssi   5’-ACCCCTGTGGAGAGGAGCCCCTC   3’-TGGGGACACCTCTCCTCGGGGAG

还包括仍能够由所讨论的序列特异性DNA-内切核酸酶识别和切割的 识别序列的微小偏离(简并性)。已经描述此类偏离及与之有关的不同构架 条件,例如钙浓度或镁浓度(Argast GM等(1998)J Mol Biol 280:345-353)。 还包括这些识别序列的核心序列和其中的微小偏离(简并性)。已知识别序 列的内侧部分足以诱导双链断口并且外侧部分不是绝对重要的,但是可以 共同地决定切割效率。因此,例如,可以对I-SceI定义18bp核心序列。

2.3.2缺失/切除的启动

存在适宜地启动靶序列缺失/切除的多种方法。优选地,缺失仅在靶序 列成功整合至植物基因组后才启动。例如在靶序列是选择标记的情况下, 优选地标记已经成功完成其功能,导致DNA构建体插入待转化植物细胞或 生物的基因组之后,启动切除。

本领域技术人员可获得多种方法以将切除酶与侧翼具有切除序列的靶 序列组合。优选地,通过选自如下的方法可以表达切除酶(例如重组酶或内 切核酸酶)或与其相应的切除序列(例如重组或识别位点)的组合:

a)将切除酶(例如重组酶或序列特异性内切核酸酶)的表达盒掺入DNA 构建体,优选地连同侧翼具有所述切除序列的靶序列(例如标记基因)一起 掺入,

b)将切除酶(例如重组酶或序列特异性内切核酸酶)的表达盒的掺入已 经包含侧翼具有所述切除序列的靶序列(例如标记基因)的植物细胞或植 物,

c)将切除酶(例如重组酶或序列特异性内切核酸酶)的表达盒掺入植物 细胞或植物,其中所述的植物细胞或植物随后作为以构建体转化的主植物 或主细胞使用,其中所述的构建体包含侧翼具有所述切除序列的靶序列(例 如标记基因),

d)将切除酶(例如重组酶或序列特异性内切核酸酶)的表达盒掺入分别 的DNA构建体,其中所述的DNA构建体通过共转化方式与包含侧翼具有所 述切除序列的靶序列(例如标记基因)的独立DNA构建体转化。

因此,靶序列和切除酶(例如重组酶或内切核酸酶)可以在例如以下的 植物生物、细胞、细胞区室或组织中组合:

1.)以惯常方式方式产生这样的植物,该植物包含插入其基因组中(优选 地至染色体DNA)的侧翼具有切除序列的靶序列(例如标记基因)。另外的用 于切除酶的表达盒随后与所述DNA构建体以如下方式组合:

a)用所述的第二表达盒进行第二次转化,或

b)包含靶序列的植物与包含切除酶的表达盒的主植物杂交。

2.)编码切除酶的表达盒可以整合至已经携带靶序列的DNA构建体中。 优选将编码切除酶的序列插入允许进行缺失的序列之间,并因此在该序列 完成其功能后,从基因组DNA中缺失该序列。非常特别优选在这种情况下 (例如在下文所述的诱导型启动子之一控制下),内切核酸酶的表达是使用 发育依赖性启动子以发育依赖性方式可诱导的,或采用这样的切除酶,其 中为避免双功能标记在插入基因组之前过早缺失,该切除酶的活性是可诱 导的。

3.)依靠共转化技术,切除酶的表达盒可以随包含靶序列而位于另外的 DNA分子(例如载体)中的DNA构建体同时转化至细胞内。共转化可以是稳 定的或短暂的。在此时,切除酶的表达优选地是可诱导的(例如在如上所述 可诱导的嵌合的转录调节性序列之一的控制下),尽管未修饰的超级启动子 的发育依赖性表达模式已经防止过早切除。

4.)表达切除酶的植物还可以充当亲代个体。在来自表达切除酶的植物 与携带靶序列的植物之间杂交的子代中观察到所需要的靶序列切除(例如 通过双链断口和同源序列之间的重组)。

本发明的优选实施方案涉及这样的DNA构建体,其包含靶序列(例如包 含选择标记的表达盒;第一表达盒)和用于切除酶的第二表达盒(例如与植 物启动子连接的内切核酸酶编码序列或重组酶编码序列),它们优选地处于 如此形式,以至于所述第二表达盒与侧翼具有所述切除序列的所述第一表 达盒连接在一起,这允许特定靶序列的缺失。

在另一个优选的实施方案中,可以以防止过早缺失/切除双功能标记的 方式诱导或激活缺失/切除机制。因此,可以优选地诱导优选使用的切除酶 的表达和/或活性,优选地通过选自如下的方法

a)通过将编码所述切除酶(例如重组酶或内切核酸酶)的序列有效连接 至诱导型启动子而可诱导的表达,

b)通过采用包含配体结合结构域的修饰的切除酶(例如重组酶或内切 核酸酶)而可诱导的激活,其中所述修饰的切除酶的活性可以通过对所述配 体结合结构域具有结合活性的化合物的处理进行调节。

编码切除酶的多核苷酸的表达优选地受切除启动子控制,该启动子允 许以时间方式的表达以至于双功能标记在受到切除前可以执行其作为负选 择标记的功能。例如在德国专利申请DE 03028884.9中描述了合适的启动 子。此类启动子可以具有例如对晚期发育期如繁殖组织的表达特异性。切 除启动子可以选自下文的启动子之一。

2.3.3防止切除构建体过早切除的任选方法

有用的是使系统维持包含本发明构建体的双功能标记,尤其在转化和 选择期间。通常,控制多核苷酸可以导入编码切除酶的DNA-构建体中以 实现此目标。控制多核苷酸的功能通常是在需要抑制时抑制切除酶表达(例 如在转化和选择期间;对于优选的时间模式,见上文)或解除对切除启动子 的阻遏,因此允许来自切除启动子的表达。技术人员知道存在用于控制或 防止切除酶在特定细胞或特定组织或在特定发育期表达的多种变化。

在一个方面,来自第一切除启动子(即与切除双功能标记的第一切除酶 的基因有效连接的启动子)的表达可以由第二非切除启动子抵消。例如,第 二非切除启动子可以有效地与表达时防止第一切除启动子表达的阻遏物基 因连接。阻遏物的实例包括tet和lac阻遏物(Gatz,等(1991)Mol Gene Genet 227:229-237)。第二非切除启动子优选地是这样的启动子,其具有用于转化 /选择的组织中的最高活性,但在受体细胞(例如花粉或卵母细胞)、所述受 体细胞的前体细胞或组织或者因繁殖产生的全能细胞(例如合子)中具有低 活性。还可以采用诱导型启动子并且诱导作用在转化/选择期期间使用。这 种诱导型启动子可以是例如受四环素或脱氧土霉素诱导的四环素(脱氧土 霉素)诱导型系统(见上文)。可以在转化/选择期间使用此类抗生素。

或者,第二非切除启动子可以与位于第一切除启动子相反方向(即从 编码序列3′端指向该序列5′端)上的编码内切核酸酶的多核苷酸连接,因而 破坏DNA切割酶表达。在这些实施方案,第二非切除启动子的转录性活 性防止完成来自第一切除启动子的转录物,因而防止切除酶表达。

在其它实施方案中,反义多核苷酸或产生双链RNA分子的多核苷酸 可以有效地与第二非切除启动子连接,因而防止DNA切割酶mRNA的翻 译。见,例如Sheehy等(1988)Proc Natl Acad Sci USA 85:8805-8809,和US 4,801,340对反义技术的描述;和EP-A1 1 042 462,EP-A1 1 068 311对双链 RNA干扰技术的描述。反义RNA分子或双链RNA分子应当与编码确保 高效抑制的切除酶的核苷酸具有同源性。通常,反义技术涉及产生与靶转 录物(即编码序列特异性内切核酸酶的转录物)杂交的RNA转录物。或者, 第二非切除启动子可以有效地与处在有义方向上的DNA切割酶多核苷酸 连接以诱导基因的有义抑制(见例如Napoli等(1990)Plant Cell 2:279-289、 US 5,034,323、US 5,231,020和US 5,283,184中对于有义抑制技术的描述)。

在一些实施方案中,适体技术可以用来阻遏第一切除启动子的表达。 见,例如Hermann等(2000)Science 287(5454):820-5;和Famulok等 (1999)Curr Top Microbiol Immunol 243:123-36。例如,可以开发通过特定 化学品进行稳定时仅结合并阻遏第一切除启动子的小寡核苷酸,其中可以 在需要转基因种子时施加所述的特定化学品。例如,可以使用通过指数型 富集的配体系统性进化(SELEX)技术的组合文库选择来鉴定以高亲和力及 高特异性对大范围的所选分子结合的核酸适体。例如见Conrad等(1995) Mol Divers 1(1):69-78;和Kusser(2000)J Biotechnol 74(l):27-38。

在一些实施方案中,使用多叠式(multi-tiered)切除系统。例如,第 一切除启动子可以由第二重组盒隔断,所述第二重组盒还可以在侧翼具有 第二套同源序列B和B’,其中所述的同源序列在侧翼具有与编码第二个序 列特异性DNA切割酶的多核苷酸有效连接的化学诱导型启动子,通常只要 不提供化学诱导物,这种系统允许转基因构建体在基因组中保持完整(例 如在转化和选择期间)。一旦提供化学诱导物,则第二DNA切割酶受到诱导 并且切除自身编码区,诱导B和B’之间同源重组,因而将第一切除启动子 重构成完整启动子。由于B在切除后还存在,因而B和B’优选地是所述第一 切除启动子的亚序列。

2.3.4待切除的靶序列

虽然本文中构思了多种序列,其中切除可能是有利的,然而待切除的 最优选靶序列是标记序列。在常用术语“标记序列”下包含可选择和可筛选 的多种标记序列。因此,本发明的方法产生无标记的单子叶植物细胞或单 子叶植物,术语“无标记”或“无选择标记”如本文中就细胞或生物方面所 用,意指不能够表达功能性标记蛋白质的细胞或生物。编码所述标记蛋白 质的序列可以部分地或优选地被全部缺失。

2.3.4.1标记基因

经常使用标记基因(例如可选择或可筛选的标记)以便改善鉴定转化 体的能力。“标记基因”是这样的基因,该基因赋予表达该标记基因的细胞 明显的表型并因此允许将这种转化细胞与不含标记的细胞区分开。此类基 因可以编码可选择或可筛选的标记,这取决于标记赋予的性状是否可以通 过化学方法即通过使用选择剂(例如除草剂、抗生素等)加以选择,或该性 状是否可简单地由观察或检验即由‘筛选’(例如R-基因座性状、绿色荧光 蛋白(GFP))加以鉴定的性状。当然,合适标记基因的众多实例是本领域中 已知的并可以用于本发明的实施。该术语中包含的可选择或可筛选标记基 因还是编码“可分泌标记”的基因,其中所述的可分泌标记可以作为鉴定或 选择已转化细胞的方法受到检测。可分泌标记的实例包括编码可通过与抗 体相互作用进行鉴定的可分泌抗原标记,或甚至是可以因其催化活性得到 检测的可分泌酶。可分泌蛋白质分成多个类别,包括(例如通过ELISA)可 检测的扩散性小分子蛋白;在细胞外溶液中可检测的小分子活性酶(例如α- 淀粉酶、β-内酰胺酶、草铵膦乙酰基转移酶)和插入或截获于细胞壁中的蛋 白质(例如包含如伸展蛋白或烟草PR-S的表达单元中存在前导序列的蛋白 质)。

就可选择的可分泌标记而言,认为使用编码隔离于细胞壁中的蛋白质 和包含独特表位的蛋白质的基因特别有利。这种分泌型抗原标记将理想地 利用在植物组织内提供浅背景的表位序列和这样的启动子-前导序列,其赋 予高效表达和穿过胞浆膜的高效定向,并将产生在细胞壁内束缚且抗体仍 可接近的蛋白质。为包括独特表位进行修饰的正常分泌的细胞壁蛋白质将 满足全部的此类要求。适合以这种方式修饰的蛋白质的一个实例是伸展蛋 白或羟脯氨酸丰富的糖蛋白(HPRG)。例如,已经充分表征玉米HPRG (Steifel 1990)分子的分子生物学、表达和蛋白质结构。然而,多种ultilane 和/或甘氨酸丰富的细胞壁蛋白质(Keller 1989)中的任一种蛋白质可以通过 添加抗原性位点进行修饰以产生可筛选标记。

可分泌的可筛选标记的一个示例性实施方案涉及使用编码经修饰以包 含来自小鼠白细胞介素前区域(pro-region)的一个15个残基表位的细胞 壁蛋白质HPRG的玉米序列,然而,在此类实施方案中几乎可以采用任 何可检测的表位,如从本领域技术人员已知的种类非常广泛的抗原-抗体组 合中选择。随后独特的细胞外表位可以使用经生色附加物或荧光附加物标 记的抗体直接检测。

本公开的元件可以通过使用bar和/或GUS基因并且还可通过使用多 种的其它标记详细举例说明。当然,根据本公开,除本文以下所述的标记 基因之外,众多其它可能的可选择和/或可筛选的标记基因对本领域技术人 员是显而易见的。因此,可以理解的是如下讨论是示例性而非排他性的。 根据本文中所公开技术和本领域中已知的常用重组技术,本发明有可能将 任一基因(包括标记基因)导入受体细胞以产生转化植物。

标记序列可以通过在植物细胞中具有表达能力的任一转录调节性序列 或启动子(合适的启动子序列在下文描述)表达。最优选的是在植物转化、 筛选和选择中所用的标记序列。标记能够鉴定转化后的转基因细胞或转基 因生物(例如植物或植物细胞)。它们可以分别分成正选择标记(赋予选择性 优势)、负选择标记(弥补选择劣势)和反选择标记(赋予选择缺点)。此类标 记可以包括但不限于:

2.3.4.1.1负选择标记

负选择标记赋予对杀生物性化合物如代谢抑制物(例如2-脱氧葡萄糖 -6-磷酸,WO 98/45456)、抗生素(例如卡那霉素、G 418、博来霉素或潮霉 素)或除草剂(例如草铵膦或草甘膦)的抗性。表达标记基因的转化植物材料 (例如细胞、组织或幼苗)能够在抑制未转化的野生型组织生长的相应选择 化合物(例如抗生素或除草剂)的浓度存在下发育。尤其优选的负选择标记 是赋予除草剂抗性的那些负选择标记。可以提到的负选择标记的实例是:

-草铵膦乙酰基转移酶(PAT;又称双丙氨膦抗性;bar;de Block 1987;Vasil 1992,1993;Weeks 1993;Becker 1994;Nehra 1994;Wan和 Lemaux 1994;EP 0 333 033;US 4,975,374)。优选来自吸水链霉菌 (Streptomyces hygroscopicus)的bar基因或来自绿色产色链霉菌 (Streptomyces viridochromogenes)的pat基因。PAT使除草剂双丙氨膦中 的活性成分草铵膦(PPT)失活。PPT抑制谷氨酰胺合成酶(Murakami 1986;Twell 1989),导致氨的迅速累积和细胞死亡。

-赋予草甘膦(N-(膦酰甲基)甘氨酸)抗性的改变的5-烯醇丙酮莽草酸 -3-磷酸合酶(EPSPS)(Hinchee 1988;Shah 1986;Della-Cioppa 1987)。在使 用突变的EPSP合酶基因中,额外益处可以通过掺入合适的叶绿体转运肽 CTP实现(EP-A1 0 218 571)。

-降解草甘膦的酶(草甘膦氧化还原酶;gox),

-失活茅草枯的脱卤素酶(deh),

-失活磺酰脲-和/或咪唑啉酮的乙酰乳酸合酶(ahas或ALS;例如具有 如S4、XI12、XA17和/或Hra突变的经突变的ahas/ALS变体(EP-A1154 204),

-降解溴苯腈的腈水解酶(bxn;Stalker 1988),

-编码例如新霉素磷酸转移酶(Fraley 1983;Nehra 1994)的卡那霉素抗 性基因或庆大霉素(G418)抗性基因(NPTII;NPT或neo;Potrykus 1985),

-赋予2-脱氧葡萄糖抗性(Randez-Gil 1995)的2-脱氧葡萄糖-6-磷酸磷 酸酶(DOGR1-基因产物;WO 98/45456;EP 0 807 836),

-介导潮霉素抗性的潮霉素磷酸转移酶(HPT)(Vanden Elzen 1985),

-赋予氨甲叶酸抗性(Thillet 1988)的改变的二氢叶酸还原酶(Eichholtz 1987),

-赋予5-甲基色氨酸抗性的突变的邻氨基苯甲酸合酶基因。

细菌来源的赋予抗生素抗性的其它负选择标记基因包括赋予壮观霉素 抗性的aadA基因、庆大霉素乙酰基转移酶、链霉素磷酸转移酶(SPT)、氨 基糖甙-3-腺苷酰基转移酶和博来霉素抗性决定子(Hayford 1988;Jones 1987;Svab 1990;Hille 1986)。

尤其优选这样的负选择标记,其赋予对D-氨基酸(例如D-丙氨酸和D- 丝氨酸)所致的毒性效应的抗性(WO 03/060133;Erikson 2004)。作为本上 下文中的负选择标记,尤其优选来自纤细红酵母(Rhodotorula gracilis)(红 冬孢酵母(Rhodosporidium toruloides))的daol基因(EC:1.4.3.3:GenBank 登录号:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨 酶)[EC:4.3.1.18;GenBank登录号:J01603)。

表达此类标记基因的经转化植物材料(例如细胞、组织或幼苗)能够在 抑制未转化野生型组织生长的相应选择化合物(例如抗生素或除草剂)的 浓度存在下发育。得到的植物可以以常规方式育种和杂交。应当培育两个 或多个世代以确信基因组整合是稳定的且遗传的。描述了相应的方法 (Jenes 1993;Potrykus 1991)。

此外,可以利用允许视观筛选的报道基因,这可能需要或可能不需要 (取决于报道基因类型)补充作为选择化合物的底物。

可以对多种负选择标记基因采用多种时间方案。在抗性基因(例如抗除 草剂或D-氨基酸)的例子中,优选地自始至终施加在整个愈伤组织导入期 进行选择约4周并超过至少4周至再生。这种选择方案可以应用于全部选 择计划。还有可能(虽然不是明确优选的)也在整个再生计划(包括生根)期 间自始至终保持选择。

例如用膦丝菌素抗性基因(bar)作为选择标记,培养基中可以包含浓度 从约1至50mg/L的膦丝菌素。例如,用dao1基因作为选择标记,培养 基中可以包含浓度从约3至100mg/L的D-丝氨酸或D-丙氨酸。用于选择 的常用浓度是20至40mg/L。例如,用突变的ahas基因作为选择标记, 培养基中可以包含浓度从约3至100mg/L的PURSUITTM。用于选择的常 用浓度是20至40mg/L。

2.3.4.1.2正选择标记

此外,可以使用正选择标记。正选择标记是这样的选择标记,它们不 引起对杀生物性化合物的脱毒,但是通过增加或改善包含此种标记的细胞 或生物的再生、生长、增殖、繁殖等而赋予优势。正选择标记的实例是异 戊烯基转移酶(细胞分裂素生物合成的关键酶,该酶促进在无细胞分裂素的 培养基上选择经转化植物细胞的再生;Ebinuma 2000a;Ebinuma 2000b; 例如来自菌株:PO22;GenBank登录号:AB025109)。与未转化物细胞相比, 对已转化物细胞赋予生长优势的其它正选择标记例如在EP-A 0 601 092中 描述。生长刺激选择标记可以包括(但是不应当限于)β-葡糖醛酸糖苷酶(与 例如细胞分裂素葡糖苷酸组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、 UDP-半乳糖-4-差向异构酶(与例如半乳糖组合)、其中尤其优选与甘露糖 组合的甘露糖-6-磷酸异构酶。

2.3.4.1.3反选择标记

待切除的靶序列可以不仅包含负选择标记或正选择标记(以促进选择 和分离已成功转化的植物),而且还可以包含反选择标记以便评估成功的后 续标记切除。在一个优选的实施方案中,正选择标记和/或正选择标记和反 选择标记在侧翼具有切除序列并均通过切除酶的作用被缺失/切除。反选择 标记尤其适合于选择这样的生物,该生物具有包含所述标记的经定义缺失 的序列(Koprek 1999)。反选择标记是编码能够使无毒化合物转化成有毒化 合物的酶的序列。因此仅缺少所述反选择标记的细胞在用所述无毒化合物 处理时存活下来,因而允许选择已经成功使序列(例如标记)缺失的细胞。 本领域中已知的常用反选择标记是例如

a)与5-氟胞嘧啶(5-FC)组合的胞嘧啶脱氨酶(CodA)(WO 93/01281;US 5,358,866;Gleave AP等(1999)Plant Mol Biol 40(2):223-35;Perera RJ等 (1993)Plant Mol Biol 23(4):793-799;Stougaard J(1993)Plant J 3:755-761);EP-A1 595 837;Mullen CA等(1992)Proc Natl Acad Sci USA 89(1):33-37;Kobayashi T等(1995)Jpn J Genet 70(3):409-422;Schlaman HRM和Hooykaas PFF(1997)Plant J 11:1377-1385;Xiaohui Wang H等 (2001)Gene 272(1-2):249-255;Koprek T等(1999)Plant J 19(6):719-726; Gleave AP等(1999)Plant Mol Biol 40(2):223-235;Gallego ME(1999)Plant Mol Biol 39(1):83-93;Salomon S和Puchta H(1998)EMBO J 17(20):6086-6095;Thykjaer T等(1997)Plant Mol Biol 35(4):523-530; Serino G(1997)Plant J 12(3):697-701;Risseeuw E(1997)Plant J 11(4):717-728;Blanc V等(1996)Biochimie 78(6):511-517;Corneille S等 (2001)Plant J 27:171-178)。

b)细胞色素P-450酶与磺酰脲除草剂原R7402(2-甲基乙基-2-3-二氢 -N-[(4,6-二甲氧嘧啶-2-基)氨基羰基]-1,2-苯并异噻唑-7-磺酰胺-1,1-二氧化 物)的组合(O’Keefe DP等(1994)Plant Physiol 105:473-482;Tissier AF等 (1999)Plant Cell 11:1841-1852;Koprek T等(1999)Plant J 19(6):719-726;O’Keefe DP(1991)Biochemistry 30(2):447-55)。

c)与萘乙酰胺(NAM)组合的吲哚乙酸水解酶(例如来自根癌农杆菌的 tms2基因产物)(Fedoroff NV和Smith DL(1993)Plant J 3:273-289; Upadhyaya NM等(2000)Plant Mol Biol Rep 18:227-223;Depicker AG等 (1988)Plant Cell rep 104:1067-1071;Karlin-Neumannn GA等(1991)Plant Cell 3:573-582;Sundaresan V等(1995)Gene Develop 9:1797-1810; Cecchini E等(1998)Mutat Res 401(1-2):199-206;Zubko E等(2000)Nat Biotechnol 18:442-445)。

d)来自养黄色杆菌GJ10(Xanthobacter autotropicus GJ10)的与1,2-二 氯乙烷(DCE)组合的卤烷脱卤素酶(dhlA基因产物)(Naested H等(1999) Plant J 18(5)571-576;Janssen DB等(1994)Annu Rev Microbiol 48:163-191;Janssen DB(1989)J Bacteriol 171(12):6791-9).

e)与无环鸟苷、更昔洛韦或1,2-脱氧-2-氟-β-D-阿拉伯呋喃糖基-5-碘尿 嘧啶(FIAU)组合的(例如来自1型单纯疱疹病毒(TK HSV-1))的胸苷激酶 (TK)(Czako M和Marton L(1994)Plant Physiol 104:1067-1071;Wigler M 等(1977)Cell 11(1):223-232;McKnight SL等(1980)Nucl Acids Res 8(24):5949-5964;McKnight SL等(1980)Nucl Acids Res 8(24):5931-5948;Preston等(1981)J Virol 38(2):593-605;Wagner等(1981) Proc Natl Acad Sci USA 78(3):1441-1445;St.Clair等(1987)Antimicrob Agents Chemother 31(6):844-849)。

本领域中已知其它数种反选择系统(见例如国际申请WO 04/013333; 第13至20页的概述;该文献本文中引用作为参考)。

2.3.4.1.4.可筛选标记

可以利用的可筛选标记(又称作报道基因或报道蛋白;Schenborn E, Groskreutz D.(1999)Mol Biotechnol 13(1):29-44)包括但不限于β-葡糖醛 酸糖苷酶(GUS;Jefferson等(1987)EMBO J 6:3901-3907)或编码多种生色 底物已知的酶的uidA基因;编码调节植物组织内花青苷色素(红颜色)产 生的产物的R-基因座基因(Dellaporta 1988);编码已知多种生色底物的酶 (例如PADAC,一种生色的头孢菌素)的β-内酰胺酶基因(Sutcliffe 1978); 编码可以转化生色儿茶酚的儿茶酚双加氧酶的xylE基因(Zukowsky 1983);α-淀粉酶基因(Ikuta 1990);酪氨酸酶基因(Katz 1983),该基因编码 能够将酪氨酸氧化成DOPA和多巴醌的酶,其中DOPA和多巴醌随后缩 合形成可轻易加以检测的黑色素;编码存在生色底物的酶的β-半乳糖苷酶 基因;允许生物发光检测的萤光素酶(lux)基因(Ow 1986;Millar等(1992) Plant Mol Biol Rep 10:324-414),或甚至可以在钙敏感的生物发光检测中利 用的水母发光蛋白基因(Prasher 1985),或绿色荧光蛋白基因(GFP)(Niedz 1995;Chui WL等(1996)Curr Biol 6:325-330;Leffel SM等 (1997)Biotechiques 23(5):912-8;Sheen等(1995)Plant J 8(5):777-784; Haseloff等(1997)Proc Natl Acad Sci USA 94(6):2122-2127;Reichel等 (1996)Proc Natl Acad Sci USA 93(12):5888-5893;Tian等(1997)Plant Cell Rep 16:267-271;WO 97/41228).

预计来自玉米R基因复合体的基因作为可筛选标记是特别有用的。R 基因复合体在玉米中编码这样的蛋白质,所述蛋白质起到调节花青苷色素 在大部分种子和植物组织中产生的作用。来自R基因复合体的基因应用于 玉米转化,因为该基因在转化细胞内的表达不伤害细胞。因此,导入这种 细胞的R基因将引起红色素的表达,并且,若R基因稳定整合,则可以 以视观方式记分为红色区域。当玉米品系对编码花青苷生物合成性途径中 的酶中间体(C2、A1、A2、Bz1和Bz2)的基因为显性、但是在R基因座内 携带隐性等位基因时,转化来自具有R的株系的任何细胞将导致红色色素 形成。示例性株系包括含有rg-Stadler等位基因和TR112的Wisconsin 22, 其中TR112是K55衍生物(r-g、b、P1)。或者,可以利用任一基因型的玉 米,只要同时导入等位基因C1和R。

还提出可以在嵌合构建体中利用R基因调节区域以便提供控制嵌合基 因表达的机制。已知在R基因座处比任何其它基因座处存在更多样的表型 表现(Coe 1988)。预计从结构性R基因的5′区域中获得的调节区域具有指 导基因(例如编码昆虫抗性、干旱抗性、除草剂耐受性或其它蛋白质的区域) 表达的价值。为了本发明的目的,认为可以成功利用多种R基因的任一 家族成员(例如P、S、Lc等)。然而,通常最优选Sn(特别是Sn:bol3)。Sn 是R基因复合体的显性成员并且与R和B基因座功能相似,因为Sn控 制花青苷色素在某些幼苗和植物细胞中的组织特异性沉积,因此,Sn的表 型与R相似。

预计用于本发明中的另一种可筛选标记是由lux基因编码的萤火虫萤 光素酶。lux基因在转化细胞内的存在可以使用例如X线胶片、闪烁计数、 荧光分光光度法、微光摄影法、光子计数照相(photon counting cameras) 或多孔发光测量法(multiwell luminometry)进行检测。还预计可以开发此系 统用于群体性生物发光筛选,如在组织培养皿上,或甚至用于筛选完整植 物。在需要使用可筛选标记基因如lux或GFP时,益处可以通过产生可筛 选标记基因与可选择标记基因之间的基因融合物(例如GFP-NPTII基因融 合物)而实现。这可能允许例如选择转化的细胞,随后筛选转基因的植物或 种子。

2.3.4.1.5.双功能标记

在本发明的一个优选的实施方案中,靶序列是双功能标记。术语“双 功能标记”包含这样的标记,该标记在一个序列中组合了待用作负选择标 记或反选择标记的可能。实现哪种效果的选择取决于筛选过程中采用的底 物。双功能标记最优选地是D-氨基酸氧化酶。这种酶能够转化D-氨基酸。 某些D-氨基酸对植物有毒并通过D-氨基酸氧化酶的作用脱毒。其它D-氨 基酸对植物无害,但是通过D-氨基酸氧化酶转化成有毒化合物。

术语D-氨基酸氧化酶(缩写DAAO、DAMOX或DAO)指这样的酶, 该酶通过(优选地)利用氧(O2)作为底物,将D-氨基酸转化成2-氧代酸并产 生过氧化氢(H2O2)作为伴生产物(Dixon M和Kleppe K.Biochim.Biophys. Acta 96(1965)357-367;Dixon M和Kleppe K Biochim.Biophys.Acta 96 (1965)368-382;Dixon M和Kleppe Biochim.Biophys.Acta 96 (1965)383-389;Massey V等,Biochim.Biophys.Acta 48(1961)1-9.Meister A和Wellner D,Flavoprotein amino acid oxidase.在:Boyer,P.D.,Lardy, H.和K.(编者),The Enzymes,第2版,第7卷,Academic Press, New York,1963,第609-648页)。

DAAO可以由国际生物化学与生子生物学联合学会命名委员会 (Nomenclature Committee of the International Union of Biochemistry and Molecular Biology(IUBMB))描述,具有EC(酶委员会)编号EC1.4.3.3。 通常,EC 1.4.3.3类的DAAO酶是催化中性和碱性D-氨基酸氧化成其相 应酮酸的FAD黄素酶。DAAO已经在真菌和脊椎动物中表征并测序,其 中已知它们位于过氧化物酶体中。术语D-氨基酸氧化酶还包含D-天冬氨 酸氧化酶(EC 1.4.3.1)(DASOX)(Negri A等(1992)J Biol Chem. 267:11865-11871),其中D-天冬氨酸氧化酶是与DAAO结构相似的酶,催 化相同反应,但仅对二羧D-氨基酸有活性。在本发明中优选EC 1.4.3.3类 的DAAO。

在DAAO中,已经证实一个保守的组氨酸(Miyano M等(1991)J Biochem 109:171-177)对酶催化活性重要。在本发明的优选实施方案中, DAAO指的包含如下共有基序的蛋白质:

[LIVM]-[LIVM]-H-[NHA]-Y-G-x-[GSA]-[GSA]-x-G-x5-G-x-A 其中括号内给出的氨基酸残基代表相应位置的备选残基,x代表任一氨基 酸残基并且指示数字表示相应的连续氨基酸残基数。各氨基酸残基的缩写 具有它们以上定义的标准IUPAC含义。表3中描述包含所述基序的其它 潜在的DAAO酶。

表3.来自多种生物的合适D-氨基酸氧化酶。登录号指来自SwisProt 数据库的蛋白质序列。

  登录号   基因名称   描述   来源生物   长度   Q19564   F18E3.7   推定的D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   秀丽隐杆线虫   334   P24552   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   腐皮镰刀菌(豌豆亚   种))(Fusarium   solani)(subsp.pisi)(血   红丛赤壳(Nectria   haematococca)   361   P14920   DAO,   DAMOX   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   智人(Homo   sapiens)(人)   347   P18894   DAO,DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   小家鼠(Mus   musculus)(小鼠)   346   P00371   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   家猪(Sus scrofa)(猪)   347   P22942   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   穴兔(Oryctolagus   cuniculus)(兔)   347   O35078   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   褐家鼠(Rattus   norvegicus)(大鼠)   346   P80324   DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   红冬孢酵母(酵母)(纤   细红酵母)   368   U60066   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   红冬孢酵母,菌株TCC   26217   368   Q99042   DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   三角酵母(Trigonopsis   variabilis)(酵母)   356   P31228   DDO   D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)   黄牛(Bos taurus)(牛)   341

  Q99489   DDO   D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)   智人(人)  341   Q9C1L2   NCU06558.1   (AF309689)推定的D-氨基酸氧化酶   G6G8.6(假设的蛋白质)   粗糙脉孢霉   (Neurospora crassa)  362   Q7SFW4   NCU03131.1   假设的蛋白质   粗糙脉孢霉  390   Q8N552   与D-天冬氨酸氧化酶相似   智人(人)  369   Q7Z312   DKFZP686F   04272   假设的蛋白质DKFzp686F04272   智人(人)  330   Q9VM80   CG11236   CG11236蛋白质(GH12548p)   黑腹果蝇(Drosophila   melanogaster)(果蝇)  341   O01739   F20H11.5   F20H11.5蛋白质   秀丽隐杆线虫  383   O45307   C47A10.5   C47A10.5蛋白质   秀丽隐杆线虫  343   Q8SZN5   CG12338   RE73481p   黑腹果蝇(果蝇)  335   Q9V5P1   CG12338   CG12338蛋白质(RE49860p)   黑腹果蝇(果蝇)  335   Q86JV2   与黄牛(牛)D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)相似   盘基网柄菌(粘菌)  599   Q95XG9   Y69A2AR.5   假设的蛋白质   秀丽隐杆线虫  322   Q7Q7G4   AGCG53627   AgCP5709(片段)   冈比亚按蚊   (Anopheles   gambiae)PEST株  344   Q7PWY   8   AGCG53442   AgCP12432(片段)   冈比亚按蚊PEST株  355   Q7PWX   4   AGCG45272   AgCP12797(片段)   冈比亚按蚊PEST株  373   Q8PG95   XAC3721   D-氨基酸氧化酶   地毯草黄单胞柑桔致   病变种(Xanthomonas   axonopodis(pv.citri))  404

  Q8P4M9   XCC3678   D-氨基酸氧化酶   野油菜黄单胞菌野油   菜致病变种   (Xanthomonas   campestris    (pv.   campestris))  405   Q9X7P6   SCO6740,   SC5F2A.23C   推定的D-氨基酸氧化酶   天蓝色链霉菌   (Streptomyces   coelicolor)  320   Q82MI8   DAO,   SAV1672   推定的D-氨基酸氧化酶   阿维链霉菌   (Streptomyces   avermitilis)  317   Q8VCW   7   DAO1   D-氨基酸氧化酶   小家鼠(小鼠)  345   Q9Z302   D-氨基酸氧化酶   黑线仓鼠(Cricetulus   griseus)(中华仓鼠)  346   Q9Z1M5   D-氨基酸氧化酶   豚鼠(Cavia   porcellus)(豚鼠)  347   Q922Z0   与相似D-天冬氨酸氧化酶   小家鼠(小鼠)  341   Q8R2R2   假设的蛋白质   小家鼠(小鼠)  341   P31228  D-天冬氨酸氧化酶   黄牛  341

D-氨基酸氧化酶(EC编号1.4.3.3)可以分离自多种生物,包括但不限于 猪、人、大鼠、酵母、细菌或真菌。举例生物是热带假丝酵母(Candida tropicalis)、三角酵母、粗糙脉孢霉、小球藻(Chlorella vulgaris)和纤细红酵 母。合适的D-氨基酸代谢多肽可以是真核生物的酶,例如来自酵母(例如 纤细红酵母)、真菌或动物,或可以是原核生物的酶、例如来自细菌如大肠 杆菌。代谢D-氨基酸的合适多肽的实例示于表4.

表4.来自多种生物的合适D-氨基酸氧化酶。登录号指来自SwisProt 数据库的蛋白质序列。

 GenBank登录号   来源生物  Q19564   秀丽隐杆线虫F18E3.7.

 GenBank登录号  来源生物  P24552  腐皮镰刀菌(豌豆亚种)(血红丛赤壳).  JX0152 腐皮镰刀菌  P14920  智人(人)  P18894  小家鼠(小鼠)  P00371  家猪(猪)  P22942  穴兔(兔)  O35078  褐家鼠(大鼠)  P80324  红冬孢酵母(酵母)(纤细红酵母)  Q99042  三角酵母  Q9Y7N4  粟酒裂殖酵母(Schizosaccharomyces pombe)(裂  殖酵母)SPCC1450  O01739  秀丽隐杆线虫.F20H11.5  Q28382  家猪(猪)  O33145  麻风分支杆菌(Mycobacterium leprae)  Q9X7P6  天蓝色链霉菌.SCSF2A.23C  Q9JXF8  脑膜炎奈瑟菌(Neisseria meningitidis)(血清组B)  Q9Z302  黑线仓鼠(中华仓鼠)  Q921M5  D-氨基酸氧化酶。豚鼠(Cavia parcellus)

D-氨基酸氧化酶优选地从由选自下表5的核酸序列编码的酶或相应的 氨基酸序列中选择:

表5:来自多种生物的合适D-氨基酸氧化酶。登录号指来自GenBank 数据库的蛋白质序列。

 GenBank登录号   生物  U60066   红冬孢酵母(酵母)  Z71657  纤细红酵母

  A56901   纤细红酵母   AF003339   红冬孢酵母   AF003340  红冬孢酵母   U53139  秀丽隐杆线虫   D00809  血红丛赤壳   Z50019.   三角酵母   NC 003421  粟酒裂殖酵母(裂殖酵母)   AL939129.   天蓝色链霉菌A3(2)   AB042032  波氏假丝酵母(Candida boidinii)

DAAO是充分表征的酶,并且它的晶体结构及催化机制已经通过高分 辨率X射线光谱分析加以确定(Umhau S.等(2000)Proc.Natl.Acad.Sci. USA 97:12463-12468)。它是位于过氧化物酶体中的黄素酶,并且它在动物 内已认识的功能是使D-氨基酸脱毒(Pilone MS(2000)Cell.Mol.Life.Sci. 57:1732-174)。此外,它能够使酵母利用D-氨基酸生长(Yurimoto H等 (2000)Yeast,16:1217-1227)。如以上所示,来自数个不同物种的DAAO已 经得以表征并在底物亲和性上显示略微不同(Gabler M等(2000)Ezyme Microb.Techno.27:605-611),但是它们通常表现宽的底物特异性,使全部 D-氨基酸氧化脱氨(除对EC 1.4.3.3.类DAAO酶的D-谷氨酸和D-天冬氨酸以 外;Pilone MS(2000)Cell.Mol.Life.Sci.57:1732-174)。

在众多的真核生物中发现了DAAO活性(Pilone MS(2000)Cell.Mol. Life.Sci.57:1732-174),但是在植物中没有报道过DAAO活性。植物中代谢 D-氨基酸的低能力对植物应答D-氨基酸的方式有重要影响。

在优选的实施方案中,从本发明的DNA构建体中表达的D-氨基酸氧化 酶优选地对选自D-丙氨酸、D-丝氨酸、D-异亮氨酸、D-缬氨酸及其衍生物 的至少一个氨基酸具有酶活性。

合适的D-氨基酸氧化酶还包括以上例所举多肽的片段、突变体、衍生 物、变体和等位基因。合适的片段、突变体、衍生物、变体和等位基因是 保留以上定义的D-氨基酸氧化酶的功能性特征的那些合适的片段、突变体、 衍生物、变体和等位基因。可以如此对序列改变以产生突变体、变体或衍 生物,即通过在核酸中一次或多次地添加、插入、缺失或替换一个或多个 核苷酸,导致所编码的多肽中添加、插入、缺失或替换一个或多个氨基酸。 当然,还包括改变核酸而不改变所编码的氨基酸序列。

本发明的D-氨基酸氧化酶可以表达在植物细胞的细胞浆、过氧化物酶 体或其它细胞区室内。D-氨基酸代谢多肽的区室化可以通过将编码DAAO 多肽的核酸序列与编码转运肽的序列融合以生成融合蛋白而实现。没有这 种转运肽的基因表达产物通常累积在细胞浆内。表达的DAAO在过氧化 物酶体的定位产生可由H2O2降解酶即过氧化氢酶代谢的H2O2。可能需要 较高水平的D-氨基酸以产生破坏性水平的H2O2。DAAO在过氧化氢酶活 性水平较低的细胞浆内的表达降低了产生破坏性水平的H2O2所需要的D- 氨基酸量。细胞浆内DAAO的表达可以通过从编码性核酸序列中去除过氧 化物酶体靶向信号或转运肽而实现。例如,来自纤细红酵母(红冬孢酵母) 的dao1基因(EC:1.4.3.3:GenBank登录号:U60066)如所述(WO 03/060133)得到克隆。最后9个核苷酸编码指导蛋白质进入亚细胞器过氧 化物酶体中的信号肽SKL。虽然在细胞浆表达的DAAO和过氧化物酶体 表达的DAAO之间未观察到显著差异,然而就抑制DAAO转基因植物萌 发的方面,发现在30mM D-Asn上,过氧化物酶体构建物比细胞浆形式构 建物略微有效。然而,两种构建体均比野生型更显著地抑制并且因此可以 用于条件性反选择。

双功能标记的其它修饰和用途在欧洲专利申请号04006358.8(SweTree Technologies AB & BASF;IMPROVED CONSTRUCTS FOR MARKER EXCISION BASED ON DUAL-FUNCTION SELECTION MARKER)及 其它要求其优先权的国家申请和国际申请中公开。

2.3.5.标记基因和其它序列的表达

标记基因(或可以从本发明DNA构建体之一中表达的其它序列)可以 由在植物中有功能的任一启动子表达。这些启动子包括但不限于组成型的、 诱导型、时间性调节、发育调节、空间调节的、化学调节的、胁迫应答性、 组织特异性、病毒性和合成性启动子。启动子可以是γ-玉米醇溶蛋白启动 子、油质蛋白ole16启动子、球蛋白启动子、肌动蛋白I启动子、肌动蛋 白cl启动子、蔗糖合成酶启动子、INOPS启动子、EXM5启动子、球蛋 白2启动子、β-32,ADPG-焦磷酸化酶启动子、LtpI启动子、Ltp2启动子、 油质蛋白ole17启动子、油质蛋白ole18启动子、肌动蛋白2启动子、花粉 特异性蛋白质启动子、花粉特异性果胶酸裂合酶启动子、花药特异性蛋白 质启动子、花药特异性基因RTS2启动子、花粉特异性基因启动子、绒毡 层特异性基因启动子,绒毡层特异性基因RAB24启动子、邻氨基苯甲酸合 酶α亚基启动子、α-玉米醇溶蛋白启动子、邻氨基苯甲酸合酶β亚基启动 子、二氢吡啶二羧酸合酶启动子、Thil启动子、醇脱氢酶启动子、cab结 合蛋白启动子、H3C4启动子、RUBISCO SS淀粉分支酶启动子、ACC酶 启动子、肌动蛋白3启动子、肌动蛋白7启动子、调节性蛋白质GF14-12 启动子、核糖体蛋白L9启动子、纤维素生物合成酶启动子、S-腺苷基-L- 高半胱氨酸水解酶启动子、超氧化物歧化酶启动子、C-激酶受体启动子、 磷酸甘油酸变位酶启动子、根特异性RCc3 mRNA启动子、葡萄糖-6磷酸 异构酶启动子、焦磷酸-果糖6-磷酸基磷酸转移酶启动子、遍在蛋白启动子、 β-酮酰基-ACP合酶启动子、33kDa光合系统11启动子、放氧蛋白启动子、 69kDa液泡ATP酶亚基启动子、金属硫蛋白样蛋白质启动子、甘油醛-3- 磷酸脱氢酶启动子、ABA诱导型样和成熟诱导型样蛋白启动子、苯丙氨酸 脱氨酶启动子、腺苷三磷酸酶-腺苷基-L-高半胱氨酸水解酶启动子、α-微管 蛋白启动子、cab启动子、PEPC酶启动子、R基因启动子、凝集素启动 子、集光复合体启动子、热休克蛋白启动子、查尔酮合酶启动子、玉米醇 溶蛋白启动子、球蛋白-1启动子、ABA启动子、植物生长素结合蛋白启动 子、UDP葡萄糖类黄酮糖基转移酶基因启动子、NTI启动子、肌动蛋白启 动子、不透明2启动子、b70启动子、油质蛋白启动子、CaMV 35S启动 子、CaMV 34S启动子、CaMV 19S启动子、组蛋白启动子、膨压诱导型 启动子、豌豆小亚基RuBP羧化酶启动子、Ti质粒甘露氨酸合酶启动子、 Ti质粒胭脂碱合酶启动子、矮牵牛(petunia)查尔酮异构酶启动子、豆类甘 氨酸丰富的蛋白质I启动子、CaMV 35S转录物启动子、马铃薯patatin 启动子或S-E9小亚基RuBP羧化酶启动子。

2.4多样性状

众多其它有利的性状可以用本文中公开的本发明成功地实现。实际上, 任一序列和性状可以与本发明的嵌合的转录核苷酸序列组合,其中优选所 述的序列和性状在胚和早期幼苗内偏好性表达。因此,本发明的又一个实 施方案涉及用于核酸序列在单子叶植物中的淀粉胚乳特异性或偏好地表达 和/或萌芽胚特异性或偏好地表达的方法,所述方法包括步骤

a)构建表达盒,为将包含

iii)衍生自根癌农杆菌甘露氨酸合酶基因启动子的至少一个转录调 节核苷酸序列,

iv)衍生自根癌农杆菌章鱼碱合酶基因的至少一个上游激活序列, 的至少一个嵌合的转录调节核苷酸序列有效连接到相对于所述嵌合的转录 调节核苷酸序列是异源的至少一个核酸序列,和

b)将所述的表达盒插入单子叶植物中以提供转基因植物,和

c)选择转基因植物,其表现出所述异源核酸序列的淀粉胚乳特异性 或偏好地表达和/或萌芽胚特异性或偏好地表达。

如上所述的,用于本发明淀粉胚乳特异性或偏好地表达和/或萌芽胚特 异性或偏好地表达的方法导致表达异源核酸序列,其中所述的异源核酸序 列的表达赋予单子叶植物至少一个选自如下的性状或特性

v)抗至少一个胁迫因子的增强抗性,

vi)提高的种子营养质量或籽苗营养质量,

vii)提高的产量,和

viii)选择标记切除。

优选的所述性状和实现所述性状的序列在下文中详述。

本发明方法优选应用的单子叶植物可以选自玉米、小麦、稻、大麦、 燕麦、黑麦、高粱、香蕉、黑麦草或薏苡。植物优选地是选自玉米、小麦、 大麦、稻、燕麦、黑麦和高粱、甚至更优选地来自玉米、小麦和稻的谷类 植物,植物最优选地是玉米植物。

在本发明的一个优选的实施方案中,从本发明的嵌合的转录调节性序 列表达的核苷酸序列不编码β-葡糖醛酸糖苷酶(GUS),或不是用于表达 GUS-基因以实现GUS介导性染色的方法。

3.转基因表达的分析。

为证实在再生的植物中存在外源DNA,可以开展多种分析法。此类 分析法包括例如分子生物学分析法如Southern印迹和RNA印迹和PCR; 生物化学分析法如检测蛋白质产物的存在,例如通过免疫学方法(ELISA 和蛋白质印迹)或通过酶功能;植物部分的测定如叶或根测定;以及在某些 情况下对完整的再生植物的表型分析。用于确定转基因表达和启动子功能 的效率的其它分析法还包括,但不限于荧光原位杂交(FISH)、直接DNA 测序、脉冲场凝胶电泳(PFGE)分析、单链构象分析(SSCA)、RNA酶保护 分析、等位基因特异性寡核苷酸(ASO)、点印迹分析、变性梯度凝胶电泳、 RT-PCR、定量RT-PCR、RFLP和PCR-SSCP。分析对于本领域技术人 员是已知的(也见下文)。

4.本发明的转化(转基因)植物和制备方法

单子叶植物种可以用本发明的DNA构建体通过本领域中已知的多种 方法转化。可以转化能够随后克隆性增殖(无论通过器官发生或胚发生)的 任一植物组织。术语“器官发生”如本文中所用意指从分生中心依次地发育 枝条和根的过程;术语“胚发生”如本文中所用意指枝条和根(从体细胞或配 子中)以协调的方式(不是依次)一同发育的过程。所选的特定组织取决于对 所转化特定物种可用的并且是最适合的克隆增殖系统而不同。示例性靶组 织包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、现有分生组 织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶 分生组织和ultilane分生组织)。

本发明的植物可以具有多种形式。植物可以是转化细胞和非转化细胞 的嵌合体;植物可以是克隆的转化体(例如所转化的全部细胞均含有表达 盒);植物可以包含转化及未转化组织的移植物(例如移植到柑桔(citus)物 种中的未转化接穗上的已转化砧木)。转化的植物可以通过多种方法增殖, 如通过克隆性增殖或传统育种技术。例如,第一世代(或T1)的转化植物可 以自交以产生纯合的第二世代(或T2)转化植物并且T2植物通过传统育种 技术进一步增殖。显性选择性标记(如npt II)可以与表达盒组合以辅助育 种。

因此,本发明以植物中(in planta)或植物外(ex planta)方式提供包含已 转化的质体或其它器官(例如细胞核、线粒体或叶绿体)的转化(转基因)单 子叶植物和单子叶植物细胞。本发明可以用来转化任一单子叶植物物种, 包括但是不限于来自以上在“定义”部分中已详述植物物种的细胞。优选 地,本发明的转基因植物是作物植物并且尤其是谷类(例如,玉米、苜蓿、 稻、大麦、高粱、小麦、黍等)并且甚至更优选地是玉米、小麦和稻。本发 明的其它实施方案涉及所述单子叶植物的细胞、细胞培养物、组织、部分(如 植物器官、叶、根等)和繁殖材料(如种子)。

单子叶植物的转化可以用单种DNA分子或多种DNA分子(即共转化) 开展并且这两种技术适用于本发明的表达盒。众多转化载体可用于植物转 化并且本发明的表达盒可以与任一此类载体共同使用。载体的选择将取决 于优选的转化技术和转化的靶物种。

本领域中技术人员可获得并知道用于将构建体导入植物细胞宿主的多 种技术。这些技术通常包括利用根癌农杆菌或发根农杆菌(A.rhizogeneas) 作为转化介质的DNA转化法、脂质体法、PEG沉淀法、电穿孔法、DNA 注射法、直接DNA摄取法、微抛射体轰击法、粒子加速法等(见例如,EP 295959和EP 138341)。然而,除植物细胞以外的细胞也可以用本发明的表 达盒转化。对植物表达载体和报道基因以及农杆菌和农杆菌介导性基因转 移的一般描述可以在Gruber等(1993)中找到。

含有基因组片段或合成片段的表达载体可以导入原生质体或导入完整 组织或分离的细胞。表达载体优选地导入完整组织。培养植物组织的一般 方法例如由Maki等,(1993)以及由Phillips等(1988)提供。优选地,使用直 接基因转移方法如微抛射体介导性递送法、DNA注射法、电穿孔法等,将 表达载体导入玉米或其它植物组织。更优选地,使用微抛射体介导递送法, 用生物射弹装置将表达载体导入植物组织。见,例如Tomes等(1995)。本 发明的载体不仅可以用来表达结构基因,而且还可以用于外显子捕获 (exon-trap)克隆、或启动子捕获(promoter trap)方法以检测多种组织中的 差异性基因表达(Lindsey 1993;Auch和Reth 1990)。

特别优选使用农杆菌某些种的Ti和Ri质粒的双元型载体。Ti衍生的 载体转化类型广泛的高等植物,包括单子叶植物和双子叶植物,如大豆、 棉花、油菜、烟草和稻(Pacciotti 1985:Byrne 1987;Sukhapinda 1987;Lorz 1985;Potrykus,1985;Park 1985:Hiei 1994)。使用T-DNA转化植物细胞 已经受到广泛研究并得到大量描述(EP 120516;Hoekema,1985;Knauf, 1983;和An 1985)。为导入植物,可将本发明的嵌合基因插入如实施例中所 述的双元载体。

本领域技术人员可获得其它转化方法,如外源DNA构建体直接摄取 法(见EP 295959),电穿孔技术(Fromm 1986)或使用以核酸构建体包被的 金属粒子的高速生物射弹轰击法(Kline 1987和US 4,945,050)。一旦转化, 细胞可以由本领域技术人员进行再生。

本领域中技术人员知道转化方法的选择将取决于预定转化的单子叶植 物的类型。适合用于转化植物细胞的方法包括,但不限于微抛射体法 (Crossway 1986)、电穿孔法(Riggs 1986)、农杆菌介导的转化法、直接基 因转移法(Paszkowski 1984)和其中使用可从Agracetus,Inc.,Madison, Wis.和BioRad,Hercules,Calif.获得的装置的生物射弹粒子加速法(见例 如,US 4,945,050;和McCabe 1988)。还见Datta 1990;(稻);Klein 1988(玉 米);Klein 1988(玉米);Klein 1988(玉米);Fromm 1990(玉米);和 Gordon-Kamm 1990(玉米);Koziel 1993(玉米);Shimamoto 1989(稻); Christou 1991(稻);欧洲专利申请EP 0 332 581(羊茅草(orchardgrass)和 其它羊茅亚科(Pooideae));Vasil 1993(小麦);Weeks 1993(小麦),Li 1993 和Christou 1995(稻);Osjoda 1996(玉米,借助根癌农杆菌),稻(Hiei 1994) 和玉米(Gordon-Kamm 1990;Fromm 1990),其中全部文献在本文中引用 作为参考。

在产生转化植物的方法中使用含有包含本发明表达盒的载体的根癌农 杆菌细胞,其中所述的载体包含Ti质粒。植物细胞用如上所述的根癌农 杆菌感染以产生转化的植物细胞并随后使植物从转化的植物细胞再生。已 知用于实施本发明的众多农杆菌载体系统。可以采用多种农杆菌菌株,优 选卸甲的根癌农杆菌菌株或发根农杆菌菌株。在优选的实施方案中,用于 实施本发明的农杆菌菌株包括章鱼碱菌株(例如LBA4404)或农杆碱菌株 (例如EHA101或EHA105)。适合用于DNA转移的根癌农杆菌菌株例如 是EHA101[pEHA101](Hood 1986)、EHA105[pEHA105](Li 1992)、 LBA4404[pAL4404](Hoekema 1983)、C58C1[pMP90](Koncz & Schell 1986)和C58C1[pGV2260](Deblaere 1985)。其它合适的菌株是根癌农杆菌 胭脂碱菌株C58。其它合适的菌株是根癌农杆菌C58C1(Van Larebeke 1974)、A136(Watson 1975)或LBA4011(Klapwijk 1980)。在另一个优选的 实施方案中,土源细菌是发根农杆菌菌株K599(NCPPB 2659)的卸甲变体。 优选地,这些菌株包含了提供T-DNA转移至植物细胞内的所需功能(例如 vir基因)的Ti质粒或Ri质粒的卸甲质粒变体。在优选的实施方案中,用 来转化与植物酚类化合物预培养的植物组织的农杆菌菌株含有L,L-琥珀碱 型(succinamopine type)Ti-质粒,优选地卸甲的L,L-琥珀碱型Ti-质粒,如 pEHA101。在另一个优选的实施方案中,用来转化与植物酚类化合物预培 养的植物组织的农杆菌菌株含有章鱼碱型Ti-质粒,优选地卸甲的章鱼碱 型Ti-质粒,如pAL4404。当使用章鱼碱型Ti-质粒或辅助质粒时,优选使 virF基因缺失或失活(Jarschow 1991)。

本发明方法还可以与特定的农杆菌菌株组合使用以进一步增加转化效 率,如其中vir基因的表达和/或其引入因存在突变性或嵌合的virA或virG 基因而受到改变的农杆菌菌株(例如Hansen 1994;Chen和Winans 1991; Scheeren-Groot,1994)。优选根癌农杆菌菌株LBA4404(Hiei 1994)与超强 毒性质粒的进一步组合。这些质粒优选地是基于pTOK246的载体(Ishida 1996)。

双元载体或其它任何载体可以通过常规DNA重组技术得以修饰,在 大肠杆菌中增殖并通过例如电穿孔或其它转化技术(Mozo和Hooykaas 1991)导入农杆菌。

农杆菌以类似Ishida(1996)所述的方式进行培养和使用。包含载体的 农杆菌菌株例如可以在补充适宜抗生素(例如50mg/L壮观霉素)的YP 培养基(5g/L酵母提取物、10g/L蛋白胨、5g/L NaCl、15g/L琼脂、pH6.8) 上培育3日。细菌用接种环从固体培养基上收集并重悬。在本发明的优选 实施方案中,以使用在-80℃冷冻的等分试样开始培养农杆菌。

农杆菌对靶组织(例如不成熟的胚)的转化可以通过仅将靶组织与农杆 菌接触而实施。可能需要变动用于感染和共培养的农杆菌浓度。例如,制 备农杆菌的细胞混悬液,其中所述的细胞混悬液具有大约105-1011、优选 106至1010、更优选约108个细胞或cfu/ml的群体浓度并且将靶组织浸泡 在这种混悬液内约3至10分钟。得到靶组织随后在固体培养基上与农杆 菌一起培养数日。

优选地,以106至1010cfu/mL的浓度使用细菌。在对共培养步骤的 优选实施方案中,在共培养介质中将约1至10μl的土源细菌(例如农杆 菌)混悬液直接施加至每种靶组织外植体并进行空气干燥。这节省劳动力和 时间并减少由于过量使用农杆菌所致的非故意的农杆菌介导的损伤。

对于农杆菌处理,将细菌重悬于植物兼容的共培养介质中。用可减少 因植物防御应答(如酚氧化作用)所致的组织坏死的抗氧化剂(例如硝酸银)、 酚吸收性化合物(如聚乙烯吡咯烷酮,Perl 1996)或巯基化合物(例如二硫苏 糖醇、L-半胱氨酸,Olhoft 2001)对共培养介质补充还可以改善农杆菌介导 的转化的效率。在另一个优选的实施方案中,共培养介质包含至少一种巯 基化合物,该巯基化合物优选地选自硫代硫酸钠、二硫苏糖醇(DTT)和半胱 氨酸。浓度优选地是在约1mM与10mM之间的L-半胱氨酸、0.1mM至 5mM DTT和/或0.1mM至5mM硫代硫酸钠。优选地,在共培养期间使 用的培养基包含约1μM至约10μM的硝酸银和约50mg/L至约1,000 mg/L的L-半胱氨酸。这导致明显降低靶组织对农杆菌介导的损伤(如诱导 的坏死)的脆弱性并明显改善整体转化效率。

多种载体系统可以与农杆菌组合使用。优选双元载体系统。常见双元 载体基于“广宿主范围”质粒,如衍生自P-型质粒RK2的质粒如pRK252 (Bevan 1984)或pTJS75(Watson 1985)。这些载体大部分是pBIN19(Bevan 1984)的衍生物。多种双元载体是已知的,其中某些可商业地获得,例如 pBI101.2或pBIN19(Clontech Laboratories,Inc.USA)。其它载体在大小 和操作性方面得到改良(例如pPZP;Hajdukiewicz 1994)。改良的载体系统 还在WO 02/00900中描述。

使用直接基因转移或农杆菌介导的转移形式的方法通常但不必需与选 择性标记一起实施,其中所述的选择性标记可以提供对抗生素(例如卡那霉 素、潮霉素或甲氨蝶呤)或除草剂(例如膦丝菌素)的抗性。然而,选择用于 植物转化的选择性标记对本发明不重要。

对于某些植物物种,可以优选不同的抗生素选择标记或除草剂选择标 记。转化中常规使用的选择标记包括赋予卡那霉素抗性和相关抗生素抗性 的nptII基因(Messing和Vierra,1982;Bevan 1983)、赋予除草剂膦丝菌 素抗性的bar基因(White 1990,Spencer 1990)、赋予抗生素潮霉素抗性的 hph基因(Blochlinger和Diggelmann)和赋予甲氨蝶呤抗性的dhfr基因 (Bourouis 1983)。

5.产生并表征稳定转化的植物。

随后将转基因植物细胞放置在适宜的选择性培养基中以选择转基因细 胞,其中所述的转基因细胞随后培育成愈伤组织。从愈伤组织中培育出枝 条。通过在生根培养基中培育从枝条生成小植物。多种构建体通常连接有 在植物细胞中用于选择的选择标记。便利地,标记可以抵抗杀生物物质(特 别是抗生素(如卡那霉素、G418、博来霉素、潮霉素、氯霉素)、除草剂等)。 与缺乏已导入DNA的细胞比较时,所用的特定标记将允许选择转化的细 胞。包括本发明转录盒的DNA构建体的成分可以从对宿主是天然(内源性) 或外来(外源)的序列中制备。“外来的”意指在导入构建体的野生型宿主中 找不到该序列。异源构建体将含有对衍生转录启动区的基因是非天然的至 少一个区域。

为证实转基因细胞和转基因植物存在外源DNA,可以开展多种分析 法。如此分析法例如包括本领域技术人员众所周知的“分子生物学”分析 法,如Southern印迹和RNA印迹,原位杂交和基于核酸的扩增方法如PCR 或RT-PCR或TaqMan;“生物化学”分析法,如检测蛋白质产物的存在, 例如通过免疫学方法(ELISA和蛋白质印迹)或通过酶功能;植物部分测定 如种子测定;并且还包括分析完整的再生植物的表型,例如对疾病抗性或 害虫抗性分析。

可以从细胞系或任一植物部分中分离DNA以便通过使用本领域技术 人员众所周知的技术确定存在预选择的核酸节段。应当指出完整序列并非 总是存在,其可能原因是所述序列在细胞内的重排或缺失。

可以通过聚合酶链式反应(PCR)确定由本发明方法所导入的核酸元件 的存在。使用这些技术,扩增并通过凝胶电泳检测核酸的预期片段。这种 类型的分析允许确定预选择的核酸节段是否存在于稳定的转化体,但是没 有证明导入的预选择核酸节段整合至宿主细胞基因组中。此外,不可能使 用PCR技术来确定转化体是否使外源基因导入基因组中的不同位点处, 即转化体是否有独立的来源。考虑了使用PCR技术,将有可能克隆毗邻 已导入的预选择DNA节段的宿主基因组DNA片段。

DNA整合至宿主基因组中和转化体独立身份的直接证据可以使用 Southern杂交技术确定。使用该技术,可以鉴定导入宿主基因组并分布在 宿主DNA序列侧翼的特定DNA序列。因此,给定转化体的Southern杂 交模式充当该转化体的鉴定性特征。此外,有可能通过Southern杂交来 证实已导入的预选择DNA节段存在于高分子量DNA中,即证实导入的预 选择DNA节段已经整合至宿主细胞基因组中。Southern杂交技术提供了 使用PCR所获得的信息,例如预选择DNA节段的存在,而且还证实基因 组整合并表征每个单独的转化体。

认为使用作为Southern杂交技术的改良技术:点杂交或狭线印迹杂 交技术可以获得从PCR中推导出的相同信息,例如预选择DNA节段的存 在。

PCR和Southern杂交技术均可以用来证实预选择DNA节段传递至 于代。在大多数情况下,对给定转化体的特征性Southern杂交模式将在 子代中分离为说明基因稳定遗传的一个或多个孟德尔基因(Spencer 1992); Laursen 1994)。通过生殖系传递和相同的DNA印迹分析杂交模式及转化 性DNA在愈伤组织、R0植物和对所转化基因分离的R1子代中的密集度 而显示愈伤组织和亲代转化体(R0)的非嵌合本质。

尽管DNA分析技术可以利用分离自植物任一部分的DNA进行,RNA 可能仅表达于特定细胞或组织型并且因此需要从这些组织中制备用于分析 的RNA。PCR技术还可以用于检测和定量从预选择的DNA节段中产生 的RNA。在PCR的这种应用中,首先需要使用酶如逆转录酶,将RNA 逆转录成DNA并随后利用常规PCR技术扩增DNA。在大多数情况下, 尽管PCR技术有用,但它没有证实RNA产物的完整性。关于RNA产物 本质的其它信息可以通过RNA印迹获得。该技术将证实RNA种类的存在 并产生关于该RNA完整性的信息。RNA种类的存在或不存在还可以点印 迹或狭线印迹Northern杂交确定。这些技术是RNA印迹法的修改并仅证 实RNA种类的存在或不存在。

尽管DNA印迹分析和PCR可以用来检测预选择的所讨论DNA节段, 然而它们不提供例如是否表达预选择的DNA节段的信息。表达可以通过 特异性地鉴定预选择DNA节段的蛋白质产物或评估因这些蛋白质产物表 达所致的表型改变进行评价。

用于特定蛋白质的产生和鉴定的分析法可以利用蛋白质的物理化学、 结构、功能或其它特性。独特的物理化学特征或结构特性允许通过电泳方 法(如天然凝胶或变性凝胶电泳或等电聚焦法)或色谱技术(如离子交换或凝 胶排阻色谱)分离并鉴定蛋白质。各种蛋白质的独特结构提供在测定(如 ELISA测定)中利用特定抗体来检测蛋白质存在的可能。可以采用具有甚至 更强特异性的方法的组合,如在其中使用抗体来确定已通过电泳技术分离 的各个基因产物的蛋白质印迹法。可以采用其它技术来绝对地证实目的产 物身份,如通过纯化后的氨基酸测序评估。虽然这些方法属于最常见使用 的方法,然而也可以使用其它方法。

测定方法还可以用来通过蛋白质功能、尤其酶催化包含特定底物和产 物的特定化学反应的能力而鉴定蛋白质的表达。这些反应可以通过在反应 中提供底物并由物理方法或化学方法测定底物的丧失或产物的生成而进 行。实例随着待分析的酶而不同。

基因产物的表达最经常地通过评估基因产物表达的表型结果而确定。 这些分析法还可以采取众多形式,包括但不限于分析植物的化学组成、形 态学或生理特性的改变。形态学改变可以包括更大的株型或更厚实的茎。 最经常的是在精心控制的条件定义的生物测定法中评估对所施加处理应答 的植物或植物部分的改变。可以培育两个或多个世代以确信稳定维持和遗 传所需要的表型特征在目的条件下的组织偏好性表达。

6.转基因植物的用途

一旦将本发明的表达盒转化至特定的植物种中,则使用传统育种技术, 可以在所述物种中增殖该表达盒或使之移动到相同物种的其它品种中,尤 其包括商业品种。本发明特别优选的植物包括上文所列的农学重要的作物。 工程化至以上所述的转基因种子或转基因植物中的遗传特性通过有性繁殖 进行传递并且因此可以在子代植物中得到维持和增殖。本发明还涉及从转 基因植物中获得的转基因植物细胞、组织、器官、种子或植物部分。本发 明还包括植物的转基因后代以及从该后代中获得的转基因植物细胞、组织、 器官、种子和植物部分。

优选地,转基因植物中的表达盒以有性方式传递。在一个优选的实施 方案中,编码序列通过R0植物的完整正常有性周期以有性方式传递至R1世代。还优选表达盒在转基因植物细胞、组织、种子或植物中以这样的量 表达,其中所述的量与差异仅在于缺少所述表达盒的植物细胞、组织、种 子或植物中的量不同。

因此,预期本文中产生的转基因植物用于多种商业目的和研究目的。 可以产生转基因植物用在传统农业中,以便种植者获得益处(例如农学性状 如水匮乏抗性、害虫抗性或提高的产量),消费者从该植物中所收获的谷物 中获得益处(例如人食品或动物饲料内改善的营养含量;维生素、氨基酸和 抗氧化剂含量增加,产生抗体(被动免疫)和营养品)或食品加工者获得益处 (例如改善的加工性状)。在此类用途中,通常为在人食物或动物饲料中使 用植物的谷粒而培育植物。此外,转基因植物中根特异性启动子的使用可 以提供局限于(动物和人)可消费的植物根(如胡萝卜、欧防风(parsnips) 和甜菜)中的有益性状。然而,植物的其它部分,包括茎、壳、营养部分等 还可以具有用途,包括用作动物青贮饲料的部分或化妆品目的。通常提取 玉米和其它作物的化学成分(例如油或淀粉)用于食品或工业用途,并且可 以产生具有增强或改良的此类成分的转基因植物。

转基因植物还可以用于商业地制造蛋白质或其它分子,其中从植物部 分或种子等中提取或纯化目的分子。还可以培养、体外生长或发酵来自该 植物的细胞或组织以制造此类分子。转基因植物还可以在商业育种计划内 使用或可以与相关的作物植物物种杂交或育种。由表达盒编码的改良可以 例如从玉米细胞转移至其它物种的细胞,例如通过原生质体融合。

转基因植物可以在研究或育种中具有众多用途,包括通过插入性诱变 而产生新的突变植物,以鉴定可能随后通过传统突变和选择法产生的有益 突变体。实例是导入编码可用来生成遗传变异的转座元件的重组DNA序 列。本发明方法还可以用来产生具有可用于鉴定专有品系或品种的独特 “标签序列”或其它标记序列的植物。

因此,本发明的转基因植物和转基因种子可以用于旨在开发如此植物 的植物育种中使用,其中所述植物具有由表达盒所赋予的改良特性,如对 干旱、疾病或其它胁迫的耐受性。多种育种步骤由充分定义的人类干预加 以表征,如选择待杂交的系、亲代系的定向授粉或选择适宜的后代植物。 根据需要的特性,采用不同的育种措施。相关技术在本领域中是众所周知 的并且包括但不限于杂交、近交、回交、并行育种(multilane breeding)、 品种混杂、种间杂交、非整倍体的技术等。杂交技术还包括通过机械方法、 化学方法或生物化学方法致植物不育,以产生雄性不育或雌性不育植物。 用不同品系的花粉对雄性不育植物交叉授粉确保雄性不育植物的基因组而 非雌性能育植物的基因组均匀地获得两个亲代系的特性。因此,本发明的 转基因种子和转基因植物可以用于对改良植物品系进行育种,例如因所述 植物改良的遗传特性而增加常规方法如除草剂处理或杀虫剂处理的效率或 允许替代所述方法。或者,可以获得具有改善的胁迫耐受性的新作物,所 述的新作物因其优化的遗传“装置”而产生这样的收获产物,其质量比不能 够耐受相当的不利发育条件的产物更好。

序列

1.SEQ ID NO:1核苷酸序列,其编码衍生自根癌农杆菌章鱼碱合酶 基因的上游激活序列

2.SEQ ID NO:2核苷酸序列,其编码衍生自根癌农杆菌甘露氨酸合 酶基因启动子的转录调节核苷酸序列

3.SEQ ID NO:3核苷酸序列,其编码衍生自根癌农杆菌甘露氨酸合 酶基因的包含一些填充序列的启动子的转录调节核苷酸序列

4.SEQ ID NO:4核苷酸序列,其编码嵌合的转录调节性序列(超级 启动子)

5.SEQ ID NO:5核苷酸序列,其编码小立碗藓EST217:14-3-3蛋白 (gb AX281102)[pBPSSuP001]

6.SEQ ID NO:6氨基酸序列,其编码小立碗藓EST217:14-3-3蛋 白(gb AX281102)[pBPSSuP001]

7.SEQ ID NO:7核苷酸序列,其编码小立碗藓EST268:磷酸肌醇 特异性磷脂酶C(gb AX281101)[pBPSSuP002]

8.SEQ ID NO:8氨基酸序列,其编码小立碗藓EST268:磷酸肌醇 特异性磷脂酶C(gb AX281101)[pBPSSuP002]

9.SEQ ID NO:9核苷酸序列,其编码拟南芥菜推定的酪氨酸氨基转 移酶(At5g53970)gb BT000782[pBPSSuP003]

10.SEQ ID NO:10氨基酸序列,其编码拟南芥菜推定的酪氨酸氨基 转移酶(At5g53970)gb BT000782[pBPSSuP003]

11.SEQ ID NO:11核苷酸序列,其编码稻推定的胆色素原脱氨酶 [gb XM_464262](pBPSSuP004)

12.SEQ ID NO:12氨基酸序列,其编码稻推定的胆色素原脱氨酶 [gb XM_464262](pBPSSuP004)

13.SEQ ID NO:13核苷酸序列,其编码稻推定的ω-3脂肪酸去饱 和酶[gb NM_185577](pBPSSuP005)

14.SEQ ID NO:14氨基酸序列,其编码稻推定的ω-3脂肪酸去饱 和酶[gb NM_185577](pBPSSuP005)

15.SEQ ID NO:15核苷酸序列,其编码稻镰刀菌抗性蛋白质I2C-5 样[gb NM_194161](pBPSSuP006)

16.SEQ ID NO:16氨基酸序列,其编码稻镰刀菌抗性蛋白质 I2C-5样[gb NM_194161](pBPSSuP006)

17.SEQ ID NO:17核苷酸序列,其编码拟南芥菜致病相关基因5的 组成型表达子(cpr5,At5g64930;gb AY033229)[pBPSSuP007]

18.SEQ ID NO:18氨基酸序列,其编码拟南芥菜致病相关基因5的 组成型表达子(cpr5,At5g64930;gb AY033229)[pBPSSuP007]

19.SEQ ID NO:19核苷酸序列,其编码稻的植物疾病抗性聚蛋白 样[gb XM_465297](pBPSSuP008)

20.SEQ ID NO:20氨基酸序列,其编码稻的植物疾病抗性聚蛋白样 [gb XM_465297](pBPSSuP008)

21.SEQ ID NO:21核苷酸序列,其编码酿酒酵母归巢内切核酸酶 I-SceI

22.SEQ ID NO:22氨基酸序列,其编码酿酒酵母归巢内切核酸酶 I-SceI

23.SEQ ID NO:23核苷酸序列,其编码酿酒酵母归巢内切核酸酶 I-SceI,包含内含子(例如旨在抑制细菌(例如大肠杆菌或农杆菌细胞)中的功 能性蛋白质表达)

24.SEQ ID NO:24-41寡核苷酸引物序列

42.SEQ ID NO:42核苷酸序列,其编码HvRACB(RACB,来自大 麦的GTP酶。RACBV15组成型活性形式似乎显示增加的镰刀菌抗性)

43.SEQ ID NO:43氨基酸序列,其编码HvRACB(RACB,来自大 麦的GTP酶。RACBV15组成型活性形式似乎显示增加的镰刀菌抗性)

44.SEQ ID NO:44核苷酸序列,其编码BAX抑制物1(大麦抗凋 亡基因,其过量表达导致增加的广谱抗性)

45.SEQ ID NO:45氨基酸序列,其编码BAX抑制物1(大麦抗凋 亡基因,其过量表达导致增加的广谱抗性)

46.SEQ ID NO:46核苷酸序列,其编码HvADF3(肌动蛋白解聚因 子3,过量表达导致增加的广谱抗性)

47.SEQ ID NO:47氨基酸序列,其编码HvADF3(肌动蛋白解聚因 子3,过量表达导致增加的广谱抗性)

48.SEQ ID NO:48核苷酸序列,其编码HvSNAP34(参与囊泡运输 的ROR2的t-SNARE相互作用子。过量表达增加真菌抗性)

49.SEQ ID NO:49氨基酸序列,其编码HvSNAP34(参与囊泡运输 的ROR2的t-SNARE相互作用子。过量表达增加真菌抗性)

50.SEQ ID NO:50核苷酸序列,其编码HvROR2(突触融合蛋白, SNAP34的相互作用子。过量表达增加真菌抗性)

51.SEQ ID NO:51氨基酸序列,其编码HvROR2(突触融合蛋白, SNAP34的相互作用子。过量表达增加真菌抗性)

52.SEQ ID NO:52核苷酸序列,其编码HvPOX8.1(过氧化物酶,其 过量表达导致增加的真菌抗性)

53.SEQ ID NO:53氨基酸序列,其编码HvPOX8.1(过氧化物酶,其 过量表达导致增加的真菌抗性)

54.SEQ ID NO:54-65寡核苷酸引物序列

实施例

材料和通用方法

除非另外说明,实施例中的化学品和试剂从Sigma Chemical Company (St.Louis,MO)获得,限制性内切核酸酶获自New England Biolabs (Beverly,MA)或Roche(Indianapolis,IN),寡核苷酸由MWG Biotech Inc. (High Point,NC)合成并且其它关于生物化学分析或分子生物学分析的修 饰酶试剂盒来自Clontech(Palo Alto,CA)、Pharmacia Biotech (Piscataway,NJ)、Promega Corporation(Madison,WI)或Stratagene(La Jolla,CA)。用于细胞培养基的材料从Gibco/BRL(Gaithersburg,MD)或 DIFCO(Detroit,MI)获得。如Sambrook(1989)所述实施用于本发明目的的 克隆步骤,例如,限制性切割、琼脂糖凝胶电泳、纯化DNA片段、转移 核酸至纤维素和尼龙膜、连接DNA片段、转化大肠杆菌细胞、培养细菌、 增殖噬菌体和重组DNA的序列分析。按照Sanger方法(Sanger 1977)使用 ABI激光荧光DNA序列仪来开展重组DNA分子测序。

实施例1载体构建

启动子片段通过用XbaI和XmaI酶消化而从p1bxSuperGUS中分离 并亚克隆至pBPSCER011[pUC中的GUS(马铃薯转化酶内含子2)∷NOS] 中的GUS基因上游,产生pBPSMM188。受超级启动子驱动的GUS嵌 合盒用AscI和SacI消化并通过用超级启动子∷GUS(I)∷NOS终止子替换 现存的GUS盒而克隆入pBPSMM146。这种转化构建体命名为 pBPSMM225。

实施例2.单子叶植物中农杆菌介导的转化

还可以使用标准转化和再生技术实施农杆菌介导的植物转化,目的在 于转化作物植物(Gelvin 1995;Glick 1993,US 5,591,616)。例如,Freeling 和Walbot(1993)“The maize handbook”ISBN 3-540-97826-7,Springer Verlag New York)描述了使用粒子轰击法、聚乙二醇介导的DNA摄入法或 通过碳化硅纤维技术对植物的转化。

为选择农杆菌和植物而使用的植物毒性化合物(例如抗生素、除草剂等) 取决于转化所用的双元载体和农杆菌菌株。通常使用膦丝菌素或D-丝氨酸 或D-丙氨酸作为选择化合物实施对玉米选择。

实施例3.报道基因表达的检测

为鉴定带来组织特异性的启动子的特征和该启动子的必需元件,需要 将启动子自身及其多种片段置于允许测定表达活性的所谓报道基因的前 面。可提到的实例是细菌的β-葡糖醛酸糖苷酶(Jefferson 1987a)。β-葡糖醛 酸糖苷酶活性在植物中借助生色底物如5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸 于活性染色法(Jefferson 1987b)内进行检测。为研究组织特异性,植物组织 如(例如1991b)所述进行切割、包埋、染色和分析。

第二种分析法允许定量确定所研究组织中的GUS活性。为定量的活性 确定,使用MUG(4-甲基伞形基-β-D-葡糖苷酸)作为β-葡糖醛酸糖苷酶的底 物并且MUG被切割成MU(甲基伞形酮)和葡糖醛酸。

为做到这点,首先制备目的组织的蛋白质提取物并随后添加底物GUS 至该提取物。底物可以仅在GUS已经得到反应后用荧光测定法测量。在多 个时间点处收集随后于荧光计中得到测量的样品。该测定法可以用例如处 于各种发育期(开花后21日,24日或30日)的亚麻籽胚实施。为此目的,在任 何情况下,将一个胚在2mL反应容器在液氮中借助振动研磨机(型号: Retsch MM 2000)研磨成粉末。在添加100μL的EGL缓冲液(0.1M KPO4、 pH7.8;1mM EDTA;5%甘油;1M DTT)后,将混合物在25℃和14,000x g离心10分钟。移走并再次离心上清液。再次将上清液转移至新的反应容器 并在冰上保存直至进一步使用。25μL的这种蛋白质提取物用65μL的EGL 缓冲液(无DTT)处理和用于GUS测定法中。现在添加10μL底物MUG (10mM 4-甲基伞形基-β-D-葡糖苷酸),涡旋混合该混合物并且立即取出 30μL作为零值并用470μL终止缓冲液(0.2M Na2CO3)处理。该方法以30 秒间隔重复用于全部样品。采集的样品贮藏在冰箱内直至进行测量。在1 小时和在2小时后获得其它读数。对荧光测量法建立含有0.1mM至10mM MU(4-甲基伞形酮)浓度的校正系列。如果样品值在这些浓度之外,使用较 少的蛋白质提取物(来自1∶10稀释的10μL、1μL、1μL)并且测量更短的间 隔期(0小时、30分钟、1小时)。在Fluoroscan II装置(Lab系统)中在365nm 激发和445nm发射处实施测量。作为备选,底物切割可以如Bustos(1989) 中所述以荧光测量方式在碱性条件下监测(在365nm激发,测量在455nm 的发射;Spectro荧光计BMG Polarstar+)。全部样品通过Bradford(1976) 蛋白质浓度测定方法测定蛋白质浓度,因此允许鉴定多种组织和植物中的 启动子活性和启动子强度。

实施例4.玉米中的淀粉胚乳特异性表达和/或萌芽胚特异性表达

超级启动子在(吸涨后直到7日的)幼苗的根内仅零星地表现低表达, 然而在大部分植物中是检测不到的。超级启动子在发育的谷穗和T2谷粒 中低水平表达。在仍位于玉米穗轴上的谷粒中,表达限于中央胚乳。在干 燥种子中观察到较低水平的相同表达模式。然而,在水中吸涨24小时后, 超级启动子在胚中高度表达,但在胚乳的受限制区域中的染色较弱并且几 乎检测不到。这种强烈的胚特异性表达在萌发期间得以维持直至吸涨后7 日。在吸涨的7日后,在胚根和少数非常幼小的根内检测到中等水平的GUS 表达。根中的表达在较年长的植物中检测不到。

表6.控制GUS表达的单子叶植物潜在的成型启动子候选物

作为组成型启动子的阳性对照;通过组织化学测定法测量了一系列 GUS表达水平(-至+++++),ND:未测定

1淀粉胚乳区域

2

实施例5.转基因作物的利用

pBPSMM225中的报道基因可以(例如通过反义RNA或双链RNA)用 主要于根和谷粒内表达的目的基因替换,因而改善例如生物量和/或产量, 对生物性和非生物性环境胁迫的耐受性或种子或籽苗的营养价值。将嵌合 的构建体转化至单子叶植物中。可以根据需要使用本领域中用于转化的标 准方法。使用已知方法使转化的植物再生。测量多种表型以确定改善了生 物量、产量、脂肪酸组成、高油、疾病耐受性或指示产量增强或产量稳定 性的任何其它表型。测定在不同发育阶段和不同世代(T0至T2植物或其它 世代)中的基因表达水平。植物中的评价结果导致鉴定与这种启动子组合而 增加产量的合适基因。

实施例6.由超级启动子驱动的性状基因构建体

6.1候选基因的分离

使用Qiagen DNAeasy Plant Mini Kit(Qiagen)提取来自目的植物种的 基因组DNA。使用常规PCR分离含有目的基因(GOI)的基因组DNA区 域。对于常规PCR反应(见下文),使用大约0.1μg的已消化的基因组 DNA。基于基因组序列设计引物。1μL稀释的已消化的基因组DNA用作 初级PCR反应中的DNA模板。初级PCR反应包含在含有缓冲液3的混 合物中的如下引物对(表7),按照Expand Long PCR试剂盒(目录号 1681-842,Roche-Boehringer Mannheim)概述的方法进行。使用分离的 DNA作为使用如下引物的PCR扩增反应中的模板DNA:

表7.引物序列

  引物名称   序列  SEQ ID NO:   14-3-3蛋白   FP:5’-ATCCCGGGCGGACTGTCGTGG-3’   RP:5’-GCGAGCTCGGCACGCAACTGC-3’   24   25   磷酸肌醇特   异性磷脂酶C   FP:5’-ATCCCGGGCTTCGGGAGTTTA-3’   RP:5’-GGCGTTAACCTTGGGTGCACA-3’   26   27   酪氨酸氨基   转移酶   FP:5’-AAAATCAAAACCTTCTCTTCT-3’   RP:5’-CAAGTTAACATTTTTCTGTTT-3’   28   29   推定的胆色   素原脱氨酶   FP:5’-ATGCCGCCGCCGCCGAGATGC-3’   RP:5’-TCATTGCAAGCTATCAAAGAA-3’   30   31   推定的ω-3   脂肪酸去饱   和酶   FP:5’-ATGGCCCGGCTGCTACTCTCC-3’   RP:5’-TTAGTTAGCAGGGTCGGTCTG-3’   32   33   Os.I2C-5-样   FP:5’-ATGGATAACACGTTGGTGGCA-3’   RP:5’-TCAGTTGTCATCGACTTCTGA-3’   34   35   致病相关基   因5的组成型   表达子   FP:5’-ATGGAAGCCCTCCTCCTCCCT-3’   RP:5’-TCAAGCATAGTCAGACCCACC-3’   36   37   植物疾病抗   性聚蛋白样   FP:   5’-ATGGGGAAGAAAAGGAAAGGGG-3’   RP:   5’-CTAGGCTCGCCGCCGCACCGCG-3’   38   39

  归巢内切核   酸酶I-SceI   FP:5’-ATGCATATGAAAAACATCAAA-3’   RP:5’-TTATTTCAGGAAAGTTTCGGA-3’   40   41   GTP酶   FP:5’-ATGAGCGCGTCCAGGTTCATA-3’   RP:5’-TCACAAGATGGAGCAAGCCCC-3’   54   55   大麦抗凋亡   基因   FP:5’-ATGCGCTTGAATATCGGTGGA-3’   RP:5’-CTAAGTTTCTTCATTATTTCT-3’   56   57   肌动蛋白解   聚因子3   FP:5’-ATGGCTAATGCAGCATCAGGA-3’   RP:5’-TCAATTGGCTCGGCTTTTGAA-3’   58   59   ROR2的   t-SNARE相   互作用蛋白   FP:5’-ATGAGCGCCACCAGGCCCTCC-3’   RP:5’-CTATCTGCCAAGCAGGCGACG-3’   60   61   突触融合蛋   白,SNAP34   的相互作用   蛋白   FP:   5’-ATGAACAACCTCTTCTCGAGCTCG-3’   RP:5’-CTACTGCTGGCTGTTGTTGTT-3’   62   63   过氧化物酶   FP:5’-ATGGCCTCTACTTCGTCCCTA-3’   RP:5’-TTAATTCACCTTGGAGCAGCT-3’   64   65

表中所示序列显示仅与待扩增序列部分同源。完整引物包含在正向引 物5’端的SmaI限制性位点接头(5-CCCGGG-3’)和反向引物5’端的SacI限 制性位点接头(5-GAGCTC-3’)。

正向引物和反向引物包含附加在引物5’端的悬突的SmaI和SacI限制 酶位点。扩增在PCR反应(5μL 10×Advantage PCR Mix[Eppendorf]、5μ L基因组DNA[对应于大约80ng]、2.5mM每种dATP、dCTP、dGTP 和dTTP[Invitrogen:dNTP混合物]、1μL的20μM的5’-内含子特异性引物、 1μL的20μM的3’内含子特异性引物、1μL TripleMaster DNA聚合酶混合物 [Eppendorf],终体积50μL)中,在热循环仪(T3 Thermocycler Biometra) 提供的优化PCR程序(在94℃15秒和在80℃1分钟的1个循环,在94℃15 秒、在58℃1分钟和在72℃1分钟的35个循环)下实施。

将PCR产物加在1%(w/v)琼脂糖凝胶上并以80V分离。将PCR产物从 凝胶中切出并用Qiagen Gel Extraction Kit(Qiagen,Hilden,Germany)纯 化。PCR产物可以按照制造商的说明书直接克隆至载体pCR4-TOPO (Invitrogen),即将获得的PCR产物插入具有T突出端、A突出端和拓扑异 构酶的载体。

4.2载体构建

候选基因克隆至其中的基础载体是pBPSMM225。该载体包含超级启 动子,后接GUSint ORF(包括马铃薯转化酶[PIV]2内含子以防止细菌性表 达),此后是胭脂碱合酶(NOS)终止子。

通过将SmaI-SacI消化的目的基因PCR产物连接到SmaI-SacI线性 化的pBPSMM225产生含有超级启动子∷目的基因∷NOS终止子的嵌合构 建体,从而产生如下载体(表8)。

表8.由超级启动子驱动的性状基因嵌合构建体

  双元载体   靶/性状   候选目的基因[GenBank登录号]   1   pBPSSuP001   pBPSSuP002   非生物的胁迫R[冷,寒冷,   早期萌发势,和高产量]   ·14-3-3蛋白及磷酸肌醇特异性磷脂   酶C[WO0177355和US6720477]   2   pBPSSuP003   pBPSSuP004   pBPSSuP005   营养性籽苗[维生素,脂   肪酸等]   ·酪氨酸氨基转移酶(Vit   E)[BT000782;WO02072848]   ·推定的胆色素原脱氨酶(Vit   B12)[XM464262]   ·推定的ω-3脂肪酸去饱和酶   [NM185577]   3   pBPSSuP006   pBPSSuP007   pBPSSuP008   种子来源的疾病R  ·稻镰刀菌抗性蛋白质I2C-5样   [NM194161]   ·致病相关基因5的组成型表达子   (cpr5)[NM125892.2]   ·植物疾病抗性聚蛋白样   [XM465297]   5   pBPSSuP009   标记切除   ·归巢内切核酸酶I-SceI   6   pBPSSuP010   pBPSSuP011   pBPSSuP012   真菌抗性   ·GTP酶[WO03020939]   ·大麦抗凋亡基因[WO03020939]   ·肌动蛋白解聚因子3

  双元载体   靶/性状   候选目的基因[GenBank登录号]   pBPSSuP013   pBPSSuP014   pBPSSuP015   [WO2004035798]   ·ROR2的t-SNARE相互作用子   [WO2004081217]   ·突触融合蛋白,SNAP34的相互作   用子[WO2004081217]   ·过氧化物酶

4.3增强对至少一个胁迫因子的抗性、提高种子或籽苗的营养质量、 增加产量或提高选择性标记切除的频率

pBPSMM225中的报道基因可以做如下替换

(1)非生物性胁迫抗性基因(14-3-3蛋白及磷酸肌醇特异性磷脂酶C: WO0177355和US6720477),

(2)参与维生素E生物合成的基因(酪氨酸氨基转移酶(BT000782: WO02072848),推定的胆色素原脱氨酶,推定的ω-3脂肪酸去饱和酶 [NM185577])

(3)生物性胁迫抗性基因(稻镰刀菌抗性蛋白质I2C-5-样[NM194161], 致病相关基因5的组成型表达子(cpr5:NM185577)),GTP酶[WO03020939], 肌动蛋白解聚因子3[WO2004035798],ROR2的t-SNARE相互作用子和 突触融合蛋白、SNAP34的相互作用子[WO2004081217],

(4)归巢内切核酸酶基因(例如编码归巢内切核酸酶I-SceI的序列) 以便萌发期间在胚中表达,因而改善例如对非生物性环境胁迫的耐受性、 导致提高潜在产量的早期萌发势、维生素E的量、对生物性胁迫的耐受性 和标记切除频率。将嵌合构建体转化至单子叶植物中。可以根据需要使用 本领域中用于转化的标准方法。使用已知方法使转化的植物再生。测量多 种表型以确定改善了生物量、产量、脂肪酸组成、高油、疾病耐受性或指 示产量增强或产量稳定性的任何其它表型。测定在不同发育期和不同世代 (T0至T2植物或其它世代)中的基因表达水平。植物中的评价结果导致鉴定 与这种启动子组合而增加产量、改善疾病耐受性、改善非生物性胁迫耐受 性和/或提高种子或籽苗营养质量的合适基因。

实施例5.缺失分析

克隆方法由Rouster(1997)和Sambrook(1989)描述。启动子的详细作 图(即缩减到与启动子特异性有关的核酸节段)通过产生多种报道基因表 达载体实施,其中所述的报道基因表达载体首先含有完整启动子区并且其 次含有该完整启动子区的多种片段。首先,将完整启动子区或其片段克隆 入含有GUS或其它报道基因的双元载体中。为此目的,首先使用这样的片 段,所述片段通过使用识别全长启动子序列中的内部限制性切割位点的限 制酶获得。其次,使用具有由引物导入的切割位点的PCR片段。使用本领 域中的转化方法,将含有多种缺失型启动子的嵌合GUS构建体转化入玉米 和其它植物种内。启动子活性通过使用GUS组织化学测定法或其它适宜方 法分析不同发育期的多种组织和器官。

实施例6.体内诱变

技术人员熟知用于修饰启动子活性或鉴定重要启动子元件的多种方 法。这些方法中的一种基于随机突变,随后用如上所述的报道基因进行检 测。微生物的体内诱变可以通过质粒(或另一种载体的)DNA经其中维持遗 传信息完整性的能力被破坏的大肠杆菌或其它的微生物(例如芽孢杆菌某 些种(Bacillus spp.)或酵母如酿酒酵母)传代而来实现。常用的突变菌株在 用于DNA修复系统的基因(例如mutHLS,mutD,mutT等;参见Rupp 1996) 中具有突变。技术人员熟知这些菌株。这些菌株的使用例如由Greener (1994)展示。将突变的DNA分子转移至植物中优选地在选择和测试微生物 之后进行。如上所述产生并分析转基因植物。

实施例7.对超级启动子(SEQ ID NO:4)的PLACE分析

基于以下给出的PLACE结果,表明在SEQ ID NO:4的1,112碱基对 中没有可用的TATA盒共有序列。在如SEQ ID NO:4所述的超级启动子 中鉴定了如下的启动子元件簇:

表9.位于超级启动子中的结合调节性蛋白的DNA基序

 IUPAC   位置   Str.   序列

  从-至   CGACGOSAMY3  14-18   (+)   CGACG   NONAMERMOTIFTAH3H  4  17-25   (-)   CATCCAACG   PYRIMIDINEBOXOSRAM  43-48   (+)   CCTTTT   IBOXCORENT  48-54   (-)   GATAAGA   ACGTABOX  62-67   (+)   TACGTA   ACGTABOX  62-67   (-)   TACGTA   OCSENHANMOTIFAT  63-78   (+)   ACGTAAGCGCTTACGT   OCSENHANMOTIFAT  63-78   (-)   ACGTAAGCGCTTACGT   RAV1AAT  109-113   (-)   CAACA   CGACGOSAMY3  233-237   (+)   CGACG   NONAMERMOTIFTAH3H  4  236-244   (-)   CATCCAACG   PYRIMIDINEBOXOSRAM  262-267   (+)   CCTTTT   IBOXCORENT  267-273   (-)   GATAAGA   ACGTABOX  281-286   (+)   TACGTA   ACGTABOX  281-286   (-)   TACGTA   OCSENHANMOTIFAT  282-297   (+)   ACGTAAGCGCTTACGT   OC SENHANMOTIFAT  282-297   (-)   ACGTAAGCGCTTACGT   RAV1AAT  328-332   (-)   CAACA   CGACGOSAMY3  452-456   (+)   CGACG   NONAMERMOTIFTAH3H  4  455-463   (-)   CATCCAACG   PYRIMIDINEBOXOSRAM  481-486   (+)   CCTTTT   IBOXCORENT  486-492   (-)   GATAAGA

  ACGTABOX  500-505   (+)   TACGTA   ACGTABOX  500-505   (-)   TACGTA   OCSENHANMOTIFAT  501-516   (+)   ACGTAAGCGCTTACGT   OCSENHANMOTIFAT  501-516   (-)   ACGTAAGCGCTTACGT   P$FAM270/P$RAV1AAT  547-551   (-)   CAACA   OCTAMERMOTIFTAH3H  4  659-666   (-)   CGCGGATC   ELRECOREPCRP1  663-677   (-)   ATTGACCAGCTCGCG   RAV1AAT  699-703   (+)   CAACA   CCA1ATLHCB1  727-734   (-)   AAAAATCT   -300ELEMENT  728-736   (-)   TGAAAAATC   ABRELATERD1  747-759   (+)   CAAGACGTGACGT   TGACGTVMAMY  749-761   (+)   AGACGTGACGTAA   HEXMOTIFTAH3H4  751-763   (-)   ACTTACGTCACGT   AUXRETGA1GMGH3  752-764   (+)   CGTGACGTAAGTA   WBOXHVISO1  761-775   (-)   ACTGACTCGGATACT   REBETALGLHCB21  762-768   (-)   CGGATAC   LTRE1HVBLT49  805-810   (-)   CCGAAA   -10PEHVPSBD  848-853   (+)   TATTCT   BOXIINTPATPB  856-861   (-)   ATAGAA   WUSATAg  885-891   (-)   TTAATGG   WBBOXPCWRKY1  923-937   (-)   TTTGACTAGCGAGGC   -300CORE  954-960   (-)   TGTAAAG   TAAAGSTKST1  954-960   (-)   TGTAAAG   ASF1MOTIFCAMV  974-986   (+)   GCGCGTGACGCTC   ASF1MOTIFCAMV  986-998   (+)   CGCGGTGACGCCA

  -300ELEMENT  1003-1011   (-)  TGAAAAGGC   PYRIMIDINEBOXOSRAM  1004-1009   (+)  CCTTTT   AMYBOX2  1015-1021   (-)  TATCCAT   TATCCAOSAMY  1015-1021   (-)  TATCCAT   MYBST1  1016-1022   (+)  TGGATAA   IBOXCORE  1018-1024   (+)  GATAAAT   CCAATBOX1  1057-1061   (+)  CCAAT   DPBFCOREDCDC3  1067-1073   (+)  ACACTAG   MYB1AT  1087-1092   (+)  TAACCA   REALGLHCB21  1088-1098   (+)  AACCAATCTCG   CCAATBOX1  1090-1094   (+)  CCAAT

参考文献

1.Abel等,Science,232:738(1986).

2.Altschul等,Nucleic Acids Res.,25:3389(1997).

3.Altschul等,J.Mol.Biol.,215:403(1990).

4.An等,EMBO J.,4:277(1985).

5.Auch和Reth,Nucleic Acids Research,18:6743(1990).

6.Ausubel等(1987)Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987).

7.Ballas等,Nucleic Acids Res.,17:7891(1989).

8.Barkai-Golan等,Arch.Microbiol.,116:119(1978).

9.Barker等,(1983)Plant Molec.Biol.2:335-50.

10.Batzer等,Nucleic Acid Res.,19:5081(1991).

11.等Mol Gen Genet 225:121-128(1991)

12.Becker等(1994)Plant J.,5:299-307,

13.Bernal-Lugo和Leopold,Plant Physiol.,98:1207(1992).

14.Bevan等,Nature,304:184(1983).

15.Bevan等,Nucl.Acids Res.,11:369(1983).

16.Bevan,Nucl.Acids Res.,12:8711(1984).

17.Blackman等,Plant Physiol.,100:225(1992).

18.Blochlinger和Diggelmann,Mol Cell Biol,4:2929(1984).

19.Bol等,Ann.Rev.Phytopath.,28:113(1990).

20.Bouchez等,EMBO J.,8:4197(1989).

21.Bourouis等,EMBO J.,2:1099(1983).

22.Bowler等,Ann.Rev.Plant Physiol.,43:83(1992).

23.Bradford,Anal.Biochem.72:248-254(1976)

24.Branson和Guss,Proc.North Central Branch Entomological Society of America(1972).

25.Broakgert等,Science,245:110(1989).

26.Bustos等(1989)Plant Gell 1:839-853

27.Byrne等Plant Cell Tissue and Organ Culture,8:3(1987).

28.Callis等,Genes and Develop.,1:1183(1987).

29.Campbell和Gowri,Plant Physiol.,92:1(1990).

30.Campbell编辑Ivermectin and Abamectin,Springer-Verlag, New York,(1989).

31.Chee等,Plant Physiol.,91:1212(1989).

32.Chen等,(1988)EMBO J.,6:3559-3564

33.Chen和Winans,J.Bacteriol.173:1139-1144(1991).

34.Christou等,Proc.Natl.Acad.Sci USA,86:7500(1989).

35.Christou等,Biotechnology,9:957(1991).

36.Christou等,Plant Physiol.,87:671(1988).

37.Christou等(1995),Annals of Botany 75:407-413

38.Chui等,Curr Biol 6:325-330(1996).

39.Coe等,在:Corn and Corn Improvement,Sprague等(编者)第 81-258页(1988).

40.Corpet等,Nucleic Acids Res.,16:10881(1988).

41.Coxson等,Biotropica,24:121(1992).

42.Crameri等,Nature Biotech.,15:436(1997).

43.Crameri等,Nature,391:288(1998).

44.Crossway等,BioTechniques,4:320-334(1986).

45.Cuozzo等,Bio/Technology,6:549(1988).

46.Cutler等,J.Plant Physiol.,135:351(1989).

47.Czapla和Lang,J.Econ.Entomol.,83:2480(1990).

48.Dale EC和Ow DW(1991)Proc Natl Acad Sci USA 88:10558-10562

49.Datta等,Bio/Technology,8:736-740(1990).

50.Davies等,Plant Physiol.,93:588(1990).

51.Dayhoff等,Atlas of Protein Sequence and Structure,Natl. Biomed.Res.Found.,Washington,C.D.(1978).

52.De Blaere等,Meth.Enzymol.,143:277(1987).

53.De Block等,Plant Physiol.,91:694(1989).

54.De Block等,EMBO Journal,6:2513(1987).

55.Deblaere等,Nucl Acids Res 13:4777-4788(1985)

56.Della-Cioppa等,Bio/Technology 5:579-584(1987)

57.Della-Cioppa等,Plant Physiology,84:965-968(1987).

58.Dellaporta等,在Chromosome Structure and Function,Plenum Press,263-282(1988).

59.Depicker等,Plant Cell Reports,7:63(1988).

60.DiRita和Gelvin(1987)Mol.Gen.Genet.207:233-4

61.Dunn等,Can.J.Plant Sci.,61:583(1981).

62.Dure等,Plant Mol.Biol.,12:475(1989).

63.Ebinuma等,Proc Natl Acad Sci USA 94:2117-2121(2000a).

64.Ebinuma等,Selection of Marker-free transgenic plants using the oncogenes(ipt,rol A,B,C)of Agrobacterium as selectable markers,在 Molecular Biology  of Woody Plants中,Kluwer Academic Publishers (2000b).

65.Eichholtz等,Somatic Cell and Molecular Genetics 13,67-76 (1987).

66.Ellis等,EMBO Journal,6:3203(1987).

67.Ellis等,(1984)Mol.Gen.Genet.195:466-73

68.Elroy-Stein等,Proc.Natl.Acad.Sci.U.S.A.,86:6126(1989).

69.English等,Plant Cell,8:179(1996).

70.Erdmann等,J.Gen.Microbiol.,138:363(1992).

71.Erikson等Nat Biotechnol.22(4):455-8(2004).

72.Everett等,Bio/Technology,5:1201(1987).

73.Fedoroff和Smith,Plant J 3:273-289(1993).

74.Fire等,Nature 391:806-811(1998).

75.Fitzpatrick,Gen.Engineering News,22:7(1993).

76.Fox等(1992)Plant Mol.Biol.20:219-33

77.Fraley等,Proc Natl Acad Sci USA 80:4803(1983)

78.Fromm等,Bio/Technology,8:833-839(1990).

79.Fromm等,Nature(London),319:791(1986).

80.Galbiati等,Funct.Integr Genozides,201:25-34(2000).

81.Gallie等,Nucl Acids Res 15:8693-8711(1987).

82.Gallie等,Nucleic Acids Res.,15:3257(1987).

83.Gallie等,The Plant Cell,1:301(1989).

84.Gan等,Science,270:1986(1995).

85.Gatehouse等,J.Sci.Food Agric.,35:373(1984).

86.Gelfand编者,PCR Strategies Academic Press,New York(1995).

87.Gelvin等,Plant Molecular Biology Manual,(1990).

88.Gleave等,Plant Mol Biol.40(2):223-35(1999)

89.Gordon-Kamm等,Plant Cell,2:603(1990).

90.Goring等,PNAS,88:1770(1991).

91.Gruber等,Vectors for Plant Transformation,in:Methods in Plant Molecular Biology & Biotechnology″在Glich等(编者)第89-119页, CRC Press,1993).

92.Guerineau等,Mol.Gen.Genet.,262:141(1991).

93.Guerrero等,Plant Mol.Biol.,15:11(1990).

94.Guevara-Garcia等,(1993)Plant J.4:495-505.

95.Gupta等,PNAS,90:1629(1993).

96.Haines和Higgins(编者),Nucleic Acid Hybridization,IRL Press, Oxford,U.K.

97.Hajdukiewicz等,Plant Mol Biol 25:989-994(1994).

98.Hammock等,Nature,344:458(1990).

99.Hansen等Proc.Natl.Acad.Sci.USA 91:7603-7607(1994).

100.Hare P & Chua NH(2002)Nat.Biotechnol.20,575-580

101.Harpster等,(1988)Mol.Gen.Genet.212:182-90

102.Hayford等Plant Physiol.86:1216(1988)

103.Hemenway等,EMBO Journal,7:1273(1988).

104.Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA,89:10915 (1989).

105.Hiei等Plant J 6:271-282(1994)

106.Higgins等,Gene,73:237(1988).

107.Higo等(1999)Nucl Acids Res 27(1):297-300

108.Hilder等,Nature,330:160(1987).

109.Hille等Plant Mol.Biol.7:171(1986)

110.Hinchee等Bio/Technology 6:915(1988).

111.Hoekema等Nature 303:179-181(1983).

112.Hoekema,在:The Binary Plant Vector System.Offset-drukkerij Kanters B.V.;Alblasserdam(1985).

113.Hood等J Bacteriol 168:1291-1301(1986).

114.Huang等,CABIOS,8:155(1992).

115.Ikeda等,J.Bacteriol.,169:5612(1987).

116.Ikuta等,Biotech.,8:241(1990).

117.Ingelbrecht等,Plant Cell,1:671(1989).

118.Innis和Gelfand编者,PCR Methods Manual(Academic Press, New York)(1999).

119.Innis等编辑,PCR Protocols:A Guide to Method and Applications(Academic Press,New York(1995).

120.Innis等,PCR Protocols:A Guide to Methods and Applications, Academic Press,Inc.,San Diego,Calif.(1990).

121.Ishida等Nature Biotech 745-750(1996).

122.Jefferson等EMBO J 6:3901-3907(1987).

123.Jefferson等,Plant Mol Biol Rep 5:387-405(1987).

124.Jenes等,Techniques for Gene Transfer,in:Recombinant Plants, 第1卷,Engineering and Utilization,SD Kung和R Wu编辑,Academic Press,第128-143页(1993)

125.Jobling等,Nature,325:622(1987).

126.Johnson等,PNAS USA,86:9871(1989).

127.Jones等Mol.Gen.Genet.,210:86(1987).

128.Joshi等,Nucleic Acid Res.,15:9627(1987).

129.Kaasen等,J.Bacteriol.,174:889(1992).

130.Karlin和Altschul,Proc.Natl.Acad Sci.USA,87:2264(1990).

131.Karlin和Altschul,Proc.Natl.Acad.Sci.USA,90:5873(1993).

132.Karsten等,Botanica Marina,35:11(1992).

133.Kasuga等,(1999)Nature Biotechnology 17(3):287-291

134.Katz等,J.Gen.Microbiol.,129:2703(1983).

135.Keller等,EMBO Journal,8:1309(1989).

136.Keller等,Genes Dev.,3:1639(1989)

137.Kilby NJ等(1995),Plant J 8:637-652

138.Klapwijk等,J.Bacteriol.,141,128-136(1980).

139.Klein等,Bio/Technoloy,6:559-563(1988).

140.Klein等,Plant Physiol.,91:440-444(1988).

141.Klein等,Proc.Natl.Acad.Sci.USA,85:4305-4309(1988).

142.Knauf等,Genetic Analysis of Host Range Expression by Agrobacterium,在:Molecular Genetics of the Bacteria-Plant Interaction, Puhler,A编辑,Springer-Verlag,New York,1983.

143.Komro等,(1985)Plant Mol.Biol.4:253-63

144.Koncz和Schell Mol Gen Genet 204:383-396(1986).

145.Kononowicz等,(1992)Plant Cell 4:17-27

146.Koprek等Plant J 19(6):719-726(1999).

147.Koster和Leopold,Plant Physiol.,88:829(1988).

148.Koziel等,Biotechnology,11:194(1993).

149.Kridl等,(1991)Seed Sci.Res.,1:209-219

150.Kuiper HA等(2001)Plant J.27,503-528

151.Kunkel等,Methods in Enzymol.,154:367(1987).

152.Kunkel,Proc.Natl.Acad.Sci.USA,82:488(1985).

153.Lam和Chua,J Biol Chem;266(26):17131-17135(1991).

154.Langridge等,(1989)Proc.Nat′l Acad.Sci 86:7890-94

155.Laufs等,PNAS,87:7752(1990).

156.Lawton等,Mol.Cell Biol.,7:335(1987).

157.Lee和Saier,J.Bacteriol.,153(1982).

158.Leffel等Biotechniques 23(5):912-8(1997).

159.Lescot等Nucleic Acids Res 30(1):325-7(2002).

160.Leung等,(1991)Mol.Gen.Genet.230:463-74

161.Levings,Science,250:942(1990).

162.Li等,Plant Mol Biol 20:1037-1048(1992).

163.Li等(1993)Plant Cell Reports 12:250-255

164.Lindsey等,Transgenic Research,2:3347(1993).

165.Liu等,Plant J.8,457-463(1995)

166.Lommel等,Virology,181:382(1991).

167.Loomis等,J.Expt.Zool.,252:9(1989).

168.Lorz等,Mol.Gen.Genet.,199:178(1985).

169.Lyznik LA等(1996)Nucleic Acids Res 24:3784-3789

170.Ma等,Nature,334:631(1988).

171.Macejak等,Nature,353:90(1991).

172.Maki等,Methods in Plant Mol.Biol.& Biotechnol,Glich等, 67-88 CRC Press,(1993).

173.Maniatis等,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY),(1989).

174.Mariani等,Nature,347:737(1990).

175.Matzke等(2000)Plant Mol Biol 43:401-415(2000).

176.McBride等,PNAS USA,91:7301(1994).

177.McCabe等,Bio/Technology,6:923(1988).

178.Meinkoth和Wahl,Anal.Biochem.,138:267(1984).

179.Messing和Vierra,Gene,19:259(1982).

180.Michael等,J.Mol.Biol.,26:585(1990)

181.Millar等Plant Mol Biol Rep 10:324-414(1992).

182.Mogen等,Plant Cell,2:1261(1990).

183.Moore等,J.Mol.Biol.,272:336(1997).

184.Mozo和Hooykaas,Plant Mol.Biol.16:917-918(1991).

185.Mundy和Chua,EMBO J.,7:2279(1988).

186.Munroe等,Gene,91:151(1990).

187.Murakami等,Mol.Gen.Genet.,205:42(1986).

188.Murata等,FEBS Lett.,296:187(1992).

189.Murdock等,Phytochemistry,29:85(1990).

190.Murray等,Nucleic Acids Res.,17:477(1989).

191.Myers和Miller,CABIOS,4:11(1988).

192.Naested,Plant J 18:571-576(1999).

193.Napoli等,Plant Cell,2:279(1990).

194.Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970).

195.Nehra等,Plant J.5:285-297(1994)

196.Ni M等(1995)Plant J 7(4):661-676

197.Niedz等,Plant Cell Reports,14:403(1995).

198.Odell等,Mol.Gen.Genet.,113:369(1990).

199.Odell等,Nature,313:810(1985).

200.Ohtsuka等,J.Biol.Chem.,260:2605(1985).

201.Olhoft等Plant Cell Rep 20:706-711(2001).

202.Onouchi H等(1995)Mol Gen Genet 247:653-660

203.Osborne BI等(1995)Plant J.7:687-701

204.Osjoda等(1996)Nature Biotechnology 14:745-750

205.Ow等,Science,234:856(1986).

206.Ow DW和Medberry SL(1995)Crit Rev in Plant Sci 14:239-261

207.Pacciotti等,Bio/Technology,3:241(1985).

208.Park等,J.Plant Biol.,38:365(1985).

209.Paszkowski等,EMBO J.,3:2717-2722(1984).

210.Pearson和Lipman,Proc.Natl.Acad.Sci.,85:2444(1988).

211.Pearson等,Meth.Mol.Biol.,24:307(1994).

212.Perera等Plant Mol.Biol 23(4):793-799(1993).

213.Perlak等,Proc.Natl.Acad.Sci.USA,88:3324(1991).

214.Phillips等,在Corn & Corn Improvement,第3版10 Sprague 等(编者)第345-387页(1988).

215.Phi-Van等,Mol.Cell.Biol.,10:2302(1990).

216.Piatkowski等,Plant Physiol.,94:1682(1990).

217.Potrykus等,Mol.Gen.Genet.,199:183(1985).

218.Potrykus,Trends Biotech.,7:269(1989).

219.Prasher等,Biochem.Biophys.Res.Comm.,126:1259(1985).

220.Proudfoot,Cell,64:671(1991).

221.Reed等,J.Gen.Microbiol.,130:1(1984).

222.Riggs等,Proc.Natl.Acad.Sci.USA,83:5602-5606(1986).

223.Rossolini等,Mol.Cell.Probes,8:91(1994).

224.Ruiz,Plant Cell,10:937(1998).

225.Russeu SH等(1992)Mol Gene Genet 234:49-59

226.Saito等,(1991)Planta 184:40-46

227.Sambrook等,Molecular Cloning:A Laboratory Manual(第二版, Cold Spring Harbor Laboratory Press,Plainview,N.Y.)(1989).

228.Sanfacon等,Genes Dev.,5:141(1991).

229.Sanford等,Particulate Science and Technology,5:27(1987).

230.Sanger等,(1990)Plant Mol.Biol.14:433-43

231.Scheeren-Groot等,J.Bacteriol 176:6418-6426(1994).

232.Schenborn和Groskreutz,Mol Biotechnol 13(1):29-44(1999).

233.Schlaman和Hooykaas,Plant J 11:1377-1385(1997).

234.Schoffl等Mol Gen Genetics 217(2-3):246-53(1989).

235.Shagan等,Plant Physiol.,101:1397(1993).

236.Shah等Science 233:478(1986).

237.Shapiro,Mobile Genetic Elements,Academic Press,N.Y.(1983).

238.Shimamoto等,Nature,338:274(1989).

239.Silhavy等,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(NY),(1984).

240.Skuzeski等,Plant Molec.Biol.15:65-79(1990).

241.Smith等,Adv.Appl.Math.,2:482.(1981).

242.Smith等,Mol.Gen.Genet.,224:447(1990).

243.Spencer等,Theor.Appl.Genet,79:625(1990).

244.Stalker等,Science,242:419(1988).

245.Staub等,EMBO J.,12:601(1993).

246.Staub等,Plant Cell,4:39(1992).

247.Steifel等,The Plant Cell,2:785(1990).

248.Stemmer,Nature,370:389(1994).

249.Stemmer,Proc.Natl.Acad.Sci.USA,91:10747(1994).

250.Stief等,Nature,341:343(1989).

251.Stougaard,Plant J 3:755-761(1993)

252.Sugita Ket等(2000)Plant J.22:461-469

253.Sukhapinda等,Plant Mol.Biol.,8:209(1987).

254.Sundaresan等Gene Develop 9:1797-1810(1995).

255.Sutcliffe,PNAS USA,75:3737(1978).

256.Svab等,Plant Mol.Biol.14:197(1990).

257.Svab等,Proc.Natl.Acad.Sci.USA,87:8526(1990).

258.Svab等,Proc.Natl.Acad.Sci.USA,90:913(1993).

259.Tarczynski等,PNAS USA,89:2600(1992).

260.Teeri等,(1989)EMBO J.,8:343-50

261.Thillet等,J.Biol.Chem.,263:12500(1988).

262.Tijssen,Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,Elsevier,N.Y.(1993).

263.Tomes等,Plant Cell,Tissue and Organ Culture:Fundamental Methods,Springer Verlag,Berlin(1995).

264.Tomic等,NAR,12:1656(1990).

265.Thompson等,NAR 22(22):4673-4680(1994).

266.Turner等,Molecular Biotechnology,3:225(1995).

267.Twell等,Plant Physiol.,91:1270(1989).

268.Ugaki等,Nucl.Acids Res.,19:371(1991).

269.Ulmasov等,Plant Mol.Biol.,35:417(1997).

270.Upender等,Biotechniques,18:29(1995).

271.van der Krol等,Plant Cell,2:291(1990).

272.Vanden Elzen等Plant Mol Biol.5:299(1985).

273.Vasil等Bio/Technology,10:667-674(1992).

274.Vasil等Bio/Technology,11:1153-1158(1993).

275.Vasil等,Mol.Microbiol.,3:371(1989).

276.Vasil等,Plant Physiol.,91:1575(1989).

277.Vernon和Bohnert,EMBO J.,11:2077(1992).

278.Walker和Gaastra编者,Techniques in Molecular Biology, MacMillan Publishing Company,New York(1983).

279.Wan和Lemaux Plant Physiol.,104:3748(1994).

280.Wang等,Mol.Cell.Biol.,12:3399(1992).

281.Waterman,Introduction to Computational Biology:Maps, sequences and genomes.Chapman & Hall.London(1995).

282.Watrud等,在Engineered Organisms and the Environment (1985).

283.Watson等J.Bacteriol 123,255-264(1975)

284.Watson等,Corn:Chemistry and Technology(1987).

285.Weeks等Plant Physiol 102:1077-1084(1993)

286.Weissinger等,Annual Rev.Genet.,22:421(1988).

287.White等,Nucl Acids Res,18,1062(1990).

288.Wingender等,Nucleic Acids Res 29(1):281-3(2001).

289.Wolter等,EMBO Journal,11:4685(1992).

290.Wyn-Jones和Storey,Physiology and Biochemistry of Drought Resistance in Plants,Paleg等(编者),第171-204页(1981).

291.Yamaguchi-Shinozaki等,Plant Cell Physiol.,33:217(1992).

292.Zhang等,Proc.Natl.Acad.Sci.USA,94:4504(1997).

293.Zubko等(2000)Nature Biotech 18(4):442-445

294.Zukowsky等,PNAS USA,80:1101(1983).

全部出版物、专利和专利申请在本文中引用作为参考。尽管在以上说 明书中,本发明已经就其中某些优选的实施方案进行了描述,并且众多细 节已经为说明目的而描述,对于本领域中技术人员而言显而易见的是本发 明容易变成其它实施方案并且本文中所述的某些细节可以做明显变化而不 脱离本发明的基本精神。

序列表

<110>巴斯福植物科学有限公司

<120>单子叶植物中的淀粉胚乳特异性和/或萌芽胚特异性表达

<130>AE20050152/PF 56540 US

<160>65

<170>PatentIn版本3.3

<210>1

<211>219

<212>DNA

<213>根癌农杆菌(Agrobacterium tumefaciens)

<220>

<221>misc_feature

<222>(1)..(219)

<223>衍生自根癌农杆菌章鱼碱合酶基因的上游激活序列

<400>1

ggatccctga aagcgacgtt ggatgttaac atctacaaat tgccttttct tatcgaccat     60

gtacgtaagc gcttacgttt ttggtggacc cttgaggaaa ctggtagctg ttgtgggcct    120

gtggtctcaa gatggatcat taatttccac cttcacctac gatggggggc atcgcaccgg    180

tgagtaatat tgtacggcta agagcgaatt tggcctgta                           219

<210>2

<211>387

<212>DNA

<213>根癌农杆菌

<220>

<221>启动子

<222>(1)..(387)

<223>衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列

<400>2

gagatttttc aaatcagtgc gcaagacgtg acgtaagtat ccgagtcagt ttttattttt    60

ctactaattt ggtcgtttat ttcggcgtgt aggacatggc aaccgggcct gaatttcgcg    120

ggtattctgt ttctattcca actttttctt gatccgcagc cattaacgac ttttgaatag    180

atacgctgac acgccaagcc tcgctagtca aaagtgtacc aaacaacgct ttacagcaag    240

aacggaatgc gcgtgacgct cgcggtgacg ccatttcgcc ttttcagaaa tggataaata    300

gccttgcttc ctattatatc ttcccaaatt accaatacat tacactagca tctgaatttc    360

ataaccaatc tcgatacacc aaatcga                                        387

<210>3

<211>455

<212>DNA

<213>人工的

<220>

<223>包含衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列的人工构建 体

<220>

<221>misc_feature

<222>(1)..(18)

<223>包含BamH1位点的填充片段

<220>

<221>misc_feature

<222>(19)..(68)

<223>填充片段(部分甘露氨酸合酶cDNA)

<220>

<221>启动子

<222>(69)..(455)

<223>衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列

<400>3

ggatccgcga gctggtcaat cccattgctt ttgaagcagc tcaacattga tctctttctc     60

gatcgaggga gatttttcaa atcagtgcgc aagacgtgac gtaagtatcc gagtcagttt    120

ttatttttct actaatttgg tcgtttattt cggcgtgtag gacatggcaa ccgggcctga    180

atttcgcggg tattctgttt ctattccaac tttttcttga tccgcagcca ttaacgactt    240

ttgaatagat acgctgacac gccaagcctc gctagtcaaa agtgtaccaa acaacgcttt    300

acagcaagaa cggaatgcgc gtgacgctcg cggtgacgcc atttcgcctt ttcagaaatg    360

gataaatagc cttgcttcct attatatctt cccaaattac caatacatta cactagcatc    420

tgaatttcat aaccaatctc gatacaccaa atcga                               455

<210>4

<211>1112

<212>DNA

<213>人工的

<220>

<223>超级启动子(嵌合的转录调节性序列,包含有效连接至来自根癌农杆菌甘露氨酸合酶 的转录调节核苷酸序列的来自根癌农杆菌章鱼碱合酶基因的3个上游激活序列

<220>

<221>misc_feature

<222>(1)..(219)

<223>衍生自根癌农杆菌章鱼碱合酶基因的第1个上游激活序列

<220>

<221>misc_feature

<222>(220)..(438)

<223>衍生自根癌农杆菌章鱼碱合酶基因的第2个上游激活序列

<220>

<221>misc_feature

<222>(439)..(657)

<223>衍生自根癌农杆菌章鱼碱合酶基因的第3个上游激活序列

<220>

<221>misc_feature

<222>(658)..(675)

<223>包含BamH1位点的填充片段

<220>

<221>misc_feature

<222>(676)..(725)

<223>包含部分甘露氨酸合酶cDNA的填充片段

<220>

<221>启动子

<222>(726)..(1112)

<223>衍生自根癌农杆菌甘露氨酸合酶基因启动子的转录调节核苷酸序列

<400>4

ggatccctga aagcgacgtt ggatgttaac atctacaaat tgccttttct tatcgaccat     60

gtacgtaagc gcttacgttt ttggtggacc cttgaggaaa ctggtagctg ttgtgggcct    120

gtggtctcaa gatggatcat taatttccac cttcacctac gatggggggc atcgcaccgg    180

tgagtaatat tgtacggcta agagcgaatt tggcctgtag gatccctgaa agcgacgttg    240

gatgttaaca tctacaaatt gccttttctt atcgaccatg tacgtaagcg cttacgtttt    300

tggtggaccc ttgaggaaac tggtagctgt tgtgggcctg tggtctcaag atggatcatt    360

aatttccacc ttcacctacg atggggggca tcgcaccggt gagtaatatt gtacggctaa    420

gagcgaattt ggcctgtagg atccctgaaa gcgacgttgg atgttaacat ctacaaattg    480

ccttttctta tcgaccatgt acgtaagcgc ttacgttttt ggtggaccct tgaggaaact    540

ggtagctgtt gtgggcctgt ggtctcaaga tggatcatta atttccacct tcacctacga    600

tggggggcat cgcaccggtg agtaatattg tacggctaag agcgaatttg gcctgtagga    660

tccgcgagct ggtcaatccc attgcttttg aagcagctca acattgatct ctttctcgat    720

cgagggagat ttttcaaatc agtgcgcaag acgtgacgta agtatccgag tcagttttta    780

tttttctact aatttggtcg tttatttcgg cgtgtaggac atggcaaccg ggcctgaatt    840

tcgcgggtat tctgtttcta ttccaacttt ttcttgatcc gcagccatta acgacttttg    900

aatagatacg ctgacacgcc aagcctcgct agtcaaaagt gtaccaaaca acgctttaca    960

gcaagaacgg aatgcgcgtg acgctcgcgg tgacgccatt tcgccttttc agaaatggat   1020

aaatagcctt gcttcctatt atatcttccc aaattaccaa tacattacac tagcatctga   1080

atttcataac caatctcgat acaccaaatc ga                                 1112

<210>5

<211>916

<212>DNA

<213>小立碗藓(Physcomitrella patens)

<220>

<221>CDS

<222>(40)..(816)

<223>编码小立碗藓14-3-3蛋白质(gb AX281102)

<400>5

atcccgggcg gactgtcgtg gacgatgtgc taggccaag atg agt acg gag aag     54

                                           Met Ser Thr Glu Lys

                                           1               5

gag cgc gag agc tat gtg tac atg gcc aag ctc gcc gag cag gcg gag    102

Glu Arg Glu Ser Tyr Val Tyr Met Ala Lys Leu Ala Glu Gln Ala Glu

                10                  15                  20

cgt tac gat gag atg gtg gaa tcg atg aag aag gtt gcc aag ctt gat    150

Arg Tyr Asp Glu Met Val Glu Ser Met Lys Lys Val Ala Lys Leu Asp

            25                  30                  35

gtg gag ctg aca gta gag gag cga aat ctc ttg tcc gtg ggt tat aag    198

Val Glu Leu Thr Val Glu Glu Arg Asn Leu Leu Ser Val Gly Tyr Lys

        40                  45                  50

aat gtc atc gga gcc cgg agg gcg tca tgg cgg atc atg tca tcc atc    246

Asn Val Ile Gly Ala Arg Arg Ala Ser Trp Arg Ile Met Ser Ser Ile

    55                  60                  65

gaa cag aag gag gag agc aaa ggt aac gaa cag aat gtt aaa cgc atc    294

Glu Gln Lys Glu Glu Ser Lys Gly Asn Glu Gln Asn Val Lys Arg Ile

70                  75                  80                  85

aag gac tac aga cac aag gtg gag gag gag ctg tcg aag atc tgc aat    342

Lys Asp Tyr Arg His Lys Val Glu Glu Glu Leu Ser Lys Ile Cys Asn

                90                  95                  100

gat atc ctg tct atc atc gac gga cac ctg att ccg tcg tcc agc acg    390

Asp Ile Leu Ser Ile Ile Asp Gly His Leu Ile Pro Ser Ser Ser Thr

            105                 110                 115

gga gag tcc act gtg ttc tac tat aaa atg aag gga gat tac tat cgg    438

Gly Glu Ser Thr Val Phe Tyr Tyr Lys Met Lys Gly Asp Tyr Tyr Arg

        120                 125                 130

tac ctg gcg gag ttc aag acc ggg aat gag agg aaa gag gcc gct gac    486

Tyr Leu Ala Glu Phe Lys Thr Gly Asn Glu Arg Lys Glu Ala Ala Asp

    135                 140                 145

caa tct ttg aag gca tac cag gct gca tcc agc act gca gtg acg gac    534

Gln Ser Leu Lys Ala Tyr Gln Ala Ala Ser Ser Thr Ala Val Thr Asp

150                 155                 160                 165

ctg gca ccg acg cat cct atc cga ctg gga tta gct ttg aac ttc tcg    582

Leu Ala Pro Thr His Pro Ile Arg Leu Gly Leu Ala Leu Asn Phe Ser

                170                 175                 180

gtc ttt tat tat gaa att ttg aac tct cct gag agg gca tgc cat ttg    630

Val Phe Tyr Tyr Glu Ile Leu Asn Ser Pro Glu Arg Ala Cys His Leu

            185                 190                 195

gcg aaa caa gca ttt gac gag gcg att gct gag ttg gat acg tta agt    678

Ala Lys Gln Ala Phe Asp Glu Ala Ile Ala Glu Leu Asp Thr Leu Ser

        200                 205                 210

gag gag tcg tac aag gac agc aca ttg atc atg cag cta ctt aga gat    726

Glu Glu Ser Tyr Lys Asp Ser Thr Leu Ile Met Gln Leu Leu Arg Asp

    215                 220                 225

aat ctg acc ctg tgg aca tct gac ctt cag gac gag gga ggt gac gac    774

Asn Leu Thr Leu Trp Thr Ser Asp Leu Gln Asp Glu Gly Gly Asp Asp

230                 235                 240                 245

cag gga aag gga gat gat atg agg ccc gag gag gct gag tga            816

Gln Gly Lys Gly Asp Asp Met Arg Pro Glu Glu Ala Glu

                250                 255

tgacgattag gtcttttatg tggagacgaa tttgcaaatc acttcactca attggtggtg  876

ggccggggca agaagatgtg cagttgcgtg ccgagctcgc                        916

<210>6

<211>258

<212>PRT

<213>小立碗藓

<400>6

Met Ser Thr Glu Lys Glu Arg Glu Ser Tyr Val Tyr Met Ala Lys Leu

1               5                   10                  15

Ala Glu Gln Ala Glu Arg Tyr Asp Glu Met Val Glu Ser Met Lys Lys

            20                  25                  30

Val Ala Lys Leu Asp Val Glu Leu Thr Val Glu Glu Arg Asn Leu Leu

        35                  40                  45

Ser Val Gly Tyr Lys Asn Val Ile Gly Ala Arg Arg Ala Ser Trp Arg

    50                  55                  60

Ile Met Ser Ser Ile Glu Gln Lys Glu Glu Ser Lys Gly Asn Glu Gln

65                  70                  75                  80

Asn Val Lys Arg Ile Lys Asp Tyr Arg His Lys Val Glu Glu Glu Leu

                85                  90                  95

Ser Lys Ile Cys Asn Asp Ile Leu Ser Ile Ile Asp Gly His Leu Ile

        100                     105                 110

Pro Ser Ser Ser Thr Gly Glu Ser Thr Val Phe Tyr Tyr Lys Met Lys

        115                 120                 125

Gly Asp Tyr Tyr Arg Tyr Leu Ala Glu Phe Lys Thr Gly Asn Glu Arg

    130                 135                 140

Lys Glu Ala Ala Asp Gln Ser Leu Lys Ala Tyr Gln Ala Ala Ser Ser

145                 150                 155                 160

Thr Ala Val Thr Asp Leu Ala Pro Thr His Pro Ile Arg Leu Gly Leu

                165                 170                 175

Ala Leu Asn Phe Ser Val Phe Tyr Tyr Glu Ile Leu Asn Ser Pro Glu

            180                 185                 190

Arg Ala Cys His Leu Ala Lys Gln Ala Phe Asp Glu Ala Ile Ala Glu

        195                 200                 205

Leu Asp Thr Leu Ser Glu Glu Ser Tyr Lys Asp Ser Thr Leu Ile Met

    210                 215                 220

Gln Leu Leu Arg Asp Asn Leu Thr Leu Trp Thr Ser Asp Leu Gln Asp

225                 230                 235                 240

Glu Gly Gly Asp Asp Gln Gly Lys Gly Asp Asp Met Arg Pro Glu Glu

                245                 250                 255

Ala Glu

<210>7

<211>2139

<212>DNA

<213>小立碗藓

<220>

<221>CDS

<222>(123)..(2009)

<223>编码小立碗藓磷酸肌醇特异性磷脂酶C(gb AX281101)

<400>7

atcccgggct tcgggagttt aagaggatgt cacggcgtgg gaagacgagg cggtgatgca     60

ggtttgggtg gagcttaagg ttgacggagt gtaagggatc ggctcgtcac tgggtttgca    120

aa atg tgt tcc ata gca tgt tgt cga agt gga acc ccg aaa ggg gat       167

    Met Cys Ser Ile Ala Cys Cys Arg Ser Gly Thr Pro Lys Gly Asp

    1               5                   10                  15

ccg gag caa gac ctg gtg ggg gag gtg ttc aca ata tac agc gag aat      215

Pro Glu Gln Asp Leu Val Gly Glu Val Phe Thr Ile Tyr Ser Glu Asn

                20                  25                  30

gag agg atg agt gcg gag ggg ttg ctg aaa ttc ttg cat aca gag caa      263

Glu Arg Met Ser Ala Glu Gly Leu Leu Lys Phe Leu His Thr Glu Gln

            35                  40                  45

ggg gat gtc gac ttc acc ctt gat gac gcc aag cag atc atg gag cgc      311

Gly Asp Val Asp Phe Thr Leu Asp Asp Ala Lys Gln Ile Met Glu Arg

        50                  55                  60

att cgc aag gac tgg aag aaa tcc ttc gga ctc gcc tct atc aac tca      359

Ile Arg Lys Asp Trp Lys Lys Ser Phe Gly Leu Ala Ser Ile Asn Ser

    65                  70                  75

gac ttg tcg aag gag gct ttt cgg aag tac ttg atg aat ccc gac ttg      407

Asp Leu Ser Lys Glu Ala Phe Arg Lys Tyr Leu Met Asn Pro Asp Leu

80                  85                  90                  95

aat ggc gtc tta cac aac gtt gtt cac caa gac atg acg cag ccg atg      455

Asn Gly Val Leu His Asn Val Val His Gln Asp Met Thr Gln Pro Met

                100                 105                 110

tcg cac tat ttc ata ttc acg ggc cat aac tcg tac ctg acc ggc aac      503

Ser His Tyr Phe Ile Phe Thr Gly His Asn Ser Tyr Leu Thr Gly Asn

            115                 120                 125

cag ctg agc agc gac agc agc gac aca ccc atc gct gcg gca ctg cgg      551

Gln Leu Ser Ser Asp Ser Ser Asp Thr Pro Ile Ala Ala Ala Leu Arg

        130                 135                 140

cgc ggc gtg cgg gtt gtg gaa ttg gac ttg tgg cct gat gac aaa ggc      599

Arg Gly Val Arg Val Val Glu Leu Asp Leu Trp Pro Asp Asp Lys Gly

    145                 150                 155

ggc atg aag gtc aca cac gga aac aca ctt acc aat ccg gtg tcg ttc      647

Gly Met Lys Val Thr His Gly Asn Thr Leu Thr Asn Pro Val Ser Phe

160                 165                 170                 175

caa aag tgt gtc aca gcc atc aag aat aac gcc ttc ttc acc tcg gag    695

Gln Lys Cys Val Thr Ala Ile Lys Asn Asn Ala Phe Phe Thr Ser Glu

                180                 185                 190

tac cca gtt tgc gtt act att gag gat cat ctt aca agc gaa tta cag    743

Tyr Pro Val Cys Val Thr Ile Glu Asp His Leu Thr Ser Glu Leu Gln

            195                 200                 205

ggc cat gct gca gag att tta gag caa att ctc gga gac gcc ctg tat    791

Gly His Ala Ala Glu Ile Leu Glu Gln Ile Leu Gly Asp Ala Leu Tyr

        210                 215                 220

tat cca ccc aca act gat gca tta gtg gag ttt cct tca ccg gag tca    839

Tyr Pro Pro Thr Thr Asp Ala Leu Val Glu Phe Pro Ser Pro Glu Ser

    225                 230                 235

ctg aag agg aag atc ata atc tcc acc aaa ccg ccg aag gag tat ctc    887

Leu Lys Arg Lys Ile Ile Ile Ser Thr Lys Pro Pro Lys Glu Tyr Leu

240                 245                 250                 255

gaa gca tgt tcc acg cag aaa ttg gcc atg gag aac agg aat ctg gtg    935

Glu Ala Cys Ser Thr Gln Lys Leu Ala Met Glu Asn Arg Asn Leu Val

                260                 265                 270

gag gag ctt gag aag gaa gac aaa ttg gag cag acc aca ttc gct ccc    983

Glu Glu Leu Glu Lys Glu Asp Lys Leu Glu Gln Thr Thr Phe Ala Pro

            275                 280                 285

ctt gaa gag aac cac atc ctg gga gaa aat aca cca tcg ctg cgt aag   1031

Leu Glu Glu Asn His Ile Leu Gly Glu Asn Thr Pro Ser Leu Arg Lys

        290                 295                 300

gaa gtc gag gtt tta agc caa aag gaa atg tca aca cca gct gag ctt   1079

Glu Val Glu Val Leu Ser Gln Lys Glu Met Ser Thr Pro Ala Glu Leu

    305                 310                 315

aac tct aga agt ccc tct gac ctc ggg gaa gca aca tcc aca agg tat   1127

Asn Ser Arg Ser Pro Ser Asp Leu Gly Glu Ala Thr Ser Thr Arg Tyr

320                 325                 330                 335

agc aag agc aac gat ggc aat gac aac cct aaa cat ttc aag tat gcc   1175

Ser Lys Ser Asn Asp Gly Asn Asp Asn Pro Lys His Phe Lys Tyr Ala

                340                345                 350

cgg ctc atc aca atc cgg cta gca aag cac gca aag ggg aca tcg atg   1223

Arg Leu Ile Thr Ile Arg Leu Ala Lys His Ala Lys Gly Thr Ser Met

            355                 360                 365

gag cat cga ctg caa gtc gat gaa tca gtg aaa cgg atc agt ctg tcg   1271

Glu His Arg Leu Gln Val Asp Glu Ser Val Lys Arg Ile Ser Leu Ser

        370                 375                 380

gaa tcg aag ctg gaa aaa gtg gtg gaa aag tgg ccc gaa gct ctg gtc    1319

Glu Ser Lys Leu Glu Lys Val Val Glu Lys Trp Pro Glu Ala Leu Val

    385                 390                 395

aaa ttc acg cag aag aac att tta cgt gtg tat cct gct gct aat cgt    1367

Lys Phe Thr Gln Lys Asn Ile Leu Arg Val Tyr Pro Ala Ala Asn Arg

400                 405                 410                 415

gta aac tcc tcc aac ttc tgc cct act ctg gct tgg aac tac gga gct    1415

Val Asn Ser Ser Asn Phe Cys Pro Thr Leu Ala Trp Asn Tyr Gly Ala

                420                 425                 430

caa atg gtg gct caa aac atg cag ggc tat ggt aaa gag ctt tgg cag    1463

Gln Met Val Ala Gln Asn Met Gln Gly Tyr Gly Lys Glu Leu Trp Gln

            435                 440                 445

gca ttt ggc aag ttc aag gga aat ggg gga tgt ggg tat gtt ttg aag    1511

Ala Phe Gly Lys Phe Lys Gly Asn Gly Gly Cys Gly Tyr Val Leu Lys

        450                 455                 460

cca cag tat ctg ttg gaa aac ttg cct tct ggt gtg cct ttc aac ccc    1559

Pro Gln Tyr Leu Leu Glu Asn Leu Pro Ser Gly Val Pro Phe Asn Pro

    465                 470                 475

aca tca ccc aga aac aca acc cta att ctc aag att aaa gtt atg act    1607

Thr Ser Pro Arg Asn Thr Thr Leu Ile Leu Lys Ile Lys Val Met Thr

480                 485                 490                 495

acc ttg gga tgg gac aag gcc ttt tcc aaa cgc cat ttt gac cta ttc    1655

Thr Leu Gly Trp Asp Lys Ala Phe Ser Lys Arg His Phe Asp Leu Phe

                500                 505                 510

tca cct cca gat ttc ttc act agg gtg att gtg gtg gga gtg cct gct    1703

Ser Pro Pro Asp Phe Phe Thr Arg Val Ile Val Val Gly Val Pro Ala

            515                 520                 525

gac gag gcc aag tgg aag aca tct gtg gtg gac aat tca tgg gca ccc    1751

Asp Glu Ala Lys Trp Lys Thr Ser Val Val Asp Asn Ser Trp Ala Pro

        530                 535                 540

cat tgg aat gag gac cat gag ttt gcc cta aaa tgc cct gag ctc gca    1799

His Trp Asn Glu Asp His Glu Phe Ala Leu Lys Cys Pro Glu Leu Ala

    545                 550                 555

cta ctt cgc atc gag gtc cga gac cat gat gat gat agc aaa gat gag    1847

Leu Leu Arg Ile Glu Val Arg Asp His Asp Asp Asp Ser Lys Asp Glu

560                 565                 570                 575

ttt gaa ggg cag aca tgc ctt ccc atc cat gaa gtc cgg gat ggg tat    1895

Phe Glu Gly Gln Thr Cys Leu Pro Ile His Glu Val Arg Asp Gly Tyr

                580                 585                 590

cgg tgc atg caa atg tac gac aag aag ggc aat gta ctg aaa ggc gtg    1943

Arg Cys Met Gln Met Tyr Asp Lys Lys Gly Asn Val Leu Lys Gly Val

            595                 600                 605

ctg atg ttg ttt cat ttt caa aag tgc aaa tgc acc ttt caa gac aca    1991

Leu Met Leu Phe His Phe Gln Lys Cys Lys Cys Thr Phe Gln Asp Thr

        610                 615                 620

gct cct ata tcc tct taa actcaacccg cccacacatg gccccattat           2039

Ala Pro Ile Ser Ser

    625

caattactaa tgctgctttt tatgttgcca ttgtcatata attgttggtt tgtggggggg  2099

aagactgacc agtttagtgt gtgcacccaa ggttaacgcc                        2139

<210>8

<211>628

<212>PRT

<213>小立碗藓

<400>8

Met Cys Ser Ile Ala Cys Cys Arg Ser Gly Thr Pro Lys Gly Asp Pro

1               5                   10                  15

Glu Gln Asp Leu Val Gly Glu Val Phe Thr Ile Tyr Ser Glu Asn Glu

            20                  25                  30

Arg Met Ser Ala Glu Gly Leu Leu Lys Phe Leu His Thr Glu Gln Gly

        35                  40                  45

Asp Val Asp Phe Thr Leu Asp Asp Ala Lys Gln Ile Met Glu Arg Ile

    50                  55                  60

Arg Lys Asp Trp Lys Lys Ser Phe Gly Leu Ala Ser Ile Asn Ser Asp

65                  70                  75                  80

Leu Ser Lys Glu Ala Phe Arg Lys Tyr Leu Met Asn Pro Asp Leu Asn

                85                  90                  95

Gly Val Leu His Asn Val Val His Gln Asp Met Thr Gln Pro Met Ser

            100                 105                 110

His Tyr Phe Ile Phe Thr Gly His Asn Ser Tyr Leu Thr Gly Asn Gln

        115                 120                 125

Leu Ser Ser Asp Ser Ser Asp Thr Pro Ile Ala Ala Ala Leu Arg Arg

    130                 135                 140

Gly Val Arg Val Val Glu Leu Asp Leu Trp Pro Asp Asp Lys Gly Gly

145                 150                 155                 160

Met Lys Val Thr His Gly Asn Thr Leu Thr Asn Pro Val Ser Phe Gln

                165                 170                 175

Lys Cys Val Thr Ala Ile Lys Asn Asn Ala Phe Phe Thr Ser Glu Tyr

            180                 185                 190

Pro Val Cys Val Thr Ile Glu Asp His Leu Thr Ser Glu Leu Gln Gly

        195                 200                 205

His Ala Ala Glu Ile Leu Glu Gln Ile Leu Gly Asp Ala Leu Tyr Tyr

    210                 215                 220

Pro Pro Thr Thr Asp Ala Leu Val Glu Phe Pro Ser Pro Glu Ser Leu

225                 230                 235                 240

Lys Arg Lys Ile Ile Ile Ser Thr Lys Pro Pro Lys Glu Tyr Leu Glu

                245                 250                 255

Ala Cys Ser Thr Gln Lys Leu Ala Met Glu Asn Arg Asn Leu Val Glu

            260                 265                 270

Glu Leu Glu Lys Glu Asp Lys Leu Glu Gln Thr Thr Phe Ala Pro Leu

        275                 280                 285

Glu Glu Asn His Ile Leu Gly Glu Asn Thr Pro Ser Leu Arg Lys Glu

    290                 295                 300

Val Glu Val Leu Ser Gln Lys Glu Met Ser Thr Pro Ala Glu Leu Asn

305                 310                 3l5                 320

Ser Arg Ser Pro Ser Asp Leu Gly Glu Ala Thr Ser Thr Arg Tyr Ser

                325                 330                 335

Lys Ser Asn Asp Gly Asn Asp Asn Pro Lys His Phe Lys Tyr Ala Arg

            340                 345                 350

Leu Ile Thr Ile Arg Leu Ala Lys His Ala Lys Gly Thr Ser Met Glu

        355                 360                 365

His Arg Leu Gln Val Asp Glu Ser Val Lys Arg Ile Ser Leu Ser Glu

    370                 375                 380

Ser Lys Leu Glu Lys Val Val Glu Lys Trp Pro Glu Ala Leu Val Lys

385                 390                 395                 400

Phe Thr Gln Lys Asn Ile Leu Arg Val Tyr Pro Ala Ala Asn Arg Val

                405                 410                 415

Asn Ser Ser Asn Phe Cys Pro Thr Leu Ala Trp Asn Tyr Gly Ala Gln

            420                 425                 430

Met Val Ala Gln Asn Met Gln Gly Tyr Gly Lys Glu Leu Trp Gln Ala

        435                 440                 445

Phe Gly Lys Phe Lys Gly Asn Gly Gly Cys Gly Tyr Val Leu Lys Pro

    450                 455                 460

Gln Tyr Leu Leu Glu Asn Leu Pro Ser Gly Val Pro Phe Asn Pro Thr

465                 470                 4754                 80

Ser Pro Arg Asn Thr Thr Leu Ile Leu Lys Ile Lys Val Met Thr Thr

                485                 490                 495

Leu Gly Trp Asp Lys Ala Phe Ser Lys Arg His Phe Asp Leu Phe Ser

            500                 505                 510

Pro Pro Asp Phe Phe Thr Arg Val Ile Val Val Gly Val Pro Ala Asp

        515                 520                 525

Glu Ala Lys Trp Lys Thr Ser Val Val Asp Asn Ser Trp Ala Pro His

    530                 535                 540

Trp Asn Glu Asp His Glu Phe Ala Leu Lys Cys Pro Glu Leu Ala Leu

545                 550                 555                 560

Leu Arg Ile Glu Val Arg Asp His Asp Asp Asp Ser Lys Asp Glu Phe

                565                 570                 575

Glu Gly Gln Thr Cys Leu Pro Ile His Glu Val Arg Asp Gly Tyr Arg

            580                 585                 590

Cys Met Gln Met Tyr Asp Lys Lys Gly Asn Val Leu Lys Gly Val Leu

        595                 600                 605

Met Leu Phe His Phe Gln Lys Cys Lys Cys Thr Phe Gln Asp Thr Ala

    610                 615                 620

Pro Ile Ser Ser

625

<210>9

<211>1554

<212>DNA

<213>拟南芥菜(Arabidopsis thaliana)

<220>

<221>CDS

<222>(127)..(1371)

<223>编码拟南芥菜推定的酪氨酸氨基转移酶(At5g53970)gb BT000782

<400>9

aaaatcaaaa ccttctcttc ttcttcttct tgcgagttgc accgaaacac tcaacaaaac     60

caaatcatcc aaattgggta aaacaaaaga aactaacaag aagaagatcg aattcaagaa    120

gaagag atg gag aat gga gca acg acg acg agc aca att acc atc aaa       168

    Met Glu Asn Gly Ala Thr Thr Thr Ser Thr Ile Thr Ile Lys

    1               5                   10

ggg att ctg agt ttg cta atg gaa agc atc aca aca gag gaa gat gaa      216

Gly Ile Leu Ser Leu Leu Met Glu Ser Ile Thr Thr Glu Glu Asp Glu

15                  20                  25                  30

gga gga aag aga gta ata tct ctg gga atg gga gac cca aca ctc tac      264

Gly Gly Lys Arg Val Ile Ser Leu Gly Met Gly Asp Pro Thr Leu Tyr

                35                  40                  45

tcg tgt ttt cgt aca aca caa gtc tct ctt caa gct gtt tct gat tct      312

Ser Cys Phe Arg Thr Thr Gln Val Ser Leu Gln Ala Val Ser Asp Ser

            50                  55                  60

ctt ctc tcc aac aag ttc cat ggt tac tct cat acc gtc ggt ctt ccc      360

Leu Leu Ser Asn Lys Phe His Gly Tyr Ser His Thr Val Gly Leu Pro

        65                  70                  75

caa gct cga agg gca ata gca gag tat cta tcg cgt gat ctt cca tac      408

Gln Ala Arg Arg Ala Ile Ala Glu Tyr Leu Ser Arg Asp Leu Pro Tyr

    80                  85                  90

aaa ctt tca cag gat gat gtg ttt atc aca tcg ggt tgc acg caa gcg      456

Lys Leu Ser Gln Asp Asp Val Phe Ile Thr Ser Gly Cys Thr Gln Ala

95                  100                 105                 110

atc gat gta gca ttg tcg atg tta gct cgt ccc agg gct aat ata ctt      504

Ile Asp Val Ala Leu Ser Met Leu Ala Arg Pro Arg Ala Asn Ile Leu

                115                 120                 125

ctt cca agg cct ggt ttc cca atc tat gaa ctc tgt gct aag ttt aga      552

Leu Pro Arg Pro Gly Phe Pro Ile Tyr Glu Leu Cys Ala Lys Phe Arg

            130                 135                 140

cac ctt gaa gtt cgc tac gtc gat ctt ctt ccg gaa aat gga tgg gag      600

His Leu Glu Val Arg Tyr Val Asp Leu Leu Pro Glu Asn Gly Trp Glu

        145                 150                 155

atc gat ctt gat gct gtc gag gct ctt gca gac gaa aac acg gtt gct      648

Ile Asp Leu Asp Ala Val Glu Ala Leu Ala Asp Glu Asn Thr Val Ala

    160                 165                 170

ttg gtt gtt ata aac cct ggt aat cct tgc ggg aat gtc tat agc tac      696

Leu Val Val Ile Asn Pro Gly Asn Pro Cys Gly Asn Val Tyr Ser Tyr

175                 180                 185                 190

cag cat ttg atg aag att gcg gaa tcg gcg aaa aaa cta ggg ttt ctt    744

Gln His Leu Met Lys Ile Ala Glu Ser Ala Lys Lys Leu Gly Phe Leu

                195                 200                 205

gtg att gct gat gag gtt tac ggt cat ctt gct ttt ggt agc aaa ccg    792

Val Ile Ala Asp Glu Val Tyr Gly His Leu Ala Phe Gly Ser Lys Pro

            210                 215                 220

ttt gtg cca atg ggt gtg ttt gga tct att gtt cct gtg ctt act ctt    840

Phe Val Pro Met Gly Val Phe Gly Ser Ile Val Pro Val Leu Thr Leu

        225                 230                 235

ggc tct tta tca aag aga tgg ata gtt cca ggt tgg cga ctc ggg tgg    888

Gly Ser Leu Ser Lys Arg Trp Ile Val Pro Gly Trp Arg Leu Gly Trp

    240                 245                 250

ttt gtc acc act gat cct tct ggt tcc ttt aag gac cct aag atc att    936

Phe Val Thr Thr Asp Pro Ser Gly Ser Phe Lys Asp Pro Lys Ile Ile

255                 260                 265                 270

gag agg ttt aag aaa tac ttt gat att ctt ggt gga cca gct aca ttt    984

Glu Arg Phe Lys Lys Tyr Phe Asp Ile Leu Gly Gly Pro Ala Thr Phe

                275                 280                 285

att cag gct gca gtt ccc act att ttg gaa cag acg gat gag tct ttc   1032

Ile Gln Ala Ala Val Pro Thr Ile Leu Glu Gln Thr Asp Glu Ser Phe

            290                 295                 300

ttc aag aaa acc ttg aac tcg ttg aag aac tct tcg gat att tgt tgt   1080

Phe Lys Lys Thr Leu Asn Ser Leu Lys Asn Ser Ser Asp Ile Cys Cys

        305                 310                 315

gac tgg atc aag gag att cct tgc att gat tcc tcg cat cga cca gaa   1128

Asp Trp Ile Lys Glu Ile Pro Cys Ile Asp Ser Ser His Arg Pro Glu

    320                 325                 330

gga tcc atg gca atg atg gtt aag ctg aat ctc tca tta ctt gaa gat   1176

Gly Ser Met Ala Met Met Val Lys Leu Asn Leu Ser Leu Leu Glu Asp

335                 340                 345                 350

gta agt gac gat atc gac ttc tgt ttc aag tta gct agg gaa gaa tca   1224

Val Ser Asp Asp Ile Asp Phe Cys Phe Lys Leu Ala Arg Glu Glu Ser

                355                 360                 365

gtc atc ctt ctt cct ggg acc gcg gtg ggg ctg aag aac tgg ctg agg   1272

Val Ile Leu Leu Pro Gly Thr Ala Val Gly Leu Lys Asn Trp Leu Arg

            370                 375                 380

ata acg ttt gca gca gat gca act tcg att gaa gaa gct ttt aaa agg    1320

Ile Thr Phe Ala Ala Asp Ala Thr Ser Ile Glu Glu Ala Phe Lys Arg

        385                 390                 395

atc aaa tgt ttc tat ctt aga cat gcc aag act caa tat cca acc ata    1368

Ile Lys Cys Phe Tyr Leu Arg His Ala Lys Thr Gln Tyr Pro Thr Ile

    400                 405                 410

tag ttgatttctg attttggtat ggtcataaat tgttcttaaa ttacatgttt         1421

aaaaacacag atacagtaca gtgtcttttt gttctcccta tataagtgtt gatataaaat  1481

ttctttattg taataagatt aactcttaat taaaaacatc aactaaacga ataaacagaa  1541

aaatgttaac ttg                                                     1554

<210>10

<211>414

<212>PRT

<213>拟南芥菜

<400>10

Met Glu Asn Gly Ala Thr Thr Thr Ser Thr Ile Thr Ile Lys Gly Ile

1               5                   10                  15

Leu Ser Leu Leu Met Glu Ser Ile Thr Thr Glu Glu Asp Glu Gly Gly

            20                  25                  30

Lys Arg Val Ile Ser Leu Gly Met Gly Asp Pro Thr Leu Tyr Ser Cys

        35                  40                  45

Phe Arg Thr Thr Gln Val Ser Leu Gln Ala Val Ser Asp Ser Leu Leu

    50                  55                  60

Ser Asn Lys Phe His Gly Tyr Ser His Thr Val Gly Leu Pro Gln Ala

65                  70                  75                  80

Arg Arg Ala Ile Ala Glu Tyr Leu Ser Arg Asp Leu Pro Tyr Lys Leu

                85                  90                  95

Ser Gln Asp Asp Val Phe Ile Thr Ser Gly Cys Thr Gln Ala Ile Asp

            100                 105                 110

Val Ala Leu Ser Met Leu Ala Arg Pro Arg Ala Asn Ile Leu Leu Pro

        115                 120                 125

Arg Pro Gly Phe Pro Ile Tyr Glu Leu Cys Ala Lys Phe Arg His Leu

    130                 135                 140

Glu Val Arg Tyr Val Asp Leu Leu Pro Glu Asn Gly Trp Glu Ile Asp

145                 150                 155                 160

Leu Asp Ala Val Glu Ala Leu Ala Asp Glu Asn Thr Val Ala Leu Val

                165                 170                 175

Val Ile Asn Pro Gly Asn Pro Cys Gly Asn Val Tyr Ser Tyr Gln His

            180                 185                 190

Leu Met Lys Ile Ala Glu Ser Ala Lys Lys Leu Gly Phe Leu Val Ile

        195                 200                 205

Ala Asp Glu Val Tyr Gly His Leu Ala Phe Gly Ser Lys Pro Phe Val

    210                 215                 220

Pro Met Gly Val Phe Gly Ser Ile Val Pro Val Leu Thr Leu Gly Ser

225                 230                 235                 240

Leu Ser Lys Arg Trp Ile Val Pro Gly Trp Arg Leu Gly Trp Phe Val

                245                 250                 255

Thr Thr Asp Pro Ser Gly Ser Phe Lys Asp Pro Lys Ile Ile Glu Arg

            260                 265                 270

Phe Lys Lys Tyr Phe Asp Ile Leu Gly Gly Pro Ala Thr Phe Ile Gln

        275                 280                 285

Ala Ala Val Pro Thr Ile Leu Glu Gln Thr Asp Glu Ser Phe Phe Lys

    290                 295                 300

Lys Thr Leu Asn Ser Leu Lys Asn Ser Ser Asp Ile Cys Cys Asp Trp

305                 310                 315                 320

Ile Lys Glu Ile Pro Cys Ile Asp Ser Ser His Arg Pro Glu Gly Ser

                325                 330                 335

Met Ala Met Met Val Lys Leu Asn Leu Ser Leu Leu Glu Asp Val Ser

            340                 345                 350

Asp Asp Ile Asp Phe Cys Phe Lys Leu Ala Arg Glu Glu Ser Val Ile

        355                 360                 365

Leu Leu Pro Gly Thr Ala Val Gly Leu Lys Asn Trp Leu Arg Ile Thr

    370                 375                 380

Phe Ala Ala Asp Ala Thr Ser Ile Glu Glu Ala Phe Lys Arg Ile Lys

385                 390                 395                 400

Cys Phe Tyr Leu Arg His Ala Lys Thr Gln Tyr Pro Thr Ile

                405                 410

<210>11

<211>1077

<212>DNA

<213>稻(Oryza sativa)

<220>

<221>CDS

<222>(1)..(1077)

<223>编码稻推定的胆色素原脱氨酶[gbXM_464262]

<400>11

atg ccg ccg ccg ccg aga tgc gcc gcc acc acc gcc cac cac tcc ctc    48

Met Pro Pro Pro Pro Arg Cys Ala Ala Thr Thr Ala His His Ser Leu

1               5                   10                  15

ctc ggc tcg ccc acc tgc ctc gcg cgc ccg cgg cgg cgg tgc tgc ccc    96

Leu Gly Ser Pro Thr Cys Leu Ala Arg Pro Arg Arg Arg Cys Cys Pro

            20                  25                  30

gtg cgc gcc gcc gtc gcc gtc cag gcc gag gcg cag gcc aag gtc tcg   144

Val Arg Ala Ala Val Ala Val Gln Ala Glu Ala Gln Ala Lys Val Ser

        35                  40                  45

ctc atc cgg att ggc acc cgc ggg agt cct ctt gca ctg gca caa gct    192

Leu Ile Arg Ile Gly Thr Arg Gly Ser Pro Leu Ala Leu Ala Gln Ala

    50                  55                  60

cat gaa acc cga gac aag ctg aag gct gca cac tca gag tta gcc gag    240

His Glu Thr Arg Asp Lys Leu Lys Ala Ala His Ser Glu Leu Ala Glu

65                  70                  75                  80

gag ggg gcc gtt gag att gtc atc att aag acc aca gga gac atg atc    288

Glu Gly Ala Val Glu Ile Val Ile Ile Lys Thr Thr Gly Asp Met Ile

                85                  90                  95

ttg gac aaa ccc ctg gca gat ata ggt ggc aag ggt tta ttc acc aag    336

Leu Asp Lys Pro Leu Ala Asp Ile Gly Gly Lys Gly Leu Phe Thr Lys

            100                 105                 110

gag atc gat gat gca ctt ttg cag gga agg att gac att gcc gtc cac    384

Glu Ile Asp Asp Ala Leu Leu Gln Gly Arg Ile Asp Ile Ala Val His

        115                 120                 125

tcg atg aaa gat gtt cca aca tat tta cca gaa ggc acg ata ttg cct    432

Ser Met Lys Asp Val Pro Thr Tyr Leu Pro Glu Gly Thr Ile Leu Pro

    130                 135                 140

tgt aat ctc cca cgg gaa gat gtg aga gat gca ttc ata tgc ttg act    480

Cys Asn Leu Pro Arg Glu Asp Val Arg Asp Ala Phe Ile Cys Leu Thr

145                 150                 155                 160

gca agt tcc ctt gcg gag ctt cct gct ggc agt gtt gtt gga agt gct    528

Ala Ser Ser Leu Ala Glu Leu Pro Ala Gly Ser Val Val Gly Ser Ala

                165                 170                 175

tct ctg cgt aga caa tct caa att ctc tac aaa tat cca tca ctc aaa    576

Ser Leu Arg Arg Gln Ser Gln Ile Leu Tyr Lys Tyr Pro Ser Leu Lys

            180                 185                 190

gtt gtt aac ttc aga gga aat gtt caa aca cga ttg agg aaa ctc aaa    624

Val Val Asn Phe Arg Gly Asn Val Gln Thr Arg Leu Arg Lys Leu Lys

        195                 200                 205

gaa gga gat gtc cat gct aca ttg ttg gct cta gct gga cta aaa cgc    672

Glu Gly Asp Val His Ala Thr Leu Leu Ala Leu Ala Gly Leu Lys Arg

    210                 215                 220

tta aac atg gca gaa act gcg aca tct gta ttg tca gtg gac gaa atg    720

Leu Asn Met Ala Glu Thr Ala Thr Ser Val Leu Ser Val Asp Glu Met

225                 230                 235                 240

ctt cca gca gtt gct caa ggt gct att gga ata gct tgc aga agc agt    768

Leu Pro Ala Val Ala Gln Gly Ala Ile Gly Ile Ala Cys Arg Ser Ser

                245                 250                 255

gat gac aca atg atg aat tac ttg tcc tca ttg aac cat gaa gat acc    816

Asp Asp Thr Met Met Asn Tyr Leu Ser Ser Leu Asn His Glu Asp Thr

            260                 265                 270

aga tta gct gtt gca tgt gaa aga gaa ttc ttg tca gtt ctt gat ggc    864

Arg Leu Ala Val Ala Cys Glu Arg Glu Phe Leu Ser Val Leu Asp Gly

        275                 280                 285

aac tgc cga act cca att gcg gca tat gct tct cgt gac aag gat ggg    912

Asn Cys Arg Thr Pro Ile Ala Ala Tyr Ala Ser Arg Asp Lys Asp Gly

    290                 295                 300

aat tgt tca ttc cga ggg cta ttg gct tca cct gat gga tct aca gta    960

Asn Cys Ser Phe Arg Gly Leu Leu Ala Ser Pro Asp Gly Ser Thr Val

305                 310                 315                 320

tat gag act tcg aga act gga cct tat gat ttc gat atc atg gtt gag   1008

Tyr Glu Thr Ser Arg Thr Gly Pro Tyr Asp Phe Asp Ile Met Val Glu

                325                 330                 335

atg ggt aaa gat gct ggc cac gag ctg aaa gca aag gct ggc cct ggc   1056

Met Gly Lys Asp Ala Gly His Glu Leu Lys Ala Lys Ala Gly Pro Gly

            340                 345                 350

ttc ttt gat agc ttg caa tga                                       1077

Phe Phe Asp Ser Leu Gln

        355

<210>12

<211>358

<212>PRT

<213>稻

<400>12

Met Pro Pro Pro Pro Arg Cys Ala Ala Thr Thr Ala His His Ser Leu

1               5                   10                  15

Leu Gly Ser Pro Thr Cys Leu Ala Arg Pro Arg Arg Arg Cys Cys Pro

            20                  25                  30

Val Arg Ala Ala Val Ala Val Gln Ala Glu Ala Gln Ala Lys Val Ser

        35                  40                  45

Leu Ile Arg Ile Gly Thr Arg Gly Ser Pro Leu Ala Leu Ala Gln Ala

    50                  55                  60

His Glu Thr Arg Asp Lys Leu Lys Ala Ala His Ser Glu Leu Ala Glu

65                  70                  75                  80

Glu Gly Ala Val Glu Ile Val Ile Ile Lys Thr Thr Gly Asp Met Ile

                85                  90                  95

Leu Asp Lys Pro Leu Ala Asp Ile Gly Gly Lys Gly Leu Phe Thr Lys

            100                 105                 110

Glu Ile Asp Asp Ala Leu Leu Gln Gly Arg Ile Asp Ile Ala Val His

        115                  120                  125

Ser Met Lys Asp Val Pro Thr Tyr Leu Pro Glu Gly Thr Ile Leu Pro

    130                  135                  140

Cys Asn Leu Pro Arg Glu Asp Val Arg Asp Ala Phe Ile Cys Leu Thr

145                 150                 155                 160

Ala Ser Ser Leu Ala Glu Leu Pro Ala Gly Ser Val Val Gly Ser Ala

                165                 170                 175

Ser Leu Arg Arg Gln Ser Gln Ile Leu Tyr Lys Tyr Pro Ser Leu Lys

            180                 185                 190

Val Val Asn Phe Arg Gly Asn Val Gln Thr Arg Leu Arg Lys Leu Lys

        195                 200                 205

Glu Gly Asp Val His Ala Thr Leu Leu Ala Leu Ala Gly Leu Lys Arg

    210                 215                 220

Leu Asn Met Ala Glu Thr Ala Thr Ser Val Leu Ser Val Asp Glu Met

225                 230                 235                 240

Leu Pro Ala Val Ala Gln Gly Ala Ile Gly Ile Ala Cys Arg Ser Ser

                245                 250                 255

Asp Asp Thr Met Met Asn Tyr Leu Ser Ser Leu Asn His Glu Asp Thr

            260                 265                 270

Arg Leu Ala Val Ala Cys Glu Arg Glu Phe Leu Ser Val Leu Asp Gly

        275                 280                 285

Asn Cys Arg Thr Pro Ile Ala Ala Tyr Ala Ser Arg Asp Lys Asp Gly

    290                 295                 300

Asn Cys Ser Phe Arg Gly Leu Leu Ala Ser Pro Asp Gly Ser Thr Val

305                 310                 315                 320

Tyr Glu Thr Ser Arg Thr Gly Pro Tyr Asp Phe Asp Ile Met Val Glu

                325                 330                 335

Met Gly Lys Asp Ala Gly His Glu Leu Lys Ala Lys Ala Gly Pro Gly

            340                 345                 350

Phe Phe Asp Ser Leu Gln

        355

<210>13

<211>1242

<212>DNA

<213>稻

<220>

<221>CDS

<222>(1)..(1242)

<223>编码稻推定的ω-3脂肪酸去饱和酶[gb NM_185577]

<400>13

atg gcc cgg ctg cta ctc tcc ggc gtc gcg ccg ctc ccc ctc ctc ccc     48

Met Ala Arg Leu Leu Leu Ser Gly Val Ala Pro Leu Pro Leu Leu Pro

1               5                   10                  15

tgc cgc cgt cgc gcc att gca ttt gcg ctc cca ctt ggg aat gtc cgc     96

Cys Arg Arg Arg Ala Ile Ala Phe Ala Leu Pro Leu Gly Asn Val Arg

            20                  25                  30

ctc cgc ctc cgt gtg gcc gca ccc acc agc cgc gtg gcc acc gtg gag    144

Leu Arg Leu Arg Val Ala Ala Pro Thr Ser Arg Val Ala Thr Val Glu

        35                  40                  45

gag gac gac aat gaa aat aat gct cct cct cct cct tgt gag gac ttc    192

Glu Asp Asp Asn Glu Asn Asn Ala Pro Pro Pro Pro Cys Glu Asp Phe

    50                  55                  60

gac ccg ggc gcg gcg ccc ccg ttt ggt ctg gcc gac atc cgc gcc gct    240

Asp Pro Gly Ala Ala Pro Pro Phe Gly Leu Ala Asp Ile Arg Ala Ala

65                  70                  75                  80

atc ccc aag cac tgt tgg gtg aag gac ccc tgg cga tcc atg ggg tac    288

Ile Pro Lys His Cys Trp Val Lys Asp Pro Trp Arg Ser Met Gly Tyr

                85                  90                  95

gtg ctg cgc gac gtg gtg gtg gtg ttc gcc ctc gct gcc gcc gcc gcg    336

Val Leu Arg Asp Val Val Val Val Phe Ala Leu Ala Ala Ala Ala Ala

            100                 105                 110

cgc ctc cac agc tgc ctc gcc tgg ccg ctc tac tgg gcg gcg cag gga    384

Arg Leu His Ser Cys Leu Ala Trp Pro Leu Tyr Trp Ala Ala Gln Gly

        115                 120                 125

acc atg ttc tgg gcg ctc ttc gtc ctc ggc cac gac tgc ggg cac ggg    432

Thr Met Phe Trp Ala Leu Phe Val Leu Gly His Asp Cys Gly His Gly

    130                 135                 140

agc ttc tcc aac aac tcg agg ctc aac agc gtg atg ggc cac ata ctc    480

Ser Phe Ser Asn Asn Ser Arg Leu Asn Ser Val Met Gly His Ile Leu

145                 150                 155                 160

cac tcc tcc atc ctc gta ccc tac cat ggc tgg agg att agc cac agg    528

His Ser Ser Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser His Arg

                165                 170                 175

acg cat cat cag aac cat ggc cat gtc gac aag gat gag tcc tgg cat    576

Thr His His Gln Asn His Gly His Val Asp Lys Asp Glu Ser Trp His

            180                 185                 190

ccc ctc ccc gag cgg ctg tac agg agc ctt aac aga gcc acc cgg atg    624

Pro Leu Pro Glu Arg Leu Tyr Arg Ser Leu Asn Arg Ala Thr Arg Met

        195                 200                 205

ctc cgc ttc tcc ata ccc ttc ccc atg ctc gcc tac cca ttc tac ctg    672

Leu Arg Phe Ser Ile Pro Phe Pro Met Leu Ala Tyr Pro Phe Tyr Leu

    210                 215                 220

tgg tct cgg agc cca gga aag tct ggt tcg cat ttc cat ccc agc agc     720

Trp Ser Arg Ser Pro Gly Lys Ser Gly Ser His Phe His Pro Ser Ser

225                 230                 235                 240

gac ctg ttc cag ccc aac gaa agg aac gat gtg ctg aca tcc aca gcg     768

Asp Leu Phe Gln Pro Asn Glu Arg Asn Asp Val Leu Thr Ser Thr Ala

                245                 250                 255

tgc tgg gtg gcc atg gct gcc ctc ctc gca ggc ctc acc ttc ctc atg     816

Cys Trp Val Ala Met Ala Ala Leu Leu Ala Gly Leu Thr Phe Leu Met

            260                 265                 270

gga ccc ctc ctc atg ctc aac ctc tac ttt gtc cct tac tgg att ttt     864

Gly Pro Leu Leu Met Leu Asn Leu Tyr Phe Val Pro Tyr Trp Ile Phe

        275                 280                 285

gtt atg tgg ctg gac ttc gtc acc tac ttg cac cat cac ggc cac aac     912

Val Met Trp Leu Asp Phe Val Thr Tyr Leu His His His Gly His Asn

    290                 295                 300

gac aag ctg ccc tgg tac cgt ggc aag gaa tgg agc tat ttg cgg gga     960

Asp Lys Leu Pro Trp Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly

305                 310                 315                 320

gga ctg acg aca gtg gac agg gac tat ggg tgg atc aac aac atc cac    1008

Gly Leu Thr Thr Val Asp Arg Asp Tyr Gly Trp Ile Asn Asn Ile His

                325                 330                 335

cac gac atc ggg aca cat gtc att cac cat ctt ttc ccc caa atc ccg    1056

His Asp Ile Gly Thr His Val Ile His His Leu Phe Pro Gln Ile Pro

            340                 345                 350

cat tac cat cta att gag gcg acg gaa gca gca aag ggt gtg atg ggg    1104

His Tyr His Leu Ile Glu Ala Thr Glu Ala Ala Lys Gly Val Met Gly

        355                 360                 365

aaa tac tac agg gag ccg gac aag tct ggg cct ttt ccc tta cac ctg    1152

Lys Tyr Tyr Arg Glu Pro Asp Lys Ser Gly Pro Phe Pro Leu His Leu

    370                 375                 380

ttt gga gcg ctg tcc cgg agc ttg aaa cgc gac cac tat gtc agc gac    1200

Phe Gly Ala Leu Ser Arg Ser Leu Lys Arg Asp His Tyr Val Ser Asp

385                 390                 395                 400

acc gga gat gtg gtc tac tac cag acc gac cct gct aac taa            1242

Thr Gly Asp Val Val Tyr Tyr Gln Thr Asp Pro Ala Asn

                405                 410

<210>14

<211>413

<212>PRT

<213>稻

<400>14

Met Ala Arg Leu Leu Leu Ser Gly Val Ala Pro Leu Pro Leu Leu Pro

1               5                   10                  15

Cys Arg Arg Arg Ala Ile Ala Phe Ala Leu Pro Leu Gly Asn Val Arg

            20                  25                  30

Leu Arg Leu Arg Val Ala Ala Pro Thr Ser Arg Val Ala Thr Val Glu

        35                  40                  45

Glu Asp Asp Asn Glu Asn Asn Ala Pro Pro Pro Pro Cys Glu Asp Phe

    50                  55                  60

Asp Pro Gly Ala Ala Pro Pro Phe Gly Leu Ala Asp Ile Arg Ala Ala

65                  70                  75                  80

Ile Pro Lys His Cys Trp Val Lys Asp Pro Trp Arg Ser Met Gly Tyr

                85                  90                  95

Val Leu Arg Asp Val Val Val Val Phe Ala Leu Ala Ala Ala Ala Ala

            100                 105                 110

Arg Leu His Ser Cys Leu Ala Trp Pro Leu Tyr Trp Ala Ala Gln Gly

        115                 120                 125

Thr Met Phe Trp Ala Leu Phe Val Leu Gly His Asp Cys Gly His Gly

    130                 135                 140

Ser Phe Ser Asn Asn Ser Arg Leu Asn Ser Val Met Gly His Ile Leu

145                 150                 155                 160

His Ser Ser Ile Leu Val Pro Tyr His Gly Trp Arg Ile Ser His Arg

                165                 170                 175

Thr His His Gln Asn His Gly His Val Asp Lys Asp Glu Ser Trp His

            180                 185                 190

Pro Leu Pro Glu Arg Leu Tyr Arg Ser Leu Asn Arg Ala Thr Arg Met

        195                 200                 205

Leu Arg Phe Ser Ile Pro Phe Pro Met Leu Ala Tyr Pro Phe Tyr Leu

    210                 215                 220

Trp Ser Arg Ser Pro Gly Lys Ser Gly Ser His Phe His Pro Ser Ser

225                 230                 235                 240

Asp Leu Phe Gln Pro Asn Glu Arg Asn Asp Val Leu Thr Ser Thr Ala

                245                 250                 255

Cys Trp Val Ala Met Ala Ala Leu Leu Ala Gly Leu Thr Phe Leu Met

            260                 265                 270

Gly Pro Leu Leu Met Leu Asn Leu Tyr Phe Val Pro Tyr Trp Ile Phe

        275                 280                 285

Val Met Trp Leu Asp Phe Val Thr Tyr Leu His His His Gly His Asn

    290                 295                 300

Asp Lys Leu Pro Trp Tyr Arg Gly Lys Glu Trp Ser Tyr Leu Arg Gly

305                 310                 315                 320

Gly Leu Thr Thr Val Asp Arg Asp Tyr Gly Trp Ile Asn Asn Ile His

                325                 330                 335

His Asp Ile Gly Thr His Val Ile His His Leu Phe Pro Gln Ile Pro

            340                 345                 350

His Tyr His Leu Ile Glu Ala Thr Glu Ala Ala Lys Gly Val Met Gly

        355                 360                 365

Lys Tyr Tyr Arg Glu Pro Asp Lys Ser Gly Pro Phe Pro Leu His Leu

    370                 375                 380

Phe Gly Ala Leu Ser Arg Ser Leu Lys Arg Asp His Tyr Val Ser Asp

385                 390                 395                 400

Thr Gly Asp Val Val Tyr Tyr Gln Thr Asp Pro Ala Asn

                405                 410

<210>15

<211>1668

<212>DNA

<213>稻

<220>

<221>CDS

<222>(1)..(1668)

<223>编码稻镰刀菌抗性蛋白质I2C-5-样[gb NM_194161]

<400>15

atg gat aac acg ttg gtg gca acg tca gct agg gtt ctt cca aca atg     48

Met Asp Asn Thr Leu Val Ala Thr Ser Ala Arg Val Leu Pro Thr Met

1               5                   10                  15

ttg gca ccg gat ggc gat gcc tcc ttg ctg tct gtg tct gct ctt gat     96

Leu Ala Pro Asp Gly Asp Ala Ser Leu Leu Ser Val Ser Ala Leu Asp

            20                  25                  30

cca gtt ctt gtt gat cca ttg agt gat cta cag aac ttc aga tta cat    144

Pro Val Leu Val Asp Pro Leu Ser Asp Leu Gln Asn Phe Arg Leu His

        35                  40                  45

act tca ctt atg gag aca ttt ttg tct gtg att ctg agt gat ctt gcc    192

Thr Ser Leu Met Glu Thr Phe Leu Ser Val Ile Leu Ser Asp Leu Ala

    50                  55                  60

act aaa tcc ata tct ttc ctg atc aac aag tgc tcg aaa ccg aca gca    240

Thr Lys Ser Ile Ser Phe Leu Ile Asn Lys Cys Ser Lys Pro Thr Ala

65                  70                  75                  80

tca aac atg gag gag aga ctg caa cgg ctg ctg ctc cgt gcc cag atc    288

Ser Asn Met Glu Glu Arg Leu Gln Arg Leu Leu Leu Arg Ala Gln Ile

                85                  90                  95

atc gtg gag gag gca gag gac cgg ctc atc aca aac caa cgc atg ctg    336

Ile Val Glu Glu Ala Glu Asp Arg Leu Ile Thr Asn Gln Arg Met Leu

            100                 105                 110

ctg caa ctg aat ata ctg agg aag gag atg ttc aga ggg tat tac gct     384

Leu Gln Leu Asn Ile Leu Arg Lys Glu Met Phe Arg Gly Tyr Tyr Ala

        115                 120                 125

ctt gac aga ttc aga tgc cgt ggc cat gaa gaa gat gat gca aaa gat     432

Leu Asp Arg Phe Arg Cys Arg Gly His Glu Glu Asp Asp Ala Lys Asp

    130                 135                 140

cac cag gtg agt aac tct ttc gcg caa tcc aag ttc aat cct gct aag     480

His Gln Val Ser Asn Ser Phe Ala Gln Ser Lys Phe Asn Pro Ala Lys

145                 150                 155                 160

agt gtc cgg ttc ttc agg atc agt ggc cat agt tta caa gag cag ttg     528

Ser Val Arg Phe Phe Arg Ile Ser Gly His Ser Leu Gln Glu Gln Leu

                165                 170                 175

cag caa gtt gtt ggc agc ata gaa gtc acc ctt gaa gat atg agc gtt     576

Gln Gln Val Val Gly Ser Ile Glu Val Thr Leu Glu Asp Met Ser Val

            180                 185                 190

ttt gtc atg ttc ttg aac agt tgt ccc cat ttg tgc cgt cag cca tat     624

Phe Val Met Phe Leu Asn Ser Cys Pro His Leu Cys Arg Gln Pro Tyr

        195                 200                 205

agc atg cac ttg ctt cta gac aaa tgt ttg ttt ggt cgc caa atg gag     672

Ser Met His Leu Leu Leu Asp Lys Cys Leu Phe Gly Arg Gln Met Glu

    210                 215                 220

atc gag cgc atc atg aac ttc ctg ctc aaa gtg gat tct cca ggt tct     720

Ile Glu Arg Ile Met Asn Phe Leu Leu Lys Val Asp Ser Pro Gly Ser

225                 230                 235                 240

gaa aat ccg ggt gtc ctg ccg atc att ggt cga cgg aaa gct ggg aag     768

Glu Asn Pro Gly Val Leu Pro Ile Ile Gly Arg Arg Lys Ala Gly Lys

                245                 250                 255

agc acc ttg atc gag cat gcc tgt aac gat gaa agg gtg cgt aac cac     816

Ser Thr Leu Ile Glu His Ala Cys Asn Asp Glu Arg Val Arg Asn His

            260                 265                 270

ttc tct caa att gtg tgt ttc agt gac gat gat ctt aaa gat gca gac     864

Phe Ser Gln Ile Val Cys Phe Ser Asp Asp Asp Leu Lys Asp Ala Asp

        275                 280                 285

atg gta act ctt cga cat tgt ggt tca atc aag aat gga aac caa tgc     912

Met Val Thr Leu Arg His Cys Gly Ser Ile Lys Asn Gly Asn Gln Cys

    290                 295                 300

act ggt gga gaa aga ata ttg atc gtt atc gag cta atc aga gac atc     960

Thr Gly Gly Glu Arg Ile Leu Ile Val Ile Glu Leu Ile Arg Asp Ile

305                 310                 315                 320

gat gag gtt gta tgg aca aga ttg tac tca gct tcc aag agt tat gtt    1008

Asp Glu Val Val Trp Thr Arg Leu Tyr Ser Ala Ser Lys Ser Tyr Val

                325                 330                 335

cca aat ggc agt aaa att atc gtc gca agc caa tct gat aag att gca    1056

Pro Asn Gly Ser Lys Ile Ile Val Ala Ser Gln Ser Asp Lys Ile Ala

            340                 345                 350

aga ttt gga aca aca caa gct ctt aga gta gaa tta ttt act gaa gaa    1104

Arg Phe Gly Thr Thr Gln Ala Leu Arg Val Glu Leu Phe Thr Glu Glu

        355                 360                 365

gca tac tgg tac ttt ttc aag gtg cgc aca ttc gga agc atg gat gca    1152

Ala Tyr Trp Tyr Phe Phe Lys Val Arg Thr Phe Gly Ser Met Asp Ala

    370                 375                 380

cag gag cac cca aag atg gca tca atg gcc atg gaa atg gcc agg gag    1200

Gln Glu His Pro Lys Met Ala Ser Met Ala Met Glu Met Ala Arg Glu

385                 390                 395                 400

ttg caa ggg tgc ttc atg ggt gca agc atc tac agt gga ctt ttg aaa    1248

Leu Gln Gly Cys Phe Met Gly Ala Ser Ile Tyr Ser Gly Leu Leu Lys

                405                 410                 415

gca aat ttc aat gct cgg ttt tgg aac atg gct ctg gca agc atc aga    1296

Ala Asn Phe Asn Ala Arg Phe Trp Asn Met Ala Leu Ala Ser Ile Arg

            420                 425                 430

gaa tac aag cag acg aat ctc cta gta tac ggt aca tat ttt gag aat    1344

Glu Tyr Lys Gln Thr Asn Leu Leu Val Tyr Gly Thr Tyr Phe Glu Asn

        435                 440                 445

cca tgg cag gcg tct gaa cct cca tat gtt agg aca gta aac aaa att    1392

Pro Trp Gln Ala Ser Glu Pro Pro Tyr Val Arg Thr Val Asn Lys Ile

    450                 455                 460

tcc tcc gaa tac ctt gtg att cat gat gag tat cac aca tgt tct gtt    1440

Ser Ser Glu Tyr Leu Val Ile His Asp Glu Tyr His Thr Cys Ser Val

465                 470                 475                 480

cag aac atg gtt ctt tgt cgc aca aac ttt act cgg agt gaa gct gaa    1488

Gln Asn Met Val Leu Cys Arg Thr Asn Phe Thr Arg Ser Glu Ala Glu

                485                 490                 495

gtt ccc atg ttg agc atg caa gat ttt ctc ttt gga agt gtt aga cct    1536

Val Pro Met Leu Ser Met Gln Asp Phe Leu Phe Gly Ser Val Arg Pro

            500                 505                 510

caa gga aaa ttc aag gtt ctt gcg tgg aag tct cac ctt ccg cct tac    1584

Gln Gly Lys Phe Lys Val Leu Ala Trp Lys Ser His Leu Pro Pro Tyr

        515                 520                 525

tac aac cac atg ttc aac tgt gag ttt gaa gat gtc aac atg cta aga    1632

Tyr Asn His Met Phe Asn Cys Glu Phe Glu Asp Val Asn Met Leu Arg

    530                 535                 540

cgc aag gat att agt tca gaa gtc gat gac aac tga                    1668

Arg Lys Asp Ile Ser Ser Glu Val Asp Asp Asn

545                 550                 555

<210>16

<211>555

<212>PRT

<213>稻

<400>16

Met Asp Asn Thr Leu Val Ala Thr Ser Ala Arg Val Leu Pro Thr Met

1               5                   10                  15

Leu Ala Pro Asp Gly Asp Ala Ser Leu Leu Ser Val Ser Ala Leu Asp

            20                  25                  30

Pro Val Leu Val Asp Pro Leu Ser Asp Leu Gln Asn Phe Arg Leu His

        35                  40                  45

Thr Ser Leu Met Glu Thr Phe Leu Ser Val Ile Leu Ser Asp Leu Ala

    50                  55                  60

Thr Lys Ser Ile Ser Phe Leu Ile Asn Lys Cys Ser Lys Pro Thr Ala

65                  70                  75                  80

Ser Asn Met Glu Glu Arg Leu Gln Arg Leu Leu Leu Arg Ala Gln Ile

                85                  90                  95

Ile Val Glu Glu Ala Glu Asp Arg Leu Ile Thr Asn Gln Arg Met Leu

            100                 105                 110

Leu Gln Leu Asn Ile Leu Arg Lys Glu Met Phe Arg Gly Tyr Tyr Ala

        115                 120                 125

Leu Asp Arg Phe Arg Cys Arg Gly His Glu Glu Asp Asp Ala Lys Asp

    130                 135                 140

His Gln Val Ser Asn Ser Phe Ala Gln Ser Lys Phe Asn Pro Ala Lys

145                 150                 155                 160

Ser Val Arg Phe Phe Arg Ile Ser Gly His Ser Leu Gln Glu Gln Leu

                165                 170                 175

Gln Gln Val Val Gly Ser Ile Glu Val Thr Leu Glu Asp Met Ser Val

            180                 185                 190

Phe Val Met Phe Leu Asn Ser Cys Pro His Leu Cys Arg Gln Pro Tyr

        195                 200                 205

Ser Met His Leu Leu Leu Asp Lys Cys Leu Phe Gly Arg Gln Met Glu

    210                 215                 220

Ile Glu Arg Ile Met Asn Phe Leu Leu Lys Val Asp Ser Pro Gly Ser

225                 230                 235                 240

Glu Asn Pro Gly Val Leu Pro Ile Ile Gly Arg Arg Lys Ala Gly Lys

                245                 250                 255

Ser Thr Leu Ile Glu His Ala Cys Asn Asp Glu Arg Val Arg Asn His

            260                 265                 270

Phe Ser Gln Ile Val Cys Phe Ser Asp Asp Asp Leu Lys Asp Ala Asp

        275                 280                 285

Met Val Thr Leu Arg His Cys Gly Ser Ile Lys Asn Gly Asn Gln Cys

    290                 295                 300

Thr Gly Gly Glu Arg Ile Leu Ile Val Ile Glu Leu Ile Arg Asp Ile

305                 310                 315                 320

Asp Glu Val Val Trp Thr Arg Leu Tyr Ser Ala Ser Lys Ser Tyr Val

                325                 330                 335

Pro Asn Gly Ser Lys Ile Ile Val Ala Ser Gln Ser Asp Lys Ile Ala

            340                 345                 350

Arg Phe Gly Thr Thr Gln Ala Leu Arg Val Glu Leu Phe Thr Glu Glu

        355                 360                 365

Ala Tyr Trp Tyr Phe Phe Lys Val Arg Thr Phe Gly Ser Met Asp Ala

    370                 375                 380

Gln Glu His Pro Lys Met Ala Ser Met Ala Met Glu Met Ala Arg Glu

385                 390                 395                 400

Leu Gln Gly Cys Phe Met Gly Ala Ser Ile Tyr Ser Gly Leu Leu Lys

                405                 410                 415

Ala Asn Phe Asn Ala Arg Phe Trp Asn Met Ala Leu Ala Ser Ile Arg

            420                 425                 430

Glu Tyr Lys Gln Thr Asn Leu Leu Val Tyr Gly Thr Tyr Phe Glu Asn

        435                 440                 445

Pro Trp Gln Ala Ser Glu Pro Pro Tyr Val Arg Thr Val Asn Lys Ile

    450                 455                 460

Ser Ser Glu Tyr Leu Val Ile His Asp Glu Tyr His Thr Cys Ser Val

465                 470                 475                 480

Gln Asn Met Val Leu Cys Arg Thr Asn Phe Thr Arg Ser Glu Ala Glu

                485                 490                 495

Val Pro Met Leu Ser Met Gln Asp Phe Leu Phe Gly Ser Val Arg Pro

            500                 505                 510

Gln Gly Lys Phe Lys Val Leu Ala Trp Lys Ser His Leu Pro Pro Tyr

        515                 520                 525

Tyr Asn His Met Phe Asn Cys Glu Phe Glu Asp Val Asn Met Leu Arg

    530                 535                 540

Arg Lys Asp Ile Ser Ser Glu Val Asp Asp Asn

545                 550                 555

<210>17

<211>1695

<212>DNA

<213>拟南芥菜

<220>

<221>CDS

<222>(1)..(1695)

<223>编码拟南芥菜致病相关基因5的组成型表达子(cpr5,At5g64930;gb AY033229)

<400>17

atg gaa gcc ctc ctc ctc cct cct tcg ccg gaa ccc caa aat caa atc     48

Met Glu Ala Leu Leu Leu Pro Pro Ser Pro Glu Pro Gln Asn Gln Ile

1               5                   10                  15

acc aat ccg gcg aat tca aag cca aat cat caa tct ggt gac gta cat     96

Thr Asn Pro Ala Asn Ser Lys Pro Asn His Gln Ser Gly Asp Val His

            20                  25                  30

aaa gat gag acg atg atg atg aag aag aag aag gat acg aat cca tcg    144

Lys Asp Glh Thr Met Met Met Lys Lys Lys Lys Asp Thr Asn Pro Ser

        35                  40                  45

aat ttg gaa aag aga aaa ctc aag gga aag aag aaa gag att atg gac    192

Asn Leu Glu Lys Arg Lys Leu Lys Gly Lys Lys Lys Glu Ile Met Asp

    50                  55                  60

aac gac gaa gct tct tcg tcc tat tgt tct aca tct tct acc tct aat    240

Asn Asp Glu Ala Ser Ser Ser Tyr Cys Ser Thr Ser Ser Thr Ser Asn

65                  70                  75                  80

tca aat tct act aaa agg gtt acg aga gtg gtt cat aga tta cga aac    288

Ser Asn Ser Thr Lys Arg Val Thr Arg Val Val His Arg Leu Arg Asn

                85                  90                  95

cct atg cgg tta ggt atg gct cga cga agc gtt ggt gaa cga caa gct    336

Pro Met Arg Leu Gly Met Ala Arg Arg Ser Val Gly Glu Arg Gln Ala

            100                 105                 110

gaa aaa ttg gcg aag cct ctg ggc ttt tca ctt gcc gct ttt gct aat     384

Glu Lys Leu Ala Lys Pro Leu Gly Phe Ser Leu Ala Ala Phe Ala Asn

        115                 120                 125

atg gtt att gcg aga aag aat gcc gca ggt cag aat gtt tat gtt gat     432

Met Val Ile Ala Arg Lys Asn Ala Ala Gly Gln Asn Val Tyr Val Asp

    130                 135                 140

gat ctt gtt gag atc ttt gct act ctt gtc gaa gaa tca tta gcc aat     480

Asp Leu Val Glu Ile Phe Ala Thr Leu Val Glu Glu Ser Leu Ala Asn

145                 150                 155                 160

gtt tat ggt aat aag ctt ggt tcc ttt gcg acc aac ttt gag caa aca     528

Val Tyr Gly Asn Lys Leu Gly Ser Phe Ala Thr Asn Phe Glu Gln Thr

                165                 170                 175

ttc agc agt act cta aag atc ctt aaa ttg acc aat gaa tgt gca aat     576

Phe Ser Ser Thr Leu Lys Ile Leu Lys Leu Thr Asn Glu Cys Ala Asn

            180                 185                 190

cca cat cag tca aac aat aat gat ggt ggg agt tgt aat tta gat cgc     624

Pro His Gln Ser Asn Asn Asn Asp Gly Gly Ser Cys Asn Leu Asp Arg

        195                 200                 205

tct acc ata gac gga tgc tca gac acc gag cta ttt gag agg gag act     672

Ser ThrIle Asp Gly Cys Ser Asp Thr Glu Leu Phe Glu Arg Glu Thr

    210                 215                 220

tca tct gct acg tct gct tat gaa gtg atg caa ggc agt gca aca gca     720

Ser Ser Ala Thr Ser Ala Tyr Glu Val Met Gln Gly Ser Ala Thr Ala

225                 230                 235                 240

acc tct ttg atg aat gag ctt gcc ctt ttc gaa gag act cta caa ctc     768

Thr Ser Leu Met Asn Glu Leu Ala Leu Phe Glu Glu Thr Leu Gln Leu

                245                 250                 255

tct tgt gtc cct cct aga agt tca gca atg gct ttg acc aca gac gaa     816

Ser Cys Val Pro Pro Arg Ser Ser Ala Met Ala Leu Thr Thr Asp Glu

            260                 265                 270

agg ttt tta aaa gag caa aca cga gca aac gac cta aag acc gtg gag     864

Arg Phe Leu Lys Glu Gln Thr Arg Ala Asn Asp Leu Lys Thr Val Glu

        275                 280                 285

att ggt ctt caa ata aga gag tta agg tgc aaa gag acg gcg cta gga     912

Ile Gly Leu Gln Ile Arg Glu Leu Arg Cys Lys Glu Thr Ala Leu Gly

    290                 295                 300

tta aaa ttt gaa tca aac aac ctg ggg aaa gcg gcg cta gag ttg gat     960

Leu Lys Phe Glu Ser Asn Asn Leu Gly Lys Ala Ala Leu Glu Leu Asp

305                 310                 315                 320

gtt tcg aaa gct gca ttc aga gcg gag aaa ttc aaa acc gaa tta gaa    1008

Val Ser Lys Ala Ala Phe Arg Ala Glu Lys Phe Lys Thr Glu Leu Glu

                325                 330                 335

gat aca aga aaa gaa gag atg gtc aca aga atc atg gat tgg ctc ctc    1056

Asp Thr Arg Lys Glu Glu Met Val Thr Arg Ile Met Asp Trp Leu Leu

            340                 345                 350

gta agt gtc ttc agc atg ttg gct tct atg gta ctt ggc gtt tac aat    1104

Val Ser Val Phe Ser Met Leu Ala Ser Met Val Leu Gly Val Tyr Asn

        355                 360                 365

ttt tca ata aag aga atc gag gat gct acc tca gta tgc gac caa tcc    1152

Phe Ser Ile Lys Arg Ile Glu Asp Ala Thr Ser Val Cys Asp Gln Ser

    370                 375                 380

gag gag aaa agt tcg tcg tgg tgg gtt cct aaa caa gtt tca tcg att    1200

Glu Glu Lys Ser Ser Ser Trp Trp Val Pro Lys Gln Val Ser Ser Ile

385                 390                 395                 400

aac tca ggc ttc aac acc ttc atc tgc cgg gtt cga gtt tgg gtg cag    1248

Asn Ser Gly Phe Asn Thr Phe Ile Cys Arg Val Arg Val Trp Val Gln

                405                 410                 415

ata ttt ttc ggt gtg tta atg atc att gtc ttc act tac ttt cta aac    1296

Ile Phe Phe Gly Val Leu Met Ile Ile Val Phe Thr Tyr Phe Leu Asn

            420                 425                 430

aaa cga tca tca ggt acg aag cag aca atg ccg ata agt ttc atc gtt    1344

Lys Arg Ser Ser Gly Thr Lys Gln Thr Met Pro Ile Ser Phe Ile Val

        435                 440                 445

ctt ttc ctc ggt ata ttt tgc ggt gta tcg ggt aaa ttg tgt gtg gac    1392

Leu Phe Leu Gly Ile Phe Cys Gly Val Ser Gly Lys Leu Cys Val Asp

    450                 455                 460

aca ttg ggc ggt gat ggc aaa ctc tgg cta ata gtt tgg gaa gtg ttt    1440

Thr Leu Gly Gly Asp Gly Lys Leu Trp Leu Ile Val Trp Glu Val Phe

465                 470                 475                 480

tgc ctt ttg caa ttc gtt gca aat gtc ttc aca ttg gct ttg tat ggt    1488

Cys Leu Leu Gln Phe Val Ala Asn Val Phe Thr Leu Ala Leu Tyr Gly

                485                 490                 495

cta atg ttc ggt cct ata aac gtg act caa gag acc aga tcg aac cgt    1536

Leu Met Phe Gly Pro Ile Asn Val Thr Gln Glu Thr Arg Ser Asn Arg

            500                 505                 510

tgt aac agt atg ttt cca tat tgg gca agg cgc agt gtc gtg tat gtg    1584

Cys Asn Ser Met Phe Pro Tyr Trp Ala Arg Arg Ser Val Val Tyr Val

        515                 520                 525

gtg att ctg ttt gtt ctt cca gtc ata aac ggt ctt ttg cca ttt gca    1632

Val Ile Leu Phe Val Leu Pro Val Ile Asn Gly Leu Leu Pro Phe Ala

    530                 535                 540

aca ttt ggt gaa tgg aga gac ttc gct atg tat cac ctt cat ggt ggg    1680

Thr Phe Gly Glu Trp Arg Asp Phe Ala Met Tyr His Leu His Gly Gly

545                 550                 555                 560

tct gac tat gct tga                                                1695

Ser Asp Tyr Ala

<210>18

<211>564

<212>PRT

<213>拟南芥菜

<400>18

Met Glu Ala Leu Leu Leu Pro Pro Ser Pro Glu Pro Gln Asn Gln Ile

1               5                   10                  15

Thr Asn Pro Ala Asn Ser Lys Pro Asn His Gln Ser Gly Asp Val His

            20                  25                  30

Lys Asp Glu Thr Met Met Met Lys Lys Lys Lys Asp Thr Asn Pro Ser

        35                  40                  45

Asn Leu Glu Lys Arg Lys Leu Lys Gly Lys Lys Lys Glu Ile Met Asp

    50                  55                  60

Asn Asp Glu Ala Ser Ser Ser Tyr Cys Ser Thr Ser Ser Thr Ser Asn

65                  70                  75                  80

Ser Asn Ser Thr Lys Arg Val Thr Arg Val Val His Arg Leu Arg Asn

                85                  90                  95

Pro Met Arg Leu Gly Met Ala Arg Arg Ser Val Gly Glu Arg Gln Ala

            100                 105                 110

Glu Lys Leu Ala Lys Pro Leu Gly Phe Ser Leu Ala Ala Phe Ala Asn

        115                 120                 125

Met Val Ile Ala Arg Lys Asn Ala Ala Gly Gln Asn Val Tyr Val Asp

    130                 135                 140

Asp Leu Val Glu Ile Phe Ala Thr Leu Val Glu Glu Ser Leu Ala Asn

145                 150                 155                 160

Val Tyr Gly Asn Lys Leu Gly Ser Phe Ala Thr Asn Phe Glu Gln Thr

                165                 170                 175

Phe Ser Ser Thr Leu Lys Ile Leu Lys Leu Thr Asn Glu Cys Ala Asn

            180                 185                 190

Pro His Gln Ser Asn Asn Asn Asp Gly Gly Ser Cys Asn Leu Asp Arg

        195                 200                 205

Ser Thr Ile Asp Gly Cys Ser Asp Thr Glu Leu Phe Glu Arg Glu Thr

    210                 215                 220

Ser Ser Ala Thr Ser Ala Tyr Glu Val Met Gln Gly Ser Ala Thr Ala

225                 230                 235                 240

Thr Ser Leu Met Asn Glu Leu Ala Leu Phe Glu Glu Thr Leu Gln Leu

                245                 250                 255

Ser Cys Val Pro Pro Arg Ser Ser Ala Met Ala Leu Thr Thr Asp Glu

            260                 265                 270

Arg Phe Leu Lys Glu Gln Thr Arg Ala Asn Asp Leu Lys Thr Val Glu

        275                 280                 285

Ile Gly Leu Gln Ile Arg Glu Leu Arg Cys Lys Glu Thr Ala Leu Gly

    290                 295                 300

Leu Lys Phe Glu Ser Asn Asn Leu Gly Lys Ala Ala Leu Glu Leu Asp

305                 310                 315                 320

Val Ser Lys Ala Ala Phe Arg Ala Glu Lys Phe Lys Thr Glu Leu Glu

                325                 330                 335

Asp Thr Arg Lys Glu Glu Met Val Thr Arg Ile Met Asp Trp Leu Leu

            340                 345                 350

Val Ser Val Phe Ser Met Leu Ala Ser Met Val Leu Gly Val Tyr Asn

        355                 360                 365

Phe Ser Ile Lys Arg Ile Glu Asp Ala Thr Ser Val Cys Asp Gln Ser

    370                 375                 380

Glu Glu Lys Ser Ser Ser Trp Trp Val Pro Lys Gln Val Ser Ser Ile

385                 390                 395                 400

Asn Ser Gly Phe Asn Thr Phe Ile Cys Arg Val Arg Val Trp Val Gln

                405                 410                 415

Ile Phe Phe Gly Val Leu Met Ile Ile Val Phe Thr Tyr Phe Leu Asn

            420                 425                 430

Lys Arg Ser Ser Gly Thr Lys Gln Thr Met Pro Ile Ser Phe Ile Val

        435                 440                 445

Leu Phe Leu Gly Ile Phe Cys Gly Val Ser Gly Lys Leu Cys Val Asp

    450                 455                 460

Thr Leu Gly Gly Asp Gly Lys Leu Trp Leu Ile Val Trp Glu Val Phe

465                 470                 475                 480

Cys Leu Leu Gln Phe Val Ala Asn Val Phe Thr Leu Ala Leu Tyr Gly

                485                 490                 495

Leu Met Phe Gly Pro Ile Asn Val Thr Gln Glu Thr Arg Ser Asn Arg

            500                 505                 510

Cys Asn Ser Met Phe Pro Tyr Trp Ala Arg Arg Ser Val Val Tyr Val

        515                 520                 525

Val Ile Leu Phe Val Leu Pro Val Ile Asn Gly Leu Leu Pro Phe Ala

    530                 535                 540

Thr Phe Gly Glu Trp Arg Asp Phe Ala Met Tyr His Leu Hi s Gly Gly

545                 550                 555                 560

Ser Asp Tyr Ala

<210>19

<211>321

<212>DNA

<213>稻

<220>

<221>CDS

<222>(1)..(321)

<223>编码稻的植物疾病抗性聚蛋白样[gb XM_465297]

<400>19

atg ggg aag aaa agg aaa ggg gag gga gtc ctc acc gga ggg gac ggc     48

Met Gly Lys Lys Arg Lys Gly Glu Gly Val Leu Thr Gly Gly Asp Gly

1               5                   10                  15

ggc gtc cgg cga cga gga acg acg gag gga ggt cga cac gcg gcg gac     96

Gly Val Arg Arg Arg Gly Thr Thr Glu Gly Gly Arg His Ala Ala Asp

            20                  25                  30

ggc gac cgg gac gac cta aag agc gaa aag aaa gag gtt aga gag gaa    144

Gly Asp Arg Asp Asp Leu Lys Ser Glu Lys Lys Glu Val Arg Glu Glu

        35                  40                  45

gag agg ggc cat agg aga cgg gaa tgc cgg ccg aaa gcg gcg gac atg    192

Glu Arg Gly His Arg Arg Arg Glu Cys Arg Pro Lys Ala Ala Asp Met

    50                  55                  60

gcg acc ctc acc tac gca cga tgg gaa tgg cgc tcc ggc gac gaa cct    240

Ala Thr Leu Thr Tyr Ala Arg Trp Glu Trp Arg Ser Gly Asp Glu Pro

65                  70                  75                  80

cga cga agg agg ggt gga cgg ggt gga tct cgg cca cgc gaa ccc gac    288

Arg Arg Arg Arg Gly Gly Arg Gly Gly Ser Arg Pro Arg Glu Pro Asp

                85                  90                  95

ggc ggc gac ggc gcg gtg cgg cgg cga gcc tag                        321

Gly Gly Asp Gly Ala Val Arg Arg Arg Ala

            100                 105

<210>20

<211>106

<212>PRT

<213>稻

<400>20

Met Gly Lys Lys Arg Lys Gly Glu Gly Val Leu Thr Gly Gly Asp Gly

1               5                   10                  15

Gly Val Arg Arg Arg Gly Thr Thr Glu Gly Gly Arg His Ala Ala Asp

            20                  25                  30

Gly Asp Arg Asp Asp Leu Lys Ser Glu Lys Lys Glu Val Arg Glu Glu

        35                  40                  45

Glu Arg Gly His Arg Arg Arg Glu Cys Arg Pro Lys Ala Ala Asp Met

    50                  55                  60

Ala Thr Leu Thr Tyr Ala Arg Trp Glu Trp Arg Ser Gly Asp Glu Pro

65                  70                  75                  80

Arg Arg Arg Arg Gly Gly Arg Gly Gly Ser Arg Pro Arg Glu Pro Asp

                85                  90                  95

Gly Gly Asp Gly Ala Val Arg Arg Arg Ala

            100                 105

<210>21

<211>714

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<220>

<221>CDS

<222>(1)..(714)

<223>编码酿酒酵母归巢内切核酸酶I-SceI

<400>21

atg cat atg aaa aac atc aaa aaa aac cag gta atg aac ctc ggt ccg     48

Met His Met Lys Asn Ile Lys Lys Asn Gln Val Met Asn Leu Gly Pro

1               5                   10                  15

aac tct aaa ctg ctg aaa gaa tac aaa tcc cag ctg atc gaa ctg aac     96

Asn Ser Lys Leu Leu Lys Glu Tyr Lys Ser Gln Leu Ile Glu Leu Asn

            20                  25                  30

atc gaa cag ttc gaa gca ggt atc ggt ctg atc ctg ggt gat gct tac    144

Ile Glu Gln Phe Glu Ala Gly Ile Gly Leu Ile Leu Gly Asp Ala Tyr

        35                  40                  45

atc cgt tct cgt gat gaa ggt aaa acc tac tgt atg cag ttc gag tgg    192

Ile Arg Ser Arg Asp Glu Gly Lys Thr Tyr Cys Met Gln Phe Glu Trp

    50                  55                  60

aaa aac aaa gca tac atg gac cac gta tgt ctg ctg tac gat cag tgg    240

Lys Asn Lys Ala Tyr Met Asp His Val Cys Leu Leu Tyr Asp Gln Trp

65                  70                  75                  80

gta ctg tcc ccg ccg cac aaa aaa gaa cgt gtt aac cac ctg ggt aac    288

Val Leu Ser Pro Pro His Lys Lys Glu Arg Val Asn His Leu Gly Asn

                85                  90                  95

ctg gta atc acc tgg ggc gcc cag act ttc aaa cac caa gct ttc aac    336

Leu Val Ile Thr Trp Gly Ala Gln Thr Phe Lys His Gln Ala Phe Asn

            100                 105                 110

aaa ctg gct aac ctg ttc atc gtt aac aac aaa aaa acc atc ccg aac    384

Lys Leu Ala Asn Leu Phe Ile Val Asn Asn Lys Lys Thr Ile Pro Asn

        115                 120                 125

aac ctg gtt gaa aac tac ctg acc ccg atg tct ctg gca tac tgg ttc    432

Asn Leu Val Glu Asn Tyr Leu Thr Pro Met Ser Leu Ala Tyr Trp Phe

    130                 135                 140

atg gat gat ggt ggt aaa tgg gat tac aac aaa aac tct acc aac aaa    480

Met Asp Asp Gly Gly Lys Trp Asp Tyr Asn Lys Asn Ser Thr Asn Lys

145                 150                 155                 160

tcg atc gta ctg aac acc cag tct ttc act ttc gaa gaa gta gaa tac    528

Ser Ile Val Leu Asn Thr Gln Ser Phe Thr Phe Glu Glu Val Glu Tyr

                165                 170                 175

ctg gtt aag ggt ctg cgt aac aaa ttc caa ctg aac tgt tac gta aaa    576

Leu Val Lys Gly Leu Arg Asn Lys Phe Gln Leu Asn Cys Tyr Val Lys

            180                 185                 190

atc aac aaa aac aaa ccg atc atc tac atc gat tct atg tct tac ctg    624

Ile Asn Lys Asn Lys Pro Ile Ile Tyr Ile Asp Ser Met Ser Tyr Leu

        195                 200                 205

atc ttc tac aac ctg atc aaa ccg tac ctg atc ccg cag atg atg tac    672

Ile Phe Tyr Asn Leu Ile Lys Pro Tyr Leu Ile Pro Gln Met Met Tyr

    210                 215                 220

aaa ctg ccg aac act atc tcc tcc gaa act ttc ctg aaa taa            714

Lys Leu Pro Asn Thr Ile Ser Ser Glu Thr Phe Leu Lys

225                 230                 235

<210>22

<211>237

<212>PRT

<213>酿酒酵母

<400>22

Met His Met Lys Asn Ile Lys Lys Asn Gln Val Met Asn Leu Gly Pro

1               5                   10                  15

Asn Ser Lys Leu Leu Lys Glu Tyr Lys Ser Gln Leu Ile Glu Leu Asn

            20                  25                  30

Ile Glu Gln Phe Glu Ala Gly Ile Gly Leu Ile Leu Gly Asp Ala Tyr

        35                  40                  45

Ile Arg Ser Arg Asp Glu Gly Lys Thr Tyr Cys Met Gln Phe Glu Trp

    50                  55                  60

Lys Asn Lys Ala Tyr Met Asp His Val Cys Leu Leu Tyr Asp Gln Trp

65                  70                  75                  80

Val Leu Ser Pro Pro His Lys Lys Glu Arg Val Asn His Leu Gly Asn

                85                  90                  95

Leu Val Ile Thr Trp Gly Ala Gln Thr Phe Lys His Gln Ala Phe Asn

            100                 105                 110

Lys Leu Ala Asn Leu Phe Ile Val Asn Asn Lys Lys Thr Ile Pro Asn

        115                 120                 125

Asn Leu Val Glu Asn Tyr Leu Thr Pro Met Ser Leu Ala Tyr Trp Phe

    130                 135                 140

Met Asp Asp Gly Gly Lys Trp Asp Tyr Asn Lys Asn Ser Thr Asn Lys

145                 150                 155                 160

Ser Ile Val Leu Asn Thr Gln Ser Phe Thr Phe Glu Glu Val Glu Tyr

                165                 170                 175

Leu Val Lys Gly Leu Arg Asn Lys Phe Gln Leu Asn Cys Tyr Val Lys

            180                 185                 190

Ile Asn Lys Asn Lys Pro Ile Ile Tyr Ile Asp Ser Met Ser Tyr Leu

        195                 200                 205

Ile Phe Tyr Asn Leu Ile Lys Pro Tyr Leu Ile Pro Gln Met Met Tyr

    210                 215                 220

Lys Leu Pro Asn Thr Ile Ser Ser Glu Thr Phe Leu Lys

225                 230                 235

<210>23

<211>897

<212>DNA

<213>人工的

<220>

<223>编码包含内含子的酿酒酵母归巢内切核酸酶I-SceI

<220>

<221>misc_feature

<222>(1)..(897)

<223>编码酿酒酵母归巢内切核酸酶I-SceI

<400>23

atgaaaaaca tcaaaaaaaa ccaggtaatg aacctgggtc cgaactctaa actgctgaaa     60

gaatacaaat cccagctgat cgaactgaac atcgaacagt tcgaagcagg tatcggtctg    120

atcctgggtg atgcttacat ccgttctcgt gatgaaggta aaacctactg tatgcagttc    180

gagtggaaaa acaaagcata catggaccac gtatgtctgc tgtacgatca gtgggtactg    240

tccccgccgc acaaaaaaga acgtgttaac cacctgggta acctggtaat cacctggggc    300

gcccagactt tcaaacacca agctttcaac aaactggcta gcctgttcat cgttaacaac    360

aaaaaaacca tcccgaacaa cctggttgaa aactacctga ccccgatgtc tctggcatac    420

tggttcatgg atgatggtgg taaatgggat tacaacaaaa actctaccaa caaatcgatc    480

gtactgaaca cccagtcttt cactttcgaa gaagtagaat acctggttaa gggtctgcgt    540

aacaaattcc aactgaactg ttacgtaagt ttctgcttct acctttgata tatatataat    600

aattatcatt aattagtagt aatataatat ttcaaatatt tttttcaaaa taaaagaatg    660

tagtatatag caattgcttt tctgtagttt ataagtgtgt atattttaat ttataacttt    720

tctaatatat gaccaaaatt tgttgatgtg caggtaaaaa tcaacaaaaa caaaccgatc    780

atctacatcg attctatgtc ttacctgatc ttctacaacc tgatcaaacc gtacctgatc    840

ccgcagatga tgtacaaact gccgaacact atctcctccg aaactttcct gaaataa       897

<210>24

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>24

atcccgggcg gactgtcgtg g                                               21

<210>25

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>25

gcgagctcgg cacgcaactg c    21

<210>26

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>26

atcccgggct tcgggagttt a    21

<210>27

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>27

ggcgttaacc ttgggtgcac a    21

<210>28

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>28

aaaatcaaaa ccttctcttc t    21

<210>29

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>29

caagttaaca tttttctgtt t    21

<210>30

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>30

atgccgccgc cgccgagatg c    21

<210>31

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>31

tcattgcaag ctatcaaaga a    21

<210>32

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>32

atggcccggc tgctactctc c    21

<210>33

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>33

ttagttagca gggtcggtct g    21

<210>34

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>34

atggataaca cgttggtggc a    21

<210>35

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>35

tcagttgtca tcgacttctg a    21

<210>36

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>36

atggaagccc tcctcctccc t    21

<210>37

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>37

tcaagcatag tcagacccac c    21

<210>38

<211>22

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>38

atggggaaga aaaggaaagg gg    22

<210>39

<211>22

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>39

ctaggctcgc cgccgcaccg cg    22

<210>40

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>40

atgcatatga aaaacatcaa a    21

<210>41

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>41

ttatttcagg aaagtttcgg a    21

<210>42

<211>594

<212>DNA

<213>大麦(Hordeum vulgare)

<220>

<221>CDS

<222>(1)..(594)

<223>核苷酸序列,其编码HvRACB(RACB,来自大麦的GTP酶)

<400>42

atg agc gcg tcc agg ttc ata aag tgc gtc acc gtg ggg gac ggc gcc     48

Met Ser Ala Ser Arg Phe Ile Lys Cys Val Thr Val Gly Asp Gly Ala

1               5                   10                  15

gtc ggc aag acc tgc atg ctc atc tcc tac acc tcc aac acc ttc ccc     96

Val Gly Lys Thr Cys Met Leu Ile Ser Tyr Thr Ser Asn Thr Phe Pro

            20                  25                  30

acc gac tat gtg ccc acg gtg ttt gac aac ttc agt gct aat gtt gtg    144

Thr Asp Tyr Val Pro Thr Val Phe Asp Asn Phe Ser Ala Asn Val Val

        35                  40                  45

gtt gat ggc aac act gtc aac ctt ggg cta tgg gat act gca ggt cag    192

Val Asp Gly Asn Thr Val Asn Leu Gly Leu Trp Asp Thr Ala Gly Gln

    50                  55                  60

gaa gac tac aac aga ctg aga ccg ctg agt tat cgt gga gct gat gtc    240

Glu Asp Tyr Asn Arg Leu Arg Pro Leu Ser Tyr Arg Gly Ala Asp Val

65                  70                  75                  80

ttc ctt ctg gcc ttc tcg ctt atc agc aag gct agc tat gag aat gtt    288

Phe Leu Leu Ala Phe Ser Leu Ile Ser Lys Ala Ser Tyr Glu Asn Val

                85                  90                  95

tca aag aag tgg ata cct gaa ctg aag cat tat gca cca ggt gtg cct    336

Ser Lys Lys Trp Ile Pro Glu Leu Lys His Tyr Ala Pro Gly Val Pro

            100                  105                110

att atc ctc gtg gga aca aag ctt gat ctt cga gat gac aag cag ttc    384

Ile Ile Leu Val Gly Thr Lys Leu Asp Leu Arg Asp Asp Lys Gln Phe

        115                 120                 125

ttt gtg gac cat cct ggt gct gtt cct atc act act gct cag ggg gag    432

Phe Val Asp His Pro Gly Ala Val Pro Ile Thr Thr Ala Gln Gly Glu

    130                 135                 140

gaa cta aaa aag tta ata ggc gca ccc tac tac atc gaa tgc agc tcg    480

Glu Leu Lys Lys Leu Ile Gly Ala Pro Tyr Tyr Ile Glu Cys Ser Ser

145                 150                 155                 160

aag acc caa cta aat gtc aag ggt gta ttt gat gcg gca ata aag gtg    528

Lys Thr Gln Leu Asn Val Lys Gly Val Phe Asp Ala Ala Ile Lys Val

                165                 170                 175

gta ctg cag cca cca aag gca aag aag aag aaa aag gcg cag agg ggg    576

Val Leu Gln Pro Pro Lys Ala Lys Lys Lys Lys Lys Ala Gln Arg Gly

            180                 185                 190

gct tgc tcc atc ttg tga                                            594

Ala Cys Ser Ile Leu

        195

<210>43

<211>197

<212>PRT

<213>大麦

<400>43

Met Ser Ala Ser Arg Phe Ile Lys Cys Val Thr Val Gly Asp Gly Ala

1               5                   10                  15

Val Gly Lys Thr Cys Met Leu Ile Ser Tyr Thr Ser Asn Thr Phe Pro

            20                  25                  30

Thr Asp Tyr Val Pro Thr Val Phe Asp Asn Phe Ser Ala Asn Val Val

        35                  40                  45

Val Asp Gly Asn Thr Val Asn Leu Gly Leu Trp Asp Thr Ala Gly Gln

    50                  55                  60

Glu Asp Tyr Asn Arg Leu Arg Pro Leu Ser Tyr Arg Gly Ala Asp Val

65                  70                  75                  80

Phe Leu Leu Ala Phe Ser Leu Ile Ser Lys Ala Ser Tyr Glu Asn Val

                85                  90                  95

Ser Lys Lys Trp Ile Pro Glu Leu Lys His Tyr Ala Pro Gly Val Pro

            100                 105                 110

Ile Ile Leu Val Gly Thr Lys Leu Asp Leu Arg Asp Asp Lys Gln Phe

        115                 120                 125

Phe Val Asp His Pro Gly Ala Val Pro Ile Thr Thr Ala Gln Gly Glu

    130                 135                 140

Glu Leu Lys Lys Leu Ile Gly Ala Pro Tyr Tyr Ile Glu Cys Ser Ser

145                 150                 155                 160

Lys Thr Gln Leu Asn Val Lys Gly Val Phe Asp Ala Ala Ile Lys Val

                165                 170                 175

Val Leu Gln Pro Pro Lys Ala Lys Lys Lys Lys Lys Ala Gln Arg Gly

            180                 185                 190

Ala Cys Ser Ile Leu

        195

<210>44

<211>564

<212>DNA

<213>大麦

<220>

<221>CDS

<222>(1)..(564)

<223>核苷酸序列,其编码BAX抑制物1(大麦抗凋亡基因)

<400>44

atg cgc ttg aat atc ggt gga acc att act aag ctt gga tgg gtt tta     48

Met Arg Leu Asn Ile Gly Gly Thr Ile Thr Lys Leu Gly Trp Val Leu

1               5                   10                  15

agt tta ttg gag cat gtg gtt tct tgt cct cca tat aaa cat aaa ata     96

Ser Leu Leu Glu His Val Val Ser Cys Pro Pro Tyr Lys His Lys Ile

            20                  25                  30

agg ttt tca ctt ctg ctt ctc ttt ggt gtt ctt cat ggg gct tca gtt    144

Arg Phe Ser Leu Leu Leu Leu Phe Gly Val Leu His Gly Ala Ser Val

        35                  40                  45

ggt cca tgt atc aag tcc aca atc gat att gat tca agc atc ctt atc    192

Gly Pro Cys Ile Lys Ser Thr Ile Asp Ile Asp Ser Ser Ile Leu Ile

    50                  55                  60

acc gcg ttc tta gga act gcg gtg ata ttt ttc tgt ttc tcg gca gtg    240

Thr Ala Phe Leu Gly Thr Ala Val Ile Phe Phe Cys Phe Ser Ala Val

65                  70                  75                  80

gca atg ctg gca aga cgc agg gag tat atc tac ctc gga gga ctg ctt    288

Ala Met Leu Ala Arg Arg Arg Glu Tyr Ile Tyr Leu Gly Gly Leu Leu

                85                  90                  95

tcg tct ggc ttt tcc ttg cta acg tgg ctc aag aat tct gat cag ttt    336

Ser Ser Gly Phe Ser Leu Leu Thr Trp Leu Lys Asn Ser Asp Gln Phe

            100                 105                 110

gcc tct gcg aca gtt gag att cag atg tac ctt gga ctc ctg ctc ttc    384

Ala Ser Ala Thr Val Glu Ile Gln Met Tyr Leu Gly Leu Leu Leu Phe

        115                 120                 125

gtg gga tgt ata gtg gtg aac aca cag gag ata ata gag aaa gca cac    432

Val Gly Cys Ile Val Val Asn Thr Gln Glu Ile Ile Glu Lys Ala His

    130                 135                 140

tgt ggt gac atg gac tac gcg gta cat tcg ctg atc ctt tac att ggc    480

Cys Gly Asp Met Asp Tyr Ala Val His Ser Leu Ile Leu Tyr Ile Gly

145                 150                 155                 160

ttt gta cgt gtg ttc ctt caa att ctc agt ata atg tgg aat acc tct    528

Phe Val Arg Val Phe Leu Gln Ile Leu Ser Ile Met Trp Asn Thr Ser

                165                 170                 175

gcc gat aga ata aga aga aat aat gaa gaa act tag                    564

Ala Asp Arg Ile Arg Arg Asn Asn Glu Glu Thr

            180                 185

<210>45

<211>187

<212>PRT

<213>大麦

<400>45

Met Arg Leu Asn Ile Gly Gly Thr Ile Thr Lys Leu Gly Trp Val Leu

1               5                   10                  15

Ser Leu Leu Glu His Val Val Ser Cys Pro Pro Tyr Lys His Lys Ile

            20                  25                  30

Arg Phe Ser Leu Leu Leu Leu Phe Gly Val Leu His Gly Ala Ser Val

        35                  40                  45

Gly Pro Cys Ile Lys Ser Thr Ile Asp Ile Asp Ser Ser Ile Leu Ile

    50                  55                  60

Thr Ala Phe Leu Gly Thr Ala Val Ile Phe Phe Cys Phe Ser Ala Val

65                  70                  75                  80

Ala Met Leu Ala Arg Arg Arg Glu Tyr Ile Tyr Leu Gly Gly Leu Leu

                85                  90                  95

Ser Ser Gly Phe Ser Leu Leu Thr Trp Leu Lys Asn Ser Asp Gln Phe

            100                 105                 110

Ala Ser Ala Thr Val Glu Ile Gln Met Tyr Leu Gly Leu Leu Leu Phe

        115                 120                 125

Val Gly Cys Ile Val Val Asn Thr Gln Glu Ile Ile Glu Lys Ala His

    130                 135                 140

Cys Gly Asp Met Asp Tyr Ala Val His Ser Leu Ile Leu Tyr Ile Gly

145                 150                 155                 160

Phe Val Arg Val Phe Leu Gln Ile Leu Ser Ile Met Trp Asn Thr Ser

                165                 170                 175

Ala Asp Arg Ile Arg Arg Asn Asn Glu Glu Thr

            180                 185

<210>46

<211>375

<212>DNA

<213>大麦

<220>

<221>CDS

<222>(1)..(375)

<223>核苷酸序列,其编码HvADF3(肌动蛋白解聚因子3)

<400>46

atg gct aat gca gca tca gga atg gca gtc cat gat gac tgc aag ctg     48

Met Ala Asn Ala Ala Ser Gly Met Ala Val His Asp Asp Cys Lys Leu

1               5                   10                  15

aaa ttt atg gaa ttg aag acg aaa agg aca cac cgt ttc atc att tac     96

Lys Phe Met Glu Leu Lys Thr Lys Arg Thr His Arg Phe Ile Ile Tyr

            20                  25                  30

aag att gag gag ctg cag aaa caa gtg att gtt gag aaa atc ggt gaa    144

Lys Ile Glu Glu Leu Gln Lys Gln Val Ile Val Glu Lys Ile Gly Glu

        35                  40                  45

ccg ggt caa acc cat gag gac ctt gct gca agt ctt cca gct gat gaa    192

Pro Gly Gln Thr His Glu Asp Leu Ala Ala Ser Leu Pro Ala Asp Glu

    50                  55                  60

tgc cgc tat gcc att ttc gat ttt gat ttt gtc agt tct gag ggt gtc    240

Cys Arg Tyr Ala Ile Phe Asp Phe Asp Phe Val Ser Ser Glu Gly Val

65                  70                  75                  80

cca agg agc agg att ttt ttc gtg gca tgg tct ccg gac aca gca aga    288

Pro Arg Ser Arg Ile Phe Phe Val Ala Trp Ser Pro Asp Thr Ala Arg

                85                  90                  95

aga gaa cta gac gga att cag gtc gag ctt cag gca acc gat cca acc    336

Arg Glu Leu Asp Gly Ile Gln Val Glu Leu Gln Ala Thr Asp Pro Thr

            100                 105                 110

gag atg gat ctt gat gtt ttc aaa agc cga gcc aat tga                375

Glu Met Asp Leu Asp Val Phe Lys Ser Arg Ala Asn

        115                 120

<210>47

<211>124

<212>PRT

<213>大麦

<400>47

Met Ala Asn Ala Ala Ser Gly Met Ala Val His Asp Asp Cys Lys Leu

1               5                   10                  15

Lys Phe Met Glu Leu Lys Thr Lys Arg Thr His Arg Phe Ile Ile Tyr

            20                  25                  30

Lys Ile Glu Glu Leu Gln Lys Gln Val Ile Val Glu Lys Ile Gly Glu

        35                  40                  45

Pro Gly Gln Thr His Glu Asp Leu Ala Ala Ser Leu Pro Ala Asp Glu

    50                  55                  60

Cys Arg Tyr Ala Ile Phe Asp Phe Asp Phe Val Ser Ser Glu Gly Val

65                  70                  75                  80

Pro Arg Ser Arg Ile Phe Phe Val Ala Trp Ser Pro Asp Thr Ala Arg

                85                  90                  95

Arg Glu Leu Asp Gly Ile Gln Val Glu Leu Gln Ala Thr Asp Pro Thr

            100                 105                 110

Glu Met Asp Leu Asp Val Phe Lys Ser Arg Ala Asn

        115                 120

<210>48

<211>930

<212>DNA

<213>大麦

<220>

<221>CDS

<222>(1)..(930)

<223>核苷酸序列,其编码HvSNAP34(参与囊泡运输的ROR2的t-SNARE相互作用子)

<400>48

atg agc gcc acc agg ccc tcc ttc ttc ccc tcc aac aac aac agg aac     48

Met Ser Ala Thr Arg Pro Ser Phe Phe Pro Ser Asn Asn Asn Arg Asn

1               5                   10                  15

aag ccc gcc acc cgg aac ccc ttc gac tcc gac tcg gac gac gac ggc     96

Lys Pro Ala Thr Arg Asn Pro Phe Asp Ser Asp Ser Asp Asp Asp Gly

            20                  25                  30

ggc atg gcc cgg cgc ggc ccg gcg cgg gcc tcg tcc gtc ccg acc ccc    144

Gly Met Ala Arg Arg Gly Pro Ala Arg Ala Ser Ser Val Pro Thr Pro

        35                  40                  45

gcc gcg ggg ccg gcc agg gcc tcc tcg gcc ccg atc ccc gcc gac gag    192

Ala Ala Gly Pro Ala Arg Ala Ser Ser Ala Pro Ile Pro Ala Asp Glu

    50                  55                   60

gcg gac cag cgg ggc gcc ctg ttc ggc gcg ggc ccc gcg ccg tcc ggc    240

Ala Asp Gln Arg Gly Ala Leu Phe Gly Ala Gly Pro Ala Pro Ser Gly

65                  70                  75                  80

ttc gcg tcc tcc tcc tcc gcg gcc gcc agg ggc cgg tac agg aac gac    288

Phe Ala Ser Ser Ser Ser Ala Ala Ala Arg Gly Arg Tyr Arg Asn Asp

                85                  90                  95

ttc cgc gac tcg ggc ggc gtg gag gcg cag tcc gtg cag gag ctc gag    336

Phe Arg Asp Ser Gly Gly Val Glu Ala Gln Ser Val Gln Glu Leu Glu

            100                 105                 110

ggc tac gcg gcc tac aag gcc gag gag acc acg cgc cgg gtc gac ggc    384

Gly Tyr Ala Ala Tyr Lys Ala Glu Glu Thr Thr Arg Arg Val Asp Gly

        115                 120                 125

tgc ctc cgg gtc gcc gag gag atg cgg gac acc gcg tca aag acc ctg    432

Cys Leu Arg Val Ala Glu Glu Met Arg Asp Thr Ala Ser Lys Thr Leu

    130                 135                 140

ctc cag gtg cac cag cag ggc cag cag atc agg cgc acc cac gcc atg    480

Leu Gln Val His Gln Gln Gly Gln Gln Ile Arg Arg Thr His Ala Met

145                 150                 155                 160

gcc gtc gac atc gac cag gat ctc tcc agg ggg gaa aag cta cta ggt    528

Ala Val Asp Ile Asp Gln Asp Leu Ser Arg Gly Glu Lys Leu Leu Gly

                165                 170                 175

gat ctt ggt ggt ttg ttt tcc aag aag tgg aag cca aag aag aac ggc    576

Asp Leu Gly Gly Leu Phe Ser Lys Lys Trp Lys Pro Lys Lys Asn Gly

            180                 185                 190

gca atc agg ggc cct atg ctg acc aga gac gat tcc ttc ata cgc aag    624

Ala Ile Arg Gly Pro Met Leu Thr Arg Asp Asp Ser Phe Ile Arg Lys

        195                 200                 205

ggc agc cat atg gag cag agg cat aaa ctg ggg ctg tca gat cgt ccg    672

Gly Ser His Met Glu Gln Arg His Lys Leu Gly Leu Ser Asp Arg Pro

    210                 215                 220

cat cga tcc aat gca cgc cag ttc cta tct gaa ccc aca tca ggc ctt    720

His Arg Ser Asn Ala Arg Gln Phe Leu Ser Glu Pro Thr Ser Gly Leu

225                 230                 235                 240

gag aaa gtc gag gtg gag aag gca aag cag gat gat ggc ctg tct gac    768

Glu Lys Val Glu Val Glu Lys Ala Lys Gln Asp Asp Gly Leu Ser Asp

                245                 250                 255

ctt agc gac ata ctg aca gag ttg aaa gga atg gcc att gac atg gga    816

Leu Ser Asp Ile Leu Thr Glu Leu Lys Gly Met Ala Ile Asp Met Gly

            260                 265                 270

act gag att gag ggg caa aca aag gat ctt ggt cat gcg gag aag gac    864

Thr Glu Ile Glu Gly Gln Thr Lys Asp Leu Gly His Ala Glu Lys Asp

        275                 280                 285

ttt gac gaa ctt aac tac agg gtc aag ggg gca aac gct cga aca cgt    912

Phe Asp Glu Leu Asn Tyr Arg Val Lys Gly Ala Asn Ala Arg Thr Arg

    290                 295                 300

cgc ctg ctt ggc aga tag                                            930

Arg Leu Leu Gly Arg

305

<210>49

<211>309

<212>PRT

<213>大麦

<400>49

Met Ser Ala Thr Arg Pro Ser Phe Phe Pro Ser Asn Asn Asn Arg Asn

1               5                   10                  15

Lys Pro Ala Thr Arg Asn Pro Phe Asp Ser Asp Ser Asp Asp Asp Gly

            20                  25                  30

Gly Met Ala Arg Arg Gly Pro Ala Arg Ala Ser Ser Val Pro Thr Pro

        35                  40                  45

Ala Ala Gly Pro Ala Arg Ala Ser Ser Ala Pro Ile Pro Ala Asp Glu

    50                  55                  60

Ala Asp Gln Arg Gly Ala Leu Phe Gly Ala Gly Pro Ala Pro Ser Gly

65                  70                  75                  80

Phe Ala Ser Ser Ser Ser Ala Ala Ala Arg Gly Arg Tyr Arg Asn Asp

                85                  90                  95

Phe Arg Asp Ser Gly Gly Val Glu Ala Gln Ser Val Gln Glu Leu Glu

            100                 105                 110

Gly Tyr Ala Ala Tyr Lys Ala Glu Glu Thr Thr Arg Arg Val Asp Gly

        115                 120                 125

Cys Leu Arg Val Ala Glu Glu Met Arg Asp Thr Ala Ser Lys Thr Leu

    130                 135                 140

Leu Gln Val His Gln Gln Gly Gln Gln Ile Arg Arg Thr His Ala Met

145                 150                 155                 160

Ala Val Asp Ile Asp Gln Asp Leu Ser Arg Gly Glu Lys Leu Leu Gly

                165                 170                 175

Asp Leu Gly Gly Leu Phe Ser Lys Lys Trp Lys Pro Lys Lys Asn Gly

            180                 185                 190

Ala Ile Arg Gly Pro Met Leu Thr Arg Asp Asp Ser Phe Ile Arg Lys

        195                 200                 205

Gly Ser His Met Glu Gln Arg His Lys Leu Gly Leu Ser Asp Arg Pro

    210                 215                 220

His Arg Ser Asn Ala Arg Gln Phe Leu Ser Glu Pro Thr Ser Gly Leu

225                 230                 235                 240

Glu Lys Val Glu Val Glu Lys Ala Lys Gln Asp Asp Gly Leu Ser Asp

                245                 250                 255

Leu Ser Asp Ile Leu Thr Glu Leu Lys Gly Met Ala Ile Asp Met Gly

            260                 265                 270

Thr Glu Ile Glu Gly Gln Thr Lys Asp Leu Gly His Ala Glu Lys Asp

        275                 280                 285

Phe Asp Glu Leu Asn Tyr Arg Val Lys Gly Ala Asn Ala Arg Thr Arg

    290                 295                 300

Arg Leu Leu Gly Arg

305

<210>50

<211>957

<212>DNA

<213>大麦

<220>

<221>CDS

<222>(1)..(957)

<223>核苷酸序列,其编码HvROR2(突触融合蛋白,SNAP34的相互作用子)

<400>50

atg aac aac ctc ttc tcg agc tcg tgg aag cgg gcg ggc gcg ggg ggc     48

Met Asn Asn Leu Phe Ser Ser Ser Trp Lys Arg Ala Gly Ala Gly Gly

1               5                   10                  15

gac ggg gac ctg gag tcg ggc ggc ggc ggc gtg gag atg acg gcg ccg     96

Asp Gly Asp Leu Glu Ser Gly Gly Gly Gly Val Glu Met Thr Ala Pro

            20                  25                  30

ccg ggc gcc gcg gcg ggg gcg agc ctg gac cgc ttc ttc gag gac gtg    144

Pro Gly Ala Ala Ala Gly Ala Ser Leu Asp Arg Phe Phe Glu Asp Val

        35                  40                  45

gag tcg atc aag gac gac ctg cgg gag ctg gag cgg atc cag cgc tcc    192

Glu Ser Ile Lys Asp Asp Leu Arg Glu Leu Glu Arg Ile Gln Arg Ser

    50                  55                  60

ctc cac gac ggc aac gag tcg ggc aag tcg ctc cac gac gcg tcg gcg    240

Leu His Asp Gly Asn Glu Ser Gly Lys Ser Leu His Asp Ala Ser Ala

65                  70                  75                  80

gtg cgc gcg ctc cgc tcc cgc atg gac gcc gac gtg gcc gcc gcc atc    288

Val Arg Ala Leu Arg Ser Arg Met Asp Ala Asp Val Ala Ala Ala Ile

                85                  90                  95

aag aag gcc aag gtg gtg aag ttg cgg ctc gag tcg ctc gac cgc gcc    336

Lys Lys Ala Lys Val Val Lys Leu Arg Leu Glu Ser Leu Asp Arg Ala

            100                 105                 110

aac gcc gcc aac cgg tcc gtg gcc ggg tgc ggg ccg ggg tcg tcc acg    384

Asn Ala Ala Asn Arg Ser Val Ala Gly Cys Gly Pro Gly Ser Ser Thr

        115                 120                 125

gac cgc acc cgc acc tcc gtc gtg gcc ggg ctg cgc aag aag ctg cgg 432

Asp Arg Thr Arg Thr Ser Val Val Ala Gly Leu Arg Lys Lys Leu Arg

    130                 135                 140

gat gcc atg gag tcc ttc tcc tcc ctc cgc tcc cgc atc acc tcc gag    480

Asp Ala Met Glu Ser Phe Ser Ser Leu Arg Ser Arg Ile Thr Ser Glu

145                 150                 155                 160

tac cgg gaa acc gtg gcc cgc cgc tac ttc acg gtg acg ggg tcc cag    528

Tyr Arg Glu Thr Val Ala Arg Arg Tyr Phe Thr Val Thr Gly Ser Gln

                165                 170                 175

ccc gac gag gcc acg ctg gac acg ctg gcg gag acg ggg gag ggg gag    576

Pro Asp Glu Ala Thr Leu Asp Thr Leu Ala Glu Thr Gly Glu Gly Glu

            180                 185                 190

cgg ctc ctg cag cgc gcc atc gcg gag cag cag ggg aga ggg gag gtg    624

Arg Leu Leu Gln Arg Ala Ile Ala Glu Gln Gln Gly Arg Gly Glu Val

        195                 200                 205

ctg ggc gtg gtg gcg gag atc cag gag cgg cac ggc gcc gtg gcg gac    672

Leu Gly Val Val Ala Glu Ile Gln Glu Arg His Gly Ala Val Ala Asp

    210                 215                 220

ctg gag cgg tcc ctg ctg gag ctg cag cag gtg ttc aac gac atg gcc    720

Leu Glu Arg Ser Leu Leu Glu Leu Gln Gln Val Phe Asn Asp Met Ala

225                 230                 235                 240

gtg ctg gtg gcg gcg cag ggg gag cag ctg gac gac atc gag ggc cac    768

Val Leu Val Ala Ala Gln Gly Glu Gln Leu Asp Asp Ile Glu Gly His

                245                 250                 255

gtc ggg cgg gcg agg tcg ttc gtc gac cgc ggg cgc gag cag ctg cag    816

Val Gly Arg Ala Arg Ser Phe Val Asp Arg Gly Arg Glu Gln Leu Gln

            260                 265                 270

gtg gca cgc aag cac cag aag agc tcc cgc aag tgg acc ttc atc ggc    864

Val Ala Arg Lys His Gln Lys Ser Ser Arg Lys Trp Thr Phe Ile Gly

        275                 280                 285

atc ggc atc ctg ctc gtc gtc atc ctc atc atc gtc atc ccc atc gtg    912

Ile Gly Ile Leu Leu Val Val Ile Leu Ile Ile Val Ile Pro Ile Val

    290                 295                 300

ctc aag aac acc aac aag agc aac aac aac aac agc cag cag tag        957

Leu Lys Asn Thr Asn Lys Ser Asn Asn Asn Asn Ser Gln Gln

305                 310                 315

<210>51

<211>318

<212>PRT

<213>大麦

<400>51

Met Asn Asn Leu Phe Ser Ser Ser Trp Lys Arg Ala Gly Ala Gly Gly

1               5                   10                  15

Asp Gly Asp Leu Glu Ser Gly Gly Gly Gly Val Glu Met Thr Ala Pro

            20                  25                  30

Pro Gly Ala Ala Ala Gly Ala Ser Leu Asp Arg Phe Phe Glu Asp Val

        35                  40                  45

Glu Ser Ile Lys Asp Asp Leu Arg Glu Leu Glu Arg Ile Gln Arg Ser

    50                  55                  60

Leu His Asp Gly Asn Glu Ser Gly Lys Ser Leu His Asp Ala Ser Ala

65                  70                  75                  80

Val Arg Ala Leu Arg Ser Arg Met Asp Ala Asp Val Ala Ala Ala Ile

                85                  90                  95

Lys Lys Ala Lys Val Val Lys Leu Arg Leu Glu Ser Leu Asp Arg Ala

            100                 105                 110

Asn Ala Ala Asn Arg Ser Val Ala Gly Cys Gly Pro Gly Ser Ser Thr

        115                 120                 125

Asp Arg Thr Arg Thr Ser Val Val Ala Gly Leu Arg Lys Lys Leu Arg

    130                 135                 140

Asp Ala Met Glu Ser Phe Ser Ser Leu Arg Ser Arg Ile Thr Ser Glu

145                 150                 155                 160

Tyr Arg Glu Thr Val Ala Arg Arg Tyr Phe Thr Val Thr Gly Ser Gln

                165                 170                 175

Pro Asp Glu Ala Thr Leu Asp Thr Leu Ala Glu Thr Gly Glu Gly Glu

            180                 185                 190

Arg Leu Leu Gln Arg Ala Ile Ala Glu Gln Gln Gly Arg Gly Glu Val

        195                 200                 205

Leu Gly Val Val Ala Glu Ile Gln Glu Arg His Gly Ala Val Ala Asp

    210                 215                 220

Leu Glu Arg Ser Leu Leu Glu Leu Gln Gln Val Phe Asn Asp Met Ala

225                 230                 235                 240

Val Leu Val Ala Ala Gln Gly Glu Gln Leu Asp Asp Ile Glu Gly His

                245                 250                 255

Val Gly Arg Ala Arg Ser Phe Val Asp Arg Gly Arg Glu Gln Leu Gln

            260                 265                 270

Val Ala Arg Lys His Gln Lys Ser Ser Arg Lys Trp Thr Phe Ile Gly

        275                 280                 285

Ile Gly Ile Leu Leu Val Val Ile Leu Ile Ile Val Ile Pro Ile Val

    290                 295                 300

Leu Lys Asn Thr Asn Lys Ser Asn Asn Asn Asn Ser Gln Gln

305                 310                 315

<210>52

<211>945

<212>DNA

<213>大麦

<220>

<221>CDS

<222>(1)..(945)

<223>核苷酸序列,其编码HvPOX8.1(过氧化物酶)

<400>52

atg gcc tct act tcg tcc cta tca gtg gtg ttg ctc ttg tgc ctg gcc     48

Met Ala Ser Thr Ser Ser Leu Ser Val Val Leu Leu Leu Cys Leu Ala

1               5                   10                  15

gtg gcg gcg tcg gcg cag ctg tcg ccg acg ttc tac caa acg acg tgc     96

Val Ala Ala Ser Ala Gln Leu Ser Pro Thr Phe Tyr Gln Thr Thr Cys

            20                  25                  30

ccg aac gct ctg tcc acc atc aag gcc gcc gtg acg gcc gcc gtg aac    144

Pro Asn Ala Leu Ser Thr Ile Lys Ala Ala Val Thr Ala Ala Val Asn

        35                  40                  45

aat gag aac cgc atg ggc gcg tcg ctg ctc cgg ctg cac ttc cac gac    192

Asn Glu Asn Arg Met Gly Ala Ser Leu Leu Arg Leu His Phe His Asp

    50                  55                  60

tgc ttc gtc caa ggt tgt gac gcg tct gtt ctg ctg tct ggc atg gaa    240

Cys Phe Val Gln Gly Cys Asp Ala Ser Val Leu Leu Ser Gly Met Glu

65                  70                  75                  80

caa aac gcg gcg ccg aac gtc atg tcc ctg cga ggc ttc gaa gtc ata    288

Gln Asn Ala Ala Pro Asn Val Met Ser Leu Arg Gly Phe Glu Val Ile

                85                  90                  95

gac agc atc aag gcg aag ctc gag acc atg tgc aag cag acc gtc tcc    336

Asp Ser Ile Lys Ala Lys Leu Glu Thr Met Cys Lys Gln Thr Val Ser

            100                 105                 110

tgc gcc gac atc ctc acc gtc gct gcc cgc gat tcc gtc gtc gcc ttg    384

Cys Ala Asp Ile Leu Thr Val Ala Ala Arg Asp Ser Val Val Ala Leu

        115                 120                 125

gga ggg cca tcg tgg acg gtt ccg cta gga agg agg gac tcc acc aat    432

Gly Gly Pro Ser Trp Thr Val Pro Leu Gly Arg Arg Asp Ser Thr Asn

    130                 135                 140

gca aac gaa gca gcg gcg aac tcc gac cta cct ccc ccg ttc ttc gac    480

Ala Asn Glu Ala Ala Ala Asn Ser Asp Leu Pro Pro Pro Phe Phe Asp

145                 150                 155                 160

ctc gtc aac ctc acc caa tcc ttc ggc gac aag ggc ttc acc gtc acc    528

Leu Val Asn Leu Thr Gln Ser Phe Gly Asp Lys Gly Phe Thr Val Thr

                165                 170                 175

gac atg gtc gcg ctc tcc ggt gcc cac acc atc gga cag gcg cag tgc    576

Asp Met Val Ala Leu Ser Gly Ala His Thr Ile Gly Gln Ala Gln Cys

            180                 185                 190

cag aac ttc agg gat agg ctc tac aac gag act aac atc aac tcc ggc    624

Gln Asn Phe Arg Asp Arg Leu Tyr Asn Glu Thr Asn Ile Asn Ser Gly

        195                 200                 205

ttc gcg acg tcg ctc aag gcc aac tgc ccc cgg ccg acc ggc tcc ggc    672

Phe Ala Thr Ser Leu Lys Ala Asn Cys Pro Arg Pro Thr Gly Ser Gly

    210                 215                 220

gac cgc aac ctg gcc aat ctg gac gtg tct acc ccg tac tca ttc gac     720

Asp Arg Asn Leu Ala Asn Leu Asp Val Ser Thr Pro Tyr Ser Phe Asp

225                 230                 235                 240

aac gcc tac tac agc aac ctc aag tcc cag aag ggg ctc ctg cac tct     768

Asn Ala Tyr Tyr Ser Asn Leu Lys Ser Gln Lys Gly Leu Leu His Ser

                245                 250                 255

gac cag gtg ctc ttc acc ggc acg ggc ggc ggc acg gac aac atc gtc     816

Asp Gln Val Leu Phe Thr Gly Thr Gly Gly Gly Thr Asp Asn Ile Val

            260                 265                 270

aac aac ttc gcg agc aac cca gct gcg ttc agc ggc gcc ttt gcc tcg     864

Asn Asn Phe Ala Ser Asn Pro Ala Ala Phe Ser Gly Ala Phe Ala Ser

        275                 280                 285

gcc atg gtg aag atg ggg aac ctc agc cca ttg act ggc tct cag ggg     912

Ala Met Val Lys Met Gly Asn Leu Ser Pro Leu Thr Gly Ser Gln Gly

    290                 295                 300

cag gtc agg ctg agc tgc tcc aag gtg aat taa                         945

Gln Val Arg Leu Ser Cys Ser Lys Val Asn

305                 310

<210>53

<211>314

<212>PRT

<213>大麦

<400>53

Met Ala Ser Thr Ser Ser Leu Ser Val Val Leu Leu Leu Cys Leu Ala

1               5                   10                  15

Val Ala Ala Ser Ala Gln Leu Ser Pro Thr Phe Tyr Gln Thr Thr Cys

            20                  25                  30

Pro Asn Ala Leu Ser Thr Ile Lys Ala Ala Val Thr Ala Ala Val Asn

        35                  40                  45

Asn Glu Asn Arg Met Gly Ala Ser Leu Leu Arg Leu His Phe His Asp

    50                  55                  60

Cys Phe Val Gln Gly Cys Asp Ala Ser Val Leu Leu Ser Gly Met Glu

65                  70                  75                  80

Gln Asn Ala Ala Pro Asn Val Met Ser Leu Arg Gly Phe Glu Val Ile

                85                  90                  95

Asp Ser Ile Lys Ala Lys Leu Glu Thr Met Cys Lys Gln Thr Val Ser

            100                 105                 110

Cys Ala Asp Ile Leu Thr Val Ala Ala Arg Asp Ser Val Val Ala Leu

        115                 120                 125

Gly Gly Pro Ser Trp Thr Val Pro Leu Gly Arg Arg Asp Ser Thr Asn

    130                 135                 140

Ala Asn Glu Ala Ala Ala Asn Ser Asp Leu Pro Pro Pro Phe Phe Asp

145                 150                 155                 160

Leu Val Asn Leu Thr Gln Ser Phe Gly Asp Lys Gly Phe Thr Val Thr

                165                 170                 175

Asp Met Val Ala Leu Ser Gly Ala His Thr Ile Gly Gln Ala Gln Cys

            180                 185                 190

Gln Asn Phe Arg Asp Arg Leu Tyr Asn Glu Thr Asn Ile Asn Ser Gly

        195                 200                 205

Phe Ala Thr Ser Leu Lys Ala Asn Cys Pro Arg Pro Thr Gly Ser Gly

    210                 215                 220

Asp Arg Asn Leu Ala Asn Leu Asp Val Ser Thr Pro Tyr Ser Phe Asp

225                 230                 235                 240

Asn Ala Tyr Tyr Ser Asn Leu Lys Ser Gln Lys Gly Leu Leu His Ser

                245                 250                 255

Asp Gln Val Leu Phe Thr Gly Thr Gly Gly Gly Thr Asp Asn Ile Val

            260                 265                 270

Asn Asn Phe Ala Ser Asn Pro Ala Ala Phe Ser Gly Ala Phe Ala Ser

        275                 280                 285

Ala Met Val Lys Met Gly Asn Leu Ser Pro Leu Thr Gly Ser Gln Gly

    290                 295                 300

Gln Val Arg Leu Ser Cys Ser Lys Val Asn

305                 310

<210>54

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>54

atgagcgcgt ccaggttcat a    21

<210>55

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>55

tcacaagatg gagcaagccc c    21

<210>56

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>56

atgcgcttga atatcggtgg a    21

<210>57

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>57

ctaagtttct tcattatttc t    21

<210>58

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>58

atggctaatg cagcatcagg a    21

<210>59

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>59

tcaattggct cggcttttga a    21

<210>60

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>60

atgagcgcca ccaggccctc c    21

<210>61

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>61

ctatctgcca agcaggcgac g    21

<210>62

<211>24

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>62

atgaacaacc tcttctcgag ctcg    24

<210>63

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>63

ctactgctgg ctgttgttgt t    21

<210>64

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>64

atggcctcta cttcgtccct a    21

<210>65

<211>21

<212>DNA

<213>人工的

<220>

<223>寡核苷酸引物

<400>65

ttaattcacc ttggagcagc t    21

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号