首页> 中国专利> 自限性夜蛾

自限性夜蛾

摘要

本发明提供用于在性别特异性基础上表达目的基因的夜蛾科dsx剪接盒,用于赋予转化的夜蛾科自限性状的基因表达系统,以及转基因夜蛾科,抑制夜蛾科种群并减少、抑制或消除由夜蛾科昆虫引起的农作物损害的方法。

著录项

说明书

相关申请的交叉引用

本申请要求于2018年3月29日提交的美国临时专利申请62/649,912的权益,其全部内容通过引用纳入本文。

序列表引用

本申请通过引用将“序列表”(在下面标识)纳入文本,所述“序列表”以文本文件与本申请一起递交。随本文递交的序列表的文本文件副本标记为“序列表”,文件大小为131,925字节,创建于2019年3月27日;该序列表通过引用全部纳入本文。

背景技术

已知夜蛾或夜蛾科(Noctuidae)有多种常见名称,包括地老虎(cutworm)、粘虫和飞蛾。夜蛾科涵盖1,000多个属和11,000多种。夜蛾科中有一些属和物种,每年造成大量的农作物破坏,造成数十亿美元的损失。包括灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)和实夜蛾属(Heliothis)在内的几个属是造成全球农作物损失的主要昆虫。重要物种包括,例如,草地贪夜蛾(Spodoptera frugiperda)(草地夜蛾)、甜菜夜蛾(Spodoptera exigua)(甜菜粘虫)、灰翅夜蛾(Spodoptera littoralis)(非洲棉叶虫)、棉铃虫(Helicoverpa armigera)(棉铃虫;螟蛉;古夜蛾;非洲棉铃虫)、疆夜蛾(Peridromasaucia)(斑叶夜蛾)、谷实夜蛾(Helicoverpa zea)(螟蛉;其他通用名称包括棉铃虫和番茄螟蛉)、银灰夜蛾(Chrysodeixis includens)(大豆夜蛾)、梨豆夜蛾(Anticarsiagemmatalis)(天鹅绒豆毛虫)(velvetbean caterpillar)和烟草夜蛾(Heliothisvirescens)(烟草夜蛾幼虫)。

草地贪夜蛾例如影响多种农作物,包括玉米、水稻、棉花、甘蔗和高粱。雌性夜蛾每群约有2,000颗卵,每只夜蛾产下约1,000颗卵。从这些卵中孵出的幼虫会吞食农作物。每年可能会繁衍几代粘虫。

防治夜蛾科的尝试主要是通过使用农药。但是,昆虫对农药例如拟除虫菊酯、氨基甲酸酯和有机磷酸酯具有抗药性。控制昆虫的其他尝试包括使用转基因农作物,例如从苏云金芽孢杆菌(Bacillus thuringiensis)(Bt作物)等微生物表达杀虫蛋白(例如Cry1Fa)的植物。但是,昆虫也对Bt作物产生了抗性。

在本领域中非常需要开发一种解决方案,该解决方案以不同于现有作用方式的方式抑制夜蛾科种群,以减少对当前实践的依赖并由此减轻抗药性,并可能扭转杀虫剂在昆虫中的耐药性的趋势。

其中昆虫通过辐射绝育并释放以与相同物种的野生昆虫交配的昆虫不育技术(SIT)在抑制昆虫种群方面是有效的(昆虫不育技术,Dyck,VAJ Hendrichs,J.Robinson,Eds;Springer Netherlands,2005年)。这种SIT方法的生物学替代方法是使用一种自限性基因,其中对昆虫进行遗传工程改造以使其包含可抑制的基因,这种基因在表达时会导致昆虫死亡。在自限性基因方法中,携带自限基因的雄性昆虫在相同物种的野生昆虫中被释放,后代继承自限性基因并且不能存活到成年。

自限性方法的最新发展利用了基因的性别特异性表达,并允许对其中仅雌性昆虫表达自限性基因的昆虫物种进行改造(WO 2007/091099)。当雄性自限性昆虫在野生种群中释放时,所有后代都继承自限性基因,但是由于性别特异性表达,只有雌性昆虫无法存活到成年。这种发展使得大量繁殖自限性雄性昆虫进行释放。在许多情况下,大规模的饲养和两性的物理分离是不切实际的,或者至少是劳动密集型的。

昆虫基因双性基因(dsx)已用于双翅目昆虫(Dipteran)物种中以创建性别特异性剪接(WO 2018/029534)以及鳞翅目(Lepidopteran)物种(Jin,L.等(2013)ACSSynth.Biol.2(3):160-166;Tan,A等(2013)Proc.Natl.Acad.Sci.USA 110(17):6766-6770)。虽然双翅目昆虫dsx和鳞翅目昆虫dsx之间有一定的保守性,但看来鳞翅目昆虫中的性别特异性剪接机制不同于其他昆虫。双翅目、鞘翅目和膜翅目均通过TRA/TRA2复合体调节dsx mRNA前体剪接,而鳞翅目似乎缺乏TRA同源物,并使用不同的基因来针对dsx确定性别(Nagaraju,J.等(2014)Sex.Devel.8(1-3):104-12)。鳞翅目产生的雄性和雌性DSX蛋白同工型具有相同的N端区域,但蛋白质的C端部分不同,这是雄性和雌性DSX蛋白同工型具有不同性别特异性功能所必需的(Suzuki,M.G.等(2005)Evol.Dev.7(1):58-68;Shukla,J.N.和J.Nagaraju(2010)Insect Niochem.Mol.Biol.40(9):672-682;Xu,J.等(2017)InsectBiochem.Mol.Biol.80:42-51)。

本领域中需要开发自限性的夜蛾科类,以抑制这些昆虫的种群,这些昆虫种群严重破坏了农作物并减少了世界的粮食供应。

发明内容

本发明提供用于指导节肢动物中编码功能蛋白的异源多核苷酸的性别特异性剪接的剪接盒(其中功能蛋白的编码序列限定在起始密码子和终止密码子之间)。所述盒包含夜蛾双性(dsx)基因的至少一个外显子2,或其部分;夜蛾科dsx基因的至少一个外显子3或其部分;夜蛾科dsx基因的至少一个外显子5或其部分;夜蛾科dsx基因的至少一个内含子2或其部分;夜蛾科dsx基因的至少一个内含子4或其部分;其中(a)所述异源多核苷酸的RNA转录物的第一剪接产生第一剪接的mRNA产物,其不具有从起始密码子延伸至终止密码子的连续开放阅读框;(b)所述RNA转录物的可变剪接产生可变剪接的mRNA产物,其包括从起始密码子延伸至终止密码子的连续开放阅读框。

在一些实施方式中,剪接盒包含夜蛾科双性(dsx)基因的至少一个外显子2或其部分;夜蛾科dsx基因的至少一个外显子3或其部分;夜蛾科dsx基因的至少一个外显子4或其部分;夜蛾科dsx基因的至少一个外显子5或其部分;夜蛾科dsx基因的至少一个内含子2或其部分;夜蛾科dsx基因的至少一个内含子3或其部分;夜蛾科dsx基因的至少一个内含子4或其部分;其中(a)所述异源多核苷酸的RNA转录物的第一剪接产生第一剪接的mRNA产物,所述第一剪接的mRNA产物不具有从起始密码子延伸至终止密码子的连续开放阅读框;(b)所述RNA转录物的可变剪接产生可变剪接的mRNA产物,其包括从起始密码子延伸至终止密码子的连续开放阅读框。

在一些实施方式中,所述盒任选地包含夜蛾科dsx基因的至少一个外显子3a或其部分和/或夜蛾科dsx基因的至少一个外显子4b或其部分。

在一些实施方式中,编码功能蛋白的多核苷酸位于外显子2和外显子3的3'。在其他实施方式中,编码功能蛋白的多核苷酸位于外显子2、外显子3和外显子5的3'。在其他实施方式中,编码功能蛋白的多核苷酸位于外显子2、外显子3、外显子3a、外显子4、外显子4b和外显子5的3'。

在一些实施方式中,雄性中来自剪接盒的初级转录物被剪接,使得翻译终止于编码所述功能蛋白的多核苷酸的5',并且功能蛋白不被翻译。在其他实施方式中,在雄性中来自剪接盒的初级转录物被剪接,使得编码功能蛋白的多核苷酸从初级转录物中被剪接下来。

在一些实施方式中,剪接盒的外显子2包含编码与SEQ ID NO:71的序列具有80%、85%、90%、95%、98%或100%同一性的氨基酸序列的多核苷酸。在一些实施方式中,外显子2具有编码SEQ ID NO:71的氨基酸序列的多核苷酸序列。在其他实施方式中,外显子2具有SEQ ID NO:7、SEQ ID NO:32或SEQ ID NO:54的多核苷酸序列。

在一些实施方式中,剪接盒的外显子3包含编码与编码SEQ ID NO:72的氨基酸序列的序列具有80%、85%、90%、95%、98%或100%同一性的氨基酸序列的多核苷酸。在一些实施方式中,外显子3具有编码SEQ ID NO:72的氨基酸序列的多核苷酸序列。在一些实施方式中,外显子3具有SEQ ID NO:93、SEQ ID NO:56的核心多核苷酸序列,或可以被分成两个部分(SEQ ID NO:94和SEQ ID NO:9)以及编码致死的、有害的或不育的(例如tTAV或其类似物)蛋白质的多核苷酸通过接头插入在这两部分之间,有用的接头的实例包括如SEQ IDNO:95和SEQ ID NO:96所示的那些(见图19)。

在一些实施方式中,剪接盒的外显子3a包含具有与编码SEQ ID NO:73的氨基酸序列的序列具有80%、85%、90%、95%、98%或100%同一性的序列的多核苷酸序列。在一些实施方式中,外显子3a具有编码SEQ ID NO:73的氨基酸序列的多核苷酸序列。在一些实施方式中,外显子3具有SEQ ID NO:12的多核苷酸序列。

在一些实施方式中,剪接盒的外显子4包含多核苷酸,该多核苷酸具有与编码SEQID NO:74的氨基酸序列的序列具有80%、85%、90%、95%、98%或100%同一性的序列。在一些实施方式中,外显子4具有编码SEQ ID NO:74的氨基酸序列的多核苷酸序列。在一些实施方式中,外显子4具有SEQ ID NO:15的多核苷酸序列。

在一些实施方式中,剪接盒的外显子4b包含与SEQ ID NO:14的多核苷酸序列具有80%、85%、90%、95%、98%或100%同一性的序列的多核苷酸。

在一些实施方式中,剪接盒的外显子5包含编码SEQ ID NO:75的氨基酸序列的多核苷酸。在一些实施方式中,外显子5具有编码SEQ ID NO:75的氨基酸序列的多核苷酸序列。在一些实施方式中,外显子5具有SEQ ID NO:17的多核苷酸序列。

在一些实施方式中,剪接盒的内含子2包含具有与SEQ ID NO:55的序列具有80%、85%、90%、95%、98%或100%的同一性的序列的多核苷酸。

在一些实施方式中,剪接盒的内含子3包含具有与SEQ ID NO:58的序列具有80%、85%、90%、95%、98%或100%同一性的序列的多核苷酸。

在一些实施方式中,剪接盒的内含子4包含具有与SEQ ID NO:39的序列具有80%、85%、90%、95%、98%或100%同一性的序列的多核苷酸。

在一些实施方式中,剪接盒包含具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;具有SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;具有SEQ ID NO:17的多核苷酸的夜蛾科dsx外显子5;具有SEQ IDNO:55的多核苷酸序列的内含子2;以及具有SEQ ID NO:39的多核苷酸序列的内含子4(参见图18)。

在其他实施方式中,剪接盒包含具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;具有SEQ ID NO:94,SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;具有SEQ ID NO:15的多核苷酸序列的夜蛾科dsx外显子4;具有SEQID NO:17的多核苷酸序列的夜蛾科dsx外显子5;具有SEQ ID NO:55的多核苷酸序列的夜蛾科dsx内含子2;具有SEQ ID NO:58的多核苷酸序列的夜蛾科dsx内含子3;和具有SEQ IDNO:39的多核苷酸序列的夜蛾科dsx内含子4。

在一些实施方式中,剪接盒包括包含SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;包含SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;包含SEQ ID NO:12的多核苷酸序列的夜蛾科dsx外显子3a;包含SEQ ID NO:15的多核苷酸序列的夜蛾科dsx外显子4;包含SEQ ID NO:14的多核苷酸序列的夜蛾科dsx外显子4b;以及包含SEQ ID NO:17的多核苷酸序列的夜蛾科dsx外显子5;包含SEQ ID NO:55的多核苷酸序列的夜蛾科dsx内含子2;包含SEQ ID NO:58的多核苷酸序列的夜蛾科dsx内含子3;以及包含SEQ ID NO:39的多核苷酸序列的夜蛾dsx内含子4。

在一些实施方式中,剪接盒包含具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;具有SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;具有SEQ ID NO:12的多核苷酸序列的夜蛾科dsx外显子3a;具有SEQ ID NO:15的多核苷酸序列的夜蛾科dsx外显子4;具有SEQ ID NO:14的多核苷酸序列的夜蛾科dsx外显子4b;以及具有SEQ ID NO:17的多核苷酸序列的夜蛾科dsx外显子5。在其他实施方式中,剪接盒包含具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;具有SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;具有SEQ ID NO:12的多核苷酸序列的夜蛾科dsx外显子3a;具有SEQ ID NO:15的多核苷酸序列的夜蛾科dsx外显子4;具有SEQ ID NO:14的多核苷酸序列的夜蛾科dsx外显子4b;具有SEQ ID NO:17的多核苷酸序列的夜蛾科dsx外显子5;具有SEQ ID NO:55的多核苷酸序列的夜蛾科dsx内含子2;具有SEQ ID NO:58的多核苷酸序列的夜蛾科dsx内含子3;和具有SEQ ID NO:39的多核苷酸序列的夜蛾科dsx内含子4。

在其他实施方式中,剪接盒包含具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列的夜蛾科dsx外显子2;具有SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列的夜蛾科dsx外显子3;具有SEQ ID NO:12的多核苷酸序列的夜蛾科dsx外显子3a;具有SEQ ID NO:15的多核苷酸序列的夜蛾科dsx外显子4;夜蛾科dsx;具有SEQ ID NO:17的多核苷酸序列的夜蛾科dsx外显子5;具有SEQ ID NO:55的多核苷酸序列的夜蛾科dsx内含子2;具有SEQ ID NO:58的多核苷酸序列的夜蛾科dsx内含子3;和具有SEQ ID NO:39的多核苷酸序列的夜蛾科dsx内含子4。

盒可以用于节肢动物例如昆虫中。在一些实施方式中,该昆虫是夜蛾科的。这种夜蛾科的非限制性实例包括包括灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)和实夜蛾属(Heliothis)的昆虫。具体物种包括,但不限于,草地贪夜蛾(Spodoptera frugiperda)(草地夜蛾)、甜菜夜蛾(Spodoptera exigua)(甜菜粘虫)、灰翅夜蛾(Spodoptera littoralis)(非洲棉叶虫)、棉铃虫(Helicoverpa armigera)(棉铃虫;螟蛉;古夜蛾;非洲棉铃虫)、疆夜蛾(Peridroma saucia)(斑叶夜蛾)、谷实夜蛾(Helicoverpa zea)(螟蛉)、银灰夜蛾(Chrysodeixis includens)(大豆夜蛾)、梨豆夜蛾(Anticarsia gemmatalis)(天鹅绒豆毛虫)(velvetbean caterpillar)和烟草夜蛾(Heliothis virescens)(烟草夜蛾幼虫)。

在一些实施方式中,所述盒具有来源于夜蛾科的属的夜蛾科dsx的外显子和内含子,所述夜蛾属包括但不限于灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)或实夜蛾属(Heliothis)。在一些实施方式中,外显子和内含子衍生自草地贪夜蛾(Spodopterafrugiperda)、甜菜夜蛾(Spodoptera exigua)、灰翅夜蛾(Spodoptera littoralis)、棉铃虫(Helicoverpa armigera)、疆夜蛾(Peridroma saucia)、谷实夜蛾(Helicoverpa zea)、银灰夜蛾(Chrysodeixis includens)、梨豆夜蛾(Anticarsia gemmatalis)或烟草夜蛾(Heliothis virescens)中至少一种的dsx基因。

在一些实施方式中,剪接盒进一步包含编码所述功能蛋白的多核苷酸5'的泛素前导序列。

本发明还提供了用于在节肢动物中控制效应基因表达的雌性特异性基因表达系统,其包括:

a.启动子;

b.编码功能蛋白的多核苷酸,其编码序列限定在起始密码子和终止密码子之间;

C.与节肢动物中的剪接体协作的剪接控制多核苷酸,其能够在节肢动物中性别特异性的介导初级转录物的剪接,其中初级转录物包含夜蛾科双性(dsx)基因的外显子2或其部分;夜蛾科dsx基因的外显子3或其部分;夜蛾科dsx基因的外显子4或其部分;夜蛾科dsx基因的外显子5或其部分;夜蛾科dsx基因的内含子2或其部分;夜蛾科dsx基因的内含子4或其部分;任选地,夜蛾科dsx基因的外显子3a或其部分;任选地,夜蛾科dsx基因的内含子3或其部分;和任选地,外显子4b或其部分,从而形成夜蛾科dsx基因的外显子4b-外显子4;其中:

(1)多核苷酸的RNA转录物的第一剪接产生第一剪接的mRNA产物,其不具有从起始密码子延伸至终止密码子的连续开放阅读框;和

(2)RNA转录物的可变剪接产生可变剪接的mRNA产物,其包括从起始密码子延伸至终止密码子的连续开放阅读框。

在一些实施方式中,功能蛋白对节肢动物具有致死、有害或、不育作用。功能蛋白的实例包括但不限于Hid或其同源物、Reaper(Rpr)或其同源物、Nipp1Dm或其同源物、钙调蛋白或其同源物、Michelob-X或其同源物、tTAV或其同源物、tTAV2或其同源物、tTAV3或其同源物、tTAF或其同源物、medea或其同源物,或核酸酶。在其他实施方式中,多核苷酸编码microRNA毒素,而不是具有致死、有害或不育作用的蛋白质。在某些实施方式中,编码功能蛋白的多核苷酸编码tTAV或其同源物、tTAV2或其同源物、tTAV3或其同源物,或tTAF或其同源物。非限制性实例包括具有SEQ ID NO:80、SEQ ID NO:97或SEQ ID NO:98的氨基酸序列的蛋白质。在一些实施方式中,核酸酶是FokI或EcoRI。

节肢动物雌性特异性基因表达系统可以进一步包含与编码功能蛋白的多核苷酸可操作地连接的3'UTR或其部分。在一些实施方式中,3’UTR是P10 3’UTR或其部分。

在一些实施方式中,节肢动物雌性特异性基因表达系统可以进一步包含编码功能蛋白的多核苷酸5'的泛素前导序列。

在节肢动物雌性特异性基因表达系统的一些实施方式中,编码功能蛋白的多核苷酸位于外显子2的3',并且在外显子3内,使得编码功能蛋白的多核苷酸侧接编码功能蛋白的多核苷酸5'的外显子3的第一部分,以及编码功能蛋白的多核苷酸3'的外显子3的第二部分。在非限制性实例中,第一部分具有SEQ ID NO:94的多核苷酸序列,而第二部分包括SEQID NO:9的多核苷酸序列。在其他实施方式中,编码功能蛋白的多核苷酸位于外显子2、外显子3、外显子3a、外显子4、外显子4b和外显子5的3'。

在一些实施方式中,初级转录物在雄性中剪接,使得翻译终止于编码功能蛋白的多核苷酸的5'。在其他实施方式中,初级转录物在雄性中剪接,使得编码功能蛋白的多核苷酸从初级转录物中剪接下来。

在一些实施方式中,外显子2包含编码SEQ ID NO:71的氨基酸序列的多核苷酸。外显子2的多核苷酸的非限制性实例包括SEQ ID NO:7和SEQ ID NO:32。

在一些实施方式中,外显子3包含编码SEQ ID NO:72的氨基酸序列的多核苷酸。例如,其可以是包含SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的核酸序列的多核苷酸。

在一些实施方式中,外显子3a包含编码SEQ ID NO:73的氨基酸序列的多核苷酸。这样的氨基酸序列可以例如由SEQ ID NO:12的核酸序列编码。

在一些实施方式中,外显子4包含编码SEQ ID NO:74的氨基酸序列的多核苷酸。这样的氨基酸序列可以由例如SEQ ID NO:15的核酸序列编码。在一些实施方式中,外显子4b包含SEQ ID NO:14的多核苷酸序列。在一些实施方式中,外显子4b和外显子4连接以形成外显子4b-外显子4,并且可具有例如SEQ ID NO:90、SEQ ID NO:91或SEQ ID NO:92的多核苷酸序列。

在一些实施方式中,外显子5包含编码SEQ ID NO:75的氨基酸序列的多核苷酸。这样的氨基酸序列可以由例如SEQ ID NO:17的核酸序列编码。

在一些实施方式中,内含子2包含SEQ ID NO:55的多核苷酸序列。

在一些实施方式中,内含子3包含SEQ ID NO:58的多核苷酸序列。

在一些实施方式中,内含子4包含SEQ ID NO:39的多核苷酸序列。

在某些实施方式中,外显子2包含编码SEQ ID NO:71的氨基酸序列的多核苷酸序列;外显子3包含编码SEQ ID NO:72的氨基酸序列的多核苷酸序列;外显子3a包含编码SEQID NO:73的氨基酸序列的多核苷酸序列;外显子4包含编码SEQ ID NO:74的氨基酸序列的多核苷酸序列。外显子5包含编码SEQ ID NO:75的氨基酸序列的多核苷酸序列。

在其他实施方式中,外显子2具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列;外显子3的第一部分具有SEQ ID NO:94的多核苷酸序列,第二部分具有SEQ ID NO:9的多核苷酸序列。外显子3a具有SEQ ID NO:12的多核苷酸序列;外显子4具有SEQ ID NO:15的多核苷酸序列;外显子4b具有SEQ ID NO:14的多核苷酸序列;外显子5具有SEQ ID NO:17的多核苷酸序列。

在其他实施方式中,外显子2具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列;外显子3具有SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列;外显子3a具有SEQ ID NO:12的多核苷酸序列;外显子4具有SEQ ID NO:15的多核苷酸序列;外显子4b具有SEQ ID NO:14的多核苷酸序列;外显子5具有SEQ ID NO:17的多核苷酸序列。

在其他实施方式中,外显子2具有SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列;外显子3具有SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列;外显子3a具有SEQ ID NO:12的多核苷酸序列;外显子4具有SEQ ID NO:15的多核苷酸序列;外显子4b具有SEQ ID NO:14的多核苷酸序列;外显子5具有SEQ ID NO:17的多核苷酸序列;内含子2具有SEQ ID NO:55的多核苷酸序列;内含子3具有SEQ ID NO:58的多核苷酸序列;内含子4具有SEQ ID NO:39的多核苷酸序列。

在节肢动物雌性特异性基因表达系统中,启动子可以是Hsp70启动子、β-微管蛋白启动子、Hsp83启动子、鱼精蛋白启动子、肌动蛋白启动子(acting promoter)、Hsp70最小启动子、P最小启动子、CMV最小启动子、基于Acf5C的最小启动子、TRE3G启动子、BmA3启动子片段或Adh核心启动子。在一些实施方式中,启动子是源自黑腹果蝇(Drosophilamelanogaster)的Hsp70最小启动子(dmHsp70 minipro)。在其他实施方式中,启动子是人CMV最小启动子(hCMV minipro)。在一些实施方式中,hCMV minipro还包含芜菁黄花叶病毒(turnip yellow mosaic virus)(TYMV)5'UTR。在一些实施方式中,启动子具有SEQ ID NO:18、SEQ ID NO:41、SEQ ID NO:63或SEQ ID NO:65的多核苷酸序列。

本发明的节肢动物雌性特异性基因表达系统可进一步包含转录控制元件,其通过化学配体的存在或不存在来控制转录。在一些实施方式中,转录控制元件是四环素应答元件,并且化学配体是四环素或其类似物或衍生物。在一些实施方式中,四环素应答元件是tetOx1、tetOx2、tetOx3、tetOx4、tetOx5、tetOx6、tetOx7、tetOx8、tetOx9、tetOx10、tetOx11、tetOx12、tetOx13、tetOx14、tetOx15、tetOx16、tetOx17、tetOx18、tetOx19、tetOx20或tetOx21。

在一些实施方式中,节肢动物是昆虫。在一些实施方式中,该昆虫是夜蛾科的。夜蛾科昆虫属的实例包括但不限于灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)或实夜蛾属(Heliothis)。在一些实施方式中,昆虫是草地贪夜蛾(Spodoptera frugiperda)(草地夜蛾)、甜菜夜蛾(Spodoptera exigua)(甜菜粘虫)、灰翅夜蛾(Spodoptera littoralis)(非洲棉叶虫)、棉铃虫(Helicoverpa armigera)(棉铃虫;螟蛉;古夜蛾;非洲棉铃虫)、疆夜蛾(Peridroma saucia)(斑叶夜蛾)、谷实夜蛾(Helicoverpa zea)(螟蛉)、银灰夜蛾(Chrysodeixis includens)(大豆夜蛾)、梨豆夜蛾(Anticarsia gemmatalis)(天鹅绒豆毛虫)或烟草夜蛾(Heliothis virescens)(烟草夜蛾幼虫)。

在一些实施方式中,夜蛾科dsx基因衍生自灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)或实夜蛾属(Heliothis)的物种。在一些实施方式中,夜蛾科dsx基因衍生自草地贪夜蛾(Spodoptera frugiperda)、甜菜夜蛾(Spodoptera exigua)、灰翅夜蛾(Spodoptera littoralis)、棉铃虫(Helicoverpa armigera)、疆夜蛾(Peridromasaucia)、谷实夜蛾(Helicoverpa zea)、银灰夜蛾(Chrysodeixis includens)、梨豆夜蛾(Anticarsia gemmatalis)或烟草夜蛾(Heliothis virescens)。

节肢动物雌性特异性基因表达系统可以进一步包含包含第二启动子的第二表达单元,在存在或不存在化学配体的情况下控制转录的第二转录控制元件,以及编码第二功能蛋白的第二多核苷酸,其编码序列限定在第二起始密码子和第二终止密码子之间,其中第二功能蛋白编码Hid或其同源物、Reaper(Rpr)或其同源物、Nipp1Dm或其同源物、钙调蛋白或其同源物、Michelob-X或其同源物、medea或其同源物、microRNA毒素或核酸酶;第一功能蛋白编码tTAV或其同源物、tTAV2或其同源物、tTAV3或其同源物、tTAF或其同源物。这提供了积极的反馈,其中在存在或不存在化学配体的情况下,转录因子可以驱动自身的表达和第二表达单元的转录。

在一些实施方式中,第二表达单元包含与编码第二功能蛋白(例如,转录因子)的第二多核苷酸可操作地连接的第二剪接控制多核苷酸,其与节肢动物中的剪接体协同作用,能够在节肢动物中进行性别特异性介导的初级转录物的剪接,其中节肢动物的一个性别剪接第二剪接控制多核苷酸以产生开放阅读框,所述阅读框与编码第二功能蛋白的第二多核苷酸在框内,而节肢动物的另一种性别剪接第二剪接控制多核苷酸产生另一个阅读框,该框如下:

(a)与编码第二功能蛋白的第二多核苷酸不同框;

(b)将编码第二功能蛋白的第二多核苷酸剪接下来;或

(c)导致在另外的阅读框中的一个或多个终止密码子,阻止第二功能蛋白的翻译。

在一些实施方式中,第二剪接控制多核苷酸与第一剪接控制多核苷酸相同。

在节肢动物雌性特异性基因表达系统的一些实施方式中,所述系统进一步包括可操作地连接至编码标记蛋白的多核苷酸的第二启动子。在一些实施方式中,标记蛋白是荧光蛋白。在特定的实施方式中,荧光蛋白是DsRed2。

本发明提供了用于制备基因工程夜蛾科昆虫的质粒。在特定的实施方式中,这些质粒包含SEQ ID NO:86(pOX5403)、SEQ ID NO:87(pOX5368)和SEQ ID NO:88(pOX5382)。

本发明还提供了通过在相同物种的野生节肢动物群体中释放包括本发明的表达系统的基因工程雄性节肢动物(例如,夜蛾科昆虫)来抑制野生节肢动物(例如,夜蛾科昆虫)群体的方法,然后,基因改造的节肢动物与野生节肢动物交配,而这种交配的后代有区别地剪接剪接盒的初级转录物,以产生具有致死、有害或不育作用的功能蛋白(在雌性节肢动物的情况下),导致雌性后代的死亡或雌性后代无法有效繁殖,从而抑制了野生节肢动物的种群。

本发明还提供了减少、抑制或消除节肢动物(例如夜蛾科昆虫)对作物的损害的方法,包括在相同物种中的野生节肢动物种群中释放包含本发明的表达系统的基因工程雄性节肢动物(例如夜蛾科昆虫),然后,基因工程节肢动物与野生节肢动物交配,并且这种交配的后代有区别地剪接剪接盒的初级转录物,从而产生(在雌性节肢动物的情况下)具有致死、有害或不育作用的功能蛋白,导致雌性后代死亡或雌性后代无法有效繁殖,从而抑制了野生节肢动物的种群,并减少、抑制或消除了由野生昆虫引起的农作物损害。

附图说明

图1示出了pOX5403质粒的基因图谱。piggyBac 5'和3'是在草地贪夜蛾(Spodoptera frugiperda)基因组中插入OX5403 rDNA所需的转座元件序列。在两个piggyBac元件之间并包括两个piggyBac元件的DNA序列是仍整合到OX5403A基因组中的rDNA。

图2示出了线性质粒图,其示出了插入OX5403A中的两个基因(DsRed2,Sfdsx_tTAV)。由于剪接模块,tTAV蛋白仅在不存在四环素家族抗生素的雌性中表达。

图3示出了自限性tTAV基因的剪接变体。Sfdsx剪接模块由Sfdsx外显子2、3、3a、4b、4和5以及Sfdsx内含子2、3和4组成。在雌性中,产生雌性特异性转录物F1和F2。在没有四环素解毒剂的情况下,雌性草地贪夜蛾中产生的F1和F2转录物表达转基因,从而以雌性特异性方式表达tTAV蛋白。F1和F2转录物包含与泛素_tTAV和P10 3’UTR融合的Sfdsx起始密码子。tTAV与起始密码子在框内,因此F1和F2转录物可以翻译成tTAV蛋白。在雄性中,仅产生转录物M。转录物M包含Sfdsx外显子2和外显子5,泛素_tTAV和P10 3’UTR。与其他两个转录物一样,该转录物中的ORF在Sfdsx外显子2的上游开始,在外显子5结束(在与编码tTAV蛋白的ORF不同的框中)。在M转录物中,排除dsx外显子3、3a、4b和4阻止了tTAV蛋白的产生,因为tTAV编码序列与tTAV起始密码子不在框内,并且也与在外显子5的末端的终止密码子在框内。箭头指示起始密码子的位置,红色八边形指示框内终止密码子的位置。雄性转录物很可能由于无义介导的衰变而降解(Hansen,K.D.等(2009)PLoS Genet.5,e1000525)。

图4示出了pOX5368质粒的基因图谱。piggyBac 5'和3'是在草地贪夜蛾(Spodoptera frugiperda)基因组中插入OX5368 rDNA所需的转座元件序列。在两个piggyBac元件之间并包括两个piggyBac元件的DNA序列是仍整合到OX5368基因组中的rDNA。

图5示出了线性质粒图,其示出了插入OX5368中的两个基因(DsRed2,Sfdsx_tTAV2)。由于剪接模块,tTAV2蛋白仅在没有四环素家族抗生素的情况下在雌性中表达。

图6示出了自限性tTAV基因的剪接变体。Sfdsx剪接模块由Sfdsx外显子2、3、3a、4b、4和5以及Sfdsx内含子2、3和4组成。在雌性中,产生雌性特异性转录物F1和F2。在雌性草地贪夜蛾中产生的F1和F2转录物在不存在四环素解毒剂的情况下表达转基因,导致tTAV蛋白以雌性特异性方式表达。F1和F2转录物包含tTAV编码序列和DmK10 3’UTR,因此F1和F2转录物能够翻译成tTAV蛋白。在雄性中,仅产生转录物M。转录物M包含Sfdsx外显子2和外显子5以及DmK10 3’UTR。该转录物不编码tTAV蛋白,仅产生Sfdsx的短片段。箭头指示起始密码子的位置,红色八边形指示框内终止密码子的位置。这些转录物的序列及其预测的编码蛋白在附录5中给出。雄性转录物很可能由无义介导的衰变而降解(Hansen等,2009)。

图7示出了pOX5382质粒的基因图谱。piggyBac 5'和3'是在草地贪夜蛾基因组中插入OX5382 rDNA所需的转座元件序列。在两个piggyBac元件之间并包括两个piggyBac元件的DNA序列是仍整合到OX5382G基因组中的rDNA。

图8示出了线性质粒图,其示出了插入到OX5382G中的两个基因(DsRed2,Sfdsx_tTAV)。由于剪接模块,tTAV蛋白仅在不存在四环素家族抗生素的雌性中表达。

图9示出了自限性tTAV基因的剪接变体。Sfdsx剪接模块由Sfdsx外显子2、3、3a、4b、4和5以及Sfdsx内含子2、3和4组成。在雌性中,产生雌性特异性转录物F1和F2。在没有四环素解毒剂的情况下,雌性草地贪夜蛾产生的F1和F2转录物表达转基因,从而以雌性特异性方式表达tTAV蛋白。F1和F2转录物包含与泛素_tTAV和P10 3’UTR融合的Sfdsx起始密码子。tTAV与起始密码子在框内,因此F1和F2转录物可以翻译成tTAV蛋白。在雄性中,仅产生转录物M。转录物M包含Sfdsx外显子2和外显子5、泛素_tTAV和P10 3’UTR。与其他两个转录物一样,该转录物中的ORF在Sfdsx外显子2的上游开始,并在外显子5终止(在与编码tTAV蛋白的ORF不同的框中)。在M转录物中,dsx外显子3、3a、4b和4的排除阻止了tTAV蛋白的产生,因为tTAV编码序列与tTAV起始密码子在框外,并且也在与位于外显子5末端的终止密码子在框内。箭头指示起始密码子的位置,红色八边形指示框内终止密码子的位置。这些转录物的序列及其预测的编码蛋白在附录5中给出。雄性转录物可能由于无义介导的衰变而降解(Hansen等,2009)。

图10示出了在幼虫阶段的喂养中,在具有四环素(左)或不具有四环素(右)时繁殖半合子夜蛾科昆虫的结果;阴影蛾包含雌性特异性基因表达系统,白色蛾是野生型;当在四环素上生长时,雌性特异性表达系统关闭,雄性和雌性后代都可以存活到成年;当在没有四环素的情况下饲养时,雌性特异性基因表达系统的副本可能会被后代遗传,在继承雌性特异性基因表达系统的蛾中,只有雄性才能存活到成年。

图11示出了OX5368C雄性和雌性在有强力霉素和没有强力霉素时的存活情况。没有强力霉素,没有雌性存活。

图12示出了OX5403A雄性和雌性在有强力霉素和没有强力霉素时的存活情况。没有强力霉素,没有雌性存活。

图13示出OX5382G雄性和雌性在有强力霉素和没有强力霉素时的存活情况。没有强力霉素,没有雌性存活。

图14示出了OX5382J雄性和雌性在有强力霉素和没有强力霉素时的存活情况。没有强力霉素,没有雌性存活。

图15示出了与野生型草地贪夜蛾相比,OX5382B转基因草地贪夜蛾在各个生命阶段的DsRed2荧光。

图16示出了选定夜蛾科dsx外显子2、3、3a、4b、4和5的剪接模式:A:棉铃虫的雌性(顶部)和雄性(底部)的剪接图案(黑框,外显子;灰框,外显子内的可变剪接位点;白色框:3'UTR型序列;*:终止密码子),如Wang XY等(2014)Insect Biochem.Mol.Biol.44:1-11;B:草地贪夜蛾的雌性(顶部)和雄性(底部)的剪接模式(黑框,外显子;灰框,外显子内的可变剪接位点);C:内源剪接的雌性(F1、F2、F3和F4)和雄性转录物的详细信息(终止符号表示终止密码子)。

图17示出了由dsx的雌性(F)和雄性(M)转录物编码的外显子2、3、3a、4和5的氨基酸序列,其构建体为OX5403、OX5368、OX5382,内源性野生型草地贪夜蛾(Endo)和棉铃虫(HA);A:雄性和雌性转录物的外显子2;B:仅用于雌性转录物的外显子3);C:来自OX5403和OX5382的雌性转录物的外显子3a;D:来自OX5403和OX5382的雌性转录物的外显子4;E:来自OX5403和OX5382的雌性转录物的外显子5;F:雄性转录物的外显子5;HA的阴影区域表示鳞翅目中的保守氨基酸(Wang X.Y.等(2014);OX5403、OX5368、OX5382,野生型草地贪夜蛾的阴影区域表示与棉铃虫中的保守氨基酸的氨基酸同一性。

图18示出了雌性特异性表达系统的实施方式,其仅包含外显子2、3和5作为剪接盒的一部分;在雌性中,剪接导致外显子2、3和5的结合(在这种情况下,与泛素前导序列和tTAV基因一起在框内),导致雌性死亡。在雄性中,剪接导致外显子2和5的连接,使得终止密码子在泛素前导序列或tTAV序列翻译之前,因此雄性存活。

图19示出了一个实施方式,其中致死、有害或不育基因(在这种情况下为tTAV)位于分裂的外显子3之间,该外显子3通过接头连接至外显子3的5'部分和外显子3的3'部分。在具体的实例中,外显子3的第一部分(外显子3p1;SEQ ID NO:94)通过接头(接头1;SEQ IDNO:95)连接至tTAV开放阅读框(ORF;SEQ ID NO:99),通过第二接头(接头2;SEQ ID NO:96)依次连接至外显子3的第二部分(外显子3p2;SEQ ID NO:9)。

发明详述

该说明书包含对各种期刊文章、专利申请和专利的引用。这些都通过引用纳入本文,就好像每个内容都在本文中完整阐述一样。

如本文所用,术语“外显子”是指dsx的全长外显子及其部分,以易于参考。因此,“dsx的外显子2”是指全长野生型dsx外显子2以及截短形式的外显子2。“外显子”还包含全长或截短的外显子,这些外显子包含点突变,其去除假定的内部起始密码子(atg)或终止密码子,因此开放阅读框可能会保留或丢失。外显子/内含子的5'和3'边界必须保留剪接供体和受体位点,以便将外显子剪接到另一个外显子。在某些情况下,说明书将引用“截短的外显子”以指示野生型外显子的某些部分已被删除。在其他情况下,本说明书将涉及“修饰的外显子”,指已经将某些突变引入到外显子中,修饰野生型dsx外显子序列中的多核苷酸序列。外显子的具体实施方式还参考它们各自的SEQ ID NO。同样,应该理解外显子是指可以在不同阅读框中翻译以产生不同多肽序列的多核苷酸序列。一个具体的例子是该构建体允许某些雌性构建体中外显子5的翻译产生SEQ ID NO:89的氨基酸序列,而在雄性中,该多核苷酸序列在不同的阅读框中被读取以产生SEQ ID NO:78的氨基酸序列。

术语“内含子”是指多核苷酸序列,该多核苷酸序列是RNA分子的初级转录物的一部分,但是从待翻译的最终RNA中剪接下来。

如本文所用,术语“外显率”是指携带基因的特定变体的个体的比例,所述个体也表达与该变体相关的表型性状。因此,关于本发明,“外显率”是指表达致死表型的转化生物的比例。

如本文所用,术语“构建体”是指用于插入宿主生物中以遗传修饰宿主生物的DNA的人工构建区段。将构建体的至少一部分插入宿主生物的基因组并改变宿主生物的表型。该构建体可以形成载体的一部分或为载体。

如本文所用,术语“转基因”是指包含待插入宿主生物的基因组中以改变宿主生物的表型的第一基因表达系统和第二基因表达系统的多核苷酸序列。质粒载体中含有待表达的基因的部分在本文中称为转化DNA或重组DNA(rDNA)。

如本文所用,术语“基因表达系统”是指基因与表达所述待表达基因所需的任何基因和DNA序列一起表达。

如本文所用,术语“剪接控制序列”是指与基因相关的RNA序列,其中该RNA序列与剪接体一起介导所述基因的RNA产物的选择性剪接。优选地,剪接控制序列与剪接体一起介导相关基因的RNA转录物的剪接,以产生编码功能蛋白的mRNA,并且介导所述RNA转录物的可变剪接,以产生编码非功能蛋白的至少一种可变mRNA。“剪接控制模块”可以包含多个剪接控制序列,其连接多个外显子以形成编码多肽的核酸。

如本文所用,术语“反式激活活性”是指活化转录因子的活性,其导致基因表达增加。活化转录因子可结合与所述基因可操作连接的启动子或操纵基因,从而活化该启动子,并因此增强所述基因的表达。或者,活化转录因子可以结合与所述启动子相关的增强子,从而通过所述增强子促进所述启动子的活性。

如本文所用,术语“致死基因”是指这样的基因,其表达产物以足够的量对表达致死基因的生物具有致死作用。

如本文所用,术语“致死作用”是指有害或不育作用,例如能够杀死生物本身或其后代,或能够减少或破坏其某些组织功能的作用,其中特别优选生殖组织,从而该生物或其后代是不育的。因此,某些致死作用(例如毒药)将在相对于其寿命的短时间框内杀死生物体或组织,而另一些则可能会简单地降低生物体的功能,例如生殖功能。

如本文所用,术语“tTAV基因变体”是指编码功能性tTA蛋白但核苷酸序列不同的多核苷酸。这些核苷酸可以编码不同的tTA蛋白序列,例如tTAV2和tTAV3,分别例如SEQ IDNO:97和SEQ ID NO:98。

如本文所用,术语“启动子”是指基因的基础转录和/或调节的转录需要的通常在编码序列的直接上游的DNA序列。特别地,启动子足以允许转录的起始,通常具有转录启动起始位点和RNA聚合酶转录复合物的结合位点。

如本文所用,术语“最小启动子”是指如上文所定义的启动子,其通常具有转录启动起始位点和聚合酶复合物的结合位点,并且进一步通常具有足够的额外序列以允许这两者有效。可能缺少其他序列,例如确定组织特异性的序列。

如本文所用,术语“外源控制因子”是指在宿主生物体中天然不存在,在宿主生物体的天然栖息地中不存在,或在宿主生物体的天然栖息地中不存在的环境条件的物质。因此,外源控制因子的存在由转化宿主生物的操纵子(manipulator)控制,以便控制基因表达系统的表达。

如本文所用,术语“tetO元件”是指串联定位的一个或多个tetO操纵基因单元。如本文所用,术语例如“tetOx(数字)”是指由指示数量的tetO操纵基因单元组成的tetO元件。因此,对“tetOx7”的引用表示由7个tetO操作基因单元组成的tetO元件。类似地,对“tetOx14”的引用是指由14个tetO操纵基因单元组成的tetO元件等。

当提到特定的核苷酸或蛋白质序列时,应当理解,这包括提及其具有基本等同的生物学活性的任何突变体或变体。优选地,突变体或变体与参考序列具有至少85%、优选至少90%、优选至少95%、优选至少99%、优选至少99.9%、最优选至少99.99%的序列同一性。

然而,将理解,尽管具有上述序列同源性,但为了系统有效发挥作用,某些元件,特别是侧翼核苷酸和剪接分支位点必须保留。换句话说,虽然部分可被缺失或改变,但与野生型相比,可变剪接功能或活性的至少30%、优选50%、优选70%、更优选90%、最优选95%应保留。与野生型相比,例如,这也可以通过适当地改造结合可变剪接因子或与剪接体相互作用的位点来增加。

如本文所用,“剪接控制模块”意指合并到载体中的多核苷酸构建体,当被引入昆虫中时,经历差异剪接(例如,阶段特异性、性别特异性、组织特异性、种系特异性等),因此如果剪接控制模块以性别特异性的方式进行差异剪接,则在雌性中产生与雄性中不同的转录物。

如本文所用,“5’UTR”是指RNA转录物的非翻译区,其是该转录物的5’翻译部分,并且通常包含启动子序列。

如本文所用,“3’UTR”是指RNA转录物的非翻译区,其是该转录物的3’翻译部分,并且通常包含聚腺苷酸化序列。

本发明提供了质粒、表达构建体和节肢动物,特别是夜蛾科昆虫,其具有用于致死基因的性别特异性表达的元件,该致死基因导致夜蛾科昆虫的一种性别的死亡。所述元件是可抑制的,例如通过化学实体(例如,四环素或其类似物)。在特定的实施方式中,本发明涉及用这些构建体转化的夜蛾科昆虫,特别是灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)或实夜蛾属(Heliothis),包括,但不限于,草地贪夜蛾(Spodopterafrugiperda)(草地夜蛾)、甜菜夜蛾(Spodoptera exigua)(甜菜粘虫)、灰翅夜蛾(Spodoptera littoralis)(非洲棉叶虫)、棉铃虫(Helicoverpa armigera)(棉铃虫;螟蛉;古夜蛾;非洲棉铃虫)、疆夜蛾(Peridroma saucia)(斑叶夜蛾)、谷实夜蛾(Helicoverpazea)(螟蛉)、银灰夜蛾(Chrysodeixis includens)(大豆夜蛾)、梨豆夜蛾(Anticarsiagemmatalis)(天鹅绒豆毛虫)(velvetbean caterpillar)和烟草夜蛾(Heliothisvirescens)(烟草夜蛾幼虫)。

剪接控制模块

本发明提供了剪接控制模块多核苷酸序列,其提供了生物体中的差异剪接(例如,性别特异性、阶段特异性、种系特异性、组织特异性等)。特别地,本发明提供了剪接控制模块,其提供了有用的目的基因的足够的雌性特异性的表达。在本发明的某些实施方式中,目的基因是赋予有害、致死或不育作用的基因。为了方便起见,本说明书将涉及致死作用,然而,应理解,剪接模块可用于其他感兴趣的基因,如下面进一步详细描述的。

由于在每个基因表达系统中存在至少一个剪接控制模块可操作地连接到待差异表达的目的基因,因此转基因的显性致死基因的表达可以是性别特异性的,或者是性别特异性和阶段特异性、种系特异性或组织特异性的组合。在一些实施方式中,性别特异性表达是雌性特异性的。除了启动子外,每个基因表达序列中的剪接控制模块允许控制蛋白质表达的额外水平。

剪接控制模块的基因包含蛋白质或多肽的编码序列,即至少两个或多个外显子,其能够编码多肽,例如蛋白质或其片段。优选地,将不同的外显子差异地剪接在一起以提供可变mRNA。优选地,所述可变剪接的mRNA具有不同的编码潜力,即,编码不同的蛋白质或多肽序列。因此,编码序列的表达通过可变剪接来调控。

系统中的每个剪接控制模块包括至少一个剪接受体位点和至少一个剪接供体位点。供体位点和受体位点的数目可以变化,这取决于要剪接在一起的序列区段的数目。

在一些实施方式中,剪接控制模块通过内含子和外显子核苷酸两者调控可变剪接。将理解,在可变剪接中,序列在某些情况下可以是内含子的(即,在其中内含子被剪接掉的某些可变剪接变体中),而在其他情况下可以是外显子。在其他实施方案中,剪接控制模块是内含子剪接控制模块。换句话说,优选地,所述剪接控制序列基本上源自形成内含子的一部分的多核苷酸,并因此通过剪接从初级转录物中切除,使得这些核苷酸不保留在成熟的mRNA序列中。

如上所述,外显子序列可以参与介导可变剪接,但是优选至少一些内含子控制序列参与介导可变剪接。

可以通过剪接将剪接控制模块从mRNA前体中除去或保留,以便编码待差异表达的目的基因的至少一部分的融合蛋白。优选地,剪接控制模块不会在所产生的剪接变体中导致移码。优选地,这是编码全长功能蛋白的剪接变体。

剪接控制模块与细胞剪接机器例如剪接体的相互作用导致或介导从初级转录物中去除一系列例如至少20、30、40或50个或更多个连续核苷酸,将在原始转录物中不连续的核苷酸序列连接(剪接)在一起(因为它们或其互补序列(如果考虑了反义序列)在转录初级转录物的原始模板序列中不连续)。至少50个连续核苷酸的所述系列包含内含子。该介导优选以性别特异性,更优选雌性特异性的方式起作用,使得不同性别的同等初级转录物,以及任选地还处于不同阶段、组织类型等的同等初级转录物倾向于去除不同大小或序列的内含子,或在某些情况下可能去除内含子,而在另一种情况下则不能。这种现象,在不同情况下去除大小或序列不同的内含子,或在不同情况下差异去除给定大小或序列的内含子,被称为可变剪接。可变剪接是自然界中众所周知的现象,并且许多实例是已知的。

当可变剪接介导的是性别特异性时,优选地,编码在生物体中待表达的功能蛋白的剪接变体是F1剪接变体或F2剪接变体(或F1和F2两者),即,是剪接变体,其中F表示仅或主要在雌性中发现,尽管这不是必需的。

当要去除外显子核苷酸时,如果希望避免移码,则必须以三个(整个密码子)的倍数去除这些核苷酸,如果需要引入移码,则以单个核苷酸或两个核苷酸的倍数(也不是三个的倍数)去除。应当理解,如果仅去除两个核苷酸的一倍或某些倍数,则这可能导致在mRNA的剪接点处或附近编码完全不同的蛋白质序列。

相应地,对于其中全部或部分功能性开放阅读框位于盒式外显子上的构型,优选地,该盒式外显子包括在仅或主要在雌性中发现的转录物中,并且优选地,此类转录物是单独或组合的,是雌性中发现的最丰富的变体,尽管这不是必需的。

在一个优选实施方式中,序列包含在杂合或重组序列或构建体中,其衍生自天然存在的内含子序列,所述内含子序列本身在其天然或原始背景下经受可变剪接。因此,可以将内含子序列视为在天然类似物的至少一种可变剪接变体中形成内含子的一部分。因此,设想了与天然存在的内含子序列的单个连续片段相对应的序列,而且还设想了这种序列的杂合序列,包括来自两个不同天然存在的内含子序列的杂合序列,以及相对于天然存在的内含子序列的单个连续片段而言具有缺失或插入的序列,以及其杂合体。在本发明中,源自天然存在的内含子序列的所述序列本身可以与本身不是任何天然存在的内含子的一部分的序列相关。如果这样的序列被转录,并且优选在至少一种剪接变体中保留在成熟RNA中,则它们可以被认为是外显子的。

还应理解的是,提及“移码”也可以指直接编码终止密码子,其也可能导致无功能的蛋白质,如通过插入或缺失核苷酸引起的剪接的mRNA序列的破坏。除了产生其中一个或多个没有预测或可辨别的功能的两个或更多个不同蛋白质或多核苷酸序列之外,还设想了不同功能的两个或更多个不同蛋白质或多肽序列的不同剪接变体的产生。还设想了类似功能但具有不同的亚细胞位置、稳定性或与其他蛋白质或核酸结合或缔合的能力的两种或更多种不同蛋白质或多肽序列的不同剪接变体的产生。

修饰的dsx内含子是一个实例。在这种情况下,如在实施例中所做的那样,优选从可变剪接的内含子中缺失适当数量的内含子,例如在某些情况下为90%或更多的内含子,同时仍保留可变剪接的功能。因此,尽管设想了大的缺失,但也设想了较小的,例如甚至单核苷酸插入、取代或缺失也是优选的。

剪接模块双性(dsx)

内含子通常由以下特征组成(在此称为有义DNA序列5’至3’);在RNA中,胸腺嘧啶(T)将由尿嘧啶(U)代替:

a.5'端(称为剪接“供体”):GT(或可能是GC)

b.3'端(称为剪接“受体”):AG

c.受体上游/5'(称为“分支点”):A-聚嘧啶束,即AYYYYY…Y

与5'内含子剪接“供体”和3'内含子剪接“受体”紧邻的外显子的末端核苷酸通常为G。

在一些实施方式中,剪接控制模块在3'方向上紧邻起始密码子,使得ATG的G是剪接控制模块的起始(5'端)的5'。这可能是有利的,因为它允许ATG起始密码子的G为剪接控制模块的5'G侧翼序列。

备选地,剪接控制模块在起始密码子的3'处,但在10,000外显子bp、9,000外显子bp、8,000外显子bp、7,000外显子bp、6,000外显子bp、5,000外显子bp、4,000外显子bp、外显子3,000bp、外显子2000bp或1000外显子bp、500外显子bp、300外显子bp、200外显子bp、150外显子bp、100外显子bp、75外显子bp、50外显子bp、30外显子bp、20外显子bp或10甚至5、4、3、2或1外显子bp内。

优选地,如上所述,分支点包括在每个剪接控制序列中。分支点是最初连接剪接供体的序列,表明剪接以两个阶段发生,其中5'外显子被分离,然后连接到3'外显子。

所提供的序列可以耐受某些序列变异并且仍然正确剪接。已知有一些重要的核苷酸。这些是所有剪接所必需的。内含子的初始GU和最终AG尤为重要,因此是优选的,如在其他地方讨论的那样,尽管约5%的内含子以GC开始。该共有序列是优选的,尽管它适用于所有剪接,而不特别适用于可变剪接。

在昆虫中,dsx基因由内含子和外显子组成,它们在雄性和雌性之间有差异剪接。本发明的剪接盒衍生自昆虫dsx基因,并且可衍生自任何昆虫来源,只要初级转录物在雄性和雌性之间差异地剪接。在一些实施方式中,昆虫dsx序列衍生自以下属的夜蛾科种,其包括但不限于,灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)或实夜蛾属(Heliothis)。在具体实例中,dsx基因衍生自夜蛾科的以下种,包括,但不限于,草地贪夜蛾(Spodoptera frugiperda)、甜菜夜蛾(Spodoptera exigua)、灰翅夜蛾(Spodopteralittoralis)、棉铃虫(Helicoverpa armigera)、疆夜蛾(Peridroma saucia)、谷实夜蛾(Helicoverpa zea)、银灰夜蛾(Chrysodeixis includens)、梨豆夜蛾(Anticarsiagemmatalis)或烟草夜蛾(Heliothis virescens)。在某个具体实例中,dsx衍生自草地贪夜蛾(Spodoptera frugiperda)。

本发明的dsx剪接盒包括内含子和外显子,使得可以发生差异剪接。在一些实施方式中,剪接盒至少包含dsx的外显子2、内含子2、外显子3、内含子4和外显子5。在这样的实施方式中,致死基因(例如tTAV或其变体)可以可操作地连接外显子2、内含子2的3'和外显子3的中间,但是内含子4和外显子5的5'(参见图6和图19)。因此,雌性将剪接外显子2-外显子3-tTAV-外显子4-外显子5的产物,雄性将剪接下来tTAV以提供外显子2-外显子5(参见例如图6)。该构建体还可以包含外显子3a、4、4b和内含子3。

在其他布置中,致死基因(例如tTAV)可以是dsx剪接模块元件外显子2、内含子2、外显子3、外显子3a、内含子3、外显子4b、外显子4、内含子4和外显子5的3'。在这样的实施方式中,雌性剪接剪接模块的初级转录物以产生外显子2-外显子3-外显子4-外显子5(参见,例如,SEQ ID NO:76)或外显子2-外显子3-外显子3a-外显子4-外显子5(参见,例如SEQ IDNO:77),而雄性则剪接剪接盒的初级转录物以产生外显子2-外显子5,其中在翻译致死蛋白之前存在终止密码子(参见图3和图9)。例如,这种终止密码子可能是由于剪接外显子2至外显子5所致,其中外显子5与外显子2不在框内。

在一些实施方式中,外显子2具有编码SEQ ID NO:71的氨基酸序列的多核苷酸序列。外显子2可以具有例如SEQ ID NO:7或SEQ ID NO:32的多核苷酸序列。在一些实施方式中,外显子3具有编码SEQ ID NO:72的氨基酸序列的多核苷酸序列。外显子3可以具有例如SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56的多核苷酸序列。在一些实施方式中,外显子3a具有编码SEQ ID NO:73的氨基酸序列的多核苷酸序列。外显子3a可具有例如SEQ ID NO:12的多核苷酸序列。在一些实施方式中,外显子4具有编码SEQ ID NO:74的氨基酸序列的多核苷酸序列。外显子4可以具有例如SEQ ID NO:15的多核苷酸序列。在一些实施方式中,外显子5具有编码SEQ ID NO:75的氨基酸序列的多核苷酸序列。外显子5可以具有例如SEQ IDNO:17的多核苷酸序列。

外显子4b在没有间插内含子的情况下与外显子4结合。取而代之的是,似乎存在剪接的内部识别位点,从而使夜蛾科可以从初级转录物剪接下来外显子4b,留下外显子4。因此,可以将外显子4b/外显子4掺入构建体中,如SEQ ID NO:90(图3)、SEQ ID NO:91(图6)或SEQ ID NO:92(图9)所示的构建体,或使用不含外显子4b的构建体。

在一些实施方式中,内含子2具有SEQ ID NO:55的多核苷酸序列。在一些实施方式中,内含子3具有SEQ ID NO:58的多核苷酸序列。在一些实施方式中,内含子4具有SEQ IDNO:39的多核苷酸序列。内含子的长度可以变化,只要剪接供体和剪接受体位点保守即可。本文和实施例中提供的具体内含子序列仅是示例性的,本领域技术人员将知道如何修饰此类内含子的序列和长度以允许从初级转录物与外显子适当地剪接。

本文提供完整的剪接控制模块的实例为SEQ ID NO:6、SEQ ID NO:31和SEQ IDNO:53。

目的异源基因

该系统能够表达至少一种目的蛋白质,即在生物体中表达的功能蛋白。一种这样的目标蛋白质可能具有治疗效果,或者可能是标记物,例如荧光蛋白(例如AmCyan、Clavularia、ZsGreen、ZsYellow、Discosoma striata、DsRed2、AsRed、Discosoma Green、Discosoma Magenta、HcRed-2A,mCherry、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)和HcRed-Cr1-串联等,或它们的一个或多个突变体或变体),或本领域众所周知的其他标记物,例如药物抗性基因。其他目的蛋白质可以是例如具有有害、致死或、不育作用的蛋白质。或者,目的异源基因可编码具有抑制作用的RNA分子。在生物体中表达的其他蛋白质设想是与所述功能性蛋白质,优选如下文所述的致死基因组合的。

优选地,在生物体中,异源多核苷酸序列的表达产生表型结果。在一些实施方式中,功能蛋白不是β-半乳糖苷酶,而是可以与可见标记(包括荧光)、存活率、生育率、繁殖力、适应性、飞行能力、视力和行为差异相关。当然,应当理解,在一些实施方式中,表达系统通常是有条件的,表型仅在某些条件下表达,例如在限制性或允许性条件下表达。

异源多核苷酸序列可以在夜蛾科中表达。通过“异源的”,应理解,这是指在野生型中通常不会与至少一个剪接控制序列的至少一个元件或组件缔合或连接的序列。例如,当剪接控制序列来自特定生物,并且异源多核苷酸是蛋白质或多肽的编码序列,即是编码功能蛋白的多核苷酸序列时,则编码序列可以部分衍生或全部衍生自同一生物体的基因,条件是所转录的多核苷酸序列的至少某些部分的起源与至少一个剪接控制序列的起源不同。备选地,编码序列可以来自不同生物,并且在这种情况下,可以被认为是“外源的”。异源多核苷酸也可以被认为是“重组的”,因为蛋白质或多肽的编码序列源自相同基因组(即,单个物种或亚物种的基因组)内的不同位置,或来自不同基因组(即来自不同物种或亚种的基因组)或合成来源。

异源的可以指除剪接控制序列以外的序列,因此可以与以下事实有关:启动子和其他序列例如5'UTR和/或3'UTR可以与在生物体中待表达的多核苷酸序列异源,只要在野生型中,即所述多核苷酸序列的天然背景(如果有的话)中未发现所述多核苷酸序列与所述启动子、5'UTR和/或3'UTR缔合或可操作地连接。

应理解,异源的也适用于并非源自特定生物但基于来自不同生物的许多组分的“设计者”或杂合序列,因为这也将满足该序列和剪接控制序列的至少一个组分在野生型中不连接或没发现缔合的要求,即使这样发现了杂合序列的一部分或元件,只要至少一部分或元件不是。还应理解,可以设想天然存在序列的合成形式。此类合成序列也被认为是异源的,除非它们与在野生型或天然情况下通常发现与至少一个剪接控制序列的至少一种元件或组分缔合或连接的序列具有相同的序列。

这同样适用于异源多核苷酸是用于干扰RNA的多核苷酸的情况。

在一个实施方式中,当待表达的多核苷酸序列包含蛋白质或多肽的编码序列时,应理解,提及在生物体中的表达是指提供一个或多个转录的RNA序列,优选成熟的mRNA。但是,优选地,这也可以指所述生物中的翻译多肽。

致死基因

在一些实施方式中,待在生物体中表达的功能蛋白具有致死或有害作用。在本文中提到致死作用时,应当理解,这延伸到有害或不育作用,例如能够杀死生物本身或其后代,或者能够减少或其破坏某些组织功能的作用,其中生殖组织是特别优选的,因此该生物或其后代是不育的。在其他实施方式中,可以采用不是致命的而是有害的系统,从而给生物体带来相当大的适应成本。非限制性实例包括失明和不能飞行(对于通常可以飞行的生物)。因此,某些致死作用(例如毒药)将在相对于其寿命的较短时间内杀死生物体或组织,而其他的则可能会简单地降低生物体的功能,例如生殖功能。

在一些实施方式中,致死作用导致不育,从而使该生物能够在自然环境中(“在野外”)与野生生物竞争,但是该不育生物随后不能产生存活的后代。以这种方式,本发明获得了与诸如昆虫中的昆虫不育技术(SIT)之类的技术类似或更好的结果,而没有与SIT相关的问题,例如成本、对使用者的危险,被辐照生物的竞争力降低,以及缺少可用的和实用性别鉴别系统。

在一些实施方式中,该系统包括至少一种正反馈机制,即至少一种功能蛋白通过可变剪接差异表达,以及至少一种启动子,其中待表达的基因产物用作所述至少一个启动子的阳性转录控制因子,由此产物或产物的表达是可控的。在一些实施方式中,增强子与启动子相关,基因产物用于通过增强子增强启动子的活性。

本发明允许选择性控制显性致死基因的表达,从而提供对致死表型表达的选择性控制。因此,应当理解,每个致死基因都编码功能蛋白,例如Hid、Reaper(Rpr)、Nipp1Dm、钙调蛋白、Michelob-X、tTAV、tTAV2、tTAV3、tTAF和其他四环素系统,Barnase/Barstar组合、medea microRNA毒素和核酸酶,例如但不限于FokI或EcoRI。

每个致死基因都具有条件致死作用。合适条件的实例包括温度,使得致死在一个温度下表达,而在另一温度下不表达或以较小程度表达。合适条件的另一个实例是物质的存在或不存在,由此在存在或不存在物质下表达致死性,但不能同时在两者中表达致死性。优选地,致死基因的作用是有条件的,并且在要求存在生物体自然环境所不存在的物质的允许条件下不表达,从而致死系统的致死作用发生在生物体的自然环境中。

每个致死的遗传系统都可作用于特定的细胞或组织或将其作用施加于整个生物体。还构想了并非严格致死的系统,但会花费大量的适应成本,例如导致失明,无法飞行(对于通常可以飞行的生物体而言)或不育。还设想了干扰性别决定的系统,例如将生物体的全部或部分从一种性别类型转化或趋于转化为另一种性别类型。

在一些实施方式中,至少一种致死基因的产物优选是细胞凋亡诱导因子,例如在Candé等(2002)J.Cell Science 115:4727-4734)中描述的AIF蛋白或其同源物。在哺乳动物中,甚至在无脊椎动物(包括昆虫、线虫、真菌和植物)中都发现了AIF同源物,这意味着AIF基因在整个真核生物界都是保守的。在其他实施方式中,至少一种致死基因的产物是Hid、黑腹果蝇(Drosophila melanogaster)的头退化缺陷基因的蛋白质产物,或Reaper(Rpr),果蝇的reaper基因的产物或其突变体。Heinrich和Scott(2000)Proc.Natl.Acad.Sci.USA 97:8229-8232描述了Hid的使用。Horn和Wimmer(2003)NatureBiotechnology 21:64-70描述了突变体衍生物HidAla5的使用。White等(1996);Science271(5250):805-807;Wing等(2001)Mech.Dev.102(1-2):193-203;和Olson等(2003)J.Biol.Chem.278(45):44758-44768描述了Rpr的突变衍生物RprKR的使用。Rpr和Hid均为促凋亡蛋白,被认为与IAP1结合。IAP1是很保守的抗凋亡蛋白。因此,即使它们自身的序列不是很保守,还是预期Rpr和Hid在广泛的系统发生范围内发挥作用(Huang等(2002);Vernooy等(2000)J.Cell Biol.150(2):F69-76)。

在某些实施方式中,使用Nipp1Dm,哺乳动物的Nipp1的果蝇同源物(Parker等(2002)Biochemical Journal 368:789-797;Bennett等,(2003)Genetics 164:235-245)。如本领域技术人员将理解的,如果以合适的水平表达,Nipp1Dm是具有致死作用的蛋白质的另一个实例。实际上,具有致死作用的蛋白质的许多其他实例是本领域技术人员已知的。

在其他实施方式中,致死基因是tTA或tTAV或tTAF基因变体,其中tTA表示“四环素抑制性反式激活因子”,V表示“变体”。tTAV是tTA的类似物,其中tTA的序列被修饰以增强与所需昆虫种类的相容性。编码tTA蛋白的tTAV变体是可能的,使得tTAV基因产物具有与tTA基因产物相同的功能。因此,与tTA核苷酸序列和彼此相比,tTAV基因的变体包含修饰的核苷酸序列,但是编码具有相同功能的蛋白质。因此,可以使用tTAV基因变体代替tTA。可以使用的tTAV及其变体的实例包括但不限于tTAV(SEQ ID NO:10)、tTAV2(SEQ ID NO:67)和tTAV3(SEQ ID NO:68(分别编码SEQ ID NO:80、SEQ ID NO:97和SEQ ID NO:98的蛋白)。在一些实施方式中,tTA变体蛋白包含氨基酸取代,添加或缺失。可以使用致死基因的任何组合,并且在一些实施方式中,致死基因是相同的,而在其他实施方式中,致死基因是不同的。通过积累致死产物可以实现提高致死作用的外显率和致死性更早的发作。

在一些实施方式中,致死基因导致昆虫至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的死亡。

在一些实施方式中,如果期望一个以上反馈环具有一个以上致死基因,则第一致死基因和第二致死基因中的每一个可以独立地是tTA或tTAV基因变体。在一些实施方式中,第一致死基因和第二致死基因中的每一个独立地是编码tTAV(SEQ ID NO:80)、tTAV2(SEQID NO:97)和tTAV3(SEQ ID NO:98)的基因。在其他实施方式中,第一致死基因和第二致死基因是相同的。在进一步的实施方式中,第一致死基因和第二致死基因中的一个编码tTAV(SEQ ID NO:80),另一个基因编码tTAV3(SEQ ID NO:68)。但是,可以使用tTAV变体的任何组合。因此,在一些实施方式中,第一和第二基因中的一个编码tTAV(SEQ ID NO:80),另一个编码tTAV2(SEQ ID NO:97),而在另一个实施方式中,第一基因和第二基因中的一个编码tTAV2(SEQ ID NO:97),另一个基因编码tTAV3(SEQ ID NO:98)。在其他实施方式中,第一致死基因编码tTAV(SEQ ID NO:80),第二致死基因编码tTAV3(SEQ ID NO:98)。编码tTAV、tTAV2和tTAV3的多核苷酸的实例分别提供为SEQ ID NO:10、SEQ ID NO:81和SEQ ID NO:82。

待表达以具有致死、有害或不育作用的多核苷酸序列可包含用于干扰RNA(RNAi)的多核苷酸。在一些实施方式中,当待表达的多核苷酸序列包含干扰RNA的多核苷酸时,还应理解,提及生物体中的表达是指干扰RNA的多核苷酸或其转录物在RNAi途径中的相互作用。例如,通过结合切酶(Dicer)(类似RNA Pol III的酶)或形成小的干扰RNA(siRNA)来实现。这样的序列能够提供例如一个或多个区段的双链RNA(dsRNA),优选地以初级转录物的形式,其又能够被切酶(Dicer)加工。此类区段包括,例如,可以形成环的单链RNA区段,例如在短发夹RNA(shRNA)中发现的区段,或具有基本自我互补的较长区域。

特别是在昆虫和线虫中,优选例如通过发夹形成提供一部分dsRNA,然后可以通过切酶(Dicer)系统对其进行加工。哺乳动物细胞通常会产生针对长dsRNA序列的干扰素反应,因此对于哺乳动物细胞,提供较短序列(例如siRNA)更为常见。根据本发明的一个实施方式,也可以设想反义序列或与天然存在的靶向蛋白质3'UTR的RNA分子的microRNA具有同源性的序列作为RNAi的序列。

因此,在系统是DNA的情况下,用于干扰RNA的多核苷酸是脱氧核糖核苷酸,当被转录成RNA前体核糖核苷酸时,如上所述,提供了一段dsRNA。

当定位所述多核苷酸以使对可变剪接的干扰最小化时,特别优选用于干扰RNA的多核苷酸。这可以通过将这些多核苷酸从可变剪接控制序列远侧定位,优选定位到控制序列3'来实现。在另一个优选的实施方式中,基本自我互补的区域可以通过一个或多个介导可变剪接的剪接控制序列例如内含子彼此分开。优选地,将自我互补区域布置成一系列的两个或更多个反向重复,每个反向重复通过剪接控制序列(优选内含子)分开,如在其他地方所定义的。

在该构型中,不同的可变剪接转录物可以具有在成熟的(可变剪接后的)转录物中由不同长度的非自我互补序列隔开的基本自我互补区域。应当理解,基本上自我互补的区域是能够形成发夹的区域,例如,因为该序列的部分能够与该序列的其他部分进行碱基配对。这两个部分不必彼此完全互补,因为在每个部分中可能存在一些彼此不碱基配对的片段的错配或耐受性。这样的片段在其他部分可能没有等同物,从而失去了对称性,形成了“凸出”形式,这通常是碱基对互补所公知的。

在另一个优选实施方式中,相对于至少一个剪接控制序列,定位与初级转录物的另一部分基本上互补的序列的一个或多个区段,使得其不包括在通过可变剪接初级转录物产生的所有转录物中。通过这种方法,会产生一些倾向于产生dsRNA的转录物,而另一些则不会产生。通过可变剪接的介导,例如性别特异性介导、阶段特异性介导、种系特异性介导、组织特异性介导及其组合,可以以性别特异性、阶段特异性、种系特异性或组织特异性方式或其组合产生dsRNA。

融合前导体(Leader)

在一些实施方式中,期望目的功能蛋白不具有剪接控制模块蛋白序列。在一些实施方式中,剪接控制模块与刺激翻译的多肽的蛋白水解切割的编码多肽的多核苷酸(用于多核苷酸的“融合前导序列”和用于编码的多肽的“融合前导多肽”)可操作地连接。这种融合前导序列的实例是编码泛素的多核苷酸。这样的融合前导序列可以在框内可操作地连接至剪接控制模块的3'末端,并在框内可操作地连接至目的蛋白质编码基因(即,从5'至3':剪接控制模块-融合前导序列目的基因)。在这种情况下,剪接控制模块/融合前导多肽被细胞中的特异性蛋白酶从目的蛋白上切割下来。除了泛素之外,可以代替泛素进行任何其他类似的融合,其将具有刺激N末端剪接控制模块的切割的作用。编码泛素的多核苷酸的实例提供为SEQ ID NO:30。泛素融合前导体可以是编码来自任何生物体的功能性泛素前导多肽的任何多核苷酸,只要该泛素前导体在节肢动物系统中被可靠切割即可。一个例子是果蝇泛素(例如SEQ ID NO:79),其从引起致死、有害或不育作用的功能蛋白上切割下来。

启动子和5’UTR

与具有致死、有害或不育作用的基因可操作地连接的每个剪接模块可操作地与启动子连接,其中所述启动子能够被基因编码的激活转录因子或反式激活转录因子激活,该基因还包括在至少一个基因表达系统中。优选地,设想了启动子和剪接控制模块的任何组合。优选地,该启动子对具有短暂的时间或有限的空间效应,例如细胞自主效应的特定蛋白质具有特异性。

启动子可以是大的或复杂的启动子,但是当引入到非寄主昆虫中时,这些启动子经常具有使用不当或零星利用的缺点。因此,在一些实施方式中,优选采用最小的启动子。应当理解,最小的启动子可以直接从已知的启动子来源获得,或者衍生自较大的天然存在的或其他已知的启动子。合适的最小启动子以及如何获得它们对于本领域技术人员将是显而易见的。例如,合适的最小启动子包括衍生自Hsp70的最小启动子、P最小启动子、CMV最小启动子、基于Act5C的最小启动子、BmA3启动子片段、来自果蝇的sryα胚胎特异性启动子(Horn和Wimmer(2003)Nat.Biotechnol.21(1):64-70)或其同源物,或来自其他胚胎特异性或胚胎活性基因的启动子,例如果蝇基因slow as molasses(slam)的胚胎活性基因的启动子或其来自其他物种的同源物,和Adh核心启动子(Bieschke,E.等(1998)Mol.Gen.Genet.,258:571-579)。对于本领域技术人员而言,如何确保所选的启动子是有活性的是显而易见的。优选的是,本发明中存在的至少一个可操作连接的启动子在宿主生物的早期发育期间,特别是在胚胎阶段具有活性,以确保致死基因在生物体的早期发育期间表达。

在一些实施方式中,启动子可以被环境条件激活,例如在本文所述的tet系统中存在或不存在诸如四环素(或其类似物)之类的特定因子,从而目的基因的表达可以被技术人员容易地操纵。在一些实施方式中,合适的启动子是hsp70热休克启动子,例如,允许用户通过改变宿主在实验室或现场所暴露的环境温度来控制表达。温度控制的另一个例子在Fryxell和Miller(1995)J.Econ.Entomol.88:1221-1232中描述。

备选地,启动子可以对更广泛种类的蛋白质或具有长期和/或广泛系统作用的特定蛋白质具有特异性,例如激素、正生长因子或负生长因子、成形素或其他分泌的或细胞表面信号分子。例如,这将允许更广泛的表达模式,使得成形素启动子与阶段特异性可变剪接机制结合可以导致成形素仅在达到某个生命周期阶段时才表达,但是在该生命周期阶段之后仍会感觉到成形素的作用(即成形素仍然可以起作用并具有效果)。优选的例子是成形素/信号分子Hedgehog、Wingless/WNT、TGFβ/BMP、EGF及其同源物,它们是众所周知的进化保守的信号分子。

还可以预见,由一系列蛋白质因子激活的启动子,例如反式激活子,或具有广泛的全身作用的启动子,例如激素或成形素,可以与可变剪接机制结合使用,实现组织和性别特异性的控制或性别和阶段特异性的控制,或阶段、组织、种系和性别特异性控制的其他组合。

还设想在本系统中可以使用一种以上的启动子和任选的增强子,作为启动相同蛋白质转录的备选手段,或者由于遗传系统包含一个以上的基因表达系统(即,一个以上的基因及其伴随的启动子)。

在一些实施方式中,启动子中的至少一个是热休克启动子,例如Hsp70。包含Hsp70启动子(HSP70 minipro)的序列的实例是SEQ ID NO:18和SEQ ID NO:41。在其他实施方式中,启动子中的至少一个是来自黑腹果蝇的sryα胚胎特异性启动子(Horn和Wimmer(2003)Nat.Biotechnol.21(1):64-70)或其同源物,或来自其他胚胎特异性或胚胎活性的启动子,例如果蝇基因slow as molasses(slam)或其他物种的同源物的胚胎活性基因。在一些实施方式中,使用基于人CMV minipro的启动子,带有或不带有其他元件,例如tetOx7和芜菁黄花叶病毒(TYMV)5’UTR(统称为“TRE3G启动子”)。基于hCMV minipro的启动子的实例提供为SEQ ID NO:65。芜菁黄花叶病毒(TYMV)5'UTR序列的一个例子是SEQ ID NO:64,而tetOx7增强子序列的一个例子是SEQ ID NO:66。这些共同构成了TRE3G启动子的一个实例(SEQ IDNO:63)。

其他有用的启动子包括但不限于杆状病毒苜蓿银纹夜蛾核多角体病毒(Baculovirus Autographica californica nucleopolyhedrosisvirus)(AcNPV)启动子IE1(例如,SEQ ID NO:26);Hsp83启动子;来自黑腹果蝇(Drosophila melanogaster)的sryα胚胎特异性启动子(Horn和Wimmer(2003)Nat.Biotechnol.21(1):64-70)或其同源物;来自果蝇基因slow as molasses(slam)的启动子或其他物种的同源物;β-微管蛋白启动子;topi启动子;aly启动子;鱼精蛋白启动子;和肌动蛋白启动子,例如昆虫肌肉肌动蛋白启动子Act5c(WO 2014/135604);或来自黄杉合毒蛾(Orgyia pseudotsugata)多核多角体病毒的Opie2启动子。

转录控制元件

优选地,多核苷酸表达系统是重组的显性致死遗传系统,其致死作用是有条件的。合适的条件包括温度,以使该系统例如在一个温度下表达,而在另一温度下则不表达,或者以较小的程度表达。致死的遗传系统可能作用于特定的细胞或组织,或对整个生物体产生影响。将理解的是,本文使用的术语致死性涵盖所有此类系统和后果。类似地,“杀死”和类似术语指的是致死系统的有效表达,并因此施加有害或性别畸变的表型,例如死亡。

更优选地,多核苷酸表达系统是重组显性致死遗传系统,其致死作用是有条件的,并且在要求存在生物体自然环境所不存在的物质的允许条件下不表达,使得致死系统的致死作用发生在生物体的自然环境中。

在一些实施方式中,编码序列编码与系统例如WO 01/39599和/或WO2005/012534中描述的tet系统连接的致死性。

确实,优选地,所述致死基因的表达处于可抑制的反式激活蛋白的控制之下。还优选的是,其表达受可变剪接调控的基因编码反式激活蛋白,例如tTA,或其变体,例如tTAV2或tTAV3。编码tTAV蛋白和变体的多核苷酸的非限制性实例包括SEQ ID NO:10(tTAV);SEQID NO:81(tTAV2)和SEQ ID NO:82(tTAV3)。由它们编码的蛋白质提供为SEQ ID NO:80(tTAV)、SEQ ID NO:97(tTAV2)和SEQ ID NO:98(tTAV3)。这与调控蛋白具有致命性并不矛盾。实际上,特别优选两者都是。在这方面,我们特别优选该系统包括如WO2005/012534中教导的正反馈系统。

优选地,显性致死系统的致死作用是有条件地可抑制的。在一些实施方式中,仅在雌性中发挥致死作用。在其他实施方式中,致死作用仅在雄性中起作用;也就是说,致死作用在雄性或雌性中表达(根据需要)。例如,如果昆虫中存在显性致死系统,则优选其导致至少40%的昆虫死亡。在一些实施方式中,在没有抑制剂的情况下,其导致至少45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的遗传系统的昆虫的死亡。

因此,在一些实施方式中,其中一个或多个显性致死基因是tTA或tTAV基因变体,增强子是包含一个或多个tetO操纵基因单元的tetO元件。当结合tTA基因或tTAV基因变体的产物时,在任一方向上的启动子的上游,tetO都能够增强其附近的启动子的转录水平。在一些实施方式中,每个增强子独立地是tetOx1、tetOx2、tetOx3、tetOx4、tetOx5、tetOx6、tetOx7、tetOx8、tetOx9、tetOx10、tetOx11、tetOx12、tetOx13、tetOx14、tetOx15、tetOx16、tetOx17、tetOx18、tetOx19,tetOx20和tetOx21中的一个。在一些实施方式中,每个增强子独立地是tetOx1、tetOx7、tetOx14和tetOx21中的一个。在包含一个以上增强子的实施方式中,第一增强子与第二增强子相同或不同。tetOx7元件的实例示出在SEQ ID NO:20、SEQ IDNO:42和SEQ ID NO:66中。tetOX14的一个实例在SEQ ID NO:83中示出。tetOx21元件的实例在SEQ ID NO:84中示出。

其他元件

在一些实施方式中,系统包括其他上游、5'因子和/或下游3'因子,用于控制表达。实例包括增强子,例如来自果蝇卵黄蛋白基因的脂肪体增强子,以及来自杆状病毒的同源区域(hr)增强子,例如AcNPV Hr5(SEQ ID NO:27或SEQ ID NO:49)。还应当理解,RNA产物将包括例如合适的5'和3'UTR。5'和3'UTR的实例包括但不限于TYMV 5'UTR(SEQ ID NO:64);黑腹果蝇(Drosophila melanogaster)fs(1)K10 3’UTR(SEQ ID NO:19);SV40 3’UTR(SEQID NO:43),P10 3’UTR(SEQ ID NO:28或SEQ ID NO:50);或在表达系统中起作用的任何其他合适的5'或3'UTR。

应该理解,参考起始密码子和终止密码子,在起始密码子和终止密码子之间定义了待在生物体中表达的多核苷酸序列,但这并不排除在该区域中定位至少一个剪接控制序列、其元件或其他序列,例如内含子。实际上,从本说明书中将显而易见的是,在某些实施方案中,剪接控制序列可以位于该区域中。

此外,在一些实施方式中,例如剪接控制序列可以至少在ATG的G可以是剪接控制序列的起始5'G的意义上与起始密码子重叠。因此,术语“在...之间”可以被认为是指从起始密码子的起始(3'到起始核苷酸,即A),优选3'到起始密码子的第二个核苷酸(即T),向上直至终止密码子第一个核苷酸的5'侧。备选地,如通过简单读取多核苷酸序列将显而易见的,也可以包括终止密码子。

其他表达单元的组合

本发明还提供了多个表达单元。在一些实施方式中,第一表达单元包括用于表达转录因子例如tTAV、tTAV2、tTAV3、tTAF或其任何类似物的dsx剪接模块。表达单元包括转录因子的识别序列,使得在缺乏四环素或四环素类似物的情况下,转录因子的表达导致正反馈,以驱动进一步表达对节肢动物具有致死或有害作用的转录因子。

在其他实施方式中,第一表达单元包括dsx剪接模块,用于表达可能具有或不具有有害或致死作用的转录因子,但作用于第二表达单元以驱动功能蛋白或核酸的转录,所述功能蛋白或核酸具有有害、致死或不育作用(例如Hid或其同源物、Reaper(Rpr)或其同源物、Nipp1Dm或其同源物、钙调蛋白或其同源物、Michelob-X或其同源物,tTAV或其同源物、tTAV2或其同源物、tTAV3或其同源物、tTAF或其同源物,Medea或其同源物、microRNA毒素或核酸酶(例如,EcoRI,FokI等),并任选地驱动来自第一表达单元(即正反馈)的更多转录因子的表达。以这种方式,节肢动物以性别特异性方式剪接dsx/转录因子表达单元的初级转录物,转录因子驱动第二表达单元在一种性别中的表达,而在另一种性别中不表达,并且任选地通过正反馈来驱动其他转录因子的表达。在一些实施方式中,第一表达单元产生tTAV或其同源物、tTAV2或其同源物、tTAV3或其同源物、tTAF或其同源物,并且在四环素响应转录控制元件例如tetO的控制下。第二转录单位产生具有有害、致死或不育作用的蛋白质。在一些实施方式中,一个或两个表达单元包括剪接模块。优选地,在存在或不存在化学配体的情况下,可抑制来自第一表达单元的转录。第二表达单元还可以通过添加第二剪接控制模块以性别特异性的方式来调控,第二剪接控制模块可以与第一剪接控制模块相同或不同,只要它在节肢动物中起作用。例如WO 2018/029534和WO 2007/091099中已经描述了其他剪接控制模块。

标记蛋白

本发明的表达系统可以进一步包含编码标记蛋白的多核苷酸,该标记蛋白可以被表达以鉴定包含该表达系统的节肢动物(例如昆虫)。此类多核苷酸可以可操作地连接至5'和/或3'元件以帮助表达。例如,启动子和任选地增强子可以可操作地连接至编码标记蛋白的多核苷酸。该启动子可以与用于表达具有致死、有害或不育作用的基因的启动子相同或不同。可以使用的启动子的实例包括组成型启动子,使得标记蛋白组成型表达。有用的启动子的实例包括但不限于杆状病毒苜蓿银纹夜蛾核多角体病毒(Baculovirus Autographicacalifornica nucleopolyhedrosisvirus)(AcNPV)启动子IE1(例如,SEQ ID NO:26);Hsp83启动子;来自黑腹果蝇(Drosophila melanogaster)的sryα胚胎特异性启动子(Horn和Wimmer(2003)Nat.Biotechnol.21(1):64-70)或其同源物;来自果蝇基因slow asmolasses(slam)的启动子或其他物种的同源物;β-微管蛋白启动子;topi启动子;aly启动子;鱼精蛋白启动子;和肌动蛋白启动子。在某些实施方式中,启动子是IE1启动子(例如,SEQ ID NO:26)。表达系统标记多核苷酸/启动子可以进一步包含增强子。合适的增强子可以包括但不限于杆状病毒苜蓿银纹夜蛾核多角体病毒(Baculovirus Autographicacalifornica nucleopolyhedrosisvirus)(AcNPV)Hr5增强子(例如,SEQ ID NO:27或SEQID NO:49)、tetOx1、tetOx2、tetOx3、tetOx4、tetOx5、tetOx6、tetOx7、tetOx8、tetOx9、tetOx10、tetOx11、tetOx12、tetOx13、tetOx14、tetOx15、tetOx16、tetOx17、tetOx18、tetOx19、tetOx20和tetOx21。在一些实施方式中,每个增强子独立地是tetOx1、tetOx7、tetOx14和tetOx21中的一个。在包含一个以上增强子的实施方式中,第一增强子与第二增强子相同或不同。tetOx7元件的实例在SEQ ID NO:20、SEQ ID NO:42和SEQ ID NO:66中示出。tetOX14的实例在SEQ ID NO:83中示出。tetOx21元件的实例在SEQ ID NO:84中示出。

标记蛋白质可以是赋予药物抗性的蛋白质,或者可以是荧光蛋白质。可用作标记蛋白的荧光蛋白的实例包括但不限于AmCyan、Clavularia、ZsGreen、ZsYellow、Discosomastriata、DsRed2、AsRed、Discosoma Green、Discosoma Magenta、HcRed-2A、mCherry、绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)和HcRed-Cr1-串联等,或它们的一种或多种突变体或变体。如下例所示,可以使用DsRed2(Clontech)。编码DsRed2的多核苷酸序列的实例提供为SEQ ID NO:1、SEQ ID NO:23和SEQ ID NO:45。由SEQ ID NO:1(DsRed2)编码的多肽序列提供为SEQ ID NO:85。

将构建体引入生物体

关于相关生物,基因系统构建体的引入或转化以及诱导表达的方法在本领域中是众所周知的。应当理解,该系统或构建体优选作为质粒施用,但是通常在整合入基因组之后进行测试。可以通过本领域已知的方法将质粒载体引入所需的宿主细胞中,例如通过转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂质转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白(参见,例如,Wu等,(1992)J.Biol.Chem.267:963;Wu等(1988)J.Biol.Chem.263:14621;和Hartmut等的加拿大专利申请号2,012,311)。通过显微注射向胚胎内给药是产生基因工程节肢动物(例如昆虫)的优选方法。质粒可以在给药前或给药过程中线性化。质粒载体可以通过任何已知的方法整合到宿主染色体中。可以使用熟知的基因座特异性插入方法,包括同源重组和重组酶介导的基因组插入。在另一个实施方式中,基因座特异性插入可以通过重组酶位点特异性基因插入来进行。在一个实例中,可将piggyBac序列掺入到载体中以驱动载体插入宿主细胞染色体。也可以采用其他技术,例如CRISPR、TALEN、AttP/AttB重组。并非所有质粒都可以整合到基因组中。在仅将质粒的一部分整合到基因组中的情况下,优选地,该部分包括至少一个能够介导可变剪接的剪接控制模块。

基因工程昆虫

本发明的载体可用于产生灰翅夜蛾属(Spodoptera)、铃夜蛾属(Helicoverpa)、银灰夜蛾属(Chrysodeixis)、大豆夜蛾属(Anticarsia)、疆夜蛾属(Peridroma)和实夜蛾属(Heliothis)的转基因昆虫。可能产生的基因工程昆虫种类的实例包括但不限于草地贪夜蛾(Spodoptera frugiperda)(草地夜蛾)、甜菜夜蛾(Spodoptera exigua)(甜菜粘虫)、灰翅夜蛾(Spodoptera littoralis)(非洲棉叶虫)、棉铃虫(Helicoverpa armigera)(棉铃虫;螟蛉;古夜蛾;非洲棉铃虫)、疆夜蛾(Peridroma saucia)(斑叶夜蛾)、谷实夜蛾(Helicoverpa zea)(螟蛉;其他通用名称包括棉铃虫和番茄螟蛉)、银灰夜蛾(Chrysodeixis includens)(大豆夜蛾)、梨豆夜蛾(Anticarsia gemmatalis)(天鹅绒豆毛虫)(velvetbean caterpillar)和烟草夜蛾(Heliothis virescens)(烟草夜蛾幼虫)。

具体实施方案(pOX5403、pOX5368和pOX5382)

在某些特定实施方式中,本发明提供了剪接盒,该剪接盒包含来源于草地贪夜蛾双性(dsx)基因的外显子和内含子。剪接盒包括各种排列的dsx的外显子2、3、3a、4、4b和5以及内含子2、3和4。在某些实施方式中,雄性剪接外显子2至外显子5。因此,对于雄性特异性剪接,必须包括外显子2和5。通过将外显子2和3与编码致死、有害或不育功能蛋白的异源序列连接,可以进行雌性剪接。对于这些实施方式,需要外显子2和3以及内含子2(见图6)。因此,可以使用外显子2、3和5与内含子2和4进行差异剪接。雌性的剪接也可以通过连接外显子2、3、4和5或外显子2、3、3a、4和5来完成(参见图3和图9)。因此,在这些构建体中,可以使用外显子2、3、4和5或外显子2、3、3a、4和5(以及任选的外显子4b)以及内含子2、3和4进行差异剪接。

这些实施方式的构建体可以将剪接盒连接至感兴趣的异源基因,例如赋予致死作用的基因,例如tTAV基因,并任选地连接至5'前导序列,例如泛素(参见图3和图9)。或者,可以将异源序列置于剪接盒的元件之间,使得雌性剪接该剪接盒的初级转录物以将异源序列包括在框内,而雄性剪接该剪接盒的初级转录物和异源序列,以将异源序列剪接下来(参见图6)。

对于这些构建体,外显子编码以下氨基酸序列:外显子2(SEQ ID NO:71),外显子3(SEQ ID NO:72),外显子3a(SEQ ID NO:73),外显子4(SEQ ID NO:74)和外显子5(SEQ IDNO:75)。在具体实施方式中,外显子和内含子的多核苷酸序列如下:外显子2(SEQ ID NO:7或SEQ ID NO:32);和外显子3(SEQ ID NO:94、SEQ ID NO:34或SEQ ID NO:56);外显子3a(SEQ ID NO:12);外显子4(SEQ ID NO:15),外显子4b(SEQ ID NO:14)(外显子4b/外显子4序列在SEQ ID NO:90、SEQ ID NO:91和SEQ ID NO:92中示出),外显子5(SEQ ID NO:17),内含子2(SEQ ID NO:55),内含子3(SEQ ID NO:58)和内含子4(SEQ ID NO:39)。这些构建体中的泛素前导序列具有SEQ ID NO:30或SEQ ID NO:52的多核苷酸序列。

这些具体实施方式具有可操作地连接至tetO增强子序列(在图2、图5和图8中)的黑腹果蝇(D.melanogaster)Hsp70 minipro启动子或人CMV minipro(具有TYMV 5'UTR)(分别示出为pOX5403、pOX5368和pOX5382),所述tetO增强子序列是tetOx7增强子。这些元件的多核苷酸序列的SEQ ID NO在表1、2和3中示出。

抑制节肢动物/昆虫种群并减少作物损害的方法

本发明还提供了通过在相同物种的野生节肢动物种群中释放包括本发明的表达系统的基因工程改造的雄性节肢动物(例如,夜蛾科昆虫)来抑制野生节肢动物(例如,夜蛾科昆虫)种群的方法。然后,基因改造的节肢动物与野生节肢动物交配,并且这种交配的后代有差异剪接剪接盒的初级转录物,以产生具有致死、有害或不育作用的功能蛋白(对于雌性节肢动物而言),导致雌性后代死亡或雌性后代无法有效繁殖,从而抑制了野生节肢动物的种群。

可以通过包含抑制功能蛋白表达并从致死、有害或不育作用中拯救昆虫的化合物来饲养昆虫以进行繁殖,从而可以产生更多的成年昆虫。当只饲养雄性昆虫用于释放时,就消除了抑制功能蛋白的化合物,并且由于雌性昆虫将产生功能性蛋白,所以雌性昆虫将死亡或无法繁殖。即使不存在抑制性化合物,不会产生功能蛋白的雄性昆虫将存活而没有任何不利影响。

本发明还提供了减少、抑制或消除节肢动物(例如夜蛾科昆虫)对作物的损害的方法,包括在相同物种的野生节肢动物种群中释放包含本发明的表达系统的基因工程雄性节肢动物(例如夜蛾科昆虫),然后基因改造的节肢动物与野生节肢动物交配,这种交配的后代差异剪接剪接盒的初级转录物,从而产生具有致死、有害或不育作用的功能蛋白(对于雌性节肢动物),导致雌性后代死亡或雌性后代无法有效繁殖,从而抑制了野生节肢动物的种群,并减少、抑制或消除了由野生昆虫引起的农作物损害。

本发明还提供了对夜蛾科昆虫进行抗性管理的方法,包括在相同物种的野生夜蛾科昆虫种群中释放包含本发明的表达系统的基因工程雄性夜蛾科昆虫,其中该种群包含对杀虫剂和生物性杀虫剂(例如Bt型)具有抗性的多种昆虫,然后,基因工程昆虫与野生昆虫交配,这种交配的后代有差异剪接剪接盒的初级转录物,以产生(对于雌性夜蛾科昆虫)具有致死、有害或不育作用的功能蛋白,导致雌性后代死亡或雌性后代无法有效繁殖。从这种与野生雌性交配的后代中存活下来的雄性后代还有效地传递了转基因群体中存在的易感等位基因(即,性状渗入了野生种群),并稀释了野生害虫种群的抗性频率。这种策略的进一步描述例如可以在WO2004098278中找到。以此方式,从而该方法抑制了野生夜蛾科昆虫的种群并减缓或逆转了野生夜蛾科昆虫种群对杀虫剂的抗性。

本发明还包括检测包含本发明的雌性基因表达系统的基因工程昆虫的方法,其通过在表达系统中包括报告基因表达单元来表达报告基因(例如但不限于荧光蛋白)来实现,其中报告基因在系统中的表达是可检测的。

在一些实施方式中,报道基因是荧光蛋白。在一些实施方式中,荧光蛋白是DsRed2(例如,由SEQ ID NO:1编码,并且具有SEQ ID NO:80的氨基酸序列)。在一些实施方式中,通过在一定波长的光下检查昆虫来检测报告基因。

实施例

以下实施例涉及基于夜蛾科、草地贪夜蛾dsx基因制备的构建体。为了允许开放阅读框,减少翻译内部起始位点的可能性,控制表达片段的大小以及在雄性和雌性之间产生可靠的性别特异性剪接,对一些外显子和内含子进行了一些改造。

在本发明的剪接盒和表达系统中使用的dsx完全消除了外显子1。外显子2被截短了大约75%,并在5'末端添加了5个核苷酸(atgaa),以提供起始的甲硫氨酸并将外显子保持在OX5403和OX5382的读框内。整个外显子3和外显子3a保留在OX5382和OX5403中,并在3'末端添加了另一个g,以保持阅读框。在OX5368中,将包含起始密码子和终止密码子的tTAV蛋白编码序列置于通过多核苷酸接头连接的外显子3内(参见图19)。尽管保留了整个外显子4b和外显子4,但由于在外显子4b/4的编码区内发生了剪接事件,因此只有外显子4被剪接到功能蛋白中。整个外显子5与在外显子3'末端提供的另外6个核苷酸(gtagcg)一起使用。

此外,针对pOX5382和pOX5403引入了以下点突变(编号是参考内源dsx cDNA,编号始于外显子1的开头):

类似地,除了上述截短之外,还为pOX5368设计了以下点突变(编号是参考内源dsxcDNA,编号始于外显子1的开头):

实施例1.OX5403草地贪夜蛾的产生

质粒pOX5403(图1)是基于克隆载体pKC26-FB2(基因库(Genbank)#HQ998855)。质粒骨架包含pUC复制起点和赋予氨苄青霉素抗性的β-内酰胺酶基因,用于分子克隆程序。该质粒部分不包含在rDNA中或未整合到昆虫基因组中。

pOX5403还包含掺入昆虫中的完整rDNA,包括编码DsRed2红色荧光标记蛋白的合成DNA序列(Clontech),四环素可抑制的转录激活子tTAV的合成DNA序列(基于来自大肠杆菌和HSV-1VP16转录激活子的序列融合),以及衍生自草地贪夜蛾的修饰的Sfdsx剪接模块。图2中所示的组件在表1中详细列出。通过使用常规DNA克隆程序制备质粒。

第一基因是在Hr5/IE1启动子控制下的DsRed2基因。该基因负责产生DsRed2荧光蛋白,该蛋白可作为可视化标记,用于将rDNA整合到草地贪夜蛾的基因组中并鉴定转基因昆虫。

第二基因是在复合启动子(TRE3G)控制下的Sfdsx_tTAV基因,该启动子包括与TYMV 5'UTR融合的截短版本的hCMV最小启动子,位于四环素响应操纵基因(tetOx7)的下游(Loew等(2010)BMC Biotechnol.10:81)。通过Sfdsx剪接模块使得tTAV蛋白的表达为雌性特异性的。

通过包含草地贪夜蛾双性基因(Sfdsx)的部分以雌性特异的方式表达Sfdsx_tTAV基因。该基因被转录成三种不同的性别特异性可变剪接的转录物,两种雌性特异性(F1和F2)和一种雄性特异性(M)转录物(图3)。这三种转录物中的变异是由于性别特异性的包括不同的mRNA序列,其来自Smdsx性别特异性可变剪接模块编码的RNA的性别特异性剪接。在F1和F2转录物中,编码tTAV的序列与上游起始密码子在读框内(图2)。在雌性转录物中,发生剪接以将外显子2、3、4和5与泛素前导序列和tTAV序列按读框连接,从而将tTAV序列翻译并从翻译的蛋白质上切割下来,或者将外显子2、3/3a、4和5按读框连接到泛素前导序列和tTAV序列,使得tTAV序列被翻译并从翻译的蛋白质上切割下来。在M转录物中,dsx外显子3、3a、4b和4的排除阻止了tTAV蛋白的产生,因为tTAV编码序列不在具有tTAV起始密码子的框内,并且与具有位于tTAV编码序列之前的外显子5的下游的终止密码子在框内。因此,M转录物在其编码序列中包含读框内的终止密码子,其可能通过无义介导的衰变导致M转录物mRNA降解(Hansen等(2009)PLoS Genet.5:e1000525)。

质粒pOX5403含有掺入昆虫中的完整rDNA,包括编码DsRed2红色荧光标记蛋白的合成DNA序列,四环素可抑制转录激活子tTAV的合成DNA序列(基于大肠杆菌和HSV-1VP16转录激活子的序列融合),以及衍生自草地贪夜蛾的修饰的Sfdsx剪接模块。

表1.OX5403的遗传组分

用非自主的piggyBac转座元件进行转化,该元件首先在(Thibault等,(1999)Insect Mol.Biol.8:119-123)中描述,并与piggyBac转座酶的非整合源共同注入(从质粒pOX3022体外转录的mRNA)。该piggyBac转座子最初是从粉纹夜蛾(Trichoplusia ni)的细胞培养物中分离出来的,并且已经用于几种昆虫转化中(双翅目、鳞翅目、鞘翅目)(Handler,(2002)Proc.Natl.Acad.Sci.USA 95:7520-7525;O'Brochta等,(2003)J.Exp.Biol.206:3823-3834;Tamura等,(2000)Nat.Biotechnol.18:81-84)。如最初所描述的,该转座子由两个组件组成,分别是编码piggyBac转座酶的编码序列,和被转座酶识别并加工成整合入靶DNA的末端反向重复序列。但是,用于将OX5382 rDNA整合到草地夜蛾基因组中的piggyBac最小元件是基于piggyBac转座酶有效整合到目标DNA所需的最小序列(包括但不限于末端反向重复序列),并且不含产生piggyBac转座酶所需的编码序列(Li等(2005)Insect Mol.Biol.14:17-30)。

实施例2.OX5368草地贪夜蛾的产生

质粒pOX5368(图4)是基于克隆载体pKC26-FB2(基因库(Genbank)#HQ998855)。质粒骨架包含pUC复制起点和赋予氨苄青霉素抗性的β-内酰胺酶基因,其用于分子克隆程序。该质粒部分不包含在rDNA中或未整合到昆虫基因组中。

质粒pOX5368还包含掺入昆虫的完整rDNA,包括编码DsRed2红色荧光标记蛋白的合成DNA序列,四环素可抑制转录激活子tTAV2的合成DNA序列(基于大肠杆菌和HSV-1VP16转录激活子的序列的融合),以衍生自草地贪夜蛾的修饰的Sfdsx剪接模块。图5中所示的组件在表2中详细列出。使用常规DNA克隆方法制备质粒。

通过包含草地贪夜蛾双性基因(Sfdsx)的一部分以雌性特异性方式表达Sfdsx_tTAV2基因。该基因被转录成三种不同的性别特异性可变剪接转录物,两种雌性特异性(F1和F2)转录物和一种雄性特异性(M)的转录物(图6)。这三种转录物中的变异是由于不同的mRNA序列的性别特异的包含,所述不同的mRNA序列由Sfdsx性别特异性可变剪接模块编码的RNA的性别特异性剪切所致。在F1和F2转录物中,编码tTAV2的mRNA序列与剪接的外显子2、外显子3 5'部分在框内,并翻译成tTAV2蛋白(图6)。在M转录物中,剪接转录物中排除dsx外显子3、3a、4b和4会阻止tTAV2蛋白的产生,因为tTAV2编码序列是完全从mRNA中剪接出来的。

表2.OX5368的遗传组件

用非自主的piggyBac转座元件进行转化,首先在(Thibault等,1999)中描述,与非整合来源的piggyBac转座酶(从质粒pOX3022体外转录的mRNA)一起注射。该piggyBac转座子最初是从粉纹夜蛾(Trichoplusia ni)的细胞培养物中分离出来的,并已用于多种昆虫转化中(双翅目、鳞翅目、鞘翅目)(Handler,2002;O'Brochta等,2003;Tamura等,2000)。如最初所描述的,该转座子由两个组件组成,分别是编码piggyBac转座酶的编码序列,和被转座酶识别并加工以整合入靶DNA的末端反向重复序列。但是,用于将OX5368 rDNA整合到草地夜蛾基因组中的piggyBac最小元件是基于piggyBac转座酶有效整合到目标DNA所需的最小序列(包括但不限于末端反向重复序列),以及不包含产生piggyBac转座酶所需的编码序列(Li等,2005)。

实施例3.OX5382草地贪夜蛾的产生

质粒pOX5382(图7)基于克隆载体pKC26-FB2(Genbank#HQ998855)。质粒骨架包含pUC复制起点和赋予氨苄青霉素抗性的β-内酰胺酶基因,可用于分子克隆程序。该质粒部分不包含在rDNA中或未整合到昆虫基因组中。

pOX5382还包含掺入昆虫中的完整rDNA,包括编码DsRed2红色荧光标记蛋白的合成DNA序列,四环素可抑制转录激活子tTAV的合成DNA序列(基于来自大肠杆菌和HSV-1VP16转录激活子的序列的融合),以及衍生自草地贪夜蛾的修饰的Sfdsx剪接模块。图8中所示的组件在表3详细列出。质粒是由Oxitec Ltd使用常规DNA克隆程序制备的。

Sfdsx_tTAV基因通过包含草地贪夜蛾双性基因(Sfdsx)的一部分以雌性特异性方式表达。该基因被转录成三种不同的性别特异性可变剪接转录物,两种雌性特异性(F1和F2)转录物和一种雄性特异性(M)转录物(图9)。这三种转录物中的变异是由于不同mRNA序列的性别特异性包含,所述不同mRNA序列是由Sfdsx性别特异性可变剪接模块编码的RNA的性别特异性剪接所致。在F1和F2转录物中,编码tTAV的序列与上游起始密码子在读框内(图9)。在M转录物中,dsx外显子3、3a、4b和4的排除阻止了tTAV蛋白的产生,因为tTAV编码序列与tTAV起始密码子不同框,并且与位于在tTAV编码序列之前外显子5的下游的终止密码子在读框内。因此,M转录物在其编码序列中包含框内终止密码子,这可能导致M转录物mRNA由于无义介导的衰变而降解(Hansen等,2009)。

表3.OX5382的遗传组件

用非自主的piggyBac转座元件进行转化,首先在(Thibault等,1999)中描述,并与非整合来源的piggyBac转座酶(从质粒pOX3022体外转录的mRNA)一起注射。该piggyBac转座子最初是从粉纹夜蛾的细胞培养物中分离出来的,并已用于多种昆虫转化中(双翅目、鳞翅目、鞘翅目)(Handler,2002;O'Brochta等,2003;Tamura等,2000)。如最初所描述的,该转座子由两个组件组成,分别是编码piggyBac转座酶的编码序列,和被转座酶识别并加工成整合入靶DNA的末端反向重复序列。但是,用于将OX5368 rDNA整合到草地夜蛾基因组中的piggyBac最小元件是基于piggyBac转座酶有效整合到目标DNA所需的最小序列(包括但不限于末端反向重复序列),以及不包含产生piggyBac转座酶所需的编码序列(Li等,2005)。

野生型草地贪夜蛾的雌性转录物和雄性转录物在图16C中示意性地示出,其中内源终止密码子阻止剪接的初级转录物的翻译,除了在雄性草地贪夜蛾的情况下。野生型草地贪夜蛾和相关的夜蛾科(棉铃虫)中外显子的剪接分别在图16B和16A中示出。这些相关的夜蛾科以高度保守的方式剪接外显子。

图17显示了构建体OX5403、OX5368、OX5382、内源性野生型草地贪夜蛾(内源性)和棉铃虫(HA)由dsx的雌性(F)和雄性(M)转录物编码的外显子2、3、3a、4和5的氨基酸序列。由于棉铃虫和野生型草地贪夜蛾在外显子3中具有终止密码子,所以雌性不翻译外显子3a、4b、4或5。本发明的构建体引入了变化以打开外显子3、3a、4和5的阅读框,允许雌性翻译整个外显子集,尽管外显子5的翻译与雄性转录物处于不同的阅读框中,并导致不同的氨基酸序列(比较图17E和图17F)。

实施例4.基因改造的草地贪夜蛾的性状的外显率

为了评估OX5403、OX5368和OX5382中早期双性自限性状的外显率和抑制性,在半合子雄性OX5403、OX5368和OX5382与野生型雌蛾之间进行测交。从这些杂交中收集第一龄幼虫并饲养在单个细胞中,并饲喂含有100μg/ml强力霉素(“有强力霉素”)或不含强力霉素(0μg/ml)(“无强力霉素”)的饮食。预计从这些杂交中会得到四类蛾:(1)雄性自限蛾;(2)雌性自限蛾类;(3)野生型雄蛾;(4)野生型雌蛾。如果自限性性状具有良好的外显率,则所有类别都将在强力霉素上存活,但是在没有强力霉素的情况下,雌性自限性飞蛾将死亡(图10)。测试了OX5403、OX5368和OX5382的几个亚株。选择满足外显率标准的株进行进一步开发。每种株OX5368C、OX5403A和OX5382G和OX5382J的结果示于图11、图12、图13和图14。

图11示出了携带自限性性状的OX5368C雌性在有强力霉素时是完全能存活的,但在无强力霉素时,没有OX5368C雌性存活至成年。同样,图12示出了携带自限性性性状的OX5403A雌性在有强力霉素时是完全能存活的,但是在无强力霉素时,没有OX5403A雌性存活至成年。

为了实现外显率目的,选择了OX5382的两个株:OX5382G和OX5382J。与OX5403A和OX5368C相似,携带自限性性状的OX5382G和OX5382J雌性都可以在有强力霉素时存活(尽管比野生型雌性略低),但是无强力霉素时,没有OX5382G或OX5382J雌性存活到成年(分别是图13和图14)。

实施例5.夜蛾生命期荧光的评估

携带自限基因构建体的转基因株还携带并表达荧光蛋白DsRed2(Clontech;Matz,MV等(1999)Nature Biotechnol.17:969-973;Lukyanov等(2000)J.Biol.Chem.275(34):25879)。

使用配备有用于检测的滤光片的Leica M80显微镜检查转基因和野生型草地贪夜蛾的早期幼虫、终龄幼虫,蛹和成虫的DsRed2荧光,来评估DsRed2转基因在夜蛾中的表达:最大激发563nm、发射582nm。结果示于图15中。在草地贪夜蛾的所有生命阶段均检测到DsRed2荧光。

SEQ ID NO:1:来自珊瑚(Discosoma)的红色荧光蛋白的变体(clontech)

SEQ ID NO:2:合成DNA

SEQ ID NO:6:基于草地贪夜蛾序列的合成DNA

SEQ ID NO:10:优化的融合四环素反式激活蛋白

SEQ ID NO:20:合成DNA包含Tn10tet-操纵子的7个重复序列

SEQ ID NO:22:合成DNA

SEQ ID NO:23:来自珊瑚(Discosoma)的红色荧光蛋白的变体(Clontech)

SEQ ID NO:24:合成DNA

SEQ ID NO:29:优化的融合四环素反式激活蛋白

SEQ ID NO:31:基于草地贪夜蛾的合成DNA

SEQ ID NO:42:合成DNA包含Tn10tet-操纵子的7个重复序列

SEQ ID NO:44:合成DNA

SEQ ID NO:45:来自珊瑚(Discosoma)的红色荧光蛋白变体(Clontech)

SEQ ID NO:46:合成DNA

SEQ ID NO:51:优化的融合四环素反式激活蛋白

SEQ ID NO:53:基于草地贪夜蛾的序列的合成DNA

SEQ ID NO:63:基于TYMV、hCMV和Tn10tet操纵子的7个重复序列

SEQ ID NO:64:基于TYMV序列的合成非编码片段

SEQ ID NO:66:合成的DNA包含Tn10tet-操纵子的7个重复序列

SEQ ID NO:67:tTAV2

SEQ ID NO:68:tTAV3

SEQ ID NO:80:tTAV

SEQ ID NO:81:tTAV2

SEQ ID NO 82:tTAV3

SEQ ID NO:83:合成的DNA包含Tn10tet-操纵子的14个重复序列

SEQ ID NO:84:合成DNA包含Tn10 tet-操纵子的21个重复序列

SEQ ID NO:85:来自珊瑚(Discosoma)的红色荧光蛋白变体(Clontech)

SEQ ID NO:86:用于在节肢动物中表达的质粒构建体

SEQ ID NO:87:用于在节肢动物中表达的质粒构建体

SEQ ID NO:88:用于在节肢动物中表达的质粒构建体

SEQ ID NO:95:合成DNA接头

SEQ ID NO:96:合成DNA接头

SEQ ID NO:97:tTAV2

SEQ ID NO:98:tTAV3

SEQ ID NO:99:tTAV2ORF

SEQ ID NO:100:tTAV2

SEQ ID NO:101:tTAV

SEQ ID NO:102:tTAV

SEQ ID NO:103:来自5403和5382的转录物的翻译

SEQ ID NO:104:来自Endo的外显子2的翻译

SEQ ID NO:105:来自HA的外显子2的翻译

SEQ ID NO:106:来自5403的外显子3F转录物的翻译

SEQ ID NO:107:来自5382的外显子3F转录物的翻译

SEQ ID NO:108:来自Endo 1的外显子3F转录物的翻译

SEQ ID NO:109:来自Endo 2的外显子3F转录物的翻译

SEQ ID NO:110:来自HA的外显子3F转录物的翻译

SEQ ID NO:111:来自5403和5382的外显子4F转录物的翻译

SEQ ID NO:112:来自HA的外显子5M转录物的翻译

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号