首页> 中国专利> 信使RNA 5’端引入的两个RNA序列取代信使RNA帽

信使RNA 5’端引入的两个RNA序列取代信使RNA帽

摘要

本发明涉及缺少帽分子的信使核糖核酸(mRNA)分子,因其在体外转录合成的成本大大降低,其从5'至3'端包含:至少一个拷贝的对Xrn1外切核酸酶具有抗性的GUCAGRYC(N7‑19)GCCA(N2‑19)UGCNRYCUG共有序列、一个拷贝的内部核糖体进入位点(IRES)RNA序列、以及开放阅读相(une phase)。

著录项

  • 公开/公告号CN112567046A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 梅辛杰生物制药;

    申请/专利号CN201980040513.6

  • 发明设计人 J·勒穆瓦安;

    申请日2019-05-15

  • 分类号C12Q1/6865(20060101);C12N15/67(20060101);C12N15/115(20060101);C12P19/34(20060101);C12P21/02(20060101);

  • 代理机构11314 北京戈程知识产权代理有限公司;

  • 代理人程伟;程云

  • 地址 法国里奥姆

  • 入库时间 2023-06-19 10:22:47

说明书

技术领域

本发明涉及核糖核酸领域,更具体地涉及信使核糖核酸(ARNm)的体外合成、其稳定性以及其翻译成多肽,特别是在转染细胞中。

背景技术

ARNm是在工业规模上生产多肽的重要分子。它的稳定性以及转录和翻译效率强烈地影响多肽的下游产量,以及由此而来的成本。

ARNm也是在基因疗法和遗传接种中所使用的药物组合物所选择的分子。事实上,与ADN分子相比,从未证实ARNm分子整合入转染细胞的基因组。然而,由于其对核糖核酸酶降解敏感,所以其在溶液中的稳定性差。因此,在体外和体内稳定的ARN分子合成对于减少最佳治疗效果所需的ARNm量并因此降低其成本至关重要。此外,使用更少量的更稳定的ARNm可降低与治疗相关副作用风险。

在培养细胞(例如酵母或细菌)中发生体内合成。但是,这种方法有许多缺点。特别是由于降解问题和存在其他细胞ARN,纯化完整的目标ARN昂贵且复杂。与通过体外转录获得的产量相比,其通常产生较低产量。

结果,通常使用大规模ARNm的合成方法是无细胞体外转录系统。该方法仅使用了几种纯化的化合物(即反应缓冲液、带有基因的ADN分子、重组ARN聚合酶和四种核糖核苷酸三磷酸),唯一要生产的ARN是人们希望合成的ARNm。反应结束时,由于反应混合物中不存在ARN酶,因此没有ARNm降解产物。也没有其他ARN种类,这是优于用培养细胞来合成ARNm的主要优势。因此大大简化了ARNm的纯化。

为了确保ARNm在真核细胞中的稳定性,其5′端具有帽分子,可保护5′端免于外切核糖核酸酶。帽是由两个鸟苷组成的复合分子,两个鸟苷的5′碳通过三个磷酸基团的链连接。末端鸟苷在鸟嘌呤的7位甲基化。通过帽对Xrn1外切核糖核酸酶从5′到3′执行的进行性酶降解具有抗性,ARNm得以稳定。除了稳定ARNm的作用外,帽还具有其他功能,包括核糖体募集(Cowling,2010年)。为此,帽从募集翻译起始因子开始,而起始因子又进而募集核糖体。然后,核糖体将ARNm 翻译成蛋白质。

在工业规模上,为了提高ARNm的稳定性并实现在转染细胞中将ARNm有效翻译成多肽,应在5′端掺入帽分子。在体外转录过程中,在转录后的步骤中使用加帽酶(例如,来自牛痘(Viccina)病毒的2′-O-甲基转移酶)可添加帽分子(Martin 等,1975)。但是,这一额外步骤增加合成的复杂性,需要纯化加帽酶,并且效率不高(Contreas等,1982)。另外,该酶需要S-腺苷-L-蛋氨酸,其在水溶液中是不稳定分子。

为了简化体外转录,在现有技术中已经开发了帽类似物,但是其并不令人满意。例如,可引用P

实际上,为了确保体外转录过程中高加帽效率,有必要提供过量的帽类似物,从而导致原材料成本高。实际上,建议比例为每个GTP分子使用4个帽类似物分子,以最大化每个ARNm分子具有帽的机会。尽管如此,据估计仅80%的合成 ARNm将得以加帽。此外,与其他三种核糖核苷三磷酸相比,GTP浓度降低了5 倍,从而使转录产量降低了5倍。

降低体外转录高成本的一种方法是降低该方法中使用的ADN和/或ARN聚合酶的生产成本。但是,获得的成本降低仍然相对较小。可选择的,有可能通过在无细胞系统中的体外转录来合成环状的无帽的ARNm(WO 2014/186334 A1)。然而,作者证明,与加帽线性ARNm相比,环状ARNm在转染细胞中的翻译效率较低(参见例如,图2和图3以及WO 2014/186334A1的第[00121]和[00131]段)。

结果,仍然需要具有高稳定性以及高翻译效率的ARNm分子,优选具有至少与加帽的ARNm分子一样高的稳定性和翻译效率的ARNm分子。还需要一种ARN 分子,其具有简单的生产方法并且其制造成本显著降低。

发明内容

本发明涉及可以高效翻译的稳定的无帽的ARNm分子。该ARNm是特别有利的,因为其生产成本比含有帽分子或其类似物的常规ARNm的生产成本低得多。本发明还涉及ARNm分子,与包含帽分子或其类似物的常规ARNm相比,其体外转录产量提高。实际上,本发明的ARNm也是有利的,因为尽管其生产成本显著降低和/或其合成产量提高,但是当转染培养的细胞和组织时,所述ARNm至少与常规的加帽ARNm一样有效。实际上,发明人非常惊奇地证明了体内转染后获得的表达水平和持续时间至少与加帽的ARNm一样高。具体地,无论是用本发明的ARNm还是对照加帽的ARNm转染,报告蛋白在Caco-2细胞中的表达动力学都是相同的(图2和图3)。同样,发明人非常惊奇地证明,当在小鼠的真皮或肌肉中体内转染本发明的ARNm时,报告蛋白的表达比对照加帽ARNm转染的表达高2 倍至约10倍(图5和图15)。但是,因为额外的加帽步骤是不必要的,所以简化了反应。在体外转录过程中,也不需要在反应混合物中包含帽类似物分子。因此,与现有技术的ARNm相比,对于至少同样高的表达而言,本发明的ARNm分子在降低成本和促进生产方面明显有利。

出于本申请的目的,术语“ARNm分子”是指核糖核苷酸的任何线性链。在本申请中,这些序列以5′-UTR区域开始以5′至3′方向表达。

“核糖核苷酸”是指任何天然核糖核苷酸(例如,鸟嘌呤、胞苷、尿苷、腺苷),以及这些核苷酸的类似物以及具有化学或生物学修饰的碱基(例如,通过甲基化、烷基化、酰化、硫醇化等)的核苷酸,插入的碱基、修饰的核糖基团和/或修饰的磷酸基团。

发明人在本文中出人意料地证明,ARNm分子5′端的帽可以被至少一个拷贝的对Xrn1外切核糖核酸酶(xrRNA)有抗性的序列所替代,所述有抗性的序列源自于黄病毒属的病毒的3′-UTR区域,优选在开放阅读框内带有内部核糖体进入位点(IRES)。与加帽的ARNm分子相比,非常有利的是,通过体外转录这种ARNm 分子的生产成本降低了约30倍,并且其产率得以提高。另外,本发明的ARNm分子在被转染的细胞中是特别稳定的,即使无帽也可以被有效地翻译。

“帽”是指7-甲基鸟苷(N7-甲基鸟苷或m7G)核苷及其任何突变体、变体、类似物或其片段,其可以通过5′-5′三磷酸键与从ARNm转录的第一核苷酸连接。无限制地,帽类似物包括非甲基化的类似物(例如P

因此,根据第一方面,本发明涉及缺少帽分子的信使核糖核酸(ARNm)分子,其包含:

·5′-UTR区,其包含至少一个拷贝的GUCAGRYC(N

·至少一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·至少一个开放阅读框。

优选地,IRES ARN序列位于每个开放阅读框的上游。

根据一个优选的实施方案,本发明涉及缺少帽分子的信使核糖核酸(ARNm) 分子,其从5′至3′包含:

·5′-UTR区,其包含至少一个拷贝的GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框。

优选地,ARNm分子还包含3′-UTR区域。

优选地,ARNm分子还包含至少一种ARN适体,其促进ARNm分子穿透进入细胞,优选进入肌肉细胞。ARN适体可以直接或间接地通过肽显著促进穿透。

优选地,所述ARNm分子还包含在5′端的茎-环。

在一个优选的实施方案中,本发明涉及缺少帽分子的信使核糖核酸(ARNm) 分子,从5′至3′由以下组成:

·5′-UTR区,包含至少一个拷贝的GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框。

在现有技术中已经证明黄病毒(Flavivirus)的3′-UTR非翻译区具有阻断Xrn1 的特性,从而保护下游序列(Chapman等,2014)。ARN的该区域由至少一个自发折叠而形成抑制Xrn1进程的复杂三维结构的序列组成,从而抑制了病毒亚基因组ARN的降解。但是,此类序列之前从未插入至ARNm的5′。确实,人们担心这些序列可能需要在黄病毒基因组的3′-UTR的背景下才能发挥其功能。特别地,当不再被黄病毒3′-UTR区域的序列包围时,这些三维结构可能无法正确折叠。

尽管现有技术表明xrRNA序列抑制翻译,但是发明人在此出人意料地证明帽的保护功能和翻译起始功能可以被至少一个拷贝的xrRNA序列和至少一个拷贝的 IRES序列(优选来自EMCV病毒)所成功取代,而不影响翻译效率。出人意料地是,使用xrRNA和IRES序列甚至可以大大提高翻译效率。

通过“黄病毒”是指黄病毒属的任何病毒,包括黄热病、登革热、西尼罗河 (WNV)、寨卡、日本脑炎、罗西奥(Rocio)、墨莱(Murray)溪谷、巴格扎(Bagaza) 病毒、科科贝拉(Kokobera)、恩塔亚(Ntaya)、凯杜古(kedougou)、塞皮克 (Sepik)、圣路易斯、乌苏图(Usutu)、阿尔弗(Alfuy)、韦塞尔布朗(Wesselbron)、伊列乌斯(Ilheus)、布苏夸(Bussuquara)、坦布苏(Tembusu)、朝阳(Chaoyang)、横濑(Yokose)、东港(Donngang)病毒以及黄病毒属的任何其他病毒。

因此,本发明涉及一种稳定的ARNm分子,其在所述ARNm的5′区域中包含至少一个拷贝的xrRNA序列。所述ARNm以与加帽分子相似的水平和持续时间有效地翻译成蛋白质。根据本发明的优选实施方案,ARNm分子包含两个拷贝的 xrRNA。

通过“抗Xrn1的ARN序列”或“xrRNA”指可能降低、减缓或阻止Xrn1外切酶降解ARNm的任何多核苷酸序列。优选地,xrRNA序列包含共有序列。

“共有序列”指至少包含以下所示序列的任何序列:5′-GUCAGRYC(N

优选地,ARNm分子包含至少一个拷贝的选自SEQ ID NO:1至SEQ ID NO: 44所示序列的一个xrRNA序列。当ARNm分子包含一个以上拷贝所述序列时,那些拷贝可以相同或不同。因此,更优选地,ARNm分子包含SEQ ID NO:11和 SEQ ID NO:26所示序列之一的至少一个拷贝。甚至更优选地,ARNm分子包含一个拷贝SEQ ID NO:11所示序列和一个拷贝SEQ IDNO:26所示序列。

优选地,当在5′-UTR区域中有两个xrRNA序列时,它们被间隔子序列隔开。同样,在xrRNA序列和IRES序列之间可能存在间隔子序列。优选地,两个xrRNA 序列之间的间隔子序列对应于SEQ ID NO:47。优选地,xrRNA序列和IRES序列之间的间隔子序列对应于SEQ IDNO:48。当ARNm分子包含至少两个开放阅读框时,间隔子序列也可以存在于两个开放阅读框之间或在开放阅读框与IRES序列之间。

“间隔子序列”是指使得有可能将所述间隔子序列上游序列与下游序列物理分离的任何非编码多核苷酸序列。根据本发明的ARNm分子可以显著包含一个或多个间隔子序列。

在一些实施方案中,间隔子序列的长度可以是2至300个核苷酸。优选地,其在2至10个核苷酸之间,甚至更优选地在2至5个核苷酸之间。或者,其可以在10至150个核苷酸之间,甚至更优选在15至40个核苷酸之间。优选地,间隔子序列不产生二级结构。

本发明的ARNm还包含至少一个内部核糖体进入位点(IRES)ARN序列。

“内部核糖体进入位点”或“IRES”是指允许不依赖于帽而起始ARNm分子翻译的任何多核苷酸序列。这样的序列与翻译起始因子直接相互作用,然后其在翻译起始密码子上招募核糖体。已知许多IRES序列(Mokrejs等,2010)。因此,本领域技术人员将能够识别起IRES′作用的序列,并选择那些适合的用来实施本发明。因此,根据本发明的IRES序列可以是真核的或病毒来源的序列,例如,来自小核糖核酸病毒(Picornavirus)属。优选地,其来源于脑心肌炎病毒(EMCV) (Borman等,1995)或来自人eIF4G ARNm。甚至更优选地,IRES的ADN序列对应于SEQ ID NO:45。

IRES序列通常位于5′-UTR区域。它们也可以位于两个开放阅读框之间,这使得可以从单个ARNm启动双顺反或多顺反子翻译。在一个优选的实施方案中,本发明的ARNm在所述ARNm的5′区域中包含单拷贝的IRES序列。根据一个优选的实施方案,IRES序列的第二拷贝位于两个开放阅读框之间。根据又一个优选的实施方案,本发明的ARNm在5′区域中包含一个拷贝的IRES序列以及一个拷贝的两个开放阅读框之间的IRES序列。有利地,所述IRES序列位于xrRNA序列的下游。该组织有利地使得有可能保护这些序列免于Xrn1外切核糖核酸酶。当ARNm 分子包含至少两个IRES序列时,所述序列可以相同或不同。具体地,可以根据其启动翻译的效率选择一个或多个IRES序列。当ARNm分子包含至少两个不同的开放阅读框并且第一个开放阅读框所需的翻译效率不同于第二个开放阅读框所需的翻译效率时,选择两个不同的IRES序列是特别有利的。

IRES元件还具有复杂的三维结构。因此,通过在两个区域中每个的ARN序列之间形成配对,可能在xrRNA和IRES序列之间产生相互干扰。此类干扰可能分别阻止xrRNA和IRES序列正确结构形成。另外,xrRNA结构可以通过IRES 显著阻止招募翻译起始因子和核糖体。甚至更出人意料的是,发明人已经证明,存在xrRNA和IRES序列使得有可能在转染细胞中获得蛋白质表达产量,所述产量至少类似于用加帽ARNm分子获得的产量。因此,xrRNA和IRES序列一起可以取代一个帽或帽类似物分子。它们对于确保翻译包含在本发明ARNm中的开放阅读框和ARNm稳定性是必不可少的。

因此,在转染的细胞中,本发明的ARNm至少与加帽的ARNm一样稳定,同时也至少有效地被翻译。另外,与加帽的ARNm相比,其通过体外转录合成的成本大大降低。

根据一个具体的实施方案,本发明的ARNm在共有序列GUCAGRYC(N

“茎-环”指形成双螺旋形结构的任何多核苷酸序列,其中一条链的5′端通过未配对的环与另一条链的3′端物理连接。因此,茎-环由双链茎和未配对的单链环组成。所述物理键可以是共价的或非共价的。优选地,所述物理键是共价键。ARN 环的大小可以是,例如,在3至30个核苷酸之间。环的大小优选为至少3个核苷酸,优选为至少4个核苷酸。双链茎的长度可以是例如,5至50个核苷酸之间。茎的长度优选为5至50、5至40、5至30、5至25,或更优选5至10个核苷酸。甚至更优选地,茎的长度是6、7或8个核苷酸。

在本发明的上下文中,茎-环优选在ARNm分子的5′端形成。根据一个优选的实施方案,茎-环具有SEQ ID NO:87的序列。茎-环优选通过间隔子序列与xrRNA 序列分开。优选地,所述间隔子序列的长度等于或小于5个核苷酸(即,5、4、3 或2个核苷酸)。确实,发明人出人意料地证明,在ARNm分子的5′端添加茎- 环结构(在此也称为5′-SL,因为茎-环在5′端),当其接近xrRNA序列(例如,5 个核苷酸或更少)可能进一步改善体内翻译。实际上,当位于5′端的茎-环被长度约为70个核苷酸的间隔子序列与xrRNA序列分开时,发明人并未观察到有利的效果(见图15)。

不受理论的束缚且出人意料地是,至少在该序列为茎-环形式且非常接近时,可以设想xrRNA序列遮盖了5′端使其免于磷酸酶和Xrn1。

因此,在一个优选的实施方案中,本发明涉及缺少帽分子的信使核糖核酸 (ARNm)分子,其从5′至3′包含:

·5′-UTR区域,包含至少一个拷贝的GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框,

在5′端还包含茎-环。

ARNm分子可以进一步包含第二IRES序列,其后是第二开放阅读框。ARNm 分子可以进一步包含本文定义的ARN适体,其位于茎-环和xrRNA序列之间,或者优选地,位于xrRNA序列和IRES序列之间。ARNm分子可以进一步包含本文定义的3′-UTR区域。

在一个优选的实施方案中,本发明涉及缺少帽分子的信使核糖核酸(ARNm) 分子,其从5′至3′包含:

·在5′端含有茎-环的5′-UTR区域,接着是至少一个拷贝的GUCAGRYC (N

·任选地,ARN适体;

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框。

在一个优选的实施方案中,本发明涉及缺少帽分子的信使核糖核酸(ARNm) 分子,从5′至3′由以下组成:

·5′-UTR区域在5′端含有茎-环,接着是至少一个拷贝的GUCAGRYC(N

·任选地,ARN适体;

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框;和

·3′-UTR区域。

“适体”是指具有与核酸分子采用特定三维结构(特别是类似于单克隆抗体)能力相关的识别特性和特异性的任何核酸(参见,例如Dunn等,2017)。适体可以由ADN、ARN和/或修饰的ARN,优选ARN组成。所述适体可以由6至50个核苷酸组成,例如以上定义的核糖核苷酸。作为非限制性示例,可以根据本领域技术人员公知的各种技术分离适体,例如通过一个或多个体外选择循环,或通过迭代选择方法从随机序列的大量化合物的组合文库(“SELEX”技术)中来体外鉴定适体。通过选择而在体外鉴定适体,有利地可能获得具有精确作用或功能的适体,而无需知道所述适体所针对的靶标。制造或选择适体描述于例如,在欧洲专利申请EP0533838中。有利地,根据本发明的范围,已经根据ARN适体穿透目的细胞(更具体地是组织细胞、优选地是肌肉细胞(例如,肌纤维细胞))的能力对ARN 适体进行鉴定。有利地,根据本发明的适体能够穿过细胞膜,更优选地哺乳动物细胞的质膜和/或核内体(endosomal)膜。

根据本发明的适体优选包含6至50个核苷酸,更优选10至45个核苷酸,20 至40个核苷酸,甚至更优选30至40个核苷酸。优选地,适体由核糖核苷酸组成,例如上文所定义的那些。优选地,根据本发明的适体与具有SEQ ID NO:64序列的适体A、与具有SEQ ID NO:65序列的适体B、或与具有SEQ ID NO:66序列的适体C,具有至少70%的同一性,更优选至少80%的同一性,至少90%的同一性,至少95%的同一性,至少96%的同一性,至少97%的同一性,至少98%的同一性,甚至更优选至少99%的同一性。

在本发明描述的上下文中参考的同一性百分比是基于待比较序列的整体比对确定的,也就是说,使用本领域技术人员公知的任何算法(例如Needleman和 Wunsch的算法,1970年),对序列以其整体对全长进行比对。可以使用本领域技术人员公知的任何软件来执行该序列比较,例如Needle软件使用等于10.0的“空位开放(Gap open)”参数,等于0.5的“空位扩展(Gap extend)”参数和Blosum 62 矩阵。

优选地,根据本发明的适体选自具有SEQ ID NO:64序列的适体A、具有SEQ ID NO:65序列的适体B、与具有SEQ ID NO:66序列的适体C、甚至更优选地,选自具有SEQ ID NO:64序列的适体A和具有SEQ ID NO:66序列的适体C。

优选地,根据本发明的ARNm分子包含至少一个拷贝的能够穿过膜的适体,优选地哺乳动物质膜和/或核内体膜。因此有利地,当根据本发明的ARN分子包含适体时,所述适体促进其穿透进入细胞,优选进入肌肉或皮肤细胞。优选地,根据本发明ARNm分子包含至少一个拷贝的具有SEQ ID NO:64序列的适体A、具有SEQ ID NO:65序列的适体B、和/或具有SEQID NO:66序列的适体C。

促进ARNm分子穿过进入靶细胞的适体不一定需要被保护免于被核酸外切酶降解,其主要发生在细胞的细胞质中。因此,根据具体的实施方案,含有适体的 ARNm分子在一个或多个GUCAGRYC(N

·5′-UTR区域,包含至少一种能够穿过细胞膜的适体,优选质膜和/或核内体膜,优选地穿过哺乳动物细胞的质膜和/或核内体膜,优选地至少一种适体选自本文所述的适体A、B和C,以及至少一个拷贝的GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框。

优选地,ARNm分子在GUCAGRYC(N

因此,根据一个优选的实施方案,本发明涉及缺少帽分子的ARNm分子,其从5′至3′包含:

·在5′端含有茎-环的5′-UTR区域,接着是至少一个拷贝的GUCAGRYC (N

·至少一个能够穿过细胞膜的适体;

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框。

虽然选择适体B和C是因为其具有穿透肌纤维细胞的能力,适体A对应于“shot47”适体,由Tsuji等人于2013年鉴定。适体A有利地以高亲和力结合多组氨酸型肽基序。适体A因此可以结合任何包含多组氨酸标签(例如HHHHHH基序) 的分子(例如,肽或蛋白质)。作为非限制性示例,根据本发明的ARNm分子可以通过适体A连接至允许其更好地穿透细胞的分子,例如“细胞穿透肽”或“CPP”,所述CPP包含多组氨酸标签。

“细胞穿透肽”或“CPP”是指能够穿过哺乳动物细胞的细胞膜,更优选穿过质膜和核内体膜的任何肽、多肽或蛋白质。有利地,当CPP与另一个分子(特别是ARNm 分子)连接时,CPP保留了该特性,从而使所述另一个分子穿过膜。在本发明的上下文中,考虑了穿过膜的任何可能机制,包括,例如能量依赖性转运机制(即活性的,例如,胞吞作用)和能量非依赖性转运机制(例如,扩散)。通常,CPP 是阳离子肽(Poillot和De Waard,2011年)。作为非限制性示例,由于其负电荷, ARNm分子可利用静电相互作用和/或疏水性与CPP非共价结合。备选地,ARNm 分子可以与CPP共价结合。CPP可以形成由至少两个相同或不同的肽分子组成的寡聚物。在本发明的上下文中,CPP优选非共价结合至ARN适体。实际上,鉴于这种键的简单性,通过CPP和ARNm分子的简单混合,其低成本以及这些分子完全可生物降解的事实,这种键是有利的。实际上,不需要非天然且不可生物降解的化学基团。

根据本发明的CPP的长度优选为约8个氨基酸残基至约60个氨基酸残基。更优选,长度为8至40个氨基酸残基,更优选为8至30个氨基酸残基,甚至更优选为10至25个氨基酸残基(例如,13或20个氨基酸残基)。然而,本领域技术人员将认识到,CPP的长度不必限于上述那些。例如,根据本领域技术人员的常识,可以特别地创建具有不同长度的本文所述的CPP衍生物。

作为非限制性示例,本发明的CPP可以是(如Gao X.等人,2014描述的)“M12” CPP、(如Kamada等人,2007描述的)“CPP2”或“CPP3”CPP、或(Lee等人,2012 年所述的)CPP“CPP1”,以及这些的任何变体或衍生物。根据优选的实施方案,所述CPP包含多组氨酸基序(例如,六组氨酸),其优选通过间隔子与所述CPP 连接。优选地,所述间隔子是亲水性间隔子,有利地是无结构的和不带电荷的,甚至更有利地由甘氨酸和丝氨酸组成。优选地,间隔子长度为约21个氨基酸,优选21个氨基酸。

优选地,根据本发明的CPP与以下肽具有至少70%的同一性,更优选地至少 80%的同一性,至少90%的同一性,至少95%的同一性,至少96%的同一性,至少97%的同一性,至少98%的同一性,甚至更优选地具有至少99%的同一性:具有SEQ ID NO:75序列的M12-H6肽,具有SEQ ID NO:76序列的CPP1-H6肽,具有SEQ ID NO:77序列的CPP2-H6肽,和具有SEQ ID NO:78序列的CPP3-H6 肽。根据一个特别优选的实施方案,根据本发明的CPP选自:具有SEQ ID NO: 75序列的M12-H6;具有SEQ ID NO:76序列的CPP1-H6;具有SEQ ID NO:77序列的CPP2-H6肽;或具有SEQ ID NO:78序列的CPP3-H6;甚至更优选地,选自:具有SEQ IDNO:76序列的CPP1-H6;具有SEQ ID NO:77序列的CPP2-H6 肽;和具有SEQ ID NO:78序列的CPP3-H6。有利地,CPP非共价或共价连接至 ARNm分子,优选非共价。有利地,CPP与ARNm分子中包含的ARN适体连接 (即,当CPP包含多组氨酸标签时为适体A)。

优选地,本发明的CPP在穿过质膜后对其靶细胞不具有显著的细胞毒性和/或免疫原性作用,即它们不干扰细胞生存力、细胞转染和/或穿透。在本文中所用的术语“非显著地”是指在连接有CPP的ARNm分子穿过质膜而被细胞内化之后,被杀死的靶细胞少于50%、优选少于40%或30%、优选少于20%或10%以及特别少于5%。本领域技术人员熟悉确定给定化合物的细胞毒性和/或施用该化合物的靶细胞的生存力的方法(参见,例如Ausubel等,2001)。相应的分析试剂盒是可从各种供应商处商业上可获得的。在具体的实施方案中,本发明的CPP的潜在固有细胞毒性和/或免疫原性作用可以通过在肽中引入一种或多种修饰(例如通过化学合成的方式或重组的ADN)被“遮盖(masquage)”。此类修饰可包括,例如,官能团的添加、去除或取代或改变这些官能团的位置。本领域技术人员充分知晓对于给定的肽如何可以完成这种“遮盖”。

因此,根据一个优选的实施方案,本发明涉及缺少帽分子的ARNm分子,其从5′至3′包含:

·5′-UTR区域含有至少SEQ ID NO:64的适体A ARN、和至少一个拷贝的 GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列,和

·开放阅读框,

其中,所述ARNm分子连接到融合多组氨酸标签的细胞穿透肽(CPP),所述CPP优选选自:具有SEQ ID NO:75序列的M12-H6;具有SEQ ID NO:76序列的CPP1-H6;具有SEQ IDNO:77序列的CPP2-H6肽;和具有SEQ ID NO: 78序列的CPP3-H6。优选地,所述CPP非共价连接至适体。

“开放阅读框”表示可以翻译成目标多肽的任何多核苷酸序列。开放阅读框为三个连续核苷酸的区块(称为密码子)读取,每个密码子代表一个氨基酸。在翻译过程中,通过核糖体翻译所述开放阅读框的密码子来合成多肽。

多肽的第一个氨基酸通常在ARNm分子上由AUG密码子指示,因此表示开放阅读框的开始。已知其他起始密码子,例如AUN、或NUG,其中N对应于A、 C、U或G。多肽的末端以UAA、UGA或UAG终止密码子的形式显示在ARNm 分子上。终止密码子指示ARNm分子上开放阅读框的末端。

根据本发明的开放阅读框更具体地是这样一种开放阅读框,其在转染细胞中翻译产生应用在人或兽药物中的具有治疗或疫苗目的产物。优选地,具有治疗目的的产物是蛋白质。

在治疗目的的蛋白质中,一个可能更具体指的是酶,血液衍生物,激素,淋巴因子:白介素、干扰素、TNF等(FR 92 03120),生长因子,神经递质或其前体或合成酶,营养因子:BDNF、CNTF、NGF、IGF、GMF、aFGF、bFGF、NT3、 NT5等,载脂蛋白:ApoAI、ApoAIV、ApoE等(FR 9305125),肌营养不良蛋白或小肌营养不良蛋白(FR 91 11947),抑癌蛋白:p53、Rb、Rap1A、DCC、k-rev 等(FR 93 04745),涉及在凝血中的因子:因子VII、VIII、IX等,促凋亡蛋白:胸苷激酶、胞嘧啶脱氨酶等、或甚至全部或部分天然或人工免疫球蛋白(Fab、ScFv 等,请参见例如WO 2011/089527),ARN配体(WO 91/19813)等。

由ARNm编码的目的蛋白质还可以是能够在人或动物中产生免疫应答以实现接种的抗原。它们具体可以是对爱泼斯坦巴尔(Epstein Barr)病毒、HIV病毒、乙肝病毒(EP 185573)、伪狂犬病毒特异的、甚至对肿瘤(EP 259 212)特异的抗原蛋白。最后,目的蛋白可以是佐剂蛋白质,其可以刺激免疫反应以提高疫苗的效力。

由ARNm编码的目的蛋白质可以是对无帽的ARNm分子或由所述分子表达的蛋白质具有有利作用的蛋白质。这种有利的效果可能来自不同的机制。作为非限制性示例,由无帽的ARNm编码的蛋白质可通过与所述分子结合或通过降解至少一种具有ARN酶活性的蛋白质来增加无帽ARNm分子的稳定性。作为非限制性示例,无帽ARNm编码的蛋白质可通过促进起始因子的招募或通过结合加帽的细胞ARNm以抑制其翻译来增加所述分子的翻译。作为非限制性示例,由ARNm编码的目的蛋白质是来自小核糖核酸病毒的2Apro蛋白,例如人鼻病毒2型(HRV2)。不受理论的束缚,可以认为由于2Apro蛋白的蛋白酶活性、切割eIF4G起始因子的N-末端,因此阻止了所述起始因子识别加帽ARNm,2Apro蛋白增加无帽ARNm 的表达。这种切割可以减少体内本发明的ARNm与加帽ARNm之间的竞争。实际上,发明人出人意料地证明,使用根据本发明的编码2Apro的第一ARNm、和根据本发明的编码报告蛋白的第二ARNm所共转染的细胞使得报告蛋白表达增加。因此,存在2Apro蛋白是特别有利的,因为允许本发明的无帽的ARNm编码的蛋白质特异性表达增加(图7)。

根据一个优选的实施方案,本发明的ARNm编码2Apro蛋白,优选来自小核糖核酸病毒的2Apro蛋白,甚至更优选来自HRV2病毒。根据一个具体的实施方案,2Apro蛋白具有SEQID NO:81的序列。根据一个具体的实施方案,所述2Apro 蛋白由具有SEQ ID NO:80序列的ARNm编码。

开放阅读框还可编码治疗性ARNm。这可以是,例如反义序列,其在靶细胞中的表达使得可以控制细胞ARNm的转录或翻译。根据专利EP 140 308中所述的技术,这样的序列可以例如,在靶细胞中转录为与细胞内ARNm互补的ARN,从而阻止其翻译为蛋白质。

优选地,本发明的ARNm除了包含xrRNA序列和IRES序列之外,还包含编码目的多肽的开放阅读框。优选地,该开放阅读框位于xrRNA序列的下游。本领域技术人员将容易理解,ARNm可以包括几个开放阅读框。因此,ARNm可以是单顺反子、双顺反子或多顺反子。当ARNm只有一个开放阅读框时,它是单顺反子。当它包含两个开放阅读框时,它是双顺反子;当它包含至少两个开放阅读框时,它是多顺反子。

本发明的ARNm还可包含一个或多个非编码区。这些非编码区尤其可以是两个开放阅读框之间的区域。在这种情况下,IRES序列有利地存在于位于两个开放阅读框之间的这些非编码区域中。

根据一个具体的实施方案,缺少帽或帽类似物分子的信使核糖核酸(ARNm) 分子,从5′至3′包含:

·5′UTR区域,其包含至少一个拷贝的GUCAGRYC(N

·开放阅读框;和

·包含poly(A)序列的3′-UTR区域。

有利地,所述ARNm分子还包含至少一种ARN适体,其促进所述分子穿透进入靶细胞,优选肌肉细胞。有利地,所述ARNm分子包含至少一个适体,其选自具有SEQ ID NO:64序列的适体A、具有SEQ ID NO:65序列的适体B、和具有SEQ ID NO:66序列的适体C。

根据另一个具体的实施方案,缺少帽或帽类似物分子的信使核糖核酸(ARNm) 分子,从5′至3′由以下组成:

·5′-UTR区域,其包含至少一个拷贝的GUCAGRYC(N

·开放阅读框;和

·包含poly(A)序列的3′-UTR区域。

“5′-UTR区域”是指位于翻译起始密码子上游的任何核酸区域。该区域是非编码的,但是可以包含调节下游ARNm表达的元件。除了xrRNA和IRES元件外,该区域还可以包含其他元件,例如核糖开关和/或T-box。在一些实施方案中,5′-UTR 区域长度可以是10至2000个核苷酸。优选地,其包含在50和1500个核苷酸之间,更优选地200至1000个核苷酸。

“3′-UTR区域”是指位于翻译终止密码子下游的任何核酸区域。该区域可能会影响ARNm的表达和/或稳定性、其在细胞中的位置、或包含蛋白质或小干扰ARN 或微小ARN的结合位点。该区域可包括,例如,诸如聚腺苷酸化的尾巴(poly(A))、组蛋白茎-环结构、和/或富含嘧啶或嘌呤的区域之类的元件。它可以包含编码或非编码序列。在一些实施方案中,3′-UTR区域长度可以是50至500个核苷酸。优选地,它包含在50和200个核苷酸之间,更优选地50至100个核苷酸。在一个优选的实施方案中,ARNm包含聚腺苷酸化的尾巴(poly(A)),其包含腺嘌呤或其类似物或其变体的核苷酸序列,其为10至300个核苷酸,优选为50至100个核苷酸。

根据第二方面,本发明涉及一种脱氧核糖核酸(ADN)分子,其包含可以被转录成本发明的ARNm分子的多核苷酸。优选地,ADN分子包含SEQ ID NO: 50、71、72、73、85或86的5′-UTR区域。

优选地,所述ADN分子包含在表达盒中。

在本文中“表达盒”是指包含目的多核苷酸的ADN片段,例如可被转录成本发明的ARNm分子的多核苷酸,其可操作地连接至控制基因序列表达的一个或多个调节元件,如,例如启动子序列和增强子序列。

多核苷酸“可操作地连接”到调节元件,当以这种方式将这些不同的核酸序列组合在单一核酸片段上时,其中一个序列的功能受其他序列的影响。例如,调节性 ADN序列是“可操作地连接”到编码ARN或蛋白质的ADN序列,如果两个序列以这样的方式定位,使得调节性ADN序列影响ADN编码序列的表达(换句话说, ADN编码序列处于启动子的转录控制之下)。编码序列可以以正义方向和反义方向可操作地连接至调节序列。优选地,本发明的编码序列以正义方向可操作地连接至调节序列。

通过“调节序列”或“调节元件”在本文中是指影响它们所连接的编码序列的表达和成熟所必需的多核苷酸序列。此类调节序列尤其包括转录起始和终止序列、启动子序列和增强子序列;有效ARN成熟的信号,例如剪接和聚腺苷酸化信号;稳定细胞质ARNm的序列;提高翻译效率的序列(例如,Kozak序列);增加蛋白质稳定性的序列;以及、必要时增加蛋白质分泌的序列。

优选地,本发明的调节序列包含启动子序列,即编码本发明ARNm的基因优选地可操作地连接至允许所述对应ARNm表达的启动子。优选地,当编码本发明的ARNm的基因位于启动子的下游时(即启动子3′),其可操作地连接至该启动子,从而形成表达盒。

如本文所用,术语“启动子”是指核苷酸序列,最常位于编码序列的上游(5′),其被ARN聚合酶和转录必需的其他因子识别,并由此控制所述编码序列的表达。如本文所用“启动子”特别包括最小的启动子,即由TATA盒和其他序列组成的短 ADN序列,其允许转录起始位点特异化。在本发明的意义内“启动子”还包括核苷酸序列,其包括最小启动子和能够控制编码序列表达的调节元件。例如,本发明的启动子序列可以包含调节序列,例如可以影响基因表达水平的增强子序列。

有利地,根据本发明的启动子是与在无细胞转录系统中使用的ARN聚合酶一起起作用的那些。例如,被SP6和T7噬菌体的ARN聚合酶识别的启动子是本领域技术人员众所周知的。因此,在下面的实验部分中使用了带有T7 ARN聚合酶识别的启动子的pMBx-luc2载体(Rogé和Betton,2005)。此外,含有此类启动子的载体是商业上可获得的。

在一个具体的实施方案中,本发明包含编码本发明的ARNm的ADN分子,其可操作地连接至至少一个调节元件。优选地,编码本发明的ARNm的ADN分子与位于上游的启动子序列可操作地连接,从而形成表达盒。在另一个实施方案中,本发明由编码本发明的ARNm的ADN分子组成,其与位于上游的启动子序列可操作地连接,从而形成表达盒。

甚至更优选地,本发明的ADN分子包含:

·T7 ARN聚合酶识别的启动子,所述启动子包含SEQ ID NO:46所示的序列;

·5′-UTR区域,其包含由SEQ ID NO:50、71、72、73、85或86所示的序列;

·开放阅读框;和

·3′-UTR区域,其包含选自SEQ ID NO:53、54、55和56所示序列的序列。

有利地,本发明的调控序列包含转录终止子序列,也就是说,编码本发明的 ARNm的基因优选可操作地连接至转录终止子。本文的术语“转录终止子”指标记着基因或操纵子的转录结束并成为信使ARN的基因组序列。在原核生物和真核生物之间转录终止的机制有所不同。本领域技术人员知道根据不同细胞类型使用的信号。例如,如果他们希望在细菌中表达本发明的ARNm,则他们将使用不依赖 Rho的终止子(反向重复序列,后接一系列T(转录的ARN中的尿嘧啶)或依赖 Rho的终止子(由Rho蛋白识别的共有序列组成)。当编码本发明的ARNm的基因位于终止子的上游时(即终止子的5′端),优选将其可操作地连接至终止子,从而形成表达盒。

有利地,根据本发明的终止子是与在无细胞转录系统中使用的ARN聚合酶一起起作用的那些终止子。例如,被SP6和T7噬菌体的ARN聚合酶识别的终止子是本领域技术人员公知的。含有此类终止子的载体是商业上可获得的。

在一个具体实施方案中,本发明包括编码本发明的ARNm的ADN分子,其可操作地连接至至少一种调节元件和至少一种转录终止子。

在第三方面,本发明还涉及至少包含根据本发明的ADN或ARNm分子的载体。

本文所使用的术语“载体”是指能够转运已经与其连接的另一核酸的核酸分子。载体的一种类型是“质粒”,指单链ADN的环状双环,可将其他ADN片段连接到其中。载体的另一种类型是病毒载体,其中另外的ADN片段可连接到病毒基因组中。可选择地,病毒载体可以在病毒基因组中包含ARNm(例如,逆转录病毒或 ARN病毒)。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其他载体(如,例如,整合哺乳动物载体)通过引入宿主细胞时可整合到宿主细胞的基因组中,并因此与宿主基因组一起复制。

本领域技术人员已知,为了将目的核酸分子引入并维持在真核或原核宿主细胞中,可以将目的核酸分子插入许多载体中。选择合适的载体取决于该载体的预期用途(例如,复制目的序列、表达该序列、以染色体外形式维持该序列、甚至整合到宿主的染色体材料中)、以及宿主细胞的性质(例如,质粒优选引入细菌细胞中,而YAC优选用于酵母中)。这些表达载体可以是质粒、YAC、粘粒、逆转录病毒、源自EBV的附加体,以及本领域技术人员认为可适合表达所述序列的任何载体。在本发明的优选实施方案中,用于编码本发明的ARNm的载体是能够在细菌中繁殖的载体。更优选地,该质粒包含被无细胞转录系统中使用的ARN聚合酶识别的启动子,例如SP6和T7噬菌体的启动子。甚至更优选地,由该质粒携带的该启动子能够在至少所述ARN聚合酶存在下指导本发明的ARNm的表达。

优选地,本发明的载体包含复制起点,以允许所述载体在宿主细胞中繁殖。术语“复制起点”(也称为ori)是允许复制起始的独特ADN序列。单向或双向复制开始于该序列。本领域技术人员知道复制起点的结构从一个物种到另一个物种是不同的;因此,尽管它们都具有某些特征,但它是特异性的。蛋白质复合物在该序列上形成,并允许ADN打开和复制的起始。

有利地,含有本发明表达盒的载体还包含选择标记,以便于鉴定含有所述载体的细胞,特别是在转化后。根据本发明的“选择标记”是由载体携带的多核苷酸序列,其允许鉴定和选择具有所述载体的细胞。选择标记是本领域技术人员所公知的。优选地,它是编码赋予抗生素抗性的蛋白质的基因。

通过本领域技术人员通常使用的方法制备包含本发明目的核酸的本发明载体。为了将多核苷酸引入宿主细胞中可以通过本领域技术人员已知的标准方法将所得克隆可引入合适的宿主。这样的方法可以是使用右旋糖酐转化、使用磷酸钙沉淀、使用聚丙烯转染、原生质体融合、电穿孔、在脂质体中包封多核苷酸、生物(biolistique)注射和将ADN直接显微注射到细胞核中。也可能将所述ADN或 ARNm序列(分离或插入质粒或病毒载体)与允许其穿过宿主细胞膜的物质(例如转运蛋白(例如,纳米转运蛋白)或脂质体制剂、或阳离子聚合物)相结合。另外,这些方法可以有利地组合,例如,通过使用与脂质体相关的电穿孔。

根据本发明的优选实施方案,本发明的载体包含编码本发明的ARNm的ADN 分子。优选地,本发明的载体是质粒。甚至更优选地,本发明的载体包含表达盒、转录终止子、复制起点、和选择标记。在另一个优选的实施方案中,载体由表达盒组成。

根据本发明的另一个优选的实施方案,载体包含本发明的ARNm分子。优选地,本发明的载体是病毒或合成ARN载体。

根据另一方面,本发明涉及包含所述载体的宿主细胞。如本文所用术语“宿主细胞”指已引入用来表达本发明ARNm的重组表达载体的细胞。该术语应理解为不仅包括所述特定宿主细胞,而且还包括其子代。应当理解,由于突变或环境影响,经多世代可以存在某些修饰。结果,子代可能与亲代细胞不完全相同,但是仍然包括在如本文所用的术语“宿主细胞”中。

上述ADN和/或载体对于产生大量本发明的ARNm特别有用。

根据另一方面,本发明涉及一种使用上述ADN或载体生产本发明的ARNm 的方法。因此,可以通过本领域技术人员已知的任何方法生产ARNm。这可以,例如通过化学合成、通过体内表达或通过体外表达来完成。

优选地,使用无细胞ARNm表达系统在体外表达ARNm。通过“无细胞ARNm 表达系统”在本发明的上下文中是指,允许在不存在细胞的情况下合成本发明的 ARNm的生化系统。无细胞系统基于使用生物体转录机制从外源遗传信息中生产特定的ARNm。因此,在本发明的上下文中,无细胞的ARNm表达系统包含在不存在细胞的情况下生产ARNm所需的所有元件。从中提取该机制的生物有很多而且多种多样,以及来自原核和真核生物。

具体地,该系统特别包括来源于细胞的转录机制。更具体地,该系统包含能够识别上述表达盒启动子的ARN聚合酶。因此,在合适的核苷酸存在下和合适的离子条件下,这种ARN聚合酶能够指导编码本发明ARNm基因的转录。数十年来,此类系统对于本领域技术人员而言是众所周知的(作为综述,参见例如Beckert 和Masquida,2011)。在无细胞系统中,有许多方法可以将ADN转录为ARN。也可以使用许多公司提供的试剂盒:New EnglandBiolabs、Sigma Aldrich、Thermo Scientific、Promega、Roche Diagnostics、Ambion、Invitrogen等。

除ARN聚合酶外,无细胞体外转录系统还包含反应缓冲液。有利地,所述系统包含四种核糖核苷三磷酸中的每一种。这四种核糖核苷三磷酸非常有利地以相同的浓度存在。特别地,GTP的浓度与其他三种核糖核苷三磷酸的浓度相同。因此,本发明的ARNm的体外转录产率比由体外反应产生的加帽ARNm的体外转录产率高很多,这大大降低了ARNm合成的成本。

优选地,生产方法包括纯化所述ARNm的步骤。

在一个优选的实施方案中,在无细胞体外转录系统中,将质粒ADN(包含噬菌体ARN聚合酶识别的启动子、接着是编码目的ARNm的ADN序列)与噬菌体 ARN聚合酶接触。然后可以纯化通过所述方法合成的ARNm。优选地,无细胞体外转录系统中所述质粒ADN在与ARN聚合酶接触之前被线性化。更优选地,所述ADN在3′-UTR区域下游通过酶消化被线性化。甚至更优选地,所述ADN通过用Ssp1或Eco53kI酶促消化进行线性化。

优选地,ARN聚合酶是噬菌体T7 ARN聚合酶。

ARNm分子能够在其被引入的真核有机体中指导目的多肽的生产。因此,它特别适用于基因疗法或遗传接种。因此,本发明的ARNm分子可以用作药物或疫苗。

根据另一方面,本发明还涉及药物组合物或疫苗组合物。

因此,更具体地,本发明涉及包含本发明的ARNm的药物或疫苗组合物。使用该组合物中包含的ARNm来转染细胞,然后其可以将ARNm翻译成蛋白质。优选地,这些蛋白质具有预防活性或治疗活性。

实际上,发明人出人意料地证明,在组织转染过程中,根据本发明的ARNm 比常规的加帽ARNm更有效。实际上,发明人出人意料地证明,体内转染后获得的表达水平和持续时间至少与加帽的ARNm一样高。具体地,本发明的ARNm在小鼠真皮或肌肉中的体内表达大于对照的加帽ARNm的体内表达(图5,图15)。另外,发明人出人意料地表明,根据本发明的ARNm超过长期(即,超过7周) 持续存在于细胞中。最后,发明人出人意料地表明,使用根据本发明的编码2Apro 蛋白的第一ARNm和根据本发明的编码第二蛋白的第二ARNm共转染细胞,使得可能增加该第二蛋白的翻译。

因此,根据本发明的另一方面,药物组合物包含2Apro蛋白或编码所述蛋白的ARNm。优选地,2Apro蛋白具有SEQ ID NO:81的序列。优选地,编码所述蛋白质的ARNm具有SEQ ID NO:80的序列。根据本发明的一个具体实施方案,药物组合物包含至少两个不同的无帽的信使核糖核酸(ARNm)分子,其从5′至 3′包含:

·5′-UTR区域,包含至少一个拷贝的GUCAGRYC(N

·一个拷贝的内部核糖体进入位点(IRES)ARN序列;和

·开放阅读框,

其中至少一个ARNm分子包含编码2Apro蛋白的开放阅读框。

优选地,所述药物组合物包含第一ARNm分子,所述第一ARNm分子包含编码2Apro蛋白的阅读框,以及至少第二ARNm分子,所述第二ARNm分子包含编码目的第二蛋白的开放阅读框。更优选地,所述第二目的蛋白质不是2Apro蛋白质。甚至更优选地,所述目的第二分子是如上所定义的抗原或治疗性蛋白质。根据本发明的一个具体实施方案,第一ARNm和第二ARNm之间的摩尔比包含在 540:1和240:1之间,优选为540:1和315:1之间,甚至更优选为465:1。

优选地,所述组合物将补充有赋形剂和/或药学上可接受的载体。在本说明书中,术语药学上可接受的载体指在药物组合物中包括的化合物或化合物的组合,其不会引起副作用,并且允许例如改进活性化合物的施用简便性,其增加了在体内的寿命和/或有效性、其增加了在溶液中的溶解度或者甚至改善存储。这些药学上可接受的载体是公知的,并且本领域技术人员将根据所选择的活性化合物的性质和施用方式对其进行调整。在本说明书中,术语“药学上可接受的赋形剂”指在药物组合物中包括的化合物或化合物的组合,其不会引起副作用,并且允许例如改进活性化合物的施用简便性,其增加了在有机体中的寿命和/或有效性、其增加了在溶液中的溶解度或者甚至改善存储。所述赋形剂可以特别地在即将施用之前添加到组合物中,例如,如果ARN以冻干形式保存。药学上可接受的赋形剂/载体是公知的,并且本领域技术人员将根据所选择的活性化合物的性质和施用方式对其进行调整。The Science and Practice of Pharmacy,Remington著,第22版, Pharmaceutical出版社,伦敦,UK(2013),对各种赋形剂进行特别描述。例如,药学上可接受的组合物包含无菌水和/或氯喹作为赋形剂。“氯喹”赋形剂还包括其任何变体或类似物,例如伯氨喹。

实际上,发明人出人意料地表明,在某些条件下,氯喹与ARNm共同注射使得可能提高转染效率。具体地,与“CPP”型肽复合的ARNm的转染效率得到提高 (参见图10)。

根据一个优选的实施方案,药物组合物还包含氯喹。作为非限制性示例,药物组合物包含重量比为1∶0.5至1∶4之间的ARNm∶氯喹,以及更具体地, ARNm∶氯喹的重量比为1∶1。作为非限制性示例,药物组合物还包含5μg ARN: 2.5-20μg氯喹。

根据一个优选的实施方案,药物组合物还包含至少一种本文所述的CPP,其非共价连接到根据本发明的ARNm分子。有利地,选择CPP以促进ARNm穿透到靶细胞中(例如,取决于器官或细胞系的类型,如肌肉或真皮细胞)。

优选地,这些组合物将通过肌内、皮内、腹膜内或皮下途径,通过呼吸途径、或通过局部途径施用。这些组合物优选用于注射进入哺乳动物组织,甚至更优选地,人。这些组合物优选用于根据本领域技术人员已知的方法通过肌内、静脉内、皮内、腹膜内或皮下途径进行注射。本发明的药物组合物可以随着时间的推移交错进行若干次施用。可根据在建立适合患者的治疗时通常考虑的标准,例如,患者的年龄或体重、患者一般情况的严重程度、对治疗的耐受性、以及观察到的副作用,来确定其施用方式、剂量和最佳盖仑制剂形式。

肠胃外施用形式包括水性混悬剂、等渗盐溶液、或无菌和可注射溶液,其可以包含药理学上相容的分散剂和/或湿润剂。可以通过呼吸途径施用的形式包括气雾剂。局部施用形式包括贴剂、凝胶剂、乳膏剂、软膏剂、洗剂、喷雾剂、滴眼剂。

制备可胃肠外施用化合物的方法对于本领域技术人员而言将是已知的或显而易见的,并且有更详细的描述见于,例如,Pharmaceutical Sciences of Remington,第17版,Mack Publishing Company,Easton,Pa.(1985),以及其第18和19版。用于药物活性物质的介质和试剂的用途是本领域众所周知的。为了获得适合施用的药学上可接受的组合物,所述组合物将包含足够量的ARNm分子以具有治疗效果。

本发明化合物的有效剂量随许多参数的变化而变化,例如,选择的施用途径、体重、年龄、性别、待治疗病理的进展状态、以及待治疗个体的敏感性。

根据一个具体方面,本发明涉及所述组合物在基因疗法中的用途。本发明的组合物可用于治疗或调节多种疾病,例如:癌症、遗传性疾病(例如血友病、地中海贫血、腺苷脱氨酶缺乏症、α-1抗胰蛋白酶缺乏症)、糖尿病、脑部疾病(例如阿尔茨海默氏症和帕金森氏症)、过敏、自身免疫性疾病和心血管疾病。

根据另一方面,本发明涉及所述组合物其在遗传疫苗中的用途。例如,本发明的组合物可以用于针对癌症和流感、以及其他病毒和细菌病原体的疫苗接种。疫苗接种可能涉及人以及宠物和牲畜。

发明人特别地表明,本发明的ARNm在体内是稳定的。实际上,本发明的 ARNm在体内诱导至少与加帽ARNm一样高的蛋白质合成量,表明其对Xrn1的抗性至少与加帽ARNm一样有效。另外,发明人特别地表明,本发明的ARNm在细胞中长期存在。这样的ARNm分子也是非常有利的,因为其生产成本比加帽的 ARNm分子的生产成本低得多。最后,发明人表明,包含直接穿透细胞的ARN适体(例如,ARN适体C)、或通过CPP肽穿透细胞的ARN适体(例如,ARN适体A)的ARNm能更有效地转染细胞,这有利地改善了一种或多种目的蛋白的生产。

本发明将通过以下的实施例的方式来更具体地描述。

附图说明

图1:信使ARN的结构。

(A)加帽的MB5-luc2 ARNm对应于编码荧光素酶的传统信使ARN,在其 5′端具有帽类似物以及包含poly(A)尾巴的3′-UTR区域。(B)MB5-luc2 ARNm 与(A)相同,只是缺少帽类似物。(C)MB7-luc2 ARNm缺少帽,在其5′端具有茎-环和EMCV病毒的内部核糖体进入位点(IRES)。(D)MB8-luc2 ARNm缺少帽并且具有茎-环,在5′UTR区域有来自西尼罗河病毒(WNV)的两个Xrn1抗性序列(xrRNA1和xrRNA2)和来自EMCV病毒的IRES。(E)MB9-luc2 ARNm 与(D)相似,只是(D)的3′-UTR和poly(A)已被来自昆金病毒(KUN)的 3′-UTR取代。(F)无帽的MB11-luc2 ARNm与(D)相似,只是在西尼罗河病毒 (WNV)的两个Xrn1抗性序列(xrRNA1和xrRNA2)和EMCV病毒的IRES上游的5′区域中添加适体A,以及其没有茎-环。MB13-luc2(G)和MB14-luc2(H) ARNm具有这种相同构型,但含有其后分别是ARN适体B和C的5′茎-环。(I) 加帽的MB15-luc2 ARNm与(A)相似,除了在帽后的5′区域添加了适体A。(J) MB17-luc2 ARNm与(D)相似,除了在茎-环和xrRNA序列之间在5′添加适体A。 (K)MB18-luc2 ARNm与(J)相似,除了适体A位于xrRNA序列下游和IRES 序列上游的5′区域。

图2:四天中,Caco-2细胞中的荧光素酶的表达动力学。

使用MB5-luc2加帽的ARNm(菱形)和无帽的ARNm(圆圈)以及MB7-luc2 ARNm(三角形)和MB8-Iuc2 ARNm(方形)转染融合(confluentes)的Caco-2 细胞。跟踪表达动力学四天。

图3:在十天内,Caco-2细胞中的荧光素酶的表达动力学。

用加帽的MB5-luc2 ARNm(菱形)、MB8-luc2 ARNm(方形)和MB9-luc2 ARNm(三角形)转染融合的Caco-2细胞。跟踪表达动力学十天。

图4:人间充质干细胞中的长期荧光素酶的表达动力学。

MB8-Iuc2 ARNm与pepMB1肽(以pepMB1肽阳电荷:ARNm负电荷为约2.2:1 的比例)复合,在48孔板中以每孔2μg上述复合物来转染间充质干细胞1小时。然后监测荧光素酶活性约48天。

图5:转染小鼠肌肉和真皮。

分别用10μg和5μg的无帽的MB8-luc2 ARNm或加帽的MB5-luc2 ARNm转染雄性BALB/cByJ小鼠的肌肉和真皮。注射后16小时和18小时分别在肌肉和皮肤中测量荧光素酶活性。

图6:MB8-2Apro ARNm的毒理学研究。

为了评估2Apro蛋白表达的细胞毒性作用,仅用MB8-luc2 ARNm转染C2C12 细胞,或者将MB8-Iuc2 ARNm与MB8-2Apro ARNm以465:1或9:1的比例混合来转染C2C12细胞。通过测量释放到细胞外介质中的乳酸脱氢酶(LDH)来确定细胞毒性。通过测量490nm处的吸光度来确定LDH活性。阴性对照:不裂解的未转染的细胞或MB8-luc2 ARNm单独转染的细胞。阳性对照:用Triton X-100 裂解的未转染的细胞。

图7:2Apro蛋白对荧光素酶的表达的影响随MB8-luc2 ARNm:MB8-2Apro ARNm的摩尔比变化而变化。

在存在增加量的MB8-2Apro ARNm时,用MB8-luc2 ARNm转染C2C12细胞。 MB8-luc2ARNm:MB8-2Apro ARNm的摩尔比为540:1至240:1。每孔转染的 ARNm总量为750ng。转染之后18小时测量荧光素酶活性。

图8:在存在或不存在MB8-2Apro ARNm的情况下,七天内的荧光素酶的表达动力学。

仅用MB8-luc2 ARNm(黑线)转染融合的C2C12细胞、或MB8-luc2 ARNm 与MB8-2Apro ARNm组合(灰色虚线)转染融合的C2C12细胞。MB8-luc2 ARNm: MB8-2Apro ARNm的摩尔比为465:1。通过荧光素酶活性水平测量表达动力学,进行持续7天。

图9:2Apro蛋白对不同信使ARN荧光素酶表达的影响。

评估2Apro蛋白对来自不同信使ARN的荧光素酶的表达的影响。在每种情况下,都将编码荧光素酶的ARNm单独转染(-)、或与编码2Apro蛋白的第二ARNm 共转染(+),在具有最佳摩尔比465:1时具有相同特征。(1)单独的MB8-luc2 ARNm;(2)MB8-luc2 ARNm与MB8-2Apro ARNm共转染;(3)单独的加帽 MB5-luc2 ARNm;(4)将加帽的MB5-luc2 ARNm与无帽的MB8-2Apro ARNm 共转染;(5)单独的缺少帽类似物的MB5-luc2 ARNm;(6)将缺少帽类似物的 MB5-luc2 ARNm与缺少帽类似物的MB8-2Apro ARNm共转染;(7)单独的 MB7-luc2 ARNm;(8)将MB7-luc2 ARNm与MB8-2Apro ARNm共转染。转染之后18小时测量荧光素酶活性。

图10:不同适体对加帽ARNm分子在肌肉中转染效率的影响。

用以下转染雄性BALB/cByJ小鼠的肌肉:5μg的MB8-luc2 ARNm、MB13-luc2 ARNm、MB14-luc2 ARNm、与M12-H6肽复合的MB11-luc2 ARNm、或在5μg氯喹存在下与M12-H6肽复合的MB11-luc2 ARNm。注射后16小时测量荧光素酶活性。

图11:根据真皮中CPP3-H6肽:MB11-luc2 ARNm的摩尔比的ARNm的转染效率。

用5.6μg与CPP3-H6肽复合的MB11-luc2 ARNm,以增加的摩尔比 (CPP3-H6:MB11-luc2 ARNm的摩尔比在1:8和1125:1之间)转染雄性OF1 小鼠的真皮。注射后18小时测量荧光素酶活性。允许最佳转染的摩尔比为1 CPP3-H6:4MB11-luc2 ARNm。

图12:根据真皮中CPP1-H6肽:MB11-luc2 ARNm的摩尔比的ARNm的转染效率。

用5.6μg的与CPP1-H6肽复合的MB11-luc2 ARNm,以增加的摩尔比 (CPP1-H6:MB11-luc2 ARNm的摩尔比在1:8和3:1之间)转染雄性OF1小鼠的真皮。注射后18小时测量荧光素酶活性。允许最佳转染的摩尔比为1 CPP1-H6:4MB11-luc2 ARNm。

图13:根据真皮中CPP2-H6肽:MB11-luc2 ARNm的摩尔比的ARNm的转染效率。

用5.6μg的与CPP2-H6肽复合的MB11-luc2 ARNm,以增加的摩尔比 (CPP2-H6:MB11-luc2 ARNm的摩尔比在1:4和2.75:1之间)转染雄性OF1 小鼠的真皮。注射后18小时测量荧光素酶活性。允许最佳转染的摩尔比为2 CPP2-H6:1MB11-luc2 ARNm。

图14:适体A对加帽ARNm分子在真皮中转染效率的影响。

将ARN适体A插入常规的加帽MB5-luc2 ARNm的5′-UTR中,以产生加帽的MB15-luc2ARNm。鉴于先前获得的结果(参见图12),将5.6μg以摩尔比2 CPP2-H6:1MB15-luc2 ARNm或非此摩尔比的与CPP2-H6肽复合的加帽 MB15-luc2 ARNm转染的雄性OF1小鼠的真皮。在存在或不存在适体A或CPP2-H6 肽的情况下,用这种构建体都不能改善转染。

图15:5′-SL对ARNm分子在真皮中转染效率的影响。

与缺少茎-环的ARNm(MB11-luc2 ARNm)以及其茎-环位于xrRNA1上游超过70个核苷酸的ARNm(MB17-luc2 ARNm)相比,当茎-环在下游5个核苷酸处接着的是xrRNA1序列时(MB8-luc2和MB18-luc2 ARNm)的茎-环(此处为具有 SEQ ID NO:87序列的“5′-SL”)对转染效率的影响。常规的MB5-luc2加帽ARNm 用作5′-SL后随两个xrRNA序列功效的对照。用5.6μg每种不同的ARNm转染雄性OF1小鼠的真皮,注射后18小时测量荧光素酶活性。MB11-luc2的适体A不与肽连接,因此对该ARNm的转染效率没有影响。

具体实施方式

通过以下非限制性实施例来阐明本发明。如本领域技术人员将理解的,这些教导包括替代、修改和等同形式。

实施例1:质粒构建

通过化学合成对应于SEQ ID NO:49、SEQ ID NO:50、或SEQ ID NO:51 的5′非编码序列的ADN序列,整合到ADN载体中并通过ProteoGenix测序。用限制酶切下ADN片段。用相同的限制酶消化pMBx-luc2系列的质粒,并通过T4 ADN 连接酶的作用将ADN片段整合到这些质粒中。这些质粒包含编码荧光素酶的基因 (SEQ ID NO:62),插入在噬菌体T7启动子的下游。短的非编码3′-UTR序列,接着是根据SEQ ID NO:53的转录多聚腺苷酸化序列,位于荧光素酶基因的下游。不同的非编码5′-UTR序列将启动子与荧光素酶基因分开。这样构建的质粒通过限制性酶在转录多聚腺苷酸化序列的下游被扩增、验证和线性化。

实施例2:质粒线性化和ARNm的体外转录

Ssp1限制性酶切位点位于每个质粒的poly(A)的紧邻下游(参见SEQ ID NO: 54)。在1×CutSmart缓冲液中,用20个单位的Ssp1-HF限制酶(New England Biolabs)消化10微克质粒,在37℃下消化4小时。

然后,将经Ssp1-HF线性化的8μl质粒与2μl的10×T7 ARN聚合酶反应缓冲液、四种核苷三磷酸(ATP、GTP、CTP和UTP)各2μl和2μl的T7 ARN聚合酶溶液(New England Biolab)混合。在该反应混合物中包括帽类似物,用于合成加帽的ARNm。省略无帽ARNm的合成。

转录进行三至十小时,并且在37℃的块加热器中进行。然后,加入1μL的 TURBODNase(Thermo Fisher)降解质粒,并将混合物在37℃孵育15分钟。

MB5-luc2 ARNm是编码荧光素酶的常规ARNm。它具有根据SEQ ID NO:57 的5′非编码序列(UTR),选择其用于翻译的最佳起始以及包含根据SEQ ID NO:60 的Poly(A)尾部的3′-UTR区域。合成加帽或不加帽的该ARNm(参见图1(A) 和图1(B))。

无帽的MB7-luc2 ARNm在其5′端具有5′端的茎-环,以取代MB5-luc2 ARNm 的5′-UTR,其后是EMCV病毒的IRES序列。因此,虽然没有帽,但IRES序列将允许其有效招募核糖体。然而,该ARNm对Xrn1酶敏感(参见图1(C))。 MB7-luc2 ARNm的5′-UTR区域对应于SEQ IDNO:58以及3′-UTR区域对应于 SEQ ID NO:60。

无帽的MB8-luc2 ARNm在其5′端具有茎-环,接着在5′-UTR区域是来自黄病毒WNV3′-UTR的抗Xrn1的两个连续序列,称为xrRNA1和xrRNA2(Kieft等人, 2015年)。这些序列之后是EMCV病毒的IRES序列,因此其受到两个抗Xrn1 序列的保护(参见图1(D))。MB8-luc2ARNm的5′-UTR区域对应于SEQ ID NO: 59以及3′-UTR区域对应于SEQ ID NO:60。产生无帽的MB8-luc2 ARNm的成本比生产加帽的ARNm的成本低约30倍。

无帽的MB9-luc2 ARNm与无帽的MB8-luc2 ARNm仅在3′端不同。实际上,MB8-luc2的3′-UTR和poly(A)序列已被昆金病毒的3′-UTR区域取代。该区域没有poly(A)序列(请参见图1(E))。MB9-luc2 ARNm的3′-UTR区域对应于SEQ ID NO:61。

无帽的MB11-luc2 ARNm与无帽的MB8-luc2 ARNm的不同之处仅在于5′端没有茎-环,以及在对Xrn1具有抗性的两个连续序列的上游5′区域存在适体(参见图 1(F))。MB11-luc2 ARNm包含SEQ ID NO:64的适体A;MB11-luc2 ARNm 的5′-UTR区域因此对应于SEQ IDNO:67。

无帽的MB13-luc2和MB14-luc2 ARNm区别于无帽的MB8-luc2 ARNm仅在于在对Xrn1抗性的两个连续序列的上游5′区域中存在适体(参见图1(G,H))。 MB13-luc2 ARNm包含SEQ ID NO:65的适体B;因此MB13-luc2 ARNm的5′-UTR 区域对应于SEQ ID NO:68。MB14-luc2 ARNm包含SEQ ID NO:66的适体C;因此,MB14-luc2 ARNm的5′-UTR区域对应于SEQ IDNO:69。

MB15-luc2 ARNm对应于加帽的MB5-luc2 ARNm,其中适体A(SEQ ID NO: 64)已插入5′-UTR区域(参见图1(I));因此,MB15-luc2 ARNm的5′-UTR 区域对应于SEQ ID NO:70。

MB17-luc2 ARNm与无帽MB11-luc2 ARNm的区别仅在于适体A上游5′端存在茎-环(参见图1(J))。MB17-luc2 ARNm包含SEQ ID NO:64的适体A;因此,MB17-luc2 ARNm的5′-UTR区域对应于SEQ ID NO:83。

无帽的MB18-luc2 ARNm与无帽的MB8-luc2 ARNm的区别仅在于在对Xrn1 抗性的两个连续序列和IRES序列之间的5′区域存在适体(参见图1(K))。 MB18-luc2 ARNm包含SEQID NO:64的适体A;因此,MB18-luc2 ARNm的5′-UTR 区域对应于SEQ ID NO:84。

实施例3:纯化信使ARN

使用MegaClear试剂盒(Ambion)纯化不同的荧光素酶ARNm。将79μl洗脱溶液、350μl结合溶液浓缩液和250μl的100%乙醇添加到21μl的之前混合物中。将这700μl放在滤芯(Filter Cartridge)上,以10,000×g离心1分钟。过滤器保留信使ARN。用500μl洗涤液进行两次洗涤,以10,000×g离心1分钟。然后通过两次添加50μl洗脱溶液从过滤器中洗脱ARN,并在块加热器中加热到70℃十分钟。通过以10,000×g离心1分钟获得洗脱液。

通过用氯化锂沉淀进行第二纯化步骤。将60μl LiCl沉淀溶液添加到100μl 洗脱液中。将混合物在-20℃冷却1小时,然后以最大速度在4度离心15分钟。用 500μl的70%乙醇洗涤沉淀物,并以最大速度在4度下进行最后的离心5分钟。将信使ARN沉淀物空气干燥几分钟,然后重悬在无菌去离子水中。通过使用分光光度计测量在260nm处的吸光度来确定ARNm溶液的浓度。

实施例4:信使ARN/pepMB1复合物的组装

阳离子肽pepMB1由ProteoGenix合成、纯化和冻干。其氨基酸序列如下:CRRRRRRRRC。将冻干物重悬于无菌去离子水中。

将5μg的荧光素酶ARNm与5μg的pepMB1混合,最终ARN浓度为20μg/ml。将混合物在室温(20-25℃)下孵育15分钟,然后在-80℃下冷冻。接着,将 ARNm/pepMB1复合物冻干约20小时。

实施例5:转染Caco-2或C2C12细胞

材料和方法:

a)Caco-2或C2C12系细胞的培养和接种

所有细胞操作均在层流净化罩下进行。Caco-2细胞系(ECACC)在DMEM (Gibco)中培养,补充了非必需氨基酸、抗生素和抗真菌药的混合物、以及胎牛血清(最终15%)。在75cm

当达到接种48孔板(Corning)所需的细胞数量时,在37℃使用3ml的TryPLESelect 1X(Gibco)处理5分钟,从烧瓶底部分离细胞。添加7ml DMEM以中和TryPLE Select1X。将细胞在室温下以100xg离心10分钟。然后,将细胞沉淀重悬于10ml培养介质中。将250μl这种细胞悬浮液引入48孔板的每个孔中,并将后者置于37℃的含有5%CO

接种后,C2C12细胞可以在48孔板的孔中保持汇合(confluence)约12天。在此期间之后,这些细胞分化为肠上皮,从而影响ARNm的翻译。相反,人间充质干细胞可以在汇合的培养物中保存7周以上。因此,将间充质干细胞(Millipore,人间充质干细胞(骨髓))在即用型介质(Millipore,间充质干细胞扩增介质)中在48孔板(Corning)中培养长达48天。对于转染后超过5天将被裂解的细胞,每周更换培养介质3次。

b)转染Caco-2或C2C12细胞

对于Caco-2细胞,对于每种ARNm在五个不同的孔中进行转染。将 ARNm/pepMB1复合物的冻干物(Proteogenix)重悬于750μl转染缓冲液(20mM Hepes,40mM KCl和100mM三氟乙酸)中。

对于C2C12细胞,按以下指示进行MB8 ARNm的转染。通过在肽存在下,以约2.2的带正电肽:带负电ARNm的比率,在室温下ARNm孵育30分钟来组装MB8-luc2 ARNm/pepMB1复合物(Proteogenix)。然后将溶液用3×DMEM稀释以获得1×的最终DMEM。

在这两种情况下,都将孔中所含培养介质倒空以引入150μl ARN/pepMB1复合溶液(Caco-2细胞对应每孔1μg的ARNm;以及C2C12细胞对应每孔2μg)。将细胞在CO

c)裂解Caco-2或C2C12细胞,在转染后六小时至48天测量荧光素酶活性,裂解细胞以进行荧光素酶蛋白的表达动力学。吸出培养介质,并用250μl的裂解缓冲液(荧光素酶分析系统(Luciferase Assay System),Promega)代替。将20μl 的每种细胞裂解物放入适合发光计(Berthold Technologies)的试管中。通过光度计将100μl的荧光素酶底物(Promega)加入到细胞裂解物中。然后,光度计测量由荧光素酶催化的酶促反应发出的光量。结果以相对光单位(RLU)来表示。Caco-2 细胞或C2C12细胞产生的荧光素酶蛋白的量,通过荧光素酶ARNm的方式,通过使用660nm蛋白分析试剂盒(Pierce)分析总细胞蛋白进行标准化。为此,将100 μl细胞裂解液与1.5ml的试剂混合,并在660nm下测量吸光度。使用牛血清白蛋白溶液进行校准范围。因此,荧光素酶活性以每毫克蛋白的RLU表示。

结果:

结果示于图2、图3和图4中。无帽的MB5-luc2 ARNm诱导Caco-2细胞中荧光素酶蛋白的低且短的表达。在没有帽的情况下,ARNm很少被翻译成蛋白质,并被Xrnl迅速降解(参见图2)。

与无帽的MB5-luc2 ARNm相比,无帽的MB7-luc2 ARNm在Caco-2细胞中提供了更强以及更持久的荧光素酶蛋白表达。IRES区域招募核糖体,但对Xrn1没有明显的抗性(参见图2)。

无帽的MB8-luc2 ARNm诱导的荧光素酶的表达动力学与加帽的MB5-luc2 ARNm所获相似(参见图2和图3)。这意味着,与MB5-luc2 ARNm的帽相似,添加WNV病毒具有Xrn1抗性的两个序列赋予ARNm对Xrn1的抗性。缺少帽和对Xrn1有抗性的序列的MB7-luc2 ARNm所诱导的荧光素酶的表达,介于无帽的 MB8-luc2 ARNm和无帽的MB5-luc2 ARNm之间(参见图2)。

MB9-luc2 ARNm与MB8-luc2 ARNm的区别在于其3′-UTR末端缺少poly(A)。它在Caco-2细胞中诱导的荧光素酶的表达比MB8-luc2 ARNm诱导的荧光素酶的表达显著更低且持续更短(参见图3)。

在人间充质干细胞中,MB8-luc2 ARNm出人意料地并且有利地诱导荧光素酶的表达,其持续很长时间。实际上,即使表达随时间降低,转染后48天仍可检测到(参见图4)。

实施例6:转染小鼠肌肉和真皮

材料和方法:

a)动物饲养:

对于肌肉,将8周大的雄性BALB/cByJ小鼠饲养在开放的笼子中,每个笼子中有5只动物。昼/夜周期由自动设备管理(12h昼/12h夜)。饲养它们并且它们能够随意饮用过滤水。对于皮肤,将6周龄的雄性OF1小鼠饲养在开放的笼中,每笼四只动物。

b)即席制备ARNm样本:

对于每次肌肉注射,制备100μl的含有230mM NaCl的裸ARNm溶液。

对于每次皮内注射,制备17μl含160mM NaCl的裸ARNm溶液。

当使用CPP-H6肽时,将其与ARNm混合并在室温下在5mM Hepes pH 7.5和 0.7mMMgCl

c)ARNm的皮内和肌内注射:

通过使用异氟烷实现麻醉小鼠。对于肌肉注射,通过丁丙诺啡注射给予镇痛作用。对于皮内注射,在三到四天前剃光背部的皮肤(详细信息参见实施例10)。

将100μl和17μl ARNm溶液分别注入股二头肌和皮肤。将动物放回笼子直到第二天早晨。

d)皮肤和肌肉样本:

对于肌肉,注射后16小时将小鼠用CO

e)裂解皮肤和肌肉活检的细胞:

每次皮肤和肌肉活检均进行三个冷冻/解冻周期。实际上,将包含活检和裂解缓冲液的试管在-80℃冷冻10分钟。然后,将它们在室温下在水浴中解冻两分钟,并使用涡旋短暂混合。然后将试管在20℃下以5000x g离心5分钟,以沉淀组织碎片并获得澄清的细胞裂解液上清液。

f)荧光素酶活性的测量:

将每种细胞裂解物20μl用于测量每次活检中荧光素酶的表达。管式发光计向每个样本中添加100μl荧光素酶底物(Promega),并测量10秒钟的发光量。结果以相对光单位或RLU表示。

然后使用660nm蛋白质分析试剂盒(Pierce)将细胞裂解液稀释8至20倍进行蛋白质分析。将100μl稀释的细胞裂解液与1.5ml试剂混合6分钟,并在660nm 处测量吸光度。牛血清白蛋白的校正范围为0至750μg/ml。

结果:

结果如图5所示。在注射后16小时(肌肉)或18小时(真皮),无帽的MB8-luc2 ARNm在骨骼肌(A)和皮肤(B)中诱导的荧光素酶的表达高于加帽的MB5-luc2 ARNm。这些结果表明,两个xrRNA序列(此处来自WNV病毒)和IRES(此处来自EMCV)的存在使ARNm在体内对Xrn1具有抗性,并且翻译效率优于 MB5-luc2 ARNm帽的翻译效率。实际上,非常出人意料的是,将10μg的MB8-luc2 ARNm转染小鼠肌肉组织,导致荧光素酶的表达比用相同剂量的加帽MB5-luc2 ARNm获得的荧光素酶的表达高2.6倍(参见图5A)。同样,在皮肤中转染5μg MB8-luc2 ARNm产生的荧光素酶的表达比相同剂量的加帽MB5-luc2 ARNm获得的荧光素酶的表达高9.3倍(参见图5B)。

因此,MB8-luc2 ARNm可以完全取代加帽的MB5-luc2 ARNm,甚至会更具有优势。

实施例7:MB8-2Apro ARNm的细胞毒性

材料和方法:

2Apro蛋白在哺乳动物细胞中的表达可通过凋亡或坏死来诱导毒性直至导致细胞死亡(Goldstaub等,2000)。在这些过程中,细胞将乳酸脱氢酶(LDH)释放到细胞外环境中。可以使用商业试剂盒Promega的CytoTox96 Non-Radioactive Cytotoxicity Assay测量LDH活性。

MB8-2Apro ARNm(SEQ ID NO:80)是编码来自人类鼻病毒2(HRV2)的基因组的2A非结构蛋白(2Apro,具有SEQ ID NO:81的序列)的ARNm。它具有根据SEQ ID NO:57的5′非编码序列(UTR),其与MB8-luc2 ARNm相同,以及包含根据SEQ ID NO:60的poly(A)尾巴的3′-UTR区域。

如实施例4所述,将750ng的MB8-luc2 ARNm单独或者将MB8-luc2 ARNm 和MB8-2Apro ARNm的混合物与pepMB1肽复合。

将MB8-luc2 ARNm单独或者将MB8-luc2 ARNm与MB8-2Apro ARNm以两种不同的摩尔比混合、转染到C2C12细胞中。具体地,将来自48孔板的孔中的 C2C12细胞与ARNm/pepMB1复合物孵育一小时。18小时后,测量荧光素酶活性 (图6)。未转染未裂解的C2C12细胞用作阴性对照,而用Triton X-100裂解的未转染的C2C12细胞以将所有LDH释放到培养介质中用作阳性对照。

结果:

即使在最高摩尔比(MB8-luc2 ARNm:MB8-2Apro ARNm比例为9:1)下, ARNm混合物也不会诱导细胞毒性。这表明病毒蛋白酶的表达不诱导细胞毒性(图 9)。

实施例8:通过共转染MB8-luc2和MB8-2Apro ARNm优化荧光素酶的表达动力学

材料和方法:

在无毒性的情况下,根据上述方法,随后将MB8-luc2和MB8-2Apro ARNm 以不同比例共转染到C2C12细胞中。18小时后,测量荧光素酶活性(图7)。然后根据上述方法,在转染后6小时至7天测量动力学,以确定是否仅在转染后18 小时观察到荧光素酶的表达改善。

结果:

出乎意料的是,在所有测试的比率中,MB8-luc2和MB8-2Apro ARNm的共转染使C2C12细胞中MB8-luc2 ARNm的荧光素酶的表达增加了至少2.5倍。最佳的MB8-luc2 ARNm:MB8-2Apro ARNm摩尔比为465:1,并使荧光素酶的表达增加3.4倍。

转染后6小时至7天进行的动力学出人意料地证明,观察到荧光素酶的表达改善长达至少一周。实际上,荧光素酶的表达平均增加了2.4倍(图7)。

实施例9:ARN适体对ARNm在肌肉中转染效率的影响

为了改善根据本发明的ARNm分子的内在化,将不同的适体掺入ARN分子中,如下文详述。然后在体内评估这些适体的作用,以确定是否可以观察到荧光素酶的表达的改善。

材料和方法:

适体选择

选择穿透C2C12细胞的适体。首先,与5′引物杂交,接着从单链ADN文库中延伸单链ADN,生成双链ADN。然后,根据本领域技术人员众所周知的方法沉淀并纯化由此获得的双链ADN。

然后,通过使用T7 DuraScribe转录试剂盒(20μl/轮)转录纯化片段,然后使用ssDNA和ARN纯化试剂盒进行ARN纯化,获得ARN适体文库。最后,用DNAseI 处理溶液以去除污染的ADN。以8μM ARN时,将适体溶解在1×DMEM+ITS 中(1288μg/5ml)。为了选择适体,将5ml DMEM/ITS/ARN溶液添加到预先用不含抗生素或血清的DMEM洗涤两次的细胞中。将细胞在37℃下孵育1小时,每 15分钟短暂摇动装有混合物的烧瓶。然后,将含有细胞的烧瓶置于冰上,并用15 mL冷的1×PBS洗涤细胞5次,以去除未穿透细胞的ARN适体。然后,用TRIzol(Invitrogen)裂解细胞,并通过苯酚-氯仿法提取总ARN。用RNA酶A消化内源 ARN,剩余的ARN与3′引物杂交,并在存在5′引物(100μM)、3′引物(100μM)、 Q5 High Fidelity ADN聚合酶(NEB)以及1×浓度的Q5 High-Fidelity Master Mix 缓冲液的情况下进行PCR扩增之前,由Superscript III酶(ThermoFisher)进行反转录。重复所有这些允许获得适体ARN文库的步骤。因此,进行两轮穿透C2C12 细胞的ARN适体的选择。

选择两个穿透C2C12细胞的ARN适体(B和C)并测序(分别是SEQ ID NO: 65和66)。然后将ARN适体B和C插入到xrRNA1上游的MB8-luc2 ARNm的 5′-UTR中,分别产生MB13-luc2和MB14-luc2 ARNm。

牢固结合多组氨酸肽基序的适体

旨在改善ARNm内化的第二种策略由以下组成:在MB8-luc2 ARNm的 xrRNA1上游的5′-UTR中,插入能够在镁存在使强力结合多组氨酸肽基序的另一个ARN适体(适体A)。掺入ARN适体A的ARNm被命名为MB11-luc2。小鼠肌纤维穿透肽M12(参见Gao等人,2014)通过间隔子(此处包含甘氨酸和丝氨酸氨基酸)连接到六组氨酸基序中。通过以下序列示例的方式,说明不同的间隔子:SEQ ID NO:75 (PRQPPRSISSHP

体内转染

在存在或不存在5μg氯喹的情况下,用5μg的与M12-H6肽复合的MB8-luc2 ARNm、MB13-luc2 ARNm、MB14-luc2 ARNm、或MB11-luc2 ARNm,转染雄性 BALB/cByJ小鼠的股二头肌。注射后16小时测量荧光素酶活性。

结果:

MB13-luc2 ARNm与MB8-luc2 ARNm一样转染肌肉(图10)。非常有利地,包含C适体的MB14-luc2 ARNm比MB8-luc2 ARNm转染股二头肌的效率高2.1 倍。因此,ARN适体C改善了ARNm分子向其所插入的肌肉纤维中的内化。

MB11-luc2 ARNm的转染效率适中(图10)。然而,出人意料的是,与存在肽而无氯喹时的MB11-luc2 ARNm相比,将5μg的MB11-luc2 ARNm、M12-H6 肽和5μg氯喹共同注射可以使转染效率提高31倍。另外,与MB8-Iuc2 ARNm所得相比,在M12-H6和氯喹存在下MB11-luc2ARNm所获得的荧光素酶的表达非常有利地高2.7倍。

不受理论的束缚,可以假设在氯喹的存在下M12-H6肽复合的MB11-luc2 ARN 的高转染效率,得益于ARNm穿透进入细胞之后通过氯喹减缓核内体酸化。氯喹可以在酸性pH下减缓六组氨酸质子化,因此防止MB11-luc2 ARNm和M12-H6 肽之间的复合物不稳定。结果,ARNm通过仍与之复合的M12-H6的帮助穿过核内体膜,可以提高ARNm从核内体逃逸,进入胞质并随后在其中翻译。

实施例10:小鼠皮内注射方案

a-溶液制备

为每只小鼠准备一个含有20μg ARNm的60μl溶液。为此,混合去离子水、 50mMHepes(1/8的Hepes、7/8的Hepes钠)、NaCl(最终160mM)、MgCl

b-皮内注射和活检样本

使用6周龄的雄性OF1小鼠(Charles River)。皮内注射前三到四天将它们剃光。使用面罩进行麻醉。用4%的异氟烷(Piramal Heathcare)实现麻醉诱导。在2%的异氟醚百分比维持麻醉。注射前,用酒精擦拭清洁之前剃光的背部皮肤。为过滤0.3mm x 8mm U-100(30G)胰岛素注射器(Becton-Dickinson),在室温下缓慢融化ARNm溶液。在每只小鼠剃光的背部皮肤中三次注射约17μl的ARN溶液。在解决(résorber)之前就形成了丘疹。使用永久性标记对这些进行划界,从而使得在第二天识别出待活检的皮肤区域。还使用标记物对尾巴进行标记,以区分同一笼中的动物。

注射后18小时,从注射区域获取皮肤活检。为此,将小鼠麻醉,然后通过颈脱位无痛致死。用一把剪刀将活检切成小块以促进细胞裂解,并将其放入装有500 μl 1×裂解缓冲液(5×荧光素酶细胞培养裂解液(Promega),用水稀释)的试管中。将每个管在-20℃冷冻直至下一步。

c-细胞裂解,荧光素酶和蛋白质测定

通过进行三个冷冻/解冻循环来获得裂解收集的组织:-80℃放置10分钟,在室温水浴中放置3分钟,然后使用涡旋混合器混合几秒钟。然后将试管在20℃下以5000xg离心5分钟,以沉淀组织碎片。将上清液转移到另一管中。

使用Luciferase Assay System试剂盒(Promega)进行荧光素酶分析。将20μl 的每种样本放入光度计专用管(Berthold AutoLumat Plus LB 953)中。向设备中注入了100μl底物,并测量了发射光的量(RLU)。

使用Pierce 660nm Protein Assay试剂盒(Thermo Scientific)进行蛋白质分析。用牛血清白蛋白(Thermo science)和1×裂解缓冲液作为稀释剂校准范围。其覆盖范围为每ml的100至500μg蛋白质。用100μl的1×裂解缓冲液作为空白。在某些情况下,用1×裂解缓冲液稀释裂解物。每个样本100μl用于蛋白质分析。将 1.5ml试剂添加到空白和样本中。在室温和黑暗中孵育精确的5分钟后,使用分光光度计在660nm处测量每个样本的吸光度。

实施例11:CPP对ARNm在皮肤中转染效率的影响

如上文实施例9中所述,通过使细胞穿透肽(CPP)与ARN适体A结合来改善裸ARNm内在化的策略不限于肌肉。这种使用不同CPP的策略已在此处应用于小鼠皮肤中。

材料和方法:

这里使用了三个CPP:CPP1、CPP2和CPP3(请参见Kamada等,2007和Lee 等,2012)。它们通过由甘氨酸和丝氨酸构成的间隔子与六组氨酸相连,以形成分别具有序列SEQ IDNO:76、77和78的肽CPP1-H6、CPP2-H6和CPP3-H6。

在预先优化的包含160mM NaCl、0.7mM MgCl

根据实施例10中详述的方案,在OF1小鼠中进行5.6μg的MB8-luc2 ARNm 或5.6μg的MB11-luc2皮内注射。还向小鼠皮肤注射1:1比例的MB11-luc2 ARNm 和MB8-luc2 ARNm的混合物,以及与0.5摩尔比相同量的CPP3-H6,以确定 CPP3-H6肽是否可以皮内注射后,与MB11-luc2 ARNm中存在的ARN适体A分离。注射后18小时测量荧光素酶活性。

结果:

如预期的那样,注射MB8-luc2 ARNm导致有效的皮肤转染。将CPP3-H6、 0.7mMMgCl

与单独的MB11-luc2 ARNm相比,有利地将转录效率增加9.2倍的CPP3-H6 肽的最佳量对应于1CPP3-H6肽:2ARNm的摩尔比(图11)。另外,非常有利地比用MB8-luc2 ARNm获得的荧光素酶活性高2.1倍,并且比用常规的MB5-luc2 加帽的ARNm获得的荧光素酶活性高19.5倍。

当每两个ARNm中有一个不结合CPP3-H6时,转染会下降12.3倍(图11, MB8-luc2和MB11-luc2 ARNm,各2.8μg)。这意味着在皮内注射后,CPP3-H6 肽可以与MB11-Iuc2 ARNm中存在的ARN适体A分离。如果一半的ARNm缺乏 ARN适体A(MB8-luc2 ARNm),则CPP3-H6无法有效地改善转染。

MB11-luc2 ARNm也与CPP1-H6肽以不同的摩尔比进行孵育。最佳摩尔比是 1CPP1-H6肽:4MB11-luc2 ARNm(图12)。与单独的MB11-luc2 ARNm相比,转染效率增加5.4倍。

因此,CPP1-H6比CPP3-H6结果差。这可以通过皮肤细胞的质膜上存在的每个CPP受体的拷贝数、以及每个CPP对其受体的亲合性进行说明。

最后,MB11-luc2 ARNm也与CPP2-H6以各种摩尔比孵育。最佳摩尔比是2 CPP2-H6肽:1MB11-luc2 ARNm(图13)。与单独MB11-Iuc2 ARNm相比,转染效率增加10.6倍,并且也比CPP3-H6肽所获得的转染效率更高。因此,荧光素酶的表达比常规MB5-luc2 ARNm高22.8倍。

实施例12:CPP-H6对加帽ARNm在皮肤中的转染效率的影响

材料和方法:

为了评估CPP(这里为CPP2-H6)对加帽ARNm的转染效率的影响,将适体 A插入到常规加帽MB5-luc2 ARNm的5′-UTR中,以生成具有SEQ ID NO:70序列的加帽MB15-luc2 ARNm。如上文实施例11所述,在包含0.7mM MgCl

根据实施例10中详述的方案,在OF1小鼠中进行5.6μg的MB15-luc2 ARNm 的皮内注射。注射后18小时测量荧光素酶活性。

结果:

在不存在CPP2-H6肽的情况下,加帽的MB15-Iuc2 ARNm比加帽的MB5-luc2 ARNm获得的荧光素酶的表达低1.68倍。

与单独的MB15-luc2 ARNm相比,以每ARNm对应2肽的摩尔比共注射加帽的MB15-luc2 ARNm和CPP2-H6肽,只能使转染效率提高1.48倍。这表明,与使用加帽的ARNm MB11-luc2观察到的相比(10.6倍),将ARN适体A插入常规加帽ARNm的5′-UTR,并将CPP-H6肽附着到该ARN适体上不会提高转染效率。不考虑加帽的ARNm分子(带有或不带有适体,是否连接到CPP2-H6 CPP),转染效率仍远低于MB8-luc2和MB11-luc2 ARNm所观察到的转染效率。因此,使用本发明的ARNm分子而不是加帽的ARNm分子是非常有利的。

实施例13:5′-SL对皮肤中体内荧光素酶的表达的影响

材料和方法:

以下ARNm:根据上述实施例10中详述的方案,将MB8-luc2、MB11-luc2、 MB17-luc2、MB18-luc2和加帽的MB5-luc2注射到皮肤中,并在注射后18小时测量荧光素酶活性。

结果:

如图15中所示,与加帽的ARNm(MB5-luc2)相比,包含至少一个xrRNA 序列和一个IRES序列(MB11-luc2)的根据本发明的ARNm使皮肤中的荧光素酶的表达增加约2倍。出人意料的是,当茎-环位于xrRNA1序列上游的五个核苷酸位置时(MB8-luc2和MB18-luc2),添加茎-环(此处5′-SL具有SEQ ID NO:87 的序列)使得在皮肤中荧光素酶的表达比仅有xrRNA和IRES序列(MB11-luc2) 增加约4.3倍。

但是,当茎-环位于xrRNA序列上游约70个核苷酸处时,除了在没有茎-环情况下所观察到的,茎-环没有提高效率。实际上,MB11-luc2和MB17-luc2 ARNm 的翻译效率相似。出人意料地是,与MB11-luc2和MB17-luc2 ARNm相比,将适体A放置在xrRNA序列和IRES序列(MB18-luc2)之间使得翻译效率提高甚至更多。因此,MB8-luc2和MB18-luc2 ARNm具有相似的翻译效率。

结论:

与加帽的ARNm分子相比,本发明的ARNm分子的合成成本降低约30倍,同时蛋白质表达的产率提高至少2倍,优选为约10倍。此外,本发明的ARNm至少与加帽的ARNm一样稳定,并且由于不存在帽分子或其类似物而简化其通过体外转录生产。当本发明的编码HRV2的2A蛋白酶的ARNm与编码目的蛋白的 ARNm共转染时,本发明编码HRV2的2A蛋白酶的ARNm可能增加编码目的蛋白的ARNm的翻译。另外,例如,通过在根据本发明的ARNm分子的5′-UTR区域插入直接穿透细胞的ARN适体(CPP(与上所述ARN适体连接))、和/或通过在xrRNA序列上游5′-UTR区的5′端添加茎-环,可以提高组织(例如肌肉或皮肤)的转染效率。

参考文献

Ausubel et al.,2001,Current Protocols in Molecular Biology,Wiley&Sons,Hoboken N.J.,USA.

Beckert et Masquida,2011,Methods Mol Biol.703:29-41.

Borman et al.,1995,Nucl.Acids Res.23(18):3656-3663.

Chapman et al.,2014,eLife,3:e01892.

Contreas et al.,1982,Nucl.Acids Res.10:6353-6363.

Cowling,2010,Biochem.J.425:295-302.

Dunn et al.,2017,Nat Rev Chem.1.s41570-017.10.1038/s41570-017-0076.

Gao et al.,2014,Molecular Therapy 22(7):1333-41.

Goldstaub et al.,2000,Mol CellBiol,20:1271-1277

Kamada et al.,2007,Biol.Pharm.Bull.30(2):218-23.

Kieft et al.,2015,RNA Biology,12(11):1169-77.

Lee et al.,2012,Biotechnol.7∶387-96.

Martinez Salas et al.,2013,lnt J Mol Sci.Nov;14(11):21705-21726.

Martin et al.,1975,JBC,250:9322-9329.

Needleman et Wunsch,1970,J Mol Biol.48(3):443-53.

Pasquinelli et al.,1995,RNA,1∶957-967.

Poillot et De Waard,2011,Med Sci(Paris).27(5):527-34.

Rogé et Betton,2005,Microb Cell Fact.4:18.

Tsuji S.et al.,2013,PLoS ONE 8(12):e83108.

序列表

<110> 梅辛杰生物制药

<120> 信使RNA 5'端引入的两个RNA序列取代信使RNA帽

<130> 375816D38002

<150> FR 1854052

<151> 2018-05-15

<160> 89

<170> PatentIn version 3.5

<210> 1

<211> 45

<212> RNA

<213> 登革热病毒型 1

<400> 1

gucaggccgg auuaagccau agcacgguaa gagcuaugcu gccug 45

<210> 2

<211> 45

<212> RNA

<213> 登革热病毒型 2

<400> 2

gucaggccgg auuaagccau aguacggaaa aaacuaugcu accug 45

<210> 3

<211> 45

<212> RNA

<213> 登革热病毒型 3

<400> 3

gucaggccac cuuaagccac aguacggaag aagcugugcu gccug 45

<210> 4

<211> 43

<212> RNA

<213> 科科贝拉病毒

<400> 4

gucaggccug aaaagccacc ugauccggug aaggugcugc cug 43

<210> 5

<211> 47

<212> RNA

<213> 寨卡病毒

<400> 5

gucaggccug cuagucagcc acaguuuggg gaaagcugug cagccug 47

<210> 6

<211> 50

<212> RNA

<213> 圣路易脑炎病毒

<400> 6

gucaggccaa ucaguuuugc caccggaugu cagguaaacg gugcugucug 50

<210> 7

<211> 50

<212> RNA

<213> 日本脑炎病毒

<400> 7

gucaggccag caaaagcugc caccggauac uggguagacg gugcugucug 50

<210> 8

<211> 50

<212> RNA

<213> 恩塔亚病毒

<400> 8

gucaggccag gcaaugccug ccaccggaag uuggaugacg gugcugucug 50

<210> 9

<211> 50

<212> RNA

<213> 乌苏图病毒

<400> 9

gucaggccag ggcaaccugc caccggaagu ugaguagacg gugcugccug 50

<210> 10

<211> 52

<212> RNA

<213> 墨莱溪谷脑炎病毒

<400> 10

gucaggccag ccgguuaggc ugccaccgaa gguugguaga cggugcugcc ug 52

<210> 11

<211> 51

<212> RNA

<213> 西尼罗河病毒

<400> 11

gucaggccag auuaaugcug ccaccggaag uugaguagac ggugcugccu g 51

<210> 12

<211> 45

<212> RNA

<213> 伊瓜佩病毒

<400> 12

gucaggccgg aaacgccacc ggauggucgu aaacggugcg gccug 45

<210> 13

<211> 52

<212> RNA

<213> 巴格扎病毒

<400> 13

gucaggccgg acuacguguc cgccaccgga uguuggauga cggugcugcc ug 52

<210> 14

<211> 52

<212> RNA

<213> 以色列土耳其脑膜脑脊髓炎病毒

<400> 14

gucaggccgg auuauauguc cgccaccgga uguuggauga cggugcugcc ug 52

<210> 15

<211> 42

<212> RNA

<213> 新马普恩病毒

<400> 15

gucaggccga auagccaucu gauccgguga agaugcugcc ug 42

<210> 16

<211> 41

<212> RNA

<213> 登革热病毒型 1

<400> 16

gucaggccga aagccacggu ucgagcaagc cgugcugccu g 41

<210> 17

<211> 46

<212> RNA

<213> 登革热病毒型 2

<400> 17

gucaggccau cauaaaugcc auagcuugag uaaacuaugc agccug 46

<210> 18

<211> 43

<212> RNA

<213> 登革热病毒型 4

<400> 18

gucaggccac uugugccacg guuugagcaa accgugcugc cug 43

<210> 19

<211> 37

<212> RNA

<213> 科科贝拉病毒

<400> 19

gucagauccg aaaggccacc aguuuggugc agaacug 37

<210> 20

<211> 44

<212> RNA

<213> 寨卡病毒

<400> 20

gucaggccga gaacgccaug gcacggaaga agccaugcug ccug 44

<210> 21

<211> 46

<212> RNA

<213> 圣路易脑炎病毒

<400> 21

gucagaccag aaaugccacc ugaaagcaug cuaaaggugc ugucug 46

<210> 22

<211> 44

<212> RNA

<213> 日本脑炎病毒

<400> 22

gucaggccac aaauuugugc caccccgcua gggggugcgg ccug 44

<210> 23

<211> 43

<212> RNA

<213> 恩塔亚病毒

<400> 23

gucaggccgu agguuuuacg ccacuagcau gcagugcugc cug 43

<210> 24

<211> 41

<212> RNA

<213> 乌苏图病毒

<400> 24

gucaggccgc aaagcgccac uucgccaagg agugcagccu g 41

<210> 25

<211> 42

<212> RNA

<213> 墨莱溪谷脑炎病毒

<400> 25

gucagaucgc gaaagcgcca cuucgccgag gagugcaauc ug 42

<210> 26

<211> 45

<212> RNA

<213> 西尼罗河病毒

<400> 26

gucagaccac acuuuaaugu gccacucugc ggagagugca gucug 45

<210> 27

<211> 43

<212> RNA

<213> 伊瓜佩病毒

<400> 27

gucaggccga aagccaccac aagcgguaca guggugcugc cug 43

<210> 28

<211> 43

<212> RNA

<213> 巴格扎病毒

<400> 28

gucaggccac agguuuugug ccacuagcau gcagugcugc cug 43

<210> 29

<211> 43

<212> RNA

<213> 以色列土耳其脑膜脑脊髓炎病毒

<400> 29

gucaggccac agguuuugug ccacuagcau gcagugcugc cug 43

<210> 30

<211> 48

<212> RNA

<213> 新马普恩病毒

<400> 30

gucagaccac uuagugccac caguaugaug auaagcuggu gcugucug 48

<210> 31

<211> 50

<212> RNA

<213> 韦塞尔布朗病毒

<400> 31

gucagcccau cauuugaugc cauggcuaag cugugaggcc augcuggcug 50

<210> 32

<211> 49

<212> RNA

<213> 伊列乌斯病毒

<400> 32

gucaggccau ggaaacaugc cacccaaagc uuguagaggg ugcagccug 49

<210> 33

<211> 51

<212> RNA

<213> 塞皮克病毒

<400> 33

gucagcccgu cauaaugacg ccauggcuaa gcugugaggc caugcuggcu g 51

<210> 34

<211> 45

<212> RNA

<213> 布苏夸病毒

<400> 34

gucaggccag aaaugccacc ggauaaaggu agacggugcu gccug 45

<210> 35

<211> 50

<212> RNA

<213> 坦布苏病毒

<400> 35

gucaggccag ggaaucccug ccaccggaug uuggaugacg gugcugucug 50

<210> 36

<211> 44

<212> RNA

<213> 朝阳病毒

<400> 36

gucaggccua aaugccaccg gaugauagua gacggugcug ccug 44

<210> 37

<211> 50

<212> RNA

<213> 凯杜古病毒

<400> 37

gucaggccac ucgugagagu gccacaguac gguaaagacu gugcggccug 50

<210> 38

<211> 53

<212> RNA

<213> 横濑病毒

<400> 38

gucaggccaa gauugagaaa aucuugccac agcuuggcag acugugcagc cug 53

<210> 39

<211> 51

<212> RNA

<213> 东港病毒

<400> 39

gucaggccuc acgaauguga gccaccggau gggacuagac ggugcugccu g 51

<210> 40

<211> 59

<212> RNA

<213> 黄热病毒

<400> 40

gucagcccag aaccccacac gaguuuugcc acugcuaagc ugugaggcag ugcaggcug 59

<210> 41

<211> 48

<212> RNA

<213> 罗西奥病毒

<400> 41

gucaggccgu ccuuggacgc cacccaaagc augggagggu gcugccug 48

<210> 42

<211> 49

<212> RNA

<213> 阿尔弗病毒

<400> 42

gucaggccag ugaaaacugc caccggaugu ugguagacgg ugcugccug 49

<210> 43

<211> 43

<212> RNA

<213> 斯特拉特福病毒

<400> 43

gucaggccug aaaagccauc ugauccggug aagaugcugc cug 43

<210> 44

<211> 50

<212> RNA

<213> 鸭蛋滴综合征病毒

<400> 44

gucaggccag ggaaucccug ccaccggaug uuggaugacg gugcugucug 50

<210> 45

<211> 547

<212> DNA

<213> 脑心肌炎病毒

<400> 45

tactggccga agccgcttgg aataaggccg gtgtgcgttt gtctatatgt tattttccac 60

catattgccg tcttttggca atgtgagggc ccggaaacct ggccctgtct tcttgacgag 120

cattcctagg ggtctttccc ctctcgccaa aggaatgcaa ggtctgttga atgtcgtgaa 180

ggaagcagtt cctctggaag cttcttgaag acaaacaacg tctgtagcga ccctttgcag 240

gcagcggaac cccccacctg gcgacaggtg cctctgcggc caaaagccac gtgtataaga 300

tacacctgca aaggcggcac aaccccagtg ccacgttgtg agttggatag ttgtggaaag 360

agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg aaggatgccc agaaggtacc 420

ccattgtatg ggatctgatc tggggcctcg gtgcacatgc tttacatgtg tttagtcgag 480

gttaaaaaac gtctaggccc cccgaaccac ggggacgtgg ttttcctttg aaaaacacga 540

tgataat 547

<210> 46

<211> 17

<212> DNA

<213> 噬菌体T7

<400> 46

taatacgact cactata 17

<210> 47

<211> 83

<212> RNA

<213> 人工序列

<220>

<223> 来自pMB8-luc2和pMB9-luc2的RNA中的xrRNA序列之间的间隔子1

<400> 47

gaccaaagcu gcgaggugau ccacguaagc ccucagaacc gucucggaag gaggacccca 60

cgugcuuuag ccucaaagcc cag 83

<210> 48

<211> 17

<212> RNA

<213> 人工序列

<220>

<223> 来自pMB8-luc2和pMB9-luc2的RNA中的xrRNA2和IRES序列之间的间隔子2

<400> 48

uaacaaaggc aaaacau 17

<210> 49

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 5'UTR pMB5-luc2(没有T7启动子)

<400> 49

gggaagctta agtgttcttt ttgcagaagc tcagaataaa cgctcaactt tggcagatct 60

acc 63

<210> 50

<211> 818

<212> DNA

<213> 人工序列

<220>

<223> pMB8-luc2和pMB9-luc2的5'UTR

<400> 50

gggaagctta agcttcccaa aaaagtcagg ccagattaat gctgccaccg gaagttgagt 60

agacggtgct gcctgcggct caaccccagg aggactgggt gaccaaagct gcgaggtgat 120

ccacgtaagc cctcagaacc gtctcggaag gaggacccca cgtgctttag cctcaaagcc 180

cagtgtcaga ccacacttta atgtgccact ctgcggagag tgcagtctgc gatagtgccc 240

caggtggact gggttaacaa aggcaaaaca ttactggccg aagccgcttg gaataaggcc 300

ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg 360

cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca 420

aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa 480

gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt 540

gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt 600

gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca 660

acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc 720

ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc ccccgaacca 780

cggggacgtg gttttccttt gaaaaacacg atgataat 818

<210> 51

<211> 583

<212> DNA

<213> 人工序列

<220>

<223> pMB7-luc2的5'UTR(没有T7启动子)

<400> 51

gggaagctta agcttccctt aacaaaggca aaacattact ggccgaagcc gcttggaata 60

aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt 120

gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct 180

cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc 240

ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga 300

caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc 360

ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt 420

attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg 480

gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaacgtct aggccccccg 540

aaccacgggg acgtggtttt cctttgaaaa acacgatgat aat 583

<210> 52

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> pMB5-luc2、pMB7-luc2和pMB8-luc2的3'-UTR没有poly A尾巴或限制性位点

<400> 52

ttctagaatg tccgaatggt tgacacttga tctcggcaac gcat 44

<210> 53

<211> 109

<212> DNA

<213> 人工序列

<220>

<223> pMB5-luc2、pMB7-luc2和pMB8-luc2的3'-UTR没有限制性位点

<400> 53

ttctagaatg tccgaatggt tgacacttga tctcggcaac gcataaaaaa aaaaaaaaaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 109

<210> 54

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> pMB5-luc2、pMB7-luc2和pMB8-luc2的完整3'-UTR(有SspI限制性位点)

<400> 54

ttctagaatg tccgaatggt tgacacttga tctcggcaac gcataaaaaa aaaaaaaaaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaat att 113

<210> 55

<211> 625

<212> DNA

<213> 昆金病毒

<400> 55

aatactttgt taattgtaaa taaatattgt tattatgtgt agaagtttag ctttataata 60

gtgtttagtg tgtttagagt tagaaaaatt ttagtgagga agtcaggccg gaaaattccc 120

gccaccggaa gttgagtaga cggtgctgcc tgcgactcaa ccccaggagg actgggtgaa 180

caaagctgcg aagtgatcca tgtaagccct cagaaccgtc tcggaaagag gaccccacat 240

gttgtagctt caaggcccaa tgtcagacca cgccatggcg tgccactctg cggagagtgc 300

agtctgcgac agtgccccag gaggactggg tgaacaaagg cgaatcaacg tcccacgcgg 360

ccctagctct ggcaatggtg ttaaccagag tgaaaggact agaggttaga ggagaccccg 420

cgttctgaag tgcacggccc agcctggctg aagctgtagg tcaggggaag gactagaggt 480

tagtggagac cccgtgccgc aaaacaccac aacaacacag catattgaca cctgggatag 540

actaggagat cttctgctct gcacaaccag ccacacggca cagtgcgccg acaatggtgg 600

ctggtggtgc gagaacacag gatct 625

<210> 56

<211> 718

<212> DNA

<213> 人工序列

<220>

<223> 3'UTR (昆金病毒) - Eco53kI (pMB9-luc2)

<400> 56

ttctagaata ctttgttaat tgtaaataaa tattgttatt atgtgtagaa gtttagcttt 60

ataatagtgt ttagtgtgtt tagagttaga aaaattttag tgaggaagtc aggccggaaa 120

attcccgcca ccggaagttg agtagacggt gctgcctgcg actcaacccc aggaggactg 180

ggtgaacaaa gctgcgaagt gatccatgta agccctcaga accgtctcgg aaagaggacc 240

ccacatgttg tagcttcaag gcccaatgtc agaccacgcc atggcgtgcc actctgcgga 300

gagtgcagtc tgcgacagtg ccccaggagg actgggtgaa caaaggcgaa tcaacgtccc 360

acgcggccct agctctggca atggtgttaa ccagagtgaa aggactagag gttagaggag 420

accccgcgtt ctgaagtgca cggcccagcc tggctgaagc tgtaggtcag gggaaggact 480

agaggttagt ggagaccccg tgccgcaaaa caccacaaca acacagcata ttgacacctg 540

ggatagacta ggagatcttc tgctctgcac aaccagccac acggcacagt gcgccgacaa 600

tggtggctgg tggtgcgaga acacaggatc tgggtcggca tggcatctcc acctcctcgc 660

ggtccgacct gggcatccga aggaggacgc acgtccactc ggatggctaa gggagctc 718

<210> 57

<211> 63

<212> RNA

<213> 人工序列

<220>

<223> 来自MB5-luc2的RNA的5'-UTR

<400> 57

gggaagcuua aguguucuuu uugcagaagc ucagaauaaa cgcucaacuu uggcagaucu 60

acc 63

<210> 58

<211> 583

<212> RNA

<213> 人工序列

<220>

<223> 来自MB7-luc2的RNA的5'-UTR

<400> 58

gggaagcuua agcuucccuu aacaaaggca aaacauuacu ggccgaagcc gcuuggaaua 60

aggccggugu gcguuugucu auauguuauu uuccaccaua uugccgucuu uuggcaaugu 120

gagggcccgg aaaccuggcc cugucuucuu gacgagcauu ccuagggguc uuuccccucu 180

cgccaaagga augcaagguc uguugaaugu cgugaaggaa gcaguuccuc uggaagcuuc 240

uugaagacaa acaacgucug uagcgacccu uugcaggcag cggaaccccc caccuggcga 300

caggugccuc ugcggccaaa agccacgugu auaagauaca ccugcaaagg cggcacaacc 360

ccagugccac guugugaguu ggauaguugu ggaaagaguc aaauggcucu ccucaagcgu 420

auucaacaag gggcugaagg augcccagaa gguaccccau uguaugggau cugaucuggg 480

gccucggugc acaugcuuua cauguguuua gucgagguua aaaaacgucu aggccccccg 540

aaccacgggg acgugguuuu ccuuugaaaa acacgaugau aau 583

<210> 59

<211> 818

<212> RNA

<213> 人工序列

<220>

<223> pMB8-luc2和pMB9-luc2的5'UTR

<400> 59

gggaagcuua agcuucccaa aaaagucagg ccagauuaau gcugccaccg gaaguugagu 60

agacggugcu gccugcggcu caaccccagg aggacugggu gaccaaagcu gcgaggugau 120

ccacguaagc ccucagaacc gucucggaag gaggacccca cgugcuuuag ccucaaagcc 180

cagugucaga ccacacuuua augugccacu cugcggagag ugcagucugc gauagugccc 240

cagguggacu ggguuaacaa aggcaaaaca uuacuggccg aagccgcuug gaauaaggcc 300

ggugugcguu ugucuauaug uuauuuucca ccauauugcc gucuuuuggc aaugugaggg 360

cccggaaacc uggcccuguc uucuugacga gcauuccuag gggucuuucc ccucucgcca 420

aaggaaugca aggucuguug aaugucguga aggaagcagu uccucuggaa gcuucuugaa 480

gacaaacaac gucuguagcg acccuuugca ggcagcggaa ccccccaccu ggcgacaggu 540

gccucugcgg ccaaaagcca cguguauaag auacaccugc aaaggcggca caaccccagu 600

gccacguugu gaguuggaua guuguggaaa gagucaaaug gcucuccuca agcguauuca 660

acaaggggcu gaaggaugcc cagaagguac cccauuguau gggaucugau cuggggccuc 720

ggugcacaug cuuuacaugu guuuagucga gguuaaaaaa cgucuaggcc ccccgaacca 780

cggggacgug guuuuccuuu gaaaaacacg augauaau 818

<210> 60

<211> 110

<212> RNA

<213> 人工序列

<220>

<223> MB5-luc2、MB7-luc2、MB8-luc2的RNA的3'-UTR

<400> 60

uucuagaaug uccgaauggu ugacacuuga ucucggcaac gcauaaaaaa aaaaaaaaaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaau 110

<210> 61

<211> 715

<212> RNA

<213> 人工序列

<220>

<223> MB9-luc2的RNA的3'-UTR

<400> 61

uucuagaaua cuuuguuaau uguaaauaaa uauuguuauu auguguagaa guuuagcuuu 60

auaauagugu uuaguguguu uagaguuaga aaaauuuuag ugaggaaguc aggccggaaa 120

auucccgcca ccggaaguug aguagacggu gcugccugcg acucaacccc aggaggacug 180

ggugaacaaa gcugcgaagu gauccaugua agcccucaga accgucucgg aaagaggacc 240

ccacauguug uagcuucaag gcccaauguc agaccacgcc auggcgugcc acucugcgga 300

gagugcaguc ugcgacagug ccccaggagg acugggugaa caaaggcgaa ucaacguccc 360

acgcggcccu agcucuggca augguguuaa ccagagugaa aggacuagag guuagaggag 420

accccgcguu cugaagugca cggcccagcc uggcugaagc uguaggucag gggaaggacu 480

agagguuagu ggagaccccg ugccgcaaaa caccacaaca acacagcaua uugacaccug 540

ggauagacua ggagaucuuc ugcucugcac aaccagccac acggcacagu gcgccgacaa 600

ugguggcugg uggugcgaga acacaggauc ugggucggca uggcaucucc accuccucgc 660

gguccgaccu gggcauccga aggaggacgc acguccacuc ggauggcuaa gggag 715

<210> 62

<211> 1656

<212> DNA

<213> 人工序列

<220>

<223> luc2

<400> 62

atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60

accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120

gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180

gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240

tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300

gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360

agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420

aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480

ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540

ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600

agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660

catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720

gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780

cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840

aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900

atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960

aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020

ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080

gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140

acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200

tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260

ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320

ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380

caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440

cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500

tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560

gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620

aaggccaaga agggcggcaa gatcgccgtg taataa 1656

<210> 63

<211> 1656

<212> RNA

<213> 人工序列

<220>

<223> luc2

<400> 63

auggaagaug ccaaaaacau uaagaagggc ccagcgccau ucuacccacu cgaagacggg 60

accgccggcg agcagcugca caaagccaug aagcgcuacg cccuggugcc cggcaccauc 120

gccuuuaccg acgcacauau cgagguggac auuaccuacg ccgaguacuu cgagaugagc 180

guucggcugg cagaagcuau gaagcgcuau gggcugaaua caaaccaucg gaucguggug 240

ugcagcgaga auagcuugca guucuucaug cccguguugg gugcccuguu caucggugug 300

gcuguggccc cagcuaacga caucuacaac gagcgcgagc ugcugaacag caugggcauc 360

agccagccca ccgucguauu cgugagcaag aaagggcugc aaaagauccu caacgugcaa 420

aagaagcuac cgaucauaca aaagaucauc aucauggaua gcaagaccga cuaccagggc 480

uuccaaagca uguacaccuu cgugacuucc cauuugccac ccggcuucaa cgaguacgac 540

uucgugcccg agagcuucga ccgggacaaa accaucgccc ugaucaugaa caguaguggc 600

aguaccggau ugcccaaggg cguagcccua ccgcaccgca ccgcuugugu ccgauucagu 660

caugcccgcg accccaucuu cggcaaccag aucauccccg acaccgcuau ccucagcgug 720

gugccauuuc accacggcuu cggcauguuc accacgcugg gcuacuugau cugcggcuuu 780

cgggucgugc ucauguaccg cuucgaggag gagcuauucu ugcgcagcuu gcaagacuau 840

aagauucaau cugcccugcu ggugcccaca cuauuuagcu ucuucgcuaa gagcacucuc 900

aucgacaagu acgaccuaag caacuugcac gagaucgcca gcggcggggc gccgcucagc 960

aaggagguag gugaggccgu ggccaaacgc uuccaccuac caggcauccg ccagggcuac 1020

ggccugacag aaacaaccag cgccauucug aucacccccg aaggggacga caagccuggc 1080

gcaguaggca agguggugcc cuucuucgag gcuaaggugg uggacuugga caccgguaag 1140

acacugggug ugaaccagcg cggcgagcug ugcguccgug gccccaugau caugagcggc 1200

uacguuaaca accccgaggc uacaaacgcu cucaucgaca aggacggcug gcugcacagc 1260

ggcgacaucg ccuacuggga cgaggacgag cacuucuuca ucguggaccg gcugaagagc 1320

cugaucaaau acaagggcua ccagguagcc ccagccgaac uggagagcau ccugcugcaa 1380

caccccaaca ucuucgacgc cggggucgcc ggccugcccg acgacgaugc cggcgagcug 1440

cccgccgcag ucgucgugcu ggaacacggu aaaaccauga ccgagaagga gaucguggac 1500

uauguggcca gccagguuac aaccgccaag aagcugcgcg gugguguugu guucguggac 1560

gaggugccua aaggacugac cggcaaguug gacgcccgca agauccgcga gauucucauu 1620

aaggccaaga agggcggcaa gaucgccgug uaauaa 1656

<210> 64

<211> 33

<212> RNA

<213> 人工序列

<220>

<223> 适体A

<400> 64

gguauauugg cgccuucgug gaaugucagu gcc 33

<210> 65

<211> 32

<212> RNA

<213> 人工序列

<220>

<223> 适体B

<400> 65

gggaggacga ugcggacaga cgacucgccc ga 32

<210> 66

<211> 36

<212> RNA

<213> 人工序列

<220>

<223> 适体C

<400> 66

gggaggacga ugcggacgug cagacgacuc gcccga 36

<210> 67

<211> 869

<212> RNA

<213> 人工序列

<220>

<223> 来自MB11-luc2的RNA的5'-UTR

<400> 67

gggaagcuua aguggugagg uauauuggcg ccuucgugga augucagugc cucaccagca 60

ugccuuccca aaaaagucag gccagauuaa ugcugccacc ggaaguugag uagacggugc 120

ugccugcggc ucaaccccag gaggacuggg ugaccaaagc ugcgagguga uccacguaag 180

cccucagaac cgucucggaa ggaggacccc acgugcuuua gccucaaagc ccagugucag 240

accacacuuu aaugugccac ucugcggaga gugcagucug cgauagugcc ccagguggac 300

uggguuaaca aaggcaaaac auuacuggcc gaagccgcuu ggaauaaggc cggugugcgu 360

uugucuauau guuauuuucc accauauugc cgucuuuugg caaugugagg gcccggaaac 420

cuggcccugu cuucuugacg agcauuccua ggggucuuuc cccucucgcc aaaggaaugc 480

aaggucuguu gaaugucgug aaggaagcag uuccucugga agcuucuuga agacaaacaa 540

cgucuguagc gacccuuugc aggcagcgga accccccacc uggcgacagg ugccucugcg 600

gccaaaagcc acguguauaa gauacaccug caaaggcggc acaaccccag ugccacguug 660

ugaguuggau aguuguggaa agagucaaau ggcucuccuc aagcguauuc aacaaggggc 720

ugaaggaugc ccagaaggua ccccauugua ugggaucuga ucuggggccu cggugcacau 780

gcuuuacaug uguuuagucg agguuaaaaa acgucuaggc cccccgaacc acggggacgu 840

gguuuuccuu ugaaaaacac gaugauaau 869

<210> 68

<211> 874

<212> RNA

<213> 人工序列

<220>

<223> 来自MB13-luc2的RNA的5'-UTR

<400> 68

gggaagcuua agcuucccaa aaaagggagg acgaugcgga cagacgacuc gcccgaaaaa 60

aaucuagagc augcaaaaaa gucaggccag auuaaugcug ccaccggaag uugaguagac 120

ggugcugccu gcggcucaac cccaggagga cugggugacc aaagcugcga ggugauccac 180

guaagcccuc agaaccgucu cggaaggagg accccacgug cuuuagccuc aaagcccagu 240

gucagaccac acuuuaaugu gccacucugc ggagagugca gucugcgaua gugccccagg 300

uggacugggu uaacaaaggc aaaacauuac uggccgaagc cgcuuggaau aaggccggug 360

ugcguuuguc uauauguuau uuuccaccau auugccgucu uuuggcaaug ugagggcccg 420

gaaaccuggc ccugucuucu ugacgagcau uccuaggggu cuuuccccuc ucgccaaagg 480

aaugcaaggu cuguugaaug ucgugaagga agcaguuccu cuggaagcuu cuugaagaca 540

aacaacgucu guagcgaccc uuugcaggca gcggaacccc ccaccuggcg acaggugccu 600

cugcggccaa aagccacgug uauaagauac accugcaaag gcggcacaac cccagugcca 660

cguugugagu uggauaguug uggaaagagu caaauggcuc uccucaagcg uauucaacaa 720

ggggcugaag gaugcccaga agguacccca uuguauggga ucugaucugg ggccucggug 780

cacaugcuuu acauguguuu agucgagguu aaaaaacguc uaggcccccc gaaccacggg 840

gacgugguuu uccuuugaaa aacacgauga uaau 874

<210> 69

<211> 878

<212> RNA

<213> 人工序列

<220>

<223> 来自MB14-luc2的RNA的5'-UTR

<400> 69

gggaagcuua agcuucccaa aaaagggagg acgaugcgga cgugcagacg acucgcccga 60

aaaaaaucua gagcaugcaa aaaagucagg ccagauuaau gcugccaccg gaaguugagu 120

agacggugcu gccugcggcu caaccccagg aggacugggu gaccaaagcu gcgaggugau 180

ccacguaagc ccucagaacc gucucggaag gaggacccca cgugcuuuag ccucaaagcc 240

cagugucaga ccacacuuua augugccacu cugcggagag ugcagucugc gauagugccc 300

cagguggacu ggguuaacaa aggcaaaaca uuacuggccg aagccgcuug gaauaaggcc 360

ggugugcguu ugucuauaug uuauuuucca ccauauugcc gucuuuuggc aaugugaggg 420

cccggaaacc uggcccuguc uucuugacga gcauuccuag gggucuuucc ccucucgcca 480

aaggaaugca aggucuguug aaugucguga aggaagcagu uccucuggaa gcuucuugaa 540

gacaaacaac gucuguagcg acccuuugca ggcagcggaa ccccccaccu ggcgacaggu 600

gccucugcgg ccaaaagcca cguguauaag auacaccugc aaaggcggca caaccccagu 660

gccacguugu gaguuggaua guuguggaaa gagucaaaug gcucuccuca agcguauuca 720

acaaggggcu gaaggaugcc cagaagguac cccauuguau gggaucugau cuggggccuc 780

ggugcacaug cuuuacaugu guuuagucga gguuaaaaaa cgucuaggcc ccccgaacca 840

cggggacgug guuuuccuuu gaaaaacacg augauaau 878

<210> 70

<211> 114

<212> RNA

<213> 人工序列

<220>

<223> 加帽MB15-luc2 RNA的5'-UTR

<400> 70

gggaagcuua aguguucuuu uugcagaagc ucagaauugg ugagguauau uggcgccuuc 60

guggaauguc agugccucac cagcaugcaa acgcucaacu uuggcagauc uacc 114

<210> 71

<211> 869

<212> DNA

<213> 人工序列

<220>

<223> MB11-luc2的5'-UTR

<400> 71

gggaagctta agtggtgagg tatattggcg ccttcgtgga atgtcagtgc ctcaccagca 60

tgccttccca aaaaagtcag gccagattaa tgctgccacc ggaagttgag tagacggtgc 120

tgcctgcggc tcaaccccag gaggactggg tgaccaaagc tgcgaggtga tccacgtaag 180

ccctcagaac cgtctcggaa ggaggacccc acgtgcttta gcctcaaagc ccagtgtcag 240

accacacttt aatgtgccac tctgcggaga gtgcagtctg cgatagtgcc ccaggtggac 300

tgggttaaca aaggcaaaac attactggcc gaagccgctt ggaataaggc cggtgtgcgt 360

ttgtctatat gttattttcc accatattgc cgtcttttgg caatgtgagg gcccggaaac 420

ctggccctgt cttcttgacg agcattccta ggggtctttc ccctctcgcc aaaggaatgc 480

aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga agcttcttga agacaaacaa 540

cgtctgtagc gaccctttgc aggcagcgga accccccacc tggcgacagg tgcctctgcg 600

gccaaaagcc acgtgtataa gatacacctg caaaggcggc acaaccccag tgccacgttg 660

tgagttggat agttgtggaa agagtcaaat ggctctcctc aagcgtattc aacaaggggc 720

tgaaggatgc ccagaaggta ccccattgta tgggatctga tctggggcct cggtgcacat 780

gctttacatg tgtttagtcg aggttaaaaa acgtctaggc cccccgaacc acggggacgt 840

ggttttcctt tgaaaaacac gatgataat 869

<210> 72

<211> 874

<212> DNA

<213> 人工序列

<220>

<223> MB13-luc2的5'-UTR

<400> 72

gggaagctta agcttcccaa aaaagggagg acgatgcgga cagacgactc gcccgaaaaa 60

aatctagagc atgcaaaaaa gtcaggccag attaatgctg ccaccggaag ttgagtagac 120

ggtgctgcct gcggctcaac cccaggagga ctgggtgacc aaagctgcga ggtgatccac 180

gtaagccctc agaaccgtct cggaaggagg accccacgtg ctttagcctc aaagcccagt 240

gtcagaccac actttaatgt gccactctgc ggagagtgca gtctgcgata gtgccccagg 300

tggactgggt taacaaaggc aaaacattac tggccgaagc cgcttggaat aaggccggtg 360

tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 420

gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 480

aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 540

aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 600

ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 660

cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 720

ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 780

cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc taggcccccc gaaccacggg 840

gacgtggttt tcctttgaaa aacacgatga taat 874

<210> 73

<211> 878

<212> DNA

<213> 人工序列

<220>

<223> MB14-luc2的5'-UTR

<400> 73

gggaagctta agcttcccaa aaaagggagg acgatgcgga cgtgcagacg actcgcccga 60

aaaaaatcta gagcatgcaa aaaagtcagg ccagattaat gctgccaccg gaagttgagt 120

agacggtgct gcctgcggct caaccccagg aggactgggt gaccaaagct gcgaggtgat 180

ccacgtaagc cctcagaacc gtctcggaag gaggacccca cgtgctttag cctcaaagcc 240

cagtgtcaga ccacacttta atgtgccact ctgcggagag tgcagtctgc gatagtgccc 300

caggtggact gggttaacaa aggcaaaaca ttactggccg aagccgcttg gaataaggcc 360

ggtgtgcgtt tgtctatatg ttattttcca ccatattgcc gtcttttggc aatgtgaggg 420

cccggaaacc tggccctgtc ttcttgacga gcattcctag gggtctttcc cctctcgcca 480

aaggaatgca aggtctgttg aatgtcgtga aggaagcagt tcctctggaa gcttcttgaa 540

gacaaacaac gtctgtagcg accctttgca ggcagcggaa ccccccacct ggcgacaggt 600

gcctctgcgg ccaaaagcca cgtgtataag atacacctgc aaaggcggca caaccccagt 660

gccacgttgt gagttggata gttgtggaaa gagtcaaatg gctctcctca agcgtattca 720

acaaggggct gaaggatgcc cagaaggtac cccattgtat gggatctgat ctggggcctc 780

ggtgcacatg ctttacatgt gtttagtcga ggttaaaaaa cgtctaggcc ccccgaacca 840

cggggacgtg gttttccttt gaaaaacacg atgataat 878

<210> 74

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> 加帽MB15-luc2的5'-UTR

<400> 74

gggaagctta agtgttcttt ttgcagaagc tcagaattgg tgaggtatat tggcgccttc 60

gtggaatgtc agtgcctcac cagcatgcaa acgctcaact ttggcagatc tacc 114

<210> 75

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> M12-H6

<400> 75

Arg Arg Gln Pro Pro Arg Ser Ile Ser Ser His Pro Gly Gly Gly Gly

1 5 10 15

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

20 25 30

Gly Gly His His His His His His

35 40

<210> 76

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> CPP1-H6

<400> 76

Pro Gln Arg Asp Thr Val Gly Gly Arg Thr Thr Pro Pro Ser Trp Gly

1 5 10 15

Pro Ala Lys Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly His His His His His His

35 40

<210> 77

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> CPP2-H6

<400> 77

Gly Pro Phe His Phe Tyr Gln Phe Leu Phe Pro Pro Val Gly Gly Gly

1 5 10 15

Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly

20 25 30

Ser Gly His His His His His His

35 40

<210> 78

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> CPP3-H6

<400> 78

Gly Ser Pro Trp Gly Leu Gln His His Pro Pro Arg Thr Gly Gly Gly

1 5 10 15

Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly

20 25 30

Ser Gly His His His His His His

35 40

<210> 79

<211> 462

<212> RNA

<213> 人鼻病毒2

<400> 79

auggugacaa ggcccaucau cacaacagcc ggcccuuccg auauguacgu gcacgugggc 60

aaccugaucu acaggaaccu gcaccuguuc aacagcgaga ugcacgagag cauccuggug 120

agcuacagca gcgaucugau caucuacaga accaacacag ugggcgacga uuacaucccc 180

agcugugacu gcacacaggc caccuacuac ugcaagcaca agaacagaua cuucccuauc 240

acagugacaa gccacgauug guacgagauc caggagagcg aguacuaccc uaagcacauc 300

caguacaacc ugcugaucgg cgagggcccu ugcgagcccg gagacugugg cggaaagcug 360

cuguguaagc acggcgugau cggcaucgug accgccggcg gagauaacca cguggccuuc 420

aucgaccuga ggcacuucca cugcgccgag gagcaguaau aa 462

<210> 80

<211> 1390

<212> RNA

<213> 人工序列

<220>

<223> MB8-2Apro mRNA

<400> 80

gggaagcuua agcuucccaa aaaagucagg ccagauuaau gcugccaccg gaaguugagu 60

agacggugcu gccugcggcu caaccccagg aggacugggu gaccaaagcu gcgaggugau 120

ccacguaagc ccucagaacc gucucggaag gaggacccca cgugcuuuag ccucaaagcc 180

cagugucaga ccacacuuua augugccacu cugcggagag ugcagucugc gauagugccc 240

cagguggacu ggguuaacaa aggcaaaaca uuacuggccg aagccgcuug gaauaaggcc 300

ggugugcguu ugucuauaug uuauuuucca ccauauugcc gucuuuuggc aaugugaggg 360

cccggaaacc uggcccuguc uucuugacga gcauuccuag gggucuuucc ccucucgcca 420

aaggaaugca aggucuguug aaugucguga aggaagcagu uccucuggaa gcuucuugaa 480

gacaaacaac gucuguagcg acccuuugca ggcagcggaa ccccccaccu ggcgacaggu 540

gccucugcgg ccaaaagcca cguguauaag auacaccugc aaaggcggca caaccccagu 600

gccacguugu gaguuggaua guuguggaaa gagucaaaug gcucuccuca agcguauuca 660

acaaggggcu gaaggaugcc cagaagguac cccauuguau gggaucugau cuggggccuc 720

ggugcacaug cuuuacaugu guuuagucga gguuaaaaaa cgucuaggcc ccccgaacca 780

cggggacgug guuuuccuuu gaaaaacacg augauaauau ggugacaagg cccaucauca 840

caacagccgg cccuuccgau auguacgugc acgugggcaa ccugaucuac aggaaccugc 900

accuguucaa cagcgagaug cacgagagca uccuggugag cuacagcagc gaucugauca 960

ucuacagaac caacacagug ggcgacgauu acauccccag cugugacugc acacaggcca 1020

ccuacuacug caagcacaag aacagauacu ucccuaucac agugacaagc cacgauuggu 1080

acgagaucca ggagagcgag uacuacccua agcacaucca guacaaccug cugaucggcg 1140

agggcccuug cgagcccgga gacuguggcg gaaagcugcu guguaagcac ggcgugaucg 1200

gcaucgugac cgccggcgga gauaaccacg uggccuucau cgaccugagg cacuuccacu 1260

gcgccgagga gcaguaauaa uucuagaaug uccgaauggu ugacacuuga ucucggcaac 1320

gcauaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380

aaaaaaaaau 1390

<210> 81

<211> 143

<212> PRT

<213> 人鼻病毒2

<400> 81

Met Gly Pro Ser Asp Met Tyr Val His Val Gly Asn Leu Ile Tyr Arg

1 5 10 15

Asn Leu His Leu Phe Asn Ser Glu Met His Glu Ser Ile Leu Val Ser

20 25 30

Tyr Ser Ser Asp Leu Ile Ile Tyr Arg Thr Asn Thr Val Gly Asp Asp

35 40 45

Tyr Ile Pro Ser Cys Asp Cys Thr Gln Ala Thr Tyr Tyr Cys Lys His

50 55 60

Lys Asn Arg Tyr Phe Pro Ile Thr Val Thr Ser His Asp Trp Tyr Glu

65 70 75 80

Ile Gln Glu Ser Glu Tyr Tyr Pro Lys His Ile Gln Tyr Asn Leu Leu

85 90 95

Ile Gly Glu Gly Pro Cys Glu Pro Gly Asp Cys Gly Gly Lys Leu Leu

100 105 110

Cys Lys His Gly Val Ile Gly Ile Val Thr Ala Gly Gly Asp Asn His

115 120 125

Val Ala Phe Ile Asp Leu Arg His Phe His Cys Ala Glu Glu Gln

130 135 140

<210> 82

<211> 547

<212> RNA

<213> 脑心肌炎病毒

<400> 82

uacuggccga agccgcuugg aauaaggccg gugugcguuu gucuauaugu uauuuuccac 60

cauauugccg ucuuuuggca augugagggc ccggaaaccu ggcccugucu ucuugacgag 120

cauuccuagg ggucuuuccc cucucgccaa aggaaugcaa ggucuguuga augucgugaa 180

ggaagcaguu ccucuggaag cuucuugaag acaaacaacg ucuguagcga cccuuugcag 240

gcagcggaac cccccaccug gcgacaggug ccucugcggc caaaagccac guguauaaga 300

uacaccugca aaggcggcac aaccccagug ccacguugug aguuggauag uuguggaaag 360

agucaaaugg cucuccucaa gcguauucaa caaggggcug aaggaugccc agaagguacc 420

ccauuguaug ggaucugauc uggggccucg gugcacaugc uuuacaugug uuuagucgag 480

guuaaaaaac gucuaggccc cccgaaccac ggggacgugg uuuuccuuug aaaaacacga 540

ugauaau 547

<210> 83

<211> 885

<212> RNA

<213> 人工序列

<220>

<223> MB17-luc2 RNA的5'UTR

<400> 83

gggaagcuua agcuucccac aaaaaaucgg uauauuggcg ccuucgugga augucagugc 60

cucaacaucu agagcaugcc uucccaaaaa agucaggcca gauuaaugcu gccaccggaa 120

guugaguaga cggugcugcc ugcggcucaa ccccaggagg acugggugac caaagcugcg 180

aggugaucca cguaagcccu cagaaccguc ucggaaggag gaccccacgu gcuuuagccu 240

caaagcccag ugucagacca cacuuuaaug ugccacucug cggagagugc agucugcgau 300

agugccccag guggacuggg uuaacaaagg caaaacauua cuggccgaag ccgcuuggaa 360

uaaggccggu gugcguuugu cuauauguua uuuuccacca uauugccguc uuuuggcaau 420

gugagggccc ggaaaccugg cccugucuuc uugacgagca uuccuagggg ucuuuccccu 480

cucgccaaag gaaugcaagg ucuguugaau gucgugaagg aagcaguucc ucuggaagcu 540

ucuugaagac aaacaacguc uguagcgacc cuuugcaggc agcggaaccc cccaccuggc 600

gacaggugcc ucugcggcca aaagccacgu guauaagaua caccugcaaa ggcggcacaa 660

ccccagugcc acguugugag uuggauaguu guggaaagag ucaaauggcu cuccucaagc 720

guauucaaca aggggcugaa ggaugcccag aagguacccc auuguauggg aucugaucug 780

gggccucggu gcacaugcuu uacauguguu uagucgaggu uaaaaaacgu cuaggccccc 840

cgaaccacgg ggacgugguu uuccuuugaa aaacacgaug auaau 885

<210> 84

<211> 873

<212> RNA

<213> 人工序列

<220>

<223> MB18-luc2 RNA的5'UTR

<400> 84

gggaagcuua agcuucccaa aaaagucagg ccagauuaau gcugccaccg gaaguugagu 60

agacggugcu gccugcggcu caaccccagg aggacugggu gaccaaagcu gcgaggugau 120

ccacguaagc ccucagaacc gucucggaag gaggacccca cgugcuuuag ccucaaagcc 180

cagugucaga ccacacuuua augugccacu cugcggagag ugcagucugc gauagugccc 240

cagguggacu ggguuaacaa aggcaaaaca uggugaggua uauuggcgcc uucguggaau 300

gucagugccu caccuaagca ugccguuacu ggccgaagcc gcuuggaaua aggccggugu 360

gcguuugucu auauguuauu uuccaccaua uugccgucuu uuggcaaugu gagggcccgg 420

aaaccuggcc cugucuucuu gacgagcauu ccuagggguc uuuccccucu cgccaaagga 480

augcaagguc uguugaaugu cgugaaggaa gcaguuccuc uggaagcuuc uugaagacaa 540

acaacgucug uagcgacccu uugcaggcag cggaaccccc caccuggcga caggugccuc 600

ugcggccaaa agccacgugu auaagauaca ccugcaaagg cggcacaacc ccagugccac 660

guugugaguu ggauaguugu ggaaagaguc aaauggcucu ccucaagcgu auucaacaag 720

gggcugaagg augcccagaa gguaccccau uguaugggau cugaucuggg gccucggugc 780

acaugcuuua cauguguuua gucgagguua aaaaacgucu aggccccccg aaccacgggg 840

acgugguuuu ccuuugaaaa acacgaugau aau 873

<210> 85

<211> 885

<212> DNA

<213> 人工序列

<220>

<223> MB17-luc2的5'UTR

<400> 85

gggaagctta agcttcccac aaaaaatcgg tatattggcg ccttcgtgga atgtcagtgc 60

ctcaacatct agagcatgcc ttcccaaaaa agtcaggcca gattaatgct gccaccggaa 120

gttgagtaga cggtgctgcc tgcggctcaa ccccaggagg actgggtgac caaagctgcg 180

aggtgatcca cgtaagccct cagaaccgtc tcggaaggag gaccccacgt gctttagcct 240

caaagcccag tgtcagacca cactttaatg tgccactctg cggagagtgc agtctgcgat 300

agtgccccag gtggactggg ttaacaaagg caaaacatta ctggccgaag ccgcttggaa 360

taaggccggt gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat 420

gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct 480

ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct 540

tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc 600

gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa 660

ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc 720

gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg 780

gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaacgt ctaggccccc 840

cgaaccacgg ggacgtggtt ttcctttgaa aaacacgatg ataat 885

<210> 86

<211> 873

<212> DNA

<213> 人工序列

<220>

<223> MB18-luc2的5'UTR

<400> 86

gggaagctta agcttcccaa aaaagtcagg ccagattaat gctgccaccg gaagttgagt 60

agacggtgct gcctgcggct caaccccagg aggactgggt gaccaaagct gcgaggtgat 120

ccacgtaagc cctcagaacc gtctcggaag gaggacccca cgtgctttag cctcaaagcc 180

cagtgtcaga ccacacttta atgtgccact ctgcggagag tgcagtctgc gatagtgccc 240

caggtggact gggttaacaa aggcaaaaca tggtgaggta tattggcgcc ttcgtggaat 300

gtcagtgcct cacctaagca tgccgttact ggccgaagcc gcttggaata aggccggtgt 360

gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg 420

aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga 480

atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa 540

acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc 600

tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac 660

gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag 720

gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc 780

acatgcttta catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg 840

acgtggtttt cctttgaaaa acacgatgat aat 873

<210> 87

<211> 18

<212> RNA

<213> 人工序列

<220>

<223> 5'-SL

<400> 87

gggaagcuua agcuuccc 18

<210> 88

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> pepMB1

<400> 88

crrrrrrrrc 10

<210> 89

<211> 23

<212> RNA

<213> 人工序列

<220>

<223> 共有序列,其中在位置9的“N”对应于任何序列的7至19个核苷酸,以及

在位置14的“N”对应于任何序列的12至19个核苷酸

<220>

<221> misc_feature

<222> (9)..(9)

<223> n 是 a, c, g,或 u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n 是 a, c, g, 或 u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n 是 a, c, g, 或 u

<400> 89

gucagrycng ccanugcnry cug 23

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号