首页> 中国专利> 新颖腺相关病毒(AAV)载体、具有降低的衣壳脱酰胺化的AAV载体及其用途

新颖腺相关病毒(AAV)载体、具有降低的衣壳脱酰胺化的AAV载体及其用途

摘要

一种重组腺相关病毒(rAAV)载体,其包括AAV衣壳,所述AAV衣壳具有vp1蛋白的异质群体、vp2蛋白的异质群体以及vp3蛋白的异质群体。与经过编码的VP1氨基酸序列相比,所述衣壳含有经过修饰的氨基酸,所述衣壳含有处于天冬酰胺‑甘氨酸对处的高度脱酰胺化的天冬酰胺残基,并且进一步包括多个其它较小程度脱酰胺化的天冬酰胺残基以及任选地谷氨酰胺残基。

著录项

  • 公开/公告号CN112236443A

    专利类型发明专利

  • 公开/公告日2021-01-15

    原文格式PDF

  • 申请/专利权人 宾夕法尼亚州大学信托人;

    申请/专利号CN201980029022.1

  • 申请日2019-02-27

  • 分类号C07K14/005(20060101);C12N15/864(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人罗文锋;李志强

  • 地址 美国宾夕法尼亚州

  • 入库时间 2023-06-19 09:33:52

说明书

本发明是在国立卫生研究院授予的P01HL059407下由政府支持进行的。政府享有本发明的一定权利。

创建于2019年2月27日并通过EFS-Web以电子方式提交的命名为“18-8592PCT_Sequence_Listing_ST25”的序列表的文本文件的内容在此与本申请通过引用整体并入本文中。

背景技术

腺相关病毒(AAV)衣壳的结构为二十面体,并且包含比率为1:1:10的60个病毒蛋白(VP)单体(VP1、VP2和VP3)(Xie Q等人,《美国国家科学院院刊(Proc Natl Acad SciUSA)》2002;99(16):10405-10)。VP1和VP2两者的C端内均含有整个VP3蛋白序列(约535aa),并且共享的VP3序列主要负责总体衣壳结构。由于VP1/VP2独特区的结构柔性以及组装衣壳中VP1和VP2单体相对于VP3单体的低呈现,因此VP3是可通过x射线晶体学分辨的唯一衣壳蛋白(Nam HJ等人,《病毒学杂志(J Virol)》2007;81(22):12260-71)。VP3含有作为AAV血清型之间序列变异的主要来源的九个高变区(HVR)(Govindasamy L等人,《病毒学杂志》2013;87(20):11187-99)。考虑到其在衣壳表面上的柔性和位置,HVR主要负责与靶细胞以及免疫系统相互作用(Huang LY等人,《病毒学杂志》2016;90(11):5219-30;Raupp C等人,《病毒学杂志》2012;86(17):9396-408)。虽然公开了分别用于AAV2、AAVrh.8、AAV6、AAV9、AAV3B、AAV8和AAV4的结构条目的多种血清型的结构(来自结构生物信息学研究合作实验室(RCSB)数据库的蛋白质数据库(PDB)ID 1LP3、4RSO,4V86、3UX1、3KIC、2QA0、2G8G),但文献中关于这些衣壳的表面上的修饰的信息很少。研究表明衣壳的细胞内磷酸化在特定酪氨酸残基处发生(Zhong L等人,《病毒学(Virology)》2008;381(2):194-202)。尽管初级VP3序列中存在推定的糖基化位点,但尚未在AAV2中鉴定出糖基化事件(Murray S等人,《病毒学杂志》2006;80(12):6171-6;Jin X等人,《人类基因疗法方法(Hum Gene Ther Methods)》2017;28(5):255-267);其它AAV血清型尚未针对衣壳糖基化进行评估。

AAV基因疗法载体经历较少的分子水平审查,所述分子水平审查通常伴随重组蛋白治疗剂的开发和制造。AAV衣壳转译后修饰(PTM)很大程度上尚未被开发,因此,对关于其影响功能的潜力或关于控制制造的AAV疗法中PTM水平的策略知之甚少。

非基因疗法蛋白治疗剂的转译后修饰的变化使得其开发作为药物变得复杂。Jenkins,N、Murphy,L和Tyther,R(2008),“重组蛋白的转译后修饰:对于生物制药的意义(Post-translational modifications of recombinant proteins:significance forbiopharmaceuticals)”《分子生物技术(Mol Biotechnol)》39:113-118;Houde,D、Peng,Y、Berkowitz,SA和Engen,JR(2010),“转译后修饰差异地影响IgG1构象和受体结合(Post-translational modifications differentially affect IgG1 conformation andreceptor binding)”《分子细胞蛋白质组学(Mol Cell Proteomics)》9:1716-1728。例如,所选氨基酸的脱酰胺化调节了基于重组保护性抗原的炭疽疫苗的稳定性和免疫应答。(Powell BS等人,《蛋白质(Proteins)》2007;68(2):458-79;Verma A等人,《临床与疫苗免疫学(Clin Vaccine Immunol)》2016;23(5):396-402)。在一些情况下,此过程通过病毒或细菌脱酰胺酶进行催化,以调节宿主细胞信号传导途径或先天免疫应答(Zhao J等人,《病毒学杂志》2016;90(9):4262-8;Zhao J等人,《细胞宿主微生物(Cell Host Microbe)》2016;20(6):770-84)。更常见的是,内源性脱酰胺化是一种不依赖酶的自发过程。尽管尚未完全阐明自发脱酰胺化的目的,但先前的研究已经表明此事件用作分子时钟以指示蛋白质的相对年龄并调节其转换(Robinson NE和Robinson AB,《美国国家科学院院刊》2001;98(3):944-9)。

脱酰胺化在天冬酰胺或更不常见的谷氨酰胺的酰胺基经历来自相邻氮原子的亲核攻击并且酰胺基丢失时发生。此过程产生琥珀酰亚胺基中间体(Yang H和Zubarev RA,《电泳(Electrophoresis)》2010;31(11):1764-72),所述琥珀酰亚胺基中间体通过水解分解为天冬氨酸和异天冬氨酸(或谷氨酸和异谷氨酸)的混合物(Catak S等人,《物理化学杂志A(J Phys Chem A)》2009;113(6):1111-20)。短合成肽的研究估计,这种水解会产生比例为3:1的异天冬氨酸与天冬氨酸混合物(Geiger T.和Clarke S,《生物化学杂志(J BiolChem)》1987;262(2):785-94。

仍然需要包括基于AAV的构建体的组合物以递送具有稳定的受体结合和/或稳定的衣壳的异源分子,从而避免中和抗体和/或在储存时保持纯度。

发明内容

在一个实施例中,提供了一种组合物,其包括重组腺相关病毒(rAAV)的混合群体,所述rAAV中的每个rAAV包括:(a)AAV衣壳,所述AAV衣壳包括约60个衣壳vp1蛋白、vp2蛋白和vp3蛋白,其中所述vp1蛋白、所述vp2蛋白和所述vp3蛋白为:vp1蛋白的异质群体,所述vp1蛋白由对所选AAV vp1氨基酸序列进行编码的核酸序列产生;vp2蛋白的异质群体,所述vp2蛋白由对所选AAV vp2氨基酸序列进行编码的核酸序列产生;vp3蛋白的异质群体,所述vp3蛋白由对所选AAV vp3氨基酸序列进行编码的核酸序列产生,其中所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括所述AAV衣壳中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(b)所述AAV衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和对产物进行编码的非AAV核酸序列,所述非AAV核酸序列可操作地连接到引导所述产物在宿主细胞中的表达的序列。

在某些实施例中,所述脱酰胺化的天冬酰胺被脱酰胺化为天冬氨酸、异天冬氨酸、相互转化的天冬氨酸/异天冬氨酸对或其组合。在某些实施例中,所述衣壳进一步包括一种或多种脱酰胺化的谷氨酰胺,所述一种或多种脱酰胺化的谷氨酰胺被脱酰胺化为(α)-谷氨酸、γ-谷氨酸、相互转化的(α)-谷氨酸/γ-谷氨酸对或其组合。

在另外的方面,提供了一种重组腺相关病毒(rAAV),所述rAAV包括:(A)AAVrh79衣壳,所述AAVrh79衣壳包括以下中的一种或多种:(1)AAVrh79衣壳蛋白,所述AAVrh79衣壳蛋白包括:AAVrh79 vp1蛋白的异质群体,所述AAVrh79 vp1蛋白选自以下:通过从对SEQ IDNO:2的1到738的预测的氨基酸序列进行编码的核酸序列的表达产生的vp1蛋白、从SEQ IDNO:1产生的vp1蛋白或从与SEQ ID NO:1至少70%相同的对SEQ ID NO:2的1到738的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白;AAVrh79vp2蛋白的异质群体,所述AAVrh79 vp2蛋白选自以下:通过从对SEQ ID NO:2的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列的表达产生的vp2蛋白、从包括SEQ ID NO:1的至少核苷酸412到2214的序列产生的vp2蛋白或从与SEQ ID NO:1的至少核苷酸412到2214至少70%相同的对SEQ ID NO:2的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白;AAVrh79 vp3蛋白的异质群体,所述AAVrh79 vp3蛋白选自以下:通过从对SEQ IDNO:2的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列的表达产生的vp3蛋白、从包括SEQ ID NO:1的至少核苷酸610到2214的序列产生的vp3蛋白或从与SEQ IDNO:1的至少核苷酸610到2214至少70%相同的对SEQ ID NO:2的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白;和/或(2)vp1蛋白的异质群体,所述vp1蛋白作为对SEQ ID NO:2的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ ID NO:2的至少约氨基酸138到738的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:2的至少氨基酸204到738进行编码的核酸序列的产物,其中:所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)所述AAVrh79衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和对产物进行编码的非AAV核酸序列,所述非AAV核酸序列可操作地连接到引导所述产物在宿主细胞中的表达的序列。

另一方面,提供了一种转导靶组织的方法。在一个实施例中,所述方法包含施用具有如本文所描述的AAVrh79衣壳的AAV。在一个实施例中,提供了一种转导肝脏组织的方法,所述方法包括施用具有AAVrh79衣壳的AAV。在另一个实施例中,提供了一种转导肌肉组织的方法,所述方法包括施用具有AAVrh79衣壳的AAV。

在又另一方面,提供了一种降低AAVrh79衣壳的脱酰胺化的方法。在一个实施例中,所述方法包含由含有经过修饰的AAVrh79 VP密码子的核酸序列产生AAVrh79衣壳,所述核酸序列包括定位在SEQ ID NO:2中的位置N57、N263、N385和/或N514处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子,使得经过修饰的密码子对除甘氨酸之外的氨基酸进行编码。在另一个实施例中,所述方法包含由含有经过修饰的AAVrh79 vp密码子的核酸序列产生AAVrh79衣壳,所述核酸序列包括定位在SEQID NO:2的位置N94、N254、N305、N410和/或N479处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子。

在另外的实施例中,提供了一种rAAV8.AR2.08,其包括:(A)AAV8.AR2.08衣壳,所述AAV8.AR2.08衣壳包括以下中的一种或多种:(1)AAV8.2.08衣壳蛋白,所述AAV8.2.08衣壳蛋白包括:AAV8.AR2.08 vp1蛋白的异质群体,所述AAV8.AR2.08 vp1蛋白选自以下:通过从对SEQ ID NO:18的1到738的预测的氨基酸序列进行编码的核酸序列的表达产生的vp1蛋白、从SEQ ID NO:17产生的vp1蛋白或从与SEQ ID NO:17至少70%相同的对SEQ ID NO:18的1到738的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白;AAV8.AR2.08 vp2蛋白的异质群体,所述AAV8.AR2.08 vp2蛋白选自以下:通过从对SEQ ID NO:18的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV8.AR2.08 vp2蛋白、从包括SEQ ID NO:17的至少核苷酸412到2214的序列产生的vp2蛋白或从与SEQ ID NO:17的至少核苷酸411到2214至少70%相同的对SEQ ID NO:18的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白;AAV8.AR2.08 vp3蛋白的异质群体,所述AAV8.AR2.08vp3蛋白选自以下:通过从对SEQ ID NO:18的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列的表达产生的vp3蛋白、从包括SEQ ID NO:17的至少核苷酸607到2214的序列产生的vp3蛋白或从与SEQ ID NO:17的至少核苷酸607到2214至少70%相同的对SEQ ID NO:18的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白;和/或(2)vp1蛋白的异质群体,所述vp1蛋白作为对SEQ ID NO:18的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ IDNO:18的至少约氨基酸138到738的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:18的至少氨基酸204到738进行编码的核酸序列的产物,其中:所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:18中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)所述AAV8.AR2.08衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和对产物进行编码的非AAV核酸序列,所述非AAV核酸序列可操作地连接到引导所述产物在宿主细胞中的表达的序列。

另一方面,提供了一种转导靶组织的方法。在一个实施例中,所述方法包含施用具有如本文所描述的AAV8.AR2.08衣壳的AAV。在一个实施例中,提供了一种转导肝脏组织的方法,所述方法包括施用具有AAV8.AR2.08衣壳的AAV。在另一个实施例中,提供了一种转导肌肉组织的方法,所述方法包括施用具有AAV8.AR2.08衣壳的AAV。

在又另一方面,提供了一种降低AAV8.AR2.08衣壳的脱酰胺化的方法。在一个实施例中,所述方法包含由含有经过修饰的AAV8.AR2.08 vp密码子的核酸序列产生AAV8.AR2.08衣壳,所述核酸序列包括定位在SEQ ID NO:18中的位置N57、N263、N385、N514和/或N540处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子,使得经过修饰的密码子对除甘氨酸之外的氨基酸进行编码。在另一个实施例中,所述方法包含由含有经过修饰的AAV8.AR2.08 vp密码子的核酸序列产生AAV8.AR2.08衣壳,所述核酸序列包括定位在SEQ ID NO:18的位置N94、N254、N305、N521、N590、Q601、N653和/或N665处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子。

在某些实施例中,提供了一种rAAV5.5.9,其包括:(A)AAV5.5.9衣壳,所述AAV5.5.9衣壳包括以下中的一种或多种:(1)AAVG5衣壳蛋白,所述AAVG5衣壳蛋白包括:AAV5.5.9vp1蛋白的异质群体,所述AAV5.5.9vp1蛋白选自以下:通过从对SEQ ID NO:10的1到736的预测的氨基酸序列进行编码的核酸序列的表达产生的vp1蛋白、从SEQ ID NO:9产生的vp1蛋白或从与SEQ ID NO:9至少70%相同的对SEQ ID NO:1的1到736的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白;AAV5.5.9vp2蛋白的异质群体,所述AAV5.5.9vp2蛋白选自以下:通过从对SEQ ID NO:10的至少约氨基酸138到736的预测的氨基酸序列进行编码的核酸序列的表达产生的AAVG5 vp2蛋白、从包括SEQ ID NO:9的至少核苷酸412到2211的序列产生的vp2蛋白或从与SEQ ID NO:9的至少核苷酸412到2211至少70%相同的对SEQ ID NO:10的至少约氨基酸138到736的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白;AAV5.5.9vp3蛋白的异质群体,所述AAV5.5.9vp3蛋白选自以下:通过从对SEQ IDNO:10的至少约氨基酸203到736的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV5.5.9vp3蛋白、从包括SEQ ID NO:9的至少核苷酸607到2211的序列产生的vp3蛋白或从与SEQ ID NO:9的至少核苷酸607到2211至少70%相同的对SEQ ID NO:10的至少约氨基酸203到736的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白;和/或(2)vp1蛋白的异质群体,所述vp1蛋白作为对SEQ ID NO:10的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ ID NO:10的至少约氨基酸138到736的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:10的至少氨基酸203到726进行编码的核酸序列的产物,其中:所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:10中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)所述AAV5.5.9衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和对产物进行编码的非AAV核酸序列,所述非AAV核酸序列可操作地连接到引导所述产物在宿主细胞中的表达的序列。

另一方面,提供了一种转导靶组织的方法。在一个实施例中,所述方法包含施用具有如本文所描述的AAV5.5.9衣壳的AAV。在一个实施例中,提供了一种转导肝脏组织的方法,所述方法包括施用具有AAV5.5.9衣壳的AAV。在另一个实施例中,提供了一种转导肌肉组织的方法,所述方法包括施用具有AAV5.5.9衣壳的AAV。

在又另一方面,提供了一种降低AAV5.5.9衣壳的脱酰胺化的方法。在一个实施例中,所述方法包含由含有经过修饰的AAV5.5.9vp密码子的核酸序列产生AAV5.5.9衣壳,所述核酸序列包括定位在SEQ ID NO:10中的位置N57、N319、N442和/或N502处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子,使得经过修饰的密码子对除甘氨酸之外的氨基酸进行编码。在另一个实施例中,所述方法包含由含有经过修饰的AAV5.5.9vp密码子的核酸序列产生AAV5.5.9衣壳,所述核酸序列包括定位在SEQ ID NO:10的位置N35、N113、N204、N217、N243、N249、N293/294、N304、N399/400、N505、Q589、N618、N641、N653、N658和/或N699处的天冬酰胺-甘氨酸对中的一到四个天冬酰胺-甘氨酸对处的独立地经过修饰的甘氨酸密码子。

另一方面,提供了一种组合物,所述组合物包括如本文所描述的重组AAVrh79、AAV8.AR2.08或AAV5.5.9的混合群体。

在又另一方面,提供了如本文所描述的重组AAV(rAAV),所述rAAV用于将所期望的基因产物递送到有需要的受试者。

另一方面,提供了一种可用于产生如本文所描述的rAAV的rAAV产生系统。在一个实施例中,所述系统包含:(a)AAVrh79、AAV8.AR2.08或AAV5.5.9衣壳核酸序列,所述衣壳核酸序列对SEQ ID NO:2、10或18的预测的氨基酸序列进行编码;(b)适合于包装到所述AAV衣壳中的核酸分子,所述核酸分子包括至少一个AAV反向末端重复序列(ITR)和对基因产物进行编码的非AAV核酸序列,所述非AAV核酸序列可操作地连接到引导所述产物在宿主细胞中的表达的序列;以及(c)足以允许将所述核酸分子包装到重组AAV衣壳中的AAV rep功能和辅助功能。

通过以下对本发明的详细描述,本发明的这些和其它方面将变得显而易见。

附图说明

图1A-图1G:AAV8 VP同种型的电泳分析。(图1A)图展示了天冬酰胺残基通过相邻氮原子经历亲核攻击从而形成琥珀酰亚胺基中间体的机制。然后此中间体经历水解,从而分解为天冬氨酸和异天冬氨酸的混合物。如此标记β碳。图是在BIOVIA Draw2018中产生的。(图1B)在变性的一维SDS-PAGE上运行1μg的AAV8载体。(图1C)示出了碳酸酐酶pI标志物点的等电点。(图1D)通过二维凝胶电泳分析5μg的AAV8载体,并用考马斯蓝对其进行染色。点1-20是氨基甲酰化的碳酸酐酶pI标志物。加框区如下:a=VP1,b=VP2,c=VP3,d=内部原肌球蛋白标志物(箭头:原肌球蛋白点的MW=33kDa,pI=5.2)。在4-8的pI范围内进行等电聚焦。(图1E-图1G)在4-8的pI范围内进行的等电聚焦的结果。通过2D凝胶电泳分析1e11 GC的wtAAV8载体(图1E)或突变载体(图1F和图1G),并用Sypro Ruby对其进行染色。蛋白质标记:A=VP1;B=VP2;C=VP3,D=鸡蛋清伴清蛋白标记物,E=turbouclease标记物。在6-10的pI范围内进行等电聚焦。初级VP1/2/3同种型点被圈出,并且标志物的主要点的迁移距离由竖直线指示(turbonuclease=虚线,伴清蛋白=实线)。

图2A-图2E:AAV8衣壳蛋白中的天冬酰胺和谷氨酰胺脱酰胺化的分析。(图2A-图2B)示出了电喷雾电离(ESI)质谱以及含有Asn-94(图2A)和Asp-94(图2B)的3+肽(93-103)的理论和观察到的质量。(图2C-图2D)示出了ESI质谱以及含有Asn-254(图2C)和Asp-254(图2D)的3+肽(247-259)的理论和观察到的质量。Asn-94和Asn-254的观察到的质量偏移分别为0.982Da和0.986Da,而理论质量偏移为0.984Da。(图2E)示出了通过不同方法纯化的AAV8胰蛋白酶肽在所关注的特定天冬酰胺残基和谷氨酰胺残基处的脱酰胺化百分比。用交叉阴影线标记指示具有N+1个甘氨酸的天冬酰胺残基处的脱酰胺化的条。包含在所分析的至少一种制剂中确定为至少2%脱酰胺化的残基。数据表示为平均值±标准偏差。

图3A-图3E:AAV8 VP3单体的结构建模和脱酰胺化的位点的分析。(图3A)以卷曲表示形式示出了AAV8 VP3单体(PDB标识符:3RA8)。带的颜色指示相对柔性程度(蓝色=最高刚性/正常温度系数,红色=最高柔性/高温系数)。球体指示所关注的残基。展开图是所关注残基及其周围残基的球状和棒状表示,以展示局部蛋白质结构(蓝色=氮,红色=氧)。带下划线的残基是NG基序中的残基。图3B-图3E:示出了具有N+1个甘氨酸的脱酰胺化的天冬酰胺的异天冬氨酸模型。与(图3C)N263、(图3D)N514和(图3E)N540的异天冬氨酸模型相比,用(图3B)N410的天冬酰胺模型从AAV8晶体结构(PDB ID:3RA8)的精修产生2FoFc电子密度图(1σ水平)。电子密度图以洋红色网格示出。如此标记β碳。箭头指示与所关注的残基的R基团对应的电子密度。

图4A-图4D:影响AAV8衣壳脱酰胺化的因素的确定。将AAV8制剂(图4A)在70℃下温育三天或七天,(图4B)暴露于pH 2或pH 10持续七天,或使用D

图5A-图5B:非AAV蛋白中的脱酰胺化频率。为了与AAV脱酰胺化百分比进行比较,示出了两种含有可能被脱酰胺化的NG基序的非AAV重组蛋白(人碳酸酐酶(图5A)和大鼠苯丙氨酸-羟化酶(图5B))的脱酰胺化百分比。

图6:使用来自两个机构的数据分析流水线计算的AAV8脱酰胺化百分比的比较。示出了在两个不同机构处评估的AAV8胰蛋白酶肽在所关注的特定天冬酰胺残基和谷氨酰胺残基处的脱酰胺化百分比。

图7A-图7C展示了在批次之间具有高变异性的非NG位点处的功能性天冬酰胺取代。(图7A)通过在293个细胞中的小规模三重转染产生wtAAV8载体和突变载体的效价,如通过定量PCR(qPCR)测量的。报告了相对于wtAAV8对照物的效价。如图8B中所描述的测量转导效率。使效价和转导效率相对于wtAAV8对照物的值归一化。(图7B)示出了接受wtAAV8.CB7.ffluc和N499Q衣壳突变载体的小鼠在注射后第14天的代表性荧光素酶图像。(图7C)在研究期间的第14天,通过荧光素酶成像测量来自用wtAAV8载体或突变载体(n=3或4)静脉内注射的C57BL/6小鼠的荧光素酶表达,并以总通量单位报告。所有数据表示为平均值+标准偏差。

图8A和图8B示出了基因脱酰胺化对载体性能的影响的体外分析结果。(图8A)通过在293个细胞中的小规模三重转染产生wtAAV8载体和基因脱酰胺化突变载体的效价,如通过定量PCR(qPCR)测量的。报告了相对于wtAAV8对照物的效价。用wtAAV8和阴性对照物呈现高脱酰胺化的NG位点(图案化条)、低脱酰胺化的位点(白条)和高度可变的位点(黑条)。(图8B)相对于wtAAV8对照物报告的产生萤火虫荧光素酶的突变AAV8载体的转导效率。转导效率以添加到HUH7细胞中的每个GC产生的发光单位来测量,并通过在多个稀释度下用粗载体进行转导来确定。使转导效率数据相对于wt参考归一化。所有数据表示为平均值±标准偏差。

图9A-图9D展示了随着时间的推移,载体活性丧失与进行性脱酰胺化有关。(图9A)持续三重转染的HEK 293细胞的时程的载体产生(DNAseI抗性基因组拷贝,GC)产生包装荧光素酶报告基因的AAV8载体。使GC水平相对于最大观察值归一化。(图9B)使用经过纯化的时程载体转导Huh7细胞。使用多个稀释度的经过纯化的时程载体样品如图8B中那样测量转导效率(以添加到靶细胞的每个GC的发光单位)。误差条表示对于每个采样时间进行至少10次技术重复的标准偏差。转染后1天、2天和5天收集的载体的AAV8 NG位点(图9C)和非NG位点(图9D)的脱酰胺化。

图10A-图10D展示了稳定天冬酰胺对载体性能的影响。图10A示出了通过在293个细胞中的小规模三重转染产生wtAAV8载体和+1位置突变载体的效价,如通过定量PCR(qPCR)测量的。报告了相对于wtAAV8对照物的效价。图10B示出了相对于wtAAV8对照物报告的产生萤火虫荧光素酶的突变AAV8载体的转导效率。使用粗载体材料如图8B中那样测量转导效率。运行双样品t测试(

图11A-图11C:AAV9衣壳蛋白中的天冬酰胺和谷氨酰胺脱酰胺化的分析。(图11A)通过2D凝胶电泳分析1e11 GC的wtAAV9,并用Sypro Ruby对其进行染色。蛋白质标记:A=VP1;B=VP2;C=VP3,D=鸡蛋清伴清蛋白标记物,E=turbouclease标记物。在6-10的pI范围内进行等电聚焦。(图11B)示出了通过不同方法纯化的AAV9胰蛋白酶肽在所关注的特定天冬酰胺残基和谷氨酰胺残基处的脱酰胺化百分比。用交叉阴影线标记指示具有N+1个甘氨酸的天冬酰胺残基处的脱酰胺化的条。包含在所分析的至少一种制剂中确定为至少2%脱酰胺化的残基。数据表示为平均值±标准偏差。(图11C)在由AAV9晶体结构(PDB ID:3UX1)的未偏置精修产生的2FoFc电子密度图中示出了N512的异天冬氨酸模型。箭头指示与残基N512的R基团对应的电子密度。

图11D-图11F:影响AAV9衣壳脱酰胺化的因素的确定。(图11D)将两种AAV9制剂在70℃下温育三天或七天,或(图11F)暴露于pH 2或pH 10持续七天,以确定对AAV衣壳形成而言不是固有的脱酰胺化的可能来源。数据表示为平均值±标准偏差。(图11F)使用B1抗体(与变性的衣壳反应)如图11D那样处理载体的斑点印迹以评估衣壳结构完整性。

图11G和图11H展示了AAV9的基因脱酰胺化对载体性能的影响的体外分析。(图11G)通过在293个细胞中的小规模三重转染产生wtAAV9载体和基因脱酰胺化突变载体的效价,如通过定量PCR(qPCR)测量的。报告了相对于wtAAV9对照物的效价。用wtAAV8和阴性对照物呈现高脱酰胺化的NG位点(图案化条)、低脱酰胺化的位点(白条)和高度可变的位点(黑条)。(图11H)相对于wtAAV9对照物,报告了产生萤火虫荧光素酶的突变AAV9载体的转导效率。所有数据表示为平均值±标准偏差。

图11I-图11K示出了随着时间的推移的AAV9载体体外效力。(图11I)持续三重转染的HEK 293细胞的时程的载体产生(DNAseI抗性基因组拷贝,GC)产生包装荧光素酶报告基因的AAV9载体。使GC水平相对于最大观察值归一化。(图11J)使用粗时程载体转导Huh7细胞。(图11K)示出了针对粗载体样品和经过纯化的载体样品的转染后1天对比转染后5天收集的载体的转导效率。转导效率表达为荧光素酶活性/GC,相对于第1天的值归一化。

图12A提供了使用用于比对的ClustalΩ1.2.2及其默认参数制备的AAV5.5.9[SEQID NO:10](有时也被称为AAVG5)、AAV9[SEQ ID NO:4]和AAVPHP.B[SEQ ID NO:12]的氨基酸序列的比对。图12B-12E提供了AAV5.5.9[SEQ ID NO:9]、PHP.B[SEQ ID NO:11]、AAV9[SEQ ID NO:3]和AAVhu68[SEQ ID NO:14]的核苷酸序列的比对。

图13A提供了使用用于比对的ClustalΩ1.2.2及其默认参数制备的AAV8三重突变体(AAV8T)[SEQ ID NO:16]、AAV8.AR2.08[SEQ ID NO:18](有时也被称为AAVG3或AR2或AAV.AR2)和AAV8[SEQ ID NO:20]的氨基酸序列的比对。图13B-13D提供了AAV8三重突变体[SEQ ID NO:15]、AAV8.AR2.08[SEQ ID NO:17]、AAV8[SEQ ID NO:19]的核苷酸序列的比对。

图14A提供了使用用于比对的ClustalΩ1.2.2及其默认参数的AAVrh79[SEQ IDNO:2](有时也被称为AAVG2)、AAVrh10[SEQ ID NO:24]和AAVhu37[SEQ ID NO:22]的氨基酸序列的比对。图14B-14D提供了AAVrh79[SEQ ID NO:1]、AAVrh10[SEQ ID NO:22]和AAVhu37[SEQ ID NO:21]的核苷酸序列的比对。

图15A和15B展示了在参考的载体的小规模或大规模制剂中的AAV8三重、AAVhu68、AAV9、AAV9和AAVrh79的产生产率。

图16提供了图15B的大规模制剂的产生纯度。

图17A至17D示出了使用表达萤火虫荧光素酶的载体将3×10

图18A示出了实例5中用于条形码实验的质粒。图18B示出了注射到6只黑色小鼠的每种AAV条形码变体的量。处死动物,采集组织样品,并从这些动物中的每只动物中分离出DNA。图18C中示出了三只动物的总载体分布。图18D中示出了注射的载体混合物的实际频率对比理论频率。

图19A-图20C示出了实例5的条形码生物分布实验的结果。分析单独组织样品的针对基因组和cDNA的样品中的单个条形码频率对比注射混合物中的单个条形码频率。示出了针对肌肉(图19A,19B);心脏(图19C和图19D)和肝脏(图19E和图19F)的结果。图20A-20C中示出了与理论频率相比的倍数变化。

图21和22示出了与AAV8相比,AAV8.AR2.08在小鼠中的生物分布。结果表明,AAV8.AR2.08比AAV8具有更高的肝脏特异性。

图23比较了AAV8对比AAV8.AR2.08对比AAVrh79的与可制造性有关的效价和产率。

图24示出了与AAV8(中条和右条)相比,AAV8.AR2.08在组织中的生物分布(最左边的条)。

图25-28示出了将AAV载体施用于非人灵长类动物后的结果。图25提供了用于研究的载体和动物的细节。图26定量了从接受AAV8、AAVrh79或AAV8.AR2.08载体的动物的肝脏中检测到的GC和GFP的水平。图27总结了HNP肝脏中的GFP表达的水平。图28示出了从施用AAV8、AAVrh79或AAV8.AR2.08载体的HNP的组织中检测到的载体的水平。

图29示出了在各种组织中检测到的AAVrh79载体的生物分布。

具体实施方式

本文提供了一种重组腺相关病毒(rAAV)以及含有其的组合物,在重组AAV的衣壳内存在的三个衣壳蛋白群体VP1、VP2和VP3中的每个衣壳蛋白群体中均具有序列和电荷异质性。本文提供了新颖rAAV以及用于降低脱酰胺化的方法和任选地其它衣壳单体修饰。本文进一步提供了具有减少的修饰的经过修饰的rAAV,所述减少的修饰可用于提供具有保持更大的稳定性、效力和/或纯度的衣壳的rAAV。

“重组AAV”或“rAAV”是含有两个元件的抗DNAse的病毒颗粒、AAV衣壳和至少含有包装在AAV衣壳内的非AAV编码序列的载体基因组。除非另有说明,否则此术语可以与短语“rAAV载体”互换使用。rAAV是“复制缺陷型病毒”或“病毒载体”,因为其缺少任何功能性AAVrep基因或功能性AAV cap基因并且不能产生后代。在某些实施例中,仅AAV序列是AAV反向末端重复序列(ITR),通常定位在载体基因组的5'和3'最末端处,以允许定位在ITR之间的基因和调节序列包装在AAV衣壳内。

如本文所使用的,“载体基因组”是指包装在形成病毒颗粒的rAAV衣壳内部的核酸序列。这种核酸序列含有AAV反向末端重复序列(ITR)。在本文的实例中,载体基因组至少含有从5'到3'的AAV 5'ITR、一个或多个编码序列和AAV 3'ITR。可以选择来自AAV2的ITR、不同于衣壳来源或除全长ITR之外的AAV。在某些实施例中,ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。进一步地,可以使用其它ITR。进一步地,载体基因组含有引导基因产物表达的调节序列。在本文中更详细地讨论载体基因组的合适组分。

rAAV由AAV衣壳和载体基因组构成。AAV衣壳是vp1的异质群体、vp2的异质群体和vp3蛋白的异质群体的组装。如本文所使用的,当用于指vp衣壳蛋白时,术语“异源”或其任何语法变型是指由不相同的元件组成的群体,例如具有含有不同的经过修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白)。

如本文所使用的,与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质群体”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群体。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如,某些亚群体包括天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺化的天冬酰胺(N)位置,并且任选地进一步包括其它脱酰胺化的氨基酸,其中脱酰胺化引起氨基酸变化和其它任选的修饰。

如本文所使用的,除非另有说明,否则vp蛋白的“亚群体”是指一组vp蛋白,所述一组vp蛋白具有至少一个限定的特性,并且由至少一个组成员到少于参考组的所有成员组成。例如,除非另有说明,否则vp1蛋白的“亚群体”可以是至少一种(1)vp1蛋白,并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明,否则vp3蛋白的“亚群体”可以是一种(1)vp3蛋白到少于组装的AAV衣壳中的所有vp3蛋白。例如,vp1蛋白可以是vp蛋白的亚群体;vp2蛋白可以是vp蛋白的不同单独的亚群体,并且vp3是组装的AAV衣壳中的vp蛋白的又另外的亚群体。在另一个实例中,vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体,所述修饰例如至少一个、两个、三个或四个高度脱酰胺化的天冬酰胺,例如在天冬酰胺-甘氨酸对处。

除非另有说明,否则高度脱酰胺化的是指与在参考氨基酸位置处的预测的氨基酸序列相比,在参考的氨基酸位置处被至少45%脱酰胺化的、至少50%脱酰胺化的、至少60%脱酰胺化的、至少65%脱酰胺化的、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%或最高约100%脱酰胺化的(例如,在SEQ ID NO:2的氨基酸57处的天冬酰胺的至少80%可以基于总vp1蛋白脱酰胺化或可以基于总vp1、vp2和vp3蛋白脱酰胺化)。此类百分比可以使用2D凝胶、质谱技术或其它合适的技术来确定。

在不希望受理论束缚的情况下,AAV衣壳中的vp蛋白中的至少高度脱酰胺化的残基的脱酰胺化被认为本质上主要是非酶促的,这是由衣壳蛋白内的功能基团引起的,所述功能基团使所选天冬酰胺脱酰胺化,并在较小程度上使谷氨酰胺残基脱酰胺化。大多数脱酰胺化vp1蛋白的有效衣壳组装表明这些事件在衣壳组装之后发生,或者单独单体(vp1、vp2或vp3)中的脱酰胺化在结构上具有良好的耐受性,并且在很大程度上不会影响组装动力学。VP1独特(VP1-u)区(约aa 1-137)中的广泛的脱酰胺化通常被认为在细胞进入之前定位在内部,这表明VP脱酰胺化可以在衣壳组装之前发生。

在不希望受理论束缚的情况下,N的脱酰胺化可以通过其C端残基的骨架氮原子对Asn的侧链酰胺基碳原子进行亲核攻击而发生。据信形成了中间闭环的琥珀酰亚胺残基。然后,琥珀酰亚胺残基进行快速水解以产生最终产物天冬氨酸(Asp)或异天冬氨酸(IsoAsp)。因此,在某些实施例中,天冬酰胺(N或Asn)的脱酰胺化产生Asp或IsoAsp,其可以通过琥珀酰亚胺中间体相互转化,例如如下文所展示的。

如本文所提供的,VP1、VP2或VP3中的每个脱酰胺化的N可以独立地是天冬氨酸(Asp)、异天冬氨酸(isoAsp)、天冬氨酸和/或Asp和isoAsp的互相转化的共混物或其组合。可以存在任何合适比率的α-和异天冬氨酸。例如,在某些实施例中,比率可以为10:1到1:10天冬氨酸:异天冬氨酸、约50:50天冬氨酸:异天冬氨酸或约1:3天冬氨酸:异天冬氨酸或另一所选比率。

在某些实施例中,一种或多种谷氨酰胺(Q)可以脱酰胺化为谷氨酸(Glu),即α-谷氨酸、γ-谷氨酸(Glu)或α-和γ-谷氨酸的共混物,其可以通过常见的戊二酰亚胺(glutarinimide)中间体相互转化。可以存在任何合适比率的α-和γ-谷氨酸。例如,在某些实施例中,比率可以为10:1到1:10α:γ、约50:50α:γ或约1:3α:γ或另一所选比率。

因此,rAAV包含vp1、vp2和/或vp3蛋白的rAAV衣壳内具有脱酰胺化的氨基酸的亚群体,至少包含至少一种包括至少一个高度脱酰胺化的天冬酰胺的亚群体。另外,其它修饰可以包含异构化,特别是在所选天冬氨酸(D或Asp)残基位置处。在仍其它实施例中,修饰可以包含在Asp位置处的酰胺化。

在某些实施例中,AAV衣壳含有具有至少1个、至少2个、至少3个、至少4个、至少5个到至少约25个脱酰胺化的氨基酸残基位置的vp1、vp2和vp3的亚群体,与vp蛋白的经过编码的氨基酸序列相比,所述vp1、vp2和vp3的至少1%到10%、至少10%到25%、至少25%到50%、至少50%到70%、至少70%到100%、至少75%到100%、至少80%到100%或至少90%到100%被脱酰胺化。这些中的大多数可以是N残基。然而,Q残基也可以被脱酰胺化。

如本文所使用的,“经过编码的氨基酸序列”是指基于被转译成氨基酸的参考的核酸序列的已知DNA密码子的转译而预测的氨基酸。下表展示了DNA密码子和二十种常见氨基酸,分别示出了单字母代码(SLC)和三个字母代码(3LC)。

在某些实施例中,rAAV具有含有vp1、vp2和vp3蛋白的AAV衣壳,所述蛋白具有包括在本文中提供的表中列出的位置处的两个、三个、四个、五个或更多个脱酰胺化的残基的组合的亚群体,并通过引用并入本文中。

rAAV中的脱酰胺化可以使用2D凝胶电泳和/或质谱和/或蛋白质建模技术来确定。在线色谱可以使用Acclaim PepMap柱和与Q Exactive HF和NanoFlex源(赛默飞世尔科技公司(Thermo Fisher Scientific))联接的Thermo UltiMate 3000 RSLC系统(赛默飞世尔科技公司)执行。MS数据是使用用于Q Exactive HF的数据依赖性前20种方法获取的,所述方法从调查扫描(200-2000m/z)中动态选择最丰富的尚未测序的前体离子。测序通过高能碰撞解离片段进行,其中通过预测性自动增益控制确定的靶值为1e5离子,并且以4m/z的窗口进行前体分离。以m/z 200以120,000的分辨率获取调查扫描。HCD光谱的分辨率可以在m/z 200下设置为30,000,其中最大离子注入时间为50毫秒,并且归一化碰撞能量为30。S-透镜RF水平可以设置为50,以使消化肽所占据的m/z区达到最佳传输。可以从片段选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。BioPharma Finder 1.0软件(赛默飞世尔科技公司)可以用于分析所获取的数据。对于肽作图,使用单进入蛋白FASTA数据库进行搜索,其中脲基甲基化设置为固定的修饰;并将氧化、脱酰胺化和磷酸化设置为可变修饰、10ppm质量准确度、高蛋白酶特异性和置信水平为0.8的MS/MS光谱。合适的蛋白酶的实例可以包含例如胰蛋白酶或胰凝乳蛋白酶。脱酰胺化的肽的质谱鉴定相对简单,因为脱酰胺化向完整分子的质量添加了+0.984Da(-OH基团与-NH

除脱酰胺化之外,可能发生不会导致一个氨基酸转化为不同的氨基酸残基的其它修饰。这种修饰可以包含乙酰化残基、异构化、磷酸化或氧化。

脱酰胺化的调节:在某些实施例中,AAV被修饰成改变天冬酰胺-甘氨酸对中的甘氨酸,以降低脱酰胺化。在其它实施例中,将天冬酰胺改变为不同的氨基酸,例如以较慢速率进行脱酰胺化的谷氨酰胺;或改变为缺乏酰胺基的氨基酸(例如,含有酰胺基的谷氨酰胺和天冬酰胺);和/或改变为缺乏酰胺基的氨基酸(例如,含有胺基的赖氨酸、精氨酸和组氨酸)。如本文所使用的,缺乏酰胺或胺侧基的氨基酸是指例如甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、苏氨酸、胱氨酸、苯丙氨酸、酪氨酸或色氨酸和/或脯氨酸。如所描述的修饰可以在经过编码的AAV氨基酸序列中存在的天冬酰胺-甘氨酸对中的一个、两个或三个天冬酰胺-甘氨酸对中。在某些实施例中,在所有四个天冬酰胺-甘氨酸对中没有进行此类修饰。因此,一种用于降低具有较低脱酰胺化速率的AAV和/或工程化AAV变体的脱酰胺化的方法。另外地或可替代地,可以将一种或多种其它酰胺氨基酸改变为非酰胺氨基酸以降低AAV的脱酰胺化。在某些实施例中,本文所描述的突变AAV衣壳含有天冬酰胺-甘氨酸对中的突变,使得甘氨酸变为丙氨酸或丝氨酸。突变AAV衣壳可以含有一个、两个或三个突变体,其中参考AAV天然地含有四个NG对。在某些实施例中,AAV衣壳可以含有一个、两个、三个或四个此类突变体,其中参考AAV天然地含有五个NG对。在某些实施例中,突变AAV衣壳含有NG对中的仅单个突变。在某些实施例中,突变AAV衣壳含有两个不同的NG对中的突变。在某些实施例中,突变AAV衣壳含有定位在AAV衣壳中的结构上分开的位置中的两个不同的NG对中的突变。在某些实施例中,突变不在VP1独特区中。在某些实施例中,突变中的一个突变不在VP1独特区中。任选地,突变AAV衣壳不含有NG对中的修饰,但是含有突变以最小化或消除定位在NG对的外部的一个或多个天冬酰胺或谷氨酰胺中的脱酰胺化。

在某些实施例中,提供了一种增加rAAV载体的效力的方法,所述方法包括使AAV衣壳工程化,这消除了野生型AAV衣壳中的NG中的一个或多个NG。在某些实施例中,“NG”的“G”的编码序列被工程为对另一种氨基酸进行编码。在下文的某些实例中,“S”或“A”被取代。然而,可以选择其它合适的氨基酸编码序列。参见例如下表,其中基于AAV8的编号,修饰针对以下位置中的至少一个位置的编码序列:N57+1、N263+1、N385+1、N514+1、N540+1,或如下表所示出的。在某些实施例中,AAV8突变体避免改变位置N57、N94、N263、N305、Q467、N479和/或N653处的NG对。在某些实施例中,其它AAV避免了在使用AAV8编号作为参考如基于与AAV8的比对所确定的对应N位置处的突变。

这些氨基酸修饰可以通过常规的基因工程技术进行。例如,可以产生含有经过修饰的AAV vp密码子的核酸序列,其中修饰精氨酸-甘氨酸对中对甘氨酸进行编码的密码子中的一到三个密码子以对除甘氨酸之外的氨基酸进行编码。在某些实施例中,含有经过修饰的精氨酸密码子的核酸序列可以在精氨酸-甘氨酸对中的一到三个精氨酸-甘氨酸对处被工程化,使得经过修饰的密码子对除精氨酸之外的氨基酸进行编码。每个经过修饰的密码子可以对不同的氨基酸进行编码。可替代地,改变的密码子中的一个或多个密码子可以对相同的氨基酸进行编码。在某些实施例中,这些经过修饰的AAVrh79、AAV8.AR2.08或AAV5.5.9核酸序列可以用于产生具有比天然AAVrh79、AAV8.AR2.08或AAV5.5.9衣壳脱酰胺化程度更低的衣壳的突变rAAV。此类突变rAAV可以具有降低的免疫原性和/或增加储存时的稳定性,特别是以悬浮液形式储存时的稳定性。

本文还提供了对具有降低的脱酰胺化的AAV衣壳进行编码的核酸序列。设计对此AAV衣壳进行编码的核酸序列在本领域的技术范围内,包含DNA(基因组或cDNA)或RNA(例如,mRNA)。可以通过各种方法设计可以被密码子优化以在所选系统(即,细胞类型)中进行表达的此类核酸序列。可以使用在线可用的方法(例如,GeneArt)、公开的方法或提供密码子优化服务的公司(例如,DNA2.0)(加利福尼亚州门洛帕克市)来执行此优化。例如,在国际专利公开第WO 2015/012924号中描述了一种密码子优化方法,其通过引用整体并入本文中。还参见例如美国专利公开第2014/0032186号和美国专利公开第2006/0136184号。适合的是,修饰产物的开放阅读框(ORF)的全长。然而,在一些实施例中,仅ORF的片段可以被改变。通过使用这些方法中的一种方法,可以将频率应用于任何给定的多肽序列,并产生对多肽进行编码的经过密码子优化的编码区的核酸片段。许多选项可用于对密码子进行实际改变或者可用于合成如在此所述地设计的密码子优化的编码区。此类改变或合成可以使用本领域普通技术人员已熟知的标准和常规分子生物学操作来进行。在一种方法中,通过标准方法合成各自长度为80-90个核苷酸且跨越希望的序列的长度的一系列互补寡核苷酸对。这些寡核苷酸对被合成为使得在退火时它们形成80-90个碱基对的双链片段,这些双链片段含有黏性末端,例如在该对中的各寡核苷酸被合成来延伸超过与该对中另一寡核苷酸互补的区域3个、4个、5个、6个、7个、8个、9个、10个或更多个碱基。每对寡核苷酸的单链末端被设计为用另一对寡核苷酸的单链末端退火。允许这些寡核苷酸对退火,并且然后允许约五至六个这些双链片段经由粘性单链末端一起退火,并且随后它们连接在一起并克隆到标准细菌克隆载体中,例如可获自加利福尼亚州卡尔斯巴德英杰公司(InvitrogenCorporation,Carlsbad,Calif)的

在某些实施例中,提供了AAV衣壳,所述AAV衣壳具有含有多个高度脱酰胺化的“NG”位置的AAV衣壳同种型(即,VP1、VP2、VP3)的异质群体。在某些实施例中,高度脱酰胺化的位置在下文参考预测的全长VP1氨基酸序列鉴定的位置中。在其它实施例中,衣壳基因被修饰成使得参考的“NG”被消融,并且突变体“NG”被工程化到另一个位置中。

在某些实施例中,混合的rAAV群体由使用单个AAV衣壳核酸序列的生产系统产生,所述核酸序列对一种AAV类型的预测的AAV VP1氨基酸序列进行编码。然而,产生和制造过程提供了上文所描述的衣壳蛋白的异质群体。

在某些实施例中,提供了新颖的分离的AAVrh79衣壳。SEQ ID NO:1中提供了对AAV进行编码的核酸序列,并且SEQ ID NO:2中提供了经过编码的氨基酸序列。

在某些实施例中,rAAV包括AAVrh79衣壳。AAVrh79衣壳包括AAVrh79 vp1蛋白、AAVrh79 vp2蛋白和AAVrh79 vp3蛋白的异质群体。在一个实施例中,AAVrh79衣壳是通过从对SEQ ID NO:2的1到738的预测的氨基酸序列进行编码的核酸序列的表达产生的。任选地,序列共表达来自不包含vp1独特区(约aa 1到137)或vp2独特区(约aa 1到203)的核酸序列的vp3蛋白、从SEQ ID NO:1产生的vp1蛋白或从与SEQ ID NO:1至少70%相同的对SEQ IDNO:2的1到738的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白。在其它实施例中,通过从对SEQ ID NO:2的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAVrh79 vp2蛋白、从包括SEQ ID NO:1的至少核苷酸412到2214的序列产生的vp2蛋白或从与SEQ ID NO:1的至少核苷酸412到2214至少70%相同的对SEQ ID NO:2的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白、通过从对SEQ ID NO:2的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAVrh79 vp3蛋白、从包括SEQ ID NO:1的至少核苷酸610到2214的序列产生的vp3蛋白或从与SEQ ID NO:1的至少核苷酸610到2214至少70%相同的对SEQ ID NO:2的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白。

在某些实施例中,AAVrh79衣壳包括:vp1蛋白的异质群体,所述vp1蛋白作为对SEQID NO:2的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ ID NO:2的至少约氨基酸138到738的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:2的至少氨基酸204到738进行编码的核酸序列的产物。

AAVrh79 vp1蛋白、vp2蛋白和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:2中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。相对于SEQ ID NO:2的编号,在N-G对N57、N263、N385和/或N514处观察到高水平的脱酰胺化。如下表和实例中所示,在其它残基中也观察到脱酰胺化。在某些实施例中,AAVrh79可以具有其它脱酰胺化的残基,例如通常小于10%和/或可以具有其它修饰,所述其它修饰包含甲基化(例如,约R487)(通常小于5%,在给定残基处更通常小于1%)、异构化(例如,在D97处)(通常小于5%,在给定残基处更通常小于1%)、磷酸化(例如,在存在的情况下,范围为约10%到约60%、或约10%到约30%、或约20%到约60%)(例如,在S149、约S153、约S474、约T570、约S665中的一个或多个处)或氧化(例如,在W248、W307、W307、M405、M437、M473、W480、W480、W505、M526、M544、M561、W621、M637和/或W697中的一个或多个处)。任选地,W可以氧化成犬尿氨酸。

表A-AAVrh79脱酰胺化

在某些实施例中,在下文提供的如使用胰蛋白酶使用质谱所测定的范围内,在上表中鉴定的位置中的一个或多个位置中修饰AAVrh79衣壳。在某些实施例中,如本文所描述的修饰以下位置中的一个或多个位置或N之后的甘氨酸。残基数量基于本文所提供的AAVrh79序列。参见SEQ ID NO:2。

在某些实施例中,SEQ ID NO:1中提供了对AAVrh79 vp1衣壳蛋白进行编码的核酸序列。在其它实施例中,可以选择与SEQ ID NO:1具有70%到99.9%同一性的核酸序列以表达AAVrh79衣壳蛋白。在某些其它实施例中,核酸序列与SEQ ID NO:1至少约75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少97%相同或至少99%到99.9%相同。然而,可以选择对SEQ ID NO:2的氨基酸序列进行编码的其它核酸序列用于产生rAAV衣壳。在某些实施例中,核酸序列具有SEQ ID NO:1的核酸序列或与SEQ ID NO:1至少70%到99%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:2进行编码的序列。在某些实施例中,核酸序列具有SEQ ID NO:1的核酸序列或与SEQ ID NO:1的约nt 412到约nt 2214至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:2的vp2衣壳蛋白(约aa 138到738)进行编码的序列。在某些实施例中,核酸序列具有SEQ ID NO:1的约nt 610到约nt 2214的核酸序列或与nt SEQ ID NO:1至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:2的vp3衣壳蛋白(约aa 204到738)进行编码的序列。

本发明还涵盖对突变体AAVrh79进行编码的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可以用于产生突变rAAVrh79衣壳。

在某些实施例中,提供了新颖AAV8.AR2.08衣壳。SEQ ID NO:17中提供了对AAV进行编码的核酸序列,并且SEQ ID NO:18中提供了经过编码的氨基酸序列。在一个实施例中,重组腺相关病毒(rAAV)具有AAV8.AR2.08衣壳。图13A中提供了AAV8T、AAV8.AR2.08和AAV8的氨基酸序列的比对。图13B-13D中提供了AAV8T、AAV8.AR2.08和AAV8的核酸序列的比对。

在某些实施例中,AAV8.AR2.08衣壳包括AAV8.AR2.08衣壳蛋白,所述AAV8.AR2.08衣壳蛋白包括:通过从对SEQ ID NO:18的1到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV8.AR2.08 vp1蛋白、从SEQ ID NO:17产生的vp1蛋白或从与SEQ ID NO:17至少70%相同的对SEQ ID NO:18的1到738的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白、通过从对SEQ ID NO:18的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV8.AR2.08 vp2蛋白、从包括SEQ ID NO:17的至少核苷酸412到2214的序列产生的vp2蛋白或从与SEQ ID NO:17的至少核苷酸412到2214至少70%相同的对SEQ ID NO:18的至少约氨基酸138到738的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白、通过从对SEQ ID NO:18的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV8.AR2.08 vp3蛋白、从包括SEQ ID NO:17的至少核苷酸610到2214的序列产生的vp3蛋白或从与SEQ ID NO:17的至少核苷酸610到2214至少70%相同的对SEQ ID NO:18的至少约氨基酸204到738的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白。

另外地或可替代地,AAV8.AR2.08衣壳包括:vp1蛋白的异质群体,所述vp1蛋白作为对SEQ ID NO:18的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ ID NO:18的至少约氨基酸138到738的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:18的至少氨基酸204到738进行编码的核酸序列的产物,其中:所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:18中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。AAV8.AR2.08由例如在基于AAV8.AR2.08 VP1[SEQ ID NO:18]的编号的位置N57、N263、N385、N514和N540处具有高度脱酰胺化的残基表征。另外地,在本申请的下表和详细表中的位置处的残基示出在AAV8.AR2.08衣壳中已经观察到的脱酰胺化。

在某些实施例中,在下文提供的如使用胰蛋白酶使用质谱所测定的范围内,在以下位置中的一个或多个位置中修饰AAV8.AR2.08衣壳。在某些实施例中,如本文所描述的修饰以下位置中的一个或多个位置或N之后的甘氨酸。例如,在某些实施例中,G可以例如在位置58、264、386、515或541处被修饰为S或A。当NG57/58改变为NS57/58或NA57/58时,观察到脱酰胺化显著降低。然而,在某些实施例中,当NG改变为NS或NA时,观察到脱酰胺化增加。在某些实施例中,NG对的N被修饰为Q,同时保留G。在某些实施例中,NG对的两个氨基酸均被修饰。在某些实施例中,N385Q引起所述位置中的脱酰胺化显著降低。在某些实施例中,N499Q引起所述位置中的脱酰胺化显著增加。

除了脱酰胺化之外,其它修饰可以包含异构化(例如,在D442和/或D584中的一个或多个处)(1-15%)、磷酸化(例如,在约S149、约T417、约T454、约T493、S600和/或约T663中的一个或多个处)和/或氧化(例如,在约W22、约M204、约M212、W248、W307、M405、M437、M473、W480、W505、

M526、M561、M607、约W609、W621、M637、W697中的一个或多个处)。其它位置可以具有此类这些或其它修饰(例如,乙酰化或另外的脱酰胺化)。

表B-AAV8.AR2.08脱酰胺化

在某些实施例中,SEQ ID NO:17中提供了对AAV8.AR2.08 vp1衣壳蛋白进行编码的核酸序列。在其它实施例中,可以选择与SEQ ID NO:17具有70%到99.9%同一性的核酸序列以表达AAV8.AR2.08衣壳蛋白。在某些其它实施例中,核酸序列与SEQ ID NO:17至少约75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少97%相同或至少99%到99.9%相同。然而,可以选择对SEQ ID NO:18的氨基酸序列进行编码的其它核酸序列用于产生rAAV8.AR2.08衣壳。在某些实施例中,核酸序列具有SEQ ID NO:17的核酸序列或与SEQ ID NO:17至少70%到99%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:18进行编码的序列。在某些实施例中,核酸序列具有SEQ ID NO:17的核酸序列或与SEQ ID NO:17的约nt 412到约nt 2214至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:18的vp2衣壳蛋白(约aa 138到738)进行编码的序列。在某些实施例中,核酸序列具有SEQ ID NO:17的约nt 607到约nt 2214的核酸序列或与nt SEQ ID NO:17至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:18的vp3衣壳蛋白(约aa 204到738)进行编码的序列。

本发明还涵盖对突变体AAV8.2.08进行编码的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可以用于产生突变体rAAV8.2.08。

在某些实施例中,提供了新颖AAV5.5.9衣壳。SEQ ID NO:9中提供了对AAV进行编码的核酸序列,并且SEQ ID NO:10中提供了经过编码的氨基酸序列。图12A中示出了AAV5.5.9、AAV9和AAVPHP.B的氨基酸序列的比对。图12B-12E中示出了AAV5.5.9、AAV9和AAVPHP.B的核酸序列的比对。在一个实施例中,重组腺相关病毒(rAAV)具有AAV5.5.9衣壳,所述AAV5.5.9衣壳包括:AAV5.5.9衣壳蛋白,所述AAV5.5.9衣壳蛋白包括:以下的异质群体:通过从对SEQ ID NO:10的1到726的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV5.5.9vp1蛋白、从SEQ ID NO:9产生的vp1蛋白或从与SEQ ID NO:9至少70%相同的对SEQ ID NO:1的1到726的预测的氨基酸序列进行编码的核酸序列产生的vp1蛋白;以下的异质群体:通过从对SEQ ID NO:10的至少约氨基酸137到726的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV5.5.9vp2蛋白、从包括SEQ ID NO:9的至少核苷酸409到2178的序列产生的vp2蛋白或从与SEQ ID NO:9的至少核苷酸577到2178至少70%相同的对SEQ IDNO:10的至少约氨基酸137到726的预测的氨基酸序列进行编码的核酸序列产生的vp2蛋白;以及以下的异质群体:通过从对SEQ ID NO:10的至少约氨基酸193到726的预测的氨基酸序列进行编码的核酸序列的表达产生的AAV5.5.9vp3蛋白、从包括SEQ ID NO:9的至少核苷酸577到2178的序列产生的vp3蛋白或从与SEQ ID NO:9的至少核苷酸577到2178至少70%相同的对SEQ ID NO:10的至少约氨基酸193到726的预测的氨基酸序列进行编码的核酸序列产生的vp3蛋白。

另外地或可替代地,AAV5.5.9衣壳包括:vp1蛋白的异质群体,所述vp1蛋白作为对SEQ ID NO:10的氨基酸序列进行编码的核酸序列的产物;vp2蛋白的异质群体,所述vp2蛋白作为对SEQ ID NO:10的至少约氨基酸137到726的氨基酸序列进行编码的核酸序列的产物;以及vp3蛋白的异质群体,所述vp3蛋白作为对SEQ ID NO:10的至少氨基酸193到726进行编码的核酸序列的产物,其中:所述vp1蛋白、所述vp2蛋白和所述vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:10中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。

表C-AAV5.5.9脱酰胺化

在某些实施例中,SEQ ID NO:9中提供了对AAV5.5.9vp1衣壳蛋白进行编码的核酸序列。在其它实施例中,可以选择与SEQ ID NO:9具有70%到99.9%同一性的核酸序列以表达AAV5.5.9衣壳蛋白。在某些其它实施例中,核酸序列与SEQ ID NO:9至少约75%相同、至少80%相同、至少85%相同、至少90%相同、至少95%相同、至少97%相同或至少99%到99.9%相同。然而,可以选择对SEQ ID NO:10的氨基酸序列进行编码的其它核酸序列用于产生rAAV5.5.9衣壳。在某些实施例中,核酸序列具有SEQ ID NO:10的核酸序列或与SEQ IDNO:9至少70%到99%相同、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:10进行编码的序列。在某些实施例中,核酸序列具有SEQ IDNO:9的核酸序列或与SEQ ID NO:9的约nt 409到约nt 2178至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ ID NO:10的vp2衣壳蛋白(约aa 137到726)进行编码的序列。在某些实施例中,核酸序列具有SEQ ID NO:9的约nt 577到约nt 2178的核酸序列或与SEQ ID NO:9的nt 577到2178至少70%到99%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少99%相同的对SEQ IDNO:10的vp3衣壳蛋白(约aa 193到726)进行编码的序列。

本发明还涵盖对突变体AAV5.5.9进行编码的核酸序列,其中已经改变一个或多个残基以降低脱酰胺化或本文所鉴定的其它修饰。此类核酸序列可以用于产生突变体rAAV5.5.9。

I.rAAV载体

如上文所指示的,新颖AAV序列和蛋白可用于产生rAAV,并且还可用于重组AAV载体,所述重组AAV载体可以是反义递送载体、基因疗法载体或疫苗载体。另外,本文描述的经过工程化的AAV衣壳可以用于工程化rAAV载体,以将多种合适的核酸分子递送到靶细胞和组织。

包装到AAV衣壳中并递送到宿主细胞的基因组序列通常至少由转基因及其调节序列和AAV反向末端重复序列(ITR)构成。单链AAV和自身互补(sc)AAV两者都涵盖在rAAV内。转基因是与载体序列异质的核酸编码序列,所述核酸编码序列对多肽、蛋白质、功能性RNA分子(例如,miRNA、miRNA抑制剂)或其它所关注的基因产物进行编码。核酸编码序列以允许转基因在靶组织的细胞中转录、转译和/或表达的方式与调节组分可操作地连接。

载体的AAV序列通常包括顺式作用的5'和3'反向末端重复序列(参见例如B.J.Carter,《细小病毒手册(Handbook of Parvoviruses)》,P.Tijsser编辑,CRC出版社,第155到168页(1990))。ITR序列的长度为约145bp。优选地,分子中使用了对ITR进行编码的基本上整个序列,尽管允许对这些序列进行一定程度的微小修饰。修饰这些ITR序列的能力在本领域的技术范围内。(参见例如文本,如Sambrook等人,《分子克隆:实验室手册(Molecular Cloning.A Laboratory Manual)》,第2版,冷泉港实验室(Cold SpringHarbor Laboratory),纽约(1989);以及K.Fisher等人,《病毒学杂志》,70:520 532(1996))。在本发明中采用的这种分子的实例是含有转基因的“顺式作用”质粒,其中所选转基因序列和相关的调节元件侧接5'和3'AAV ITR序列。在一个实施例中,ITR来自与供应衣壳的AAV不同的AAV,从而产生假型载体。在一个实施例中,ITR来自AAV2。已经描述了被称为ΔITR的5'ITR的缩短版本,其中缺失了D序列和末端解析位点(trs)。在其它实施例中,使用了全长AAV 5'和3'ITR。然而,可以选择来自其它AAV来源的ITR。在ITR的来源来自AAV2并且AAV衣壳来自另一个AAV来源的情况下,所得载体可以被称为假型的。然而,这些元件的其它构型可以是合适的。

除重组AAV载体的上文鉴定的主要元件外,AAV载体还包含必需的常规控制元件,所述常规控制元件以允许其在用质粒载体转染或用由本发明产生的病毒感染的细胞中转录、转译和/或表达的方式与转基因可操作地连接。如本文所使用的,“可操作地连接的”序列包含与所关注的基因邻接的表达控制序列和以反式或在远处起作用以控制所关注的基因的表达控制序列。

调节控制元件通常含有作为表达控制序列的一部分的启动子序列,例如定位在所选5'ITR序列与编码序列之间。可以在本文所描述的载体中使用组成型启动子、可调节启动子[参见例如WO 2011/126808和WO 2013/04943]、组织特异性启动子或对生理学线索有应答的启动子。一种或多种启动子可以选自不同的来源,例如人巨细胞病毒(CMV)立即早期增强子/启动子、SV40早期增强子/启动子、JC多瘤病毒启动子、髓鞘碱性蛋白(MBP)或神经胶质原纤维酸性蛋白(GFAP)启动子、单纯疱疹病毒(HSV-1)潜伏期相关启动子(LAP)、劳氏肉瘤病毒(RSV)长末端重复(LTR)启动子、神经元特异性启动子(NSE)、血小板衍生生长因子(PDGF)启动子、hSYN、黑色素浓缩激素(MCH)启动子、CBA、基质金属蛋白启动子(MPP)和鸡β-肌动蛋白启动子。在一个实施例中,启动子是肝脏特异性启动子,如本文例示的被称为LSP的启动子。

除了启动子之外,载体还可以含有一个或多个其它合适的转录起始、终止、增强子序列、有效的RNA加工信号,如剪接和聚腺苷酸化(polyA)信号;稳定胞质mRNA的序列,例如WPRE;增强转译效率的序列(即,Kozak共有序列);增强蛋白稳定性的序列;以及在需要时,增强所编码产物的分泌的序列。合适的增强子的实例是CMV增强子。其它合适的增强子包含适合于所期望的靶组织适应症的增强子。在一个实施例中,表达盒包括一种或多种表达增强子。在一个实施例中,表达盒含有两种或更多种表达增强子。这些增强子可以相同或彼此不同。例如,增强子可以包含CMV立即早期增强子。这种增强子可以存在于彼此相邻定位的两个拷贝中。可替代地,增强子的双拷贝可以被一个或多个序列分开。在仍另一个实施例中,表达盒进一步含有内含子,例如,鸡β-肌动蛋白内含子。其它合适的内含子包含本领域已知的内含子,例如,如WO 2011/126808中描述的内含子。合适的polyA序列的实例包含例如SV40、SV50、牛生长激素(bGH)、人生长激素和合成polyA。任选地,可以选择一个或多个序列来稳定mRNA。这种序列的实例是经过修饰的WPRE序列,其可以在polyA序列的上游和编码序列的下游被工程化[参见例如MA Zanta-Boussif等人,《基因疗法(Gene Therapy)》(2009)16:605-619]。

这些rAAV特别适合于用于治疗目的和用于免疫的基因递送,包含诱导保护性免疫。进一步地,本发明的组合物还可以用于体外产生所期望的基因产物。对于体外产生,可以在用含有对所期望的产物进行编码的分子的rAAV转染宿主细胞并在允许表达的条件下培养细胞培养物之后从所期望的培养物中获得所期望的产物(例如,蛋白质)。然后可以根据需要纯化和分离所表达的产物。用于转染、细胞培养、纯化和分离的合适的技术是本领域的技术人员已知的。

治疗性转基因

由转基因编码的有用产物包含各种基因产物,所述基因产物替代缺陷型或有缺陷的基因,使失活或“敲除”、或“敲低”或减少以不期望的高水平表达或递送具有所期望的治疗效果的基因产物的基因的表达。在大多数实施例中,疗法将是“体细胞基因疗法”,即,将基因转移到不产生精子或卵子的人体细胞。在某些实施例中,转基因表达蛋白具有天然人序列的序列。然而,在其它实施例中,表达合成蛋白。此类蛋白质可以用于治疗人,或者在其它实施例中,被设计成用于治疗动物,包含如犬科或猫科群体等伴侣动物,或用于治疗与人群体接触的牲畜或其它动物。

合适的基因产物的实例可以包含与家族性高胆固醇血症、肌营养不良、囊性纤维化以及罕见疾或孤儿病相关的基因产物。此类罕见疾病的实例可以包含脊髓性肌萎缩症(SMA)、亨廷顿氏病(Huntingdon's Disease)、雷特综合征(Rett Syndrome)(例如,甲基CpG结合蛋白2(MeCP2);UniProtKB-P51608)、肌萎缩侧索硬化症(ALS)、杜兴型肌营养不良(Duchenne Type Muscular dystrophy)、弗里德里希共济失调(Friedrichs Ataxia)(例如,共济蛋白)、颗粒蛋白前体(PRGN)(与非阿尔茨海默氏病的大脑变性相关,包含额颞叶痴呆(FTD)、进行性非流利性失语症(PNFA)和语义性痴呆)等等。参见例如www.orpha.net/consor/cgi-bin/Disease_Search_List.php;rarediseases.info.nih.gov/diseases。

合适的基因的实例可以包含例如激素以及生长和分化因子,包含但不限于胰岛素、胰高血糖素、胰高血糖素样肽-1(GLP1)、生长激素(GH)、甲状旁腺激素(PTH)、生长激素释放因子(GRF)、促卵泡激素(FSH)、促黄体激素(LH)、人绒毛膜促性腺激素(hCG)、血管内皮生长因子(VEGF)、血管生成素、血管抑素、粒细胞集落刺激因子(GCSF)、促红细胞产生素(EPO)(包含例如人、犬或猫epo)、结缔组织生长因子(CTGF)、神经营养因子包含例如碱性成纤维细胞生长因子(bFGF)、酸性成纤维细胞生长因子(aFGF)、表皮生长因子(EGF)、血小板衍生生长因子(PDGF)、胰岛素生长因子I和II(IGF-I和IGF-II)、转化生长因子α超家族(包含TGFα、激活素、抑制素)中的任一种、或骨形态发生蛋白(BMP)BMP 1-15中的任一种、生长因子的调蛋白/神经调节蛋白/ARIA/neu分化因子(NDF)家族、神经生长因子(NGF)、脑源性神经营养因子(BDNF)、神经营养因子NT-3和NT-4/5、睫状神经营养因子(CNTF)、神经胶质细胞系源性神经营养因子(GDNF)、神经秩蛋白、集聚蛋白中的任一种、信号素/脑衰蛋白、纺锤蛋白-1和纺锤蛋白-2、肝细胞生长因子(HGF)、肝配蛋白、头蛋白、音猬因子和酪氨酸羟化酶的家族中的任一种。

其它有用的转基因产物包含调节免疫系统的蛋白质,包含但不限于细胞因子和淋巴因子,如血小板生成素(TPO)、白细胞介素(IL)IL-1到IL-36(包含例如人白细胞介素IL-1、IL-1α、IL-1β、IL-2、IL-3、IL-4、IL-6、IL-8、IL-12、IL-11、IL-12、IL-13、IL-18、IL-31、IL-35)、单核细胞趋化蛋白、白血病抑制因子、粒细胞-巨噬细胞集落刺激因子、Fas配体、肿瘤坏死因子α和β、干扰素α、β和γ、干细胞因子、flk-2/flt3配体。由免疫系统产生的基因产物也可用于本发明。这些包含但不限于免疫球蛋白IgG、IgM、IgA、IgD和IgE、嵌合免疫球蛋白、人源化抗体、单链抗体、T细胞受体、嵌合T细胞受体、单链T细胞受体、MHC I类和II类分子以及经过工程化的免疫球蛋白和MHC分子。例如,在某些实施例中,可以将rAAV抗体设计成递送犬或猫抗体,例如抗IgE、抗IL31、抗CD20、抗NGF、抗GnRH。有用的基因产物还包含补体调节蛋白,如补体调节蛋白、膜辅因子蛋白(MCP)、衰变加速因子(DAF)、CR1、CF2、CD59和C1酯酶抑制剂(C1-INH)。

仍其它有用的基因产物包含用于激素、生长因子、细胞因子、淋巴因子、调节蛋白和免疫系统蛋白的受体中的任一种。本发明涵盖用于胆固醇调节和/或脂质调节的受体,包含低密度脂蛋白(LDL)受体、高密度脂蛋白(HDL)受体、极低密度脂蛋白(VLDL)受体和清除剂受体。本发明还涵盖基因产物,如类固醇激素受体超家族的成员,包含糖皮质激素受体和雌激素受体、维生素D受体和其它核受体。另外,有用的基因产物包含转录因子,如jun、fos、max、mad、血清响应因子(SRF)、AP-1、AP2、myb、MyoD和肌生成素、含ETS盒的蛋白质、TFE3、E2F、ATF1、ATF2、ATF3、ATF4、ZF5、NFAT、CREB、HNF-4、C/EBP、SP1、CCAAT盒结合蛋白、干扰素调节因子(IRF-1)、威尔姆斯肿瘤蛋白、ETS结合蛋白、STAT、GATA盒结合蛋白(例如,GATA-3)和带翼螺旋蛋白的叉头家族。

其它有用的基因产物包含氨基甲酰合成酶I、鸟氨酸转氨甲酰酶(OTC)、精氨酸琥珀酸合成酶、用于治疗精氨琥珀酸裂解酶缺乏症的精氨琥珀酸裂解酶(ASL)、精氨酸酶、延胡索酰乙酰乙酸水解酶、苯丙氨酸羟化酶、α-1抗胰蛋白酶、恒河猴甲胎蛋白(AFP)、恒河猴绒毛膜促性腺激素(CG)、葡萄糖-6-磷酸酶、胆色素原脱氨酶、胱硫醚β合酶、支链酮酸脱羧酶、白蛋白、异戊酰辅酶A脱氢酶、丙酰辅酶A羧化酶、甲基丙二酰辅酶A变位酶、戊二酰辅酶A脱氢酶、胰岛素、β-葡糖苷酶、丙酮酸羧酸盐、肝磷酸化酶、磷酸化酶激酶、甘氨酸脱羧酶、H蛋白、T蛋白、囊性纤维化跨膜调节子(CFTR)序列和肌营养不良蛋白基因产物[例如,迷你或微小肌营养不良蛋白]。仍其它有用的基因产物还包含如可以用于酶替代疗法的酶,所述酶替代疗法可用于由于酶活性不足而导致的多种病状。例如,可以将含有甘露糖-6-磷酸的酶用于溶酶体贮积病的疗法中(例如,合适的基因包含对β-葡糖醛酸酶(GUSB)进行编码的基因)。

在某些实施例中,可以在基因编辑系统中使用rAAV,所述系统可以涉及一种rAAV或多种rAAV原液的共同施用。例如,rAAV可以被工程化以递送SpCas9、SaCas9、ARCUS、Cpf1和其它合适的基因编辑构建体。

仍其它有用的基因产物包含用于治疗血友病的基因产物,所述血友病包含血友病B(包含因子IX)和血友病A(包含因子VIII及其变体,如异二聚体和B缺失结构域的轻链和重链;美国专利第6,200,560号和美国专利第6,221,349号)。在一些实施例中,迷你基因包括因子VIII重链的前57个碱基对,所述重链对10个氨基酸信号序列以及人生长激素(hGH)聚腺苷酸化序列进行编码。在替代性实施例中,迷你基因进一步包括A1和A2结构域以及来自B结构域的N端的5个氨基酸和/或B结构域的C端的85个氨基酸以及A3、C1和C2结构域。在又其它实施例中,在单个迷你基因中提供了对因子VIII重链和轻链进行编码的核酸,所述单个迷你基因由对B结构域的14个氨基酸进行编码的42个核酸分开[美国专利第6,200,560号]。

其它有用的基因产物包含非天然存在的多肽,如具有含有插入、缺失或氨基酸取代的非天然存在的氨基酸序列的嵌合或杂合多肽。例如,单链工程化的免疫球蛋白可能在某些免疫受损的患者中有用。其它类型的非天然存在的基因序列包含反义分子和催化核酸,如核酶,其可以用于减少靶标的过度表达。

减少和/或调节基因表达对于治疗由细胞过度增殖表征的过度增殖性病状(如癌症和牛皮癣)是特别期望的。靶多肽包含与正常细胞相比在过度增殖性细胞中专门产生或以更高水平产生的那些多肽。靶抗原包含由癌基因如myb、myc、fyn和易位基因bcr/abl、ras、src、P53、neu、trk和EGRF编码的多肽。除作为靶抗原的癌基因产物之外,用于抗癌治疗和保护方案的靶多肽包含由B细胞淋巴瘤产生的抗体的可变区和T细胞淋巴瘤的T细胞受体的可变区,在一些实施例中,所述可变区还被用作自身免疫疾病的靶抗原。其它肿瘤相关多肽也可以用作靶多肽,如在肿瘤细胞中以较高水平存在的多肽,包含由单克隆抗体17-1A识别的多肽和叶酸结合多肽。

其它合适的治疗性多肽和蛋白质包含可以用于通过为针对与自身免疫相关的靶标赋予广泛基础的保护性免疫应答而治疗患有自身免疫性疾病和病症的个体的多肽和蛋白质,所述靶标包含细胞受体和产生“自身”定向抗体的细胞。T细胞介导的自身免疫性疾病包含类风湿关节炎(RA)、多发性硬化症(MS)、干燥综合征(

可以通过rAAV递送的另外的说明性基因包含但不限于与糖原贮积病或1A型缺乏症(GSD1)相关的葡萄糖-6-磷酸酶;与PEPCK缺乏症相关的磷酸烯醇丙酮酸羧激酶(PEPCK);细胞周期蛋白依赖性激酶样5(CDKL5),其也被称为与癫痫发作和严重的神经发育障碍相关的丝氨酸/苏氨酸激酶9(STK9);与半乳糖血症相关的半乳糖-1磷酸尿嘧啶转移酶;与苯丙酮尿症(PKU)相关的苯丙氨酸羟化酶;与枫糖尿病相关的支链α-酮酸脱氢酶;与1型酪氨酸血症相关的延胡索酰乙酰乙酸水解酶;与甲基丙二酸血症相关的甲基丙二酰辅酶A变位酶;与中链乙酰辅酶A缺乏症相关的中链酰基辅酶A脱氢酶;与鸟氨酸转氨甲酰酶缺乏症相关的鸟氨酸转氨甲酰酶(OTC);与瓜氨酸血症相关的精氨酸琥珀酸合成酶(ASS1);卵磷脂胆固醇酰基转移酶(LCAT)缺乏症;甲基丙二酸血症(MMA);尼曼-皮克病(Niemann-Pick disease),C1型;丙酸血症(PA);与家族性高胆固醇血症(FH)相关的低密度脂蛋白受体(LDLR)蛋白;与克里格勒-纳贾尔病(Crigler-Najjar disease)相关的UDP-葡萄糖醛糖基转移酶;与严重联合免疫缺陷病相关的腺苷脱氨酶;与痛风和莱施-奈恩综合征(Lesch-Nyhan syndrome)相关的次黄嘌呤鸟嘌呤磷酸核糖基转移酶;与生物素酶缺乏症相关的生物素酶;与法布里病(Fabry disease)相关的α-半乳糖苷酶A(α-Gal A);与威尔逊氏病(Wilson's Disease)相关的ATP7B;与戈谢病(Gaucher disease)2和3型相关的β-葡糖脑苷脂酶;与泽尔韦格氏综合征(Zellweger syndrome)相关的过氧化物酶体膜蛋白70kDa;与变质性脑白质营养不良相关的芳基硫酸酯酶A(ARSA);与克拉伯病(Krabbe disease)相关的半乳糖脑苷脂酶(GALC);与庞贝病(Pompe disease)相关的α-葡糖苷酶(GAA);与尼曼-皮克病(Nieman Pickdisease)A型相关的鞘磷脂酶(SMPD1)基因;与成人II型瓜氨酸血症(CTLN2)相关的精氨琥珀酸合酶;与脲循环病症相关的氨基甲酰磷酸合酶1(CPS1);与脊髓性肌萎缩症相关的存活运动神经元(SMN)蛋白;与法伯脂肪肉芽肿病相关的神经酰胺酶;与GM2神经节苷脂病和泰伊-萨克斯二氏病和山霍夫氏病(Tay-Sachs and Sandhoff diseases)相关的b-己糖胺酶;与天冬氨酰葡糖尿症相关的天冬氨酰葡糖胺酶;与岩藻糖苷贮积症相关的α岩藻糖苷酶;与α甘露糖苷贮积症相关的α-甘露糖苷酶;与急性间歇性卟啉症(AIP)相关的胆色素原脱氨酶;用于治疗α-1抗胰蛋白酶缺乏症(肺气肿)的α-1抗胰蛋白酶;用于治疗因地中海贫血或肾衰竭引起的贫血的促红细胞生成素;用于治疗缺血性疾病的血管内皮生长因子、血管生成素-1和成纤维细胞生长因子;用于治疗如例如在动脉粥样硬化、血栓形成或栓塞中所看见的阻塞的血管的血栓调节蛋白和组织因子途径抑制剂;用于治疗帕金森氏病(Parkinson's disease)的芳香族氨基酸脱羧酶(AADC)和酪氨酸羟化酶(TH);与受磷蛋白、肌浆(内质)网腺苷三磷酸酶2(SERCA2)呈反义或为其突变体形式的β肾上腺素能受体;用于治疗充血性心力衰竭的心脏腺苷酸环化酶;用于治疗各种癌症的肿瘤抑制基因,如p53;用于治疗炎症和免疫病症以及癌症的细胞因子,如各种白细胞介素之一;用于治疗肌营养不良的肌营养不良蛋白或迷你肌营养不良蛋白以及肌萎缩相关蛋白或迷你肌萎缩相关蛋白;以及用于治疗糖尿病的胰岛素或GLP-1。

另外所关注的基因和疾病包含例如肌张力异常蛋白基因相关的疾病,如遗传性感觉和自主神经病VI型(DST基因对肌张力异常蛋白进行编码;由于蛋白质的大小(约7570aa)可能需要双重AAV载体;SCN9A相关疾病,其中功能突变体的丧失导致无法感觉疼痛,并且功能突变体的获得引起疼痛病状,如红斑性肢痛症。由于NEFL基因(神经丝轻链)发生突变,另一种病状是腓骨肌萎缩症1F和2E型,其由具有可变临床和电生理表达的进行性周围运动和感觉神经病表征。

在某些实施例中,本文所描述的rAAV可以用于治疗黏多糖贮积症(MPS)病症。这种rAAV可以含有携带对用于治疗MPS I(贺勒、贺勒-施艾氏和施艾氏综合征(Hurler,Hurler-Scheie and Scheie syndromes))的α-L-艾杜糖苷酸酶(IDUA)进行编码的核酸序列;对用于治疗MPS II(亨特氏综合征)的艾杜糖醛酸-2-硫酸酯酶(IDS)进行编码的核酸序列;对用于治疗MPSIII A、B、C和D(沙费利波综合征(Sanfilippo syndrome))的磺酰胺酶(SGSH)进行编码的核酸序列;对用于治疗MPS IV A和B(莫基奥综合征(Morquio syndrome))的N-乙酰半乳糖胺-6-硫酸硫酸酯酶(GALNS)进行编码的核酸序列;对用于治疗MPS VI(马罗托-拉米氏综合征(Maroteaux-Lamy syndrome))的芳基硫酸酯酶B(ARSB)进行编码的核酸序列;对用于治疗MPSI IX(透明质酸酶缺乏症)的透明质酸酶进行编码的核酸序列;以及对用于治疗MPS VII(斯赖综合征(Sly syndrome))的β-葡糖醛酸苷酶进行编码的核酸序列。

免疫原性转基因

在一些实施例中,通过向患有癌症的受试者施用含有rAAV载体的rAAV,包括对与癌症相关的基因产物(例如,肿瘤抑制因子)进行编码的核酸的rAAV载体可以用于治疗癌症。在一些实施例中,通过向患有癌症的受试者施用含有rAAV载体的rAAV,包括对抑制与癌症相关的基因产物(例如,致癌基因)的表达的小干扰核酸(例如,shRNA、miRNA)进行编码的核酸的rAAV载体可以用于治疗癌症。在一些实施例中,包括对与癌症相关的基因产物(或抑制与癌症相关的基因表达的功能性RNA)进行编码的核酸的rAAV载体可以用于研究目的,例如研究癌症或鉴定治疗癌症的治疗剂。以下是已知与癌症的发展相关的示例性基因(例如,癌基因和肿瘤抑制因子)的非限制性列表:AARS、ABCB1、ABCC4、ABI2、ABL1、ABL2、ACK1、ACP2、ACY1、ADSL、AK1、AKR1C2、AKT1、ALB、ANPEP、ANXA5、ANXA7、AP2M1、APC、ARHGAP5、ARHGEF5、ARID4A、ASNS、ATF4、ATM、ATP5B、ATP5O、AXL、BARD1、BAX、BCL2、BHLHB2、BLMH、BRAF、BRCA1、BRCA2、BTK、CANX、CAP1、CAPN1、CAPNS1、CAV1、CBFB、CBLB、CCL2、CCND1、CCND2、CCND3、CCNE1、CCT5、CCYR61、CD24、CD44、CD59、CDC20、CDC25、CDC25A、CDC25B、CDC2L5、CDK10、CDK4、CDK5、CDK9、CDKL1、CDKN1A、CDKN1B、CDKN1C、CDKN2A、CDKN2B、CDKN2D、CEBPG、CENPC1、CGRRF1、CHAF1A、CIB1、CKMT1、CLK1、CLK2、CLK3、CLNS1A、CLTC、COL1A1、COL6A3、COX6C、COX7A2、CRAT、CRHR1、CSF1R、CSK、CSNK1G2、CTNNA1、CTNNB1、CTPS、CTSC、CTSD、CUL1、CYR61、DCC、DCN、DDX10、DEK、DHCR7、DHRS2、DHX8、DLG3、DVL1、DVL3、E2F1、E2F3、E2F5、EGFR、EGR1、EIF5、EPHA2、ERBB2、ERBB3、ERBB4、ERCC3、ETV1、ETV3、ETV6、F2R、FASTK、FBN1、FBN2、FES、FGFR1、FGR、FKBP8、FN1、FOS、FOSL1、FOSL2、FOXG1A、FOXO1A、FRAP1、FRZB、FTL、FZD2、FZD5、FZD9、G22P1、GAS6、GCN5L2、GDF15、GNA13、GNAS、GNB2、GNB2L1、GPR39、GRB2、GSK3A、GSPT1、GTF2I、HDAC1、HDGF、HMMR、HPRT1、HRB、HSPA4、HSPA5、HSPA8、HSPB1、HSPH1、HYAL1、HYOU1、ICAM1、ID1、ID2、IDUA、IER3、IFITM1、IGF1R、IGF2R、IGFBP3、IGFBP4、IGFBP5、IL1B、ILK、ING1、IRF3、ITGA3、ITGA6、ITGB4、JAK1、JARID1A、JUN、JUNB、JUND、K-α-1、KIT、KITLG、KLK10、KPNA2、KRAS2、KRT18、KRT2A、KRT9、LAMB1、LAMP2、LCK、LCN2、LEP、LITAF、LRPAP1、LTF、LYN、LZTR1、MADH1、MAP2K2、MAP3K8、MAPK12、MAPK13、MAPKAPK3、MAPRE1、MARS、MAS1、MCC、MCM2、MCM4、MDM2、MDM4、MET、MGST1、MICB、MLLT3、MME、MMP1、MMP14、MMP17、MMP2、MNDA、MSH2、MSH6、MT3、MYB、MYBL1、MYBL2、MYC、MYCL1、MYCN、MYD88、MYL9、MYLK、NEO1、NF1、NF2、NFKB1、NFKB2、NFSF7、NID、NINE、NMBR、NME1、NME2、NME3、NOTCH1、NOTCH2、NOTCH4、NPM1、NQO1、NR1D1、NR2F1、NR2F6、NRAS、NRG1、NSEP1、OSM、PA2G4、PABPC1、PCNA、PCTK1、PCTK2、PCTK3、PDGFA、PDGFB、PDGFRA、PDPK1、PEA15、PFDN4、PFDN5、PGAM1、PHB、PIK3CA、PIK3CB、PIK3CG、PIM1、PKM2、PKMYT1、PLK2、PPARD、PPARG、PPIH、PPP1CA、PPP2R5A、PRDX2、PRDX4、PRKAR1A、PRKCBP1、PRNP、PRSS15、PSMA1、PTCH、PTEN、PTGS1、PTMA、PTN、PTPRN、RAB5A、RAC1、RAD50、RAF1、RALBP1、RAP1A、RARA、RARB、RASGRF1、RB1、RBBP4、RBL2、REA、REL、RELA、RELB、RET、RFC2、RGS19、RHOA、RHOB、RHOC、RHOD、RIPK1、RPN2、RPS6 KB1、RRM1、SARS、SELENBP1、SEMA3C、SEMA4D、SEPP1、SERPINH1、SFN、SFPQ、SFRS7、SHB、SHH、SIAH2、SIVA、SIVA TP53、SKI、SKIL、SLC16A1、SLC1A4、SLC20A1、SMO、鞘磷脂磷酸二酯酶1(SMPD1)、SNAI2、SND1、SNRPB2、SOCS1、SOCS3、SOD1、SORT1、SPINT2、SPRY2、SRC、SRPX、STAT1、STAT2、STAT3、STAT5B、STC1、TAF1、TBL3、TBRG4、TCF1、TCF7L2、TFAP2C、TFDP1、TFDP2、TGFA、TGFB1、TGFBI、TGFBR2、TGFBR3、THBS1、TIE、TIMP1、TIMP3、TJP1、TK1、TLE1、TNF、TNFRSF10A、TNFRSF10B、TNFRSF1A、TNFRSF1B、TNFRSF6、TNFSF7、TNK1、TOB1、TP53、TP53BP2、TP5313、TP73、TPBG、TPT1、TRADD、TRAM1、TRRAP、TSG101、TUFM、TXNRD1、TYRO3、UBC、UBE2L6、UCHL1、USP7、VDAC1、VEGF、VHL、VIL2、WEE1、WNT1、WNT2、WNT2B、WNT3、WNT5A、WT1、XRCC1、YES1、YWHAB、YWHAZ、ZAP70和ZNF9。

rAAV载体可以包括对调节细胞凋亡的蛋白质或功能性RNA进行编码的作为转基因的核酸。以下是与细胞凋亡相关的基因的非限制性列表,并且对这些基因的产物及其同源物进行编码的以及对抑制这些基因及其同源物的表达的小干扰核酸(例如,shRNA、miRNA)进行编码的核酸在本发明的某些实施例中用作转基因:RPS27A、ABL1、AKT1、APAF1、BAD、BAG1、BAG3、BAG4、BAK1、BAX、BCL10、BCL2、BCL2A1、BCL2L1、BCL2L10、BCL2L11、BCL2L12、BCL2L13、BCL2L2、BCLAF1、BFAR、BID、BIK、NAIP、BIRC2、BIRC3、XIAP、BIRC5、BIRC6、BIRC7、BIRC8、BNIP1、BNIP2、BNIP3、BNIP3L、BOK、BRAF、CARD10、CARD11、NLRC4、CARD14、NOD2、NOD1、CARD6、CARDS、CARDS、CASP1、CASP10、CASP14、CASP2、CASP3、CASP4、CASP5、CASP6、CASP7、CASP8、CASP9、CFLAR、CIDEA、CIDEB、CRADD、DAPK1、DAPK2、DFFA、DFFB、FADD、GADD45A、GDNF、HRK、IGF1R、LTA、LTBR、MCL1、NOL3、PYCARD、RIPK1、RIPK2、TNF、TNFRSF10A、TNFRSF10B、TNFRSF10C、TNFRSF10D、TNFRSF11B、TNFRSF12A、TNFRSF14、TNFRSF19、TNFRSF1A、TNFRSF1B、TNFRSF21、TNFRSF25、CD40、FAS、TNFRSF6B、CD27、TNFRSF9、TNFSF10、TNFSF14、TNFSF18、CD40LG、FASLG、CD70、TNFSF8、TNFSF9、TP53、TP53BP2、TP73、TP63、TRADD、TRAF1、TRAF2、TRAF3、TRAF4和TRAF5。

有用的转基因产物还包含miRNA。miRNA和其它小干扰核酸通过靶信使RNA(mRNA)的靶RNA转录物裂解/降解或转译抑制来调节基因表达。miRNA是天然表达的,通常作为最终的19-25种非转译的RNA产物。miRNA通过与靶mRNA的3'非转译区(UTR)的序列特异性相互作用展现出其活性。这些内源表达的miRNA形成发夹前体,所述发夹前体随后被加工成miRNA双链体,并且被进一步加工成“成熟的”单链miRNA分子。这种成熟的miRNA引导多蛋白复合物miRISC,所述多蛋白复合物基于与成熟的miRNA的互补性来鉴定靶mRNA的靶位点,例如在3'UTR区中。

在方法的某些实施例中,以下miRNA基因及其同源物的非限制性列表可用作转基因或由转基因编码的小干扰核酸(例如,miRNA海绵体、反义寡核苷酸、TuD RNA)的靶标:hsa-let-7a、hsa-let-7a

miRNA抑制其靶向的mRNA的功能,并且因此抑制由mRNA编码的多肽的表达。因此,(部分地或全部地)阻断miRNA的活性(例如,沉默miRNA)可以有效地诱导或恢复表达被抑制的多肽的表达(使多肽去抑制)。在一个实施例中,通过多种方法中的任一种抑制细胞中的miRNA活性来实现对由miRNA的mRNA靶标编码的多肽的去抑制。例如,可以通过与和miRNA互补或基本上互补的小干扰核酸(例如,反义寡核苷酸、miRNA海绵体、TuD RNA)杂交来实现阻断miRNA的活性,由此阻断miRNA与其靶mRNA的相互作用。如本文所使用的,与miRNA基本上互补的小干扰核酸是能够与miRNA杂交并阻断miRNA活性的小干扰核酸。在一些实施例中,与miRNA基本上互补的小干扰核酸是除1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个或18个碱基之外完全与miRNA互补的小干扰核酸。“miRNA抑制剂”是阻断miRNA功能、表达和/或加工的药剂。例如,这些分子包含但不限于抑制miRNA与Drosha复合物相互作用的微小RNA特异性反义分子、微小RNA海绵体、强诱饵RNA(TuD RNA)和微小RNA寡核苷酸(双链、发夹、短寡核苷酸)。

仍其它有用的转基因可以包含对赋予病原体被动免疫的免疫球蛋白进行编码的转基因。“免疫球蛋白分子”是含有共价偶联在一起并且能够与抗原特异性组合的免疫球蛋白重链和免疫球蛋白轻链的免疫活性部分的蛋白质。免疫球蛋白分子可以是任何类型(例如,IgG、IgE、IgM、IgD、IgA和IgY)、类别(例如,IgG1、IgG2、IgG3、IgG4、IgA1和IgA2)或子类。术语“抗体”和“免疫球蛋白”在本文中可以互换使用。

“免疫球蛋白重链”是含有免疫球蛋白的抗原结合结构域的至少一部分和免疫球蛋白重链的可变区的至少一部分或免疫球蛋白重链的恒定区的至少一部分的多肽。因此,免疫球蛋白源性重链与免疫球蛋白基因超家族的成员具有显著的氨基酸序列同源性区。例如,Fab片段中的重链是免疫球蛋白源性重链。

“免疫球蛋白轻链”是含有免疫球蛋白的抗原结合结构域的至少一部分和免疫球蛋白轻链的可变区的至少一部分或恒定区的至少一部分的多肽。因此,免疫球蛋白源性轻链与免疫球蛋白基因超家族的成员具有显著的氨基酸同源性区。

“免疫粘附素”是嵌合的抗体样分子,所述分子将结合蛋白(通常是受体、配体或细胞粘附分子)的功能结构域与免疫球蛋白恒定结构域组合,所述免疫球蛋白恒定结构域通常包含铰链和Fc区。

“片段抗原结合(Fab)片段”是与抗原结合的抗体上的区。其由重链和轻链中的每一个的一个恒定结构域和一个可变结构域构成。

基于寻求针对其进行保护的疾病的病原体(causative agent/pathogen)选择抗病原体构建体。这些病原体可以是病毒、细菌或真菌来源的,并且可以用于预防人感染人类疾病,或用于非人哺乳动物或其它动物以预防兽医疾病。

rAAV可以包含对抗体以及具体地针对病毒病原体的中和抗体进行编码的基因。这种抗病毒抗体可以包含针对甲型流感、乙型流感和丙型流感中的一种或多种的抗流感抗体。A型病毒是最具毒性的人类病原体。与流行病相关的甲型流感的血清型包含:H1N1,其引起1918年的西班牙流感和2009年的猪流感;H2N2,其引起1957年的亚洲流感;H3N2,其引起1968年的香港流感;H5N1,其引起2004年的禽流感;H7N7;H1N2;H9N2;H7N2;H7N3;以及H10N7。其它靶病原性病毒包含:沙粒病毒(包含funin、马丘波病毒(machupo)和拉沙热病毒(Lassa))、丝状病毒(包含马尔堡病毒(Marburg)和埃博拉病毒(Ebola))、汉坦病毒、小核糖核酸病毒(picornoviridae)(包含鼻病毒、艾柯病毒)、冠状病毒、副粘病毒、麻疹病毒、呼吸道合胞病毒、囊膜病毒、柯萨奇病毒、JC病毒、细小病毒B19、副流感病毒、腺病毒、呼吸道肠道病毒、来自痘病毒家族的天花病毒(variola)(大天花(天花(Smallpox))和牛痘(Vaccinia/Cowpox)以及水痘-带状疱疹病毒(伪狂犬病)。病毒性出血热是由沙粒病毒家族(拉沙热)(此家族也与淋巴细胞性脉络丛脑膜炎病毒(LCM)相关)、丝状病毒(埃博拉病毒)和汉坦病毒(普马拉病毒(puremala))的成员引起的。小核糖核酸病毒(鼻病毒的亚家族)的成员与人普通感冒相关。冠状病毒家族包含多种非人类病毒,如传染性支气管炎病毒(家禽)、猪传染性胃肠炎病毒(猪)、猪血凝素脑脊髓炎病毒(猪)、猫传染性腹膜炎病毒(猫)、猫肠道冠状病毒(猫)、犬冠状病毒(狗)。已经推定人呼吸道冠状病毒与普通感冒、非甲型、乙型或丙型肝炎以及突发性急性呼吸综合症(SARS)相关。副粘病毒家族包含副流感病毒1型、副流感病毒3型、牛副流感病毒3型、腮腺炎病毒属(腮腺炎病毒)、副流感病毒2型、副流感病毒4型、新城疫病毒(鸡)、牛瘟、麻疹病毒(包含麻疹和犬瘟热)和肺炎病毒(包含呼吸道合胞病毒(RSV)。细小病毒家族包含猫细小病毒(猫肠炎)、猫泛白细胞减少症病毒、犬细小病毒和猪细小病毒。腺病毒家族包含引起呼吸道疾病的病毒(EX、AD7、ARD、O.B.)。因此,在某些实施例中,本文所描述的rAAV载体可以被工程化以表达抗埃博拉抗体(例如,2G4、4G7、13C6)、抗流感抗体(例如,FI6、CR8033)和抗RSV抗体(例如,帕利珠单抗(palivizumab)、莫维珠单抗(motavizumab))。也可以选择针对细菌病原体的中和抗体构建体用于本发明中。在一个实施例中,中和抗体构建体针对细菌本身。在另一个实施例中,中和抗体构建体针对由细菌产生的毒素。空气传播的细菌病原体的实例包含例如脑膜炎奈瑟氏球菌(Neisseriameningitidis)(脑膜炎)、肺炎克雷伯菌(Klebsiella pneumonia)(肺炎)、铜绿假单胞菌(Pseudomonas aeruginosa)(肺炎)、伪鼻疽假单胞菌(Pseudomonas pseudomallei)(肺炎)、鼻疽假单胞菌(Pseudomonas mallei)(肺炎)、不动杆菌(肺炎)、卡他莫拉菌(Moraxella catarrhalis)、腔隙莫拉菌(Moraxella lacunata)、产碱杆菌属(Alkaligenes)、心杆菌属(Cardiobacterium)、流感嗜血杆菌(Haemophilus influenzae)(流感)、副流感嗜血杆菌(Haemophilus parainfluenzae)、百日咳博代氏杆菌(Bordetellapertussis)(百日咳)、土拉弗朗西斯菌(Francisella tularensis)(肺炎/发烧)、肺炎军团菌(Legionella pneumonia)(军团病)、鹦鹉热衣原体(Chlamydia psittaci)(肺炎)、肺炎衣原体(Chlamydia pneumoniae)(肺炎)、结核分枝杆菌(Mycobacterium tuberculosis)(肺结核(TB))、堪萨斯分枝杆菌(Mycobacterium kansasii)(TB)、鸟分枝杆菌(Mycobacterium avium)(肺炎)、星状诺卡氏菌(Nocardia asteroides)(肺炎)、炭疽杆菌(Bacillus anthracis)(炭疽)、金黄色葡萄球菌(Staphylococcus aureus)(肺炎)、酿脓链球菌(Streptococcus pyogenes)(猩红热)、肺炎链球菌(Streptococcus pneumoniae)(肺炎)、白喉棒状杆菌(Corynebacteria diphtheria)(白喉)、肺炎支原体(Mycoplasmapneumoniae)(肺炎)。

rAAV可以包含对抗体以及具体地针对细菌病原体(如炭疽的病原体,即由炭疽杆菌产生的毒素)的中和抗体进行编码的基因。已经描述了针对形成类毒素的三种肽之一的保护剂(PA)的中和抗体。其它两种多肽由致死因子(LF)和水肿因子(EF)组成。抗PA中和抗体已经被描述为有效针对炭疽进行被动地免疫。参见例如美国专利第7,442,373号;R.Sawada-Hirai等人,《基于免疫的疫苗疗法杂志(J Immune Based Ther Vaccines)》2004;2:5.(2004年5月12日在线)。已经描述和/或可以产生仍其它抗炭疽毒素中和抗体。类似地,针对其它细菌和/或细菌毒素的中和抗体可以用于产生如本文所描述的AAV递送性抗病原体构建体。

针对传染病的抗体可以由寄生虫或真菌引起,所述真菌包含例如曲霉菌(Aspergillus species)、伞枝犁头霉(Absidia corymbifera)、匍枝根霉(Rhixpusstolonifer)、密丛毛霉(Mucor plumbeaus)、新型隐球菌(Cryptococcus neoformans)、荚膜组织胞浆菌(Histoplasm capsulatum)、皮炎芽生菌(Blastomyces dermatitidis)、粗球孢子菌(Coccidioides immitis)、青霉菌(Penicillium species)、干草小多孢菌(Micropolyspora faeni)、普通高温放线菌(Thermoactinomyces vulgaris)、互隔交链孢霉(Alternaria alternate)、枝孢菌(Cladosporium species)、长蠕孢属(Helminthosporium)和葡萄穗霉(Stachybotrys species)。

rAAV可以包含对抗体以及具体地针对以下疾病的致病因子的中和抗体进行编码的基因:如阿尔茨海默氏病(AD)、帕金森氏病(PD)、GBA相关的帕金森氏病(GBA-PD)、类风湿关节炎(RA)、肠易激综合症(IBS)、慢性阻塞性肺病(COPD)、癌症、肿瘤、全身性硬化症、哮喘和其它疾病。此类抗体可以是但不限于例如α-突触核蛋白、抗血管内皮生长因子(VEGF)(抗VEGF)、抗VEGFA、抗PD-1、抗PDL1、抗CTLA-4、抗TNF-α、抗IL-17、抗IL-23、抗IL-21、抗IL-6、抗IL-6受体、抗IL-5、抗IL-7、抗XII因子、抗IL-2、抗HIV、抗IgE、抗肿瘤坏死因子受体1(TNFR1)、抗-notch 2/3、抗-notch 1、抗OX40、抗erb-b2受体酪氨酸激酶3(ErbB3)、抗ErbB2、抗β细胞成熟抗原、抗B淋巴细胞刺激剂、抗CD20、抗HER2、抗粒细胞巨噬细胞集落刺激因子、抗制瘤素M(OSM)、抗淋巴细胞活化基因3(LAG3)蛋白、抗CCL20、抗血清淀粉样蛋白P组分(SAP)、抗脯氨酰羟化酶抑制剂、抗CD38、抗糖蛋白IIb/IIIa、抗CD52、抗-CD30、抗IL-1β、抗表皮生长因子受体、抗CD25、抗RANK配体、抗补体系统蛋白C5、抗CD11a、抗CD3受体、抗α-4(α4)整联蛋白、抗RSV F蛋白和抗整联蛋白α

II.rAAV载体产生

供产生AAV病毒载体(例如,重组(r)AAV)之用,表达盒可以携带在递送到包装宿主细胞的任何合适的载体(例如,质粒)上。可在本发明使用的质粒可以被工程化,使得其适合于在原核细胞、昆虫细胞、哺乳动物细胞以及其它细胞中进行体外复制和包装。合适的转染技术和包装宿主细胞是已知的和/或可以由本领域的技术人员容易地设计。

用于产生和分离适合于用作载体的AAV的方法是本领域已知的。通常参见例如Grieger和Samulski,2005,“腺相关病毒作为基因疗法载体:载体开发、产生和临床应用(Adeno-associated virus as a gene therapy vector:Vector development,production and clinical applications)”,《生化工程/生物技术进展(Adv.Biochem.Engin/Biotechnol)》99:119-145;Buning等人,2008,“腺相关病毒载体技术的最新开发(Recent developments in adeno-associated virus vector technology),”《基因医学杂志(J.Gene Med)》10:717-733;以及下文引用的参考文献,这些参考文献中的每个参考文献通过引用整体并入本文中。为了将转基因包装到病毒粒子中,ITR是在与含有表达盒的核酸分子相同的构建体中需要的顺式的唯一AAV组分。cap和rep基因可以反式供应。

在一个实施例中,本文所描述的表达盒被工程化到基因元件(例如,穿梭质粒),所述基因元件将其上携带的转基因构建体序列转移到包装宿主细胞中以产生病毒载体。在一个实施例中,所选基因元件可以通过任何合适的方法递送到AAV包装细胞,所述方法包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的粒料、病毒感染和原生质体融合。也可以制备稳定的AAV包装细胞。可替代地,表达盒可以用于产生除AAV之外的病毒载体。用于制备此类构建体的方法对核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如《分子克隆:实验室手册》,由Green和Sambrook编辑,冷泉港实验室出版社,冷泉港,纽约(2012)。

术语“AAV中间体”或“AAV载体中间体”是指缺少包装在其中的所期望的基因组序列的组装的rAAV衣壳。这些也可以被称为“空”衣壳。此类衣壳可以不含有表达盒的可检测基因组序列,或者含有不足以实现基因产物的表达的仅部分包装的基因组序列。这些空衣壳是无功能的以将所关注的基因转移到宿主细胞。

可以使用已知的技术产生本文所描述的重组腺相关病毒(AAV)。参见例如WO2003/042397;WO 2005/033321、WO 2006/110689;US 7588772 B2。此类方法涉及培养含有对AAV衣壳蛋白进行编码的核酸序列的宿主细胞;功能性rep基因;至少由AAV反向末端重复序列(ITR)和转基因构成的表达盒;以及足以允许将表达盒包装到AAV衣壳蛋白中的辅助功能。已经描述了产生衣壳的方法、其编码序列以及产生rAAV病毒载体的方法。参见例如Gao等人,《美国国家科学院院刊》100(10):6081-6086(2003)和US 2013/0045186A1。

在一个实施例中,提供了一种可用于产生重组AAV的产生细胞培养物。这种细胞培养物含有在宿主细胞中表达AAV衣壳蛋白的核酸;适合于包装到AAV衣壳中的核酸分子,例如含有AAV ITR和对基因产物进行编码的非AAV核酸序列的载体基因组,所述非AAV核酸序列可操作地连接到引导产物在宿主细胞中的表达的序列;以及足以允许将核酸分子包装到重组AAV衣壳中的AAV rep功能和腺病毒辅助功能。在一个实施例中,细胞培养物由哺乳动物细胞(例如,人胚肾293细胞以及其它细胞)或昆虫细胞(例如,杆状病毒)构成。

任选地,rep功能由除提供衣壳的AAV之外的AAV提供。例如,rep可以是但不限于AAV1 rep蛋白、AAV2 rep蛋白、AAV3 rep蛋白、AAV4 rep蛋白、AAV5 rep蛋白、AAV6 rep蛋白、AAV7 rep蛋白、AAV8 rep蛋白;或rep 78、rep 68、rep 52、rep 40、rep68/78和rep40/52;或其片段;或另一种来源。任选地,rep和cap序列在细胞培养物中位于同一基因元件上。rep序列与cap基因之间可以存在间隔子。这些AAV或突变AAV衣壳序列中的任一种都可以在引导其在宿主细胞中表达的外源性调节控制序列的控制下。

在一个实施例中,在合适的细胞培养物(例如,HEK 293)细胞中制造细胞。用于制造本文所描述的基因疗法载体的方法包含本领域众所周知的方法,如产生用于产生基因疗法载体的质粒DNA、产生载体以及纯化载体。在一些实施例中,基因疗法载体是AAV载体,并且所产生的质粒是对包含所关注的基因的载体基因组进行编码的AAV顺式质粒、含有AAVrep和cap基因的AAV反式质粒以及腺病毒辅助质粒。载体产生过程可以包含方法步骤,如开始细胞培养、进行细胞传代、接种细胞、用质粒DNA转染细胞、将转染后培养基交换为无血清培养基以及采集含载体的细胞和培养基。所采集的含载体的细胞和培养基在本文中被称为粗细胞采集物。在又另一个系统中,通过用基于杆状病毒的载体进行感染来将基因疗法载体引入到昆虫细胞中。关于这些产生系统的综述,通常参见例如Zhang等人,2009,“用于大规模重组腺相关病毒产生的腺病毒-腺相关病毒杂合体(Adenovirus-adeno-associatedvirus hybrid for large-scale recombinant adeno-associated virus production)”,《人类基因疗法(Human Gene Therapy)》20:922-929,这些参考文献中的每个参考文献的内容通过引用整体并入本文中。在以下美国专利中也描述了制备和使用这些及其它AAV产生系统的方法,这些美国专利中的每个美国专利的内容通过引用整体并入本文中:5,139,941;5,741,683;6,057,152;6,204,059;6,268,213;6,491,907;6,660,514;6,951,753;7,094,604;7,172,893;7,201,898;7,229,823;和7,439,065。

此后,粗细胞采集物可以是本主题的方法步骤,如浓缩载体采集物、渗滤载体采集物、微流化载体采集物、核酸酶消化载体采集物、过滤经过微流化的中间体、通过色谱粗纯化、通过超速离心法粗纯化、通过切向流过滤进行缓冲液交换和/或调配和过滤以制备大量载体。

在高盐浓度下进行两步亲和色谱纯化,然后使用阴离子交换树脂色谱来纯化载体药物产物并去除空衣壳。在国际专利公开第WO 2017/160360号中更详细地描述了这些方法,其通过引用并入本文中。对于AAV8,公开第WO2017/100676号中描述了纯化方法,并且对于rh10,国际专利公开第WO 2017/100704号中描述了纯化方法,并且对于AAV1,国际专利公开第WO 2017/100674号中描述了纯化方法,这些国际专利公开通过引用全部并入本文中。

为了计算空颗粒和完整颗粒的含量,将所选样品(例如,在本文的实例中经过碘克沙醇(iodixanol)梯度纯化的制剂,其中GC#=颗粒#)的VP3带体积相对于加载的GC颗粒进行作图。所得线性等式(y=mx+c)用于计算测试品峰的带状体积中的颗粒的数量。然后将加载的每20μL颗粒数量(pt)乘以50,以得到颗粒(pt)/mL。将Pt/mL除以GC/mL得到颗粒与基因组拷贝的比率(pt/GC)。Pt/mL-GC/mL得到空pt/mL。空pt/mL除以pt/mL并且×100得到空颗粒的百分比。

通常,用于测定具有包装的基因组的空衣壳和AAV载体颗粒的方法是本领域已知的。参见例如Grimm等人,《基因疗法》(1999)6:1322-1330;Sommer等人,《分子疗法(Molec.Ther.)》(2003)7:122-128。为了测试变性的衣壳,所述方法包含使经过处理的AAV原液经受SDS-聚丙烯酰胺凝胶电泳(由能够分离三种衣壳蛋白的任何凝胶组成,例如在缓冲液中含有3-8%三乙酸盐的梯度凝胶),然后运行凝胶直到分离出样品材料,并且将凝胶印迹到尼龙或硝酸纤维素膜(优选地是尼龙)上。然后,将抗AAV衣壳抗体用作与变性的衣壳蛋白结合的初级抗体,优选地抗AAV衣壳单克隆抗体,最优选地B1抗AAV2单克隆抗体(Wobus等人,《病毒学杂志》(2000)74:9281-9293)。然后使用次级抗体,所述次级抗体与初级抗体结合并且含有一种用于检测与初级抗体的结合的装置,更优选地是含有与其共价结合的检测分子的抗IgG抗体,最优选地是与辣根过氧化物酶共价连接的绵羊抗小鼠IgG抗体。一种用于检测结合的方法用于半定量地确定初级抗体与次级抗体之间的结合,优选地是能够检测放射性同位素发射、电磁辐射或比色变化的检测方法,最优选地是化学发光检测试剂盒。例如,对于SDS-PAGE,可以从柱级分中提取样品并在含有还原剂(例如,DTT)的SDS-PAGE上样缓冲液中加热,并且在预制的梯度聚丙烯酰胺凝胶(例如,Novex)上解析衣壳蛋白。可以根据制造商的说明使用SilverXpress(加利福尼亚州英杰公司)或其它合适的染色方法(即SYPRO红宝石色或考马斯染色)进行银染色。在一个实施例中,可以通过定量实时PCR(Q-PCR)测量柱级分中的AAV载体基因组(vg)的浓度。将样品稀释并用DNase I(或另一种合适的核酸酶)消化以去除外源性DNA。在核酸酶失活后,使用引物和对引物之间的DNA序列具有特异性的TaqMan

一方面,使用了经过优化的q-PCR方法,所述方法利用了广谱丝氨酸蛋白酶,例如蛋白酶K(如可从凯杰公司(Qiagen)商购获得)。更具体地,经过优化的qPCR基因组效价测定与标准测定类似,不同之处在于在DNase I消化之后,将样品用蛋白酶K缓冲液稀释并用蛋白酶K处理,然后进行热失活。合适地,以等于样品大小的量用蛋白酶K缓冲液稀释样品。蛋白酶K缓冲液可以浓缩2倍或更多倍。通常,蛋白酶K处理为约0.2mg/mL,但是可以在0.1g/mL到约1mg/mL之间变化。处理步骤通常在约55℃下进行持续约15分钟,但是可以在较低温度(例如,约37℃到约50℃)下进行持续较长的时间段(例如,约20分钟到约30分钟),或者在较高的温度(例如,最高约60℃)下进行持续较短的时间段(例如,约5到10分钟)。类似地,热失活通常在约95℃下持续约15分钟,但是温度可以降低(例如,约70℃到约90℃)并且时间延长(例如,约20分钟到约30分钟)。然后将样品稀释(例如,1000倍),并如标准测定中所描述的进行TaqMan分析。

另外地或可替代地,可以使用液滴数字PCR(ddPCR)。例如,已经描述了用于通过ddPCR确定单链和自身互补AAV载体基因组效价的方法。参见例如,M.Lock等人,《人类基因疗法方法》2014年4月;25(2):115-25.doi:10.1089/hgtb.2013.131.电子出版2014年2月14日。

简而言之,用于从基因组缺陷型AAV中间体中分离具有包装的基因组序列的rAAV颗粒的方法涉及使包括重组AAV病毒颗粒和AAV衣壳蛋白中间体的悬浮液经受高效液相色谱,其中AAV病毒颗粒和AAV中间体与在高pH下平衡的强阴离子交换树脂结合,并经受盐梯度,同时监测洗脱液在约260和约280下的紫外线吸光度。可以基于所选AAV调整pH。参见例如WO2017/160360(AAV9)、WO2017/100704(AAVrh10)、WO 2017/100676(例如,AAV8)和WO2017/100674(AAV1),这些通过引用并入本文中。在此方法中,当A260/A280的比率达到拐点时,从洗脱的级分中收集AAV完整衣壳。在一个实例中,对于亲和色谱步骤,可以将经过渗滤的产物应用于有效捕获AAV2血清型的Capture Select

III.组合物和用途

本文提供了一种组合物,所述组合物含有至少一种rAAV原液(例如,rAAV原液或突变rAAV原液)和任选的载剂、赋形剂和/或防腐剂。rAAV原液是指多个rAAV载体,所述多个rAAV载体的量与例如在下文关于浓度和剂量单位的讨论中描述的量相同。

如本文所使用的,“载剂”包含任何和所有溶剂、分散介质、媒剂、涂层、稀释剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲剂、载剂溶液、悬浮液、胶质物等。这种介质和药剂用于药物活性物质的用途在本领域中是熟知的。补充性活性成分也可以并入到组合物中。短语“药学上可接受的”是指当向宿主施用时不会产生过敏或类似不良反应的分子实体和组合物。递送媒剂(如脂质体、纳米胶囊、微颗粒、微球、脂质颗粒、囊泡等)可以用于将本发明的组合物引入到合适的宿主细胞中。特别地,rAAV载体递送的转基因可以被调配用于递送,所述转基因被包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中。

在一个实施例中,组合物包含适合于递送到受试者的最终调配物,所述组合物是例如缓冲到生理上相容的pH和盐浓度的水性液体悬浮液。任选地,调配物中存在一种或多种表面活性剂。在另一个实施例中,可以将组合物作为稀释以施用于受试者的浓缩物运输。在其它实施例中,可以在施用时将组合物冻干并重构。

可以从无毒的非离子表面活性剂中选择合适的表面活性剂或表面活性剂的组合。在一个实施例中,选择终止于伯羟基的双官能嵌段共聚物表面活性剂,例如

以足够的量施用载体以转染细胞并提供足够水平的基因转移和表达,以便提供治疗益处,而不会产生过度的副作用或具有医学上可接受的生理作用,这可以由医学领域的技术人员确定。常规和药学上可接受的施用途径包含但不限于直接递送到所期望的器官(例如,肝脏(任选地通过肝动脉)、肺、心脏、眼睛、肾脏)、口服、吸入、鼻内、鞘内、气管内、动脉内、直接递送到眼睛(任选地通过眼部递送、视网膜下注射、视网膜内注射、玻璃体内、局部)、静脉内、肌内、皮下、皮内和其它亲本施用途径。在一个实施例中,施用途径是视网膜下或玻璃体内注射。如果需要的话,可以组合施用途径。

病毒载体的剂量将主要取决于如所治疗的病状、患者的年龄、体重和健康状况等因素,并且因此在患者之间可能有所不同。例如,病毒载体的治疗有效人剂量通常在约25到约1000微升到约100mL溶液范围内,所述溶液含有浓度为约1×10

可以以剂量单位调配复制缺陷型病毒组合物,以使含有的复制缺陷型病毒的量在约1.0×10

这些上述剂量可以以各种体积的载剂、赋形剂或缓冲剂调配物施用,范围为约25到约1000微升或更大的体积,包含所述范围内的所有数字,这取决于待治疗区域的大小、所使用的病毒效价、施用途径以及所述方法的所期望的效果。在一个实施例中,载剂、赋形剂或缓冲剂的体积为至少约25μL。在一个实施例中,体积为约50μL。在另一个实施例中,体积为约75μL。在另一个实施例中,体积为约100μL。在另一个实施例中,体积为约125μL。在另一个实施例中,体积为约150μL。在另一个实施例中,体积为约175μL。在又另一个实施例中,体积为约200μL。在另一个实施例中,体积为约225μL。在又另一个实施例中,体积为约250μL。在又另一个实施例中,体积为约275μL。在又另一个实施例中,体积为约300μL。在又另一个实施例中,体积为约325μL。在另一个实施例中,体积为约350μL。在另一个实施例中,体积为约375μL。在另一个实施例中,体积为约400μL。在另一个实施例中,体积为约450μL。在另一个实施例中,体积为约500μL。在另一个实施例中,体积为约550μL。在另一个实施例中,体积为约600μL。在另一个实施例中,体积为约650μL。在另一个实施例中,体积为约700μL。在另一个实施例中,体积介于约700与约1000μL之间。

在某些实施例中,剂量可以在约1×10

另一方面,提供了适合施用于受试者的水性悬浮液。在一个实施例中,悬浮液包含水性悬浮液体和约1×10

在一个实施例中,病毒构建体可以以至少约1×10

可以根据所公开的方法将上文描述的重组载体递送到宿主细胞。可以将优选地悬浮于生理上相容的载剂中的rAAV施用于人或非人哺乳动物患者。在某些实施例中,为了施用于人类患者,将rAAV适当地悬浮于含有盐水、表面活性剂和生理上相容的盐或盐的混合物的水溶液中。合适地,将调配物调整到生理上可接受的pH,例如,在pH 6到9、或pH 6.5到7.5、pH 7.0到7.7或pH 7.2到7.8的范围内。由于脑脊液的pH为约7.28到约7.32,对于鞘内递送,可能期望在此范围内的pH;而对于静脉内、视网膜下或玻璃体内注射,可能期望约6.8到约7.2的pH。然而,可以选择最宽范围和这些子范围内的其它pH用于其它递送途径。

在另一个实施例中,组合物包含载剂、稀释剂、赋形剂和/或佐剂。鉴于转移病毒所针对的适应症,本领域的技术人员可以容易地选择合适的载剂。例如,一种合适的载剂包含盐水,其可以与多种缓冲溶液(例如,磷酸盐缓冲盐水)一起调配。其它示例性载剂包含无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。缓冲液/载剂应包含防止rAAV粘附到输液管上但不干扰rAAV体内结合活性的组分。可以从无毒的非离子表面活性剂中选择合适的表面活性剂或表面活性剂的组合。在一个实施例中,选择终止于伯羟基的双官能嵌段共聚物表面活性剂,例如

任选地,本发明的组合物除rAAV和一种或多种载剂之外还可以含有其它常规药物成分,如防腐剂或化学稳定剂。合适的示例性防腐剂包含氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸甲酯、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包含明胶和白蛋白。

根据本发明的组合物可以包括药学上可接受的载剂,如上文所定义的。合适地,本文所描述的组合物包括有效量的一种或多种AAV,所述一种或多种AAV悬浮于药学上合适的载剂中和/或与合适的赋形剂混合,所述合适的赋形剂被设计成通过注射、渗透泵、鞘内导管递送到受试者或通过另一种装置或途径递送。在一个实例中,组合物被调配用于鞘内递送。

如本文所使用的,术语“鞘内递送”或“鞘内施用”是指通过注射到椎管中,更具体地注射到蛛网膜下腔中以便其到达脑脊液(CSF)的药物施用途径。鞘内递送可以包含腰椎穿刺、心室内(包含脑室内(ICV))、枕骨下/脑池内和/或C1-2穿刺。例如,可以通过腰椎穿刺引入材料以在整个蛛网膜下腔扩散。在另一个实例中,可以向小脑延髓池(cisternamagna)中注射。

如本文所使用的,术语“脑池内递送”或“脑池内施用”是指药物直接进入到小脑延髓池(cisterna magna cerebellomedularis)的脑脊液中,更具体地是通过枕骨下穿刺或通过直接注射到小脑延髓池(cisterna magna)中或通过永久定位的管的施用途径。

一方面,本文所提供的载体可以通过所述方法和/或装置鞘内施用。参见例如WO2017/181113,其通过引用并入本文中。可替代地,可以选择其它装置和方法。所述方法包括以下步骤:使脊髓针前进到患者的小脑延髓池(cisterna magna)中;将一定长度的柔性管连接到脊髓针的近侧毂,并且将阀的输出端口连接到柔性管的近端,并且在进行了所述前进和连接步骤之后,并在允许管将使用患者的脑脊液进行自身引物后,将含有一定量等渗溶液的第一容器连接到阀的冲洗入口,并且然后将含有一定量的药物组合物的第二容器连接到阀的载体入口。在将第一血管和第二血管连接到阀之后,在阀的载体入口与出口之间打开流体流动路径,并将药物组合物通过脊髓针注射到患者中,并且在注射药物组合物之后,通过阀的冲洗入口和出口打开流体流动路径,并将等渗溶液注射到脊髓针中以将药物组合物冲洗到患者中。

此方法和此装置可以各自任选地用于鞘内递送本文所提供的组合物。可替代地,其它方法和装置可以用于此类鞘内递送。

应注意的是,术语“一个(a)”或“一个(an)”是指一个或多个。如此,术语“一个(a或an)”、“一个或多个”和“至少一个”在本文中可互换使用。

词语“包括(comprise)”、“包括(comprises)”和“包括(comprising)”将被解释为是包含性而非排他性的。词语“由……组成(consist)”、“由……组成(consisting)”及其变体将被解释为是排他性的而非包含性。虽然说明书中的各个实施例是使用“包括”语言来呈现的,但是在其它情况下,也意图使用“由……组成”或“基本上由……构成”的语言来解释和描述相关的实施例。

如本文所使用的,除非另有说明,否则术语“约”意指相对于给定参考的10%(±10%)的变化性。

如本文所使用的,“疾病”、“病症”和“病状”可互换地用于指示受试者的异常状态。

除非在本说明书中另有定义,否则本文所使用的技术术语和科学术语具有与本领域的普通技术人员和参照公开文本所通常理解的相同含义,这为本领域的技术人员提供了本申请中使用的许多术语的通用指南。

术语“表达”在本文中以其最广泛的含义使用,并且包括RNA或RNA和蛋白质的产生。关于RNA,术语“表达”或“转译”尤其涉及肽或蛋白质的产生。表达可以是暂时的或可以是稳定的。

如本文所使用的,术语“NAb效价”是产生多少中和抗体(例如,抗AAV Nab)的量度,所述中和抗体中和其靶向的表位(例如,AAV)的生理作用。抗AAV NAb效价可以如在Calcedo,R等人,“针对腺相关病毒的中和抗体的世界范围的流行病(WorldwideEpidemiology of Neutralizing Antibodies to Adeno-Associated Viruses)”《传染病杂志(Journal of Infectious Diseases)》,2009.199(3):第381-390页中所描述的那样进行测量,其通过引用并入本文中。

如本文所使用的,“表达盒”是指包括编码序列、启动子并可以包含其的其它调节序列的核酸分子,所述盒可以通过基因元件(例如,质粒)递送到包装宿主细胞,并包装到病毒载体(例如,病毒颗粒)的衣壳中。通常,用于产生病毒载体的这种表达盒含有本文所描述的基因产物的编码序列,所述编码序列侧接病毒基因组的包装信号和其它表达控制序列,如本文描述的序列。

缩写“sc”是指自身互补的。“自身互补AAV”是指其中由重组AAV核酸序列所携带的编码区已经被设计成形成分子内双链DNA模板的构建体。感染后,未等待细胞介导的第二条链合成,而是两条互补的半scAAV将缔合以形成易于立即复制和转录的一条双链DNA(dsDNA)。参见例如D M McCarty等人,“自身互补重组腺相关病毒(scAAV)载体独立于DNA合成而促进高效转导(Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently of DNA synthesis)”,《基因疗法》,(2001年8月),第8卷,第16期,第1248-1254页。自身互补AAV在例如美国专利第6,596,535号;第7,125,717号;第7,456,683号中描述,这些美国专利中的每个美国专利通过引用整体并入本文中。

如本文所使用的,术语“可操作地连接”是指与所关注的基因邻接的表达控制序列以及以反式或在远处起作用以控制所关注的基因的表达控制序列两者。

术语“异源性”当结合蛋白质或核酸使用时表明蛋白质或核酸包含在自然界中未发现彼此间的相同关系的两个或更多个序列或子序列。例如,核酸通常是重组地产生的,具有来自不相关基因的布置成产生新的功能性核酸的两个或更多个序列。例如,在一个实施例中,核酸具有来自一种基因的布置成引导编码序列从不同基因表达的启动子。因此,关于编码序列,启动子是异源的。

“复制缺陷型病毒”或“病毒载体”是指其中含有所关注的基因的表达盒包装在病毒衣壳或包膜中的合成或人工病毒粒子,其中也包装在病毒衣壳或包膜内的任何病毒基因组序列均是复制缺陷型的;即,其不能产生子代病毒粒子,但保留了感染靶细胞的能力。在一个实施例中,病毒载体的基因组不包含对复制所需的酶进行编码的基因(基因组可以被工程化成“无肠的(gutless)”-仅含有所关注的转基因,其侧接扩增和包装人工基因组所需的信号),但是这些基因可以在产生期间供应。因此,这被认为可以安全地用于基因疗法,因为除非存在复制所需的病毒酶,否则不会发生通过子代病毒粒子进行的复制和感染。

在许多情况下,rAAV颗粒被称为DNase抗性的。然而,除此核酸内切酶(DNase)之外,其它核酸内切酶和核酸外切酶也可以用于本文所描述的纯化步骤中,以去除污染性核酸。可以选择此类核酸酶以降解单链DNA和/或双链DNA以及RNA。此类步骤可以含有单个核酸酶或针对不同靶标的核酸酶的混合物,并且可以是核酸内切酶或核酸外切酶。

术语“抗核酸酶”表示AAV衣壳已经在表达盒周围完全组装,所述表达盒被设计成将转基因递送到宿主细胞并保护这些包装的基因组序列在被设计成去除产生过程中可能存在的污染性核酸的核酸酶温育步骤期间免于降解(消化)。

在本发明的上下文中,术语“转译”涉及核糖体的过程,其中mRNA链控制氨基酸序列的组装以产生蛋白质或肽。

如贯穿本说明书和权利要求所使用的,术语“包括”和“包含”包含其它组分、元件、整数、步骤等。相反,术语“由……组成”及其变体不包含其它组分、元件、整数、步骤等。

如上文所描述的,除非另有说明,否则术语“约”在用于修改数值时意指±10%的变化。

以下实例仅是说明性的,并且不旨在限制本发明。

实例

以下实例报告了AAV8和另外的不同AAV血清型的广泛脱酰胺化以及来自结构、生物化学和质谱方法的支持证据。每个位点处的脱酰胺化程度取决于载体的年龄以及多个主要序列和3D结构因素,但在很大程度上不受载体回收和纯化的条件制约。证明脱酰胺化可能影响载体转导活性,并使载体活性的早期时间点丧失与在若干种AAV8天冬酰胺处快速进展的自发脱酰胺化相关。探索了稳定侧链酰胺的突变策略,从而改善载体转导并减少批次间分子变异性,所述批次间分子变异性是生物制备中的关键问题。这项研究展示了AAV衣壳异质性的先前未知的方面,并突出显示了其在开发这些用于基因疗法的载体中的重要性。

实例1中是通过一维和二维凝胶电泳、质谱和从头结构建模提供了对AAV8载体衣壳的转译后修饰的表征。在衣壳表面上鉴定了多个推定的脱酰胺化位点之后,评估了其在体内和体外两者对衣壳结构和功能的影响。实例1进一步将此分析扩展到AAV9,以确定此现象是否适用于除AAV8之外的血清型,从而证实了AAV衣壳的脱酰胺化不是血清型特异性的。实例2到5示出了不同的AAV中的脱酰胺化。

实例1:腺相关病毒衣壳的表面上的氨基酸的脱酰胺化

A.材料与方法

1.1D和2D凝胶电泳

为了进行1D SDS聚丙烯酰胺凝胶电泳(SDS-PAGE)分析,首先在存在十二烷基硫酸锂和还原剂的情况下在80℃下使AAV载体变性持续20分钟。然后,在200V下在4-12%Bis-Tris凝胶上将其运行90分钟,并用考马斯兰染色。对于图1A-图1D中的数据,肯德里克实验室有限公司(Kendrick Laboratories,Inc.)(威斯康星州麦迪逊)进行了2D凝胶电泳。对于后续实验,在内部进行了2D SDS-PAGE。为此,将3×10

2.载体产生

宾夕法尼亚大学的载体核心公司(Vector Core)生产了用于1D和2D凝胶电泳和质谱实验的重组AAV载体,并如先前所描述的通过氯化铯或碘克沙醇梯度对其进行纯化。(Lock M等人,《人类基因疗法》2010;21(10):1259-71;Gao GP等人,《美国国家科学院院刊》2002;99(18):11854-9)。产生了经过亲和力纯化的载体,如下:使HEK293细胞在十个36层超堆叠容器(康宁公司(Corning))中生长,用载体基因组质粒(pAAV-LSP-IVS2.hFIXco-WPRE-bGH)、含有AAV2 rep和AAV8 cap基因的反式质粒和腺病毒辅助质粒的混合物对其进行共转染。使用PEIpro(PolyPlus)作为转染试剂。转染后五天,采集上清液,通过Sartoguard PESMidicap过滤器(赛多利斯斯泰帝公司(Sartorius Stedim))进行澄清,并用苯并酶(benzonase)(密理博公司(Millipore))处理,然后添加盐以使其达到0.6M。通过切向流过滤(TFF)将澄清的块状采集材料浓缩十倍,并且然后针对四个体积的亲和柱上样缓冲液进行渗滤。在POROS CaptureSelect(赛默飞世尔科技公司)亲和柱上捕获载体,并在低pH下将载体峰直接洗脱到中和缓冲液中。将中和的洗脱液稀释到高pH的结合缓冲液中,并且将其上样到阴离子交换精制柱(Cimultus QA-8;Bia分离)上,其中制剂富集了含基因组的(完整)颗粒。用浅盐洗脱梯度洗脱完整的载体颗粒,并立即进行中和。最后,使载体经受第二轮TFF,以进行最终浓缩,并将缓冲液交换成调配物缓冲液(PBS+0.001%普朗尼克(pluronic)F-68)。

通过六孔板中的HEK293细胞的小规模三重转染产生用于体外测定的突变载体。将5.6μL 1mg/mL聚乙烯亚胺溶液在90μL无血清培养基中与质粒DNA(在90μL无血清培养基中,0.091μg顺式质粒,0.91μg反式质粒,1.82μgδF6 Ad-辅助质粒)混合,将其在室温下温育持续15分钟,并且将其添加到细胞中以及另外0.8mL新鲜的无血清培养基中。第二天,用完全血清培养基代替0.5mL的顶部培养基。转染后三天,通过三个冷冻/融化循环采集载体,然后离心以去除细胞碎片并收集上清液。顺式质粒含有转基因盒,所述转基因盒在鸡β-肌动蛋白(CB7)启动子以及普洛麦格(Promega)嵌合内含子和兔β-珠蛋白(RBG)聚腺苷酸化信号的控制下对萤火虫荧光素酶转基因进行编码。反式质粒对wtAAV8 cap基因进行编码;为了产生突变AAV8 cap变体,使用了Quikchange Lightning Mutagenesis试剂盒(特拉华州威明顿市安捷伦科技公司(Agilent Technologies,Wilmington,DE)。如先前所描述的滴定载体。(Lock M等人,《人类基因疗法》2010;21(10):1259-71)。

对于时程载体产生实验,通过HEK293细胞在15cm组织培养皿中的中等规模的三重转染产生载体。对于每个板,将36μL 1mg/mL聚乙烯亚胺溶液在2mL无血清的培养基中与质粒DNA(0.6μg顺式质粒,5.8μg反式质粒,11.6μgδF6 Ad-辅助质粒)混合,在室温下温育持续15分钟,并且在用14ml无血清培养基更新的板上将其以约60%汇合度添加到细胞中。接下来的一天,用新鲜的全血清培养基替代8ml的顶部培养基。通过收集所有顶部培养基,从培养皿中刮下细胞并将其冷冻在-80℃下来采集载体。通过应用3次冷冻/融化循环并通过离心澄清裂解物,从上清液/细胞混合物中回收粗载体。通过向澄清的裂解物中添加苯并酶、1M Tris pH 7.5和5M NaCl来纯化和浓缩用于质谱分析的载体,使其最终浓度为20mM Tris和360mM NaCl。在1ml POROS CaptureSelect亲和柱上捕获载体,并在低pH下将载体峰直接洗脱到中和缓冲液中。通过在280nm处的吸光度分析级分,并且使最浓缩的级分经受质谱分析。

对于体内实验,产生了如先前所描述的具有wtAAV8衣壳或具有6个脱酰胺化突变体之一的载体;转基因盒包含CB7启动子、PI内含子、萤火虫荧光素酶转基因和RBG聚腺苷酸化信号(Lock M等人,《人类基因疗法》2010;21(10):1259-71)。

3.质谱运行/消化/分析

材料:从西格玛公司(密苏里州圣路易斯市)购买了碳酸氢铵、DTT、碘乙酰胺(IAM)和富集18O的水(纯度为97.1%);并且从赛默飞世尔科技公司(伊利诺伊州罗克福德市)购买了乙腈、甲酸、三氟乙酸(TFA)、8M盐酸胍(GndHCl)和胰蛋白酶。

胰蛋白酶消化:制备了1M DTT和1.0M碘乙酰胺的储备溶液。使衣壳蛋白变性,并在存在10mM DTT和2M GndHCl的情况下在90℃下还原十分钟。允许样品冷却到室温,并且然后在黑暗中在室温下用30mM IAM使其烷基化30分钟。通过添加1mL DTT淬灭烷基化反应。将20mM碳酸氢铵(pH 7.5-8)以将最终的GndHCl浓度稀释到200mM的一定体积添加到变性的蛋白质溶液中。添加胰蛋白酶溶液,使胰蛋白酶与蛋白质的比率达到1:20,并在37℃下温育过夜。在消化之后,将TFA添加到最终浓度0.5%,以淬灭消化反应。

对于18O水实验,首先使用Zeba旋转脱盐柱(伊利诺伊州罗克福德市赛默飞世尔科技公司)将衣壳样品缓冲液交换成在18O水中制备的100mM碳酸氢铵。为了确保完全去除样品中的水,进行了两次缓冲液交换。在18O水中制备了1M DTT和1M IAM的储备溶液。使用18O水试剂和缓冲液进行与上述相同的变性、烷基化和消化步骤。

液相色谱串联-质谱:使用Acclaim PepMap柱(长15cm,内径300μm)和与具有NanoFlex源的Q Exactive HF(赛默飞世尔科技公司)联接的Thermo UltiMate 3000RSLC系统(赛默飞世尔科技公司)进行在线色谱。在线分析期间,柱温保持在35℃下。用流动相A(含0.1%甲酸的MilliQ水)和流动相B(含0.1%甲酸的乙腈)的梯度分离肽。梯度在15分钟内从4%B运行到6%B,在25分钟内运行到10%B(共40分钟),并且然后在46分钟内运行到30%B(共86分钟)。将样品直接上样到柱上。柱尺寸为75cm×15um I.D.,并装有2微米的C18培养基(Acclaim PepMap)。由于上样、导入和洗涤步骤,每个液相色谱串联-质谱的总时间为约两小时。

在Q Exactive HF质谱仪上使用数据依赖性前20种方法获取质谱数据,所述质谱仪从调查扫描(200-2000m/z)中动态选择最丰富的尚未测序的前体离子。通过高能碰撞解离片段化进行测序,其中通过预测性自动增益控制确定的靶值为1e5离子;并且以4m/z的窗口进行前体分离。在200m/z下以120,000的分辨率获取调查扫描。HCD光谱的分辨率在m/z200下设置为30,000,其中最大离子注入时间为50毫秒,并且归一化碰撞能量为30。S-透镜RF水平设置为50,以使来自消化的肽所占据的m/z区达到最佳传输。从片段化选择中排除具有单个、未分配或六个和更高电荷状态的前体离子。

数据处理:使用BioPharma Finder 1.0软件(赛默飞世尔科技公司)分析所获取的所有数据。对于肽作图,使用单进入蛋白FASTA数据库进行搜索,其中脲基甲基化设置为固定的修饰,并将氧化、脱酰胺化和磷酸化设置为可变修饰。对于串联质谱,使用了10ppm的质量准确度、高蛋白酶特异性和0.8的置信水平。脱酰胺化的肽的质谱鉴定相对简单,因为脱酰胺化向完整分子的质量添加了+0.984Da(-OH基团与-NH2基团之间的质量差)。通过将脱酰胺化的肽的质量面积除以脱酰胺化的和天然的肽的面积之和来确定特定肽的脱酰胺化百分比。考虑到可能的脱酰胺化位点的数量,在不同位点处被脱酰胺化的同量异位物种可以在单个峰处共迁移。因此,源自具有多个潜在的脱酰胺化位点的肽的片段离子可以用于定位或区分多个脱酰胺化位点。在这些情况下,观察到的同位素图案内的相对强度可以用于特异性确定不同的脱酰胺化的肽异构体的相对丰度。此方法假设所有异构物种的片段化效率是相同的,并且脱酰胺化位点是独立的。此方法允许定义脱酰胺化涉及的特定位点以及脱酰胺化涉及的潜在组合。

次级数据处理:使用以下方法在马里兰州巴尔的摩市的大学进行了原始质谱的次级分析。所有质谱分析均使用Peaks Studio v5.3软件(生物信息学解决方案有限公司)。使用以下参数对原始数据文件进行数据精化:前体的m/z公差≤10ppm,并且前体电荷状态最小为2,最大为4。使用峰算法对输入光谱进行从头测序,其中前体离子误差公差为10ppm,并且产物离子误差公差为0.1Da。将消化酶设置为胰蛋白酶,可变修饰设置为氧化、磷酸化和脱酰胺化,并且固定修饰设置为半胱氨酸的脲基甲基化。

4.AAV衣壳的结构分析

从RCSB蛋白质数据库(PDB ID:3RA8)获得了AAV8原子坐标、结构因子和相关的衣壳模型。进行了结构精修,并产生了独立于AAV8 VP3的初级氨基酸序列的电子密度,以用于衣壳的三维(3D)结构分析。执行此分析以观察AAV8衣壳中的不受预期的AAV8 VP3的初级序列偏置的异天冬氨酸电子密度。使用所得结构,用N+1个甘氨酸作为异天冬氨酸对AAV8 VP3初级序列中的四个天冬酰胺进行建模,并且然后使用Crystallography和NMR系统(CNS)软件通过使用标准精修方案严格施加二十面体非结晶矩阵来精修AAV8衣壳结构(Brunger AT等人,《晶体学学报D区—生物晶体学(Acta Crystallogr D Biol Crystallogr)》1998;54(Pt 5):905-21)。从HIC-UP数据库中获得异天冬氨酸的结构模型,然后在PRODRG中生成分子词典以进行结构精修(Kleywegt GJ,《晶体学学报D区—生物晶体学》2007;63(Pt 1):94-100)。然后,计算AAV8衣壳的平均电子密度图(也在CNS中),并使用COOT软件使其可视化,然后对所得模型进行较小的调整,以将建模的异天冬氨酸残基拟合到电子密度图中(EmsleyP和Cowtan K,《晶体学学报D区—生物晶体学》2004;60(Pt 12 Pt 1):2126-32)。重复此方案,以使用N+1个甘氨酸(PDB ID:3UX1)在AAV9 VP3初级序列中另外对N512进行建模。使用COOT、PyMol和UCSF Chimera生成了所有图(Emsley P和Cowtan K等人,《晶体学学报D区—生物晶体学》2004;60(Pt 12 Pt 1):2126-32;DeLano WL PyMOL:开源分子图形工具(DeLano WL PyMOL:An Open-Source Molecular Graphics Tool)》第40卷,2002:82-92;Pettersen EF等人,《计算化学杂志(J Comput Chem)》2004;25(13):1605-12)。获得了多种先前鉴定的脱酰胺化的蛋白质(PDB ID:1DY5、4E7G、1RTU、1W9V、4E7D和1C9D)的结构,以用于将其脱酰胺化的异天冬氨酸残基的电子密度图与来自AAV8和AAV9的建模的异天冬氨酸残基进行比较(Rao FV等人,《化学生物(Chem Biol)》2005;12(1):65-76;Noguchi S等人,《生物化学》1995;34(47):15583-91;Elliott等人,《分子医学杂志(J Mol Biol)》2000;297(3):713-32)。

通过求AAV8或AAV9晶体结构原子坐标(PDB ID:3RA8、3UX1)中报告的每个天冬酰胺残基的每个原子的温度系数的平均值来确定脱酰胺化的残基的温度系数。

5.动物研究

宾夕法尼亚大学的机构动物护理和使用委员会批准了所有动物程序。为了评估载体性能,通过尾静脉注射向八周龄的C57BL/6小鼠静脉内注射3e10 GC wtAAV8或衣壳突变载体,体积为100μL。在第14天处死所有小鼠。为了体内评估荧光素酶表达,将小鼠(约20g)麻醉并腹膜内注射200μL或15mg/mL萤光素底物(马萨诸塞州沃尔瑟姆市珀金埃尔默公司(Perkin Elmer,Waltham,MA))。在萤光素施用之后五分钟对小鼠进行成像,并通过IVISXenogen体内成像系统进行成像。使用Living Image 3.0软件对所描述的所关注的区中的信号进行定量。在第7天和第14天进行测量。

6.评估突变载体效价和体外转导效率

通过抗DNAseI基因组的qPCR确定载体效价。使qPCR引物与包装的转基因的聚腺苷酸化序列粘接。为了通过荧光素酶表达体外评估载体转导效率,将0.9e5 Huh7细胞/孔接种在完整DMEM(10%胎牛血清,1%青霉素/链霉素)中的黑壁96孔板中。第二天,去除培养基,并用在完全培养基中稀释的50μL粗制或经过纯化的载体将其替代。对于每种粗载体样品,以3倍稀释系列测试4种稀释液。在48小时之后,以0.3μg/μL在完全培养基中制备荧光素(威斯康星州麦迪逊市普洛麦格公司),并以50μL的体积将其添加到经过转导的细胞中。在Biotek Clarity光度计上读取结果。发现添加到靶细胞的荧光素酶活性/GC在宽GC范围内是恒定的,但在高MOI时可能变得饱和。因此,检查了针对线性度的稀释系列数据(发光单位对比GC),如果饱和度明显,则排除最高点,并针对每种变体的每个测定的线性范围中的值计算平均荧光素酶/GC。这产生转导效率值。通过将wt对照物的值设置为1,对数据进行归一化以简化比较。

7.生物分布

使用QIAamp DNA迷你试剂盒(德国希尔登凯杰公司)从肝脏样品中提取DNA,并且然后使用针对转基因盒的RBG聚腺苷酸化信号设计的引物/探针组如先前所描述的通过实时PCR分析用于载体GC的DNA(Chen SJ等人,《人类基因疗法临床开发(Hum Gene Ther ClinDev)》2013;24(4):154-60)。

AAV8突变体的引物序列

B.结果

AAV8示出其衣壳蛋白中的大量电荷异质性

为了定量评估可能影响载体性能的AAV8载体衣壳上的转译后修饰的存在,通过1D和2D凝胶电泳两者分析了通过碘克沙醇梯度纯化的AAV8总衣壳蛋白。在1D还原十二烷基硫酸钠SDS凝胶中,VP1、VP2和VP3以单个带的形式在合适的分子量下解析(图1B)(Rose JA等人,《病毒学杂志》1971;8(5):766-70)。当通过基于电荷分离蛋白质(图1C)的2D凝胶电泳进一步评估时,取决于VP同种型,衣壳蛋白中的每种衣壳蛋白另外解析为一系列具有不同等电点(pI)的不同点,其范围从pH 6.3到>7.0(图1D)。每个VP上的单独点通过如所测量的作为相对于碳酸酐酶同种型内部等电点标准的迁移的0.1pI单位的离散间隔分开,这表明单个残基电荷发生变化。这些同种型的存在表明每个VP都有可能经历许多修饰,由此导致其在等电聚焦下不同地迁移。

其中一部分(通常为天冬酰胺)侧链酰胺基团转化为羧酸的脱酰胺化(图1A)是蛋白质制剂中电荷异质性的常见来源。为了确定脱酰胺化是否可能负责VP电荷同种型的不同群体,将两个AAV8天冬酰胺残基分别突变为天冬氨酸。这些衣壳突变应使电荷偏移,其偏移量等于使单个另外的天冬酰胺残基完全脱酰胺化的量。突变体的2D凝胶分析表明,与野生型(wt)AAV8中的等效点相比,VP1、VP2和VP3的主要点偏移更酸性的一个点位置(0.1pH单位)(图1E-图1G)。此偏移的幅度等于wt VP电荷同种型之间观察到的间隔。因此,AAV衣壳蛋白的2D凝胶图案化与多位点脱酰胺化一致。

在AAV8载体衣壳上发生自发脱酰胺化

为了鉴定负责每个衣壳蛋白的离散点样图案的修饰,通过质谱分析一组AAV8载体。AAV8衣壳蛋白的平均覆盖>总VP1序列的95%(数据未示出)。通过质谱检测到天冬酰胺和谷氨酰胺残基的子集的广泛脱酰胺化,这示出与基于由DNA编码序列的预测值相比,观察到的单独肽质量增加了约1Da;在AAV8载体的所有制剂中都观察到脱酰胺化的此模式(图2A-图2D)。

为了评估常用纯化方法之间脱酰胺化的总体异质性并检查VP1和VP2独特区中的脱酰胺化,选择了通过三重转染在293个细胞中产生的九批AAV8,并通过氯化铯梯度、碘克沙醇梯度或亲和色谱对其进行纯化。载体在启动子和转基因盒方面也不同。为了确定载体基因组的存在是否对脱酰胺化有影响,还评估了在不存在顺式质粒(仅产生空衣壳)的情况下通过三重转染在293个细胞中产生的AAV8制剂,并通过碘克沙醇梯度进行纯化。

跨AAV8衣壳的天冬酰胺和谷氨酰胺残基存在广泛范围的脱酰胺化,范围从不可检测到超过99%的被脱酰胺化的单独氨基酸(图2E)。在天冬酰胺残基处发生最高水平的脱酰胺化(>75%),其中N+1残基为甘氨酸(即,NG对)(表1)。在N+1不是甘氨酸的另外的天冬酰胺残基处检测到较低水平的脱酰胺化(即,最高17%)。制剂之间的天冬酰胺的平均脱酰胺化在很大程度上一致。还检测到在谷氨酰胺残基处的脱酰胺化,但频率比在天冬酰胺处的频率低;在Q467处观察到的最高百分比<2%(图7)。此观察结果在所有制剂中均不一致(数据未示出)。在残基N499(N+1残基是天冬酰胺)处观察到最大的制备间差异,其值范围为<1%到50%以上的脱酰胺化。无论如何,在载体制剂之间的脱酰胺化中观察到的变化似乎与纯化方法、转基因同一性或载体基因组的存在不相关,这表明这些因素不会影响脱酰胺化率。

表1:所关注的AAV8脱酰胺化的残基的特性。星号表示所选的用于进一步分析的残基。

接下来,进行了一系列实验,以确定样品处理是否有助于AAV8中的观察到的脱酰胺化水平。极端温度(70℃持续7天)或pH(pH 2或pH 10持续7天)没有显著诱导AAV8衣壳中的另外的脱酰胺化(图4A和图4B)。考虑到这种抗性,认为观察到的脱酰胺化不太可能仅发生在相对较短且较温和的纯化阶段。试图对未经纯化的载体进行质谱分析,以确定纯化前后的脱酰胺化程度,但均未成功。同样,重水对照物表明特定于质谱工作流程的处理不会有助于另外的脱酰胺化事件(图4C)。

为了验证质谱工作流程,检查了两种先前已经评估脱酰胺化的重组蛋白;所述发现(图5A和图5B)与已经公开的结果一致[Henderson,LE、Henriksson,D和Nyman,PO(1976),“人碳酸酐酶C的初级结构(Primary structure of human carbonic anhydrase C)”《生物化学杂志》251:5457-5463以及Carvalho,RN、Solstad,T、Bjorgo,E、Barroso,JF和Flatmark,T(2003),重组人苯丙氨酸羟化酶中的脱酰胺化(Deamidations in recombinanthuman phenylalanine hydroxylase)不稳定的天冬酰胺残基的鉴定和Asn-->Asp突变体形式的功能表征(Identification of labile asparagine residues and functionalcharacterization of Asn-->Asp mutant forms)《生物化学杂志》278:15142-1515]。另外,雇用了次级机构来评估来自AAV8的原始数据。此独立分析鉴定了与被脱酰胺化的位点相同的位点,其中在每个位点处的修饰程度变化最小,这归因于峰检测和面积计算中软件间的变化(图6)。

N+1氨基酸的结构拓扑、温度系数和同一性有助于脱酰胺化频率

由于AAV8的结构已经解决并公开(PDB标识符:2QA0)(Nam HJ等人,《病毒学杂志》2011;85(22):11791-99),接下来检查AAV8衣壳结构,以为非酶促脱酰胺化的有利条件提供证据,并使脱酰胺化百分比与已建立的结构特征相关(Nam HJ等人,《病毒学杂志》2007;81(22):12260-71)。仅关注天冬酰胺残基,因为影响天冬酰胺脱酰胺化的因素在文献中被更好地表征,并且天冬酰胺脱酰胺化事件远比谷氨酰胺脱酰胺化事件更为常见(Robinson,NE和Robinson,AB(2001),“分子时钟(Molecular clocks)”《美国国家科学院院刊》98:944-949)。还确定了来自AAV8晶体结构的这些残基中的每个残基的温度(或B)系数;温度系数是对原子从其平均位置开始的位移的量度,值越大表示位移越大、热振动越大,并且因此柔性越高(Parthasarathy S和Murphy MR,《蛋白质科学:蛋白质协会的出版物(ProteinScience:A Publication of the Protein Society)》1997;6:2561-7))。大多数所关注的天冬酰胺都定位在表面暴露的HVR中或其附近(表1),这在结构上有利于脱酰胺化,并提供了溶剂暴露的环境(Govindasamy L等人,《病毒学杂志》2013;87(20):11187-99)。发现平均而言定位在这些柔性环区中的残基比如β链和α螺旋等柔性较差的区中的残基更频繁地被脱酰胺。例如,在位置N263处的NG残基是HVR I的一部分,具有高温系数,并且平均被脱酰胺化>98%(图7A和图6,表1)。在所述时间内被脱酰胺化约85%的N514(图3和图6,表1)也存在于具有N+1甘氨酸的HVR(HVR V)中;然而,局部温度系数与N263的温度系数相比相对低,这是由于其与在三重轴处的其它VP单体上的残基相互作用。不利的+1残基和较低的局部温度系数与较低的脱酰胺化相关,即使对于HVR残基也是如此。例如,N517平均仅4%脱酰胺化(表1);此残基具有与高度脱酰胺化的N514相当的温度系数,但其N+1残基为丝氨酸,这降低了由于空间位阻而引起的脱酰胺化事件的可能性。这表明,尽管+1残基的同一性显然是最有影响力的因素,但许多因素会累积地确定在给定衣壳位置处的脱酰胺化程度。

为了测试+1残基在天冬酰胺脱酰胺化中的作用,产生了突变载体,其中AAV8 NG位点在+1位置处分别突变为丙氨酸或丝氨酸。模型肽研究表明,NG肽的脱酰胺化半衰期短至1天,而NA肽或NS肽的脱酰胺化通常分别慢25倍或16倍(Robinson NE和Robinson AB,《美国国家科学院院刊》2001;98(8):4367-72)。载体突变体的质谱分析证实了+1位点在确定载体脱酰胺化程度中起着核心作用。当+1位点变为丙氨酸(<5%脱酰胺化)或丝氨酸(<14%脱酰胺化)时,此集合中的NG位点(>80%脱酰胺化,在wt中)示出相邻天冬酰胺的选择性稳定(表2)。

表2:在wt中五个AAV8 NG位点处和六个+1位点突变体的脱酰胺化程度(%)

与定位在更有利的环境中的残基相比,在完整的完全组装的AAV8衣壳中,至少部分被掩埋且不易暴露于溶剂和/或定位在局部柔性低的区中的残基的脱酰胺化频率更低(表1)。尽管如此,在不利条件下的少数残基仍被脱酰胺化。例如,N630被至少部分掩埋,但仍具有可检测的脱酰胺化程度。对于此残基,苯丙氨酸作为N+1残基存在表明此区可能是AAV8 VP3蛋白内的非酶促自蛋白水解裂解的新颖位点。

AAV8 VP3的结构建模证实了脱酰胺化事件

为了提供在组装的衣壳的背景下的脱酰胺化的直接证据,评估了AAV8的晶体结构(Nam H-J等人,《病毒学杂志》2011;85(22):11791-9)。此血清型的可用晶体结构(即,

首先精修了AAV8结构本身,从而产生不受已知AAV8 VP3序列偏置的AAV8衣壳电子密度。然后,基于与异天冬氨酸相关的较短的R基团的存在,检查了经过精修的AAV8晶体结构以证明脱酰胺化(图3A-图3E)。电子密度图证实,与在410处通过质谱没有检测到脱酰胺化的天冬酰胺相比(图3B),在位置263处(图3C)、385处(未示出)、514处(图3D)和540处(图3E)高度脱酰胺化的N+1甘氨酸残基的R基团更短。因此,由电子密度图指示的脱酰胺化与通过质谱在这些位点处进行的>75%脱酰胺化的数据一致。所得异天冬氨酸模型与在其它已知的脱酰胺化的蛋白质的晶体结构中观察到的异天冬氨酸残基相当,这支持AAV8的分析的有效性(Rao FV等人,《化学生物》2005;12(1):65-76;Noguchi S等人,《生物化学》1995;34(47):15583-91;Elliott等人,《分子医学杂志》2000;297(3):713-32)。此结构分析用作对通过质谱分析AAV8衣壳时观察到的脱酰胺化现象的独立证实。

AAV衣壳的脱酰胺化不是血清型特异性的

调查了AAV8以外的血清型,以证明衣壳脱酰胺化。使用2D凝胶电泳(图11A)和质谱(图11B)检查AAV9载体制剂,包含针对潜在载体处理效果的对照物(图11D-图11F)。AAV9脱酰胺化的模式和程度与AAV8脱酰胺化的模式和程度类似。所有四个AAV9 NG位点>85%脱酰胺化;13个非NG位点的脱酰胺化程度较小,其中少数位点示出的脱酰胺化%的批次间变异性很大。接下来,应用了结构分析工作流程,并对现有的AAV9晶体学数据进行了重新拟合(图11C,表3)。与AAV8一样,异天冬氨酸更好地拟合到AAV9晶体结构中若干个NG位点的电子密度。将2D凝胶分析(数据未示出)和质谱(总结在表4中)扩展到了五种另外的进化上不同的血清型(rh32.33、AAV7、AAV5、AAV4、AAV3B和AAV1)。所有检查的衣壳均含有类似的脱酰胺化模式和程度,这表明此修饰在临床上相关的AAV载体中是广泛的,并由类似的基础初级序列和结构因素确定。

表3.所关注的AAV9脱酰胺的残基的特性。

具有同源N+1残基(与AAV8相比)的保守天冬酰胺残基以斜体表示(由AAV8和AAV9VP1的全长氨基酸序列的比对确定)。

表4.观察到不同血清型的脱酰胺化程度

脱酰胺化事件可能影响衣壳组装和转导效率

测试脱酰胺化的功能影响的一种方法是通过基因突变用天冬氨酸取代天冬酰胺。通过对293个细胞进行小规模三重转染为每个脱酰胺化的AAV8天冬酰胺产生对荧光素酶报告基因进行编码的天冬氨酸突变载体,并通过抗DNAseI基因组拷贝的qPCR对载体进行滴定(图8A)。相对于wtAAV8,突变极少影响衣壳组装,并且影响仅限于wt载体中总体上具有低脱酰胺化的大部分掩埋的非NG位点。接下来,评估人肝源性Huh7细胞的突变组体外转导效率(图8B)。若干个突变体示出受损的转导效率,其中位置N57、N94、N263、N305、Q467、N479和N653表现出>10倍的转导损失。观察到类似数量的AAV9的敏感位点(图11G和图11H)。通常,在给定位置处只有一部分残基是内源性脱酰胺化的,因此此方法可能会高估蛋白质(如衣壳)的功能丧失,其中功能单元是同单体组装;在一个衣壳位点处的内源性修饰可以被具有完整残基的相邻亚基补偿。尽管如此,认为所述方法可以帮助脱酰胺化的残基进行优先级排序,以便在制备或突变稳定期间进行进一步监测。将需要来自内源性脱酰胺化载体的群体的功能数据,以将这种功能丧失诱变数据置于适当的背景下。

随着时间的推移的载体活性丧失与进行性脱酰胺化相关

考虑到NG脱酰胺化的半衰期很短,认为年龄相差仅1天的载体样品可能示出不同的脱酰胺化谱,从而提供使内源性脱酰胺化与功能相关的机会。大规模载体制备方案要求对293个细胞进行三重转染,然后温育5天以产生载体,并需要1-2天进行载体纯化。为了近似此过程,用wt AAV8制备293个细胞的中等规模三重转染(每个细胞培养皿10×15cm)。以1天的间隔收集载体(2×15cm细胞培养皿/天)持续5天,从而通过将载体冷冻在-80℃下保存到5天结束的时间点。接下来,如上文所描述的评估粗载体效价和体外转导效率。如所期望的,组装的抗DNAseI基因组拷贝的数量随时间推移而增加(图9A)。然后,通过亲和纯化快速处理早期(第1天和第2天)和晚期(第5天)时间点的粗载体,并测量huh7细胞的体外转导效率。载体的相对转导效率随时间推移而逐渐降低(图9B)。就添加到靶细胞的每个GC的转基因表达而言,第5天的载体的效率为第1天的材料的效率的仅40%。也观察到粗材料的此活性下降,这表明纯化前分子组合物的变化(图)。观察到5天内AAV9的活性丧失趋势类似,其中载体效力降低了约40%(图11I-11K)。

接下来,通过质谱测量时程样品的脱酰胺化。NG位点脱酰胺化基本上在每个间隔内进行,其中在第1天平均25%脱酰胺化,并且到第5天转化的位点>60%(图9C)。非NG位点脱酰胺化通常在5天内进行,尽管在第2天与第5天之间的水平要低得多并且一致性较低(图9D)。数据使内源性载体脱酰胺化与特异性活性的早期时间点衰减相关,并通过缩短生产周期或寻找稳定天冬酰胺的衣壳突变突出显示捕获更多活性载体的潜在机会。

应注意的是,图2A-图2E中的用于质谱分析的材料是转染后至少7天的,这是由于另外2天用于纯化。这些样品中的较高NG位点脱酰胺化(>80%)表明,脱酰胺化可能会在表达时间段之后以及在回收和纯化过程期间以约相同的速率继续进行,直到NG位点被完全脱酰胺化或载体样品被冷冻。因此,脱酰胺化很大程度上由载体的年龄确定,而不是回收和纯化过程所独有或引起的过程。第1天的材料对比第5天的材料(均经过亲和纯化)的低得多的脱酰胺化值说明了这一点。

稳定NG天冬酰胺可以改善载体性能

考虑到载体NG脱酰胺化与转导效率损失之间的相关性,认为通过+1位点诱变稳定NG酰胺可以改善载体功能。以小规模为AAV8 NG位点突变体产生载体,其中每个+1残基分别转化为丙氨酸或丝氨酸。就载体组装(图10A)和转导效率(图10B)而言,单个+1突变体具有良好的耐受性。定位在衣壳表面上的先前定义的“死区”附近的G386取代(Aydemir F等人,《病毒学杂志》2016年7月;90(16):7196-204)存在体外转导缺陷。G386突变体的功能丧失可能表明对在N385处的脱酰胺化的天冬酰胺的偏好。可替代地,+1位置处的另外的侧链本体可能对独立于酰胺基团稳定化的功能具有负面影响。尽管其相邻的天冬酰胺具有显著的稳定性,但单个位点突变体没有显著改善体外转导(表2)。因为体外和体内的转导活性可能不一致,所以在C57BL/6小鼠中测试了用于肝脏转导的单个位点+1突变体的子集。进行静脉内尾静脉注射(n=3到5),并通过持续2周的每周成像来检查荧光素酶表达(图10C)。体内和体外转导数据与每个测定的相关误差范围相一致(即,在误差范围内)。G386取代在转导方面是有缺陷的,而在其它位置处的+1位点突变在很大程度上被耐受,从而以等于但不超过wtAAV8的水平转导肝脏。

由于在任何一个NG位点处稳定酰胺可能是必要的,但不足以恢复功能,因此接下来评估了具有+1位点丙氨酸取代的组合的载体变体。重组+1丙氨酸功能强大的所有3个AAV8 NG位点(N263、N514和N540)。一些包含三重突变体G264A/G515A/G541A的组合组装不佳,并且对转导而言具有功能障碍。然而,涉及N263的两种成对组合(G246A/G515A和G264A/G541A)均改善了体外转导效率(分别是wtAAV8的2.0倍和2.6倍),而没有效价损失(图10D)。因为这些突变会引入至少两种变化(N-酰胺稳定化和+1残基侧链取代),所以这些数据不能最终将NG脱酰胺化与功能丧失联系起来。然而,数据与在时程研究中建立的模型一致,在所述模型中,NG位点脱酰胺化可能影响体外转导效率。

功能性天冬酰胺取代改进了载体制备的批次间重现性

报告的载体脱酰胺化谱的另一个潜在问题方面是在一些位置处的脱酰胺化具有高批次间变异性。对于wtAAV8,此变异性对于N459(观察到的脱酰胺化范围为0%到31%)和N499(观察到的脱酰胺化范围为0%到53%)最为显著。通常在生物制剂开发期间实际上要避免转译后修饰中的变异性,这通过完全避免表现出此变异性的克隆,仔细监测和控制生产菌株和条件,或者对受影响的候选物进行蛋白质工程化。

由于无法确定导致N459和N499脱酰胺化变异性的生产或加工因素(图2E),因此寻求在这些位置处进行功能性氨基酸取代。首先评估了小规模载体制剂在各个位置处分别被谷氨酰胺保守取代的可能性。N459Q和N499Q两者都高效地组装到载体中,并且与wtAAV8的体外转导效率参考相当(图7A)。接下来,大规模产生突变体并进行质谱。与对极为罕见的谷氨酰胺脱酰胺化的观察一致,观察到这些突变体中在位置459或499处的谷氨酰胺具有选择性和完全的稳定性(数据未示出)。如上所述在C57BL/6小鼠的尾静脉注射后体内评估了这些突变体批次的肝脏转导(图7B和图7C)。在此实验中用作对照物的wtAAV8载体批次在N499处脱酰胺化16.8%,但是在N459处未检测到脱酰胺化(数据未示出)。两个突变体在第14天的肝脏转导等同于wtAAV8的肝脏转导。此数据证明了蛋白质工程化方法解决制备的AAV载体中与脱酰胺化相关的分子变异性的潜力。

C.讨论

分别通过2D凝胶电泳、质谱、从头蛋白质建模以及体外和体内两者的功能研究来鉴定和评估AAV8衣壳上天冬酰胺和谷氨酰胺残基的非酶促脱酰胺化。已经示出脱酰胺化发生在广泛多种蛋白质中,并显著影响生物制剂的活性,包含基于抗体的治疗剂(Nebija D等人,《国际分子科学学报(Int J Mol Sci)》2014;15(4):6399-411)和基于肽的疫苗(VermaA等人,《临床与疫苗免疫学》2016;23(5):396-402)。已经通过质谱示出其它病毒蛋白(如轮状病毒的VP6蛋白)会经历脱酰胺化事件(Emslie KR等人,《功能与整合基因组学(FunctIntegr Genomics)》2000;1(1):12-24)。

在AAV8中发生这些脱酰胺化的情况表明它们是自发的非酶促事件的结果。已知天冬酰胺残基比谷氨酰胺残基更广泛地被脱酰胺化;天冬酰胺下游的氨基酸基本上影响脱酰胺化的速率,其中N+1甘氨酸(即,NG)被最高效地脱酰胺化。观察到N+1氨基酸在AAV衣壳的脱酰胺化中的作用得到明显证实,因为VP1中存在的每个NG均以>75%的水平被脱酰胺化,而衣壳中的其它天冬酰胺或谷氨酰胺中的任一种的脱酰胺化始终从未>20%。实际上,AAV8和AAV9衣壳(即,7/9)中的所有NG基序也存在于与构象柔性和热振动的高速率相关的HVR区中含有的衣壳的表面上。这与其它蛋白质的NG基序的先前报告是一致的,所述其它蛋白质定位在可能需要柔性来实现适当蛋白质功能的区中,而不是在更有序的结构中,如α螺旋或β折叠(Yan BX和Sun YQ,《生物化学杂志》1997;272(6):3190-4)。通过提供溶剂可及性和构象柔性,对表面暴露的HVR中NG基序的偏好进一步增强了脱酰胺化速率,由此促进了琥珀酰亚胺基中间体的形成。如所预期的,不利的环境导致脱酰胺化速率低得多。

关于AAV的生物学及其作为载体的用途的重要问题是这些脱酰胺化的功能后果。将天冬酰胺转化为天冬氨酸的衣壳DNA的诱变允许评估衣壳,其中在特定位点处的所有氨基酸均表示为天冬氨酸。然而,除潜在地突变N+1残基之外,不存在使用诱变防止脱酰胺化的任何容易的策略,这与第二位点突变的直接后果相混淆。研究了有限数量的变体,其中通过诱变将天冬酰胺残基转化为天冬氨酸。功能分析包含衣壳组装以及体外和体内转导。诱变对载体功能的最基本影响是涉及在基线处没有被完全地脱酰胺化并且没有暴露的表面的天冬酰胺的影响。然而,令人惊讶的是,在514处将高度脱酰胺化的天冬酰胺诱变为天冬氨酸确实对功能有一些影响。此结果表明对应酰胺的残留量的存在可能影响功能。这可能部分地由于另一三倍相关的VP3单体(在wtAAV8晶体结构中鉴定)的N514与D531之间存在氢键相互作用,所述氢键相互作用在脱酰胺化之后此残基转化为天冬氨酸时失去。

在评估这些脱酰胺化对新颖治疗剂开发的影响时,更好地了解影响AAV载体中脱酰胺化程度的因素很重要。在极端条件(已知能显著加速脱酰胺化动力学)下温育载体几乎没有影响。结合同位素并入研究,此结果表明脱酰胺化发生在衣壳组装期间,并且不是载体处理或质谱分析的伪像。在NG位点处的脱酰胺化不太可能对载体性能具有实质性影响,因为在评估的每个样品中,反应实际上都已经完成。然而,最初的功能研究表明未脱酰胺化的天冬酰胺的残留量可以有助于功能。更加关注其中脱酰胺化不完全的位点,在大多数情况下,这也与样品间的差异相关。实例是在位置499处的天冬酰胺示出的脱酰胺化范围为0%到53%,平均为17%。载体产生条件的细微差异可能会导致这种异质性。AAV8和AAV9中脱酰胺化的惊人相似性表明这是这种整个病毒家族的性质。

总之,在AAV8和AAV9衣壳蛋白的初级氨基酸结构中发现了大量异质性。这些研究可能以若干种方式影响作为载体的AAV的发展。首先,VP蛋白的实际氨基酸序列不是由对应DNA序列所预测的。其次,生产方法的各个方面可能导致脱酰胺化的差异以及载体功能的对应变化。直到掌握影响在非NG位点处的脱酰胺化速率的因素并更好地了解其功能后果之前,可能有必要在临床级AAV载体的表征中包含脱酰胺化。2D凝胶电泳可以提供净脱酰胺化的总体评估,尽管质谱对于评估在特定残基处的脱酰胺化是必不可少的。

实例2:脱酰胺化AAV5.5.9

SEQ ID NO:9和10中分别提供了AAV5.5.9的新颖序列。如实例1中针对AAV9所描述的,评估AAV5.5.9载体的脱酰胺化。在N57、N319、N442、N502处可以看到高度脱酰胺化的残基。

实例3:脱酰胺化AAVrh79(进化枝E)

AAVrh79是从恒河猴的小肠组织提取的DNA中分离出的。其在系统发育上已经被表征为在进化枝E内(图14A-14D)。本文提供了其序列,其中核苷酸序列在SEQ ID NO:1中,并且氨基酸序列在SEQ ID NO:2中。图14A中提供了AAVrh79、AAVrh.10和AAVhu.37的氨基酸序列的比对。图14B-14D中提供了AAVrh79、AAVrh.10和AAVhu.37的核酸序列的比对。

AAVrh79在其初级序列中具有三种氨基酸差异。而AAVhu37具有定位在其初级VP1序列的位置67处的Ala和在位置169处的Lys,AAVrh79具有在位置67处的谷氨酸(E)和在位置169处的Arg。图11B中示出了rh.79、hu.37和hu.40之间的VP1的DNA序列的差异。制备基于各种进化枝E变体的载体表达性eGFP,并评估其对Huh7细胞的相对感染性(图11C)。C57BL/6小鼠注射有两个剂量水平(3×10

使用已知的产生技术使用用于产生cap的AAVrh79核苷酸序列来制备基于AAVrh79的载体,如先前针对AAV8载体所描述的。图15A-15B和图16中分别提供了产生产率和产生纯度评估的结果。

为了使用含有标志物基因(萤火虫荧光素酶)的AAVrh79评估表达水平,使用汉密尔顿注射器向6-8周龄的雄性RAG KO小鼠肌内注射3×10

在向雄性和雌性食蟹猴肌内施用10

将表达分泌的转基因(201Ig IA)的载体肌内注射到雄性RAG KO小鼠(n=5/组)的腓肠肌中(3×10

预筛选雌性食蟹猴(RA2362)的NAb(图18A),并注射AAVG2.TBG.eGFP.WPRE.bGH(1×10

产生各种AAV8和AAVrh79载体,并且在一些情况下,产生了许多批次。比较这些AAV9和AAVrh79载体批次的产率(图19)。

如实例1中针对AAV8和AAV9所描述的,评估AAVrh79载体的脱酰胺化。结果示出,载体含有高度脱酰胺化的四种氨基酸(N57、N263、N385、N514),所述四种氨基酸基于AAVrh79(SEQ ID NO:1)的编号对应于天冬酰胺-甘氨酸对中的天冬酰胺。在残基N94、N254、N410中始终观察到较低的脱酰胺化百分比。

实例4:AAV8.2.08的制备

如在WO 2017/180854(通过引用并入本文)中所讨论的,产生了若干个AAV8突变体c41、c42、c46、g110、g113、g115和g117,其在HVR.VIII区中具有突变。如Gurda等人所讨论的,主要的ADK8表位位于HVR.VIII区(使用AAV8 vp1编号的氨基酸586到591)。在体外测试这些突变体的ADK8抗性,并且在体内测试其中一些的ADK8抗性。参见例如上文引用的Lochrie 2006。

随机挑选AR2.1-9。基于频率选择AR2.25-61。就6孔板产率和Huh7转导而言,随机挑选的变体以及频率较高的变体都是活的。图24示出在AAV8.AR2.08的各种组织中的表达(最左边的一组条)。

实例5:AAV8.AR2.08的脱酰胺化

SEQ ID NO:17和18中分别提供了AAV8.AR2.08的新颖序列,其如实例4中进行设计。

A.如实例1中针对AAV8所描述的,产生修饰AAV8.AR2.08载体,并评估其修饰。结果示出,载体含有高度脱酰胺化的五种氨基酸(N57、N263、N385、N514和N540),所述五种氨基酸基于AAV8.AR2.08(SEQ ID NO:18)的编号对应于天冬酰胺-甘氨酸对中的天冬酰胺。在残基N94、N254、N410中始终观察到较低的脱酰胺化百分比。与AAV8相反,在位置N459(AAV8中的平均值为7%)或N499(在AAV8中的平均值为17%)处未观察到脱酰胺化。

B.单细胞RNA-seq揭示了用AAV8处理后从非人灵长类动物中分离出的转导肝细胞的组织定位和转录特征。

单细胞RNA测序已经被证明是用前所未有的单细胞分辨率表征细胞转录组的强大技术。在当前的工作中,利用单细胞RNA-seq研究在用表达GFP的AAV8载体处理后从恒河猕猴分离出的初级肝细胞的转录情况。FACS分选的GFP+和GFP-细胞的转录组分析揭示了肝小叶内转导细胞的组织定位以及涉及肝细胞转导和转基因表达调节的基因和调节途径。

对于研究设计,恒河猴用1×1013ddGC/kg AAV8.TBG.EGFP.WPRE(n=1)或1×1013ddGC/kg AAV8.2.08.TBG.EGFP.WPRE(AAV8变体,n=1)处理。在处理后7天对动物实施安乐死,并进行尸检以从两只动物中分离出肝脏。在用胶原酶处理并进行梯度离心后,通过GFP转基因表达将分离的肝细胞FACS分选到BD Precise

发现与AAV8相比,AAV8.AR2.08具有增加的肝向性,并且表现出转导效率增加1.5倍。对分选的肝细胞进行单细胞转录组分析揭示,表达转基因的细胞均匀分布在整个肝小叶中,示出对门静脉区的轻微偏好,这也在组织病理学中观察到。感兴趣的是,发现分选的GFP-细胞的亚群体以与分选的GFP+细胞相当的水平表达转基因转录物,这表明尽管没有可检测水平的转译蛋白,但实际上这些细胞已经被转导并表达转基因mRNA。比较GFP-和GFP+细胞的转录谱揭示了参与病毒mRNA转译的差异表达的转录物,从而阐明了涉及转导细胞中的转基因蛋白表达的调节的可能途径。

C.通过人肝异种移植模型用定向进化对非人灵长类动物中具有更好肝脏转导和更高肝脏特异性的腺相关病毒8变体的分离

为了得到具有更好转导和更高特异性的AAV变体,使用靶向AAV8衣壳上的表面暴露的位点的饱和诱变执行AAV定向进化(即肝基因疗法的基准),随后在人肝异种移植小鼠模型中进行两轮体内富集,并分离出被称为AAV8.2.08的AAV8变体。在以1e13基因组拷贝(GC)/kg体重的剂量向非人灵长类动物静脉内注射后,与AAV8相比,由AAV8.AR2.08在各个器官(包含肺、心脏、胃、胰腺、肾脏和肠系膜淋巴结)中递送的载体基因组拷贝减少,而在肝脏中递送的载体基因组拷贝增加,这意味着更好的肝脏转导和更高的组织特异性。下一代测序表明,在体内选择期间,AAV8.AR2.08的显著富集证明了用新的和改良的向性分离衣壳的方法的潜力。图21到27示出了其它比较。图28示出了AAV8.AR2.08和AAV8的生物分布。

D.加条形码

6只黑色小鼠静脉内注射有2×10

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号