首页> 中国专利> 通过利用内源激活诱导性胞嘧啶脱氨酶改造B淋巴细胞

通过利用内源激活诱导性胞嘧啶脱氨酶改造B淋巴细胞

摘要

本发明提供了用于通过利用B淋巴细胞的激活诱导性胞嘧啶脱氨酶改造B淋巴细胞的方法。从而,可避免改造的核酸酶如Cas核酸酶的使用。改造的B细胞可用于生产定制的抗体和用于B细胞治疗。因此,本发明还提供改造的B细胞和由改造的B细胞生产的定制抗体。

著录项

  • 公开/公告号CN112384627A

    专利类型发明专利

  • 公开/公告日2021-02-19

    原文格式PDF

  • 申请/专利权人 生物医学研究所;

    申请/专利号CN201980046344.7

  • 申请日2019-05-29

  • 分类号C12N15/90(20060101);C12N9/78(20060101);C07K16/00(20060101);C12N5/0781(20060101);C12N15/87(20060101);

  • 代理机构11245 北京纪凯知识产权代理有限公司;

  • 代理人王永伟

  • 地址 瑞士贝林佐纳

  • 入库时间 2023-06-19 09:54:18

说明书

本发明涉及改造(工程化,engineered)B淋巴细胞领域,具体地用于生产抗体。具体地,本发明涉及编辑B细胞的免疫球蛋白基因,使得改造的B细胞能够生产定制的抗体。因此,本发明提供用于改造B细胞的方法和根据本发明的方法改造的B细胞。这种改造的B细胞和该B细胞生产的定制抗体可用于多种医疗应用,包括预防和治疗该改造的抗体所靶向的疾病以及诊断方法,例如用于检测(分离的)样品中的抗原。

治疗性单克隆抗体的使用已出现作为突破性的方法以特异性地靶向多种疾病,包括免疫障碍、癌症和感染。目前,FDA批准了65种单克隆抗体(mAb)用于临床使用,并且超过350种mAb处于临床试验中,这证明了这种治疗方法和重组抗体改造的力量。

特别是自1975年起,当

为了避免那些问题,开发了使鼠抗体更“人性”的策略。一种方法是开发嵌合抗体,其中将鼠可变域与人恒定域融合,产生抗体,该抗体大约70%的人性并且具有全人Fc部分(Neuberger MS,Williams GT,Mitchell EB,Jouhal SS,Flanagan JG,Rabbitts TH:Ahapten-specific chimaeric IgE antibody with human physiological effectorfunction.Nature.1985 Mar 21-27;314(6008):268-70)。为了进一步减少mAb的鼠部分,开发了“人源化”抗体,其中通过“互补决定区(CDR)移植”将全人抗体的高变环替换为目标鼠抗体的高变环。人源化抗体包含85-90%的人序列,并且免疫原性甚至低于嵌合抗体。大多数被批准的mAb是嵌合的或人源化的(综述参见Chames P,Van Regenmortel M,Weiss E,Baty D.Therapeutic antibodies:successes,limitations and hopes for thefuture.British Journal of Pharmacology.2009;157(2):220-233.doi:10.1111/j.1476-5381.2009.00190.x.)。然而,人源化是有技术要求的,并且可能导致抗体活性丧失(即,功能丧失)。

另一种开发治疗性抗体的方法涉及体外展示技术,如噬菌体展示(McCafferty J,Griffiths AD,Winter G,Chiswell DJ:Phage antibodies:filamentous phagedisplaying antibody variable domains.Nature.1990Dec 6;348(6301):552-4)。由此,人抗体或抗体片段被展示在简单生物体如噬菌体、细菌或酵母的表面上以进行筛选。但是,这种文库系统不包含全长抗体,并且抗体是被细菌或酵母而非被人细胞表达的。这种表达系统不能反映人类翻译后修饰。具体地,体外生产的抗体通常不类似于天然人抗体糖基化模式,但这对于抗体有效性是至关重要的,因为其影响免疫系统的效应功能和下游激活。

此外,转基因“人源化”小鼠可用于由人基因生产抗体(Lonberg N.Humanmonoclonal antibodies from transgenic mice.In:Chernajovsky Y,Nissim A,editors.Therapeutic Antibodies.Handbook of Experimental Pharmacology,Volume181.Berlin Heidelberg:Springer-Verlag;2008.pp.69–97.Eds.)。但是,由于这种技术依赖于抗原对小鼠的免疫化,其限于可被小鼠的免疫系统识别的抗原的抗体的生产。

因此,生产治疗性抗体的“黄金标准”是分离的人B淋巴细胞的使用,该淋巴细胞利用了人类抗体生产的“天然”方式(Traggiai E,Becker S,Subbarao K,Kolesnikova L,Uematsu Y,Gismondo MR,Murphy BR,Rappuoli R,Lanzavecchia A.An efficient methodto make humanmonoclonal antibodies from memory B cells:potent neutralizationof SARScoronavirus.Nat Med.2004Aug;10(8):871-5.Epub 2004Jul 11;LanzavecchiaA,Bernasconi N,Traggiai E,Ruprecht CR,Corti D,Sallusto F.Understanding andmaking use of human memory B cells.Immunol Rev.2006Jun;211:303-9)。因此,B细胞传统上被用于获得天然人抗体和基于天然B细胞基因组的人抗体文库(Duvall MR,FioriniRN.Different approaches for obtaining antibodies fromhuman B cells.Curr DrugDiscov Technol.2014Mar;11(1):41-7)。只是最近,随着诸如CRISPR/Cas9、锌指核酸酶和TALEN(转录激活因子样效应核酸酶)的基因组编辑工具的发展,人B细胞也开始作为免疫球蛋白基因编辑的靶标,因此定制的重组抗体也可以通过分离的人类B细胞来生产。

例如,Cheong及其同事报道了CRISPR/Cas9技术对于编辑免疫球蛋白基因的应用,其通过用逆转录病毒或慢病毒将Cas9和向导RNA递送至B细胞,从而诱导免疫球蛋白类别转换重组(Cheong TC,Compagno M,Chiarle R.Editing of mouse and humanimmunoglobulingenes by CRISPR-Cas9 system.Nat Commun.2016Mar 9;7:10934.doi:10.1038/ncomms10934)。

此外,WO 2016/161446还描述了使用CRISPR/Cas9技术对于改造人B细胞的应用。另外,WO 2016/161446还提出使用其他改造的核酸酶如锌指核酸酶和TALEN对于遗传修饰B细胞的应用。

总的来说,利用改造核酸酶(如CRISPR/Cas9、锌指核酸酶和TALEN)的基因组编辑方法最近开始作为生物技术中具有有前景的治疗潜力的强大工具。然而,由于改造核酸酶的工作机制及其递送要求,对于在工程应用中采用通过改造核酸酶进行的基因组编辑也引起了主要的安全关注。

因此,主要的关注涉及不期望的脱靶剪切和突变。尽管改造核酸酶特异性靶向,但改造核酸酶的非故意相互作用和导致的非靶标位点的剪切已被报道(Zhang XH,Tee LY,Wang XG,Huang QS,Yang SH.Off-target Effects inCRISPR/Cas9-mediated GenomeEngineering.Mol Ther Nucleic Acids.2015Nov17;4:e264.doi:10.1038/mtna.2015.37;Shim G,Kim D,Park GT,Jin H,Suh SK,Oh YK.Therapeutic gene editing:delivery andregulatory perspectives.Acta Pharmacol Sin.2017Jun;38(6):738-753.doi:10.1038/aps.2017.2)。例如,在CRISPR/Cas9系统中,sgRNA可通过部分同源性结合至错配的序列。

此外,外源基因编辑工具的致肿瘤性代表了另一个重要的安全问题,其中具体地,脱靶突变(例如在原癌基因附近)可导致癌症发生。换句话说,脱靶突变的生成负有功能异常和癌症发作的风险。

另一个重要的安全问题与改造核酸酶的免疫原性有关,因为CRISPR/Cas9、锌指核酸酶和TALEN对于人体都是外源的和外来的。因此,改造核酸酶可以引发免疫响应(Dai WJ,Zhu LY,Yan ZY,Xu Y,Wang QL,Lu XJ.CRISPR-Cas9 for in vivo GeneTherapy:Promiseand Hurdles.Mol Ther Nucleic Acids.2016;5:e349.doi:10.1038/mtna.2016.58)。此外,用于递送改造核酸酶的病毒载体也可具有免疫原性,并导致抗体和T细胞免疫响应产生,限制了相同病毒载体的重复使用(Zaiss AK,Muruve DA.Immune responses to adeno-associated virus vectors.Curr Gene Ther.2005Jun;5(3):323-31)。此外,病毒载体负有染色体整合和种系传递的风险。

因此,需要开发更安全的B细胞基因组编辑工具。

因此,本发明的目的是提供克服上述现有技术缺点的用于改造B细胞的新方法。具体地,本发明的目的是提供更安全的用于改造B细胞的方法。例如,本发明的目的是提供用于改造B细胞的方法,which lowers the风险for不期望的脱靶突变。这些目的通过下文和所附权利要求中提出的主题来实现。

虽然本发明在下文中被详细描述,但要理解,本发明不限于本文所述的具体方法、方案和试剂,因为这些可变动。还要理解,本文所用的术语学不意图限制本发明的范围,其将仅由所附权利要求限制。除非另有限定,本文所用的所有技术和科学术语具有与本领域普通技术人员的通常理解相同的含义。

在下文中,将对本发明的要素进行描述。这些要素随具体实施方式一起列举,然而应理解,其可以任何方式和以任何数量组合以建立另外的实施方式。各种描述的实例和优选的实施方式不应被解释为将本发明限制到仅明确描述的实施方式。这种描述应被理解为支持和包括将明确描述的实施方式与任何数量的公开的和/或优选的要素组合的实施方式。另外,本申请的所有所述要素的任何排列和组合应被认为已被本申请的描述公开,除非上下文另有说明。

贯穿本说明书和所附权利要求,除非上下文另有限定,术语"包括"和诸如"包含"和"含有"的变型将被理解为暗示包括所陈述的成员、整数或步骤,但不排除任何其他未陈述的成员、整数或步骤。术语"由……组成"是术语"包括"的一种具体实施方式,其中排除任何其他未陈述的成员、整数或步骤。在本发明的环境中,术语"包括"涵盖术语"由……组成"。术语“包括”因此涵盖“包括”以及“由……组成”,例如,“包括”X的组合物可仅由X组成,或可包括其他(组分),例如,X+Y。

在描述本发明的环境中(特别是权利要求环境中)使用的术语"一个"和"一种"和"所述"以及类似语言将被解释为覆盖单数和复数,除非本文另有说明或上下文明确否定。本文中数值范围的叙述仅意图作为将所述范围内的各分别数值单独提及的简略表达方法。除非本文另有说明,各单独数值被并入说明书中,如同其在本文中被单独叙述。说明书中的任何语言表述都不应被解释为表示任何未主张的要素对于本发明的实践是必需的。

词语“基本上”不排除“完全”,例如,“基本上不含”Y的组合物可以完全不含Y。在必要时,本发明的定义可以省略词语“基本上”。

与数值x相关的术语“约”指代x±10%。

如本文所用,术语“肽”、“多肽”、“蛋白质”分别指代这样的肽、寡肽或包括融合蛋白在内的蛋白质:包含至少两个彼此结合的氨基酸,优选通过普通肽键,或可选地通过修饰的肽键,如例如在等排肽(isosteric peptides)的情况下。术语“(多)肽”指代肽和/或多肽。具体地,术语“肽”、“多肽”、“蛋白质”还包括“拟肽”,其被定义为包含非肽结构元件的肽类似物,该肽能够模仿或拮抗天然亲本肽的生物作用在(一种或多种)。拟肽缺乏经典的肽特征,如可酶促切断的肽键。肽、多肽或蛋白质可以由通过遗传密码限定的20种氨基酸中的任意种构成。此外,肽、多肽或蛋白质除这些氨基酸以外还可以包含通过遗传密码限定的这20种氨基酸以外的氨基酸,或者其可以由通过遗传密码限定的和20种氨基酸以外的氨基酸构成。具体地,在本发明的环境中,肽、多肽或蛋白质可以等同地由通过本领域技术人员公知的天然过程如翻译后成熟过程或通过化学过程修饰的氨基酸组成。这种修饰在文献中已被充分详细描述。这些修饰可以出现在多肽中的任何位置:在肽骨架中,在氨基酸链中,或甚至在羧基或氨基末端。具体地,肽或多肽可以在泛素化之后是分支的,或是有或无分支的环状的。这种类型的修饰可以是本领域技术人员公知的天然或合成的翻译后过程的结果。在本发明的环境中,术语“肽”、“多肽”、“蛋白质”具体地还包括修饰的肽、多肽和蛋白质。例如,肽、多肽或蛋白质修饰可包括乙酰化、酰化、ADP-核糖基化、酰胺化、核苷酸或核苷酸衍生物的共价固定、脂质或脂质衍生物的共价固定、磷脂酰肌醇的共价固定、共价或非共价交联、环化、二硫键形成、去甲基化、糖基化——包括聚乙二醇化、羟基化、碘化、甲基化、肉豆蔻酰化、氧化、蛋白水解过程、磷酸化、异戊烯基化、外消旋化、seneloylation、硫酸化、氨基酸添加如精氨酰化或泛素化。这种修饰被充分详细描述于文献中(Proteins Structureand Molecular Properties(1993)2nd Ed.,T.E.Creighton,New York;Post-translational Covalent Modifications of Proteins(1983)B.C.Johnson,Ed.,Academic Press,New York;Seifter et al.(1990)Analysis for proteinmodifications and nonprotein cofactors,Meth.Enzymol.182:626-646和Rattan etal.,(1992)Protein Synthesis:Post-translational Modifications and Aging,Ann NYAcad Sci,663:48-62)。因此,术语“肽”、“多肽”、“蛋白质”优选包括例如脂肽、脂蛋白、糖肽、糖蛋白等。

然而,优选地,蛋白质、多肽或肽是“经典的”肽、多肽或蛋白质,其中“经典”肽、多肽或蛋白质通常由选自通过遗传密码限定的20种氨基酸的氨基酸构成。该氨基酸通过普通肽键彼此连接。

本文所用的术语(抗体或抗体片段的)“重链”指代将与另一多肽(“轻链”)缔合的多肽。具体地,重链和轻链通过二硫键缔合。重链可包含1、2、3或4个抗体重链恒定域。在优选的实施方案中,其包含三个抗体重链恒定域:CH1、CH2和CH3,以及CH1和CH2之间的铰链区。所述重链恒定域可源自鼠抗体、嵌合抗体、合成抗体,人源化或人抗体以及单克隆或多克隆抗体。重链可包含一个或多个可变域,优选抗体重链(VH)的可变域。

本文所用的术语(抗体或抗体片段的)“轻链”指代将与另一多肽(“重链”)缔合的多肽。具体地,重链和轻链通过二硫键缔合。轻链可包含抗体轻链恒定区CL。所述轻链恒定区可以源自鼠抗体、嵌合抗体、合成抗体、人源化或人抗体以及单克隆或多克隆抗体。第二多肽链可包含一个或多个可变域,优选抗体轻链(VL)的可变域。

总体上,“抗体”是与抗原特异性结合的蛋白质。通常,抗体包含独特的结构使其能够特异性结合其相应抗原,但是——总体上——抗体具有相似的结构,并且具体地还被称为免疫球蛋白(Ig)。如本文所用,术语“抗体”涵盖各种形式的抗体,包括而不限于全抗体、抗体片段、具体地抗原结合片段、人抗体、嵌合抗体、人源化抗体、重组抗体和遗传改造抗体(抗体变体或突变体抗体),只要保留了根据本发明的特征性质。尽管说明书(包括权利要求书)在一些位置可能明确地提及了抗原结合片段、抗体片段、抗体的变体和/或衍生物,但应理解该术语“抗体”包括所有类别的抗体,即,抗原结合片段、抗体片段、抗体的变体和衍生物。

如本文所用,术语“抗原结合片段”、“片段”和“抗体片段”被可互换使用,并且指代抗体的任何片段。具体地,术语“抗原结合片段”、“片段”和“抗体片段”在本文中指代保留以下的任何片段:(i)抗体的抗原结合活性和/或(ii)如本文所述由该抗体的(其他)功能域提供的其他功能,例如由(独立的)结合位点提供的结合活性。在根据本发明的抗体片段中,保留了根据本发明的特征性质。总体上,抗体片段的实例包括但不限于单链抗体、Fab、Fab'或F(ab')

如本文所用,术语“人抗体”旨在包括具有源自人免疫球蛋白序列的可变区和恒定区的抗体。人抗体在现有技术中是公知的(van Dijk,M.A.,and van de Winkel,J.G.,Curr.Opin.Chem.Biol.5(2001)368-374)。人抗体也可以在转基因动物(例如小鼠)中产生,该转基因动物能够在无内源性免疫球蛋白产生的情况下在免疫化后产生全库或选定的人抗体。人种系免疫球蛋白基因阵列在这种种系突变小鼠中的转移将导致在抗原挑战后产生人抗体(参见例如Jakobovits,A.,et al.,Proc.Natl.Acad.Sci.USA 90(1993)2551-2555;Jakobovits,A.,et al.,Nature 362(1993)255-258;Bruggemann,M.,et al.,YearImmunol.7(1993)3340)。人抗体也可以在噬菌体展示文库中产生(Hoogenboom,H.R.,andWinter,G.,J.Mol.Biol.227(1992)381-388;Marks,J.D.,et al.,J.Mol.Biol.222(1991)581-597)。Cole等和Boerner等的技术也可用于制备人单克隆抗体(Cole et al.,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,p.77(1985);and Boerner,P.,et al.,J.Immunol.147(1991)86-95)。然而,最优选地,如本文所述通过根据本发明的方法来制备人单克隆抗体,其可以组合改善的EBV-B细胞永生化,如Traggiai E,Becker S,Subbarao K,Kolesnikova L,Uematsu Y,Gismondo MR,Murphy BR,Rappuoli R,Lanzavecchia A.(2004):An efficient method to make human monoclonal antibodiesfrom memory B cells:potent neutralization of SARS coronavirus.Nat Med.10(8):871-5所述。如本文所用,术语“人抗体”还包含如本文所述经修饰以产生根据本发明的性质的这种抗体。

根据本发明的抗体可以纯化形式提供。因此,根据本发明的抗体或抗体片段可以是纯化的抗体或抗体片段。通常,抗体将存在于组合物中,该组合物基本上不含其他多肽,例如,其中组合物的小于90%(按重量计),通常小于60%,更通常小于50%由其他多肽构成。

如本文所用,术语“可变域”(也称为“可变区”;轻链(VL)的可变域,重链(VH)的可变域)指代抗体或抗体片段的如下域:其是经典的天然存在的抗体的N端域,通常是在经典的天然存在的抗体中提供最大可变性的域,并且其直接参与抗体与抗原的结合。通常,可变的人轻链和重链的域具有相同的总体结构,并且各域包括序列广泛保守的框架(FR)区(具体地,四个框架(FR)区)和三个“高变区”或互补决定区CDR(具体地,三个“高变区”/CDR)。框架区通常采用β-折叠构象,并且CDR可以形成连接β-折叠结构的环。各链中的CDR通常通过框架区保持其三维结构,并与来自另一链的CDR一起形成抗原结合位点。

如本文所用,术语“高变区”指代抗体中的负责抗原结合的氨基酸残基。高变区包括“互补决定区”或“CDR”。“框架”或“FR”区是本文定义的高变区残基以外的那些可变域。CDR和FR区可以按照Kabat et al.,Sequences of Proteins of ImmunologicalInterest,5th ed.,Public Health Service,National Institutes of Health,Bethesda,Md.(1991)的标准定义来确定。通常,具体地在天然的单特异性IgG抗体中,三个CDR(CDR1、CDR2和CDR3)被非连续地布置在可变域中。换句话说,重链和/或轻链上的CDR可以例如被框架区隔开,其中框架区(FR)是可变域中“可变性”小于CDR的区域。例如,在抗体中,可变域(或各每个可变域,分别地)可优选包含被三个CDR隔开的四个框架区。具体地,抗体的可变域(轻链或重链可变域VH或VL)从N端到C端包含域FR1、CDR1、FR2、CDR2、FR3、CDR3和FR4。各链上的CDR被这种框架氨基酸隔开。通常,重链的三个CDR和所连接的轻链的三个CDR一起形成抗原结合位点(互补位)。换句话说,由于具体地在天然单特异性IgG抗体中抗原结合位点通常由两个可变域构成,各抗原结合位点有六个CDR(重链:CDRH1、CDRH2和CDRH3;轻链:CDRL1、CDRL2和CDRL3)。单个抗体,具体地单个天然单特异性IgG抗体,通常具有两个(相同的)抗原结合位点,因此包含十二个CDR(即2×六个CDR)。

由于其“多特异性”,即不同的抗原结合位点,多特异性抗体或其抗原结合片段的重链和/或轻链可以(各)包含多于三个CDR,具体地多于三个不同的CDR。例如,多特异性抗体或其抗原结合片段可以包含至少两个不同的可变域,其中所述至少两个不同的可变域中的每一个源自不同的单特异性抗体,例如IgG型。由于这种单特异性抗体通常包含在重链中的三个CDR和在轻链中的三个CDR形成抗原结合位点,多特异性抗体可以具体地包含第一抗体的重链的三个CDR和第一抗体的轻链的三个CDR、第二抗体的重链的三个CDR和第二抗体的轻链的三个CDR、任选地第三抗体的重链的三个CDR和第三抗体的轻链的三个CDR等。因此,多特异性抗体的重链和/或轻链所包含的CDR的数目优选是三的倍数,例如三、六、九、十二等。因此还优选多特异性抗体的重链和轻链两者所包含的CDR的总数是六的倍数,例如六、十二、十八等。由于“抗原结合位点”通常以CDR为特征,即CDRH1、CDRH2和CDRH3以及CDRL1、,CDRL2和CDRL3,优选在多特异性抗体中CDR被布置使得顺序(例如源自同一单特异性抗体的CDRH1、CDRH2和CDRH3和/或CDRL1、CDRL2和CDRL3维持以保留抗原结合位点,即保留与抗原中的某个位点特异性结合的能力。这意味着例如在氨基酸序列中源自第一单特异性抗体的CDRH1、CDRH2和CDRH3的顺序优选不被源自第二单特异性抗体的任何CDR打断。重要的是,如果多特异性抗体包含源自至少两种不同的单特异性抗体的抗原结合位点,则这些单特异性抗体的CDR或可变域应在多特异性抗体中被布置使得CDR(或可变区)来源的各单特异性抗体的“抗原受体”被保留,即,其特异性结合抗原中的某个位点的能力被保留。

在本发明的环境中,可变域可以是天然存在的抗体的任何可变域(具体地,VH和/或VL),或可变域可以是修饰的/改造的可变域。修饰的/改造的可变域是本领域已知的。通常,可变域被修饰/改造以删除或添加一个或多个功能,例如通过“种系化(germlining)”体细胞突变(“去除”体细胞突变)或通过人源化。

如本文所用,术语“恒定域”指代抗体中的不直接参与抗体与抗原的结合但呈现多种效应功能的域。通常,根据免疫球蛋白类别,重链包含三个或四个恒定域:CH1、CH2,CH3和任选地CH4(沿N端至C端方向)。因此,重链的恒定区通常通过以下形成(沿N端至C端方向):CH1-铰链(柔性多肽,包含在重链的第一和第二恒定域之间的氨基酸)-CH2-CH3(-CH4)。轻链通常包含仅一个单一恒定域,称为CL,其通常也形成轻链的恒定区。在本发明的环境中,恒定域可以是天然存在的抗体的任何恒定域(具体地,CL、CH1、CH2、CH3和/或CH4),或者恒定域可以是修饰的/改造的恒定域。修饰的/改造的恒定域是本领域已知的。通常,恒定域被修饰/改造以删除或添加一个或多个功能,例如在Fc区的功能的环境中。根据其重链恒定区的氨基酸序列,抗体或免疫球蛋白被分为以下类别:IgA、IgD、IgE、IgG和IgM,并且其中一些可进一步被分为亚类,例如。IgG1、lgG2、lgG3和lgG4、IgA1和lgA2。不同类别的免疫球蛋白相应的重链恒定区分别称为α、ε、γ和μ。根据本发明的抗体优选是IgM型或IgG型。不同于IgG,IgM不包含铰链区,但包含在羧基端的另外的恒定域和18氨基酸尾链(tailpiece),其包含半胱氨酸并参与分子的多聚化。

总体上,抗体可以是任何同种型(例如,IgA、IgG、IgM,即α、γ或μ重链),但优选为IgM或IgG。在IgG同种型内,抗体可以是IgG1、IgG2、IgG3或IgG4亚类,其中IgG1是优选的。抗体可具有κ或λ轻链。

如本文所用,术语“重组抗体”旨在包括所有在自然界中不存在的抗体,例如由根据本发明的方法改造的B细胞生产的抗体。

如本文所用,抗体或抗体片段环境中的术语“多特异性”指代该抗体或抗体片段结合至少两个不同表位(例如,不同抗原上或相同抗原上)的能力。因此,诸如“双特异性”、“三特异性”、“四特异性”等的术语指代抗体可以结合的不同表位的数量。例如,常规的单特异性IgG型抗体具有两个相同的抗原结合位点(互补位(paratope)),因此仅结合相同的表位(而不结合不同的表位)。相比之下,多特异性抗体具有至少两种不同类型的互补位/结合位点,因此可以结合至少两种不同的表位。如本文所用,“互补位”指代抗体的抗原结合位点。此外,单一“特异性”可以指单一抗体中的一个、两个、三个或更多个相同的互补位(单一一个抗体分子中的互补位/结合位点的实际数量被称为“价”)。例如,单个天然IgG抗体是单特异性和二价的,因为其具有两个相同的互补位。因此,多特异性抗体包含至少两种(不同的)互补位/结合位点。因此,术语“多特异性抗体”指代具有多于一种互补位和结合两种或更多种不同表位的能力的抗体。术语“多特异性抗体”具体地包括如如上定义的双特异性抗体,但一般还包括具体地结合三种或更多种不同表位的蛋白质,例如抗体、支架,即具有三种或更多种互补位/结合位点的抗体。

具体地,多特异性抗体或抗体片段可以包含两个或更多个互补位/结合位点,其中一些互补位/结合位点可以是相同的,使得抗体的所有互补位/结合位点都属于至少两种不同类型的互补位/结合位点,并且因此抗体具有至少两种特异性。例如,多特异性抗体或抗体片段可包含四个互补位/结合位点,其中每两个互补位/结合位点是相同的(即具有相同的特异性),因此该抗体或其片段是双特异性和四价的(对于所述两种特异性每一种有两个相同的互补位/结合位点)。因此,“一特异性”具体地指代呈现相同特异性的一个或多个互补位/结合位点(这通常意味着这样的一个或多个互补位/结合位点是相同的),并且因此“二特异性”可以通过两个、三个、四个、五个、六个或更多个互补位/结合位点来实现。只要其仅涉及两种特异性。或者,多特异性抗体可针对(至少两种中的)每种特异性包含单一一个互补位/结合位点,即,多特异性抗体总共包含至少两个互补位/结合位点。例如,双特异性抗体针对两种特异性中的每一种都包含单一一个互补位/结合位点,即该抗体总共包含两个互补位/结合位点。还优选,对于所述两种特异性的每一种,抗体包含两个(相同的)互补位/结合位点,即该抗体总共包含四个互补位/结合位点。优选地,针对两种特异性中的每一种,抗体包含三个(相同的)互补位/结合位点,即该抗体总共包含六个互补位/结合位点。

如本文所用,术语“抗原”指代充当适应性免疫响应的受体的靶标,具体地抗体、T细胞受体和/或B细胞受体的靶标,的任何结构性物质。“表位”,也称为“抗原决定簇”,是被免疫系统,具体地被抗体、T细胞受体和/或B细胞受体,识别的抗原部分(或片段)。因此,一个抗原具有至少一个表位,即,单一抗原具有一个或多个表位。抗原可以是(i)肽、多肽或蛋白质,(ii)多糖,(iii)脂质,(iv)脂蛋白或脂肽,(v)糖脂,(vi)核酸,或(vii)小分子药物或毒素。因此,抗原可以是肽、蛋白质、多糖、脂质、其组合——包括脂蛋白和糖脂、核酸(例如DNA、siRNA、shRNA、反义寡核苷酸、陷阱(decoy)DNA、质粒)或小分子药物(例如环孢霉素A、紫杉醇、阿霉素、甲氨蝶呤、5-氨基乙酰丙酸)或其任何组合。优选地,抗原选自(i)肽、多肽或蛋白质,(ii)多糖,(iii)脂质,(iv)脂蛋白或脂肽,和(v)糖脂;更优选地,抗原是肽、多肽或蛋白质。

如本文所用,术语“抗原结合位点”指代包含与抗原的部分或全部特异性结合并互补的区域的抗体部分。当抗原大时,抗体可仅与抗原的特定部分结合,该部分称为“表位”。通常,两个可变域,具体地重链可变域VH和轻链可变域VL,缔合形成一个抗原结合位点。具体地,抗原结合位点由重链可变域的三个CDR和轻链可变域的三个CDR(即六个CDR)形成,如上所述。

术语“特异性结合”和类似的语言不包括非特异性粘附。

本文所用的术语“连接体”(也称为“间隔体”)指代适于连接多肽或蛋白质(如抗体或抗体片段)的不同域的肽。连接体在本领域中是已知的,并且例如在Reddy Chichili VP,Kumar V,Sivaraman J.Linkers in the structural biology of protein–proteininteractions.Protein Science:A Publication of the Protein Society.2013;22(2):153-167)中被详细描述。通常,连接体被设计使得其不影响功能。具体地,连接体不特异性结合靶标。连接体可包含任何氨基酸,氨基酸甘氨酸(G)和丝氨酸(S)可以是优选的。优选地,连接体由氨基酸甘氨酸(G)和丝氨酸(S)构成(“GS-连接体”)。如果一个多肽或蛋白质中存在两个或更多个连接体,则连接体可以彼此相同或不同。此外,连接子的长度可以为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、15、1 6、1 7、1 8、19或20个氨基酸。

如本文所用,术语“核酸或核酸分子”旨在包括DNA分子和RNA分子。核酸分子可以是单链的(ss)或双链的(ds)。

如本文所用,术语“细胞”、“细胞系”和“细胞培养物”被可互换地使用,并且这种命名全部均包括后代。因此,词语“转化体”和“转化细胞”包括原代对象细胞和从其衍生的培养物,而与转移数无关。还应理解,所有后代的DNA含量可能由于故意或无意的突变而不完全相同。具有在原始转化细胞中所筛选的相同功能或生物学活性的变体后代是被包括在内的。如果意图区别命名,则从上下文中可以明确。

如本文所用,“序列变体”(也称为“变体”)指代参考序列中的任何改变,其中参考序列是“序列表和SEQ ID编号表”(序列表)中列出的任何序列),即SEQ ID NO:1至SEQ IDNO:115。因此,术语“序列变体”包括核苷酸序列变体和氨基酸序列变体。注意,本文提及的序列变体具体地是功能序列变体,即保持参考序列的生物学功能的序列变体。例如,内含子序列(例如具有剪接位点功能和/或剪接增强子功能)的目标(多)肽(具有例如结合功能)的功能可以保持。因此,优选的序列变体是与参考序列具有至少70%、至少75%、至少80%、至少85%、至少88%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的(功能)序列变体。如本文所用,短语“具有至少70%、至少75%、至少80%、至少85%、至少88%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的其序列变体”意为%序列同一性越高,序列变体越优选。换句话说,短语“具有至少70%、至少75%、至少80%、至少85%、至少88%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的其序列变体”具体地意为该序列变体与对应的参考序列具有至少70%序列同一性,优选至少75%序列同一性,优选至少80%序列同一性,更优选至少85%序列同一性,更优选至少88%序列同一性,甚至更优选至少90%序列同一性,甚至更优选至少92%序列同一性,还更优选至少95%序列同一性,还更优选至少96%序列同一性,特别优选至少97%序列同一性,特别优选至少98%序列同一性,最优选至少99%序列同一性。

通常相对于参考序列(即本申请中所述的序列)的全长来计算序列同一性。如本文提及的同一性百分比可以例如利用BLAST采用由NCBI(National Center forBiotechnology Information;http://www.ncbi.nlm.nih.gov/)指定的默认参数来确定[Blosum 62矩阵;空位开放罚分=11,空位延伸罚分=1]。

如本文所用,“核苷酸序列变体”具有改变的序列,其中参考序列中的一个或多个核苷酸被删除或取代,或一个或多个核苷酸被插入参考核苷酸序列的序列中。核苷酸在本文中通过标准单字母名称(A、C、G或T)提及。由于遗传密码的简并性,“核苷酸序列变体”可以导致对应参考氨基酸序列改变,即“氨基酸序列变体”的改变或不导致对应参考氨基酸序列改变。优选的序列变体是这样的核苷酸序列变体:其不导致氨基酸序列变体(沉默突变),但是其他非沉默突变也在该范围内,具体地导致可与参考序列具有至少80%,优选至少90%,更优选至少95%序列同一性的氨基酸序列的突变核苷酸序列。

“氨基酸序列变体”具有改变的序列,其中参考序列中的一个或多个氨基酸被删除或取代,或者一个或多个氨基酸被插入参考氨基酸序列的序列中。作为所述改变的结果,氨基酸序列变体的氨基酸序列与参考序列具有至少80%同一性,优选至少90%同一性,更优选至少95%同一性,最优选至少99%同一性。具有至少90%同一性的变体序列具有,参考序列的每100个氨基酸,不超过10个改变,即删除、插入或取代的任何组合。

尽管可以具有非保守氨基酸取代,但优选取代是保守氨基酸取代,其中取代的氨基酸具有与参考序列中相应氨基酸相似的结构或化学性质。举例来说,保守氨基酸取代涉及一种脂族或疏水氨基酸(例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸)被另一种取代;一种含羟基氨基酸(例如丝氨酸和苏氨酸)被另一种取代;一种酸性残基(例如谷氨酸或天冬氨酸)被另一种取代;一种含酰胺的残基(例如天冬酰胺和谷氨酰胺)被另一种替代;一种芳族残基(例如苯丙氨酸和酪氨酸)被另一种替代;一种碱性残基(例如赖氨酸、精氨酸和组氨酸)被另一种替代;和一种小氨基酸(例如丙氨酸、丝氨酸、苏氨酸、甲硫氨酸和甘氨酸)被另一种替代。

氨基酸序列插入包括长度范围从一个残基到包含一百个以上残基的多肽的氨基末端和/或羧基末端融合,以及单个或多个氨基酸残基的序列内插入。末端插入的实例包括氨基酸序列的N端或C端与报告分子或酶的融合。

重要的是,序列变体的改变在当前情况下不消除对应参考序列的功能,例如抗体或抗体片段的序列结合其抗原的功能和/或由功能域提供的其他功能,例如结合(独立)结合位点的靶标的功能。确定哪些核苷酸和氨基酸残基分别可以被取代,插入或删除而不消除这种功能的指导通过使用本领域公知的计算机程序被找到。

如本文所用,“源自”指定核酸、肽、多肽或蛋白质的核酸序列或氨基酸序列指代核酸、肽、多肽或蛋白质的来源。优选地,源自具体序列的核酸序列或氨基酸序列具有与其来源序列或其部分本质上相同的氨基酸序列,其中“本质上相同”包括如上限定的序列变体。优选地,源自具体肽或蛋白质的核酸序列或氨基酸序列源自所述具体肽或蛋白质中的相应域。从而,“相应的”具体地指代相同的功能。例如,“胞外域”相应于(另一蛋白质的)另一“胞外域”,或“跨膜域”相应于(另一蛋白质的)另一“跨膜域”。肽、蛋白质和核酸的“相应”部分因此是可容易被本领域技术人员辨认的。同样,“源自”其他序列的序列对于本领域技术人员通常可容易辨认为具有其来源序列。

优选地,源自另一核酸、肽、多肽或蛋白质的核酸序列或氨基酸序列可与起始核酸、肽、多肽或蛋白质(其来源)相同。然而,源自另一核酸、肽、多肽或蛋白质的核酸序列或氨基酸序列也可相对于起始核酸、肽、多肽或蛋白质(其来源)具有一个或多个突变,具体地源自另一核酸、肽、多肽或蛋白质的核酸序列或氨基酸序列可以是该起始核酸、肽、多肽或蛋白质(其来源)的如上所述的功能序列变体。例如,在肽/蛋白质中,一个或多个氨基酸残基可被其他氨基酸残基取代,或一个或多个氨基酸残基可被插入或被删除。

如本文所用,术语“突变”涉及与参考序列(例如相应的基因组序列)相比核酸序列和/或氨基酸序列中的变化。突变(例如与基因组序列相比)可以是例如(天然存在的)体细胞突变、自发突变、诱导突变(例如通过酶、化学剂或辐射诱导)或通过定点诱变(用于在核酸序列和/或氨基酸序列中形成特定和有意变化的分子生物学方法)得到的突变。因此,术语“突变”(“mutation”或“mutating”)应被理解为还包括物理形成的突变,例如在核酸序列或氨基酸序列中。突变包括一个或多个核苷酸或氨基酸的取代、删除和插入以及若干(两个或更多个)连续核苷酸或氨基酸的颠倒。为实现氨基酸序列突变,优选地可将突变引入编码所述氨基酸序列的核苷酸序列,以表达(重组)突变多肽。突变可例如通过以下实现:通过改变(例如,通过定点诱变)编码一个氨基酸的核酸分子的密码子以产生编码不同氨基酸的密码子,或通过合成序列变体,例如通过知晓编码多肽的核酸分子的核苷酸序列和通过设计包括编码多肽变体的核苷酸序列的核酸分子的合成,而无需突变核酸分子该一个或多个核苷酸。

如本文所用,术语“上游”和“下游”均指代DNA或RNA中的相对位置。DNA或RNA的各链具有5'端和3'端(脱氧核糖或核糖环上的碳位置命名)。按照惯例,上游和下游与RNA转录进行的5'至3'方向相关。上游朝向RNA分子的5'端,并且下游朝向3'端。在双链DNA中,上游朝向目标外显子的编码链5'端,并且下游朝向3'端。由于DNA的反平行属性,这意味着模板链的3'端是基因的上游,并且5'端是下游。

如本发明环境中所用的术语“疾病”意图与术语“障碍”和“状况”(如医疗状况)是总体上同义的,并且被可互换地使用,因为其全部均反映人体或动物体或其部分之一的异常/病理状况,该异常/病理状况一般损害正常功能,一般通过区别性迹象或症状显露,并且通常导致人或动物的寿命减少或生活质量下降。

在本说明书的全文中引用了若干文件。无论是上文还是下文,本文引用的各文件(包括所有专利、专利申请、科学出版物、制造商的说明书、说明书等)其整体均通过引用并入本文。本文中的任何内容均不被解释为承认本发明无权凭借在先发明而早于这种公开。

应该理解,本发明不限于本文描述的具体方法、方案和试剂,因为其可以变化。还应理解,本文所用的术语仅出于描述具体实施方案的目的,并不旨在限制本发明的范围,本发明的范围仅由所附权利要求书来限制。除非另有限定,本文中使用的所有技术和科学术语具有与本领域普通技术人员的通常理解相同的含义。

用于编辑B淋巴细胞的基因组的方法

在第一方面中,本发明提供用于编辑分离的B淋巴细胞的基因组的方法,包括以下步骤:

(i)激活B淋巴细胞的内源激活诱导性胞嘧啶脱氨酶;和

(ii)将DNA分子引入B淋巴细胞,该DNA分子包括编码目标(多)肽的核苷酸序列。

“编辑基因组”意为插入、删除或改变(天然存在的)目标基因或基因座,具体地生成特异性和/或功能改变的B细胞。因此,通过本发明的方法可得到改造的B淋巴细胞,其中B淋巴细胞的基因组包括编码目标(多)肽的核苷酸序列。优选地,根据本发明编辑的目标基因座是免疫球蛋白基因座,即编码免疫球蛋白(抗体)多肽链的基因座。优选地,本发明的方法提供改造的B细胞(其中免疫球蛋白基因座被编辑)以生成(和分泌)重组(定制)抗体。因此,本发明优选地提供用于编辑分离的B细胞的基因组中的免疫球蛋白基因座的方法,其包括本文所述的步骤。

术语“B淋巴细胞”和“B细胞”可互换使用。总体上,“B淋巴细胞”是一种淋巴细胞亚型的白血细胞。B淋巴细胞的主要功能是分泌抗体。因此,B淋巴细胞属于适应性免疫系统的体液组分。另外,B淋巴细胞可呈递抗原并分泌细胞因子。与其他两种淋巴细胞T细胞和自然杀伤细胞相比,B淋巴细胞在其细胞膜上表达B细胞受体(BCR)。BCR允许B细胞与特定抗原结合,针对该特定抗原其将启动抗体响应。

总体上,B淋巴细胞可以是任何物种的。在一些实施方式中,B淋巴细胞是哺乳动物B淋巴细胞。优选地,B淋巴细胞是人B淋巴细胞。因此,在一些实施方案中,B淋巴细胞不是鸡B淋巴细胞或鼠B淋巴细胞。具体地,优选不删除B淋巴细胞的IgL基因座。

总体上,术语“分离的”B淋巴细胞指代不是人体或动物体一部分的B淋巴细胞。具体地,分离的B淋巴细胞可以是原代B淋巴细胞或B细胞系(的B淋巴细胞)。

细胞系一般是持续的(即,其可以无限期地增殖),具体地由于肿瘤或人工永生化,例如,Epstein-Barr病毒(EBV)永生化。B细胞系是可商购的,例如Ramos(

最优选地,分离的B淋巴细胞是原代B淋巴细胞。“原代”B淋巴细胞被分离自活组织并被建立用于体外培养。与持续(肿瘤或人工永生化)细胞系相比,“原代”细胞是“新”分离的,即其在体外仅经历很少的细胞分裂。一般,原代细胞具有有限生命跨度,即其不会像细胞系那样“永生”。具体地,原代细胞没有被以任何方式修饰(除了从其来源组织提取细胞所需的酶促和/或物理解离)。

原代B细胞可以从血液或淋巴组织(如骨髓、胸腺、脾和/或淋巴结)分离。一般,B细胞分离自对象的(分离的)样品中分离。样品是例如血液或淋巴组织,如骨髓、胸腺、脾和/或淋巴结。例如,B细胞分离自外周血单核细胞(PBMC)、骨髓或脾。

分离原代B淋巴细胞的方法是本领域已知的。例如,可以通过流式细胞术、磁性细胞分离和细胞隔离(MACS)、RosetteSep或抗体淘选来分离B细胞。为了提供具有足够纯度、活力和产率的分离的B淋巴细胞,可以利用一种或多种分离技术。优选地,通过MACS或RosetteSep分离原代B细胞。例如,可以具体地从外周血单核细胞(PBMC),通过磁性细胞分选来分离B细胞。为此,可以使用例如抗CD19微珠,例如可从Miltenyi Biotec获得。

优选地,分离的(原代)B淋巴细胞的纯度是至少约80%、85%、90%、91%、92%、93%、94%、95%、或更高。另外,优选分离的(原代)B细胞是至少约70%、75%、80%、85%、90%、95%或更高可活的。任选地,在分离后,可将原代B淋巴细胞在培养中扩增。

在优选的实施方式中,原代B淋巴细胞分离自患者(的分离样品)。在改造后,B细胞可被给予同一患者(其或其祖细胞从该患者分离)。这种B细胞可被称为“自体”B细胞。以这种方式,患者可在体内生成定制的抗体(“由自身”)。可选地,改造的B细胞可用于建立(永生化)B细胞系,例如用于体外生产定制抗体。

在分离的B淋巴细胞的基因组编辑的第一步骤中,激活B淋巴细胞的内源激活诱导性胞嘧啶脱氨酶。将B淋巴细胞的激活诱导性胞嘧啶脱氨酶激活的各种方式是本领域已知的并且在下文被更详细地描述。从而,诱导基因组DNA的双链断裂(DSB),具体地在免疫球蛋白基因座的转换区域中。总体上,激活诱导性胞嘧啶脱氨酶(也被称为“AID”或“AICDA”)是这样的酶:通过胞嘧啶碱基的脱氨在DNA中产生突变,从而将胞嘧啶变成尿嘧啶。AID被认为是二级抗体多样化的“主调节剂”,因为其介导体细胞超突变(SHM)、类别转换重组(CSR)和基因转换(GC)。具体地,AID介导CSR的免疫球蛋白基因基因座中的转换区域(也称为“S区”)的DNA剪切。转换区域是免疫球蛋白基因座中的重复DNA序列的区域,具体地位于CH基因部分的上游。

CSR发生在位于各CH基因部分上游的两个转换区域之间,切除了居间的DNA(“转换环”)并将可变区与下游CH基因部分并置。AID引起胞嘧啶脱氨,产生dU,然后其通过尿嘧啶-N-糖基化酶(UNG)和无嘧啶核酸内切酶(APE1)的联合作用而被去除,导致单链DNA断裂(SSB)。当SSB在相对的DNA链上非常接近时,形成双链断裂(DSB)。DSB也可以通过错配修复(MMR)途径的作用经由“末端加工”而形成。在两个转换区域中形成DSB后,DNA的其余“末端”被连接,并通过经典的非同源末端连接(C-NHEJ)或替代末端连接(A-EJ)途径而发生重组。

术语“内源”意为激活诱导的胞苷脱氨酶源自B淋巴细胞内。具体地,激活诱导的胞苷脱氨酶基于编码激活诱导的胞苷脱氨酶的内源基因而被表达(即,不借助于引入B细胞的构建体)。因此,激活诱导的胞苷脱氨酶由B淋巴细胞表达。因此,不需要将(外源)核酸酶(或编码或表达这种核酸酶的核酸、载体或病毒)引入B细胞。而是,基因组DNA的断裂通过B细胞自身的机制进行,该机制仅根据本发明被激活。具体地,本发明的方法一般不涉及将核酸酶(或编码核酸酶的核酸或其他用于编码和/或表达核酸酶的外源手段)引入B细胞。

在激活B淋巴细胞的激活诱导的胞苷脱氨酶之后,在根据本发明方法的另一步骤(步骤(ii))中,将包含编码目标(多)肽的核苷酸序列的DNA分子引入B细胞。因此,一般在步骤(i)之后进行根据本发明的方法的步骤(ii)。具体地,在将包含编码目标(多)肽的核苷酸序列的DNA分子引入B细胞之前,激活B细胞的内源激活诱导性胞苷脱氨酶。

因此,用包含编码目标(多)肽的核苷酸序列的DNA分子转染B淋巴细胞。总体上,术语“转染”指代将核酸分子如DNA或RNA分子引入细胞,优选地引入真核细胞。在本发明的环境中,术语“转染”涵盖技术人员已知的用于将DNA分子引入B淋巴细胞的任何方法。这种方法包括例如病毒和非病毒转染方法。可以用于基因转移的病毒包括逆转录病毒(包括慢病毒)、单纯疱疹病毒、腺病毒和腺病毒相关病毒(AAV)。然而,在一些实施方式中,B淋巴细胞不用逆转录病毒转导。此外,纳米颗粒也可以用于转染。其他非病毒转染方法包括多种化学和物理方法。化学转染方法包括脂转染——例如基于阳离子脂质和/或脂质体、磷酸钙沉淀或基于阳离子聚合物(如DEAE-葡聚糖或聚乙烯亚胺(PEI)等)的转染。物理转染方法包括电穿孔、弹道基因转移(将包覆有DNA的颗粒引入细胞)、微注射(DNA通过微毛细管转移到细胞中)和核转染。优选地,包含编码目标(多)肽的核苷酸序列的DNA分子在B淋巴细胞中的引入是非病毒的。最优选地,通过核转染引入DNA。

目标(多)肽可以是设想作为定制抗体(的一部分)被表达的任何(多)肽。优选的目标(多)肽在下文中被更详细地描述。

在图1中示意性地示出了根据本发明的用于编辑分离的B淋巴细胞的基因组的方法。不受任何理论的束缚,本发明人认为,包含编码目标(多)肽的核苷酸序列的DNA分子在B细胞基因组中(具体地在B淋巴细胞的免疫球蛋白基因座的转换区域中)的整合通过天然机制发生,如同源重组(HR)、非同源末端连接(c-NHEJ)或替代末端连接(A-EJ)途径。换句话说,在将包含编码目标(多)肽的核苷酸序列的DNA分子引入(转染)到B淋巴细胞中之后,B淋巴细胞的内源修复机制随后通过天然过程(如同源重组(HR)、非同源末端连接(NHEJ)和/或替代末端连接(A-EJ)修复所引入的断裂(一个或多个),从而将包含编码目标(多)肽的核苷酸序列的DNA分子整合到B淋巴细胞的基因组中。在c-NHEJ和A-EJ途径中,通过Mre11/Rad50/Nbs1(MRN)和共济失调毛细血管扩张突变(ATM)复合体检测DNA断裂。在c-NHEJ中,Ku蛋白Ku70和Ku80异二聚体与DNA依赖性蛋白激酶(DNAPKs)形成支架,将非同源DNA末端固定在一起,修饰DNA末端并募集DNA连接酶IV以重新连接DNA末端。相比之下,A-EJ独立于Ku和DNA连接酶IV发生,并且可能将PARP和/或CtIP作为支架用于DNA末端加工和通过DNA连接酶I或III连接所需的其他因子。

总之,与用于改造B细胞的现有技术方法(其依赖于外源(改造)核酸酶的给予)相比,根据本发明的用于编辑B淋巴细胞的基因组的方法降低了不期望的脱靶突变的风险。具体地,在根据本发明的方法中,B淋巴细胞的基因组编辑i)可以早在分离和B细胞刺激后一天进行,并且ii)在不添加改造核酸酶如Cas9的情况下工作。

具体地,根据本发明的方法不涉及外源核酸酶。换句话说,在根据本发明的方法中,具体地,不需要外源核酸酶存在。因此,在本发明的环境中优选,外源核酸酶本身和编码外源核酸酶的核酸均不被引入B淋巴细胞。总体上,核酸酶是能够剪切核酸单体之间的磷酸二酯键的酶。外源核酸酶是非源自B淋巴细胞内的核酸酶,具体地非由B细胞表达的核酸酶。更优选地,根据本发明的方法不涉及/利用CRISPR核酸酶、锌指核酸酶、转录激活因子样核酸酶或大范围核酸酶(meganuclease)。

因此,优选根据本发明的方法不涉及人工改造的核酸酶。这种改造核酸酶通常被称为“分子剪刀”,并且包括改造的大范围核酸酶(例如改造的大范围核酸酶重新改造的归巢核酸内切酶)、转录激活因子样核酸酶(TALEN)、锌指核酸酶(ZFN)和RNA向导的核酸酶,如CRISPR(聚类的规律间隔的短回文重复序列)核酸酶,如Cas核酸酶(例如Cas9)、Cpf1核酸酶、Cmr核酸酶、Csf核酸酶、Csm核酸酶、Csn核酸酶、Csy核酸酶、C2cl核酸酶、C2c3核酸酶或C2c3核酸酶。更优选地,根据本发明的方法不涉及/利用改造的核酸酶、如CRISPR核酸酶、锌指核酸酶、转录激活因子样核酸酶或大范围核酸酶。

大范围核酸酶是特征在于12至40个碱基对的大识别位点的核酸内切酶。改造的大范围核酸酶通常源自归巢核酸内切酶。锌指核酸酶(ZFN)是通过将锌指DNA结合域融合到DNA剪切域而生成的人工限制酶,其中锌指域可以被改造以靶向特定期望DNA序列,这使锌指核酸酶能够靶向复杂基因组中的独特序列。转录激活因子样效应核酸酶(TALEN)是通过将TAL效应DNA结合域与DNA剪切域融合而制得的限制酶,其可以被改造以切割DNA的特定序列。CRISPR是细菌和古细菌中包含来自已攻击原核生物的病毒的DNA片段的一类DNA序列,其被原核生物用于在后续攻击中检测和破坏相似病毒的DNA。在CRISPR序列中带有间隔序列的RNA可帮助CRISPR核酸酶识别和切割外源DNA。对于基因编辑,通常CRISPR核酸酶,如Cas核酸酶(例如,Cas9)、Cpf1核酸酶、Cmr核酸酶、Csf核酸酶、Csm核酸酶、Csn核酸酶、Csy核酸酶、C2cl核酸酶、C2c3核酸酶或C2c3核酸酶,与向导RNA一起被引入细胞,以在期望位置矫正细胞的基因组。

此外,本方法优选不涉及任何向导核酸(向导RNA或向导DNA)在B淋巴细胞中的引入。除了利用向导RNA的上述CRISPR/Cas系统外,还有其他利用向导核酸的基因组编辑方法是本领域中已知的,例如基于argonaute(Ago)核酸酶的方法,其利用5'磷酸化短单链链核酸(RNA或DNA)作为向导剪切靶标。然而,根据本发明的方法利用激活诱导性胞苷脱氨酶(AID),其天然地靶向转换区域并且因此不需要向导核酸,并且具体地不涉及向导核酸。

任选地,根据本发明的方法可进一步包括步骤:

(iii)确认编码目标(多)肽的核苷酸序列在B淋巴细胞基因组中的整合。

具体地,此步骤(iii)在如上所述的步骤(i)和(ii)之后执行。步骤(iii)可以例如通过测序(来自B淋巴细胞的核酸,如基因组DNA)和/或通过检查B细胞受体或由改造B淋巴细胞产生的抗体是否包含目标(多)肽来进行。例如,如果目标(多)肽是特异性结合位点,则可以评估由改造的B淋巴细胞产生的抗体与特定结合伙伴的结合。目标(多)肽在抗体中的成功整合还可以通过荧光标记抗体的细胞表面染色和流式细胞术分析来评估,例如如果整合的目标(多)肽不是B细胞内源表达的表面分子的一部分。此外,编码目标(多)肽的核苷酸序列在B淋巴细胞基因组中的整合可通过PCR扩增和/或(随后的)免疫球蛋白转换区域测序来验证,该免疫球蛋白转换区域包括转换-μ和任选地所有α和γ同种型的相应区域。

包括编码目标(多)肽的核苷酸序列的DNA分子

在步骤(ii)中引入B淋巴细胞的DNA分子可以是任何形式,例如。环状(如质粒)或线性DNA分子。例如,如果在步骤(ii)中引入环状DNA分子(质粒),则其可含有至少一个内源DNA酶限制位点,使得质粒可被剪切以整合到基因组中。优选地,在根据本发明的方法的步骤(ii)中引入B淋巴细胞的DNA分子是线性或线性化的DNA分子。例如,DNA分子可以作为质粒(或作为质粒的组分)被制备,该质粒在其被引入B淋巴细胞之前被剪切(以使其包含编码目标(多)肽的核苷酸序列(线性化DNA分子))。

此外,在步骤(ii)中引入B淋巴细胞的DNA分子可以是单链DNA分子(ssDNA)或双链DNA分子(dsDNA)。如实施例1所示,ssDNA和dsDNA均可用于根据本发明的方法。优选地,DNA分子是dsDNA分子。

此外,在步骤(ii)中引入B淋巴细胞的双链DNA分子可以具有平端(blunt end),5'和/或3'突出端(overhang)或翻口末端(frayed end)。“平端”是双链DNA分子的最简单末端,其中DNA分子的两条链均终止于互补碱基的碱基对(分别为腺嘌呤:胸苷(A:T)和胞嘧啶:鸟嘌呤(C:G))。换句话说,在平端中,第一条链的各核苷酸与另一条链的互补核苷酸配对(形成碱基对)。相比之下,“突出端”是dsDNA分子末端中的一段未配对核苷酸。这些未配对的核苷酸可以在任一链中,产生3'或5'突出端。至少两个未配对核苷酸的突出端也称为“粘性末端”或“粘着末端”。因此,粘性或粘着末端具有带有未配对核苷酸的突出单链(称为突出端)-而平端不具有突出链。最后,“翻口末端”指代dsDNA分子中靠近末端的区域,其具有显著比例的非互补序列(在非互补“碱基对”中)。然而,错误匹配的核苷酸倾向于避免键合,因此看起来类似于一段翻口绳子中的线股。

优选地,DNA分子具有粘性末端或平端。最优选地,DNA分子具有平端。

还优选,DNA分子或至少该DNA分子的编码目标(多)肽的核苷酸序列是密码子优化的。具体地,编码目标(多)肽(其中目标(多)肽不是人类来源的)的核苷酸序列进行优选是密码子优化的。总体上,密码子优化可以改善重组蛋白在人细胞中的翻译和表达。用于密码子优化的各种方法是本领域已知的。例如,可使用计算工具,如JCat(Grote A,Hiller K,Scheer M,Münch R,

可选地,还优选,编码目标(多)肽的DNA分子或DNA分子的至少编码目标(多)肽核苷酸序列不是密码子优化的。具体地,优选地,如果目标(多)肽是人(多)肽或源自人(多)肽,则DNA分子或所述核苷酸序列不是密码子优化的。

优选地,包含编码目标(多)肽的核苷酸序列的DNA分子进一步包含(在编码目标(多)肽的核苷酸序列以外)在编码目标(多)肽的核苷酸序列上游和/或下游的内含子序列。更优选地,包含编码目标(多)肽的核苷酸序列的DNA分子进一步包含(在编码目标(多)肽的核苷酸序列之外)(i)在编码目标(多)肽的核苷酸序列上游的内含子序列和(ii)在编码目标(多)肽的核苷酸序列下游的内含子序列。具体地,术语“内含子序列”指代非编码核苷酸序列。

优选地,内含子序列的长度为至少5个核苷酸(在dsDNA中:碱基对;bp)中,优选至少10个核苷酸(在dsDNA中:碱基对;bp)中,更优选地,至少15个核苷酸(在dsDNA中:碱基对;bp),甚至更优选至少20个核苷酸(在dsDNA中:碱基对;bp),最优选至少25个核苷酸(在dsDNA中:碱基对;bp)。还优选,内含子序列的长度为至少50个核苷酸(在dsDNA中:碱基对;bp),优选至少75或100个核苷酸(在dsDNA中:碱基对;bp),更优选至少150或200个核苷酸(在dsDNA中:碱基对;bp),甚至更优选至少300或400个核苷酸(在dsDNA中:碱基对;bp),还更优选至少500个核苷酸(在dsDNA中:碱基对;bp),最优选至少600个核苷酸(在dsDNA中:碱基对;bp)。

还优选,内含子序列的长度不超过3000个核苷酸,优选不超过2500个核苷酸(在dsDNA中:碱基对;bp),更优选不超过2000个核苷酸(在dsDNA中:碱基对;bp),甚至更优选(具体地在DNA分子包含两个内含子序列的情况下)不超过1500个核苷酸(在dsDNA中:碱基对;bp),还更优选地(具体地在DNA分子包含两个内含子序列的情况下)不超过1250个核苷酸(在dsDNA中:碱基对;bp),最优选(具体地在DNA分子包含两个内含子序列的情况下)不超过1000个核苷酸(在dsDNA中:碱基对;bp)。

优选地,内含子序列包含剪接识别位点。“剪接识别位点”(也称为“剪接位点”)是被剪接体特异性识别并被剪接的核苷酸序列。因此,剪接(识别)位点是在内含子和外显子之间的“边界”处的内含子核苷酸序列。

更优选地,包含编码目标(多)肽的核苷酸序列的DNA分子包括:

(i)内含子序列,其包含在编码目标(多)肽的核苷酸序列上游的(单一)剪接识别位点(例如5'剪接位点);和

(ii)内含子序列,其包含在编码目标(多)肽的核苷酸序列下游的(单一)剪接识别位点(例如3'剪接位点)。

最优选地,剪接识别位点位于编码目标(多)肽的核苷酸序列的直接相邻处(直接上游或下游)。

如本文所用,术语“5'剪接位点”指代位于内含子的下游端并且因此位于外显子的直接上游(在外显子的5'端处)的剪接位点。例如,“5'剪接位点”一般包括在其3'端处的核苷酸“AG”(按此顺序)。换句话说,“5'剪接位点”可以以核苷酸“AG”作为最后两个核苷酸结尾(在其后外显子/编码序列开始)。

如本文所用,术语“3'剪接位点”指代位于内含子的上游端并且因此位于外显子的直接下游(在外显子的3'端处)的剪接位点。例如,“3'剪接位点”一般包含在其5'端处的核苷酸“GT”(按此顺序)。换句话说,“3'剪接位点”可以以核苷酸“GT”作为最前两个核苷酸开始(正好(直接)在外显子/编码序列结束后)。

剪接位点可以通过各种生物信息学工具在计算机上被预测,包括,例如:

—Berkeley Drosophila Genome Project(Drosophily and human prediction;URL:http://www.fruitfly.org/seq_tools/splice.html;Reese MG,Eeckman,FH,Kulp,D,Haussler,D,1997.``Improved Splice Site Detection in Genie”.J Comp Biol4(3),311-23);

—Human Splicing Finder(URL:http://www.umd.be/HSF/;FO Desmet,HamrounD,Lalande M,Collod-Beroud G,Claustres M,Beroud C.Human Splicing Finder:anonline bioinformatics tool to predict splicing signals.Nucleic Acid Research,2009,April);

—GeneSplicer(URL:http://ccb.jhu.edu/software/genesplicer/;M.Pertea,X.Lin,S.L.Salzberg.GeneSplicer:a new computational method for splice siteprediction.Nucleic Acids Res.2001Mar 1;29(5):1185-90);

—NetGene2 Server(URL:http://www.cbs.dtu.dk/services/NetGene2/;S.M.Hebsgaard,P.G.Korning,N.Tolstrup,J.Engelbrecht,P.Rouze,S.Brunak:Splicesite prediction in Arabidopsis thaliana DNA by combining local and globalsequence information,Nucleic Acids Research,1996,Vol.24,No.17,3439-3452.Brunak,S.,Engelbrecht,J.,and Knudsen,S.:Prediction of Human mRNA Donorand Acceptor Sites from the DNA Sequence,Journal of Molecular Biology,1991,220,49-65);

—SplicePort:An Interactive Splice Site Analysis Tool(URL:http://spliceport.cbcb.umd.edu/;Dogan RI,Getoor L,Wilbur WJ,Mount SM.SplicePort—Aninteractive splice-site analysis tool.Nucleic Acids Research.2007;35(WebServer issue):W285-W291.doi:10.1093/nar/gkm407);和

—MaxEntScan(URL:http://genes.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html;Yeo G,Burge CB.Maximum entropy modeling of short sequencemotifs with applications to RNA splicing signals.J Comput Biol.2004;11(2-3):377-94。

优选地,3'剪接位点包含根据SEQ ID NO:1的核苷酸序列或其序列变体:

AGGTAAGT

[SEQ ID NO:1]。

还优选5'剪接位点包含聚嘧啶区(polypyrimidine tract)(10个U或C,然后是任何碱基和C)和末端AG。

在特别优选的实施方式中,包括编码目标(多)肽的核苷酸序列的DNA分子进一步包括:

(i)在编码目标(多)肽的核苷酸序列的上游(在编码目标(多)肽的核苷酸序列的5'端):内含子序列,具体地(天然存在的)内含子的3'端,其包含(单一)剪接识别位点,具体地5'剪接位点;和

(ii)在编码目标(多)肽的核苷酸序列的下游(在编码目标(多)肽的核苷酸序列的3'端):内含子序列,具体地内含子的5'端,其包含(单一)剪接识别位点,具体地3'剪接位点。

最优选地,包含编码目标(多)肽的核苷酸序列的DNA分子包含(按以下顺序):

1.第一内含子序列,其包含第一剪接识别位点(例如,(天然存在的)内含子的3'端,其包含5'剪接位点);

2.编码目标(多)肽的核苷酸序列;和

3.第二内含子序列,其包含第二剪接识别位点(例如,(天然存在的)内含子的5'端,其包含3'剪接位点)。

这种DNA分子的示意性实例(例如整合在B淋巴细胞基因组的14号染色体的转换区域中)显示在图11中,具体地在上部一般思路(图11的中下部示出了包括如下所述的进一步特征的其实例)。

内含子序列的特别优选实例包括本文限定的根据SEQ ID NO 112-115中的任一者的核苷酸序列或其序列变体或由其组成。例如,位于编码目标(多)肽的核苷酸序列的(直接)上游(编码目标(多)肽的核苷酸序列的5'端)的内含子序列优选包含本文限定的根据SEQ ID NO:112或SEQ ID NO:114的核苷酸序列或其序列变体或由其组成。例如,位于编码目标(多)肽的核苷酸序列(直接)下游(编码目标(多)肽的核苷酸序列的3'端)的内含子序列优选包含本文限定的根据SEQ ID NO:113或SEQ ID NO:115的核苷酸序列或其序列变体或由其组成。

优选地,内含子序列包含Ig基因座内含子序列。术语“Ig基因座内含子序列”指代免疫球蛋白(Ig)基因座的内含子序列(具体地天然存在于Ig基因座中的内含子序列,如天然存在于Ig基因座中的内含子的5'端和/或3'端)。因此,优选内含子序列是Ig基因座的(天然存在的)内含子的片段或Ig基因座的完整内含子。

最优选地,内含子序列包括J段下游内含子的内含子序列和/或CH上游内含子(例如CH1-上游内含子)的内含子序列。术语“J段下游内含子”指代编码J段的外显子直接下游的内含子。术语“CH上游内含子”指代编码重链恒定域(CH)的外显子直接上游的内含子。因此,如上所述,J段下游内含子的内含子序列和/或CH上游内含子的内含子序列可以是如上所述完整的J段下游内含子/完整的CH上游内含子或其片段。优选地,CH上游内含子包括分支点序列(也称为“分支序列”或“分支位点”)。特别优选地,DNA分子包含在编码目标(多)肽的核苷酸序列上游的CH上游内含子(例如,CH1上游内含子)的内含子序列(即,CH上游内含子的内含子序列位于编码目标(多)肽的核苷酸序列(直接)“之前”/上游),和/或在编码目标(多)肽的核苷酸序列下游的J段下游内含子的内含子序列(即,J段下游内含子的内含子序列位于编码目标(多)肽的核苷酸序列(直接)“之前”/下游)。

最优选地,包含编码目标(多)肽的核苷酸序列的DNA分子包含(按以下顺序):

1.CH上游内含子的内含子序列(例如CH上游内含子的3'端片段),其在其3'端包含第一剪接识别位点(例如5'剪接位点),CH上游内含子的内含子序列优选进一步包含分支点序列和/或内含子剪接增强子;

2.编码目标(多)肽的核苷酸序列;

3.J段下游内含子的内含子序列(例如J段下游内含子的5'端片段),其在其5'端包含第二剪接识别位点(例如3'剪接位点),J片段下游内含子的内含子序列优选进一步包含内含子剪接增强子。

这种优选实施方式在图11(中部)中被示意性地示出。

因此,优选地,编码目标(多)肽的核苷酸序列上游的内含子序列包括分支点序列(也称为“分支序列”或“分支位点”)。“分支位点”是弱保守序列元件,如YNCTGAC(其中Y可以是C或T,并且N可以是选自A、G、C和T的任何核苷酸;SEQ ID NO:2),位于距5'剪接位点约18-50个核苷酸的保守距离。因此,优选地,分支位点在内含子序列中位于内含子序列所包含的5'剪接位点上游约18-50个核苷酸(优选20-40个核苷酸)。

内含子序列还可包含剪接调控元件(SRE),其为顺式作用序列,其增强或沉默(抑制)剪接。因此,可以区分“剪接增强子”和“剪接沉默子”。SRE募集反式作用剪接因子以激活或抑制剪接位点识别或剪接体组装。

优选地,内含子序列包含(内含子)剪接增强子。还优选内含子序列不包含(内含子)剪接沉默子。总体上,内含子序列中(例如内含子(的片段)中)存在的剪接增强子/沉默子被称为“内含子”剪接增强子/沉默子,而外显子/编码序列中(例如编码目标(多)肽的核苷酸序列中)存在的剪接增强子/沉默子被称为“外显子”剪接增强子/沉默子。DNA分子中存在天然或设计的剪接增强子和/或不存在剪接沉默子是优选的,并且可以改善编码目标(多)肽的核苷酸序列的剪接和整合。

还优选,DNA分子包含在编码目标(多)肽的核苷酸序列的上游和/或下游的内含子序列,该内含子序列包含内含子剪接增强子。优选的内含子剪接增强子被描述于Wang Y,MaM,Xiao X,Wang Z.Intronic Splicing Enhancers,Cognate Splicing Factors andContext Dependent Regulation Rules.Nature structural&molecular biology.2012;19(10):1044-1052.doi:10.1038/nsmb.2377。

最优选地,内含子剪接增强子具有根据SEQ ID NO 3-26中任一者的核苷酸序列或其序列变体:

GTAGTGAGGG(SEQ ID NO:3)

GTTGGTGGTT(SEQ ID NO:4)

AGTTGTGGTT(SEQ ID NO:5)

GTATTGGGTC(SEQ ID NO:6)

AGTGTGAGGG(SEQ ID NO:7)

GGGTAATGGG(SEQ ID NO:8)

TCATTGGGGT(SEQ ID NO:9)

GGTGGGGGTC(SEQ ID NO:10)

GGTTTTGTTG(SEQ ID NO:11)

TATACTCCCG(SEQ ID NO:12)

GTATTCGATC(SEQ ID NO:13)

GGGGGTAGG(SEQ ID NO:14)

GTAGTTCCCT(SEQ ID NO:15)

GTTAATAGTA(SEQ ID NO:16)

TGCTGGTTAG(SEQ ID NO:17)

ATAGGTAACG(SEQ ID NO:18)

TCTGAATTGC(SEQ ID NO:19)

TCTGGGTTTG(SEQ ID NO:20)

CATTCTCTTT(SEQ ID NO:21)

GTATTGGTGT(SEQ ID NO:22)

GGAGGGTTT(SEQ ID NO:23)

TTTAGATTTG(SEQ ID NO:24)

ATAAGTACTG(SEQ ID NO:25)

TAGTCTATTA(SEQ ID NO:26)

最优选地,内含子序列具有根据SEQ ID NO 27-53中任一者的核苷酸序列或其序列变体。SEQ ID NO27-45显示CH上游内含子的(的内含子序列/片段)的优选实例,并且SEQID NO46-51显示J片段下游内含子的(的内含子序列/片段)的优选实例。

5`IgM-CH1

CGAGGAGGCAGCTCCTCACCCTCCCTTTCTCTTTTGTCCTGCGGGTCCTCAG

[SEQ ID NO:27]

5`IgM-CH2

CGAAGGGGGCGGGAGTGGCGGGCACCGGGCTGACACGTGTCCCTCACTGCAG

[SEQ ID NO:28]

5`IgM-CH3

TCCGCCCACATCCACACCTGCCCCACCTCTGACTCCCTTCTCTTGACTCCAG

[SEQ ID NO:29]

5`IgM-CH4

CCACAGGCTGGTCCCCCCACTGCCCCGCCCTCACCACCATCTCTGTTCACAG

[SEQ ID NO:30]

5`IgG1-CH1

TGGGCCCAGCTCTGTCCCACACCGCGGTCACATGGCACCACCTCTCTTGCAG

[SEQ ID NO:31]

5`ìgG1-铰链

GGACACCTTCTCTCCTCCCAGATTCCAGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:32]

5`IgG1-CH2

AGGGACAGGCCCCAGCCGGGTGCTGACACGTCCACCTCCATCTCTTCCTCAG

[SEQ ID NO:33]

5`IgG1-CH3

GGCCCACCCTCTGCCCTGAGAGTGACCGCTGTACCAACCTCTGTCCCTACAG

[SEQ ID NO:34]

5`IgG3-CH1

TGGGCCCAGCTCTGTCCCACACCGCAGTCACATGGCGCCATCTCTCTTGCAG

[SEQ ID NO:35]

5`IgG3-铰链

AGATACCTTCTCTCTTCCCAGATCTGAGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:36]

5`IgG3-铰链2

ACGCATCCACCTCCATCCCAGATCCCCGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:37]

5`IgG3-铰链3

ACGCGTCCACCTCCATCCCAGATCCCCGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:38]

5`IgG3-铰链4

ACGCATCCACCTCCATCCCAGATCCCCGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:39]

5`IgG3-CH2

ACGCATCCACCTCCATCCCAGATCCCCGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:40]

5`IgG3-CH3

GACCCACCCTCTGCCCTGGGAGTGACCGCTGTGCCAACCTCTGTCCCTACAG

[SEQ ID NO:41]

5`IgG4-CH1

TGGGCCCAGCTCTGTCCCACACCGCGGTCACATGGCACCACCTCTCTTGCAG

[SEQ ID NO:42]

5`IgG4-铰链

AGACACCTTCTCTCCTCCCAGATCTGAGTAACTCCCAATCTTCTCTCTGCAG

[SEQ ID NO:43]

5`IgG4-CH2

AGGGACAGGCCCCAGCCGGGTGCTGACGCATCCACCTCCATCTCTTCCTCAG

[SEQ ID NO:44]

5`IgG4-CH3

GGCCCACCCTCTGCCCTGGGAGTGACCGCTGTGCCAACCTCTGTCCCTACAG

[SEQ ID NO:45]

上述实例显示了在IgM和各种IgG亚类的对应Ig基因座(例如,IgM-CH1)中天然存在的内含子的片段(3'端)。还优选,可以使用其他免疫球蛋白同种型如IgA1、IgA2和IgE的相应的(天然存在的)内含子序列。

3`J1

GTGAGTCTGCTGTCTGGGGATAGCGGGGAGCCAGGTGTACTGGGCCAGGCAA

[SEQ ID NO:46]

3`J2

GTGAGTCCCACTGCAGCCCCCTCCCAGTCTTCTCTGTCCAGGCACCAGGCCA

[SEQ ID NO:47]

3`J3

GTAAGATGGCTTTCCTTCTGCCTCCTTTCTCTGGGCCCAGCGTCCTCTGTCC

[SEQ ID NO:48]

3`J4

GTGAGTCCTCACAACCTCTCTCCTGCTTTAACTCTGAAGGGTTTTGCTGCAT

[SEQ ID NO:49]

3`J5

GTGAGTCCTCACCACCCCCTCTCTGAGTCCACTTAGGGAGACTCAGCTTGCC

[SEQ ID NO:50]

3`J6

GTAAGAATGGCCACTCTAGGGCCTTTGTTTTCTGCTACTGCCTGTGGGGTTT

[SEQ ID NO:51]

进一步优选的实例包括:

5`LAIR1

CATGGTGACTTCCTACAGTGGACGCTGAGATCCTGCTCTGCTTCCCTCCTAG

[SEQ ID NO:52]

3`LAIR1

GTGAGGACGTCACCTGGGCCCTGCCCCAGTCTCAGCTCGACCCTCGAGCTTG

[SEQ ID NO:53]

总体上,优选DNA分子包含剪接增强子。剪接增强子可以是内含子的(即,位于DNA分子的内含子序列中)或外显子的(即,位于DNA分子的编码序列中,例如在编码目标(多)肽的核苷酸序列中)。由于编码目标(多)肽的核苷酸序列总体上比内含子序列远更预先确定(由于其编码目标(多)肽的功能),内含子剪接增强子通常是优选的。换句话说,通常优选剪接增强子位于DNA分子包含的内含子序列中。更优选地,DNA分子包含在编码目标(多)肽的核苷酸序列上游的内含子序列和在编码目标(多)肽的核苷酸序列下游的内含子序列,并且各内含子序列包括剪接增强子。这种优选实施方式被示意性地示出在图11(下部)中。

然而,还优选,DNA分子包含外显子剪接增强子,例如在编码目标(多)肽的核苷酸序列中。例如,可以选择目标(多)肽,使得编码其的核苷酸序列“天然地”包含外显子剪接增强子。此外,遗传密码的简并性可用于引入外显子剪接增强子。即,沉默突变(其不改变编码的氨基酸)可用于将外显子剪接增强子引入编码目标(多)肽的核苷酸序列中。

优选地,DNA分子不包含外显子剪接沉默子。

外显子剪接增强子(ESE)是外显子内可促进组成性和调控性剪接的离散序列。外显子剪接增强子(ESE)序列以富含丝氨酸和精氨酸(SR)的蛋白为界,其进而增强剪接因子的募集。优选地,外显子剪接增强子是由六个碱基组成的序列基序。

外显子剪接增强子是本领域已知的(Liu H-X,Zhang M,KrainerAR.Identification of functional exonic splicing enhancer motifs recognized byindividual SR proteins.Genes&Development.1998;12(13):1998-2012;BlencoweBJ.Exonic splicing enhancers:mechanism of action,diversity androle in humangenetic diseases.Trends Biochem Sci.2000Mar;25(3):106-10)。剪接增强子可在计算机上通过各种生物信息学工具预测,包括例如通过RESCUE-ESE Web Server(URL:http://genes.mit.edu/burgelab/rescue-ese/;Fairbrother WG,Yeh RF,Sharp PA,BurgeCB.Predictive identification of exonic splicing enhancers in humangenes.Science.2002Aug 9;297(5583):1007-13)和/或通过ESEfinder(http://rulai.cshl.edu/cgi-bin/tools/ESE3/esefinder.cgi?process=home;Smith,P.J.,Zhang,C.,Wang,J.Chew,S.L.,Zhang,M.Q.and Krainer,A.R.2006.An increasedspecificity score matrix for the prediction of SF2/ASF-specific exonicsplicing enhancers.Hum.Mol.Genet.15(16):2490-2508;Cartegni L.,Wang J.,Zhu Z.,Zhang M.Q.,Krainer A.R.;2003.ESEfinder:a web resource to identify exonicsplicing enhancers.Nucleic Acid Research,2003,31(13):3568-3571)。

最优选地,剪接增强子(内含子的或外显子的)被选择以在分离的人B细胞中显示有效性,具体地在原代人B细胞中。因此,剪接增强子优选源自分离的人B细胞,具体地原代人B细胞(例如,通过用合适的生物信息学工具分析B细胞序列以预测本文所述的剪接增强子)。

优选地,在根据本发明的方法中,编辑B淋巴细胞的基因组以表达修饰的免疫球蛋白链,其在N端至C端方向上包含:可变域、目标(多)肽(由在根据本发明的方法的步骤(ii)中引入的DNA分子编码)和恒定域。换句话说,优选对B淋巴细胞的基因组进行编辑以表达修饰的免疫球蛋白链,该修饰的免疫球蛋白链包含布置在免疫球蛋白链的可变域和恒定域之间的目标(多)肽。因此,优选地,对B淋巴细胞的基因组进行编辑以表达修饰的抗体,该修饰的抗体包含在抗体的肘区中的目标(多)肽。此外,优选地,编辑B淋巴细胞的基因组以表达修饰的B细胞受体,该修饰的B细胞受体包含在抗体的肘区中的目标(多)肽。

肘区是抗体重链和轻链中可变域和恒定域之间的连接处。通常,可变域(VH或VL)的C端直接连接至最N端恒定域(通常CH1或CL)的N端,并且可变域(VH或VL)的C端和最N端恒定域(通常CH1或CL)的N端之间的连接处被称为“肘”或“肘区”。肘区允许可变域相对于恒定域弯曲和旋转。因此,肘区与铰链区一起为抗体提供柔性,用于抗原结合。基于肘区提供的运动范围,肘区也被称为“分子球窝接头”(Lesk AM,Chothia C.Elbow motion in theimmunoglobulins involves a molecularball-and-socket joint.Nature.1988 Sep 8;335(6186):188-90)。

在B淋巴细胞的基因组中,转换区域位于抗体的可变域和(最N端)恒定域之间。如上所述,通过AID的作用,包含编码目标(多)肽的核苷酸序列的DNA分子被整合在B细胞基因组的转换区域中。因此,包含编码目标(多)肽的核苷酸序列的DNA分子被整合在抗体的可变域和恒定域之间。具体地,内含子序列在剪接过程中被去除,使得由如本文所述的根据本发明编辑的B细胞基因组所表达的免疫球蛋白链在N端至C端方向上包含:可变域、目标(多)肽(由在根据本发明的方法的步骤(ii)中所引入的DNA分子编码)和恒定域。因此,在被表达的免疫球蛋白链中,目标(多)肽位于抗体的肘区,即在可变域和最N端恒定域之间。

图2A显示了包含在肘区中的目标(多)肽的抗体和相应的基因组排列的优选实例。图2A的上部示出了在肘区中具有单个受体域作为目标(多)肽的抗体(经典IgG型)。图2A的中部显示了在肘区具有两个受体域作为目标(多)肽的抗体(经典IgG型)。图2A的下部显示了在肘区中具有V

总体上,可以如本文所述通过根据本发明的方法获得的具有“肘内插入物”(IEI)的抗体被详细描述于WO 2019/025391 A1和WO 2019/024979 A1(PCT/EP2017/069357),其通过引用并入本文。具体地,可以用根据本发明的方法编辑B淋巴细胞的基因组,以表达包含重链的抗体或其抗原结合片段,其中所述重链在N端至C端方向上包含

(i)可变域,具体地重链可变域(VH);

(ii)目标(多)肽;和

(iii)一个或多个恒定域,具体地重链恒定域(CH),优选包含至少CH1恒定域。

优选地,重链的目标(多)肽(ii)优选不包含轻链的片段。

肘区经改造以包含目标(多)肽的这种抗体可以例如同时结合(1)其可变域所靶向的抗原和(2)被引入抗体肘区的结合位点所靶向的其他靶标——如WO 2019/025391 A1和WO 2019/024979 A1(PCT/EP2017/069357)详细描述。

具体地,可以如本文所述通过根据本发明的方法获得各种“肘内插入物”(IEI)抗体。“肘内插入物”(IEI)抗体被详细描述于WO 2019/025391 A1和WO 2019/024979 A1(PCT/EP2017/069357)。可通过根据本发明的方法获得的优选“肘内插入物”(IEI)抗体相应于WO2019/025391 A1和在WO 2019/024979 A1(PCT/EP2017/069357)中所描述的“肘内插入物”(IEI)抗体的优选实施方式。

然而,通过根据本发明的方法,也可以获得其他重组抗体。具体地,还优选,编辑B淋巴细胞的基因组以表达修饰的免疫球蛋白链,其中内源可变域被目标(多)肽替代。因此,还优选,编辑B淋巴细胞的基因组以表达修饰的B细胞受体,其中内源可变域被目标(多)肽替代。因此,优选编辑B淋巴细胞的基因组以表达包含目标(多)肽以“代替”内源可变域的修饰抗体。

图2B显示了包含免疫球蛋白链的抗体和相应的基因组排列的优选实例,所述免疫球蛋白链包含目标(多)肽以代替内源可变区。图2B的上部显示了抗体(经典的igG型),其中内源可变区(V

还优选,编辑B淋巴细胞的基因组以表达修饰的免疫球蛋白链,其中内源恒定域被目标(多)肽替代。因此,还优选,编辑B淋巴细胞的基因组以表达修饰的B细胞受体,其中内源恒定域被目标(多)肽替代。因此,优选编辑B淋巴细胞的基因组以表达包含目标(多)肽以“代替”内源恒定域的修饰抗体。因此,这种修饰的免疫球蛋白链包含(内源)可变域、目标(多)肽,但不包含(内源)恒定域。

其中目标(多)肽替代内源可变域的修饰可以通过在内源VDJ外显子和编码(多)肽的核苷酸序列之间引入编码剪切位点如T2A剪切位点的核苷酸序列来实现。其中目标(多)肽替代内源恒定域的修饰可以通过在编码目标(多)肽的核苷酸序列和编码恒定区的核苷酸序列之间引入编码剪切位点如T2A剪切位点的核苷酸序列来实现。

因此,优选地,DNA分子包含在编码目标(多)肽的核苷酸序列上游和/或下游的编码剪切位点的核苷酸序列。优选地,剪切位点是T2A剪切位点。

如本文所用,术语“剪切位点”包括酶促剪切(例如通过蛋白酶)以及“自我剪切”(例如通过核糖体跳跃(rebosomal skipping))。酶促切割的位点是本领域已知的。优选的实例包括用于人鼻病毒(HRV)3C蛋白酶的3C(“PreScission”)剪切标签(序列:LEVLFQGP;SEQ ID NO:54);和用于肠激酶的EKT(肠激酶)剪切标签(序列:DDDDK;SEQ ID NO:55);用于Xa因子的FXa(Xa因子)剪切标签(序列:IEGR;SEQ ID NO:56);和用于烟草蚀刻病毒蛋白酶的TEV(烟草蚀刻病毒)剪切标签(序列:ENLYFQG;SEQ ID NO:57);和用于凝血酶的凝血酶剪切标签(序列:LVPRGS;SEQ ID NO:58)。总体上,被蛋白酶或肽酶剪切的位点允许——翻译后——剪切从修饰的免疫球蛋白基因翻译的蛋白质。通过这种蛋白质剪切——例如通过肽酶或蛋白酶,翻译后的基因产物(单一一条链)中包含的共价连接的免疫球蛋白组分被加工成片段,从而获得如上所述的修饰的抗体或抗体片段。

另外,剪切位点可在计算机中通过各种生物信息学工具来预测,包括例如:

—PeptideCutter(URL:https://web.expasy.org/peptide_cutter/;GasteigerE.,Hoogland C.,Gattiker A.,Duvaud S.,Wilkins M.R.,Appel R.D.,Bairoch A.;

Protein Identification and Analysis Tools on the ExPASy Server;

(In)John M.Walker(ed):The Proteomics Protocols Handbook,Humana Press(2005));

—PROSPER(URL:https://prosper.erc.monash.edu.au/webserver.html;SongJ,Tan H,Perry AJ,Akutsu T,Webb GI,Whisstock JC and Pike RN.PROSPER:anintegrated feature-based tool for predicting protease substrate cleavagesites.PLoS ONE,2012,7(11):e50300);

—MEROPS(URL:https://www.ebi.ac.uk/merops/;Rawlings,N.D.,Barrett,A.J.,Thomas,P.D.,Huang,X.,Bateman,A.&Finn,R.D.(2018)The MEROPS database ofproteolytic enzymes,their substrates and inhibitors in 2017and a comparisonwith peptidases in the PANTHER database.Nucleic Acids Res46,D624-D632);

—TopFIND(URL:http://clipserve.clip.ubc.ca/topfind;Nikolaus Fortelny,Sharon Yang,Paul Pavlidis,Philipp F.Lange*,Christopher M.Overall*,NucleicAcids Research 43(D1),D290-D297(2014));和

—CutDB(URL:http://cutdb.burnham.org/;Igarashi Y,Eroshkin A,Gramatikova S,Gramatikoff K,Zhang Y,Smith JW,Osterman AL,Godzik A.CutDB:aproteolytic event database.Nucleic Acids Res.2007Jan;35(Database issue):D546-9)。

优选地,剪切位点是“自我剪切”位点(也称为“自我加工”位点),如核糖体跳跃位点。如本文所用,术语“自我剪切”(“自我加工”)涉及在无蛋白酶情况下的“剪切”,例如通过核糖体跳跃。优选地,编码自我加工位点的核苷酸序列是编码氨基酸序列Asp-Val/Ile-Glu-X-Asn-Pro-Gly-Pro的核苷酸序列,其中X可以是任何氨基酸(DX

最优选地,DNA分子如本文所述包含编码T2A位点(例如SEQ ID NO:60)的核苷酸序列或其序列变体。

在一些实施方式中,DNA分子不包含染色体的全长DNA链。

在一些实施方式中,DNA分子包含启动子。更具体地,在一些实施方式中,DNA分子可包含转录单元。术语“转录单元”指代DNA中编码单个RNA分子的核苷酸序列以及其转录所必需的序列。通常,转录单元包含启动子、RNA编码序列和终止子。启动子和终止子的例子是本领域公知的。例如,启动子和终止子可以与天然存在的基因中关于被编码(多)肽的启动子和终止子相同。在一些实施方式中,启动子(和/或终止子)是异源的(关于被编码的(多)肽;即,其在自然界中不存在于被编码(多)肽的基因中)。具体地,RNA编码序列(和DNA分子中的相应DNA序列)通常编码目标(多)肽,例如如本文所述。

目标(多)肽

目标(多)肽可以是异源的(即在自然界中不被B淋巴细胞表达),和/或其可以被包括在异源多肽(或蛋白质)(即在自然界中不被B淋巴细胞表达;如修饰的抗体)中。

如上所述,目标(多)肽可以是任何(多)肽,具体地设想作为定制抗体(的一部分)或抗体片段被表达的(多)肽。具体地,目标(多)肽包含一个(单个)或多个功能域或由其组成。总体上,术语“功能域”指代功能单元,例如抗体或抗体片段的功能单元。一般,功能域为蛋白质(例如抗体或抗体片段)提供(附加)功能。因此,(附加)功能域通常包含提供(附加)功能所需的所有氨基酸/序列。

优选地,功能域(被包含在目标(多)肽中)具有上至1000个氨基酸的长度,更优选上至750个氨基酸,甚至更优选上至500个氨基酸,甚至更优选上至400个氨基酸,特别优选上至300个氨基酸,最优选上至275或250个氨基酸。此外,优选功能域的长度为5至1000个氨基酸,更优选10至750个氨基酸,甚至更优选20至500个氨基酸,再更优选50至400个氨基酸,特别优选70-300个氨基酸,最优选75-275或100-250个氨基酸。

还优选功能域(被包含在目标(多)肽中)具有上至150kDa的尺寸,更优选上至100kDa,甚至更优选上至80kDa,还更优选上至70kDa,特别优选最高50kDa,最优选上至30或25kDa。此外,优选功能域的尺寸为0.5kDa至150kDa,更优选1kDa至100kDa,甚至更优选2.5kDa至80kDa,还更优选5kDa至70kDa,特别优选7.5kDa至50kDa,最优选10kDa至30或25kDa。

目标(多)肽可包含单体域或多聚体域。单体域是在不涉及任何其他(附加)域的情况下介导其功能的域。多聚体域,例如形成二聚体的两个域或形成三聚体的三个域,一起介导其功能性,具体地作为多聚体,例如作为二聚体或三聚体。在多聚体域的情况下,目标(多)肽可包含如本文所述的连接体以提供足够的灵活性以形成多聚体,具体地连接体可位于一个或多个多聚体域的(直接)相邻处,例如。在两个多聚体域之间或在所有多聚体域的各侧。优选地,目标(多)肽包含一个或多个单体域或由其组成。

总体上,目标(多)肽可以包含单一一个蛋白质域或多于一个蛋白质域或由其组成。“多于一个蛋白质域”可以是如上所述的多聚体域和/或如上所述的一个或多个单体域。例如,目标(多)肽可以包含两个或三个单体域或由其组成,所述两个或三个单体域可以介导相同或不同的功能和/或可以任选地通过连接体连接。例如,目标(多)肽可包含1、2、3、4、5、6、7、8、9或10个(不同的)蛋白质域。

优选地,目标(多)肽中包含的功能域(更优选地,完整的目标(多)肽)是人蛋白质、肽或多肽或其片段(具体地,域)或衍生物。

目标(多)肽还可以包含连接体,例如GS-连接体。

优选的功能域(被包含在目标(多)肽中)包含下列或由下列组成:Ig样域;例如蛋白质或(多)肽的Ig样域,例如如下示例。免疫球蛋白(Ig)分子的基本结构是通过二硫键连接的两条轻链和两条重链的四聚体。有两种类型的轻链:κ和λ,各自均由恒定域(CL)和可变域(VL)构成。共有五种类型的重链:α、δ、ε、γ和mu,全部均由可变域(VH)和三个(α、δ和γ)或四个(ε和mu)恒定域(CHI至CH4)构成。Ig分子是高度模块化的蛋白质,其中可变域和恒定域具有清晰保守的序列模式。Ig和Ig样分子中的域分为四种类型:V-组(可变),C1-组(恒定-1),C2-组(恒定-2)和I-组(中间)。结构研究显示,这些域具有共同的核心希腊钥匙β-三明治结构,各类型区别在于β-折叠中的链数以及序列模式。在几个不同的蛋白质家族中可以发现在序列和结构上都相关的免疫球蛋白样域。Ig样域涉及多种功能,包括细胞识别、细胞表面受体、肌肉结构和免疫系统。

Ig样域的优选实例包括以下蛋白质或(多)肽中任一种的Ig样域:A1BG(α-1-B糖蛋白)、ACAM、ADAMTSL1(ADAMTS样1)、ADAMTSL3(ADAMTS样3)、AGER(晚期糖基化终产物特异性受体)、ALCAM(激活的白细胞粘附分子)、ALPK3(α激酶3)、AMIGO1(具有Ig样域1的粘附分子)、AMIGO2(具有Ig样域2的粘附分子)、AMIGO3(具有Ig样域3的粘附分子)、AXL(AXL受体酪氨酸激酶)、BCAM(基底细胞粘附分子(Lutheran血型))、BOC(BOC细胞粘附相关,癌基因调控)、BSG(basigin(Ok血型))、BTLA(B和T淋巴细胞相关)、C10orf72、C20orf102、CADM1(细胞粘附分子1)、CADM3(细胞粘附分子3)、CADM4(细胞粘附分子4)、CCDC141(含卷曲螺旋域的141)、CD2、CD3、CD4、CD8、CD19、CD22、CD33、CD47、CD48、CD80、CD84、CD86、CD96、CD101、CD160、CD200、CD244、CD276、CDON(细胞粘附相关,癌基因调控)、CEACAM1(癌胚抗原相关的细胞粘附分子1)、CEACAM5(癌胚抗原相关的细胞粘附分子5)、CEACAM6(癌胚抗原相关的细胞粘附分子6)、CEACAM7(癌胚抗原相关的细胞粘附分子7)、CEACAM8(癌胚抗原相关的细胞粘附分子8)、CEACAM16(癌胚抗原相关的细胞粘附分子16)、CEACAM18(癌胚抗原相关的细胞粘附分子18)、CEACAM20(癌胚抗原相关的细胞粘附分子20)、CEACAM21(癌胚抗原相关的细胞粘附分子21)、CHL1(细胞粘附分子L1样)、CILP(软骨中间层蛋白)、CILP2(软骨中间层蛋白2)、CLMP(CXADR样膜蛋白)、CNTFR(睫状神经营养因子受体)、CNTN1(接触蛋白1)、CNTN2(接触蛋白2)、CNTN3(接触蛋白3)、CNTN4(接触蛋白4)、CNTN5(接触蛋白5)、CNTN6(接触蛋白6)、CSF1R(集落刺激因子1受体)、CXADR(CXADR,Ig样细胞粘附分子)、DSCAM(DS细胞粘附分子)、DSCAML1(DS细胞粘附分子样1)、EMB(embigin)、ESAM(内皮细胞粘附分子)、F11R(F11受体)、FAIM3、FCMR(IgM受体的Fc片段)、HMCN1(hemicentin 1)、HMCN2(hemicentin 2)、FCAR(IgA受体的Fc片段)、FCER1A(IgE受体Ia的Fc片段)、FCGR1A(IgG受体Ia的Fc片段)、FCGR1B(IgG受体Ib的Fc片段)、FCGR1CP(IgG受体Ic的Fc片段,假基因)、FCGR2A(IgG受体IIa的Fc片段)、FCGR2B(IgG受体IIb的Fc片段)、FCGR2C(IgG受体IIa的Fc片段)、FCGR3A(IgG受体IlIa的Fc片段)、FCGR3B(IgG受体IIIb的Fc片段)、FCRH1、FCRH3、FCRH4、FCRL1(Fc受体样1)、FCRL2(Fc受体样2)、FCRL3(Fc受体样3)、FCRL4(Fc受体样4)、FCRL5(Fc受体样5)、FCRL6(Fc受体样6)、FCRLA(Fc受体样A)、FCRLB(Fc受体样B)、FGFR1、FGFR2、FGFR3、FGFR4、FGFRL1、FLT1(fms相关酪氨酸激酶1)、FLT3(fms相关酪氨酸激酶3)、FLT4(fms相关酪氨酸激酶4)、FSTL4(卵泡抑素样4)、FSTL5(卵泡抑素样5)、GP6(糖蛋白VI血小板)、GPA33(糖蛋白A33)、GPR116、GPR125、ADGRF5(粘附G蛋白偶联受体F5)、ADGRA2(粘附G蛋白偶联受体A2)、hEMMPRIN、HEPACAM(肝细胞和胶质细胞粘附分子)、HEPACAM2(HEPACAM家族成员2)、HLA-DMA、HLA-DMB、HLA-DQB、HLA-DQB1、HNT、HSPG2(硫酸乙酰肝素蛋白聚糖2)、HYST2477、ICAM1(细胞间粘附分子1)、ICAM2(细胞间粘附分子2)、ICAM3(细胞间粘附分子3)、ICAM4(细胞间粘附分子4(Landsteiner-Wiener血型))、ICAM5(细胞间粘附分子5)、DCC(DCC netrin 1受体)、NEO1(neogenin 1)、IGHA1、IGHD、IGHE、IGDCC4(免疫球蛋白超家族DCC亚类成员4)、IGLON5(IgLON家族成员5)、IGSF1(免疫球蛋白超家族成员1)、IGSF2(免疫球蛋白超家族成员2)、IGSF3(免疫球蛋白超家族成员3)、IGSF5(免疫球蛋白超家族成员5)、IGSF9(免疫球蛋白超家族成员9)、IGSF9B(免疫球蛋白超家族成员9B)、IGSF10(免疫球蛋白超家族成员10)、IGSF11(免疫球蛋白超家族成员11)、IGSF21(免疫球蛋白超家族成员21)、IGSF23(免疫球蛋白超家族成员23)、IL1R1(白介素1受体1型)、IL1R2(白介素1受体2型)、IL1RAP(白介素1受体辅助蛋白)、IL1RAPL1(白介素1受体辅助蛋白样1)、IL1RAPL2(白介素1受体辅助蛋白样2)、IL1RL1(白介素1受体样1)、IL1RL2(白介素1受体样2)、IL6R(白介素6受体)、IL11RA(白介素11受体亚基α)、IL12B(白介素12B)、IL18BP(白介素18结合蛋白)、IL18R1(白介素18受体1)、IL18RAP(白介素18受体辅助蛋白)、ISLR2(含有富亮氨酸重复序列2的免疫球蛋白超家族)、JAM2(连接粘附分子2)、JAM3(连接粘附分子3)、KDR(激酶插入域受体)、KIR-123FM、KIR2DL1(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾1)、KIR2DL2(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾2)、KIR2DL3(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾3)、KIR2DL4(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾4)、KIR2DL5A(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾5A)、KIR2DF5B(杀伤细胞免疫球蛋白样受体、两个Ig域和长胞质尾5B)、KIR2DLX、KIR2DS1(杀伤细胞免疫球蛋白样受体、两个Ig域和短胞质尾1)、KIR2DS2(杀伤细胞免疫球蛋白样受体、两个Ig域和短胞质尾2)、KIR2DS3(杀伤细胞免疫球蛋白样受体、两个Ig域和短胞质尾3)、KIR2DS4(杀伤细胞免疫球蛋白样受体、两个Ig域和短胞质尾4)、KIR2DS5(杀伤细胞免疫球蛋白样受体、两个Ig域和短的胞质尾5)、kir3d、KIR3DL1(杀伤细胞免疫球蛋白样受体、三个Ig域和长胞质尾1)、KIR3DL2(杀伤细胞免疫球蛋白样受体、三个Ig域和长胞质尾2)、KIR3DL3(杀伤细胞免疫球蛋白样受体、三个Ig域和长胞质尾3)、KIR3DP1(杀伤细胞免疫球蛋白样受体、三个Ig域假基因1)、KIR3DS1(杀伤细胞免疫球蛋白样受体、三个Ig域和短胞质尾1)、KIR3DX1(杀伤细胞免疫球蛋白样受体、三个Ig域X1)、KIRREL1(kirre样肾病蛋白(nephrin)家族粘附分子1)、KIRREL2(kirre样肾病蛋白家族粘附分子2)、KIRREL3(kirre样肾病蛋白家族粘附分子3)、KIT(KIT原癌基因受体酪氨酸激酶)、L1CAM、LAG3(淋巴细胞激活(蛋白)3)、LAIR1(白细胞相关的免疫球蛋白样受体1)、LAIR2(白细胞相关的免疫球蛋白样受体2)、LEPR(瘦素受体)、LILRA1(白细胞免疫球蛋白样受体A2)、LILRA2(白细胞免疫球蛋白样受体A2)、LILRA3(白细胞免疫球蛋白样受体A3)、LILRA4(白细胞免疫球蛋白样受体A4)、LILRA5(白细胞免疫球蛋白样受体A5)、LILRA6(白细胞免疫球蛋白样受体A6)、LILRB1(白细胞免疫球蛋白样受体B1)、LILRB2(白细胞免疫球蛋白样受体B2)、LILRB3(白细胞免疫球蛋白样受体B3)、LILRB4(白细胞免疫球蛋白样受体B4)、LILRB5(白细胞免疫球蛋白样受体B5)、LILRP2、LRIG1、LRIG2、LR1G3、LRIT1、LRRC4、LSAMP、LSR(脂解刺激脂蛋白受体)、LY9(淋巴细胞抗原9)、MADCAM1(粘膜血管地址素(addressin)细胞粘附分子1)、MAG(髓磷脂相关糖蛋白)、MALT1(MALT1paracaspase)、MCAM(黑色素瘤细胞粘附分子)、MDGA1(包含MAM域的糖基磷脂酰肌醇锚定因子1)、MDGA2(包含MAM域的糖基磷脂酰肌醇锚定因子2)、MERTK(MER原癌基因、酪氨酸激酶)、MFAP3、MIR、MILR1(肥大细胞免疫球蛋白样受体1)、MMP23A(基质金属肽酶23A(假基因))、MMP23B(基质金属肽酶23B)、MUSK(肌肉相关受体酪氨酸激酶)、MXRA5(基质重塑相关5)、MYBPC3、MYOM1(myomesin1)、MYOM2(myomesin 2)、MYOM3(myomesin 3)、NCA、NCAM1、NCAM2、NCR1(天然细胞毒性触发受体1)、NEGR1、NEO1、NFASC、NOPE、NPHS1(NPHS1,nephrin)、NPTN(neuroplastin)、NRCAM(神经细胞粘附分子)、NTRK1(神经营养受体酪氨酸激酶1)、NRG1、NT、NTRK3、OBSCN、OBSL1(obscurin样1)、OPCML、OSCAR(破骨细胞相关的免疫球蛋白样受体)、PAPLN、PDCD1LG2(程序性细胞死亡1配体2)、PDGFRA(血小板源生长因子受体α)、PDGFRB(血小板源生长因子受体β)、PDGFRL(血小板源生长因子受体样)、PECAM1(血小板和内皮细胞粘附分子1)、PRODH2、PSG1(妊娠特异性β-1-糖蛋白1)、PSG2(妊娠特异性β-1-糖蛋白2)、PSG3(妊娠特异性β-1-糖蛋白3)、PSG4(妊娠特异性β-1-糖蛋白4)、PSG5(妊娠特异性β-1-糖蛋白5)、PSG6(妊娠特异性β-1-糖蛋白6)、PSG7(妊娠特异性β-1-糖蛋白7(基因/假基因))、PSG8(妊娠特异性β-1-糖蛋白8)、PSG9(妊娠特异性β-1-糖蛋白9)、PSG10(妊娠特异性β-1-糖蛋白10)、PSG11(妊娠特异性β-1-糖蛋白11)、PSG11 s'(妊娠特异性β-1-糖蛋白11s')、PTGFRN(前列腺素F2受体抑制因子)、PTK7(蛋白酪氨酸激酶7(无活性))、PTPRD(蛋白酪氨酸磷酸酶,D型受体)、PTPRK(蛋白酪氨酸磷酸酶,K型受体)、PTPRM(蛋白酪氨酸磷酸酶,M型受体)、PTPRS蛋白酪氨酸磷酸酶,S型受体、PTPRT(蛋白酪氨酸磷酸酶,T型受体)、PTPσ、PUNC、PVR(脊髓灰质炎病毒受体)、PVRL1、PVRL2、PVRL4、NECTIN1(连接蛋白(nectin)细胞粘附分子1)、NECTIN2(连接蛋白细胞粘附分子2)、NECTIN3(连接蛋白细胞粘附分子3)、RAGE、ROBO3(环回引导受体3)、SCN1B(钠电压门控通道β亚基1)、SDK1(辅助细胞粘附分子1)、SDK2(辅助细胞粘附分子2)、SEMA3A(信号蛋白(semaphorin)3A)、SEMA3B(信号蛋白3B)、SEMA3E(信号蛋白3E)、SEMA3F(信号蛋白3F)、SEMA3G(信号蛋白3G)、SEMA4C(信号蛋白4C)、SEMA4D(信号蛋白4D)、SEMA4G(信号蛋白4G)、SEMA7A(信号蛋白7A(John Milton Hagen血型))、SIGIRR(含单个Ig和TIR域)、SIGLEC1(唾液酸结合Ig样凝集素1)、SIGLEC5(唾液酸结合Ig样凝集素5)、SIGLEC6(唾液酸结合Ig样凝集素6)、SIGLEC7(唾液酸结合Ig样凝集素7)、SIGLEC8(唾液酸结合Ig样凝集素8)、SIGLEC9(唾液酸结合Ig样凝集素9)、SIGLEC10(唾液酸结合Ig样凝集素10)、SIGLEC11(唾液酸结合Ig样凝集素11)、SIGLEC12(唾液酸结合Ig样凝集素12(基因/假基因))、SIGLEC14(唾液酸结合Ig样凝集素14)、SIGLEC15(唾液酸结合Ig样凝集素15)、SLAMF1(信号传导性淋巴细胞激活分子家族成员1)、SLAMF6(SLAM家族成员6)、SLAMF8(SLAM家族成员8)、SIRPG;TARM1(与T细胞相互作用的髓样细胞激活受体1)、TEK(TEK受体酪氨酸激酶)、THY1(Thy-1细胞表面抗原)、TIE1(酪氨酸激酶,具有免疫球蛋白样和EGF样域1)、TMEM81(跨膜蛋白81)、TMIGD1(含跨膜和免疫球蛋白域的1)、TMIGD2(含跨膜和免疫球蛋白域的2)、TTN(titin)、TYRO3(TYRO3蛋白酪氨酸激酶)、UNC5D、VCAM1(血管细胞粘附分子1)、VSIG1(含V-组和免疫球蛋白域的1)、VSIG2(含V-组和免疫球蛋白域的2)、VSIG4(含V-组和免疫球蛋白域的4)、VSIG10(含V-组和免疫球蛋白域的10)、VSIG10L(含V-组和免疫球蛋白域的10样)、VSTM1(含V-组和跨膜域的1)、VTCN1(含V-组域的T细胞激活抑制因子1)、ZPBP(透明带(zona pellucida)结合蛋白)或ZPBP2(透明带结合蛋白2)。

更优选地,Ig样域是下列蛋白质中任一种的Ig样域:CD2、CD3、CD4、CD8、CD19、CD22、CD33、CD80、CD86,具体地CD4。

另外,还优选,目标(多)肽包括一个或多个抗体域或由其组成,如一个或多个可变域(例如,轻链可变域(V

Ig样域的进一步优选的实例如下文所述。

另一优选的功能域(被包含在目标(多)肽中)包括(已知)蛋白质的胞外和/或胞内域或由其组成。另外,功能域可优选地包括(已知)可溶性球蛋白质的域或由其组成。更优选地,功能域包括(已知)蛋白质的胞外域或(已知)可溶性球蛋白质的域或由其组成。

优选地,功能域(被包含在目标(多)肽中)包含下列或由下列组成:载体域、报告域、标签、定位域、(独立的)结合位点、酶或酶促域、受体或其功能片段,或配体或其功能片段。

优选地,功能域(被包含在目标(多)肽中)包含酶或其酶促域或由酶或其酶促域组成。“酶”是多肽或蛋白质催化剂,即酶通常加速化学反应。酶可能作用的分子被称为底物,并且酶将底物转化为不同分子,称为产物。细胞中几乎所有的代谢过程都需要酶——为了以快到足以维持生命的速度发生。优选的酶包括氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。对于形成二聚体的酶,目标(多)肽可以包含通过连接体连接的两个相同域。例如,酶可以是可用于在特定位点例如肿瘤处激活前药的。优选的酶和包含这种酶的抗体的用途的实例被描述于Andrady C,Sharma SK,Chester KA;Antibody-enzyme fusionproteins for cancer therapy;Immunotherapy.2011Feb;3(2):193-211和Boado RJ1,Zhang Y,Zhang Y,Xia CF,Wang Y,Pardridge WM;Genetic engineering of a lysosomalenzyme fusion protein for targeted delivery across the human blood-brainbarrier;Biotechnol Bioeng.2008Feb1;99(2):475-84。

优选的酶选自脱氢酶、荧光素酶、DMSO还原酶、醇脱氢酶(NAD)、醇脱氢酶(NADP)、高丝氨酸脱氢酶、氨基丙醇氧化还原酶、二乙酰基还原酶、甘油脱氢酶、丙二醇-磷酸脱氢酶-3、甘油-3-磷酸脱氢酶(NAD+)、D-木酮糖还原酶、L-木酮糖还原酶、乳酸脱氢酶、苹果酸脱氢酶、异柠檬酸脱氢酶、HMG-辅酶A还原酶、葡萄糖氧化酶、L-古洛糖酸内酯氧化酶(L-gulonolactone oxidase)、硫胺氧化酶、黄嘌呤氧化酶、乙醛脱氢酶、甘油醛3-磷酸脱氢酶、丙酮酸脱氢酶、氧戊二酸脱氢酶、胆绿素(Biliverdin)还原酶、单胺氧化酶、二氢叶酸还原酶、亚甲基四氢叶酸还原酶、肌氨酸氧化酶、二氢苯并菲啶氧化酶、NADH脱氢酶、尿酸氧化酶、亚硝酸还原酶、硝酸还原酶、谷胱甘肽还原酶、硫氧还蛋白还原酶、亚硫酸氧化酶、细胞色素c还原酶、辅酶Q-细胞色素c还原酶、儿茶酚氧化酶、漆酶、细胞色素c过氧化物酶、过氧化氢酶、髓过氧化物酶、甲状腺过氧化物酶、谷胱甘肽过氧化物酶、4-羟基苯基丙酮酸双加氧酶、Renilla-荧光素2-单加氧酶、Cypridina-荧光素2-单加氧酶、萤火虫荧光素酶、Watasenia-荧光素2-单加氧酶、Oplophorus-荧光素2-单加氧酶、芳香酶、CYP2D6、CYP2E1、CYP3A4、细胞色素P450氧化酶、一氧化氮双加氧酶、一氧化氮合酶、芳香酶、苯丙氨酸羟化酶、酪氨酸酶、超氧化物歧化酶、铜蓝蛋白、固氮酶、脱碘酶、谷胱甘肽S转移酶、儿茶酚-O-甲基转移酶、DNA甲基转移酶、组蛋白甲基转移酶、ATC酶、鸟氨酸转氨甲酰酶、氨基乙酰丙酸合酶、胆碱乙酰基转移酶、XIII因子、γ-谷氨酰转肽酶、转谷氨酰胺酶、次黄嘌呤-鸟嘌呤磷酸核糖基转移酶、硫胺酶、丙氨酸转氨酶、天冬氨酸转氨酶、丁酸激酶、核酸酶、核酸内切酶、核酸外切酶、酸水解酶、磷脂酶A、磷脂酶C、乙酰胆碱酯酶、胆碱酯酶、脂蛋白脂肪酶、泛素羧基末端水解酶L1、磷酸酶、碱性磷酸酶、果糖双磷酸酶、CGMP特异性磷酸二酯酶5型、磷酸酶D、限制酶1型、限制酶2型、限制酶3型、限制酶4型、脱氧核糖核酸酶I、RNA酶H、核糖核酸酶、淀粉酶、蔗糖酶、几丁质酶、溶菌酶、麦芽糖酶、乳糖酶、β-半乳糖苷酶、透明质酸酶、腺苷甲硫氨酸水解酶、S-腺苷-L-高半胱氨酸水解酶、烯基甘油磷酸胆碱水解酶、烯丙基甘油磷酸乙醇胺水解酶、胆固醇5,6-氧化物水解酶、Hepoxilin-环氧化物水解酶、异分支酸酶(Isochorismatase)、白三烯-A4水解酶、柠檬烯-1,2-环氧化物水解酶、微粒体环氧化物水解酶、反式环氧琥珀酸水解酶、丙氨酸氨肽酶、血管紧张素转换酶、丝氨酸蛋白酶、胰凝乳蛋白酶(Chymotrypsin)、胰蛋白酶、凝血酶、X因子、纤溶酶、顶体蛋白(Acrosin)、VII因子、IX因子、脯氨酰寡肽酶、XI因子、弹性蛋白酶、XII因子、蛋白酶K、组织纤溶酶原激活因子、蛋白C、分离酶、胃蛋白酶、凝乳酶(Rennet)、肾素、胰蛋白酶原、Plasmepsin、基质金属蛋白酶、金属内肽酶、尿素酶、β-内酰胺酶、精氨酸酶、腺苷脱氨酶、GTP环水解酶I、腈水解酶(Nitrilase)、解旋酶、DnaB解旋酶、RecQ解旋酶、ATP酶、NaKATP酶、ATP合酶、犬尿氨酸酶(Kynureninase)、卤代乙酸脱卤酶、裂解酶、鸟氨酸脱羧酶、尿苷单磷酸合酶、芳香族L-氨基酸脱羧酶、RubisCO、碳酸酐酶、色氨酸合酶、苯丙氨酸解氨酶、胱硫醚γ-裂解酶、胱硫醚β-裂解酶、白三烯C4合酶、二氯甲烷脱卤酶、卤代醇脱卤酶、腺苷酸环化酶、鸟苷酸环化酶、氨基酸消旋酶:苯丙氨酸消旋酶、丝氨酸消旋酶、扁桃酸酯消旋酶、UDP-葡萄糖4-表异构酶、甲基丙二酰辅酶A表异构酶、FKBP:FKBP1A、FKBP1B、FKBP2、FKBP3、FKBP5、FKBP6、FKBP8、FKBP9、FKBP10、FKBP52、FKBPL、亲环蛋白、细小蛋白(Parvulin)、脯氨酰异构酶、2-氯-4-羧亚甲基丁-2-烯-1,4-酸内酯异构酶、β-胡萝卜素异构酶、法尼醇2-异构酶、呋喃基呋喃酰胺异构酶、亚油酸异构酶、马来酸异构酶、马来酰乙酰乙酸异构酶、马来酰丙酮酸异构酶、细小蛋白、光异构酶、前番茄红素异构酶、脯氨酰异构酶、视网膜异构酶、视黄醇异构酶、ζ-胡萝卜素异构酶、烯酰辅酶A异构酶、蛋白质二硫键异构酶、磷酸葡萄糖变位酶、粘康酸环异构酶、3-羧基-顺式,顺式粘康酸环异构酶、四羟基蝶啶环异构酶、肌醇-3-磷酸合酶、羧基-顺式,顺式粘康酸环化酶、查耳酮异构酶、氯粘康酸环异构酶、(+)-冰片基二磷酸合酶、环桉烯醇环异构酶、α-蒎烯氧化物脱环酶、二氯粘康酸环异构酶、柯巴基二磷酸合酶、Ent-柯巴基二磷酸合酶、Syn-柯巴基-二磷酸合酶、Terpentedienyl-二磷酸合酶、Halimadienyl-diphosphate合酶、(S)-β-macrocarpene合酶、番茄红素ε-环化酶、番茄红素β-环化酶、Prosolanapyrone-III环异构酶、D-核糖吡喃酶、类固醇δ异构酶、拓扑异构酶、6-羧基四氢蝶呤合酶、FARSB、谷氨酰胺合酶、CTP合酶、精氨酸琥珀酸合酶、丙酮酸羧化酶、乙酰辅酶A羧化酶和DNA连接酶。

更优选的酶可以选自羧肽酶、β-内酰胺酶、胞嘧啶脱氨酶、β-葡糖醛酸糖苷酶、嘌呤核苷磷酸化酶、粒酶B、胱天蛋白酶和RNA酶如HPR(人胰腺RNA酶、barnase、牛精液RNA酶、onconase、RapLRI、血管生成素、dicer、DIS3样核酸外切酶2、磷酸二酯酶ELAC2、RNA酶HIII、RNA酶T2和tRNA剪接核糖核酸酶。

酶的功能片段可以是具有介导功能的能力的任何酶片段。通常,这种片段被称为“域”。因此,酶的功能片段可以是酶的任何域。优选的实例包括上述(示例的)酶的功能片段(例如域)。优选地,功能域所包含的酶功能片段是酶的催化域。酶的催化域是酶与其底物相互作用以引起酶促反应的区域。例如,功能域可以是以下酶中任一种的催化域:羧肽酶、β-内酰胺酶、胞嘧啶脱氨酶、β-葡糖醛酸糖苷酶、嘌呤核苷磷酸化酶、粒酶B、胱天蛋白酶和RNA酶如HPR(人胰腺RNA酶、barnase、牛精液RNA酶、onconase、RapLRI、血管生成素、dicer、DIS3样核酸外切酶2、磷酸二酯酶ELAC2、RNA酶HIII、RNA酶T2和tRNA剪接核糖核酸酶。

优选地,功能域(被包含在目标(多)肽中)包含载体域或由其组成。如本文所用,“载体域”指代实现抗体与另一分子缀合的氨基酸序列。在一个优选的实例中,载体域实现抗体或其抗原结合片段与例如药物、成像剂或纳米颗粒的缀合。总体上,可用于本发明环境的缀合物的优选实例被描述于Wu,A.M.,and Senter,P.D.(2005)Arming antibodies:Prospects and challenges for immunoconjugates.Nat.Biotechnol.23,1137–1146。

例如,可以与抗体缀合的药物包括抗癌药物,如Thomas A,Teicher BA,Hassan R;Antibody-drug conjugates for cancer therapy;Lancet Oncol.2016Jun;17(6):e254-62.doi:10.1016/S1470-2045(16)30030-4描述的那些。例如,可以与抗体缀合的成像剂被描述于Steve Knutson,Erum Raja,Ryan Bomgarden,Marie Nlend,Aoshuang Chen,Ramaswamy Kalyanasundaram,and Surbhi Desai;Development and Evaluation of aFluorescent Antibody-Drug Conjugate for Molecular Imaging and TargetedTherapy of Pancreatic Cancer;PLoS One 2016;11(6):e0157762。这种药物优选是细胞毒性剂。可以与本发明的抗体或抗原结合片段缀合的药物的优选实例包括阿霉素、截短的假单胞菌外毒素A、类美登素DM1。

可以与本发明的抗体或抗原结合片段缀合的成像剂的实例包括放射性同位素,如Schubert M,Bergmann R,

可与本发明的抗体或抗原结合片段缀合的成像剂的进一步实例包括荧光染料、量子点和氧化铁。荧光染料的实例包括以下作为报告域描述的那些。氧化铁纳米颗粒的实例被描述于Hengyi Xu,Zoraida P.Aguilar,Lily Yang,Min Kuang,Hongwei Duan,YonghuaXiong,Hua Wei,and Andrew Wang:Antibody Conjugated Magnetic Iron OxideNanoparticles for Cancer Cell Separation in Fresh WholeBlood.Biomaterials.2011Dec;32(36):9758–9765。

抗体缀合物(即与其他分子缀合的抗体)是本领域已知的。具体地,缀合至抗体的分子可以通过可剪切或不可剪切的连接体连接至抗体(例如,如Thomas H.Pillow.Novellinkers and connections for antibody-drug conjugates to treat cancer andinfectious disease.Pharmaceutical Patent Analyst Vol.6,No.1,February 3rd,2017,https://doi.org/10.4155/ppa-2016-0032;或Beck A,Goetsch L,Dumontet C,

进一步优选的载体域是用于缀合的域,如白喉(diphtheria)毒素、破伤风(tetanus)类毒素(T)、脑膜炎球菌(meningococcal)外膜蛋白复合物(OMPC)、白喉类毒素(D)和流感嗜血杆菌(influenzae)蛋白D(HiD)的遗传修饰的交叉反应物质(CRM),例如如Pichichero ME:Protein carriers of conjugate vaccines:characteristics,development,and clinical trials,Hum Vaccin Immunother.2013Dec;9(12):2505-23所述。

优选地,功能域(被包含在目标(多)肽中)包含报告域或由其组成。报告域通常由报告基因编码。报告域是这样的域:其存在(例如,在细胞、生物体中)可以容易被观察的。报告域包括例如荧光蛋白,如GFP/EGFP(绿色荧光蛋白/增强的绿色荧光蛋白)、YFP(黄色荧光蛋白)、RFP(红色荧光蛋白,如tdTomato或DsRed)和CFP(青色荧光蛋白)、荧光素酶和诸如β-半乳糖苷酶和过氧化物酶的酶。报告域可用于体内和离体方法。例如,荧光蛋白使细胞在被特定波长的光激励时发出荧光,荧光素酶使细胞催化产生光的反应,并且诸如β-半乳糖苷酶的酶使底物转化为有色产物。有几种不同的方法来根据具体的报告因子和期望的表征数据种类测量或定量报告因子。总体上,显微术可用于获得有关报告因子活性的空间和时间信息,特别是在单个细胞的水平上。流式细胞术最适于在大细胞群体上测量报告因子活性分布。平板读取器总体上最适于进行多个不同样本随时间的群体平均测量。可与给定底物反应的酶,如β-半乳糖苷酶和过氧化物酶,可用于例如人类样品的离体染色,例如在肿瘤诊断中。但是,在一些实施方式中,目标(多)肽不包含GFP(绿色荧光蛋白)或RFP(红色荧光蛋白,如tdTomato或DsRed)。更总体而言,在一些实施方式中,目标(多)肽不包含荧光(报告)蛋白。因此,在一些实施方式中,DNA分子不包含编码GFP或RFP(或总体而言,荧光(报告)蛋白)的核苷酸序列。

优选地,报告域包含编码GFP/EGFP、YFP、RFP、CFP、荧光素酶、β-半乳糖苷酶或过氧化物酶的氨基酸序列或由其组成。另外,如下所述的荧光标签也可用作报告域。

优选地,功能域(被包含在目标(多)肽中)包含定位域或由其组成。总体上,定位域将蛋白质引导至某个靶标,例如在生物体或细胞的水平上。定位域可以将根据本发明的抗体或抗原结合片段引导至细胞中的特定物理位置,如核、膜、周质、细胞外分泌、身体的特定部分或其他位置。

例如,为将根据本发明的抗体或抗原结合片段引导到细胞中,功能域可包括细胞穿透肽或由其组成。术语“细胞穿透肽”(“CPP”,也称为“蛋白转导域”/“PTD”)总体上用于表示能够跨质膜运送不同类型货物分子并且因此促进细胞摄取各种分子货物(从纳米尺寸颗粒到小化学分子和DNA大片段)的短肽。细胞穿透肽通常具有这样的氨基酸组成:含有高相对丰富的带正电荷的氨基酸如赖氨酸或精氨酸,或具有包含极性/带电荷氨基酸和非极性疏水性氨基酸的交替模式的序列。这两种类型的结构分别称为聚阳离子型或两亲型。通常,细胞穿透肽(CPP)是具有8至50个残基的、具有穿越细胞膜并进入大多数细胞类型的能力的肽。或者,其也被称为蛋白质转导域(PTD),反映其起源为存在于天然蛋白质中。Frankel和Pabo与Green和Lowenstein同时描述了来自人类免疫缺陷病毒1(HIV-TAT)的反式激活转录激活因子穿透到细胞中的能力(Frankel,A.D.and C.O.Pabo,Cellular uptake of thetat protein from human immunodeficiency virus.Cell,1988.55(6):p.1189-93)。在1991年,黑腹果蝇(Drosophila melanogaster)的触角足同源域(DNA结合域)到神经细胞中的转导被描述(Joliot,A.,et al.,Antennapedia homeobox peptide regulates neuralmorphogenesis.Proc Natl Acad Sci U S A,1991.88(5):p.1864-8)。在1994年,被称为Penetratin的第一个16mer肽CPP被表征来自于触角足同源域的第三个螺旋(Derossi,D.,et al.,The third helix of the Antennapedia homeodomain translocates throughbiological membranes.J Biol Chem,1994.269(14):p.10444-50),然后在1998年识别了蛋白质转导所需的最小域TAT(Vives,E.,P.Brodin,and B.Lebleu,A truncated HIV-1Tatprotein basic domain rapidly translocates through the plasma membrane andaccumulates in the cell nucleus.J Biol Chem,1997.272(25):p.16010-7)。在过去的二十年里,描述了数十种肽,其来自不同来源,包括病毒蛋白,例如VP22(Elliott,G.andP.O'Hare,Intercellular trafficking and protein delivery by a herpesvirusstructural protein.Cell,1997.88(2):p.223-33),或来自毒液,例如蜂毒肽(Dempsey,C.E.,The actions of melittin on membranes.Biochim Biophys Acta,1990.1031(2):p.143-61)、mastoporan(Konno,K.,et al.,Structure and biological activities ofeumenine mastoparan-AF(EMP-AF),a new mast cell degranulating peptide in thevenom of the solitary wasp(Anterhynchium flavomarginatum micado).Toxicon,2000.38(11):p.1505-15)、maurocalcin(Esteve,E.,et al.,Transduction of thescorpion toxin maurocalcine into cells.Evidence that the toxin crosses theplasma membrane.J Biol Chem,2005.280(13):p.12833-9)、响尾蛇胺(crotamine)(Nascimento,F.D.,et al.,Crotamine mediates gene delivery into cells throughthe binding to heparan sulfate proteoglycans.J Biol Chem,2007.282(29):p.21349-60)或buforin(Kobayashi,S.,et al.,Membrane translocation mechanism ofthe antimicrobial peptide buforin2.Biochemistry,2004.43(49):p.15610-6)。还设计了合成CPP,包括聚精氨酸(R8、R9、R10和R12)(Futaki,S.,et al.,Arginine-richpeptides.An abundant source of membrane-permeable peptides having potentialas carriers for intracellular protein delivery.J Biol Chem,2001.276(8):p.5836-40)或transportan(Pooga,M.,et al.,Cell penetration by transportan.FASEBJ,1998.12(1):p.67-77)。任何上述CPP可在根据本发明的抗体或抗原结合片段中用作细胞穿透肽。可在根据本发明的抗体或抗原结合片段中用作细胞穿透肽的各种CPP也被公开于以下综述:Milletti,F.,Cell-penetrating peptides:classes,origin,and currentlandscape.Drug Discov Today 17(15-16):850-60,2012。

可用于根据本发明的抗体或抗原结合片段的定位域的另一个实例是用于穿越血脑屏障的域,例如如Farrington GK,Caram-Salas N,Haqqani AS,Brunette E,EldredgeJ,Pepinsky B,Antognetti G,Baumann E,Ding W,Garber E,Jiang S,Delaney C,BoileauE,SiskWP,Stanimirovic DB.A novel platform for engineering blood-brainbarrier-crossing bispecific biologics.FASEB J.2014Nov;28(11):4764-78所述。

定位域的另一个实例是核定位域。核定位域将蛋白质(具体地根据本发明的抗体或抗原结合片段)导向细胞核。核定位域可用于抗体或抗原结合片段阻断转录因子的活性和调节基因表达。核定位域的优选实例被描述于Kalderon D,Roberts BL,Richardson WD,Smith AE(1984)"A short amino acid sequence able to specify nuclear location"Cell39(3Pt 2):499–509and in Lusk CP,Blobel G,King MC(May 2007)"Highway to theinner nuclear membrane:rules for the road"Nature Reviews Molecular CellBiology8(5):414–20。

优选地,功能域(被包含在目标(多)肽中)包括标签或由其组成。更优选地,标签是亲和标签、溶解标签、色谱标签、表位标签或荧光标签。

标签是嫁接到重组蛋白上的肽序列。标签的实例包括亲和标签、溶解标签、色谱标签、表位标签、荧光标签和蛋白质标签。亲和标签可用于利用亲和技术将蛋白质从其粗生物来源纯化。亲和标签的实例包括几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)和谷胱甘肽-S-转移酶(GST)。进一步实例是与金属基质结合的聚(His)标签。溶解标签可以特别用于对于在伴侣蛋白缺陷物种(例如大肠杆菌(E.coli))中表达的重组蛋白,以协助蛋白质中的适当折叠和防止其沉淀。溶解标签的实例包括硫氧还蛋白(TRX)和聚(NANP)。色谱标签可用于更改蛋白质的色谱特性,以在具体分离技术中提供不同的分辨率。色谱标签通常由聚阴离子氨基酸组成,如FLAG标签。表位标签是短肽序列,其被选择是因为可以在多种不同物种中可靠地产生高亲和力抗体。这些通常源自病毒基因,这解释了其高免疫反应性。表位标签包括V5标签、Myc标签、HA标签和NE标签。这些标签对于蛋白质印迹、免疫荧光和免疫沉淀实验特别有用,尽管其也可用于抗体纯化。荧光标签可用于提供关于蛋白质视觉读出。GFP及其变体是最常用的荧光标签。GFP可用作折叠报告因子(在折叠时荧光,否则无色)。蛋白质标签可以允许特定的酶促修饰(如通过生物素连接酶进行的生物素化)或化学修饰(如与FlAsH-EDT2反应进行荧光成像)。标签可以组合,例如以将蛋白质连接到多种其他组分。标签可以是通过化学试剂或通过酶促手段(例如蛋白水解或内含肽剪接)可去除的。

标签的优选实例包括但不限于下列:双Strep标签(SAWSHPQFEKGGGSGGGSGGSAWSHPQFEK;SEQ ID NO:65);AviTag,允许通过酶BirA进行生物素化并且因此蛋白质可通过链霉亲和素分离的肽(GLNDIFEAQKIEWHE;SEQ ID NO:66);钙调蛋白-标签,被钙调蛋白结合的肽(KRRWKKNFIAVSAANRFKKISSSGAL;SEQ ID NO:67);聚谷氨酸标签,与阴离子交换树脂(如Mono-Q)有效结合的肽(EEEEEE;SEQ ID NO:68);E-标签,被抗体识别的肽(GAPVPYPDPLEPR;SEQ ID NO:69);FLAG-标签,被抗体识别的肽(DYKDDDDK;SEQID NO:70);HA-标签,被抗体识别的来自血凝素的肽(YPYDVPDYA;SEQ ID NO:71);His-标签,被镍或钴螯合物结合的5-10个组氨酸(HHHHHH;SEQ ID NO:72);Myc-标签,被抗体识别的源自c-myc的肽(EQKLISEEDL;SEQ ID NO:73);NE-标签,被单克隆IgG1抗体被识别的18氨基酸合成肽(TKENPRSNQEESYDDNES;SEQ ID NO:74),其可用于多种应用,包括蛋白质印迹、ELISA、流式细胞术、免疫细胞化学、免疫沉淀和重组蛋白质亲和纯化;S-标签,源自核糖核酸酶A的肽(KETAAAKFERQHMDS;SEQ ID NO:75);SBP-标签,结合至链霉亲和素的肽(MDEKTTGWRGGHVVEGLAGELEQLRARLEHHPQGQREP;SEQ ID NO:76);Softag 1,用于哺乳动物表达(SLAELLNAGLGGS;SEQ ID NO:77);Softag 3,用于原核生物表达(TQDPSRVG;SEQ ID NO:78);Strep-标签,结合至链霉亲和素或修饰的链霉亲和素的肽(被称为streptactin)(Strep-标签II:WSHPQFEK;SEQ ID NO:79);TC标签,被FlAsH和ReAsH双砷化合物识别的四半胱氨酸标签(CCPGCC;SEQ ID NO:80);V5标签,被抗体识别的肽(GKPIPNPLLGLDST;SEQ IDNO:81);VSV-标签,被抗体识别的肽(YTDIEMNRLGK;SEQ ID NO:82);Xpress标签(DLYDDDDK;SEQ ID NO:83);Isopeptag,共价结合至pilin-C蛋白的肽(TDKDMTITFTNKKDAE;SEQ ID NO:84);SpyTag,共价结合至SpyCatcher蛋白的肽(AHIVMVDAYKPTK;SEQ ID NO:85);SnoopTag,共价结合至SnoopCatcher蛋白的肽(KLGDIEFIKVNK;SEQ ID NO:86);Ty1标签(EVHTNQDPLD;SEQ ID NO:87);BCCP(生物素羧基载体蛋白),被BirA生物素化、能够被链霉亲和素识别的蛋白质域;谷胱甘肽-S-转移酶(GST)-标签,结合至固定化谷胱甘肽的蛋白质;绿色荧光蛋白-标签,自发荧光并且可被纳米体结合的蛋白质;HaloTag,共价附接至反应性卤代烷底物的突变细菌卤代烷脱卤酶,这允许实现与多种底物的附接;麦芽糖结合蛋白(MBP)-标签,结合至直链淀粉琼脂糖的蛋白质;Nus(N-利用物)-标签;硫氧还蛋白(Trx)-标签;肝片吸虫(Fasciola hepatica)8-kDa抗原(Fh8)-标签;小泛素修饰(SUMO)-标签;溶解性增强肽序列(SET)-标签;蛋白G的IgG域B1(GB1)-标签;蛋白A的IgG重复域ZZ(ZZ)-标签;溶解性增强普遍标签(SNUT)-标签;17千道尔顿蛋白质(Skp)-标签;噬菌体T7蛋白质激酶(T7PK)-标签;大肠杆菌分泌的蛋白A(EspA)-标签;单体噬菌体T7 0.3蛋白(Orc蛋白)/Mocr-标签;大肠杆菌胰蛋白酶抑制因子(Ecotin)-标签;钙结合蛋白(CaBP)-标签;应激响应性砷酸还原酶(ArsC)-标签;翻译起始因子N端片段IF2(IF2-域I)-标签;表达性标签(翻译起始因子N端片段IF2);应激响应性蛋白RpoA、SlyD、Tsf、RpoS、PotD、Crr-标签;大肠杆菌酸性蛋白msyB、yjgD、rpoD标签(参见例如Costa S,Almeida A,Castro A,Domingues L.Fusion tags forprotein solubility,purification and immunogenicity in Escherichia coli:thenovel Fh8 system.Frontiers in Microbiology.2014;5:63,in particular Table 1inCosta et al.,2014)。

因此,标签优选包含根据SEQ ID NO:65-87中任一者的氨基酸序列或其序列变体或由之组成。最优选地,标签是Strep标签,具体地根据SEQ ID NO:65或79。

优选地,功能域(被包含在目标(多)肽中)包含受体或其功能片段(也称为“受体域”)或由之组成。“受体”是结合特定的(信号)分子、其配体并且可以引发响应(例如,在细胞中)的多肽或蛋白质。在自然界中,受体具体地位于细胞膜之上或之内(细胞表面受体)或胞内(胞内受体)。优选的受体包括离子通道连接的(离子移变型)受体、G蛋白连接的(代谢型)激素受体和酶连接的激素受体、胞质受体和核受体。对于形成二聚体的受体,目标(多)肽可以包含通过连接体连接的两个相同域。

优选的受体是包含Ig样域的受体。具体地,所述受体可以是包含Ig样域的抑制受体或包含Ig样域的激活受体。包含Ig样域的抑制受体的优选实例包括程序性细胞死亡蛋白1(PD-1或PD1)、细胞毒性T淋巴细胞相关蛋白4(CTLA4)、B和T淋巴细胞衰减因子(BTLA)、T-细胞免疫球蛋白和含有粘蛋白域的3(TIM-3;也称为甲型肝炎病毒细胞受体2(HAVCR2))、具有Ig和ITIM域的T细胞免疫受体(TIGIT)、细胞表面糖蛋白CD200受体1(CD200R1)、2B4(CD244;SLAMF4)、Trem(在髓样细胞上表达的触发受体)样转录物2(TLT2)、白细胞免疫球蛋白样受体亚家族B成员4(LILRB4)和杀伤细胞免疫球蛋白样受体、双Ig域和长胞质尾2(KIR2DL2)。包含Ig样域的激活受体的优选实例包括诱导型T细胞COS刺激因子(ICOS)和CD28。特别优选地,受体是程序性细胞死亡蛋白1(PD-1或PD1)或信号传导性淋巴细胞激活分子(SLAM)。

进一步优选的受体是可溶性受体,例如如Heaney ML,Golde DW.Solublereceptors in human disease.J Leukoc Biol.1998Aug;64(2):135-46中公开。其实例包括TNFR(肿瘤坏死因子受体)、p55、p75、Fas(CD95)、神经生长因子受体、CD27、CD30、生长激素受体、GM-CSF受体、促红细胞生成素受体(EpoR)、血栓生成素受体、G-CSF受体、IL-1RI(白介素1受体I)、IL-1RII(白介素1受体II)、IL-2Rα(白介素2受体α、Tac、CD25)、IL-4R(白介素4受体)、IL-5Rα(白介素5受体α)、IL-7R(白介素7受体)、IL-6Rα(白介素6受体α)、gp130、CNTFR(睫状神经营养因子受体)、LIFR(白血病抑制因子受体)、瘦素受体、IL-11R(白介素11受体)、IL-12p40(白介素12受体p40)、干细胞因子受体(c-kit)、干扰素受体、脂多糖受体(CD14)、补体受体I型(CD35)、透明质酸受体(CD44)、CD58、IgE受体(FcεRII、CD23)、IgG受体(FcγRII)、ICAM-1(CD54)、ICAM-3(CD50)、转化生长因子β受体III、表皮生长因子受体(c-erb B)、血管内皮生长因子受体、血小板源生长因子受体、成纤维细胞生长因子、集落刺激因子1受体(MCFR、c-fms)、ARK(肾上腺素能受体激酶)、Tie(血管生成素受体)、胰岛素受体、胰岛素样生长因子II受体和甘露糖6-磷酸受体。

更优选地,可溶性受体是可溶性细胞因子受体,如I类细胞因子受体超家族受体、II类细胞因子受体超家族受体、IL-1/TLR家族受体、TGF-β受体家族受体、TNFR超家族受体、或IL-17R。I类细胞因子受体超家族的优选受体包括IL-4Rα、IL-5Rα、IL-6Rα、IL-7Rα、IL-9Rα、EpoR、G-CSFR、GM-CSFRα、gp130和LIFRα。II类细胞因子受体超家族的优选受体包括I型IFNR,如IFNAR1和IFNAR2α。IL-1/TLR家族的优选受体包括IL-1RII和IL-1RacP。TGF-β受体家族的优选受体包括TβR-I和激活素受体样激酶7。TNFR超家族的优选受体包括TNFRSF6/Fas/CD95和TNFRSF9/4-1BB/CD137。因此,细胞因子受体的优选实例包括IL-4Rα、IL-5Rα、IL-6Rα、IL-7Rα、IL-9Rα、EpoR、G-CSFR、GM-CSFRα、gp130、LIFRα、IFNAR1、IFNAR2α、IL-1RII、IL-1RacP、TβR-I、激活素受体样激酶7、TNFRSF6/Fas/CD95、TNFRSF9/4-1BB/CD137和IL-17R。包含含有这种受体或其功能片段的功能域的抗体或抗体片段可以在抗体到达其靶标时调节炎症反应。例如,主要通过响应各种刺激而蛋白水解剪切生成的可溶性II型IL-1受体(sIL-1RII)可以通过优先结合IL-1β来减弱过量的IL-1生物活性。例如,可溶性IL-1RacP其是通过可选的剪接而非通过外域剪切而生成的。例如,可溶性IL-6受体以类似于膜IL-6R的亲和力结合IL-6,从而延长IL-6的半衰期。

受体的功能片段可以是具有介导功能的能力的任何受体片段。通常,这种片段称为“域”。因此,受体的功能片段可以是受体的任何域。优选的实例包括上述(示例的)受体的功能片段(例如域)。优选地,功能域所包含的受体功能片段是受体的胞外域。例如,功能域可以是以下任何受体的胞外域:IL-4Rα、IL-5Rα、IL-6Rα、IL-7Rα、IL-9Rα、EpoR、G-CSFR、GM-CSFRα、gp130、LIFRα、IFNAR1、IFNAR2α、IL-1RII、IL-1RacP、TβR-I、激活素受体样激酶7、TNFRSF6/Fas/CD95、TNFRSF9/4-1BB/CD137、IL-17R、p55、p75、神经生长因子受体、CD27、CD30、生长激素受体、血栓生成素受体、IL-1RI(白介素1受体I)、IL-2Rα(白介素2受体α、Tac、CD25)、CNTFR(睫状神经营养因子受体)、瘦素受体、IL-11R(白介素11受体)、IL-12p40(白介素12受体p40)、干细胞因子受体(c-kit)、干扰素受体、脂多糖受体(CD14)、补体受体I型(CD35)、透明质酸受体(CD44)、CD58、IgE受体(FcεRII、CD23)、IgG受体(FcγRII)、ICAM-1(CD54)、ICAM-3(CD50)、转化生长因子β受体III、表皮生长因子受体(c-erb B)、血管内皮生长因子受体、血小板源生长因子受体、成纤维细胞生长因子、集落刺激因子1受体(MCFR、c-fms)、ARK(肾上腺素能受体激酶)、Tie(血管生成素受体)、胰岛素受体、胰岛素样生长因子II受体和甘露糖6-磷酸受体。

优选地、功能域所包含的受体功能片段是Ig样域。例如,功能域可以是以下任何受体的Ig样域:PD1、SLAM、LAIR1、CTLA4、BTLA、TIM-3、TIGIT、CD200R1、2B4(CD244)、TLT2、LILRB4、KIR2DL2、ICOS或CD28。优选地,功能域不包含跨膜域。最优选地,受体包含PD1、SLAM或LAIR1(的片段)或其组成,如SEQ ID NO 88-90中任一者所示的氨基酸序列或其序列变体。

此外,特别优选,功能域包含突变白细胞相关免疫球蛋白样受体1(LAIR1)片段或由其组成,如WO 2016/207402A1中所述。SEQ ID NO:88所示的突变LAIR1片段或其具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,还更优选90%,特别优选95%,最优选至少98%的序列同一性的序列变体是最优选的。

突变LAIR1片段:

EDLPRPSISAEPGTVIPLGSHVTFVCRGPVGVQTFRLERERNYLYSDTEDVSQTSPSESEARFRIDSVNAGNAGLFRCIYYKSRKWSEQSDYLELVVK

[SEQ ID NO:88]

特别优选地,功能域(被包含在目标(多)肽中)包括下列或由下列组成:PD1或SLAM的Ig样片段,如SEQ ID NO:89或SEQ ID NO:90所示的氨基酸序列;或其具有至少70%,优选地至少75%,更优选地至少80%,甚至更优选地至少85%,还更优选地90%,特别优选地95%,最优选地至少98%序列同一性的序列变体。

PD-1片段:

DSPDRPWNPPTFSPALLVVTEGDNATFTCSFSNTSESFVLNWYRMSPSNQTDKLAAFPEDRSQPGQDCRFRVTQLPNGRDFHMSVVRARRNDSGTYLCGAISLAPKAQIKESLRAELRVT

[SEQ ID NO:89]

SLAM片段:

EQVSTPEIKVLNKTQENGTCTLILGCTVEKGDHVAYSWSEKAGTHPLNPANSSHLLSLTLGPQHADNIYICTVSNPISNNSQTFSPWPGCRTDPS

[SEQ ID NO:90]

优选地,功能域(被包含在目标(多)肽中)包含配体或其功能片段或由之组成。“配体”是与蛋白质或任何其他分子上的特定位点特异性结合的分子。在本发明的环境中,配体是肽、多肽或蛋白质,因为其被包含在目标(多)肽中。配体的结合具体地通过分子间力发生,如离子键、氢键和范德华力。配体的优选实例是细胞因子和上述任一种受体的配体,具体地下列受体的配体:PD1、SLAM、LAIR1、CTLA4、BTLA、TIM-3、TIGIT、CD200R1、2B4(CD244)、TLT2、LILRB4、KIR2DL2、ICOS或CD28,如PD-L1、PD-L2、B7-1、B7-2、B7-H4(B7同系物)、半乳糖凝集素-9(galectin-9)、脊髓灰质炎病毒受体(PVR)、OX-2膜糖蛋白、CD48、B7-H3(B7同系物)、MHCI和ICOS-L。

优选地,配体是细胞因子或其功能片段。细胞因子通常是在细胞信号传导中重要的小蛋白质(~5-20kDa)。其由细胞释放并影响其他细胞的行为,并且有时影响释放细胞本身的行为。细胞因子可以选自趋化因子,如SIS家族细胞因子、SIG家族细胞因子、SCY家族细胞因子、血小板因子-4超家族和intercrines、CC趋化因子配体(CCL)-1至-28(具体地CCL12)、CXCL1-CXCL17、XCL1(淋巴细胞激活素-α(lymphotactin-α))和XCL2(淋巴细胞激活素-β)、fractalkine(或CX

其他优选的配体包括例如激素,其是肽、多肽或蛋白质。激素是信号传导分子,其通过循环系统被运送到远处靶标器官,具体地以调控生理和行为。激素通常在多细胞生物体中由腺体产生。特别优选的激素是(人)生长激素。激素的进一步实例包括TRH、加压素、胰岛素、催乳素、ACTH、催产素、心房钠尿肽(ANP)、胰高血糖素、生长抑素、胆囊收缩素、胃泌素、瘦素、血管紧张素II、碱性成纤维细胞生长因子2和甲状旁腺激素相关蛋白。

配体的功能片段可以是具有介导功能的能力的任何配体片段。通常,这种片段称为“域”。因此,配体的功能片段可以是配体的任何域。优选的实例包括上述(示例的)配体的功能片段(例如域)。优选地,功能域所包含的配体功能片段是Ig样域。

优选地,功能域(被包含在目标(多)肽中)包含(独立的)结合位点或由其组成。因此,优选地,目标(多)肽包含(独立的)结合位点或由其组成。

总体上,(独立的)结合位点”是具体靶标(例如分子和/或离子)可结合(具体地通过形成化学键,例如非共价键)的(多肽)链的区域。非共价键是不涉及电子紧密共享的相对弱的化学键。多个非共价键通常使大分子的构象稳定,并介导分子之间的高度特异性的相互作用。因此,结合位点是提供结合功能的功能域。具体地,结合位点不是连接体,如GS-连接体。连接体通常不提供结合功能。即使结合位点可以任选地包含连接体(肽)如GS-连接体,但其优选不是由连接体(肽)如GS-连接体组成。换句话说,即使结合位点包含连接体(肽)如GS-连接体,其也优选包含介导不同于(纯粹)使两个肽彼此连接的功能的其它氨基酸序列。因此,结合位点优选不同于连接体(肽)如GS连接体。

优选地,(独立的)结合位点选自受体及其功能片段、配体及其功能片段、CD分子及其功能片段、单链抗体及其抗原结合片段、抗原及其功能片段、和标签。

更优选地,(独立的)结合位点包含受体或其功能片段或由之组成。受体通常能够结合(特异性)配体。因此,受体也可被称为(独立的)结合位点。以上描述了各种受体及其优选实施方式和实例相应地适用。

在结合位点的环境中,受体的功能片段就是保留受体与其配体结合的能力的受体片段。由于结合位点可包含受体或其功能片段,在结合位点的环境中术语“功能”指的是受体的结合功能。受体的其他片段/域可以优选地不被(独立的)结合位点包含。例如,受体可以包含一个或多个跨膜域,其通常不涉及受体的结合功能,并且因此优选不被包括在(独立的)结合位点中。因此,最优选地,(独立的)结合位点所包含的受体片段仅是受体的结合位点(具体地,无受体的任何其他域)。

还更优选地,(独立的)结合位点包含配体或其功能片段或由之组成。配体通常能够结合(特异性)受体。因此,配体也可以称为(独立的)结合位点。各种配体被上文描述,并且其优选的实施方式和实例相应地适用。

在结合位点的环境中,配体的功能片段是这样的配体片段:保留配体的结合能力。由于结合位点可包含配体或其功能片段,在结合位点的环境中术语“功能”指的是配体的结合功能。配体的其他片段/域可以优选地不被(独立的)结合位点包含。因此,最优选,(独立的)结合位点所包含的配体片段仅是配体的结合位点(具体地,无配体的任何其他域)。

优选地,(独立的)结合位点是CD(分化簇)分子或其功能片段。CD(分化簇)分子是细胞表面标记。CD分子通常充当受体或配体,或涉及细胞粘附。CD命名是通过始于1982年的HLDA(Human Leukocyte Differentiation Antigens)研讨会开发和维持的。可在本发明的环境中用作结合位点的CD分子的实例可例如从本领域技术人员已知的多种来源检索,如http://www.ebioscience.com/resources/human-cd-chart.htm,BD Bioscience’s“Humanand Mouse CD Marker Handbook”(可从https://www.bdbiosciences.com/documents/cd_marker_handbook.pdf检索)或www.hcdm.org。因此,(独立的)结合位点可以是CD标记或其功能片段,例如(人)CD标志物,被描述于BD Bioscience’s“Human and Mouse CD MarkerHandbook”(可在https://www.bdbiosciences.com/documents/cd_marker_handbook.pdf)或“CD标记图”的其他来源,其通常还指示结合伙伴,从而可以选择合适的结合位点。

CD分子的功能片段是CD分子的这样的片段:保留CD分子的结合能力。在本发明的环境中,结合位点可包含CD分子或其功能片段,因此,术语“功能”指的是CD分子的结合功能。CD分子的其他片段/域可以优选地不被(独立的)结合位点包含。因此,最优选地,(独立的)结合位点所包含的CD分子的片段仅是CD分子的结合位点(具体地,无CD分子的任何其他域)。优选地,(独立的)结合位点所包含的CD分子的功能片段是Ig样域。

优选地,(独立的)结合位点是单链抗体(如scFv或VHH)或其抗原结合片段。还优选,(独立的)结合位点是抗原或其功能片段,如表位。

优选地,(独立的)结合位点是单链抗体或其抗原结合片段。单链抗体是仅由一个单多肽链组成的重组抗体。单链抗体的优选实例包括没有恒定域的单链抗体如单域抗体,基于单链可变片段(scFv's)和单链双抗体(scDb)的单链抗体,以及具有恒定域的单链抗体如单链Fab片段(scFab;Hust M,Jostock T,Menzel C,Voedisch B,Mohr A,Brenneis M,Kirsch MI,Meier D,Dübel S.Single chain Fab(scFab)fragment.BMCBiotechnol.2007Mar 8;7:14)。

基于单链可变片段(scFv’s)的单链抗体的优选实例包括scFv(单一一个VH和单一一个VL域)和串联scFv’s,如串联-双-scFv(BiTE)、串联-三-scFv和串联-四-scFv。

单域抗体(也称为“纳米抗体”)是仅包含/由单一一个(单体)可变域/由单一一个(单体)可变域组成的抗体片段。如同完整抗体,单域抗体能够选择性结合特定抗原。第一个单域抗体是由骆驼科动物中发现的重链抗体改造的;这些被称为“VHH”或“VHH片段”。软骨鱼类也具有重链抗体(IgNAR,“免疫球蛋白新抗原受体”),由其可获得单域抗体,称为“V

最优选地,功能域是VHH或scFv。VHH的最优选实例是T3-VHH或F4-VHH。例如,单域抗体优选包含下列或由下列组成:SEQ ID NO:91或93所示的氨基酸序列或其具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,还更优选90%,特别优选95%,最优选至少98%序列同一性的序列变体。scFv的最优选实例是TT39.7-scFv或MPE8-scFv。例如,单域抗体优选包含下列或由下列组成:SEQ ID NO:92或94所示的氨基酸序列或其具有至少70%,优选至少75%,更优选至少80%,甚至更优选至少85%,还更优选90%,特别优选95%,最优选至少98%的序列同一性的序列变体。

T3-VHH:

MAQVQLVESGGGLVQAGGSLTLSCAASGSTSRSYALGWFRQAPGKEREFVAHVGQTAEFAQGRFTISRDFAKNTVSLQMNDLKSDDTAIYYCVASNRGWSPSRVSYWGQGTQVTVSS

[SEQ ID NO:91]

TT39.7-scFv:

QITLKESGPTLVKPTQTLTLTCTFSGFSLSTSRVGVGWIRQPPGKALEWLSLIYWDDEKHYSPSLKNRVTISKDSSKNQVVLTLTDMDPVDTGTYYCAHRGVDTSGWGFDYWGQGALVTVSSGGGGSGGGGSGGGGSQSALTQPASVSGSPGQSITISCSGAGSDVGGHNFVSWYQQYPGKAPKLMIYDVKNRPSGVSYRFSGSKSGYTASLTISGLQAEDEATYFCSSYSSSSTLIIFGGGTRLTVL

[SEQ ID NO:92]

F4-VHH:

QVQLQESGGGLVQPGGSLRLSCAASGFTLDYYYIGWFRQAPGKEREAVSCISGSSGSTYYPDSVKGRFTISRDNAKNTVYLQMNSLKPEDTAVYYCATIRSSSWGGCVHYGMDYWGKGTQVTVSS

[SEQ ID NO:93]

MPE8-scFv:

EVQLVESGGGLVKPGGSLRLSCAASGFTFSSYSMNWVRQAPGKGLEWVSSISASSSYSDYADSAKGRFTISRDNAKTSLFLQMNSLRAEDTAIYFCARARATGYSSITPYFDIWGQGTLVTVSSGGGGSGGGGSGGGGSQSVVTQPPSVSGAPGQRVTISCTGSSSNIGAGYDVHWYQQLPGTAPKLLIYDNNNRPSGVPDRFSASKSGTSASLAITGLQAEDEADYYCQSYDRNLSGVFGTGTKVTVL

[SEQ ID NO:94]

优选地,(独立的)结合位点是抗原或其功能片段,具体地表位。抗原是能够被抗体结合的分子或分子部分。由于抗原或其功能片段被多肽链包含,应理解在本发明的环境中,如果结合位点是抗原或其功能片段,则所述抗原或其功能片段是肽或多肽。抗原通常包含一个或多个表位。表位是抗原的被抗体结合(被抗体“识别”)的部分。抗原的优选实例包括但不限于血清蛋白,例如细胞因子如IL4、IL5、IL9和IL13、生物活性肽、细胞表面分子,例如受体、转运体、离子通道、病毒和细菌蛋白、RAGE(晚期糖基化终产物的受体)、GPVI和胶原蛋白。

抗原的功能片段就是这样的抗原片段:保留抗原的结合能力。因此,抗原的片段优选是表位或其包含一个或多个表位。抗原的其他片段/域可以优选地不被(独立的)结合位点所包含。因此,最优选,(独立的)结合位点所包含的抗原片段是表位或包括多于一个表位(具体地,无抗原的任何其他域)。

还优选,(独立的)结合位点是包含结合位点的标签。大多数标签能够结合,例如亲和标签。因此,那些具有结合另一分子的能力的标签也可以被称为(独立的)结合位点。各种标签被上文描述,包括包含结合位点的标签,并且优选的实施方式和实例相应地适用。

最优选地,功能域是Ig样域、scFv、VHH或Strep标签。具体地,功能域优选地包含下列或由下列组成:SEQ ID NO 65、79和88-94中任一者所示的氨基酸序列或其具有至少80%,优选至少85%,更优选至少90%,甚至更优选至少95%,最优选至少98%序列同一性的序列变体。

在特别优选的实施方式中,目标(多)肽包含V

包含CD4、二肽基肽酶4、CD9或血管紧张素转化酶2或其片段或序列变体或由其组成的目标(多)肽是特别优选的。例如,分化簇(CD)4结合人类免疫缺陷病毒(HIV)。例如,二肽基肽酶4(DPP-4)和CD9被“中东呼吸综合征冠状病毒”(MERS-CoV)靶向。例如,血管紧张素转换酶2(ACE2)结合严重急性呼吸综合征(SARS-CoV)。

编码目标(多)肽的核苷酸序列的特别优选的实例包括下列或由下列组成:SEQ IDNO:111所示的核苷酸序列;或其具有至少70%、至少75%、优选地至少80%、优选地至少85%、更优选地至少88%、更优选地至少90%、甚至更优选地至少92%、甚至更优选地至少95%、还更优选地至少96%、还更优选地至少97%、最优选地至少98%或至少99%序列同一性的(功能)序列变体。

因此,根据本发明待引入分离的B细胞的DNA分子的特别优选的实例包括包含下列或由下列组成的DNA分子:SEQ ID NO:99或110所示的核苷酸序列;或其具有至少70%、至少75%、优选地至少80%、优选地至少85%、更优选地至少88%、更优选地至少90%、甚至更优选地至少92%、甚至更优选地至少95%、还更优选地至少96%、还更优选地至少97%、最优选地至少98%或至少99%序列同一性的(功能)序列变体。

B淋巴细胞培养和AID激活

如上所述,本发明提供了用于编辑B淋巴细胞的基因组的方法。具体地,可以编辑B淋巴细胞的基因组使得B淋巴细胞不表达其内源(即,天然重组的)B细胞受体(BCR),如上所述。例如,可以编辑B淋巴细胞的基因组,以用定制的(单克隆)抗体的序列替代内源性B细胞受体(BCR)。

为编辑B淋巴细胞的基因组,具体地在培养物中提供分离的(优选地原代)B淋巴细胞。用于培养分离的(优选原代)B细胞的方法是本领域已知的。

总体上,培养条件通常包含“完全培养基”。如本文所用,术语“培养基”总体上指代被设计以支持细胞生长的液体或凝胶。“完全培养基”指代补充有至少一种其他组分的基础培养基,优选基础合成培养基。完全培养基的非限制性实例被描述于WO03/076601、WO 05/007840、EP 787180、US 6,114,168、US 5,340,740、US 6,656,479、US 5,830,510和Pain等(1996,Development 122:2339-2348)。

如本文所用,“基础培养基”指代本身至少允许细胞存活且优选地允许细胞生长的培养基。具体地,基础培养基具有经典的培养基配方。基础培养基的非限制性实例包括BME(Eagle基础培养基)、MEM(最低限度Eagle培养基)、培养基199、DMEM(Dulbecco改良Eagle培养基)、敲除DMEM、GMEM(Glasgow改良Eagle培养基)、DMEM-HamF12、Ham-F12和Ham-F10、Iscove改良Dulbecco培养基(1MDM)、MacCoy 5A培养基和RPMI1640。具体地,基础培养基包含一种或多种无机盐(例如CaCl

优选地,本发明的培养基还包含动物血清,具体地胎儿动物血清。优选的动物血清是胎牛血清(FBS)。特别优选的FBS是HyClone(GE Healthcare Life Sciences;例如HyClone 40毫米过滤型,SH30070.03)。然而,也可以使用包含来自其他动物物种的血清的动物血清。培养基中动物血清的最终浓度优选为约0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

本发明的培养基可优选另外包含抗生素,如例如青霉素和链霉素和/或卡那霉素,具体地为了防止细菌污染。因此,青霉素/链霉素的组合是优选的。另外,卡那霉素也是优选的。例如,终末培养基可以包含青霉素/链霉素和/或卡那霉素。优选地,培养基中的抗生素浓度为1至1000U/ml,更优选10至500U/ml,甚至更优选50至250U/ml,特别优选约100U/ml。例如,青霉素/链霉素的组合可在终末培养基中以以下抗生素浓度使用:1至1000U/ml青霉素和1至1000μg/ml链霉素,更优选10至500U/ml青霉素和10-500μg/ml链霉素,甚至更优选50-250U/ml青霉素和50-250μg/ml链霉素,特别优选约100U/ml青霉素和约100μg/ml链霉素。还优选,终末培养基中的青霉素/链霉素浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。还优选,终末培养基中的卡那霉素浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

另外,本发明的培养基可以优选地包含其他添加剂,例如谷氨酰胺衍生物——优选地GlutaMax、NEAA、生物缓冲剂——优选地HEPES、丙酮酸盐(例如丙酮酸钠)、β-巯基乙醇和/或转铁蛋白。总体上,上述和其他添加剂可以以按照制造商所述的浓度使用。

谷氨酰胺衍生物可以是例如L-谷氨酰胺或GlutaMax,其中优选GlutaMax。GlutaMax是一种L-丙氨酰-L-谷氨酰胺二肽,其可例如作为在0.85%NaCl(100x原液)中的200mM L-丙氨酰-L-谷氨酰胺二肽获得。谷氨酰胺衍生物优选在最终培养基中以0.1-100mM,更优选0.5-50mM,甚至更优选1-10mM,特别优选约2mM的浓度使用。还优选,最终培养基中的GlutaMax浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

NEAA(即非必需氨基酸溶液)是可商购的无菌过滤的和细胞培养测试的液体制剂,具有Earle盐碱、非必需氨基酸、碳酸氢钠(NaHCO

丙酮酸盐(丙酮酸离子)是糖酵解中的中间有机酸代谢产物,并且是ErnbdenMyerhoff途径中可以很容易地进出细胞的第一个(物质)。因此,其在细胞培养基中的添加可为合成代谢过程提供能源和碳骨架。优选的丙酮酸盐是丙酮酸钠,其还可有助于减少荧光引起的光毒性。丙酮酸盐,优选地丙酮酸钠,优选以0.05至50mM,更优选0.1至10mM,甚至更优选0.5至5mM,特别优选约1mM的浓度在培养基中使用。还优选,最终培养基中丙酮酸(优选地丙酮酸钠)的浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

β-巯基乙醇(也称为2-巯基乙醇,β-ME或2-ME)被设想充当自由基清除剂。β-巯基乙醇优选以0.005-5.0mM,更优选0.01-1.0mM,甚至更优选0.05-0.5mM,特别优选约0.1mM的浓度在最终培养基中使用。还优选,最终培养基中的β-巯基乙醇浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

此外,还优选,最终培养基中的转铁蛋白浓度为0.01-10%,优选0.05-5%,更优选0.1-2.5%,甚至更优选0.5-1.5%,最优选约1%。

因此,根据本发明的特别优选的培养基包括:

—基础培养基,优选地RPMI或IMDM;

—优选地动物血清,更优选地FBS;

—优选地抗生素,更优选地青霉素/链霉素和/或卡那霉素;和

—优选地进一步的添加剂,包括例如谷氨酰胺衍生物(优选地GlutaMax)、NEAA、丙酮酸盐(例如丙酮酸钠)、β-巯基乙醇和/或转铁蛋白。

最优选地,B淋巴细胞被培养在具有10%FBS、1%NEAA、1%丙酮酸钠、1%β-巯基乙醇、1%Glutamax、1%青霉素/链霉素、1%卡那霉素和1%转铁蛋白的RPMI或IMDM中。

在另一实例中,B淋巴细胞可被培养在具有10%FBS、1%P/S(青霉素/链霉素)、1%HEPES(4-(2-羟基乙基)-1-哌嗪乙磺酸)和1%L-谷氨酰胺的RPMI(例如,RPMI-1640)中。

优选地,B淋巴细胞以下列密度培养:约或0.5x10

在根据本发明的方法的步骤(i)中,将B细胞的内源AID激活。优选地,B淋巴细胞的激活诱导性胞嘧啶脱氨酶的激活可例如通过在包括激活诱导性胞嘧啶脱氨酶的激活剂的培养基中培养B细胞而实现。优选地,激活诱导性胞嘧啶脱氨酶的激活剂选自:细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂、咪唑并喹啉化合物或任何所述激活剂的组合。换句话说,优选地,B淋巴细胞被培养在包括细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物的培养基中。

为激活B细胞内源AID,B淋巴细胞优选地在包括激活诱导性胞嘧啶脱氨酶的激活剂(如细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物)的细胞培养基中被培养约3小时至10天,优选地约6小时至7天,更优选地约12小时至5天,甚至更优选地约18小时至3天,还更优选地约21小时至2天。最优选地,B细胞在包括激活诱导性胞嘧啶脱氨酶的激活剂(如细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物)的细胞培养基中被培养约24小时。

因此,优选地,B淋巴细胞在包括激活诱导性胞嘧啶脱氨酶的激活剂(如细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物)的细胞培养基中被培养约3小时至10天后再引入DNA分子(步骤(ii)),优选地约6小时至7天后再引入DNA分子(步骤(ii)),更优选地约12小时至5天后再引入DNA分子(步骤(ii)),甚至更优选地约18小时至3天后再引入DNA分子(步骤(ii)),还更优选地约21小时至2天后再引入DNA分子(步骤(ii)),最优选地约24小时后再引入DNA分子(步骤(ii))。

另外,优选地,B淋巴细胞在包括激活诱导性胞嘧啶脱氨酶的激活剂(如细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物)的细胞培养基中被培养至少3小时后再引入DNA分子(步骤(ii)),优选地至少6小时后再引入DNA分子(步骤(ii)),更优选地至少12小时后再引入DNA分子(步骤(ii)),甚至更优选地至少18小时后再引入DNA分子(步骤(ii)),最优选地至少21小时后再引入DNA分子(步骤(ii)),如约24小时后再引入DNA分子(步骤(ii))。

还优选,B淋巴细胞在包括激活诱导性胞嘧啶脱氨酶的激活剂(如细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物)的细胞培养基中被培养不超过10天后再引入DNA分子(步骤(ii)),优选地不超过7天后再引入DNA分子(步骤(ii)),更优选地不超过5天后再引入DNA分子(步骤(ii)),甚至更优选地不超过3天后再引入DNA分子(步骤(ii)),还更优选地不超过2天后再引入DNA分子(步骤(ii)),最优选地不超过约36小时后再引入DNA分子(步骤(ii)),如约24小时后再引入DNA分子(步骤(ii))。

换句话说,在根据本发明的方法中,优选地,在B淋巴细胞中引入DNA分子如下进行:在将激活诱导性胞嘧啶脱氨酶激活后上至10天,优选地在将激活诱导性胞嘧啶脱氨酶激活后上至7天,更优选地在将激活诱导性胞嘧啶脱氨酶激活后上至5天,甚至更优选地在将激活诱导性胞嘧啶脱氨酶激活后上至2天,最优选地在将激活诱导性胞嘧啶脱氨酶激活后约1天。

如上所述,激活诱导性胞嘧啶脱氨酶的激活剂优选是细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物。

优选的Toll样受体(TLR)激动剂是TLR7或TLR9的激动剂,如R848或CL264。抗B细胞受体抗体或其片段的优选实例包括人免疫球蛋白的特异性抗B细胞受体F(ab')2-片段。CpG-B激动剂的优选实例是ODN2006。咪唑并喹啉化合物的优选实例是Clo97。

细胞因子的实例包括IL1样、IL1a、IL1β、IL1RA、IL18、CD132、IL2、IL4、IL7、IL9、IL13、IL15、CD131、IL3、IL5、GM-CSF、IL6样、IL6、IL11、G-CSF、IL12、LIF、OSM、IL10样、IL10、IL20、IL21、IL14、IL16、IL17、IFNα、IFNβ、IFNγ、CD154、LTβ、TNFα、TNFβ、4-1BBL、APRIL、BAFF、CD70、CD153、CD178、CD30L、CD40L、GITRL、LIGHT、OX40L、TALL-1、TRAIL、TWEAK、TRANCE、TGFβΙ、TGFβ2、TGFβ3、c-Kit、FLT-3、Epo、Tpo、FU-3L、SCF、M-CSF、aCD40、或其任何组合。优选地,细胞因子选自CD40L、IL4、IL2、IL21、BAFF、APRIL、CD30L、TGF-β1、4-1BBL、IL6、IL7、IL10、IL13、c-Kit、FLT-3、IFNα、或其任何组合。最优选地,B淋巴细胞被培养在包括IL4和/或CD40L的培养基中。

例如,B细胞可在引入DNA分子(步骤(ii);转染)前与CD40L表达细胞系(例如K562L或3T3细胞)共同培养。B细胞可在转染前被共同培养至少12、24、36、48或72小时。

优选地,细胞因子的浓度(在培养基中)是0.001-20ng/ml,优选地0.001-1ng/ml,更优选地0.005-0.5ng/ml,甚至更优选地0.01-0.1ng/ml,还更优选地0.015-0.02ng/ml,最优选地约0.16ng/ml。

另外,优选地,B淋巴细胞被培养在细胞培养基中,该细胞培养基包括如下浓度的细胞因子:至少0.001ng/ml,优选地至少0.001ng/ml,更优选地至少0.005ng/ml,甚至更优选地至少0.01ng/ml,还更优选地至少0.015ng/ml,最优选地约0.16ng/ml。

还优选,B淋巴细胞被培养在细胞培养基中,该细胞培养基包括如下浓度的细胞因子:不超过20ng/ml,优选地不超过1ng/ml,更优选地不超过0.5ng/ml,甚至更优选地不超过0.1ng/ml,还更优选地不超过0.02ng/ml,最优选地约0.16ng/ml。

在优选的实施方式中,激活诱导性胞嘧啶脱氨酶的激活通过CD40L和/或IL4进行(在CD40L和/或IL4存在的情况下培养B淋巴细胞)。换句话说,优选地,B淋巴细胞被培养在包括CD40L和/或IL4的细胞培养基中。更优选地,激活诱导性胞嘧啶脱氨酶的激活通过与CD40L表达细胞系共同培养(如上所述)和添加IL-4(至上述培养基)进行。最优选地,CD40L表达细胞系是K562L。

总体上,培养基中的IL4浓度可总体上如上文关于细胞因子所述。具体地,IL4浓度(在最终培养基中)优选是0.005-0.03ng/ml,更优选地0.01-0.025ng/ml,甚至更优选地0.015-0.02ng/ml,最优选地0.16ng/ml。

优选地,B淋巴细胞在将DNA分子引入B淋巴细胞后(转染后)被再激活。转染后的细胞再激活提高活力。对于再激活,可使用上述B细胞刺激剂可,即如上所述的细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物。换句话说,优选地,B细胞刺激剂,例如如上限定(细胞因子、抗B细胞受体抗体或其片段、TLR激动剂、CpG-B激动剂和/或咪唑并喹啉化合物),在将DNA分子引入B淋巴细胞后被施加于B淋巴细胞。

总体上,B淋巴细胞可在将DNA分子引入B淋巴细胞后(转染后)被一次或反复地再激活。例如,B淋巴细胞可被再激活约1、2、3、4、5、或更多天。优选地,B细胞在转染后不超过24小时被再激活(转染后第一次),例如转染后约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、或24小时。更优选地B细胞在转染后不超过18小时被再激活,甚至更优选地B细胞在转染后不超过12小时被再激活,最优选地B细胞在转染后不超过6小时被再激活,如转染后3-5小时,例如转染后约4小时。这种再激活最优选用IL4进行。另外,再激活(例如用IL4)优选地反复进行,每1-5天,优选地每2-4天,最优选地每3天。

另外地或可选地,B淋巴细胞特别优选地通过CD40L表达细胞如K562L细胞被再激活,例如一次或反复,最优选一次性地在转染后2至10天,优选转染后4至9天,更优选转染后6至8天,如转染后约7天。

在特别优选的实施方式中,B细胞在转染后4h和连续3天间隔用IL4再激活和在等7天用K562L细胞再激活。

优选地,在将DNA分子引入B淋巴细胞之前,用能够阻断可选的末端连接的DNA抑制剂处理B淋巴细胞。这种DNA抑制剂的优选实例是奥拉帕尼(Olaparib)。这种预处理阻断可选末端连接(a-EJ)途径,从而强制采用c-NHEJ途径和进一步提高改造效率。

还优选,在将DNA分子引入B淋巴细胞之前,将包含编码目标(多)肽的核苷酸序列的DNA分子与Ku蛋白如Ku70/Ku80一起温育。因此,在优选的实施方式中,将DNA分子/Ku蛋白复合物(在温育过程中形成)引入B淋巴细胞。从而,可以进一步增加DNA分子的成功整合数量。

还优选,DNA分子包含核定位信号,如SV40核定位信号,例如根据SEQ ID NO:95的SV串联重复序列或其序列变体:

SV串联重复序列:

TGGTTGCTGACTAATTGAGATGCATGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGGGACTTTCCACACCTGGTTGCTGACTAATTGAGATGCATGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGGGACTTTCCACACC

[SEQ ID NO:95]

从而,可以实现B淋巴细胞核中高浓度的DNA分子,这进而还进一步增加DNA分子在B淋巴细胞基因组中的整合。

另外,还优选,用核酸酶抑制剂处理B淋巴细胞,具体地在B淋巴细胞的激活诱导性胞苷脱氨酶激活后至少约24小时。核酸酶抑制剂的优选实例是Mirin。从而,可以避免引入B细胞的DNA分子被B细胞的内切和/或外切核酸酶降解。

转染

如上所述,用于引入包含编码目标(多)肽的核苷酸序列的DNA分子的方法(即转染方法)包括例如病毒和非病毒转染方法。可以用于基因转移的病毒包括逆转录病毒(包括慢病毒)、单纯疱疹病毒,腺病毒和腺病毒相关病毒(AAV)。然而,在一些实施方式中,B淋巴细胞不是用逆转录病毒转导。此外,纳米颗粒也可以用于转染。进一步的非病毒转染方法包括多种化学和物理方法。化学转染方法包括脂转染——例如基于阳离子脂质和/或脂质体、磷酸钙沉淀或基于阳离子聚合物(如DEAE-葡聚糖或聚乙烯亚胺(PEI)等)的转染。物理转染方法包括电穿孔、弹道基因转移(将包覆有DNA的颗粒引入细胞)、微注射(DNA通过微毛细管转移到细胞中)和核转染。优选地,包含编码目标(多)肽的核苷酸序列的DNA分子在B淋巴细胞中的引入是非病毒的。

最优选地,通过核转染将DNA分子引入B淋巴细胞。核转染是基于电穿孔的转染方法,其能够通过施加特定电压实现核酸(如DNA和RNA)到细胞中的转移。基于电穿孔物理方法,核转染利用了由核转染装置(“转染装置”)生成的电参数的组合,优选地连同细胞类型特异性试剂。DNA分子(底物)被直接转移到细胞核和细胞质中。因此,优选地,核转染装置用于核转染。总体上,可以使用任何核转染装置,例如

总体上,可以使用核转染装置制造商提供的任何核转染程序。优选地,2100-2500V与10-20ms(msec)的1或2个脉冲联用。更优选地,2100-2400V与10-20ms(msec)的1或2个脉冲联用。例如,可以使用2150V和10ms的单个脉冲。例如,可以使用2150V和15ms的单个脉冲。例如,可以使用2150V和20ms的单个脉冲。例如,可以使用2150V和10ms的两个脉冲。例如,可以使用2400V和10ms的单个脉冲。例如,可以使用2400V和15ms的单个脉冲。例如,可以使用2400V和20ms的单个脉冲。例如,可以使用2500V和10ms的单个脉冲。例如,可以使用2500V和15ms的单个脉冲。最优选地,使用(确切地)2150V和10ms的两个脉冲,具体地利用

优选地,使用B细胞的核转染试剂盒(例如,用于人B细胞的Lonza's Nucleofector试剂盒),具体地与

优选地,以约0.5μg至1.0μg DNA之间的量(每次转染的量,具体地核转染)转染DNA,例如DNA浓度可以为1、2、3、4、5、6、7、8、9或10μg。更优选地,转染的DNA浓度为约1μg至5μgDNA之间的量(每次转染的量,具体地核转染),甚至更优选1.5μg至3.5μg DNA,还更优选1.0至3.0μg DNA,最优选每次转染的DNA量为约2.5μg DNA。

优选地,基因组编辑的B细胞在基因组编辑过程之后或短培养期之后直接使用。对于临床用途,可以在使用前辐射基因组被编辑的B细胞。辐射引起细胞因子表达,其促进免疫效应细胞活性。

改造的B淋巴细胞及其用途

在另一方面,本发明还提供了通过如本文所述的根据本发明的方法可获得的改造B淋巴细胞。换句话说,本发明还提供了通过如本文所述的根据本发明的方法制备的改造B淋巴细胞。

因此,应当理解,以上所述的根据本发明的用于编辑B淋巴细胞的基因组的方法的详细描述和优选实施方式相应地适用于通过这种方法可获得的改造B淋巴细胞。例如,对上述编辑的B细胞,具体地目标优选(多)肽,的详细描述相应地适用于通过本发明方法可获得的B细胞。

总体上,本发明方法获得的B细胞可由于在B细胞基因组的转换区域中的异源插入序列而易于识别。

因此,本发明还提供了改造的B淋巴细胞,其包含编辑的免疫球蛋白基因座,该编辑的免疫球蛋白基因座包含异源插入序列,所述异源插入序列包含插入其转换区域的编码目标(多)肽的核苷酸序列。术语“异源”指代与内源序列(即原本位于该基因组位置的序列)不同的序列。总体上,上述包含编码目标(多)肽的核苷酸序列的DNA分子基本上相应于异源插入序列。因此,上述包含编码目标(多)肽的核苷酸序列的DNA分子的详细描述和优选实施方式相应地适用于异源插入序列。具体地,目的(多)肽与上述相同。

总体上,异源插入序列被插入免疫球蛋白基因基因座的转换区域。从而,免疫球蛋白基因座被编辑。总体上,对于改造的B淋巴细胞,上述根据本发明的用于编辑B淋巴细胞的基因组的方法的详细描述和优选实施方式也相应地适用。

总体上,本发明的改造B淋巴细胞可以是任何物种的。在一些实施方式中,改造B淋巴细胞是哺乳动物B淋巴细胞。优选地,根据本发明的改造B淋巴细胞是人的。因此,在一些实施方式中,改造B淋巴细胞不是鸡或鼠B淋巴细胞。具体地,优选不删除B淋巴细胞的IgL基因座。

具体地,在根据本发明的改造B细胞中,B细胞的基因组优选地被编辑以表达修饰的免疫球蛋白链,该修饰的免疫球蛋白链在N端至C端方向上包含:可变域、目标(多)肽(由步骤(ii)中引入的DNA分子编码)和恒定域。换句话说,B淋巴细胞的基因组优选地被编辑以表达修饰的免疫球蛋白链,该修饰的免疫球蛋白链包含布置在免疫球蛋白链的可变域和恒定域之间的目标(多)肽。因此,优选地,B淋巴细胞的基因组被编辑以表达修饰抗体,该修饰抗体包含在抗体的肘区中的目标(多)肽。此外,优选地,B淋巴细胞的基因组被编辑以表达修饰的B细胞受体,该修饰的B细胞受体包含在抗体的肘区中的目标(多)肽。在这种环境中,以上在根据本发明的方法的环境中提出的详细描述相应地适用。

还优选,B淋巴细胞的基因组被编辑以表达修饰的免疫球蛋白链,其中内源可变域被目标(多)肽替代。因此,还优选,B淋巴细胞的基因组被编辑以表达修饰的B细胞受体,其中内源可变域被目标(多)肽替代。因此,优选地,B淋巴细胞的基因组被编辑以表达修饰抗体,该修饰抗体包含目标(多)肽以“代替”内源可变域。同样,以上在根据本发明的方法的环境中提出的详细描述相应地适用。

还优选,B淋巴细胞的基因组被编辑以表达修饰的免疫球蛋白链,其中内源恒定域被目标(多)肽替代。因此,还优选,B淋巴细胞的基因组被编辑以表达修饰的B细胞受体,其中内源恒定域被目标(多)肽替代。因此,优选地,B淋巴细胞的基因组被编辑以表达修饰抗体,该修饰抗体包含目标(多)肽以“代替”内源恒定域。因此,这种修饰的免疫球蛋白链包含(内源)可变域、目标(多)肽,但不包含(内源)恒定域。同样,以上在根据本发明的方法的环境中提出的详细描述相应地适用。

优选地,根据本发明的改造B淋巴细胞的免疫球蛋白基因座的转换区域包含剪切位点,更优选地是自我加工位点,如T2A剪切位点。同样,以上在根据本发明的方法的环境中提出的关于剪切位点的详细描述相应地适用。

优选地,根据本发明的改造B淋巴细胞的免疫球蛋白基因座的转换区域包含编码病原结合域、V

在一些实施方式中,改造B淋巴细胞不表达GFP(绿色荧光蛋白)或RFP(红色荧光蛋白,例如tdTomato或DsRed)。更总体地,在一些实施方式中,改造的B淋巴细胞不表达(荧光)报告蛋白。

总体上,改造的B细胞可用于需要调节B细胞受体表达、特异性和/或功能的任何应用。优选地,改造的B淋巴细胞用于医学,即用于医学用途,例如用于免疫疗法。为此,B淋巴细胞优选地如本文所述被改造(即,基因组编辑)。

总体上,根据本发明的改造的B淋巴细胞所靶向的疾病包括可以用(单克隆)抗体治疗的任何疾病。这种疾病包括癌症、感染性疾病、自身免疫性障碍、移植排斥、骨质疏松、黄斑变性、多发性硬化症和心血管疾病。优选治疗和/或预防癌症和/或传染病。

优选地,根据本发明的改造的B细胞可以用于预防、治疗和/或改善癌症或肿瘤疾病(的药物的制备)。总体上,术语“癌症”包括实体瘤,具体地恶性实体瘤,如肉瘤、癌和淋巴瘤以及血液癌,如白血病。癌症包括癌、肉瘤、淋巴瘤、白血病、生殖细胞肿瘤和母细胞瘤。

优选地,根据本发明的改造B细胞可以用于预防、治疗和/或改善感染性疾病(的药物的制备)。感染性疾病包括病毒、逆转录病毒、细菌和原生动物感染性疾病。

此外,根据本发明的改造的B细胞可以用于预防、治疗和/或改善自身免疫性疾病(的药物的制备)。通常,自身免疫性疾病是由机体对正常存在于体内的物质和组织的异常免疫响应(自身免疫性)引起的。这可限于某些器官或可涉及不同位置的特定组织。自身免疫疾病可按相应的超敏反应类型分为:I型(即自体血清引起的荨麻疹)、II型、III型或IV型。

对于医学用途,优选将改造的B淋巴细胞给予患者。给予患者的B淋巴细胞可以是自体B淋巴细胞(即,将B细胞给予该B细胞或其祖细胞在改造前所被分离来自的同一患者)或同种异体B淋巴细胞(另一(人类)来源的,即B细胞并非源自其在改造后所被给予的患者。最优选地,B细胞是自体B淋巴细胞,即,接受改造B淋巴细胞的患者是在改造之前从中分离出B淋巴细胞(或其祖细胞)的患者。

因此,本发明还提供用于B细胞治疗的方法,包括以下步骤:

(a)从对象分离(非改造的)B淋巴细胞;

(b)如本文所述根据本发明改造B淋巴细胞;和

(c)将改造的B淋巴细胞给予(相同的)对象。

如果向对象/患者给予改造的B淋巴细胞(自体或同种异体),则优选在向对象/患者给予之前,关于已知涉及癌症(发生)的突变(即B细胞中是否发生这种突变)对B淋巴细胞进行测试(例如体外)。这种致癌突变的实例包括染色体易位。因此,可以否决被鉴定携带已知涉及癌症(发生)的突变的改造B淋巴细胞,即不向患者给予被鉴定携带已知涉及癌症(发生)的突变的改造B淋巴细胞。从而,大大降低了给予具有致癌突变的B细胞的风险。

测试B细胞中致癌突变的方法是本领域已知的。例如,B细胞表面上免疫球蛋白的损失是引起癌症的突变的指标。因此,在将B细胞给予于患者之前,可以选择保留BCR表面表达的改造B细胞。因此,优选在向患者给予B细胞之前,确认B细胞其表面上表达免疫球蛋白/B细胞受体。

可选地或另外地,在给予患者/对象之前,还可以检查改造的B细胞是否存在具体致癌基因。这样的癌基因的实例包括BCL6、BCL2(MCL1)、BCL11和MALT1。因此,优选在向患者给予B细胞之前,确认B细胞未显示癌基因(例如BCL6、BCL2(MCL1)、BCL11和/或MALT1)的表达失调(例如,过表达)。

在进一步方面,本发明还提供了本文所述的改造B淋巴细胞的细胞系。具体地,术语“细胞系”指代永生化细胞系。永生化细胞系是来自被永生化并且可以因此在体外生长延长时间的多细胞生物的细胞群体。使B细胞永生化的方法是本领域已知的。优选地,使用EBV(Epstein-Barr病毒)永生化。例如,用EBV进行B细胞永生化的改进方法被描述于TraggiaiE,Becker S,Subbarao K,Kolesnikova L,Uematsu Y,Gismondo MR,Murphy BR,RappuoliR,Lanzavecchia A.(2004):An efficient method to make human monoclonalantibodies from memory B cells:potent neutralization of SARS coronavirus.NatMed.10(8):871-5。

这种永生化的B细胞系对于人抗体的生产特别有用。因此,本发明还提供了用于生成包含(异源)目标多肽)的抗体或其片段的方法,该方法包括以下步骤:

(1)提供如本文所述的根据本发明的改造的B淋巴细胞或B细胞系,其中B淋巴细胞包含(被)编辑的免疫球蛋白基因座,该编辑的免疫球蛋白基因座包含异源插入序列,该异源插入序列包含其转换区域中插入的编码目标(多)肽的核苷酸序列;

(2)培养改造的B淋巴细胞或B细胞系;和

(3)从B细胞培养物分离包含目标(异源)(多)肽的抗体或其片段。

由于抗体是由B细胞分泌的,抗体的分离容易实现。优选地,分离的抗体被纯化。这意味着抗体通常将存在于基本上不含其他多肽的组合物中,例如,其中少于90%(按重量计),通常少于60%,更通常少于50%的组合物由其他多肽组成。

另外,根据本发明的用于生成抗体或其片段的方法优选地进一步包括抗体或抗体片段的表征,其中表征包括

—进行功能测定以确定抗体或抗体片段的功能;

—进行结合测定以确定抗体或抗体片段的结合特异性和/或被该抗体或抗体片段识别的结合伙伴/表位;和/或

—进行中和测定以确定抗体或抗体片段中和毒素或病原的能力。

功能测定、结合测定和中和测定是本领域已知的。技术人员将根据抗体的功能选择合适的测定。例如,如果抗体包含结合位点(例如,如果插入的目标(多)肽包含结合位点),则技术人员可以用所述结合位点的结合伙伴进行结合测定。

在进一步方面,本发明还提供了通过本文所述的根据本发明的生成抗体的方法可获得的抗体。换句话说,本发明还提供了通过本文所述的根据本发明的用于生成抗体的方法制备的抗体。这样的抗体包含如上所述的目标(多)肽。因此,目标(多)肽可以如上所述位于抗体的肘区中。可选地,目标(多)肽也可以如本文所述替代抗体的可变区或恒定区(例如重链的)。

在进一步方面,本发明还提供了包含根据本发明的改造的B淋巴细胞或根据本发明的抗体的组合物。优选地,所述组合物还包含药学上可接受的载体、稀释剂和/或赋形剂。因此,该组合物优选是药物组合物。

尽管载体或赋形剂可以促进给予,但是其本身不应引起对接受组合物的个体有害的抗体的产生。其也不应是有毒的。合适的载体可以是大的、缓慢代谢的大分子,如蛋白质、多肽、脂质体、多糖、聚乳酸、聚乙醇酸、聚合氨基酸、氨基酸共聚物和无活性病毒颗粒。总体上,根据本发明的药物组合物中的药学上可接受的载体可以是活性组分或无活性组分。

可以使用药学上可接受的盐,例如无机酸盐,如盐酸盐、氢溴酸盐、磷酸盐和硫酸盐,或有机酸盐,如乙酸盐、丙酸盐、丙二酸盐和苯甲酸盐。

药物组合物中的药学上可接受的载体可以另外包含液体,如水、盐水、甘油和乙醇。另外,这种组合物中可以存在辅助物质,如湿润剂或乳化剂或pH缓冲物。这种载体使药物组合物能够被配制成片剂、丸剂、糖衣丸、胶囊、液体、凝胶、糖浆、浆液和悬浮液,以供对象摄取。

本发明的药物组合物可以以各种形式制备。例如,可以将组合物制备成注射剂,作为液体溶液或悬浮液。也可以制备适于在注射前溶解或悬浮在液体媒介物中的固体形式(例如,冻干组合物,类似于Synagis

优选地,组合物中的活性成分是根据本发明的改造的B细胞或抗体。组合物可以包含保护抗体免于降解或确保B细胞生存的试剂。

对药学上可接受的载体的深入讨论可在Gennaro(2000)Remington:The Scienceand Practice of Pharmacy,20th edition,ISBN:0683306472中找到。

本发明的药物组合物总体上具有5.5至8.5之间的pH,在一些实施方式中,其可以在6至8之间,并且在其他实施方式中,为约7。可以通过使用缓冲剂来维持pH。组合物可以是无菌的和/或无热原的。组合物对于人可以是等渗的。在一个实施方式中,本发明的药物组合物在气密容器中被供应。

组合物可以采取在油性或水性媒介物中的悬浮液、溶液或乳液的形式,并且具体地,其可以包含配制剂,例如悬浮剂、防腐剂、稳定剂和/或分散剂。或者,抗体分子可以是干燥形式,以在使用之前用适当的无菌液体重构。

组合物可以包含媒介物,如水或盐水。通常将媒介物理解为适于存储、运输和/或给予化合物(如药物活性化合物,具体地根据本发明的抗体)的材料。例如,媒介物可以是适于存储、运输和/或给予药物活性化合物(具体地根据本发明的抗体)的生理上可接受的液体。

组合物可以是不含热原且具有合适的pH、等渗性和稳定性的水溶液。本领域相关技术人员完全能够制备合适的溶液,例如使用等渗媒介物如氯化钠注射液、林格氏注射液、乳酸林格氏注射液。防腐剂、稳定剂、缓冲剂、抗氧化剂和/或其他添加剂可以按需被包括在内。根据本发明的组合物可以例如在预填充注射器中被提供。

如上限定的组合物也可以是包括但不限于以下的剂型:胶囊、片剂、水性悬浮液或溶液。在片剂情况下,常用的载体包括乳糖和玉米淀粉。通常还添加润滑剂,如硬脂酸镁。对于胶囊形式,有用的稀释剂包括乳糖和干燥玉米淀粉。当需要水性悬浮液时,可以将活性成分与乳化剂和悬浮剂混合。如需,还可以添加某些甜味剂、调味剂或着色剂。

组合物包含的载体的其他实例包括但不限于矿物油、液体凡士林、白凡士林、丙二醇、聚氧乙烯、聚氧丙烯化合物、乳化蜡和水。或者,可以将组合物配制在合适的洗剂或乳剂中。在本发明的环境中,合适的载体包括但不限于矿物油、脱水山梨醇单硬脂酸酯、聚山梨酸酯60、鲸蜡酯蜡、鲸蜡硬脂醇、2-辛基十二烷醇、苄醇和水。

在一个实施方式中,本发明的组合物可以包含本发明的抗体,其中所述抗体可以占组合物中总蛋白的至少50重量%(例如60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高)。在这样的组合物中,抗体优选为纯化形式。

药物组合物可以包含抗微生物剂,具体地在以多剂量形式包装的情况下。其可以包括洗涤剂,例如Tween(聚山梨酸酯),如Tween 80。洗涤剂总体上以低水平存在,例如小于0.01%。组合物还可包含钠盐(例如氯化钠)以产生张力。例如,10±2mg/mlNaCl的浓度是一般的。

此外,药物组合物可以包含糖醇(例如甘露醇)或二糖(例如蔗糖或海藻糖),例如约15-30mg/ml(例如25mg/ml),具体地在其将被冻干的情况下或在其包括已由冻干材料重构的材料的情况下。可将用于冻干的组合物的pH在冻干前调节至5至8,或5.5至7,或约6.1。

本发明的组合物还可包含一种或多种免疫调节剂。在一个实施方式中,一种或多种免疫调节剂包括佐剂。

包含根据本发明的改造的B细胞或抗体的组合物优选用于药物,即用作药物。在这种环境下,如上关于改造B细胞的医学用途所述的详细描述相应地适用,例如关于待治疗的疾病方面。

因此,本发明还提供了免疫治疗方法,该方法包括向有此需要的对象给予根据本发明的抗体、根据本发明的改造的B细胞或根据本发明的组合物。

附图说明

在下文中,将给出附图的简要描述。附图意在更详细地示例本发明。然而,其无意以任何方式限制本发明的主题。

图1显示了染色体14上的抗体转换区域的、AID介导的B细胞改造的示意图——通过整合额外的外显子元件(目标(多)肽)生成抗体,其包含期望的特异性(目标(多)肽)。

图2显示了从根据本发明改造的B细胞可获得的编码抗体链的改造基因的示意性实例以及对应抗体的示意图。(A)包括在抗体的肘区(可变区和恒定区之间)的附加插入序列实例。(B)包括T2A蛋白酶剪切位点以例如替代抗体的原始可变区的实例。V、D、J-原始V、D、J。恒定-原始恒定域。T2A-引入的T2A剪切位点。V

图3提供了实施例(exp)的示意图:检测基因组的LAIR1插入(实施例1;exp 1)、表达LAIR1-Ab的原代B细胞的产生和通过分选(实施例2;exp 2)或通过高通量筛选(实施例3;exp 3)的选择。天数表示在进行刺激核转染后的天数,“核转染”列中的备注表示用于核转染的核酸的特征,而“筛查”列中的备注表示进行了何种类型的筛查。

图4显示了实施例1,(A)转换区域PCR的设计和(B)在双链(dsDNA)LAIR1底物核转染后通过MinlON测序技术检测长转换-μ-区域PCR扩增子中密码子优化的LAIR1(包括部分整合)的结果。

图5显示了实施例2,(A)根据本发明产生的表达含有LAIR1的抗体的在核转染后通过FACS分选进行选择的B细胞的LAIR1和IgM表面共染色,与阴性(MME17)和阳性(MMJ5)对照B细胞系相比。(B)经LAIR1野生型和LAIR1 CH1/J6内含子优化底物转染的B细胞系分泌的人工含LAIR1抗体的Bead pull down和流式FACS分析。

图6显示了实施例2,(A)培养物上清液的LAIR1和IgM特异性蛋白质印迹。(B)使用从表达重组含LAIR1抗体的改造B细胞系分离的基因组DNA的转换-μ-正向引物和LAIR1-反向引物进行的PCR扩增。(C)转换区域和5'LAIR1-插入序列覆盖区域的PCR产物序列比对,转换区域为灰色,LA1R1内含子为浅灰色并且剪接受体位点为粗体,LAIR1外显子为黑色高亮显示。

图7显示了实施例3,(A)表达重组含LAIR1抗体的改造B细胞系的频率,分别通过60000和35000个细胞的高通量筛选而检测。用LAIR1野生型底物或CH1/J6内含子优化形式对细胞进行核转染。II)中的筛选条件通过减少细胞接种数量,同时增加培养时间以在培养物上清液中获得较高抗体浓度来优化。(B)两个384孔培养板的珠体筛选实例,测量了与对照珠体相比的由抗LAIR1捕获的IgM的MFI比。空心圆圈显示阳性对照,并且矩形显示分泌人工含LAIR1抗体的培养物。

图8显示了实施例4,(A)H2AX染色,指示PBMC辐射后的DNA双链断裂(FACS作图),和(B)CD40L/1L4刺激和AID诱导后的原代B细胞。MFI=平均荧光强度。

图9显示了实施例4,(A)在pMAX-GFP对照质粒的NEON核转染后两天存活的和表达GFP的原代B细胞的百分比。(B)FACS作图显示了模拟核转染子(nucleofectants)和用于进一步筛选实验的条件d)(2150V,10ms,2个脉冲)的门控策略。

图10显示了实施例5的原理和结果。(A)体外转换插入取决于c-NHEJ。(B)将幼稚的分选B细胞用CD40L和IL4刺激,并在存在c-NFHEJ(SCR7)、α-NFIEJ(奥拉帕尼)或逆转录酶(ddl/AZT)抑制剂的情况下培养9天。通过MinlON测序技术,在50,000个体外IgG+转换的B细胞中检测到天然转换插入序列。

图11显示了用于剪接位点识别的内含子优化的示意图。

实施例

在下文中,展示了示例本发明的各种实施例和方面的具体实施例。然而,本发明的范围将不受本文描述的具体实施方式的限制。给出以下制备和实施例以使本领域技术人员能够更清楚地理解和实施本发明。但是,本发明的范围不受示例的实施例的限制,这些示例的实施例仅意图作为本发明的单个方面的示例,并且功能等同的方法在本发明的范围之内。事实上,根据本文的前述描述、附图和以下实施例,在本文所述那些以外的本发明的各种变型对于本领域技术人员而言也将变得显而易见。所有这些变型都落入所附权利要求的范围内。

实施例1-3的基本原理是证明分离的人B细胞的免疫球蛋白转换区域可以成为遗传修饰的目标,并随后导致重组抗体产生。例如,成功进行了数个实验以生成产生具有插入的LAIR1域的抗体的改造的人原代B细胞(实施例1-3)。

B细胞分离、刺激和核转染。通过利用来自Miltenyi Biotec的抗CD19微珠的磁性细胞分选,从外周血单核细胞(PBMC)分离原代人B细胞。将100000个/ml的B细胞铺在12个孔中。将表达CD40L的经辐射的K562L细胞以1:2的比例添加至B细胞。以1 6ng/ml添加人重组IL4。第二天,用8ng/ml IL4再刺激细胞。在细胞接种后第1天,IL4再刺激后4h进行核转染,或将其进一步培养,每3天用8ng/ml IL4再刺激并在指定的时间点进行核转染。为了进行核转染,收获B细胞,并使用

DNA核转染产物。密码子优化的LAIR1由

序列分析。核转染后7天,使用商品试剂盒(QIAGEN)从核转染的B细胞分离gDNA。使用LongAmp Taq聚合酶(New England Biolabs)以50μl反应体积进行gDNA上的转换区域PCR,其中在95℃下温育3分钟,然后30次循环的在95℃下40s,在60℃下30s,在65℃下3分钟,最后在65℃下延伸10分钟。将上游转换-μ正向引物S-μ-FW(cacccttgaaagtagcccatgccttcc;SEQ ID NO:96)与S-γ-REV(cctgcctcccagtgtcctgcattacttctg;SEQ ID NO:97)组合。取而代之,将核转染的B细胞gDNA的转换-μ区域扩增,组合S-μ-FW引物与S-μ-REV(ggaacgcagtgtagactcagctgagg;SEQID NO:98)。利用Herculase II Fusion DNA聚合酶(Agilent)与1M甜菜碱和3%DMSO以50μl的体积在98℃下进行PCR反应4分钟,然后30次循环的在98℃下40s,在58℃下30s,和72℃下4分钟,最后在72℃下延长10分钟。转换区域PCR的设计概述在图4A中提供。通过MinION/Oxford Nanopore Technology(ONT)对来自寡克隆B细胞培养物的尺寸选择的纯化的转换扩增子进行测序。通过向S-μ和S-γ引物添加推荐的BC序列以及PCR扩增来引入条形码。利用Nanopore 2D测序试剂盒SQK-LSK207制备测序文库,然后将其加载到Nanopore流通池FLO-MIN106上,并用MinlON Mk1 B测序仪测序上至20h。

第一个实验中使用的DNA底物包含ssDNA和dsDNA形式,其中密码子优化的LAIR1外显子和野生型侧翼内含子序列具有以下核苷酸序列:

TTGTGAGCAAGTCTCAGGGTCCTCACTGTCAACTGGGAAAAAACTCTGCAGTGATGAGAATCACATGCACGTAGAAGGTGCAGGAGGCGTGGGAATGTTCTAAGGTTGGGCTGTGGTCATGGCTGCATAACTCTATAAAATTGCTAAAATCCCTGAATTGTGATGCTAAAATGACGTGTGTGGCATGGTGACTTCCTACAGTGGACGCTGAGATCCTGCTCTGCTTCCCTCCT

[SEQ ID NO:99]

(编码目标多肽的核苷酸序列以下划线显示;5’和3’剪接识别位点以粗体和斜体显示)

总体上,用ssDNA和dsDNA底物进行的核转染成功地将核酸底物整合到B细胞基因组中。例如,图4B显示了使用dsDNA获得的结果。

为了提供含LAIR1抗体的有效插入(productive insertion)和表达的证据,用dsDNA LAIR1野生型底物对原代B细胞进行核转染,并通过细胞分选对LAIR1和IgM共染色进行了筛选。由于在Epstein-Barr病毒(EBV)永生化后天然LAIR1受体被下调,在此实验设置中生成了EBV系以区分天然受体和改造B细胞受体。

为了制备用于核转染的LAIR1野生型(wt)产物,使用以下引物从人基因组DNA(gDNA)PCR扩增人野生型LAIR1:(LAIR1_IN_FW ccacctccaaacggcaggcatcc(SEQ ID NO:100);LAIR1_INTR_REV ccaaaggccgcatgaccatcacgc(SEQ ID NO:101))。通过以下生成包含源自人免疫球蛋白基因座的LAIR1外显子和内含子的嵌合DNA产物:首先用引物IgM-CH1-IN-fw cctcagctgagtctacactgcgttcc(SEQ ID NO:102)、IgM-CH1-IN-revctgaggacccgcaggacaaaagagaaaggg(SEQ ID NO:103)、J6-IN-fwggtcaccgtctcctcaggtaagaatggcc(SEQ ID NO:104)、J6_IN-REVgccttttcagtttcggtcagcctcgc(SEQ ID NO:105)扩增单一产物,然后通过利用重叠引物的PCR将其融合至LAIR1wt扩增子——利用LAIR1-CH1-FW gcgggtcctcagaagatctgcccagaccc(SEQ ID NO:106)和LAIR1-J6-REV ggccattcttacctttcaccagcagctccagg(SEQ ID NO:107)。利用引物LAIR1-CH1-opt-FW gcgggtcctcaggggaagatctgcccagaccc(SEQ ID NO:108)和LAIR1-J6-REV ggccattcttacctgaggagacggctttcaccagcagctccagg(SEQ ID NO:109)生成优选形式。为最小化在扩增过程中通过聚合酶引入的突变,使用具有高校正活性的

将B细胞如上所述分离,刺激和核转染。在核转染后一天,如前所述,通过在37℃旋转4h病毒温育,用Epstein-Barr病毒(EBV)使B细胞永生化(Traggiai E,Becker S,Subbarao K,Kolesnikova L,Uematsu Y,Gismondo MR,Murphy BR,Rappuoli R,Lanzavecchia A.An efficient method to make human monoclonal antibodies frommemory B cells:potent neutralization of SARS coronavirus.Nat Med.2004Aug;10(8):871-5.Epub 2004Jul 11)。洗涤B细胞,并将其在CpG-DNA(2.5μg/ml)存在的情况下,以1x10

为了确认EBV永生化B细胞分泌含LAIR1抗体,通过蛋白质印迹分析来分析培养物上清液。将上清液在水中稀释,并与4x样品加载缓冲剂(Life Technologies)和10x还原剂(Life Technologies)一起在70℃温育10min。将样品以4-12%丙烯酰胺梯度加载到预制凝胶(Invitrogen)。通过iBlot2设备(Life Technologies)将蛋白质转移至PVDF膜,然后在室温下用3%BSA的TBS(溶液)阻断1小时。将该膜与在TBS/1%BSA中稀释的一级和二级抗体的不同组合在室温下温育1小时,其中进行两次连续的TBS温育以在温育之间对膜洗涤。用10μg/ml未标记的山羊抗人IgM(Southern Biotech,2020-01)和8ng/ml驴抗山羊HRP(JacksonImmunoResearch,705-036-147)对IgM同种型染色。用2μg/ml的多克隆山羊抗人LAIR1抗体(R&D)与二级驴抗山羊HRP组合检测含LAIR1抗体。在Las4000成像仪(General ElectricCompany)上用ECL底物使膜显影。

图5显示了FACS分析的结果。图5A显示,生成了B细胞,其表面上成功表达LA1R1-IgM。通过珠体捕获测定(图5B)和蛋白质印迹分析(图6A)确认了LAIR1域在分泌的抗体中的整合,如上所述。此外,使用了如下底物还实现了成功整合:其中LAIR1野生型外显子侧翼是免疫球蛋白基因座内含子区域,即J段下游内含子和CH1上游内含子(命名为LAIR1 CH1/J6),其具有以下序列:

CCTCAGCTGAGTCTACACTGCGTTCCCCATCACACTCACCCTCCCTATACTCACTCCCAGGCCTGGGTTGTCTGCCTGGGGAGACTTCAGGGTAGCTGGAGTGTGACTGAGCTGGGGGCAGCAGAAGCTGGGCTGGAGGGACTCTATTGGCTGCCTGCGGGGTGTGTGGCTCCAGGCTTCACATTCAGGTATGCAACCTGGGCCCTCCAGCTGCATGTGCTGGGAGCTGAGTGTGTGCAGCACCTACGTGCTGATGCCTCGGGGGAAAGCAGGCCTGGTCCACCCAAACCTGAGCCCTCAGCCATTCTGAGCAGGGAGCCAGGGGCAGTCAGGCCTCAGAGTGCAGCAGGGCAGCCAGCTGAATGGTGGCAGGGATGGCTCAGCCTGCTCCAGGAGACCCCAGGTCTGTCCAGGTGTTCAGTGCTGGGCCCTGCAGCAGGATGGGCTGAGGCCTGCAGCCCCAGCAGCCTTGGACAAAGACCTGAGGCCTCACCACGGCCCCGCCACCCCTGATAGCCATGACAGTCTGGGCTTTGGAGGCCTGCAGGTGGGCTCGGCCTTGGTGGGGCAGCCACAGCGGGACGCAAGTAGTGAGGGCACTCAGAACGCCACTCAGCCCCGACAGGCAGGGCACGAGGAGGCAGCTCCTCACCCTCCCTTTCTCTTTTGTCCTGCGGGTCCTC

[SEQ ID NO:110]

(编码目标多肽的核苷酸序列以下划线显示;5’和3’剪接识别位点以粗体和斜体显示)

LAIR1野生型序列在转换区域中的基因组插入通过特异性PCR反应和序列分析(图6B、C)来确认。

为了评价成功核转染的细胞产生含LAIR1抗体的频率,通过LAIR1捕获珠体测定筛选了384孔形式的10-30个细胞/孔培养物。

如上所述进行B细胞分离、刺激、核转染和EBV永生化。在病毒温育后,在存在25,000个经辐射的自体PBMC作为饲养细胞和CpG-DNA(2.5μg/ml)的情况下,将B细胞以10或30个细胞/孔铺板。培养2周后,通过基于双决定子的珠基免疫测定,分析细胞的上清液的含LAIR1抗体分泌。因此,在室温下用山羊抗人LAIR1(R&D Systems,AF2664)或对照抗体山羊抗人EGF(R&D Systems,AF-259-NA)包覆抗山羊IgG微珠(Spherotech)20分钟。将40x的SYBRGreen I(ThermoFisher Scientific)添加到LAIR1抗体包覆溶液中,以区分LAIR1包覆珠和对照珠。将珠体洗涤,混合,并与永生化B细胞的上清液在室温下温育30分钟。利用2.5μg/mlAlexa Fluor 647缀合驴抗人IgM(Jackson ImmunoResearch,709-606-073)检测珠体捕获的含LAIR1抗体。

结果显示在图7中。结果证实在约12000个原代B细胞中一次有效插入的频率(图7A、B)。

在此实施例中,研究了核转染的最佳时间点和条件。

将B细胞通过用抗CD1 9珠进行的磁性细胞分选从PBMC分离,并用表达CD40L的K562L细胞和IL4刺激,如上所述。为了评估DNA双链断裂的诱导,在指定的时间点收获细胞,用3.7%的甲醛固定,用90%的甲醇渗透并在-20℃下保存。在分析当天,将细胞用0.25μg/ml的兔抗--H2AX(组蛋白H3,克隆D1H2,#12167S,细胞信号传导)染色,并通过流式细胞术分析。为了对照抗体的染色特异性,进行了用经辐射或未处理的PBMCS染色。

培养开始后1-10天对B细胞进行核转染。结果显示在图8中。如图8B中通过H2AX组蛋白标记物染色所示,DNA双链断裂最大值实现始于第2-3天。

接下来,在不同条件下用

为了提高改造效率,使用体外系统来研究c-NHEJ和a-EJ对获取天然插入序列的影响。

为此,利用抗CD19珠通过磁珠分离B细胞,然后进行FACS分选和选择幼稚B细胞(IgM

一般原理显示在图10A中,并且结果显示在图10B中。结果显示,天然转换插入序列依赖于c-NFHEJ DNA修复途径,因为插入序列频率在SCR7存在时降低,而在奥拉帕尼被加入培养基时升高(图10A、B)。因此,在抑制剂奥拉帕尼的存在下进行B细胞改造可以提高改造效率。同样,DNA底物与DNA结合蛋白Ku70/80的预温育,c-NHEJ介导的修复的第一事件,以及DNA-Ku70/80蛋白复合物的核转染,可增加成功整合的数量(图10A)。

序列和SEQ ID NO表(序列表):

序列表

<110> 生物医学研究所

<120> 通过利用内源激活诱导性胞嘧啶脱氨酶改造B淋巴细胞

<130> IR01P010WO1

<160> 115

<170> PatentIn version 3.5

<210> 1

<400> 1

000

<210> 2

<400> 2

000

<210> 3

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 3

gtagtgaggg 10

<210> 4

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 4

gttggtggtt 10

<210> 5

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 5

agttgtggtt 10

<210> 6

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 6

gtattgggtc 10

<210> 7

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 7

agtgtgaggg 10

<210> 8

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 8

gggtaatggg 10

<210> 9

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 9

tcattggggt 10

<210> 10

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 10

ggtgggggtc 10

<210> 11

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 11

ggttttgttg 10

<210> 12

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 12

tatactcccg 10

<210> 13

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 13

gtattcgatc 10

<210> 14

<400> 14

000

<210> 15

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 15

gtagttccct 10

<210> 16

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 16

gttaatagta 10

<210> 17

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 17

tgctggttag 10

<210> 18

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 18

ataggtaacg 10

<210> 19

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 19

tctgaattgc 10

<210> 20

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 20

tctgggtttg 10

<210> 21

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 21

cattctcttt 10

<210> 22

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 22

gtattggtgt 10

<210> 23

<400> 23

000

<210> 24

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 24

tttagatttg 10

<210> 25

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 25

ataagtactg 10

<210> 26

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 内含子剪接增强子

<400> 26

tagtctatta 10

<210> 27

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 27

cgaggaggca gctcctcacc ctccctttct cttttgtcct gcgggtcctc ag 52

<210> 28

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 28

cgaagggggc gggagtggcg ggcaccgggc tgacacgtgt ccctcactgc ag 52

<210> 29

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 29

tccgcccaca tccacacctg ccccacctct gactcccttc tcttgactcc ag 52

<210> 30

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 30

ccacaggctg gtccccccac tgccccgccc tcaccaccat ctctgttcac ag 52

<210> 31

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 31

tgggcccagc tctgtcccac accgcggtca catggcacca cctctcttgc ag 52

<210> 32

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 32

ggacaccttc tctcctccca gattccagta actcccaatc ttctctctgc ag 52

<210> 33

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 33

agggacaggc cccagccggg tgctgacacg tccacctcca tctcttcctc ag 52

<210> 34

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 34

ggcccaccct ctgccctgag agtgaccgct gtaccaacct ctgtccctac ag 52

<210> 35

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 35

tgggcccagc tctgtcccac accgcagtca catggcgcca tctctcttgc ag 52

<210> 36

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 36

agataccttc tctcttccca gatctgagta actcccaatc ttctctctgc ag 52

<210> 37

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 37

acgcatccac ctccatccca gatccccgta actcccaatc ttctctctgc ag 52

<210> 38

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 38

acgcgtccac ctccatccca gatccccgta actcccaatc ttctctctgc ag 52

<210> 39

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 39

acgcatccac ctccatccca gatccccgta actcccaatc ttctctctgc ag 52

<210> 40

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 40

acgcatccac ctccatccca gatccccgta actcccaatc ttctctctgc ag 52

<210> 41

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 41

gacccaccct ctgccctggg agtgaccgct gtgccaacct ctgtccctac ag 52

<210> 42

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 42

tgggcccagc tctgtcccac accgcggtca catggcacca cctctcttgc ag 52

<210> 43

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 43

agacaccttc tctcctccca gatctgagta actcccaatc ttctctctgc ag 52

<210> 44

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 44

agggacaggc cccagccggg tgctgacgca tccacctcca tctcttcctc ag 52

<210> 45

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 45

ggcccaccct ctgccctggg agtgaccgct gtgccaacct ctgtccctac ag 52

<210> 46

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 46

gtgagtctgc tgtctgggga标签cggggag ccaggtgtac tgggccaggc aa 52

<210> 47

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 47

gtgagtccca ctgcagcccc ctcccagtct tctctgtcca ggcaccaggc ca 52

<210> 48

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 48

gtaagatggc tttccttctg cctcctttct ctgggcccag cgtcctctgt cc 52

<210> 49

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 49

gtgagtcctc acaacctctc tcctgcttta actctgaagg gttttgctgc at 52

<210> 50

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 50

gtgagtcctc accaccccct ctctgagtcc acttagggag actcagcttg cc 52

<210> 51

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 51

gtaagaatgg ccactctagg gcctttgttt tctgctactg cctgtggggt tt 52

<210> 52

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 52

catggtgact tcctacagtg gacgctgaga tcctgctctg cttccctcct ag 52

<210> 53

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 53

gtgaggacgt cacctgggcc ctgccccagt ctcagctcga ccctcgagct tg 52

<210> 54

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 剪切标签

<400> 54

Leu Glu Val Leu Phe Gln Gly Pro

1 5

<210> 55

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 剪切标签

<400> 55

Asp Asp Asp Asp Lys

1 5

<210> 56

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 剪切标签

<400> 56

Ile Glu Gly Arg

1

<210> 57

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 剪切标签

<400> 57

Glu Asn Leu Tyr Phe Gln Gly

1 5

<210> 58

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 剪切标签

<400> 58

Leu Val Pro Arg Gly Ser

1 5

<210> 59

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<220>

<221> Xaa

<222> (2)..(2)

<223> 其中Xaa是Val或Ile

<220>

<221> Xaa

<222> (4)..(4)

<223> 其中Xaa可以是任何(天然存在的)氨基酸

<400> 59

Asp Xaa Glu Xaa Asn Pro Gly Pro

1 5

<210> 60

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<400> 60

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 61

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<400> 61

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

<210> 62

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<400> 62

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 63

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<400> 63

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

1 5 10 15

Glu Glu Asn Pro Gly Pro

20

<210> 64

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 自我加工位点

<400> 64

Arg Lys Arg Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln

1 5 10 15

Ala Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 65

<211> 30

<212> PRT

<213> 人工序列

<220>

<223> 双Strep标签

<400> 65

Ser Ala Trp Ser His Pro Gln Phe Glu Lys Gly Gly Gly Ser Gly Gly

1 5 10 15

Gly Ser Gly Gly Ser Ala Trp Ser His Pro Gln Phe Glu Lys

20 25 30

<210> 66

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> AviTag

<400> 66

Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu

1 5 10 15

<210> 67

<211> 26

<212> PRT

<213> 人工序列

<220>

<223> 钙调蛋白标签

<400> 67

Lys Arg Arg Trp Lys Lys Asn Phe Ile Ala Val Ser Ala Ala Asn Arg

1 5 10 15

Phe Lys Lys Ile Ser Ser Ser Gly Ala Leu

20 25

<210> 68

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 聚谷氨酸标签

<400> 68

Glu Glu Glu Glu Glu Glu

1 5

<210> 69

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> E-标签

<400> 69

Gly Ala Pro Val Pro Tyr Pro Asp Pro Leu Glu Pro Arg

1 5 10

<210> 70

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> FLAG-标签

<400> 70

Asp Tyr Lys Asp Asp Asp Asp Lys

1 5

<210> 71

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> HA-标签

<400> 71

Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

1 5

<210> 72

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> His-标签

<400> 72

His His His His His His

1 5

<210> 73

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> Myc-标签

<400> 73

Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu

1 5 10

<210> 74

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> NE-标签

<400> 74

Thr Lys Glu Asn Pro Arg Ser Asn Gln Glu Glu Ser Tyr Asp Asp Asn

1 5 10 15

Glu Ser

<210> 75

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> S-标签

<400> 75

Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

<210> 76

<211> 38

<212> PRT

<213> 人工序列

<220>

<223> SBP-标签

<400> 76

Met Asp Glu Lys Thr Thr Gly Trp Arg Gly Gly His Val Val Glu Gly

1 5 10 15

Leu Ala Gly Glu Leu Glu Gln Leu Arg Ala Arg Leu Glu His His Pro

20 25 30

Gln Gly Gln Arg Glu Pro

35

<210> 77

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> Softag 1

<400> 77

Ser Leu Ala Glu Leu Leu Asn Ala Gly Leu Gly Gly Ser

1 5 10

<210> 78

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> Softag 3

<400> 78

Thr Gln Asp Pro Ser Arg Val Gly

1 5

<210> 79

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> Strep-标签

<400> 79

Trp Ser His Pro Gln Phe Glu Lys

1 5

<210> 80

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> TC标签

<400> 80

Cys Cys Pro Gly Cys Cys

1 5

<210> 81

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> V5标签

<400> 81

Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr

1 5 10

<210> 82

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> VSV-标签

<400> 82

Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys

1 5 10

<210> 83

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> Xpress标签

<400> 83

Asp Leu Tyr Asp Asp Asp Asp Lys

1 5

<210> 84

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> Isopeptag

<400> 84

Thr Asp Lys Asp Met Thr Ile Thr Phe Thr Asn Lys Lys Asp Ala Glu

1 5 10 15

<210> 85

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> SpyTag

<400> 85

Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys

1 5 10

<210> 86

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> SnoopTag

<400> 86

Lys Leu Gly Asp Ile Glu Phe Ile Lys Val Asn Lys

1 5 10

<210> 87

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> Ty1标签

<400> 87

Glu Val His Thr Asn Gln Asp Pro Leu Asp

1 5 10

<210> 88

<211> 98

<212> PRT

<213> 人工序列

<220>

<223> 突变的LAIR1片段

<400> 88

Glu Asp Leu Pro Arg Pro Ser Ile Ser Ala Glu Pro Gly Thr Val Ile

1 5 10 15

Pro Leu Gly Ser His Val Thr Phe Val Cys Arg Gly Pro Val Gly Val

20 25 30

Gln Thr Phe Arg Leu Glu Arg Glu Arg Asn Tyr Leu Tyr Ser Asp Thr

35 40 45

Glu Asp Val Ser Gln Thr Ser Pro Ser Glu Ser Glu Ala Arg Phe Arg

50 55 60

Ile Asp Ser Val Asn Ala Gly Asn Ala Gly Leu Phe Arg Cys Ile Tyr

65 70 75 80

Tyr Lys Ser Arg Lys Trp Ser Glu Gln Ser Asp Tyr Leu Glu Leu Val

85 90 95

Val Lys

<210> 89

<211> 120

<212> PRT

<213> 人工序列

<220>

<223> PD-1片段

<400> 89

Asp Ser Pro Asp Arg Pro Trp Asn Pro Pro Thr Phe Ser Pro Ala Leu

1 5 10 15

Leu Val Val Thr Glu Gly Asp Asn Ala Thr Phe Thr Cys Ser Phe Ser

20 25 30

Asn Thr Ser Glu Ser Phe Val Leu Asn Trp Tyr Arg Met Ser Pro Ser

35 40 45

Asn Gln Thr Asp Lys Leu Ala Ala Phe Pro Glu Asp Arg Ser Gln Pro

50 55 60

Gly Gln Asp Cys Arg Phe Arg Val Thr Gln Leu Pro Asn Gly Arg Asp

65 70 75 80

Phe His Met Ser Val Val Arg Ala Arg Arg Asn Asp Ser Gly Thr Tyr

85 90 95

Leu Cys Gly Ala Ile Ser Leu Ala Pro Lys Ala Gln Ile Lys Glu Ser

100 105 110

Leu Arg Ala Glu Leu Arg Val Thr

115 120

<210> 90

<211> 95

<212> PRT

<213> 人工序列

<220>

<223> SLAM片段

<400> 90

Glu Gln Val Ser Thr Pro Glu Ile Lys Val Leu Asn Lys Thr Gln Glu

1 5 10 15

Asn Gly Thr Cys Thr Leu Ile Leu Gly Cys Thr Val Glu Lys Gly Asp

20 25 30

His Val Ala Tyr Ser Trp Ser Glu Lys Ala Gly Thr His Pro Leu Asn

35 40 45

Pro Ala Asn Ser Ser His Leu Leu Ser Leu Thr Leu Gly Pro Gln His

50 55 60

Ala Asp Asn Ile Tyr Ile Cys Thr Val Ser Asn Pro Ile Ser Asn Asn

65 70 75 80

Ser Gln Thr Phe Ser Pro Trp Pro Gly Cys Arg Thr Asp Pro Ser

85 90 95

<210> 91

<211> 117

<212> PRT

<213> 人工序列

<220>

<223> T3-VHH

<400> 91

Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala

1 5 10 15

Gly Gly Ser Leu Thr Leu Ser Cys Ala Ala Ser Gly Ser Thr Ser Arg

20 25 30

Ser Tyr Ala Leu Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu

35 40 45

Phe Val Ala His Val Gly Gln Thr Ala Glu Phe Ala Gln Gly Arg Phe

50 55 60

Thr Ile Ser Arg Asp Phe Ala Lys Asn Thr Val Ser Leu Gln Met Asn

65 70 75 80

Asp Leu Lys Ser Asp Asp Thr Ala Ile Tyr Tyr Cys Val Ala Ser Asn

85 90 95

Arg Gly Trp Ser Pro Ser Arg Val Ser Tyr Trp Gly Gln Gly Thr Gln

100 105 110

Val Thr Val Ser Ser

115

<210> 92

<211> 248

<212> PRT

<213> 人工序列

<220>

<223> TT39.7-scFv

<400> 92

Gln Ile Thr Leu Lys Glu Ser Gly Pro Thr Leu Val Lys Pro Thr Gln

1 5 10 15

Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser

20 25 30

Arg Val Gly Val Gly Trp Ile Arg Gln Pro Pro Gly Lys Ala Leu Glu

35 40 45

Trp Leu Ser Leu Ile Tyr Trp Asp Asp Glu Lys His Tyr Ser Pro Ser

50 55 60

Leu Lys Asn Arg Val Thr Ile Ser Lys Asp Ser Ser Lys Asn Gln Val

65 70 75 80

Val Leu Thr Leu Thr Asp Met Asp Pro Val Asp Thr Gly Thr Tyr Tyr

85 90 95

Cys Ala His Arg Gly Val Asp Thr Ser Gly Trp Gly Phe Asp Tyr Trp

100 105 110

Gly Gln Gly Ala Leu Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly

115 120 125

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser Ala Leu Thr Gln Pro

130 135 140

Ala Ser Val Ser Gly Ser Pro Gly Gln Ser Ile Thr Ile Ser Cys Ser

145 150 155 160

Gly Ala Gly Ser Asp Val Gly Gly His Asn Phe Val Ser Trp Tyr Gln

165 170 175

Gln Tyr Pro Gly Lys Ala Pro Lys Leu Met Ile Tyr Asp Val Lys Asn

180 185 190

Arg Pro Ser Gly Val Ser Tyr Arg Phe Ser Gly Ser Lys Ser Gly Tyr

195 200 205

Thr Ala Ser Leu Thr Ile Ser Gly Leu Gln Ala Glu Asp Glu Ala Thr

210 215 220

Tyr Phe Cys Ser Ser Tyr Ser Ser Ser Ser Thr Leu Ile Ile Phe Gly

225 230 235 240

Gly Gly Thr Arg Leu Thr Val Leu

245

<210> 93

<211> 125

<212> PRT

<213> 人工序列

<220>

<223> F4-VHH

<400> 93

Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Leu Asp Tyr Tyr

20 25 30

Tyr Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Ala Val

35 40 45

Ser Cys Ile Ser Gly Ser Ser Gly Ser Thr Tyr Tyr Pro Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Thr Ile Arg Ser Ser Ser Trp Gly Gly Cys Val His Tyr Gly Met

100 105 110

Asp Tyr Trp Gly Lys Gly Thr Gln Val Thr Val Ser Ser

115 120 125

<210> 94

<211> 249

<212> PRT

<213> 人工序列

<220>

<223> MPE8-scFv

<400> 94

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr

20 25 30

Ser Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Ser Ile Ser Ala Ser Ser Ser Tyr Ser Asp Tyr Ala Asp Ser Ala

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Thr Ser Leu Phe

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Ile Tyr Phe Cys

85 90 95

Ala Arg Ala Arg Ala Thr Gly Tyr Ser Ser Ile Thr Pro Tyr Phe Asp

100 105 110

Ile Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Gly Gly Gly Gly

115 120 125

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Ser Val Val Thr

130 135 140

Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr Ile Ser

145 150 155 160

Cys Thr Gly Ser Ser Ser Asn Ile Gly Ala Gly Tyr Asp Val His Trp

165 170 175

Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Asp Asn

180 185 190

Asn Asn Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Ala Ser Lys Ser

195 200 205

Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp Glu

210 215 220

Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Asn Leu Ser Gly Val Phe

225 230 235 240

Gly Thr Gly Thr Lys Val Thr Val Leu

245

<210> 95

<211> 144

<212> DNA

<213> 人工序列

<220>

<223> SV40核定位信号

<400> 95

tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 60

actttccaca cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg 120

gggagcctgg ggactttcca cacc 144

<210> 96

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 96

cacccttgaa agtagcccat gccttcc 27

<210> 97

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 97

cctgcctccc agtgtcctgc attacttctg 30

<210> 98

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 98

ggaacgcagt gtagactcag ctgagg 26

<210> 99

<211> 590

<212> DNA

<213> 人工序列

<220>

<223> DNA底物

<400> 99

ttgtgagcaa gtctcagggt cctcactgtc aactgggaaa aaactctgca gtgatgagaa 60

tcacatgcac gtagaaggtg caggaggcgt gggaatgttc taaggttggg ctgtggtcat 120

ggctgcataa ctctataaaa ttgctaaaat ccctgaattg tgatgctaaa atgacgtgtg 180

tggcatggtg acttcctaca gtggacgctg agatcctgct ctgcttccct cctagaagat 240

ctgcccagac cctccatctc ggctgagcca ggcaccgtga tccccctggg gagccatgtg 300

actttcgtgt gccggggccc ggttggggtt caaacattcc gcctggagag ggacagtaga 360

tccacataca atgatactga agatgtgtct caagctagtc catctgagtc agaggccaga 420

ttccgcattg actcagtaag agaaggaaat gccgggcttt atcgctgcat ctattataag 480

ccccctaaat ggtctgagca gagtgactac ctggagctgc tggtgaaagg tgaggacgtc 540

acctgggccc tgccccagtc tcagctcgac cctcgagctt gtccccaggt 590

<210> 100

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 100

ccacctccaa acggcaggca tcc 23

<210> 101

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 101

ccaaaggccg catgaccatc acgc 24

<210> 102

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 102

cctcagctga gtctacactg cgttcc 26

<210> 103

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 103

ctgaggaccc gcaggacaaa agagaaaggg 30

<210> 104

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 104

ggtcaccgtc tcctcaggta agaatggcc 29

<210> 105

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 105

gccttttcag tttcggtcag cctcgc 26

<210> 106

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 106

gcgggtcctc agaagatctg cccagaccc 29

<210> 107

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 107

ggccattctt acctttcacc agcagctcca gg 32

<210> 108

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 108

gcgggtcctc aggggaagat ctgcccagac cc 32

<210> 109

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 109

ggccattctt acctgaggag acggctttca ccagcagctc cagg 44

<210> 110

<211> 1965

<212> DNA

<213> 人工序列

<220>

<223> DNA底物

<400> 110

cctcagctga gtctacactg cgttccccat cacactcacc ctccctatac tcactcccag 60

gcctgggttg tctgcctggg gagacttcag ggtagctgga gtgtgactga gctgggggca 120

gcagaagctg ggctggaggg actctattgg ctgcctgcgg ggtgtgtggc tccaggcttc 180

acattcaggt atgcaacctg ggccctccag ctgcatgtgc tgggagctga gtgtgtgcag 240

cacctacgtg ctgatgcctc gggggaaagc aggcctggtc cacccaaacc tgagccctca 300

gccattctga gcagggagcc aggggcagtc aggcctcaga gtgcagcagg gcagccagct 360

gaatggtggc agggatggct cagcctgctc caggagaccc caggtctgtc caggtgttca 420

gtgctgggcc ctgcagcagg atgggctgag gcctgcagcc ccagcagcct tggacaaaga 480

cctgaggcct caccacggcc ccgccacccc tgatagccat gacagtctgg gctttggagg 540

cctgcaggtg ggctcggcct tggtggggca gccacagcgg gacgcaagta gtgagggcac 600

tcagaacgcc actcagcccc gacaggcagg gcacgaggag gcagctcctc accctccctt 660

tctcttttgt cctgcgggtc ctcagaagat ctgcccagac cctccatctc ggctgagcca 720

ggcaccgtga tccccctggg gagccatgtg actttcgtgt gccggggccc ggttggggtt 780

caaacattcc gcctggagag ggacagtaga tccacataca atgatactga agatgtgtct 840

caagctagtc catctgagtc agaggccaga ttccgcattg actcagtaag agaaggaaat 900

gccgggcttt atcgctgcat ctattataag ccccctaaat ggtctgagca gagtgactac 960

ctggagctgc tggtgaaagg taagaatggc cactctaggg cctttgtttt ctgctactgc 1020

ctgtggggtt tcctgagcat tgcaggttgg tcctcggggc atgttccgag gggacctggg 1080

cggactggcc aggaggggat gggcactggg gtgccttgag gatctgggag cctctgtgga 1140

ttttccgatg cctttggaaa atgggactca ggttgggtgc gtctgatgga gtaactgagc 1200

ctgggggctt ggggagccac atttggacga gatgcctgaa caaaccaggg gtcttagtga 1260

tggctgagga atgtgtctca ggagcggtgt ctgtaggact gcaagatcgc tgcacagcag 1320

cgaatcgtga aatattttct ttagaattat gaggtgcgct gtgtgtcaac ctgcatctta 1380

aattctttat tggctggaaa gagaactgtc ggagtgggtg aatccagcca ggagggacgc 1440

gtagccccgg tcttgatgag agcagggttg ggggcagggg标签cccagaa acggtggctg 1500

ccgtcctgac aggggcttag ggaggctcca ggacctcagt gccttgaagc tggtttccat 1560

gagaaaagga ttgtttatct标签gaggcat gcttactgtt aaaagacagg atatgtttga 1620

agtggcttct gagaaaaatg gttaagaaaa ttatgactta aaaatgtgag agattttcaa 1680

gtatattaat ttttttaact gtccaagtat ttgaaattct tatcatttga ttaacaccca 1740

tgagtgatat gtgtctggaa ttgaggccaa agcaagctca gctaagaaat actagcacag 1800

tgctgtcggc cccgatgcgg gactgcgttt tgaccatcat aaatcaagtt tattttttta 1860

attaattgag cgaagctgga agcagatgat gaattagagt caagatggct gcatgggggt 1920

ctccggcacc cacagcaggt ggcaggaagc aggtcaccgc gagag 1965

<210> 111

<211> 294

<212> DNA

<213> 人工序列

<220>

<223> 编码目标(多)肽的核苷酸序列

<400> 111

aagatctgcc cagaccctcc atctcggctg agccaggcac cgtgatcccc ctggggagcc 60

atgtgacttt cgtgtgccgg ggcccggttg gggttcaaac attccgcctg gagagggaca 120

gtagatccac atacaatgat actgaagatg tgtctcaagc标签tccatct gagtcagagg 180

ccagattccg cattgactca gtaagagaag gaaatgccgg gctttatcgc tgcatctatt 240

ataagccccc taaatggtct gagcagagtg actacctgga gctgctggtg aaag 294

<210> 112

<211> 235

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 112

ttgtgagcaa gtctcagggt cctcactgtc aactgggaaa aaactctgca gtgatgagaa 60

tcacatgcac gtagaaggtg caggaggcgt gggaatgttc taaggttggg ctgtggtcat 120

ggctgcataa ctctataaaa ttgctaaaat ccctgaattg tgatgctaaa atgacgtgtg 180

tggcatggtg acttcctaca gtggacgctg agatcctgct ctgcttccct cctag 235

<210> 113

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 113

gtgaggacgt cacctgggcc ctgccccagt ctcagctcga ccctcgagct tgtccccagg 60

t 61

<210> 114

<211> 685

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 114

cctcagctga gtctacactg cgttccccat cacactcacc ctccctatac tcactcccag 60

gcctgggttg tctgcctggg gagacttcag ggtagctgga gtgtgactga gctgggggca 120

gcagaagctg ggctggaggg actctattgg ctgcctgcgg ggtgtgtggc tccaggcttc 180

acattcaggt atgcaacctg ggccctccag ctgcatgtgc tgggagctga gtgtgtgcag 240

cacctacgtg ctgatgcctc gggggaaagc aggcctggtc cacccaaacc tgagccctca 300

gccattctga gcagggagcc aggggcagtc aggcctcaga gtgcagcagg gcagccagct 360

gaatggtggc agggatggct cagcctgctc caggagaccc caggtctgtc caggtgttca 420

gtgctgggcc ctgcagcagg atgggctgag gcctgcagcc ccagcagcct tggacaaaga 480

cctgaggcct caccacggcc ccgccacccc tgatagccat gacagtctgg gctttggagg 540

cctgcaggtg ggctcggcct tggtggggca gccacagcgg gacgcaagta gtgagggcac 600

tcagaacgcc actcagcccc gacaggcagg gcacgaggag gcagctcctc accctccctt 660

tctcttttgt cctgcgggtc ctcag 685

<210> 115

<211> 986

<212> DNA

<213> 人工序列

<220>

<223> 内含子序列

<400> 115

gtaagaatgg ccactctagg gcctttgttt tctgctactg cctgtggggt ttcctgagca 60

ttgcaggttg gtcctcgggg catgttccga ggggacctgg gcggactggc caggagggga 120

tgggcactgg ggtgccttga ggatctggga gcctctgtgg attttccgat gcctttggaa 180

aatgggactc aggttgggtg cgtctgatgg agtaactgag cctgggggct tggggagcca 240

catttggacg agatgcctga acaaaccagg ggtcttagtg atggctgagg aatgtgtctc 300

aggagcggtg tctgtaggac tgcaagatcg ctgcacagca gcgaatcgtg aaatattttc 360

tttagaatta tgaggtgcgc tgtgtgtcaa cctgcatctt aaattcttta ttggctggaa 420

agagaactgt cggagtgggt gaatccagcc aggagggacg cgtagccccg gtcttgatga 480

gagcagggtt gggggcaggg gtagcccaga aacggtggct gccgtcctga caggggctta 540

gggaggctcc aggacctcag tgccttgaag ctggtttcca tgagaaaagg attgtttatc 600

ttaggaggca tgcttactgt taaaagacag gatatgtttg aagtggcttc tgagaaaaat 660

ggttaagaaa attatgactt aaaaatgtga gagattttca agtatattaa tttttttaac 720

tgtccaagta tttgaaattc ttatcatttg attaacaccc atgagtgata tgtgtctgga 780

attgaggcca aagcaagctc agctaagaaa tactagcaca gtgctgtcgg ccccgatgcg 840

ggactgcgtt ttgaccatca taaatcaagt ttattttttt aattaattga gcgaagctgg 900

aagcagatga tgaattagag tcaagatggc tgcatggggg tctccggcac ccacagcagg 960

tggcaggaag caggtcaccg cgagag 986

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号