首页> 中国专利> 跨膜测序中用于核酸构建体的衔接体

跨膜测序中用于核酸构建体的衔接体

摘要

本发明涉及用于测序核酸的衔接体。所述衔接体可用于生成用于测序目的的单链核酸构建体。所述构建体可含有双链脱氧核糖核酸(DNA)或核糖核酸(RNA)模板的全部两条链。本发明还涉及使用所述衔接体生成的构建体,制备所述衔接体和构建体的方法,以及测序双链核酸的方法。

著录项

  • 公开/公告号CN102369298A

    专利类型发明专利

  • 公开/公告日2012-03-07

    原文格式PDF

  • 申请/专利权人 牛津纳米孔技术有限公司;

    申请/专利号CN201080015405.2

  • 发明设计人 B·麦克基翁;

    申请日2010-01-29

  • 分类号C12Q1/68;

  • 代理机构北京北翔知识产权代理有限公司;

  • 代理人张广育

  • 地址 英国牛津

  • 入库时间 2023-12-18 04:34:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-22

    授权

    授权

  • 2012-04-18

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20100129

    实质审查的生效

  • 2012-03-07

    公开

    公开

说明书

技术领域

本发明涉及用于测序核酸的衔接体。所述衔接体可用于生成用于测 序目的的单链核酸构建体。所述构建体可含有双链脱氧核糖核酸(DNA) 或核糖核酸(RNA)模板的全部两条链。本发明还涉及使用所述衔接体生成 的构建体,制备所述衔接体和构建体的方法,以及测序双链核酸的方法。

背景技术

随机检测是一种依赖于对分析物分子与受体之间的各个结合事件进 行观察的传感方法。随机传感器可通过如下方式形成:将纳米尺寸的单 孔置入绝缘膜中,并且在存在分析物分子的情况下测量电压驱动的穿过 所述孔的离子转运。电流波动的发生频率揭示在所述孔中结合的分析物 的浓度。分析物的种类通过其特征性的电流特征特别是电流阻断的持续 时间和程度而示出(Braha,O.,Walker,B.,Cheley,S.,Kasianowicz,J.J., Song,L.,Gouaux,J.E.,and Bayley,H.(1997)Chem.Biol.4,497-505;and  Bayley,H.,and Cremer,P.S.(2001)Nature 413,226-230)。

形成细菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已用于对许 多类型的分子进行随机传感(Bayley,H.,and Cremer,P.S.(2001)Nature 413,226-230;Shin,S.,H.,Luchian,T.,Cheley,S.,Braha,O.,and Bayley, H.(2002)Angew.Chem.Int.Ed.41,3707-3709;Guan,X.,Gu,L.-Q.,Cheley, S.,Braha,O.,and Bayley,H.(2005)ChemBioChem 6,1875-1881)。在这些 研究的过程中,已发现,将α-HL改造以直接结合小的有机分析物的尝试 是很费力的,并且鲜有成功的实例(Guan,X.,Gu,L.-Q.,Cheley,S.,Braha, O.,and Bayley,H.(2005)ChemBioChem 6,1875-1881)。幸运的是,人们 发现了一种不同的策略,该策略利用了非共价结合的分子衔接体,特别 是环糊精(Gu,L.-Q.,Braha,O.,Conlan,S.,Cheley,S.,and Bayley,H. (1999)Nature 398,686-690)、环肽(Sanchez-Quesada,J.,Ghadiri,M.R., Bayley,H.,and Braha,O.(2000)J.Am.Chem.Soc.122,11758-11766)和葫 芦脲(cucurbituril)(Braha,O.,Webb,J.,Gu,L.-Q.,Kim,K.,and Bayley, H.(2005)ChemPhysChem 6,889-892)。环糊精可短暂地进入所述α-HL孔 中,并产生很大程度但不完全的通道阻断。有机分析物结合于环糊精的 疏水内部,它们可加强这种阻断,使得可实现分析物检测(Gu,L.-Q., Braha,O.,Conlan,S.,Cheley,S.,and Bayley,H.(1999)Nature 398, 686-690)。

现在,在广泛的应用中需要快速且廉价的DNA或RNA测序技术。 现有的技术速度慢且价格昂贵,这主要是由于其倚赖于扩增技术来产生 大量核酸并且需要大量专用的荧光化学物质用于信号检测。随机传感有 可能通过减少所需核苷酸和试剂的量提供快速且廉价的DNA测序。

发明内容

发明人令人惊讶地证明,人工的、可鉴定的衔接体可用于生成含有 双链核酸模板的全部两条链的单链核酸构建体。所述模板的两条链通过 衔接体共价连接并分隔(分开)。所述衔接体不仅使得可鉴定一条链到 另一条链的转接点,而且使得可在对所述构建体进行测序之前先将其纯 化。所述衔接体还使得所述构建体与所述链具有不同来源的相似构建体 区分。因此,所述衔接体使得可对来源于不同个体源的模板进行多重序 列分析。

所述衔接体特别可用于测序双链DNA(dsDNA)和双链RNA (dsRNA)。所述衔接体可用于生成含有所述dsDNA或dsRNA的正义链和 反义链的单链构建体。

所述衔接体通常成对使用。所述对中的全部两种类型的衔接体不仅 均包含构成半个回文切割位点的双链核酸区,而且是彼此可差异选择的。 每一对包含两种类型的衔接体:I型和II型。I型衔接体包含发夹环,其 使得双链核酸模板中的两条链可共价连接。II型衔接体可包含发夹环, 但不是必须的。这种特征组合使得可生成和纯化其中双链核酸模板的两 条链通过I型衔接体共价连接的单链构建体。通过衔接体相互连接形成的 不需要的构建体可使用回文切割位点从反应混合物中除去。类似地,含 有所述两种类型的衔接体之一的构建体可使用所述衔接体的差异选择性 从反应混合物中分离。

因此,本发明提供了用于测序核酸的衔接体,其包含双链核酸区, 其中该区的至少一个末端构成半个回文切割位点,并且其中所述衔接体 与另一衔接体可差异地选择。在某些实施方案中,所述区通过单链核酸 的两个不同区之间杂交形成并且所述衔接体包含发夹环。

本发明还提供了:

-衔接体对,其包含通过单链核酸的两个不同区之间杂交形成并且包 含发夹环的本发明衔接体(I型)以及本发明衔接体(II型),其中所述 对中每种类型的衔接体与另一类型是可差异选择的,并且其中如果所述 两种类型的衔接体任意组合彼此连接,那么就形成完整的回文切割位点;

-包含至少两群本发明衔接体的试剂盒,其中每群中的每个衔接体均 包含对该群特异的核酸序列;

-用作测序模板的核酸构建体,其包含与至少一个本发明衔接体连接 的双链核酸;

-用作测序模板的单链核酸构建体,其包含通过本发明衔接体共价连 接的两条核酸链,所述衔接体通过单链核酸的两个不同区之间杂交形成 并且包含发夹环;

-包含两条核酸链的用作测序模板的环状核酸构建体,所述两条核酸 链在每个末端通过本发明衔接体共价连接,所述衔接体通过单链核酸的 两个不同区之间杂交形成并且包含发夹环;

-一种制备本发明衔接体的方法,包括:

(a)提供两个核酸,所述核酸(i)能够彼此杂交形成半个回文切割位 点,并且(ii)可与另一种衔接体的核酸差异地选择;以及

(b)使所述核酸在使得它们可杂交的条件下接触,从而制备衔接体;

-一种制备通过单链核酸的两个不同区之间杂交形成并且包含发夹 环的本发明衔接体的方法,包括:

(a)提供单链核酸,其包含(i)能够彼此杂交的两个区,(ii)可与另一 种衔接体的核酸差异选择的环形成区和(iii)一起构成半个回文切割位点 的两个末端;以及

(b)使所述核酸暴露于使得所述两个区可杂交并形成发夹环的条件 下,从而制备衔接体;

-一种制备本发明核酸构建体的方法,包括:

(a)使至少一个本发明衔接体与两条核酸链在使得所述衔接体与所 述链之间可连接的条件下接触;以及

(b)使所述衔接体与所述两条链连接,从而制备核酸构建体;

-一种制备本发明单链核酸构建体的方法,包括:

(a)使通过单链核酸的两个不同区之间杂交形成并包含发夹环的本 发明衔接体与两条核酸链在使得所述衔接体与所述链之间可杂交的条件 下接触;

(b)使得所述衔接体共价连接所述两条链;以及

(c)使所述共价连接的构建体变性,从而制备单链核酸构建体;

-一种用于制备本发明环状核酸构建体的方法,包括:

(a)使至少两个包含发夹环的本发明衔接体与两条核酸链在使得所 述衔接体与链之间可连接的条件下接触;以及

(b)使衔接体与所述两条链在每个末端共价连接,从而制备环状核 酸构建体;

-一种制备测序构建体的方法,包括:

(a)提供双链核酸;

(b)使所述双链核酸与本发明衔接体对在使得所述衔接体与所述核 酸可连接的条件下接触,其中I型衔接体不能被切割或缺刻,II型衔接体 能够被切割或缺刻;

(c)使所连接的产物与特异性结合所述II型衔接体的表面接触,并 除去任何未结合的产物;

(d)使所述表面与识别所述完整回文切割位点的酶接触,并除去任 何未结合的产物;

(e)切割所述II型衔接体;

(f)使在步骤(e)中产生的可溶解产物与特异性结合所述I型衔接体 的表面接触,并除去任何未结合的产物;以及

(g)从所述表面释放在步骤(f)后剩余的产物,从而产生测序构建体;

-一种测序双链核酸的方法,包括:

(a)进行本发明的方法;

(b)根据需要,使所述构建体变性以形成单链构建体;以及

(c)测序所述单链构建体,从而测序所述双链核酸;以及

-用于测序双链核酸的试剂盒,其包含本发明的衔接体对和用于切 割所述回文切割位点的工具。

附图说明

图1示出了I型衔接体的一个实施方案。所述单链DNA具有自互补 性,使得其可与自身杂交,产生单链DNA的大发夹环,其用于在纯化过 程中选择性结合“I型衔接体”连接产物。所述自杂交的衔接体的末端编 码第一限制性核酸内切酶识别序列的一半(箭头所指,1ry),用于切割 通过衔接体:衔接体(不管是I型:I型、I型:II型还是II型:II型) 连接形成的任何连接产物。

图2示出了II型衔接体的一个实施方案。在此图和所有后续图中, 所述II型衔接体均包含发夹环。所述单链DNA间有Biotin-dT碱基(爆炸 星),所述Biotin-dT碱基在所述链自杂交时位于所述单链的“泡”区。 此生物素是仅那些包括II型衔接体的连接产物的选择性特征。此衔接体 的双链元件包括第二限制性核酸内切酶的识别序列并且(与I型衔接体一 样)末端为第一限制性核酸内切酶识别序列的一半,以能够除去如前所 述的衔接体:衔接体连接产物。

图3示出了两种类型的发夹衔接体(黑色:I型;深灰:II型)与平 端模板dsDNA(浅灰)结合。A框示出了一个I型和一个II型衔接体连 接到介于其间的模板DNA序列的任一端的理想情况。B框绘出了,如果 没有介于其间的模板,则会生成不需要的连接产物。所述连接产物内存 在第一RE限制性识别位点(实线框)可用于选择性破坏所述不需要的连 接产物。另一个位于II型衔接体内的第二RE限制性位点(虚线框)用 于释放所述测序模板(见下文)。“B”标识存在II型衔接体的单链元 件上包括的生物素部分。

图4示出了闭合的环状“DNA哑铃”的产生始于大分子量模板DNA 的常规随机片段化。仅一部分所产生的片段携带在全部两条链上悬挂有 可延伸的3’OH,其可被DNA聚合酶末端修复。仍有少量修复的片段 还会在全部两条链上具有5’PO4末端。尽管数量不多,然而任何这样 的平端片段均可接受人工发夹环衔接体的连接,这会形成对核酸外切酶 在全部两条链上测序必需的闭合环状模板。

图5示出了连接后的I型和II型衔接体。用于测序的所需产物可使 用示出的方法进行纯化:黑线代表“I型”衔接体;深灰线代表生物素化 的“II型”衔接体;浅灰线标识模板DNA。交叉线箭头标识不转移至新 板的操作。空箭头标识将之前孔的内含物转移至新板。(1)连接后,将产 物吸至固定有链亲和素的板中。只有带有生物素化的II型衔接体的连接 产物会结合。(2)洗涤所述板会除去所有I型/I型连接产物等。(3)用“连 接于衔接体的衔接体”第一限制性核酸内切酶孵育会切割“衔接体/衔接 体”产物。(4)从所述第一RE消化中洗掉所有限制性内切碎片。(5)用“II 型衔接体”编码的第二限制性核酸内切酶孵育会切割结合的II型衔接体 产物。(6)将第二RE消化产物转移至新板,在所述新板上已固定化与I 型单链发夹“泡”互补的ssDNA。使得来自(5)的RE片段与所述固定化 的ssDNA杂交。(7)洗掉任何未结合的物质,只剩下保留作为所需“连接 于模板DNA的I型衔接体”的物质。(8)使用破坏所述连接产物与所述固 定化DNA的杂交的条件(加热、NaOH或任何其他本领域已知的方式), 将所需产物转移至进行后续变性和测序的新管/板。

图6示出了用识别II型接头中的杂交区的酶处理捕获的哑铃结构(图 1,A)释放如此处所绘的共价闭合的结构(左)。用变性剂处理此结构 生成易被核酸外切酶I消化的单链结构(右),如果进行所述核酸外切酶 I消化持续会释放要检测的DNA上的核苷酸、连接人工序列核苷酸以及 反向互补核苷酸,这些核苷酸可与已经进行的碱基访问进行比较。所述 访问的组合产生更高质量的一致访问。

图7示出的实例为从所述板回收的单链产物被核酸外切酶消化以释 放引起流过衔接体修饰的α-HL蛋白孔的电流变化的5’单磷酸核苷。其 中所述“碱基”被释放和鉴定的顺序是相继的。

序列表说明

SEQ ID NO:1示出了编码野生型溶血素(α-HL)的一个亚基的多核苷 酸序列。

SEQ ID NO:2示出了野生型α-HL的一个亚基的氨基酸序列。氨基 酸2-6、73-75、207-209、214-216和219-222构成α-螺旋。氨基酸22-30、 35-44、52-62、67-71、76-91、98-103、112-123、137-148、154-159、165-172、 229-235、243-261、266-271、285-286和291-293构成β-链。所有其他非 末端氨基酸,即7-21、31-34、45-51、63-66、72、92-97、104-111、124-136、 149-153、160-164、173-206、210-213、217、218、223-228、236-242、262-265、 272-274和287-290构成环区。氨基酸1和294为末端氨基酸。

SEQ ID NO:3示出了编码α-HL M113R/N139Q(HL-RQ)的一个亚基 的多核苷酸序列。

SEQ ID NO:4示出了α-HL M113R/N139Q(HL-RQ)的一个亚基的氨 基酸序列。在野生型α-HL中构成α-螺旋、β-链和环区的相同氨基酸在 此亚基中构成相应的区域。

SEQ ID NO:5示出了来源于大肠杆菌的sbcB基因的密码子优化的多 核苷酸序列。其编码大肠杆菌的核酸外切酶I(EcoExoI)。

SEQ ID NO:6示出了大肠杆菌的核酸外切酶I(EcoExoI)的氨基酸序 列。此酶以3’到5’方向从单链DNA(ssDNA)持续消化5’单磷酸核苷。 氨基酸60-68、70-78、80-93、107-119、124-128、137-148、165-172、182-211、 213-221、234-241、268-286、313-324、326-352、362-370、373-391、401-454 和457-475构成α-螺旋。氨基酸10-18、28-26、47-50、97-101、133-136、 229-232、243-251、258-263、298-302和308-311构成β-链。所有其他非 末端氨基酸19-27、37-46、51-59、69、79、94-96、102-106、120-123、 129-132、149-164、173-181、212、222-228、233、242、252-257、264-267、 287-297、303-307、312、325、353-361、371、372、392-400、455和456 构成环。氨基酸1-9为末端氨基酸。所述酶的整体折叠使得三个区域联合 形成字母C外形的分子,但无序分布在所述晶体结构中的残基355-358 有效地将此C形转化为类O形。氨基末端(1-206)构成核酸外切酶结构域 并与DnaQ超家族具有同源性,如下残基(202-354)构成SH3样结构域 并且羧基结构域(359-475)伸出所述核酸外切酶结构域,以形成C形的该 分子。EcoExoI的4个酸性残基与DnaQ超家族的活性位点残基是保守的 (对应于D15、E17、D108和D186)。已经提出,单个金属离子被残基 D15和108结合。DNA的水解似乎通过活性水分子对易切断的磷酸基的 攻击进行催化,以H181为催化残基并对齐所述核苷酸底物。

SEQ ID NO:7示出了来源于嗜热栖热菌(T.thermophilus)的recJ基因 的密码子优化的多核苷酸序列。其编码嗜热栖热菌的RecJ酶 (TthRecJ-cd)。

SEQ ID NO:8示出了嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序 列。此酶以5’到3’方向从单链DNA持续消化5’单磷酸核苷。酶在链 上的启动需要至少4个核苷酸。氨基酸19-33、44-61、80-89、103-111、 136-140、148-163、169-183、189-202、207-217、223-240、242-252、254-287、 302-318、338-350和365-382形成α-螺旋。氨基酸36-40、64-68、93-96、 116-120、133-135、294-297、321-325、328-332、352-355和359-363构成 β-链。所有其他非末端氨基酸34、35、41-43、62、63、69-79、90-92、 97-102、112-115、121-132、141-147、164-168、184-188、203-206、218-222、 241、253、288-293、298-301、319、320、326、327、333-337、351-358 和364构成环。氨基酸1-18和383-425为末端氨基酸。仅对嗜热栖热菌 (Thermus thermophilus)的RecJ的核心结构域(残基40-463)解析了晶体 结构。为确保启动所述RecJ核心结构域的翻译和体内表达,在其氨基末 端添加一个甲硫氨酸残基,这不包含在晶体结构信息中。所解析的结构 示出了由一个长α-螺旋(254-287)连接的两个结构域:氨基区(2-253)和 羧基区(288-463)。催化残基(D46、D98、H122和D183)配位单个二 价金属离子用于对磷酸二酯键进行亲核攻击。D46和H120被认为是催化 对;然而,在大肠杆菌的RecJ中突变这些保守残基的任一个均显示会完 全破坏活性。

SEQ ID NO:9示出了I-SceI归巢(homing)核酸内切酶识别位点的 序列。

SEQ ID NO:10示出了可从中产生优选的核酸接头的核酸序列。

SEQ ID NO:11示出了优选的核酸接头。MAL是马来酰亚胺。所述 接头与SEQ ID NO:14结合使用。

SEQ ID NO:12示出了优选的核酸接头。MAL是马来酰亚胺。所述 接头与SEQ ID NO:15结合使用。

SEQ ID NO:13示出了优选的核酸接头。MAL是马来酰亚胺。所述 接头与SEQ ID NO:16结合使用。

SEQ ID NO:14示出了优选的15mer的核酸接头。MAL是马来酰亚 胺。所述接头与SEQ ID NO:11互补并与SEQ ID NO:11结合使用。

SEQ ID NO:15示出了优选的15mer的核酸接头。MAL是马来酰亚 胺。所述接头与SEQ ID NO:12互补并与SEQ ID NO:12结合使用。

SEQ ID NO:16示出了优选的15mer的核酸接头。MAL是马来酰亚 胺。所述接头与SEQ ID NO:13互补并与SEQ ID NO:13结合使用。

具体实施方式

应理解,所公开的产物和方法的不同用途可根据本领域的具体需要 进行调整。还应理解,本文所用的术语只是为了描述本发明的具体实施 方案的目的,而非意图进行限制。

此外,除非上下文另有清楚的指明,否则本说明书和所附权利要求 书中所用的单数形式“a”、“an”和“the”也包括复数指代物。因此, 例如,提及“a construct”时也包括“constructs”,提及“a transmembrane” 时包括两个或更多个这类孔,提及“a molecular adaptor”时包括两个或 多个所述衔接体,等等。

本文中——无论在上文还是下文——引用的所有出版物、专利和专 利申请均以引用的方式全文纳入本文。

衔接体

本发明提供了用于测序核酸的衔接体。所述衔接体包含双链核酸区。 该区的至少一端构成半个回文切割位点。所述衔接体与其他衔接体是可 差异选择的。在某些实施方案中,所述区通过单链核酸的两个不同区之 间杂交形成并且所述衔接体包含发夹环。本发明的衔接体通常作为衔接 体对的一部分使用。

本发明的衔接体具有多个优点。所述衔接体有助于所需单链测序构 建体——其包含双链核酸模板的全部两条链——的构建、纯化和最终释 放。这确保了在对所述构建体进行测序时,所述双链核酸中的每个位置 都不仅观测一次,而是实际上被检测两次。这更加确定:所述核酸中的 每个位置都被观测,并且对每个位置上的两个碱基的累积访问具有比单 次观测更高质量的值。换言之,本发明衔接体的关键优点是它们使得双 链模板的每个“碱基对”位置可有效检测两次,作为相同“读取事件” 的一部分。因此,这确保了所生成的序列的质量非常高,并且错误鉴定 的碱基访问或完全遗漏碱基的可能性降低。

这特别有助于测序dsDNA或dsRNA。本发明的衔接体使得可产生含 有dsDNA和dsRNA的正义链和反义链的构建体。所述dsDNA或dsRNA 的每个“碱基对”位置可被有效检测两次:一次在正义链上,一次在反 义链上。

这种检测每个位置两次的能力在使用随机传感测序核酸时尤其重 要。这种测序通常倚赖所述跨膜孔对每个碱基的依次捕获和足够高的取 样速率,以实现对流过所述孔的电流减小程度的精确测定。能够对每个 碱基有效检测两次降低了以足够高的速率捕获每个碱基的要求。

此外,本发明衔接体使得所述核酸可以以适于随机传感的形式提供。 只有单链核酸可以穿过跨膜孔。此外,许多核酸操作酶——其是本文所 述测序方法的组成部分——能够只操作单链核酸。

所述对每个位置检测两次的能力还有助于使用随机传感区分甲基胞 嘧啶和胸腺嘧啶。这两个碱基在它们穿过跨膜孔并与跨膜孔相互作用时 产生非常类似的电流示踪线。因此难以区分两者。然而,对核酸中每个 位置检测两次会使得可进行所述区分,因为甲基胞嘧啶的互补碱基是鸟 嘌呤,而胸腺嘧啶的互补碱基是腺嘌呤。甲基胞嘧啶当然与多种疾病有 关,包括癌症。

作为人工序列,本发明衔接体在其实际序列中具有很大程度的灵活 性,因此可将功能性构建在所用的序列中。例如,可将衔接体特异性序 列构建在每个衔接体中。这使得含有具体衔接体的构建体可与含有不同 衔接体的构建体区分。这特别有助于对来源于不同个体源的模板的多重 序列分析。

所述衔接体可用于测序核酸。所述衔接体优选用于通过生成含有双 链核酸模板全部两条链的单链核酸构建体测序所述双链核酸。所述衔接 体更优选用于通过生成含有dsDNA或dsRNA的正义链和反义链的单链 核酸构建体测序所述dsDNA或dsRNA。

双链核酸区

所述衔接体包含双链核酸区。存在此区意味着本发明衔接体能够连 接其他双链核酸,例如dsDNA或dsRNA。本发明衔接体还能够连接其自 身或其他类型的衔接体。如下文更详细描述的,这种连接会导致完整回 文切割位点的形成。使得本发明衔接体可与双链核酸或其自身连接的合 适条件在下文讨论。

所述双链核酸区可包含任何类型的核酸。核酸是一种包含两个或更 多个核苷酸的大分子。所操作的核酸可包含任何核苷酸的任意组合。所 述核苷酸可为天然的或人工的。核苷酸通常含有核碱基、糖和至少一个 磷酸基团。所述核碱基通常是杂环。核碱基包括但不限于嘌呤和嘧啶, 更具体是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。所述糖通常为 戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。所述核苷酸通常为核糖 核苷酸或脱氧核糖核苷酸。所述核苷酸通常含有单磷酸基、二磷酸基或 三磷酸基。磷酸基可连接在核苷酸的5’或3’侧。

核苷酸包括但不限于单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、 三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三 磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷 酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸 尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞 苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷 酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、 单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟 苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、 三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿 苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、 二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。所述核苷酸优 选是AMP、TMP、GMP、UMP、dAMP、dTMP、dGMP或dCMP。

所述核酸可为脱氧核糖核酸(DNA)或核糖核酸(RNA)。所述核酸可包 括本领域已知的任意合成核酸的两条链,例如肽核酸(PNA)、甘油核酸 (GNA)、苏糖核酸(TNA)、锁核酸(LNA)或其他具有核苷酸侧链的合成聚 合物。当测序双链核酸模板时,选择所述衔接体中的核酸,使得所述衔 接体能够连接于要测序的双链核酸。

所述双链核酸区可为任意长度,只要在两个衔接体连接在一起时所 述回文切割位点具有功能。所述区的长度通常为40个或更少的碱基对, 例如30个或更少的碱基对,20个或更少的碱基对或者10个或更少的碱 基对。所述区的长度优选为5到20个碱基对,更优选6到10个碱基对。

所述区可通过杂交两条不同的单链核酸链形成。所述两条不同的链 可为相同类型的核酸,也可为不同类型的核酸,只要它们杂交。所述两 条不同的链可为上述任何类型的核酸。使得核酸杂交的合适条件在下文 更详细地讨论。

所述双链核酸区优选通过以下方式形成:单链核酸的两个不同区杂 交,使得所述衔接体包含发夹环。在本发明文中,I型衔接体包含发夹环。 这使得I型衔接体可共价连接双链核酸模板的两条链。II型衔接体可包含 发夹环,也可不包含发夹环。II型衔接体优选包含发夹环。发夹环的形 成为本领域所知。所述发夹环通常由单链核酸构成。所述发夹环可为与 构成所述双链核酸区的核酸相同类型的核酸。或者,所述发夹环可为与 构成所述双链核酸区的核酸不同类型的核酸。所述发夹环可为上述任意 类型的核酸。如在下文详细讨论的,所述发夹环可参与本发明衔接体的 差异选择性。例如,所述发夹环可包含可选择的结合部分。

所述发夹环可为任意长度。所述发夹环的长度通常为50个或更少的 碱基,例如40个或更少的碱基,30个或更少的碱基,20个或更少的碱 基或者10个或更少的碱基。所述发夹环的长度优选约1-50个、2-40个或 6-30个碱基。如果所述环参与所述衔接体的差异选择性,那么所述发夹 环优选更长的长度,例如15-50个碱基。类似地,如果所述环不参与所述 衔接体的差异选择性,那么所述发夹环优选更短的长度,例如1-5个碱基。

在无发夹环的衔接体中,所述双链核酸区具有两个自由末端。这些 末端的一个或两个都可连接于双链核酸模板。至少一个末端构成半个回 文切割位点。两个末端优选均构成相同半个回文切割位点。一个或两个 末端还可参与本发明衔接体的差异选择性。优选地,所述衔接体的一个 末端可连接于双链核酸模板并构成半个回文切割位点,并且另一个末端 参与所述衔接体的差异选择性。

在有发夹环的衔接体中,所述双链核酸区仅具有一个自由末端。另 一末端由所述发夹环闭合。所述自由末端不仅构成半个回文切割位点, 而且可连接于双链核酸模板。

所述双链核酸区的自由端可以为任意形式。所述末端可为粘性的。 换言之,所述末端不必须形成碱基对。所述粘性末端可具有5’或3’悬 突。所述末端优选为平端。换言之,所述末端优选形成碱基对。所述区 构成半个回文切割位点的末端特别优选为平端。

在无发夹环的衔接体中,连接于双链核酸模板并构成半个回文切割 位点的末端优选为平端,并且参与所述衔接体的差异选择性的另一个末 端为粘性末端。

半个回文切割位点

回文切割位点是核酸中可以以某种方式进行切割的回文共有序列。 多个这类序列为本领域所知并可用于本发明。优选的回文切割位点如下 所示。

半个回文切割位点就是半个回文共有序列。换言之,半个回文切割 位点是与其自身再组合可构成完整回文切割位点时的回文切割位点的 量。如上文所讨论的,构成所述半个回文切割位点的末端可为粘性末端 或平端。例如,对于具有如下序列的回文切割位点:

5’...AAAATTTT...3’

3’...TTTTAAAA...5’

半个回文切割位点可为

5’...AAAA...3’

3’...TTTT...5’

5’...AAAAT...3’

3’...TTT...5’

5’...AAA...3’

3’...TTTTA...5’

在上面实例中,第一个半个回文切割位点具有平端,而第二个和第 三个半个回文切割位点具有粘性末端。

如上文所讨论的,本发明的衔接体通常成对使用,其中所述对中的 一种类型的衔接体与所述对中另一种类型的衔接体可差异地选择。由于 所述对中两种类型的衔接体都包含半个回文切割位点,因此当一种类型 的衔接体与另一种相同类型或不同类型的衔接体连接时就构成完整回文 切割位点。例如,如果I型连接I型(I型:I型)、II型连接II型(II 型:II型)或I型连接II型(I型:II型),那么就该构成完整回文切割 位点。形成完整回文切割位点使得可切割所述连接的衔接体。这在下文 更详细地讨论。

所述完整回文切割位点可为任意长度。例如,回文切割位点的长度 通常为8-50个碱基对,例如至少10个碱基对,至少12个碱基对,至少 14个碱基对,至少16个碱基对,至少20个碱基对,至少30个碱基对或 至少40个碱基对。对于测序目的,所述回文切割位点越长越好,因为这 样该序列在生物体基因组中不太可能随机出现。在完全随机的基因组序 列中(其当然不可能在自然界中出现),长x个碱基对的回文切割位点 在每4x个碱基对中会出现一次。

优选的回文切割位点包括限制性核酸内切酶识别位点。限制性核酸 内切酶识别位点是被限制性核酸内切酶切割的位点。适用于本发明的限 制性核酸内切酶包括但不限于酶分类(EC)组3.1.21.4和3.1.21.5中的那 些。

所述限制性核酸内切酶识别位点可为被天然限制性核酸内切酶切割 的天然位点。或者,所述限制性核酸内切酶识别位点和/或所述限制性核 酸内切酶可为非天然的。设计用于本发明的限制性核酸内切酶识别位点 和/或限制性核酸内切酶可提供多种优点。例如,设计切割长和/或稀有位 点的核酸内切酶意味着所述核酸内切酶不太可能“偶然地”切割要检测 的双链核酸模板内的一个或多个位点。

优选的限制性核酸内切酶识别位点包括但不限于以下这些:

Sbfl 5’...CCTGCAGG...3’

3’...GGACGTCC...5’

AsiSI 5’...GCGATCGC...3’

      3’...CGCTAGCG...5’

优选的这些位点的一半包括但不限于以下这些:

Sbfl 5’...CCTG...3’

     3’...GGAC...5’

Sbfl 5’...CCT...3’

     3’...GGACG...5’

Sbfl 5’.........AGG...3’

     3’...CGTCC...5’

AsiSI 5’...GCGA...3’

      3’...CGCT...5’

AsiSI 5’.........CGC...3’

      3’...TAGCG...5’

AsiSI 5’...GCG...3’

      3’...CGCTA...5’

差异选择性

本发明的衔接体可与其他衔接体差异地选择。本发明的衔接体可与 本发明的不同类型衔接体差异地选择。I型衔接体可与I型衔接体差异地 选择。差异选择性是指一种类型的衔接体可基于至少一种性质而与另一 种类型的衔接体分开或区分。任何性质均可用于差异地选择不同类型的 衔接体。

通常,不同类型的衔接体可差异地选择,因为其可以被相互分离。 当成对使用时,所述对中每一类型的衔接体均可以与另一类型分离。例 如,I型衔接体可与II型衔接体分离,反之亦然。这有助于在下文更详细 地讨论的本发明方法。可使用任何分离方式。

差异地选择优选包括差异地或选择性地结合于表面。例如,两种类 型的本发明衔接体如果仅一种结合于表面A并且仅另一种结合于表面B, 那么它们当然可被差异地选择。因此,如果本发明衔接体特异地结合于 表面,那么它们可差异地选择。如果衔接体以远大于不同类型衔接体的 程度结合于表面,那么其就特异性结合于该表面。在优选的实施方案中, 所述衔接体结合于没有其他类型的衔接体结合的表面。下文更详细地讨 论合适的表面。

最优选地,所述衔接体可通过差异结合与其他衔接体分离。例如, 如果第一种类型的衔接体(A型)特异性结合于一个表面(表面A)而 第二种类型的衔接体(B型)结合于另一表面(表面B),那么就可使所述 两种类型的衔接体(例如A型和B型)相互分离。两种类型的衔接体的 混合物会含有未连接的两种类型的衔接体,以及A型:A型、B型:B 型、A型:B型的连接构建体。所述混合物与表面A接触会导致A型衔 接体和包含A型衔接体的任何构建体结合。类似地,所述混合物与表面 B接触会导致B型衔接体和包含B型衔接体的任何构建体结合。连接的 构建体当然可使用所述回文切割位点进行切割。

所述衔接体优选包含选择性结合部分。选择性结合部分是可基于其 结合性质被选择的部分。因此,选择性结合部分优选是特异性结合于表 面的部分。如果选择性结合部分以远大于本发明中使用的任何其他部分 的程度结合于表面,那么其就特异性结合于该表面。在优选的实施方案 中,所述部分结合于没有本发明中使用的其他部分结合的表面。如果存 在,所述发夹环优选包含选择性结合部分。

合适的选择性结合部分为本领域所知。优选的选择性结合部分包括 但不限于生物素、核酸序列、抗体、抗体片段例如Fab和ScSv、抗原、 核酸结合蛋白、聚组氨酸尾巴和GST标签。最优选的选择性结合部分是 生物素和可选择的核酸序列。生物素特异性结合于抗生物素蛋白包被的 表面。可选择的核酸序列与同源序列包被的表面特异性结合(即杂交)。 这在下文更详细地讨论。或者,可选择的核酸序列与核酸结合蛋白包被 的表面特异性结合。在最优选的实施方案中,衔接体对中一种类型的衔 接体包含生物素而另一种类型的衔接体包含可选择的核酸序列。

鉴定序列

在优选的实施方案中,所述衔接体包含使得所述衔接体可被鉴定的 核酸序列。所述核酸序列可存在于所述双链核酸区,或者,如果存在发 夹环的话,存在于所述发夹环中。

所述核酸序列的长度通常为12个或更少的碱基,例如10个或更少 的碱基,8个或更少的碱基或者6个或更少的碱基。当根据本发明测序包 含所述衔接体的构建体时,所述核酸序列包含可被鉴定的可识别序列。 在包含发夹环的衔接体中,所述序列会在连接要检测的两条核酸链的衔 接体部分被测序时被鉴定。在缺少发夹环并能够被切割或缺刻的衔接体 中,所述序列通常位于连接所述双链核酸模板的末端与衔接体可被切割 或缺刻的点之间。在这些实施方案中,即使在所述衔接体被切割或缺刻 的情况下,所述序列仍然与所述双链核酸模板连接。

在优选的实施方案中,所述核酸序列可鉴定其连接的两条链的来源。 在这些实施方案中,所述衔接体使得可对来源于不同个体源的模板进行 多重序列分析。每个模板被分配给不同的衔接体,其中每个衔接体都包 含可鉴定所述模板来源的核酸序列。

能够被切割或缺刻的衔接体

在某些实施方案中,所述衔接体自身能够被切割或缺刻。换言之, 所述衔接体不必连接于另一衔接体就可被切割或缺刻。所述双链核酸区 能够被切割或缺刻,并且/或者,如果存在发夹环,所述发夹环能够被切 割或缺刻。在有发夹环的衔接体中,构成半个回文切割位点的衔接体末 端(即连接所述双链序列模板的衔接体末端)优选可与所述可选择的结 合部分分离。在无发夹环的衔接体中,所述衔接体的一个或两个末端优 选可与所述可选择的结合部分分离。

能够被切割或缺刻的衔接体优选含有一个或多个例如两个、三个或 更多个切割或缺刻位点。可依照本发明使用任何切割或缺刻位点。这些 位点包括但不限于,化学切割或缺刻位点、RNA/DNA复合位点、非天然 碱基(例如脲嘧啶)以及限制性核酸内切酶识别位点和归巢核酸内切酶 识别位点。

能够被切割或缺刻的衔接体更优选包含一个或多个限制性或归巢核 酸内切酶识别位点。优选所述限制性或归巢核酸内切酶识别位点不是当 所述衔接体连接于本发明另一衔接体时所形成的回文切割位点。合适的 限制性或归巢核酸内切酶识别位点为本领域所知。优选的归巢核酸内切 酶识别位点包括但不限于以下这些:

I-SceI(SEQ ID NO:9)5’...TAGGGATAACAGGGTAAT...3’

                    3’...ATCCCTATTGTCCCATTA...5’

衔接体对

本发明还提供了本发明的衔接体对。所述对中一种类型的衔接体通 过单链核酸的两个不同区之间杂交形成并且包含发夹环(I型)。所述对 中另一类型的衔接体可具有发夹环,也可不具有发夹环(II型)。所述 II型衔接体优选也通过单链核酸的两个不同区之间杂交形成并且包含发 夹环。所述对中每一类型的衔接体均可与另一类型差异地选择。如果所 述两种类型的衔接体的任意组合彼此连接,就形成完整回文切割位点。 所述衔接体可为上面讨论的任何衔接体。

I型衔接体优选可与II型衔接体分离,反之亦然。可使用上文所述 的任何分离方法。I型衔接体更优选可通过差异结合与II型衔接体分离。 I型衔接体甚至更优选包含与II型衔接体不同的可选择的结合部分。优选 地,I型衔接体包含可选择的核酸而II型衔接体包含生物素。所有这些实 施方案都有利于在下文详细讨论的本发明方法。

还优选I型衔接体自身不能被切割或缺刻而II型衔接体自身能够被 切割或缺刻。所述II型衔接体可以以上文讨论的任何方式被切割或缺刻。

I型衔接体还优选包含使得所述衔接体可被鉴定的核酸序列。

本发明最优选的衔接体对总结在下表1中。

试剂盒

本发明还提供了试剂盒,其包含至少两群通过单链核酸的两个不同 区之间杂交形成并且包含发夹环的本发明的衔接体(I型)。每群中的每 个衔接体都包含对该群特异的核酸序列。换言之,群中的每个衔接体都 包含使得所述衔接体被鉴定为该群的一部分而非其他群的一部分的序 列。所述两个或多个群使得可对来源于两个或多个不同个体源例如两个 或多个生物体的双链核酸模板进行多重序列分析。合适的生物体在下文 讨论。每个模板被分配给不同的群,每个群都包含可鉴定所述模板来源 的核酸序列。所述鉴定核酸序列在每个群中不同。所述序列通常位于所 述两个或多个群中每个群的衔接体中的相同位置。这使得可有效区分所 述群。使得衔接体可被鉴定的核酸序列在上文进行了更详细的讨论。上 文讨论的任何实施方案都适用于本发明的试剂盒。

所述试剂盒可包含任意数量的群,例如5、10、20、50、100或更多 的群。

所述试剂盒优选还包含两个或多个群的II型衔接体,使得每一I型 衔接体与II型衔接体成对。衔接体对在上文进行了更详细的讨论。上文 讨论的任何实施方案都适用于本发明的试剂盒。

本发明还提供了用于测序双链核酸的试剂盒,其包含本发明的衔接 体对和用于切割所述回文切割位点的工具;所述工具通常是上文讨论的 酶。

本发明的试剂盒还可包含一种或多种可使任何上述实施方案得以进 行的其他试剂或器具。这些试剂或器具包括以下的一种或多种:合适的 缓冲剂(水性溶液)、从受试者获得样品的工具(例如包含针头的容器 或器具)、多核苷酸序列的扩增、表达和/或测序工具、上文定义的膜、 上文定义的表面或者电压钳或膜片钳装置。试剂可以以干态存在于试剂 盒中,从而液体样品可重悬浮所述试剂。所述试剂盒还可任选地包含使 所述试剂盒可用于本发明方法的说明书或者关于所述方法可用于哪些患 者的详细资料。所述试剂盒可任选地包含核苷酸。

核酸构建体

本发明还提供了用作测序模板的核酸构建体。这些构建体可用于测 序双链核酸。所述构建体通常包含与至少一个本发明衔接体连接的两条 核酸链。通常需要确定所述两条核酸链的序列。

在一个实施方案中,本发明提供了用作测序模板的核酸构建体,所 述核酸构建体包含与至少一个本发明衔接体连接的双链核酸;所述构建 体可包含两个衔接体,所述双链核酸的每个末端连接一个。所述构建体 可包含上文讨论的任何衔接体。

在另一个实施方案中,本发明提供了用作测序模板的单链核酸构建 体,其包含通过本发明衔接体共价连接的两条核酸链,所述衔接体通过 单链核酸的两个不同区之间杂交形成并且包含发夹环(I型)。所述两条 链通常来源于双链核酸,例如dsDNA或dsRNA。所述构建体可包含上文 讨论的任何I型衔接体。这些构建体具有上文所述的多个优点。在某些实 例中,可能必须变性所述构建体以产生单链结构。用于变性核酸的合适 条件在下文更详细地讨论。

在另一个实施方案中,本发明提供了包含两条核酸链的环状核酸构 建体,所述两条核酸链在每个末端通过本发明衔接体共价连接,所述衔 接体通过单链核酸的两个不同区之间杂交形成并且包含发夹环(I型)。 所述两条链通常来源于双链核酸,例如dsDNA或dsRNA。所述构建体可 包含上文讨论的任何I型衔接体。

在所有这些实施方案中,所述两条链优选为dsDNA或dsRNA的正 义和反义链。

制备本发明衔接体的方法

本发明还提供了用于制备本发明衔接体的方法。所述方法包括提供 两个核酸,所述核酸(i)能够彼此杂交构成半个回文切割位点,并且(ii)可 与另一种衔接体的核酸差异地选择。这些特征都在上文关于本发明衔接 体进行了详细讨论。所述核酸在使得它们可杂交的条件下接触并产生本 发明衔接体。这些条件在下文更详细地讨论。

本发明还提供了用于制I型衔接体的方法。所述方法包括提供单链核 酸,其包含(i)能够彼此杂交的两个区,(ii)可与另一种衔接体的核酸差异 选择的环形成区和(iii)一起构成半个回文切割位点的两个末端。这些特征 都在上文关于本发明衔接体进行了详细讨论。所述核酸暴露于使得所述 两个区可杂交并形成发夹环的条件下,从而制备I型衔接体;

能够彼此杂交的核酸或区优选具有以序列同一性计至少80%、至少 85%、至少90%、至少95%、至少98%或至少99%的同源性。所述核酸 或区更优选互补(即具有以序列同一性计100%的同源性)。

可使用本领域的标准方法确定同源性。例如UWGCG软件包提供可 用于计算同源性的BESTFIT程序(例如使用它的默认设置)(Devereux et al (1984)Nucleic Acids Research 12,p387-395)。例如,如Altschul S.F.(1993) J Mol Evol 36:290-300;Altschul,S,F et al(1990)J Mol Biol 215:403-10中 所述,可以使用PILEUP和BLAST算法计算同源性或者对序列进行比对 (例如鉴定等价残基或相应的序列(一般使用它们的默认设置))。

进行BLAST分析的软件可以从美国国家生物技术信息中心 (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)公开获得。所述算法涉及到首先鉴定高分 值序列对(HSP),这个步骤是通过如下方式实现:在查询序列中鉴定长度 为W的短字长,所述短字长当与数据库序列中相同长度的字长比对的时 候匹配或者满足某个正值的阈值T。T是指邻近字长值阈值(Altschul et al, 见上文)。将这些初始邻近字长匹配作为种子启动检索,以发现包含它们 的HSP。在累积比对分值能够增加期间,在每条序列的两个方向进行字 长匹配延伸。在每个方向上的字长匹配的延伸停止的条件是:所述累积 比对分值从其所达到的最大值下降X量;由于一个或多个负得分残基比 对的累积,所述累积分值降到0或小于0;或者达到任何一个序列的端点。 所述BLAST算法的参数W、T和X决定了比对的敏感度和速度。所述 BLAST程序使用的默认字长(W)为11,BLOSUM62打分矩阵(见Henikoff  and Henikoff(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919)比对(B)为 50,期望(E)为10,M=5,N=4,并且是进行双链比较。

所述BLAST算法可进行两个序列之间的相似性的统计分析;参见例 如Karlin and Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5787。所 述BLAST算法提供的一种相似性的量度是最小和概率(P(N)),所述最小 和概率表示两个氨基酸序列之间随机出现匹配的概率。例如,如果一个 序列与另一个序列比较中的最小和概率小于约1,优选小于约0.1,更优 选小于约0.01,并且最优选小于约0.001,那么第一序列被认为与第二序 列相似。

使杂交可进行的条件为本领域所公知(例如Sambrook et al.,2001, Molecular Cloning:a laboratory manual,3rd edition,Cold Spring  Harbour Laboratory Press;和Current Protocols in Molecular Biology, Chapter 2,Ausubel et al.,Eds.,Greene Publishing and Wiley-lnterscience, New York(1995))。杂交可在低严格条件下进行,例如于37℃在30-35% 甲酰胺、1M NaCl和1% SDS(十二烷基硫酸钠)的缓冲溶液中杂交, 然后于50℃在1X(0.1650M Na+)到2X(0.33M Na+)SSC(标准柠檬酸钠) 中洗涤。杂交可在中等严格条件下进行,例如于37℃在40-45%甲酰胺、 1M NaCl和1% SDS的缓冲溶液中杂交,然后于55℃在0.5X(0.0825M Na+)到1X(0.1650M Na+)SSC中洗涤。杂交可在高严格条件下进行,例 如于37℃在50%甲酰胺、1M NaCl和1% SDS的缓冲溶液中进行,然后 于60℃在0.1X(0.0165M Na+)SSC中洗涤。

制备本发明构建体的方法

本发明还提供了多种用于制备本发明构建体的方法。本发明的构建 体在上文讨论。任何本发明构建体都可使用这些方法制备。

在一个实施方案中,本发明提供了用于制备本发明核酸构建体的方 法。所述方法包括使至少一种本发明衔接体与两条核酸链在使得所述衔 接体与所述链之间可连接的条件下接触。上文讨论的任何衔接体均可使 用。所述两条链通常来源于双链核酸,例如dsDNA或dsRNA。适于连 接核酸的条件为本领域所知。这些条件包括但不限于50mM Tris-HCl、 10mM MgCl2、1mM ATP、10mM二硫苏糖醇、pH 7.5和25℃。然后 使所述衔接体与所述两条链连接,从而制备核酸构建体。

在另一个实施方案中,本发明提供了用于制备本发明的单链核酸构 建体的方法。所述方法包括使I型衔接体与两条核酸链在使得所述衔接体 与所述链之间可连接的条件下接触。上文讨论的任何I型衔接体均可使 用。所述两条链通常来源于双链核酸,例如dsDNA或dsRNA。适于连 接核酸的条件在上文进行了讨论。使所述衔接体与所述两条链在每个末 端共价连接。然后使所述共价连接的构建体变性,从而制备单链核酸构 建体。适于变性核酸的条件包括但不限于pH、温度和离子强度。

在另一个实施方案中,本发明提供了用于制备本发明的环状核酸构 建体的方法。所述方法包括使至少两个I型衔接体与两条核酸链在使得所 述衔接体与所述链之间可连接的条件下接触。所述至少两个I型衔接体可 相同或不同。上文讨论的任何I型衔接体均可使用。所述两条链通常来源 于双链核酸,例如dsDNA或dsRNA。适于连接核酸的条件在上文进行了 讨论。然后,使衔接体与所述两条链在每个末端共价连接,从而制备环 状核酸构建体。

在另一个实施方案中,本发明提供了用于制备本发明测序构建体的 方法。所述方法制备了单链核酸构建体,其包含通过I型衔接体共价连接 的双链核酸的两条链。所述方法包括提供双链核酸。所述提供优选包括 随机片段化模板核酸。所述双链核酸的末端可被修复以形成平端。上文 公开的任何核酸均可使用。所述方法通常使用序列未知的双链核酸进行。 或者,所述方法可使用序列已知或可预测的双链核酸进行。

所述方法可对于从任何生物体或微生物体获得或提取的双链核酸在 体外进行。所述生物体或微生物体通常是原核生物、真核生物或古生物 并通常属于以下5界之一:植物界、动物界、真菌界、原核生物界和原 生生物界。所述方法可对于从任何病毒获得或提取的双链核酸在体外进 行。通常,所述双链核酸是人源的,但其也可来源于另一种哺乳动物例 如经济动物如马、牛、绵羊或猪,也可为宠物如猫或狗。

所述双链核酸通常在进行所述方法之前处理,例如通过离心或通过 穿过膜,所述膜可滤出不想要的分子或细胞如红细胞。所述双链核酸可 在采集后立即使用。所述双链核酸在进行所述方法之前保存在优选低于 -70℃下。

所述双链核酸优选dsDNA或dsRNA。

使所述双链核酸与本发明的I型和II型衔接体对在使得所述衔接体 与所述核酸可连接的条件下接触。所述II型衔接体自身能够如上所述被 切割或缺刻。适于连接核酸的条件在上文进行了讨论。合适的I型衔接体 和II型衔接体对也在上文进行了讨论。

然后,使连接产物与特异性结合II型衔接体的表面接触,所述II型 衔接体能够被切割或缺刻。任何含有II型衔接体的构建体都会结合于所 述表面。合适的表面包括但不限于金属(特别是金)、琼脂糖、葡聚糖、 聚苯乙烯、玻璃、硅(键合与非键合的)和纤维素。优选地,所述表面 特异性结合所述II型衔接体上的可选择的结合部分。所述表面最优选被 抗生物素蛋白包被。

然后,除去任何未结合的产物。这通常通过用合适的缓冲液洗涤所 述表面完成。合适的缓冲液包括但不限于合适离子浓度的Tris、HEPES 和MOPS。此步骤除去所有通过I型衔接体与I型衔接体连接形成的构建 体(I型衔接体:I型衔接体)。

然后,使所述表面与识别所述完整回文切割位点的酶接触。合适的 酶在上文进行了讨论。此步骤会切割任何剩余的(即结合的)通过衔接 体与衔接体的连接形成的构建体,即I型:II型或II型:II型。

同时,除去任何未结合的产物,通常通过洗涤。此步骤确保了只有 分离的II型衔接体或者含有所述双链核酸和至少一个II型衔接体的构建 体仍结合于所述表面。

然后,切割所述II型衔接体。进行这一点的方法在上文进行了讨论。 此步骤确保了含有所述双链核酸和至少一个II型衔接体的构建体从所述 表面的释放。

然后,使所得可溶性产物与特异性结合I型衔接体的表面接触,所述 I型衔接体不能够被切割或缺刻。任何剩余的含有I型衔接体的构建体都 结合于所述表面。每个构建体都将含有双链核酸,所述双链核酸在一个 末端通过I型衔接体共价连接。所述表面优选特异性结合所述I型衔接体 上的可选择的结合部分。所述表面更优选被核酸序列包被,所述核酸序 列以序列同一性计与I型衔接体中的可选择的核酸序列至少80%,例如 至少90%、至少95%或至少99%同源。所述表面最优选被核酸序列包被, 所述核酸序列与I型衔接体中的可选择的核酸序列互补。同时,除去未结 合的产物。

最后,从所述表面释放任何剩余的产物。这些释放的产物即本发明 的测序构建体,其中双链核酸在一个末端通过I型衔接体共价连接。所述 构建体还可在所述双链核酸的末端含有II型衔接体的片段。

所得到的构建体可能需要变性以形成单链构建体。适于变性核酸的 条件在上文进行了讨论。

测序双链核酸的方法

本发明还提供了测序双链核酸的方法。所述方法包括进行上述用于 制备核酸构建体的方法之一。所述构建体含有通过I型衔接体共价连接的 两条核酸链,优选DNA或RNA。如必要,将所述构建体变性以形成单 链构建体。进行这一点的条件在上面进行了描述。

然后,测序所述单链构建体。测序所述单链构建体将依次提供一条 链、I型衔接体和另一条链的序列。所述链当然是以相对的方向。在某些 实施方案中,所述单链核酸构建体中还可存在II型衔接体的片段。

本发明方法是有利的,因为所述双链核酸中的每个位置均被检测两 次(即每条链上一次)。所述方法优选包括测序含有或怀疑含有甲基胞 嘧啶的双链核酸。如果I型衔接体包含鉴定所述双链核酸来源的核酸序 列,该序列也将通过使用本发明的方法来识别。

可使用这些方法测序所述构建体的全长或一部分。所述构建体可为 任意长度。例如,所述构建体的长度可为至少10、至少50、至少100、 至少150、至少200、至少250、至少300、至少400或至少500个核苷酸。 所述方法通常在体外进行。

通过有效地倍增对每个碱基的检测,本发明可提高所有现有第二代 测序化学和开发中的下一代测序技术的数据质量。可依照本发明使用任 何测序单链核酸构建体的方法。合适的方法为本领域所知。这些方法包 括但不限于:Sanger(或双脱氧)法、Maxam-Gilbert(化学切割)法、 Life Technologies的SOLiD(其使用通过连接的测序)、Illumina Genome  Analyser(其使用对扩增模板的荧光可逆终止子化学)、454 Genome  Sequencer FLX(其使用对扩增模板的焦磷酸测序化学)、Helicos  Heliscope(其通过对未扩增(衔接体修饰的)模板的荧光可逆终止子化 学使用真实的单分子测序)、Bionanomatrix(蚀刻通道中碱基的电子分 辨)、Danaher Motion(“polony”测序)、LingVitae(“设计聚合物” 测序)、Pacific BioSciences的通过荧光核苷酸DNA聚合的单分子测序 和Visigen’s(通过DNA聚合反应过程中供体和受体的FRET相互作 用测序)。

还存在多种使用跨膜孔来测序核酸分子的方式。一种方式包括使用 核酸外切酶例如脱氧核糖核酸酶。在此方法中,所述核酸外切酶用于使 核苷酸从靶核酸链上序贯脱离。然后,按核苷酸释放的顺序通过孔检测 并分辨所述核苷酸,从而读出原始链的序列。

测序核酸的另一种方式包括将所述靶核酸链推过或拉过所述孔的酶 和施加电势的结合使用。在此方法中,离子电流随着靶链中的核苷酸通 过所述孔而波动。所述电流波动指示该链的序列。

第三种测序核酸链的方式是检测与孔检测器紧密接近的聚合酶的副 产物。在此方法中,对核苷磷酸(核苷酸)进行标记从而使磷酸标记物 质在将聚合酶加至核苷酸链后释放,并且通过所述孔检测所述磷酸标记 物质。所述磷酸物质含有对每种核苷酸特异的标记物。随着核苷酸被序 贯加至所述核酸链,加入碱基的副产物被检测。所述磷酸标记物质被检 测的顺序可用于确定所述核酸链的序列。

这三种方法的任一种都可依照本发明用于测序。

在一个优选实施方案中,测序通过包含以下步骤的方法进行:(i)使 所述构建体与共价结合有核酸外切酶和分子衔接体的跨膜孔接触,使得 所述核酸外切酶从所述构建体的一个末端消化单个核苷酸;(ii)使所述核 苷酸与所述孔接触,使得所述核苷酸与所述分子衔接体相互作用;(iii)测 量在所述相互作用中通过所述孔的电流,从而确定所述核苷酸的类型; 以及(iv)在所述构建体的同一末端重复步骤(i)-(iii),从而确定所述靶序列 的序列。因此,所述方法包括以连续方式对所述构建体中的一部分核苷 酸进行随机传感,以测序所述构建体。单个核苷酸在上文进行了描述。

在另一个优选实施方案中,测序通过包含以下步骤的方法进行:(i) 使所述构建体与连接有核酸操作酶的跨膜孔接触,使得所述酶将所述构 建体推过或拉过所述孔并且所述构建体中的一部分核苷酸与所述孔相互 作用,以及(ii)测量在每次相互作用中通过所述孔的电流,从而确定所述 构建体的序列。因此,所述方法包括以连续方式在核苷酸通过所述桶或 通道时对构建体中的一部分核苷酸进行随机传感,以测序所述构建体。

跨膜孔

跨膜孔是使得由施加电势驱动的离子可从膜的一侧流至该膜的另一 侧的孔。优选地,所述孔使得核苷酸可沿施加电势从膜的一侧流至另一 侧。优选地,所述孔可将核酸例如DNA或RNA推过或拉过所述孔。

所述孔优选跨膜蛋白孔。跨膜蛋白孔是使得由施加电势驱动的离子 可从膜的一侧流至该膜的另一侧的多肽或多肽集合。

所述孔可为分离的、基本上分离的、纯化的或基本上纯化的。如果 孔完全不含任何其他组分(如脂质或其他孔),则该孔是分离的或纯化 的。如果孔混有不干扰其预计用途的载体或稀释剂,则该孔是基本分离 的。例如,如果孔以包含小于10%、小于5%、小于2%或小于1%的其 他组分(如脂质或其他孔)的形式存在,则该孔是基本分离或基本纯化 的。所述孔通常存在于脂质双层中。

所述孔可为单体或寡聚体。所述孔优选由数个重复亚基例如6、7或 8个亚基构成。所述孔更优选七聚体孔。所述孔通常包含离子可从中流过 的桶或通道。所述孔的亚基通常环绕一个中心轴,并向跨膜β桶或通道 或者跨膜α-螺旋束或通道提供链。

所述孔的桶或通道通常包含有助于与核苷酸或核酸相互作用的氨基 酸。这些氨基酸优选位于靠近所述桶或通道的收缩区附近。所述孔通常 包含一个或多个带正电的氨基酸,例如精氨酸、赖氨酸或组氨酸。这些 氨基酸通常有助于所述孔与核苷酸或核酸之间的相互作用。衔接体可有 助于所述核苷酸检测。这一点在下文更详细地讨论。

依照本发明使用的孔可为β-桶孔、α-螺旋束孔或固态孔。β-桶孔包含 由β-链构成的桶或通道。合适的β-桶孔包括但不限于:β-毒素例如α-溶血 素、炭疽毒素和杀白细胞素,细菌的外膜蛋白/孔蛋白例如耻垢分枝杆菌 (Mycobacterium smegmatis)孔蛋白A(MspA)、外膜孔蛋白F(OmpF)、外 膜孔蛋白G(OmpG)、外膜磷酸酯酶A和奈瑟球菌属(Neisseria)自转运脂 蛋白(NalP)。α-螺旋束孔包含由α-螺旋构成的桶或通道。合适的α-螺旋束 孔包括但不限于:内膜蛋白和α外膜蛋白例如WZA。

合适的固态孔包括但不限于:氮化硅孔、二氧化硅孔和石墨烯孔。 其他合适的固态孔及其生产方法在美国专利6,464,842、WO 03/003446、 WO 2005/061373、美国专利7,258,838、美国专利7,466,069、美国专利 7,468,271和美国专利7,253,434中有所描述。

所述孔优选来源于α-溶血素(α-HL)。野生型α-HL孔由7个相同的单 体或亚基构成(即,其是七聚体)。α-溶血素的一个野生型单体或亚基 的序列示于SEQ ID NO:2。所述孔优选包含7个序列示于SEQ ID NO:2 序列或其变体的亚基。SEQ ID NO:2的氨基酸1、7-21、31-34、45-51、 63-66、72、92-97、104-111、124-136、149-153、160-164、173-206、210-213、 217、218、223-228、236-242、262-265、272-274、287-290和294构成环 区。SEQ ID NO:2的残基113和147构成所述α-HL的桶或通道的收缩区 的一部分。

SEQ ID NO:2的变体是具有从SEQ ID NO:2变化而来但保留有其孔 形成能力的氨基酸序列的亚基。变体形成孔的能力可使用任何本领域已 知的方法测定。例如,可将所述变体和其他合适的亚基一块插入膜中, 并可确定其寡聚形成孔的能力。

所述变体可包括有助于与所述核酸操作酶共价结合或与其相互作用 的修饰。优选地,所述变体包含有助于与所述酶结合的一个或多个反应 性半胱氨酸残基。例如,所述变体可在SEQ ID NO:2的8、9、17、18、 19、44、45、50、51、237、239和287位中的一个或多个位置和/或氨基 或羧基末端上包括半胱氨酸。优选的变体包含对SEQ ID NO:2的8、9、 17、237、239和287位上的残基的半胱氨酸置换(K8C、T9C、N17C、 K237C、S239C或E287C)。

可修饰所述变体以有助于所述酶的基因融合。例如,可修饰例如缺 失与插入位点相邻的一个或多个残基以有助于所述酶和/或接头的插入。 如果将所述酶插入SEQ ID NO:2的环2中,那么可缺失SEQ ID NO:2的 残基D45、K46、N47、H48、N49和K50中的一个或多个。

所述变体还可包括有助于与核苷酸的任何相互作用或有助于下文讨 论的分子衔接体的取向的修饰。所述变体还可含有有助于分子衔接体的 共价结合的修饰。

具体地,所述变体优选在SEQ ID NO:2的139位上具有谷氨酰胺。 所述变体优选在SEQ ID NO:2的113位上具有精氨酸。所述变体优选在 SEQ ID NO:2的119、121或135位上具有半胱氨酸。SEQ ID NO:4示出 了SEQ ID NO:2的序列,不同之处在于其在113位具有精氨酸(M113R) 以及在139位具有谷氨酰胺(N139Q)。SEQ ID NO:4或其变体可用于构成 本发明的孔。

所述变体可为由生物体例如葡萄球菌属(Staphylococcus)细菌天然表 达的天然变体,或者由细菌例如大肠杆菌(Escherichia coli)重组表达。变 体还可包括通过重组技术产生的非天然变体。对于SEQ ID NO:2或4的 氨基酸序列的全长,变体优选与该序列以氨基酸同一性计至少50%同源。 更优选地,对于全长,所述变体多肽可以与SEQ ID NO:2或4的氨基酸 序列以氨基酸同一性计至少55%、至少60%、至少65%、至少70%、至 少75%、至少80%、至少85%、至少90%并且更优选地至少95%、97% 或99%同源。在200或更多个例如230、250、270或280或更多个连续 氨基酸的片段上存在至少80%例如至少85%、90%或95%的氨基酸同一 性(“硬同源性”)。

除上文讨论的以外,还可对SEQ ID NO:2或4的氨基酸序列进行氨 基酸置换,例如最多多至1、2、3、4、5、10、20或30个置换。保守性 置换可例如根据下表2进行。

表2保守性置换

第二列同一格中的氨基酸,优选第三列同一行中的氨基酸可相互置 换。

还可从上述多肽中额外缺失SEQ ID NO:2的氨基酸序列的一个或多 个氨基酸残基。可缺失最多达1、2、3、4、5、10、20或30个残基,或 者更多。

变体可为SEQ ID NO:2或4的片段。这类片段保留了孔形成活性。 片段长度可为至少50、100、200或250个氨基酸。片段优选包含SEQ ID  NO:2或4的孔形成结构域。片段通常包括SEQ ID NO:2或4的残基119、 121、135、113和139。

可将一个或多个氨基酸替代地或额外地加至上述多肽上。在SEQ ID  NO:2或4或者其变体或片段的氨基酸序列的氨基端或羧基端,可提供延 长物。所述延长物可以非常短,例如长度为1-10个氨基酸。或者,所述 延长物可以较长,例如最多达50或100个氨基酸。可使载体蛋白与孔或 变体融合。

如上文所讨论的,SEQ ID NO:2或4的变体是具有从SEQ ID NO:2 或4变化而来但保留有其形成孔的能力的氨基酸序列的亚基。变体通常 包含SEQ ID NO:2或4中负责孔形成的区域。α-HL——其包含β-桶—— 的孔形成能力由每个亚基中的β-链提供。SEQ ID NO:2或4的变体通常 包含SEQ ID NO:2中形成β-链的区域。SEQ ID NO:2或4中形成β-链的 氨基酸在上文进行了讨论。可对SEQ ID NO:2或4中形成β-链的区域进 行一个或多个修饰,条件是得到的变体保留其形成孔的能力。可对SEQ ID NO:2或4的β-链区域进行的具体修饰在上文进行了讨论。

SEQ ID NO:2或4的变体优选在其α-螺旋和/或环区中包括一个或 多个修饰,例如置换、添加或缺失。构成α-螺旋和/或环的氨基酸在上文 进行了讨论。

可对所述变体进行修饰,例如通过插入组氨酸或精氨酸残基以辅助 其鉴定或纯化,或者通过在所述多肽天然不含信号序列的情况下插入信 号序列以促进其从细胞的分泌。

所述孔可被显示标记物所标记。所述显示标记物可为使得所述孔可 被检测的任何合适标记物。合适标记物包括但不限于:荧光分子;放射 性同位素例如125I、35S、14C;酶;抗体;抗原;多核苷酸;以及配体例 如生物素。

所述孔可分离自产生孔的生物体例如金黄色葡萄球菌 (Staphylococcus aureus),或者可通过合成或通过重组方式制备。例如, 所述孔可通过体外翻译和转录进行合成。可对所述孔的氨基酸序列进行 修饰,以包括非天然氨基酸或者以增加所述孔的稳定性。当所述孔通过 合成方式产生时,这类氨基酸可在产生过程中引入。所述孔还可在合成 或重组产生后进行修改。

所述孔还可使用D-氨基酸产生。例如,所述孔可包含L-氨基酸和 D-氨基酸的混合物。对于产生这类蛋白或肽,这一点是本领域常用的。

所述孔还可含有其他非特异性化学修饰,只要这些修饰不影响其形 成孔的能力。许多非特异性侧链修饰是本领域已知的,并且可对所述孔 的侧链进行这些修饰。例如,这类修饰包括对氨基酸的还原烷基化(按 照如下方式进行:首先与醛反应,然后以NaBH4进行还原)、以甲基乙 酰亚胺进行脒基化(amindination)或者以乙酸酸酐进行酰化。对所述孔 的修饰可在各亚基的表达之后或者已使用所述亚基形成孔之后进行。

所述孔可使用本领域已知的标准方法产生。编码孔或孔亚基的多核 苷酸序列可使用本领域中的标准方法分离和复制。编码孔或孔亚基的多 核苷酸序列可使用本领域中的标准技术在细菌宿主细胞中表达。所述孔 可通过在细胞中从重组表达载体原位表达多肽产生。所述表达载体任选 地携带诱导型启动子以控制所述多肽的表达。

孔可通过如下方式大规模产生:从产生孔的生物体或者在如下文所 述的重组表达后通过任一种蛋白质液相色谱体系进行纯化。常见蛋白质 液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic 系统和Gilson HPLC系统。

核酸操作酶

核酸操作酶是能够与核酸相互作用并改变核酸的至少一种性质的多 肽。所述酶可通过切割核酸以形成单个核苷酸或更短的核苷酸链例如二 核苷酸或三核苷酸而修改所述核酸。所述酶可通过将核酸取向至具体位 置或将其移动至具体位置而修改所述核酸。所述酶可操作上文讨论的任 何核酸。

由所述酶所操作的核酸优选为单链。由所述酶操作的核酸可为双链, 例如dsDNA或dsRNA。操作单链核酸的酶可用于测序双链DNA,条件 是该双链DNA在由该酶操作之前通过化学或加热方式解离为单链。

优选所述核酸操作酶的三级结构是已知的。知晓所述酶的三维结构 使得可对所述酶进行修饰以有助于其在本发明方法中的作用。

所述酶可为任意大小并可具有任何结构。例如,所述酶可为寡聚体, 例如二聚体或三聚体。所述酶优选是由一个单体构成的小球状多肽。这 种酶易于操作并且不太可能影响所述孔或孔亚基的孔形成能力,特别是 在与所述孔或孔亚基的序列融合或插入所述孔或孔亚基的序列中时。

所述酶的氨基和羧基末端优选紧密接近。所述酶的氨基和羧基末端 更优选处于酶的同一面上。这种实施方案有助于所述酶插入到所述孔或 孔亚基的序列中。例如,如果所述酶的氨基和羧基末端紧密接近,那么 每个末端均可通过与所述孔或孔亚基序列中邻近氨基酸的基因融合而结 合。

还优选所述酶的活性位点的位置和功能是已知的。这可避免对活性 位点进行破坏所述酶活性的修饰。这还使得所述酶可与所述孔结合,从 而使得所述酶以这样的方式操作所述构建体,即所述构建体中的一部分 核苷酸与所述孔相互作用。有利的是,使所述酶的活性位点的位置与所 述孔的某一部分尽可能近,所述部分构成所述孔的桶或通道的开口的一 部分,而酶自身不呈现对电流流动的阻断。知晓酶以何种方式取向核酸 还使得可设计出有效的孔-酶构建体。

为使构建体中的大多数核苷酸被随机传感正确地鉴定,所述酶必需 在与分辨核苷酸相适应的缓冲背景下操作所述核酸。所述酶优选在远高 于正常生理水平的盐浓度例如100mM-2000mM下至少具有剩余活性。 更优选对所述酶进行修饰以提高其在高盐浓度下的活性。还可对所述酶 进行修饰以提高其持续操作能力、稳定性和保存期。

合适的修饰可通过对嗜极微生物例如嗜盐和中度嗜盐细菌、嗜热和 中度嗜热生物的核酸操作酶进行表征来确定,以及通过改变嗜温或嗜热 核酸外切酶的耐盐性、稳定性和温度依赖性的定向进化方法来确定。

所述酶还优选在10-60℃的温度下例如在室温下保留至少部分活性。 这使得所述构建体可在包括室温的多种温度下测序核酸。

所述核酸操作酶优选溶核酶(nucleolytic enzyme)。所述核酸操作 酶更优选酶分类(EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、 3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31的任一组的成员。所述核 酸操作酶更优选以下酶的任一种:

●3.1.11.-产生5’-磷酸单酯的脱氧核糖核酸外切酶。

○3.1.11.1    脱氧核糖核酸外切酶I。

○3.1.11.2    脱氧核糖核酸外切酶III。

○3.1.11.3    脱氧核糖核酸外切酶(入诱导的)。

○3.1.11.4    脱氧核糖核酸外切酶(噬菌体SP3诱导的)。

○3.1.11.5    脱氧核糖核酸外切酶V。

○3.1.11.6    脱氧核糖核酸外切酶VII。

●3.1.13.-产生5’-磷酸单酯的核糖核酸外切酶。

○3.1.13.1    核糖核酸外切酶II。

○3.1.13.2    核糖核酸外切酶H。

○3.1.13.3    寡核苷酸酶。

○3.1.13.4    Poly(A)特异的核糖核酸酶。

○3.1.13.5    核糖核酸酶D。

●3.1.14.-产生3’-磷酸单酯的核糖核酸外切酶。

○3.1.14.1    酵母核糖核酸酶。

●3.1.15.-产生5’-磷酸单酯的对核糖核酸或脱氧核糖核酸具有活性 的核酸外切酶。

○3.1.15.1    毒液核酸外切酶。

●3.1.16.-产生3’-磷酸单酯的对核糖核酸或脱氧核糖核酸具有活性 的核酸外切酶。

○3.1.16.1    脾核酸外切酶。

●3.1.21.-产生5’-磷酸单酯的脱氧核糖核酸内切酶。

○3.1.21.1    脱氧核糖核酸酶I。

○3.1.21.2    脱氧核糖核酸酶IV(噬菌体T(4)诱导的)。

○3.1.21.3    I型位点特异的脱氧核糖核酸酶。

○3.1.21.4    II型位点特异的脱氧核糖核酸酶。

○3.1.21.5    III型位点特异的脱氧核糖核酸酶。

○3.1.21.6    CC偏爱的脱氧核糖核酸内切酶。

○3.1.21.7    脱氧核糖核酸酶V。

●3.1.22.-不产生5’-磷酸单酯的脱氧核糖核酸内切酶。

○3.1.22.1    脱氧核糖核酸酶II。

○3.1.22.2    曲霉(Aspergillus)脱氧核糖核酸酶K(1)。

○3.1.22.3    转至登记号:3.1.21.7。

○3.1.22.4    跨结(crossover junction)脱氧核糖核酸内切

  酶。

○3.1.22.5    脱氧核糖核酸酶X。

●3.1.25.-对改变的碱基特异的位点特异性脱氧核糖核酸内切酶。

○3.1.25.1    脱氧核糖核酸酶(嘧啶二聚体)。

○3.1.25.2    转至登记号:4.2.99.18。

●3.1.26.-产生5’-磷酸单酯的核糖核酸内切酶。

○3.1.26.1    多头绒泡菌(Physarum polycephalum)核糖核

  酸酶。

○3.1.26.2    核糖核酸酶α。

○3.1.26.3    核糖核酸酶III。

○3.1.26.4    核糖核酸酶H。

○3.1.26.5    核糖核酸酶P。

○3.1.26.6    核糖核酸酶IV。

○3.1.26.7    核糖核酸酶P4。

○3.1.26.8    核糖核酸酶M5。

○3.1.26.9    核糖核酸酶(poly(U)特异的)。

○3.1.26.10   核糖核酸酶IX。

○3.1.26.11   核糖核酸酶Z。

●3.1.27.-不产生5’-磷酸单酯的核糖核酸内切酶。

○3.1.27.1    核糖核酸酶T(2)。

○3.1.27.2    枯草芽胞杆菌(Bacillus subtilis)核糖核酸酶。

○3.1.27.3    核糖核酸酶T(1)。

○3.1.27.4    核糖核酸酶U(2)。

○3.1.27.5    胰腺核糖核酸酶。

○3.1.27.6    肠杆菌(Enterbacter)核糖核酸酶。

○3.1.27.7    核糖核酸酶F。

○3.1.27.8    核糖核酸酶V。

○3.1.27.9    tRNA-内含子核酸内切酶。

○3.1.27.10   rRNA核酸内切酶。

●3.1.30.-产生5’-磷酸单酯的对核糖核酸或脱氧核糖核酸具有活性 的核糖核酸内切酶。

○3.1.30.1    曲霉核酸酶S(1)。

○3.1.30.2    粘质沙雷氏菌(Serratia marcescens)核酸酶。

●3.1.31.-产生3’-磷酸单酯的对核糖核酸或脱氧核糖核酸具有活性 的核糖核酸内切酶。

○3.1.31.1    微球菌(micrococcal)核酸酶。

所述酶最优选是核酸外切酶,例如脱氧核糖核酸酶,其切割核酸以 形成单个核苷酸。脱氧核糖核酸外切酶的优点在于其对单链和双链DNA 均有活性并以5’-3′方向或3’-5’方向水解碱基。

单个核苷酸是单核苷酸。单个核苷酸是不通过任何键例如磷酸二酯 键与另一个核苷酸或核酸结合的核苷酸。磷酸二酯键包括:核苷酸的一 个磷酸基结合于另一核苷酸的糖基。单个核苷酸通常是不以任何方式与 另一至少5、至少10、至少20、至少50、至少100、至少200、至少500、 至少1000或至少5000个核苷酸的核酸序列结合的核苷酸。

优选的用于所述方法的酶包括大肠杆菌的核酸外切酶I(SEQ ID NO:6)和嗜热栖热菌的RecJ(SEQ ID NO:8)及其变体。所述核酸外切酶优 选包含SEQ ID NO:6和8所示任一序列或其变体。SEQ ID NO:6或8的 变体是具有从SEQ ID NO:6或8变化而来但保留有其核酸操作能力的氨 基酸序列的酶。变体操作核酸的能力可使用任何本领域已知的方法测定。 例如,可对所述变体或连接有所述变体的孔测试其操作具体核酸序列的 能力。所述酶可包括有助于操作核酸和/或有助于其在高盐浓度和/或室温 下的活性的修饰。所述酶可包括有助于与所述孔或孔亚基共价结合或相 互作用的修饰。如上文所讨论的,可从所述酶中除去可及的半胱氨酸以 避免与接头的非特异性反应。或者,可将一个或多个反应性半胱氨酸引 入所述酶中——例如作为基因融合的肽接头的一部分——以有利于与所 述孔或孔亚基的结合。

变体可与SEQ ID NO:6或8不同,所述不同程度与上文讨论的SEQ  ID NO:2的变体与SEQ ID NO:2或4的不同程度相同。

SEQ ID NO:6或8的变体保留有其核酸操作活性。变体通常包含SEQ  ID NO:6或8中负责核酸操作活性的区域。SEQ ID NO:6或8的催化结 构域在上文进行了讨论。SEQ ID NO:6或8的变体优选包含相关催化结 构域。SEQ ID NO:6或8的变体通常在所述相关催化结构域之外包括一 种或多种修饰,例如置换、插入或缺失。

SEQ ID NO:6或8的优选变体在与本申请同时提交的共同待决的申 请[J A Kemp & Co Ref:N.106566;Oxford Nanolabs Ref:ONL IP 007]中 有所描述,所述申请以引用的方式纳入本文。该申请的所有教导均可同 样地适用于本发明。

能够将所述构建体推过或拉过所述孔的优选酶包括聚合酶、核酸外 切酶、解螺旋酶和拓扑异构酶例如促旋酶。所述聚合酶优选酶分类(EC) 组2.7.7.6、2.7.7.7、2.7.7.19、2.7.7.48和2.7.7.49的任一组的成员。所述 聚合酶优选是依赖DNA的DNA聚合酶、依赖RNA的DNA聚合酶、依 赖DNA的RNA聚合酶或依赖RNA的RNA聚合酶。所述解螺旋酶优选 酶分类(EC)组3.6.1.-和2.7.7.-的任一组的成员。所述解螺旋酶优选是依赖 ATP的DNA解螺旋酶(EC组3.6.1.8)、依赖ATP的RNA解螺旋酶(EC 组3.6.1.8)或不依赖ATP的RNA解螺旋酶。所述拓扑异构酶优选是酶 分类(EC)组5.99.1.2和5.99.1.3的任一组的成员。

所述酶可被显示标记物标记。所述显示标记物可为上述显示标记物 的任一种。

此酶可从产生酶的生物体例如大肠杆菌、嗜热栖热菌或噬菌体分离, 或者可通过合成或通过重组方式制备。例如,所述酶可通过上文和下文 描述的体外翻译和转录合成。所述酶可在如上所述的纯化后大规模产生。

所述酶与所述孔的共价连接

为有效测序所述构建体,重要的是确保以连续方式鉴定所述构建体 中的一部分核苷酸。所述酶的固有性质意味着所述构建体中的一部分核 苷酸影响流过所述孔的电流。

与所述孔结合的酶以这样的方式操作构建体,即使得所述构建体中 的一部分核苷酸与所述孔,优选所述孔的桶或通道,相互作用。然后基 于核苷酸在相互反应过程中影响流过所述孔的电流的不同方式来分辨核 苷酸。

所述酶的固有性质意味着所述孔以特异的方式操作构建体。例如, 每个核苷酸可以以持续的方式从所述构建体的一端被消化,或者所述构 建体可被推过或拉过所述孔。这确保所述构建体中的一部分核苷酸与所 述孔相互作用并被鉴定。在测序核酸时,信号无任何中断是重要的。此 外,所述酶和所述孔的固有性质意味着它们可一起保存,从而可产生即 用型传感器。

在一个优选实施方案中,核酸外切酶例如脱氧核糖核酸酶与所述孔 结合,使得一部分核苷酸从所述构建体释放并与所述孔的桶或通道相互 作用。在另一个优选实施方案中,能够将所述构建体推过或拉过所述孔 的酶与所述孔结合,使得将所述构建体推过或拉过所述孔的桶或通道并 且所述构建体的一部分核苷酸与所述桶或通道相互作用。在此实施方案 中,所述核苷酸可以以不止1个例如2、3或4个的团体或组与所述孔相 互作用。合适的酶包括但不限于聚合酶、核酸酶、解螺旋酶和拓扑异构 酶例如促旋酶。在每个实施方案中,均优选使所述酶在这样的位点与所 述孔结合,即所述位点与所述孔的桶或通道的开口紧密接近。更优选地, 所述酶与所述孔结合,使得所述酶的活性位点朝向所述孔的桶或通道的 开口。这意味着所述构建体的一部分核苷酸进入所述桶或通道中。优选 地,所述酶与所述孔的顺侧(cis side)结合。

所述孔与所述酶结合。所述孔可与所述酶在不止一点例如两点或三 点结合。使所述孔与所述酶在不止一点结合可用于限制所述酶的可动性。 例如,多点结合可用于限制所述酶转动的自由度或其离开所述孔或孔亚 基的能力。

当所述孔与所述酶结合时,其可以是单体形式(表达修饰后)。或 者,当所述孔与酶结合时,其可以是寡聚孔(寡聚修饰后)。

可使用任何本领域已知的方法使所述孔或孔亚基与所述酶结合。所 述孔或孔亚基和酶可分别产生,然后结合在一起。所述两种组分可以以 任意构型结合。例如,它们可通过其末端(即氨基末端或羧基末端)氨 基酸结合。合适的构型包括但不限于所述酶的氨基末端结合于所述孔或 孔亚基的羧基末端,反之亦然。或者,所述两种组分可通过它们序列内 部的氨基酸结合。例如,所述酶可结合于所述孔或孔亚基的环区的一个 或多个氨基酸。在一个优选实施方案中,所述酶的末端氨基酸结合于孔 或孔亚基的环区中的一个或多个氨基酸。末端氨基酸和环区在上文进行 了讨论。

在一个优选实施方案中,所述孔或孔亚基与所述酶基因融合。如果 整个构建体由单个多核苷酸序列表达,则孔或孔亚基与酶基因融合。所 述孔或孔亚基和酶的编码序列可以以任何方式组合以形成编码所述构建 体的单个多核苷酸序列。

所述孔或孔亚基和酶可以以任何构型基因融合。所述孔或孔亚基和 酶可以通过它们的末端氨基酸融合。例如,所述酶的氨基末端可与所述 孔或孔亚基的羧基末端融合,反之亦然。优选将所述酶的氨基酸序列同 框内添加至所述孔或孔亚基的氨基酸序列中。换言之,优选将所述酶插 入所述孔或孔亚基的序列内。在这些实施方案中,所述孔或孔亚基和酶 通常在两点上结合,即通过所述酶的氨基末端氨基酸和羧基末端氨基酸 结合。如果将所述酶插入所述孔或孔亚基的序列内,则优选使所述酶的 氨基末端氨基酸与羧基末端氨基酸紧密接近,并且使每个末端均与所述 孔或孔亚基的序列中的邻近氨基酸结合。在一个优选实施方案中,将所 述酶插入所述孔或孔亚基的环区中。在一个特别优选的实施方案中,将 所述酶插入SEQ ID NO:2的氨基酸18与19、44与45或者50与51之间。

在另一个优选实施方案中,所述孔或孔亚基与所述酶化学融合。如 果孔或孔亚基与酶化学地结合,例如通过一个接头分子结合,则这两部 分化学融合。合适的方法包括但不限于:六组氨酸标签、Ni-NTA、生物 素结合链亲和素、抗体结合抗原、伯胺偶联、GST标签结合谷胱甘肽、 MBP标签结合糊精、蛋白A结合IgG、硫醇间的反应、核酸杂交接头和 半胱氨酸键合。DNA杂交接头和半胱氨酸键合在下文更详细地讨论。所 述孔或孔亚基优选与所述酶共价结合。

所述孔必须保留其孔形成能力。所述孔的孔形成的能力通常由其α- 螺旋和β-链提供。β-桶孔包含由β-链构成的桶或通道,而α-螺旋束孔包含 由α-螺旋构成的桶或通道。α-螺旋和β-链通常通过环区连接。为避免影响 所述孔形成能力,优选使所述酶与所述孔或孔亚基的环区基因融合,或 插入所述孔或孔亚基的环区中。具体亚基的环区在下文更详细地讨论。 在一个优选实施方案中,酶与SEQ ID NO:2的氨基酸8、9、17、18、19、 44、45、50和51中的一个或多个结合。

类似地,所述构建体保留有所述酶的核酸操作能力,所述能力通常 也是由其二级结构元件(α-螺旋和β-链)和三级结构元件提供。为避免不 利地影响所述酶的核酸操作能力,优选使所述酶与所述孔或孔亚基基因 融合,或经不影响其二级或三级结构的残基或区域插入所述孔或孔亚基 中。

所述孔或孔亚基可与所述酶直接结合。优选使用一个或多个例如两 个或三个接头使所述孔或孔亚基与所述酶结合。可设计一个或多个接头 以限制所述酶的可动性。所述接头可与所述孔、孔亚基和/或酶中的一个 或多个反应性半胱氨酸残基、反应性赖氨酸残基或非天然氨基酸结合。 合适的接头是本领域公知的。合适的接头包括但不限于化学交联剂和肽 接头。优选的接头是氨基酸序列(即肽接头)或核酸杂交接头。通常对 所述肽接头或核酸杂交接头的长度、柔性和亲水性进行设计使其不干扰 所述孔或孔亚基和酶的功能。优选的柔性肽接头为2-20个例如4、6、8、 10或16个丝氨酸和/或甘氨酸的氨基酸片段。更优选的柔性接头包括 (SG)1、(SG)2、(SG)3、(SG)4、(SG)5和(SG)8,其中S为丝氨酸,G为甘氨 酸。优选的刚性接头为2-30个例如4、6、8、16或24个脯氨酸的氨基酸 片段。更优选的刚性接头包括(P)12,其中P为脯氨酸。

所述核酸杂交接头可包含上文讨论的任何核酸。例如,其可包含脱 氧核糖核酸(DNA)、核糖核酸(RNA)或本领域已知的任何合成核酸,如肽 核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或其他具 有核苷酸侧链的合成聚合物。还可对所述接头修饰,从而使它们一旦杂 交就相互反应。或者,一旦所述接头相互杂交,可使用试剂来交联所述 接头。

优选的核酸杂交接头对应于SEQ ID NO:10的5’末端的前15、25 或35个核苷酸。所述接头优选还在3’末端具有TT以提供额外的柔性。 在3’末端,所述接头具有使得所述接头可与所述核酸结合蛋白或表面结 合的基团,例如马来酰亚胺。马来酰亚胺修饰的寡核苷酸可从例如 ATDBio购得。更优选的接头示于SEQ ID NO:11、12和13。互补接头示 于SEQ ID NO:14、15和16。SEQ ID NO:11、12或13可与所述核酸结 合蛋白和表面之一结合,所述互补接头(分别是SEQ ID NO:14、15或 16)与另一核酸结合蛋白和表面结合。然后所述核酸结合蛋白和表面可 通过所述接头的杂交而结合在一起。

其他优选的化学交联剂示于下表3。

表3某些优选的接头

接头可先与所述孔或孔亚基结合再与所述酶结合,先与所述酶结合 再与所述孔或孔亚基结合,或者与所述酶和所述孔或孔亚基同时结合。 当所述接头与所述孔或孔亚基结合时,其可为单体亚基、两个或多个单 体的寡聚体的一部分或完整寡聚孔的一部分。所述接头优选在除去任何 未结合接头的任何纯化步骤之前反应。

一种使所述孔或孔亚基与所述酶结合的优选方法是通过半胱氨酸键 合。这可通过双官能化学接头或通过末端具有半胱氨酸残基的多肽接头 介导。α-HL(SEQ ID NO:2)缺少天然半胱氨酸残基,因此将半胱氨酸引 入到SEQ ID NO:2的序列中可实现所述酶与所述亚基受控的共价结合。 可在SEQ ID NO:2的多个位置,例如位置K8、T9或N17或在SEQ ID  NO:2的羧基末端引入半胱氨酸。可对任何双官能接头的长度、反应性、 特异性、刚性和溶解度进行设计以确保所述酶相对所述亚基的位置正确, 并且所述亚基和所述酶两者的功能均被保持。合适的接头包括双马来酰 亚胺交联剂,例如1,4-双(马来酰亚胺)丁烷(BMB)或双(马来酰亚胺) 己烷。双官能交联剂的一个缺点是需要酶不含其他表面可及的半胱氨酸 残基,因为所述双官能接头与这些残基的结合不可控制并可影响底物结 合或活性。如果所述酶含有数个可及的半胱氨酸残基,那么可能需要对 所述酶进行修饰以除去这些残基,同时确保所述修饰不影响所述酶的折 叠或活性。在一个优选实施方案中,与所述酶基因结合的肽接头上存在 反应性半胱氨酸。这意味着不必需要其他修饰来从所述酶除去其他可及 的半胱氨酸残基。半胱氨酸残基的反应性可通过例如在肽接头上修饰邻 近残基进行增强。例如,侧翼精氨酸、组氨酸或赖氨酸残基的碱性基团 会将半胱氨酸硫醇基团的pKa改变为更大反应性的S-基团的pKa。半胱 氨酸残基的反应性可被巯基保护基团例如dTNB所保护。这些保护基团 可在接头结合之前与所述酶或者孔或孔亚基(作为单体或寡聚体的一部 分)的一个或多个半胱氨酸残基反应。

孔、孔亚基或酶与它们自身的交联可通过保持接头的浓度远过量于 所述孔、孔亚基和/或酶而防止。或者,可使用“锁匙”配置,其中使用 了两种接头。例如,可使用链接化学(click chemistry)例如叠氮炔Huisgen 环加成,以确保所述孔或孔亚基只与所述酶结合而不与自身结合,反之 亦然。在一个优选实施方案中,使用示于上表3的氮化物-PEG-马来酰亚 胺和炔-PEG-马来酰亚胺接头。一个连接所述孔或孔亚基,另一个连接所 述酶。这确保了结合只在所述孔或孔亚基与所述酶之间发生。

每个接头只有一个末端可一起反应以形成更长的接头并且所述接头 的另一末端各自与所述构建体(即亚基或单体)的不同部分反应。

选择共价结合的位点,使得所述酶以这样的方式操作构建体,所述 方式即所述构建体中的一部分核苷酸与所述孔相互作用。然后,基于核 苷酸在相互作用过程中影响流过所述孔的电流的不同方式来分辨核苷 酸。

优选使所述酶与所述孔或孔亚基的一部分结合,所述部分形成包含 所述构建体的孔的顺侧部分。在电生理学中,所述顺侧常规为接地侧。 如果溶血素孔被正确插入电生理学装置中,那么帽区(Cap region)在所述 顺侧上。公知的是,在正电势下,核苷酸会从用于随机传感的孔的顺侧 迁移向反侧(trans side)。将所述酶置于孔的顺侧使其操作所述构建体,使 得所述序列中的一部分核苷酸进入所述孔的桶或通道并与其相互作用。 优选地,所述序列中至少20%、至少40%、至少50%、至少80%或至少 90%的核苷酸进入所述孔的桶或通道并与其相互作用。

优选地,选择共价结合的位点和方法,使得所述酶的可动性受限。 这可帮助确保所述酶以这样的方式操作所述构建体,所述方式即所述构 建体中的一部分核苷酸与所述孔相互作用。例如,限制所述酶移动的能 力意味着所述酶的活性位点可永远朝向所述孔或孔亚基的这样的一部 分,即所述部分形成所述孔的桶或通道的开口的一部分。所述酶的可动 性可通过增加所述酶与所述孔或孔亚基结合的点的数量和/或使用特定接 头而加以限制。

分子衔接体

在某些实施方案中,所述孔包含有助于所述孔与所述核苷酸或所述 构建体之间的相互作用的分子衔接体。所述衔接体的存在可改善所述孔 与核苷酸的主客体化学(host-guest chemistry),所述核苷酸是从所述构 建体释放的或在所述构建体中存在的。主客体化学的原理为本领域所公 知。所述衔接体对所述孔的物理或化学性质具有提高所述孔与核苷酸相 互作用的效应。所述衔接体通常改变所述孔的桶或通道的电荷;或特异 地与核苷酸相互作用或结合,从而有利于所述核苷酸与所述孔的相互作 用。

所述衔接体介导核苷酸与所述孔之间的相互作用,所述核苷酸是从 所述构建体释放的或在所述构建体中存在的。优选地,所述核苷酸通过 所述衔接体可逆地结合于所述孔,或通过与所述衔接体一起可逆地结合 于所述孔。最优选地,所述核苷酸在穿过跨膜的孔时,通过所述衔接体 可逆地结合于所述孔,或通过与所述衔接体一起可逆地结合于所述孔。 所述核苷酸还可在穿过跨膜的孔时,通过所述衔接体可逆地结合于所述 孔的桶或通道,或通过与所述衔接体一起可逆地结合于所述孔的桶状体 或通道。所述衔接体优选使所述桶或通道紧缩,从而其可以与所述核苷 酸相互作用。

所述衔接体通常为环状。优选地,所述衔接体具有与所述孔相同的 对称性。如果所述孔为七聚体(例如具有为跨膜β桶提供14条链的环绕 中心轴的七个亚基),那么通常使用具有七次对称性(seven-fold  symmetry)的衔接体。同样地,如果所述孔为六聚体(例如具有为跨膜 β桶提供12条链的环绕中心轴的六个亚基,或者为12-链β桶),那么 通常使用具有六次对称性的衔接体。可使用有助于所述孔与所述核苷酸 之间相互作用的任何衔接体。合适的衔接体包括但不限于环糊精、环肽 和葫芦脲。所述衔接体优选环糊精或其衍生物。所述衔接体更优选七-6- 氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-βCD)或 七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。下表4示出了孔与衔接体的优选 组合。

表4-孔与衔接体的合适组合

优选地,所述衔接体与所述孔共价结合。可使用本领域已知的任何 方法使所述衔接体与所述孔共价结合。所述衔接体可与所述孔直接结合。 优选地,使用双官能交联剂使所述衔接体与所述孔结合。合适的交联剂 为本领域所公知。优选的交联剂包括2,5-二氧吡咯烷-1-基3-(吡啶-2-基二 硫烷基)丙酸酯(2,5-dioxopyrrolidin-1-yl 3-(pyridine-2-yldisulfanyl)propanoate)、2,5-二氧吡咯烷-1-基4-(吡啶-2- 基二硫烷基)丁酸酯和2,5-二氧吡咯烷-1-基8-(吡啶-2-基二硫烷基)辛酸 酯。最优选的交联剂是琥珀酰亚胺基3-(2-吡啶基二硫基)丙酸酯(SPDP)。 通常,所述衔接体先与所述双官能交联剂共价结合,然后所述衔接体/交 联剂复合物再与所述孔共价结合;但也有可能所述双官能交联剂先与所 述孔共价结合,然后所述双官能交联剂/孔复合物再与所述衔接体结合。

选择共价结合的位点,使得所述衔接体有助于核苷酸(其是从构建 体释放的或在构建体中存在的)与所述孔相互作用并籍此使得可检测核 苷酸。对于基于α-HL的孔,可使用对SEQ ID NO:2的特定修饰来帮助 所述衔接体在所述孔的桶或通道内的正确取向以及衔接体与所述孔的共 价结合。具体地,所述孔的每个亚基优选在SEQ ID NO:2的139位上具 有谷氨酰胺。所述孔的一个或多个亚基可在SEQ ID NO:2的113位上具 有精氨酸。所述孔的一个或多个亚基可在SEQ ID NO:2的119、121或 135位上具有半胱氨酸。

所述孔与核苷酸之间的相互作用

所述方法可使用任何合适的膜/孔体系进行,在所述膜/孔体系中使结 合有核酸操作酶例如核酸外切酶的孔插入膜中。所述方法通常使用以下 物质进行:(i)包含结合有核酸操作酶例如核酸外切酶的孔的人工膜,(ii) 包含结合有核酸操作酶例如核酸外切酶的孔的分离的天然膜,或者(iii)表 达结合有核酸操作酶例如核酸外切酶的孔的细胞。所述方法优选使用人 工膜进行。除修饰的孔之外,所述膜还可包含其他跨膜蛋白和/或膜内蛋 白以及其他分子。

所述膜形成离子流、核苷酸和核酸的障碍物。所述膜优选是脂质双 层。适合依照本发明使用的脂质双层可使用本领域已知的方法制备。例 如,脂质双层膜可使用Montal和Mueller(1972)的方法形成。脂质双层 还可使用国际专利申请PCT/GB08/000563和PCT/GB07/002856描述的方 法形成。

本发明的方法可使用由任何膜脂质构成的脂质双层进行,所述膜脂 质包括但不限于磷脂、糖脂、胆固醇及其混合物。可使用国际专利申请 PCT/GB08/000563中描述的任一种脂质。

使孔插入膜例如脂质双层的方法为本领域所知。这些方法中的一些 在上文进行了讨论。

可以将所述核苷酸或构建体在所述膜的任一侧与所述孔接触。可以 将所述核苷酸或构建体在所述膜的任一侧引入所述孔。所述核苷酸或构 建体通常与所述膜的一侧(其中所述酶与所述孔在该侧结合)接触。这 使得所述酶可在所述方法的过程中操作所述构建体。

所述构建体的一部分核苷酸在通过所述孔的桶或通道穿过所述膜时 与所述孔和/或衔接体相互作用。或者,如果所述构建体为核酸外切酶所 消化,那么核苷酸可经由所述衔接体或者以与所述衔接体一起的方式与 所述孔相互作用,从所述孔解离下来并且仍留在所述膜的同一侧上。所 述方法可包括使用其中所述衔接体的取向被固定的孔。在这些实施方案 中,优选使所述核苷酸与所述孔中所述衔接体所朝向的末端接触。最优 选地,所述核苷酸与所述孔中与所述核苷酸相互作用的衔接体的一部分 所朝向的末端接触。

所述核苷酸可以以任何方式并在任何位点与所述孔相互作用。如上 文所讨论的,所述核苷酸优选通过所述衔接体可逆地结合于所述孔,或 者通过与所述衔接体一起可逆地结合于所述孔。最优选地,当所述核苷 酸在穿过跨膜的孔时,它们通过所述衔接体可逆地结合于所述孔,或者 通过与所述衔接体一起可逆地结合于所述孔。当所述核苷酸穿过跨膜的 孔时,它们还可通过所述衔接体可逆地结合于所述孔的桶或通道,或者 通过与所述衔接体一起可逆地结合于所述孔的桶状体或通道。

在核苷酸和所述孔之间发生相互作用过程中,所述核苷酸以对该核 苷酸特异的方式影响流过所述孔的电流。例如,某种具体核苷酸将降低 流经所述孔的电流,这一降低持续某一具体的平均时长并且达到某一具 体的程度。换言之,流过所述孔的电流对于具体核苷酸而言是特征性的。 可进行对照实验,以确定具体核苷酸对流过所述孔的电流的效应。然后, 可以将对测试样品实施本发明的方法所获得的结果与来自这类对照实验 的结果进行比较,以鉴定具体的核苷酸。

装置

所述方法可使用适合用于研究膜/孔体系的任何装置进行,在所述膜/ 孔体系中结合有核酸操作酶的孔插入膜中。所述方法可使用任何适合用 于随机传感的装置进行。例如,所述装置包含装有水溶液的槽和将所述 槽分隔成两区室的隔离物。所述隔离物具有其中形成有包含上述孔的膜 的孔隙。通过将核酸引入至所述槽中,可以使所述核苷酸或构建体与所 述孔相接触。可以将所述核酸引入至所述槽的两个区室的任一个中,但 优选引入所述槽的含有酶的区室中。

所述方法可使用国际专利申请PCT/GB08/000562中记载的装置进 行。

所述方法包括测量在与所述核苷酸的相互作用过程中通过所述孔的 电流。因此,所述装置还包含能够施加电势并测量通过所述膜和孔的电 信号的电路。所述方法可使用膜片钳或电压钳进行。所述方法优选包括 使用电压钳。

条件

本发明的方法包括测量在与构建体中的核苷酸的相互作用过程中通 过所述孔的电流。合适于测量通过跨膜孔的离子电流的条件为本领域所 知并公开于实施例中。所述方法通过跨所述膜和孔施加的电压进行。所 用的电压通常为-400mV至+400mV。所用的电压优选是在具有选自-400 mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV 的下限以及独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、 +200mV、+300mV和+400mV的上限的区间内。所用的电压更优选在 120mV至170mV的区间内。通过改变施加电势,可以加强本发明的孔对 不同核苷酸的分辨。

所述方法可在可在存在任何碱金属氯盐(alkali metal chloride)的条 件下进行。在上文讨论的示例性装置中,所述盐存在于所述槽的水溶液 中。通常使用氯化钾(KCl)、氯化钠(NaCl)或氯化铯(CsCl)。优选KCl。 所述盐的浓度通常是0.1-2.5M、0.3-1.9M、0.5-1.8M、0.7-1.7M、0.9- 1.6M或1M-1.4M。高的盐浓度提供高的信噪比,使得电流可以在正常 的电流波动背景的基础上指示待鉴定核苷酸的存在情况。然而,可能必 须使用更低的盐浓度,使得所述酶能够工作。

所述方法通常在缓冲物的存在下进行。在上文讨论的示例性装置中, 所述缓冲物存在于所述槽的水溶液中。任何缓冲物均可用于所述方法。 一种合适的缓冲物为Tris-HCl缓冲液。所述方法通常在4.0-10.0、4.5-9.5、 5.0-9.0、5.5-8.8、6.0-8.7、7.0-8.8或7.5-8.5的pH下进行。所用的pH优 选约7.5。

所述方法通常在0℃-100℃、15℃-95℃、16℃-90℃、17℃-85℃、 18℃-80℃、19℃-70℃或20℃-60℃下进行。所述方法可在室温下进行。 所述方法优选在支持酶功能的温度下进行,例如约37℃。如果升高温度, 那么可以在低盐浓度下达到良好的核苷酸分辨。然而,更低的温度特别 是低于室温的温度导致更长的停留时间,因此可用于获得更高程度的准 确性。

除了升高所述溶液温度外,还有许多其他策略可以用于以增加所述 溶液的电导,并保持适合于酶活性的条件。一种这类策略是使用脂质双 层以将两种不同浓度的盐溶液分开:在酶侧是低盐浓度的盐,在对侧是 较高浓度的盐。该方法的一个实例是在所述膜顺侧使用200mM的KCl 和在反侧槽(trans chamber)中使用500mM KCl。在这些条件下,通过 所述孔的电导预计大致相当于在正常条件下的400mM KCl,并且如果将 所述酶放置于所述顺侧,则它仅处于200mM中。使用不对称盐条件的 另一可能的益处是跨过所述孔引起的渗透梯度。这种水的净流动可用于 将核苷酸牵拉进入所述孔以进行检测。使用中性渗透物例如蔗糖、甘油 或PEG可以达到类似效应。另一可能的方法是使用KCl水平相对低的溶 液,并依赖于对酶活性破坏较小的其他带电物质。

基于核酸外切酶的方法

在一个实施方案中,所述测序方法包括使所述构建体与结合有核酸 外切酶例如脱氧核糖核酸酶的孔接触。上文讨论的核酸外切酶的任一种 均可用于所述方法。所述核酸外切酶从所述构建体的一个末端释放单个 核苷酸。核酸外切酶是这样的酶,即通常抓附于核酸序列的一个末端, 并从该端以每次一个核苷酸的方式消化所述序列。所述核酸外切酶可以 以5’-3’方向或3’-5’方向消化所述核酸。所述核酸外切酶结合的所述核酸 的末端通常通过选择所用的酶和/或使用本领域已知的方法来确定。在所 述核酸序列任一末端的羟基基团或帽结构通常可用于阻碍或促进所述核 酸外切酶与所述核酸序列的具体末端的结合。

所述方法包括使所述构建体与所述核酸外切酶接触,从而使所述核 苷酸以这样的速率从所述构建体的末端被消化,即使得可如上文所讨论 的鉴定一部分核苷酸。这样做的方法为本领域所公知。例如,爱德曼 (Edman)降解法用于从多肽末端连续消化单个氨基酸,使得它们可以 使用高效液相色谱(HPLC)来进行鉴定。本发明可使用类似的方法。

可通过相对于野生型酶的突变改变所述核酸外切酶的速率。所述核 酸外切酶在测序方法中的合适的活性速率是每秒消化0.5-1000个核苷酸、 每秒0.6-500个核苷酸、每秒0.7-200个核苷酸、每秒0.8-100个核苷酸、 每秒0.9-50个核苷酸或每秒1-20或10个核苷酸。所述速率优选每秒1、 10、100、500或1000个核苷酸。合适的核酸外切酶活性速率可以以多种 方式实现。例如,本发明可使用最适活性速率降低或升高的变体核酸外 切酶。

将DNA推过或拉过所述孔

链测序包括使核酸聚合物受控地和逐步地移位(translocation)通过 孔。大部分DNA操作酶均适用于此用途,只要它们可水解、聚合或加工 单链DNA或RNA。优选的酶为聚合酶、核酸酶、解螺旋酶和拓扑异构 酶例如促旋酶。所述酶部分不需要如单个核苷酸测序那样紧密地位于接 近所述孔腔的位置,因为核苷酸到达所述孔的传感部分的顺序不可能被 打乱。

单链DNA测序的两种方法是使DNA顺着或逆着施加电势从顺侧到 反侧以及从反侧到顺侧移位通过纳米孔。链测序的最有利的机制是以施 加电势使单链DNA受控地移位通过所述纳米孔。前进性或持续地作用于 双链DNA的核酸外切酶可用在所述孔的顺侧以使剩余单链在施加电势下 被送入,或者在反向电势下用于反侧。同样,解链双链DNA的解螺旋酶 也可以以类似的方式使用。对于需要链逆着施加电势移位的测序应用也 可以使用,但所述酶必须首先在反向电势下或在没有电势的条件下“捕 获住”DNA。通过在结合后随后切换回来的电势,所述链可由顺侧到反 侧通过所述孔并处于被电流保持的延伸构型。所述单链DNA核酸外切酶 或依赖单链DNA的聚合酶可用作分子马达,逆着施加电压从反侧到顺侧, 以受控的逐步方式将最近移位的单链向后拉过所述孔。

下面的实施例对本发明进行举例说明:

1实施例

1.1测序模板的产生

所需模板通过将人工发夹衔接体(在本文件中称为“I型衔接体”和 “II型衔接体”)连接至双链(dsDNA)模板片段的平端产生。所述衔接体 是人工的化学合成DNA序列,其被设计以有助于所需单链测序模板的构 建、纯化和最终释放。作为人工序列,这些衔接体在其真实序列中具有 很大程度的灵活性,因此可将功能性构建在所用的序列中。

1.2I型衔接体

将所述I型衔接体(图1)合成为单链DNA(ssDNA)寡核苷酸,其中 5’末端核苷酸与3’末端核苷酸互补,使得在合适的条件下发生分子内 杂交,产生具有dsDNA区和ssDNA“泡”区的DNA平端“发夹环”。 所述双链杂交区终止于(例如)代表“稀有切割”限制性核酸内切酶的 半个识别序列的碱基序列。所述“泡”区是可提供可杂交“钩”的单链 序列,所述“钩”用于将所述结构和任何含有所述结构的连接产物捕获 到配有互补ssDNA序列的支撑表面或珠上。所述“泡”区还可含有这样 的序列,即其将具体I型衔接体从另一种其他部分相同的I型衔接体中鉴 定出来,并因此实现对从来自不同个体的模板DNA获得的连接产物的多 重分析。

1.3II型衔接体

II型衔接体(图2)在总体结构上与I型衔接体不同,是长的寡核苷 酸的分子内杂交的产物。形成的结构具有末端,其也具有存在于I型衔接 体发夹末端的半个回文稀有切割限制性内切酶识别序列。此外,II型衔 接体的双链区含有不同的稀有切割限制性核酸内切酶的识别序列(图2 中的2ry)。所述衔接体还可含有可用于鉴定所述衔接体的序列,所述序 列位于具有半个回文稀有切割限制性内切酶识别序列(图2中的1ry)的 末端与所述不同稀有切割限制性核酸内切酶的识别序列(图2中的2ry) 之间。II型衔接体的单链DNA的泡区可显著小于I型衔接体的泡区,因 为尽管其也包含可选择的标志物,然而它是[生物素-dT]的形式,这能够 将含有II型衔接体的任何连接产物捕获到固定有链亲和素的表面上。

1.4基因组模板

可以以多种方式从大分子量的基因组模板制备测序模板。一种已建 立的方法是随机片段化和将被剪切的DNA末端修复为平端;这是被接受 且可靠的方法,并且所提出的模板产生方案假定这将是选择的方法。然 而,经过改变,所述的技术可被改进以适合产生其他末端(包括“粘性” 末端)的其他片段化方法。

1.5衔接体与随机片段化并末端修复的模板DNA的连接

被剪切的DNA的片段在两条链都具有5’PO4和3’OH。所述模 板的脱磷酸会防止所述模板片段的多联化,但会存在随后必须修复在连 接5’磷酸化衔接体时留下的缺口的挑战。使用过量浓度的衔接体与磷酸 化模板DNA将限制模板:模板连接的可能性,但意味着会形成大量不含 插入模板的连接产物(图3和图4)。

I型、II型衔接体和平端模板的组合会产生多种不同的连接产物:

●衔接体-衔接体产物

○I型-I型不会结合于抗生物素蛋白并将在任何RE处理前除 去。

○I型-II型会结合于链亲和素,但将被第一RE消化所降解。

○II型-I型会结合于链亲和素,但将被第一RE消化所降解。

○II型-II型会结合于链亲和素,并可交联链亲和素支撑珠, 但将被第一RE消化所降解。

●衔接体-dsDNA模板-衔接体产物

○I型-dsDNA模板-I型不会结合于链亲和素,但将在任何 RE处理前除去。

○I型-dsDNA模板-II型会结合于链亲和素,会在第一RE消 化后还存在,并将在第二RE消化时释放所需产物。

○II型-dsDNA模板-I型会结合于链亲和素,会在第一RE消 化后还存在,并将在第二RE消化时释放所需产物。

○II型-dsDNA模板-II型会结合于链亲和素,并可交联链亲 和素支撑珠,会在第一RE消化后还存在,但将在第二RE 消化时释放“单链”模板产物(非共价连接的)。

1.6所需测序模板的分离

图5示出了一种用于流水线纯化所需单链产物的方法。连接反应后, 所有纳入II型衔接体的哑铃结构(借助于II型衔接体上携带的生物素部 分)都被捕获在固定有链亲和素的表面,并且任何只含有I型衔接体的结 构均不结合并可被洗去。第一限制性核酸内切酶对结合的II型衔接体结 构的处理会切割通过连接两个衔接体形成的没有任何介于其间的模板 DNA的结合产物。然后可洗去所有释放的片段,而所需的产物仍结合于 所述板。第二限制性内切酶的应用会在捕获的II型衔接体序列内切割结 合的片段,不管所述连接的产物只具有一个II型衔接体还是在两末端都 具有II型衔接体。所述释放产物要么是所需的共价闭合结构(所有释放 结构的2/3将是此形式),要么是来源于II型:模板:II型连接产物的 线性化序列(释放产物的1/3将是此形式)。所需共价闭合结构的非闭合 末端将来源于II型衔接体并可含有可用于鉴定该衔接体的序列。

将这些释放的序列转移到新板上,在所述新板上与I型“泡”的序列 互补的单链DNA序列将使得可仅捕获来源于I型:模板:II型连接产物 的DNA物质。洗涤将除去任何其他DNA片段并只留下所需的共价闭合 I型:模板:II型剩余物质,然后其可从所述板释放(加热、碱洗)并被 变性以备核酸外切酶测序。

上述纯化方案的吸引力是可自动化,并只产生一种类型的产物:这 是测序反应需要的。这种产物可通过简单碱洗从固定有抗-I型衔接体的 泡的板释放,随后变性的模板DNA(图6)可在存在例如含有大肠杆菌 单链结合蛋白的缓冲溶液的情况下中和,所述蛋白在结合于所述变性的 ssDNA时会保持所述ssDNA的单链形式——这是保持大肠杆菌核酸外切 酶I的可加工性的必备条件。

1.7所需测序模板的核酸外切酶测序

当产生所需结构时,其将适合进行核酸外切酶测序,所述核酸外切 酶结合于并消化所述单链的3’末端。释放的5’单磷酸核苷将在所述孔 中被鉴定并会产生(理想情况下)依次对应于以下部分的碱基序列(图7):

序列开始:II型衔接体剩余部分的序列,其可能含有可用于鉴定所 述衔接体的序列。

基因组序列:模板DNA的序列(在正义链上)。

I型共有序列:I型衔接体的序列(其也是所述“捕获”序列)。

I型鉴定序列:用于在多重测序反应中特异性鉴定连接产物的I型衔 接体序列。

对比基因组序列:模板DNA的序列(在反义链上,因此正义链序列 的反向互补序列已经产生)。

序列结束:II型衔接体剩余部分的序列(作为被测序的前几个碱基 的反向互补序列),其可能含有可用于鉴定所述衔接体的序列。

序列表

SEQ ID NO:1

   1 ATGGCAGATT CTGATATTAA TATTAAAACC GGTACTACAG ATATTGGAAG CAATACTACA GTAAAAACAG

  71 GTGATTTAGT CACTTATGAT AAAGAAAATG GCATGCACAA AAAAGTATTT TATAGTTTTA TCGATGATAA

 141 AAATCACAAT AAAAAACTGC TAGTTATTAG AACAAAAGGT ACCATTGCTG GTCAATATAG AGTTTATAGC

 211 GAAGAAGGTG CTAACAAAAG TGGTTTAGCC TGGCCTTCAG CCTTTAAGGT ACAGTTGCAA CTACCTGATA

 281 ATGAAGTAGC TCAAATATCT GATTACTATC CAAGAAATTC GATTGATACA AAAGAGTATA TGAGTACTTT

 351 AACTTATGGA TTCAACGGTA ATGTTACTGG TGATGATACA GGAAAAATTG GCGGCCTTAT TGGTGCAAAT

 421 GTTTCGATTG GTCATACACT GAAATATGTT CAACCTGATT TCAAAACAAT TTTAGAGAGC CCAACTGATA

 491 AAAAAGTAGG CTGGAAAGTG ATATTTAACA ATATGGTGAA TCAAAATTGG GGACCATACG ATCGAGATTC

 561 TTGGAACCCG GTATATGGCA ATCAACTTTT CATGAAAACT AGAAATGGTT CTATGAAAGC AGCAGATAAC

 631 TTCCTTGATC CTAACAAAGC AAGTTCTCTA TTATCTTCAG GGTTTTCACC AGACTTCGCT ACAGTTATTA

 701 CTATGGATAG AAAAGCATCC AAACAACAAA CAAATATAGA TGTAATATAC GAACGAGTTC GTGATGATTA

 771 CCAATTGCAT TGGACTTCAA CAAATTGGAA AGGTACCAAT ACTAAAGATA AATGGACAGA TCGTTCTTCA

 841 GAAAGATATA AAATCGATTG GGAAAAAGAA GAAATGACAA AT

SEQ ID NO:2

   1 ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK KLLVIRTKGT IAGQYRVYSE

  71 EGANKSGLAW PSAFKVQLQL PDNEVAQISD YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV

 141 SIGHTLKYVQ PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR NGSMKAADNF

 211 LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE

  281 RYKIDWEKEE MTN

SEQ ID NO:3

   1 ATGGCAGATT CTGATATTAA TATTAAAACC GGTACTACAG ATATTGGAAG CAATACTACA GTAAAAACAG

  71 GTGATTTAGT CACTTATGAT AAAGAAAATG GCATGCACAA AAAAGTATTT TATAGTTTTA TCGATGATAA

 141 AAATCACAAT AAAAAACTGC TAGTTATTAG AACAAAAGGT ACCATTGCTG GTCAATATAG AGTTTATAGC

 211 GAAGAAGGTG CTAACAAAAG TGGTTTAGCC TGGCCTTCAG CCTTTAAGGT ACAGTTGCAA CTACCTGATA

 281 ATGAAGTAGC TCAAATATCT GATTACTATC CAAGAAATTC GATTGATACA AAAGAGTATA GGAGTACTTT

 351 AACTTATGGA TTCAACGGTA ATGTTACTGG TGATGATACA GGAAAAATTG GCGGCCTTAT TGGTGCACAA

 421 GTTTCGATTG GTCATACACT GAAATATGTT CAACCTGATT TCAAAACAAT TTTAGAGAGC CCAACTGATA

 491 AAAAAGTAGG CTGGAAAGTG ATATTTAACA ATATGGTGAA TCAAAATTGG GGACCATACG ATCGAGATTC

 561 TTGGAACCCG GTATATGGCA ATCAACTTTT CATGAAAACT AGAAATGGTT CTATGAAAGC AGCAGATAAC

 631 TTCCTTGATC CTAACAAAGC AAGTTCTCTA TTATCTTCAG GGTTTTCACC AGACTTCGCT ACAGTTATTA

 701 CTATGGATAG AAAAGCATCC AAACAACAAA CAAATATAGA TGTAATATAC GAACGAGTTC GTGATGATTA

 771 CCAATTGCAT TGGACTTCAA CAAATTGGAA AGGTACCAAT ACTAAAGATA AATGGACAGA TCGTTCTTCA

 841 GAAAGATATA AAATCGATTG GGAAAAAGAA GAAATGACAA AT

SEQ ID NO:4

   1 ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK KLLVIRTKGT IAGQYRVYSE

  71 EGANKSGLAW PSAFKVQLQL PDNEVAQISD YYPRNSIDTK EYRSTLTYGF NGNVTGDDTG KIGGLIGAQV

 141 SIGHTLKYVQ PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR NGSNKAADNF

 211 LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE

 281 RYKIDWEKEE MTN

SEQ ID NO:5

   1 ATGATGAATG ACGGTAAGCA ACAATCTACC TTTTTGTTTC ACGATTACGA AACCTTTGGC ACGCACCCCG

  71 CGTTAGATCG CCCTGCACAG TTCGCAGCCA TTCGCACCGA TAGCGAATTC AATGTCATCG GCGAACCCGA

 141 AGTCTTTTAC TGCAAGCCCG CTGATGACTA TTTACCCCAG CCAGGAGCCG TATTAATTAC CGGTATTACC

 211 CCGCAGGAAG CACGGGCGAA AGGAGAAAAC GAAGCCGCGT TTGCCGCCCG TATTCACTCG CTTTTTACCG

 281 TACCGAAGAC CTGTATTCTG GGCTACAACA ATGTGCGTTT CGACGACGAA GTCACACGCA ACATTTTTTA

 351 TCGTAATTTC TACGATCCTT ACGCCTGGAG CTGGCAGCAT GATAACTCGC GCTGGGATTT ACTGGATGTT

 421 ATGCGTGCCT GTTATGCCCT GCGCCCGGAA GGAATAAACT GGCCTGAAAA TGATGACGGT CTACCGAGCT

 491 TTCGCCTTGA GCATTTAACC AAAGCGAATG GTATTGAACA TAGCAACGCC CACGATGCGA TGGCTGATGT

 561 GTACGCCACT ATTGCGATGG CAAAGCTGGT AAAAACGCGT CAGCCACGCC TGTTTGATTA TCTCTTTACC

 631 CATCGTAATA AACACAAACT GATGGCGTTG ATTGATGTTC CGCAGATGAA ACCCCTGGTG CACGTTTCCG

 701 GAATGTTTGG AGCATGGCGC GGCAATACCA GCTGGGTGGC ACCGCTGGCG TGGCATCCTG AAAATCGCAA

 771 TGCCGTAATT ATGGTGGATT TGGCAGGAGA CATTTCGCCA TTACTGGAAC TGGATAGCGA CACATTGCGC

 841 GAGCGTTTAT ATACCGCAAA AACCGATCTT GGCGATAACG CCGCCGTTCC GGTTAAGCTG GTGCATATCA

 911 ATAAATGTCC GGTGCTGGCC CAGGCGAATA CGCTACGCCC GGAAGATGCC GACCGACTGG GAATTAATCG

 981 TCAGCATTGC CTCGATAACC TGAAAATTCT GCGTGAAAAT CCGCAAGTGC GCGAAAAAGT GGTGGCGATA

1051 TTCGCGGAAG CCGAACCGTT TACGCCTTCA GATAACGTGG ATGCACAGCT TTATAACGGC TTTTTCAGTG

1121 ACGCAGATCG TGCAGCAATG AAAATTGTGC TGGAAACCGA GCCGCGTAAT TTACCGGCAC TGGATATCAC

1191 TTTTGTTGAT AAACGGATTG AAAAGCTGTT GTTCAATTAT CGGGCACGCA ACTTCCCGGG GACGCTGGAT

1261 TATGCCGAGC AGCAACGCTG GCTGGAGCAC CGTCGCCAGG TCTTCACGCC AGAGTTTTTG CAGGGTTATG

1331 CTGATGAATT GCAGATGCTG GTACAACAAT ATGCCGATGA CAAAGAGAAA GTGGCGCTGT TAAAAGCACT

1401 TTGGCAGTAC GCGGAAGAGA TTGTC

SEQ ID NO:6

   1 MMNDGKQQST FLFHDYETFG THPALDRPAQ FAAIRTDSEF NVIGEPEVFY CKPADDYLPQ PGAVLITGIT

  71 PQEARAKGEN EAAFAARIHS LFTVPKTCIL GYNNVRFDDE VTRNIFYRNF YDPYAWSWQH DNSRWDLLDV

 141 MRACYALRPE GINWPENDDG LPSFRLEHLT KANGIEHSNA HDAMADVYAT IAMAKLVKTR QPRLFDYLFT

 211 HRNKHKLMAL IDVPQMKPLV HVSGMFGAWR GNTSWVAPLA WHPENRNAVI MVDLAGDISP LLELDSDTLR

 281 ERLYTAKTDL GDNAAVPVKL VHINKCPVLA QANTLRPEDA DRLGINRQHC LDNLKILREN PQVREKVVAI

 351 FAEAEPFTPS DNVDAQLYNG FFSDADRAAM KIVLETEPRN LPALDITFVD KRIEKLLFNY RARNFPGTLD

 421 YAEQQRWLEH RRQVFTPEFL QGYADELQML VQQYADDKEK VALLKALWQY AEEIV

SEQ ID NO:7

   1 ATGTTTCGTC GTAAAGAAGA TCTGGATCCG CCGCTGGCAC TGCTGCCGCT GAAAGGCCTG CGCGAAGCCG

  71 CCGCACTGCT GGAAGAAGCG CTGCGTCAAG GTAAACGCAT TCGTGTTCAC GGCGACTATG ATGCGGATGG

 141 CCTGACCGGC ACCGCGATCC TGGTTCGTGG TCTGGCCGCC CTGGGTGCGG ATGTTCATCC GTTTATCCCG

 211 CACCGCCTGG AAGAAGGCTA TGGTGTCCTG ATGGAACGCG TCCCGGAACA TCTGGAAGCC TCGGACCTGT

 281 TTCTGACCGT TGACTGCGGC ATTACCAACC ATGCGGAACT GCGCGAACTG CTGGAAAATG GCGTGGAAGT

 351 CATTGTTACC GATCATCATA CGCCGGGCAA AACGCCGCCG CCGGGTCTGG TCGTGCATCC GGCGCTGACG

 421 CCGGATCTGA AAGAAAAACC GACCGGCGCA GGCGTGGCGT TTCTGCTGCT GTGGGCACTG CATGAACGCC

 491 TGGGCCTGCC GCCGCCGCTG GAATACGCGG ACCTGGCAGC CGTTGGCACC ATTGCCGACG TTGCCCCGCT

 561 GTGGGGTTGG AATCGTGCAC TGGTGAAAGA AGGTCTGGCA CGCATCCCGG CTTCATCTTG GGTGGGCCTG

 631 CGTCTGCTGG CTGAAGCCGT GGGCTATACC GGCAAAGCGG TCGAAGTCGC TTTCCGCATC GCGCCGCGCA

 701 TCAATGCGGC TTCCCGCCTG GGCGAAGCGG AAAAAGCCCT GCGCCTGCTG CTGACGGATG ATGCGGCAGA

 771 AGCTCAGGCG CTGGTCGGCG AACTGCACCG TCTGAACGCC CGTCGTCAGA CCCTGGAAGA AGCGATGCTG

 841 CGCAAACTGC TGCCGCAGGC CGACCCGGAA GCGAAAGCCA TCGTTCTGCT GGACCCGGAA GGCCATCCGG

 911 GTGTTATGGG TATTGTGGCC TCTCGCATCC TGGAAGCGAC CCTGCGCCCG GTCTTTCTGG TGGCCCAGGG

 981 CAAAGGCACC GTGCGTTCGC TGGCTCCGAT TTCCGCCGTC GAAGCACTGC GCAGCGCGGA AGATCTGCTG

1051 CTGCGTTATG GTGGTCATAA AGAAGCGGCG GGTTTCGCAA TGGATGAAGC GCTGTTTCCG GCGTTCAAAG

1121 CACGCGTTGA AGCGTATGCC GCACGTTTCC CGGATCCGGT TCGTGAAGTG GCACTGCTGG ATCTGCTGCC

1191 GGAACCGGGC CTGCTGCCGC AGGTGTTCCG TGAACTGGCA CTGCTGGAAC CGTATGGTGA AGGTAACCCG

1261 GAACCGCTGT TCCTG

SEQ ID NO:8

   1 MFRRKEDLDP PLALLPLKGL REAAALLEEA LRQGKRIRVH GDYDADGLTG TAILVRGLAA LGADVHPFIP

  71 HRLEEGYGVL MERVPEHLEA SDLFLTVDCG ITNHAELREL LENGVEVIVT DHHTPGKTPP PGLVVHPALT

 141 PDLKEKPTGA GVAFLLLWAL HERLGLPPPL EYADLAAVGT IADVAPLWGW NRALVKEGLA RIPASSWVGL

 211 RLLAEAVGYT GKAVEVAFRI APRINAASRL GEAEKALRLL LTDDAAEAQA LVGELHRLNA RRQTLEEAML

 281 RKLLPQADPE AKAIVLLDPE GHPGVMGIVA SRILEATLRP VFLVAQGKGT VRSLAPISAV EALRSAEDLL

 351 LRYGGHKEAA GFAMDEALFP AFKARVEAYA ARFPDPVREV ALLDLLPEPG LLPQVFRELA LLEPYGEGNP

 421 EPLFL

SEQ ID NO:9

TAGGGATAACAGGGTAAT

SEQ ID NO:10

TGTGTTCTATGTCTTATTCTTACTTCGTTATTCTTGTCTCTATTCTGTTTATGTTTCTTGTTTGTTA

SEQ ID NO:11

TGTGTTCTATGTCTT TT-(CH2)4-MAL

SEQ ID NO:12

TGTGTTCTATGTCTTATTCTTACTT TT-(CH2)4

SEQ ID NO:13

TGTGTTCTATGTCTTATTCTTACTTCGTTATTCTT TT-(CH2)4-MAL

SEQ ID NQ:14

AAGACATAGAACACA TT-(CH2)4-MAL

SEQ ID NO:15

AAGTAAGAATAAGACATAGAACACA TT-(CH2)4-MAL

SEQ ID NO:16

AAGAATAACGAAGTAAGAATAAGACATAGAACACA TT-(CH2)4-MAL

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号