首页> 中国专利> 用于构建测序文库的接头和测序文库的构建方法

用于构建测序文库的接头和测序文库的构建方法

摘要

本发明提供了一种用于构建测序文库的接头,其通过第一核苷酸单链与第二核苷酸单链部分结合而形成,所述第一核苷酸单链包括第一通用引物序列、第一测序引物序列和位于所述第一通用引物序列与所述第一测序引物序列之间的单分子标签,所述第二核苷酸单链包括第二通用引物序列、与所述第一测序引物序列部分互补的第二测序引物序列和位于所述第二通用引物序列与所述第二测序引物序列之间的样本标签,所述第一通用引物序列为AATGATACGGCGACCACCGAGATCTACAC,所述第一测序引物为ACACTCTTTCCCTACACGACGCTCTTCCGATC T,所述第二通用引物序列为ATCTCGTATGCCGTCTT CTGCTTG,所述第二测序引物为GATCGGAAGAGCACA CGTCTGAACTCCAGTCAC。根据本公开,能够提供一种能够提高二代测序准确性的用于构建测序文库的接头和测序文库的构建方法。

著录项

  • 公开/公告号CN112852802A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 深圳海普洛斯医疗器械有限公司;

    申请/专利号CN202110147807.8

  • 发明设计人 许明炎;张晓妮;

    申请日2018-12-06

  • 分类号C12N15/11(20060101);C12Q1/6806(20180101);C40B50/06(20060101);C40B40/06(20060101);

  • 代理机构44398 深圳舍穆专利代理事务所(特殊普通合伙);

  • 代理人黄贤炬

  • 地址 518000 广东省深圳市龙华区观湖街道松元厦社区虎地排117号锦绣大地7号楼302

  • 入库时间 2023-06-19 11:08:20

说明书

本申请是申请日为

技术领域

本发明属于基因测序领域,特别涉及一种用于构建测序文库的接头和测序文库的构建方法。

背景技术

高通量测序技术(High-throughput sequencing,HTS)可以一次性对几十万到几百万条核酸分子进行序列测定,从而能够对一个物种的基因组、转录组和表观遗传改变等进行细致全貌的分析,高通量测序技术又被称为“深度测序”(Deep sequencing)。随着高通量测序技术的兴起以及测序成本的大幅降低,基因测序在精准医疗领域,如肿瘤基因检测、遗传病基因检测、产前检测等有着广阔的应用前景。

以癌症早期筛查为例,在癌症患者的体液内,可以检测到由肿瘤细胞凋亡和裂解释放的循环肿瘤DNA(circulating tumor DNA),约占cfDNA的1%,甚至0.01%,可以通过对肿瘤患者ctDNA进行测序,检测到癌症相关基因突变信息。而在孕妇的cfDNA中,约有10%-15%的cfDNA来自于胎儿,可以通过对孕妇cfDNA进行测序,筛查胎儿的遗传缺陷。然而,在上述测序中,例如cfDNA所包含的基因突变丰度较低,因此迫切需要测序精度更高,准确度更高的测序方法。

目前,针对这种二代测序技术(Next-Generation Sequencing),具有通量高、成本低、准确性高等优点成为目前使用最为广泛的高通量测序技术。二代测序技术的基本原理是边合成边测序。在文库构建过程中,将DNA随机片段化,并在片段化后的DNA两端添加特定测序接头(Adaptor),然后进行文库PCR扩增。构建好的DNA文库在进行测序时通过捕捉新合成的末端的标记来确定DNA的序列。二代测序技术的准确性可达到98%以上。但是其文库在构建过程中引入了PCR扩增过程,而PCR扩增的偏好性和错误率,增加了二代测序的错误率。因此,需要开发一种精度更高准确度更高的建库技术,以适应低丰度DNA的测序要求。

发明内容

本发明是鉴于上述现有技术的状况而完成,其目的在于提供一种能够提高二代测序准确性的测序接头及测序文库的构建方法。

为此,本公开提供了一种含单分子标签的测序接头,该测序接头通过第一核苷酸单链与第二核苷酸单链部分结合而形成,其中,第一核苷酸单链包括单分子标签和第一测序引物序列,并且第二核苷酸单链包括样本标签、以及与所述第一测序引物序列部分互补的第二测序引物序列。

在本公开的一方面中,含单分子标签的测序接头由第一核苷酸单链与第二核苷酸单链部分结合而形成。其中,第一核苷酸单链包括单分子标签和第一测序引物序列,并且第二核苷酸单链包括样本标签、以及与所述第一测序引物序列部分互补的第二测序引物序列。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。

另外,在本公开的一方面所涉及的测序接头中,所述测序接头可以为Y字型接头。在这种情况下,单分子标签和样本标签分别位于Y字型接头的两条单链上,因此能够有效地抑制单链上的单分子标签对样本标签的干扰。

另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链还可以包括第一通用引物序列,并且所述第二核苷酸单链还可以包括第二通用引物序列。在这种情况下,能够将测序接头中未结合部分的两端的序列作为正反向引物。

另外,在本公开的一方面所涉及的测序接头中,所述单分子标签可以为用于标记不同DNA片段的随机的碱基序列。在这种情况下,能够根据单分子标签识别重复的DNA片段,进一步提高测序的准确性。

另外,在本公开的一方面所涉及的测序接头中,所述样本标签可以为用于区别不同样本的固定的碱基序列。在这种情况下,能够根据样本标签识别不同的样本,由此能够使用该测序接头能够同时操作多个样本。

另外,在本公开的一方面所涉及的测序接头中,所述单分子标签的序列可以为SEQID NO:5-10。在这种情况下,能够进一步提高测序的准确性。

另外,在本公开的一方面所涉及的测序接头中,所述样本标签的序列可以为SEQID NO:18-23。在这种情况下,能够进一步提高测序的准确性。

另外,在本公开的一方面所涉及的测序接头中,所述单分子标签的长度可以为4bp至20bp。在这种情况下,通过将单分子标签的长度控制在适当的长度范围,能够不影响后续测序的效果。

另外,在本公开的一方面所涉及的测序接头中,所述样本标签的长度可以为4bp至20bp。在这种情况下,通过将样本标签的长度控制在适当的长度范围,由此能够减少对后续测序效果的不良影响。

另外,在本公开的一方面所涉及的测序接头中,所述第二核苷酸单链的5’端可以使用磷酸基团修饰。在这种情况下,有利于促进测序接头与DNA片段的连接反应。

另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链可以与所述第二核苷酸单链通过退火而部分结合。在这种情况下,能够促进不同单链部分结合。

另外,在本公开的一方面所涉及的测序接头中,所述第一核苷酸单链可以为5’-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’,所述第二核苷酸单链可以为5’PHO-GATCGGAAGAGCACACGTCTGAACTCCAGTCACXXXXXXXXATCTCGTATGCCGTCTTCTGCTTG-3’;在所述第一核苷酸单链中,所述第一测序引物序列可以为SEQ IDNO:1,所述第一通用引物序列可以为SEQ ID NO:2,其中,所述单分子标签可以为NNNNNNNN;在所述第二核苷酸单链中,所述第二测序引物序列可以为SEQ ID NO:3,所述第二通用引物序列可以为SEQ ID NO:4,其中,所述样本标签可以为XXXXXXXX。由此,能够更进一步提高后续的测序的精度和准确度。

本公开的另一方面提供了一种测序文库的构建方法,所述方法可以包括:(a)提取DNA;(b)将DNA进行片段化处理;(c)对所获得的DNA片段进行末端修复和加A尾;(d)在步骤(c)所获得的DNA片段两端连接含单分子标签的测序接头;(e)以步骤(d)获得的DNA接头连接产物为模板,以两端接头的已知序列为正反向引物,进行PCR扩增并得到PCR产物;以及(f)进行PCR产物纯化。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。

另外,在本公开的另一方面所涉及的测序文库的构建方法中,所述步骤(c)中,DNA片段的大小可以为100bp至250bp。在这种情况下,能够促进后续测序的反应。

此外,在本公开的另一方面所涉及的测序文库的构建方法中,所述步骤(6)中,可以利用磁珠法对所述PCR产物进行纯化。在这种情况下,能够提高PCR产物的纯化的效率及纯度。

根据本公开,与现有技术相比,能够有效提高测序精度和准确度,能够弥补PCR扩增过程引入的错误,特别适用于cfDNA等低丰度DNA基因变化的检测的测序接头和测序文库的构建方法。

附图说明

图1是示出了本发明的实施方式所涉及的含单分子标签的测序接头的结构示意图。

图2是示出了本发明的实施方式所涉及的含单分子标签的测序接头的制备流程图。

图3是示出了本发明的实施方式所涉及的测序文库构建方法的流程图。

图4是示出了本发明的实施方式所涉及的测序文库构建方法的原理图。

具体实施方式

以下,参考附图,详细地说明本发明的优选实施方式。在下面的说明中,对于相同的部件赋予相同的符号,省略重复的说明。另外,附图只是示意性的图,部件相互之间的尺寸的比例或者部件的形状等可以与实际的不同。

图1是示出了本发明的实施方式所涉及的含单分子标签的测序接头的结构示意图。图2是示出了本发明的实施方式所涉及的含单分子标签的测序接头的合成流程图。

本公开提供了一种含单分子标签的测序接头1,该测序接头可以通过第一核苷酸单链10与第二核苷酸单链20部分结合而形成(参见图1)。其中,第一核苷酸单链10可以包括单分子标签12和第一测序引物序列11。另外,第二核苷酸单链20可以包括样本标签22、以及与第一测序引物序列11部分互补的第二测序引物序列21(参见图2)。

在本公开中,测序接头1可以由第一核苷酸单链10与第二核苷酸单链20部分结合而形成。其中,第一核苷酸单链10包括单分子标签12和第一测序引物序列11,并且第二核苷酸单链20包括样本标签22、以及与第一测序引物序列11部分互补的第二测序引物序列21。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签12识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。

另外,在一些示例中,测序接头1可以为Y字型接头。通过第一核苷酸单链10的第一测序引物序列11与第二核苷酸单链20的第二测序引物序列21部分结合而形成Y字型接头,在这种情况下,单分子标签12和样本标签22分别位于Y字型上的两条单链上,因此,能够有效地抑制第一核苷酸单链10单链上的单分子标签12对样本标签22的干扰。

另外,在一些示例中,第一核苷酸单链10还可以包括第一通用引物序列13,并且第二核苷酸单链20还可以包括第二通用引物序列23。在测序接头中,单分子标签12位于第一测序引物序列11与第一通用引物序列13中间,样本标签22位于第二序引物序列21与第二用引物序列23中间,且第一测序引物序列11与第二测序引物序列21部分结合,由此,第一通用引物序列13与第二用引物序列23位于测序接头未结合部分末端。在这种情况下,能够将测序接头1中未结合部分的两端的序列作为正反向引物。

在一些示例中,第一核苷酸单链10可以为5’-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’。另外,在第一核苷酸单链10中,第一测序引物序列11可以为SEQ ID NO:1,第一通用引物序列13可以为SEQ ID NO:2,单分子标签12可以为NNNNNNNN,例如单分子标签12为SEQ ID NO:5-10。

另外,在一些示例中,第一核苷酸单链10还可以为5’-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNTCGTCGGCAGCGTC-3’。第一测序引物序列11可以为SEQ ID NO:11,第一通用引物序列13还可以为SEQ ID NO:12,单分子标签12还可以为SEQ ID NO:13-17。本公开的示例不限于此,根据测序文库、测序样本、测序仪器等的不同,本领域技术人员还可以获得不同的测序接头单链序列。

另外,在一些示例中,第二核苷酸单链20可以为5’PHO-GATCGGAAGAGCACACGTCTGAACTCCAGTCACXXXXXXXXATCTCGTATGCCGTCTTCTGCTTG-3’。另外,在第二核苷酸单链20中,第二测序引物序列21可以为SEQ ID NO:3,第二通用引物序列23可以为SEQ ID NO:4,其中,样本标签22可以为XXXXXXXX,例如,样本标签22可以为SEQ ID NO:18-23。由此,能够更进一步提高后续的测序的精度和准确度。

另外,在一些示例中,第二核苷酸单链20还可以为5’PHO-CAAGCAGAAGACGGCATACGAGATXXXXXXXXGTCTCGTGGGCTCGG-3’,第二测序引物序列21还可以为SEQ ID NO:24,第二通用引物序列23还可以为SEQ ID NO:25,其中,样本标签22还可以为SEQ ID NO:26-29。本公开的示例不限于此,根据测序文库、测序样本、测序仪器等的不同,本领域技术人员还可以获得不同的测序接头单链序列。

另外,在一些示例中,单分子标签12可以为用于标记不同DNA片段的随机的碱基序列。在这种情况下,能够根据单分子标签识别重复的DNA片段,进一步提高测序的准确性。

另外,在一些示例中,样本标签22可以为用于区别不同样本的固定的碱基序列。在这种情况下,能够根据样本标签22识别不同的样本,由此能够使用该测序接头能够同时操作多个样本。

另外,在一些示例中,单分子标签12的长度可以为4bp至20bp,例如,单分子标签12的长度可以为6bp、7bp、8bp、10bp、126bp等等。在这种情况下,通过将单分子标签12的长度控制在适当的长度范围,能够不影响后续测序的效果。特别是在测序读长固定的情况下,能够减少测序读长的浪费,从而减少对后续测序的不良影响。

另外,在一些示例中,样本标签22的长度可以为4bp至20bp,例如,样本标签22的长度可以为6bp、7bp、8bp、10bp、126bp等等。在在这种情况下,通过将样本标签22的长度控制在适当的长度范围,能够减少对后续测序效果的不良影响。特别是在测序读长固定的情况下,能够减少测序读长的浪费,从而减少对后续测序的不良影响。

另外,在一些示例中,第二核苷酸单链20的5’端可以使用磷酸基团修饰。在这种情况下,有利于促进测序接头与DNA片段的连接反应。一般而言,磷酸基团可以为四面体的PO4基、磷酸基团(Phosphonates)或膦酸(Phosphonic Acids),其为包含C-PO(OH)2或C-PO(OR)2的有机复合分子,其中R为烷基或芳香族羟基。通过使用磷酸基团修饰第二核苷酸单链20的5’端,使其与DNA片段3’端的羟基更加容易形成磷酸二酯键,从而有利于促进测序接头1与DNA片段的连接反应。

另外,在一些示例中,第一核苷酸单链10可以与第二核苷酸单链20通过退火而部分结合。在这种情况下,能够促进不同单链(第一核苷酸单链10与第二核苷酸单链20)部分结合。在一些示例中,上述退火的程序可以依次为:退火温度95℃、退火时间10min,降温速度0.1℃/s;退火温度70℃、退火时间2min,降温速度0.1℃/s;退火温度65℃、退火时间2min,降温速度0.1℃/s;退火温度60℃、退火时间2min,降温速度0.1℃/s;退火温度55℃、退火时间2min,降温速度0.1℃/s;退火温度50℃、退火时间2min,降温速度0.1℃/s;退火温度45℃、退火时间2min,降温速度0.1℃/s;退火温度40℃、退火时间2min,降温速度0.1℃/s;退火温度25℃、退火时间2min,降温速度0.1℃/s。

以下,结合图3和图4详细地描述测序文库的构建方法。图3是示出了本发明的实施方式所涉及的测序文库的构建方法的流程图。图4是示出了本发明的实施方式所涉及的测序文库的构建方法的原理图。

在本公开中,测序文库的构建方法包括:提取DNA(步骤S10);将DNA进行片段化处理(步骤S20);对所获得的DNA片段进行末端修复和加A尾(步骤S30);在步骤S30中所获得的DNA片段两端连接含单分子标签的测序接头(步骤S40);以步骤S40中获得的DNA接头连接产物为模板,以两端接头的通用引物为正反向引物,进行PCR扩增并得到PCR产物(步骤S50);最后进行PCR产物纯化(步骤S60)。在这种情况下,能够在测序的生物信息学分析中,通过DNA片段比对到参考基因组上的位置和单分子标签识别重复的DNA片段,并且将重复的DNA片段进行对比以识别真正的基因变异,从而能够提高测序的准确性。

另外,在本实施方式中,在步骤S30中,DNA片段化同样可以采用现有技术中的任何标准手段来进行,例如可以采用物理方法如超声破碎仪进行,或生物方法如片段化酶进行,优选地,所得片段大小为100bp到250bp。另外,如果在步骤S10中的DNA为体液、血液提取的游离DNA,则一般情况下不需要进行片段化操作。在这种情况下,DNA片段的大小有利于后续的测序反应。

另外,在一些示例中,步骤S30中,由于DNA片段化容易造成文库双链末端杂乱,大部分为粘性末端,无法进行接头连接,因此需要对其进行末端修复,然后末端加A尾以便接下来的接头连接。一般而言,“加A尾”是指往DNA片段溶液中加入三磷酸脱氧腺苷缓冲液(dATP缓冲液)通过酶的作用在DNA片段的末端加上A尾,其中dATP可以使用dNTP代替,酶可以是taq酶。

另外,在一些示例中,在步骤S50中,PCR反应扩增可以采用常规的PCR反应,PCR反应通常包括变性、退火、延伸三个基本反应步骤构成。具体而言,首先,进行模板DNA的变性,模板DNA经加热至例如98℃左右一定时间后,使模板DNA双链或经PCR扩增形成的双链DNA解离为单链,以便它与引物结合,为下轮反应作准备;接着,模板DNA与引物的退火(复性),模板DNA经加热变性成单链后,温度降至例如60℃左右,引物与模板DNA单链的互补序列配对结合;然后,进行引物的延伸,也即DNA模板引物结合物在DNA聚合酶的作用下,例如以dNTP为反应原料,靶序列为模板,按碱基配对与半保留复制原理,合成一条新的与模板DNA链互补的半保留复制链。

另外,在一些示例中,在步骤S60中,利用磁珠法对PCR产物进行纯化。磁珠法纯化技术采用了纳米级磁珠微珠,这种磁珠微珠的表面标记了一种官能团,能同核酸发生吸附反应。在一定条件下磁珠对核酸具有很强的吸附力,当条件改变时,磁珠释放吸附的核酸,可以达到快速纯化核酸且全程自动化。在这种情况下,能够提高PCR产物的纯化的效率及纯度。

以下,结合具体的实施例对本发明的实施方式进一步详细说明。

[实施例1]

在本实施例中,主要描述测序接头序列的设计和合成及测序接头的形成。

首先,针对Horizon Discovery公司生产的多突变位点的cfDNA标准样品,四个标准品的编号分别为HD776(野生型),HD777(5%突变率),HD778(1%突变率)和HD779(0.1%突变率),根据一般测序技术(例如二代测序技术)测序接头序列设计含单分子标签的测序接头,序列如下:

HD776-i5:SEQ ID NO:30,HD776-i7:SEQ ID NO:31;HD777-i5:SEQ ID NO:32,HD777-i7:SEQ ID NO:33;HD778-i5:SEQ ID NO:34,HD778-i7:SEQ ID NO:35;HD779-i5:SEQ ID NO:36;HD779-i7:SEQ ID NO:37。

上述单核苷酸序列,由生工生物工程(上海)股份有限公司合成。接着,将HD776-i5、HD777-i5、HD778-i5、HD779-i5分别与含有任意样本标签的HD776-i7、HD777-i7、HD778-i7、HD779-i7进行退火形成接头HD776-Adapter、HD777-Adapter、HD778-Adapter、HD779-Adapter。具体而言,可以将HD776-i5、HD777-i5、HD778-i5、HD779-i5核苷酸链的溶液与HD776-i7、HD777-i7、HD778-i7、HD779-i7核苷酸的溶液分别稀释成100μmol/L,并且各取25μL加入到PCR管中,震荡混匀后离心,在PCR仪(Bio-RedT100)中进行退火。具体的退火程序如表1所示。

表1退火程序

通过上述退火并进行纯化,从而获得含有Y字型接头的溶液,最终获得含单分子标签的测序接头50μL,浓度为25μL,放至2-8℃冰箱暂存。

此外,在上述步骤中,每1个i7核苷酸链与i5核苷酸链退火后所形成的含单分子标签的测序接头可以用于1个样本。其中,i7核苷酸链的个数决定可同时操作的样本数量。

[实施例2]

在本实施例中,主要描述使用含单分子标签的测序接头与普通测序接头短的文库构建、上机测序、以及结果分析。

(a)样本准备

本实施例使用Horizon Discovery公司生产的多突变位点的cfDNA标准品作为样本,四个标准品的编号分别为HD776(野生型),HD777(5%突变率),HD778(1%突变率)和HD779(0.1%突变率)。四个标准品的浓度均为15ng/μL,均含有8个已知的突变位点。本实施例中采用的标准品为cfDNA的样本,不需要进行片段化,可直接进行文库构建。组1包含四个标准品各一个,将使用本发明设计的含单分子标签的测序接头(HD776-Adapter、HD777-Adapter、HD778-Adapter、HD779-Adapter)进行文库构建,组2包含四个标准品各一个,将使用无单分子编码的常规接头进行文库构建。

(b)末端修复和加A尾

b-1:按表2所示配制末端修复反应体系,向每个1.5mL样本管内加入20μl末端修复反应体系,混匀后,20℃孵育30min。

表2末端修复反应体系

b-2:配制80%乙醇(40mL乙醇+10mLddH2O),80%乙醇应现用现配。

b-3:末端修复完成后,开始DNA纯化,具体步骤如下:

b-3-1:每个1.5mL样本管内加入120μl混合均匀的磁珠,将反应体系涡旋混匀,置于室温10min,使DNA与磁珠充分结合;

b-3-2:将1.5mL样本管置于磁力架上,进行磁珠吸附,直至溶液澄清(一般等待1-2min);

b-3-3:小心移除上清液(为避免吸入磁珠,可以在管底留存20uL上清液),再加入500μl 80%乙醇,180度旋转离心管使磁珠穿过溶液吸至另一侧管壁,旋转2-3次,或上下颠倒混匀6-8次,静置15s后弃上清液(此过程,离心管一直保持在磁力架上);

b-3-4:重复步骤b-3-3一次;

b-3-5:将离心管自磁力架上取下,快速离心,然后置于磁力架上再次分离、移除残留的酒精溶液。将离心管自磁力架上取下,打开管盖,常温下干燥磁珠,挥发乙醇。

b-4:从-20℃冰箱内取出KAPA A-tailing buffer和KAPA A-tailingenzyme试剂,置于冰盒上解冻,待用。将金属浴从4℃冰箱取出,温度调至30℃,待用。然后按表3配制尾端加A反应体系。每个样本管中加入50μl A-Tailing master mix重悬磁珠,充分混匀后,在30℃孵育30min。

表3尾端加A反应体系

尾端加A反应结束后,开始DNA纯化,具体操作同步骤c-3。

(c)连接接头:

将步骤(b)所得的DNA片段两端连接测序接头,反应体系如表4所示:

表4接头连接反应体系

c-1:从-20℃冰箱内取出5×KAPA Ligation buffer和KAPA T4 DNA Ligase试剂,置于冰盒上解冻,待用。

c-2:将金属浴置于4℃冰箱内,温度调至20℃,待用。

c-3:每个样本管内加入45μl接头连接反应体系,从悬浮磁珠,充分混匀。

c-4:组1加入1μL本发明设计的含单分子标签的测序接头,组2加入1μL无单分子编码的接头。充分涡旋混匀,20℃反应15min。

c-5:接头连接反应结束后,进行DNA纯化,具体操作同步骤b-3。

c-6:双筛:

c-6-1:每个样本管内加入100μl TE缓冲液,涡旋混匀,室温静置5min;

c-6-2:每个样本管内再加入60μl KAPA PEG/NaCl SPRI solution,室温静置10min。使大于450bp的DNA片段吸附于磁珠之上;

c-6-3:准备一批新的1.5mL离心管,管盖管壁标注相对应的编号,加入20μl混合均匀的磁珠;

c-6-4:将样本管置于磁力架上,进行磁珠吸附,直至溶液澄清(一般等待1-2min);

c-6-5:小心取出155μl上清液,移至对应编号的含磁珠的1.5mL离心管中,充分涡旋混匀,室温静置10min。将大于250bp的DNA片段进行吸附;

c-6-6:双筛结束后,开始进行DNA纯化,具体步骤同上述DNA纯化步骤;

c-6-7:每个样本管内加入22μl Nuclease-Free water,重悬浮磁珠,充分混匀后室温静置5min;

c-6-8:准备一批新的0.2mLPCR管,管盖管壁标注对应的样本编号;

c-6-9:将样本管置于磁力架,进行磁珠吸附,直至溶液澄清后,将上清液转移至对应编号的PCR管中;

c-6-10:配置Qubit Buffer 199μL,加入1μL DNA样本,涡旋混匀,避光静置2min,使用Qubit2.0检测文库浓度,浓度结果如表5:

表5 DNA文库PCR前浓度(ng/μL)

(d)PCR扩增文库:

以步骤(c)获得的完整双链DNA接头连接产物为模板,进行PCR扩增:

d-1:每个0.2mL样本管内加入30μL如表6所示PCR扩增反应体系,涡旋混匀。

表6 PCR扩增反应体系

d-2:然后按照表7所示设置PCR扩增过程温度和时间参数。

表7 PCR扩增过程温度和时间参数

d-3:PCR反应结束后,开始进行DNA纯化,具体步骤同上述DNA纯化步骤。

d-4:每个1.5mL样本管内加入22Nuclease-Free water,充分混匀后室温静置5min。

d-5:准备一批新的离心管,管盖上标注信息。

d-6:将1.5mL样本管置于磁力架上,进行磁珠吸附,直至溶液澄清后,将上清液转移至对应的新的写有样本信息的1.5mL离心管,

d-7:配置Qubit Buffer 199μL,加入1μL DNA样本,涡旋混匀,避光静置2min,使用Qubit 2.0检测文库浓度,浓度结果如表8。文库合格,可以进行上机测序。

表8 DNA文库浓度(ng/μL)

(e)上机测序:

以实施例2中所得的DNA文库为样本,使用Novaseq 6000(Illumina)仪器,按照该仪器的常规使用方式进行上机测序,每个样本分配30G数据。

(f)数据质量分析:

使用FastQC软件对下机数据基本质控进行分析,结果如表9。两组样本的测序质量均较好,无明显差异。

表9下机数据基本质控结果

(g)数据分析对比

g-1:所得下机数据使用BWA软件与hg19基因组(GRch37)进行比对,

g-2:使用SAMtools软件包确定比对质量,

g-3:使用VarScan2软件包筛选体细胞变异(--min-coverage=100;--min-varfreq=0.05;--somatic-p-value=0.01;--strand-filter=1;其他参数为默认参数)。

数据分析结果见表10。结果显示,两种建库方法在比对率和捕获效率上差异不明显,但对于突变位点的分析,本发明设计的含单分子标签的测序接头可以更灵敏的检测到突变位点,尤其是对于0.1%的突变,差异更为明显。

表10数据分析结果

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本申请的保护范围。

序列表

<110> 深圳海普洛斯医疗器械有限公司

<120> 用于构建测序文库的接头和测序文库的构建方法

<160> 37

<170> SIPOSequenceListing 1.0

<210> 1

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

acactctttc cctacacgac gctcttccga tct 33

<210> 2

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

aatgatacgg cgaccaccga gatctacac 29

<210> 3

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gatcggaaga gcacacgtct gaactccagt cac 33

<210> 4

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atctcgtatg ccgtcttctg cttg 24

<210> 5

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

agcgctag 8

<210> 6

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gatatcga 8

<210> 7

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

cgcagacg 8

<210> 8

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

tatgagta 8

<210> 9

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

aggtgcgt 8

<210> 10

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gaacatac 8

<210> 11

<211> 14

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tcgtcggcag cgtc 14

<210> 12

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

aatgatacgg cgaccaccga gatctacac 29

<210> 13

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tagatcgc 8

<210> 14

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

ctctctat 8

<210> 15

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

tatcctct 8

<210> 16

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

agagtaga 8

<210> 17

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

gtaaggag 8

<210> 18

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ccgcggtt 8

<210> 19

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ttataacc 8

<210> 20

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

ggacttgg 8

<210> 21

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aagtccaa 8

<210> 22

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

atccactg 8

<210> 23

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

gcttgtca 8

<210> 24

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

caagcagaag acggcatacg agat 24

<210> 25

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

gtctcgtggg ctcgg 15

<210> 26

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

taaggcga 8

<210> 27

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

cgtactag 8

<210> 28

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

aggcagaa 8

<210> 29

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

tcctgagc 8

<210> 30

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

aatgatacgg cgaccaccga gatctacaca gcgctagaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 31

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

gatcggaaga gcacacgtct gaactccagt cacccgcggt tatctcgtat gccgtcttct 60

gcttg 65

<210> 32

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

aatgatacgg cgaccaccga gatctacacg atatcgaaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 33

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

gatcggaaga gcacacgtct gaactccagt cacttataac catctcgtat gccgtcttct 60

gcttg 65

<210> 34

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

aatgatacgg cgaccaccga gatctacacc gcagacgaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 35

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

gatcggaaga gcacacgtct gaactccagt cacggacttg gatctcgtat gccgtcttct 60

gcttg 65

<210> 36

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

aatgatacgg cgaccaccga gatctacact atgagtaaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 37

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

gatcggaaga gcacacgtct gaactccagt cacaagtcca aatctcgtat gccgtcttct 60

gcttg 65

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号