CN113462759B

CN113462759B - 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用

Info

Publication number: CN113462759B
Application number: CN202110882685.7A
Authority: CN
Inventors: 王伟伟; 刘萌; 刘星宇; 张利利; 田埂
Original assignee: Geneis Beijing Co ltd
Current assignee: Geneis Beijing Co ltd
Priority date: 2021-08-02
Filing date: 2021-08-02
Publication date: 2024-06-25
Anticipated expiration: 2041-08-02
Also published as: CN113462759A

Abstract

本发明公开基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法及在突变检测中的应用。本发明的方法首先对DNA进行单链化，在随后的单链建库过程中有效地将双链DNA和单链DNA被建库保留进入下一个实验环节。在此基础上整合和优化目标区域的捕获和扩增技术，结果不仅可以有效提高富集区域重要突变的检出率和稳定性，而且可以兼容低起始量DNA文库构建。本发明的方法能够克服单链建库单链ctDNA漏检的问题，提供了一种极大改善低质量和微量DNA样本建库效果的技术方案。

Description

基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法及在突变检测中的应用

技术领域

本发明涉及基因测序，具体地涉及对单链DNA序列富集的测序方法及其在突变检测中的应用，尤其是涉及基于多重扩增和探针杂交捕获对单链DNA序列富集和突变的测序方法及其应用。

背景技术

近年来，液体活检技术在临床方面特别是在辅助肿瘤患者诊断、治疗和术后监控等方面得到广泛的应用。相比于传统的术中取样，液体活检通过抽血获得样品。健康人中，人体各组织细胞自然凋亡，细胞核内DNA分子被一系列消化处理后，变成碎片化核酸分子被释放到血浆等体液中。当组织发生肿瘤时，大量的特异组织肿瘤细胞的碎片化核酸分子被释放到血浆中。

血浆游离DNA又称cfDNA(cell free DNA)，是指外周血中游离于细胞外的DNA，cfDNA的来源既包括正常细胞，也有异常细胞(如肿瘤细胞)或者外源的微生物(如病毒DNA)，具体包括自身正常细胞代谢的凋亡小体，肿瘤细胞碎片、外泌体等。循环肿瘤DNA(Circulating tumor DNA)，即ctDNA是指从原发肿瘤甚至是转移形成的新肿瘤细胞破裂掉落下来到循环外周血中的DNA。ctDNA在临床医学中具有重要意义，ctDNA的检测在肿瘤的早期检测，肿瘤的靶向治疗和后期的疾病监控等方面具有重要的临床价值。cfDNA检测难点主要是含量低，人群在10ng-50ng。

目前常用建库均为双链建库，主要存在的问题如下：1.样本起始量100ng起，无法有效针对低起始量的单链DNA建库；2.成本问题；3.样本DNA的低质量，很多困难样本如FFPE样本、液体活检cfDNA，法医样本、微量样本因其自身的特性，单链化DNA占比较高，双链建库可能会导致测序覆盖度偏差较大，有效目标区域测序不完整，影响突变检出，同时存在着很大的建库失败风险。目前对于如何降低建库失败风险，尤其是提高目的片段的捕获效率以及测序数据质量，从而得到有效的变异检出率仍面临挑战。

发明内容

针对现有技术中存的至少部分技术问题，发明人在深入研究后发现血液中存在部分呈单链形式的ctDNA，而目前建库方法往往会忽略这类单链DNA，造成检测有遗漏。基于此，发明人提出一种可以极大改善低质量和微量DNA样本建库效果的技术方案。通过对单链状态的DNA使用带有通用引物结合区的上游引物组合INDEX引物进行多重PCR后，再经杂交捕获富集目的片段。这种组合方式可极大提高目标区域片段的有效富集。本发明的方法不仅可以有效提高富集区域重要突变的检出率和稳定性，而且可以兼容低起始量DNA文库构建。具体地，本发明包括以下内容。

本发明的第一方面，提供一种基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，包括以下步骤：

(1)提供来自生物样本的单链状态的DNA片段，在所述DNA片段的末端连接一连接臂，所述连接臂设计为能够通过接头的互补臂与接头连接；

(2)通过局部双链互补配对和连接反应使DNA片段的末端与接头连接，局部双链结构有助于提高单链连接效率；

(3)加热使所述接头与所述DNA片段分离，从而形成单链状态的第一扩增模板；

(4)利用所述第一扩增模板进行多重PCR，得到第二扩增模板，其中，所述多重PCR的引物包括特异性引物和第一INDEX引物；

(5)利用所述第二扩增模板进行通用PCR，得到杂交捕获用片段，通用PCR的引物包括通用引物和第二INDEX引物；

(6)使探针和所述杂交捕获用片段进行接触，从而捕获目标片段。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，进一步包括进行捕获后PCR，从而得到测序文库的步骤，其中测序文库中的片段长度为150-500bp。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，第一INDEX引物和第二INDEX引物为相同引物。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，所述特异性引物包含第一通用引物结合序列和能够与靶标一侧的序列特异性互补结合的结合序列，所述第一INDEX引物或所述第二INDEX引物各自分别包含第二通用引物结合序列和INDEX序列，且第一INDEX引物和第二INDEX引物各自的至少一部分能够与DNA片段的至少一部分互补结合，从而使INDEX引物能够与单链DNA序列结合。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，所述第一通用引物结合序列和所述第二通用引物结合序列为相同的序列。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，所述生物样本为血液，其包括全血、血浆、血清；所述DNA片段为cfDNA、ctDNA或人工片段化DNA片段。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，所述接头包含条形码序列。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，进一步包括对测序文库进行测序的步骤。

根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法，优选地，所述连接臂为poly C，即多聚C尾，其中C的个数为1-10；所述互补臂为poly G，即多聚C尾，其中G的个数为1-10。

本发明的第二方面，提供根据第一方面的方法在单链DNA突变检测中的应用。

本发明的方法通过组合单链建库、探针捕获以及多重PCR，实现了医学样品中单链化DNA的建库和目标基因区域的富集和测序。在目标区域有效数据量占比上，本发明的方法相比于单独单链建库(3％)、单独探针捕获杂交富集(30％-40％)和单独多重扩增(1％-5％)，具有统计显著性提升，有效目标区域数据达到80-90％。另外，在目标区域覆盖的均一性和序列覆盖层数上，本发明的方法也显著优于其他单独建库测序的方法。本发明的方法可以有效提高肿瘤筛查液体活检样品中的单链核酸的捕获效率和突变的检出率，使得检测更加稳定，且准确度更高。

附图说明

图1为本发明示例性单链DNA富集流程图。

图2为本发明示例性探针捕获流程图。

图3为多重PCR扩增后的产物长度分布区间结果。

图4为通用PCR扩增后的产物长度分布区间结果。

图5为本发明示例性的富集得到的测序文库的质检结果。

具体实施方式

现详细说明本发明的多种示例性实施方式，该详细说明不应认为是对本发明的限制，而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

应理解本发明中所述的术语仅仅是为描述特别的实施方式，并非用于限制本发明。另外，对于本发明中的数值范围，应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

除非另有说明，否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料，但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入，用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时，以本说明书的内容为准。

本文所用的术语“样本”涉及包含一种或多种所关注的分析物的材料或材料混合物，通常但不一定为液体形式。本发明的样本含有核酸样本，核酸样本可以是复杂样品，其包含多种不同的含有目的序列的分子，这样的样本可具有多于10、50、100或200个不同的核酸分子。

本文中，DNA片段可源于任何来源，例如基因组DNA、cDNA(来自RNA)、cfDNA、ctDNA或人工DNA构建体或人工片段化DNA片段。在某些实施方案中，DNA片段为cfDNA。在另外的实施方案中，DNA片段为ctDNA。本文可以采用含有DNA片段(例如基因组DNA)的任何样品，包括但不限于血液、组织样品或FFPE样品。优选地，本发明中基因组DNA片段源自人基因组DNA。

本文所用的术语“条形码序列”是指将唯一性核苷酸序列，用于在反应中鉴定和/或跟踪多核苷酸的来源。“条形码序列”与“分子标签”可互换使用，条形码序列可位于寡核苷酸的5’末端或3’末端。在一些实施方案中，条形码可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸或更长的长度。

本发明所用术语“INDEX”具有本领域通常的含义，是指索引标签，具体指一段用于区分不同测序样品的核苷酸序列。优选地，索引标签序列长度为20个核苷酸或更少。例如，索引标签序列长度可以为1-10个核苷酸或4-6个核苷酸。

本发明各个步骤的条件对于实现本发明的目的是重要的。需要说明的是，本发明步骤(1)-(6)中所用试剂的浓度、引物间体积比或特定扩增程序适用于本发明的方法而存在。如无特别说明，本发明所用试剂均购自于已知商品和试剂盒。

[步骤(1)]

在步骤(1)中，提供来自生物样本的单链状态的DNA片段，在所述DNA片段的末端连接单链连接臂，使所述连接臂通过接头的互补臂与接头连接。单链的DNA片段可以源自双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)。例如，可以使用本领域熟知的标准技术将双链DNA分子转化为成单链DNA。含有单链DNA序列的核酸样本的精确序列对于本文展示的公开内容通常是不重要的，并且可能是已知或未知的。

本发明的步骤(1)可选地包括对来自生物样本的DNA进行片段化的步骤，其可以以任何合适的方式被片段化，优选被随机片段化。这样的片段化方法是本领域已知的，适用于本文的方法的具体实施方案的说明性方法包括但不限于剪切、超声处理、酶消化。

在一些实施方案中，随机片段化通过机械手段，例如雾化或超声处理产生长度约150-500bp的片段，优选长度约150-500bp的片段，还优选长度为199-451bp的片段。

本发明步骤(1)中的连接臂不特别限定，只要连接臂能够与互补臂形成双链结构，从而将接头可分离地连接至单链DNA分子末端，特别是3’末端即可。连接臂与互补臂可以是互补核酸分子。在示例性实施方案中，连接臂为poly C，C的个数为1-10，优选2-8，还优选3-6。互补臂为poly G，G的个数为1-10，优选2-8，还优选3-6。优选C的个数与G的个数相同，以实现核酸分子中C碱基与G碱基以氢键互补锁定。本领域还可以理解，连接臂还可以是polyA，互补臂可以是poly T。

优选地，步骤(1)中单链DNA片段的浓度为1.5-10ng/μL，优选2.5-8ng/μL，还优选3.5-7.5ng/μL。含接头的分子的体积为0.5-5.5μl，优选1.5-4.5μl，还优选2.1-3.5μl。

[步骤(2)和(3)]

本发明中，通过连接反应使连接臂与单链DNA片段连接，局部双链结构有助于提高单链连接效率。通过例如加热使互补臂和接头的复合结构与单链DNA片段分离，形成第一扩增模板，其为单链形式的DNA分子。加热温度为85-99℃，优选为90-98℃。

优选地，在步骤(3)之后进一步包括对连接产物进行纯化的步骤，纯化时可以使用磁珠法，优选地，磁珠为1.2×的磁珠。

[步骤(4)]

在步骤(4)中，利用所述第一扩增模板进行多重PCR，得到第二扩增模板，其中，所述多重PCR的引物包括特异性引物和第一INDEX引物。第二扩增模板可以是双链DNA分子。PCR引物不特别限定，可根据目标片段序列而具体设计。在某些示例性实施方案中，目标片段选自BRAF、EGFR、KRAS、NRAS、PIK3CA、PIK3CA、AKT1、CDA、HRAS、PDGFRA、TYMS、CYP19A1、CYP2C19、CYP2C8、CYP2C9、CYP2D6、CYP3A4、DHFR、DPYD、ERCC1、ERCC2、GSTP1、IDH1、IDH2、MDR1(ABCB1)、MTHFR、NOTCH1、NQO1、RRM1、SMAD4、SMAD4、SMO、TSC1、UGT1A1、XRCC1、ESR1和KIT。所述特异性引物具有如SEQ ID NO.1-75所示的正向引物序列以及SEQ ID NO.76-150所示的反向引物序列。

在本发明的步骤(4)中，第一扩增模板和INDEX引物的浓度不特别限定，可由本领域技术人员自由设定。可选地，第一扩增模板(10uM)与INDEX引物(10uM时)的体积比为3-12:1，优选5-12:1，还优选6-10:1。特异性引物与INDEX引物的体积比为0.5-1.2:1，还优选1:1。其中，INDEX引物的体积为0.5-4.5μl，优选0.8-2.5μl，还优选1.1-2.1μl。

[步骤(5)]

在步骤(5)中，利用所述第二扩增模板进行通用PCR，得到杂交捕获用片段，第二扩增模板的引物包括通用引物(10uM)和第二INDEX引物(10uM时)。第二扩增模板与通用引物的体积比为11-25:1，优选15-20:1，还优选16-20:1。使用的通用引物的体积为0.5-4.5μl，优选0.8-2.5μl，还优选1.1-2.1μl。通用引物和第二INDEX引物体积比为0.5-1.2:1，优选1:1。

优选地，进一步包括对得到的杂交捕获用片段进行纯化的步骤，纯化方法不特别限定，优选使用磁珠法，可使用例如0.9×磁珠。

[步骤(6)]

在步骤(6)中，使探针和所述杂交捕获用片段进行接触，从而捕获目标片段。本发明中，捕获探针中探针的数量不限定，可根据需要而变化，例如可以是探针组。一般而言，探针的数量为50条以上，优选100条以上，更优选500条以上，例如1000条、2000条等。本发明中，加入的探针的体积为1-10μl，优选2-8μl，还优选3-7μl。杂交捕获用片段为200-700ng，优选300-600ng，还优选400-550ng。其中，所述探针的浓度为0.5-1pmol，优选0.6-0.8pmol。

本发明中，探针与杂交捕获用片段进行接触的时间为10-20h，优选12-18h，还优选13-17h。在某些实施方案中，本发明中，探针上可进一步包含用于分离的功能基团，例如生物素等。通过此类功能基团可使探针与载体等进行结合或分离。例如将探针预先固定至磁珠或基片等载体。在具体实施方案中，含有目标序列的片段和带有生物素标记的探针直接杂交，然后通过生物素亲和素的反应使该片段锚定在带有亲和素的磁珠上，洗去非目标序列的片段。

在步骤(6)中，用于杂交的磁珠体积为80-120μl，优选90-110μl，还优选95-105μl。用于目的片段筛选时的温度为60-70℃，优选62-68℃，还优选63-67℃。用于目的片段筛选的时间为30-70min，优选35-65min，还优选40-50min。其中，用于杂交的磁珠浓度一般为8-15mg/ml，优选9-11mg/ml。

本发明中，在步骤(6)后进一步包括进行捕获后PCR，从而得到测序文库的步骤，其中测序文库中的片段长度为150-500bp，优选为150-450bp。捕获后PCR可使用本领域已知的方法进行。例如通过使用P5引物和P7引物进行PCR，其者的用量不特别限定，可以是例如1:1。

优选地，本发明进一步包括对捕获后PCR产物进行纯化的步骤，纯化方法不特别限定，优选磁珠法，磁珠法的磁珠可以是例如0.9×的磁珠。

本发明方法的捕获效率不低于86％，优选不低于90％，还优选不低于91％。例如92％、93％、94％、95％、96％、97％、98％以上。

本发明方法的目标区域或目的片段或靶序列的读长百分比不低于86％，优选不低于90％，还优选不低于91％。例如92％、93％、94％、95％、96％、97％、98％。

本发明方法的测序数据中的重复序列不高于11％，优选不高于10％，还优选不高于8％。例如7％、6％、5％、4％、3％、2％、1％以下。

本发明方法的测序数据中的有效目标区域数据不低于80％，优选不低于85％，更优选不低于90％。

需要注意的是，在本发明的步骤(1)-(6)前后，或步骤之间还可包含其他步骤或操作，例如进一步优化和/或改善本发明所述的方法。需要说明的是，在本发明的方法中，缺少步骤中的任何一个或改变步骤的顺序，例如先进行步骤(4)，再进行步骤(5)，或步骤的替换，例如使用常规单链建库对本发明的步骤进行替换，均不能实现本发明的目的。

实施例

对单链状态的cfDNA使用带有通用引物结合区的上游引物FP MIX组合INDEXprimer进行多重PCR后，再经杂交捕获富集目的片段。本发明的方法可极大提高目标区域片段的有效富集。具体流程参见图1和图2。下面详细说明。

一、材料或设备

1.gDNA片段化(Fragmentation of Genomic DNA)

1.1M220开机，用AFA-grade water注水。待温度降至10℃以下方可使用。

1.2打断参数：设置相应参数340s，打断至150bp。

1.3将50μl体系(DNA样本+ddH₂O)加入到covaris玻璃管中，短暂离心后将玻璃管放进细胞破碎仪中进行DNA打断。

1.4结束后将玻璃管中片段化的DNA转移至标记好的PCR管中。用Qubit检测浓度进行质控。

2.DNA模板预处理

热循环仪(PCR仪)提前置于95℃，热盖温度设定为105℃，配制T7 Tailing&Ligation预混液，冰上放置待用。

2.1取片段化DNA100ng放到0.2ml的PCR管中，放入Low-EDTA调整到总体积为15ul。

2.2待PCR仪稳定到95℃，将PCR管放入PCR仪中，进行95℃孵育2min后。立即将PCR管置于冰上进行冷却，静置2min。

3.单链接头连接

PCR仪提前置于37℃，热盖温度设定为105℃。

3.1按照下表配制T7 Tailing&Ligation预混液，需提前配制，冰上放置不超过20min。

表1-T7 Tailing&Ligation体系

试剂	体积
		T7 Buffer	4μl
T7 Adapter	2.5μl
		T7 Enzyme Mix	3μl
Low-EDTA TE	15.5μl
		Total	25μl

3.2取25ulT7 Tailing&Ligation预混液加入到冰上放置的预处理DNA样本PCR管中，使用移液器进行吹打混匀，然后瞬时离心使得反应液至管底。

3.3将PCR管置于PCR仪(热盖温度105℃)，进行T7 Tailing&Ligation。

表2-T7 Tailing&Ligation程序

温度	时间
		37℃	15min
95℃	2min
		4℃	hold

3.4连接产物磁珠纯化

反应结束后将样品转到含1.2×XP beads的离心管中，吹打混匀，室温静置5-10min。

a.放磁力架上直至液体变澄清后，从远离磁珠一侧吸弃液体(不要吸到磁珠)。

b.从远离磁珠一侧加入200μl 80％新鲜配制的乙醇，盖紧盖子，向里向外旋转磁力架将壁上、盖上的磁珠冲下后吸弃液体。共洗两次。

c.瞬时离心后，放回磁力架并用10μl移液器吸掉多余液体后，开盖晾至磁珠颜色由闪亮变哑光色。

d.沿磁珠一侧加入22.5μlddH₂O吹打混匀，室温放置5min。

e.放磁力架上直至液体变澄清后，从远离磁珠一侧吸出样本到一新的标记的PCR管中(不要吸到磁珠)。

4.多重PCR扩增

4.1预先从-20℃中取出多重扩增Buffer，10uM预混好的多重引物混合液和对应的INDEX primer，冰上融化并使其充分混匀，其中，所述引物具有如SEQIDNO.1-150所示的序列。

INDEX Primer(ATCACG)：5’-Spc/C*A*A*GCAGAAGACGGCATACGAGATXXXXXX(XX)GTGACTGGAGTTCAGACGTGTGCTCTTCCGA*T*C*T-3’。

4.2在冰上按以下体系依次加入表3的试剂。

表3-多重PCR扩增体系

组分	体积(ul)
		上一步连接产物	13.5
10uM Primer MIX	1.5
		10uM index Primer	1.5
5×MultiPCR Buffer	4
		Total	20.5μl

吹打混匀后瞬时离心，放入PCR仪(提前运行下列表4程序)。

表4-多重PCR扩增程序

反应结束后PCR体系20ul加30ul low TE补至50ul，用1×XP beads(50μl)纯化回收多重PCR产物，纯化方法参照步骤3.4。最后用25μlddH₂O洗脱并转移至一新的PCR管中，其中PCR产物浓度为15-45ng/ul。

4.3纯化后的产物取1μl用2100高灵敏芯片检测，对扩增产物进行质控，确定在预期长度区间内(150-400bp)有产物峰。图3示例性示出Multi PCR-2的质控结果图。

5.Universal PCR反应

5.1从-20℃保存的试剂盒中取出2×kapa hifihotstart ready mix、PCR Primerp7和uni versal Primer，冰上融化并充分混匀。

5’-Spc/A*A*T*GATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGA*T*C*T-3’。

5.2在冰上按以下体系依次加入下表所示的试剂：

表5-Universal PCR试剂

组分	体积(ul)
		模板	22.5
10uM universal primer	1.25
		10uM Primer p7	1.25
2×kapa hifihotstart ready mix	25
		Total	50μl

吹打混匀后瞬时离心，放入PCR仪运行以下程序。

5.3PCR反应程序：

表6-Universal PCR扩增程序

5.4反应结束后用0.9×的XP beads(45μl)纯化，纯化方法参照步骤3.4。最后用21μlddH₂O洗脱并转移至贴好标签的离心管中。PCR产物浓度为25-45ng/ul)。标签信息包括Index号，样本ID，具体如表7。

表7

样本编号	index	文库Qubit值(ng/ul)	文库总体积(ul)	文库总量(ng)
					1	单链-1	74.6	21	1566.6
2	单链-2	77.4	21	1625.4
					3	单链-3	89	21	1869

5.5纯化后的产物取1μl的纯化样本用Agilent 2100Bioanalyzer system(HighSensitivity DNA Kit)进行文库片段长度测定和质控，确定主要产物峰在预期长度区间内(200-450bp)，具体参见图4。

文库结构：

Spc/A*A*T*GATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGA*T*C*TNNNNNNNNNNNPloyCSpc/C*A*A*GCAGAAGACGGCATACGAGATXXXXXX(XX)GTGACTGGAGTTCAGACGTGTGCTCTTCCGA*T*C*T。

6.文库探针杂交

6.1.试剂及待捕获文库准备

6.1.1将上述三例文库按照表8进行混合杂交，按Qubit浓度等量混合。

表8-文库混合

混杂方式	文库个数	每个文库用量
			三杂一	3	170ng

6.1.2按照表9混合blocking oligos、Cot-1及上述已经混合均匀的DNA文库。

表9-封闭体系

等量混合的已连接Barcode/Index的文库	500ng
		Cot-1DNA	5ul
blocking oligos	2ul

6.1.3将上述混合液震荡混匀并打开EP管盖，于60℃真空浓缩仪中浓缩蒸发至干粉状态。

真空浓缩仪设置为60℃，15min。15min后查看混合物蒸干状态，若尚有未蒸干液体，继续进行60℃，15min蒸干，避免过分干燥。

6.2用预混探针组合进行文库捕获，其中，探针组具有如SEQIDNO.151-235所示的序列：

6.2.1捕获试剂所需试剂准备：

a)将所需试剂(按下表10)从冷冻冰箱中找出室温解冻。

b)向上述已经蒸干的EP管中依次加入以下试剂：

表10-捕获试剂

xGen 2×Hybridization Buffer(蓝盖)	8.5ul
		xGen Hybridization Buffer Enhancer(棕褐色)	2.7ul
Nuclease-Free Water	1.8ul
		共计	13ul

室温孵育10min；在Proflex PCR仪中block1上设置并运行以下程序：“95℃，forever”，热盖105℃。

c)上述10min结束后，充分震荡混匀液体，离心，全部转移至0.2ml PCR管中，将PCR管置于block1中计时10min。

d)在PCR仪设置并运行以下如表11的程序，准备捕获探针。c中过程结束，将PCR管转移到65℃的block中，立即加入4ul的gene probe。充分振荡混匀并离心：计时16h。

表11-捕获程序

程序	PCR仪热盖状态
		65℃，forever	PCR仪热盖75℃闭盖

6.2.2捕获非特异片段洗脱及磁珠准备(杂交反应结束前2h开始准备试剂)：

a)从冰箱(冷冻)取出下表中的洗脱液解冻，并从4℃取出M270磁珠，充分震荡混匀

b)配置1×洗脱工作液(洗脱液需现用现配，可杂交反应结束前2h前进行洗脱液准备)：

下表12是进行1次洗脱所需的洗脱工作液配置，根据杂交量配置相应洗脱液。

表12-洗脱工作液配置

浓缩洗脱buffer	浓缩buffer(ul)	无核酸酶的水(ul)
			xGen2×Bead Wash Buffer	250	250
xGen 10×Wash Buffer1	30	270
			xGen 10×Wash Buffer2	20	180
xGen 10×Wash Buffer3	20	180
			xGen 10×Stringent Wash Buffer	40	360

c)对于已经配置好的1×Wash Buffer 1和Stringent Wash Buffer工作液，需按下表创建不同温度的工作液(即Stringent Wash Buffer工作液要65摄氏度金属浴预热2h，Wash Buffer1工作液分为65℃预热2h的工作液和常温工作液)。下表13是1次捕获用量，需根据捕获次数适量配备。

表13-工作液配置

d)再次充分震荡M270磁珠，并向1.5ml EP管中加入100ulM270磁珠。并将EP管置于磁力架上。

e)2-5min后，待磁珠吸附到磁力架上，弃上清。并加入200ul 1×Bead WashBuffer，从磁力架上取下EP管，震荡混匀10s，再次将EP管置于磁力架上。

f)重复步骤e一次。

g)2-5min后，待磁珠吸附到磁力架上，弃上清。加入100ul 1×Bead Wash Buffer，涡旋混匀，并转移至0.2ml PCR管中。

h)杂交完毕前5min将0.2ml PCR管置于磁力架上，待溶液澄清后，弃上清。

6.2.3M270磁珠筛选目的片段：

a、杂交完成时，将步骤h中准备好的M270磁珠置于65℃的block中，于1min内将杂交反应液完全转移到M270磁珠的PCR管中，迅速振荡混匀并放回65℃的block中，计时45min(若有多个杂交反应，该过程须逐一操作)。

b、65℃孵育过程中，每8min震荡混匀一次，确保M270磁珠处于重悬状态。

6.2.4洗涤M270磁珠，洗脱非杂交片段(使用1×洗涤buffer)：

a、65℃洗涤(快速操作，保证温度接近于65℃)：45min孵育结束，取50ul金属浴中65℃预热的1×Wash Buffer 1快速转移至对应的M270钓取反应混合液中，匀速吸打3到5次，并将所有液体快速转移至金属浴65℃预热的1×Wash Buffer 1对应的EP管中，快速振荡离心，此步若有多个杂交反应，将混合液暂放回65℃的金属浴中，逐一完成以上步骤，然后逐一置于磁力架上，快速(30s内)吸弃上清，放回65℃的金属浴中。

b、65℃洗涤(快速操作，保证温度接近于65℃)：加入200ul预热的Stringent WashBuffer工作液，涡旋混匀，简单离心并65℃孵育5min。若有多个杂交反应，待孵育5min后，逐一置于磁力架上，快速(30s内)吸弃上清，放回65℃的金属浴中。

c、重复b一次。

d、室温洗涤：向步骤c中的beads中加入200ul室温的1×Wash Buffer 1，涡旋混匀30s，简单离心，置于磁力架上，待溶液澄清后，弃上清。

e、室温洗涤：向上述beads中加入200ul 1×Wash Buffer 2，涡旋混匀30s，简单离心，置于磁力架上，待溶液澄清后，弃上清。

f、室温洗涤：向上述beads中加入200ul 1×Wash Buffer 3，涡旋混匀30s，简单离心，置于磁力架上，待溶液澄清后，弃上清。离心并放回磁力架，吸净上清。

g、重悬beads：从磁力架上取下含beads的EP管，加入22.5ul无核酸酶的水。涡旋震荡混匀，加入到以下PCR反应液中(带磁珠进行PCR反应)

6.2.5捕获后PCR

a、捕获后PCR反应液配置

表14-捕获后PCR反应液配置

2×KAPA HiFi HotStartReadyMix	25ul
		10uM Illumina P5 primer(Illumina Primer A)	1.25ul
10uM Illumina P7 primer(Illumina Primer B)	1.25ul
		上述g中带磁珠的产物	22.5ul
共计	50ul

b、震荡混匀后，进行如下程序PCR(Proflex PCR仪)：

98℃，45s；98℃，15s；60℃，30s；72℃，30s；72℃，60s；4℃，hold，15个循环，PCR仪热盖状态105℃热盖闭盖。

6.2.6捕获后PCR产物纯化：

a、向新的EP管中加入已在室温平衡0.5h的45ul XP beads。

b、将PCR产物从PCR仪中取出混合均匀后加入到含45ul XP beads的EP管中(0.9×)，震荡混合均匀，室温孵育5min。

c、孵育完将混合产物置于磁力架上，待上清与磁珠完全分离开，弃上清。

d、向管内加入200ul新鲜配置的80％的乙醇洗涤磁珠1min，弃上清(乙醇)。

e、重复步骤d一次。

f、室温或37℃干燥磁珠。

g、待磁珠干燥后加入23ul水，震荡混匀vortex，室温静置5min。

h、置于磁力架上，待磁珠与上清完全分离，吸取上清22ul于一新的EP管中，标明样本名称、文库类型、建库日期、Index/barcode等信息。

6.3质控

a.取1μl文库使用Qubit dsDNA HS Assay Kit进行定量，记录文库浓度；

b.取1ul样品使用Agilent 2100Bioanalyzer system(High Sensitivity DNAKit)进行文库片段长度测定和质控，确定目标主峰片段在预期长度区域内(200-450bp)，具体见图5。

c.使用NGS测序平台进行测序。

7.数据分析和质控结果

7.1测序数据处理

对于测序的下机原始数据，使用fastp软件对数据进行质量控制，软件自动识别引物并进行处理、再过滤低质量的序列时，设置滑动窗口过滤值及碱基平均质量值时-W为4，-M为Q20。使用二代测序数据比对软件bwa-mem模式将经过质量控制所得的数据比对到人类参考基因组上(hg19)，得到每条序列的位置信息及比对质量信息。然后使用picard软件对比对后的结果去除由PCR扩增所形成的重复。使用软件(如samtools)对去除重复后的比对结果进行排序并进行索引。

二、数据结果

1.测序数据结果如表15所示：

表15-测序数据结果

2.Bamqc结果表16所示：

表16-Bamqc结果

3.Calling情况-突变的识别

使用freebayes软件对得到的样本二代测序比对结果进行分析，识别样本中的突变，并设置参数最小比对质量值-m为10，最小质量值-q为20，最小交替分数-F设置为0.01，观察到的最少的碱基数-C为1。使用annovar软件对freebayes识别出来的突变进行注释。

表17-比对结果分析

4.不同方法学捕获效率比较

本发明采用了不同方法学对捕获效率进行了比较，包括单独采用多重富集方法、单链建库富集。具体参见表18所示。

表18-富集效率比较

注：Ontarget ratio＝Ontarget reads/Mapped reads。

5.不同方法学覆盖度和均一性比较

本发明采用了不同方法学对覆盖度和均一性进行了比较，包括单独采用多重富集方法、单链建库富集。具体参见表19所示。

表19-覆盖度和均一性比较

尽管本发明已经参考示例性实施方案进行了描述，但应理解本发明不限于公开的示例性实施方案。在不背离本发明的范围或精神的情况下，可对本发明说明书的示例性实施方案做多种调整或变化。权利要求的范围应基于最宽的解释以涵盖所有修改和等同结构与功能。

序列表

<110> 元码基因科技（北京）股份有限公司

<120> 基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法及在突变检测中的应用

<130> BH2110311

<141> 2021-08-02

<160> 234

<170> SIPOSequenceListing 1.0

<210> 1

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ctcttgagga tcttgaagga aactg 25

<210> 2

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tgccactttc ccttgtagac tg 22

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ccacactgac gtgcctctcc 20

<210> 4

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

tctgcctcac ctccaccg 18

<210> 5

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ccgcagcatg tcaagatcac 20

<210> 6

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gatctgtatt tatttcagtg ttacttacct gtc 33

<210> 7

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ctgaattagc tgtatcgtca aggc 24

<210> 8

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ctcatgtact ggtccctcat tgc 23

<210> 9

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

cctgagcctg ttttgtgtct actg 24

<210> 10

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tggttctgga ttagctggat tgtc 24

<210> 11

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

cgcctgtcct catgtattgg tc 22

<210> 12

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

acagctcaaa gcaatttcta cacg 24

<210> 13

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

aactgagcaa gaggctttgg ag 22

<210> 14

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

gtgccatcat tcttgaggag g 21

<210> 15

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

ccctgaagcc tgagtgtgtc c 21

<210> 16

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ctggatggtc agcgcactc 19

<210> 17

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

cgcatgtact ggtcccgc 18

<210> 18

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ttgtgaagat ctgtgacttt ggc 23

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

caatgtctca aacatcatca cgg 23

<210> 20

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gccacttggc ctgcctc 17

<210> 21

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

tgtagcctgg ttctctggtg tg 22

<210> 22

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

tctcttagat atgcaataat tttcccac 28

<210> 23

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

tgaatgaaaa catcaggatt gtaagc 26

<210> 24

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

cagtgagctt cctcttgaac acg 23

<210> 25

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

gctgcggaat tttgggatg 19

<210> 26

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ggagccacat gccctacaca g 21

<210> 27

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

agtccacatg cagcaggttg 20

<210> 28

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

ccattctagc ggggcacag 19

<210> 29

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

ctcttccatt cttcatcctc agc 23

<210> 30

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

gatgggtgtg gaatggcag 19

<210> 31

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

cattcaccaa cttatgccaa ttctc 25

<210> 32

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

ggtcatgtag catttaccac agttg 25

<210> 33

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

gcgaaggatt tctgatctgt gg 22

<210> 34

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

gctggtggct ggagttgc 18

<210> 35

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

caatgtttct tgtctaattt cttggc 26

<210> 36

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

ctggcccagc acatagtcg 19

<210> 37

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

cagagtctgg ggaggaggc 19

<210> 38

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

cagagctgct gagcaatctg c 21

<210> 39

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

gggctcaccc tgcagcac 18

<210> 40

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

gaatgacggc gtggaggac 19

<210> 41

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

gcaaaatcac attattgcca aca 23

<210> 42

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

gggctcccgg aagacagtc 19

<210> 43

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

cctggcctac ctggtcgc 18

<210> 44

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

cgatgaaggc atgtatgttg gc 22

<210> 45

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

gcctcaaaga aaagctgcgt g 21

<210> 46

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

cccgagaggt aaagaacgaa gac 23

<210> 47

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

ggacgagctg gaccactgg 19

<210> 48

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

tgtcagagca ttcagaacca tcc 23

<210> 49

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

ggcgtctgct ggagtgtgc 19

<210> 50

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

tgtagggttt gaagactggg atg 23

<210> 51

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

cccatttatt tcctatagct cctgag 26

<210> 52

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

catttaaggt tccttcaagc tgc 23

<210> 53

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

tgctggattg aaattcactt acacc 25

<210> 54

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

gccgctgagc cactgc 16

<210> 55

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

tcaacagttc aggccagtgc 20

<210> 56

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

gtggtcctca cctatgcctg g 21

<210> 57

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

ctggcctttg gctttgtgc 19

<210> 58

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

cacttctacg acttcttcaa ccagg 25

<210> 59

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

agcccatccc tgactgtgag 20

<210> 60

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

cctgtttgcc atgtttggaa c 21

<210> 61

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

caggttgact gggcagagtg ac 22

<210> 62

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

gttgtctctc ctcctgtcag tgc 23

<210> 63

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

ctgtatcagt ctgtccagca cttcc 25

<210> 64

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

gtgacacagt caaacattaa cttggtg 27

<210> 65

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

cctagcacct gacgcctcg 19

<210> 66

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

ccagcacagg ataaggagca g 21

<210> 67

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

cgttgtccga gctcacctg 19

<210> 68

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

gcttctctct ctcactctct ctctgc 26

<210> 69

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

cctacagtaa caaaggcatg gagc 24

<210> 70

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

ctagtgcatt caagcacaat ggc 23

<210> 71

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

aggtgatcta tttttccctt tctccc 26

<210> 72

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

ggaaggttgt tgaggagata aatgg 25

<210> 73

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

ccatttgaca gaacgggaag c 21

<210> 74

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

gtgattcatt tatttgttca aagcagg 27

<210> 75

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

ctccttactc atggtcggat cac 23

<210> 76

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

gggaccttac cttatacacc gtgc 24

<210> 77

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

gatgggcaga ttacagtggg ac 22

<210> 78

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

ccagcaggcg gcacac 16

<210> 79

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

caggaggcag ccgaagg 17

<210> 80

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

ctccttactt tgcctccttc tgc 23

<210> 81

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

gctcaggact tagcaagaag ttatgg 26

<210> 82

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

gctgaaaatg actgaatata aacttgtgg 29

<210> 83

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

gaaacctgtc tcttggatat tctcg 25

<210> 84

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

gagttaagga ctctgaagat gtacctatgg 30

<210> 85

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

tggtgtgaaa tgactgagta caaactg 27

<210> 86

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

gatggtgaaa cctgtttgtt ggac 24

<210> 87

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

ctccatttta gcacttacct gtgactc 27

<210> 88

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

agatccaatc catttttgtt gtcc 24

<210> 89

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

gggtagagtg tgcgtggctc 20

<210> 90

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

aggaaagtga ctgtaggggc ag 22

<210> 91

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

cctgaggagc gatgacgg 18

<210> 92

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 92

gtgcctgttg gacatcctgg 20

<210> 93

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 93

ctgcctttcg acacatagtt cg 22

<210> 94

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 94

gccctccacg gtactcctg 19

<210> 95

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 95

acggaggcag gcgaagtg 18

<210> 96

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 96

ctcctatggg ttgtcaccaa gc 22

<210> 97

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 97

caaaatatca ctttccataa aagcaagg 28

<210> 98

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 98

gactgtaagt ggtttctcag gaagc 25

<210> 99

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 99

ctccctcaca accttgcgg 19

<210> 100

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 100

caactcctcc acaaggcagc 20

<210> 101

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 101

ctgaatttaa tgtcacaggt cactgc 26

<210> 102

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 102

gctcctggtg gacctgatgc 20

<210> 103

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 103

ggtgcccact ggacagcc 18

<210> 104

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 104

ctctagcctt ttggtccagt gg 22

<210> 105

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 105

cttctccaag accccaactg ag 22

<210> 106

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 106

ctgcatattg gtgtcaaagt gtcac 25

<210> 107

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 107

tggaacattt ggtgaattga gc 22

<210> 108

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 108

tgacaattga tttccccgta gg 22

<210> 109

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 109

cctattgatc tggtggacat tagtgtag 28

<210> 110

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 110

aatcctcgaa cacaaactca tgc 23

<210> 111

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 111

gcaatcccgt actgaagttc g 21

<210> 112

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 112

gactacacag gctgctgctg c 21

<210> 113

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 113

agcctggagc agctagaatc ag 22

<210> 114

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 114

gagacggacg cccacctg 18

<210> 115

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 115

gcagatgctc acatagttgg tgtag 25

<210> 116

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 116

cttgtgagtg gatgggtaaa acc 23

<210> 117

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 117

gctgaagaag atgtggaaaa gtcc 24

<210> 118

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 118

ctggaccaag cccatcacc 19

<210> 119

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 119

gctgagaaca ttgcctatgg agac 24

<210> 120

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 120

gaggctgacc tgaagcactt g 21

<210> 121

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 121

ggaggagctg ctgaagatgt g 21

<210> 122

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 122

caccagctac aggtgcctga g 21

<210> 123

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 123

agtttgctta cacttacgct gcc 23

<210> 124

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 124

ggcattctgc atttctgtgg c 21

<210> 125

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 125

ctccttattt agagtgaact ggattgg 27

<210> 126

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 126

gaaggaacct taaatgtctc tcctacc 27

<210> 127

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 127

cctgtggaca ttggagagtt gac 23

<210> 128

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 128

tgtgggtctg caatcggc 18

<210> 129

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 129

cccaggcaca cgttgtagc 19

<210> 130

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 130

ctccacgtcc tcgtaccagc 20

<210> 131

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 131

caggtggaag taggaggtct tgc 23

<210> 132

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 132

cacatagtcc cggaagctgc 20

<210> 133

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 133

catgcccctc actcacagc 19

<210> 134

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 134

ccaaacatgg caaacaggtt g 21

<210> 135

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 135

ggtacgcctc cagatgagca g 21

<210> 136

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 136

gccttggcaa tcatcttgct c 21

<210> 137

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 137

ctctgcctca accagccac 19

<210> 138

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 138

gaagactgag gagctgttaa agaaagc 27

<210> 139

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 139

ctcctgccag aggttcgc 18

<210> 140

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 140

ctccctttgg aatggcacag 20

<210> 141

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 141

ggagtgggtg ctggactgtc 20

<210> 142

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 142

tgtgaaggag gaggatgaga gc 22

<210> 143

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 143

ggatatggtc cttctcttcc agag 24

<210> 144

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 144

gtccagcatc tccagcagc 19

<210> 145

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 145

gcagaagtct tgcccacatc g 21

<210> 146

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 146

gatcataagg aagttgtgtt gggtc 25

<210> 147

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 147

aagcccctgt ttcatactga cc 22

<210> 148

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 148

tgcaggctcc aagtagattc ac 22

<210> 149

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 149

ggaagactcc tttgaatgca gaag 24

<210> 150

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 150

caagcagaga atgggtactc acg 23

<210> 151

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 151

acttgtcaca atgtcaccac attacatact taccatgcca ctttcccttg tagactgttc 60

caaatgatcc agatccaatt ctttgtccca ctgtaatctg cccatcagga atctcccaat 120

<210> 152

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 152

ggatccagac aactgttcaa actgatggga cccactccat cgagatttca ctgtagctag 60

accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg aggtgtagta 120

<210> 153

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 153

ccaaccaagc tctcttgagg atcttgaagg aaactgaatt caaaaagatc aaagtgctgg 60

gctccggtgc gttcggcacg gtgtataagg taaggtccct ggcacaggcc tctgggctgg 120

<210> 154

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 154

cactgacgtg cctctccctc cctccaggaa gcctacgtga tggccagcgt ggacaacccc 60

cacgtgtgcc gcctgctggg catctgcctc acctccaccg tgcagctcat cacgcagctc 120

<210> 155

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 155

atgcccttcg gctgcctcct ggactatgtc cgggaacaca aagacaatat tggctcccag 60

tacctgctca actggtgtgt gcagatcgca aaggtaatca gggaagggag atacggggag 120

<210> 156

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 156

gccaggaacg tactggtgaa aacaccgcag catgtcaaga tcacagattt tgggctggcc 60

aaactgctgg gtgcggaaga gaaagaatac catgcagaag gaggcaaagt aaggaggtgg 120

<210> 157

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 157

atattcgtcc acaaaatgat tctgaattag ctgtatcgtc aaggcactct tgcctacgcc 60

accagctcca actaccacaa gtttatattc agtcattttc agcaggcctt ataataaaaa 120

<210> 158

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 158

acaaagaaag ccctccccag tcctcatgta ctggtccctc attgcactgt actcctcttg 60

acctgctgtg tcgagaatat ccaagagaca ggtttctcca tcaattacta cttgcttcct 120

<210> 159

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 159

atgattttgc agaaaacaga tctgtattta tttcagtgtt acttacctgt cttgtctttg 60

ctgatgtttc aataaaagga attccataac ttcttgctaa gtcctgagcc tgttttgtgt 120

<210> 160

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 160

taacttcttg ctaagtcctg agcctgtttt gtgtctactg ttctagaagg caaatcacat 60

ttatttccta ctaggaccat aggtacatct tcagagtcct taactctttt aatttgttct 120

<210> 161

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 161

atattcatct acaaagtggt tctggattag ctggattgtc agtgcgcttt tcccaacacc 60

acctgctcca accaccacca gtttgtactc agtcatttca caccagcaag aacctgttgg 120

<210> 162

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 162

cacagaggaa gccttcgcct gtcctcatgt attggtctct catggcactg tactcttctt 60

gtccagctgt atccagtatg tccaacaaac aggtttcacc atctataacc acttgttttc 120

<210> 163

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 163

aaatgacaaa gaacagctca aagcaatttc tacacgagat cctctctctg aaatcactga 60

gcaggagaaa gattttctat ggagtcacag gtaagtgcta aaatggagat tctctgtttc 120

<210> 164

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 164

cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcaca 60

tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120

<210> 165

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 165

aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactc 60

ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120

<210> 166

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 166

cctgcaccct gaagcctgag tgtgtccagc agctgctggt ttgctcccag gaggccaaga 60

agtcagccta ctgcccctac agtcactttc ctgtgggggc tgccctgctc acccaggagg 120

<210> 167

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 167

gtattcgtcc acaaaatggt tctggatcag ctggatggtc agcgcactct tgcccacacc 60

gccggcgccc accaccacca gcttatattc cgtcatcgct cctcaggggc ctgcggcccg 120

<210> 168

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 168

cacacaggaa gccctccccg gtgcgcatgt actggtcccg catggcgctg tactcctcct 60

ggccggcggt atccaggatg tccaacaggc acgtctcccc atcaatgacc acctgcttcc 120

<210> 169

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 169

tgatgctatt cagctacaga tggcttgatc ctgagtcatt tcttcctttt ccatgcagtg 60

tgtccaccgt gatctggctg ctcgcaacgt cctcctggca caaggaaaaa ttgtgaagat 120

<210> 170

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 170

ctgtgacttt ggcctggcca gagacatcat gcatgattcg aactatgtgt cgaaaggcag 60

tgtacgtcct cacttccctc actggtcagg ctcatcctcc ttcactttaa tctctaaagt 120

<210> 171

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 171

atgaaacttc ctggactatt ttggccaaca atgtctcaaa catcatcacg gagatccact 60

cccgagacag gagtaccgtg gagggccgtg tgactttcgc caaagtggag gagaccatcg 120

<210> 172

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 172

gcgcggaagg ggtcctgcca ccgcgccact tggcctgcct ccgtcccgcc gcgccacttg 60

gcctgcctcc gtcccgccgc gccacttcgc ctgcctccgt cccccgcccg ccgcgccatg 120

<210> 173

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 173

cttggcctct gctttttctc ttgtagcctg gttctctggt gtgaacagga gcagatgaca 60

aatagcacct agcttggtga caacccatag gaggtatgcc tataaaatgc catgggccac 120

<210> 174

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 174

taaattattg ttttctctta gatatgcaat aattttccca ctatcattga ttatttcccg 60

ggaacccata acaaattact taaaaacctt gcttttatgg aaagtgatat tttggagaaa 120

<210> 175

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 175

caatttctta acttgatgga aaaattgaat gaaaacatca ggattgtaag caccccctgg 60

atccaggtaa ggccaagttt tttgcttcct gagaaaccac ttacagtctt tttttctggg 120

<210> 176

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 176

tttttctcaa ctcctccaca aggcagtgag cttcctcttg aacacggtcc tcaatgctcc 60

tcttccccat cccaaaattc cgcaaggttg tgagggagaa acgccggatc tccttccatc 120

<210> 177

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 177

ggcgtttctc cctcatgacg ctgcggaatt ttgggatggg gaagaggagc attgaggacc 60

gtgttcaaga ggaagcccgc tgccttgtgg aggagttgag aaaaaccaag ggtgggtgac 120

<210> 178

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 178

tgcaagacag gagccacatg ccctacacag atgctgtggt gcacgaggtc cagagataca 60

ttgaccttct ccccaccagc ctgccccatg cagtgacctg tgacattaaa ttcagaaact 120

<210> 179

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 179

gttctggaag tccacatgca gcaggttgcc cagcccgggc agtggcaggg ggcctggtgg 60

gtagcgtgca gcccagcgtt ggcgccggtg catcaggtcc accaggagca ggaagatggc 120

<210> 180

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 180

gctggggact aggtacccca ttctagcggg gcacagcaca aagctcatag ggggatgggg 60

tcaccaggaa agcaaagaca ccatggtggc tgggccgggg ctgtccagtg ggcaccgaga 120

<210> 181

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 181

gaaggttgga gacagcaatg atcgtaatct cttccattct tcatcctcag ctatagagat 60

ggcacttttc ataaatccca ctggaccaaa aggctagagt tcaaagcaga aacattttgt 120

<210> 182

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 182

acaatgtcaa ggactggcaa gagtgccaca tgtgatgggt gtggaatggc agctcactgt 60

agcaggtgct ggggactcag ttggggtctt ggagaagcac ttagttatag caagaatgtc 120

<210> 183

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 183

taaataaaca ttcaccaact tatgccaatt ctcttgtttt agatgttaaa tcacacttac 60

gttgtctgga aagtcagcct ttagttcagt gacactttga caccaatatg cagccgtttt 120

<210> 184

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 184

ggtagccaga atcattacag gtcatgtagc atttaccaca gttgatacac atttcttcat 60

caatcatagc cacaacttgc tctacgttgc tcaattcacc aaatgttcca aggtactgca 120

<210> 185

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 185

ggcttcagac attttttctg ggggaggcag cgaaggattt ctgatctgtg ggatactcat 60

tgctttgaat acctacgggg aaatcaattg tcatggttaa aattttgaaa ctagcttaca 120

<210> 186

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 186

tcttcgaatc attgatgtgc tggtggctgg agttgcgcta gcaagaccaa aaggatttat 60

aaacttcaat ccggccattt ctacactaat gtccaccaga tcaataggag tgtaaaagag 120

<210> 187

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 187

gttcttatca ggatttcttt tccaatgttt cttgtctaat ttcttggccg aagtggaacg 60

cagagttgca tgagtttgtg ttcgaggatt taaagccagg atactctaaa gacagcataa 120

<210> 188

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 188

gcacaggtgc tctggcccag cacatagtcg ggaattacgt cgccaaattc ccagggcaca 60

ttgcgcacga acttcagtac gggattgccc ctctggggag ggacgaaggg cagaagccat 120

<210> 189

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 189

cgccactgaa ttcagagtct ggggaggagg ctcccacagg ccgggacaag aagcggaagc 60

agcagcagca gcagcctgtg tagtctgccc ccgggaaact gaggaactaa agaaagctga 120

<210> 190

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 190

aaccgtttat ggccccaccc gccccactca gagctgctga gcaatctgct ctatcctctt 60

cagcgtctcc tctgattcta gctgctccag gctgagcagg gacaggccca gctgatcctc 120

<210> 191

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 191

gaggcgggaa agggactggg gggcagcggg gggtcggggc tcaccctgca gcacttcgtc 60

gggcagcacg gggttggcca ggtgggcgtc cgtctcccgg gcggcgctgg cctcccgcag 120

<210> 192

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 192

aggaggcagc cctggtggac atggtgaatg acggcgtgga ggacctccgc tgcaaataca 60

tctccctcat ctacaccaac tatgtgagca tctgcaccag ggttgggcac tgggggctga 120

<210> 193

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 193

aaaaacatgc aaaatcacat tattgccaac atgacttact tgatccccat aagcatgacg 60

acctatgatg ataggtttta cccatccact cacaagccgg gggatatttt tgcagataat 120

<210> 194

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 194

ggtgcccagg tcagtggatc ccctctccac cctggcctac ctggtcgcca tgggcgtgcc 60

tgccaatggt gatgggcttg gtccagccag ggactaggcg tgggatgttt ttgcagatga 120

<210> 195

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 195

ggcgtgggat gtttttgcag atgatgggct cccggaagac agtccccccc aggatgttcc 60

ggatagttcc attgggactt ttccacatct tcttcagctt gaactctgtg aggacagaga 120

<210> 196

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 196

cttacattag gcagtgactc gatgaaggca tgtatgttgg cctcctttgc tgccctcaca 60

atctcttcct gtgacaccac ccggctgttg tctccatagg caatgttctc agcaatgctg 120

<210> 197

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 197

ccttcacaaa gcggaagaat gtgtcagcct caaagaaaag ctgcgtgatg atgaaatcgg 60

ctcccgcaga caccttctcc ttcaagtgct tcaggtcagc ctcaaagctc cctgcttcgg 120

<210> 198

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 198

tgtgaccatt ccggtttggt tctcccgaga ggtaaagaac gaagacttca aagacacttt 60

cttcactggt cagctcctcc ccccacatct tcagcagctc ctccttgggg gacttgctct 120

<210> 199

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 199

accaccacca ccacagccgc accttggcgt gagctcagca gccagcggcc acctgggccg 60

gagcttcctg agtggagagc cgagccaggc agacgtgcag ccactgggcc ccagcagcct 120

<210> 200

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 200

ggcggtgcac actattctgc cccaggagag ccccgccctg cccacgtcgc tgccatcctc 60

gctggtccca cccgtgaccg cagcccagtt cctgacgccc ccctcgcagc acagctactc 120

<210> 201

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 201

ctcgcctgtg gacaacaccc ccagccacca gctacaggtg cctgagcacc ccttcctcac 60

cccgtcccct gagtcccctg accagtggtc cagctcgtcc ccgcattcca acgtctccga 120

<210> 202

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 202

ctggtccgag ggcgtctcca gccctcccac cagcatgcag tcccagatcg cccgcattcc 60

ggaggccttc aagtaaacgg cgcgccccac gagaccccgg cttcctttcc caagccttcg 120

<210> 203

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 203

ggcgtctgtg tgcgctctgt ggatgccagg gccgaccaga ggagcctttt taaaacacat 60

gtttttatac aaaataagaa cgaggatttt aatttttttt agtatttatt tatgtacttt 120

<210> 204

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 204

tcggaccagt cggagacgtt ggaatgcggg gacgagctgg accactggtc aggggactca 60

ggggacgggg tgaggaaggg gtgctcaggc acctgtagct ggtggctggg ggtgttgtcc 120

<210> 205

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 205

atcaggacag accacccaga agctggctgt cagagcattc agaaccatcc acctacccgg 60

aagggtcctt tgtcatacat ggcagcgtaa gtgtaagcaa actctcctat gaacactcgc 120

<210> 206

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 206

ttccaggatt tgaattcggg cgtctgctgg agtgtgccca atgctatatg tcagttgagg 60

ttctaagact tggaagccac agaaatgcag aatgccactc tgaggataca gaaagcacag 120

<210> 207

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 207

ctaataattg tctttacttt ccttgtaggg tttgaagact gggatgtatt atttaaggac 60

aagaccagcg gctaatccaa tccagttcac tctaaataag gagaagctaa aagataaag 119

<210> 208

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 208

tgttctttcc catttatttc ctatagctcc tgagtattgg tgttccattg cttactttga 60

aatggatgtt caggtaggag agacatttaa ggttccttca agctgcccta ttgttactgt 120

<210> 209

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 209

tcaggtagga gagacattta aggttccttc aagctgccct attgttactg ttgatggata 60

cgtggaccct tctggaggag atcgcttttg tttgggtcaa ctctccaatg tccacaggac 120

<210> 210

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 210

ttccttcaag ctgccctatt gttactgttg atggatacgt ggacccttct ggaggagatc 60

gcttttgttt gggtcaactc tccaatgtcc acaggacaga agccattgag agagcaaggt 120

<210> 211

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 211

gcatcaaaga aacaccttgc tggattgaaa ttcacttaca ccgggccctc cagctcctag 60

acgaagtact tcataccatg ccgattgcag acccacaacc tttagactga ggtcttttac 120

<210> 212

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 212

gaggaggagc gcggcggtga ctggccctcc gccgccgctg agccactgcg gccgggctgc 60

cccctgcgag ccgctgcgct acaacgtgtg cctgggctcg gtgctgccct acggggccac 120

<210> 213

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 213

agaatgaggt gcagaacatc aagttcaaca gttcaggcca gtgcgaagtg cccttggttc 60

ggacagacaa ccccaagagc tggtacgagg acgtggaggg ctgcggcatc cagtgccaga 120

<210> 214

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 214

ggtttggttt gtggtcctca cctatgcctg gcacacttcc ttcaaagccc tgggcaccac 60

ctaccagcct ctctcgggca agacctccta cttccacctg ctcacctggt cactcccctt 120

<210> 215

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 215

cctttggctt tgtgctcatt accttcagct gccacttcta cgacttcttc aaccaggctg 60

agtgggagcg cagcttccgg gactatgtgc tgtgagtgag gggcatggag gcggcagtgc 120

<210> 216

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 216

accatcgggc tgcccaccaa gcagcccatc cctgactgtg agatcaagaa tcgcccgagc 60

cttctggtgg agaagatcaa cctgtttgcc atgtttggaa ctggcatcgc catgagcacc 120

<210> 217

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 217

tctggtggag aagatcaacc tgtttgccat gtttggaact ggcatcgcca tgagcacctg 60

ggtctggacc aaggccacgc tgctcatctg gaggcgtacc tggtgcaggt gggcatggca 120

<210> 218

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 218

ctccttccct atcccttctg ctctcaggtt gactgggcag agtgacgatg agccaaagcg 60

gatcaagaag agcaagatga ttgccaaggc cttctctaag cggcacgagc tcctgcagaa 120

<210> 219

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 219

gagccagggc cccaggctcg tgttgtctct cctcctgtca gtgcccccag aggaacaagc 60

caacctgtgg ctggttgagg cagagatctc cccagagctg cagaagcgcc tgggccggaa 120

<210> 220

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 220

ccctgctgta tcagtctgtc cagcacttcc attggggagg tagagggcac accatcttcc 60

tctgtgtttc cttttgcttt ctttaacagc tcctcagtct tcctgatgac aaaatgatgg 120

<210> 221

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 221

tttttatagt cacgtgacac agtcaaacat taacttggtg tatcgattgg tttttgccat 60

atatatatat ataagtagga gagggcgaac ctctggcagg agcaaaggcg ccatggctgt 120

<210> 222

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 222

agcagagggg acatgaaata gttgtcctag cacctgacgc ctcgttgtac atcagagacg 60

gagcatttta caccttgaag acgtaccctg tgccattcca aagggaggat gtgaaagagt 120

<210> 223

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 223

attcctggca ttgcccagca caggataagg agcagggttg gcgtgtgagg ccttacctct 60

gggagggcag ccgccgacgc atgcggtgac agtccagcac ccactcctta cgcacgatgc 120

<210> 224

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 224

ccctactcac tcaggaccca cgttgtccga gctcacctgg ggatgtcttg ttgatccggc 60

tgaagaagag agcccccggc ctcagagagt tggcgctctc atcctcctcc ttcacacgga 120

<210> 225

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 225

ctctttgagc ttctctctct cactctctct ctgcgcattc aggagtgtac acatttctgt 60

ccagcaccct gaagtctctg gaagagaagg accatatcca ccgagtcctg gacaagatca 120

<210> 226

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 226

ctacagtaac aaaggcatgg agcatctgta cagcatgaag tgcaagaacg tggtgcccct 60

ctatgacctg ctgctggaga tgctggacgc ccaccgccta catgcgccca ctagccgtgg 120

<210> 227

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 227

ggcttttgtt ttcttccctt tagatgctct gcttctgtac tgccagtgga tgtgcagaca 60

ctaaactcat ctgggccacc gtttggaaag ctagtggttc agagttctat agattctagt 120

<210> 228

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 228

gcattcaagc acaatggcac ggttgaatgt aaggcttaca acgatgtggg caagacttct 60

gcctatttta actttgcatt taaaggtaac aacaaaggta tatttctttt taatccaatt 120

<210> 229

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 229

aatgactgag acaataatta ttaaaaggtg atctattttt ccctttctcc ccacagaaac 60

ccatgtatga agtacagtgg aaggttgttg aggagataaa tggaaacaat tatgtttaca 120

<210> 230

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 230

tagacccaac acaacttcct tatgatcaca aatgggagtt tcccagaaac aggctgagtt 60

ttggtcagta tgaaacaggg gctttccatg tcaccttttt gggtacacat aacagtgact 120

<210> 231

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 231

ttagcgagtg cccatttgac agaacgggaa gccctcatgt ctgaactcaa agtcctgagt 60

taccttggta atcacatgaa tattgtgaat ctacttggag cctgcaccat tggaggtaaa 120

<210> 232

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 232

tatatatctc accttctttc taaccttttc ttatgtgctt ttagggccca ccctggtcat 60

tacagaatat tgttgctatg gtgatctttt gaattttttg agaagaaaac gtgattcatt 120

<210> 233

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 233

tatttgttca aagcaggaag atcatgcaga agctgcactt tataagaatc ttctgcattc 60

aaaggagtct tcctggtaag actgatttac ataaatagtt agctgttgac aggcagttca 120

<210> 234

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 234

cactctttac aagttaaaat gaatttaaat ggttttcttt tctcctccaa cctaatagtg 60

tattcacaga gacttggcag ccagaaatat cctccttact catggtcgga tcacaaagat 120

Claims

1.一种基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，包括以下步骤：

(2)通过局部双链互补配对和连接反应使所述DNA片段的末端与接头连接，局部双链结构有助于提高单链连接效率；

(5)利用所述第二扩增模板进行通用PCR，得到杂交捕获用片段，所述通用PCR的引物包括通用引物和第二INDEX引物；

(6)使探针和所述杂交捕获用片段进行接触，从而捕获目标片段；

进一步包括进行捕获后PCR，从而得到测序文库的步骤，其中测序文库中的片段长度为150-500bp；

其中，所述特异性引物包含第一通用引物结合序列和能够与目标序列一侧的序列特异性互补结合的结合序列，所述第一INDEX引物或所述第二INDEX引物各自分别包含第二通用引物结合序列和INDEX序列，且第一INDEX引物和第二INDEX引物各自的至少一部分与所述接头的序列的至少一部分相同，从而能够使INDEX引物能够与所述DNA片段形成双链结构。

2.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述第一INDEX引物和所述第二INDEX引物为相同引物。

3.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述第一通用引物结合序列和所述第二通用引物结合序列为相同的序列。

4.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述生物样本为血液，包括全血、血浆、血清。

5.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述DNA片段为cfDNA或ctDNA或人工片段化DNA片段。

6.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述接头包含条形码序列。

7.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，进一步包括对测序文库进行测序的步骤。

8.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法，其特征在于，所述连接臂为poly C，C的个数为1-10；所述互补臂为poly G，G的个数为1-10。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述单链DNA包含突变。