CN113462759B - 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 - Google Patents
基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 Download PDFInfo
- Publication number
- CN113462759B CN113462759B CN202110882685.7A CN202110882685A CN113462759B CN 113462759 B CN113462759 B CN 113462759B CN 202110882685 A CN202110882685 A CN 202110882685A CN 113462759 B CN113462759 B CN 113462759B
- Authority
- CN
- China
- Prior art keywords
- artificial sequence
- dna
- sequencing
- sequence
- stranded dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020004414 DNA Proteins 0.000 title claims abstract description 332
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000000523 sample Substances 0.000 title claims abstract description 67
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 50
- 102000053602 DNA Human genes 0.000 title claims abstract description 48
- 230000003321 amplification Effects 0.000 title claims abstract description 43
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 43
- 108020004682 Single-Stranded DNA Proteins 0.000 title claims abstract description 41
- 230000035772 mutation Effects 0.000 title claims abstract description 13
- 238000001514 detection method Methods 0.000 title abstract description 18
- 239000012634 fragment Substances 0.000 claims description 63
- 238000009396 hybridization Methods 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 17
- 238000007403 mPCR Methods 0.000 claims description 14
- 239000012472 biological sample Substances 0.000 claims description 6
- 210000004369 blood Anatomy 0.000 claims description 6
- 239000008280 blood Substances 0.000 claims description 6
- 210000002381 plasma Anatomy 0.000 claims description 5
- 238000010438 heat treatment Methods 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 claims description 2
- 210000002966 serum Anatomy 0.000 claims description 2
- 238000002405 diagnostic procedure Methods 0.000 claims 8
- 238000010276 construction Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000011324 bead Substances 0.000 description 53
- 239000000047 product Substances 0.000 description 18
- 238000002156 mixing Methods 0.000 description 17
- 239000000203 mixture Substances 0.000 description 16
- 239000006228 supernatant Substances 0.000 description 14
- 239000000872 buffer Substances 0.000 description 13
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 239000007788 liquid Substances 0.000 description 11
- 239000000243 solution Substances 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 8
- 102000039446 nucleic acids Human genes 0.000 description 8
- 108020004707 nucleic acids Proteins 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 238000003908 quality control method Methods 0.000 description 8
- 210000004027 cell Anatomy 0.000 description 7
- 238000010828 elution Methods 0.000 description 7
- 239000011534 wash buffer Substances 0.000 description 7
- 239000012224 working solution Substances 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000007664 blowing Methods 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000011528 liquid biopsy Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 239000002096 quantum dot Substances 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 238000001704 evaporation Methods 0.000 description 3
- 239000011259 mixed solution Substances 0.000 description 3
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 2
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 2
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 2
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 2
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 239000012295 chemical reaction liquid Substances 0.000 description 2
- 239000003480 eluent Substances 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- 102100029361 Aromatase Human genes 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 108010026925 Cytochrome P-450 CYP2C19 Proteins 0.000 description 1
- 108010000561 Cytochrome P-450 CYP2C8 Proteins 0.000 description 1
- 108010000543 Cytochrome P-450 CYP2C9 Proteins 0.000 description 1
- 108010001237 Cytochrome P-450 CYP2D6 Proteins 0.000 description 1
- 108010081668 Cytochrome P-450 CYP3A Proteins 0.000 description 1
- 102100029363 Cytochrome P450 2C19 Human genes 0.000 description 1
- 102100029359 Cytochrome P450 2C8 Human genes 0.000 description 1
- 102100029358 Cytochrome P450 2C9 Human genes 0.000 description 1
- 102100021704 Cytochrome P450 2D6 Human genes 0.000 description 1
- 102100039205 Cytochrome P450 3A4 Human genes 0.000 description 1
- 102100035186 DNA excision repair protein ERCC-1 Human genes 0.000 description 1
- 230000009946 DNA mutation Effects 0.000 description 1
- 101100226017 Dictyostelium discoideum repD gene Proteins 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 102100022334 Dihydropyrimidine dehydrogenase [NADP(+)] Human genes 0.000 description 1
- 101150105460 ERCC2 gene Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 description 1
- 102100030943 Glutathione S-transferase P Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000919395 Homo sapiens Aromatase Proteins 0.000 description 1
- 101000876529 Homo sapiens DNA excision repair protein ERCC-1 Proteins 0.000 description 1
- 101000902632 Homo sapiens Dihydropyrimidine dehydrogenase [NADP(+)] Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101001010139 Homo sapiens Glutathione S-transferase P Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 101000587058 Homo sapiens Methylenetetrahydrofolate reductase Proteins 0.000 description 1
- 101000973778 Homo sapiens NAD(P)H dehydrogenase [quinone] 1 Proteins 0.000 description 1
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 1
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101000809797 Homo sapiens Thymidylate synthase Proteins 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100029684 Methylenetetrahydrofolate reductase Human genes 0.000 description 1
- 102100022365 NAD(P)H dehydrogenase [quinone] 1 Human genes 0.000 description 1
- 101100384865 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cot-1 gene Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 1
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 102100038618 Thymidylate synthase Human genes 0.000 description 1
- 102100029152 UDP-glucuronosyltransferase 1A1 Human genes 0.000 description 1
- 101710205316 UDP-glucuronosyltransferase 1A1 Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 102000002258 X-ray Repair Cross Complementing Protein 1 Human genes 0.000 description 1
- 108010000443 X-ray Repair Cross Complementing Protein 1 Proteins 0.000 description 1
- 108700031763 Xeroderma Pigmentosum Group D Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- JCCNYMKQOSZNPW-UHFFFAOYSA-N loratadine Chemical compound C1CN(C(=O)OCC)CCC1=C1C2=NC=CC=C2CCC2=CC(Cl)=CC=C21 JCCNYMKQOSZNPW-UHFFFAOYSA-N 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 241000264288 mixed libraries Species 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000003805 vibration mixing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法及在突变检测中的应用。本发明的方法首先对DNA进行单链化,在随后的单链建库过程中有效地将双链DNA和单链DNA被建库保留进入下一个实验环节。在此基础上整合和优化目标区域的捕获和扩增技术,结果不仅可以有效提高富集区域重要突变的检出率和稳定性,而且可以兼容低起始量DNA文库构建。本发明的方法能够克服单链建库单链ctDNA漏检的问题,提供了一种极大改善低质量和微量DNA样本建库效果的技术方案。
Description
技术领域
本发明涉及基因测序,具体地涉及对单链DNA序列富集的测序方法及其在突变检测中的应用,尤其是涉及基于多重扩增和探针杂交捕获对单链DNA序列富集和突变的测序方法及其应用。
背景技术
近年来,液体活检技术在临床方面特别是在辅助肿瘤患者诊断、治疗和术后监控等方面得到广泛的应用。相比于传统的术中取样,液体活检通过抽血获得样品。健康人中,人体各组织细胞自然凋亡,细胞核内DNA分子被一系列消化处理后,变成碎片化核酸分子被释放到血浆等体液中。当组织发生肿瘤时,大量的特异组织肿瘤细胞的碎片化核酸分子被释放到血浆中。
血浆游离DNA又称cfDNA(cell free DNA),是指外周血中游离于细胞外的DNA,cfDNA的来源既包括正常细胞,也有异常细胞(如肿瘤细胞)或者外源的微生物(如病毒DNA),具体包括自身正常细胞代谢的凋亡小体,肿瘤细胞碎片、外泌体等。循环肿瘤DNA(Circulating tumor DNA),即ctDNA是指从原发肿瘤甚至是转移形成的新肿瘤细胞破裂掉落下来到循环外周血中的DNA。ctDNA在临床医学中具有重要意义,ctDNA的检测在肿瘤的早期检测,肿瘤的靶向治疗和后期的疾病监控等方面具有重要的临床价值。cfDNA检测难点主要是含量低,人群在10ng-50ng。
目前常用建库均为双链建库,主要存在的问题如下:1.样本起始量100ng起,无法有效针对低起始量的单链DNA建库;2.成本问题;3.样本DNA的低质量,很多困难样本如FFPE样本、液体活检cfDNA,法医样本、微量样本因其自身的特性,单链化DNA占比较高,双链建库可能会导致测序覆盖度偏差较大,有效目标区域测序不完整,影响突变检出,同时存在着很大的建库失败风险。目前对于如何降低建库失败风险,尤其是提高目的片段的捕获效率以及测序数据质量,从而得到有效的变异检出率仍面临挑战。
发明内容
针对现有技术中存的至少部分技术问题,发明人在深入研究后发现血液中存在部分呈单链形式的ctDNA,而目前建库方法往往会忽略这类单链DNA,造成检测有遗漏。基于此,发明人提出一种可以极大改善低质量和微量DNA样本建库效果的技术方案。通过对单链状态的DNA使用带有通用引物结合区的上游引物组合INDEX引物进行多重PCR后,再经杂交捕获富集目的片段。这种组合方式可极大提高目标区域片段的有效富集。本发明的方法不仅可以有效提高富集区域重要突变的检出率和稳定性,而且可以兼容低起始量DNA文库构建。具体地,本发明包括以下内容。
本发明的第一方面,提供一种基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,包括以下步骤:
(1)提供来自生物样本的单链状态的DNA片段,在所述DNA片段的末端连接一连接臂,所述连接臂设计为能够通过接头的互补臂与接头连接;
(2)通过局部双链互补配对和连接反应使DNA片段的末端与接头连接,局部双链结构有助于提高单链连接效率;
(3)加热使所述接头与所述DNA片段分离,从而形成单链状态的第一扩增模板;
(4)利用所述第一扩增模板进行多重PCR,得到第二扩增模板,其中,所述多重PCR的引物包括特异性引物和第一INDEX引物;
(5)利用所述第二扩增模板进行通用PCR,得到杂交捕获用片段,通用PCR的引物包括通用引物和第二INDEX引物;
(6)使探针和所述杂交捕获用片段进行接触,从而捕获目标片段。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,进一步包括进行捕获后PCR,从而得到测序文库的步骤,其中测序文库中的片段长度为150-500bp。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,第一INDEX引物和第二INDEX引物为相同引物。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,所述特异性引物包含第一通用引物结合序列和能够与靶标一侧的序列特异性互补结合的结合序列,所述第一INDEX引物或所述第二INDEX引物各自分别包含第二通用引物结合序列和INDEX序列,且第一INDEX引物和第二INDEX引物各自的至少一部分能够与DNA片段的至少一部分互补结合,从而使INDEX引物能够与单链DNA序列结合。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,所述第一通用引物结合序列和所述第二通用引物结合序列为相同的序列。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,所述生物样本为血液,其包括全血、血浆、血清;所述DNA片段为cfDNA、ctDNA或人工片段化DNA片段。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,所述接头包含条形码序列。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,进一步包括对测序文库进行测序的步骤。
根据本发明所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法,优选地,所述连接臂为poly C,即多聚C尾,其中C的个数为1-10;所述互补臂为poly G,即多聚C尾,其中G的个数为1-10。
本发明的第二方面,提供根据第一方面的方法在单链DNA突变检测中的应用。
本发明的方法通过组合单链建库、探针捕获以及多重PCR,实现了医学样品中单链化DNA的建库和目标基因区域的富集和测序。在目标区域有效数据量占比上,本发明的方法相比于单独单链建库(3%)、单独探针捕获杂交富集(30%-40%)和单独多重扩增(1%-5%),具有统计显著性提升,有效目标区域数据达到80-90%。另外,在目标区域覆盖的均一性和序列覆盖层数上,本发明的方法也显著优于其他单独建库测序的方法。本发明的方法可以有效提高肿瘤筛查液体活检样品中的单链核酸的捕获效率和突变的检出率,使得检测更加稳定,且准确度更高。
附图说明
图1为本发明示例性单链DNA富集流程图。
图2为本发明示例性探针捕获流程图。
图3为多重PCR扩增后的产物长度分布区间结果。
图4为通用PCR扩增后的产物长度分布区间结果。
图5为本发明示例性的富集得到的测序文库的质检结果。
具体实施方式
现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。
应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为具体公开了该范围的上限和下限以及它们之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。
除非另有说明,否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。
本文所用的术语“样本”涉及包含一种或多种所关注的分析物的材料或材料混合物,通常但不一定为液体形式。本发明的样本含有核酸样本,核酸样本可以是复杂样品,其包含多种不同的含有目的序列的分子,这样的样本可具有多于10、50、100或200个不同的核酸分子。
本文中,DNA片段可源于任何来源,例如基因组DNA、cDNA(来自RNA)、cfDNA、ctDNA或人工DNA构建体或人工片段化DNA片段。在某些实施方案中,DNA片段为cfDNA。在另外的实施方案中,DNA片段为ctDNA。本文可以采用含有DNA片段(例如基因组DNA)的任何样品,包括但不限于血液、组织样品或FFPE样品。优选地,本发明中基因组DNA片段源自人基因组DNA。
本文所用的术语“条形码序列”是指将唯一性核苷酸序列,用于在反应中鉴定和/或跟踪多核苷酸的来源。“条形码序列”与“分子标签”可互换使用,条形码序列可位于寡核苷酸的5’末端或3’末端。在一些实施方案中,条形码可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸或更长的长度。
本发明所用术语“INDEX”具有本领域通常的含义,是指索引标签,具体指一段用于区分不同测序样品的核苷酸序列。优选地,索引标签序列长度为20个核苷酸或更少。例如,索引标签序列长度可以为1-10个核苷酸或4-6个核苷酸。
本发明各个步骤的条件对于实现本发明的目的是重要的。需要说明的是,本发明步骤(1)-(6)中所用试剂的浓度、引物间体积比或特定扩增程序适用于本发明的方法而存在。如无特别说明,本发明所用试剂均购自于已知商品和试剂盒。
[步骤(1)]
在步骤(1)中,提供来自生物样本的单链状态的DNA片段,在所述DNA片段的末端连接单链连接臂,使所述连接臂通过接头的互补臂与接头连接。单链的DNA片段可以源自双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)。例如,可以使用本领域熟知的标准技术将双链DNA分子转化为成单链DNA。含有单链DNA序列的核酸样本的精确序列对于本文展示的公开内容通常是不重要的,并且可能是已知或未知的。
本发明的步骤(1)可选地包括对来自生物样本的DNA进行片段化的步骤,其可以以任何合适的方式被片段化,优选被随机片段化。这样的片段化方法是本领域已知的,适用于本文的方法的具体实施方案的说明性方法包括但不限于剪切、超声处理、酶消化。
在一些实施方案中,随机片段化通过机械手段,例如雾化或超声处理产生长度约150-500bp的片段,优选长度约150-500bp的片段,还优选长度为199-451bp的片段。
本发明步骤(1)中的连接臂不特别限定,只要连接臂能够与互补臂形成双链结构,从而将接头可分离地连接至单链DNA分子末端,特别是3’末端即可。连接臂与互补臂可以是互补核酸分子。在示例性实施方案中,连接臂为poly C,C的个数为1-10,优选2-8,还优选3-6。互补臂为poly G,G的个数为1-10,优选2-8,还优选3-6。优选C的个数与G的个数相同,以实现核酸分子中C碱基与G碱基以氢键互补锁定。本领域还可以理解,连接臂还可以是polyA,互补臂可以是poly T。
优选地,步骤(1)中单链DNA片段的浓度为1.5-10ng/μL,优选2.5-8ng/μL,还优选3.5-7.5ng/μL。含接头的分子的体积为0.5-5.5μl,优选1.5-4.5μl,还优选2.1-3.5μl。
[步骤(2)和(3)]
本发明中,通过连接反应使连接臂与单链DNA片段连接,局部双链结构有助于提高单链连接效率。通过例如加热使互补臂和接头的复合结构与单链DNA片段分离,形成第一扩增模板,其为单链形式的DNA分子。加热温度为85-99℃,优选为90-98℃。
优选地,在步骤(3)之后进一步包括对连接产物进行纯化的步骤,纯化时可以使用磁珠法,优选地,磁珠为1.2×的磁珠。
[步骤(4)]
在步骤(4)中,利用所述第一扩增模板进行多重PCR,得到第二扩增模板,其中,所述多重PCR的引物包括特异性引物和第一INDEX引物。第二扩增模板可以是双链DNA分子。PCR引物不特别限定,可根据目标片段序列而具体设计。在某些示例性实施方案中,目标片段选自BRAF、EGFR、KRAS、NRAS、PIK3CA、PIK3CA、AKT1、CDA、HRAS、PDGFRA、TYMS、CYP19A1、CYP2C19、CYP2C8、CYP2C9、CYP2D6、CYP3A4、DHFR、DPYD、ERCC1、ERCC2、GSTP1、IDH1、IDH2、MDR1(ABCB1)、MTHFR、NOTCH1、NQO1、RRM1、SMAD4、SMAD4、SMO、TSC1、UGT1A1、XRCC1、ESR1和KIT。所述特异性引物具有如SEQ ID NO.1-75所示的正向引物序列以及SEQ ID NO.76-150所示的反向引物序列。
在本发明的步骤(4)中,第一扩增模板和INDEX引物的浓度不特别限定,可由本领域技术人员自由设定。可选地,第一扩增模板(10uM)与INDEX引物(10uM时)的体积比为3-12:1,优选5-12:1,还优选6-10:1。特异性引物与INDEX引物的体积比为0.5-1.2:1,还优选1:1。其中,INDEX引物的体积为0.5-4.5μl,优选0.8-2.5μl,还优选1.1-2.1μl。
[步骤(5)]
在步骤(5)中,利用所述第二扩增模板进行通用PCR,得到杂交捕获用片段,第二扩增模板的引物包括通用引物(10uM)和第二INDEX引物(10uM时)。第二扩增模板与通用引物的体积比为11-25:1,优选15-20:1,还优选16-20:1。使用的通用引物的体积为0.5-4.5μl,优选0.8-2.5μl,还优选1.1-2.1μl。通用引物和第二INDEX引物体积比为0.5-1.2:1,优选1:1。
优选地,进一步包括对得到的杂交捕获用片段进行纯化的步骤,纯化方法不特别限定,优选使用磁珠法,可使用例如0.9×磁珠。
[步骤(6)]
在步骤(6)中,使探针和所述杂交捕获用片段进行接触,从而捕获目标片段。本发明中,捕获探针中探针的数量不限定,可根据需要而变化,例如可以是探针组。一般而言,探针的数量为50条以上,优选100条以上,更优选500条以上,例如1000条、2000条等。本发明中,加入的探针的体积为1-10μl,优选2-8μl,还优选3-7μl。杂交捕获用片段为200-700ng,优选300-600ng,还优选400-550ng。其中,所述探针的浓度为0.5-1pmol,优选0.6-0.8pmol。
本发明中,探针与杂交捕获用片段进行接触的时间为10-20h,优选12-18h,还优选13-17h。在某些实施方案中,本发明中,探针上可进一步包含用于分离的功能基团,例如生物素等。通过此类功能基团可使探针与载体等进行结合或分离。例如将探针预先固定至磁珠或基片等载体。在具体实施方案中,含有目标序列的片段和带有生物素标记的探针直接杂交,然后通过生物素亲和素的反应使该片段锚定在带有亲和素的磁珠上,洗去非目标序列的片段。
在步骤(6)中,用于杂交的磁珠体积为80-120μl,优选90-110μl,还优选95-105μl。用于目的片段筛选时的温度为60-70℃,优选62-68℃,还优选63-67℃。用于目的片段筛选的时间为30-70min,优选35-65min,还优选40-50min。其中,用于杂交的磁珠浓度一般为8-15mg/ml,优选9-11mg/ml。
本发明中,在步骤(6)后进一步包括进行捕获后PCR,从而得到测序文库的步骤,其中测序文库中的片段长度为150-500bp,优选为150-450bp。捕获后PCR可使用本领域已知的方法进行。例如通过使用P5引物和P7引物进行PCR,其者的用量不特别限定,可以是例如1:1。
优选地,本发明进一步包括对捕获后PCR产物进行纯化的步骤,纯化方法不特别限定,优选磁珠法,磁珠法的磁珠可以是例如0.9×的磁珠。
本发明方法的捕获效率不低于86%,优选不低于90%,还优选不低于91%。例如92%、93%、94%、95%、96%、97%、98%以上。
本发明方法的目标区域或目的片段或靶序列的读长百分比不低于86%,优选不低于90%,还优选不低于91%。例如92%、93%、94%、95%、96%、97%、98%。
本发明方法的测序数据中的重复序列不高于11%,优选不高于10%,还优选不高于8%。例如7%、6%、5%、4%、3%、2%、1%以下。
本发明方法的测序数据中的有效目标区域数据不低于80%,优选不低于85%,更优选不低于90%。
需要注意的是,在本发明的步骤(1)-(6)前后,或步骤之间还可包含其他步骤或操作,例如进一步优化和/或改善本发明所述的方法。需要说明的是,在本发明的方法中,缺少步骤中的任何一个或改变步骤的顺序,例如先进行步骤(4),再进行步骤(5),或步骤的替换,例如使用常规单链建库对本发明的步骤进行替换,均不能实现本发明的目的。
实施例
对单链状态的cfDNA使用带有通用引物结合区的上游引物FP MIX组合INDEXprimer进行多重PCR后,再经杂交捕获富集目的片段。本发明的方法可极大提高目标区域片段的有效富集。具体流程参见图1和图2。下面详细说明。
一、材料或设备
1.gDNA片段化(Fragmentation of Genomic DNA)
1.1M220开机,用AFA-grade water注水。待温度降至10℃以下方可使用。
1.2打断参数:设置相应参数340s,打断至150bp。
1.3将50μl体系(DNA样本+ddH2O)加入到covaris玻璃管中,短暂离心后将玻璃管放进细胞破碎仪中进行DNA打断。
1.4结束后将玻璃管中片段化的DNA转移至标记好的PCR管中。用Qubit检测浓度进行质控。
2.DNA模板预处理
热循环仪(PCR仪)提前置于95℃,热盖温度设定为105℃,配制T7 Tailing&Ligation预混液,冰上放置待用。
2.1取片段化DNA100ng放到0.2ml的PCR管中,放入Low-EDTA调整到总体积为15ul。
2.2待PCR仪稳定到95℃,将PCR管放入PCR仪中,进行95℃孵育2min后。立即将PCR管置于冰上进行冷却,静置2min。
3.单链接头连接
PCR仪提前置于37℃,热盖温度设定为105℃。
3.1按照下表配制T7 Tailing&Ligation预混液,需提前配制,冰上放置不超过20min。
表1-T7 Tailing&Ligation体系
| 试剂 | 体积 |
| T7 Buffer | 4μl |
| T7 Adapter | 2.5μl |
| T7 Enzyme Mix | 3μl |
| Low-EDTA TE | 15.5μl |
| Total | 25μl |
3.2取25ulT7 Tailing&Ligation预混液加入到冰上放置的预处理DNA样本PCR管中,使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底。
3.3将PCR管置于PCR仪(热盖温度105℃),进行T7 Tailing&Ligation。
表2-T7 Tailing&Ligation程序
| 温度 | 时间 |
| 37℃ | 15min |
| 95℃ | 2min |
| 4℃ | hold |
3.4连接产物磁珠纯化
反应结束后将样品转到含1.2×XP beads的离心管中,吹打混匀,室温静置5-10min。
a.放磁力架上直至液体变澄清后,从远离磁珠一侧吸弃液体(不要吸到磁珠)。
b.从远离磁珠一侧加入200μl 80%新鲜配制的乙醇,盖紧盖子,向里向外旋转磁力架将壁上、盖上的磁珠冲下后吸弃液体。共洗两次。
c.瞬时离心后,放回磁力架并用10μl移液器吸掉多余液体后,开盖晾至磁珠颜色由闪亮变哑光色。
d.沿磁珠一侧加入22.5μlddH2O吹打混匀,室温放置5min。
e.放磁力架上直至液体变澄清后,从远离磁珠一侧吸出样本到一新的标记的PCR管中(不要吸到磁珠)。
4.多重PCR扩增
4.1预先从-20℃中取出多重扩增Buffer,10uM预混好的多重引物混合液和对应的INDEX primer,冰上融化并使其充分混匀,其中,所述引物具有如SEQIDNO.1-150所示的序列。
INDEX Primer(ATCACG):5’-Spc/C*A*A*GCAGAAGACGGCATACGAGATXXXXXX(XX)GTGACTGGAGTTCAGACGTGTGCTCTTCCGA*T*C*T-3’。
4.2在冰上按以下体系依次加入表3的试剂。
表3-多重PCR扩增体系
| 组分 | 体积(ul) |
| 上一步连接产物 | 13.5 |
| 10uM Primer MIX | 1.5 |
| 10uM index Primer | 1.5 |
| 5×MultiPCR Buffer | 4 |
| Total | 20.5μl |
吹打混匀后瞬时离心,放入PCR仪(提前运行下列表4程序)。
表4-多重PCR扩增程序
反应结束后PCR体系20ul加30ul low TE补至50ul,用1×XP beads(50μl)纯化回收多重PCR产物,纯化方法参照步骤3.4。最后用25μlddH2O洗脱并转移至一新的PCR管中,其中PCR产物浓度为15-45ng/ul。
4.3纯化后的产物取1μl用2100高灵敏芯片检测,对扩增产物进行质控,确定在预期长度区间内(150-400bp)有产物峰。图3示例性示出Multi PCR-2的质控结果图。
5.Universal PCR反应
5.1从-20℃保存的试剂盒中取出2×kapa hifihotstart ready mix、PCR Primerp7和uni versal Primer,冰上融化并充分混匀。
5’-Spc/A*A*T*GATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGA*T*C*T-3’。
5.2在冰上按以下体系依次加入下表所示的试剂:
表5-Universal PCR试剂
| 组分 | 体积(ul) |
| 模板 | 22.5 |
| 10uM universal primer | 1.25 |
| 10uM Primer p7 | 1.25 |
| 2×kapa hifihotstart ready mix | 25 |
| Total | 50μl |
吹打混匀后瞬时离心,放入PCR仪运行以下程序。
5.3PCR反应程序:
表6-Universal PCR扩增程序
5.4反应结束后用0.9×的XP beads(45μl)纯化,纯化方法参照步骤3.4。最后用21μlddH2O洗脱并转移至贴好标签的离心管中。PCR产物浓度为25-45ng/ul)。标签信息包括Index号,样本ID,具体如表7。
表7
| 样本编号 | index | 文库Qubit值(ng/ul) | 文库总体积(ul) | 文库总量(ng) |
| 1 | 单链-1 | 74.6 | 21 | 1566.6 |
| 2 | 单链-2 | 77.4 | 21 | 1625.4 |
| 3 | 单链-3 | 89 | 21 | 1869 |
5.5纯化后的产物取1μl的纯化样本用Agilent 2100Bioanalyzer system(HighSensitivity DNA Kit)进行文库片段长度测定和质控,确定主要产物峰在预期长度区间内(200-450bp),具体参见图4。
文库结构:
Spc/A*A*T*GATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGA*T*C*TNNNNNNNNNNNPloyCSpc/C*A*A*GCAGAAGACGGCATACGAGATXXXXXX(XX)GTGACTGGAGTTCAGACGTGTGCTCTTCCGA*T*C*T。
6.文库探针杂交
6.1.试剂及待捕获文库准备
6.1.1将上述三例文库按照表8进行混合杂交,按Qubit浓度等量混合。
表8-文库混合
| 混杂方式 | 文库个数 | 每个文库用量 |
| 三杂一 | 3 | 170ng |
6.1.2按照表9混合blocking oligos、Cot-1及上述已经混合均匀的DNA文库。
表9-封闭体系
| 等量混合的已连接Barcode/Index的文库 | 500ng |
| Cot-1DNA | 5ul |
| blocking oligos | 2ul |
6.1.3将上述混合液震荡混匀并打开EP管盖,于60℃真空浓缩仪中浓缩蒸发至干粉状态。
真空浓缩仪设置为60℃,15min。15min后查看混合物蒸干状态,若尚有未蒸干液体,继续进行60℃,15min蒸干,避免过分干燥。
6.2用预混探针组合进行文库捕获,其中,探针组具有如SEQIDNO.151-235所示的序列:
6.2.1捕获试剂所需试剂准备:
a)将所需试剂(按下表10)从冷冻冰箱中找出室温解冻。
b)向上述已经蒸干的EP管中依次加入以下试剂:
表10-捕获试剂
| xGen 2×Hybridization Buffer(蓝盖) | 8.5ul |
| xGen Hybridization Buffer Enhancer(棕褐色) | 2.7ul |
| Nuclease-Free Water | 1.8ul |
| 共计 | 13ul |
室温孵育10min;在Proflex PCR仪中block1上设置并运行以下程序:“95℃,forever”,热盖105℃。
c)上述10min结束后,充分震荡混匀液体,离心,全部转移至0.2ml PCR管中,将PCR管置于block1中计时10min。
d)在PCR仪设置并运行以下如表11的程序,准备捕获探针。c中过程结束,将PCR管转移到65℃的block中,立即加入4ul的gene probe。充分振荡混匀并离心:计时16h。
表11-捕获程序
| 程序 | PCR仪热盖状态 |
| 65℃,forever | PCR仪热盖75℃闭盖 |
6.2.2捕获非特异片段洗脱及磁珠准备(杂交反应结束前2h开始准备试剂):
a)从冰箱(冷冻)取出下表中的洗脱液解冻,并从4℃取出M270磁珠,充分震荡混匀
b)配置1×洗脱工作液(洗脱液需现用现配,可杂交反应结束前2h前进行洗脱液准备):
下表12是进行1次洗脱所需的洗脱工作液配置,根据杂交量配置相应洗脱液。
表12-洗脱工作液配置
| 浓缩洗脱buffer | 浓缩buffer(ul) | 无核酸酶的水(ul) |
| xGen2×Bead Wash Buffer | 250 | 250 |
| xGen 10×Wash Buffer1 | 30 | 270 |
| xGen 10×Wash Buffer2 | 20 | 180 |
| xGen 10×Wash Buffer3 | 20 | 180 |
| xGen 10×Stringent Wash Buffer | 40 | 360 |
c)对于已经配置好的1×Wash Buffer 1和Stringent Wash Buffer工作液,需按下表创建不同温度的工作液(即Stringent Wash Buffer工作液要65摄氏度金属浴预热2h,Wash Buffer1工作液分为65℃预热2h的工作液和常温工作液)。下表13是1次捕获用量,需根据捕获次数适量配备。
表13-工作液配置
d)再次充分震荡M270磁珠,并向1.5ml EP管中加入100ulM270磁珠。并将EP管置于磁力架上。
e)2-5min后,待磁珠吸附到磁力架上,弃上清。并加入200ul 1×Bead WashBuffer,从磁力架上取下EP管,震荡混匀10s,再次将EP管置于磁力架上。
f)重复步骤e一次。
g)2-5min后,待磁珠吸附到磁力架上,弃上清。加入100ul 1×Bead Wash Buffer,涡旋混匀,并转移至0.2ml PCR管中。
h)杂交完毕前5min将0.2ml PCR管置于磁力架上,待溶液澄清后,弃上清。
6.2.3M270磁珠筛选目的片段:
a、杂交完成时,将步骤h中准备好的M270磁珠置于65℃的block中,于1min内将杂交反应液完全转移到M270磁珠的PCR管中,迅速振荡混匀并放回65℃的block中,计时45min(若有多个杂交反应,该过程须逐一操作)。
b、65℃孵育过程中,每8min震荡混匀一次,确保M270磁珠处于重悬状态。
6.2.4洗涤M270磁珠,洗脱非杂交片段(使用1×洗涤buffer):
a、65℃洗涤(快速操作,保证温度接近于65℃):45min孵育结束,取50ul金属浴中65℃预热的1×Wash Buffer 1快速转移至对应的M270钓取反应混合液中,匀速吸打3到5次,并将所有液体快速转移至金属浴65℃预热的1×Wash Buffer 1对应的EP管中,快速振荡离心,此步若有多个杂交反应,将混合液暂放回65℃的金属浴中,逐一完成以上步骤,然后逐一置于磁力架上,快速(30s内)吸弃上清,放回65℃的金属浴中。
b、65℃洗涤(快速操作,保证温度接近于65℃):加入200ul预热的Stringent WashBuffer工作液,涡旋混匀,简单离心并65℃孵育5min。若有多个杂交反应,待孵育5min后,逐一置于磁力架上,快速(30s内)吸弃上清,放回65℃的金属浴中。
c、重复b一次。
d、室温洗涤:向步骤c中的beads中加入200ul室温的1×Wash Buffer 1,涡旋混匀30s,简单离心,置于磁力架上,待溶液澄清后,弃上清。
e、室温洗涤:向上述beads中加入200ul 1×Wash Buffer 2,涡旋混匀30s,简单离心,置于磁力架上,待溶液澄清后,弃上清。
f、室温洗涤:向上述beads中加入200ul 1×Wash Buffer 3,涡旋混匀30s,简单离心,置于磁力架上,待溶液澄清后,弃上清。离心并放回磁力架,吸净上清。
g、重悬beads:从磁力架上取下含beads的EP管,加入22.5ul无核酸酶的水。涡旋震荡混匀,加入到以下PCR反应液中(带磁珠进行PCR反应)
6.2.5捕获后PCR
a、捕获后PCR反应液配置
表14-捕获后PCR反应液配置
| 2×KAPA HiFi HotStartReadyMix | 25ul |
| 10uM Illumina P5 primer(Illumina Primer A) | 1.25ul |
| 10uM Illumina P7 primer(Illumina Primer B) | 1.25ul |
| 上述g中带磁珠的产物 | 22.5ul |
| 共计 | 50ul |
b、震荡混匀后,进行如下程序PCR(Proflex PCR仪):
98℃,45s;98℃,15s;60℃,30s;72℃,30s;72℃,60s;4℃,hold,15个循环,PCR仪热盖状态105℃热盖闭盖。
6.2.6捕获后PCR产物纯化:
a、向新的EP管中加入已在室温平衡0.5h的45ul XP beads。
b、将PCR产物从PCR仪中取出混合均匀后加入到含45ul XP beads的EP管中(0.9×),震荡混合均匀,室温孵育5min。
c、孵育完将混合产物置于磁力架上,待上清与磁珠完全分离开,弃上清。
d、向管内加入200ul新鲜配置的80%的乙醇洗涤磁珠1min,弃上清(乙醇)。
e、重复步骤d一次。
f、室温或37℃干燥磁珠。
g、待磁珠干燥后加入23ul水,震荡混匀vortex,室温静置5min。
h、置于磁力架上,待磁珠与上清完全分离,吸取上清22ul于一新的EP管中,标明样本名称、文库类型、建库日期、Index/barcode等信息。
6.3质控
a.取1μl文库使用Qubit dsDNA HS Assay Kit进行定量,记录文库浓度;
b.取1ul样品使用Agilent 2100Bioanalyzer system(High Sensitivity DNAKit)进行文库片段长度测定和质控,确定目标主峰片段在预期长度区域内(200-450bp),具体见图5。
c.使用NGS测序平台进行测序。
7.数据分析和质控结果
7.1测序数据处理
对于测序的下机原始数据,使用fastp软件对数据进行质量控制,软件自动识别引物并进行处理、再过滤低质量的序列时,设置滑动窗口过滤值及碱基平均质量值时-W为4,-M为Q20。使用二代测序数据比对软件bwa-mem模式将经过质量控制所得的数据比对到人类参考基因组上(hg19),得到每条序列的位置信息及比对质量信息。然后使用picard软件对比对后的结果去除由PCR扩增所形成的重复。使用软件(如samtools)对去除重复后的比对结果进行排序并进行索引。
二、数据结果
1.测序数据结果如表15所示:
表15-测序数据结果
2.Bamqc结果表16所示:
表16-Bamqc结果
3.Calling情况-突变的识别
使用freebayes软件对得到的样本二代测序比对结果进行分析,识别样本中的突变,并设置参数最小比对质量值-m为10,最小质量值-q为20,最小交替分数-F设置为0.01,观察到的最少的碱基数-C为1。使用annovar软件对freebayes识别出来的突变进行注释。
表17-比对结果分析
4.不同方法学捕获效率比较
本发明采用了不同方法学对捕获效率进行了比较,包括单独采用多重富集方法、单链建库富集。具体参见表18所示。
表18-富集效率比较
注:Ontarget ratio=Ontarget reads/Mapped reads。
5.不同方法学覆盖度和均一性比较
本发明采用了不同方法学对覆盖度和均一性进行了比较,包括单独采用多重富集方法、单链建库富集。具体参见表19所示。
表19-覆盖度和均一性比较
尽管本发明已经参考示例性实施方案进行了描述,但应理解本发明不限于公开的示例性实施方案。在不背离本发明的范围或精神的情况下,可对本发明说明书的示例性实施方案做多种调整或变化。权利要求的范围应基于最宽的解释以涵盖所有修改和等同结构与功能。
序列表
<110> 元码基因科技(北京)股份有限公司
<120> 基于多重扩增和探针捕获的组合对单链DNA序列富集测序的方法及在突变检测中的应用
<130> BH2110311
<141> 2021-08-02
<160> 234
<170> SIPOSequenceListing 1.0
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctcttgagga tcttgaagga aactg 25
<210> 2
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tgccactttc ccttgtagac tg 22
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ccacactgac gtgcctctcc 20
<210> 4
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
tctgcctcac ctccaccg 18
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ccgcagcatg tcaagatcac 20
<210> 6
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gatctgtatt tatttcagtg ttacttacct gtc 33
<210> 7
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ctgaattagc tgtatcgtca aggc 24
<210> 8
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ctcatgtact ggtccctcat tgc 23
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
cctgagcctg ttttgtgtct actg 24
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tggttctgga ttagctggat tgtc 24
<210> 11
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cgcctgtcct catgtattgg tc 22
<210> 12
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
acagctcaaa gcaatttcta cacg 24
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aactgagcaa gaggctttgg ag 22
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gtgccatcat tcttgaggag g 21
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ccctgaagcc tgagtgtgtc c 21
<210> 16
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ctggatggtc agcgcactc 19
<210> 17
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
cgcatgtact ggtcccgc 18
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ttgtgaagat ctgtgacttt ggc 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
caatgtctca aacatcatca cgg 23
<210> 20
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gccacttggc ctgcctc 17
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tgtagcctgg ttctctggtg tg 22
<210> 22
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tctcttagat atgcaataat tttcccac 28
<210> 23
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tgaatgaaaa catcaggatt gtaagc 26
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
cagtgagctt cctcttgaac acg 23
<210> 25
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gctgcggaat tttgggatg 19
<210> 26
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggagccacat gccctacaca g 21
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
agtccacatg cagcaggttg 20
<210> 28
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ccattctagc ggggcacag 19
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ctcttccatt cttcatcctc agc 23
<210> 30
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gatgggtgtg gaatggcag 19
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cattcaccaa cttatgccaa ttctc 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ggtcatgtag catttaccac agttg 25
<210> 33
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gcgaaggatt tctgatctgt gg 22
<210> 34
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gctggtggct ggagttgc 18
<210> 35
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
caatgtttct tgtctaattt cttggc 26
<210> 36
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ctggcccagc acatagtcg 19
<210> 37
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
cagagtctgg ggaggaggc 19
<210> 38
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
cagagctgct gagcaatctg c 21
<210> 39
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
gggctcaccc tgcagcac 18
<210> 40
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gaatgacggc gtggaggac 19
<210> 41
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
gcaaaatcac attattgcca aca 23
<210> 42
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
gggctcccgg aagacagtc 19
<210> 43
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
cctggcctac ctggtcgc 18
<210> 44
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cgatgaaggc atgtatgttg gc 22
<210> 45
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
gcctcaaaga aaagctgcgt g 21
<210> 46
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
cccgagaggt aaagaacgaa gac 23
<210> 47
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
ggacgagctg gaccactgg 19
<210> 48
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
tgtcagagca ttcagaacca tcc 23
<210> 49
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ggcgtctgct ggagtgtgc 19
<210> 50
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tgtagggttt gaagactggg atg 23
<210> 51
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
cccatttatt tcctatagct cctgag 26
<210> 52
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
catttaaggt tccttcaagc tgc 23
<210> 53
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
tgctggattg aaattcactt acacc 25
<210> 54
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gccgctgagc cactgc 16
<210> 55
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tcaacagttc aggccagtgc 20
<210> 56
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
gtggtcctca cctatgcctg g 21
<210> 57
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
ctggcctttg gctttgtgc 19
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
cacttctacg acttcttcaa ccagg 25
<210> 59
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
agcccatccc tgactgtgag 20
<210> 60
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
cctgtttgcc atgtttggaa c 21
<210> 61
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
caggttgact gggcagagtg ac 22
<210> 62
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
gttgtctctc ctcctgtcag tgc 23
<210> 63
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ctgtatcagt ctgtccagca cttcc 25
<210> 64
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
gtgacacagt caaacattaa cttggtg 27
<210> 65
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
cctagcacct gacgcctcg 19
<210> 66
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ccagcacagg ataaggagca g 21
<210> 67
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
cgttgtccga gctcacctg 19
<210> 68
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gcttctctct ctcactctct ctctgc 26
<210> 69
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
cctacagtaa caaaggcatg gagc 24
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
ctagtgcatt caagcacaat ggc 23
<210> 71
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
aggtgatcta tttttccctt tctccc 26
<210> 72
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ggaaggttgt tgaggagata aatgg 25
<210> 73
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
ccatttgaca gaacgggaag c 21
<210> 74
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gtgattcatt tatttgttca aagcagg 27
<210> 75
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
ctccttactc atggtcggat cac 23
<210> 76
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
gggaccttac cttatacacc gtgc 24
<210> 77
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
gatgggcaga ttacagtggg ac 22
<210> 78
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ccagcaggcg gcacac 16
<210> 79
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
caggaggcag ccgaagg 17
<210> 80
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ctccttactt tgcctccttc tgc 23
<210> 81
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
gctcaggact tagcaagaag ttatgg 26
<210> 82
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
gctgaaaatg actgaatata aacttgtgg 29
<210> 83
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gaaacctgtc tcttggatat tctcg 25
<210> 84
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
gagttaagga ctctgaagat gtacctatgg 30
<210> 85
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
tggtgtgaaa tgactgagta caaactg 27
<210> 86
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
gatggtgaaa cctgtttgtt ggac 24
<210> 87
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
ctccatttta gcacttacct gtgactc 27
<210> 88
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
agatccaatc catttttgtt gtcc 24
<210> 89
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
gggtagagtg tgcgtggctc 20
<210> 90
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
aggaaagtga ctgtaggggc ag 22
<210> 91
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
cctgaggagc gatgacgg 18
<210> 92
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
gtgcctgttg gacatcctgg 20
<210> 93
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
ctgcctttcg acacatagtt cg 22
<210> 94
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
gccctccacg gtactcctg 19
<210> 95
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acggaggcag gcgaagtg 18
<210> 96
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ctcctatggg ttgtcaccaa gc 22
<210> 97
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
caaaatatca ctttccataa aagcaagg 28
<210> 98
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
gactgtaagt ggtttctcag gaagc 25
<210> 99
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
ctccctcaca accttgcgg 19
<210> 100
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
caactcctcc acaaggcagc 20
<210> 101
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
ctgaatttaa tgtcacaggt cactgc 26
<210> 102
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
gctcctggtg gacctgatgc 20
<210> 103
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
ggtgcccact ggacagcc 18
<210> 104
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ctctagcctt ttggtccagt gg 22
<210> 105
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
cttctccaag accccaactg ag 22
<210> 106
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
ctgcatattg gtgtcaaagt gtcac 25
<210> 107
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
tggaacattt ggtgaattga gc 22
<210> 108
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
tgacaattga tttccccgta gg 22
<210> 109
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
cctattgatc tggtggacat tagtgtag 28
<210> 110
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
aatcctcgaa cacaaactca tgc 23
<210> 111
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
gcaatcccgt actgaagttc g 21
<210> 112
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
gactacacag gctgctgctg c 21
<210> 113
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
agcctggagc agctagaatc ag 22
<210> 114
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
gagacggacg cccacctg 18
<210> 115
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
gcagatgctc acatagttgg tgtag 25
<210> 116
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
cttgtgagtg gatgggtaaa acc 23
<210> 117
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
gctgaagaag atgtggaaaa gtcc 24
<210> 118
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
ctggaccaag cccatcacc 19
<210> 119
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
gctgagaaca ttgcctatgg agac 24
<210> 120
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
gaggctgacc tgaagcactt g 21
<210> 121
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
ggaggagctg ctgaagatgt g 21
<210> 122
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
caccagctac aggtgcctga g 21
<210> 123
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
agtttgctta cacttacgct gcc 23
<210> 124
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
ggcattctgc atttctgtgg c 21
<210> 125
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
ctccttattt agagtgaact ggattgg 27
<210> 126
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
gaaggaacct taaatgtctc tcctacc 27
<210> 127
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
cctgtggaca ttggagagtt gac 23
<210> 128
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
tgtgggtctg caatcggc 18
<210> 129
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
cccaggcaca cgttgtagc 19
<210> 130
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
ctccacgtcc tcgtaccagc 20
<210> 131
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
caggtggaag taggaggtct tgc 23
<210> 132
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
cacatagtcc cggaagctgc 20
<210> 133
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
catgcccctc actcacagc 19
<210> 134
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
ccaaacatgg caaacaggtt g 21
<210> 135
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
ggtacgcctc cagatgagca g 21
<210> 136
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
gccttggcaa tcatcttgct c 21
<210> 137
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
ctctgcctca accagccac 19
<210> 138
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
gaagactgag gagctgttaa agaaagc 27
<210> 139
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
ctcctgccag aggttcgc 18
<210> 140
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
ctccctttgg aatggcacag 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
ggagtgggtg ctggactgtc 20
<210> 142
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
tgtgaaggag gaggatgaga gc 22
<210> 143
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
ggatatggtc cttctcttcc agag 24
<210> 144
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
gtccagcatc tccagcagc 19
<210> 145
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 145
gcagaagtct tgcccacatc g 21
<210> 146
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 146
gatcataagg aagttgtgtt gggtc 25
<210> 147
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 147
aagcccctgt ttcatactga cc 22
<210> 148
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 148
tgcaggctcc aagtagattc ac 22
<210> 149
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 149
ggaagactcc tttgaatgca gaag 24
<210> 150
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 150
caagcagaga atgggtactc acg 23
<210> 151
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 151
acttgtcaca atgtcaccac attacatact taccatgcca ctttcccttg tagactgttc 60
caaatgatcc agatccaatt ctttgtccca ctgtaatctg cccatcagga atctcccaat 120
<210> 152
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 152
ggatccagac aactgttcaa actgatggga cccactccat cgagatttca ctgtagctag 60
accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg aggtgtagta 120
<210> 153
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 153
ccaaccaagc tctcttgagg atcttgaagg aaactgaatt caaaaagatc aaagtgctgg 60
gctccggtgc gttcggcacg gtgtataagg taaggtccct ggcacaggcc tctgggctgg 120
<210> 154
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 154
cactgacgtg cctctccctc cctccaggaa gcctacgtga tggccagcgt ggacaacccc 60
cacgtgtgcc gcctgctggg catctgcctc acctccaccg tgcagctcat cacgcagctc 120
<210> 155
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 155
atgcccttcg gctgcctcct ggactatgtc cgggaacaca aagacaatat tggctcccag 60
tacctgctca actggtgtgt gcagatcgca aaggtaatca gggaagggag atacggggag 120
<210> 156
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 156
gccaggaacg tactggtgaa aacaccgcag catgtcaaga tcacagattt tgggctggcc 60
aaactgctgg gtgcggaaga gaaagaatac catgcagaag gaggcaaagt aaggaggtgg 120
<210> 157
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 157
atattcgtcc acaaaatgat tctgaattag ctgtatcgtc aaggcactct tgcctacgcc 60
accagctcca actaccacaa gtttatattc agtcattttc agcaggcctt ataataaaaa 120
<210> 158
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 158
acaaagaaag ccctccccag tcctcatgta ctggtccctc attgcactgt actcctcttg 60
acctgctgtg tcgagaatat ccaagagaca ggtttctcca tcaattacta cttgcttcct 120
<210> 159
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 159
atgattttgc agaaaacaga tctgtattta tttcagtgtt acttacctgt cttgtctttg 60
ctgatgtttc aataaaagga attccataac ttcttgctaa gtcctgagcc tgttttgtgt 120
<210> 160
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 160
taacttcttg ctaagtcctg agcctgtttt gtgtctactg ttctagaagg caaatcacat 60
ttatttccta ctaggaccat aggtacatct tcagagtcct taactctttt aatttgttct 120
<210> 161
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 161
atattcatct acaaagtggt tctggattag ctggattgtc agtgcgcttt tcccaacacc 60
acctgctcca accaccacca gtttgtactc agtcatttca caccagcaag aacctgttgg 120
<210> 162
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 162
cacagaggaa gccttcgcct gtcctcatgt attggtctct catggcactg tactcttctt 60
gtccagctgt atccagtatg tccaacaaac aggtttcacc atctataacc acttgttttc 120
<210> 163
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 163
aaatgacaaa gaacagctca aagcaatttc tacacgagat cctctctctg aaatcactga 60
gcaggagaaa gattttctat ggagtcacag gtaagtgcta aaatggagat tctctgtttc 120
<210> 164
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 164
cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcaca 60
tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120
<210> 165
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 165
aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactc 60
ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120
<210> 166
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 166
cctgcaccct gaagcctgag tgtgtccagc agctgctggt ttgctcccag gaggccaaga 60
agtcagccta ctgcccctac agtcactttc ctgtgggggc tgccctgctc acccaggagg 120
<210> 167
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 167
gtattcgtcc acaaaatggt tctggatcag ctggatggtc agcgcactct tgcccacacc 60
gccggcgccc accaccacca gcttatattc cgtcatcgct cctcaggggc ctgcggcccg 120
<210> 168
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 168
cacacaggaa gccctccccg gtgcgcatgt actggtcccg catggcgctg tactcctcct 60
ggccggcggt atccaggatg tccaacaggc acgtctcccc atcaatgacc acctgcttcc 120
<210> 169
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 169
tgatgctatt cagctacaga tggcttgatc ctgagtcatt tcttcctttt ccatgcagtg 60
tgtccaccgt gatctggctg ctcgcaacgt cctcctggca caaggaaaaa ttgtgaagat 120
<210> 170
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 170
ctgtgacttt ggcctggcca gagacatcat gcatgattcg aactatgtgt cgaaaggcag 60
tgtacgtcct cacttccctc actggtcagg ctcatcctcc ttcactttaa tctctaaagt 120
<210> 171
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 171
atgaaacttc ctggactatt ttggccaaca atgtctcaaa catcatcacg gagatccact 60
cccgagacag gagtaccgtg gagggccgtg tgactttcgc caaagtggag gagaccatcg 120
<210> 172
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 172
gcgcggaagg ggtcctgcca ccgcgccact tggcctgcct ccgtcccgcc gcgccacttg 60
gcctgcctcc gtcccgccgc gccacttcgc ctgcctccgt cccccgcccg ccgcgccatg 120
<210> 173
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 173
cttggcctct gctttttctc ttgtagcctg gttctctggt gtgaacagga gcagatgaca 60
aatagcacct agcttggtga caacccatag gaggtatgcc tataaaatgc catgggccac 120
<210> 174
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 174
taaattattg ttttctctta gatatgcaat aattttccca ctatcattga ttatttcccg 60
ggaacccata acaaattact taaaaacctt gcttttatgg aaagtgatat tttggagaaa 120
<210> 175
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 175
caatttctta acttgatgga aaaattgaat gaaaacatca ggattgtaag caccccctgg 60
atccaggtaa ggccaagttt tttgcttcct gagaaaccac ttacagtctt tttttctggg 120
<210> 176
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 176
tttttctcaa ctcctccaca aggcagtgag cttcctcttg aacacggtcc tcaatgctcc 60
tcttccccat cccaaaattc cgcaaggttg tgagggagaa acgccggatc tccttccatc 120
<210> 177
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 177
ggcgtttctc cctcatgacg ctgcggaatt ttgggatggg gaagaggagc attgaggacc 60
gtgttcaaga ggaagcccgc tgccttgtgg aggagttgag aaaaaccaag ggtgggtgac 120
<210> 178
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 178
tgcaagacag gagccacatg ccctacacag atgctgtggt gcacgaggtc cagagataca 60
ttgaccttct ccccaccagc ctgccccatg cagtgacctg tgacattaaa ttcagaaact 120
<210> 179
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 179
gttctggaag tccacatgca gcaggttgcc cagcccgggc agtggcaggg ggcctggtgg 60
gtagcgtgca gcccagcgtt ggcgccggtg catcaggtcc accaggagca ggaagatggc 120
<210> 180
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 180
gctggggact aggtacccca ttctagcggg gcacagcaca aagctcatag ggggatgggg 60
tcaccaggaa agcaaagaca ccatggtggc tgggccgggg ctgtccagtg ggcaccgaga 120
<210> 181
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 181
gaaggttgga gacagcaatg atcgtaatct cttccattct tcatcctcag ctatagagat 60
ggcacttttc ataaatccca ctggaccaaa aggctagagt tcaaagcaga aacattttgt 120
<210> 182
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 182
acaatgtcaa ggactggcaa gagtgccaca tgtgatgggt gtggaatggc agctcactgt 60
agcaggtgct ggggactcag ttggggtctt ggagaagcac ttagttatag caagaatgtc 120
<210> 183
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 183
taaataaaca ttcaccaact tatgccaatt ctcttgtttt agatgttaaa tcacacttac 60
gttgtctgga aagtcagcct ttagttcagt gacactttga caccaatatg cagccgtttt 120
<210> 184
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 184
ggtagccaga atcattacag gtcatgtagc atttaccaca gttgatacac atttcttcat 60
caatcatagc cacaacttgc tctacgttgc tcaattcacc aaatgttcca aggtactgca 120
<210> 185
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 185
ggcttcagac attttttctg ggggaggcag cgaaggattt ctgatctgtg ggatactcat 60
tgctttgaat acctacgggg aaatcaattg tcatggttaa aattttgaaa ctagcttaca 120
<210> 186
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 186
tcttcgaatc attgatgtgc tggtggctgg agttgcgcta gcaagaccaa aaggatttat 60
aaacttcaat ccggccattt ctacactaat gtccaccaga tcaataggag tgtaaaagag 120
<210> 187
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 187
gttcttatca ggatttcttt tccaatgttt cttgtctaat ttcttggccg aagtggaacg 60
cagagttgca tgagtttgtg ttcgaggatt taaagccagg atactctaaa gacagcataa 120
<210> 188
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 188
gcacaggtgc tctggcccag cacatagtcg ggaattacgt cgccaaattc ccagggcaca 60
ttgcgcacga acttcagtac gggattgccc ctctggggag ggacgaaggg cagaagccat 120
<210> 189
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 189
cgccactgaa ttcagagtct ggggaggagg ctcccacagg ccgggacaag aagcggaagc 60
agcagcagca gcagcctgtg tagtctgccc ccgggaaact gaggaactaa agaaagctga 120
<210> 190
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 190
aaccgtttat ggccccaccc gccccactca gagctgctga gcaatctgct ctatcctctt 60
cagcgtctcc tctgattcta gctgctccag gctgagcagg gacaggccca gctgatcctc 120
<210> 191
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 191
gaggcgggaa agggactggg gggcagcggg gggtcggggc tcaccctgca gcacttcgtc 60
gggcagcacg gggttggcca ggtgggcgtc cgtctcccgg gcggcgctgg cctcccgcag 120
<210> 192
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 192
aggaggcagc cctggtggac atggtgaatg acggcgtgga ggacctccgc tgcaaataca 60
tctccctcat ctacaccaac tatgtgagca tctgcaccag ggttgggcac tgggggctga 120
<210> 193
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 193
aaaaacatgc aaaatcacat tattgccaac atgacttact tgatccccat aagcatgacg 60
acctatgatg ataggtttta cccatccact cacaagccgg gggatatttt tgcagataat 120
<210> 194
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 194
ggtgcccagg tcagtggatc ccctctccac cctggcctac ctggtcgcca tgggcgtgcc 60
tgccaatggt gatgggcttg gtccagccag ggactaggcg tgggatgttt ttgcagatga 120
<210> 195
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 195
ggcgtgggat gtttttgcag atgatgggct cccggaagac agtccccccc aggatgttcc 60
ggatagttcc attgggactt ttccacatct tcttcagctt gaactctgtg aggacagaga 120
<210> 196
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 196
cttacattag gcagtgactc gatgaaggca tgtatgttgg cctcctttgc tgccctcaca 60
atctcttcct gtgacaccac ccggctgttg tctccatagg caatgttctc agcaatgctg 120
<210> 197
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 197
ccttcacaaa gcggaagaat gtgtcagcct caaagaaaag ctgcgtgatg atgaaatcgg 60
ctcccgcaga caccttctcc ttcaagtgct tcaggtcagc ctcaaagctc cctgcttcgg 120
<210> 198
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 198
tgtgaccatt ccggtttggt tctcccgaga ggtaaagaac gaagacttca aagacacttt 60
cttcactggt cagctcctcc ccccacatct tcagcagctc ctccttgggg gacttgctct 120
<210> 199
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 199
accaccacca ccacagccgc accttggcgt gagctcagca gccagcggcc acctgggccg 60
gagcttcctg agtggagagc cgagccaggc agacgtgcag ccactgggcc ccagcagcct 120
<210> 200
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 200
ggcggtgcac actattctgc cccaggagag ccccgccctg cccacgtcgc tgccatcctc 60
gctggtccca cccgtgaccg cagcccagtt cctgacgccc ccctcgcagc acagctactc 120
<210> 201
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 201
ctcgcctgtg gacaacaccc ccagccacca gctacaggtg cctgagcacc ccttcctcac 60
cccgtcccct gagtcccctg accagtggtc cagctcgtcc ccgcattcca acgtctccga 120
<210> 202
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 202
ctggtccgag ggcgtctcca gccctcccac cagcatgcag tcccagatcg cccgcattcc 60
ggaggccttc aagtaaacgg cgcgccccac gagaccccgg cttcctttcc caagccttcg 120
<210> 203
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 203
ggcgtctgtg tgcgctctgt ggatgccagg gccgaccaga ggagcctttt taaaacacat 60
gtttttatac aaaataagaa cgaggatttt aatttttttt agtatttatt tatgtacttt 120
<210> 204
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 204
tcggaccagt cggagacgtt ggaatgcggg gacgagctgg accactggtc aggggactca 60
ggggacgggg tgaggaaggg gtgctcaggc acctgtagct ggtggctggg ggtgttgtcc 120
<210> 205
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 205
atcaggacag accacccaga agctggctgt cagagcattc agaaccatcc acctacccgg 60
aagggtcctt tgtcatacat ggcagcgtaa gtgtaagcaa actctcctat gaacactcgc 120
<210> 206
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 206
ttccaggatt tgaattcggg cgtctgctgg agtgtgccca atgctatatg tcagttgagg 60
ttctaagact tggaagccac agaaatgcag aatgccactc tgaggataca gaaagcacag 120
<210> 207
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 207
ctaataattg tctttacttt ccttgtaggg tttgaagact gggatgtatt atttaaggac 60
aagaccagcg gctaatccaa tccagttcac tctaaataag gagaagctaa aagataaag 119
<210> 208
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 208
tgttctttcc catttatttc ctatagctcc tgagtattgg tgttccattg cttactttga 60
aatggatgtt caggtaggag agacatttaa ggttccttca agctgcccta ttgttactgt 120
<210> 209
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 209
tcaggtagga gagacattta aggttccttc aagctgccct attgttactg ttgatggata 60
cgtggaccct tctggaggag atcgcttttg tttgggtcaa ctctccaatg tccacaggac 120
<210> 210
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 210
ttccttcaag ctgccctatt gttactgttg atggatacgt ggacccttct ggaggagatc 60
gcttttgttt gggtcaactc tccaatgtcc acaggacaga agccattgag agagcaaggt 120
<210> 211
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 211
gcatcaaaga aacaccttgc tggattgaaa ttcacttaca ccgggccctc cagctcctag 60
acgaagtact tcataccatg ccgattgcag acccacaacc tttagactga ggtcttttac 120
<210> 212
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 212
gaggaggagc gcggcggtga ctggccctcc gccgccgctg agccactgcg gccgggctgc 60
cccctgcgag ccgctgcgct acaacgtgtg cctgggctcg gtgctgccct acggggccac 120
<210> 213
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 213
agaatgaggt gcagaacatc aagttcaaca gttcaggcca gtgcgaagtg cccttggttc 60
ggacagacaa ccccaagagc tggtacgagg acgtggaggg ctgcggcatc cagtgccaga 120
<210> 214
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 214
ggtttggttt gtggtcctca cctatgcctg gcacacttcc ttcaaagccc tgggcaccac 60
ctaccagcct ctctcgggca agacctccta cttccacctg ctcacctggt cactcccctt 120
<210> 215
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 215
cctttggctt tgtgctcatt accttcagct gccacttcta cgacttcttc aaccaggctg 60
agtgggagcg cagcttccgg gactatgtgc tgtgagtgag gggcatggag gcggcagtgc 120
<210> 216
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 216
accatcgggc tgcccaccaa gcagcccatc cctgactgtg agatcaagaa tcgcccgagc 60
cttctggtgg agaagatcaa cctgtttgcc atgtttggaa ctggcatcgc catgagcacc 120
<210> 217
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 217
tctggtggag aagatcaacc tgtttgccat gtttggaact ggcatcgcca tgagcacctg 60
ggtctggacc aaggccacgc tgctcatctg gaggcgtacc tggtgcaggt gggcatggca 120
<210> 218
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 218
ctccttccct atcccttctg ctctcaggtt gactgggcag agtgacgatg agccaaagcg 60
gatcaagaag agcaagatga ttgccaaggc cttctctaag cggcacgagc tcctgcagaa 120
<210> 219
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 219
gagccagggc cccaggctcg tgttgtctct cctcctgtca gtgcccccag aggaacaagc 60
caacctgtgg ctggttgagg cagagatctc cccagagctg cagaagcgcc tgggccggaa 120
<210> 220
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 220
ccctgctgta tcagtctgtc cagcacttcc attggggagg tagagggcac accatcttcc 60
tctgtgtttc cttttgcttt ctttaacagc tcctcagtct tcctgatgac aaaatgatgg 120
<210> 221
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 221
tttttatagt cacgtgacac agtcaaacat taacttggtg tatcgattgg tttttgccat 60
atatatatat ataagtagga gagggcgaac ctctggcagg agcaaaggcg ccatggctgt 120
<210> 222
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 222
agcagagggg acatgaaata gttgtcctag cacctgacgc ctcgttgtac atcagagacg 60
gagcatttta caccttgaag acgtaccctg tgccattcca aagggaggat gtgaaagagt 120
<210> 223
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 223
attcctggca ttgcccagca caggataagg agcagggttg gcgtgtgagg ccttacctct 60
gggagggcag ccgccgacgc atgcggtgac agtccagcac ccactcctta cgcacgatgc 120
<210> 224
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 224
ccctactcac tcaggaccca cgttgtccga gctcacctgg ggatgtcttg ttgatccggc 60
tgaagaagag agcccccggc ctcagagagt tggcgctctc atcctcctcc ttcacacgga 120
<210> 225
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 225
ctctttgagc ttctctctct cactctctct ctgcgcattc aggagtgtac acatttctgt 60
ccagcaccct gaagtctctg gaagagaagg accatatcca ccgagtcctg gacaagatca 120
<210> 226
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 226
ctacagtaac aaaggcatgg agcatctgta cagcatgaag tgcaagaacg tggtgcccct 60
ctatgacctg ctgctggaga tgctggacgc ccaccgccta catgcgccca ctagccgtgg 120
<210> 227
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 227
ggcttttgtt ttcttccctt tagatgctct gcttctgtac tgccagtgga tgtgcagaca 60
ctaaactcat ctgggccacc gtttggaaag ctagtggttc agagttctat agattctagt 120
<210> 228
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 228
gcattcaagc acaatggcac ggttgaatgt aaggcttaca acgatgtggg caagacttct 60
gcctatttta actttgcatt taaaggtaac aacaaaggta tatttctttt taatccaatt 120
<210> 229
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 229
aatgactgag acaataatta ttaaaaggtg atctattttt ccctttctcc ccacagaaac 60
ccatgtatga agtacagtgg aaggttgttg aggagataaa tggaaacaat tatgtttaca 120
<210> 230
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 230
tagacccaac acaacttcct tatgatcaca aatgggagtt tcccagaaac aggctgagtt 60
ttggtcagta tgaaacaggg gctttccatg tcaccttttt gggtacacat aacagtgact 120
<210> 231
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 231
ttagcgagtg cccatttgac agaacgggaa gccctcatgt ctgaactcaa agtcctgagt 60
taccttggta atcacatgaa tattgtgaat ctacttggag cctgcaccat tggaggtaaa 120
<210> 232
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 232
tatatatctc accttctttc taaccttttc ttatgtgctt ttagggccca ccctggtcat 60
tacagaatat tgttgctatg gtgatctttt gaattttttg agaagaaaac gtgattcatt 120
<210> 233
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 233
tatttgttca aagcaggaag atcatgcaga agctgcactt tataagaatc ttctgcattc 60
aaaggagtct tcctggtaag actgatttac ataaatagtt agctgttgac aggcagttca 120
<210> 234
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 234
cactctttac aagttaaaat gaatttaaat ggttttcttt tctcctccaa cctaatagtg 60
tattcacaga gacttggcag ccagaaatat cctccttact catggtcgga tcacaaagat 120
Claims (9)
1.一种基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,包括以下步骤:
(1)提供来自生物样本的单链状态的DNA片段,在所述DNA片段的末端连接一连接臂,所述连接臂设计为能够通过接头的互补臂与接头连接;
(2)通过局部双链互补配对和连接反应使所述DNA片段的末端与接头连接,局部双链结构有助于提高单链连接效率;
(3)加热使所述接头与所述DNA片段分离,从而形成单链状态的第一扩增模板;
(4)利用所述第一扩增模板进行多重PCR,得到第二扩增模板,其中,所述多重PCR的引物包括特异性引物和第一INDEX引物;
(5)利用所述第二扩增模板进行通用PCR,得到杂交捕获用片段,所述通用PCR的引物包括通用引物和第二INDEX引物;
(6)使探针和所述杂交捕获用片段进行接触,从而捕获目标片段;
进一步包括进行捕获后PCR,从而得到测序文库的步骤,其中测序文库中的片段长度为150-500bp;
其中,所述特异性引物包含第一通用引物结合序列和能够与目标序列一侧的序列特异性互补结合的结合序列,所述第一INDEX引物或所述第二INDEX引物各自分别包含第二通用引物结合序列和INDEX序列,且第一INDEX引物和第二INDEX引物各自的至少一部分与所述接头的序列的至少一部分相同,从而能够使INDEX引物能够与所述DNA片段形成双链结构。
2.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述第一INDEX引物和所述第二INDEX引物为相同引物。
3.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述第一通用引物结合序列和所述第二通用引物结合序列为相同的序列。
4.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述生物样本为血液,包括全血、血浆、血清。
5.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述DNA片段为cfDNA或ctDNA或人工片段化DNA片段。
6.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述接头包含条形码序列。
7.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,进一步包括对测序文库进行测序的步骤。
8.根据权利要求1所述的基于多重扩增和探针捕获的组合对单链DNA序列富集测序的非诊断方法,其特征在于,所述连接臂为poly C,C的个数为1-10;所述互补臂为poly G,G的个数为1-10。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述单链DNA包含突变。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202110882685.7A CN113462759B (zh) | 2021-08-02 | 2021-08-02 | 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202110882685.7A CN113462759B (zh) | 2021-08-02 | 2021-08-02 | 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN113462759A CN113462759A (zh) | 2021-10-01 |
| CN113462759B true CN113462759B (zh) | 2024-06-25 |
Family
ID=77883789
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202110882685.7A Active CN113462759B (zh) | 2021-08-02 | 2021-08-02 | 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN113462759B (zh) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117248003B (zh) * | 2023-11-13 | 2024-04-12 | 元码基因科技(北京)股份有限公司 | 用于完整端粒扩增子测序的组合物、预文库及其构建方法 |
| CN117587099B (zh) * | 2023-11-20 | 2025-02-21 | 苏州朔幸医学检验有限公司 | 一种基于捕获探针的扩增子建库方法及其应用 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107586835A (zh) * | 2017-10-19 | 2018-01-16 | 东南大学 | 一种基于单链接头的下一代测序文库的构建方法及其应用 |
| CN109706219A (zh) * | 2018-12-20 | 2019-05-03 | 臻和(北京)科技有限公司 | 构建测序文库的方法、试剂盒、上机方法及测序数据的拆分方法 |
| CN110468211A (zh) * | 2019-10-14 | 2019-11-19 | 湖南大地同年生物科技有限公司 | 膀胱癌肿瘤突变基因特异性引物、试剂盒和文库构建方法 |
| CN110699426A (zh) * | 2019-01-02 | 2020-01-17 | 上海臻迪基因科技有限公司 | 基因目标区域富集方法及试剂盒 |
| CN111534858A (zh) * | 2020-04-29 | 2020-08-14 | 杭州瑞普基因科技有限公司 | 用于高通量测序的文库构建方法及高通量测序方法 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7482443B2 (en) * | 2000-03-09 | 2009-01-27 | Genetag Technology, Inc. | Systems and methods to quantify and amplify both signaling probes for cDNA chips and genes expression microarrays |
-
2021
- 2021-08-02 CN CN202110882685.7A patent/CN113462759B/zh active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107586835A (zh) * | 2017-10-19 | 2018-01-16 | 东南大学 | 一种基于单链接头的下一代测序文库的构建方法及其应用 |
| CN109706219A (zh) * | 2018-12-20 | 2019-05-03 | 臻和(北京)科技有限公司 | 构建测序文库的方法、试剂盒、上机方法及测序数据的拆分方法 |
| CN110699426A (zh) * | 2019-01-02 | 2020-01-17 | 上海臻迪基因科技有限公司 | 基因目标区域富集方法及试剂盒 |
| CN110468211A (zh) * | 2019-10-14 | 2019-11-19 | 湖南大地同年生物科技有限公司 | 膀胱癌肿瘤突变基因特异性引物、试剂盒和文库构建方法 |
| CN111534858A (zh) * | 2020-04-29 | 2020-08-14 | 杭州瑞普基因科技有限公司 | 用于高通量测序的文库构建方法及高通量测序方法 |
Non-Patent Citations (1)
| Title |
|---|
| ABclonal 单链DNA建库试剂盒——针对困难样本的建库解决方案.https://blog.abclonal.com.cn/2020/03/23/show66/.2020,全文. * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN113462759A (zh) | 2021-10-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2020274774B2 (en) | Array and method for detecting spatial information of nucleic acids | |
| CN110760936B (zh) | 构建dna甲基化文库的方法及其应用 | |
| CN105886608A (zh) | ApoE基因引物组、检测试剂盒和检测方法 | |
| CN110396534A (zh) | 基因文库的构建方法、待测核酸样本基因突变的检测方法及试剂盒 | |
| WO2019144582A1 (zh) | 用于检测基因突变和已知、未知基因融合类型的高通量测序靶向捕获目标区域的探针和方法 | |
| JP2015516814A (ja) | 標的化されたdnaの濃縮および配列決定 | |
| CN113462759B (zh) | 基于多重扩增和探针捕获的组合对单链dna序列富集测序的方法及在突变检测中的应用 | |
| CN107513576A (zh) | 一种用于检测遗传性心肌疾病的试剂盒及其应用 | |
| CN109337956B (zh) | 基于ngs技术富集多基因茎环探针设计方法及试剂盒 | |
| JP7620080B2 (ja) | 核酸分子を固体支持体に載置するための方法 | |
| JP2022145605A (ja) | 希釈または非精製試料における核酸の正確な並行定量のための方法 | |
| CN112662762A (zh) | 一种检测消化道5种肿瘤的探针组合物 | |
| CN101589154A (zh) | 单链引物-启动子-选择子构建体的ivt的应用 | |
| CN102559856B (zh) | 去除测序文库中的载体片段的方法 | |
| CN109295500B (zh) | 一种单细胞甲基化测序技术及其应用 | |
| CN112266963B (zh) | 一种联合检测慢性粒细胞白血病检测试剂盒 | |
| CN119913234A (zh) | 超高密度探针捕获的空间转录组芯片及其制备方法和应用 | |
| TW201802244A (zh) | 建構環狀模板和檢測dna分子的方法 | |
| CN112064122A (zh) | 一种基于高通量测序检测子宫内膜癌相关基因突变的文库构建方法 | |
| CN112662759A (zh) | 一种检测3种管腔性器官肿瘤的探针组合物 | |
| CN112662761A (zh) | 一种检测3种实质性器官肿瘤的探针组合物 | |
| CN114250269B (zh) | 一种探针组合物、基于该探针组合物的二代测序文库及其应用 | |
| JP2003093058A (ja) | ランダムcDNA増幅のための改善された方法 | |
| US20210040540A1 (en) | Parallel liquid-phase hybrid capture method for simultaneously capturing sense and antisense double strands of genomic target region | |
| WO2023115536A1 (zh) | 一种生成标记的核酸分子群的方法及其试剂盒 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |