具体实施方式
除非另有定义,本申请中使用的所有技术和科学术语具有与本申请所述技术领域的普通技术人员通常理解的相同含义。
下面将结合本申请实施例,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
本申请中的发卡型接头包括反义接头互补区,index1引物结合区,脱氧尿嘧啶核苷酸(dUTP,简写U),index2引物结合区,正义接头互补区和一个突出的腺苷酸脱氧核苷酸(dTTP,简写T),index1引物结合区和index2引物结合区通过U相连接,正义接头互补区和反义接头互补区分别连接于index2引物结合区和index1引物结合区的两端,正义接头互补区和反义接头互补区可以互补配对形成发卡型。
实施例1 发卡型接头
如图1所示,本实施例中发卡型接头从5’端到3’端依次为:反义接头互补区、index1引物结合区、U、index2引物结合区和正义接头互补区。本实施例中正义接头互补区与反义接头互补区完全互补配对,在3’端还连接有突出的碱基T。
本实施例中突出的碱基T经过硫代修饰(以下序列中用“*T”表示)。
本实施例中的发卡型接头的5’端磷酸化修饰(以下序列中用“/5phos/”表示)。
本实施例中发卡型接头的具体序列如下:
/5phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACUGAACGACATGGCTACGATCCGACT*T,*T表示碱基T经过硫代修饰。
其中,
反义接头互补区序列为AGTCGGA;
index1引物结合区序列为GGCCAAGCGGTCTTAGGAAGAC;
index2引物结合区序列为GAACGACATGGCTACGA;
正义接头互补区序列为TCCGACT。
本申请中,正义接头互补区部分核苷酸序列或者全部核苷酸序列也可以作为index2引物结合区的一部分,其能够与index2引物特异性结合。
本申请中,反义接头互补区部分核苷酸序列或者全部核苷酸序列可以作为index1引物结合区的一部分,其能够与index1引物特异性结合。
本实施例中,正义接头互补区全部核苷酸序列作为index2引物结合区的一部分,能够与index2引物特异性结合。
发卡型接头的制备过程具体如下:
(1)按照发卡型接头的序列合成寡核苷酸链,取合成的寡核苷酸链10nmol,向其中加入100μL的接头退火缓冲液(10mM Tris, pH7.5-8.0, 50mM NaCl, 1mM EDTA),充分混匀,离心,室温静置溶解10min,制备成摩尔浓度为100μM的接头工作液;
(2)取接头工作液50μL至新的PCR管中,震荡混匀,离心,置于PCR仪中按照表1中的程序进行梯度降温退火,得到发卡型接头母液,使用时使用接头退火缓冲液稀释至15μM。
表1 接头退火PCR程序
注:NA表示不适用。
实施例2 双端index建库
建库时,发卡型接头建库PCR引物序列如下:
发卡接头index Primer_F:
TCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGAC*T,其中N为index序列,*T表示碱基T经过硫代修饰。
发卡接头index Primer_R:
GGCATGGCGACCTTATCAGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTGGC*C,其中N为index序列,*C表示碱基C经过硫代修饰。
利用实施例1中的发卡型接头和NadPrep® 快速DNA酶切文库构建试剂盒(forMGI)(纳昂达(南京)生物)进行双端index建库的具体方法如下:
(1)DNA片段化
以NA12878细胞系的DNA(购自Coriell Institute)为样本,按照表2配制DNA片段化反应体系,并按照表3中的程序进行PCR得到片段化DNA,置于冰盒上备用。
表2 DNA片段化反应体系
表3 DNA片段化反应程序
(2)末端修复及加“A”
向步骤(1)反应体系中,加入3μL End Repair & A-Tailing Mix,混合均匀,按照表4中的程序进行PCR反应,得到末端修复及加“A”产物,置于冰盒上备用。
表4末端修复及加“A”反应程序
(3)接头连接
按照表5,在冰上配制接头连接反应mix。
表5 接头连接反应mix
向步骤(2)反应体系中加入实施例1中制备的发卡型接头(15μM)2μL,震荡混匀;再加入20μL接头连接反应mix,震荡混匀,按照表6中的程序进行PCR,得到接头连接产物,置于冰盒上备用。
表 6 接头连接反应程序
(4)USER酶消化及磁珠纯化
向接头连接产物中,加3μL USER酶,振荡混匀并离心后置于PCR仪中37℃孵育15min(热盖≥47℃)。反应结束后,向每个反应中补加37μL Nuclease Free Water,然后加入55μL NadPrep® SP Beads磁珠进行纯化,利用80%乙醇溶液漂洗,晾干至磁珠表面哑光,其后加入22μL TE缓冲液(pH 8.0),室温下孵育5min得到消化后的产物,备用。
(5)Index PCR
按照表7,依次向PCR管中添加对应反应组分并混匀离心。将样本置于PCR仪中,按照表8程序进行PCR扩增,利用磁珠进行纯化得到双端index文库。
表7 Index PCR Mix配制表
表8 Index PCR反应程序
利用Qubit dsDNA HS Assay Kit试剂盒进行文库定量,计算文库产量,比较不同接头的建库性能。
以利用常用的标准接头序列建库为对照,标准接头的序列如下:
标准接头: MGI-dual Barcode-Ad-B:
/5Phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACAATCA*G,*G表示碱基G经过硫代修饰。
MGI-dual Barcode-Ad-T:
TTGTCTTCCTAAGCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACT*T,*T表示碱基T经过硫代修饰。
标准接头建库PCR引物:
Primer_F:
/5Phos/CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAA*C,其中N为index序列,*C表示碱基C经过硫代修饰。
Primer_R:
GCATGGCGACCTTATCAGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTG*G,其中N为index序列,*G表示碱基G经过硫代修饰。
发卡型接头与标准接头的实验结果见表9和图2所示。
表9 发卡型接头和标准接头构建的文库产量
从表9和图2中可以看出,利用实施例1中提供的发卡型接头构建的文库产量的平均值(2486)、中位数(2472)均高于利用标准接头构建的文库产量的平均值(2044)、中位数(2034),且P值小于0.01,具有显著性差异。而且发卡型接头文库产量的cv值低于标准接头,可见,利用发卡型接头构建文库时,文库产量更高,更稳定,扩增效率更均一。
实施例2 LNA修饰的发卡型接头
本申请的发明人实验了将发卡型接头进行LNA修饰,并实验了在发卡型接头插入UMI序列后建库的效果。发卡型接头插入UMI序列的结构示意图见图3所示。具体的序列如下:
发卡型接头序列:
/5phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACUGAACGACATGGCTACGATCCGACT*T,*T表示碱基T经过硫代修饰。
LNA修饰的发卡型接头序列:
/5phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACUGAACGACATGGCTACGA/iXNA_T/CCG/iXNA_A/C/iXNA_T/*T,/iXNA_T/表示碱基T被LNA修饰;/iXNA_A/表示碱基A被LNA修饰,*T表示碱基T经过硫代修饰。
插入UMI的发卡型接头序列:
/5phos/NNNNAAGTCGGAGGCCAAGCGGTCTTAGGAAGACUGAACGACATGGCTACGATCCGACTTNNNN*T,其中NNNN为UMI序列,*T表示碱基T经过硫代修饰,具体参见表10。表10中的UMI序列为5’端的序列,3’端的序列为与5’端的序列完全互补的序列。
表10 UMI序列
建库PCR引物:
发卡型接头index Primer_F:
TCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGAC*T,其中N为index序列,*T表示碱基T经过硫代修饰,同表9中的index序列。
发卡型接头index Primer_R:
GGCATGGCGACCTTATCAGNNNNNNNNNNTTGTCTTCCTAAGACCGCTTGGC*C,其中N为index序列,*C表示碱基C经过硫代修饰,同表9中的index序列。
具体实验方法同实施例1,其实验结果如表11和图4。
表11 三种类型接头构建的文库产量
从表11和图4可知,LNA修饰的发卡型接头与UMI发卡型接头构建的文库产量基本一致(无显著性差异),均高于普通的发卡型接头构建的文库产量,且P<0.01,具有显著性差异,而且扩增效率更均一。
综上,本申请提供的发卡型接头应用于双端index建库时,所构建的文库产量明显高于标准接头,而且经过LNA修饰后的发卡型接头构建的文库产量更高。在LNA修饰的发卡型接头中插入UMI序列,对文库的产量无影响,但cv值明显降低,说明文库的扩增效率更均一。
本具体实施例仅仅是对本申请的解释,其并不是对本申请的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。
序列表
<110> 北京橡鑫生物科技有限公司
天津橡鑫生物科技有限公司
天津橡鑫医疗器械有限公司
<120> 一种发卡型接头及其在双端index建库中的应用
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> N_region
<222> (30)..(30)
<223> 发卡型接头
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, t or u
<400> 1
agtcggaggc caagcggtct taggaagacn gaacgacatg gctacgatcc gactt 55
<210> 2
<211> 70
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> N_region
<222> (20)..(29)
<223> index Primer_F
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (25)..(25)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (28)..(28)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (29)..(29)
<223> n is a, c, g, t or u
<400> 2
tctcagtacg tcagcagttn nnnnnnnnnc aactccttgg ctcacagaac gacatggcta 60
cgatccgact 70
<210> 3
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> N_region
<222> (20)..(29)
<223> index Primer_R
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (25)..(25)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (28)..(28)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (29)..(29)
<223> n is a, c, g, t or u
<400> 3
ggcatggcga ccttatcagn nnnnnnnnnt tgtcttccta agaccgcttg gcc 53
<210> 4
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MGI-dual Barcode-Ad-B
<400> 4
agtcggaggc caagcggtct taggaagaca atcag 35
<210> 5
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MGI-dual Barcode-Ad-T
<400> 5
ttgtcttcct aagcaactcc ttggctcaca gaacgacatg gctacgatcc gactt 55
<210> 6
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> N_region
<222> (21)..(30)
<223> Primer_F
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (25)..(25)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (28)..(28)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (29)..(29)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, t or u
<400> 6
ctctcagtac gtcagcagtt nnnnnnnnnn caactccttg gctcacagaa c 51
<210> 7
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> N_region
<222> (19)..(28)
<223> Primer_R
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (25)..(25)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (28)..(28)
<223> n is a, c, g, t or u
<400> 7
gcatggcgac cttatcagnn nnnnnnnntt gtcttcctaa gaccgcttgg 50