用饱和染料进行核酸解链分析
本申请是国际申请号为PCT/US2005/013388、国际申请日为2005年4月20日,进入中国国家阶段的申请号为200580019704.2,名称为“用饱和染料进行核酸解链分析”的发明专利申请的分案申请。
技术领域
本发明涉及双链核酸结合染料和在双链核酸结合染料的存在下进行核酸分析的方法。
背景技术
分析DNA序列变异的方法可以大体分为两类:1)对已知序列变体的基因分型和2)对未知变体的扫描。现有多种对已知序列变体进行基因分型的方法,并可以采用使用荧光探针的单一步骤、同质的、闭管的方法(Lay MJ等,Clin.Chem 1997;43:2262-7)。相反,大部分针对未知变体的扫描技术要求PCR之后的凝胶电泳或柱分离。这些技术包括单链构象多态性(Orita O等,Proc Natl Acad Sci USA 1989;86:2766-70)、异源双链分子迁移(Nataraj AJ等,Electrophoresis 1999;20:1177-85)、变性梯度凝胶电泳(Abrams ES等,Genomics 1990;7:463-75)、温度梯度凝胶电泳(Wartell RM等,J Chromatogr A 1998;806:169-85)、酶或化学切割法(Taylor GR等,Genet Anal 1999;14:181-6)以及DNA测序。通过测序识别新的突变也要求PCR之后的多个步骤,也就是循环测序和凝胶电泳。变性高效液相色谱(Xiao W等,Hum Mutat 2001;17:439-74)涉及将PCR产物注入层析柱。
最近,用于突变扫描的同质荧光方法已有报道。SYBRGreen I(Molecular Probes,Eugene,Oregon)是一种在实时PCR中经常用于监测产物形成(Wittwer CT等,BioTechniques 1997;22:130-8)和解链温度(Ririe KM等,Anal.Biochem 1997;245:154-60)的双链特异性DNA染料。通过使用SYBRGreen I的解链曲线分析,已经在167bp以内的产物中检测到杂合子单一碱基改变的存在(Lipsky RH等,Clin Chem 2001;47:635-44)。然而,扩增后在解链分析之前,对PCR产物进行了纯化并 添加了高浓度的SYBRGreen I。所述方法中用以检测的SYBRGreen I浓度抑制PCR反应(Wittwer CT等,BioTechniques 1997;22:130-1,134-8);因而,该染料在扩增后添加。希望能有一种能用于检测遗传变异(包括杂合子单个碱基改变)的存在并能在PCR之前加入的染料。
单核苷酸多态性(SNP)是目前为止在人类和其它物种中间观察到的最常见的遗传变异。在这些多态性中,个体之间仅有单个碱基的变化。所述改变可能引起蛋白质中一个氨基酸的改变、改变转录速度、影响mRNA剪接、或对细胞过程没有明显作用。有时在所述改变沉默(例如,在其编码的氨基酸没有改变的情况下)的情况下,SNP基因分型可能仍具有价值,如果所述改变与由另一个遗传改变引起的独特表现型相连(关联的)。
现有多种SNP基因分型的方法。大部分采用PCR或其它扩增技术以扩增感兴趣的模板。可以使用包括凝胶电泳、质谱和荧光在内的同步或后续分析技术。均相(homogeneous)并且不需要在扩增开始后添加试剂或为了分析而对反应物手工取样的荧光技术是具有吸引力的。示范性的均相技术使用寡核苷酸引物来定位感兴趣的区域以及荧光标记或染料用于产生信号。通过使用对DNA变性温度稳定的热稳定酶,示例性的基于PCR的方法是完全闭管的,这样在加热开始以后,不需要进行添加。
对于SNP基因分型可以采用几种闭管的、同质的荧光PCR方法。这些方法包括使用有两个相互作用的发光基团的FRET寡核苷酸探针(邻近杂交探针,TaqMan探针,Molecular Beacons,Scorpions)、仅有一个荧光基团的单一寡核苷酸探针(G-淬灭探针,Crockett,A.O.和C.T.Wittwer,Anal.Biochem.2001;290:89-97以及SimpleProbes,Idaho Technology)、以及使用双链DNA染料而不是共价荧光标记的寡核苷酸探针的技术。由于不需要标记的寡核苷酸探针,可以降低设计时间和检测成本,所述染料技术是具有吸引力的。
已经公开了两种使用双链DNA染料的SNP分型技术。可将存在双链DNA染料情况下的等位基因特异性扩增用于实时PCR基因分型(Germer S等,Genome Research 2000;10:258-266)。在Germer的参考文献的方法中,在存在一条共有反向引物的情况下,两条3’-碱基存在差异的等位基因特异性引物差异扩增一条或另一条等位基因。虽然不需要荧光标记的寡核苷酸,基因分型要求3条引物以及针对每种基因型的两个反应池。此外,需要监测每个循环荧光信号的实时PCR仪。
另一种基于染料的方法不需要实时监测,每种SNP基因型仅需要一个反应池,并使用解链分析(Germer S等,Genome Research 1999;9:72-79)。在这种方法中,如前面的Germer方法一样,也使用了需要3条引物的等位基因特异性扩增。此外,所述引物中的一条含GC-发夹尾部,以提高一个扩增子的解链温度,使得在一个反应池中通过解链温度进行区分成为可能。PCR扩增后检测荧光,而不需要实时采集。
发明内容
本发明的一个方面提供了一种仅需要标准PCR混合物,包括试剂、引物、以及在PCR前简单添加的本公开的“饱和”双链(ds)DNA结合染料或新型dsDNA结合染料的方法。为了本发明的目的,“饱和”染料是指该染料以为不存在染料情况下由PCR通常产生的双链DNA量(例如约10纳克/微升)提供最大荧光信号的浓度存在时,不会明显抑制PCR反应。虽然所述染料通过其饱和浓度时与PCR的相容性进行鉴别,需要理解的是所述染料能以低得多的浓度使用。扩增过程中或扩增之后,所述染料可以与使用标记引物情况下类似的方式通过解链曲线分析用于区分异源双链分子和同源双链分子(Gundry CN,等,Clin Chem.2003 Mar;49(3):396-406)。异源双链分子和同源双链分子的鉴别可以用于包括突变扫描和基因分型在内的多种分析。术语“扫描”是指将一个核酸片段与一个参照核酸片段比较以检测序列上任何差异的存在的过程。表示存在序列差异的阳性结果不一定反映序列变异的确切性质或其在核酸片段上的位置。术语“基因分型”包括检测和确定已知的核酸序列变异,这些变异包括但不限于SNP、碱基缺失、碱基插入、序列重复、重排、倒置、碱基甲基化、短串联重复数;以及在两倍体基因组的情况下,基因组是否是序列变异的纯合子或杂合子,以及一条DNA链上两个或更多序列变异的顺/反位置关系(单体型分析)。任选地,可在解链曲线分析之前的任何时间将一种或多种未标记探针加入该混合物。
术语“未标记探针”指未共价连接于染料并且设计为能完全或部分杂交于靶序列的寡核苷酸或多核苷酸。该混合物中存在的染料不能结合未标记探针或与未标记探针解离,尤其是当探针与靶序列杂交和解链时。本文所用术语“寡核苷酸”和“多核苷酸”包括天然或修饰的单体或连接(包括能够通过碱基配对相互作用特异性结合靶多核苷酸的脱氧核糖核苷、核糖核苷、肽核酸核苷等)的低聚物和聚合物。任选地,可用一个或多个非荧光部分修饰未标记的探针,这些非荧光部分例如但不限于非荧光小沟结合物、生物素、间隔区、接头、磷酸、碱基类似物、非天然碱基等。在PCR 混合物中提供未标记探针的实施方式中,需要未标记探针与结合靶序列的结合不像能抑制扩增的那么紧密。
本发明的另一个方面,鉴别了多种双链DNA结合染料。本发明的双链DNA结合染料能在扩增中或扩增后以对于DNA的充分饱和量存在,同时对PCR的抑制最小化。例如,在最大PCR相容浓度下,双链DNA结合染料具有至少为50%的饱和百分比。在其它实施方式中,所述饱和百分比至少为80%,更具体的至少为90%。在还有其它实施方式中,所述饱和百分比至少99%。需要理解的是,所述饱和百分比是与饱和浓度(也就是在存在预先确定的双链DNA量的情况下提供可能的最高荧光强度的浓度)的相同染料的荧光相比的荧光百分比。举例来说,预先确定的双链DNA量是100纳克/10微升,这是典型的PCR末期到达平台期时产生的DNA量。需要进一步理解到染料制剂可能包含抑制扩增的杂质。这样的杂质应该在确定饱和百分比之前去除。也需要理解的是,饱和百分比荧光强度的测量在与检测结合双链DNA的染料良好匹配的波长处进行,而且如果可能的话,不在能检测到来自游离染料或在高染料-碱基对比率下可能形成的染料结合的二级形式(例如,染料与双链DNA-染料复合物结合或与单链核酸结合)的高本底荧光的波长处检测。
在本发明的还有另一个方面,双链DNA结合染料在最大PCR相容浓度下具有大于50%的饱和度,而且具有可能与常规实时PCR仪不兼容的激发/发射光谱。用于实时PCR分析的“常规”仪器具有介于约450-490纳米的激发波长和介于约510-530纳米的发射检测波长。已经发现某些“蓝色”染料与这些系统兼容,虽然其激发/发射光谱可能有所不同。这样,在本发明的这个方面,提供了一种在PCR过程中或PCR之后使用常规实时PCR仪和双链DNA结合染料分析的方法,其中双链DNA结合染料正如在存在双链DNA的PCR缓冲液中测得的具有介于410-465纳米,尤其是介于430-460纳米的最大激发波长,并具有介于450-500纳米,尤其是介于455-485纳米的最大发射波长。适当的仪器可以使用上述激发/检测区间,或可以按照染料的激发/发射峰值进行改进。检测本发明的“蓝色”染料以及检测如荧光素和SYBRGreen I等常规染料的适当区间可以包括440-470纳米的激发波长和500-560纳米的检测波长。注意到,虽然许多这些染料适合用于标准的实时PCR仪器和解链仪器操作,但调整光学器件以更好地匹配这些染料的激发/发射光谱可进一步提高它们用于定量或定性扩增分析的灵敏度。
在本发明又一方面,通过在一种或多种未标记探针和双链结合染料的存在下进行解链曲线分析进行扫描或基因分型。可在扩增期间或之后、或没有扩增的情况下进行解链曲线分析。染料可以是本公开的饱和染料或新型染料。
虽然这里所提供的实例是针对解链曲线分析的,需要理解的是,本发明的染料可以用于多种包括核酸定量、起始浓度测定、对存在一种核酸的检测、用标记探针的复合检测以及其它基于PCR的方法在内的实时定量PCR分析。
此外,虽然提及的是PCR,其它扩增方法可以与本发明的染料相容。这样的合适的方法包括链置换扩增(SDA)、依赖于核酸序列的扩增(NASBA)、级联滚环扩增(CRCA)、Qβ复制酶介导的扩增、等温和嵌合引物启动的核酸扩增(ICAN)、转录介导的扩增(TMA)等。也可采用不对称PCR。因此,当使用术语PCR的时侯,需要理解为包括PCR的变型和其它可供选择的扩增方法。相对于一条链更有利于扩增另一条链的扩增方法尤其适用于采用未标记探针的解链曲线分析。
而且,虽然参照扩增,但应理解可对未经扩增的核酸样品进行本发明的解链曲线分析。
此外,需要理解双链DNA结合染料包括嵌入剂以及其它与核酸结合的染料,只要所述染料差异结合双链和单链核酸,或产生基于双链核酸数量的差异信号。
因此,在本发明的一个实施方式中,提出了新型染料。新型染料可以是或不是饱和染料,可在扩增期间或之后使用这种新型染料,或者可在进行或未进行扩增的情况下进行解链曲线分析期间使用这种新型染料。例如,该新型染料具有下式:
式中
部分 代表任选取代的稠合的单环或多环芳环或任选取代的稠合的单环或多环含氮杂芳环;
X是氧、硫、硒、碲或选自C(CH3)2或NR1的部分,式中R1是氢或C1-6烷基;
R2选自C1-6烷基、C3-8环烷基、芳基、芳基(C1-2烷基)、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基和二烷基氨基烷基、三烷基铵烷基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯、任选取代的含杂原子的环状部分或任选取代的含杂原子的非环状部分;
t=0或1;
Z是0或1个电荷;
R3选自氢、C1-6烷基或芳基羰基,或者R2和R3一起形成-(CH2)w-,式中w是1-5;
R9和R10各自独立地选自氢、C1-6烷基或芳基羰基;
n=0、1或2;和
v=0或1;限制条件是当R2和R3没有一起形成-(CH2)w-时v=0;
当v=0时,Q是选自下组结构的杂环:
和
当v=1时,Q是选自下组结构的杂环:
式中R4、R5、R6、R7和R8独立地选自:氢、卤素、烷基、环烷基、杂烷基、杂环烷基、烯基、聚烯基、炔基、聚炔基、烯基炔基、芳基、杂芳基、烷氧基、烷硫基、烷基腈硫基、芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、二烷基氨基、环烷硫基、环杂烷硫基、三烷基铵烷硫基或核苷硫基,以上基团各自可被任选取代;以及各自任选地包含季铵部分的含杂原子的非环状部分、含杂原子的环状部分、BRIDGE-DYE或反应性基团。
例如,在一个实施方式中,R4、R5、R6、R7和R8中至少一个选自芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、环烷硫基、环杂烷硫基、三烷基铵烷硫基、烷基腈硫基或核苷硫基,以上基团各自可被任选取代。在另一实施方式中,所述染料选自N7、O7、P7、Q7、R7、S7、T7、U7、V7、W7、X7、Z7、K8、P8、T8、W8、X8、Z8、A9、C9、G9、I9、I9Met、J9、J9Met、K9、L9、L9Met、M9、N9、O9、P9、Q9、R9、A10、V10、F11或H11。在一种方法中,将这些染料用于PCR扩增。在另一方法中,将这些染料与靶核酸和未标记的探针一起用于解链曲线分析。这些染料可用于本文所述的各种其它方法。
在本发明的另一实施方式中,提供了一种核酸分析方法,该方法包括以下步骤:将靶核酸与饱和dsDNA结合染料和设计以杂交靶核酸一部分的至少一种未标记探针混合,形成混合物,使未标记探针能够杂交靶核酸以形成探针/靶标双链体,在加热混合物时通过测定dsDNA结合染料的荧光产生探针/靶标双链体的解链曲线,以及分析解链曲线的形状。例如,可通过产生导数解链曲线分析解链曲线的形状,例如分析导数解链曲线上一个或多个解链峰的形状和位置。可任选地在靶核酸扩增期间或之后进行此分析。上述饱和染料或其它饱和染料可用于此方法。
在本发明的又一实施方式中,提供了分析靶核酸的试剂盒,该试剂盒包括设计为至少能与靶核酸部分杂交的未标记探针和饱和dsDNA结合染料。该试剂盒可任选地包括其它组分,例如设计用于扩增靶核酸的耐热聚合酶和寡核苷酸引物。
在本发明的另一实施方式中,提供了检测c-kit基因中突变的方法,该方法包括提供含有核酸样品、设计用于扩增c-kit基因的基因座的一种或多种引物对、耐热聚合酶和饱和dsDNA结合染料的扩增混合物,扩增核酸样品以产生扩增子,使扩增子解链产生解链曲线,分析解链曲线的形状。例如,引物包括选自下组的任何引物或全部引物:GATGCTCTGCTTCTGTACTG(SEQ ID NO.40)和GCCTAAACATCCCCTTAAATTGG(SEQ ID NO.41);CTCTCCAGAGTGCTCTAATGAC(SEQ ID NO.42)和AGCCCCTGTTTCATACTGACC(SEQ ID NO.43);CGGCCATGACTGTCGCTGTAA(SEQ ID NO.44)和CTCCAATGGTGCAGGCTCCAA(SEQ ID NO.45);以及TCTCCTCCAACCTAATAGTG(SEQ ID NO.46)和GGACTGTCAAGCAGAGAAT(SEQ ID NO.47)。
在又一实施方式中,提供了一种核酸分析方法,该方法包括以下步骤:将靶核酸与饱和dsDNA结合染料混合形成混合物,在加热混合物时通过测定dsDNA结合染料的荧光产生靶核酸的解链曲线,该混合物中包括设计为能与靶核酸的一部分杂交的第二种核酸,第二种核酸小于靶核酸并且解链温度与靶核酸不同,使第二种核酸与靶核酸的部分杂交,使第二种核酸与第一种核酸解链,以及分析解链曲线的形状。在一个实施方式中,第二种核酸是可在产生靶核酸的解链曲线之前或之后加入的未标记探针,而在另一实施方式中,第二种核苷酸是较小的扩增子,例如可在扩增靶核酸的单一混合物中产生的扩增子。
本发明另一实施方式是一种PCR分析方法,该方法包括以下步骤:将dsDNA结合染料与含有未知起始量的靶核酸和设计用于扩增靶核酸的引物的样品混合,形 成混合物,在dsDNA结合染料的存在下扩增靶核酸,在多个扩增循环期间的整个温度范围中监测dsDNA结合染料的荧光以产生多个解链曲线,用该解链曲线定量靶核酸的起始量。在扩增期间可使用未标记探针和/或饱和染料。
本领域技术人员通过理解以下说明性实施方式的详述后,可明白本发明的其它特征。
附图说明
图1显示了使用染料S5的因子VLeiden的基因分型。显示了解链曲线的负一阶导数(-dF/dT)。
图2显示了解链分析之前冷却速度对异源双链分子检测的影响。
图3显示了解链分析过程中加热速度对异源双链分子检测的影响。
图4A-B是使用工程质粒在一个位置上所有可能SNP基因型的标准化高分辨率解链曲线。分析了各基因型的三个样品,包括四个纯合子(图4A,——A/A、 ——-——C/C、 )和六个杂合双链体(图4B, ——--——A/C、 ——G/T、——--——C/G)。
图5A-D显示了基因分型方法的比较;图5A显示了囊性纤维化示意图,其中一条引物上任选标记的位置用星形(★)标出,图5B显示了使用标记引物的基因分型,图5C显示了使用染料S5的基因分型,图5D显示了使用SYBRGreen I的基因分型尝试(纯合子:—--—wt,——F508del,杂合子:—·—F508del,—-—I507del,----F508C)。
图6显示了在更长的扩增子上使用染料S5的基因分型(—--—纯合子(TT),——纯合子(CC),—·—杂合子(TC))。显示了三个个体(不是导数)的解链曲线。
图7A-B显示了使用SYBRGreen I(图7A)和染料S5(图7B)的DNA混合物的导数解链曲线。
图8显示了多种类型DNA样品存在时的非线性荧光变化。图上显示了染料S5(○)和SYBRGreen I(■)。
图9A-B显示了用于测定饱和百分比的染料滴定,图9A中:◆-SYBRGreen,■-SYBRGold,▲-Pico Green;图9B中:○-染料S5,■SYTOXGreen。对于SYBRGreen和染料S5的示例性PCR范围用阴影框表示。
图10显示了染料浓度对解链温度的影响。
图11A-B显示了染料S5(图11A)和SYBRGreen I(图11B)的激发和发射光谱。
图12A-D显示了β球蛋白110bp的片段中6种不同基因型(—-—SS、——AA、—--—CC、—·—SC、 -·-·-AS)一式四份样品的高分辨率解链曲线分析。图12A显示了从每种基因型一式四份样品的高分辨率解链获得的原始数据;图12B显示了6种基因型一式四份样品的经过标准化处理的高分辨率解链曲线;图12C显示了6种基因型一式四份样品的温度变动、标准化的、高分辨率解链曲线。样品温度变动以重叠5%和10%之间的荧光;图12D显示了由图12C的数据得到的荧光差异曲线。每条差异曲线通过从标准(AA)曲线中扣除每种样品以获得差异数据。当采用一式四份样品时,由于重叠的关系,在有些情况下看起来少于4份样品。
图13A显示了人5-羟色胺受体2A(HTR2A)基因544bp片段的3种基因型的重复样品的解链曲线分析(—-—TC,——CC,—--—TT)。已使用10%和20%之间的荧光部分对数据进行了标准化和温度变动处理。图13B.为同源双链分子的理论解链示意图。单核苷酸多态性位点用(X)标出。
图14显示了囊性纤维化跨膜转导调节因子(CFTR)基因612bp片段的6种基因型的差异曲线。通过30%和40%之间荧光部分的叠加对图进行了标准化和温度变动处理,并从一种野生型图中扣除。
图15显示了参照CEPH的犹他家族1331的家系图。犹他家族1331的HLA-A基因型如下:A:02011;B:3101;C:2402101;D:03011;E:01011。对每个个体进行了编号。女性(圈);男性(方框)。
图16A-B显示了犹他家族1331成员的解链曲线。在17个家族成员中,存在着代表HLA-A外显子2的6种基因型的6条不同的解链曲线。图16A显示了完整的解链曲线,图16B显示了放大的部分(表示在16A方框中)并在圆括号内注明了基因型和个体。
图17显示了通过混合(——BM15,—--—BM16,-----BM15+BM16)对两个样品基因型的确定。两个纯合子样品BM15(0101)和BM16(0201)在HLA-A外显子2上有15bp的差异。分别检测时BM15和BM16的解链曲线是相似的,但在混合时,15bp的错配使解链曲线发生偏移。
图18A和B显示了不对称PCR之后用未标记探针进行基因分型的优化实验的结果。图18A显示了用各种引物比进行扩增的结果( 对称(各引物0.5μM); 对称(无模板对照); (细)0.05μM正向引物和0.5μM反向引物; (粗)0.5μM正向引物和0.05μM反向引物; (细)0.5μM正向引物和0.025μM反向引物; (粗)0.025μM正向引物和0.5μM反向引物; (细)0.5μM正向 引物和0.01μM反向引物; (粗)0.01μM正向引物和0.5μM反向引物)。图18B是显示探针解链峰的导数解链曲线( 对称(各引物0.5μM); 0.05μM正向引物和0.5μM反向引物; 0.5μM正向引物和0.05μM反向引物)。
图19与图18B相似,显示不对称扩增后的解链峰( 对称(各引物0.5μM);实线0.5μM正向引物和0.05μM反向引物; 0.5μM正向引物和0.025μM反向引物; 0.5μM正向引物和0.01μM反向引物)。
图20是显示长度为14-30个核苷酸的未标记探针的解链峰的导数解链曲线。
图21A-D是显示未标记探针的测试系统中解链峰的导数解链曲线。图21A显示采用染料D6时4个纯合子各自的导数解链曲线;图21B显示采用染料D6时A纯合子以及A/G、A/T和A/C杂合子的导数解链曲线;图21C显示采用SYBRGreen I时A纯合子以及A/G、A/T和A/C杂合子的导数解链曲线;图21D显示采用染料D6时A纯合子以及G/T、C/G和C/T杂合子的导数解链曲线。
图22A-B是显示采用未标记探针时各种囊性纤维化突变的解链峰的导数解链曲线。
图23是显示采用两种不同的未标记探针时囊性纤维化SNP突变的解链峰的导数解链曲线。
图24是显示在相同反应中采用两种未标记探针时囊性纤维化突变F508del和Q493V的解链峰的导数解链曲线。
图25A-B是包括囊性纤维化G542X基因座的PCR扩增子的解链曲线,其中同时对样品进行通过扩增子解链的扫描突变和通过探针解链进行基因分型。图25A显示了75℃-83℃(扩增子解链特性)的数据的荧光-温度图。插图是方框表示的曲线部分的放大图。图25B显示58℃-72℃(探针解链特性)的数据的导数图,—野生型;…G542X纯合子;---G542X杂合子。
图26说明在LightCycler上编程用于监测各扩增循环中的未标记探针/靶标双链体解链的PCR参数。显示了两个PCR循环。在退火和延伸之间连续监测各循环的荧光(用实线表示)。
图27显示采用未标记探针和染料N7时在PCR各循环期间获得的导数解链曲线。峰高随循环数而增加。该样品中模板DNA的起始浓度为105拷贝/10μl。
图28A-D显示了对PCR各循环期间获得的荧光数据的分析。图28A显示了在61℃(反映出反应中总dsDNA的量,■)和73℃(反映出扩增子量,□)获得的数据的循环数-荧光图。图28B显示了循环数与解链峰面积的图(▲)以及循环数与由导数数据 计算的解链峰顶点与恰好在解链转变之前之差的图(Δ)。图28C显示了三种不同起始模板浓度下循环数-解链峰面积图(▲-104拷贝/10μl;■-105拷贝/10μl;□-106拷贝/10μl)。图28D显示了起始模板浓度的对数与衍生自图28C的各样品交点的图。
图29-32显示对各种胃肠道基质肿瘤(GIST)突变进行基因分型的解链曲线,各自与正常的野生型扩增子作比较。图29显示杂合SNP(——正常,----GIST 1),图30显示纯合的12bp缺失/SNP(——正常,----GIST 2),图31显示杂合串联复制(36bp)(——正常,----GIST 3),图32显示杂合缺失(54bp)(——正常,----GIST4)。
具体实施方式
由于SYBRGreen I在PCR过程中表现出荧光的巨大变化,SYBRGreen I成为一种广泛用于解链分析的染料(Wittwer CT等,Biotechniques 1997;22:130-1,134-8;Wittwer CT等所著《实时PCR》(Real-Time PCR),见Persing D等编,Diagnostic Molecular Microbiology:Principles and Applications,ASM出版社,2004,印刷中)。SYBRGreen I最初在解链分析中用以区分Tm值差别2℃或更大的不同PCR产物(Ririe KM等,Anal Biochem 1997;245:154-160)。随后,将SYBRGreen I用于鉴别碱基缺失(Aoshima T等,Clin Chem 2000;46:119-22)、基因型二核苷酸重复(Marziliano N等,Clin Chem 2000;46:423-5)以及鉴别多种序列改变(Lipsky RH等,Clin Chem 2001;47:635-44;Pirulli D等,Clin Chem 2000;46:1842-4;Tanriverdi S等,J Clin Microbiol.2002;40:3237-44;Hladnik U等,Clin Exp Med.2002;2:105-8)。然而,基因型之间Tm差异可能很小并可能挑战现有仪器的分辨率。事实上,已经认为SYBRGreen I“不能在常规基因分型应用中使用”(von Ahsen N等,Clin Chem 2001;47:1331-1332)。采用通常使用的双链特异性DNA染料的解链曲线基因分型可导致随着解链转变区间加宽的Tm值提高(Douthart RJ等,Biochemistry 1973;12:214-20)和基因型之间Tm差异的压缩(图5D)。这些因素降低了SYBRGreen I用于区分基因型的能力。
杂合的DNA由4种不同的单链组成,这些单链在变性并冷却时能产生2种同源双链分子和2种异源双链分子。理论上,所有4种产物具有不同的Tm值并且解链曲线应该是所有4种双链向单链转变的合成。然而,双链特异性DNA染料可能在解链过程中重新分布(Aktipis S等,Biochemistry 1975;14:326-31),这引起染料从低解链温度的异源双链分子上释放并重新分布在更高解链温度的同源双链分子上。因为在与 PCR相容的浓度下SYBRGreen I没有饱和(Wittwer CT等,Biotechniques 1997;22:130-1,134-8;图9),这样的重新分布是可能的并与缺少异源双链分子解链转变相一致(图5D)。
本发明染料能在基因分型和扫描的应用中使用。在仅扩增一种PCR产物并且序列是纯合的情况下,只形成同源双链分子。使用本发明的染料,不同同源双链分子之间Tm值差异没有被压缩(图5C),并且可以显著区分基因型,即使是SNP。本发明染料也可以用于鉴别和区分反应中存在的多种产物,例如通过纯合的多个基因基因座或多个目标的扩增而产生的同源双链分子。相反,大概是由于染料的重新分布,使用SYBRGreen I在大多数情况下只能观察到少数产物(见图7A)。
当扩增一个或多个杂合靶标时,使用本发明的染料可以容易地观察到异源双链分子。检测并鉴定异源双链分子的能力对于检测杂合基因型以及扫描未知突变来说尤其有用。采用用于实时PCR的诸如SYBRGreen I、SYBRGold以及溴化乙锭等不能观察到其中异源双链分子产物的传统双链DNA染料是不可能实现这一点的。
在解链过程中,异源双链分子的链可以与其完全互补的链重新结合并形成同源双链分子。由于在PCR结束时产物浓度很高,这一重新结合过程快速发生。通过限制产物处于其解链温度附近(尤其是处于异源双链和同源双链产物Tm值之间)的时间,所述的重新结合能被最小化。除了解链过程中链的重新结合,链与其完全匹配的或错配的互补链的选择性杂交受到冷却速度的影响。在这里所表示的条件下,快速冷却最有利于异源双链分子形成,而在低于-0.1℃/秒的速度下,异源双链分子经常会消失(图2)。这与变性HPLC技术相反,后者的冷却速度慢得多(-0.01至约-0.02℃/秒),却仍有效形成异源双链分子(Xiao W等,Hum Mutat 2001;17:439-74)。同源双链分子和异源双链分子形成的相对速度也许非常依赖于产物大小,使用小的扩增子获得的结果对于dHPLC中更通常使用的更大的产物而言可能不具有典型性。
通过以更低的速度解链、花费更多的分析时间,可以提高纯合基因型之间的辨别力。DNA浓度对Tm的影响是解链曲线基因分型中潜在误差的一个来源。在PCR条件下使用50%GC含量的随机100bp的扩增子时,0.05μM和0.5μM的产物之间Tm值差异约为0.7℃(von Ahsen N等,Clin Chem 2001;47:1956-61;Wetmur JG,Grit Rev Biochem Mol Biol 1991;26:227-59)。当不同纯合基因型的Tm值非常接近的时候,这一改变可能是重要的。然而,不同PCR样品趋向于以相同产物浓度达到平台期,因此扩增后浓度差异通常是最小的。同时,可以通过实时荧光估计扩增子浓度并为获得甚 至更高的基因分型精度调节Tm值。另外,可以使用不对称PCR自动限制PCR产物的终浓度。
用本发明染料有可能将所有单个碱基杂合子与纯合子加以区分。在杂合子检测中,绝对解链温度和DNA浓度的影响不象使用涉及到区分纯合基因型的方法那么重要。异源双链分子影响解链曲线的形状,尤其是在转变的“早期”低温部分。通过平移X轴重叠解链转变的“晚期”高温部分,可使得不同的解链曲线温度匹配。然后可以以更高的精确度推断异源双链分子是否存在。因此,即使在未经PCR扩增的样品中,对DNA浓度的关注可能并不重要。
无论仪器的精确度如何,有些基因型的Tm值会是几乎相同的。检测具有相同Tm值的纯合变异的一种方法是将变体共同混合。获得的异源双链分子会在比纯合子更低的温度下解链,在标准化的解链曲线中表现出在主要解链转变之前的下降。
因而,使用目前可以利用的PCR扩增装置,本发明染料可以在解链曲线转变中鉴别目前不能用SYBRGreen I鉴别的异源双链分子。图7A中说明了SYBRGreen I不能简便地鉴别低温解链转变的一个可能原因。当存在几个稳定性递增的DNA片段时,使用SYBRGreen I的低温峰与使用染料如染料S5(结构见实施例1)的相比很小。在解链过程中,SYBRGreen I可能从低温双链分子上释放,只连接于在更高温度下解链的双链。这引起每个后继的峰比前一个高,使得最低温度的峰即便能够观察到也很小。正如图7B中所看到的,用染料S5可容易地检测到低温解链的产物,而用SYBRGreen I却不能检测到。
使用染料S5的优点导致了对其它与PCR相容并在PCR相容浓度下适于基因分型的双链DNA染料的区别。许多用于本发明的方法中的染料属于花青家族。花青染料是在连接两个含氮杂环的链上含一个或多个二价“-C(R)=”部分的那些染料。基团“R”可能是氢或任何碳取代基,例如氢或烷基,包括可以被任选取代的C1-6烷基。需要理解的是在其中有一个以上二价“-C(R)=”部分的花青染料中,每个“R”可以是独立选择的。正如由这里所述的说明性通式所进一步定义的,这样的花青染料可以是单体或二聚体。许多花青染料,例如二价部分是=N-、-C(R)=N-等的染料也很合适。除了花青染料,预计其它dsDNA结合染料家族也可用于本文所述的PCR反应混合物、方法和组合物,这些家族包括但不限于吖啶基染料、菲啶鎓插入剂和菲咯啉基金属插入剂。
用于本文所述PCR反应和解链曲线混合物、方法和组合物的示例性染料包括PO-PROTM-1、BO-PROTM-1、SYTO9、SYTO43、SYTO44、SYTO45、 SYTOXBlue、POPOTM-1、POPOTM-3、BOBOTM-1、BOBOTM-3、LO-PROTM-1、JO-PROTM-1、YO-PRO-1、TO-PRO-1、SYTO11、SYTO13、SYTO15、SYTO16、SYTO20、SYTO23、TOTOTM-3、YOYO-3(Molecular Probes,Inc.,Eugene,OR)、GelStar(Cambrex Bio Science Rockland Inc.,Rockland,ME)、噻唑橙(Aldrich Chemical Co.,Milwaukee,WI)、EvaGreenTM(Biotium,Hayward,CA)、BEBO、BETO、BOXTO(TATAA Biocenter AB., Sweden)和本文所述的各种新型染料,其中大部分是饱和染料。
用于本文所述PCR反应混合物、方法和组合物的示例性花青染料也包括具有吡啶 嘧啶 喹啉 异喹啉 或嘌呤 核心结构的不对称花青的单体或二聚体,以及具有通式I所述结构的那些花青染料:
式中
部分 代表任选取代的稠合的单环或多环芳环或含氮杂芳环;
X是氧、硫、硒、碲或选自C(CH3)2或NR1的部分,式中R1是氢或烷基,包括C1-6烷基和C2-6烷基;
R2是包括C1-6烷基和C2-6烷基的烷基、包括C3-8环烷基的环烷基、芳基、包括芳基(C1-3烷基)的芳烷基、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基和二烷基氨基烷基、三烷基铵烷基、烷基和芳基羰基、烷基和芳基羧酰胺、烷基和芳基磺酰基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯、亚烷基磺酸酯等、含杂原子的环状部分、或者含杂原子的非环状部分,这些基团各自可被任选取代;示范性含杂原子的部分包括任选取代的杂烷基,包括甲氧基甲基、乙氧基乙基等;杂环基,包括哌啶基等;烷基磺酸酯和芳基磺酸酯,包括甲基磺酸酯、4-氯苯基磺酸酯等;烷氧基,包括甲氧基、乙氧基等;氨基,包括甲基氨基、二甲基氨基等;羰基衍生物,包括烷基羰基和芳基羰基、烷基氨基羰基、烷氧基羰基等;杂烯基,包括烯基氨基烷基、烯氧基烷基、烷基氨基烯基、烷氧基烯基、亚烷基氨基烷基等;杂烯丙基(heteroallyl);酯;胺;酰胺;磷-氧键和磷-硫键;包括含有杂原子的部分,如美国专利号5,658,751和PCT公开号WO 00/66664所述;将各自的公开内容全部纳入本文作为参考;
t=0或1;
Z是0或1个电荷;
R3、R9和R10各自独立地选自氢、包括C1-6烷基和C2-6烷基的烷基或芳基羰基;
n=0、1或2;和
Q是杂环,如吡啶 嘧啶 喹啉 或嘌呤 各自可被任选取代。
本文所用术语“烷基”通常指含有1-约12个碳原子的直链或任选具有支链的烃部分,例如包括但不限于:甲基(Me)、乙基、丙基、丁基、十二烷基、4-乙基戊基等。
本文所用术语“环烷基”通常指含有3-约14个碳原子的至少一部分形成一个或两个环的直链或任选具有支链的烃部分,例如包括但不限于:环丙基、环戊基、环己基、4-甲基环己基、2,3-二甲基环戊基、3,5-二甲基环己基乙基等。
本文所用术语“芳基”通常指环状芳族部分,例如包括但不限于:苯基(Ph)、萘基、呋喃基、噻吩基、吡咯并、吡唑并、异 唑基、异噻唑基、 唑基、噻唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、喹啉基、异喹啉基、喹喔啉基、喹唑啉基(quinazalinyl)等。
本文所用术语“任选取代的”通常指用取代基任选取代母体基团上存在的一个或多个氢原子或孤电子对,包括碳、氮、氧或硫原子上存在的氢原子或孤电子对,取代基例如:卤素;羟基;氨基;硝基;巯基(thio);磺酸酯;腈、烷基腈、烷基腈硫基;烷基、环烷基、卤代烷基、卤代环烷基;烷氧基、环烷氧基、卤代烷氧基;单烷基和二烷基氨基;三烷基铵;氨基烷基;单烷基和二烷基氨基烷基;三烷基铵烷基;三烷基铵烷硫基;烷硫基;环烷硫基、环杂烷硫基、核苷硫基;烷基、卤代烷基、环烷基和芳基羰基;芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基;三烷基铵烷基羰硫基;烷基、卤代烷基、环烷基和芳基羰氧基;烷基、卤代烷基、环烷基和芳基磺酰基;苯二甲酰亚氨基;苯并噻唑或萘并噻唑;苯并 唑或萘并 唑和羧基衍生物,如羧酸、酯、硫酯和酰胺。应理解,取代邻近氢原子,包括双氢和连位氢,可以使取代这些邻近氢的取代基分别一起形成螺环或稠环。
应理解,各上述术语可以化学相关方式组合使用,以表示其它部分,如芳烷基指本文所述芳基连接于本文所述烷基所形成的结构,包括但不限于:苄基、苯乙基、皮考啉基、3,5-二甲氧基皮考啉-4-基等。
需要认识到,这里所描述的花青染料结构可以包含手性中心。在这些情况下,除了另有说明以外,需要理解在这些花青染料结构的描述中包括了所有立体异构体。 这样的立体异构体包括单纯的光学活性异构体、外消旋混合物、以及含任何相对量的一种或多种立体异构构型的非对映异构体的混合物。
也需要认识到,这里所描述的花青染料结构可以包含几何中心。在这些情况下,除了另有说明以外,需要理解在花青染料结构的描述中包括了所有几何异构体。这样的几何异构体包括单纯形式或多种混合的几何构型形式的顺式、反式、E和Z异构体。也需要理解,取决于花青染料结构中所包含的双键的特性,这样的双键异构体可以根据如溶剂成分、溶剂极性、离子强度等条件在顺式和反式之间、或是E和Z构型之间互相转化。
进一步需要认识到,当电荷Z大于0时,可能存在结构式I的化合物的几种共振结构。例如,如结构式I所述,电荷Z在形式上可位于氮原子上,或者,电荷可位于杂环Q上。结构式I的带电化合物的共振结构可以通过结构式I的化合物的双键-单键构型的重新排列(如以下示例性结构)进行描述:
式中 X、R2、R3、R9、R10和Q与式I中的定义相同,t=1、Z=1和n=1。本文所述花青染料化合物包括几种可能的共振结构中的任何一种。应理解,形式电荷的位置以及优选的共振结构受 X、R2、R3、R9、R10和Q部分的性质的影响。
也需要理解,在结构式I的化合物携带净电荷的情况下(诸如当Z=1时,或在结构式I的化合物上存在如铵基团、或磺酸基团等带电的取代物的情况下),这些结构式I的化合物伴有平衡离子。这里所包括的花青染料结构的描述中包括任何单价、二价或多价平衡离子。示例性的平衡离子包括如碘化物、氯化物、溴化物、氢氧化物、氧化物、醋酸根、三氟醋酸根、一磷酸根、二磷酸根、三磷酸根等带负电的平衡离子,以及如锂、钠、钾、铯、铵、多烷基铵等带正电的平衡离子。这样的平衡离子可能源于所用的合成方法、纯化方案、或其它离子交换过程。
相信平衡离子的性质或种类似乎不会影响这里所述的花青染料的功能性。需要认识到,当这里所述的染料溶于用于实践这里所述的PCR反应混合物、方法和组合物的溶剂或其它介质中时,伴随的平衡离子可以与溶剂或其它介质中存在的其它平衡离子交换。这样的附加平衡离子可以是溶剂离子、盐、缓冲液、和/或金属。
需要认识到,R2基团实际上可以是结构式I的母体化合物(其中t=Z=0)与具有式R2-L的化合物之间发生亲核反应产生的任何基团:
其中L是合适的离去基团,R2的定义如上所述。例如,R2是任选取代的烷基、酰基、芳基、磺酸或磺酰基,各自可被任选取代。示范性离去基团L包括但不限于:卤素,如氯和溴;酰化产物,如乙酸根或酯(acetate)、甲酸根或酯和三氟乙酸根或酯;磺酸根或酯,如甲磺酸根或酯、三氟甲磺酸根或酯和甲苯基磺酸根或酯;硫酸根或酯,如甲基硫酸根或酯等。
在一个示范性实施方式中,Q是杂环,例如但不限于:
式中R4、R5、R6、R7、R8、R11、R12、R13和R14各自独立地选自氢、卤素、氨基、烷基、卤代烷基、烷氧基、卤代烷氧基、烷基磺酰基、卤代烷基磺酰基、芳基磺酰基、甲酰基、烷基羰基、芳基羰基、羧酸衍生物、单烷基氨基、二烷基氨基、三烷基铵、二烷基氨基烷基、三烷基铵烷基、三烷基铵烷硫基、环烷基、杂烷基、杂环烷基、烯基、聚烯基、炔基、聚炔基、烯基炔基、芳基、杂芳基、烷氧基、烷硫基、芳硫基、烷基腈硫基、芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、其它硫酯、二烷基氨基、环烷硫基、环杂烷硫基、核苷硫基(以上基团各自可被任选取代)、哌啶并、哌嗪并(各自可被烷基、氨基、单烷基 氨基烷基或二烷基氨基烷基、三烷基铵烷基任选取代,或可任选地用烷基使氮季铵化)。
在另一示范性实施方式中,R4、R5、R6、R7、R8、R11、R12、R13和R14之一是含有杂原子的部分,如美国专利号5,658,751所述。在另一示范性实施方式中,R4、R5、R6、R7、R8、R11、R12、R13和R14之一是反应性基团,包括但不限于:卤素、羟基、醇盐(alkoxide)、胺、羧酸、卤化物、醇、醛、硫醇、烷硫基和芳硫基、烷基磺酰基和芳基磺酰基、琥珀酰亚胺基酯、酮和异硫氰酸酯,它们可用于将部分连接于染料核心结构,例如通过形成碳碳键、胺、酰胺、醚、硫醚、二硫键、酮、硫脲和席夫碱。在另一示范性实施方式中,R4、R5、R6、R7、R8、R11、R12、R13和R14之一是具有下式的BRIDGE-DYE:
式中 X、R2、t、Z、R3、R9、R10、Q和n的定义与式I相同,BRIDGE是直链或支链、环状或杂环的、饱和或不饱和、具有1-16个非氢原子如碳、氮、磷、氧或硫的单个共价键或共价连接,从而使得该连接含有烷基、醚、硫醚、胺、酯或酰胺键;碳碳单键、双键、三键或芳香键;磷-氧、磷-硫、氮-氮或氮-氧键;或者芳香键或杂芳键的任何组合。应理解,在一些实施方式中,此二聚体结构是关于BRIDGE对称的,在其它实施方式中,此二聚体结构是不关于BRIDGE对称的,例如,在BRIDGE两侧各自出现时各自独立地选择 X、R2、t、Z、R3、R9、R10和n。
用于本发明的示范性染料也包括具有吡啶 或嘧啶 核心结构的式I花青染料,其中X是氧或硫;部分 代表任选取代的稠合苯并、任选取代的稠合萘并、任选取代的稠合吡啶并、任选取代的稠合嘧啶并、任选取代的稠合喹啉并等;n=0或1;t=0或1;R2是烷基,如甲基和乙基;任选取代的芳基,如苯基或甲苯基;亚烷基磺酸酯,如亚丙基磺酸;或者烷基磺酰基,如CH3(CH2)mSO2,式中m是0、1、2或3;Q是选自下组结构的杂环:
式中
R4是氢,烷氧基,包括甲氧基、乙氧基、丙氧基等;烷硫基,包括甲硫基、乙硫基等;杂环基烷基,包括任选取代的哌啶基、吡咯烷基、哌嗪基等;或者包含带电基团的杂环基烷基,包括4,4-二甲基哌嗪-1-基等;或反应性基团,包括卤素、羟基、烷氧基、巯基、烷基和芳硫基、烷基和芳基磺酰基、氨基、甲酰基、烷基和芳基羰基、羧基衍生物等;
R5是C1-6烷基,包括甲基、乙基、丁基、仲丁基、异丁基等;任选取代的苯基;或者(CH2)3N+(Me)3;和
R6、R7和R8各自独立地是氢或甲基。
本文所用示范性染料也包括具有吡啶 或嘧啶 核心结构的式I花青染料,其中X是氧或硫;部分 代表任选取代的稠合苯并(形成任选取代的苯并 唑 或苯并噻唑 环)或者任选取代的稠合萘并(形成任选取代的萘并 唑 或萘并噻唑 环);n=0或1;t=0或1;R2是烷基如甲基,芳基如苯基或甲苯基,亚烷基磺酸酯如亚丙基磺酸,或烷基磺酰基如CH3(CH2)mSO2,式中m是0、1、2或3;Q是4-吡啶 或4-嘧啶 杂环。
本文所用示范性染料也包括用于本文所述PCR反应混合物、方法和组合物的花青染料,它具有喹啉 核心结构,通式为式II:
式中
部分 代表任选取代的稠合的单环或多环芳环或含氮杂芳环;
X是氧、硫或选自C(CH3)2或NR1的基团,其中R1是氢或C1-6烷基;
R2是烷基,包括C1-6烷基和C2-6烷基;环烷基,包括C3-8环烷基;芳基;芳烷基;亚烷基磺酸酯;含杂原子的环状部分;或含杂原子的非环状部分,各基团可被任选地取代;
t=0或1;
Z是0或1个电荷;
R3、R9和R10各自独立地选自氢或烷基,包括C1-6烷基;
n=0、1或2;和
R4、R5、R8、R11、R12、R13和R14的定义与式I相同,只要R4是分子量小于约115,或例如分子量小于约105的部分。
用于本发明的示范性染料也包括式II花青染料,式中部分 代表任选取代的稠合苯并(从而形成苯并 唑 或苯并噻唑 环);X是氧或硫;n=0或1;t=0或1;R2是甲基;
R4是氢、C1-6烷基包括甲基、或任选取代的苯基;
R5是C1-6烷基包括甲基、或任选取代的苯基;
R8是氢;和
R11、R12、R13和R14是氢或烷氧基,包括甲氧基。
在其它实施方式中,用于本发明的染料也包括(例如)式II花青染料,式中部分 代表任选取代的杂环,包括1-甲基吡啶并和3-溴-1-甲基吡啶并;X是氧或硫;n=0或1;t=z=0;
R4是氢或C1-6烷基,包括甲基;
R5是C1-6烷基,包括甲基、任选取代的苯基或杂烷基,包括含有带电基团的杂烷基,如-(CH2)3N(Me)3;
R8是氢;和
R11、R12、R13和R14是氢、烷基包括甲基、或烷氧基包括甲氧基。
在另一实施方式中,式I的两种化合物一起形成二聚体。这两种化合物通过用一个二价接头取代各式I化合物上存在的上述取代基R4、R5、R6、R7、R8、R11、R12、R13和R14之一互相连接在一起。例如,式I的两种化合物一起形成二聚体,其中用一个二价接头取代式I的两种化合物上存在的两个R5取代基。应理解,本文包括了式I化合物的对称或不对称二聚体。在式I化合物的不对称二聚体的情况下,应理解,通过形成具有不同取代方式或具有不同杂环Q的式I化合物的二聚体可能产生这种不对称。而且,通过用二价接头取代式I化合物的不同取代基形成二聚体,如用二价接头取代第一种式I化合物上的R5和取代第二种式I化合物上的R8形成二聚体也可能产生这种不对称。
在另一实施方式中,式II的两种化合物一起形成二聚体。这两种化合物通过用一个二价接头取代各式II化合物上存在的上述取代基R4、R5、R8、R11、R12、R13和R14之一互相连接在一起。例如,式II的两种化合物一起形成二聚体,其中用一个二价接头取代式II的两种化合物上存在的两个R5取代基。应理解,本文包括了式II 化合物的对称或不对称二聚体。在式II化合物的不对称二聚体的情况下,应理解,通过形成具有不同取代方式或具有不同杂环Q的式II化合物的二聚体可能产生这种不对称。而且,通过用二价接头取代式II化合物的不同取代基形成二聚体,如用二价接头取代第一种式II化合物上的R5和取代第二种式II化合物上的R8形成二聚体也可能产生这种不对称。
由式I化合物形成的花青染料二聚体结构也可用式III表示:
式中
部分 和 各自代表独立选择的任选取代的稠合的单或多环芳环或含氮杂芳环;
X和X′各自独立地选自氧、硫、硒、碲或选自下组的基团:C(CH3)2、NR1或NR1′,其中R1和R1′各自独立地是氢或C1-6烷基;
R2和R2′各自独立地选自烷基,包括C1-6烷基;环烷基,包括C3-8环烷基;芳基;芳烷基,包括芳基(C1-2烷基);含杂原子的环状部分;或含杂原子的非环状部分,这些基团各自可被任选取代;
t=0或1;
t′=0或1;
Z和Z′各自独立地是0或1个电荷;
R3、R9、R10、R3′、R9′和R10′各自独立地选自氢或烷基,包括C1-6烷基;
n=0、1或2;
n′=0、1或2;
BRIDGE是包含2-约30个二价单元的二价接头,所述二价单元选自亚烷基、杂亚烷基、烷基胺二基(alkylamindiyl)、烷基烷基铵二基(alkylalkylammoniumdiyl)等,如(CH2)p、(CH2)pN+Me2(CH2)q、(CH2)pN+Me2(CH2)qN+Me2(CH2)r等,式中p、q和r各自独立地选自1、2或3;和
Q和Q′是杂环,各自独立地选自以下结构:
其中,在式III化合物中R4、R5、R6、R7、R8、R11、R12、R13和R14各自出现时独立地选自氢、卤素、氨基、烷基、卤代烷基、烷氧基、卤代烷氧基、烷基磺酰基、卤代烷基磺酰基、芳基磺酰基、甲酰基、烷基羰基、芳基羰基、羧酸衍生物、单烷基氨基、二烷基氨基、三烷基铵、二烷基氨基烷基、三烷基铵烷基、三烷基铵烷硫基、环烷基、杂烷基、杂环烷基、烯基、聚烯基、炔基、聚炔基、烯基炔基、芳基、杂芳基、烷氧基、烷硫基、芳硫基、芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、二烷基氨基、环烷硫基、环杂烷硫基、核苷硫基(以上基团各自可被任选取代)、哌啶并、哌嗪并(各自可用烷基、氨基、单烷基氨基烷基或二烷基氨基烷基、三烷基铵烷基任选取代,或可任选地用烷基使氮季铵化)。
在又一实施方式中,R2和R3稠合在一起形成下式的结构:
式中
w是1-5;
v是0或1;和
Y、X、R9、R10、n和Q的定义与式I相同。也应理解,式VII的两种染料(式中w、v、Y、X、R9、R10、n和Q相同或不同)可与上述BRJDGE一起形成二聚体染料,结构类似于式III。
用于本发明PCR反应混合物、方法和组合物的示范性花青染料还包括但不限于:S5、PO-PROTM-1、BO-PROTM-1、SYTO43、SYTO44、SYTO45、SYTOXBlue、POPOTM-1、POPOTM-3、BOBOTM-1、BOBOTM-3、BEBO和具有通式IV的其它染料:
以及实施例1中所述的各种新型染料,和具有通式V的其它染料:
式中n是0、1或2;R2是烷基、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基和二烷基氨基烷基、三烷基铵烷基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯等;R5是烷基、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基或二烷基氨基烷基、三烷基铵烷基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯、任选取代的苯基等;X是氧或硫;A、A′和B各自代表一个或多个独立选择的任选取代基,如烷基、卤素、氨基、卤代烷基、烷氧基、卤代烷氧基、烷基和芳基磺酰基、卤代烷基磺酰基、烷基和芳硫基、甲酰基、烷基和芳基羰基、羧基衍生物、单烷基氨基和二烷基氨基、三烷基铵、二烷基氨基烷基、三烷基铵烷基、三烷基铵烷硫基、烷基腈硫基、环烷基、杂烷基、杂环烷基、烯基、聚烯基、炔基、聚炔基、烯基炔基、芳基、杂芳基、芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、二烷基氨基、环烷硫基、环杂烷硫基、核苷硫基、或杂环、包括吡咯烷并、哌啶并、哌嗪并、苯并噻唑 苯并 唑 苯二甲酰亚氨基、核苷硫基,上述基团各自可用烷基、氨基、单烷基氨基烷基或二烷基氨基烷基、三烷基铵烷基任选取代,或可任选地用烷基使氮季铵化等;BRIDGE是具有式(CH2)pN+Me2(CH2)q的二价接头,其中p和q独立地是2或3,它包括二价接头(CH2)3N+Me2(CH2)3。应理解当这些染料具有净电荷时,它们伴有一个或多个抗衡离子,如抗衡阴离子和抗 衡阳离子,抗衡阴离子包括卤离子、链烷酸根离子、磷酸根离子等,抗衡阳离子包括锂、钠、钾、铯、铵等。
本文所用的其它示范性染料包括但不限于:YO-PRO-1、TO-PRO-1、SYTO9、SYTO11、SYTO13、SYTO15、SYTO16、SYTO20、SYTO23、TOTOTM-3、YOYO-3(Molecular Probes,Inc.)、GelStar(Cambrex Bio Science Rockland Inc.,Rockland,ME)、噻唑橙(Aldrich)、BETO、BOXTO和具有通式VI的其它染料:
式中n是0、1或2;R2是烷基、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基和二烷基氨基烷基、三烷基铵烷基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯等;R5是烷基、羟基烷基、烷氧基烷基、氨基烷基、单烷基氨基烷基或二烷基氨基烷基、三烷基铵烷基、亚烷基羧酸酯、亚烷基羧酰胺、亚烷基磺酸酯、任选取代的苯基等;X是氧或硫;A、B和B′各自代表一个或多个独立选择的任选取代基,如烷基、卤素、氨基、单烷基氨基和二烷基氨基、吡咯烷并、哌啶并、哌嗪并、苯基、羟基、烷氧基、巯基和烷硫基、三烷基铵烷硫基、环烷基、杂烷基、杂环烷基、烯基、聚烯基、炔基、聚炔基、烯基炔基、芳基、杂芳基、芳基羰硫基、环杂烷基羰硫基、二烷基氨基烷基羰硫基、三烷基铵烷基羰硫基、二烷基氨基、环烷硫基、环杂烷硫基、核苷硫基、苯并噻唑 苯并 唑 上述基团各自可被烷基、氨基、单烷基氨基烷基或二烷基氨基烷基、三烷基铵烷基等任选取代;BRIDGE是具有式(CH2)pN+Me2(CH2)q的二价接头,式中p和q独立地是2或3,它包括二价接头(CH2)3N+Me2(CH2)3。应理解,当这些染料具有净电荷时,它们伴有一个或多个抗衡离子,如抗衡阴离子和抗衡阳离子,抗衡阴离子包括卤离子、链烷酸根离子、磷酸根离子等,抗衡阳离子包括锂、钠、钾、铯、铵等。
初步结果说明,对于异源双链分子的检测,S5、PO-PROTM-1、JO-PROTM-1、BO-PROTM-1、G5、H5、S5、D6、E6、P6、R6、Y6、Z6、N7、O7、P7、Q7、R7、T7、V7、Z7、G8、L8、P8、T8、V8、W8、Z8、A9、C9、G9、I9、I9Met、J9、J9Met、K9、L9、L9Met、M9、N9、O9、P9、V10、F11和H11是相当有前途的 染料。这些染料具有几个令人惊讶的性质。第一,在50%的饱和度下,这些染料不会明显抑制PCR。事实上,这些染料中的大多数在相当接近100%的饱和水平时是与PCR相容的。第二,虽然这些染料中的一些在蓝光区间发光,它们可以在多种目前可用的仪器的荧光素通道中使用。为了更好地匹配这些染料的激发/发射光谱而对光学器件的调整可以进一步提高它们在定量或定性扩增分析的使用中的灵敏度。
需要理解,以上的花青染料是示例性的,其它的花青染料也可以在所述的方法中使用。
尚未证实诸如但不限于SYBRGreen I、SYTOXGreen、SYTC14、SYTO21、SYTO24、SYTO25、TOTOTM-1和YOYO-1的一些基于喹啉 的不对称花青可以用于异源双链分子检测或用于闭管体系中多种产物的检测。当所述染料是一种基于喹啉 的花青的单体时,紧靠喹啉 环的氮的碳上(相当于R4位置)的大体积取代可能会干扰所述染料在本发明的方法中发挥功能的能力。大体积取代是指,例如,用分子量大于约105的支链脂族部分取代长链分支的含杂原子脂族或芳族部分。然而,这一限制不适用于前面提到的任何吡啶 或嘧啶 花青。在基于喹啉 的花青二聚体的情况下,由以下二价片段所定义的左右环系统之间的距离似乎也会影响功能性:
功能性可以如这里的实施例1中所述的那样,通过异源双链分子检测得以确定。已被证明诸如SYBRGold、Pico Green和溴化乙锭等以前描述的可用于PCR实时监测的其它染料在闭管PCR系统的异源双链分子检测中也是无效的。
本发明中使用的染料可以在基于染料的SNP基因分型方法中使用,这只需要两种未标记的寡核苷酸引物和针对每种SNP基因型的一个反应池,并不要求实时PCR。使用双链DNA染料从而通过能改变扩增后解链曲线形状的异源双链分子的存在鉴别杂合子。不同纯合基因型可通过其Tm差异进行区分,或作为另一种选择,通过已知纯合DNA样品与未知样品混合并寻找异源双链分子来进行区分。例如,因为可以使用很短的扩增子,优选的是直接与SNP侧翼相接的扩增子,PCR引物设计得到了极大简化。这样的短扩增子同时非常有效地扩增,降低扩增其它靶标的风险,并使非常快速的热循环成为可能。
PCR引物设计不是一门精确的科学,经常的尝试和错误是必然的。虽然一些PCR引物设计的准则被广泛接受,这些准则的可靠性还没有得到检验。因为用短的扩增子时不同基因型对解链曲线的影响更大,优选短的扩增子(≤100bp),并且通常最好的是最短的可能的扩增子(≤50bp)。因此,为了设计用于用双链DNA染料进行基因分型的引物,例如从紧邻SNP位点的每条侧翼引物开始。这样,扩增子长度将是引物1的长度加上引物2的长度加上需要进行检测的区域的长度(一个SNP的长度是1)。为了有效扩增,两条引物的解链温度(Tm)应该基本相同。引物适当的Tm可以是50-70℃。例如,具有最高Tm值的引物可以使最快的热循环成为可能,而Tm值较低的引物通常较便宜并产生最短的扩增子,这导致更大的基因分型差异。通常使用长度介于12到30个碱基的引物。例如,从SNP往外设计每种引物直到计算的Tm值最接近于希望的Tm值。计算Tm值的方法是本领域内熟知的(例如Clin.Chem.2001;47:1956-61)。通常,当Tm值尽可能匹配时,引物长度应是不一样的。例如,在因子V的SNP分析(图1)中使用的引物长度是17和24个碱基,两者均具有接近62℃的计算匹配的Tm值。
因为对于这样短的扩增子几乎不需要引物延伸,扩增的热循环参数可以很短。热循环以前的基因组DNA最初变性之后,不需要保持变性与退火温度,延伸时间可以是10秒或更少。甚至可以将编程的延伸时间降为0,以使每个循环在20秒之内进行。或者,可以使用1秒的延伸时间。因为扩增子如此之短,所以不需要大量的聚合酶(可以使用<0.6单位每10微升)。
因而,按照本发明,可以按照以下示例性步骤进行SNP基因分型:
1.选择目标Tm值并从紧邻SNP位点的每种引物的3’末端开始。任选,引物可以从SNP位点稍微移位以避免引物之间3’互补从而降低形成引物二聚体的风险。
2.向外设计每种引物直至计算的Tm值尽可能接近目标Tm值。
3.在PCR试剂和允许异源双链分子检测的双链DNA染料存在的条件下对样品进行快速热循环。
4.变性以后通过速度至少为-0.1℃/秒,优选地至少-2℃/秒,最优选地至少-5℃/秒的快速冷却形成异源双链分子。
5.以0.1-0.5℃/秒的速度加热并获得解链曲线。
6.如果所述扩增失败,将一条引物的3’末端外移1个碱基并重复所有步骤直到获得成功。
在一个说明性的实例中,所有杂合子都可以通过异源双链分子对解链曲线的影响得以检测(图4)。除此以外,6种纯合差异中的4种(A与C、A与G、C与T、和G与T)很容易通过Tm移动进行区分(图4,箭头)。然而,为了区分A与T纯合子或者C与G纯合子,常常需要高分辨率解链,并且在一些情况下,即便使用现有高分辨率解链也不能区分出纯合子。当考虑人基因组中的SNP频率时,在84%SNP中,不难区分纯合子(A与C、A与G、C与T和G与T),而16%较困难(A与T和C与G)。实际上,在4%的情况下(16%的四分之一),采用最近的邻近分析的稳定性计算说明,由于邻近碱基对称,稳定性相同。表1中给出了精确的频率,其中SNP根据产生的同源双链体和异源双链体分类。在难以区分纯合子的情况下,可优选未标记探针进行完全而高效的基因分型。
表1a.
a用“与”隔开的互换碱基规定SNP杂合子,例如C与T说明在同一链的相同位置上,一个等位基因具有C,另一个等位基因具有T。两个等位基因之间没有偏移,即C与T等同于T与C。用双冒号表示碱基配对(匹配或错配),它们无方向性。即,C::G表示C::G碱基对,但不规定哪个碱基位于哪条链。
b人SNP频率获自Kwok数据组,报道于Venter JC等,人类基因组序列(The sequence of the human genome).Science 2001;291:1304-51)。
c预测的热力学双链体的数量取决于碱基改变周围最近的领近对称。四分之一时间,预计最近邻近对称,即碱基改变位置两侧的侧翼是互补碱基。例如,如果同一条链上C与G SNP的侧翼是A和T,就出现最近邻近对称且预计仅有一个同源双链体Tm。
或者,在纯合子难于区分的情况下,扩增前或扩增后可以将已知的纯合基因型的样品以大致相当的量与所述未知基因型混合。对这一混合物进行扩增(如果以前未扩增)、变性和解链。如果所述基因型是相同的,混合物的解链曲线应与已知的纯合基因 型的解链曲线相同。如果所述基因型不同,会产生异源双链分子并由解链曲线形状的改变得以鉴别。
例如,在对已知序列变体进行基因分型时,可以使用小扩增子或未标记探针;在扫描未知变体时,可以优选大扩增子。也可采用多种扩增子。例如,如果已知大扩增子内较小区段携带了感兴趣的序列变体,那么可在一个反应中扩增较小区段和全长扩增子,并使它们解链。大扩增子的解链数据将提供突变扫描信息,而较小区段的解链数据可提供基因分型信息。可同时扩增较大和较小的扩增子,或通过在第一相中扩增较大扩增子、在第二相中扩增一种或多种较小扩增子(反之亦然)的双相PCR进行扩增。可通过设计Tm和各引物的量进行此双相PCR,以通过调节这两相的退火温度优先地扩增不同扩增子。当预计较大扩增子的信号会淹没或掩盖较短扩增子的信号时,可用此双相技术调整各扩增子的最终量,以避免上述问题。
也可在包括一种或多种未标记探针的单次PCR中同时进行扫描和基因分型。分析产物解链转变和探针解链转变。例如,首先分析全长PCR产物解链转变以检测存在的任何异源双链体。应该可通过此扫描分析检测出扩增子中任何序列差异。如果通过扫描检测到序列变体,那么存在的一种或多种未标记探针的一种或多种解链转变揭示出各探针基因座的基因型。因为探针小于整个PCR产物,用未标记探针进行基因分型比全扩增子基因分型特异性更高,可对探针基因座上的所有SNP改变进行基因分型。
实施例1
染料合成
不对称的花青染料可以通过普通方法进行制备,该方法通过一个或多个“-C(R)=”基团连接分子的吲哚 部分与吡啶 (或喹啉 嘧啶 嘌呤 )部分。如美国专利5,436,134及其引用的参考中所述,“-C(R)=”基团的数量由合成中使用的具体合成试剂决定。在如染料S5的单次甲基染料(R3=H,n=0)的合成中,使用了试剂的一种组合,其中次甲基碳原子由作为甲基的吲哚 盐上的A或吡啶 盐上的B和A和B之外的反应性离去基团生成,所述离去基团通常是甲硫基、甲基磺酰基或氯基,但可以是提供足够反应性以完成反应的任何离去基团。一种可以制备染料S5及其它类似染料的方法如下:
通过将4-甲基-2-吡啶酮(pyridinone,Aldrich)与铜粉、碳酸钾和碘代苯一起加热至回流48小时进行制备原料化合物1。将反应冷却至室温,在水和乙酸乙酯之间进行分配,过滤,并将有机层在硫酸镁上干燥。粗产物在硅胶柱上纯化,用1∶1的乙酸乙酯/己烷洗脱以获得化合物1。
另一种原料,化合物2,是通过向DMF中的甲基碘中添加2-(甲硫基)苯并 唑,并在密封试管中于150℃加热1小时以获得作为碘盐的化合物2。
将化合物1、氯氧化磷以及二氯甲烷中催化量的DMF的混合物加热至回流24小时。将混合物冷却至室温并加入另一份体积的二氯甲烷,随后加入化合物2和1当量的三乙胺。室温下搅拌混合物6小时。通过过滤分离固体并用硅胶柱使用乙酸乙酯/氯仿/甲醇的混合物洗脱进行纯化。随后将纯化的化合物重溶于甲醇并添加过量的碘化钠水溶液。将碘盐形式的化合物3通过过滤分离并真空干燥。
随后将化合物3与1,2-二氯乙烷中的1-甲基哌嗪混合并在55℃加热2小时。然后使获得的产物(化合物4)通过添加过量的甲基碘和Proton Sponge(Aldrich)季铵化,预期可获得二碘化物盐形式的染料S5(化合物5)。
此外,制备了具有以下嘧啶 核心结构的染料的某些实施方式:
式中 X、R2、R3和R5的定义与式I相同,B的定义见式V。
制备具有此式的染料的方式很多,一种方法如下:
其中化合物6是市售的,或可通过常规方法制备。用烷化剂如烷基卤、硫酸烷基酯等,在包括烷基锂、芳族胺和脂族胺、K2CO3等的中性或碱性条件下在N(3)烷化6,从而制备化合物7a。类似地,在金属化合物如铜、钯、铂等催化剂的催化下通过芳族卤化物、硼酸酯等的芳族偶联反应在N(3)使化合物6芳基化,从而制备化合物7a。通过常规氧化从化合物7a制备化合物7b,例如采用过氧化氢、过氧酸包括m-CPBA等的反应。在一些情况下,可购得化合物7a或化合物7b。化合物8是市售的,或可通过(例如)缩合适当取代的1,3-二酮和脲或硫脲来制备。而且,可通过(例如)与烷基卤、烷氧基卤或具有良好离去基团的反应物在中性条件下反应修饰在C(2)具有巯基、烷氧基或伯胺/仲胺的化合物8。可通过在碱性条件下使化合物7与化合物8反应来制备化合物9,如本文所述。
如本文所述制备具有此式的示范性化合物,用三乙胺-乙酸铵作为流动相通过HPLC纯化,分离得到它们相应的乙酸盐。这些示范性化合物见表2。
表2.
化合物D6的制备是通过以下方法合成的:首先在乙腈回流条件下,使4-甲基嘧啶与(3-溴丙基)三甲基溴化铵反应。使得到的产物(化合物A6)的乙腈溶液与3-甲基-2-甲基磺酰基苯并噻唑碘化物(购自Aldrich)在无水吡啶和三乙胺的存在下或在氯仿:甲醇(10:1)和过量三乙胺中反应。在回流温度或室温下进行反应。
化合物E6的制备按照从3-甲基-2-甲基磺酰基苯并唑碘化物(通过使2-甲基磺酰基苯并唑与硫酸二甲酯反应制备)和化合物A6制备化合物D6的通用步骤进行。
化合物G5的制备按照从2-甲硫基-3-苯基苯并噻唑(Aldrich)和化合物A6制备化合物D6的通用步骤进行。
化合物H5的制备按照从5-二氟甲磺酰基-3-甲基-2-甲硫基苯并噻唑甲基硫酸盐(用购自Aldrich的5-二氟甲磺酰基-2-甲硫基苯并噻唑与硫酸二甲酯反应制备)和化合物A6制备化合物D6的通用步骤进行。
化合物P6的制备按照从5-氯-2-(甲硫基)-3-(3-磺丙基)-苯并噻唑 氢氧化物(Aldrich)和化合物A6制备化合物D6的通用步骤进行。
化合物R6的制备按照从6-氨基-3-甲基-2-甲硫基苯并噻唑 甲基硫酸盐(通过购自Aldrich的6-氨基-2-甲硫基苯并噻唑与硫酸二甲酯反应制备)和化合物A6制备化合物D6的通用步骤进行。
化合物Y6的制备按照从3-甲基-2-甲基磺酰基萘并[1,2-d] 唑 甲基硫酸盐(通过用购自加州圣地亚哥的Chem Bridge Product List的2-甲基磺酰基萘并[1,2-d] 唑与硫酸二甲酯反应制备)和化合物A6制备化合物D6的通用步骤进行。
化合物Z6的制备按照从3-甲基-2-甲基磺酰基萘并[1,2-d]噻唑 甲基硫酸盐(通过用购自荷兰Rijswijk的Specs的2-甲基磺酰基萘并[1,2-d]噻唑与硫酸二甲酯反应制备)和化合物A6制备化合物D6的通用步骤进行。
化合物G8的制备如下:通过回流加热N-苯基硫脲和2,4-戊二酮的HCl/乙醇溶液进行制备。使得到的嘧啶硫酮与3-甲基-2-甲基磺酰基苯并噻唑 碘化物在三乙胺的氯仿/甲醇(10∶1)溶液中回流过夜反应,生成化合物G8。
化合物G5、I5、K5、L5、F7、N7、O7、P7、Q7、R7、S7、T7、U7、V7、W7、X7、Z7、C8、E8、K8、L8、M8、N8、O8、P8、T8、V8、W8、X8、Z8、A9、C9、G9、I9、I9Met、J9、J9Met、K9、L9、L9Met、M9、N9、O9、P9、Q9、R9、A10和V10可以通过与上述方法相似的方法制备。这些染料是结合于dsDNA后荧光改变的dsDNA结合染料。预计这些染料中许多可用于检测异源双链体。
也可能制备R2和R3结合在一起的嘧啶 基花青的变体。示范性染料结构包括:
其中w是1-5。在一个示范性实施例中,可通过使ClC(O)(CH2)wBr与2-氨基苯硫酚或2-氨基萘-1-硫酚的反应制备示范性染料的左环系统。例如,通过加热4-溴丁酰氯与2-氨基苯硫酚制备左环系统
然后,使示范性右环系统
通过在三乙胺和乙醇的存在下回流与左环系统反应。可通过在乙酸酐中使4-甲基嘧啶与约等摩尔的二苯基甲脒回流足够时间(如20分钟),再在乙腈中使形成的中间产物与约等摩尔的1,3-二碘代丙烷回流3天,制备此右环系统。然后,通过在二甲基甲酰胺的存在下与三甲基胺反应,使得到的化合物上的碘被(例如)季铵取代,产生以下结构的示范性染料
而且,制备了具有以下嘌呤 核心结构的花青染料的某些实施方式:
式中Y、X、R2、R3、R5、R12、R13、z和t的定义与式I相同,例如其中R2、R5和R13中至少一个不是甲基。按照Lee的改良方法(美国专利号4,937,198)分别用3-乙基-2-甲基-苯并噻唑 和1-乙基-2-甲基-萘并噻唑 制备示范性化合物F11和H11,作为染料的左环系统的前体。化合物F11和H11分别具有以下结构:
本文所述的嘧啶 基花青染料,例如G5、H5、I5、K5、L5、D6、E6、P6、R6、Y6、Z6、F7、N7、O7、P7、Q7、R7、S7、T7、U7、V7、W7、X7、Z7、C8、E8、G8、K8、L8、M8、N8、O8、P8、T8、V8、W8、X8、Z8、A9、C9、G9、I9、I9Met、J9、J9Met、K9、L9、L9Met、M9、N9、O9、P9、Q9、R9、A10和V10;以及本文所述的嘌呤 基花青染料,例如F11和H11是新型染料。表3总结了在异源双链体检测中使用这些染料的结果。通常,将PCR抑制到低于50%饱和水平的染料不能很好地检测杂合子。PCR方法和异源双链体检测如以下实施例所述。
表3.
染料 |
Ex/Em1 |
最大PCR相容的%Sat2 |
%Het3 |
G5 |
442-458/475 |
100% |
20.0% |
H5 |
444/459 |
100% |
22.5% |
S5 |
450/469 |
>99% |
20.5% |
D6 |
457/471 |
92% |
23.3% |
E6 |
425/454 |
>99% |
15.0% |
P6 |
464/490 |
100% |
21.0% |
R6 |
453/470 |
>90% |
15.0% |
Y6 |
439/477-515 |
100% |
21.0% |
Z6 |
469/494-526 |
100% |
13.4% |
N7 |
458/474 |
>100% |
22.0% |
O7 |
**4 |
>70% |
21.2% |
P7 |
**4 |
>70% |
21.5% |
Q7 |
453/471 |
>70% |
20.7% |
T7 |
453/471 |
>70% |
21.2% |
G8 |
453/471 |
>100% |
19.7% |
L8 |
470-490/490-520 |
>70% |
2.3% |
P8 |
453/471 |
>70% |
17.7% |
T8 |
453/471 |
>70% |
24.0% |
V8 |
469/494-526 |
>70% |
21.4% |
W8 |
453/471 |
>70% |
27.5% |
Z8 |
453/471 |
>70% |
22.7% |
A9 |
**4 |
100% |
23.0% |
I9 |
**4 |
100% |
20.9% |
I9Met |
**4 |
>80% |
23.0% |
J9 |
**4 |
100% |
22.4% |
J9Met |
**4 |
100% |
23.0% |
K9 |
**4 |
100% |
22.3% |
L9 |
**4 |
100% |
21.3% |
V10 |
**4 |
95% |
15.5% |
F11 |
**4 |
100% |
22.0% |
H11 |
**4 |
100% |
13.0% |
1.在PCR缓冲液中(3mM MgCl2,50mM Tris,pH 8.3,每种dNTP各200μM,500μg/ml BSA)使用2.5μM bp(100纳克/60微升)双链DNA和最大PCR相容浓度的染料在荧光计上获得的最大激发波长(Ex)和最大发射波长(Em)。有些染料由于发射或激发波长峰较宽,具有一个波长区间。
2.能存在于PCR混合液中不对扩增产生明显抑制的最大染料量,以与饱和浓度(即提供可能的最大荧光强度的浓度)的相同染料的荧光相比的荧光百分比表示,均在存在15μM bpDNA(100纳克双链DNA/10微升)和PCR缓冲液的条件下进行。
3.使用以0.3℃/秒加热速率(heating ramp)获得的del F508杂合子解链曲线,用420-490纳米激发和450-530纳米检测光学器件测量的异源双链分子特征峰的峰面积百分比。本组实验中使用的扩增子长度为57bp,通过引物GGCACCATTAAAGAAAATAT(SEQ ID NO.1)和TCTGTATCTATATTCATCATAGG(SEQ ID NO.24)产生。记录了最大百分比。
4.没有光谱数据。
实施例2
PCR方案
标记的和未标记的寡核苷酸从IT Biochem(Salt Lake City,UT)、Qiagen Operon(Alameda,CA)或Synthegen(Houston,TX)处获得。除了另有说明以外,PCR以10微升的体积在LightCycler(Roche Applied Systems,Indianapolis,IN)上以20℃/秒的程序性变化进行。除了另有说明以外,扩增混合物包括了50纳克作为模板的基因组DNA、每种dNTP各200μM、3mM MgCl2、100mM 2-氨基-2-甲基-1,3-丙二醇,pH 8.8,0.04单位/微升Taq聚合酶(Roche)、500μg/ml BSA、以及每种引物各0.5μM。经基因分型的人类基因组DNA来自以前的研究(Gundry CN等,Genetic Testing,1999;3:365-70;Herrmann M等,Clin Chem 2000;46:425-8)或来自Coriell细胞库(Camden,NJ)。除了另有说明以外,PCR反应中包含10μM的染料S5。在使用SYBRGreen I作为指示剂的情况下,使用了Molecular Probes储存液的1∶10,000最终稀释物。在PCR之前添加染料,进行扩增,并在LightCycler上或通过高分辨率解链分析监测扩增子的解链转变。通过扩增子解链温度(Tm)区分不同的纯合子。通过能加宽总的解链转变区间的异源双链分子的低温解链鉴别杂合子。解链分析需要约1分钟,并且不需要PCR后的取样过程。
为了研究染料S5、SYBRGreen I和其它双链DNA结合染料的灵敏度,分析了因子V Leiden、囊性纤维化(F508del、F508C、I507del、I506V)和HTR2A(T102C)基因中的多态性。此外,使用了工程质粒以全面研究所有可能的单个碱基改变。通过杂合DNA扩增产生的异源双链分子通过使变性产物快速冷却(至少-2℃/秒)、随后在解链分析过程中快速加热(0.2到0.4℃/秒)得到最佳的检测。所有杂合子通过更宽范围的解链转变区别于纯合子。不同的纯合子经常可以通过其Tm值加以区分。然而,正如所料,一些纯合性G至C和A至T碱基改变不进行纯合子混合的话,即使使用高分辨率分析法也不能可重复地加以区分。所述扩增子长度在44到331bp之间变化。
虽然这里提供的实施例中使用了染料S5、D6、Z6和N7,但应理解,可以使用对应于本发明的其它染料。
实施例3
解链曲线分析
循环后立即在LightCycler上或随后在高分辨率解链装置HR-1(Idaho Technology,盐湖城,犹他州)或LightTyper(Roche Applied Systems,印第安纳波利 斯,印第安纳州)上进行解链分析。然而,需要理解到解链曲线分析可以在没有扩增的情况下进行。在使用LightCycler时,将样品首先加热到94℃,以-20℃/秒的程序化设置冷却到60℃,然后以0.2℃/秒解链并连续获得荧光。在其它装置之一中解链时,除了另有说明以外,将样品首先在LightCycler中扩增,随后在LightCycler中瞬间加热至94℃并快速冷却(程序设置为-20℃/秒)到40℃。除了另有说明以外,然后将LightCycler毛细管每次一根转移到高分辨率装置并以0.3℃/秒加热。HR-1是用铝质圆柱体包围一根LightCycler毛细管的单取样装置。系统通过圆柱体外部的绕线由焦耳加热进行加热。样品温度用同样置于圆柱体内部的热电偶监测并转换成24比特数字信号。荧光通过位于圆柱底部的毛细管末端的反射照明器进行监测(Wittwer CT等,BioTechniques 1997;22:176-81)并同样转换成24比特信号(需要注意的是,一些实施例采用较早的16-比特HR-1模型机)。对每℃获得大约50个数据点。在所有装置上采用标准的光学方法,除非另有说明。
在有些情况下,PCR之后在获得解链曲线之前不使产物变性是有其好处的。例如,当目标是重复序列(例如STR和VNTR)的数量分型时,扩增可以在平台期之前的反应指数期过程中的延伸步骤上终止,并随后进行解链分析。这样,可以分析同源双链分子延伸产物。在重复序列分型中,特别是因为许多不同的异源双链分子产物可能由重复序列的不同对齐排列形成,所以同源双链分子产物可以比异源双链分子产物提供更多信息。在有些情况下,既获得同源双链分子解链曲线(未经前期变性),又获得异源双链分子解链曲线(经变性并形成所有可能的双链组合)可能是有益的。使用相同样品作为“同源双链对照”,这两种解链曲线之间的差异给出了能够形成的异源双链分子程度的量度。
解链数据用Lab View中编写的定制软件进行分析。荧光-温度图通过首先定义每种样品解链转变之前和之后的线性基线在0到100%之间进行标准化。每种样品中,每个获得的荧光作为该获得温度下顶部和底部基线之间的荧光百分比进行计算。在有些情况下,导数解链曲线图在每一点上由Savitsky-Golay多项式进行计算(Press WH等人主编的《C语言中的数字处理》(Numerical recipes in C),第二版,New York:Cambridge University Press,1992:650-5)。Savitsky-Golay分析使用2次多项式和包括1℃间隔之内所有点的数据窗口。通过使用非线性最小二乘回归法拟合多元高斯函数,获得了峰面积和解链温度。在有些情况下,对每条标准化的解链曲线的X轴进行移动以使图在一定的荧光区间内重叠。这一“温度变动”校正了任何细微的运 行中的温度变化并提高了将杂合子与纯合子区分的能力。基因型之间的差异也可以通过在各温度下基因型之间的荧光差异作图进行放大。
实施例4
使用染料S5的单核苷酸多态性基因分型:
因子V Leiden突变体分型
由长度为18和24个碱基、紧邻因子V Leiden突变体位点两侧的引物形成43bp的扩增子。两条引物均具有62℃的估计Tm值。样品使用以下方案循环35次:94℃不保持、60℃不保持、以及72℃保持10秒。扩增以后,将样品在LightCycler内瞬间加热至94℃,快速冷却(程序设置为-20℃/秒)到60℃,使PCR产物以0.2℃/秒解链并获得连续荧光。
图1中显示了从因子V基因Leiden基因座的不同基因型扩增的PCR产物的导数解链曲线。将S5染料用于双链和单链产物之间解链转变的荧光监测。Leiden突变体位于扩增子一端19个碱基处。显示了从10个纯合野生型、2个杂合以及1个纯合Leiden基因型获得的结果。纯合突变体的扩增子解链温度比纯合野生型解链温度低大约1℃。归因于异源双链分子的形成,杂合样品表现出一个次级的、低温解链转变。使用SYBRGreen I的类似实验没有检测到这一杂合子中的次级解链转变(数据未显示)。
在LightCycler上使用杂合因子V Leiden DNA研究了冷却速度和加热速度的影响。为了研究冷却速度的影响,如上所述扩增样品,加热至85℃,随后以-20、-2、-0.5或-0.1℃/秒的速度从85℃冷却到60℃,之后通过0.2℃/秒的恒定加热速度以获得解链曲线。快速冷却对于形成明显的异源双链分子是必需的(图2)。当冷却速度是-0.1℃/秒或更低时,没有观察到异源双链分子。当毛细管样品从沸水快速转移到冰水中时,形成最大量的异源双链分子(数据未显示)。采用在LightCycler上冷却,异源双链分子的形成在快于-5℃/秒的设置速度时看来达到稳定水平(图2)。然而,实际样品温度的测量显示,设置速度快于-5℃/秒时,冷却速度仅有细微的提高:当装置设置为-20℃/秒冷却时,实际速度约为-6℃/秒。
通过以-20℃/秒的设置速度冷却,随后以0.05、0.1、0.3、或0.5℃/秒解链研究了加热速度的影响。在更高的加热速度下所观察到的异源双链分子的相对百分比更高(图3)。随着速度提高,表观Tm值也向更高的温度迁移,并且解链过程更大程度地从平衡状态偏离(Gundry CN等,Genetic Testing,1999;3:365-70)。
实施例5
用质粒对SNP基因分型的系统研究
为了对所有可能的单碱基改变的解链曲线基因分型进行系统研究,使用了工程质粒。所述质粒(DNA Toolbox,Cambrex Bio Science Rockland Inc.)在确定位置上包含A、C、G或T,GC含量50%(Highsmith WE等,Electrophoresis 1999;20:1186-94)。单独使用四种质粒以模拟纯合基因型,或者两两组合使用以构建“杂合子”。引物是TCTGCTCTGCGGCTTTCT(SEQ ID NO.50)和CGAAGCAGTAAAAGCTCTTGGAT(SEQ ID NO.51),在多态性位置周围产生50bp扩增子。使用106拷贝的DNA模板并且采用在20μM D6的存在下85℃不保持、55℃保持1秒的35个循环进行PCR。将HR-1高分辨率解链装置用于解链分析。
显示了四个纯合子(图4A)和六个杂合子(图4B)的标准化解链曲线。不难区分纯合子与杂合子,因为杂合子具有由于异源双链体存在而产生的延伸解链转变。所有纯合子在一个转变中解链(图4A),根据最近邻近计算正确地预测解链顺序为A/A<T/T<C/C<G/G(SantaLucia J.,Jr,Biochemistry 1996;35:3555-62)。杂合子产生由两个同源双链体和两个异源双链体产生的较复杂的解链曲线(图4B)。各杂合子对应于四种双链体Tm的独特解链曲线路径。根据最近邻近计算用两个同源双链体Tm的平均值预测解链顺序(A/T<A/C<C/T<A/G<G/T<C/G)。在高温下六条杂合子曲线合并成三条轨迹,由存在的最高的解链同源二聚体预测(A/T杂合子是T/T,A/C和C/T杂合子是C/C,A/G、G/T和C/G杂合子是G/G)。用高分辨率解链分析可以区分所有基因型。
实施例6
采用标记引物:染料S5或SYBRGreen I的囊性纤维化基因的基因分型
PCR中使用了KlenTaq聚合酶(0.04单位/微升,AB Peptides,St.Louis,MO),88纳克TaqStart抗体(ClonTech,Palo Alto,CA)以及50mM Tris,pH 8.3,而不是Taq聚合酶和2-氨基-2-甲基-1,3-丙二醇。用下列引物:GGCACCATTAAAGAAAATAT(SEQ ID NO:1)和TCATCATAGGAAACACCA(SEQ ID NO:2)扩增了一个44bp的片段。第一条引物或用Oregon Green进行了5’标记,或是在SYBRGreen I或S5存在的条件下进行反应。引物与包含F508del、I507del和F508C变体的突变热点侧接。PCR经过85℃和58℃(保持0秒)的40个循环进行。在LightCycler上的解链曲线获 得过程中监测了6个样品。
图5B-D显示了由囊性纤维化基因I507/F508区域上不同基因型扩增的PCR产物的导数解链曲线。PCR产物长度为41或44个碱基(图5A)。将5’标记引物(图5B)、染料S5(图5C)或SYBRGreen I(图5D)用于双链和单链产物之间解链转变的荧光监测。显示了由两种纯合基因型和三种杂合基因型获得的结果。
不同基因型的双链稳定性遵循理论计算(von Ahsen N等,Clin Chem 2001;47:1956-61),其中F508del~I507del<野生型<F508C。除了F508del和I507del,基因型通过它们主要转变的Tm值是可以区分的。在LightCycler上解链时,10次重复野生型样品的Tm的标准偏差是0.12℃。在高分辨率装置上解链时,相同10个样品的Tm的标准偏差是0.04℃。
当杂合样品通过PCR扩增时,可预期两种同源双链分子和两种异源双链分子(Nataraj AJ等,Electrophoresis 1999;20:1177-85)。然而,当SYBRGreen I用作荧光指示剂时,对于每种基因型只能看见单一的解链峰(图5D)。相反,当在相同条件下使用标记引物或染料S5时,出现了两个轮廓明显的峰(图5B和5C)。较低温峰总是小于较高温峰,推测表示一种或全部两种异源双链分子产物的解链转变。正像可能预期的,3bp缺失的杂合子(F508del和I507del)导致了比单碱基改变(F508C)的异源双链分子峰更不稳定的异源双链分子峰。F508C杂合子的主峰位于比野生型更高的温度,这反映了T到G转换的更高稳定性(Gundry CN等,Genetic Testing,1999;3:365-70)。
实施例7
采用饱和染料的突变扫描
研究了HTR2A的单核苷酸多态性。按照描述对囊性纤维化位点用KlenTaq、TaqStart和Tris进行PCR。5-羟色胺受体2A(HTR2A)基因的331bp片段包括了外显子1内部的共有多态性(T102C)(Lipsky RH等,Clin Chem 2001;47:635-44)。反应在95℃不保持、62℃保持2秒以及74℃保持20秒之间循环40次。获得了高分辨率解链曲线。
图6表明,饱和染料S5可用于对序列变异的扫描。就是说不需要知道序列变异的位置。可多大的扩增子内部的任何变异的存在进行检测。如图6所示,HTR2A基因中的所有三个单核苷酸多态性基因型(纯合T、纯合C和杂合T/C)可以在331bp的扩增子内进行区分。解链曲线的精确度和区分不同基因型的能力取决于装置的温度和荧光分辨率。
实施例8
DNA大小梯状标记的解链曲线分析:SYBRGreen I与染料S5的比较
将100纳克含有6种不同种类双链DNA的DNA大小梯状标记(DNA size ladder)(低分子量DNA梯状标记,Gibco BRL)在3mM MgCl2、100mM 2-氨基-2-甲基-1,3-丙二醇,pH 8.7的缓冲液中与SYBRGreen I(1∶10,000)或染料S5(10μM)混合。以0.1℃/秒的速度在高分辨率装置上获得解链曲线。
如上所述,与SYBRGreen I不同,染料S5能够以与PCR相容的浓度在解链曲线转变中鉴别异源双链分子。图7中说明了SYBRGreen I不能简便地鉴别低解链转变的一个原因。在几种稳定性递增的DNA片段存在的情况下,与染料S5相比,采用SYBRGreen I的低温峰非常小。一种解释是在解链过程中,SYBRGreen I可能从低温双链分子上被释放,而只与在更高温度下解链的双链分子结合。这引起每个后继的峰比前一个更高,最低温度的峰即便能观察到也非常小。以高得多的饱和水平存在的染料S5对于甚至低温双链分子具有可见的峰。虽然本实施例中染料S5以接近饱和水平存在时,令人惊讶的是,当稀释到饱和水平的5-20%时,染料S5可以检测低温峰。例如,图13所表示的数据是通过使用1μM浓度的S5获得的。因而,虽然还不理解其机制,染料S5和本发明的多种其它饱和染料在解链过程中看来没有重新分布。
如果测定图7中每个峰的面积并除以每种DNA的已知量,可以估算对于每种DNA的相对灵敏度(图8)。如图8所示,采用染料S5有利于低温解链峰,而采用SYBRGreen I时,在高温下观察到信号的显著增强。
实施例9
通用双链DNA染料的滴定曲线以及PCR中染料S5可用浓度范围的测定
将100纳克低分子量DNA梯度标记与不同浓度的通用双链DNA染料在终体积10微升的含3mM MgCl2、50mM Tris,pH 8.3、250μg/ml BSA和每种dNTP各200μM的溶液中混合。样品转移到LightCycler管并在实时荧光计上测量40℃的荧光。用每种特定染料所获得的最大荧光值对荧光进行标准化处理。
使用152bp的HTR2A扩增子在终体积10微升的含3mM Mg2+,50mM Tris-HCl,pH 8.3,500μg/ml BSA,每种dNTP各200μM,每种引物各0.5μM,50纳克基因组DNA,0.4单位Taq聚合酶以及88纳克TaqStart抗体的溶液中,用稀释范围为2μM 到100μM的S5进行稀释研究。95℃ 10秒的初始变性之后,以95℃ 0秒、62℃ 2秒、以及72℃ 20秒循环40次。在LightCycler上附加的温度条件作用(95℃ 0秒,55℃ 0秒)以后,使样品以0.3℃/秒的斜率在高分辨率装置上进行解链。
图9A-B表示了与PCR相容的SYBRGreen I和染料S5的浓度。在与PCR相容的浓度下,SYBRGreen I远未使PCR结束时通常存在的DNA量饱和。相反,染料S5可以在包括使之饱和的广泛的浓度范围内使用。图10中显示了染料S5相差50倍的浓度范围内的典型解链曲线。
实施例10
SYBRGreen I和染料S5的荧光光谱
与DNA结合的SYBRGreen I和染料S5的激发和发射光谱是在Photon Technology公司的荧光计(FL-1)上测量的。在含100纳克DNA(低分子量DNA梯度标记)的终体积60微升的3mM MgCl2,50mM Tris,pH 8.3,250μg/ml BSA和每种dNTP各200μM的溶液中添加染料S5(10μM)或SYBRGreen I(1∶10,000)。
LightCycler光学器件与SYBRGreen I的激发与发射良好匹配(图11)。即便染料S5与LightCycler光学器件匹配不良,在LightCycler上用有些PCR相容浓度的染料S5观察到的荧光信号比通常从SYBRGreen I观察到的信号更强(数据未公开)。
本文所述的许多其它饱和染料也是“蓝色”染料。虽然可用标准的LightCycler光学器件观察这些染料的荧光,但在一些实施例中,对某些设备的光学器件进行改装以更好地匹配蓝色染料。在相关实施例中指出了这些对光学器件的改装。
实施例11
使用X轴调整和荧光差异分析的β-球蛋白的基因分型
从11号染色体(登录号NG_000007)的人β-球蛋白区域扩增110bp的片段。这一110bp片段包括了常见的β-球蛋白突变体HbS和HbC的位点。从每种常见基因型的4个不同个体的干血斑中提取DNA。这些基因型包括了3个纯合类型(AA、SS和CC)和3个杂合(AS、AC和SC)类型。正向引物和反向引物分别是ACACAACTGTGTTCACTAGC(SEQ ID NO:3)和CAACTTCATCCACGTTCACC(SEQ ID NO:4)。每10微升反应体系包含了50微克基因组DNA、0.5μM各种引物、10μM染料S5、3mM MgCl2、50mM Tris,pH 8.3、500μg/ml BSA、每种dNTP各0.2mM、0.04单位/微升KlentaqTM(AB Peptides,St.Louis,MO)、88纳克TaqStartTM抗体 (CloneTech,Palo Alto,CA)。PCR反应条件如下:循环前95℃ 5秒变性;94℃ 0秒、50℃ 2秒、72℃ 2秒循环35次,斜率为每秒2℃。获得每个样品在延伸2秒后的单一的荧光值。PCR扩增之后,以-20℃的设定速度冷却样品。紧接着快速冷却后,在定制的24比特高分辨率解链装置上以0.30℃/秒的速度从70℃到93℃进行解链,同时连续获得荧光值。
随着样品温度提高,通过测量荧光获得高分辨率解链曲线数据。图12A中显示了从β-球蛋白6种基因型的一式四份样品获得的原始数据。注意由于样品体积差异和毛细管光学器件变动会引起的不同样品之间荧光的量级变动。
样品之间量级差异可以通过使用主要转变之前和之后每条曲线的线性基线进行标准化。具体地说,选择两个线性区域,其中一个在主要转变之前,一个在这之后。这些区域为每条曲线定义两条直线,上方的100%的荧光直线和下方的0%的荧光直线。转变过程中每个温度下的荧光百分数(这两个区域之间)是以外推的上方和下方直线之间的距离百分数来计算的。图12B中显示了β-球蛋白数据的标准化结果。每种基因型的一式四份样品明显类同,最明显可见的是在84-85℃附近。每种基因型内部仍有一些对于运行间的温度偏差而言(注意在10-20%荧光值附近在基因型内部一式四份样品之间有约0.2℃的离散范围)是次要的偏差。这一样品偏差可以在两个不同样品之间或甚至在相同样品的两次不同运行之间发生。不同制剂,包括不同盐浓度的制剂,也可以引起温度偏差。然而,对于至少第一近似(approximation)而言,这些差异不影响曲线的形状。
运行之间的温度偏差可以通过移动每条曲线的温度轴进行校正,从而使得它们在一个给定的荧光区间上重叠。例如,选择一个样品作为标准品,并将荧光区间内的点进行二次方程拟合。对每条剩余的曲线,计算为了将所述荧光区间内的每个点转化到所述二次方程上所需要的温度变动值。然后将每条曲线以平均变动值平移,使所述曲线在选定的荧光区间内重叠。杂合子扩增产生异源双链分子的低温解链转变以及同源双链分子的高温解链转变。如图12C中所看到的,如果移动曲线以将其高温同源双链分子区域(低荧光百分数)重叠,异源双链分子可以通过其在更低温度下的荧光早期下降得以鉴别。然而,由于不同的同源双链分子的曲线形状没有很大变化,不同同源双链分子的温度变动可能掩盖它们之间的任何差异。
最后,通过将标准化的(以及任选经温度变动的)解链曲线之间的荧光差异作图最易于观察到不同的基因型。先选择一种标准基因型(例如,使用β-球蛋白野生型AA)。随后如图12D所示,将每条曲线与标准之间的差异对温度作图。标准基因型在所有温度下是0(减去了其本身)。其它基因型追踪独特的路线并能通过视觉模式匹配进行鉴别。 特征提取的自动化方法也可以用于确定基因型。此外,虽然说明性的实施例使用了饱和染料和异源双链分子检测,需要理解到,温度变动和温度差异作图可以用于不存在异源双链分子情况下的基因分型,例如可以用于其中基因组是单倍体的病毒基因分型。这样的高分辨率基因分型的例子包括丙型肝炎基因分型、人乳头瘤病毒基因分型、HIV基因分型以及通过核糖体DNA扩增的细菌鉴定。
可以设计与基因型相关联的单一参数。例如,可以使用标准化的曲线来确定不同基因型比如10%解链的(90%荧光值)温度。这样显著区分了一些基因型,但不能显著区分其它基因型(图12B)。或者,可以使用曲线的最大斜率来区分纯合子与杂合子,但在最大斜率下不同的纯合子经常是相似的。最后,可以使用不同曲线下的面积(图12D)以定义基因型,但是这样的曲线可以具有相似的面积却追踪不同的路线。虽然可能证实参数的组合对于自动化基因分型确定是有效的,这一技术非常适合于视觉模式匹配。
需要理解到,其它的标准化技术是可以利用的并且包括在本发明的范围之内。例如,HR-1(Idaho Technology,Salt Lake City,UT)具有能够在预先确定的温度下自动调整荧光值的设置(例如40℃时的荧光值为100),并且所有样品的解链曲线能根据相同的荧光值调整(align)。上述的标准化与这一机器控制的标准化之间的差异在于使用机器控制的标准化时,转变前和转变后曲线的斜率没有变平。
实施例12
更大扩增子的分析
虽然短的扩增子通常导致更大的基因分型差异,本发明染料也可以用于更大的扩增子的基因分型。DNA解链区域的长度通常约为50-500bp,更大的扩增子,例如500-800bp的扩增子,常常具有多个解链区域。一个区域中的序列改变可能不影响其它区域的解链,并且在一个区域的内部观察到的变异可以不受扩增子长度的约束。因而,虽然提供了400-650bp范围内的例子,但对于能用于扫描以确定序列变更的存在的PCR产物的大小可以没有上限。
而且,因为一个区域的解链看来是独立于其它区域的解链的,可将一个恒定的区域用作内参照以调整X轴(温度轴),这是由于装置或样品运行是变化的。由于解链曲线形状的不同,杂合子相互之间及其与纯合子之间是可以区分的。解链曲线的形状由存在的异源双链分子和同源双链分子的稳定性和/或动力学解链速度所限定。由于在更大的扩增子中存在多个解链区域,形状上的改变可以发生在曲线的任何部分。 通过调整多条曲线的X轴定位以使曲线的恒定部分重叠,更易于辨别曲线的变化部分。或者,通过重叠曲线的变化部分,如果存在多种基因型,则曲线的其余部分会有所不同。X轴调整另外可以通过在PCR之前或解链之前向每个样品添加(1)外参照核酸,或(2)具有第二个发射波长的染料,该染料不与核酸相互作用但其荧光依赖于温度(具有良好温度系数的染料,如Cy5)进行。随后应当按照所述对照核酸的解链转变的位置或按照所述对照染料的强度曲线进行温度轴移动。
图13A和14举了两个分析更大的扩增子的例子。图13A显示了获自人5-羟色胺受体2A(HTR2A)基因外显子2(登录号NM_000621.1)的544bp片段的扩增。正向引物和反向引物分别是CCAGCTCCGGGAGA(SEQ ID NO:5)和CATACAGGATGGTTAACATGG(SEQ ID NO:6)。每10微升反应体系包含50纳克基因组DNA、每种引物各0.5μM、1μM染料S5、2mM MgCl2、50mM Tris,pH 8.3、500μg/ml BSA、每种dNTP各0.2mM、0.4单位KlentaqTM(AB Peptides,St.Louis,MO)以及88纳克TaqStartTM抗体(CloneTech,Palo Alto,CA)。
PCR反应条件如下:92℃ 0秒、60℃ 2秒、74℃ 25秒循环40次。PCR扩增之后,使样品以-20℃/秒的设定速度冷却。紧随着快速冷却,在定制的24比特高分辨率解链装置上以0.30℃/秒的速度从70℃到93℃进行解链,同时连续获得荧光。
如图13A所示,扩增并分析每种基因型(CC、TC、和TT)一式两份样品。除了曲线在10%和20%荧光之间重叠以外,对数据的标准化处理与温度变动如实施例11所述进行。图13B表示同源双链分子的预测解链图和在较低温度解链区中的多态性位点。实验数据显示了两个表观解链区。所有基因型在较高温度解链区中是类似的。基因型在较低温度解链区中存在差异,其中杂合子表现出低温解链异源双链分子的典型行为,表现为杂合子曲线与低温解链纯合子曲线交叉,并随着温度升高接近于更高温度的纯合子。
图14表示获自囊性纤维化跨膜转导调控子(CFTR)基因外显子10(登录号M55115)的612bp片段扩增的差异曲线。正向引物和反向引物分别是AGAATATACACTTCTGCTTAG(SEQ ID NO:7)和TATCACTATATGCATGC(SEQ ID NO:8)。每10微升反应体系包含50纳克基因组DNA、每种引物各0.5μM、10μM染料S5、3mM MgCl2、50mM Tris,pH 8.3、500μg/ml BSA、每种dNTP各0.2mM、0.4单位KlentaqTM(AB Peptides,St.Louis,MO)以及88纳克TaqStartTM抗体(CloneTech,Palo Alto,CA)。PCR反应条件如下:89℃ 0秒、58℃ 8秒、74℃ 35秒循环35次。对每个样品在35秒延伸之后采集单一荧光值。PCR扩增之后,使样品 以-20℃/秒的设定速度冷却。紧随着快速冷却,在定制的24比特高分辨率解链装置上以0.30℃/秒的速度从60℃到87℃进行解链,同时连续获得荧光。在这个例子中,当将曲线的中间部分(30-40%荧光)用于X轴调整时,杂合子区分效果最好。最后,从野生型图中的一条上减去各图的荧光得到了如图14所示的差异图。每种序列改变与野生型明显不同,所有基因型均能被区分。
实施例13
采用饱和染料的靶向检测和多路技术
本发明染料可以用作供体以激发与寡核苷酸探针相连的受体染料。由于这些染料可以以达到或接近饱和的浓度用于以高密度结合杂交探针(每3个碱基对约2个染料分子),遍及双链DNA全长的染料可以用于荧光共振能量转移。在PCR之前在反应体系中添加具有受体染料的探针,扩增并在与产物杂交时对其进行检测。饱和染料以高密度与双链分子的结合促进了对探针上受体染料的激发,产生了高度的受体荧光。以前,使用了具有高bp/染料比的染料并只产生了低水平的受体荧光。
可采用多种探针进行多色实验。例如,可在470纳米处监测整个扩增子的解链,可在515纳米处监测荧光素标记探针的发射光,在第三个波长处监测HEX标记探针(与引物内一个不同的DNA片段杂交),而在第四个波长处监测TET标记探针(与引物内另一个不同的DNA片段杂交)。正如本领域内所熟知的,色彩补偿用以使重叠的四种信号重叠合。结果是第一种信号可用于对整个扩增子的突变扫描,而第二、第三和第四种信号使扩增子内部更小区域的基因分型成为可能。
实施例14
用于基因型比较的高分辨率解链曲线分析
本发明的染料可以用于确定任意两个个体在一个基因片段上是否共有相同的等位基因。在上文的例子中,参照样品的基因型(包括确切的等位基因、杂合性以及单体型)是已知的。在有些应用中,不需要知道参照样品的确切基因型,只要高分辨率解链曲线分析能确定另一个体的(或未知来源的)样品是否与参照相同。一个说明性的例子是家族成员中共有的HLA等位基因的鉴别。
人白细胞抗原(HLA)是白细胞和机体其它组织的细胞表面蛋白,在免疫识别以及移植耐受或排斥中起关键作用。对于器官移植来说,供体和受体之间的HLA等位基因配对是重要的。HLA蛋白形成两个主要类别:I类和II类。每个类别由多个基因编 码。目前公认的用于确定组织的HLA等位型的技术包括用特异性抗体试剂的血清分型、与核酸探针的杂交以及HLA基因的直接测序。由于需要检测大量基因和位点,测定HLA等位型的成本超过了1,000美元/人。当供体与受体无关时,HLA的完全基因分型是必需的。然而,在同胞兄弟姐妹之间有约25%HLA完全匹配的机会,因此当HLA匹配说明其可行时,优选同胞之间的器官移植。在这种情况下,只需要证明供体与受体亲属共有相同的HLA等位基因。没有必要测定所述共有的等位基因的严格一致性。
CEPH/家系犹他家族1331的基因组DNA样品得自Coriell研究所。在这一家族中有3代17人,包括4个根本的(internal)祖父母、两个父母及11个子女(图15显示了家族1331的家系图)。具有熟知的纯合基因型HLA-A BM15(0101)和BM16(0202)的两个其它样品也得自Coriell。
HLA-A基因的两个外显子的扩增如下进行:I类HLA基因在其编码外显子的全长上如此相似,以致难以设计仅扩增HLA-A基因而不扩增相关的I类基因的PCR引物。采用了巢式PCR策略,其中第一轮PCR特异性扩增HLA-A基因的一个大片段(948bp),随后用内部引物对产物进行第二次扩增。用于第一轮PCR的引物与HLA-A内含子1(正向引物5′-GAAAC(C/G)GCCTCTG(C/T)GGGGAGAAGCAA(SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12))和内含子4(反向引物5′-TGTTGGTCCCAATTGTCTCCCCTC(SEQ ID NO:13))杂交。第二轮PCR中使用了正向引物5′AGCCGCGCC(G/T)GGAAGAGGGTCG(SEQ ID NO:14、SEQ ID NO:15)和反向引物5′GGCCGGGGTCACTCACCG(SEQ ID NO:16)以扩增HLA-A外显子2的335bp片段。将正向引物5′CCC(G/A)GGTTGGTCGGGGC(SEQ ID NO:17、SEQ ID NO:18)和反向引物5′ATCAG(G/T)GAGGCGCCCCGTG(SEQ ID NO:19、SEQ ID NO:20)用于扩增HLA-A外显子3的366bp片段。在本实施例的引物序列中,(N/N′)代表所述引物是在该位置具有相等百分比的N和N’的核苷酸序列的混合物。例如,如SEQ ID NO:17和SEQ ID NO:18所代表的,HLA-A外显子2的335bp片段的正向引物在第4个位置上含两种核苷酸(G或A)的相等混合物。如序列9、10、11、12所代表,HLA-A内含子1的正向引物具有2个这样的位点,因而是4种核苷酸的相等混合物。
所有PCR使用LightCycler在玻璃毛细管中进行。第一轮PCR的10微升体系中含0.5μM正向和反向引物、含50纳克基因组DNA的缓冲液(3mM Mg++,50mM Tris-HCl pH 8.3,500μg/ml BSA和20μM的D6染料)。循环条件是94℃ 20秒,随后是循环40次的94℃ 1秒、62℃ 0秒、72℃ 1分钟。第二轮巢式PCR包含0.25μM 正向和反向引物、在含2mM Mg++的相同缓冲液中1/10000的第一轮PCR产物。循环条件是94℃ 5秒,随后是循环25次的94℃ 1秒、65℃ 0秒、72℃ 8秒。
第二次扩增之后,将玻璃毛细管转移到高分辨率解链装置HR-1上,并进行解链。将样品以0.3℃/秒的速度从60℃加热到95℃并且每40毫秒获得荧光(450纳米激发/470纳米发射)和温度测量值(图16A-B)。巢式扩增产物用ABI 3700进行测序。将4.0版本的Sequencher用于序列分析。
如下测定解链曲线分析和测序结果的一致程度:从CEPH/家系犹他家族1331的17位成员扩增的外显子2和外显子3PCR产物的解链曲线分析聚类成6个不同的组(图16A-B)。这说明在这一家族中有6种不同的HLA-A基因型。对外显子2和外显子3PCR产物进行了测序,并且结果证实了解链曲线分析,鉴别出的6种基因型是:家族成员1、4、7、12的HLA-A 02011/3101(这里称为基因型AB);家族成员3、5、6、11、17的HLA-A 3101/2402101(基因型BC);家族成员2、9、10、16的HLA-A02011/2402101(基因型AC);家族成员13、14的HLA-A 02011/03011(基因型AD);家族成员8的HLA-A 02011/02011(基因型AA)以及家族成员15的HLA-A 2402101/01011(基因型CE)(图16A-B显示了外显子2的结果)。
在有些情况下,来自同胞的扩增产物虽然具有不同的基因型,可能表现出一致的或几乎一致的解链曲线。在这种情况下,在第一轮PCR之前混合来自两个同胞的基因组DNA,随后进行两个扩增步骤,用解链曲线分析可以区分相同和不同的基因型。具体而言,如果同胞具有相同的基因型,则混合的解链曲线会与那些单独进行的相同。如果同胞具有不同的基因型,那么混合的解链曲线会与单独的解链曲线不同。每组中的混合实验证实每组的成员共有相同的基因型。
通过两个纯合样品BM15(0101)和BM16(0201)证明了混合分析技术的另一个例子。在这一例子中,所述两个等位基因在HLA-A外显子2的全长上总共散布着15个核苷酸差异,但它们表现出相似的解链曲线。由于在由HLA-A外显子2混合样品PCR产生的异源杂交分子上存在15个错配,混合样品的解链曲线明显左移(更低的解链温度)(见图17)。
实施例15
使用饱和染料实时监测扩增
用分别为ACCAGGCTCTACAGTAA(SEQ ID NO:21)和GTTAAATGCATCAGAAG(SEQ ID NO 22)的正向和反向引物扩增了HTR2A基因的 60bp片段。除了对循环参数的改动(使用LightCycler,95℃ 0秒,62℃ 2秒,74℃ 20秒)之外,使用实施例12中所述的试剂进行扩增。反应混合物中各自独立地存在不同浓度的SYBRGreen I、D6、Z6和N7。每个扩增循环获得一次荧光数据,直至循环36次。获得了如下以扩增图(X轴上的绘制循环数对Y轴上绘制的荧光强度)的二阶导数最大值计算的荧光交叉点(Cp)。
表4.
当反应中存在的抑制剂影响扩增效率的时候,代表其中信号高过本底的循环数的Cp值预计会提高。然而,在这些实验的条件下,由递增量的染料的抑制导致的不是 Cp值的逐步提高,而是扩增的突然完全停止。由于扩增子的大小较小(导致了与更大的扩增子相比更小的信号),SYBRGreen I染料只能在两倍浓度范围中用于实时监测。相反,染料D6、Z6和N7可以在32-128倍浓度范围内使用。预计许多饱和染料具有能用于实时监测扩增的宽的浓度范围。
实施例16
用未标记探针和饱和染料进行SNP分型
如图7所示,饱和染料能够检测反应混合物中存在的多种dsDNA的解链特征,而没有因从低解链温度双链体到高解链温度(Tm)双链体的染料再分布造成的低温解链不明显。饱和染料的这个方面使得用未标记探针进行基因分型成为可能。当在饱和染料的存在下将未标记探针与扩增子混合时,可同时观察扩增子和探针-靶标双链体的解链特征。可用解链曲线图的改变检测该探针中和扩增子其它地方的序列变异。任选地,通过在扩增子解链转变之前截止(truncate)解链过程,可以只研究未标记探针的解链。采用常规的实时PCR的染料,如SYBR Green I,未能象用未标记探针那样有效地进行基因分型和突变扫描(比较图21B与21C)。而且,由于饱和染料的特性,可在未标记探针的存在下进行基因分型,而无需将未标记探针或靶核酸固定在表面上。在各示范性实施方式中,染料、未标记探针和靶核酸都游离在溶液中。
在LightCycler(Roche Applied Systems,Indianapolis,IN)中,在10μl反应混合物中用引物5’GATATTTGAAGTCTTTCGGG(“反向”引物,SEQ ID NO.23)和5’TAAGAGCAACACTATCATAA(“有义”引物,SEQ ID NO.24)进行PCR,产生300bp扩增子,所述反应混合物含有1×106拷贝的初始模板质粒DNA(实施例5)、0.5μM 3’-末端磷酸化的探针、3mM MgCl2、50mM Tris(pH 8.3)、dNTP各0.2mM、500μg/ml BSA、20μM dsDNA染料D6(实施例1)和0.4U Taq聚合酶(Roche)。对于对称扩增,所用各引物为0.5μM。对于不对称扩增,引物比为10∶1、20∶1或50∶1。进行PCR的方法如下:一开始在95℃变性10秒,然后是95℃ 1秒、55℃ 0秒,72℃ 10秒(或者在没有探针的情况下5秒)的45个循环。扩增结束时,使样品在95℃变性0秒,40℃退火0秒,然后进行解链分析,以0.2℃/秒的速率加热到90℃(LightCycler),或者以0.3℃/秒(HR-1)或0.1℃/秒的速率加热到75℃(LightTyper,装有450nm激发和470nm检测的改装的光学器件)。
扩增产物的靶链应该足够用于探针杂交。在许多情况下,可通过提供相对于其它引物(“反向”引物)而言过量的产生探针-杂交链的引物(“有义”引物)来实现此目的。 图18A和19显示了优化实验的结果,其中检测了由不同引物比产生的扩增子。虽然最优引物比可能因各扩增子和/或各扩增系统而不同,但常常在有义和反向引物的比值约为10比1或更高时观察到探针解链。应注意到在LightCycler数据中,在这种引物比的情况下观察到了探针和扩增子的解链峰(图18B)。应理解,虽然本文所述实施例采用此″不对称″PCR产生较高丰度的靶链,但也适用其它扩增方法,尤其是诸如有利于一条链扩增的NASBA、TMA和滚环扩增等扩增方法。或者,可在PCR之后进行链分离,例如用适当设计的引物将生物素尾或聚腺苷酸尾(或其它序列)掺入扩增子中进行分离。在又一实施例中,可在扩增后或不进行扩增的情况下对单链核酸进行解链分析。同时,已发现探针-靶标转变的相对数量级随着扩增子长度减小而增大。因此,在另一实施例中,可采用较短的扩增子,如100bp或更短的扩增子。
在本实施例中,未标记探针的3’末端被磷酸化,以防止扩增期间的聚合酶延伸。如果需要,可通过其它方式防止探针的聚合酶延伸,包括采用2’,3’-二脱氧核苷酸、3’-脱氧核苷酸、3’-3’连接、其它不可扩增的末端如3’-间隔C3(Glen Research,Sterling,VA)、具有任选接头的生物素或小沟结合物。也可用探针的两个或多个3’末端碱基错配来防止延伸。或者,可将具有或没有3’-末端封端的未标记探针加入基本没有聚合酶活性的核酸样品混合物中。
在本文所述的许多实施方式中,当扩增混合物中包含未标记探针时,需要未标记探针与靶序列的结合不那么紧密,以便不抑制扩增,即使与靶序列完全杂交。这在未标记探针是肽核酸时尤其重要,根据其构型,完全杂交时肽核酸可紧密结合以抑制扩增(Behn M等,Nucleic Acids Res.1998;26:1356-8)。同时,在许多实施方式中,不需要探针与引物足够互补,以便不干扰解链曲线分析。本文所述的各种新型染料,以及其它已知染料,适合与这种未标记探针一起使用。而且,虽然仍不了解确切机制,但饱和百分数低于50%的几种染料也适合与未标记探针一起使用。这种染料的一个例子是噻唑橙。
成功地进行基因分型的另一需要考虑的因素是探针的长度和GC含量。由于仍未完全理解饱和染料与dsDNA的结合模式,测试了几种探针设计。表5和图20显示了采用染料D6的优化实验,其中检测了长度在14-30个碱基、GC含量为14-37%的探针当探针和靶标完全互补时,检测到短至14个碱基的探针的解链峰(图20)。然而,当探针有错配时(在本实施例中错配位于探针中),没有观察到短于22个碱基的探针的解链峰(未显示),这说明染料D6在这些条件下需要至少10~11bp的不间断结合间隔区。在探针设计中,可任选地使错配位于探针末端附近,以及在探针中部。 用100%AT和100%GC探针序列与合成互补链杂交进行相似实验。当100%AT探针为24个碱基或更长,而100%GC探针短至10个碱基时,能很明显检测到这些探针的解链峰(数据未显示)。在LightCycler、HR-1和改装LightTyper上进行解链分析的结果一致。
表5.
用28个碱基的探针和模板进行SNP分型,这些探针和模板在互换碱基位置上A、C、G和T纯合或在该位置上杂合如下:A/C、A/G、A/T、C/G、C/T和G/T。图21A-D显示了与A纯合子完全互补的探针产生的解链曲线(在这种情况下探针序列是A,正义链是T)。所有纯合子在一次转变中解链(图3A)。A::T配对最稳定,Tm为66.1℃(预测为64.0℃),错配A::G(63.0℃,预测62.4℃)、A::A(61.9℃,预测60.7℃)、A::C(61.4℃,预测60.8℃)稳定性依次降低。Tm预测值没有考虑染料的存在。正如扩增子Tm的情况(图10),染料的存在通常会提高探针Tm。能够明显地分离和区分所有纯合子的解链曲线(图21A)。将杂合模板分成两组:第一组具有与探针完全互补的等位基因(A/T、A/C、A/G),另一组没有(C/T、C/G、G/T)。在第一组中,探针解链曲线明显显示出两个峰:较高的Tm峰与纯合A模板匹配,较低的Tm峰表征了碱基错配的类型(图21B)。在第二组中,解链曲线仅显示出一个解链峰,相对于纯合A模板,各峰左移,并且不难区分各峰与其它峰(图21D)。当用SYBR Green I染料进行相同测试时,相对于完全匹配纯合A模板,与探针有一个错配的纯合模板的解链峰向左移动,但可将它们互相区分开。杂合模板C/T、C/G、G/T也左移,但不能互相分开。不能区分杂合模板A/C、A/G和A/T与纯合A模板的解链曲线(图21C)。
实施例17
用未标记探针和饱和染料进行囊性纤维基因分型
用获自Coriell Institute for Medical Research的样品和以下引物扩增CFTR基因外显子10和11的片段:外显子10的引物:5’ACATAGTTTCTTACCTCTTC(SEQ ID NO.34,有义引物)和5’ACTTCTAATGATGATTATGGG(SEQ ID NO.35,反向引物),外显子11的引物:5’TGTGCCTTTCAAATTCAGATTG(SEQ ID NO.36,有义引物)和5’CAGCAAATGCTTGCTAGACC(SEQ ID NO.37,反向引物)。在F508del突变上杂交的外显子10的探针是5’TAAAGAAA TATCATCTTTGGTGTTTCCTA(SEQ ID NO.38)。用两种探针检测外显子11中的G542X突变(5’CAATATAGTTCTTNGAGAAGGTGGAATC,SEQ ID NO.39),其中N是G或T。所有探针都在3’末端磷酸化。用引物比10∶1(0.5μM有义引物;0.05μM反向引物)进行不对称PCR。其它PCR试剂基本与实施例16相同,除了用50ng基因组DNA作模板。循环条件是:95℃ 10秒,然后是45个循环的95℃ 0秒、52℃ 0秒、72℃ 10秒。在LightCycler上进行解链曲线分析,如实施例16所述。表6列出了用探针检测到的各种缺失。
表6.
突变 |
核苷酸位置 |
氨基酸改变 |
外显子 |
I506V |
在1648上是A或G |
在506上为Ile或Val |
10 |
I507del |
在1648-1653间缺失3bp |
缺失Ile506或Ile507 |
10 |
F508del |
在1652-1655间缺失3bp |
在508上缺失Phe |
10 |
F508C |
在1655上是T或G |
在508上为Phe或Cys |
10 |
G542X |
在1756上由G至T |
在542上由Gly变为终止密码子 |
11 |
F508del突变被选作小(3bp)缺失的实施例。该探针含有28个碱基的野生型序列。图22A显示了纯合F508del的Tm改变到比野生型低约10℃。杂合F508del的解链曲线显示出两个解链峰:一个的温度与野生型相同,另一个与纯合F508del相同。图22B显示出此基因座上发现的三个额外杂合突变F508C、I506V和I507del的重叠。
G542X突变是单碱基突变,其中野生型G改变为T。用28个碱基的野生型探针G和突变探针T对G542X纯合(T/T)和杂合(G/T)突变进行分型(不测序)(图23)。
实施例18
用多种未标记探针和一种饱和染料进行基因分型
用含有饱和染料的未标记探针进行解链分析能够对探针下的一个或多个序列变体进行基因分型。采用多个未标记探针能够对多个序列段中的序列变体同时进行基因分型。可设计探针使其与一个DNA片段上的多个序列段杂交,或与多个DNA片段上的序列段杂交。例如,当多个探针与一个靶DNA片段一起使用时,探针不需要重叠来提供序列变异信息。在一个示范性实施例中,在20μM染料D6或N7的存在下,用上述两种引物(有义引物SEQ ID NO.34和反向引物SEQ ID NO.35,分别为0.5μM和0.05μM)对囊性纤维化基因的210bp片段进行不对称扩增。在该210bp片段中,用两个未标记探针检测两种突变F508del和Q493V是否存在:探针1:ATCTTTGGTGTTTCCTATGATG(SEQ ID NO.48;划线部分是在F508del突变中缺失的三个碱基)和探针2:CTCAGTTTTCCTGGATTATGCCTGGC(SEQ ID NO.49:划线部分是在Q493V中突变为T的碱基)。两个探针的3’末端都被磷酸化。将匹配或错配探针的解链温度控制在72℃以下,以通过扩增子解链特征良好地分离。用LightCycler、HR-1和改装LightTyper设备进行解链分析,如实施例16所述。用获自所有三种装置的解链数据对四个样品进行了正确的基因分型:野生型、F508del纯合子、F508del杂合子和F508del/Q493V复合杂合子。图24显示了用染料N7获得的解链特征。用染料D6获得了非常相似的结果。
实施例19
同时进行突变扫描和基因分型
许多遗传病的检测可能很困难,因为引起疾病的突变常常散在于整个基因中。可同时进行突变扫描和基因分型来检测这些改变。例如,对于感兴趣的任何具体基因,用通用剪接位点外侧的引物扩增各外显子。如果已知高频序列变体,可包括未标记探针以对此位点进行基因分型,或者可用另一组引物来扩增这个较小的基因座。可在不同反应中进行特定位点的突变扫描和基因分型,或者当扫描为阳性时,随后可将探针加入管中并重复解链分析以进行基因分型。优选地,通过在同一解链曲线分析中分析全长扩增子和较小的基因座双链体同时完成扫描和基因分型。由于全长扩增子和较小基因座的大小不同,预计与较小基因座相比,全长扩增子的解链峰会在较高温度处。
基因平均约占27kb,但仅约1,300个碱基编码氨基酸。平均来说,每个基因约有9个平均长度约为150bp的外显子。引起疾病的序列改变中,约70%是SNP,其中49%是错义,11%是无义,9%是剪接突变,<1%是调控突变。小插入/缺失占引起 疾病的突变中的23%。其余7%是由大插入或缺失、重复、重排或混合序列改变引起的。一些序列改变不影响基因功能,例如产生相同氨基酸序列的沉默SNP。其它例子包括改变氨基酸序列但不改变蛋白质功能的SNP和框内插入或缺失。在内含子中的大多数SNP和重复不引起疾病,除了剪接突变和调控突变。除了内含子内部的大缺失和序列改变,可通过PCR用各外显子侧接内含子中的引物鉴定引起疾病的突变。引物位于可能的剪接位点突变以外。如果没有扩增序列改变,就不能通过任何方法对其进行检测,包括测序。
随着扩增子大小的增加,用本发明染料进行高分辨率解链分析变得越来越困难。任选地,为了将扫描灵敏度维持在接近100%,可用一种以上的扩增子扫描大于400-500个碱基的外显子。例如,采用共用热循环参数,以一次扩增所有外显子。
在突变扫描的同时,通过包括一种或多种未标记的寡核苷酸探针或用另外一组或多组引物选择性扩增较小扩增子,可对共有突变和多态性进行基因分型。可同时扩增较大和较小的扩增子,或通过在第一相中扩增较大扩增子、在第二相中扩增较小扩增子的双相PCR进行扩增。可通过设计Tm和各引物的量进行此双相PCR,以通过调节这两相的退火温度优选地扩增不同扩增子。当预计较大扩增子的信号淹没或掩盖了较小扩增子的信号时,可用此双相技术调整各扩增子的最终量,以避免上述问题。当采用一种或多种寡核苷酸探针时,可通过轻度的不对称PCR(mild asymmetric PCR),例如引物比约为10∶1的PCR扩增较大扩增子。
采用单个解链过程同时进行扩增子中突变扫描和采用探针的基因分型的一个示范性实施例是如下进行的:根据实施例17所述的方法,在野生型探针G和染料D6的存在下,从10个野生型样品和20个未知样品中扩增囊性纤维化外显子11片段。然后在改装的LightTyper设备(实施例16)上对扩增样品进行解链,所用升温速率为0.1℃/秒,40℃-90℃。图25A显示了解链曲线的扩增子部分(75-83℃)。样品中的10个具有与10个野生型样品显著不同的稍左移的曲线。猜测这些样品的扩增子中的某处携带有杂合突变。其余的曲线吻合纯合样品的预计形状。然而,其余10个未知样品的曲线不与野生型曲线重叠,因此,也将大多数这些曲线标记为可能的序列变体。图25B显示了解链曲线的探针部分(58-72℃),以负导数作图。在本文中,对30个样品各自进行了明确的基因分型。
实施例20
用未标记探针在扩增期间监测荧光
当在PCR期间监测dsDNA-结合染料的荧光时,可能逐循环地观察由靶核酸与未标记探针杂交所确定的特定靶核酸序列的产生。各PCR循环中靶序列的量取决于其在原始样品中的初始量。因此,可能进行定量。例如,将扩增子和其它dsDNA的荧光信号与探针特异性信号分开。这通过在多个温度点上监测荧光实现,多个温度点包括探针解链转变之前或期间、扩增反应中至少两个循环期间。
在一示范性实施例中,在28-bp探针(表5,SEQ ID NO.32)的存在下用实施例16所述试剂扩增DNA Toolbox质粒(实施例5)的300bp片段,除了模板DNA是105拷贝/10μl,除非另有说明,使用2mM的MgCl2,用染料N7代替D6。所用引物比为10∶1。探针和质粒序列匹配(即探针中没有错配)。在LightCycler中用以下程序参数进行45个循环的扩增:95℃ 0秒,以-20℃/秒冷却,52℃ 0秒,以0.5℃/秒加热,74℃ 8秒,以20℃/秒加热。在各PCR循环期间,在52℃和74℃之间连续监测荧光,如图26所示。然后将数据文件输入定制软件(基本如纳入本文作参考的美国专利号6,174,670所述),以分析各循环中获得的多个荧光数据。通过在各循环的一个温度下以荧光值作图的传统方法评价扩增性质,如可观察到所有dsDNA的量的61℃(图28A实心方形),或仅观察到双链扩增子的量的73℃(图28A空心方形)。
当为各循环选择了观察探针解链特定的温度范围时(在这种情况下是62~72℃),得到的荧光曲线(在图27中以负导数作图)显示,随着循环数增加,探针的解链峰变得越来越大。表示循环数和探针:靶标的特定信号量的相关性的一种方法是以在探针Tm(在此情况下是66.5℃)下且恰好在探针的解链转变(64℃)之前的导数值之差作图。得到的图见图28B(空心三角形),该图显示探针:靶标信号和循环数正相关。可预先测定,或从导数曲线目测选择,或从二阶导数等于零的二阶导数曲线获得两个温度点。考虑到一旦建立此图,这些点可用于定量样品中的初始模板。
在另一方法中,图27的曲线是减去基线且拟合于高斯曲线(可能时)的,以便计算峰下面积和对循环数作图,如图28B(实心三角形)。在图28C中,这还得到三种不同初始模板浓度的样品证实,各自都能拟合于直线,说明循环数和由探针所确定的特定扩增产物正相关且线性相关。在它们开始随循环数增加之前的几个循环期间解链峰面积值为负。这提供了在零峰面积处设立交叉点的机会,但即使峰面积值不与零交叉,也可采用外推至零。当用这些交叉点与初始模板浓度的对数作图时,发现线性关系(图28D),说明通过在扩增期间监测荧光可能用未标记探针的解链来定量初始模板。
虽然本实施例和其它实施例采用饱和染料,但应理解,也可将其它染料与本文所述某些方法一起使用,尤其是与不必监测SNP和其它小改变的方法一起使用。例如,在上述方法中,探针与靶序列完全匹配,该方法不包括检测遗传变异。然而,也应理解,上述方法可与各种其它分析,包括基因分型联用。
实施例21
检测c-kit基因中的突变以诊断GIST
人c-kit蛋白是通过结合其配体而活化的跨膜受体酪氨酸激酶。酪氨酸激酶的活化导致酪氨酸残基的自身磷酸化,这进而产生导致细胞增殖的胞外信号转导级联反应。在各种肿瘤中观察到引起c-kit蛋白不依赖配体结合地活化的突变,这些肿瘤包括胚细胞瘤、肥大细胞瘤和胃肠道基质肿瘤(GIST)。认为这些突变是肿瘤生长的驱动力。靶向分子治疗的一个最近成果是开发出药物STI-571(伊马替尼imatinib,格列卫gleeve),它能抑制GIST中活化的c-kit受体。此药物是苯基氨基嘧啶衍生物,用STI-571治疗的许多GIST患者显示出部分反应和疾病稳定。然而,需要提供对此类肿瘤的改进诊断方法。
历史上,胃肠道基质肿瘤的诊断很困难。目前,通常通过免疫染色CD117(c-kit)来诊断胃肠道基质肿瘤。免疫染色阳性说明该肿瘤被正确地鉴定为GIST。然而有时,c-kit的免疫染色是局部性和/或模糊的,难于评价。而且,免疫染色不能给出活化突变的位置、存在与否和类型的信息,且市售CD-117抗体可能与非c-kit分子发生交叉反应。高分辨率扩增子解链可用作改进方法来快速筛选c-kit基因中的活化突变。高分辨率解链检测到的序列变体还可任选地用DNA测序表征。
c-kit筛选的示范性实验如下:将各种GIST组织样品,包括原发性肿瘤、转移/复发肿瘤、由小肠和大肠、胃、腹膜和胰腺间(per-pancreatic)软组织产生的肿瘤包埋在石蜡块中。从载玻片上石蜡包埋的组织切片中分离DNA:通过在二甲苯中,然后在95%、70%、50%和30%乙醇中连续洗涤先脱石蜡、再水化样品。最后在去离子H2O中洗涤后,在红外灯下干燥载玻片5分钟。用刮刀从玻片上显微切割下合适面积的肿瘤组织,在50-100μl的50mM Tris-HCl(pH 8.0)、1mM EDTA、1%吐温20、1.0mg/ml蛋白酶K中37℃孵育过夜。然后将该样品置于沸水浴中孵育10分钟以使蛋白酶K失活。冰上冷却后,用10mM Tris-HCl(pH 7.5)、0.1mM EDTA稀释样品,用表7所示外显子特异的引物对其进行聚合酶链反应(PCR)。
表7.
引物 |
序列(5’→3’) |
SEQ.ID.NO. |
外显子9正向 |
GATGCTCTGCTTCTGTACTG |
SEQ ID NO.40
|
外显子9反向 |
GCCTAAACATCCCCTTAAATTGG |
SEQ ID NO.41
|
外显子11正向 |
CTCTCCAGAGTGCTCTAATGAC |
SEQ ID NO.42
|
外显子11反向 |
AGCCCCTGTTTCATACTGACC |
SEQ ID NO.43
|
外显子13正向 |
CGGCCATGACTGTCGCTGTAA |
SEQ ID NO.44
|
外显子13反向 |
CTCCAATGGTGCAGGCTCCAA |
SEQ ID NO.45
|
外显子17正向 |
TCTCCTCCAACCTAATAGTG |
SEQ ID NO.46
|
外显子17反向 |
GGACTGTCAAGCAGAGAAT |
SEQ ID NO.47
|
在毛细管中进行PCR,总体积20μl。该反应混合物含有50mM Tris-HCl(pH8.5)、3mM MgCl2、0.5mg/ml BSA,dATP、dGTP和dCTP各200μM,600μM dUTP、0.5μM引物、1μl稀释的Klentaq聚合酶(用10μl酶稀释剂孵育1μl冷敏感型Klentaq聚合酶)、1单位尿嘧啶N-糖基化酶(Amperase)和20μM染料D6。在LightCycler(Roche Applied Systems,Indianapolis,IN)上进行聚合酶链式反应:一开始在95℃变性10分钟(以变性尿嘧啶糖基化酶),然后是45个循环的:95℃ 3秒,以20℃/秒冷却到58℃(外显子9和11)、62℃(外显子13)或55℃(外显子17)10秒,然后以1℃/秒加热到75℃ 0秒。扩增子大小为235bp(外显子9)、219bp(外显子11)、227bp(外显子13)、170bp(外显子17)。PCR后,立即在LightCycler上将样品加热到95℃,然后冷却到40℃。然后将样品转移到高分辨率DNA解链分析设备HR/1(Idaho Technology,Salt Lake City,UT)中。如实施例3所述进行解链分析。一式两份地运行所有样品。
示范性结果见图29-32,其中通过高分辨率扩增子解链分析检测了杂合SNP(图29)、与SNP连接的12bp的纯合缺失(图30)、36bp的杂合串联重复(图31)和54bp的杂合缺失(图32)。表8小结了通过高分辨率扩增子解链分析鉴定并用DNA测序确认的这些和其它突变。
表8.
*新鉴定的突变
het:杂合子
hom:纯合子
实施例22
采用温度控制内标来提高重复解链曲线的温度精度
用引物CTGAAAGGTTACTTCAAGGAC(SEQ ID NO.52)和GACATCGCCTCTGGG(SEQ ID NO.53)各0.5μM扩增因子V Leiden区的100bp片段。用实施例17所述试剂(除了采用10μM染料N7(实施例1)、0.2U KlenTaq1TM(AB肽)和70ngTaqStartTM抗体(Clontech))在10μl体积中用LightCycler进行该反应。此外,包含互补寡核苷酸ACGATGCTACGTACGTCGCGATG-P(SEQ ID NO.54)和CATCGCGACGTACGTAGCATCGT-P(SEQ ID NO.55)各0.5μM,作为温度控制内标(也称为内标) 。PCR循环包括94℃初始变性10秒,然后是94℃ 0秒、57℃ 0秒和78℃ 0秒(57-78℃的转变速率为1℃/秒)的30个循环。PCR后,将样品加热到94℃ 1秒,然后冷却到40℃,然后解链。在能够以24-比特获取温度和荧光的HR-1高分辨率解链设备(Idaho Technology)上进行解链。PCR后,将各毛细管转移到HR-1上,以速率0.3℃/秒从50℃至90℃进行解链,产生65个点/℃。用LabVIEW(National Instruments)编写的定制软件分析解链曲线。
独立地扩增和分析与因子V Leiden突变纯合的五个重复样品。标准化之后,扩增子Tm(取扩增子解链转变的标准化荧光为50%的温度)是83.388+/-0.025℃(平均值+/-标准差)。温度控制内标的Tm是74.446+/-0.036℃。然而,扩增子和内标之间Tm之差的标准差(ΔTm 0.016℃)小于扩增子Tm的标准差(0.025℃)。因此,可通过用各样品的内标Tm测定的温度偏移调整解链曲线,来提高解链曲线的温度精度。例如,各解链曲线是根据温度变动的(如实施例11所示),以便各样品的内标Tm变为相同值(如初始内标Tm的平均值)。
采用内标可以校正扩增缓冲液中的小差异(如因蒸发而产生的盐浓度差异)。这使相同基因型的解链曲线的精度很高,以便区分不同基因型的解链曲线图形中非常小的差异。
温度控制内标无需仅限于互补的寡核苷酸对。内标的其它非限制性例子是在样品组中探针的靶标序列不变的未标记探针-靶标杂交体,或者已知序列不变的第二扩增子。示范性内标的Tm可以比感兴趣的扩增子或未标记探针-靶标杂交体的Tm更高或更低。
上述的讨论公开并描述的仅仅是本发明的示范性实施方式。本领域的技术人员从这些讨论以及附图和权利要求书中容易认识到,可以对其进行各种改变、改进和变更而不背离如所附权利要求书所定义的本发明的构思和范围。
本文所引用的所有参考文献以全文纳入作参考。