CN1650032A - 检测遗传疾病的方法 - Google Patents

检测遗传疾病的方法 Download PDF

Info

Publication number
CN1650032A
CN1650032A CNA03809794XA CN03809794A CN1650032A CN 1650032 A CN1650032 A CN 1650032A CN A03809794X A CNA03809794X A CN A03809794XA CN 03809794 A CN03809794 A CN 03809794A CN 1650032 A CN1650032 A CN 1650032A
Authority
CN
China
Prior art keywords
dna
target gene
primer
gene seat
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA03809794XA
Other languages
English (en)
Inventor
R·达拉安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ravgen Inc
Original Assignee
Ravgen Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/093,618 external-priority patent/US6977162B2/en
Application filed by Ravgen Inc filed Critical Ravgen Inc
Publication of CN1650032A publication Critical patent/CN1650032A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/02Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/313Type II endonucleases, i.e. cutting outside recognition site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/131Modifications characterised by incorporating a restriction site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/125Allele specific primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/114Reactions characterised by their quantitative nature the purpose being quantitative analysis involving a quantitation step

Abstract

本发明提供了用于遗传疾病检测的方法。该方法包括确定目标基因座的等位基因序列,并定量目标基因座处等位基因的比率,其中该比率指示出存在或不存在染色体异常。本发明还提供了检测胎儿中染色体异常的非侵入性方法。本发明特别用作确定胎儿DNA序列的非侵入性方法。

Description

检测遗传疾病的方法
相关申请的交互参考
本发明要求2002年3月11日提交的美国专利申请号10/093,618和分别在2002年3月1日和2002年5月8日提交的美国临时专利申请号60/360,232和60/378,354的优先权。此处将这些申请的内容完整引入作为参考。
发明背景
发明领域
本发明涉及检测遗传疾病包括染色体异常和突变的方法。本发明提供了测定胎儿DNA序列的快速、非侵入方法。该方法特别用于检测胎儿中染色体异常,包括易位、颠换、单体性、三体性和其他非整倍性、缺失、添加、扩增、易位和重排。
背景技术
染色体异常是造成活胎产人类遗传缺陷的重要部分。人细胞核含有46条染色体,这些染色体含有遗传指令并决定细胞的运行。这46条染色体的一半来自每个亲本。除了性染色体(它们在正常男性中相互差异很大),来自母亲的染色体和来自父亲的染色体配成一套。当卵细胞被精子受精时组合成对。偶然地,在染色体形成或组合时发生错误,形成的受精卵细胞含有太多或太少的染色体,或者以某种方式混合的染色体。因为每条染色体含有许多基因,染色体异常可以导致严重的出生缺陷,影响许多机体系统,通常包括发育无能(例如智力迟钝)。
细胞可自发的和在暴露于化学化合物、致癌物和辐射后错误地重新连接染色体的断裂端。当在染色体中发生重新连接时,两个断点间的染色体片段成为颠倒的并被分类为倒位。倒位时,没有遗传物质损失;然而,倒位可导致关键基因的破坏,或者产生诱导疾病相关症状的融合基因。
在互换易位中,两条非同源染色体断裂并交换片段。在该情况中,两条异常染色体导致:每条由来自其他染色体的一部分组成并缺少自身的一部分。如果易位是平衡的类型,个体将不显示异常表型。然而,含有易位个体在生殖细胞形成期间,卵子或精子中染色体的正确分布偶然失败,导致后代流产、畸形或智力迟钝。
在罗伯逊易位中,两条具近端着丝粒(具有不位于中心的着丝点的染色体)的染色体的着丝点融合以产生一个大的具中间着丝粒的染色体。具有中心融合的个体染色体组型的染色体数目比正常的双倍体少一个。
产生太多或太少染色体的错误也可导致疾病表型。例如,染色体X的丢失拷贝(单体性X)导致特纳综合征,而染色体21的额外拷贝导致唐氏综合征。其他疾病如爱德华综合征(Edward’s syndrome)和帕陶综合征(Patau syndrome)分别由染色体18和染色体13的额外拷贝导致。
一种最普通的染色体异常是唐氏综合征。唐氏综合征的估计发生率为活胎产中1,000分之一到1,100分之一。每年美国出生的约3,000到5,000儿童具有染色体异常。患有唐氏综合征的儿童的大多数(约95%)具有额外的染色体21。最经常地,额外染色体来自母亲。然而,在约3-4%患有唐氏综合征的人中,染色体21和14或22的易位是遗传异常的原因。最后,称为镶嵌的另一个染色体问题在约1%患有唐氏综合征的个体中发现。在这种情况下,一些细胞有47条染色体,其他细胞有46条染色体。认为镶嵌是受孕后不久细胞分裂中的错误所导致的。
染色体异常是先天性的,因此,可以使用出生前诊断确定未出生胎儿的健康和状况。没有经出生前诊断而得到的信息,可能对胎儿或母亲或两者产生不幸的结果。先天性异常占产期死亡的20%到25%。特别地,出生前诊断有助于处理怀孕的剩余期间,安排可能的生产过程并发症,为新生婴儿发生的问题做准备,和发现可影响将来怀孕的疾病。
已有各种出生前诊断的非侵入性和侵入性技术,包括超声波检测法、羊水诊断、绒毛膜取样(CVS)、母亲血液中的胎儿血细胞、母亲血清甲胎蛋白、母亲血清β-HCG,和母亲血清雌三醇。然而,非侵入性技术特异性较低,而具有高度特异性和高敏感性的技术是高侵入性的。此外,大多数技术只能在怀孕的特定期间内应用以得到最大效用。
超声波检测法
这是一种无害的非侵入性方法。高频率声波用于从不同组织或器官,包括羊膜腔中的胎儿产生的回声的模式产生可见的图像。正在发育的胚胎可在怀孕约6周见到。在怀孕约16到20周时可以估计主要内部器官和四肢以确定是否异常。
超声检查可用于确定胎儿的大小和位置,羊膜液的量,以及胎儿解剖外观;然而,该方法存在局限。微妙的异常,如唐氏综合征,其中形态异常通常不显著而只是微妙的,这些异常根本检测不到。
羊水诊断
这是一种高侵入性方法,其中针从母亲的下腹部穿入到子宫内的羊膜腔。该方法可以在约14周妊娠时进行。对于出生前诊断,大多数羊水诊断在14到20周妊娠时进行。然而,在羊水诊断前进行超声检查以确定妊娠龄、胎儿和胎盘的位置,并确定是否存在足够羊水。在羊水中正是胎儿细胞(大多数来自胎儿皮肤)可培养生长用于染色体、生物化学和分子生物学分析。
大的染色体异常,如多余或丢失染色体或染色体片段,可通过染色体组型检测,染色体组型包括鉴定和分析细胞的所有46条染色体并基于大小和结构的细微差异将它们匹配成对排列。在该系统展示中,染色体数目和结构的异常是明显的。该方法通常要7-10天完成。
尽管羊水诊断可用于提供直接的遗传信息,但存在与该方法相关的危险,包括胎儿丧失和母亲Rh致敏。羊水诊断后胎儿死亡增加的危险高于通常所预期的约0.5%。Rh阴性母亲可用RhoGam治疗。
绒毛膜取样(CVS)
在该方法中,在超声的指引下,导管经过阴道穿过子宫颈进入子宫到达胎盘。导管的导入使得可得到来自胎盘绒膜的细胞并通过各种技术分析,这些技术包括染色体分析以确定胎儿的染色体组型。还可以培养细胞用于生物化学或分子生物学分析。一般在9.5到12.5周妊娠间进行CVS。
CVS具有非侵入性方法的弱点,并且其具有低但明显的胎儿死亡率;该流产率比经历羊水诊断的妇女高约0.5到1%。罕有地,CVS可与胎儿中四肢缺陷有关。而且,存在母亲Rh致敏的可能性。此外,还可能对正在发育的胎盘中母亲血细胞而不是胎儿细胞采样而混淆染色体分析。
母亲血清甲胎蛋白(MSAFP)
发育的胎儿有两种主要的血蛋白——白蛋白和甲胎蛋白(AFP)。母亲的血液中通常只有白蛋白,从而,MSAFT试验可用于确定胎儿AFP的水平。通常,只有少量AFP到达羊水并穿过胎盘到达母亲的血液。然而,如果胎儿具有神经管缺陷,那么更多的AFP到达羊水。神经管缺陷包括无脑(神经管不能在头盖端封闭)和脊柱裂(神经管不能在尾部封闭)。在美国这些缺陷的发生率为每1000个出生的婴儿约1到2例。而且,如果在胎儿腹壁存在缺陷,胎儿的AFP将在母亲血液中以更高量出现。
MSAFP的量随着妊娠龄增加,从而,为了为MSAFP试验提供准确的结果,妊娠龄必须确定地知道。还有,母亲的种族和妊娠糖尿病的存在可以影响将要考虑为正常的MSAFP的水平。MSAFP通常被报道为平均值的倍数(MoM)。MoM越大,越可能存在缺陷。MSAFP在16到18周妊娠时具有最大的敏感性,但在15到22周妊娠时也可使用。当存在唐氏综合征或其他染色体异常时MSAFP倾向于较低。
尽管MSAFP试验是非侵入性的,但是MSAFP不是100%特异性的。MSAFP可用于评价不与胎儿神经管或腹壁缺陷相关的各种原因。上升的MSAFP的最通常原因是错误估计了胎儿的妊娠龄。因此,MSAFP的结果从不被认为是确定的和结论性的。
母亲血清β-HCG
从怀孕后约1周以及正在发育的胚胎移植入子宫开始,滋养层将产生可检测的β-HCG(人绒膜促性腺激素的β亚单位),其可用于症断怀孕。可在母亲血清中定量β-HCG,这在怀孕的早期有用,因为当怀疑可能流产或异常怀孕时β-HCG的量将低于正常量。
在第二个三个月的中期或晚期,β-HCG可与MSAFP结合使用以筛选染色体异常,尤其是唐氏综合征。升高的β-HCG以及降低的MSAF表明为唐氏综合征。高水平的HCG表明滋养层疾病(葡萄胎妊娠)。超声波检测法无胎儿以及升高的HCG表明葡萄胎。
母亲血清雌三醇
母亲血清中雌三醇的量取决于存活的胎儿、正常活动的胎盘和母亲的健康。脱氢表雄甾酮(DHEA)由胎儿肾上腺产生,并在胎盘中被代谢成雌三醇。雌三醇进入母亲循环并被母亲的肾在尿中排泄或被母亲的肝在胆汁中分泌。在第三个三月中测量的雌三醇的正常水平表明胎儿是健康的。如果雌三醇水平下降,那么胎儿受到威胁,必须立即分娩。当存在唐氏综合征和无脑的肾上腺发育不全时,雌三醇将较低。
三因素筛选试验
三因素筛选试验包括分析母亲甲胎蛋白(MSAFP)、人绒膜促性腺激素(hCG)和非结合的雌三醇(uE3)。通常在最后月经期16-18周后进行血试验。尽管三因素筛选试验是非侵入性的,但是异常的试验结果不能表明出生缺陷。该试验仅仅指出增加的危险性和表明需要进一步试验。例如,1000个妇女中有100人将得到三因素筛选试验的异常结果。然而,这100个妇女中只有2-3个怀有具有出生缺陷的胎儿。这种假阳性的高发生率使未来的母亲产生巨大压力和不必要的焦虑。
从母亲血液中分离的胎儿细胞
在母亲血液中存在胎儿有核的细胞使得可能使用这些细胞用于非侵入性出生前诊断(Walknowska等,Lancet 1:1119-1122,1969;Lo等,Lancet2:1363-65,1989;Lo等,Blood 88:4390-95,1996)。可以分选胎儿细胞并通过各种技术分析特定DNA序列(Bianchi等,Am.J.Hum.Genet.61:822-29,(1997);Bianchi等,PNAS 93:705-08,(1996))。荧光原位杂交(FISH)是一种可用于鉴定从母亲血液中回收的胎儿细胞的特定染色体并诊断非整倍状况如三体性和单体性X的技术。据报道在非整倍体怀孕时母亲血清中胎儿细胞的数目增加。
FISH的方法使用有色荧光标签标记的DNA探针,有色荧光标签使得可以在显微镜下检测特定染色体或基因。使用FISH,不能通过标准染色体组型检测的细微的遗传异常可被容易地鉴定。该方法通常需要24-48小时来完成。此外,使用一组多色的DNA FISH探针,可以看见异常染色体的拷贝数。
尽管对胎儿细胞的分离和富集做了改进,仍然较难得到许多胎儿血细胞。可能没有足够的胎儿血细胞以可靠地确定胎儿染色体组型的异常或分析其他异常。此外,大多数技术是耗时的,需要劳动力的高投入,并且难于实现高通量模式。
来自母亲血液的胎儿DNA
已经在母亲血浆和血清中检测和定量了胎儿DNA(Lo等,Lancet 350:485-487(1997);Lo等,Am.J.hum.Genet.62:768-775(1998))。许多胎儿细胞类型在母体循环中存在,包括胎儿粒细胞、淋巴细胞、有核血红细胞和滋养层细胞(Pertl和Bianchi,Obstetrics and Gynecology 98:483-490(2001))。胎儿DNA可在怀孕的第七周在血清中检测,并且随着怀孕的时间而增加。存在于母亲血清和血浆中的胎儿DNA与从胎儿细胞分离方案所得DNA浓度相当。
循环胎儿DNA已被用于确定胎儿的性别(Lo等,Am.J.hum.Genet 62:768-775(1998))。而且,已经用胎儿DNA检测到胎儿Rh因子D基因型。然而,循环胎儿DNA的诊断和临床应用受到存在于胎儿而不是母亲中的基因的限制(Pertl和Bianchi,Obstetrics and Gynecology98:483-490(2001))。从而,仍然需要能够确定胎儿DNA序列并提供明确诊断胎儿染色体异常的非侵入性方法。
发明简述
本发明涉及检测遗传疾病包括突变和染色体异常的方法。在一个优选的实施方案中,本发明用于检测突变和染色体异常,包括但不限于易位、颠换、单体性、三体性,和其他非整倍体性、缺失、加入、扩增、片段化、易位和重排。可同时检测许多异常。本发明还提供了确定怀孕女性样品胎儿DNA序列的非侵入性方法。本发明可用于与野生型序列相比较确定基因序列中的任何改变,包括但不限于点突变、读框移位、转换、颠换、加入、插入、缺失、加入-缺失、框移位、错义、反向突变,和微卫星改变。
在一个实施方案中,本发明涉及检测染色体异常的方法,所述方法包括:(a)确定模板DNA上目标基因座的等位基因序列,和(b)定量从(a)的目标基因座鉴定的目标杂合基因座处等位基因的比率,其中所述比率指出存在或不存在染色体异常。
在另一个实施方案中,本发明提供了确定胎儿DNA上目标基因座序列的非侵入性方法,所述方法包括:(a)从怀孕女性得到样品;(b)向(a)的样品加入细胞裂解抑制剂;(c)从(b)的样品得到模板DNA,其中所述模板DNA含有胎儿DNA和母亲DNA;和(d)确定模板DNA上目标基因座的序列。
在另一个实施方案中,模板DNA得自这样的样品,该样品包括但不限于细胞、组织、血液、血清、血浆、唾液、尿、泪、阴道分泌物、脐带血、绒毛膜绒毛、羊水、胚胎组织、胚胎、两细胞胚胎、四细胞胚胎、八细胞胚胎、16细胞胚胎、32细胞胚胎、64细胞胚胎、128细胞胚胎、256细胞胚胎、512细胞胚胎、1024细胞胚胎、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便或身体渗出液。
在一个实施方案中,模板DNA从怀孕女性的样品得到。在一个优选的实施方案中,模板DNA从怀孕人类女性得到。
在另一个实施方案中,模板DNA从胚胎得到。在一个优选的实施方案中,模板DNA从胚胎的单个细胞得到。
在另一个实施方案中,加入到样品中的细胞裂解抑制剂包括但不限于甲醛和甲醛衍生物、福尔马林、戊二醛和戊二醛衍生物、交联剂、伯胺反应交联剂、巯基反应交联剂、巯基加成或二硫化物还原、糖反应交联剂、羧基反应交联剂、光反应交联剂、可切割交联剂、AEDP、APG、BASED、BM(PEO)3、BM(PEO)4、BMB、BMDB、BMH、BMOE、BS3、BSOCOES、DFDNB、DMA、DMP、DMS、DPDPB、DSG、DSP、DSS、DST、DTBP、DTME、DTSSP、EGS、HBVS、硫代-BSOCOES、硫代-DST或硫代-EGS。
在另一个实施方案中,加入到样品中的防止DNA破坏的试剂包括但不限于DNA酶抑制剂、氯化锌、乙二胺四乙酸、盐酸胍、异硫氰酸胍、N-月桂酰肌氨酸和十二烷基硫酸钠。
在一个优选的实施方案中,模板DNA得自怀孕女性血液的血浆。在另一个实施方案中,模板DNA得自怀孕女性血液的血清。
在另一个实施方案中,模板DNA含有胎儿DNA和母亲DNA。
在另一个实施方案中,模板DNA上的目标基因座选自母亲的纯合目标基因座。在另一个实施方案中,模板DNA上的目标基因座选自母亲的杂合性目标基因座。
在另一个实施方案中,模板DNA上的目标基因座选自父亲的纯合目标基因座。在另一个实施方案中,模板DNA上的目标基因座选自父亲的杂合性目标基因座。
在一个实施方案中,确定了单条染色体上的多个目标基因座的等位基因序列。在一个优选的实施方案中,确定了多条染色体上的多个基因座上的等位基因序列。
在另一个实施方案中,确定目标基因座的等位基因序列的方法包括但不限于等位基因特异PCR、凝胶电泳、ELISA、质谱、杂交、引物延伸、荧光偏振、荧光检测、荧光共振能量转移(FRET)、测序、DNA微阵列、southern印迹、狭线印迹、斑点印迹和MALDI-TOF质谱法。
在一个优选的实施方案中,确定目标基因座的等位基因序列包括(a)使用第一和第二引物扩增目标基因座,其中第二引物含有限制性酶识别位点,该限制性酶产生含有目标基因座的5’突出端;(b)用识别第二引物上的识别位点的限制酶消化扩增的DNA;(c)通过使用含有目标基因座的5’突出端作为模板将核苷酸掺入(b)的经消化DNA;和(d)通过确定(c)的DNA序列确定目标基因座的序列。
在一个实施方案中,扩增可包括聚合酶链反应(PCR)。在进一步的实施方案中,PCR第一轮的退火温度可约为第二引物退火长度的解链温度。在另一个实施方案中,PCR的第二轮退火温度可约为与模板DNA退火的第一引物3’区的解链温度。在另一个实施方案中,剩余轮的退火温度可约为第二引物全长序列的解链温度。
在另一个实施方案中,第二引物上的识别位点为这样的限制酶识别位点,该限制酶从距离其结合位点一定距离处切割并产生5’突出端,该5’突出端含有目标基因座。在一个优选的实施方案中,第二引物上的识别位点为IIS型限制酶的识别位点。IIS型限制酶包括但不限于Alw I、Alw26 I、Bbs I、Bbv I、BceAI、Bmr I、Bsa I、Bst71 I、BsmA I、BsmB I、BsmFI、BspM I、Ear I、Fau I、Fok I、Hga I、Ple I、SapI、SSfaNI和Sthi32 I,更优选BceA I和BsmF I。
在一个实施方案中,第二引物的3’端与目标基因座相邻。
在另一个实施方案中,第二引物的退火长度选自35-30、30-25、25-20、20-15、15、14、13、12、11、10、9、8、7、6、5、4和少于4个碱基。
在另一个实施方案中,扩增目标基因座包括使用含有限制酶识别位点部分的第一和第二引物,其中所述识别位点含有至少一个可变核苷酸,并且扩增后,产生完整限制酶识别位点,并且所述引物的3’区可含有与模板DNA的错配,用所述限制酶消化产生含有目标基因座的5’突出端。
在一个优选的实施方案中,限制酶(包括但不限于)
                  BsaJ I(5’CCNNGG 3’),BssK I(5’CCNGG 3’),Dde I(5’CTNAG
3’),EcoN I(5’CCTNNNNNAGG 3’),Fnu4H I(5’GCNGC 3’),Hinf I(5’GANTC 3’),
PflF 1(5’GACNNNGTC 3’),Sau96 I(5’GGNCC 3’),ScrF I(5’CCNGG 3’),Tth1 11
I(5’GACNNNGTC 3’),
更优选Fnu4H I和EcoN I的识别位点在扩增后产生。
在另一实施方案中,第一和/或第二引物的5’区含有限制酶识别位点。在一个优选的实施方案中,该限制酶识别位点与产生含有目标基因座的5’突出端的限制酶识别位点不同。
在进一步的实施方案中,本发明的方法还包括用识别第一和/或第二引物的5’区的识别位点的限制酶消化DNA。
第一和/或第二引物可在5’末端含有标签。优选地,第一引物含有5’末端标签。该标签可用于将扩增的DNA从模板DNA分开。该标签可用于将含有经标记核苷酸的扩增DNA从不含标记的核苷酸分开。标签例如选自:放射性同位素、荧光报道分子、化学发光报道分子、抗体、抗体片段、半抗原、生物素、生物素衍生物、光生物素、亚氨基生物素、地高辛、亲和素、酶、吖啶(acridinium)、糖、酶、脱辅基酶、均聚寡核苷酸、激素、铁磁性分子、顺磁性分子、反磁性分子、磷光分子、发光分子、电化学发光分子、有色分子、具有可检测的电子旋转共振、电容、介电常数或电导的分子,和它们的组合。优选地,标签为生物素。生物素标签用于通过使用链亲和素基质将扩增的DNA从模板DNA分开。链亲和素基质包被在微量滴定板的孔上。
本发明方法中的核苷酸掺入是通过DNA聚合酶进行的,这些酶包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、T7 DNA聚合酶、T4 DNA聚合酶、T5 DNA聚合酶、Klenow类型的聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent聚合酶、噬菌体29、REDTaqTM基因组DNA聚合酶或测序酶(sequenase)。核苷酸的掺入还可以包括使用标记的和未标记的核苷酸混合物。可掺入一个核苷酸、两个核苷酸、三个核苷酸、四个核苷酸、五个核苷酸或五个以上的核苷酸。可掺入标记的和未标记的核苷酸组合。标记的核苷酸选自双脱氧核苷三磷酸和脱氧核苷三磷酸。未标记的核苷酸选自双脱氧核苷三磷酸和脱氧核苷三磷酸。标记的核苷酸用选自放射活性分子、荧光分子、抗体、抗体片段、半抗原、糖、生物素、生物素衍生物、磷光分子、发光分子、电化学发光分子、有色分子、具有可检测的电子旋转共振、电容、介电常数或电导部分的分子标记。优选地,标记的核苷酸用荧光分子标记。荧光标记的核苷酸的掺入还包括使用荧光和未标记核苷酸的混合物。
在一个实施方案中,目标基因座序列的测定包括检测掺入的核苷酸。在一个实施方案中,该检测是通过选自凝胶电泳、毛细管电泳、微通道电泳、聚丙烯酰胺凝胶电泳、荧光检测、荧光偏振、DNA测序、Sanger双脱氧测序、ELISA、质谱、飞行质谱时间、四极质谱、磁性部分质谱、电部分质谱、荧光计、红外光谱、紫外光谱、palentiostatic电流测定法、DNA杂交、DNA微阵列、southern印迹、狭线印迹和斑点印迹的方法。
在一个实施方案中,确定模板DNA上单条染色体上一到数十到数百到数千目标基因座。在一个优选的实施方案中,确定了多条染色体上的一到数十到数百到数千目标基因座。
在一个优选的实施方案中,怀疑目标基因座含有单个核苷酸多态性或突变。该方法可用于同时确定多个目标基因座的序列。模板DNA可含有来自单条染色体的多个基因座。模板DNA可含有来自不同染色体的多个基因座。可以在一次反应中扩增模板DNA上的目标基因座。备选地,每个模板DNA上的目标基因座可在单独的反应中扩增。在消化扩增的DNA前可将扩增的DNA合并。每一个含有目标基因座的标记DNA可在确定目标基因座的序列前分开。在一个实施方案中,至少一个目标基因座被怀疑含有单个核苷酸多态性或突变。
在另一个实施方案中,将一条染色体上杂合性目标基因座等位基因的比率与不同染色体上杂合性目标基因座等位基因的比率相比较。对可以进行比较的染色体没有限制。任何染色体上杂合性目标基因座等位基因的比率可与任何其他染色体上杂合性目标基因座等位基因的比率相比较。在一个优选的实施方案中,将一条染色体上多个杂合性目标基因座的等位基因的比率相加并与不同染色体上多个杂合性目标基因座等位基因的比率比较。
在另一个实施方案中,将染色体上杂合性目标基因座等位基因的比率与两条、三条、四条或四条以上染色体上的杂合性目标基因座上的等位基因比率相比较。在另一个实施方案中,将染色体上多个目标基因座等位基因的比率与两条、三条、四条或四条以上染色体上的多个目标基因座上的等位基因比率相比较。
在另一个实施方案中,将一条染色体上目标基因座处等位基因的比率与不同染色体上目标基因座处等位基因比率相比较,其中比率的差异说明存在或不存在染色体异常。在另一个实施方案中,将一条染色体上多个目标基因座处等位基因的比率与不同染色体上多个目标基因座处等位基因比率相比较,其中比率的差异说明存在或不存在染色体异常。
在另一个实施方案中,确定了从怀孕女性样品所得模板DNA上的一到数十到数百到数千个目标基因座的序列。在一个实施方案中,目标基因座位于一条染色体上。在另一个实施方案中,目标基因座位于多条染色体上。
附图简述
图1A.描述双链DNA分子的示意图。一对引物(描述为弯曲箭头)位于目标基因座(描述为碱基N14处的三角形符号)的侧翼。目标基因座可以是单个核苷酸多态性、点突变、插入、缺失、易位等。每个引物含有在第一引物中描述为区域“a”在第二引物中描述为区域“d”的5’末端的约10的限制酶识别位点。限制性识别位点“a”可以用于任何类型限制酶,但是限制位点“d”为一种这样的限制酶,从距离其限制性位点“n”个核苷酸处切割并产生5’突出端和3’凹端。这些酶的实例包括但不限于BceAI和BsmF I。5’突出端作为模板以将核苷酸掺入到3’凹端。
所示第一引物在5’端被生物素修饰以利于纯化。引物的3’端序列为引物在目标基因座所期望的上游和下游处退火的序列。第二引物在目标基因座附近退火;退火位点(描述为区域“c”)被设计使得第二引物的3’端从离目标基因座一个碱基处退火。第二引物可从目标基因座的任何距离处退火,只要识别该引物上的区域“d”的限制酶产生含有目标基因座的5’突出端。描述为区域“b”的第一引物退火位点约20个碱基。
图1B.描述PCR第一轮扩增的退火和延伸步骤示意图。约在第二引物的3’区(描述为区“c”)解链温度进行第一轮扩增,该3’区与模板DNA退火,并且在该实例中为13个碱基对。在该温度,第一和第二引物都与它们各自的互补链退火并开始延伸,通过点线描述。在第一轮循环中,第二引物延伸并拷贝第一引物可在下一轮循环中退火的区域b。
图1C.描述第二轮PCR扩增中变性后退火和延伸步骤的示意图。第二轮扩增在较高退火温度(TM2)下进行,该温度约为第一引物与模板DNA退火的3’区20个碱基(描述为区“b”)的解链温度。因此,在TM2温度下,含有与区域b互补的区域b’的第一引物可结合在反应的第一轮中复制的DNA。然而,在TM2温度时,第二引物不能与最初的模板DNA或在反应的第一轮中复制的DNA退火,因为退火温度太高。第二引物可与最初模板DNA中13个碱基退火但计算的TM2在约20个碱基的解链温度。
图1D.描述第三轮扩增中变性后退火和延伸的示意图。在该轮中,退火温度TM3约为全部第二引物(包括区域“c”和“d”)的解链温度。区域“c”+“d”的长度约为27-33,从而TM3显著高于TM1和TM2。在该较高TM,含有区域c’和d’的第二引物与在第二轮中产生的复制DNA退火。
图1E.扩增的剩余轮中退火和延伸反应的示意图。剩余轮的退火温度为TM3,其约为完整第二引物的解链温度。在TM3,第二引物结合至含有区域c’和d’的模板,并且第一引物结合至含有区域a’和b的模板。通过在头三轮中每轮的连续升高退火温度,从TM1、TM2到TM3,显著降低了非特异扩增。
图1F.描述结合至固体基质的经扩增目标基因座的示意图。
图1G.描述结合的经扩增DNA用限制酶“d”消化后的示意图。“下游”端被释放到上清液中,并且可通过用任何适宜的缓冲液洗涤除去。含有目标基因座的上游端仍结合至固体基质。
图1H.描述结合的经扩增DNA用标记的ddNTP“填平”后的示意图。DNA聚合酶用于“填平”与目标基因座(N14)互补的碱基(N’14)。在该例子中,仅仅ddNTP存在于该反应中,从而只有目标基因座或目标SNP被填平。
图1I.描述经标记的结合DNA用限制酶“a”消化后的示意图。经标记的DNA被释放到上清液中,可收集上清液以鉴定掺入的碱基。
图2.描述双链DNA模板与n个目标基因座和n个引物对x1,y1到xn,yn特异退火从而一个引物位于每一目标基因座侧翼的示意图。第一引物在5’端被生物素化(用·描述),并含有限制酶识别位点“a”,其可以是任何类型的限制酶。第二引物含有限制酶识别位点“d”,其中“d”是限制酶从距离其识别位点“n”个核苷酸处切割并产生含有目标基因座的5’突出端和3’凹端的限制位点。第二引物在各自目标基因座附近退火。设计第二引物中限制酶位点“d”的确切位置从而使得用限制酶“d”消化每一目标基因座的PCR产物可产生含有目标基因座的5’突出端和3’凹端。第一引物的退火位点长约20个碱基,对该位点进行选择使得每个连续第一引物进一步远离其各自的第二引物。例如,如果在基因座1,第一和第二引物的3’端为分开的Z碱基对,那么在基因座2,第一和第二引物的3’端为分开的Z+K碱基对,其中K=1、2、3或多于三个碱基。基因座N的引物间为ZN-1+分开的K碱基对。产生远离它们各自的第二引物的连续第一引物的目的是使得“填平”的限制性片段(如图1B-1I中描述的扩增、纯化、消化和标记后产生)大小不同并可通过例如电泳分开以允许检测每个目标基因座。
图3.使用多个退火温度的SNP PCR扩增。来自36个人类志愿者的含有基因座DNA模板的样品被用于分析下面的四种SNP:SNPHC21500340(泳道1),鉴定号如人类染色体21 cSNP数据库中所指定的,位于染色体21;SNP TSC 0095512(泳道2),位于染色体1,SNP TSC0214366(泳道3),位于染色体1;和SNP TSC 0087315(泳道4),位于染色体1。每种SNP通过PCR使用三种不同的退火温度方案扩增,这三种退火温度在此处分别为低严紧性退火温度;中严紧性退火温度;和高严紧性退火温度。不管退火温度方案,每种SNP用PCR进行40轮扩增。每次PCR反应的变性步骤在95℃进行30秒。
图3A.示范使用低严紧性退火温度方案的4种不同SNP的PCR扩增的凝胶照片。
图3B.示范使用中严紧性退火温度方案的4种不同SNP的PCR扩增的凝胶照片。
图3C.示范使用高严紧性退火温度方案的4种不同SNP的PCR扩增的凝胶照片。
图4A.位于21号染色体、人染色体21 cSNP数据库指定的SNP HC21S00027的DNA序列描述。第一引物和第二引物分别显示于高于和低于HC21S00027序列。第一引物被生物素化并含有EcoRI的限制酶识别位点。第二引物含有BsmFI的限制酶识别位点并含有与DNA序列退火的13个碱基。SNP通过R(A/G)和r(T/C)(与R互补)指示。
图4B.位于21号染色体、人染色体21 cSNP数据库指定的SNP HC21S00027的DNA序列描述。第一引物和第二引物分别显示于高于和低于HC21S00027序列。第一引物被生物素化并含有EcoRI的限制酶识别位点。第二引物含有BceA I的限制酶识别位点并含有与DNA序列退火的13个碱基。SNP通过R(A/G)和r(T/C)(与R互补)指示。
图4C.来自1号染色体的SNP TSC0095512的DNA序列描述。第一引物和第二引物分别于显示高于和低于TSC0095512序列。第一引物被生物素化并含有EcoRI的限制酶识别位点。第二引物含有BsmF I的限制酶识别位点并含有与DNA序列退火的13个碱基。SNP通过S(G/C)和s(C/G)(与S互补)指示。
图4D.来自1号染色体的SNP TSC0095512的DNA序列描述。第一引物和第二引物分别显示于高于和低于TSC0095512序列。第一引物被生物素化并含有EcoRI的限制酶识别位点。第二引物含有BceA I的限制酶识别位点并含有与DNA序列退火的13个碱基。SNP通过S(G/C)和s(C/G)(与S互补)指示。
图5A-5D.描述用在图4A-4D中描述的引物扩增后SNPHC21S00027(图5A和5B)和SNP TSC0095512(图5C和5D)的示意图。引物序列中限制位点以粗体指示。
图6A-6D.描述用适宜IIS型限制酶消化后每个扩增的SNP的核苷酸序列的示意图。图6A和6B描述分别用IIS型限制酶BsmF I和BceA I消化后SNP HC21S00027的片段。图6C和6D描述分别用IIS型限制酶BsmF I和BceA I消化后SNPTSC0095512的片段。
图7A-7D.描述以经消化SNP位点的5’突出端作为模板使用荧光标记的核苷酸掺入“填平”3’凹端的示意图。图7A和7B描述具有掺入了经标记ddNTP(uR-dd=荧光双脱氧核苷酸)的经消化SNP HC21S00027基因座。图7C和7D描述具有掺入了经标记ddNTP(*S-dd=荧光双脱氧核苷酸)的经消化SNP TSC0095512基因座。ddNTP的使用确保3’凹端延伸一个核苷酸,该核苷酸与目标核苷酸或5’突出端中的SNP位点互补。
图7E.描述dNTPs和ddNTP掺入含有SNP位点的5’突出端的示意图。将SNP HC21S0007用BsmF I消化,产生四碱基的5’突出端。dNTPs和ddNTP混合物的使用使得3’凹端被延伸1个核苷酸(ddNTP首先被掺入);两个核苷酸(dNTP在ddNTP后面掺入);三个核苷酸(两个dNTP在ddNTP后面掺入);或四个核苷酸(三个dNTP在ddNTP后面掺入)。所有四种产物可根据大小分离,并检测掺入的核苷酸(*R-dd=荧光双脱氧核苷酸)。检测相应于SNP或基因座位点的第一个核苷酸和后三个核苷酸提供了质量保证的额外水平。SNP通过R(A/G)和r(T/C)(与R互补)指示。
图8A-8D.“填平的”SNP从固相支持基质,即链亲和素包被的孔释放。SNP HC21S00027在图8A和8B中显示,而SNPTSC0095512在图8C和8D中显示。“填平的”SNP在溶液中是游离的,并可被检测。
图9A.用BceA I消化的SNP HC21S00027消化的序列分析。显示了四种“填平”反应;每种反应含有一种荧光标记的核苷酸,ddGTP、ddATP、ddTTP或ddCTP,和未标记的ddNTPs。显示了用BceA I消化产生的5’突出端和在该SNP位点的预期核苷酸。
图9B.SNP TSC0095512的序列分析。将SNP TSC0095512用含有BceA I的识别位点的第二引物扩增,并在单独的反应中,用含有BsmF I识别位点的第二引物扩增。为每种PCR产物显示了四种填充反应;每种反应含有一个荧光标记的核苷酸,ddGTP、ddATP、ddTTP或ddCTP,和未标记的ddNTPs。显示了用BceA I和BsmF I消化产生的5’突出端和期望核苷酸。
图9C.用含有BsmF I识别位点的第二引物扩增后的SNPTSC0264580的序列分析。为每种PCR产物显示了四种填平反应;每种反应含有一个荧光标记的核苷酸,即ddGTP、ddATP、ddTTP或ddC TP,和未标记的ddNTPs。描述了两种不同的5’突出端:一种代表在有义链切除11个核苷酸和在反义链切除15个核苷酸的DNA分子,另一种代表在有义链切除10个核苷酸和在反义链切除14个核苷酸的DNA分子。还显示了预期的核苷酸。
图9D.用含有BsmF I识别位点的第二引物扩增后的SNPHC21S00027的序列分析。标记的ddNTPs和未标记的dNTPs的混合物被用于填平通过BsmF I消化产生的5’突出端。描述了两种不同的5’突出端:一种代表在有义链切除11个核苷酸和在反义链切除15个核苷酸的DNA分子,另一种代表在有义链切除10个核苷酸和在反义链切除14个核苷酸的DNA分子。显示了来自SNP的核苷酸、SNP位点的核苷酸(样品含有来自36个个体的DNA模板;预期两种核苷酸将在样品中被代表)和SNP下游的三个核苷酸。
图10.多种SNP的序列分析。在单独的PCR反应使用含有BsmF I识别位点的第二引物扩增位于21号染色体上的SNP HC21S00131和HC21S00027,和位于1号染色体上的SNP TSC0087315、SNP TSC0214366、SNP TSC0413944和SNP TSC0095512。设计引物使得每种目标扩增基因座具有不同大小。扩增后,将反应物合并为单个样品,并在该样品中进行该方法的所有后续步骤(如图1F-1I所描述)。显示了每种SNP和在每种SNP存在的核苷酸。
图11.母亲血液中胎儿DNA百分数的定量。在获得允许后从怀孕人类女性得到血液。分离DNA并进行系列稀释以确定样品中存在的胎儿DNA百分数。位于Y染色体上的SRY基因被用于检测胎儿DNA。位于7号染色体上的囊性纤维化基因被用于检测母亲和胎儿DNA。
图11A.使用从用EDTA处理的血液样品分离的DNA模板进行SRY基因和囊性纤维化基因的扩增。
图11B.使用从用福尔马林和EDTA处理的血液样品分离的DNA模板进行SRY基因和囊性纤维化基因的扩增。
图12.原先分型为具有三体性21(Down’综合症)基因型的个体的遗传分析。得到允许后从原先分型的具有三体性21基因型的个体收集血液。分离DNA并鉴定21号染色体上的两种SNP和13号染色体上的两种SNP的基因型。如凝胶照片所示,21号染色体上SNP显示不成比例的两种核苷酸。对凝胶的目视检查表明用于21号染色体分析的SNP位点的两个核苷酸之一强度较大,说明其不是以50∶50存在。然而,对凝胶的目视检查表明13号染色体上所分析的杂合SNP位点处核苷酸以期望的50∶50比率存在。
图13.使用一种荧光标记的核苷酸确定SNP TSC0837969、TSC0034767、TSC1130902、TSC0597888、TSC0195492、TSC0607185的两个等位基因的序列。在存在未标记的dATP、dCTP、dTTP时用标记的ddGTP填充通过BsmF I消化产生的突出端。链上可变位点前面所填充的核苷酸不是鸟嘌呤,链上可变位点后面所填充的核苷酸不是鸟嘌呤。在链的可变位点两个碱基后面所填充的核苷酸是鸟嘌呤。在可变位点含有鸟嘌呤的等位基因被标记的ddGTP填充。不含有鸟嘌呤的等位基因被未标记的dATP、dCTP或dTTP填充,并且聚合酶继续掺入核苷酸直到标记的ddGTP在与突出端互补的位置3处填充。
图14.具有在人群中易变的等位基因的SNP的鉴定。使用包含得自245个个体的DNA作为模板DNA确定位于13号染色体上7个SNP的两个等位基因的序列。在存在未标记的dATP、dCTP、dTTP时用标记的ddGTP填平通过BsmF I消化产生的突出端。链上可变位点前面所填充的核苷酸不是鸟嘌呤,链上可变位点后面所填充的核苷酸不是鸟嘌呤。在链的可变位点两个碱基后面所填充的核苷酸是鸟嘌呤。在可变位点含有鸟嘌呤的等位基因用标记的ddGTP填充。不含有鸟嘌呤的等位基因被未标记的dATP、dCTP或dTTP填充,并且聚合酶继续掺入核苷酸直到标记的ddGTP在与突出端互补的位置3处填充。
图15.杂合SNP上一个等位基因与其他等位基因的比率的确定。SNPTSC0607185观察的核苷酸为有义链上的胞嘧啶(称为等位基因1)和胸腺嘧啶(称为等位基因2)。使用分离自5个个体的模板DNA计算等位基因2和等位基因1的比率。等位基因2与等位基因1的比率(等位基因2/等位基因1)始终为1∶1。
SNP TSC1130902观察的核苷酸为有义链上的鸟嘌呤(称为等位基因1)和腺嘌呤(称为等位基因2)。使用分离自5个个体的模板DNA计算等位基因2和等位基因1的比率。等位基因2与等位基因1的比率(等位基因2/等位基因1)始终为75∶25。
图16.当在含有21号染色体额外拷贝的模板DNA上计算时,SNPTSC0108992处的等位基因2对等位基因1的百分数保持线性。用来自四个个体的模板DNA扩增SNP TSC0108992,并为每个PCR反应(标记为1至4)进行两次单独的填平反应(标记为A和B)。来自正常个体的模板DNA上等位基因2与等位基因1的理论百分数为0.47。在分离自含有唐氏综合征的个体的模板DNA上与理论预测的百分数0.50的偏差保持线性。
图17A.从具有正常遗传染色体组型的个体分离的模板DNA的位于21号染色体上的SNP的分析。使用此处描述的方法扩增SNP TSC0108992,并且用IIS性限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.50的平均值。
图17B.从具有三体性21遗传染色体组型的个体分离的模板DNA的位于21号染色体上的SNP的分析。使用此处描述的方法扩增SNPTSC0108992,并且用IIS型限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.30的平均值。
图17C.含有从具有三体性21的个体得到模板DNA与从具有正常遗传染色体组型的个体得到模板DNA的3∶1混合物(三体性21:正常)的位于21号染色体上的SNP分析。使用此处描述的方法扩增SNP TSC0108992,并且用IIS型限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.319的平均值。
图17D.含有从具有三体性21的个体得到的模板DNA与从具有正常遗传染色体组型个体得到模板DNA的1∶1混合物(三体性21:正常)的位于21号染色体上的SNP分析。使用此处描述的方法扩增SNP TSC0108992,并且用IIS型限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.352的平均值。
图17E.含有从具有三体性21的个体得到的模板DNA与从具有正常遗传染色体组型个体得到的模板DNA的1∶2.3混合物(三体性21:正常)的位于21号染色体上的SNP分析。使用此处描述的方法扩增SNP TSC0108992,并且用IIS型限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.382的平均值。
图17F.含有从具有三体性21的个体得到的模板DNA与从具有正常遗传染色体组型的个体得到的模板DNA的1∶4混合物(三体性21:正常)的位于21号染色体上的SNP分析。使用此处描述的方法扩增SNPTSC0108992,并且用IIS型限制性酶BsmF I消化后,使用标记的ddTTP,和未标记的dATP、dCTP和dGTP填平5’突出端。进行三次单独的PCR反应,并将每种PCR反应物分成两个样品。计算等位基因2与等位基因1的比率(等位基因2/(等位基因2+等位基因1)),得到0.397的平均值。
图18A.从模板DNA扩增的九(9)种SNP的琼脂糖凝胶分析。使用此处描述的方法从基因座DNA扩增九种SNP的每一种。泳道1相应于SNPTSC0397235,泳道2相应于TSC0470003,泳道3相应于TSC1649726,泳道4相应于TSC1261039,泳道5相应于TSC0310507,泳道6相应于TSC1650432,泳道7相应于TSC1335008,泳道8相应于TSC0128307,泳道9相应于TSC0259757。
图18B.使用与13号染色体上各种区域退火的12碱基引物扩增最初的模板DNA。使用一百个不同的引物组扩增贯穿13号染色体的区域。对于9种SNP的每一种,使用从离目标基因座约130个碱基和目标基因座下游130个碱基退火的引物。该扩增反应(其含有总共100个不同引物组)被用于扩增含有目标基因座的区域。所得PCR产物用于随后的PCR反应中,其中使用第一引物和第二引物单独扩增9种SNP中的每一种,其中第二引物含有IIs型限制酶BsmF I的结合位点。各SNP以与图18A相同的顺序加样。
图19A.对原始模板DNA(IA)和多重模板DNA(M1-M3)上的SNPTSC047003进行等位基因2对等位基因1的百分数定量,其中DNA首先用从目标基因座上游和下游150个碱基处退火的12碱基引物扩增。然后,使用第一和第二引物,在多重模板DNA上进行三次分开的PCR反应。
图19B.对原始模板DNA(IA)和多重模板DNA(M1-M3)上的SNPTSC1261039进行等位基因2对等位基因1的百分数定量,其中DNA首先用从目标基因座上游和下游150个碱基处退火的12碱基引物扩增。然后,使用第一和第二引物,在多重模板DNA上进行三次分开的PCR反应。
图19C.对原始模板DNA(IA)和多重模板DNA(M1-M3)上的SNPTSC310507进行等位基因2对等位基因1的百分数定量,其中DNA首先用从目标基因座上游和下游150个碱基处退火的12碱基引物扩增。然后,使用第一和第二引物,在多重模板DNA上进行三次分开的PCR反应。
图19D.对原始模板DNA(IA)和多重模板DNA(M1-M3)上的SNPTSC1335008进行等位基因2对等位基因1的百分数定量,其中DNA首先用从目标基因座上游和下游150个碱基处退火的12碱基引物扩增。然后,使用第一和第二引物,在多重模板DNA上进行三次分开的PCR反应。
图20.分离自怀孕女性血浆DNA的胎儿DNA检测。分析血浆DNA的四种SNP(其中母亲DNA为纯合的)。母亲DNA对TSC0838335的腺嘌呤是纯合的(泳道1),而血浆DNA显示出杂合模式(泳道2)。鸟嘌呤等位基因代表胎儿DNA,其清楚与母亲信号相区别。母亲DNA和血浆DNA在TSC0418134对腺嘌呤都是纯合的(泳道3和4)。母亲DNA在TSC0129188对鸟嘌呤是纯合的,而血浆DNA显示杂合模式(泳道6)。腺嘌呤等位基因代表胎儿DNA。母亲DNA和血浆DNA在TSC0501389对腺嘌呤都是纯合的(泳道7和8)。
发明详述
本发明提供了检测遗传疾病的方法,这些遗传疾病包括但不限于突变、插入、缺失和染色体异常,并且该方法特别用于检测胎儿的遗传疾病。该方法特别用于检测易位、加入、扩增、转换、颠换、非整倍性、多倍性、单体性、三体性、三体性21、三体性13、三体性14、三体性15、三体性16、三体性18、三体性22、三倍性、四倍性和性染色体异常,包括XO、XXY、XYY和XXX。该方法还提供了确定胎儿DNA序列的非侵入性技术。
本发明涉及检测染色体异常的方法,该方法包括:(a)确定模板DNA上目标基因座的等位基因的序列;和(b)定量从(a)的目标基因座鉴定的目标杂合基因座处等位基因的比率,其中所述比率指出了存在和不存在染色体异常。
在另一个实施方案中,本发明提供了确定胎儿DNA上目标基因座序列的非侵入性方法,所述方法包括:(a)从怀孕女性得到样品;(b)将细胞裂解抑制剂加入(a)的样品中;(c)从(b)的样品得到模板DNA,其中所述模板DNA含有胎儿DNA和母亲DNA;和(d)确定模板DNA上目标基因座的序列。
DNA模板
“目标基因座”指位于核酸的较大区域内核酸的选择区域。目标基因座可包括但不限于1-100、1-50、1-20或1-10个核苷酸,优选1-6、1-5、1-4、1-3、1-2或1个核苷酸。
如此处所用的,“等位基因”为位于染色体同一位置上的基因或DNA非编码区的几种备选形式中的一种。术语“等位基因”可用于描述来自任何生物体的DNA,这些生物体包括但不限于细菌、病毒、真菌、原生动物、霉、酵母、植物、人类、非人类、动物和古细菌。
例如,细菌通常具有一条大的DNA链。关于细菌DNA,术语“等位基因”指在一个细胞发现的基因形式与同一物种不同细菌细胞中相同基因的形式相比较。
等位基因可以有相同的序列或者单个核苷酸或一个以上的核苷酸改变。对于每条染色体有两份拷贝的生物体,如果两条染色体具有相同等位基因,该情况称为纯合的。如果两条染色体上等位基因不同,该情况称为杂合的。例如,如果目标基因座为1号染色体上的SNP X,其中母亲染色体在SNP X含有一个腺嘌呤(A等位基因)而父亲染色体在SNP X含有一个鸟嘌呤(G等位基因),那么该个体在SNP X为杂合的。
如此处所用的,测序指鉴定多核苷酸中一个核苷酸和一个以上相邻的核苷酸。对于单核苷酸例如SNP,“测序”和“鉴定”在此处可互换使用。
术语“染色体异常”指受试者染色体结构和正常同源染色体间的偏离。术语“正常”指在特定物种的健康个体中发现的主要染色体组型和带型。染色体异常可以是数量上的和结构上的,包括但不限于非整倍性、多倍性、倒位、三体性、单体性、重复、缺失、部分染色体的缺失、加入、部分染色体的加入、插入、染色体片段、染色体区域、染色体重排和易位。染色体异常可与病理疾病的存在相关或与发生病理疾病的倾向相关。如此处所定义的,单核苷酸多态性(“SNP”)不是染色体异常。
如此处所用的,对于个体,“突变等位基因”指与疾病状态相关的可变等位基因。
术语“模板”指可用于本发明中扩增的任何核酸分子。可使天然不是双链的RNA或DNA成为双链DNA以用作模板DNA。任何双链DNA或含有许多不同双链DNA分子的制备物可用作模板DNA以扩增模板DNA中所含的一个或多个目标基因座。
模板DNA可得自任何来源,这些来源包括但不限于人类、非人类、哺乳动物、爬行动物、牛、猫、狗、山羊、猪、生猪、猴子、猿、大猩猩、公牛、母牛、熊、马、绵羊、家禽、小鼠、大鼠、鱼、海豚、鲸和鲨鱼。
模板DNA可使用本领域中成熟的方案从任何适宜样品得到,这些样品包括但不限于组织的含核酸样品、体液(例如,血、血清、血浆、唾液、尿、泪、腹膜液、腹水液、阴道分泌物、淋巴液、脑脊液或粘膜分泌物)、脐带血、绒毛膜绒毛、胚胎、胚胎、两细胞胚胎、四细胞胚胎、八细胞胚胎、16细胞胚胎、32细胞胚胎、64细胞胚胎、128细胞胚胎、256细胞胚胎、512细胞胚胎、1024细胞胚胎、胚胎组织、淋巴液、脑脊液、粘膜分泌物,或其他身体渗出液、粪便、含有相同核酸的这些来源的单个细胞或提取物和亚细胞结构如线粒体。
在一个实施方案中,模板DNA可从怀孕女性的样品得到。
在另一个实施方案中,模板DNA可从胚胎得到。在一个优选的实施方案中,模板DNA可从胚胎的单个细胞得到。
在一个实施方案中,模板DNA为胎儿DNA。胎儿DNA可从包括但不限于母亲血液、母亲血清、母亲血浆、胎儿细胞、脐带血、绒毛膜绒毛、羊膜液、细胞或组织的来源得到。
在另一个实施方案中,将细胞裂解抑制剂加到样品中,细胞裂解抑制剂包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、伯胺反应交联剂、巯基反应交联剂、巯基加成或二硫化物还原、烃反应交联剂、羧基反应交联剂、光反应交联剂、可切割交联剂、AEDP、APG、BASED、BM(PEO)3、BM(PEO)4、BMB、BMDB、BMH、BMOE、BS3、BSOCOES、DFDNB、DMA、DMP、DMS、DPDPB、DSG、DSP、DSS、DST、DTBP、DTME、DTSSP、EGS、HBVS、硫代-BSOCOES、硫代-DST或硫代-EGS。在另一个实施方案中,可将两种、三种、四种或五种以上细胞裂解抑制剂加入样品。
在另一个实施方案中,模板DNA含有母亲DNA和胎儿DNA。在一个优选的实施方案中,模板DNA从怀孕女性的血液得到。使用用于抽血的任何标准技术(包括但不限于静脉穿刺)收集血液。例如,可从肘内或手背的静脉抽血。可从怀孕女性在胎儿妊娠的任何时候收集血样。例如,可在胎儿妊娠的1-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40或40-44周,优选妊娠8-28周从人类女性收集血样。
离心血样以将血浆与母亲细胞分开。将血浆和母亲细胞级分转移到单独的管并再次离心。血浆级分含有无细胞的胎儿DNA和母亲DNA。可使用任何标准的DNA分离技术分离胎儿DNA和母亲DNA,这些技术包括但不限于QIAGEN提供的QIAamp DNA Blood Midi试剂盒(目录号51183)。
在一个优选的实施方案中,可将血液收集到含有镁螯合剂(包括但不限于EDTA)的仪器中并在4℃保存。任选地,可加入钙螯合剂(包括但不限于EGTA)。
在另一个实施方案中,将细胞裂解抑制剂加入母亲血样中,这些细胞抑制剂包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、伯胺反应交联剂、巯基反应交联剂、巯基加成或二硫化物还原、烃反应交联剂、羧基反应交联剂、光反应交联剂、可切割交联剂、AEDP、APG、BASED、BM(PEO)3、BM(PEO)4、BMB、BMDB、BMH、BMOE、BS3、BSOCOES、DFDNB、DMA、DMP、DMS、DPDPB、DSG、DSP、DSS、DST、DTBP、DTME、DTSSP、EGS、HBVS、硫代-BSOCOES、硫代-DST或硫代-EGS。
在另一个实施方案中,从怀孕女性血液的血浆或血清得到模板DNA。母亲血浆中胎儿DNA的百分数为0.39-11.9%(Pertl和Bianchi,Obsteíricsand Gynecology 98:483-490(2001))。血浆样品中的DNA大部分是母亲的,这使得使用该DNA难于鉴定胎儿的基因型。然而,增加母亲血浆中胎儿DNA的百分数使得可以确定胎儿DNA的序列,并可以检测遗传疾病,包括突变、插入、缺失和染色体异常。向母亲血样中加入细胞裂解抑制剂可增加胎儿DNA的相对百分数。尽管母亲和胎儿细胞的裂解都受到抑制,但是大多数细胞都是母亲的,从而,通过减少母亲细胞的裂解,可相对增加游离胎儿DNA的百分数。见实施例4。
在另一个实施方案中,可使用任何减少细胞裂解量的抽血技术、方法、方案或设备,包括但不限于大boar针、较短长度的针、增加层流的针涂层,例如,特氟隆,增加层流的针的斜面的修改,或减少血流速率的技术。胎儿细胞可能在母亲血样中被母亲的免疫系统破坏。然而,由于抽血可能发生大部分母亲细胞裂解。从而,防止或减少细胞裂解的方法将减少样品中母亲DNA的量,并增加有利胎儿DNA的相对百分数。
在另一个实施方案中,可使用保持细胞结构完整性的试剂减少细胞裂解的量。
在另一个实施方案中,可向血样中加入防止破坏DNA的试剂,包括但不限于DNA酶抑制剂、氯化锌、乙二胺四乙酸、盐酸胍、异硫氰酸胍、N-十二烷基肌氨酸和十二烷基硫酸钠。
在另一个实施方案中,从胎儿细胞得到DNA,其中所述胎儿细胞可从包括但不限于母亲血、脐带血、绒毛膜绒毛、羊膜液、胚胎组织和从母亲的子宫颈或阴道得到的粘液的来源分离。
在一个优选的实施方案中,胎儿细胞分离自母亲外周血。胎儿细胞特异抗体可用于从母亲血清纯化胎儿细胞(Mueller等,Lancet 336:197-200(1990);Ganshirt-Ahlert等,Am.J.Obstet.Gynecol.166:1350-1355(1992))。流式细胞计数技术也可用于富集胎儿细胞(Herzenberg等,PNAS 76:1453-1455(1979);Bianchi等,PNAS87:3279-3283(1990);Bruch等,Prenatal Diagnosis 11:787-798(1991))。美国专利号5,432,054还描述了使用聚乙烯制成的宽顶窄毛细底部的管分离胎儿成核血红细胞的技术。使用变速程序离心导致血红细胞根据分子的密度在毛细管中堆积。回收含有低密度血红蛋白(包括胎儿血红细胞)的密度级分,然后差速匀浆以优选破坏母亲血红细胞。使用高渗培养基中的密度梯度分离血红细胞,现在从淋巴细胞和破裂的母亲细胞富集胎儿血红细胞。高渗溶液的使用使血红细胞缩小,这增加了它们的密度,并方便了从密度更大的淋巴细胞的纯化。胎儿细胞被分离后,可使用本领域标准技术纯化胎儿DNA。
所要分析的核酸可以是任何核酸,例如,基因组、质粒、粘粒、酵母人工染色体、人工或人造DNA,包括独特DNA序列,和从RNA样品反转录的DNA,如cDNA。如果能够使RNA成为用作模板DNA的双链DNA,那么可根据本发明确定RNA的序列。
术语“引物”和“寡核苷酸引物”当用于讨论与模板退火时是可互换的,并且可用于引发模板拷贝的合成。
“扩增的”DNA为例如通过聚合酶链式反应“拷贝”一次或多次的DNA。当可得到大量用于分析的DNA,使得目标基因座的足够数目的拷贝已经存在于所要分析的样品中时,可不必要将目标基因座“扩增”为更大数目的复制拷贝。相反地,使用一组适宜的引物(其可含有允许限制酶识别位点被双链化的发夹结构)简单地“拷贝”模板DNA一次就足够了。
“拷贝的DNA”中的“拷贝”指被拷贝一次的DNA,或者被扩增为一个以上拷贝的DNA。
在一个实施方案中,直接在含有核酸源的最初样品中扩增核酸。不必需提取、纯化或分离核酸,仅需要核酸以能够被扩增的形式提供。不需要在扩增前用引物杂交核酸模板。例如,可使用本领域中熟知的标准方案在细胞或样品裂解物中进行扩增。在固体支持物上的、在被固定生物制剂中的或者含有非DNA物质的组合物中的并且可以不用先从固体支持物或固定制剂或组合物中的非DNA物质提取而进行扩增的DNA可直接使用,不用进一步纯化,只要DNA可与合适的引物退火,并被拷贝,特别是扩增,并且拷贝或扩增的产物能够被回收和如此处所描述的利用。
在一个优选的实施方案中,扩增前使用本领域公知的方法从最初样品中的非核酸物质提取、纯化或分离核酸。
在另一个实施方案中,从含有核酸源的最初样品提取、纯化或分离核酸并且扩增前,使用本领域公知的任何数目的方法将核酸片段化,这些方法包括但不限于酶消化、手动剪切和超声处理。例如,可用一种或多种限制酶消化DNA,这些限制酶具有一个识别位点,特别是8碱基或6碱基对识别位点,这些识别位点不在目标基因座内。一般,可使DNA断裂成任何长度的片段,包括长为50、100、250、500、1,000、5,000、10,000、50,000和100,000个碱基对。在另一个实施方案中,将DNA片段化成为平均长度约1000到2000个碱基对的片段。然而,DNA片段化不是必须的。
扩增前可从片段化的DNA纯化含有目标基因座的DNA片段。这些片段可通过使用引物纯化,基于这些引物能够与目标基因座退火,这些引物将在扩增(见下面的“引物设计”部分)中用作钩子(hook)以得到目标基因座。在一个优选的实施方案中,使用标签修饰的引物,例如生物素化的引物。
通过纯化含有目标基因座的DNA片段,可以提高扩增反应的特异性。使模板DNA的非特异区扩增最小化。DNA片段的纯化也允许多重PCR(聚合酶链式反应)或具有特异性提高的多个目标基因座的扩增。
可只根据序列选择将要测序的目标基因座。在人类中,已经描述了超过142万个单核苷酸多态性(SNPs)(Nature 409:928-933(2001);The SNPConsortium LTD)。人类基因组平均每1.9kb有一个SNP。然而,当选择将要根据本发明测序的目标基因座时,不必考虑目标基因座之间的距离。如果分析基因组DNA一个以上的目标基因座,所选择的基因座可在相同的染色体上或不同的染色体上。
在一个优选的实施方案中,所选的目标基因座可群集到染色体上的特定区域。在DNA的某个区域可存在多个目标基因座,从而即使DNA有任何断裂或片段化,多个目标基因座仍为连锁的。例如,如果得到DNA并通过自然力断裂成5Kb的片段,那么可在5Kb区内选择多个目标基因座。这使得每个片段(通过该片段内的目标基因座测量)作为一个实验单元,并且将降低与多条染色体上目标基因座相比的任何可能的实验噪音。
染色体上的目标基因座可以相互间为任何距离,包括但不限于10-50、50-100、100-150、150-200、200-250、250-500、500-750、750-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000、4000-4500、4500-5000、5000-10,000和大于10,000碱基对。
在一个优选的实施方案中,所扩增序列的长度优选对每个目标基因座不同从而可通过大小分离目标基因座。
实际上,本发明的一个优势在于不必使用拷贝全部基因序列的引物。相反,拷贝的目标基因座优选仅仅为完整基因的一小部分或者DNA的非编码区的一小部分。测序完整基因是不利的,因为这可增加成本和延迟结果。测序仅仅想要的碱基或目标基因座可最大化本发明的总效率,因为这使得可以在最快的时间内以最小的成本确定最大数目的目标基因座的序列。
因为可同时分析大量的序列,本发明的方法尤其适于许多目的基因的大规模筛选。
使用本发明方法,可分析和处理(特别是在相同时间)任何数目的目标基因座。可分析样品以同时确定一个目标基因座或多个目标基因座处的序列。目标基因座可存在于单条染色体或多条染色体上。
备选地,当需要全局遗传筛选时,可同时分析2、3、4、5、6、7、8、9、10-20、20-25、25-30、30-35、35-40、40-45、45-50、50-100、100-250、250-500、500-1,000、1,000-2,000、2,000-3,000、3,000-5,000、5,000-10,000、10,000-50,000或50,000个以上目标基因座。当使用本发明方法以提供遗传指纹来鉴定个体或者用于SNP表型时可能需要这种全局遗传筛选。
将要拷贝的目标基因座可位于编码序列内或编码序列外。优选地,将要拷贝的一个或多个目标基因座位于基因内。在一个优选的实施方案中,拷贝的模板DNA为基因组编码序列内的一个或多个目标基因座,为内含子或外显子。在一个高度优选的实施方案中,拷贝外显子DNA序列。目标基因座可以是其中已知突变导致疾病或倾向于疾病状态的位点。目标基因座可以是单核苷酸多态性的位点。备选地,将要拷贝的目标基因座可在编码序列的外面,例如,在转录调节区,特别是启动子、增强子或抑制子序列中。
确定目标基因座序列的方法
可使用提供核酸序列信息的任何方法,该方法包括但不限于等位基因特异的PCR、PCR、质谱、MALDI-TOF质谱杂交、引物延伸、荧光检测、荧光共振能量转移(FRET)、荧光偏振、DNA测序、Sanger双脱氧测序、DNA测序凝胶、自动DNA测序仪上的毛细管电泳、微通道电泳、微阵列、southern印迹、狭线印迹、斑点印迹和单个引物线性核酸扩增,如在美国专利号6,251,639中所描述的。
优选的确定序列的方法以前已经在2002年3月11日提交的美国申请号10/093,618中描述,此处将其完整引入作为参考。
I.引物设计
公开的序列(包括共有序列)可用于设计或选择用于模板DNA扩增的引物。用于构建位于目标基因座侧翼的引物序列的选择可通过检查目标基因座的序列或与该目标基因座紧挨的序列进行。最近公开的人类基因组序列提供了有用的共有序列信息来源,可根据该信息设计位于人目标基因座侧翼的引物。
位于目标基因座“侧翼”指这样的引物序列,即一条引物的3’区的至少一部分与模板DNA的反义链互补并来自目标基因座位点(正向引物),并且另一条引物的3’区的至少一部分与模板DNA的有义链互补并在目标基因座的下游(反向引物)。“引物对”指一对正向和反向引物。引物对的两个引物以允许引物延伸的方式退火,从而,延伸导致扩增目标基因座内的模板DNA。
可通过多种方法制备引物,这些方法包括但不限于使用本领域熟知的方法克隆适宜序列并指导化学合成((Narang等,Methods Enzymol.68:90(1979);Brown等,Methods Enzymol.68:109(1979))。也可从商业来源如Operon Technologies、Amersham Pharmacia Biotech、Sigma、和LifeTechnologies得到引物。引物可具有相同的解链温度。可在5’端或3’端延长或缩短引物的长度以产生具有想要的解链温度的引物。在一个优选的实施方案中,引物对的一个引物比另一个长。在一个优选的实施方案中,引物对内两条引物的3’退火长度不同。可以设计每一引物的退火位置使得引物的序列和长度产生期望的解链温度。确定小于25碱基对的引物的解链温度的最简单等式是Wallace法则(Td=2(A+T)+4(G+C))。可使用计算机程序设计引物,这些程序包括但不限于Array Designer Software(ArrayicInc.)、用于基因分析的寡核苷酸探针序列设计软件(Oligonucleotide ProbeSequence Design Software for Genetic Analysis)(Olympus Optical Co.)、NetPrimer和Hitachi Software Engineering的DNAsis。使用软件程序如Net Primer(免费的基于网络的程序在http://premierbiosoft.com/netprimer/netprlaunch/netprlaunch.html;为 2002年4月17日的因特网地址)计算每一引物的TM(解链或退火温度)。
在另一个实施方案中,引物的退火温度可重新计算并在任意轮扩增后增加,任意轮包括但不限于1、2、3、4、5轮、6-10轮、10-15轮、15-20轮、20-25轮、25-30轮、30-35轮或35-40轮。扩增的最初几轮后,引物的5’半部分被掺入每一目标基因座的产物中,从而可基于每一引物的5’半部分和3’半部分的序列重新计算TM。
例如,在图1B中,首轮扩增约在第二引物的3’区(区“c”)(13个碱基)(其与模板DNA退火)的解链温度进行。第一轮后,可将退火温度升高到TM2,其约是第一引物3’区(其与模板DNA退火,被描述为区“b”)的解链温度。第二引物不能结合最初模板DNA,因为其仅仅与最初DNA模板中的13个碱基退火,TM2约为约20个碱基的解链温度,这20个碱基是第一引物的3’退火区(图1C)。然而,第一引物可结合在反应的第一轮中拷贝的DNA。在第三轮,退火温度上升到TM3,该温度约是第二引物(其被描述为区“c”和“d”)完整序列的解链温度。从PCR第二轮得到的DNA模板含有区c’和d’,因此,第二引物可在TM3退火和延伸(图1D)。在TM3进行剩下的轮。第一引物的完整序列(a+b’)可与来自PCR第三轮的模板退火,并延伸(图1E)。增加退火温度将减少非特异性结合并增加反应的特异性,当扩增来自人基因组DNA(长约3×109个碱基对)的目标基因座时这特别有用。
如此处所用的,关于退火温度的术语“约”用于包括所述温度10摄氏度以内的温度。
在一个实施方案中,每个目标基因座可用一个引物对。然而,每个目标基因座可使用多个引物对。
在一个实施方案中,设计引物使得引物对中的一个或两个引物在5’区含有一种或多种限制性内切核酸酶(限制酶)的识别序列。
如此处所用的,对于限制酶消化DNA的位置,“有义”链为以5’到3’方向阅读限制酶切割的链。例如,BsmF I识别下面的序列:
    5’GGGAC(N)10 3’       5’(N)14GT0003’
    3’CCCTG(N)14 5’       3’(N)10CAGGG 5’
有义链是从5’到3’方向阅读时含有限制酶切割的“GGGAC”序列的链。
如此处所用的,对于限制酶消化DNA的位置,“反义’链为从3’到5’阅读限制酶切割的链。
在另一个实施方案中,所设计引物对中的一个引物(此处称作“第二引物”)为其含有这样的限制酶识别位点,其中限制性酶从距离该识别位点“n”个核苷酸处进行切割,并产生3’凹端和含有目标基因座的5’突出端。“N”为识别位点与限制酶切割位点的距离。换句话说,引物对的第二引物含有这样的限制酶识别位点,其中限制性酶不在识别位点处切割而在距离该识别位点“n”个核苷酸处进行切割。例如,如果识别序列为限制酶BceA I的,该酶将从有义链上距离识别位点10个核苷酸处切割,并从反义链上距离识别位点12个核苷酸处切割。
设计引物的3’区,优选3’半部分以与目标基因座侧翼的序列退火(图1A)。第二引物可从目标基因座的任何距离退火,只要用识别该引物上限制酶识别位点的限制酶切割产生含有目标基因座的5’突出端。5’突出端可为任何大小,包括但不限于1、2、3、4、5、6、7、8和8个以上的碱基。
在一个优选的实施方案中,在目标基因座附近退火的引物(第二引物)的3’端可以在距离目标基因座1、2、3、4、5、6、7、8、9、10、11、12、13、14或多于14个碱基处退火或在目标基因座处退火。
在一个优选的实施方案中,设计第二引物以在比引物对另一引物(另一引物在此处称为“第一引物”)离目标基因座更近的位置处退火。第二引物可以是正向或反向引物并且第一引物可以是反向或正向引物。可通过哪种设计将提供更好的测序结果来确定是否第一或第二引物是正向或反向引物。
例如,在离目标基因座更近的位置退火的引物可含有限制酶BsmF I的识别位点,BsmF I从有义链上距离识别位点10个核苷酸处切割,并从反义链上距离识别位点14个核苷酸处切割。在该情况下,可设计引物使得限制酶识别位点距离目标基因座13个碱基、12个碱基、10个碱基或11个碱基。如果识别位点距离目标基因座13个碱基,用BsmF I消化将产生5’突出端(RXXX),其中目标基因座(R)为突出端中第一个核苷酸(从3’到5’阅读),X为任意核苷酸。如果识别位点离目标基因座12个碱基,用BsmFI消化将产生5’突出端(XRXX),其中目标基因座(R)为突出端中第二个核苷酸(从3’到5’阅读)。设计限制酶识别位点和目标基因座之间的距离使得用限制酶消化产生含有目标基因座的5’突出端。识别位点和目标基因座之间的有效距离根据所选限制酶的不同而变。
在另一个实施方案中,可设计离目标基因座更近处退火的引物(相对于另一引物)使得产生含有目标基因座的5’突出端的限制酶将在切割位点见到相同序列,而与目标基因座位点处的核苷酸无关。例如,如果设计离目标基因座更近处退火的引物使得限制酶BsmF I(5’GGGAC3’)识别位点离目标基因座13个碱基,那么限制酶将从距离目标基因座1个碱基处切割反义链。目标基因座的核苷酸与切割位点相邻,并且可根据不同DNA分子而变。如果想要与切割位点相邻的核苷酸相同,可设计引物使得BsmF I的限制酶识别位点距离目标基因座位点12个碱基。用BsmF I消化将产生5’突出端,其中目标基因座位点在该突出端的第二个位置(从3’到5’阅读)并不再与切割位点相邻。设计引物使得限制酶识别位点离目标基因座12个碱基使得与切割位点相邻的核苷酸相同,不依赖目标基因座处的核苷酸。同样,设计引物使得限制酶BsmF I识别位点离目标基因座11个或10个碱基使得与切割位点相邻的核苷酸相同,不依赖目标基因座处的核苷酸。对其他限制酶可使用类似的策略使得与切割位点相邻的核苷酸相同,不依赖目标基因座处的核苷酸。
可设计第一引物(正向或反向引物)的3’端以在离目标基因座选定的距离处退火。优选地,该距离为离目标基因座10-25、25-50、50-75、75-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450、450-500、500-550、550-600、600-650、650-700。700-750、750-800、800-850、850-900、900-950、950-1000和大于1000个碱基。选择第一引物的退火位点使得每个连续的上游引物距离其各自的下游引物更远。
例如,如果在目标基因座1处,第一和第二引物的3’末端相距Z个碱基,则在目标基因座2处,上游和下游引物的3’末端相距Z+K个碱基,其中K=1、2、3、4、5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000,或者大于1000个碱基(图2)。制备离它们各自的第二引物较远和更远的第一引物的目的是使得所有目标基因座的PCR产物的大小有别并可以在例如测序凝胶上分开。这使得可以在后续步骤中通过合并PCR产物进行多重反应(multiplexing)。
在一个实施方案中,第一或第二引物的5’区可以具有任何类型限制酶的识别位点。在一个优选的实施方案中,第一和/或第二引物的5’区具有至少一个与用于产生含有目标基因座的5’突出端的限制酶识别位点不同的限制酶识别位点。
在一个实施方案中,第一引物的5’区可以具有任何类型限制酶的识别位点。在一个优选的实施方案中,第一引物具有至少一个与第二引物中的限制酶识别位点不同的限制酶识别位点。在另一个优选的实施方案中,第一引物在较第二引物离目标基因座更远处退火。
在一个优选的实施方案中,第二引物含有IIS型限制酶的限制酶识别序列,所述限制酶包括但不限于BceA I和BsmF I,其分别产生二碱基5’突出端和四碱基5’突出端。优选IIS型限制酶,因为它们识别不对称碱基序列(不是像正统II型酶的回文序列)。IIS型限制酶在识别位点之外,通常在识别位点外多达20个碱基对处的特定位置切割DNA。这些性质使得IIS型限制酶以及其识别位点尤其可用于本发明的方法中。优选地,本发明中使用的IIS型限制酶产生了5’突出端和3’凹端。
许多IIS型限制酶是公知的并且这些酶可从细菌、噬菌体、古细菌和真核藻类的病毒中分离并且可通过商业途径得到(Promega,MadisonWI;New England Biolabs,Beverly,MA;Szybalski W.等,Gene 100:13-26,1991)。可以用于本发明的方法中的IIS型限制酶的实例包括,但不限于如表1中所列的那些酶。
酶源 识别/切割位点 供应商
Alw I-鲁氏不动杆菌(Acinetobactor lwoffii) GGATC(4/5) NE Biolabs
Alw26 I-鲁氏不动杆菌 GTCTC(1/5) Promega
Bbs I-侧孢芽孢杆菌(Bacillus laterosporus) GAAGAC(2/6) NE Biolabs
Bbv I-短芽孢杆菌(Bacillus brevis) GCAGC(8/12) NE Biolabs
BceA I-蜡状芽孢杆菌(Bacillus cereus)1315 IACGGC(12/14) NE Biolabs
Bmr I-巨大芽孢杆菌(Bacillus megaterium) CTGGG(5/4) NE Biolabs
Bsa I-嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)6-55 GGTCTC(1/5) NE Biolabs
Bst71 I-嗜热脂肪芽孢杆菌71 GCAGC(8/12) Promega
BsmA I-嗜热脂肪芽孢杆菌A664 GTCTC(1/5) NE Biolabs
BsmB I-嗜热脂肪芽孢杆菌B61 CGTCTC(1/5) NE Biolabs
BsmF I-嗜热脂肪芽孢杆菌F GGGAC(10/14) NE Biolabs
BspM I-芽孢杆菌M种 ACCTGC(4/8) NE Biolabs
Ear I-产气肠杆菌(Enterobacter aerogenes) CTCTTC(1/4) NE Biolabs
Fau I-水生黄杆菌(Flavobacterium aquatile) CCCGC(4/6) NE Biolabs
Fok I-海床黄杆菌(Flavobacterium okeonokoites) GGATG(9/13) NE Biolabs
Hga I-鸡嗜血菌(Haemophilus gallinarum) GACGC(5/10) NE Biolabs
Ple I-勒氏假单胞菌(Pseudomonas lemoignei) GAGTC(4/5) NE Biolabs
Sap I-糖多孢菌属的种(Saccharopolyspora species) GCTCTTC(1/4) NE Biolabs
SfaN I-粪链球菌(Streptococcus faecalis)ND547 GCATC(5/9) NE Biolabs
Sthl32 I-嗜热链球菌(Streptococcus thermophilus)ST132 CCCG(4/8) 无商业供应商(Gene195:201-2061997)
在一个实施方案中,引物对在每个引物的5’区具有提供使限制酶独特的限制酶识别位点的序列。
在另一个实施方案中,引物对在每个引物的5’区具有提供被一种以上的限制酶,特别是一种以上的IIS型限制酶识别的限制性位点。例如,一些共有序列可以被一种以上的酶识别。例如,BsgI、Eco571和BpmI都识别共有序列(G/C)TGnAG并且在反义链上距离其16nt处和有义链上距离其14nt处切割。提供这种共有序列的引物将导致具有可以被限制酶BsgI、Eco571和BpmI的任一种识别的位点的产物。
从识别位点的远处切割并产生3’凹端和5’突出端的其他限制酶包括III型限制酶。
例如,限制酶EcoP15I识别序列5’CAGCAG3’并在有义链下游距离25个碱基处切割,在反义链距离27个碱基处切割。本领域技术人员将进一步理解新的限制酶不断被发现并且可容易地被采用于本发明。
在另一个实施方案中,第二引物含有限制酶的识别序列的一部分,其中限制酶的完整识别位点通过模板DNA的扩增产生从而用该限制酶的消化产生含有目标基因座的5’突出端。例如,BsmFI的识别位点为5’GGGACN10 3’。第二引物的3’区(其可与模板DNA退火)可以以核苷酸“GGG”结束,核苷酸“GGG”不必与模板DNA互补。如果3’端退火区为约10-20个碱基,甚至如果最后三个碱基不退火,引物将仍然延伸并产生一个BsmFI位点。
     第二引物:5’GGAAATTCCATGATGCGTGGG→
     模板DNA 3’CCTTTAAGGTACTACGCAN1N2N3TG 5’
             5’GGAAATTCCATGATGCCTN1′N2′N3′AC 3’
可以设计第二引物与模板DNA退火,其中模板DNA的下两个碱基为胸腺嘧啶和鸟嘌呤,从而腺嘌呤和胞嘧啶被掺入引物形成BsmF I的识别位点,5’GGGACN10 3’。可以设计第二引物以下面的方式退火:用BsmF I消化产生含有目标基因座的5’突出端。
在另一个实施方案中,第二引物可以含有限制酶的完整或全部识别位点或者识别位点的一部分,其在引物依赖的模板DNA复制时产生全部识别位点,从而用在该识别位点切割的限制酶消化产生含有目标基因座的5’突出端。例如,限制酶BsaJ I结合下面的识别位点:5’CCN1N2GG3’。可以设计第二引物使得与引物的模板DNA的3’区以“CC”结束,目标SNP通过“N1”代表,SNP下游的模板序列为“N2GG”。
    第二引物:5’GGAAATTCCATGATGCGTACC→
    模板DNA 3’CCTTTAAGGTACTACGCATGGNN2 CC 5’
            5’GGAAATTCCATGATGCCTACCN1′N2′GG 3’
用BsaJ I消化后,将产生下面序列的5’突出端:
                      5’C           3’
                      3’GGN1N2CC 5’
如果核苷酸鸟嘌呤没有在目标基因座报道,那么3’凹端可用未标记的胞嘧啶填平,胞嘧啶与突出端的第一个核苷酸互补。除去过多的胞嘧啶后,可使用标记的ddNTP填充下一个核苷酸N1,其代表目标基因座。可用的其他限制酶包括但不限于
        BssK I(5’CCNGG 3’(SEQ ID NO:7)),Dde I(5’CTNAG 3’),EcoN I(5’
CCTNNNNNAGG 3’),Fnu4H I(5’GCNGC 3’),HinfI(5’GANTC 3’)PflF I(5’
GACNNNGTC 3’),Sau96 I(5’GGNCC 3’),ScrF I(5’CCNGG 3’),和Tth1 11 I(5’
GACNNNGTC 3’)。
第二引物的3’区(其与模板DNA退火)不必与模板DNA 100%互补。例如,第二引物的3’末端的最后1、2或3个核苷酸可不与模板DNA匹配。与模板DNA退火的引物的区域将靶向引物并允许引物延伸。即使最后两个核苷酸不与模板DNA互补,引物仍然将延伸并产生限制酶识别位点。例如,第二引物中的最后两个核苷酸为“CC”。第二引物与模板DNA退火,并允许延伸,即使“CC”不与模板DNA上的核苷酸Na和Nb互补。
    第二引物:5’GGAAATTCCATGATGCGTACC→
    模板DNA 3’CCITTAAGGTACTACGCATNa′Nb′N1′N2′CC 5’
            5’GGAAATTCCATGATGCCTANaNbN1N2 GG 3’
用BsaJ I消化后,将产生下面序列的5’突出端:
                      5’C           3’
                      3’GGN1N2CC 5’
如果在目标基因座没有报道鸟嘌呤,那么可以用未标记的胞嘧啶填充5’突出端。可以洗除过多的胞嘧啶,并用标记的ddNTP填充。掺入的第一个核苷酸(N1’)相应于目标基因座。如果在目标基因座报道有鸟嘌呤,那么目标基因座可以用未标记的胞嘧啶填充并且可以检测目标基因座下游的核苷酸。例如,假设N2为腺嘌呤。如果目标基因座是鸟嘌呤,那么未标记的胞嘧啶可以用于填充反应。除去胞嘧啶后,可以使用标记的胸腺嘧啶进行填充反应。只有目标基因座为鸟嘌呤时标记的胸腺嘧啶才会被掺入。从而,可以通过检测目标基因座下游的核苷酸确定目标基因座的序列。
在另一个实施方案中,第一和第二引物可以含有限制酶识别序列的一部分,其中限制酶的完整识别位点在模板DNA扩增时产生,从而该限制酶消化产生含有目标基因座的5’突出端。含有一个或多个可变核苷酸的任何限制酶的识别位点可以通过包括但不限于下面的限制酶产生:
                           BssK I(5’CCNGG 3’),Dde I(5’CTNAG 3’),Econ I
(5’CCTNN↓NNNAGG 3’(SEQ ID NO:7),Fnu4H I(5’GCNGC 3’),Hinf I(5’GANTC 3’),PflF I
(5’GACNNNGTC 3’),Sau96 I(5’GGNCC 3’),ScrF I(5’CCNGG 3’),and Tth1 11 I(5’
GACNNNGTC 3’)。
在一个优选的实施方案中,第一和第二引物的3’区含有限制酶的部分序列,其中该部分序列含有与模板DNA的1、2、3、4或多于4处错配;这些错配产生限制酶识别位点。在3’末端可以忍受的错配数取决于引物的长度。例如,如果目标基因座由N1代表,可以设计第一引物以与模板DNA互补,第一引物在下面被描述为区域“a”。第一引物的3’区以“CC”结束,其不与模板DNA互补。第二引物被设计成与模板DNA互补,其在下面被描述成区域“b’”。第二引物的3’区以“CC”结束,其不与模板DNA互补。
          第一引物  5’   a    CC→
          模板DNA   3’   a’        AAN1′N2′TT     b’  5’
                    5’   a    TTN1N2AA       b  3’
                                      ←CC       b’   5’第二引物
一轮扩增后将产生下面的产物:
                         5’   a     CCN1N2AA       b  3’
          和
                         5’   b     CCN2′N1′AA    a’    3’
在第二轮中,引物可与从第一轮PCR产生的模板退火:
               5’   a  CCN1N2AA      b  3’
                               ←CC     b’    5’
                               ←CC     a  5’
               5’   b’CCN2N1AA      a’   3’
PCR的第二轮后,将产生下面的产物:
               5’  a  CCN1N2GG      b  3’
               3’  a’GGN1N2CC      b’    5’
产生了BsaJ I的限制酶识别位点,用BsaJ I消化后,产生了含有目标基因座的5’突出端。目标基因座可如下面详述的进行检测。
在另一个实施方案中,引物对在每个引物的5’区具有一段序列,该序列提供了被两种或多种限制酶识别的两个或多个限制位点。
在最优选的实施方案中,引物对在5’区,特别时5’末端具有不同的限制酶识别位点,从而需要不同的限制酶切除任何不想要的序列。例如,目标基因座“A”的第一引物可含有被限制酶“X”识别的序列,“X”可以是任何类型的限制酶,并且目标基因座“A”的第二引物(其在目标基因座附近退火)可含有限制酶“Y”识别的序列,“Y”是IIS型限制酶,其在距离“n”个核苷酸处切割并产生5’突出端和3’凹端。5’突出端含有目标基因座。扩增的DNA结合链亲和素包被的孔后,可用酶“Y”消化,然后用标记的核苷酸填平并洗涤,然后用限制酶“X”消化,“X”将从固体基质释放含有目标基因座的DNA片段。可通过检测标记的核苷酸分析目标基因座,该标记的核苷酸“填充”在目标基因座,例如SNP位置。
在另一个实施方案中,根据本发明扩增的不同目标基因座的第二引物在同一限制酶的5’区含有识别序列,同样所有第一引物也含有相同限制酶识别位点,该限制酶是与识别第二引物的限制酶不同的限制酶。
在另一个实施方案中,根据本发明扩增的多个目标基因座的第二引物在5’区含有不同限制酶的识别序列。
在另一个实施方案中,根据本发明扩增的多个目标基因座的第一引物在5’区含有不同限制酶的识别序列。多个限制酶序列提供了影响合并的目标基因座从固体支持物释放的顺序的机会。例如,如果扩增50个目标基因座,第一引物可以在最5’末端具有有助于纯化的标签和限制酶识别位点,第二引物可以含有IIS型限制酶的识别位点。例如,第一引物中的几种可以具有EcoRI的限制酶识别位点,其他第一引物可以具有Pst I的识别位点,另外的第一引物可以具有BamH I的识别位点。扩增后,在第一引物上的标签的帮助下目标基因座可以结合到固体支持物。通过一次进行一种限制酶消化,可以顺序地释放扩增的目标基因座。如果第一次消化用EcoRI进行,将释放用含有EcoRI识别位点的第一引物扩增的目标基因座,并收集这些目标基因座,而其他目标基因座仍然结合在固体支持物上。通过一次用一种限制酶消化,扩增的目标基因座可以选择性地从固体基质释放。第一引物中不同限制酶识别位点的使用使得在单个反应管中扩增许多目标基因座。
在一个优选的实施方案中,每种引物的限制酶消化位点的5’区可以用为片段操作、加工、鉴定和/或纯化提供便利的功能基团修饰。这些功能基团的实例包括但不限于生物素、生物素衍生物、糖类、半抗原、染料、放射活性分子、抗体和抗体的片段、肽和免疫原性分子。
在另一个实施方案中,可以复制模板DNA一次,而不进行扩增一轮以上的复制。当可得到大量用于分析的DNA从而目标基因座的大量拷贝已经存在于样品中,并且不再需要其他拷贝时,这种复制模板DNA一次是有用的。在该实施方案中,引物优选地设计为在5’区含有一个“发夹”结构,从而序列加倍并以互补的方式与其内部的序列退火。当模板DNA被扩增仅仅一次时,含有识别位点的DNA序列如果不是由于“发夹”结构将是单链的。然而,在存在发夹结构时,该区被有效地双链化,从而提供了限制酶活性的双链底物。
只要反应条件相容,用以分析DNA的一个或多个目标基因座的所有引物对可以在本发明的方法中混合使用。在一个优选的实施方案中,所有引物对在单个反应容器中与模板DNA混合。这种反应容器可以是例如反应管或是微量滴定板的一个孔。
备选地,为了避免对核苷酸的竞争、最小化引物二聚体和引物退火温度的困难,可以在单独的反应管或孔中扩增目标基因座的小组或每个目标基因座,并且如果需要,产物可以在以后合并。例如,分开的反应物可以合并到单个反应容器中,之后用限制酶消化产生5’突出端(其含有目标基因座或SNP位点)和3’凹端。优选地,以等摩尔量提供每种引物对中的引物。同样特别优选地,以相对于使用的其他引物对等摩尔量提供不同引物对的每一种。
在另一个实施方案中,可以使用允许有效扩增它们各自目标基因座的引物对的组合(见图2)。在本发明方法中这种组合可以在使用前确定。可以使用多孔板和PCR仪选择相互有效工作的引物对。例如,可以使用梯度PCR仪,如Eppendorf Mastercycler_梯度PCR仪为每种碱基对选择最佳退火温度。在单个反应管中可以使用具有相似性质的引物对。
在另一个实施方案中,包括但不限于96孔或更多孔板的多样品容器可被用于扩增单个目标基因座,使用来自多个模板DNA样品的相同引物对和所述目标基因座的最佳PCR条件。备选地,分开的多样品容器可被用于扩增每种目标基因座并在以后合并每种模板DNA样品。例如,可以在微量滴定板1中扩增来自96种不同DNA样品的基因A,在微量滴定板2中扩增来自96种不同DNA样品的基因B,然后合并扩增产物。
扩增多个目标基因座的结果是产生了含有具有每个目标基因座序列的代表性PCR产物。例如,如果仅仅来自一个个体的DNA被用作模板DNA并且从该模板DNA扩增了几百种疾病相关目标基因座,扩增的DNA将是来自每种目标基因座的小量PCR产物的混合物。这种制备物将在那时被进一步分析以确定在每个目标基因座或者仅仅一些目标基因座的序列。此外,制备物可以以保存DNA的方式保存并可以在以后被分析。扩增的DNA中含有的信息可以通过适宜的方法揭示,这些方法包括但不限于荧光检测、测序、凝胶电泳和质谱(见下面的章节“掺入的核苷酸的检测”)。
II.目标基因座的扩增
可以使用本领域中公知的任何适宜的方法扩增模板DNA,这些方法包括但不限于PCR(聚合酶链式反应)、3SR(自动维持的序列反应)、LCR(连接酶链式反应)、RACE-PCR(cDNA末端的快速扩增)、PLCR(聚合酶链式反应和连接酶链式反应的组合)、Q-β噬菌体扩增(Shah等,J.MedicalMicro.33:1435-41(1995))、SDA(链置换扩增)、SOE-PCR(剪接重叠延伸PCR),等等。这些方法可以用于设计在本申请中清楚描述的可释放引物介导的循环扩增反应的可变方案。在最优选的实施方案中,使用PCR扩增模板DNA(PCR:A Practical Approach,M.J.McPherson等.,IRL Press(1991);PCR Protocols:A Guide to Methods and Applications,Innis等,Academic Press(1990);以及PCR Technology:Principalsand Applicationsof DNA Amplification,H.A.Erlich,Stockton Press(1989))。
PCR还在许多美国专利中被描述,这些专利文献包括美国专利号4,683,195、4,683,202、4,800,159、4,965,188、4,889,818、5,075,216、5,079,352、5,104,792、5,023,171、5,091,310和5,066,584。
典型的PCR反应的组分包括但不限于模板DNA、引物、反应缓冲液(依赖于聚合酶的选择)、dNTPs(dATP、dTTP、dGTP和dCTP)和DNA聚合酶。可以如上讨论的设计和制备适宜的PCR引物(见上面章节“引物设计”)。简言之,将反应物加热到95℃2分钟以分离模板DNA链,冷却反应物到合适的温度(通过计算所设计引物的退火温度确定)以允许引物与模板DNA退火,并加热到72℃2分钟以允许延伸。
在一个优选的实施方案中,在头三轮扩增的每一轮中增加退火温度以减少非特异扩增。也见下面的实施例1。PCR的第一轮的TM1约为与模板DNA退火的第二引物的3’区的解链温度。退火温度在2-10轮,优选在第二轮中升高到TM2,其约为3’区的解链温度,该3’区与第一引物的模板DNA退火。如果退火温度在第二轮中上升,那么退火温度保持大概相同直到退火温度的再次增加。最后,在退火温度上升到TM2这一轮随后的任一轮,优选第三轮中,退火温度上升到TM3,其约为整个第二引物的解链温度。第三轮后,剩余轮的退火温度可为约TM3或可以进一步增加。在该实例中,退火温度在第二轮和第三轮中增加。然而,退火温度可以从第一轮中的低退火温度增加到第二轮中的高退火温度而没有任何温度的进一步增加或者退火温度可以在任何次数的增加步骤中逐渐从低退火温度改变到高退火温度。例如,退火温度可以在第2、3、4、5、6等轮中改变。
退火后,每一轮中的温度被增加到“延伸”温度以允许引物“延伸”,然后延伸后每一轮中的温度被增加到变性温度。对于大小小于500碱基对的PCR产物,可以在每一轮中除去延伸步骤并只有变性和退火步骤。典型的PCR反应由25-45轮如上述的变性、退火和延伸组成。然而,如前面指出的,一轮扩增(一次拷贝)可以足够实施本发明。
在另一个实施方案中,多组引物(其中一个引物组含有一条正向引物和一条反向引物)可以用于扩增模板DNA 1-5、5-10、10-15、15-20或多于20轮,然后使用单个引物组或多引物组的子集进一步在反应中扩增经扩增的产物。在一个优选的实施方案中,使用低浓度的每个引物组用于最小化引物二聚体的形成。低浓度的起始DNA可以使用多引物组扩增。在第一次扩增反应中可以使用任何数目的引物组,这些数目包括但不限于1-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450、450-500、500-1000和大于1000。在另一个实施方案中,使用单个引物组将扩增的产物在第二次反应中扩增。在另一个实施方案中,使用包括但不限于2-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-250和多于250个引物对的多引物对的子集进一步扩增经扩增产物。
多引物对将扩增目标基因座,从而模板DNA的最小量将不会限制可以检测的基因座数目。例如,如果模板DNA分离自单个细胞或者模板DNA从怀孕女性得到,其含有母亲模板DNA和胎儿模板DNA,那么可以在第一次扩增反应中使用低浓度的每种引物组扩增目标基因座。引物的低浓度减少了引物二聚体的形成并增加了引物与模板DNA退火并允许聚合酶延伸的可能性。用多引物组进行的轮的最佳数目由引物的浓度确定。第一次扩增反应后,可加入额外的引物以进一步扩增目标基因座。在单个反应中可以加入每种引物组的额外量并进一步扩增。备选地,可以使用每个反应中的单个引物或者多引物组的子集进一步扩增已扩增的产物。例如,如果在第一次扩增反应中使用150种引物组,那么可以使用10引物组子集进一步扩增来自第一次反应的产物。
可以使用催化引物延伸的任何DNA聚合酶,这些聚合酶包括但不限于大肠杆菌(E.coli)DNA聚合酶、大肠杆菌DNA聚合酶1的Klenow片段、T7 DNA聚合酶、T4 DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent DNA聚合酶、细菌噬菌体29、REDTaqTM基因组DNA聚合酶或者测序酶。优选地,使用热稳定的DNA聚合酶。也可以使用“热启动”PCR,其中反应物被加热到95℃2分钟之后加入聚合酶或者聚合酶可以保持无活性直到第一轮中的第一个加热步骤。“热启动”PCR可用于最小化非特异扩增。任何次数的PCR循环可用于扩增DNA,这些轮数包括但不限于2、5、10、15、20、25、30、35、40或45轮。在一个最优选的实施方案中,所进行的PCR的轮数为使得产生等摩尔量的每种目标基因座。
III.扩增的DNA的纯化
扩增的DNA的纯化不是实施本发明所必须的。然而,在一个实施方案中,如果优选进行纯化,可以用有利于PCR产物纯化的标签修饰引物(第一或第二引物)的5’末端。在一个优选的实施方案中,用有利于PCR产物纯化的标签修饰第一引物。修饰优选对所有引物相同,尽管如果想将PCR产物分开到不同的组中可以使用不同修饰。
标签可以是放射性同位素、荧光报道分子、化学发光报道分子、抗体、抗体片段、半抗原、生物素、生物素衍生物、光生物素、亚氨基生物素、地高辛、亲和素、酶、吖啶、糖、酶、脱辅基酶、均聚寡核苷酸、激素、铁磁部分、顺磁性部分、反磁性部分、磷光部分、发光部分、电化学发光部分、有色部分、具有可检测的电子旋转共振、电容、介电常数或电导部分,或它们的组合。
作为一个实例,引物的5’末端可以被生物素化(Kandpal等,NucleicAcids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucleic Acids Res.18:6163-6164(1990))。生物素提供了一种亲和性标签,其可被用于纯化从基因座DNA或任何其他非目标DNA分子中拷贝的DNA。可以使用如图1F所示的链亲和素包被的基质纯化生物素化分子,该基质包括但不限于来自Roche Molecular Biochemicals(目录号1 645 692,如在Roche Molecular Biochemicals所列的,2001Biochemicals Catalog)的透明高结合板Streptawell。
每种目标基因座的PCR产物置于链亲和素包被板的分开孔中。备选地,目标基因座的PCR产物可以被合并并置于链亲和素包被的基质中,该基质包括但不限于来自Roche Molecular Biochemicals(目录号1 645 692,如在Roche Molecular Biochemicals所列的,2001 Biochemicals Catalog)的透明高结合板Streptawell。
使用本领域中公知的非亲和方法,例如通过使用标准方案的聚丙烯酰胺凝胶电泳从模板DNA分离扩增的DNA。
IV.扩增的DNA的消化
使用本领域中公知的标准方案可以将扩增的DNA用识别在第一和第二引物上提供的序列进行限制酶消化(图6A-6D)。使用本领域中熟知的标准方案进行限制酶的消化。所用的酶取决于用第一或第二引物产生的限制性识别位点。见上面的章节“引物设计”以了解引物上产生的限制性识别位点的详情。
IIS型限制酶特别有用,因为它们在识别位点外约10-20个碱基对处切割。优选地,所用的IIS型限制酶为产生5’突出端和3’凹端的那些限制酶,包括但不限于BceA I和BsmF I(见表1)。在一个最优选的实施方案中,第二引物(正向或反向)含有BsmF I或BceA I的限制酶识别序列。IIS型限制酶BsmF I识别核酸序列GGGAC,并从反义链上距离识别位点14个核苷酸和有义链上距离识别位点10个核苷酸处切割。用BsmF I消化产生四个(4)碱基的5’突出端。
例如,如果设计第二引物使得扩增后限制酶识别位点离目标基因座13个碱基,则消化后,目标基因座是5’突出端(从3’到5’阅读)中的第一个碱基,并且3’凹端距离目标基因座1个碱基。3’凹端可以用与目标基因座互补的核苷酸填平。突出端的一个碱基可以用双脱氧核苷酸填充。然而,可以使用脱氧核苷酸或双脱氧核苷酸和脱氧核苷酸的混合物填充突出端的1、2、3或4个碱基。
限制酶BsmFI从有义链上距离识别位点10个核苷酸和反义链上距离识别位点14个核苷酸处切割DNA。然而,以序列依赖的方式,限制酶BsmFI也从有义链上距离识别位点11个核苷酸和反义链上距离识别位点15个核苷酸处切割。从而,消化后存在两群DNA分子:在10/14处切割的DNA分子和在11/15处切割的DNA分子。如果BsmF I的识别位点距离扩增产物中的目标基因座13个碱基,那么在11/15处切割的DNA分子将产生含有目标基因座的5’突出端,该目标基因座位于突出端的第二位(从3’到5’阅读)。DNA分子的3’凹端可以用标记的核苷酸填充。例如,如果使用标记的双脱氧核苷酸,在11/15处切割的分子的3’凹端将被一个碱基填平,其相应于来自目标基因座的碱基,在10/14处切割的分子的3’凹端将被一个碱基填充,其相应于来自目标基因座的碱基。在10/14位被切割的DNA分子和在11/15位被切割的DNA分子可通过大小分离,并检测掺入的核苷酸。这允许检测目标基因座前的两个核苷酸、目标基因座的缺失和潜在目标基因座后的第三个碱基。
备选地,如果来自目标基因座的碱基和目标基因座是不同的核苷酸,那么在11/15处切割的分子的3’凹端可以用与上游碱基互补的脱氧核苷酸填平。洗除剩余的脱氧核苷酸,并且目标基因座位点可以用标记的脱氧核苷酸、未标记的脱氧核苷酸、标记的双脱氧核苷酸或未标记的双脱氧核苷酸填平。填充反应后,可通过任何适宜的方法检测核苷酸。从而,使用dNTP的第一次填充反应后,在10/14和11/15处切割的分子的3’凹端来自目标基因座。3’凹端现在可填充一个碱基(其相应于目标基因座)、两个碱基、三个碱基或四个碱基。
限制酶BceA I识别核苷酸序列ACGGC并在有义链上距离识别位点12个核苷酸和反义链上距离识别位点14个核苷酸处切割。如果第二引物上Bce A I识别位点的距离被设计成距离目标基因座13个碱基(见图4A-4D),用BceA I消化将产生两个碱基的5’突出端(其含有目标基因座)和来自目标基因座的3’凹端。目标基因座是5’突出端中的第一个核苷酸(从3’到5’阅读)。
也可见到限制酶BceA I的备选切割,尽管比BsmF I所见的频率低的多。限制酶BceA I可在有义链上距离识别位点13个核苷酸和反义链上距离识别位点15个核苷酸处切割。从而,存在两群DNA分子:在12/14处切割的DNA分子和在13/15处切割的DNA分子。如果该限制酶识别位点距离扩增产物中的目标基因座13个碱基,那么在13/15处切割的DNA分子产生含有目标基因座的5’突出端,该目标基因座位于突出端的第二位(从3’到5’阅读)。DNA分子的3’凹端可以用标记的双脱氧核苷酸填充。在13/15处切割的DNA分子将使来自目标基因座的碱基被填充,在12/14处切割的DNA分子将使目标基因座被填充。在13/15位被切割的DNA分子和在12/14位被切割的DNA分子可通过大小分离,并检测掺入的核苷酸,从而备选切割可用于得到额外的序列信息。
备选地,如果5’突出端中的两个碱基是不同的,那么DNA分子的3’凹端(在13/15处切割)可以用与突出端中的第一个碱基互补的脱氧核苷酸填充,并洗除多余的脱氧核苷酸。填充后,在12/14处切割的DNA分子和在13/15处切割的DNA分子的3’凹端来自目标基因座。3’凹端可以用标记的双脱氧核苷酸、未标记的双脱氧核苷酸、标记的脱氧核苷酸或未标记的脱氧核苷酸填充。
如果引物为某些拷贝的目标基因座提供不同的限制性位点,那么可以将所有必须的限制酶一起加入以同时消化拷贝的DNA。备选地,可以顺序得到不同的限制性消化物,例如,一次使用一种限制酶,从而只有对该限制酶特异的产物被消化。
可以为每种限制酶优化最佳限制酶消化条件,包括但不限于酶的浓度、温度、缓冲条件和消化时间。例如,如果想要,通过在包括但不限于25-16℃、16-12℃、12-8℃、8-4℃或4-0℃的较低温度进行限制酶消化可以减少用IIS型限制酶BsmF I所看到的备选切割。
V.经标记核苷酸的掺入
使用识别第二引物上的序列的限制酶消化产生一个3’凹端和5’突出端,该突出端含有目标基因座(图1G)。可以在未标记和标记的核苷酸或者未标记和标记的核苷酸的组合存在下使用5’突出端作为模板填充3’凹端。核苷酸用可检测的任何类型的基团或分子标记,这些基团或分子包括但不限于放射活性分子、荧光分子、抗体、抗体片段、半抗原、糖类、生物素、生物素衍生物、磷光分子、发光分子、电化学发光分子、有色分子、具有可检测的电子旋转共振、电容、介电常数或电导部分的分子。核苷酸可以用一种或一种以上类型的化学基团或分子标记。每种核苷酸可以用相同化学基团或分子标记。备选地,每种不同的核苷酸可以用不相同化学基团或分子标记。标记的核苷酸可以是dNTPs、ddNTPs或dNTPs和ddNTPs的混合物。未标记的核苷酸可以是dNTPs、ddNTPs或dNTPs和ddNTPs的混合物。
核苷酸的任何组合可被用于掺入核苷酸,包括但不限于未标记的脱氧核苷酸、标记的脱氧核苷酸、未标记的双脱氧核苷酸、标记的双脱氧核苷酸、标记的和未标记的脱氧核苷酸的混合物、标记的和未标记的双脱氧核苷酸的混合物、标记的脱氧核苷酸和标记的双脱氧核苷酸的混合物、标记的脱氧核苷酸和未标记的双脱氧核苷酸的混合物、未标记的脱氧核苷酸和未标记的双脱氧核苷酸的混合物、未标记的脱氧核苷酸和标记的双脱氧核苷酸的混合物、双脱氧核苷酸类似物、脱氧核苷酸类似物、双脱氧核苷酸类似物和脱氧核苷酸的类似物混合物、磷酸化核苷类似物、2’-脱氧核苷-5’-三磷酸和经修饰的2’-脱氧核苷-5’-三磷酸。
例如,如图1H中所示,在聚合酶存在下,使用5’突出端作为模板,3’凹端可以用荧光ddNTP填充。可以用包括但不限于荧光检测的任何适宜的方法检测掺入的ddNTP。
所有的四种核苷酸都可以用不同荧光基团标记,这些荧光基团将允许一个反应在存在所有四种标记的核苷酸时进行。备选地,可以为每个目标基因座进行四种单独的“填充”反应;四种反应物的每一种将含有不同的经标记核苷酸(例如ddATP*、ddTTP*、ddGTP*或ddCTP*,其中*表示经标记的核苷酸)。每种核苷酸可以用不同化学基团或相同化学基团标记。标记的核苷酸可以是双脱氧核苷酸或脱氧核苷酸。
在另一个实施方案中,核苷酸可以用荧光染料标记,这些荧光染料包括但不限于荧光素、芘、7-甲氧基香豆素、Cascade Blue.TM.、Alexa Flur350、Alexa Flur 430、Alexa Flur488、Alexa Flur532、Alexa Flur 546、AlexaFlur 568、Alexa Flur 594、Alexa Flur 633、Alexa Flur 647、Alexa Flur 660、Alexa Flur 680、AMCA-X、二烷基氨基香豆素、Pacific Blue、Marina Blue、BODIPY 493/503、BODIPY FI-X、DTAF、Oregon Green 500、Dansyl-X、6-FAM、Oregon Green 488、Oregon Green 514、罗丹明Green-X、RhodolGreen、Calcein、曙红、溴乙锭、NBD、TET、2’,4’,5’,7’四溴磺基荧光素、BODIPY-R6G、BODIPY-FI BR2、BODIPY 530/550、HEX、BODIPY558/568、BODIPY-TMR-X、PyMPO、BODIPY 564/570、TAMRA、BODIPY576/589、Cy3、罗丹明Red-x、BODIPY 581/591、羰基X罗丹明、Texas-Red-X、BODIPY-TR-X、Cy5、SpectrumAqua、SpectrumGreen#1、SpeetrumGreen#2、SpectrumOrange、SpectrumRed或萘并荧光素。
在另一个实施方案中,可以使用荧光标记的dNTPs进行“填充”反应,其中核苷酸用不同荧光基团标记。掺入的核苷酸可以通过包括但不限于荧光共振能量转移(FRET)的任何适宜方法检测。
在另一个实施方案中,标记的ddTNPs和未标记的dNTPs的混合物可用于填充SNP或目标基因座的3’凹端。优选地,5’突出端由一个以上的碱基,包括但不限于2、3、4、5、6或6个以上的碱基组成。例如,如果5’突出端由序列“XGAA”组成,其中X为目标基因座,例如SNP,那么用标记的ddTNPs和未标记的dNTPs的混合物填充将产生几种不同的DNA片段。如果一个标记的ddNTP在位置“X”处掺入,反应将终止并掺入单个标记的碱基。然而,如果一个未标记的dNTP被掺入,聚合酶将继续掺入其他碱基直到标记的ddNTP被掺入。如果头两个掺入的核苷酸是dNTPs,第三个是ddNTP,3’凹端将延伸3个碱基。这种DNA片段可以从延伸1、2或4个碱基的其他DNA片段中分离出来。标记的ddTNPs和未标记的dNTPs的混合物将允许突出端的所有碱基被填充,并提供了关于目标基因座,例如SNP(见图7E和9D)的额外序列信息。
标记的核苷酸被掺入后,可以用识别第一引物所提供序列的限制酶消化扩增的DNA。例如,在图11中,扩增的DNA被结合到区“a”的限制酶消化,该限制酶从链亲和素基质释放含有掺入的核苷酸的DNA片段。
备选地,每个目标基因座的每个引物对的一个引物可以结合到包括但不限于微量滴定板的固体支持基质。例如,抗生物素蛋白链菌包被的微量滴定板可被用于使用引物对的扩增反应,其中一个引物被生物素化。然后,滴定板被用作对目标基因座进行PCR扩增的反应容器。扩增反应完成后,可通过洗涤除去过多的引物、盐和模板DNA。扩增的DNA仍然结合微量滴定板。扩增的DNA可用识别第二引物上的序列的限制酶消化并产生5’突出端(其含有目标基因座)。可通过洗涤除去消化的片段。消化后,SNP位点或目标基因座被暴露于5’突出端中。3’凹端在聚合酶存在下被包括但不限于荧光ddNTP的经标记核苷酸填充。标记的DNA可通过用识别第一引物的5’区一段序列的限制酶消化而释放到微量滴定板中的上清液中。
在另一个实施方案中,可以使用一种核苷酸确定一个基因的多个等位基因的序列。终止延长反应的核苷酸可以用于确定一种基因的多个等位基因的序列。在一个等位基因,终止核苷酸与所述等位基因的5’突出端中的目标基因座互补。该核苷酸被掺入并终止反应。在一个不同的等位基因,终止核苷酸不与目标基因座互补,这使得一个非终止核苷酸在不同等位基因的目标基因座处被掺入。然而,终止核苷酸与所述不同等位基因的5’突出端中的目标基因座下游的一个核苷酸互补。这些等位基因的序列可以通过分析终止核苷酸掺入的模式来确定。终止核苷酸可以被标记或不标记。
在另一个实施方案中,终止核苷酸为终止或阻止延长反应的核苷酸,包括但不限于双脱氧核苷酸、双脱氧核苷酸衍生物、双脱氧核苷酸类似物、双脱氧核苷酸同系物、具有含硫化学基团的双脱氧核苷酸、脱氧核苷酸、脱氧核苷酸衍生物、脱氧核苷酸类似物、脱氧核苷酸同系物、具有含硫化学基团的脱氧核苷酸、阿拉伯糖苷三磷酸、阿拉伯糖苷三磷酸类似物、阿拉伯糖苷三磷酸同系物或阿拉伯糖苷衍生物。
在另一个实施方案中,用包括但不限于荧光染料的信号产生分子标签标记的终止核苷酸可被用于确定目标基因座的等位基因的序列。用一个信号产生分子标签标记的单核苷酸可以消除当使用不同荧光分子时产生的任何问题。此外,用一个信号产生分子标签标记的一种核苷酸来确定目标基因座等位基因的序列可减少反应数,并消除了吸量错误。
例如,如果第二引物含有BsmF I的限制酶识别位点,消化将产生4碱基的5’突出端。可以设计第二引物使得目标基因座位于突出端的第一个位置。代表性突出端在下面描绘,其中R代表目标基因座:
               5’CAC
               3’GTG        R    T    G    G
               突出端位置    1    2    3    4
具有一个信号产生部分的一种核苷酸可以用于确定可变位点是纯合的还是杂合的。例如,如果可变位点为腺嘌呤(A)或鸟嘌呤(G),那么或者腺嘌呤或者鸟嘌呤可被用于确定目标基因座的等位基因的序列,条件是在突出端的2、3或4位具有腺嘌呤或鸟嘌呤。
例如,如果突出端的2位上的核苷酸是胸腺嘧啶,其与腺嘌呤互补,那么可以使用标记的ddATP、未标记的dCTP、dGTP和dTTP来确定目标基因座的等位基因的序列。ddATP可以用任何信号产生分子(包括但不限于荧光染料)标记。如果模板DNA对腺嘌呤是纯合的,那么标记的ddATP*将被掺入与等位基因处的突出端互补的位置1,并且在与突出端互补的2、3或4位不会看见核苷酸掺入。
            等位基因1  5’CCC    A*
                       3’GGG    T    T    G    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    A*
                       3’GGG    T    T    G    G
            突出端位置           1    2    3    4
将看见相应于与突出端互补的1位上标记的ddATP的掺入的一个信号,其指出在该位置个体对腺嘌呤是纯合的。这种标记方法消除了使用具有不同量子系数的不同染料可能引起的任何困难。
纯合鸟嘌呤:
如果模板DNA对鸟嘌呤是纯合的,那么在与突出端互补的1位将没有ddATP掺入,但是ddATP将在第一个可利用的位置掺入,在该情况下为与突出端互补的位置2。例如,如果突出端中的第二个位置相应于胸腺嘧啶,那么:
            等位基因1  5’CCC    G    A*
                       3’GGG    C    T    G    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    A*
                       3’GGG    C    T    G    G
            突出端位置           1    2    3    4
将看见相应于与突出端互补的2位上标记的ddATP掺入的一个信号,其指出在该位置个体对鸟嘌呤是纯合的。在与突出端互补的2位上填充的分子将具有与突出端互补的1位上填充的分子不同的分子量。
杂合情况:
            等位基因1  5’CCC    A*
                       3’GGG    T    T    G    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    A*
                       3’GGG    C    T    G    G
            突出端位置           1    2    3    4
将看见两个信号,第一个信号相应于在与突出端互补的1位填充的ddATP,第二个信号相应于在与突出端互补的2位填充的ddATP。两个信号可以基于分子量分离;等位基因1和等位基因2将通过单个碱基对分离,该碱基对使得易于检测和定量信号。可使用基于分子量区分的任何方法使在1位填充的分子与在2位填充的分子相区别,这些方法包括但不限于凝胶电泳、毛细管凝胶电泳、DNA测序和质谱。核苷酸不是必需用化学分子标记;相应于不同等位基因的DNA分子可以基于分子量分离。
如果突出端的2位不与腺嘌呤互补,可能3或4位与腺嘌呤互补。例如,突出端的3位可能互补于核苷酸腺嘌呤,在这种情况下标记的ddATP可被用于确定两个等位基因的序列。
对腺嘌呤是纯合的:
            等位基因1  5’CCC    A*
                       3’GGG    T    G    T    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    A*
                       3’GGG    T    G    T    G
            突出端位置           1    2    3    4
对鸟嘌呤是纯合的:
            等位基因1  5’CCC    G    C    A*
                       3’GGG    C    G    T    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    C    A*
                       3’GGG    C    G    T    G
            突出端位置           1    2    3    4
            杂合的:
            等位基因1  5’CCC    A*
                       3’GGG    T    G    T    G
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    C    A*
                       3’GGG    C    G    T    G
            突出端位置           1    2    3    4
将看见两个信号,第一个信号相应于在与突出端互补的1位填充的ddATP,第二个信号相应于在与突出端互补的3位填充的ddATP。两个信号可以基于分子量分离;等位基因1和等位基因2将通过两个碱基分离,这两个碱基可使用基于分子量区分的任何方法检测。
备选地,如果2位和3位不与腺嘌呤互补(即突出端的2和3位相应于鸟嘌呤、胞嘧啶或腺嘌呤)但是4位与腺嘌呤互补,那么标记的ddATP可用于确定两个等位基因的序列。
对腺嘌呤是纯合的:
            等位基因1  5’CCC    A*
                       3’GGG    T    G    G    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    A*
                       3’GGG    T    G    G    T
            突出端位置           1    2    3    4
将看见一个信号,其相应于与突出端互补的位置1处用ddATP填充的分子的分子量,这指出在该可变位点个体对腺嘌呤是纯合的。
对鸟嘌呤是纯合的:
            等位基因1  5’CCC    G    C    C    A*
                       3’GGG    C    G    G    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    C    C    A*
                       3’GGG    C    G    G    T
            突出端位置           1    2    3    4
将看见一个信号,其相应于与突出端互补的位置4处填充的分子的分子量,这指出个体对鸟嘌呤是纯合的。
杂合的:
            等位基因1  5’CCC    A*
                       3’GGG    T    G    G    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G    C    C    A*
                       3’GGG    C    G    G    T
            突出端位置           1    2    3    4
将看见两个信号,第一个信号相应于在与突出端互补的1位填充的ddATP,第二个信号相应于在与突出端互补的4位填充的ddATP。两个信号可以基于分子量分离;等位基因1和等位基因2将通过3个碱基分离,这3个碱基允许信号的检测和定量。在1位填充的分子和在4位填充的分子可以基于分子量区分。
如上面所讨论的,如果可变位置含有腺嘌呤或鸟嘌呤,标记的腺嘌呤或标记的鸟嘌呤可用于确定两个等位基因的序列。如果突出端的2、3或4位不与腺嘌呤互补但是这些位置处的一个位置与鸟嘌呤互补,那么标记的ddGTP可用于确定模板DNA对腺嘌呤或鸟嘌呤是纯合的还是杂合的。例如,如果突出端中的3位相应于胞嘧啶,那么将预期下面的信号,如果模板DNA对鸟嘌呤是纯合的,对腺嘌呤是纯合的或杂合的:
对鸟嘌呤是纯合的:
            等位基因1  5’CCC    G*
                       3’GGG    C    T    C    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    G*
                       3’GGG    C    T    C    T
            突出端位置           1    2    3    4
将看见一个信号,其相应于与突出端互补的1位用ddGTP填充的分子的分子量,这指出个体对鸟嘌呤是纯合的。
对腺嘌呤是纯合的:
            等位基因1  5’CCC    A    A    G*
                       3’GGG    T    T    C    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    A    A    G*
                       3’GGG    T    T    C    T
            突出端位置           1    2    3    4
将看见一个信号,其相应于与突出端互补的3位填充的分子的分子量,这指出个体在可变位点对腺嘌呤是纯合的。
杂合的:
            等位基因1  5’CCC    G*
                       3’GGG    C    T    C    T
            突出端位置           1    2    3    4
            等位基因2  5’CCC    A    A    G*
                       3’GGG    T    T    C    T
            突出端位置           1    2    3    4
将看见两个信号,第一个信号相应于在与突出端互补的1位填充的ddGTP,第二个信号相应于在与突出端互补的3位填充的ddGTP。两个信号可以基于分子量分离;等位基因1和等位基因2将通过2个碱基分离,这使得信号易于检测和定量。
一些IIS型限制酶也显示出如上讨论的备选切割。例如,BsmF I将从识别位点的10/14和11/15出切割。然而,切割模式不是相互排斥的;如果在特定序列看见11/15模式,也可看见10/14切割。如果限制酶BsmF I在识别位点的10/14处切割,5’突出端将是X1X2X3X4。如果限制酶BsmF I在识别位点的11/15处切割,5’突出端将是X0X1X2X3。如果突出端的X0位与标记的核苷酸互补,那么标记的核苷酸将在X0位掺入并提供额外水平的质量保证。其提供了额外的序列信息。
例如,如果可变位点为腺嘌呤或鸟嘌呤,并且突出端中的3位与腺嘌呤互补,那么标记的ddATP可用于确定可变位点处的基因型。如果11/15突出端的0位含有与腺嘌呤互补的核苷酸,那么ddATP将被填充并且看见额外信号。
杂合的:
            10/14等位基因1  5’CCA   A*
                            3’GGT   T    G    T    G
            突出端位置               1    2    3    4
            10/14等位基因2  5’CCA   G    C    A*
                            3’GGT   C    G    T    G
            突出端位置               1    2    3    4
            11/15等位基因1  5’CC    A*
                            3’GG    T    T    G    T
            突出端位置               0    1    2    3
            11/15等位基因2  5’CC    A*
                            3’GG    T    C    G    T
            突出端位置               0    1    2    3
看到三个信号,一个相应于在与突出端互补的0位掺入的ddATP,一个相应于在与突出端互补的1位掺入的ddATP,一个相应于在与突出端互补的3位掺入的ddATP。在与突出端互补的0、1和3位填充的分子在分子量上不同并可通过基于分子量区分的任何技术分开,这些技术包括但不限于凝胶电泳和质谱。
为了定量一个等位基因与另一个等位基因的比率或者当存在野生型DNA序列时确定突变DNA序列的相对量时,必须使用准确且高度敏感的方法。IIS型限制酶显示的备选切割可增加确定一个等位基因与另一个等位基因比率的困难,因为该限制酶可能不会相等地显示两个等位基因上的备选切割(11/15)模式。例如,等位基因1可以在80%的时间里以10/14切割,在20%的时间里以11/15切割。然而,因为两个等位基因序列上不同,等位基因2可能在90%的时间里以10/14切割,而在20%时间里以11/15切割。
为了定量的目的,当突出端的0位核苷酸不与标记的核苷酸互补时,可以消除备选切割问题。例如,如果可变位点相应于腺嘌呤或鸟嘌呤,并且突出端的3位与腺嘌呤互补(即胸腺嘧啶位于突出端的3位),那么可以使用标记的ddATP确定可变位点的基因型。如果通过11/15切割性质产生的突出端的0位不与腺嘌呤互补(即,突出端的0位相应于鸟嘌呤、胞嘧啶或腺嘌呤),将不会从自识别位点11/15处切割的片段看到额外的信号。与突出端互补的0位可以用未标记的核苷酸填充,消除从限制酶的备选切割模式看到的任何复杂性。该方法提供了定量可变位点比率的高度准确的方法,可变位点包括但不限于突变或单核苷酸多态性。
例如,如果SNP X可以是腺嘌呤或鸟嘌呤,这种标记方法允许相应于腺嘌呤的等位基因和相应于鸟嘌呤的等位基因进行定量,不用确定是否限制酶显示出了关于备选切割模式的等位基因间的任何差异。
杂合的:
            10/14等位基因1  5’CCG    A*
                            3’GGC    T    G    T    G
            突出端位置                1    2    3    4
            10/14等位基因2  5’CCG    G    C    A*
                            3’GGC    C    G    T    G
            突出端位置                1    2    3    4
通过BsmF I的备选切割性质产生的突出端描述如下:
            11/15等位基因1  5’CC
                            3’GG    C    T    G    T
            突出端位置               0    1    2    3
            11/15等位基因2  5’CC
                            3’GG    C    C    G    T
            突出端位置               0    1    2    3
用标记的ddATP和未标记的dGTP、dCTP、dTTP填充后,将产生下面的分子:
            11/15等位基因1  5’CC    G    A*
                            3’GG    C    T    G    T
            突出端位置               0    1    2    3
            11/15等位基因2  5’CC    G    G    C    A*
                            3’GG    C    C    G    T
            突出端位置               0    1    2    3
看见两个信号;一个相应于在与突出端互补的1位用ddATP填充的分子,一个相应于在与突出端互补的3位用ddATP填充的分子。11/15突出端的0位被未标记的核苷酸填充,这消除了在定量等位基因1上可变位点的核苷酸和等位基因2上可变位点的核苷酸的比率时的任何困难。
可以使用的任何核苷酸包括腺嘌呤、腺嘌呤衍生物、腺嘌呤类似物、鸟嘌呤、鸟嘌呤衍生物、鸟嘌呤类似物、胞嘧啶、胞嘧啶衍生物、胞嘧啶类似物、胸腺嘧啶、胸腺嘧啶衍生物或胸腺嘧啶类似物,或腺嘌呤、腺嘌呤衍生物、腺嘌呤类似物、鸟嘌呤、鸟嘌呤衍生物、鸟嘌呤类似物、胞嘧啶、胞嘧啶衍生物、胞嘧啶类似物、胸腺嘧啶、胸腺嘧啶衍生物或胸腺嘧啶类似物的任何组合。
核苷酸可用任何化学基团或部分标记,这些化学基团或部分包括但不限于放射活性分子、荧光分子、抗体、抗体片段、半抗原、糖类、生物素、生物素衍生物、磷光部分、发光部分、电化学发光部分、有色部分、具有可检测的电子旋转共振、电容、介电常数或电导的部分。核苷酸可用一种或一种以上的化学基团或部分标记。
在另一个实施方案中,可以使用标记和未标记的核苷酸。可以使用脱氧核苷酸和双脱氧核苷酸的任何组合,包括但不限于标记的双脱氧核苷酸和标记的脱氧核苷酸、标记的双脱氧核苷酸和未标记的脱氧核苷酸、未标记的双脱氧核苷酸和未标记的脱氧核苷酸、未标记的双脱氧核苷酸和标记的脱氧核苷酸。
在另一个实施方案中,在PCR反应中可使用化学分子标记的核苷酸。然后未标记的核苷酸用于填充用限制酶消化后产生的5’突出端。在未标记的核苷酸存在下未标记的终止核苷酸可用于确定目标基因座等位基因的序列。
例如,如果标记的dTTP用于PCR反应中,用BsmF I消化后将产生下面的5’突出端:
            10/14等位基因1  5’CT*G    A
                            3’GA  C    T    G    T    G
            突出端位置                  1    2    3    4
            10/14等位基因2  5’CT*G    G    C    A
                            3’GA  C    C    G    T    G
            突出端位置                  1    2    3    4
未标记的ddATP、未标记的dCTP、未标记的dGTP、未标记的dTTP可用于填充5’突出端。将产生两个信号;一个信号相应于在与突出端互补的1位用未标记的ddATP填充的DNA分子,第二个信号相应于在与突出端互补的3位用未标记的ddATP填充的DNA分子。DNA分子可以基于分子量分离并通过dTTP的荧光检测,该dTTP在PCR反应中被掺入。
可以通过各种方法分析标记的DNA目标基因座位点,这些方法包括但不限于荧光检测、DNA测序凝胶、自动DNA测序仪上的毛细管电泳、微通道电泳和其他测序方法、质谱、飞行质谱时间、四极质谱、磁性部分质谱、电部分质谱、红外光谱、紫外光谱、palentiostatic电流测定法、或通过DNA杂交技术,包括Southern印迹、狭线印迹、斑点印迹和DNA微阵列(其中DNA片段将用作“探针”和“靶标”)、ELISA、荧光测定法和荧光共振能量转移(FRET)。
这种标记方法特别敏感并且允许检测不同比率的目标基因座的等位基因,这些比率包括但不限于1∶1、1∶2、1∶3、1∶4、1∶5、1∶6-1∶10、1∶11-1∶20、1∶21-1∶30、1∶21-1∶40、1∶41-1∶50、1∶51-1∶60、1∶60-1∶70、1∶71-1∶80、1∶81-1∶90、1∶91-1∶100、1∶101-1∶200、1∶250、1∶251-1∶300、1∶301-1∶400、1∶401-1∶500、1∶501-1∶600、1∶601-1∶700、1∶701-1∶800、1∶801-1∶900、1∶901-1∶1000、1∶1001-1∶2000、1∶2001-1∶3000、1∶3001-1∶4000、1∶4001-1∶5000、1∶5001-1∶6000、1∶6001-1∶7000、1∶7001-1∶8000、1∶8001-1∶9000、1∶9001-1∶10,000、1∶10,001-1∶20,000、1∶20,001-1∶30,000、1∶30,001-1∶40,000、1∶40,001-1∶50,000,和高于1∶50,000。
例如,这种标记方法允许用一个信号产生部分标记的核苷酸被用于确定SNP基因座的序列,或者检测一群正常等位基因中的突变等位基因,或者检测来自抗生素敏感细菌的等位基因中的来自一个细菌的编码抗生素抗性的等位基因,或者检测来自药物敏感病毒的等位基因中的来自药物抗性病毒的等位基因,或者检测来自病原性细菌菌株的等位基因中的来自非病原性细菌菌株的等位基因。
如上所示,单个核苷酸可用于确定在特定目标基因座的等位基因的序列。该方法尤其用于确定个体对特定突变是纯合或者杂合的或者确定特定SNP位点的等位基因的序列。这种标记方法消除了不同染料的量子系数导致的任何错误。其还允许反应在包括但不限于微量滴定板的一个孔或单个微量离心管的单个反应容器中进行。
这种标记方法尤其用于检测相同样品中的多个遗传信号。例如,该方法用于检测怀孕女性的血、血清或血浆中的胎儿DNA,怀孕女性的血、血清或血浆含有母亲DNA和胎儿DNA。母亲DNA和胎儿DNA可以以如97∶3的比例存在于血、血清或血浆中,然而,上面描述的方法可用于检测胎儿DNA。这种标记方法可用于检测相同人群中的两种、三种或四种不同的遗传信号。
这种标记方特别用于检测大群体野生型等位基因中的突变等位基因。此外,这种标记方法允许检测大群体的野生型细胞中的单个突变细胞。例如,这种标记方法可用于检测一大群正常细胞中的单个癌细胞。通常,癌细胞在DNA序列中具有突变。可以鉴定突变的DNA序列,即使有野生型DNA序列的大背景。这种标记方法可用于筛选、检测或诊断任何类型的癌,包括但不限于结肠癌、肾癌、乳腺癌、膀胱癌、肝癌、肾癌、脑癌、肺癌、前列腺癌和血液的癌症,包括白血病。
这种标记方法也可用于检测病原生物,包括但不限于细菌、真菌、病毒、原生动物和分枝杆菌。其也可以用于区别微生物的致病株和微生物的非致病株,包括但不限于细菌、真菌、病毒、原生动物和分枝杆菌。
例如,有7株大肠杆菌(E.Coli)的菌株,并且多数是非病原性的。然而,几种菌株,如大肠杆菌O157是病原性的。非病原性大肠杆菌菌株和病原性大肠杆菌之间有遗传差异。上述标记方法可用于检测大群非病原性生物中的病原性微生物,这些非病原性生物有时候与个体的正常群落相关。
VI.目标基因座的分析
可以通过各种方法分析目标基因座,这些方法包括但不限于荧光检测、DNA测序凝胶、自动化DNA测序仪(例如ABI Prism 3100 GeneticAnalyzer或ABI Prism 3700 Genetic Analyzer)上的毛细管电泳、微通道电泳和其他测序方法、Sanger双脱氧测序、质谱、飞行质谱时间、四极质谱、磁性部分质谱、电部分质谱、红外光谱、紫外光谱、palentiostatic电流测定法、或通过DNA杂交技术,包括Southern印迹、狭线印迹、斑点印迹和DNA微阵列(其中DNA片段将用作“探针”和“靶标”)、ELISA、荧光测定法和荧光共振能量转移(FRET)。
使用凝胶电泳然后通过掺入核苷酸的荧光检测分析目标基因座。分析或阅读目标基因座的另一种方法是使用荧光板阅读器或者荧光计直接对96孔链亲和素包被的板进行分析。该板可以置于荧光板阅读器或者扫描仪如Pharmacia 9200 Typhoon上以阅读每个目标基因座。
备选地,可以合并目标基因座上的PCR产物并且“填平”后(图10),产物可根据大小使用用于分离的任何适宜的方法分离,然后使用各种技术分析,这些技术包括但不限于荧光检测、DNA测序凝胶、自动化DNA测序仪上的毛细管电泳、微通道电泳和其他测序方法、Sanger双脱氧测序、DNA杂交技术,包括Southern印迹、狭线印迹、斑点印迹和DNA微阵列、质谱、飞行质谱时间、四极质谱、磁性部分质谱、电部分质谱、红外光谱、紫外光谱、palentiostatic电流测定法。聚丙烯酰胺凝胶电泳可用于通过大小分离DNA并且可扫描凝胶以确定每条带中的荧光颜色(使用例如ABI377 DNA测序仪或Pharmacia Typhoon 9200)。
在另一个实施方案中,目标基因座的序列可通过检测目标基因座3’的核苷酸掺入确定,其中所述核苷酸为与目标基因座的可能核苷酸不同的核苷酸。该实施方案特别用于测序和SNP的检测。DNA聚合酶掺入核苷酸的效率和速率随着每一核苷酸的不同而不同。
根据来自人类基因组计划的数据,所有SNPs的99%都是二元的。人类基因组的序列可用于确定目标SNP的3’核苷酸。当SNP 3’的核苷酸与SNP位点的核苷酸不同时,离SNP 3’一个或一个以上碱基的核苷酸可用于确定SNP位点的序列。
例如,设想要确定13号染色体上SNP X的序列。人基因组的序列指出SNP可以是腺嘌呤或鸟嘌呤并且目标基因座3’的核苷酸是胸腺嘧啶。一种含有BsmF I的限制酶识别位点的引物(其被设计成扩增后距离目标基因座13个碱基)被用于扩增含有SNP X的片段。用限制酶BsmF I消化产生含有目标基因座的5’突出端,该目标基因座是腺嘌呤或鸟嘌呤。消化产物可分成两种“填充”反应:一种含有dTTP,另一种反应含有dCTP。如果目标基因座对鸟嘌呤是纯合的,仅仅与dCTP混合的DNA分子将被填充。如果目标基因座对腺嘌呤是纯合的,仅仅与dTTP混合的DNA分子将被填充。如果目标基因座是杂合的,与dCTP混合的DNA分子以及与dTTP混合的DNA分子将被填充。洗涤除去过多dNTP后,将样品用标记的ddATP填充,其与目标基因座3’的核苷酸(胸腺嘧啶)互补。被以前的反应物填充的DNA分子将被标记的ddATP填充。如果个体对腺嘌呤是纯合的,与dTTP混合的DNA分子随后将被标记的ddATP填充。然而,与dCTP混合的DNA分子不可能已经掺入了所述核苷酸,因此,不能掺入ddATP。检测到标记的ddATP仅仅在与dTTP混合的分子中表明13号染色体上SNP X处的核苷酸为腺嘌呤。
在另一个实施方案中,可以进行存在或缺乏核苷酸多态性或突变的大规模筛选。单条染色体或多条染色体上的一到数十到数百到数千个目标基因座可以用上面的“引物设计”章节中描述的引物扩增。可以设计引物使得每个扩增的目标基因座大小不同(图2)。多个目标基因座可以是来自一个个体的DNA样品,代表单条染色体、多条染色体、多个基因、单个基因或它们的任何组合的多个目标基因座。
当分析人类数据时,公知的数据可以是从一个个体(包括例如其DNA正在被分析的个体)测定的特定序列,或者其可以是共有序列,如公布的作为人类基因组一部分的序列。
杂合性目标基因座上等位基因的比率
在一个实施方案中,可以计算杂合性目标基因座上等位基因的比率。目标基因座上核苷酸的强度可以使用任何数目的计算机程序(包括但不限于GeneScan和ImageQuant)定量。例如,对于杂合SNP,有两种核苷酸,并且每种应该以1∶1存在。在一个优选的实施方案中,可以计算多个杂合SNP的比率。
在一个实施方案中,可以计算杂合性目标基因座处等位基因上可变核苷酸的比率。目标基因座上每种可变核苷酸的强度可以使用任何数目的计算机程序(包括但不限于GeneScan和ImageQuant)定量。例如,对于杂合SNP,将有两种核苷酸存在,并且每种可以以1∶1存在。在一个优选的实施方案中,可以计算多个杂合SNP的比率。
在另一个实施方案中,一条染色体上杂合性目标基因座处等位基因的比被相加并与另一条染色体上杂合性目标基因座处等位基因的比率相比较。在一个优选的实施方案中,一条染色体上多个杂合性目标基因座处等位基因的比被相加并与另一条染色体上多个杂合性目标基因座上等位基因的比相比较。可以将从1号染色体上SNP 1、SNP 2、SNP 3、SNP 4等得到的比相加。该比值可以与从SNP A、SNP B、SNP C、SNP D得到的比值相比较。
例如,可以分析1号染色体上的100个SNP。这100个SNP中,假设50个是杂合的。可以将1号染色体上杂合SNP处等位基因的比例相加,并且应该得到约50∶50的比例。同样地,在21号染色体上分析的100个SNP中,假设50个是杂合的。将21号染色体上杂合SNP处等位基因的比例相加。在具有正常数目的染色体时,该比例应该约为50∶50,从而从1号和21号染色体得到的比例之间应该没有差异。然而,如果存在21号染色体的额外拷贝,将提供额外的等位基因,从而比例应该约为66∶33。从而,杂合SNP处核苷酸的比例可用于检测染色体异常的存在与否。可被检测的染色体异常包括非整倍性、多倍性、倒位、三体性、单体性、重复、缺失、部分染色体的缺失、加入、部分染色体的加入、插入、染色体片段化、染色体区域、染色体重排和易位。该方法特别用于三体性13、三体性18、三体性21、XXX和XYY的检测。
本发明提供了定量杂合性目标基因座处等位基因的比例。目标基因座包括但不限于单核苷酸多态性、突变。不必须扩增基因的全部序列或者定量特定基因产物的量。本发明不依赖于定量PCR。
胎儿染色体异常的检测
如在上面名为“DNA模板”的章节所讨论的,可以从怀孕女性的样品得到模板DNA,其中模板DNA含有母亲模板DNA和胎儿模板DNA。在一个实施方案中,模板DNA从怀孕女性的血液得到。在一个优选的实施方案中,模板DNA从来自怀孕女性血液的血浆或血清得到。
在一个实施方案中,来自怀孕女性样品的模板DNA含有母亲模板DNA和胎儿模板DNA。在另一个实施方案中,母亲模板DNA从任何含有核酸的来源得到,该来源包括但不限于细胞、组织、血液、血清、血浆、唾液、尿、泪、阴道分泌物、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便,或身体排出物,并且对母亲模板DNA测序以鉴定纯合或杂合性目标基因座,其是在从怀孕女性得到的样品所得到的模板DNA上分析的目标基因座。
在一个优选的实施方案中,确定母亲模板DNA上多个目标基因座处等位基因的序列以鉴定纯合目标基因座。在另一个实施方案中,确定母亲模板DNA上多个目标基因座处等位基因的序列以鉴定杂合性目标基因座。可以在单个反应或多个反应中确定母亲模板DNA上多个目标基因座的等位基因的序列。
例如,如果分析21号染色体上100个母亲目标基因座和1号染色体上100个母亲目标基因座,将预测在每条染色体上约50个目标基因座是纯合的,而另50个是杂合的。可以使用来自怀孕女性样品的模板DNA分析每条染色体上50个纯合目标基因座,或50个杂合性目标基因座或50个纯合的和50个杂合的目标基因座,或者纯合的和杂合的目标基因座的任何组合。
使用上述扩增、分离、消化、填平和检测方法分析来自怀孕女性的样品中模板DNA上的目标基因座。用于分析母亲模板DNA上目标基因座的相同引物被用于筛选来自怀孕女性的样品的模板DNA。任何数目的目标基因座可以在来自怀孕女性样品的模板DNA上分析。例如,1、1-5、5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-250、250-300、300-500、500-1000、1000-2000、2000-3000、3000-4000或多于4000个纯合母亲目标基因座可以在来自怀孕女性样品的模板DNA上分析。在一个优选的实施方案中,分析了多条染色体上多个目标基因座。
从纯合的母亲目标基因座的群体中,将有来自怀孕女性样品的模板DNA的杂合的和纯合的目标基因座;可以进一步分析杂合性目标基因座。在杂合性目标基因座,等位基因的比例可用于确定存在的染色体的数目。
来自怀孕女性的样品中胎儿DNA的百分数可通过确定与染色体异常通常不相关的染色体上的杂合性目标基因座处等位基因的比例来计算。在一个优选的实施方案中,染色体上多个杂合性目标基因座处等位基因的比例可用于确定胎儿DNA的百分比。例如,1号染色体(其是人类基因座中最大的染色体)可用于确定胎儿DNA的百分比。
例如,设想SNP X在母亲模板DNA上是纯合的(A/A)。在SNP X,来自怀孕女性的样品的模板DNA(其可以含有胎儿DNA和母亲DNA)是杂合的(A/G)。核苷酸鸟嘌呤代表胎儿DNA,因为在SNP X母亲是纯合的,从而鸟嘌呤归因于胎儿DNA。SNP X的鸟嘌呤可被用于计算样品中胎儿DNA的百分比。
备选地,可以检查两条或多条染色体上多个目标基因座以确定胎儿DNA的百分数。例如,可以在13和18号染色体上检查多个目标基因座以确定胎儿DNA的百分比,因为在13和18号染色体上具有染色体异常的生物体是不能成活的。
备选地,对于男性胎儿,可以使用Y染色体上的标记确定样品中存在的胎儿DNA的量。使用从来自怀孕女性的样品分离的模板DNA制备一组连续稀释液,并进行定量PCR分析。可以进行两种PCR反应:一种PCR反应扩增Y染色体上的标记,例如SRY,另一种反应扩增任一常染色体上的区域。可以使用下面的式子计算胎儿DNA的量:
胎儿DNA百分数:(检测的Y染色体的最终稀释液/检测的常染色体的最终稀释液)*2*100。
父亲等位基因与母亲等位基因的期望比例取决于来自怀孕女性的样品中存在的胎儿DNA的量。例如,如果在SNP A处,母亲是纯合的A/A,并且胎儿是杂合的A/G,那么比例A∶G可以用于检测染色体异常。如果胎儿DNA为母亲血液中DNA的50%,那么在SNP A处,母亲核苷酸是腺嘌呤,由父亲贡献的另一个核苷酸是鸟嘌呤,可以预期腺嘌呤(两个腺嘌呤来自母亲模板DNA,一个来自胎儿模板DNA)与鸟嘌呤(来自胎儿模板DNA)的比是75∶25。然而,如果胎儿具有该特定染色体的三体性,并且该额外的染色体由母亲贡献,从而存在额外的腺嘌呤核苷酸,那么预期比例为83.4∶16.6(胎儿DNA占母亲血液中DNA的50%,因此由胎儿贡献每个核苷酸,即两个腺嘌呤和鸟嘌呤,每种占样品中总DNA的16.66%)。从而,将检测到腺嘌呤信号增强8%和鸟嘌呤信号减弱8%。另一方面,如果额外的染色体由父亲贡献,从而,存在额外的鸟嘌呤,那么预期比例为66.6∶33.4。
然而,如果胎儿DNA占母亲血液中DNA的40%,无三体性的预期比例为80∶20。如果胎儿具有三体性,并且额外的染色体由母亲提供,预期比例将是86.6∶13.3。将检测到腺嘌呤信号增强6.6%和鸟嘌呤信号减弱6.6%。
在另一个实施方案中,可以检查多条染色体上多个目标基因座。可以将一条染色体上每个杂合性目标基因座处等位基因的比例相加并与不同染色体上每个目标基因座处等位基因的比例相比较。被比较的染色体可以是人来源的,并且包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号染色体和X和Y染色体。从多条染色体得到的比例可以从单条染色体或多条染色体得到的比例相比较。
在一个实施方案中,比较中使用的一条染色体可以是染色体13、16;18、21、22、X或Y。在一个优选的实施方案中,比较了13、18和21号染色体上的比例。
例如,假设来自怀孕女性样品中有40%胎儿DNA,1号染色体上杂合性目标基因座上的等位基因的比例将是80∶20。同样,21号染色体上杂合性目标基因座上的等位基因的比例将以80∶20的比例存在。然而,在具有三体性21,其中额外的染色体由母亲贡献的胎儿中,21号染色体上杂合性目标基因座上的核苷酸将以86.6∶13.3的比例存在。相反,关于1号染色体的比例将保持在80∶20,从而21号染色体上母亲核苷酸中6.6%的增加将表示额外的染色体或染色体的一部分。可以分析一到数十到数百到数千目标基因座。
在另一个实施方案中,可以确定来自怀孕女性样品的模板DNA上目标基因座的基因型;可鉴定杂合的和纯合的目标基因座。目标基因座处等位基因的比例可用于确定染色体异常的存在与否。来自怀孕女性样品的模板DNA含有母亲模板DNA和胎儿模板DNA。
对母亲模板DNA或胎儿模板DNA在每个SNP处有3种可能:对等位基因1是杂合的、纯合的,或对等位基因2是纯合的。对或者是腺嘌呤或者是鸟嘌呤的SNP的可能核苷酸比例如表II所示。表II中的比例用胎儿DNA为来自怀孕女性样品中DNA的50%计算。
表II.杂合SNP的核苷酸的比例
                          胎儿SNP
  母亲SNP     A/A     G/G   A/G
    A/A     100%A     N/A   75%A,25%G
    G/G     N/A     100%G   25%A,75%G
    A/G     75%A,25%G     25%A,75%G   50%A,50%G
有三种核苷酸比例:100%单一核苷酸、50∶50或75∶25。这些比例将随着来自怀孕女性的样品中存在的胎儿DNA的量而改变。然而,胎儿DNA的百分数应该不管所分析的DNA而保持恒定。因此,如果染色体以两份拷贝存在,将可以见到上面计算的比例。
另一方面,当存在额外的染色体时这些百分数将改变。例如,假设SNPX可以是腺嘌呤或鸟嘌呤,并且来自怀孕女性样品的胎儿DNA的百分比为50%。1号染色体上目标基因座的分析将提供上面讨论的比例:100∶0、50∶50和75∶25。具有额外染色体的SNP(为A/G)的可能比例在表III中提供。
表III:当存在染色体的额外拷贝时SNP处的核苷酸比例
                                     胎儿SNP
母亲SNP X   A/A/A   G/G/G  A/G/G  A/A/G
    A/A   100%A   N/A  60%A,40%G  80%A,20%G
    G/G   N/A   100%G  20%A,80%G  40%A,60%G
    A/G   80%A,20%G   20%A,80%G  40%A,60%G  60%A,40%G
具有额外拷贝的染色体在杂合SNP处等位基因的可能比例为100∶0、60∶40和80∶20。这些比例的两种:60∶40和80∶20与具有两份染色体拷贝的杂合SNP处等位基因的比例不同。如上面所讨论的,杂合SNP处核苷酸的比例取决于样品中存在的胎儿DNA的量。然而,这些比例(不管它们是什么)将在染色体间保持恒定,除非有染色体异常。
染色体上杂合性目标基因座处等位基因的比例可与不同染色体上杂合性目标基因座处等位基因的比例相比较。例如,1号染色体上的多个目标基因座(在SNP 1、SNP 2、SNP 3、SNP 4等的比例)的比例可与21号染色体上的多个目标基因座的比例相比较(在SNP A、SNP B、SNP C、SNP D等的比例)。任一染色体可与任一其它染色体比较。对可以比较的染色体数没有限制。
参考前面的表II和表III的数据,在1号染色体(其以两份拷贝存在)上的杂合SNP处核苷酸的比例为75∶25和50∶50。在21号染色体(其以三份拷贝存在)上的杂合SNP处核苷酸的比例为60∶40和80∶20。这两种比例之间的不同指出染色体异常。可对母亲血清中存在的胎儿DNA变化的全部范围进行预计算。表II和表III表明母亲纯合和杂合性目标基因座都可用于检测胎儿染色体异常的存在。
上面的实例阐明了杂合SNPs上的核苷酸比例是怎样用于检测额外DNA的存在的。同种类型的分析可用于检测染色体重排、易位、小染色体、染色体区域的重复、单体性、染色体区域的缺失和染色体片段。本发明不对胎儿基因产物的量定量,本发明的应用也不限于分析Y染色体上的基因。本发明不仅仅依赖父亲遗传的核酸的检测,而是,本发明提供了允许计算目标基因座(包括SNP)处母亲与父亲遗传的等位基因比例的方法。该方法不需要确定母亲或父亲的基因型。
可以使用本发明的方法分析任何生物的任何染色体。例如,在人类中,可以使用本发明的方法分析1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X或Y染色体。任何染色体上杂合性目标基因座处等位基因的比例可以与另一其他染色体上杂合性目标基因座处等位基因的比例相比较。
从而,本发明提供了非侵入性技术,其不依赖于胎儿细胞分离,可用于胎儿中染色体异常的快速、准确和确定的检测。本发明还提供了确定来自胎儿DNA的序列非侵入性方法。本发明可用于检测与野生型序列比较基因序列中的任何改变,包括但不限于点突变、读框移位、转换、颠换、加入、插入、缺失、加入-缺失、框移位、错义、反向突变和微卫星改变。
使用短串联重复序列检测胎儿染色体异常
短串联重复序列(STRs)是短的DNA序列,通常长2-5个碱基,其以头-尾的方式重复多次。串连重复的DNA在人基因组中广泛存在,并且在群体的个体中显示出足够的多样性。微卫星具有以9-80个碱基对重复的核。
在另一个实施方案中,短串联重复序列可用于检测胎儿染色体异常。模板DNA可得自含有核酸的样品,样品包括但不限于细胞、组织、血、血清、血浆、唾液、尿、泪、阴道分泌物、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便或身体排出物。在另一个实施方案中,细胞裂解抑制剂被加入到含有核酸的样品中。在一个优选的实施方案中,模板DNA得自怀孕女性的血液。在另一个实施方案中,模板DNA得自来自怀孕女性血液的血浆或血清。
得自怀孕女性血液的模板DNA中含有胎儿DNA和母亲DNA。胎儿DNA包含来自母亲和父亲的STRs。母亲和父亲之间STRs的变化可用于检测染色体异常。
可设计引物扩增短串联重复序列。可以使用任何扩增方法,包括但不限于聚合酶链式反应、自维持序列反应、连接酶链式反应、cDNA末端的快速扩增、聚合酶链式反应和连接酶链式反应、Q-β噬菌体扩增、链置换扩增和剪接重叠延伸聚合酶链式反应。在一个优选的实施方案中,使用PCR。
可以分析任何数目的短串联重复序列,这些数目包括但不限于1-5、5-10、10-50、50-100、100-200、200-300、300-400、400-500、500-1000和大于1000。可以在单个PCR反应或多个PCR反应中分析短串联重复序列。在一个优选的实施方案中,分析来自多条染色体的STRs。
扩增后,通过多种方法中的任一方法分析PCR产物,这些方法包括但不限于凝胶电泳和质谱。来自怀孕女性的模板DNA含有母亲和父亲来源的STR。父亲来源的STR代表胎儿DNA。父亲和母亲STR可以在长度上相同或者父亲和母亲STR可以不同。
杂合SRT是那些在长度上不同的母亲和父亲STR。可以对每种杂合STR定量每种PCR产物的量。具有正常数目的染色体时,每种PCR产物的量将大约相同。然而,具有额外染色体时,一种STR PCR产物将以较多的量存在。
例如,可以对从怀孕女性的血液得到的模板DNA上分析1号染色体上多个STR。每种STR,或者是母亲或者是父亲来源,将以大约相同的量存在。然而,具有三体性21时,STR PCR产物之一当母亲和父亲SRT长度不同(杂合STR)时将以更高的量存在。关于一条染色体上每种杂合SRT的比例可以与不同染色体上每种杂合SRT的比例相比较,其中差异表明染色体异常的存在与否。
试剂盒
本发明的方法通过将在这些方法中使用的试剂以试剂盒形式提供而非常便于实施。试剂盒优选含有一种或多种下面的组分:试剂盒使用的书面说明书、适宜的缓冲剂、盐、DNA提取去污剂、引物、核苷酸、标记的核苷酸、5’末端修饰物质,以及如果需要,还有适宜纯度的水,包装在分开的容器或包装中,这些组分使得试剂盒的使用者可提取合适的核酸样品,并根据本发明的方法分析该样品。试剂盒提供的引物将根据试剂盒的目的和使用试剂盒想要检测的DNA而变。
也可以设计试剂盒以检测期望的或单核苷酸多态性变化,特别是与那些不希望的症状或疾病相关的变化。例如,试剂盒可以含有(在其他组分中)一套或几套引物以扩增与亨庭顿疾病相关的一个或多个目标基因座。另一种试剂盒可含有(在其他组分中)一套或几套针对易患I型或II型糖尿病相关的基因的引物。另外,另一种试剂盒可含有(在其他组分中)一套或几套针对易患心脏疾病相关的基因的引物。这些试剂盒的详细用途在下面章节“用途”中提供。
用途
无论何时想要知道个体的基因型都可以使用本发明的方法。本发明的方法特别用于检测遗传紊乱。本发明的方法特别用作非侵入性技术以检测胎儿中的遗传紊乱。在一个优选的实施方案中,本发明的方法提供了鉴定单核苷酸多态性的方法。
在一个优选的实施方案中,本发明用于检测染色体异常,包括但不限于三体性、单体性、重复、缺失、加入、染色体重排、易位和其他非整倍性。本发明方法特别用于检测胎儿的染色体异常。
在一个优选的实施方案中,本发明的方法提供了鉴定胎儿疾病,特别是由于基因组序列的存在而出现的遗传疾病的存在,或期望在个体中鉴定的其他生物学状况。基于此类基因组序列的存在而在胎儿中进行这种序列的鉴定可用于例如确定胎儿是否为携带者或者用于估计胎儿是否易于产生某种遗传特征、病症或疾病。本发明的方法特别用于双亲和孩子的产前遗传检测。
可以通过本发明诊断的疾病的实例在表IV中列出。
                              表IV
软骨发育不全(Achondroplasia)
X连锁的肾上腺脑白质营养不良(Adrenoleukodystrophy,X-Linked)
X连锁的丙种球蛋白缺乏症(Agammaglobulinemia,X-Linked)
阿拉日耶综合征(Alagille Syndrome)
α-地中海贫血X连锁的精神发育迟缓综合征(Alpha-Thalassemia X-Linked Mental Retardation Syndrome)
阿尔茨海默病(Alzheimer Disease)
阿尔茨海默病,家族性早期发作(Alzheimer Disease,Early-Onset Familial)
肌萎缩侧索硬化(Amyotrophic Lateral Sclerosis Overview)
雄激素不敏感性综合征(Androgen Insensitivity Syndrome)
安格尔曼综合征(Angelman Syndrome)
共济失调总览,遗传性的(Staxia Overview,Hereditary)
共济失调-毛细血管扩张症(Ataxia-Thalassemia)
贝克尔肌营养不良(Becker Muscular Dystrophy also TheDystrophinopathies)
贝-威综合征(Beckwith-Wiedemann Syndrome)
β-地中海贫血(Beta-Thalassemia)
生物素酶缺乏症(Biotinidase Deficiency)
Branchiootorenal Syndrome
BRCA1和BRCA2遗传性乳腺/卵巢癌(BRCA1 and BRCA2 Hereditary Breast/Ovarian Cancer)
乳腺癌(Breast Cancer)
CADASIL
刀豆病(Canavan Disease)
癌(Cancer)
沙-马-图遗传性神经病(Charcot-Marie-Tooth Hereditary Neuropathy)
沙-马-图1型神经病(Charcot-Marie-Tooth Neuropathy Type1)
沙-马-图2型神经病(Charcot-Marie-Tooth Neuropathy Type2)
沙-马-图4型神经病(Charcot-Marie-Tooth Neuropathy Type4)
沙-马-图X型神经病(Charcot-Marie-Tooth Neuropathy TypeX)
科凯恩综合征(Cockayne Syndrome)
结肠癌(Colon Cancer)
先天性挛缩性细长指(趾)(Contractural Arachnodactyly,Congenital)
颅缝骨早闭综合征(FGFR相关)(Craniosynostosis Syndromes(FGFR-Related))
囊性纤维化(Cystic Fibrosis)
胱氨酸贮积症(Cystinosis)
聋及遗传性听力丧失(Deafness and Hereditary Hearing Loss)
DRPLA(Dentatorubral-Pallidoluysian Atrophy)
迪乔治综合征(也称22q11缺失综合征)(DiGeorge Syndrome(also 22q11 Deletion Syndrome))
X连锁的扩张型心肌病(Dilated Cardiomyopathy,X-Linked)
唐氏综合征(21三体性)(Down Syndrome(Trisomy 21))
迪谢内肌营养不良(也为营养不良病)(Duchenne Muscular Dystrophy(also The Dystrophinopathies))
原发性早发张力失常(DYT1)(Dystonia,Early-Onset Primary(DYT1))
营养不良(Dystrophinopathies,The)
脊柱后凹型埃-当综合征(Ehlers-Danlos Syndrome,Kyphoscoliotic Form)
血管型埃-当综合征(Ehlers-Danlos Syndrome,Vascular Type)
单纯性大疱性表皮松解症(Epidermolysis Bullosa Simplex)
遗传性多发性外生骨疣(Exostoses,Hereditary Multiple)
面肩胛臂肌营养不良(Facioscapulohumeral Muscular Dystrophy)
第V因子血栓形成倾向(Factor V Leiden Thrombophilia)
家族性腺瘤息肉(FAP)(Familial Adenomatous Polyposis(FAP))
家族性地中海发热(Familial Mediterranean Fever)
脆性X综合征(Fragile X Syndrome)
弗里德赖希共济失调(Friedreich Ataxia)
伴随帕金森综合征-17的额颞骨痴呆(Frontotemporal Dementia with Parkinsonism-17)
半乳糖血症(Galactosemia)
高歇病(Gaucher Disease)
遗传性血色病(Hemochromatosis,Hereditary)
血友病A(Hemophilia A)
血友病B(Hemophilia B)
遗传性出血性毛细血管扩张症(Hemorrhagic Telangiectasia,Hereditary)
非综合征性听力减退和耳聋,DFNA(连接蛋白26)(hearing Loss and Deafness,Nonsyndromic,DFNA(Connexin 26))
非综合征性听力减退和耳聋,DFNB1(连接蛋白26)(hearing Loss and Deafness,Nonsyndromic,DFNB1(Connexin 26))
遗传性强直性截瘫(Hereditary Spastic Paraplegia)
赫-普综合征(Hermansky-Pudlak Syndrome)
己糖胺酶A缺乏症(也称泰-萨病)(Hexosaminidase A Deficiency(also Tay-Sachs))
亨庭顿病(Huntington Disease)
软骨发育不良(Hypochondroplasia)
先天性鱼鳞病,常染色体隐性的(Ichthyosis,Congenital,AutosomalRecessive)
色素失禁(Incontinentia Pigmenti)
肯尼迪病(也称脊柱和延髓肌萎缩)(Kennedy Disease(also Spinal and Bulbar Muscular Atrophy))
克拉贝病(Krabbe Disease)
莱伯遗传性视神经病(Leber Hereditary Optic Neuropathy)
莱-尼综合征白血病(Lesch-Nyhan Syndrome Leukemias)
Li-Fraumeni综合征(Li-Fraumeni Syndrome)
肢带型肌营养不良(Limb-Girdle Muscular Dystrophy)
家族性脂蛋白脂酶缺乏(Lipoprotein Lipase Deficiency,Familial)
无脑回畸形(Lissencephaly)
马方综合征(Marfan Syndrome)
MELAS(线粒体脑脊髓病、乳酸中毒及中风样发作)MELAS(Mitochondrial Encephalomyopathy,Lactic Acidosis,and Stroke-Like Episodes)
单染色体(Monosomies)
2型多发性内分泌腺瘤形成(Multiple Endocrine Neoplasia Type 2)
遗传的先天性肌营养不良,多发性外生骨疣(Multiple Exostoses,Hereditary Muscular Dystrophy,Congenital)
营养不良性肌强直(Myotonic Dystrophy)
肾源性尿崩症(Nephrogenic Diabetes Insipidus)
神经纤维瘤病1(Neurofibromatosis 1)
神经纤维瘤病2(Neurofibromatosis 2)
遗传性压迫易感性神经病(Neuropathy with liability to Pressure Palsies,Hereditary)
C型尼-皮病(Niemann-Pick Disease Type C)
Nijmegen Breakage Syndrome诺里病(Nijmegen Breakage Syndrome Norrie Disease)
1型眼与皮肤白化病(Oculocutaneous Albinism Type 1)
眼与咽的肌营养不良(Oculopharyngeal Muscular Dystrophy)
卵巢癌(Ovarian Cancer)
Pallister-Hall综合征(Pallister-Hall Syndrome)
青少年帕金森病的Parkin型(Parkin Type of Juvenile Parkinson Disease)
佩-梅病(Pelizaeus-Merzbacher Disease)
彭德雷德综合征(Pendred Syndrome)
波-杰综合征苯丙氨酸羟化酶缺乏(Peutz-Jeghers Syndrome Phenylalanine Hydroxylase Deficiency)
普-威综合征(Prader-Willi Syndrome)
PROP1-相关结合的垂体激素缺乏(PROP1-Related Combined Pituitary Hormone Deficiency(CPHD))
前列腺癌(Prostate Cancer)
视网膜色素变(Retinitis Pigmentosa)
视网膜神经胶质瘤(Retinoblastoma)
罗汤综合征(Rothmund-Thomson Syndrome)
史-莱-奥综合征(Smith-Lemli-Opitz Syndrome)
遗传性痉挛性截瘫(Spastic Paraplegia,Hereditary)
脊柱和延髓肌萎缩(也称肯尼迪病)(Spinal and Bulbar Muscular Atrophy(also Kennedy Disease))
脊柱肌萎缩(Spinal Muscular Atrophy)
脊髓小脑共济失调1型(Spinocerebellar Ataxia Type 1)
脊髓小脑共济失调2型(Spinocerebellar Ataxia Type 2)
脊髓小脑共济失调3型(Spinocerebellar Ataxia Type 3)
脊髓小脑共济失调6型(Spinocerebellar Ataxia Type 6)
脊髓小脑共济失调7型(Spinocerebellar Ataxia Type 7)
Stickler综合征(遗传性关节眼病)(Stickler Syndrome(Hereditary Arthroophthalmopathy))
泰-萨病(也称GM2神经节苷脂病)(Tay-Sachs(also GM2 Gangliosidoses))
三体性(Trisomies)
结节硬化性复征(Tuberous Sclerosis Complex)
l型厄舍综合征(Usher Syndrome Type I)
II型厄舍综合征(Usher Syndrome Type II)
腭帆-心-面综合征(也称22q11缺失综合征)(Velocardiofacial Syndrome(also 22q11 Deletion Syndrome))
Von Hippel-Lindau综合征(Von Hippel-Lindau Syndrome)
威廉姆斯综合征(Williams Syndrome)
威尔逊症(Wilson Disease)
X-连锁的肾上腺脑白质营养不良(X-Linked Adrenoleukodystrophy)
X-连锁的丙种球旦白缺乏症(X-Linked Agammaglobulinemia)
X-连锁的扩张型心脏病(也称为营养不良病)(X-Linked Dilated Cardiomyopathy(also The Dystrophinopathies))
X-连锁面压过低的精神发育迟缓综合征(X-Linked Hypotonic Facies Mental Retardation Syndrome)
本发明的方法用于个体的多个目标基因座,如与数十、数百或甚至数千与遗传特征或遗传疾病相关的目标基因座的筛选,这可通过对与特征或疾病,特别是那些最经常与这种特征或疾病相关的目标基因座的测序来实现。本发明用于分析特定的一组疾病,这些疾病包括但不限于心脏疾病、癌、内分泌失调、免疫失调、神经失调、肌肉骨骼失调、眼科的失调、遗传异常、三体性、单体性、颠换、易位、皮肤疾病和家族性疾病。
本发明的方法也可用于证明或鉴定未知序列的DNA与已知来源或序列的DNA之间的关系,例如,用于母系和父系检验,等等。
现在已经一般性地描述了本发明,通过参考特定实施例将使本发明更好地理解,除非特别说明,此处包括的这些实施例仅仅用于阐明而不旨在限制。
实施例
下面的实施例仅仅是阐明性的并且不用于限制权利要求书所限定的本发明范围。
实施例1
通过PCR扩增DNA序列,其中第一轮循环中的退火步骤在特定温度下进行,然后在第二轮循环中升温,在第三轮循环中进一步升温,目的是减少非特异扩增。PCR的第一轮循环的TM1通过计算与第二引物的3’区(其与模板DNA退火)的解链温度确定。例如,在图1B中,TM1可以约为区“c”的解链温度。退火温度在第二轮循环中升高到TM2,其约为第一引物的3’区(其与模板DNA退火)的解链温度。例如,在图1C中,退火温度(TM2)相当于区“b”的解链温度。在第三轮循环中,退火温度上升到TM3,其约是第二引物全部序列的退火温度。例如,在图1D中,退火温度(TM3)相当于区“c”+区“d”的解链温度。在TM3进行剩下的扩增循环。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的5ml血样制备模板DNA。从36个志愿者收集血液。使用QIAGEN提供的QIAamp DNA BloodMidi试剂盒(目录号51183)从每种血样分离模板DNA。分离后,将来自36个志愿者的每一个的模板DNA合并待进一步分析。
引物设计
分析了下面的四种单核苷酸多态性:SNP HC21S00340(人21号染色体cSNP数据库给出的标识号(图3,泳道1),位于21号染色体;位于1号染色体上的SNP TSC 0095512(图3,泳道2),位于1号染色体上的SNPTSC 0214366(图3,泳道3)和位于1号染色体上的SNP TSC 0087315(图3,泳道4)。SNP Consortium Ltd数据库可从http://snp.cshl.org/进入,为2002年2月14日有效的网址。
使用下面的引物扩增SNP HC21S00340:
第一引物:
5′TAGAATAGCACTGAATTCAGGAATACAATCATTGTCAC 3′
第二引物:
5′ATCACGATAAACGGCCAAACTCAGGTTA3′
使用下面的引物扩增SNP TSC0095512:
第一引物:
5′AAGTTTAGATCAGAATTCGTGAAAGCAGAAGTTGTCTG3′
第二引物:
5′TCTCCAACTAACGGCTCATCGAGTAAAG3′
使用下面的引物扩增SNP TSC0214366:
第一引物:
5′ATGACTAGCTATGAATTCGTTCAAGGTAGAAAATGGAA 3′
第二引物:
5′GAGAATTAGAACGGCCCAAATCCCACTC3′
使用下面的引物扩增SNP TSC 0087315:
第一引物:
5′TTACAATGCATGAATTCATCTTGGTCTCTCAAAGTGC3′
第二引物:
5′TGGACCATAAACGGCCAAAAACTGTAAG 3′。
设计所有的引物使得3’区与每个目标基因座侧翼的上游或下游序列互补并且5’区含有一个限制酶识别位点。第一引物含有一个5’端生物素标签和限制酶EcoR I的识别位点。第二引物含有限制酶BceA I的识别位点。
PCR反应
使用PCR从模板基因组DNA扩增所有四种目标基因座(美国专利号4,683,195和4,682,202)。PCR反应的组分如下:40ng模板DNA,5μM第一引物,5μM第二引物,从Qiagen得到的1X HotStarTaq Master Mix(目录号203443)。HotStarTaq Master Mix含有DNA聚合酶、PCR缓冲剂、每种dNTP200μM和1.5mM MgCl2
使用三种不同系列的退火温度(此处称为低严紧性退火温度、中严紧性退火温度和高严紧性退火温度)进行含有目标SNP的每种模板DNA的扩增。不管退火温度方案如何,每种PCR反应由40个循环的扩增组成。使用Qiagen提供的HotStarTaq Master Mix试剂盒进行PCR反应。如生产商所教导的,反应物在95℃孵育15分钟后进行PCR的第一次循环。每次延伸步骤后的变性步骤在95℃进行30秒。退火反应在允许有效延伸而温度无任何增加的温度下进行。
低严紧性退火反应包括每次头三轮循环中三种不同的退火温度。第一轮循环的退火温度为37℃30秒;第二轮循环的退火温度为57℃30秒;第三轮循环的退火温度为64℃30秒。在64℃下进行随后循环的退火直到完成。
如凝胶照片(图3A)所显示的,SNP TSC 0087315扩增后观察到多条带(泳道4)。SNP HC21 S00340(泳道1)、SNP TSC0095512(泳道2)和SNPTSC0214366(泳道3)的扩增产生一个高亮度带和一个弱亮度带,其具有更高的分子量。当使用低退火温度条件时,产生正确大小的产物并且这是每个反应中主要的产物。
中严紧性退火反应包括每次头三轮循环中三种不同的退火温度。第一轮循环的退火温度为40℃30秒;第二轮循环的退火温度为60℃30秒;第三轮循环的退火温度为67℃30秒。在67℃下进行随后循环的退火直到完成。类似于在低严紧性退火条件下所观察到的,中严紧性条件下SNP TSC0087315的扩增(图3B,泳道4)产生了多条带。其他三种SNP的扩增(泳道1-3)产生了一条带。这些结果表明可变退火温度可用于使用具有13个碱基退火长度的引物从基因座DNA清楚地扩增目标基因座。
高严紧性退火反应包括每次头三轮循环中三种不同的退火温度。第一轮循环的退火温度为46℃30秒;第二轮循环的退火温度为65℃30秒;第三轮循环的退火温度为72℃30秒。在72℃下进行随后循环的退火直到完成。如在凝胶照片(图3C)中所显示的,使用高严紧性退火温度对SNPTSC0087315的扩增(泳道4)产生了正确分子量的一条带。通过升高头三轮循环中每一轮的退火温度,消除了非特异性扩增。SNP TSC0095512的扩增(泳道2)产生了单带。SNP HC21S00340(泳道1)和TSC0214366(泳道3)在该高严紧性退火温度下不能扩增,然而,在中严紧性退火温度下,这些SNP作为单带扩增。这些结果表明变化的退火温度可用于减少非特异性PCR产物,如对SNP TSC0087315(图3,泳道4)所表明的。
实施例2
分析了1号染色体上(TSC0095512)、13号染色体上(TSC0264580)和21号染色体(HC21S00027)上的SNP。使用两个不同的引物组分析了SNPTSC0095512,使用两种类型的用于掺入核苷酸的反应分析了SNPHC21S00027。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的5ml血样制备模板DNA。使用QIAGEN提供的QIAamp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。分离后,将来自36个人类志愿者的模板DNA合并并用限制酶EcoR I切割。按照生产商的说明书进行限制酶消化。
引物设计
使用下面的引物组通过PCR扩增SNP HC21S00027:
第一引物:
5’ATAACCGTATGCGAATTCTATAATTTTCCTGATAAAGG 3′
第二引物:
5′CTTAAATCAGGGGACTAGGTAAACTTCA 3′
第一引物含有最5’端生物素标签和限制酶EcoRI识别的核酸序列。第二引物含有限制酶BsmF I识别的核苷酸序列(图4A)。
同样,通过PCR使用相同的第一引物但是不同的第二引物扩增SNPHC21S00027,第二引物具有下面的序列:
第二引物:
5′CTTAAATCAGACGGCTAGGTAAACTTCA 3′
该第二引物含有限制酶BceA I的识别位点(图4B)。
使用下面的引物通过PCR扩增SNP TSC0095512:
第一引物:
5’AAGTTTAGATCAGAATTCGTGAAAGCAGAAGTTGTCTG 3′
第二引物:
5′TCTCCAACTAGGGACTCATCGAGTAAAG 3′
第一引物含有5’端生物素标签并含有EcoRI的限制酶识别位点。第二引物含有BsmF I的限制酶识别位点(图4C)。
同样,使用相同的第一引物但是不同的具有下面的序列的第二引物扩增SNP TSCO095512:
第二引物:
5′TCTCCAACTAACGGCTCATCGAGTAAAG 3′
该第二引物含有限制酶BceA I的识别位点(图4D)。
使用下面的引物扩增位于13号染色体上的SNP TSC0264580:
第一引物:
5’AACGCCGGGCGAGAATTCAGTTTTTCAACTTGCAAGG 3′
第二引物:
5′CTACACATATCTGGGACGTTGGCCATCC 3′
第一引物含有最5’端生物素标签并含有EcoRI的限制酶识别位点。第二引物含有BsmF I的限制酶识别位点。
PCR反应
使用聚合酶链式反应从模板基因组DNA扩增所有目标基因座(PCR,美国专利号4,683,195和4,683,202,此处并入作为参考)。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量,但是在该实施例中,使用40ng人基因组DNA模板和每种引物5μM。进行40轮PCR循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一轮循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二轮循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三轮循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三轮循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是具代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。对SNP HC21S00027和SNP TSC095512的PCR产物在图5A-5D中显示。
目标片段的纯化
从基因组模板DNA分离PCR产物。每种PCR产物分装到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645 692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的))4个单独的反应孔中。第一引物含有一个5’生物素标记,从而PCR产物结合至包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物的PCR产物的识别位点处的限制酶消化纯化的PCR产物。使用两种不同的第二引物在单独的反应中扩增SNPHC21S00027(图6A和6B)和SNP TSC0095512(图6C和6D)。图6A(SNPHC21S00027)和图6C(SNP TSC0095512)描述了用限制酶BsmF I(NewEngland Biolabs目录号R0572S)消化后的PCR产物。图6B(SNPHC21S00027)和图6D(SNP TSC0095512)描述了用限制酶BceA I(NewEngland Biolabs,目录号R0623 S)消化后的PCR产物。按照随限制酶提供的使用说明在Streptawell中进行消化。用BsmF I消化SNP TSC0264580。用合适的限制酶消化后,将孔用PBS洗涤3次以除去被切下的片段。
经标记核苷酸的掺入
上述限制酶消化产生具有5’突出端的DNA片段(其含有SNP位点或目标基因座)和3’凹端。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
对于每个SNP,进行四次单独的填平反应;四个反应物的每一种含有一种不同的荧光标记双脱氧核苷酸(ddATP、ddCTP、ddGTP或ddTTP)。将下面的组分加入到每个填平反应中:1μl荧光标记的ddATP、0.5μl未标记的ddNTPs(40μM),其含有除了荧光标记的核苷酸之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。所有的填平反应在40℃下进行10分钟。非荧光标记的ddATP购自FermentasInc.(Hanover,Md.)。所有其他标记试剂从Amersham(Thermo SequenaseDye Terminator Cycle Sequencing Core Kit,US 79565)得到。在荧光标记的ddNTPs的存在下,3’凹端延伸1个碱基,其相应于SNP或目标基因座(图7A-7D)。
标记的ddNTP和未标记的dNTP的混合物也可以用于SNPHC21S00027的“填充”反应中。“填充”条件如上述只是使用含有40μM未标记的dNTP,1μl荧光标记的ddATP、1μl荧光标记的ddCTP、1μl荧光标记的ddGTP、1μl荧光标记的ddTTP的混合物。荧光标记的ddNTP来自Amersham(Thermo Sequenase Dye Terminator Cycle SequencingCore Kit,US 79565;Amersham没有公布荧光核苷酸的浓度)。将SNPHC21S00027用限制酶BsmF I消化产生4碱基的5′突出端。如图7E所示,如果掺入的第一个核苷酸是标记的ddATP,3’凹端被一个碱基填充,允许检测SNP或目标基因座。然而,如果掺入的第一个核苷酸是dNTP,聚合酶继续掺入核苷酸直到ddNTP被掺入。例如,头两个核苷酸可以用dNTP填充,第三个核苷酸用ddNTP填充,则使得突出端中第三个核苷酸可被检测。从而,可以确定全部5’突出端的序列,这增加了从单个SNP或目标基因座得到的信息。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段(图8A-8D)。在120转/分钟摇动下于37℃下消化进行1小时。
目标基因座的检测
从链亲和素基质释放后,将10μl样品中的2-3μl上样至48孔膜盘(The Gel Company,目录号TAM48-01)中,盘中的样品用48流动膜梳(TheGel Company,目录号AM48)吸附,并插入一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)中。
样品在3000伏3分钟内电泳进凝胶中。除去膜梳,并且将凝胶在ABI377自动测序仪上运行3小时。通过荧光检测掺入的标记的核苷酸。
如图9A所示,在SNP HC21S00027检测来自36个个体样品的两种核苷酸中的一种:腺嘌呤或鸟嘌呤。报道在SNP HC21S00027存在两种核苷酸(http://snp.cshl.org/snpsearch.shtml)。
在SNP TS00095512检测两种核苷酸中的一种:鸟嘌呤或胞嘧啶(图9B)。用含有BceA I识别位点的第二引物或者含有BsmF I识别位点的第二引物扩增目标基因座都得到相同的结果。
如图9C所示,在SNP TSC0264580检测两种核苷酸的一种:腺嘌呤或胞嘧啶。据报道对该SNP位点有两种核苷酸( http://snp.cshl.org/snpsearch.Shtml)。此外,检测到胸腺嘧啶距离目标基因座1个碱基。BsmF I以序列依赖的方式在10/14位切割一些DNA分子,而在11/15位切割具有相同序列的其他DNA分子。当限制酶BsmF I在有义链上距离11个核苷酸和反义链上距离15个核苷酸处切割时,3’凹端距离SNP位点1个碱基。SNPTSC0264580的序列指出SNP位点前的第一个碱基是胸腺嘧啶。在该位置标记的ddNTP的掺入产生了比在10/14处切割的片段小1个碱基的片段。从而,在11/15位切割的DNA分子提供了关于SNP位点前一个碱基的序列信息,在10/14位切割的DNA分子提供了关于SNP位点的序列信息。
使用含有BsmF I识别位点的第二引物扩增SNP HC21S00027。标记的ddNTPs和未标记的dNTPs的混合物被用于填充BsmF I消化产生的5’突出端。如果一个dNTP被掺入,聚合酶继续掺入核苷酸直到ddNTP被掺入。产生了一群DNA片段(每个相差一个碱基),这允许确定突出端的全部序列。
如在图9D中所看到的,检测到腺嘌呤,其与SNP或目标基因座前面的第一个核苷酸(胸腺嘧啶)互补。该核苷酸被检测到是因为BsmF I的11/15切割性质(在上面详述)。在SNP位点检测到一个鸟嘌呤和一个腺嘌呤,它们是报道的该SNP位点的两个核苷酸(图9A)。这两个核苷酸在SNP位点被检测到是因为它们的分子量不同,这使得可以分开这两种核苷酸。检测到的下一个核苷酸是胸腺嘧啶,其与SNP位点下游的核苷酸互补。检测到的下一个核苷酸是鸟嘌呤,其与SNP位点下游两个碱基处的核苷酸互补。最后,检测到腺嘌呤,其与SNP下游第三个核苷酸互补。不仅对SNP位点,而且对SNP位点前一个核苷酸和后三个核苷酸均得到了序列信息。
这些目标基因座没有一个含有突变。然而,如果目标基因座之一含有包括但不限于点突变、插入、缺失、易位或所述突变的任何组合的突变,那么其可通过与共有序列或公开的序列比较加以鉴定。通过将每个目标基因座的序列与在每个目标基因座基因的天然的、非疾病相关序列的比较确定该序列中存在或不存在突变。那么,在序列中发现突变可解释为在个体中存在所指出的疾病,或者如果适宜,解释为个体具有易患所述疾病的倾向。可以估计突变的相对正常的或非突变序列的相对量以确定是否受试者具有突变序列的一个或两个等位基因,从而确定受试者是否是携带者,或者所述突变导致显性或隐性疾病。
实施例3
将来自1号染色体的4个目标基因座和来自21号染色体的2个目标基因座在单独的PCR反应中扩增、合并在一起并分析。设计引物使得每种扩增的目标基因座具有不同大小,这使得可以检测目标基因座。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的5ml血样制备模板DNA。使用QIAGEN提供的QIAamp DNA Blood Midi试剂盒(目录号51183)从每种血样分离模板DNA。按照试剂盒中包括的使用说明书分离模板DNA。模板DNA从36个人类志愿者分离,然后合并成单个样品以待进一步分析。
引物设计
SNP TSC 0087315使用下面的引物扩增:
第一引物:
5′TTACAATGCATGAATTCATCTTGGTCTCTCAAAGTGC 3′
第二引物:
5′TGGACCATAAACGGCCAAAAACTGTAAG 3′
SNP TSC0214366使用下面的引物扩增:
第一引物:
5′ATGACTAGCTATGAATTCGTTCAAGGTAGAAAATGGAA 3′
第二引物:
5′GAGAATTAGAACGGCCCAAATCCCACTC 3′
SNP TSC 0413944使用下面的引物扩增:
第一引物:
5′TACCTTTGATCGAATTCAAGGCCAAAAATATTAAGTT 3′
第二引物:
5′TCGAACTTTAACGGCCTTAGAGTAGAGA 3′
SNP TSC0095512使用下面的引物扩增:
第一引物:
5′AAGTTTTAGATCGAATTCGTGAAAGCAGAAGTTGTCTG 3′
第二引物:
5′TCTCCAACTAACGGCTCATCGAGTAAAG 3′
SNP HC21S00131使用下面的引物扩增:
第一引物:
5′CGATTTCGATAAGAATTCAAAAGCAGTTCTTAGTTCAG 3′
第二引物:
5′TGCGAATCTTACGGCTGCATCACATTCA 3′
SNP HC21S00027使用下面的引物扩增:
第一引物:
5′ATAACCGTATGCGAATTCTATAATTTCCTGATAAAGG 3′
第二引物:
5′CTTAAATCAGACGGCTAGGTAAACTTCA 3′
对于每个SNP,第一引物含有限制酶EcoR I的识别位点并且在最5’端具有生物素标签。用于扩增每个SNP的第二引物含有限制酶BceA I的识别位点。
PCR反应
如实施例2所描述的进行PCR反应,只是使用下面的退火温度:PCR的第一轮循环的退火温度是37℃30秒,PCR的第二轮循环的退火温度是57℃30秒,PCR的第三轮循环的退火温度是64℃30秒。所有随后的循环都具有64℃30秒的退火温度。进行PCR的37次循环。PCR后,从每个反应物中取出1/4体积,并合并到单个管中。
目标片段的纯化
如实施例2所描述的从基因组模板DNA分离PCR产物(现在组合为1个样品,并称作“样品”),只是样品结合到Streptawell微量滴定板的单个孔中。
所分离片段的限制酶消化
将样品用限制酶BceA I消化,该酶结合第二引物中的识别位点。按照随酶提供的用法说明书进行限制酶消化。限制酶消化后,将孔用1X PBS洗涤3次。
核酸的掺入
上述限制酶消化产生了具有5’突出端的DNA分子(其含有SNP位点或目标基因座)和3’凹端。5’突出端作为在DNA聚合酶存在下允许核酸掺入的模板。
下面的组分用于填充反应:1μl荧光标记的ddATP;1μl荧光标记的ddTTP;1μl荧光标记的ddGTP;1μl荧光标记的ddCTP;2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。所有标记试剂从Amersham(Thermo Sequenase DyeTerminator Cycle Sequencing Core试剂盒(US 79565)得到,试剂盒中提供的ddNTPS的浓度是私有的并且没有被Amersham公开)。在荧光标记的ddNTPs的存在下,3’凹端被一个碱基填充,该碱基相应于SNP或目标基因座。
核苷酸掺入后,将Streptawell用1X PBS洗涤3次。然后通过按照生产商的说明书用限制酶EcoR I消化使“填充”的DNA片段从Streptawell释放出来。在120转/分钟摇动下消化在37℃进行1小时。
目标基因座的检测
从链亲和素基质释放后,将10μl样品中的2-3μl上样至48孔膜盘(The Gel Company,目录号TAM48-01)中,盘中的样品用48流动膜梳(TheGel Company,目录号AM48)吸附,并插入一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)中。
样品在3000伏3分钟内电泳进凝胶中。除去膜梳,并且将凝胶在ABI377自动测序仪上运行3小时。通过荧光检测掺入的核苷酸。
设计引物使得每一扩增的目标基因座大小不同。如图10所示,每一扩增的目标基因座相差约5-10个核苷酸,这使得可以通过凝胶电泳将目标基因座相互分离开来。对SNP TSC0087315检测到两种核苷酸,它们是鸟嘌呤和胞嘧啶。它们是报道的在SNP TSC0087315存在的两种核苷酸(http://snp.cshl.org/snpsearch.shtml)。样品含有来自36个个体的模板DNA,并且因为掺入鸟嘌呤的DNA分子与掺入胞嘧啶的DNA分子在分子量上不同,所以可以看见关于每个核苷酸的清晰带。
在SNP HC21S00027检测两种核苷酸:鸟嘌呤和腺嘌呤(图10)。在该SNP位点报道的两种核苷酸是鸟嘌呤和腺嘌呤(http://snp.cshl.org/snpsearch.shtmD。如上面所讨论的,样品含有来自36个个体的模板DNA,并且可以预计在样品中存在两种核苷酸。掺入一个鸟嘌呤的DNA片段的分子量与掺入一个腺嘌呤的DNA片段的不同,使得可以检测两种核苷酸。
在SNP TSC0214366检测到核苷酸胞嘧啶(图10)。据报道在该SNP位置存在的两种核苷酸是胸腺嘧啶和胞嘧啶。
在SNP TSC0413944检测到核苷酸鸟嘌呤(图10)。据报道在该SNP位置存在的两种核苷酸是鸟嘌呤和胞嘧啶(http://snp.cshl.org/snpsearch.shtml)。
在SNP TSC00095512检测到核苷酸胞嘧啶(图10)。据报道在该SNP位置存在的两种核苷酸是鸟嘌呤和胞嘧啶(http://snp.cshl.org/snpsearch.shtml)。
在SNP HC21S00131检测到核苷酸鸟嘌呤(图10)。据报道在该SNP位置存在的两种核苷酸是鸟嘌呤和腺嘌呤(http://snp.cshl.org/snpsearch.shtml)。
如上面所讨论的,样品含有来自36个个体的模板DNA,并且可以预计在SNP位点存在两种核苷酸。对于SNP TSC0413944、TSC0095512、TSC0214366和HC21S00131,检测到两种核苷酸中的一种。对这些位点可能在样品中存在所报道的两种核苷酸但是一种荧光染料压制了另一种。掺入一个核苷酸的DNA分子的分子量不足以允许掺入另一个核苷酸的DNA分子的分离。然而,易于将SNPs相互分开,对于每一SNP而言,掺入了一个正确的核苷酸。确定了来自多条染色体的多个目标基因座的序列,其中所述多条染色体的多个目标基因座序列在PCR后作为单个样品进行处理。
用含有多个目标基因座的样品进行含有荧光标记的ddNTPs的单个反应。备选地,可进行4次单独的填充反应,其中每次反应含有一种荧光标记的核苷酸(ddATP、ddTTP、ddGTP或ddCTP)和未标记的ddNTPs(见实施例2,图7A-7D和图9A-C)。四次单独的“填充”反应将允许检测存在于目标基因座的任何核苷酸。例如,如果分析含有来自单个个体的多个目标基因座的样品,并且所述个体在一个或一个以上目标基因座处是杂合的,那么四次单独的“填充”反应可用于确定杂合性目标基因座处的核苷酸。
同样,当分析含有来自多个个体的模板的样品时,四次单独的“填充”反应将允许检测样品中存在的核苷酸,而与在目标基因座发现的该核苷酸的频率无关。例如,如果样品含有来自50个个体的DNA模板,并且个体中的49个在目标基因座处具有胸腺嘧啶,而一个个体具有鸟嘌呤,四次单独的“填充”反应(其中每个“填充”反应在凝胶的分别泳道上运行,如在图9A-9C中所示)的进行将允许检测鸟嘌呤。当分析含有多种DNA模板的样品时,多个“填充”反应将减少对通过质量差别在单个目标基因座区别多个核苷酸的需要。
在该实施例中,分析了多个单核苷酸多态性。还可能确定突变的存在与否,这些突变包括但不限于多个目标基因座的点突变、转变、颠换、易位、插入、缺失。多个目标基因座可来自单条染色体或来自多条染色体。多个目标基因座可来自单个基因或多个基因。
可以确定导致或易产生疾病表型的多个目标基因座的序列。例如,可以扩增与癌症或其他疾病相关的一种到数十种到数百种到数千种基因。可以设计引物使得每一扩增的目标基因座大小不同。PCR后,可将扩增的目标基因座合并并作为单个样品看待。备选地,可以在一次PCR反应中扩增多个目标基因座,或者目标基因座的总数目例如100可以分成小样品,例如每次PCR反应10个目标基因座,然后以后再合并。如此处所阐明的,可以确定多个目标基因座的序列。从而,在一个反应中,可以确定导致或易产生疾病表型的一种到数十种到数百种到数千种基因的序列。
实施例4
使用来自怀孕女性的样品的游离胎儿DNA确定其序列或检测胎儿染色体异常的能力受到游离胎儿DNA的低百分率的阻碍。增加游离胎儿DNA的百分率将增强突变、插入、缺失、易位、颠换、单体性、三体性、三体性21、三体性18、三体性13、XXY、XXX、其他非整倍性、缺失、加入、扩增、易位和重排的检测。从怀孕女性得到的血浆中胎儿DNA的百分率在缺乏和存在细胞裂解抑制剂时确定。Y染色体上的遗传标记被用于计算胎儿DNA的百分数。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的5ml血样制备模板DNA。将血液等分到两个管(Fischer Scientific,9ml EDTA Vacuette管,目录号NC9897284)。将甲醛(25μl/ml血液)加到一个管中。另一个管中的样品保持不处理,只是存在EDTA。将两只管在1000转/分钟旋转10分钟。每种样品的上清液(血浆)的2毫升被转移到新管中并在3000转/分钟下旋转10分钟。每种样品的800μl被用作DNA纯化。使用从血细胞纯化DNA的Qiagen Midi试剂盒(QIAmp DNA Blood Midi试剂盒,目录号51183)分离DNA。在100μl蒸馏水中洗脱DNA。得到两种DNA模板:一种来自用EDTA处理的血样,一种来自用EDTA和甲醛处理的血样。
引物设计
使用两组不同的引物:一个引物组对Y染色体特异,从而对胎儿DNA特异,另一个引物组被设计用于扩增囊性纤维化基因,其存在于母亲模板DNA和胎儿模板DNA上。
在该实施例中,设计第一引物和第二引物使得每种引物的整个5’和3’序列与模板DNA退火。在该实施例中,胎儿具有XY基因型,Y染色体被用作胎儿DNA存在的标记。设计下面的引物以扩增Y染色体上的SRY基因。
第一引物:
5′TGGCGATTAAGTCAAATTCGC 3′
第二引物:
5’CCCCCTAGTACCCTGACAATGTATT 3′
设计引物以扩增可用于检测母亲和胎儿DNA的任何基因,或一个区域的区,或者染色体的一部分。在该实施例中,设计下面的引物以扩增囊性纤维化基因:
第一引物:
5′CTGTTCTGTGATATTATGTGTGGT 3′
第二引物:
5′AATTGTTGGCATTCCAGCATTG 3′
PCR反应
使用PCR从模板基因组DNA扩增SRY基因和囊性纤维化基因(美国专利号4,683,195和4,683,202)。为了增加特异性,使用“热-启动”PCR。使用Qiagen提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。为了扩增SRY基因,将从Qiagen纯化柱洗脱下来的DNA连续以1∶2稀释。为了扩增囊性纤维化基因,将从Qiagen纯化柱洗脱下来的DNA以1∶4稀释,然后连续以1∶2稀释。下面的组分用于每个PCR反应:8μl模板DNA(稀释或未稀释的),每种引物(5μM)1μl、10μl HotStar Taq混合物。使用下面的PCR条件:
(1)95℃15分钟
(2)94℃1分钟
(3)54℃15秒
(4)72℃30秒
(5)将步骤2-4重复45个循环
(6)72℃10分钟
胎儿DNA的定量
将从Qiagen柱洗脱下列的DNA模板连续稀释到下面的浓度:1∶2、1∶4、1∶8、1∶16、1∶32、1∶64、1∶128、1∶256、1∶512、1∶1024、1∶2048和1∶4096。使用未稀释的、1∶2、1∶4、1∶8、1∶16、1∶32、1∶64、1∶128、1∶256、1∶512稀释的模板进行SRY基因的扩增。使用以1∶4、1∶8、1∶16、1∶32、1∶64、1∶128、1∶256、1∶512、1∶1024、1∶2048和1∶4096稀释的DNA模板进行囊性纤维化基因的扩增。对从只用EDTA处理的血浆样品和用EDTA和甲醛处理的血浆样品纯化的DNA进行相同的稀释系列。
使用从EDTA处理的血浆样品分离的DNA模板进行PCR反应的结果如图11A所示。从未稀释的和以1∶2稀释的DNA模板扩增SRY基因(图11A)。SRY基因没有在后7个连续稀释中扩增。另一方面,在高达1∶256的连续稀释中检测到囊性纤维化基因。期望更多地存在囊性纤维化基因因为血浆中存在较高百分比的母亲DNA。推断认为为了扩增基因产物,所提供的最后稀释样品具有囊性纤维化基因或SRY基因的一份拷贝。
使用分离自用甲醛和EDTA处理的血浆样品的模板DNA进行PCR反应的结果如图11B所示。SRY基因从未稀释的DNA模板扩增,并且也在以1∶2稀释的样品中扩增(图11b)。SRY基因没有在后6个稀释液扩增。然而,在1∶256稀释液中,检测到SRY基因。不可能在1∶256样品中的扩增代表真实信号,因为前面的6个稀释系列对SRY扩增都是阴性的。在该样品中的SRY基因扩增可能是由所用的高次数PCR循环导致的实验假象。从而,1∶256样品没有被用于计算样品中存在的胎儿DNA的量。
在1∶6稀释的样品中检测到囊性纤维化基因的扩增。福尔马林的存在防止了母亲细胞裂解,从而,样品中具有较低百分比的母亲DNA。这和只用EDTA处理的样品(其支持高达1∶256稀释的扩增)形成强烈对比。
母亲血浆中存在的胎儿DNA的百分数使用下面的式子计算:
%胎儿DNA=(SRY基因的量/囊性纤维化基因的量)*2*100。
SRY基因的量由基因在其中扩增的最高稀释值表示。同样,囊性纤维化基因的量由该基因在其中扩增的最高稀释值表示。该式子含有乘法因子2,其用于标准化下面的事实:SRY基因(位于Y染色体上)只有一份拷贝,而囊性纤维化基因有两份拷贝。
对于上面的例子,只用EDTA处理的样品中存在的胎儿DNA的百分数为1.56%(2/256*2*100)。报道的血浆中存在的胎儿DNA的百分数为0.39-11.9%(Pertl和Bianchi,Obstetrics and Gynecology,Vol.98,No.3,483-490(2001)。用福尔马林和EDTA处理的样品中存在的胎儿DNA的百分数为25%(2/16*2*100)。实验重复多次,每次福尔马林的存在都增加了胎儿DNA的总百分数。
如上计算含有和不含有福尔马林的来自18种血样的胎儿DNA的百分数,只是进行1∶5的连续稀释。随着1∶5稀释的进行,允许对SRY基因或囊性纤维化基因进行检测的最后连续稀释可以含有基因的一份拷贝或者基因的4份拷贝。从含有和不含有福尔马林的18个样品得到的结果在表V中总结。低界限假定最后的稀释样品中具有基因的一份拷贝,高界限假定最后稀释液具有基因的4份拷贝。
表V含有和不含有福尔马林的胎儿DNA的平均百分数
    样品     较低界限     较高界限
    福尔马林     19.47     43.69
    无福尔马林     7.71     22.1
通过减少母亲细胞裂解实现了胎儿DNA总的增加,从而,减少了样品中存在的母亲DNA的量。在该实施例中,福尔马林用于防止细胞裂解,然而,可以使用防止细胞裂解或增加细胞结构完整性的任何试剂。可以使用两种或两种以上的细胞裂解抑制剂。母亲血浆中胎儿DNA的增加允许确定胎儿DNA的序列,并提供了异常DNA序列或染色体异常的快速检测,这些异常DNA序列或染色体异常包括但不限于点突变、读框移位、转换、颠换、加入、插入、缺失、加入-缺失、框偏移、错义、反向突变和微卫星改变、三体性、单体性、其他非整倍性、扩增、重排、易位、颠换、缺失、加入、扩增、片段、易位和重排。
实施例5
分析了基因型具有三体性21的个体的DNA模板。分析了13号染色体上的3个目标基因座和21号染色体上的2个基因座。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的5ml血样制备模板DNA。这些人类志愿者的基因型事先被鉴定为具有额外的21号染色体(三体性21)。使用QIAGEN提供的QIAamp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。
引物设计
分析了下面的5种单核苷酸多态性:位于21号染色体上的SNP TSC0115603;位于21号染色体上的SNP TSC 03209610;位于13号染色体上的SNP TSC 0198557;位于13号染色体上的SNP TSC 0200347。来自另一个个体的DNA模板被用作内对照。SNP TSC 0200347(其在以前被鉴定为对鸟嘌呤纯合)被用作内对照。可以在http://snp.cshl.org/进入SNPConsortium Ltd数据库,为2002年4月1日的有效网址。
使用下面的引物扩增SNP TSC 0115603:
第一引物:
5′GTGCACTTACGTGAATTCAGATGAACGTGATGTAGTAG 3′
第二引物:
5′TCCTCGTACTCAACGGCTTTCTCTGAAT 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
使用下面的引物扩增SNP TSC 0309610:
第一引物:
5′TCCGGAACACTAGAATTCTTATTTACATACACACTTGT 3′
第二引物:
5′CGAATAAGGTAGACGGCAACAATGAGAA 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
使用下面的引物扩增提交的SNP(ss)81377(登记号由NCBI提交的SNP(ss)数据库指定):
第一引物:
5′CGGTAAATCGGAGAATTCAGAGGATTTTAGAGGAGCTAA 3′
第二引物:
5′CTCACGTTCGTTACGGCCATTGTGATAGC 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
使用下面的引物扩增SNP TSC 0198557:
第一引物:
5′GGGGAAACAGTAGAATTCCATATGGACAGAGCTGTACT 3′
第二引物:
5′TGAAGCTGTCGGACGGCCTTTGCCCTCTC 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
使用下面的引物扩增SNP TSC 0197279:
第一引物:
5′ATGGGCAGTTATGAATTCACTACTCCCTGTAGCTTGTT 3′
第二引物:
5′TGATTGGCGCGAACGGCACTCAGAGAAGA 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
使用下面的引物扩增SNP TSC 0200347:
第一引物:
5′CTCAAGGGACCGAATTCGCTGGGTCTTCTCGTGGGTC 3′
第二引物:
5′TAGGGCGGCGTGACGGCCAGCCAGTGGT 3′
第一引物在5’端被生物素化,并含有EcoR I的限制酶识别位点。第二引物含有限制酶BceA I的限制酶识别位点。
PCR反应
使用PCR从模板基因组DNA扩增所有目标基因座(美国专利号4,683,195和4,683,202)。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量;在该实施例中,使用40ng模板人基因组DNA和每种引物5μM。进行PCR的38次循环。对SNP TSC 0115603、SNP TSC 0309610和SNP TSC02003437使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)42℃30秒;
(3)95℃30秒;
(4)60℃30秒;
(5)95℃30秒;
(6)69℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十七(37)次;
(9)72℃5分钟。
对SNP ss813773、SNP TSC 0198557和SNP TSC 0197279使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十七(37)次;
(9)72℃5分钟;
在PCR的第一轮循环中,退火温度约为第二引物的3’退火区的解链温度。PCR的第二轮循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度。PCR的第三轮循环中的退火温度约为第二引物的全部序列的退火温度。在PCR的头三轮循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
使用Qiagen′s MinElute PCR纯化试剂盒(目录号28006)按照生产商的用法说明书从PCR反应物成分分离PCR产物。将PCR产物在20μl蒸馏水中稀释。对于每种扩增的SNP,将1μl PCR产物、1μl扩增的内对照DNA(SNP TSC 0200347),和8μl蒸馏水混合。将5μl每种样品置于Pierce Strepta Well微量滴定板(目录号15501)的两个分别的反应孔中。第一引物含有一个5’生物素标签,因此PCR产生结合链亲和素包被的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以150转/分钟在45℃下进行链亲和素结合反应1小时。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物所得PCR产物的识别位点的限制酶消化经纯化的PCR产物。纯化的PCR产物用限制酶BceA I(New England Biolabs,目录号R0623S)消化。按照随限制酶提供的用法说明书在微量滴定板的孔中进行消化。用合适的限制酶消化后,将孔用PBS洗涤3次以除去切割的片段。
标记的核苷酸的掺入
上述限制酶消化产生具有5’突出端的DNA片段,其含有SNP和3’凹端。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
对于每一SNP,进行两种填充反应;每一反应含有一种不同的荧光标记双脱氧核苷酸(ddATP、ddCTP、ddGTP或ddTTP,取决于在特定SNP存在的报道的核苷酸)。例如,报道在SNP TSC 0115603核苷酸为腺嘌呤和胸腺嘧啶。因此SNP TSC 0115603的经消化PCR产物与荧光标记的ddATP或荧光标记的ddTTP混合。每一反应含有荧光标记的ddATP作为内对照。将下面的组分加入到每个填充反应中:2μl ROX-偶联的ddNTP(取决于为每个SNP报道的核苷酸),2μl ROX-偶联的ddATP(内部对照),2.5μl 10倍sequenase缓冲液、2μl Sequenase和25μl反应所需的水。所有的填充反应在45℃下进行45分钟。然而,可以使用更短的时间。非荧光标记的ddNTPs购自Fermentas Inc.(Hanover,Md.)。ROX-偶联的ddNTPs来自Perkin Elmer。在荧光标记的ddNTPs的存在下,3’凹端延伸1个碱基,其相应于SNP或目标基因座。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放的“填充”DNA片段。在120转/分钟摇动下于37℃下消化进行1小时。
目标基因座的检测
从链亲和素基质释放后,将10μl样品中的3μl装在48孔膜盘(The GelCompany,目录号TAM48-01)中。盘中的样品用48流动膜梳(Tbe GelCompany,目录号AM48)吸附,并插入一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)中。
样品在3000伏3分钟内电泳进凝胶中。除去膜梳,并且将凝胶在ABI377自动测序仪上运行3小时。通过荧光检测掺入的标记的核苷酸。
如图12A所示,SNP TSC 0115603被标记的ddTTP“填充”(泳道1)并在单独的反应中用标记的ddATP“填充”(泳道3)。使用原始数据计算的核苷酸间的比例为66∶34,这和对三体21个体的21号染色体上SNP的理论比值66∶33一致。ddTTP和ddATP都用相同的荧光染料标记以使染料掺入效率的变化最小。然而,可以使用具有不同荧光标签或任何可检测标签的核苷酸。优选使用不同标签时计算掺入系数。
每个填充反应在单独的孔中进行因此可能在微量滴定板的孔之间的DNA结合中存在变化。为了解决DNA结合链亲和素-包被的板的潜在变化,使用了内对照。内对照(SNP TSC 0200347)(其对鸟嘌呤纯合)在将样品分开到两个单独的孔前被加入到样品中,从而,在每个孔中存在等量的内对照。掺入的ddGTP的量在两个反应之间是固定的。如果每个孔中DNA的量是相等的,那么掺入的ddGTP的量应该是相等的,因为反应在饱和条件下进行,饱和条件被定义为支持在每个模板分子掺入核苷酸的条件。使用内对照,掺入的ddATP和ddTTP的比例为63.4和36.6。该比例和用原始数据得到的非常相似,说明在关于特定SNP的两个填充反应中存在微小差异。
表VI.来自三体21个体的DNA模板上多个SNP处的等位基因频率
SNP   等位基因  峰面积  等位基因比例 内对照 正态化峰面积 等位基因比例(%)
  TSC0115630   AT  55992951   6634   723661     55993227(723/661*2951)     63.436.6
  TSC0309610   TC  41262342   6436   14241631     41262045((1424/1631)*2342)     66.833.2
ss813773   AC  41994870   4654   808647     41996082((808/647)*4870)     4159
  TSC0198557   TC  33852741   5545   719559     33853525(719/559*2741)     4951
  TSC0197279   TC  80857207   5347   27522520     80857865(2752/2520*7202)     50.749.3
SNP TSC 0309610用ddTTP(泳道3)或ddCTP(泳道4)填充(图12)。使用原始数据计算的核苷酸间的比例为64∶36。ddTTP和ddCTP都用相同的荧光染料标记。标准化内部对照后,如上面所讨论的,计算的ddTTP与ddCTP的等位基因比例为66.8∶33.2(表VI)。再次,从原始数据计算的比例和使用内在对照计算的比例与关于三体性个体21号染色体上SNP的理论比例66.6∶33.4非常相似。
为了阐明在杂合SNP上核苷酸的66∶33的比例代表以三份拷贝存在的染色体上的基因座,分析了13号染色体上的SNPs。血样所来自的个体以前被使用一个母亲13号染色体和一个父亲13号染色体进行了基因型鉴定。
提交的SNP(ss)813773用ddATP(泳道5)或ddCTP(泳道6)填充(图12)。使用原始数据为在该杂合SNP计算的比例为46∶54。该比例位于预测的比例50∶50的10%以内。重要的是,该比例不接近当存在染色体额外拷贝时预测的比例66∶33。
经用内对照校正后,计算的比例为41∶59。和期望的结果相反,经用内对照校正后增加了实测比例和理论比例的差异。该结果可能代表在等分DNA样品时的实验错误。
同样,可以使用限制酶产生突出端,该突出端用作“填充”反应的模板,其中所述限制酶优选地对一条DNA模板的切割优于另一条DNA模板。这两条模板在SNP位点处的核苷酸不同,并且这可以影响切割。可以设计引物使得与切割位点相邻的核苷酸是相同的,从而与SNP位点处的核苷酸无关(在名为“引物设计”的章节进一步讨论)。
将SNP TSC 0198557(位于13号染色体上)在一个反应中用ddTTP(泳道7)填充,在另一个反应中用ddCTP(泳道8)填充(图12)。使用原始数据为该SNP位点处核苷酸计算的比例为55∶45。用内部对照校正后,计算的T∶C等位基因比例为49∶51。校正比例与关于具有13号染色体2个拷贝的个体的理论比例50∶50接近。
将SNP TSC 0197279(位于13号染色体上)在一个反应中用ddTTP(泳道9)填充,在另一个反应中用ddCTP(泳道10)填充(图12)。使用原始数据为该SNP位点上核苷酸计算的比例为53∶47。用内部对照校正后,计算的T∶C等位基因比例为50.7∶49.3。这与关于具有13号染色体2个拷贝的个体的理论比例50∶50一致。
13号染色体上两个分析的SNP处核苷酸的比例约为50∶50。一个SNP-ss813773-显示出46∶54的比例,当用内部对照校正后,该比例为41∶59。这些比例与预期的50∶50相背离,但是同时,这些比例没有说明额外染色体(其显示的比例为66∶33)。尽管从该特定SNP得到的数据是不确定的,其并不代表假阳性。从该SNP不能得出结论。然而,其他两种SNP提供了指示正常数目的染色体的数据。优选分析一条染色体上多个SNP,这些SNP的数目包括但不限于1-5、5-10、10-50、50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-2000、2000-3000和大于3000。优选地,关于特定染色体的比例的平均值将被用于确定染色体异常的存在与否。然而,也可能分析一个目标基因座。在得到不确定数据的情况下,可以分析另一个目标基因座。
DNA模板所来自的个体事先已被鉴定基因型为三体21,并且在21号染色体上SNPs处等位基因的频率表明存在额外的21号染色体。该额外的染色体为每个SNP贡献了一个额外的核苷酸,从而改变了在杂合SNP上的常规50∶50比例。这些结果与多个SNP的结果一致,并且对在21号染色体上发现的那些SNP是特异的。13号染色体上SNPs的等位基因频率给出了预期的约50∶50的比例。这些结果表明这种SNP检测方法可用于检测染色体异常,这些染色体异常包括但不限于易位、颠换、单体性、单体21、三体18、三体13、其他非整倍性、缺失、加入、扩增、易位和重排。
实施例6
基因组DNA得自知情同意后的四个个体。使用模板DNA分析了13号染色体上的6个SNP(TSC0837969、TSC0034767、TSC1130902、TSC0597888、TSC0195492、TSC0607185)。可以在下面的网站发现关于这些SNP的信息: www.snp.chsl.org/snpsearch.shtml;2003年2月11日的有效网站)。
模板DNA的制备
从通过对知情同意的人类志愿者静脉穿刺得到的9ml血样制备模板DNA。使用QIAGEN提供的QIAamp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。按照试剂盒中的使用说明书分离模板DNA。
引物设计
使用下面的引物组扩增SNP TSC0837969:
第一引物:
5′GGGCTAGTCTCCGAATTCCACCTATCCTACCAAATGTC 3′
第二引物:
5′TAGCTGTAGTTAGGGACTGTTCTGAGCAC 3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座44个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用下面的引物组扩增SNP TSC0034767(50):
第一引物:
5′CGAATGCAAGGCGAATTCGTTAGTAATAACACAGTGCA 3′
第二引物:
5′AAGACTGGATCCGGGACCATGTAGAATAC 3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座50个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用下面的引物组扩增SNP TSC 1130902(60):
第一引物:
5′TCTAACCATTGCGAATTCAGGGCAAGGGGGGTGAGATC 3′
第二引物:
5′TGACTTGGATCCGGGACAACGACTCATCC 3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座60个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用下面的引物组扩增SNP TSC0597888(70):
第一引物:
5′ACCCAGGCGCCAGAATTCTTTAGATAAAGCTGAAGGGA 3′
第二引物:
5′GTTACGGGATCCGGGACTCCATATTGATC 3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座70个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用下面的引物组扩增SNP TSC0195492(80):
第一引物:
5′CGTTGGCTTGAGGAATTCGACCAAAAGAGCCAAGAGAA
第二引物:
5′AAAAAGGGATCCGGGACCTTGACTAGGAC 3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座80个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用下面的引物组扩增SNP TSC0607185(90):
第一引物:
5′ACTTGATTCCGTGAATTCGTTATCAATAAATCTTACAT 3′
第二引物:
5′CAAGTTGGATCCGGGACCCAGGGCTAACC3′
第一引物在5’端具有生物素标签并含有EcoRI的限制酶识别位点。第一引物被设计以从距离目标基因座90个碱基处退火。第二引物含有BsmFI的限制酶识别位点。
使用聚合酶链式反应从模板基因组DNA扩增所有目标基因座(PCR,美国专利号4,683,195和4,683,202,此处并入作为参考)。在该实例中,在单独的反应管中扩增目标基因座,但是它们也可以在单个PCR反应中一起扩增。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量,但是在该实施例中,使用40ng模板人基因组DNA和每种引物5μM。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。在该实施例中,设计第一引物使其从距离目标基因座的各种距离处退火。技术人员理解第一引物的退火位置可以是距离目标基因座5-10、11-15、16-20、21-25、26-30、31-35、36-40、41-45、46-50、51-55、56-60、61-65、66-70、71-75、76-80、81-85、86-90、91-95、96-100、101-105、106-110、111-115、116-120、121-125、126-130、131-140、141-160、161-180、181-200、201-220、221-240、241-260、261-280、281-300、301-350、351-400、401-450、450-500或大约500个碱基。
目标片段的纯化
从基因组模板DNA分离PCR产物。PCR反应后,将来自一个个体的每种PCR反应物的1/4体积在来自Roche Diagnostics GmbH的透明高结合板Streptawall(目录号1 645 692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的)的一个孔中混合。第一引物含有一个5’生物素标记,从而PCR产物结合包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
分离片段的限制酶消化
纯化的PCR产物用限制酶BsmF I消化,该酶结合掺入到来自第二引物的PCR产物的识别位点。按照随限制酶提供的用法说明在Streptawell中进行消化。消化后,用PBS洗涤孔以除去切割的片段。
标记的核苷酸的掺入
用BsmF I的限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
下面,显示了关于SNP TSC0837969的5’突出端。没有复制完整DNA序列,只是展示突出端的部分(其中R表示可变位点)。
5′TTAA
3′AATT       R    A    C    A
突出端位置    1    2    3    4
在5’有义链(此处描述为顶部链)上关于TSC0837969的核苷酸为腺嘌呤和鸟嘌呤。反义链上突出端中的第三个位置对应于胞嘧啶,其与鸟嘌呤互补。由于该可变位点可以是腺嘌呤或鸟嘌呤,在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。对关于鸟嘌呤是纯合的个体、关于腺嘌呤是纯合的或杂合的个体的填充反应图解如下。
在TSC 0837969对鸟嘌呤纯合:
            等位基因1  5’TTAA    G*
                       3’AATT    C    A    C    A
            突出端位置            1    2    3    4
            等位基因2  5’TTAA    G*
                       3’AATT    C    A    C    A
            突出端位置            1    2    3    4
标记的ddGTP被掺入突出端的第一个位置。仅仅看到一个信号,其相应于在突出端的第一个位置用标记的ddGTP填充的分子。
在TSC 0837969对腺嘌呤纯合:
            等位基因1  5’TTAA    A    T    G*
                       3’AATT    T    A    C    A
            突出端位置            1    2    3    4
            等位基因2  5’TTAA    A    T    G*
                       3’AAAT    T    A    C    A
            突出端位置            1    2    3    4
未标记的dATP在突出端的第一个位置掺入,未标记的dTTP在突出端的第二个位置掺入。标记的ddGTP被掺入突出端的第三个位置。仅仅看到一个信号;在3位用ddGTP填充的分子与在1位填充的分子具有不同分子量,这使得容易鉴定对腺嘌呤或鸟嘌呤纯合的个体。
在TSC0837969是杂合的:
            等位基因1  5’TTAA    G*
                       3’AATT    C    A    C    A
            突出端位置            1    2    3    4
            等位基因2  5’TTAA    A    T    G*
                       3’AATT    T    A    C    A
            突出端位置            1    2    3    4
将看见两种信号,一种信号相应于在1位用ddGTP填充的DNA分子,第二种信号相应于在突出端的3位填充的分子。可以使用基于分子量分离的任何一种技术分离这两种信号,这种技术包括但不限于凝胶电泳。
下面,显示了SNP TSC0034767的5’突出端示意图。没有复制完整DNA序列,只是展示突出端的部分(其中R表示可变位点)。
             A    C    A    R    GTGT 3’
                                 CACA 5’
             4    3    2    1    突出端位置
在5’有义链(此处描述为顶部链)上关于TSC0034767的核苷酸为胞嘧啶和鸟嘌呤。突出端中的第二位相应于腺嘌呤,其与胸腺嘧啶互补。突出端中的第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。
在这种情况下,第二引物从目标基因座退火,从而填充反应在反义链(此处描述为底部链)上发生。可填充有义链或者反义链,这取决于是否第二引物(其含有IIS型限制酶识别位点)在目标基因座的上游或下游退火。
下面,显示了关于SNP TSC1130902的5’突出端的示意图。没有复制完整DNA序列,只是展示突出端的部分(其中R表示可变位点)。
            5’TTCAT
            3’AAGTA      R    T    C    C
            突出端位置    1    2    3    4
在5’有义链(此处描述为顶部链)上关于TSC1130902观察到的核苷酸为腺嘌呤和鸟嘌呤。突出端中的第二位相应于胸腺嘧啶,突出端中的第三位相应于胞嘧啶,其与鸟嘌呤互补。
在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。
下面,显示了关于SNP TSC0597888的5’突出端的示意图。没有复制完整DNA序列,只是展示突出端的部分(其中R表示可变位点)。
            T    C    T    R    ATTC 3’
                                TAAG5’
            4    3    2    1    突出端位置
在5’有义链(此处描述为顶部链)上关于TSC0597888观察到的核苷酸为胞嘧啶和鸟嘌呤。突出端中的第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。
下面,显示了关于SNP TSC0607185的5’突出端的示意图。没有复制完整DNA序列,只是展示突出端的部分(其中R表示可变位点)。
             C    C    T    R    TGTC 3’
                                 ACAG 5’
             4    3    2    1    突出端位置
在5’有义链(此处描述为顶部链)上关于TSC0607185观察到的核苷酸为胞嘧啶和胸腺嘧啶。在这种情况下,第二引物从目标基因座退火,允许反义链被填充。反义链(此处描述为底部链)将用鸟嘌呤或腺嘌呤填充。
5’突出端中的第二位为胸腺嘧啶,其与腺嘌呤互补,突出端中第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。
下面,显示了关于SNP TSC0195492的5’突出端的示意图。没有复制完整DNA序列,只是展示突出端的部分。
              5’ATCT
              3’TAGA       R    A    C    A
              突出端位置    1    2    3    4
在该位点观察到的核苷酸为胞嘧啶和鸟嘌呤(此处描述为顶部链)。5’突出端中的第二位为腺嘌呤,其与胸腺嘧啶互补,突出端中第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP用于确定两个等位基因的序列。
如上面所阐述的,6个SNP的两个等位基因的序列可以通过未标记的dCTP、dTTP和dATP存在下用ddGTP标记来确定。下面的组分被加入到每个填充反应中:1μl荧光标记的ddGTP、0.5μl未标记的ddNTPs(40μM),其含有除了鸟嘌呤之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase,和20μl反应所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover,Md.)。所有其他标记试剂从Amersham(Thermo Sequenase Dye Terminator Cycle SequencingCore Kit,US 79565)得到。
标记后,每一Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段。在120转/分钟摇动下于37℃下消化进行1小时。
目标基因座的检测
从链亲和素基质释放后,将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(Hoefer SQ3 Sequencer)上运行3小时。从测序仪移走凝胶并在Typhoon 9400 Variable Mode Imager上扫描。通过荧光检测掺入的标记核苷酸。
如图11所示,关于SNP TSC 0837969,在泳道1和2中的模板DNA对腺嘌呤是纯合的。如果个体对腺嘌呤是纯化的,预计发生下面的填充反应:
在TSC 0837969处对腺嘌呤纯合:
            5’TTAA       A    T    G*
            3’AATT       T    A    C    A
            突出端位置    1    2    3    4
未标记的dATP在与突出端互补的第一位被掺入。未标记的dTTP在与突出端互补的第二位被掺入。标记的ddGTP在与突出端互补的第三位被掺入。仅仅看到一条带,其迁移到丙烯酰胺凝胶的约46位置处。这说明腺嘌呤是在第一位填充的核苷酸。如果核苷酸鸟嘌呤已被填充,预计在44位置处出现一条带。
然而,关于SNP TSC0837969在泳道3和4中的模板DNA是杂合的。如果个体是杂合的将预期下面的填充反应:
在TSC0837969是杂合的:
            等位基因15’TTAA    G*
                     3’AATT    C    A    C    A
            突出端位置          1    2    3    4
            等位基因25’TTAA    A    T    G*
                     3’AATT    T    A    C    A
            突出端位置          1    2    3    4
看到两条不同的带;一条带相应于在与突出端互补的1位(G等位基因)用ddGTP填充的分子。另一条带相应于在与突出端互补的3位(A等位基因)用ddGTP填充的分子。使用凝胶电泳基于分子量的不同分离两条带。一种荧光标记的核苷酸ddGTP被用于确定在SNP位点杂合的个体。这是第一次用单核苷酸有效检测两种不同等位基因的存在。
对于SNP TSC0034767,在泳道1和3中的DNA模板对胞嘧啶和鸟嘌呤是杂合的,如通过两条不同的带所证明的。较低的带相应于在与突出端互补的1位填充的ddGTP。具有稍高的分子量的第二条带相应于在3位填充的ddGTP,说明突出端中的第一位被未标记的dCTP填充,这使得聚合酶可以继续掺入核苷酸直到其在与突出端互补的3位掺入ddGTP。泳道2和4中的模板DNA对鸟嘌呤是纯合的,这可通过比如果ddGTP在与突出端互补的第一位掺入所得到的分子量更高的分子量来证明。
对于SNP TSC1130902,在泳道1、2和4中的DNA模板在可变位点处对腺嘌呤是纯合的,如通过迁移到凝胶的约62位置处的单条较高分子量的带所证明的。泳道3中的模板DNA在可变位点是杂合的,如通过存在两条不同的带所证明的。较低的带相应于在与突出端互补的1位填充的ddGTP(相应于鸟嘌呤等位基因)。具有较高分子量的带相应于在3位填充的ddGTP(腺嘌呤等位基因)。
对于SNP TSC0597888,在泳道1和4中的模板DNA在可变位点处对胞嘧啶是纯合的,在泳道2中模板DNA在可变位点是杂合的,在泳道3中模板DNA对鸟嘌呤是纯合的。预期的填充反应图解如下:
对胞嘧啶纯合:
            等位基因1  T    C    T    G    ATTC 3’
                            G*  A    C    TAAG 5’
                       4    3    2    1    突出端位置
            等位基因2  T    C    T    G    ATTC 3’
                            G*  A    C    TAAG 5’
                       4    3    2    1    突出端位置
对鸟嘌呤是纯合的:
            等位基因1  T    C    T    C    ATTC 3’
                                      G*  TAAG 5’
                       4    3    2    1    突出端位置
            等位基因2  T    C    T    C    ATTC 3’
                                      G*  TAAG 5’
                       4    3    2    1    突出端位置
对鸟嘌呤/胞嘧啶是杂合的:
            等位基因1  T    C    T    G    ATTC 3’
                            G*  A    C    TAAG 5’
                       4    3    2    1    突出端位置
            等位基因2  T    C    T    C    ATTC 3’
                                      G*  TAAG 5’
                       4    3    2    1    突出端位置
在可变位点处对鸟嘌呤纯合的模板DNA显示了单带,其相应于在与突出端互补的1位用ddGTP填充的DNA分子。这些DNA分子与在突出端的3位用ddGTP填充的DNA分子相比具有较低分子量(见SNPTSC0597888的泳道3)。这些DNA分子在分子量上相差2个碱基。
在可变位点处对胞嘧啶纯合的模板DNA显示了单带,其相应于在与突出端互补的3位用ddGTP填充的DNA分子。这些DNA分子具有比在突出端的1位用ddGTP填充的DNA分子更高的分子量(见SNPTSC0597888的泳道1和4)。
在可变位点杂合的模板DNA显示了两条带;一条带相应于在与突出端互补的1位用ddGTP填充的DNA分子并具有较低分子量。另一条带相应于在与突出端互补的3位用ddGTP填充的DNA分子并具有较高分子量(见SNP TSC0597888的泳道3)。
对于SNP TSC0195492,泳道1和3的模板DNA在可变位点处是杂合的,这通过存在两条不同的带证明。泳道2的模板DNA对可变位点的鸟嘌呤是纯合的。泳道4的模板DNA对可变位点的胞嘧啶是纯合的。在泳道4仅仅看见关于该SNP的一条带,并且其具有比在与突出端互补的1位用ddGTP填充的DNA分子更高的分子量。
所报道的关于SNP TSC0607185观察的等位基因为胞嘧啶或胸腺嘧啶。为了一致,SNP协会将所观察到的等位基因指代为如它们在有义链上出现的( www.snp.cshl.org/shpsearch.shtml;在2003年2月11日有效的网站)。对于该SNP,第二引物从目标基因座退火,这允许用BsmF I消化后在反义链上发生填充反应。
在泳道1和3上的模板DNA为杂合的;在泳道2的模板DNA对胸腺嘧啶是纯合的,在泳道4的模板DNA对胞嘧啶是纯合的。反义链用ddGTP填充,因此有义链上的核苷酸相应于胞嘧啶。
可以使用分子量标准(marker)鉴定预期条带的位置。备选地,对于分析的每种SNP,可以使用已知的杂合样品,这将精确鉴定两条预期条带的位置。
如在图11中所显示的,用荧光染料标记的一种核苷酸可用于确定包括但不限于SNP和单核苷酸突变的可变位点的身份。一般,为了鉴定在一个SNP位点个体是纯合的或杂合的,使用用一种染料标记的核苷酸和用另一种染料标记的第二种核苷酸进行多次反应。然而,这在比较结果时产生了问题,因为两种染料具有不同的量子系数。即使不同核苷酸用相同染料标记,量子系数也是不同的。使用一种染料标记的一种核苷酸消除了不同染料的量子系数导致的误差。
在该实施例中,使用荧光标记的ddGTP。然而,该方法可使用用任何信号产生部分标记的核苷酸,该信号部分包括但不限于放射活性分子、荧光分子、抗体、抗体片段、半抗原、糖、生物素、生物素衍生物、磷光部分、发光部分、电化学发光部分、有色部分和具有可检测的电子旋转共振、电容、介电常数或电导的部分。此外,可使用标记的ddATP、ddTTP或ddCTP。
上面的实施例使用了与突出端互补的3位作为第二个等位基因的指示物。然而,也可使用突出端的第二或第四位(见“核苷酸掺入”部分)。此外,使用IIS型酶BsmF I产生突出端;然而可以使用在离结合位点一定距离处切割DNA的任何酶,包括但不限于表1中所列的酶。
同样,在上面的实施例中,SNP位点前一个核苷酸不是在链上填充的鸟嘌呤。这消除了将要除去的IIS型限制酶的备选切割性质的任何影响。例如,在SNP TSC0837969,来自有义链上SNP位点的核苷酸是腺嘌呤。如果BsmF I显示备选切割性质,那么对腺嘌呤等位基因和鸟嘌呤等位基因产生下面的突出端:
        G等位基因-11/15切割    5’TTA
                               3’AAT    T    C    A    C
        突出端位置                       0    1    2    3
        填平后的G等位基因      5’TTA    A    G*
                               3’AAT    T    C    A    C
        突出端位置                       0    1    2    3
        A等位基因11/15切割     5’TTA
                               3’AAT    T    T    A    C
        突出端位置                       0    1    2    3
        填平后的A等位基因      5’TTA    A    A    T    G*
                               3’AAT    T    T    A    C
        突出端位置                       0    1    2    3
对于鸟嘌呤等位基因,突出端中第一位将用dATP填充,这将允许聚合酶在与突出端互补的2位掺入ddGTP。在10/14位切割的分子和在11/15位切割的分子间将没有可检测到的差异。
对于腺嘌呤等位基因,与突出端互补的第一位将用dATP填充,第二位将用dATP填充,第三位将用dTTP填充,第四位将用ddGTP填充。在10/14位切割的分子和在11/15位切割的分子间将没有差异。仅有的差异将相应于DNA分子在可变位点处含有一个腺嘌呤还是在可变位点处含有一个鸟嘌呤。
如在图11中所见,第一引物退火区的定位使得可以在凝胶的单个泳道中分析多个SNP。当使用具有相同染料的相同核苷酸时,可以进行单个填充反应。在该实施例中,在一个泳道中分析了6个SNP。然而,在单个反应中可以分析任何数目的SNP,这些数目包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-40、40-50、51-60、61-70、71-80、81-100、101-120、121-140、141-160、161-180、181-200和大于200。
此外,用于检测两个等位基因的一种经标记核苷酸可以与用于检测不同组SNP的另一种经标记核苷酸混合,条件是两种经标记核苷酸都不在可变位点的前一位置(与11/15切割的0位互补)的话。例如,假设SNP X在可变位点可以是鸟嘌呤或胸腺嘧啶并且在用BsmF I消化后产生下面的5’突出端:
        SNP X 10/14    5’TTGAC
        G等位基因      3’AACTG      C    A    C    T
                       突出端位置    1    2    3    4
        SNP X 11/15    5’TTGA
        G等位基因      3’AACT       G    C    A    C
                       突出端位置    0    1    2    3
        SNP X 10/14    5’TTGAC
        T等位基因      3’AACTG      A    A    C    T
                       突出端位置    1    2    3    4
        SNP X 11/15    5’TTGA
        T等位基因      3’AACT       G    A    A    C
                       突出端位置    0    1    2    3
用标记的ddGTP、未标记的dATP、dCTP和dTTP进行填充反应后,将产生下面的分子:
        SNP X 10/14    5’TTGAC      G*
        G等位基因      3’AACTG      C    A    C    T
                       突出端位置    1    2    3    4
        SNP X 11/15    5’TTGA       C    G*
        G等位基因      3’AACT       G    C    A    C
                       突出端位置    0    1    2    3
        SNP X 10/14    5’TTGAC      T    T    G*
        T等位基因      3’AACTG      A    A    C    T
                       突出端位置    1    2    3    4
        SNP X 11/15    5’TTGA       C    T    T    G*
        T等位基因      3’AACT       G    A    A    C
                       突出端位置    0    1    2    3
现在假设SNP Y在可变位点处可以是腺嘌呤或胸腺嘧啶,并且用BsmF I消化产生下面的5’突出端。
        SNP Y 10/14    5’GTTT
        A等位基因      3’CAAA    T    G    T    A
        突出端位置                1    2    3    4
        SNP Y 11/15    5’GTT
        A等位基因      3’CAAA    T    G    T
        突出端位置                0    1    2    3
        SNP Y 10/14    5’GTTT
        T等位基因      3’CAAA    A    G    T    A
        突出端位置                1    2    3    4
        SNP Y 11/15    5’GTT
        T等位基因      3’CAAA    A    G    T
        突出端位置                0    1    2    3
用标记的ddATP、未标记的dCTP、dGTP和dTTP的填充反应后,将产生下面的分子:
        SNP Y 10/14    5’GTTT    A*
        A等位基因      3’CAAA    T    G    T    A
        突出端位置                1    2    3    4
        SNP Y 11/15    5’GTT     T    A*
        A等位基因      3’CAAA    T    G    T
        突出端位置                0    1    2    3
        SNP Y 10/14    5’GTTT    T    C    A*
        T等位基因      3’CAAA    A    G    T    A
        突出端位置                1    2    3    4
        SNP Y 11/15    5’GTT     T    T    C    A*
        T等位基因      3’CAAA    A    G    T
        突出端位置                0    1    2    3
在该实施例中,标记的ddGTP和标记的ddATP被分别用于鉴定SNPX和SNP Y的等位基因。在链上填充的SNPX前一位核苷酸(与从11/15切割的突出端的0位互补的核苷酸)不是鸟嘌呤或腺嘌呤。同样,在链上填充的SNPY前一位核苷酸不是鸟嘌呤或腺嘌呤。这使得使用标记的ddGTP、标记的ddATP、未标记的dCTP和dTTP针对两种SNP的填充反应可以在单个反应中发生。这减少了需要进行的反应的数目并增加了在一个反应中可以分析的SNP数量。
可以设计每种SNP的第一引物以离目标基因座不同的距离处退火,这使得SNP迁移到凝胶上不同位置。例如,用于扩增SNP X的第一引物可以距离目标基因座30个碱基,用于扩增SNP Y的第一引物可以距离目标基因座35个碱基。同样,核苷酸可以用在光谱发射不重叠的荧光染料标记。跑胶后,可以在对一种染料特异的波长扫描凝胶。只有用那种染料标记的那些分子才发射信号。然后,可以在对第二染料特异的波长扫描凝胶。只有用第二种染料标记的那些分子才发射信号。该方法允许在单个反应中可以分析的SNP数目的最大压缩。
在该实施例中,被填充的链上可变位点前的核苷酸不是腺嘌呤或鸟嘌呤,并且可变位点后的核苷酸在有义链上不可能是腺嘌呤或鸟嘌呤。该方法可以用标记的核苷酸的任何组合进行,并且技术人员将理解哪些标记反应可以混合,哪些不能混合。例如,如果一种SNP用胸腺嘧啶标记并且另一种SNP用胞嘧啶标记,如果每个可变位点的前一位核苷酸在有义链上不是胸腺嘧啶或胞嘧啶并且可变位点的后一位核苷酸在有义链上不是胸腺嘧啶或胞嘧啶,那么这两种SNP可以在单个反应中标记。
该方法允许来自一种等位基因的信号与来自第二种等位基因的信号相比较而不增加确定备选切割程度这一复杂性,或者不增加不得不为染料的量子系数进行校正的复杂性。该方法尤其适用于定量一个等位基因与另一等位基因的比率。例如该方法用于检测染色体异常。一个杂合位点处等位基因的比例预计为约1∶1(一个A等位基因和一个G等位基因)。然而,如果存在额外的染色体,那么预计的比例为约1∶2(一个A等位基因和2个G等位基因或2个A等位基因和1个G等位基因)。该方法特别用于当试图检测母亲DNA中存在的胎儿DNA的时候。
此外,该方法用于检测一种样品中的两种遗传信号。例如,该方法可检测存在野生型细胞时的突变细胞(见实施例5)。如果突变细胞在特定基因的DNA序列中含有突变,那么该方法可用于检测突变信号和野生型信号。该方法可用于检测存在野生型DNA序列时的突变DNA序列。突变DNA与野生型DNA的比例可以定量,因为使用了用一种信号产生部分标记的单核苷酸。
实施例7
检测各种类型癌症的非侵入性方法具有减少疾病导致的发病和死亡的潜力。已经开发了几种包括结肠镜检查、钡灌肠和乙状结肠镜检的结肠直肠肿瘤的早期检测技术;然而,这些技术在应用上受到限制,因为它们侵入性的,导致低的病人依从率。非侵入性遗传检测可用于鉴定早期结肠直肠肿瘤。
1991年,研究人员鉴定了腺瘤性结肠息肉(Adenomatous PolyposisColi)(APC)基因,其在结肠直肠肿瘤的形成中起关键作用(Kinzler等,Science 253:661-665,1991)。APC基因位于染色体5q21-22并且总共15个外显子编码8529个核苷酸的RNA分子,其产生300Kd的APC蛋白。该蛋白在多种细胞类型中表达并且是细胞粘附所必需的。
APC基因中的突变通常启动结肠直肠瘤形成(Tsao,J.等,Am,J.Pathol.145:531-534,1994)。APC基因中约95%突变导致无义/框偏移突变。最常见的突变发生在密码子1061和1309;这些密码子的突变占所有种系突变的1/3。对于体细胞突变,60%发生在密码子1286-1513,其是编码序列的约10%。该区域被称为突变丛集区(MCR)。在APC基因中已经鉴定了多种类型的突变,包括核苷酸置换(见表VII)、剪接错误(见表VIII)、小缺失(见表IX)、小插入(见表X)、小插入/缺失(见表XI)、大缺失(见表XII)、大插入(见表XIII)和复杂重排(见表XIV)。
研究人员已经试图鉴定大便样品中含有APC基因突变的细胞(Traverso,G.等,New England Journal of Medicine,Vol 346:311-320,2002)。尽管在几乎所有肿瘤中都发现APC突变,但是大便样品中250个细胞约有一个细胞具有APC基因突变;大多数细胞都是脱落到粪便中的正常细胞。此外,人DNA基因代表在大便样品中发现的总DNA的约一亿分之一;大多数DNA是细菌的。Traverso等使用的技术仅仅检测导致截短蛋白质的突变。
如上面所讨论的,APC基因中许多突变与结肠直肠肿瘤的形成有关。从而,仍然需要检测结肠直肠肿瘤的高敏感、非侵入性技术。下面,描述了检测APC基因中两种突变的方法。然而,使用这里描述的方法可以分析任何数目的突变。
模板DNA的制备
模板DNA从含有结肠细胞的样品(包括但不限于大便样品)中纯化。使用Ahlquist等(Gastroenterology,119:1219-1227,2000)描述的方法纯化模板DNA。如果大便样品是冰冻的,在室温融化样品并用Exactor stoolshaker(Exact Laboratories,Maynard,Mass.)匀浆。匀浆后,将每份样品即相等的4g大便在2536xg离心5分钟。样品在16,500×10g再次离心10分钟。上清液用20μl RNase(每毫升0.5mg)在37℃下孵育1小时。DNA用1/10体积3摩尔/升乙酸钠和等体积异丙醇沉淀。DNA溶于5mlTRIS-EDTA(每升0.01ml Tris(pH7.4))和0.001mol/l EDTA。
引物的设计
为了确定密码子1370处的突变,使用下面的引物:
第一引物:
5′GTGCAAAGGCCTGAATTCCCAGGCACAAAGCTGTTGAA 3′
第二引物:
5′TGAAGCGAACTAGGGACTCAGGTGGACTT
第一引物含有最5’端的生物素标签和限制酶EcoRI识别的核苷酸序列。第二引物含有限制酶BsmF I的识别序列。
为了确定在密码子1320是否存在小缺失,使用下面的引物:
第一引物:
5′GATTCCGTAAACGAATTCAGTTCATTATCATCTTTGTC 3′
第二引物:
5′CCATTGTTAAGCGGGACTTCTGCTATTTG 3′
第一引物含有最5’端的生物素标签和限制酶EcoRI识别的核苷酸序列。第二引物含有限制酶BsmF I的识别序列。
PCR反应
使用聚合酶链式反应从模板基因组DNA扩增目标基因座(PCR,美国专利号4,683,195和4,682,202,此处并入作为参考)。在单独的反应管中扩增目标基因座;它们也可以在单个PCR反应中一起扩增。为了增加特异性,使用“热-启动”PCR反应,例如通过使用QIAGEN提供的HotStarTaqMaster Mix Kit(目录号203443)。可以为每个目标基因座优化每次反应中的模板DNA和引物的量,但是在该实施例中,使用40ng人基因组DNA模板和每种引物5μM。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
从基因组模板DNA分离PCR产物。每种PCR产物分装到透明的高结合板Streptawell(来自Roche Diagnostics GmbH,目录号1 645 692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的)的4个单独的反应孔中。第一引物含有5’生物素标记,从而PCR产物结合包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
备选地,将PCR产物置于链亲和素板的单个孔中以在单个孔中进行核苷酸掺入反应。
分离片段的限制酶消化
纯化的PCR产物用限制酶BsmF I(New England Biolabs目录号R0572S)消化,该酶结合掺入第二引物的PCR产物的识别位点。按照随限制酶提供的用法说明书在Streptawell中进行消化。用适宜的限制酶消化后,将孔用PSB洗涤3次以除去切下的片段。
标记的核苷酸的掺入
上述限制酶消化产生具有5’突出端(其含有目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
对于每个目标基因座,进行四次单独的填充反应;四个反应物的每一种含有一种不同的荧光标记的ddNTP(ddATP、ddTTP、ddGTP或ddCTP)。下面的组分加入到每个填充反应中:1μl荧光标记的ddNTP、0.5μl未标记的ddNTPs(40μM),其含有除了荧光标记的核苷酸之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover,Md.)。所有其他标记试剂从Amersham(ThermoSequenase Dye Terminator Cycle Sequencing Core Kit,US 79565)得到。在荧光标记的ddNTPs的存在下,3’凹端延伸1个碱基,其相应于目标基因座。
标记的ddNTP和未标记的dNTP的混合物也可以用于填充反应中。“填充”条件如上述,只是使用含有40μM未标记的dNTP,1μl荧光标记的ddATP、1μl荧光标记的ddTTP、1μl荧光标记的ddCTP、1μl荧光标记的ddGTP的混合物。荧光标记的ddNTP来自Amersham(ThermoSequenase Dye Terminator Cycle Sequencing Core Kit,US 79565;Amersham没有公开荧光核苷酸的浓度)。将目标基因座用限制酶BsmF I消化产生4个碱基的5′突出端。如果掺入的第一个核苷酸是标记的ddNTP,则3’凹端被一个碱基填充,允许检测目标基因座。然而,如果掺入的第一个核苷酸是dNTP,那么聚合酶继续掺入核苷酸直到ddNTP被掺入。例如,头两个核苷酸可以用dNTP填充,第三个核苷酸用ddNTP填充,这使得突出端中第三个核苷酸可检测。从而,可以确定全部5’突出端的序列,这增加了从单个SNP或目标基因座得到的信息。这种填充反应特别用于当检测插入、缺失、插入和缺失、重排和易位时。
备选地,用一种染料标记的一种核苷酸可用于确定目标基因座的序列。见实施例6。这种方法消除了当使用不同染料(它们具有不同量子系数)时的潜在误差。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段。在120转/分钟摇动下于37℃下进行消化1小时。
目标基因座的检测
从链亲和素基质释放后,将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(Hoefer SQ3 Sequencer)上运行3小时。通过荧光检测掺入的标记核苷酸。
为了确定进行填充反应时是否有细胞含有APC基因在密码子1370的突变,分析了相应于ddATP和ddTTP的填充反应的凝胶泳道。如果只存在正常细胞,那么相应于ddATP的填充反应的泳道是明亮的信号。对于ddTTP的“填充”反应没有检测到信号。然而,如果患者样品含有APC基因在密码子1370的突变,那么相应于ddATP的填充反应的泳道是亮信号,并且从相应于ddTTP的填充反应的泳道检测到信号。来自相应于ddTTP的填充反应的泳道的信号强度指示样品中突变细胞的数目。
备选地,一种标记的核苷酸被用于确定APC基因在密码子1370处的等位基因的序列。在密码子1370,正常序列为AAA,其编码赖氨酸。然而,在密码子1370处鉴定到了核苷酸置换,其相应于结肠直肠肿瘤。特别地,通常在密码子1370处发现A到T(AAA-TAA)的改变,这导致终止密码子。使用标记的ddATP、未标记的dTTP、未标记的dCTP和未标记的dGTP进行单个填充反应。使用一种荧光染料标记的一种核苷酸确定密码子1370所编码的正常的和突变的DNA序列的存在。在下面描绘相关的DNA序列,相应于密码子1370的序列以粗体表示。
5′CCCAAAAGTCCACCTGA
5′GGGTTTTCAGGTGGACT
用BsmF I消化后,产生下面的突出端:
    5′CCC
    3′GGG        T     T    T    T
    突出端位置    1     2    3    4
如果患者样品没有密码子1370处的突变,那么可见到相应于经标记ddATP掺入的信号。
    5′CCC        A*
    3′GGG        T    T    T    T
    突出端位置    1    2    3    4
然而,如果患者样品具有含有APC基因的密码子1370处产生突变的细胞,将看到一种信号,其相应于密码子1370处的正常序列,并且见到另一种信号,其相应于密码子1370处的突变序列。这些信号可清楚地鉴定,因为它们分子量不同。
正常DNA序列的突出端:CCC
                     GGG    T    T    T    T
突出端位置                  1    2    3    4
填充后的正常DNA序列:CCC    A*
                     GGG    T    T    T    T
突出端位置                  1    2    3    4
突变DNA序列的突出端:CCC
                     GGG    A    T    T    T
突出端位置                  1    2    3    4
填充后的突变DNA序列:CCC    T    A*
                     GGG    A    T    T    T
      突出端位置                1    2    3    4
当存在突变等位基因时可见到两种信号。突变DNA分子在野生型DNA分子后填充一个碱基。使用基于分子量分辨的任何方法可分开两种信号。一种标记的核苷酸(ddATP)被用于检测野生型DNA序列和突变DNA序列的存在。这种标记方法减少了需要进行的反应数并允许为患者样品中的突变细胞数准确定量。样品中的突变细胞数被用于确定病人预后、疾病的程度和严重性。这种标记方法消除了与使用不同染料(其具有不同的量子系数)相关的复杂性。这种标记方法也消除了与移液反应相关的误差。
为了确定进行填充反应时是否有细胞含有APC基因在密码子1302的突变,分析了相应于ddTTP和ddCTP的填充反应的凝胶泳道。在下面描绘正常的DNA序列,相应于密码子1302的序列以粗体表示。
正常序列:
5′ACCCTGCAAATAGCAGAA
5′TGGGACGTTTATCGTCTT
消化后,产生下面的5’突出端
5′ACCC
3′TGGG       A    C    G    T
突出端位置    1    2    3    4
填充反应后,标记的ddTTP被掺入。
5′ACCC       T*
3′TGGG       A    C    G    T
突出端位置    1    2    3    4
APC序列的单碱基缺失(其一般编码密码子1302)与结肠直肠肿瘤相关。突变DNA序列在下面描绘,相关序列为粗体。
突变序列:
5′ACCCGCAAATAGCAGAA
5′TGGGCGTTTATCGTCTT
消化后:
5′ACC
3′TGG        G    C    G    T
突出端位置    1    2    3    4
填充后:
5′ACC        C*
3′TGG        G    C    G    T
突出端位置    1    2    3    4
如果在APC基因中没有突变,使用ddCTP*的填充反应检测不到信号,但是使用ddTTP*的填充反应检测到明亮的信号。然而,如果在患者样品中存在具有APC基因中突变的细胞,使用ddCTP*和ddTTP*进行的填充反应可看到信号。
备选地,使用含有未标记的dNTPs,荧光标记的ddATP、荧光标记的ddTTP、荧光标记的ddCTP和荧光标记的ddGTP的混合物进行单个填充反应。如果没有缺失,那么标记的ddTTP被掺入。
5′ACCC       T*
3′TGGG       A    C    G    T
突出端位置    1    2    3    4
然而,如果T已经被缺失,那么标记的ddCTP*被掺入。
5′ACCC*
3′TGGG       C    G    T
突出端位置    1    2    3    4
因为胸腺嘧啶核苷酸的缺失,两种信号可通过分子量分开。如果存在突变细胞,那么两种信号在相同泳道中产生并通过单个碱基对分开(该原理在图9D中阐明)。缺失导致DNA片段的分子量改变,这使得可以使用单个填充反应检测正常和缺失细胞的存在。
在上面的实施例中,描述了检测核苷酸替代和小缺失的方法。然而,这些方法可用于检测任何突变,这些突变包括但不限于核苷酸替代(见表VII)、剪接错误(见表VIII)、小缺失(见表IX)、小插入(见表X)、小插入/缺失(见表XI)、大缺失(见表XII)、大插入(见表XIII)和复杂重排(见表XIV)。
此外,上述方法用于检测任何类型的疾病,包括但不限于表IV中所列的疾病。此外,使用此处描述的本发明检测任何类型的突变基因,这些基因包括但不限于与表IV中所列的疾病相关的基因、BRCA1、BRCA2、MSH6、MSH2、MLH1、RET、PTEN、ATM、H-RAS、p53、ELAC2、CDH1、APC、AR、PMS2、MLH3、CYP1A1、GSTP1、GSTM1、AXIN2、CYP19、MET、NAT1、CDKN2A、NQ01、trc8、RAD51、PMS1、TGFBR2、VHL、MC4R、POMC、NROB2、UCP2、PCSK1、PPARG、ADRB2、UCP3、glur1、cart、SORBS1、LEP、LEPR、SIM1、TNF、IL-6、IL-1、IL-2、IL-3、IL1A、TAP2、THPO、THRB、NBS1、RBM15、LIF、MPL、RUNX1、Her-2、糖皮质激素受体、雌激素受体、甲状腺受体、p21、p27、K-RAS、N-RAS、成视网膜细胞瘤蛋白、Wiskott-Aldrich(WAS)基因、因子V Leiden、因子II(凝血酶原)、亚甲基四氢叶酸还原酶、囊性纤维化、LDL受体、HDL受体、超氧化物歧化酶基因、SHOX基因、参与一氧化氮调节的基因、参与细胞周期调节的基因、肿瘤抑制基因、癌基因、与神经退化相关的基因、与肥胖相关的基因。这些缩写相应于如人类基因突变数据库所列的蛋白质,该数据库在此处引入作为参考( www.archive.uwcm.ac.uk./uwcm;2003年2月12日有效的网站)。
上面的实施例阐明了来自粪便样品的突变细胞和突变等位基因的检测。然而,此处描述的方法被用于检测来自任何生物学样品的突变细胞,这些样品包括但不限于血样、血清样品、血浆样品、尿样、脊髓样品、淋巴样品、精液、阴道分泌物、腹水液、唾液、粘膜分泌物、腹膜液、粪便样品、身体排出物、乳液、肺吸出物、细胞、组织、个体细胞或含有个体细胞的核酸的提取物、亚细胞结构如线粒体或叶绿体。此外,此处描述的方法用于检测来自任何数目的含核酸源的突变细胞和突变DNA,这些含核酸源包括但不限于法医的、食品、考古学的、农业的或无机样品。
上面的实施例涉及APC基因中突变的检测。然而,此处描述的本发明用于检测与疾病相关或有疾病倾向(见表XV)的任何基因中的突变。
例如,谷胱甘肽S-转移酶P1(GSTP1)启动子的高甲基化是前列腺癌中最常见的DNA变化。启动子的甲基化状态使用亚硫酸氢钠和此处描述的方法确定。
用亚硫酸氢钠处理将未甲基化的胞嘧啶残基转变成尿嘧啶,并使甲基化的胞嘧啶保持不变。使用此处描述的方法,设计第一和第二引物来扩增通常被甲基化的GSTP1启动子区。下面,显示了亚硫酸氢钠处理前GSTP1启动子的一个区:
亚硫酸氢钠处理前:
5′ACCGCTACA
3′TGGCGATCA
下面,显示了经亚硫酸氢钠处理、PCR扩增、用IIS型限制酶BsmF I消化后GSTP1启动子的一个区:
未甲基化
5′ACC
3′TGG        U    G    A    T
突出端位置    1    2    3    4
甲基化
5′ACC
3′TGG        C    G    A    T
突出端位置    1    2    3    4
标记的ddATP、未标记的dCTP、dGTP和dTTP被用于填平5’突出端。产生下面的分子:
未甲基化
5′ACC        A*
3′TGG        U    G    A    T
突出端位置    1    2    3    4
甲基化
5′ACC        G    C    T    A*
3′TGG        C    G    A    T
突出端位置    1    2    3    4
见到两种信号;一种相应于在与突出端互补的1位用ddATP填充的DNA分子(未甲基化的),另一种相应于在与突出端互补的4位用ddATP填充的DNA分子(甲基化的)。两种信号基于分子量分离。备选地,使用标记的ddGTP在一个反应中和使用标记的ddATP在另一个反应中进行分别的填充反应。
此处描述的方法用于筛选前列腺癌,也用于监控该疾病的发展和严重性。使用单核苷酸检测甲基化和未甲基化序列使得可以准确定量并为甲基化序列提供了高水平的敏感性,这是疾病较早检测的一种有用的工具。
表VII-XIV所含的信息来自人类基因突变数据库。使用此处提供的信息,技术人员将理解怎样应用这些方法以确定任一基因的等位基因序列。可以在下面的网站: www.archive.uwcm.ac.uk./uwcm发现许多基因和它们相关的突变。
表VII:核苷酸替代
密码子  核苷酸  氨基酸 表型
99  CGG-TGG  Arg-Trp 腺瘤性结肠息肉
121  AGA-TGA  Arg-Term 腺瘤性结肠息肉
157  TGG-TAG  Trp-Term 腺瘤性结肠息肉
159  TAC-TAG  Tyr-Term 腺瘤性结肠息肉
163  CAG-TAG  Gln-Term 腺瘤性结肠息肉
168  AGA-TGA  Arg-Term 腺瘤性结肠息肉
171  AGT-ATT  Ser-Ile 腺瘤性结肠息肉
181  CAA-TAA  Gln-Term 腺瘤性结肠息肉
190  GAA-TAA  Glu-Term 腺瘤性结肠息肉
202  GAA-TAA  Glu-Term 腺瘤性结肠息肉
208  CAG-CGG  Gln-Arg 腺瘤性结肠息肉
208  CAG-TAG  Gln-Term 腺瘤性结肠息肉
213  CGA-TGA  Arg-Term 腺瘤性结肠息肉
215  CAG-TAG  Gln-Term 腺瘤性结肠息肉
216  CGA-TGA  Arg-Term 腺瘤性结肠息肉
232  CGA-TGA  Arg-Term 腺瘤性结肠息肉
233  CAG-TAG  Gln-Term 腺瘤性结肠息肉
247  CAG-TAG  Gln-Term 腺瘤性结肠息肉
267  GGA-TGA  Gly-Term 腺瘤性结肠息肉
278  CAG-TAG  Gln-Term 腺瘤性结肠息肉
280  TCA-TGA  Ser-Term 腺瘤性结肠息肉
280  TCA-TAA  Ser-Term 腺瘤性结肠息肉
283  CGA-TGA  Arg-Term 腺瘤性结肠息肉
302  CGA-TGA  Arg-Term 腺瘤性结肠息肉
332  CGA-TGA  Arg-Term 腺瘤性结肠息肉
358  CAG-TAG  Gln-Term 腺瘤性结肠息肉
405  CGA-TGA  Arg-Term 腺瘤性结肠息肉
414  CGC-TGC  Arg-Cys 腺瘤性结肠息肉
422  GAG-TAG  Glu-Term 腺瘤性结肠息肉
423  TGG-TAG  Trp-Term 腺瘤性结肠息肉
424  CAG-TAG  Gln-Term 腺瘤性结肠息肉
433  CAG-TAG  Gln-Term 腺瘤性结肠息肉
443  GAA-TAA  Glu-Term 腺瘤性结肠息肉
457  TCA-TAA  Ser-Term 腺瘤性结肠息肉
473  CAG-TAG  Gln-Term 腺瘤性结肠息肉
486  TAC-TAG  Tyr-Term 腺瘤性结肠息肉
499  CGA-TGA  Arg-Term 腺瘤性结肠息肉
500  TAT-TAG  Tyr-Term 腺瘤性结肠息肉
541  CAG-TAG  Gln-Term 腺瘤性结肠息肉
553  TGG-TAG  Trp-Term 腺瘤性结肠息肉
554  CGA-TGA  Arg-Term 腺瘤性结肠息肉
564  CGA-TGA  Arg-Term 腺瘤性结肠息肉
577  TTA-TAA  Leu-Term 腺瘤性结肠息肉
586  AAA-TAA  Lys-Term 腺瘤性结肠息肉
592  TTA-TGA  Leu-Term 腺瘤性结肠息肉
593  TGG-TAG  Trp-Term 腺瘤性结肠息肉
593  TGG-TGA  Trp-Term 腺瘤性结肠息肉
622  TAC-TAA  Tyr-Term 腺瘤性结肠息肉
625  CAG-TAG  Gln-Term 腺瘤性结肠息肉
629  TTA-TAA  Leu-Term 腺瘤性结肠息肉
650  GAG-TAG  Glu-Term 腺瘤性结肠息肉
684  TTG-TAG  Leu-Term 腺瘤性结肠息肉
685  TGG-TGA  Trp-Term 腺瘤性结肠息肉
695  CAG-TAG  Gln-Term 腺瘤性结肠息肉
699  TGG-TGA  Trp-Term 腺瘤性结肠息肉
699  TGG-TAG  Trp-Term 腺瘤性结肠息肉
713  TCA-TGA  Ser-Term 腺瘤性结肠息肉
722  AGT-GGT  Ser-Gly 腺瘤性结肠息肉
747  TCA-TGA  Ser-Term 腺瘤性结肠息肉
764  TTA-TAA  Leu-Term 腺瘤性结肠息肉
784  TCT-ACT  Ser-Thr 腺瘤性结肠息肉
805  CGA-TGA  Arg-Term 腺瘤性结肠息肉
811  TCA-TGA  Ser-Term 腺瘤性结肠息肉
848  AAA-TAA  Lys-Term 腺瘤性结肠息肉
876  CGA-TGA  Arg-Term 腺瘤性结肠息肉
879  CAG-TAG  Gln-Term 腺瘤性结肠息肉
893  GAA-TAA  Glu-Term 腺瘤性结肠息肉
932  TCA-TAA  Ser-Term 腺瘤性结肠息肉
932  TCA-TGA  Ser-Term 腺瘤性结肠息肉
935  TAC-TAG  Tyr-Term 腺瘤性结肠息肉
935  TAC-TAA  Tyr-Term 腺瘤性结肠息肉
995  TGC-TGA  Cys-Term 腺瘤性结肠息肉
997  TAT-TAG  Tyr-Term 腺瘤性结肠息肉
999  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1000  TAC-TAA  Tyr-Term 腺瘤性结肠息肉
1020  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1032  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1041  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1044  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1045  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1049  TGG-TGA  Trp-Term 腺瘤性结肠息肉
1067  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1071  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1075  TAT-TAA  Tyr-Term 腺瘤性结肠息肉
1075  TAT-TAG  Tyr-Term 腺瘤性结肠息肉
1102  TAC-TAG  Tyr-Term 腺瘤性结肠息肉
1110  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1114  CGA-TGA  Arg-Term 腺瘤性结肠息肉
1123  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1135  TAT-TAG  Tyr-Term 腺瘤性结肠息肉
1152  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1155  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1168  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1175  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1176  CCT-CTT  Pro-Leu 腺瘤性结肠息肉
1184  GCC-CCC  Ala-Pro 腺瘤性结肠息肉
1193  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1194  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1198  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1201  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1228  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1230  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1244  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1249  TGC-TGA  Cys-Term 腺瘤性结肠息肉
1256  CAA-TAA  Gln-Term 腺瘤性结肠息肉
1262  TAT-TAA  Tyr-Term 腺瘤性结肠息肉
1270  TGT-TGA  Cys-Term 腺瘤性结肠息肉
1276  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1278  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1286  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1289  TGT-TGA  Cys-Term 腺瘤性结肠息肉
1294  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1307  ATA-AAA  Ile-Lys 结肠直肠癌,倾向于,相关
1309  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1317  GAA-CAA  Glu-Gln 结肠直肠癌,倾向于
1328  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1338  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1342  TTA-TAA  Leu-Term 腺瘤性结肠息肉
1342  TTA-TGA  Leu-Term 腺瘤性结肠息肉
1348  AGG-TGG  Arg-Trp 腺瘤性结肠息肉
1357  GGA-TGA  Gly-Term 腺瘤性结肠息肉
1367  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1370  AAA-TAA  Lys-Term 腺瘤性结肠息肉
1392  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1392  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1397  GAG-TAG  Glu-Term 腺瘤性结肠息肉
1449  AAG-TAG  Lys-Term 腺瘤性结肠息肉
1450  CGA-TGA  Arg-Term 腺瘤性结肠息肉
1451  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1503  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1517  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1529  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1539  TCA-TAA  Ser-Term 腺瘤性结肠息肉
1541  CAG-TAG  Gln-Term 腺瘤性结肠息肉
1564  TTA-TAA  Leu-Term 腺瘤性结肠息肉
1567  TCA-TGA  Ser-Term 腺瘤性结肠息肉
1640  CGG-TGG  Arg-Trp 腺瘤性结肠息肉
1693  GAA-TAA  Glu-Term 腺瘤性结肠息肉
1822  GAC-GTC  Asp-Val 腺瘤性结肠息肉,相关?
2038  CTG-GTG  Leu-Val 腺瘤性结肠息肉
2040  CAG-TAG  Gln-Term 腺瘤性结肠息肉
2566  AGA-AAA  Arg-Lys 腺瘤性结肠息肉
2621  TCT-TGT  Ser-Cys 腺瘤性结肠息肉
2839  CTT-TTT  Leu-Phe 腺瘤性结肠息肉
表VIII:核苷酸替代
供体/受体 相对位置 替代 表型
ds -1 G-C 腺瘤性结肠息肉
as -1 G-A 腺瘤性结肠息肉
as -1 G-C 腺瘤性结肠息肉
ds +2 T-A 腺瘤性结肠息肉
as -1 G-C 腺瘤性结肠息肉
as -1 G-T 腺瘤性结肠息肉
as -1 G-A 腺瘤性结肠息肉
as -2 A-C 腺瘤性结肠息肉
as -5 A-G 腺瘤性结肠息肉
ds +3 A-C 腺瘤性结肠息肉
as -1 G-A 腺瘤性结肠息肉
ds +1 G-A 腺瘤性结肠息肉
as -1 G-T 腺瘤性结肠息肉
ds +1 G-A 腺瘤性结肠息肉
as -1 G-A 腺瘤性结肠息肉
ds +1 G-A 腺瘤性结肠息肉
ds +3 A-G 腺瘤性结肠息肉
ds +5 G-T 腺瘤性结肠息肉
as -1 G-A 腺瘤性结肠息肉
as -6 A-G 腺瘤性结肠息肉
as -5 A-G 腺瘤性结肠息肉
as -2 A-G 腺瘤性结肠息肉
ds +2 T-C 腺瘤性结肠息肉
as -2 A-G 腺瘤性结肠息肉
ds +1 G-A 腺瘤性结肠息肉
ds +1 G-T 腺瘤性结肠息肉
ds +2 T-G 腺瘤性结肠息肉
表IX:APC小缺失
粗体字母表示密码子。小写字母表示缺失。当缺乏延伸至编码区时,提供了其它位置信息。例如缩写5’UTR代表5’非翻译区,缩写E6I6代表外显子/内含子6边界。
位置/密码子 缺失 表型
77 TAgataGCAGTAATTT 腺瘤性结肠息肉 SEQ ID NO:52
97  GGAAGccgggaagGATCTGTATC   腺瘤性结肠息肉 SEQ ID NO:53
138  GAGAaAGAGAG_E3I3_GTAA   腺瘤性结肠息肉 SEQ ID NO:54
139  AAAGAgag_E3I3_Gtaacttttct   甲状腺癌 SEQ ID NO:55
139  AAAGagag_E3I3_GTAACTTTTC   腺瘤性结肠息肉 SEQ ID NO:56
142  TTTTAAAAAAaAAAAATAG_I3E4_GTCA   腺瘤性结肠息肉 SEQ ID NO:57
144  AAAATAG_I3E4_GTCatTGCTTCTTGC   腺瘤性结肠息肉 SEQ ID NO:58
149  GACAaaGAAGAAAAGG   腺瘤性结肠息肉 SEQ ID NO:59
149  GACAAagaaGAAAAGGAAA   腺瘤性结肠息肉 SEQ ID NO:60
155  AGGAA^AAAGActggtATTACGCTCA   腺瘤性结肠息肉 SEQ ID NO:61
169  AAAAGA^ATAGatagTCTTCCTTTA   腺瘤性结肠息肉 SEQ ID NO:62
172  AGATAGT^CTTcCTTTAACTGA   腺瘤性结肠息肉 SEQ ID NO:63
179  TCCTTacaaACAGATATGA   腺瘤性结肠息肉 SEQ ID NO:64
185  ACCaGAAGGCAATT   腺瘤性结肠息肉 SEQ ID NO:65
196  ATCAGagTTGCGATGGA   腺瘤性结肠息肉 SEQ ID NO:66
213  CGAGCaCAG_E5I5_GTAAGTT   腺瘤性结肠息肉 SEQ ID NO:67
298  CACtcTGCACCTCGA   腺瘤性结肠息肉 SEQ ID NO:68
329  GATaTGTCGCGAAC   腺瘤性结肠息肉 SEQ ID NO:69
365  AAAGActCTGTATTGTT   腺瘤性结肠息肉 SEQ ID NO:70
397  GACaaGAGAGGCAGG   腺瘤性结肠息肉 SEQ ID NO:71
427  CATGAacCAGGCATGGA   腺瘤性结肠息肉 SEQ ID NO:72
428  GAACCaGGCATGGACC   腺瘤性结肠息肉 SEQ ID NO:73
436  AATCCaa_E9I9_gTATGTTCTCT   腺瘤性结肠息肉 SEQ ID NO:74
440  GCTCCtGTTGAACATC   腺瘤性结肠息肉 SEQ ID NO:75
455  AAACTtTCATTTGATG   腺瘤性结肠息肉 SEQ ID NO:76
455  AAACtttcaTTTGATGAAG   腺瘤性结肠息肉 SEQ ID NO:77
472  CTAcAGGCCATTGC   腺瘤性结肠息肉 SEQ ID NO:78
472  TAAATTAG_I10E11_GGgGACTCACGGC   腺瘤性结肠息肉 SEQ ID NO:79
478  TTATtGCAAGTGGAC   腺瘤性结肠息肉 SEQ ID NO:80
486  TACGgGCTTACTAAT   腺瘤性结肠息肉 SEQ ID NO:81
494  AGTATtACACTAAGAC   腺瘤性结肠息肉 SEQ ID NO:82
495  ATTACacTAAGACGATA   腺瘤性结肠息肉 SEQ ID NO:83
497  CTAaGACGATATGC   腺瘤性结肠息肉 SEQ ID NO:84
520  TGCTCtaTGAAAGGCTG   腺瘤性结肠息肉 SEQ ID NO:85
526  ATGAGagcacttgtgGCCCAACTAA   腺瘤性结肠息肉 SEQ ID NO:86
539  GACTTaCAGCAG_12I12_GTAC   腺瘤性结肠息肉 SEQ ID NO:87
560  AAAAAgaCGTTGCGAGA   腺瘤性结 SEQ ID NO:88
  肠息肉
566  GTTGgaagtGTGAAAGCAT   腺瘤性结肠息肉 SEQ ID NO:89
570  AAAGCaTTGATGGAAT   腺瘤性结肠息肉 SEQ ID NO:90
577  TTAGaagtTAAAAAG_E13I13_GTA   腺瘤性结肠息肉 SEQ ID NO:91
584  ACCCTcAAAAGCGTAT   腺瘤性结肠息肉 SEQ ID NO:92
591  GCCTtATGGAATTTG   腺瘤性结肠息肉 SEQ ID NO:93
608  GCTgTAGATGGTGC   腺瘤性结肠息肉 SEQ ID NO:94
617  GTTggcactcttacttaccGGAGCCAGAC   腺瘤性结肠息肉 SEQ ID NO:95
620  CTTACttacCGGAGCCAGA   腺瘤性结肠息肉 SEQ ID NO:96
621  ACTTaCCGGAGGCCAG   腺瘤性结肠息肉 SEQ ID NO:97
624  AGCcaGACAAACACT   腺瘤性结肠息肉 SEQ ID NO:98
624  AGCCagacAAACACTTTA   腺瘤性结肠息肉 SEQ ID NO:99
626  ACAaacaCTTTAGCCAT   腺瘤性结肠息肉 SEQ ID NO:100
629  TTAGCcATTATTGAAA   腺瘤性结肠息肉 SEQ ID NO:101
635  GGAGgTGGGATATTA   腺瘤性结肠息肉 SEQ ID NO:102
638  ATATtACGGAATGTG   腺瘤性结肠息肉 SEQ ID NO:103
639  TTACGgAATGTGTCCA   腺瘤性结肠息肉 SEQ ID NO:104
657  AGAgaGAACAACTGT   腺瘤性结肠息肉 SEQ ID NO:105
659  TATTTCAG_I14E15_GCaaatcctaagagagAACAACTGTC     腺瘤性结肠息肉 SEQ ID NO:106
660  AACTgtCTACAAACTT     腺瘤性结肠息肉 SEQ ID NO:107
665  TTAttACAACACTTA     腺瘤性结肠息肉 SEQ ID NO:108
668  CACttAAAATCTCAT     腺瘤性结肠息肉 SEQ ID NO:109
673  AGTttgacaatagtCAGTAATGCA     腺瘤性结肠息肉 SEQ ID NO:110
768  CACTTaTCAGAAACTT     腺瘤性结肠息肉 SEQ ID NO:111
769  TTATcAGAAACTTTT     腺瘤性结肠息肉 SEQ ID NO:112
770  TCAGAaACTTTTGACA     腺瘤性结肠息肉 SEQ ID NO:113
780  AGTCcCAAGGCATCT     腺瘤性结肠息肉 SEQ ID NO:114
792  AAGCaAAGTCTCTAT     腺瘤性结肠息肉 SEQ ID NO:115
792  AAGCAaaGTCTCTATGG     腺瘤性结肠息肉 SEQ ID NO:116
793  CAAAgTCTCTATGGT     腺瘤性结肠息肉 SEQ ID NO:117
798  GATTatGTTTTTGACA     腺瘤性结肠息肉 SEQ ID NO:118
802  GACACcaatcgacatGATGATAATA     腺瘤性结肠息肉 SEQ ID NO:119
805  CGACatGATGATAATA     腺瘤性结肠息肉 SEQ ID NO:120
811  TCAGacaaTTTTAATACT     腺瘤性结肠息肉 SEQ ID NO:121
825  TATtTGAATACTAC     腺瘤性结肠息肉 SEQ ID NO:122
827  AATAcTACAGTGTTA     腺瘤性结 SEQ ID NO:123
    肠息肉
830  GTGTTacccagctcctctTCATCAAGAG     腺瘤性结肠息肉 SEQ ID NO:124
833  AGCTCcTCTTCATCAA     腺瘤性结肠息肉 SEQ ID NO:125
836  TCATcAAGAGGAAGC     腺瘤性结肠息肉 SEQ ID NO:126
848  AAAGAtaGAAGTTTGGA     腺瘤性结肠息肉 SEQ ID NO:127
848  AAAGatagaagTTTGGAGAGA     腺瘤性结肠息肉 SEQ ID NO:128
855  GAACgCGGAATTGGT     腺瘤性结肠息肉 SEQ ID NO:129
856  CGCGgaattGGTCTAGGCA     腺瘤性结肠息肉 SEQ ID NO:130
856  CGCGgAATTGGTCTA     腺瘤性结肠息肉 SEQ ID NO:131
879  CAGaTCTCCACCAC     腺瘤性结肠息肉 SEQ ID NO:132
902  GAAGAcagaAGTTCTGGGT     腺瘤性结肠息肉 SEQ ID NO:133
907  GGGTcTACCACTGAA     腺瘤性结肠息肉 SEQ ID NO:134
915  GTGACaGATGAGAGAA     腺瘤性结肠息肉 SEQ ID NO:135
929  CATACacatTCAAACACTT     腺瘤性结肠息肉 SEQ ID NO:136
930  ACACAttcaAACACTTACA     腺瘤性结肠息肉 SEQ ID NO:137
931  CATtCAAACACTTA     腺瘤性结肠息肉 SEQ ID NO:138
931  CATTcAAACACTTAC     腺瘤性结肠息肉 SEQ ID NO:139
933  AACacttACAATTTCAC     腺瘤性结肠息肉 SEQ ID NO:140
935  TACAatttcactAAGTCGGAAA   腺瘤性结肠息肉 SEQ ID NO:141
937  TTCActaaGTCGGAAAAT   腺瘤性结肠息肉 SEQ ID NO:142
939  AAGtcggAAAATTCAAA   腺瘤性结肠息肉 SEQ ID NO:143
946  ACATgTTCTATGCCT   腺瘤性结肠息肉 SEQ ID NO:144
954  TTAGaaTACAAGAGAT   腺瘤性结肠息肉 SEQ ID NO:145
961  AATgATAGTTTAAA   腺瘤性结肠息肉 SEQ ID NO:146
963  AGTTTaAATAGTGTCA   腺瘤性结肠息肉 SEQ ID NO:147
964  TTAaataGTGTCAGTAG   腺瘤性结肠息肉 SEQ ID NO:148
973  TATGgTAAAAGAGGT   腺瘤性结肠息肉 SEQ ID NO:149
974  GGTAAaAGAGGTCAAA   腺瘤性结肠息肉 SEQ ID NO:150
975  AAAAgaGGTCAAATGA   甲状腺癌 SEQ ID NO:151
992  AGTAAgTTTTGCAGTT   甲状腺癌 SEQ ID NO:152
993  AAGttttgcagttaTGGTCAATAC   腺瘤性结肠息肉 SEQ ID NO:153
999  CAAtacccagCCGACCTAGC   腺瘤性结肠息肉 SEQ ID NO:154
1023  ACACcAATAAATTAT   腺瘤性结肠息肉 SEQ ID NO:155
1030  AAAtATTCAGATGA   腺瘤性结肠息肉 SEQ ID NO:156
1032  TCAGatgagCAGTTGAACT   腺瘤性结肠息肉 SEQ ID NO:157
1033  GATGaGCAGTTGAAC   腺瘤性结肠息肉 SEQ ID NO:158
1049  TGGGcAAGACCCAAA   腺瘤性结肠息肉 SEQ ID NO:159
1054  CACAtaataGAAGATGAAA   腺瘤性结肠息肉 SEQ ID NO:160
1055  ATAAtagaaGATGAAATAA   腺瘤性结肠息肉 SEQ ID NO:161
1056  ATAGAaGATGAAATAA   腺瘤性结肠息肉 SEQ ID NO:162
1060  ATAAAacaaaGTGAGCAAAG   腺瘤性结肠息肉 SEQ ID NO:163
1061  AAAcaaaGTGAGCAAAG   腺瘤性结肠息肉 SEQ ID NO:164
1061  AAACaaAGTGAGCAAA   腺瘤性结肠息肉 SEQ ID NO:165
1062  CAAAgtgaGCAAAGACAA   腺瘤性结肠息肉 SEQ ID NO:166
1065  CAAAGacAATCAAGGAA   腺瘤性结肠息肉 SEQ ID NO:167
1067  CAAtcaaGGAATCAAAG   腺瘤性结肠息肉 SEQ ID NO:168
1071  CAAAgtACAACTTATC   腺瘤性结肠息肉 SEQ ID NO:169
1079  ACTGagAGCACTGATG   腺瘤性结肠息肉 SEQ ID NO:170
1082  ACTGAtgATAAACACCT   腺瘤性结肠息肉 SEQ ID NO:171
1084  GATaaacACCTCAAGTT   腺瘤性结肠息肉 SEQ ID NO:172
1086  CACCtcAAGTTCCAAC   腺瘤性结肠息肉 SEQ ID NO:173
1093  TTTGgACAGCAGGAA   腺瘤性结肠息肉 SEQ ID NO:174
1098  TGTgtTTCTCCATAC   腺瘤性结肠息肉 SEQ ID NO:175
1105  CGGgGAGCCAATGG   甲状腺癌 SEQ ID NO:176
1110  TCAGAaACAAATCGAG   腺瘤性结肠息肉 SEQ ID NO:177
1121  ATTAAtcaaAATGTAAGCC   腺瘤性结肠息肉 SEQ ID NO:178
1131  CAAgAAGATGACTA   腺瘤性结肠息肉 SEQ ID NO:179
1134  GACTAtGAAGATGATA   腺瘤性结肠息肉 SEQ ID NO:180
1137  GATgataaGCCTACCAAT   腺瘤性结肠息肉 SEQ ID NO:181
1146  CGTTAcTCTGAAGAAG   腺瘤性结肠息肉 SEQ ID NO:182
1154  GAAGaagaaGAGAGACCAA   腺瘤性结肠息肉 SEQ ID NO:183
1155  GAAGaagaGAGACCAACA   腺瘤性结肠息肉 SEQ ID NO:184
1156  GAAgagaGACCAACAAA   腺瘤性结肠息肉 SEQ ID NO:185
1168  GAAgagaaACGTCATGTG   腺瘤性结肠息肉 SEQ ID NO:186
1178  GATTAtagtttaAAATATGCCA   腺瘤性结肠息肉 SEQ ID NO:187
1181  TTAAaATATGCCACA   腺瘤性结肠息肉 SEQ ID NO:188
1184  GCCacagaTATTCCTTCA   腺瘤性结肠息肉 SEQ ID NO:189
1185  ACAgaTATTCCTTCA   腺瘤性结肠息肉 SEQ ID NO:190
1190  TCACAgAAACAGTCAT   腺瘤性结肠息肉 SEQ ID NO:191
1192  AAAcaGTCATTTTCA   腺瘤性结肠息肉 SEQ ID NO:192
1198  TCAaaGAGTTCATCT   腺瘤性结肠息肉 SEQ ID NO:193
1207  AAAAcCGAACATATG   腺瘤性结 SEQ ID NO:194
  肠息肉
1208  ACCgaacATATGTCTTC   腺瘤性结肠息肉 SEQ ID NO:195
1210  CATatGTCTTCAAGC   腺瘤性结肠息肉 SEQ ID NO:196
1233  CCAAGtTCTGCACAGA   腺瘤性结肠息肉 SEQ ID NO:197
1249  TGCAaaGTTTCTTCTA   腺瘤性结肠息肉 SEQ ID NO:198
1259  ATAcaGACTTATTGT   腺瘤性结肠息肉 SEQ ID NO:199
1260  CAGACttATTGTGTAGA   腺瘤性结肠息肉 SEQ ID NO:200
1268  CCAaTATGTTTTTC   腺瘤性结肠息肉 SEQ ID NO:201
1275  AGTtCATTATCATC   腺瘤性结肠息肉 SEQ ID NO:202
1294  CAGGAaGCAGATTCTG   腺瘤性结肠息肉 SEQ ID NO:203
1301  ACCCtGCAAATAGCA   腺瘤性结肠息肉 SEQ ID NO:204
1306  GAAAtaaaAGAAAAGATT   腺瘤性结肠息肉 SEQ ID NO:205
1307  ATAaAAGAAAAGAT   腺瘤性结肠息肉 SEQ ID NO:206
1308  AAAgaaaAGATTGGAAC   腺瘤性结肠息肉 SEQ ID NO:207
1308  AAAGAaaagaTTGGAACTAG   腺瘤性结肠息肉 SEQ ID NO:208
1318  GATCcTGTGAGCGAA   腺瘤性结肠息肉 SEQ ID NO:209
1320  GTGAGcGAAGTTCCAG   腺瘤性结肠息肉 SEQ ID NO:210
1323  GTTCcAGCAGTGTCA   腺瘤性结肠息肉 SEQ ID NO:211
1329  CACCctagaaccAAATCCAGCA   腺瘤性结肠息肉 SEQ ID NO:212
1336  AGACtgCAGGGTTCTA   腺瘤性结肠息肉 SEQ ID NO:213
1338  CAGgGTTCTAGTTT   腺瘤性结肠息肉 SEQ ID NO:214
1340  TCTAgTTTATCTTCA   腺瘤性结肠息肉 SEQ ID NO:215
1342  TTATcTTCAGAATCA   腺瘤性结肠息肉 SEQ ID NO:216
1352  GTTgAATTTTCTTC   腺瘤性结肠息肉 SEQ ID NO:217
1361  CCCTcCAAAAGTGGT   腺瘤性结肠息肉 SEQ ID NO:218
1364  AGTggtgCTCAGACACC   腺瘤性结肠息肉 SEQ ID NO:219
1371  AGTCCacCTGAACACTA   腺瘤性结肠息肉 SEQ ID NO:220
1372  CCACCtGAACACTATG   腺瘤性结肠息肉 SEQ ID NO:221
1376  TATGttCAGGAGACCC   腺瘤性结肠息肉 SEQ ID NO:222
1394  GATAgtTTTGAGAGTC   腺瘤性结肠息肉 SEQ ID NO:223
1401  ATTGCcAGCTCCGTTC   腺瘤性结肠息肉 SEQ ID NO:224
1415  AGTGGcATTATAAGCC   腺瘤性结肠息肉 SEQ ID NO:225
1426  AGCCcTGGACAAACC   腺瘤性结肠息肉 SEQ ID NO:226
1427  CCTGGaCAAACCATGC   腺瘤性结肠息肉 SEQ ID NO:227
1431  ATGCcACCAAGCAGA   腺瘤性结肠息肉 SEQ ID NO:228
1454  AAAAAtAAAGCACCTA   腺瘤性结 SEQ ID NO:229
  肠息肉
1461  GAAaAGAGAGAGAG   腺瘤性结肠息肉 SEQ ID NO:230
1463  AGAgagaGTGGACCTAA   腺瘤性结肠息肉 SEQ ID NO:231
1464  GAGAgTGGACCTAAG   腺瘤性结肠息肉 SEQ ID NO:232
1464  GAGAgtGGACCTAAGC   腺瘤性结肠息肉 SEQ ID NO:233
1464  GAGagTGGACCTAAG   腺瘤性结肠息肉 SEQ ID NO:234
1492  GCCaCGGAAAGTAC   腺瘤性结肠息肉 SEQ ID NO:235
1493  ACGGAaAGTACTCCAG   腺瘤性结肠息肉 SEQ ID NO:236
1497  CCAgATGGATTTTC   腺瘤性结肠息肉 SEQ ID NO:237
1503  TCAtccaGCCTGAGTGC   腺瘤性结肠息肉 SEQ ID NO:238
1522  TTAagaataaTGCCTCCAGT   腺瘤性结肠息肉 SEQ ID NO:239
1536  GAAACagAATCAGAGCA   腺瘤性结肠息肉 SEQ ID NO:240
1545  TCAAAtgaaaACCAAGAGAA   腺瘤性结肠息肉 SEQ ID NO:241
1547  GAAaACCAAGAGAA   腺瘤性结肠息肉 SEQ ID NO:242
1550  GAGAaagaGGCAGAAAAA   腺瘤性结肠息肉 SEQ ID NO:243
1577  GAATgtATTATTTCTG   腺瘤性结肠息肉 SEQ ID NO:244
1594  CCAGCcCAGACTGCTT   腺瘤性结肠息肉 SEQ ID NO:245
1596  CAGACtGCTTCAAAAT   腺瘤性结肠息肉 SEQ ID NO:246
1823  TTCAaTGATAAGCTC   腺瘤性结肠息肉 SEQ ID NO:247
1859  AATGAttctTTGAGTTCTC   腺瘤性结肠息肉 SEQ ID NO:248
1941  CCAGAcagaGGGGCAGCAA   带形纤维瘤 SEQ ID NO:249
1957  GAAaATACTCCAGT   腺瘤性结肠息肉 SEQ ID NO:250
1980  AACaATAAAGAAAA   腺瘤性结肠息肉 SEQ ID NO:251
1985  GAACCtATCAAAGAGA   腺瘤性结肠息肉 SEQ ID NO:252
1986  CCTaTCAAAGAGAC   腺瘤性结肠息肉 SEQ ID NO:253
1998  GAACcAAGTAAACCT   腺瘤性结肠息肉 SEQ ID NO:254
2044  AGCTCcGCAATGCCAA   腺瘤性结肠息肉 SEQ ID NO:255
2556  TCATCccttcctcGAGTAAGCAC   腺瘤性结肠息肉 SEQ ID NO:256
2643  CTAATttatCAAATGGCAC   腺瘤性结肠息肉 SEQ ID NO:257
表X:小插入
密码子 插入 表型
157 T 腺瘤性结肠息肉
170 AGAT 腺瘤性结肠息肉
172 T 腺瘤性结肠息肉
199 G 腺瘤性结肠息肉
243 AG 腺瘤性结肠息肉
266 T 腺瘤性结肠息肉
357 A 腺瘤性结肠息肉
405 C 腺瘤性结肠息肉
413 T 腺瘤性结肠息肉
416 A 腺瘤性结肠息肉
457 G 腺瘤性结肠息肉
473 A 腺瘤性结肠息肉
503 ATTC 腺瘤性结肠息肉
519 C 腺瘤性结肠息肉
528 A 腺瘤性结肠息肉
561 A 腺瘤性结肠息肉
608 A 腺瘤性结肠息肉
620 CT 腺瘤性结肠息肉
621 A 腺瘤性结肠息肉
623 TTAC 腺瘤性结肠息肉
627 A 腺瘤性结肠息肉
629 A 腺瘤性结肠息肉
636 GT 腺瘤性结肠息肉
639 A 腺瘤性结肠息肉
704 T 腺瘤性结肠息肉
740 ATGC 腺瘤性结肠息肉
764 T 腺瘤性结肠息肉
779 TT 腺瘤性结肠息肉
807 AT 腺瘤性结肠息肉
827 AT 腺瘤性结肠息肉
831 A 腺瘤性结肠息肉
841 CTTA 腺瘤性结肠息肉
865 CT 腺瘤性结肠息肉
865 AT 腺瘤性结肠息肉
900 TG 腺瘤性结肠息肉
921 G 腺瘤性结肠息肉
927 A 腺瘤性结肠息肉
935 A 腺瘤性结肠息肉
936 C 腺瘤性结肠息肉
975 A 腺瘤性结肠息肉
985 T 腺瘤性结肠息肉
997 A 腺瘤性结肠息肉
1010 TA 腺瘤性结肠息肉
1085 C 腺瘤性结肠息肉
1085 AT 腺瘤性结肠息肉
1095 A 腺瘤性结肠息肉
1100 GTTT 腺瘤性结肠息肉
1107 GGAG 腺瘤性结肠息肉
1120 G 腺瘤性结肠息肉
1166 A 腺瘤性结肠息肉
1179 T 腺瘤性结肠息肉
1187 A 腺瘤性结肠息肉
1211 T 腺瘤性结肠息肉
1256 A 腺瘤性结肠息肉
1265 T 腺瘤性结肠息肉
1267 GATA 腺瘤性结肠息肉
1268 T 腺瘤性结肠息肉
1301 A 腺瘤性结肠息肉
1301 C 腺瘤性结肠息肉
1323 A 腺瘤性结肠息肉
1342 T 腺瘤性结肠息肉
1382 T 腺瘤性结肠息肉
1458 GTAG 腺瘤性结肠息肉
1463 AG 腺瘤性结肠息肉
1488 T 腺瘤性结肠息肉
1531 A 腺瘤性结肠息肉
1533 T 腺瘤性结肠息肉
1554 A 腺瘤性结肠息肉
1555 A 腺瘤性结肠息肉
1556 T 腺瘤性结肠息肉
1563 GACCT 腺瘤性结肠息肉
1924 AA 带形纤维瘤
表XI:小插入/缺失
位置/密码子 缺失 插入 表型
538 GAAGAcTTACAGCAGG gaa   腺瘤性结肠息肉 SEQ ID NO:258
620 CTTACttaCCGGAGCCAG ct   腺瘤性结肠息肉 SEQ ID NO:259
728 AATctcatGGCAAATAGG(SEQ ID NO:260) Ttgcagctttaa(SEQ ID NO:261 腺瘤性结肠息肉
971 GATGgtTATGGTAAAA taa   腺瘤性结肠息肉 SEQ ID NO:262
表XII:大缺失
包括ex.11的2kb 腺瘤性结肠息肉
3kb I10E11-1.5kb至I12E13-170bp 腺瘤性结肠息肉
335bp nt.1409-1743 ex.11-13 腺瘤性结肠息肉
包括ex.14的6kb 腺瘤性结肠息肉
817bp I13E14-679至I13E14+138 腺瘤性结肠息肉
ex.11-15M 腺瘤性结肠息肉
ex.11-3′UTR 腺瘤性结肠息肉
ex.15A-ex.15F 腺瘤性结肠息肉
ex.4 腺瘤性结肠息肉
ex.7,8和9 腺瘤性结肠息肉
ex.8至cx.15F之外 腺瘤性结肠息肉
ex.8-ex.15F 腺瘤性结肠息肉
ex.9 腺瘤性结肠息肉
>10mb(del 5q22) 腺瘤性结肠息肉
表XII:大插入和重复序列
描述 表型
插入14bp nt.3816 腺瘤性结肠息肉
插入22bp nt.4022 腺瘤性结肠息肉
重复43bp cd.1295 腺瘤性结肠息肉
插入of337bp Alu I序列cd.1526 带形纤维瘤
表XV:复杂重排(包括倒位)
A-T nt.4893 Q1625H,Del C nt.4897 cd.1627 腺瘤性结肠息肉
Del 1099bp I13E14-728至E14I14+156,ins 126bp 腺瘤性结肠息肉
Del 1601bp E14I14+27至E14I14+1627,ins 180bp 腺瘤性结肠息肉
Del 310bp,ins.15bp nt.4394,cd 1464 腺瘤性结肠息肉
Del A和T cd.1395 腺瘤性结肠息肉
Del TC nt.4145,Del TGT nt.4148 腺瘤性结肠息肉
Del.T,nt.983,Del.70bp,nt.985 腺瘤性结肠息肉
Del.nt 3892-3903,ins ATTT 腺瘤性结肠息肉
表XV:诊断应用
癌症类型 标记物 应用 参考文献
乳腺癌 Her2/Neu检测-在密码子655处的多态性(GTC/缬氨酸到ATC/异亮氨酸[Val(655)Ile]) 使用此处描述的方法,设计第二引物使得PCR和用限制酶消化后,产生含有Her2/Neu的密码子655处DNA序列的5’突出端。Her2/Neu可作为乳腺癌可能的标记被检测和定量。此处描述的方法可检测突变等位基因和正常等位基因,甚至当突变等位基因是总DNA的一小部分时。乳腺癌的Herceptin治疗是基于Her2的筛选。突变基因可被检测的越早,则可更快地提供治疗。 D.Xie等,J.Natl.CancerInstitute,92 412(2000)K.S.Wilson等,Am.J.Pathol.161,1171(202)L.Newman  CancerControl,9,473(2002)
乳腺/卵巢癌 BRCA1的过度甲基化 此处描述的方法可用于区分遗传的BRCA1突变导致的肿瘤和该基因的非遗传的异常甲基化导致的肿瘤 M.Esteller等,NewEngland Jnl Med.,344,539(2001)
膀胱癌 尿、血清和血浆中游离肿瘤DNA的微卫星分析 此处描述的方法可应用于微卫星分析和FGFR3突变分析以检测膀胱癌。此处描述的方法提供了膀胱癌检测的非侵入性方法 W.G.Bas等,ClinicalCancer Res.,9,257(2003)M.Utting等,ClinicalCancer Res.,8,35(2002)L.Mao,D.Sidransky等,Science,271,669(1996)
肺癌 来自痰的DNA的微卫星分析 此处描述的方法可用于检测痰样品中的突变,并且可显著增强临床前肺癌筛选的准确性 T.Liloglou等,CancerResearch,61,1624,(2001)M.Tockman等,CancerControl,7,19(2000)Field等,CancerReseach,59,2690(1999)
子宫颈癌 HPV基因型的分析 此处描述的方法可用于检测来自子宫颈涂片制备物的HPV基因型 N.Munoz等,NewEngland Jnl Med.,348,518(2003)
头和颈癌 片状剥落的口腔粘膜细胞的肿瘤特异性改变(微卫星标记物) 此处描述的方法可用于检测23种微卫星标记物中的任何一种,这些微卫星标记物与头颈鳞状细胞癌(HNSCC)相关 M.Spafford等,ClinicalCancer Reseasrch,17,607(2001)A.EI-Naggar等,J.Mol.Diag.,3,164(2001)
结肠直肠癌 K-ras2  和APC基因中突变的筛选 此处描述的方法可用于检测K-ras2突变,其可用作结肠直肠癌的预后指示剂。APC(见实施例5) B.Ryan等,Gut,52,101(2003)
前列腺癌 GSTP1过度甲基化 此处描述的方法可用于检测来自前列腺癌症病人尿的GSTP1过度甲基化;这可以是较PSA更准确的指示剂 P.Cairns等,Clin.Can.Res.7,2727(2001)
HIV
抗逆转录病毒抗性 筛选个体的HIV病毒突变-例如154V突变或CCR5Δ32等位基因 此处描述的方法可用于检测HIV病毒的突变。在受到基于抗性筛选而进行抗逆转录病毒治疗的个体中治疗结果改善 J.Durant等,The Lancet,353,2195(1999)
心脏病学
充血性心力衰竭 β1和α2c肾上腺素能受体的协同多态性 此处描述的方法可用于确定这些基因座的基因型并有助于鉴定处于心力衰竭的高危中的人。 K.Small等,NewEng.Jnl.Med.,347,1135(2002)
实施例8
单核苷酸多态性(SNPs)代表序列变化的最常见形式;估计在人基因组中存在三百万在人群中出现频率大于5%的常见SNPs。已经开发了使用这些多态性作为指导的遗传图谱(http://research.marshfieldclinic.org/genetics/;2003年2月13目的网址)。
等位基因频率随不同SNP而变化;一种SNP的等位基因频率可能是50∶50,而另一种SNP的等位基因频率可能是90∶10。等位基因频率越接近50∶50,特定个体在该SNP处越可能接近杂合。SNP协会提供了一些SNP的等位基因频率信息,但是对其他SNP没有提供(www.snp.chsl.org)。特定SNP的等位基因频率提供了有价值的信息从而所述SNP可以用于实施例5中描述的非侵入性产前筛选方法。尽管可以使用所有SNP,但是优选等位基因频率接近50∶50的SNP。
简言之,母亲血液含有胎儿DNA。母亲DNA可与胎儿DNA相区别,这可通过检查其中母亲是纯合的SNP来实现。例如,在SNP X,母亲DNA对鸟嘌呤可能是纯合的。如果从怀孕女性的血浆中得到的模板DNA是杂合的,这一点可通过检测相应于腺嘌呤等位基因和鸟嘌呤等位基因的信号而阐明,则腺嘌呤等位基因可以用作胎儿DNA的信号标灯(见实施例5)。SNP的等位基因频率越接近50∶50,母亲DNA和胎儿DNA在特定SNP处越可能存在等位基因差异。
例如,如果在SNP X观察的等位基因为腺嘌呤和鸟嘌呤,并且SNP具有90(A):10(G)的等位基因频率,那么可能母亲和父亲在该特定SNP处的腺嘌呤是纯合的。从而,母亲DNA和胎儿DNA将对腺嘌呤是纯合的,并且对胎儿DNA没有明显的信号。然而,如果在SNP X等位基因频率是50∶50,并且母亲对腺嘌呤是纯合的,那么父亲DNA在SNP X处含有鸟嘌呤等位基因的可能性就更高一些。
下面,提供了确定SNP等位基因频率的方法。分析了13号染色体上的7个SNP。该方法可应用于任何SNP,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y人染色体上的SNP。
模板DNA的制备
为了确定特定SNP的等位基因频率,获得知情同意后从250个个体得到DNA。对于每个个体,将9ml血样收集到无菌管(Fischer Scientific,9mlEDTA Vacuette管,目录号NC9897284)中。将管在1000转/分钟下旋转10分钟。除去每个样品的上清液(血浆),并将1ml剩余血样(其通常被称作“棕黄层”)转移到新管。向每个样品加入1ml 1XPBS。
使用QIAGEN提供的QIAmp DNA Blood Midi Kit(目录号51183)分离模板DNA。按照试剂盒中的说明书分离模板DNA。对于每个个体,将0.76μg DNA合并,合并的DNA在所有后续反应中使用。
引物设计
使用下面的引物组扩增SNP TSC0903430:
第一引物:
5′GTCTTGCATGTAGAATTCTAGGGACGCTGCTTTTCGTC 3′
第二引物:
5′CTCCTAGACATCGGGACTAGAATGTCCAC 3′
第一引物含有限制酶EcoRI的识别位点,并设计距离目标基因座82个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC0337961:
第一引物:
5′ACACAAGGCAGAGAATTCCAGTCCTGAGGGTGGGGGCC 3′
第二引物:
5′CCGTGTTTTAACGGGACAAGCTGTTCTTC 3′
第一引物含有限制酶EcoRI的识别位点,并设计为距离目标基因座92个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC0786441:
第一引物:
5′GTAGCGGAGGTTGAATTCTATATGTTGTCTTGGACATT 3′
第二引物:
5′CATCAGTAGAGTGGGACGAAAGTTCTGGC 3′
第一引物含有限制酶EcoRI的识别位点,并被设计为距离目标基因座104个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC1168303:
第一引物:
5′ATCCACGCCGCAGAATTCGTATTCATGGGCATGTCAAA 3′
第二引物:
5′CTTGGGACTATTGGGACCAGTGTTCAATC 3′
第一引物含有限制酶EcoRI的识别位点,并被设计为距离目标基因座64个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC0056188:
第一引物:
5′CCAGAAAGCCGTGAATTCGTTAAGCCAACCTGACTCCA 3′
第二引物:
5′TCGGGGTTAGTCGGGACATCCAGCAGCCC 3′
第一引物含有限制酶EcoRI的识别位点,并被设计为距离目标基因座82个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC0466177:
第一引物:
5′CGAAGGTAATGTGAATTCCAAAACTTAGTGCCACAATT 3′
第二引物:
5′ATACCGCCCAACGGGACAGATCCATTGAC 3′
第一引物含有限制酶EcoRI的识别位点,并被设计为距离目标基因座92个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
使用下面的引物组扩增SNP TSC0197424:
第一引物:
5′AGAAACCTGTAAGAATTCGATTCCAAATTGTTTTTTGG 3′
第二引物:
5′CGATCATAGGGGGGGACAGGAGAGAGCAC 3′
第一引物含有限制酶EcoRI的识别位点,并被设计为距离目标基因座104个碱基处退火。第二引物含有限制酶BsmF I的识别位点。
第一引物被设计以从距离目标基因座各种距离处退火。技术人员理解第一引物的退火位置可以是距离目标基因座任何距离,包括但不限于5-10、11-15、16-20、21-25、26-30、31-35、36-40、41-45、46-50、51-55、56-60、61-65、66-70、71-75、76-80、81-85、86-90、91-95、96-100、101-105、106-110、111-115、116-120、121-125、126-130、131-140、141-160、161-180、181-200、201-220、221-240、241-260、261-280、281-300、301-350、351-400、401-450、451-500、501-1000、1001-2000、2001-3000、或者大于3000。
所有目标基因座都是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。在该实施例中,在分开的反应管中扩增目标基因座,但是它们也可以在单个反应中一起扩增。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以对每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用40ng人基因组DNA模板(来自245个个体的模板DNA的混合物)和每种引物5μM。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
将PCR产物从未被使用的PCR试剂中分离出来。PCR反应后,将对SNP TSC0903430、SNP TSC0337961和SNP TSC0786441的反应体积的1/2一起在单个反应管中混合。对SNPs TSC1168303、TSC0056188、TSC0466177和TSC0197424的反应体积的1/2在单个反应管中合并。使用Qiagen MinElute PCR纯化试剂盒(Qiagen,目录号28006)从反应物除去未被使用的引物和核苷酸。按照生产商随柱子提供的用法说明书进行反应。
经分离片段的限制酶消化
纯化的PCR产物用限制酶BsmF I消化,该限制酶结合并掺入至由第二引物所获得的PCR产物上的识别位点。按照随限制酶提供的用法说明书在Eppendorf管中进行消化。
标记的核苷酸的掺入
用BsmF I的限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中详细讨论的,SNP的两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。将下面的组分加入到每个填充反应中:1μl荧光标记的ddGTP,0.5μl未标记的ddNTPs(40μM),其含有除了鸟苷酸之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。Sequenase是在该实施例中所用的DNA聚合酶。然而,任何聚合酶可以用于填充反应,这些聚合酶包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、T7 DNA聚合酶、T4 DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent DNA聚合酶、来自噬菌体29的聚合酶和REDTaqTM基因组DNA聚合酶。非荧光标记的ddNTP购自FermentasInc.(Hanover、Md.)。所有其他标记试剂来自Amersham(ThermoSequenase Dye Terminator Cycle Sequencing Core Kit,US 79565)。
目标基因座的检测
将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio WhittakerMolecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(HoeferSQ3 Sequencer)上运行3小时。从测序仪除去凝胶并在Typhoon 9400Variable Mode Imager上扫描。通过荧光检测掺入的标记核苷酸。
下面复制了SNP TSC0056188的5’突出端的示意图(其中R表示可变位点)。没有显示全部序列,仅仅显示了突出端部分。
5′CCA
3′GGT        R    T    C    C
突出端位置    1    2    3    4
如在实施例6中所详细讨论的,用化学部分标记的一种核苷酸可用于确定目标基因座处等位基因的序列。5’有义链(此处描述为顶部链)上TSC0056188的观察核苷酸是腺嘌呤和鸟嘌呤。反义链上突出端中的三位为胞嘧啶,其与鸟嘌呤互补。由于可变位点可以是腺嘌呤或鸟嘌呤,在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP被用于确定两种等位基因的序列。对鸟嘌呤纯合、对腺嘌呤纯合或杂合的个体的填充反应图示如下。
纯合的腺嘌呤:
5′CCA        A    A    G*
3′GGT        T    T    C    C
突出端位置    1    2    3    4
纯合的鸟嘌呤:
5′CCA        G*
3′GGT        C    T    C    C
突出端位置    1    2    3    4
杂合的:
等位基因1     5′CCA  G*
              3′GGT  C    T    C    C
突出端位置            1    2    3    4
等位基因2    5′CCA    A    A    G*
             3′GGT    T    T    C    C
突出端位置             1    2    3    4
如在图14中所看到的,对SNP TSC0056188检测到两条带。较低的带相应于在与突出端互补的1位用ddGTP填充的DNA分子,该带代表鸟嘌呤等位基因。较高的带(通过与较低的带相差1个碱基而分离)相应于在与突出端互补的3位用ddGTP填充的DNA分子,该带代表腺嘌呤等位基因。每条带的强度都是强的,表明每一等位基因在群体中具有好的代表性。SNPTSC0056188是具有高等位基因频率的SNP的代表。
下面复制了SNP TSC0337961用BsmF I消化后产生的5’突出端的示意图(其中R表示可变位点)。没有显示全部序列,仅仅显示了突出端部分。
5′GCCA
3′CGGT           R    G    C    T
突出端位置        1    2    3    4
5’有义链(此处描述为顶部链)上SNP TSC0337961的观察核苷酸是腺嘌呤和鸟嘌呤。反义链上突出端中的三位为胞嘧啶,其与鸟嘌呤互补。由于可变位点可以是腺嘌呤或鸟嘌呤,在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP被用于确定两种等位基因的序列。对鸟嘌呤纯合、对腺嘌呤纯合或杂合的个体的填充反应图示如下。
对鸟嘌呤纯合:
          5′GCCA         G*
          3′CGGT         C    G    C    T
突出端位置                1    2    3    4
对腺嘌呤纯合:
          5′GCCA         A    C    G*
          3′CGGT         T    G    C    T
突出端位置                1    2    3    4
杂合的:
等位基因1    5′GCCA          G*
             3′CGGT          C    G    C    T
突出端位置                    1    2    3    4
等位基因2    5′GCCA          A    C    G*
             3′CGGT          T    G    C    T
突出端位置                    1    2    3    4
如在图14中所看到的,观察到在预期的较低分子量位置处迁移的一条带。该带代表在与突出端互补的1位用ddGTP填充的DNA分子。没有检测到相应于在与突出端互补的3为用ddGTP填充的DNA分子带。SNPTSC0337961是在群体中不高度可变的SNP的代表。
在所分析的7种SNP中,四种SNP(TSC1168303、TSC0056188、TSC0466177和TSC0197424)具有高等位基因频率。对四种SNP中的每一种见到高强度的两条带,表明两个等位基因在人群中都有良好的代表性。
然而,不必SNP具有50∶50的等位基因频率而成为有用的。所有SNP都提供了有用的信息。此处描述的方法提供了确定SNP或者包括但不限于点突变的任一可变位点处等位基因频率的快速技术。可以使用50∶50、51∶49、52∶48、53∶47、54∶46、55∶45、56∶46、57∶43、58∶42、59∶41、60∶40、61∶39、62∶38、63∶37、64∶36、65∶35、66∶34、67∶33、68∶32、69∶31、70∶30、71∶29、72∶28、73∶27、74∶26、75∶25、76∶24、77∶23、78∶22、79∶21、80∶20、81∶19、82∶18、83∶17、84∶16、85∶15、86∶14、87∶13、88∶12、89∶11、90∶10、91∶9、92∶8、93∶7、94∶6、95∶5、96∶4、97∶3、98∶2、99∶1和100∶0的等位基因频率。
对SNP TSC0903430见到两条带。一条带—低分子量带代表用标记的ddGTP填充的DNA分子。对于在与突出端互补的3位用标记的ddGTP填充的分子见到较弱强度的一条带,其代表胞嘧啶等位基因。SNP 0903430代表具有低等位基因频率变化的SNP。在群体中,大多数个体携带鸟嘌呤等位基因,但是胞嘧啶等位基因仍然存在。
对于SNP TSC0337961和SNP TSC0786441见到一条高强度带。对于SNP TSC0337961和SNP TSC0786441检测到的带相应于在与突出端互补的1位用ddGTP填充的DNA分子。对于在与突出端互补的3位应该已经被填充的DNA分子没有检测到信号,其应该代表第二个等位基因。SNPTSC0337961和SNP TSC0786441代表人群中基本无变化的SNP。
如在图14所阐明的,用于扩增每个目标基因座的第一引物可以设计在距离目标基因座不同距离处退火。这使得可以在相同反应中分析多个SNP。通过设计在距离目标基因座不同距离处退火的第一引物,在单个反应中可以分析任何数目的目标基因座,这些数目包括但不限于1-10、11-20、21-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-110、111-120、121-130、131-140、141-150、151-160、161-170、171-180、181-190、191-200、201-300、301-400、401-500、和大于500。
如在实施例6中所讨论的,一些IIS型限制酶显示了备选切割模式。例如,IIS型限制酶BsmF I从其结合位点10/14处切割;然而,该酶也从其结合位点11/15处切割。为了消除备选切割的影响,应该选择用于填充反应的经标记核苷酸使得其与通过11/15切割产生的突出端的0位不互补(在实施例6中详细讨论)。例如,如果你用ddGTP标记,填充的链上可变位点前的核苷酸不应是鸟嘌呤。
对SNP TSC 0056188通过BsmF I产生的11/15突出端描绘如下,可变位点以粗体表示:
TSC0056188的11/15突出端
          等位基因1   5’CC
                      3’GG    T    C    T    C
          突出端位置           0    1    2    3
          等位基因2   5’CC
                      3’GG    T    T    T    C
          突出端位置           0    1    2    3
用标记的ddGTP、未标记的dATP、dTTP和dCTP填充后产生下面的分子:
           11/15等位基因1 5’CC       A    G*
                          3’GG       T    C    T    C
                          突出端位置  0    1    2    3
           11/15等位基因2 5’CC       A    A    A    G*
                          3’GG       T    T    T    C
                          突出端位置  0    1    2    3
见到两个信号;一条带相应于在突出端的1位用ddGTP填充的分子,另一条带相应于在与突出端互补的3位用ddGTP填充的分子。这些是10/14突出端的填充反应后产生的相同DNA分子。从而,这两条带可以比较而没有备选切割导致的不确定性。这种用单核苷酸的标记方法消除了酶的备选切割性质产生的任何误差。
此处描述的方法可用于确定任一SNP的等位基因频率,这些SNP包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X和Y染色体上的SNP。
实施例9
根据定义,杂合SNP的差别在于一个核苷酸的不同。在杂合SNP处,等位基因1和等位基因2可以1∶1的比例存在。然而,可能DNA聚合酶掺入一种核苷酸的速度比另一种核苷酸快,从而杂合SNP的观测比例与理论上预测的1∶1比例不同。
下面,描述了杂合SNP处等位基因1和等位基因2的预期比例的有效和准确定量的方法。
模板DNA的制备
知情同意批准后从24个个体得到模板DNA。从每个个体将9ml血样收集到无菌管(Fischer Scientific,9ml EDTA Vacuette管,目录号NC9897284)中。管在1000转/分钟下不间断旋转10分钟。除去每个样品的上清液(血浆),并将1ml剩余血样(其通常被称作“棕黄层”)转移到新管。向每个样品加入1ml 1XPBS。
使用QIAGEN提供的QIAmp DNA Blood Midi Kit(目录号51183)分离模板DNA。按照试剂盒中的说明书分离模板DNA。
引物的设计
使用下面的引物组扩增SNP TSC0607185:
第一引物:
5′ACTTGATTCCGTGAATTCGTFATCAATAAATCTTACAT 3′
第二引物:
5′CAAGTTGGATCCGGGACCCAGGGCTAACC 3′
使用下面的引物组扩增SNP TSC1130902:
第一引物:
5′TCTAACCATTGCGAATTCAGGGCAAGGGGGGTGAGATC 3′
第二引物:
5′TGACTTGGATCCGGGACAACGACTCATCC 3′
第一引物含有5’端的生物素标签和限制酶EcoRI的识别位点。第二引物含有限制酶BsmF I的识别位点。第一引物被设计以在离目标基因座的不同距离处退火。
SNP TSC0607185的第一引物被设计从距离目标基因座90个碱基处退火。SNP TSC1130902的第一引物被设计从距离目标基因座60个碱基处退火。
所有目标基因座都是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。在该实施例中,在分开的反应管中扩增目标基因座,但是它们也可以在单个反应中一起扩增。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用40ng人基因组DNA模板和每种引物5μM。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员将理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
从基因组模板DNA分离PCR产物。每种PCR产物的一半被转移到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的)的1个孔中。第一引物含有一个5’生物素标记,从而PCR产物结合包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物的PCR产物的识别位点的限制酶BsmFI消化纯化的PCR产物。按照随酶提供的用法说明书在Streptawell中进行消化。消化后,用PSB洗涤孔三次以除去被切下的片段。
经标记核苷酸的掺入
用BsmF I的限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中详细讨论的,SNP处两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。将下面的组分加入到每个填充反应中:1μl荧光标记的ddGTP,0.5μl未标记的ddNTPs(40μM),其含有除了鸟苷酸之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应物所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover、Md.)。所有其他标记试剂来自Amersham(Thermo Sequenase Dye Terminator CycleSequencing Core Kit,US 79565)。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段。在120转/分钟摇动下于37℃下消化进行1小时。
目标基因座的检测
将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio WhittakerMolecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(HoeferSQ3 Sequencer)上运行3小时。从测序仪除去凝胶并在Typhoon 9400Variable Mode Imager上扫描。在每条带的周围划框并使用Typhoon 9400Variable Mode Imager软件计算带的强度.
下面,显示了SNP TSC0607185的5’突出端的示意图。没有显示全部序列,仅仅显示了突出端部分(其中R表示可变位点)。
C  C  T  R         TGTC 3′
                     ACAG 5′
4  3  2  1           突出端位置
5’有义链(此处描述为顶部链)上TSC0607185在可变位点处观察到的核苷酸是胞嘧啶和胸腺嘧啶(此处描述为R)。在此情况下,第二引物从目标基因座退火,这允许填充反应在反义链(此处描绘为底部链)上发生。反义链将用鸟嘌呤或腺嘌呤填充。
5’突出端中的第二位为胸腺嘧啶,其与腺嘌呤互补,突出端中的第三位为胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP被用于确定两种等位基因的序列。填充反应后,产生如下DNA分子:
C  C  T  C     TGTC 3′等位基因1
         G*   ACAG 5′
4  3  2  1     突出端位置
C  C  T  T     TGTC 3′等位基因1
   G*A  A     ACAG 5′
4  3  2  1     突出端位置
通过BsmF I在TSC0607185的识别位点11/15处切割产生的突出端描绘如下:
C  T  R  T     GTC 3′11/15
               CAG 5′
3  2  1  0     突出端位置
由于标记的ddGTP用于填充反应,从识别位点的11/15处切割的分子将不会产生新信号。与突出端互补的0位被未标记的dATP填充。仅仅看到从在与突出端互补的1位用标记的ddGTP填充的分子或在与突出端互补的3位用标记的ddGTP填充的分子产生的信号。
24个个体中的5个对SNP TSC0607185是杂合的。如图15所示,检测到两条带。较低分子量的带相应于在与突出端互补的1位用标记的ddGTP填充的DNA分子。较高分子量的带相应于在与突出端互补的3位用标记的ddGTP填充的DNA分子。
对5个杂合样品中的每一个计算两个等位基因的比例(见表XVI)。等位基因2与等位基因1的比例为1.000,标准差是0.044。从而,在SNPTSC0607185处的等位基因比例高度一致。关于特定SNP的实验计算的等位基因比例此后被成为SNP的“p”值。SNP TSC0607185的分析将一致地提供1∶1的等位基因比例,条件是基因组分析的数目为足够数量从而不会从统计样品产生误差。
如果样品含有低数目的基因组,统计上可能引物将与一条染色体而不与另一条染色体退火。例如,如果样品含有40个基因组,其相应于等位基因1的总共40条染色体和等位基因2的40条染色体,引物可以与等位基因1的40条染色体退火,而只与等位基因2的35条染色体退火。这将导致等位基因1比等位基因2优选扩增,从而导致等位基因1与等位基因2的比例改变。可通过样品中存在足够数目的基因组消除该问题。
SNP TSC0607185代表一种SNP,其中可变位点上核苷酸的不同不影响PCR反应,或者限制酶的消化或者填充反应。使用一种荧光染料标记的一种核苷酸确保了一个等位基因的带可与另一个等位基因的带准确比较。没有不得不比较两个不同泳道,或者不得不为染料的量子系数进行校正的附加复杂性。此外,IIS型限制酶的备选切割性质导致的任何影响已经被去除。
表XVI.在SNP TSC0607185和TSC1130902处等位基因1与等位基因2的比例
             SNP TSC0607185                                SNP TSC1130902
 样品  等位基因1  等位基因2  等位基因2/等位基因1  等位基因1  等位基因2  等位基因2/等位基因1
 1  2382  2313  0.971033  5877  4433  0.754296
 2  1581  1533  0.969639  3652  2695  0.737952
 3  1795  1879  1.046797  5416  3964  0.730059
 4  1921  1855  0.965643  3493  2663  0.762382
 5  1618  1701  1.051298  3894  2808  0.721109
 平均值  1.000882  0.74116
 标准差  0.044042  0.017018
下面,显示了SNP TSC1130902的5’突出端的示意图。没有显示全部序列,仅仅显示了突出端部分(其中R表示可变位点)。
           5′TTCAT
           3′AAGTA  R  T  C  C
突出端位置           1  2  3  4
5’有义链(此处描述为顶部链)上TSC1130902所观察到的核苷酸是腺嘌呤和鸟嘌呤。突出端中的第二位相应于胸腺嘧啶,突出端中的第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP、dTTP和dATP存在下荧光标记的ddGTP被用于确定两种等位基因的序列。填充反应后产生下面的DNA分子:
等位基因1  5′TTCAT  G*
           3′AAGTA  C  T  C  C
突出端位置           1  2  3  4
等位基因2  5′TTCAT  A  A  G*
            3′AAGTA T  T  C  C
突出端位置           1  2  3  4
如图15所示,检测到两条带。较低的分子量带相应于在与突出端互补的1位用ddGTP填充的DNA分子(G等位基因)。较高分子量的带(通过与较低的带相差1个碱基而分离)相应于在与突出端互补的3位用ddGTP填充的DNA分子(A等位基因)。
24个个体中的5个对SNP TSC1130902是杂合的。如图15中所看到的,相应于等位基因1的带比相应于等位基因2的带更强。对5个个体中的每一个都看到这种现象。相应于等位基因1的带的实际强度随不同个体而变,但是其总是比相应于等位基因2的带更强。对于5个个体,等位基因2与等位基因1的平均比例为0.74116,标准差为0.017018。
从5个不同个体制备模板DNA。进行单独的PCR反应、单独的限制酶消化和单独的填充反应。然而,对于每种模板DNA,等位基因2与等位基因1的比例约为0.75。该SNP的“p”值高度一致。
例如,对于SNP TSC1130902,“p”值为0.75。如果样品含有足够数量的基因组以除去统计样品误差,那么该值的任何误差将说明有13号染色体的异常拷贝数。如果有等位基因2的额外拷贝,“p”值将比预期的0.75高。然而,如果有等位基因1的额外拷贝,“p”值将比预期的0.75低。为特定SNP定量“p”值后,该SNP可用于确定染色体异常的存在与否。为单个SNP测量的准确“p”值将足够检测染色体异常的存在。
对于为什么在一些SNP一种等位基因与另一种等位基因的比例与理论预期的比例1∶1相背离有几种可能的解释。首先,可能DNA聚合酶掺入一种核苷酸比另一种快。由于等位基因被PCR扩增,即使对一种核苷酸比对另一种有微弱的优选性也可以导致与预期的1∶1比例不同。在填充反应中没有见到对一种核苷酸比对另一种的潜在优选性,因为使用了用一种染料标记的一种核苷酸。
也可能SNP位点处的可变核苷酸影响两个等位基因变性的速率。如果等位基因1含有鸟嘌呤并且等位基因2含有腺嘌呤,那么这些核苷酸键强度间的差异可影响DNA链分离的速率。再次,重要的是提到等位基因是通过PCR扩增,从而非常微小的差异也可对最终结果产生大的影响。还可能SNP位点处的可变核苷酸影响了两条链分离后退火的速率。
备选地,也可能IIS型限制酶切割一个等位基因比另一个更优选。如上面详细讨论的,IIS型限制酶在离识别位点一定距离处切割。可能SNP位点处的可变核苷酸影响限制酶消化的效率。可能在一些SNP处限制酶以100%的效率切割一个等位基因,而其以90%的效率切割另一个等位基因。
然而,等位基因1与等位基因2的比例背离理论预测比例1∶1这一事实并不影响或降低该SNP的实用性。如上面所阐明的,在不同个体中对每个SNP的“p”值是一致的。
对每个SNP的“p”值可通过分析任何数目杂合个体的模板DNA来计算,这些数目包括但不限于1-10、11-20、21-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-110、111-120、121-130、131-140、141-150、151-160、161-170、171-180、181-190、191-200、201-210、211-220、221-230、231-240、241-250、251-260、261-270、271-280、281-290、291-300和大于300。
此处描述的方法允许确定对每个SNP的“p”值。可能一些SNP比其他SNP表现出更一致。在人类基因组中,有超过3百万个SNP;不可能推测每个SNP的行为。对每个SNP的“p”值将不得不通过实验确定。此处描述的方法允许具有高度一致和可重现的“p”值的SNP的鉴定。
实施例10
如在实施例9中所讨论的,在特定SNP处一个等位基因与另一个等位基因的比例可与理论预测的比例50∶50不同。如果在染色体异常个体中一个等位基因与另一个等位基因的比例保持线性的话,这些SNP可用于检测额外染色体的存在。例如,在SNP X处,如果等位基因1与等位基因2的百分比为75∶25,对于唐氏综合征的个体的等位基因1与等位基因2的期望百分比必须适当调整以反映在该SNP处与预期百分比的不同。
使用来自4个正常个体的模板DNA和来自患唐氏综合征个体的模板DNA计算21号染色体上对SNP TSC0108992等位基因1与等位基因2的百分比。如下面所阐明的,一个等位基因与另一个等位基因的百分比是一致的并且在唐氏综合征个体中保持线性。
模板DNA的制备
从具有正常遗传染色体组型的4个个体和被鉴定为21号染色体额外拷贝(唐氏综合征)的1个个体得到DNA。从所有个体得到知情同意。从患有唐氏综合征的个体的父母得到知情同意。
对于每个个体,将9ml血样收集到无菌管(Fischer Scientific,9mlEDTA Vacuette管,目录号NC9897284)中。使用QIAGEN提供的QIAmpDNA Blood Midi Kit(目录号51183)分离模板DNA。按照试剂盒中的说明书分离模板DNA。
引物设计
使用下面的引物组扩增SNP TSC0108992:
第一引物:
5′CTACTGAGGGCTCGTAGATCCCAATTCCTTCCCAAGCT 3′
第二引物:
5′AATCCTGCTTTAGGGACCATGCTGGTGGA 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点。第二引物含有限制酶BsmFI的识别位点。
SNP TSC0108992是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq MasterMix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用50ng人基因组DNA模板和每种引物5μM。进行PCR的38次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十七(37)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
从基因组模板DNA分离PCR产物。每一PCR反应物被分成两个样品并转移到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645 692,如在Roche Molecular Biochemicals,2001 BiochemicalsCatalog所列的))的两个单独的孔中。第一引物含有一个5’生物素标记,从而PCR产物结合包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物的PCR产物的识别位点的限制酶BsmFI消化纯化的PCR产物。按照随酶提供的用法说明书在Streptawell中进行消化。消化后,用PSB洗涤孔三次以除去切下的片段。
标记的核苷酸的掺入
用BsmF I的限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中详细讨论的,SNP处的两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。将下面的组分加入到每个填充反应中:1μl荧光标记的ddTTP,0.5μl未标记的ddNTPs(40μM),其含有除了胸腺嘧啶之外的所有核苷酸,2μl 10×Sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover,Md.)。所有其他标记试剂来自Amersham(Thermo Sequenase Dye TerminatorCycle Sequencing Core Kit,US 79565)。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段。在120转/分钟摇动下于37℃下消化进行1小时。
目标基因座的检测
将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio WhittakerMolecular Applications,Long Ranger Run Gel Packs,目录号50691)的泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(Hoefer SQ3Sequencer)上运行3小时。从测序仪除去凝胶并在Typhoon 9400 VariableMode Imager上扫描。通过荧光检测掺入的经标记核苷酸。在每条带的周围划框并使用Typhoon 9400 Variable Mode Imager软件计算带的强度。
下面,显示了SNP TSC0108992的5’突出端的示意图。没有显示全部序列,仅仅显示了突出端部分(其中R表示可变位点)。
              GTCC 3′
G  A  C  R    CAGG 5′
4  3  2  1    突出端位置
5’有义链(此处描述为顶部链)上TSC0108992所观察到的核苷酸是腺嘌呤和胸腺嘧啶。突出端的3位相应于腺嘌呤,其与胸腺嘧啶互补。在未标记的dATP、dCTP和dGTP存在下使用荧光标记的ddTTP。用标记的ddTTP进行填充反应后,产生如下DNA分子:
T*G  A       GTCC 3′等位基因1
G  A  C  T    CAGG 5′
4  3  2  1    突出端位置
         T*  GTCC 3′等位基因2
G  A  C  A    CAGG 5′
4  3  2  1    突出端位置
在从等位基因1到等位基因2得到的值的比较中没有困难,因为一种标记的核苷酸被用于填充反应,并且两种等位基因的填充反应在一个管中进行。BsmF I的备选切割性质将不影响该分析,因为11/15突出端将和10/14突出端一样填充。填充的11/15突出端的示意图描绘如下:
T*G  A  G     TCC 3′11/15等位基因1
A  C  T  C     AGG 5′
3  2  1  0     突出端位置
      T*G     TCC 3′11/15等位基因2
A  C  A  C     AGG 5′
3  2  1  0     突出端位置
如在图16中所见到的,对模板DNA的每种样品看到两条带。较低分子量的带相应于在与突出端互补的1位用ddTTP填充的DNA分子,较高的分子量带相应于在与突出端互补的3位用ddTTP填充的DNA分子。
等位基因2与等位基因1的百分比高度一致(见表XVII)。此外,对于任何给定的个体,PCR反应的重复显示类似结果(见表XVII)。通过将等位基因2的值与等位基因1的值和等位基因2的值的和相除(等位基因2/(等位基因1+等位基因2))计算等位基因2与等位基因1的百分比。从4个个体得到的等位基因2与等位基因1的平均百分比为0.4773,标准差为0.0097。分离自唐氏综合征的个体的模板DNA上等位基因2与等位基因1的百分比为0.3086。
与理论上预测的百分比的偏差高度一致并保持线性。下面的式子阐明在SNP TSC0108992处等位基因2与等位基因1的百分比甚至在从具有21号染色体额外拷贝的个体得到的模板DNA上仍然保持线性。
0.47 0.50 = X 0.33
X=0.3102
如果使用从正常个体得到的模板DNA的等位基因2与等位基因1的百分比被确定为0.47,那么使用从唐氏综合征个体得到的模板DNA的等位基因2与等位基因1的百分比应该为0.3102。实验确定的比例为0.3086,标准差为0.00186。从唐氏综合征个体得到的模板DNA的等位基因2与等位基因1的预测百分比和实验确定的百分比之间没有差异。
在特定SNP处一个等位基因与另一个等位基因的百分比是高度一致的、可重复的和线性的。这表明不管一个等位基因与另一个等位基因的计算百分比如何,任何SNP都可用于确定染色体疾病的存在与否。
表XVII.在SNP TSC0108992处等位基因2与等位基因1的百分比
    样品   等位基因2   等位基因1     2/(2+1)
    1A   9568886   10578972     0.474933
    1B   8330864   9221381     0.474632
    2A   9801053   10345444     0.486489
    2B   8970942   9603102     0.482983
    3A   8676718   9211085     0.485063
    3B   10847024   11420943     0.487113
    4A   10512420   12227107     0.462297
    4B   7883584   9055289     0.465414
  平均值     0.477366
  标准差     0.009654
    DS   6797400   15138959     0.309869
    DS   6025753   13586890     0.307238
  平均值     0.308554
  标准差     0.00186
实施例11
对于特定SNP,等位基因2与等位基因1的百分比是高度一致的。与实验所确定比例的统计学上显著的偏差表明存在染色体异常。下面,使用来自正常个体的模板DNA和来自唐氏综合征个体的模板DNA计算了21号染色体上SNP TSC0108992处等位基因2与等位基因1的百分比。以不知情的方式制备并分析了含有正常DNA和唐氏综合征DNA的各种量的混合物。
模板DNA的制备
从一个具有正常遗传染色体组型的个体和一个被鉴定为具有21号染色体的额外拷贝(唐氏综合征)的个体得到DNA。这两个个体都得到知情同意。也从唐氏综合征个体的父母处得到知情同意。
对于每个个体,将9ml血样收集到无菌管(Fischer Scientific,9mlEDTA Vacuette管,目录号NC9897284)中。使用QIAGEN提供的QIAmpDNA Blood Midi Kit(目录号51183)分离模板DNA。按照试剂盒中的说明书分离模板DNA。
模板DNA的混合物
将来自具有正常遗传染色体组型的个体的模板DNA和具有21号染色体的额外拷贝的个体的模板DNA稀释到浓度为10ng/μl。以下面的方式制备正常模板DNA和唐氏综合征模板DNA的四种混合物:
混合物1:32μl正常DNA+8μl唐氏综合征DNA
混合物2:28μl正常DNA+12μl唐氏综合征DNA
混合物3:20μl正常DNA+20μl唐氏综合征DNA
混合物4:10μl正常DNA+30μl唐氏综合征DNA
对正常模板DNA和来自唐氏综合征个体的模板DNA制定3次单独的PCR反应。同样,对于每种混合物,制定3次单独的PCR反应。
引物的设计
使用下面的引物组扩增SNP TSC0108992:
第一引物:
5′CTACTGAGGGCTCGTAGATCCCAATTCCTTCCCAAGCT 3′
第二引物:
5′AATCCTGCTTTAGGGACCATGCTGGTGGA 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点。第二引物含有限制酶BsmF I的识别位点。
SNP TSC0108992是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq MasterMix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用50ng人基因组DNA模板和每种引物5μM。进行PCR的38次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十七(37)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
从基因组模板DNA分离PCR产物。每种PCR反应物被分成两个样品并转移到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645 692,如在Roche Molecular Biochemicals,2001 BiochemicalsCatalog所列的))的两个单独的孔中。对于每种PCR反应物,有两份复制品,每份复制品存在于微量滴定板的单独的孔中。第一引物含有一个5’生物素标记,从而PCR产物结合至包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物的PCR产生的识别位点的限制酶BsmFI消化纯化的PCR产物。按照随酶提供的用法说明书在Streptawell中进行消化。消化后,用1X PSB洗涤孔三次以除去切下的片段。
标记的核苷酸的掺入
用限制酶BsmF I消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中详细讨论的,SNP的两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。下面的组分加入到每个填充反应中:1μl荧光标记的ddTTP,0.5μl未标记的ddNTPs(40μM),其含有除了胸腺嘧啶之外的所有核苷酸,2μl 10×sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover,Md.)。所有其他标记试剂来自Amersham(Thermo Sequenase Dye Terminator CycleSequencing Core Kit,US 79565)。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化从Streptawell释放“填充”的DNA片段。在120转/分钟摇动下于37℃下进行消化1小时。
目标基因座的检测
将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio WhittakerMolecular Applications,Long Ranger Run Gel Packs,目录号50691)的泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(Hoefer SQ3Sequencer)上运行3小时。从测序仪除去凝胶并在Typhoon 9400 VariableMode Imager上扫描。通过荧光检测掺入的标记的核苷酸。在每条带的周围划框并使用Typhoon 9400 Variable Mode Imager软件计算带的强度。
如在图17A-F所看到的,看到两条带。较低分子量的带相应于在与突出端互补的1位用ddTTP填充的DNA分子。较高的带相应于在与突出端互补的3位用ddTTP填充的DNA分子。
实验以不知情的方式进行。对管编号从而不知道那个管相应于哪个模板DNA。分析凝胶后,将每个管分入下面的类别:正常模板DNA、唐氏综合征模板DNA、唐氏综合征模板DNA和正常模板DNA的3∶1混合物、正常模板DNA和唐氏综合征模板DNA的1∶1混合物、唐氏综合征模板DNA和正常模板DNA的1∶2.3混合物、唐氏综合征模板DNA和正常模板DNA的1∶4混合物。每一PCR反应的每次重复都成功地分入合适的组,这表明该方法可用于检测异常DNA,即使其仅仅代表总DNA的一小部分。
对来自正常模板DNA的三种PCR反应物的每次重复的等位基因2与等位基因1的百分比显示于表XVIII(也见图17A)中。通过将等位基因2的值与等位基因1的值和等位基因2的值的和相除(等位基因2/(等位基因1+等位基因2))计算等位基因2与等位基因1的百分比,计算的平均值为0.50025,标准差为0.002897。从而等位基因2与等位基因1以50∶50的百分比存在。尽管带的强度在每一PCR反应间变化(比较反应1和反应3),但在一种PCR反应中的强度没有差异。此外,从PCR反应的两次重复得到的值非常相似。大多数变化存在于PCR反应之间并且可能是移液误差导致的。
对来自唐氏综合征的模板DNA的三种PCR反应的每一重复,等位基因2与等位基因1的百分比显示于表XVIII(也见图17B)中。通过将等位基因2的值与等位基因1的值和等位基因2的值的和相除(等位基因2/(等位基因1+等位基因2))计算等位基因2与等位基因1的百分比,计算的平均值为0.301314,标准差为0.012917。即使通过裸眼分析凝胶也很清楚等位基因1以比等位基因2更高的拷贝数存在(见图17B)。再次,大多数变化是PCR反应之间的而不是一种PCR反应的重复反应之间的。主要的统计变化可能是来自移液误差。
单个SNP的分析足够检测染色体异常的存在。如果已知SNP的“p”值并且有足够数目的基因组从而统计样品误差不会导入分析中,那么一个SNP就足够了。在该实验中,每个反应中约有5,000个基因组。
由唐氏综合征模板DNA和正常模板DNA的3∶1混合物组成的反应物明显与正常模板DNA和其他DNA的混合物不同(见图17C)。等位基因2与等位基因1计算的百分数为0.319089,标准差为0.004346(见表XVIII)。同样,由唐氏综合征模板DNA和正常模板DNA的1∶1和1∶2.3的混合物组成的反应物也是可区别的(见图17D和17E)并且值与来自其他反应物的值是统计学上显著的(见表XVIII)。
随着正常模板DNA的量增加,等位基因2与等位基因1的百分比也增加。对于唐氏综合征模板DNA和正常模板DNA的1∶4混合物,等位基因2与等位基因1的百分比为0.397642,标准差为0.001903(见图17F)。该值和从正常模板DNA得到的值之间的差异是统计显著的。从而,此处描述的方法允许染色体异常的检测,即使当样品不是异常DNA的均匀样品时。
如上所述,甚至存在大量正常DNA时也是可以检测具有染色体异常拷贝数的一小部分DNA的存在。甚至通过裸眼也很明显,随着正常DNA的量增加和唐氏综合征的量下降,相应于等位基因1和2的带的强度也变得相等。
上面的实施例分析了位于21号染色体上的一个SNP。然而,可以分析任何染色体上的任何SNP,这些染色体包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X、和Y染色体和1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、X、Y胎儿染色体。此外,也可以使用上面的方法分析来自非人生物体的染色体。可以分析染色体的组合。在上面的实施例中,检测了染色体的额外拷贝。然而,相同的方法可用于检测单体性。
表XVIII.使用正常模板DNA和唐氏综合征模板DNA在SNPTSC0108992处等位基因2与等位基因1的百分比.
    正常模板DNA
 等位基因1     等位基因2  2/(2+1)
 1A  2602115     2604525  0.500231
 1B  2855846     2923860  0.505884
 2A  1954765     1941929  0.498353
 2B  2084476     2068106  0.498029
 3A  2044147     2035719  0.498967
 3B  1760291     1760543  0.500036
    平均值  0.50025
    标准差  0.002897
    唐氏综合征
 等位基因1     等位基因2  2/(2+1)
 1A  4046926     1595581  0.282779
 1B  4275341     1736260  0.288818
 2A  2875698     1299509  0.311244
 2B  2453615     1069635  0.303593
 3A  3169338     1426643  0.310411
 3B  3737440     1687286  0.311036
    平均值  0.301314
    标准差  0.012917
    3∶1(唐氏∶正常)
 等位基因1     等位基因2  2/(2+1)
 1A  4067623     1980770  0.327487
 1B  4058506     1899853  0.318855
 2A  2315044     1085860  0.319286
 2B  2586984     1243406  0.316357
 3A  3880385     1790764  0.315767
 3B  3718661     1724189  0.316781
    平均值  0.319089
    标准差  0.004346
    1∶1(唐氏∶正常)
 等位基因1     等位基因2  2/(2+1)
 1A  3540255     1929840  0.352798
 1B  4004085     2161443  0.350569
 2A  2358009     1282132  0.35222
 2B  2158132     1238377  0.364603
 3A  3052330     1648677  0.350707
 3B  3852682     2024012  0.344413
    平均值  0.352552
    标准差  0.006618
    1∶2.3(唐氏∶正常)
 等位基因1     等位基因2   2/(2+1)
 1A  3109326     1942597   0.384526
 1B  3392477     2118011   0.38436
 2A  2824213     1758428   0.383715
 2B  2069889     1249545   0.376433
 3A  2335128     1433016   0.380298
 3B  2916772     1797965   0.38135
    平均值   0.38178
    标准差   0.003128
    1∶4(唐氏∶正常)
 等位基因1     等位基因2   2/(2*1)
 1A  3066524     2039636   0.399446
 1B  3068284     2038770   0.399207
 2A  2325477     1542526   0.398791
 2B  2366122     1562218   0.397679
 3A  2151205     1403120   0.394764
 3B  2397046     1571360   0.395968
    平均值   0.397642
    标准差   0.001903
实施例12
如在上面实施例9中所讨论的,在杂合SNP处等位基因1与等位基因2的比例是恒定的。然而,可影响杂合SNP处等位基因1与等位基因2的比例的一个因素是低数目的基因组。例如,如果有40个基因组,这意味着总共有40条等位基因1的染色体和40条等位基因2的染色体,在统计学上可能引物与含有等位基因1的40条染色体退火而仅仅与含有等位基因2的30条染色体退火。这将影响等位基因1与等位基因2的比例,并且可以错误地影响特定SNP的“p”值。
通常,完整基因组扩增(其使用简并寡核苷酸PCR)被用于增加基因组DNA样品的低含量。将8、10、12或14个碱基的寡核苷酸用于扩增基因组。认为引物在整个基因组中随机退火,并将小的基因组DNA样品扩增为成百倍的DNA以用于遗传分析。
此处描述的方法利用了这一事实:即通常人们对完整基因组没有兴趣。选择位于一条染色体或多条染色体或代表全部基因组的染色体上的特定目标基因座用于分析。即使目标基因座位于全部基因组上的几条染色体,优选扩增含有目标基因座的那些染色体的区域。
为了克服低数目基因组的限制,该限制通常在从怀孕女性血浆得到的胎儿DNA中看到,可以使用多种方法增加基因组的数目。下面描述的方法优选扩增含有目标基因座的一条或多条染色体。
模板DNA的制备
获得知情同意后从一个人类志愿者将9ml血样收集到无菌管(FischerScientific,9ml EDTA Vacuette管,目录号NC9897284)中。将管在1000转/分钟下旋转10分钟。除去每个样品的上清液(血浆),并将1ml剩余血样(其通常被称作“棕黄层”)转移到新管。向每个样品加入1ml 1XPBS。使用QIAGEN提供的QIAmp DNA Blood Midi Kit(目录号51183)分离模板DNA。
多重引物的设计
设计引物在21号染色体上的多个区域退火以增加21号染色体上目标基因座的数目。引物长12个碱基。然而,可以使用任何长度的引物,包括但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36-45、46-55、56-65、66-75、76-85、86-95、96-105、106-115、116-125和大于125个碱基。引物被设计为对有义链和反义链均退火。
分析了21号染色体上的9个SNP:TSC0397235、TSC0470003、TSC1649726、TSC1261039、TSC0310507、TSC1650432、TSC1335008、TSC0128307、和TSC0259757。可分析任何数目的SNP,这些数目包括但不限于1-10、11-20、21-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-2000、2001-3000、3001-4000、4001-5000、5001-6000、6001-7000、7001-8000、8001-9000、9001-10,000和大于10,000。
对于9个SNP中的每一个SNP,设计12碱基引物以在目标基因座上游约130个碱基处退火,并设计12碱基引物以在目标基因座下游约130个碱基处退火(此处称为多重引物(nultiplex primers))。多重引物可被设计成在距离目标基因座任何距离处退火,包括但不限于10-20、21-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-110、111-120、121-130、131-140、141-150、151-160、161-170、171-180、181-190、191-200、201-210、211-220、221-230、231-240、241-250、251-260、261-270、271-280、281-290、291-300、301-310、311-320、321-330、331-340、341-350、351-360、361-370、371-380、381-390、391-400、401-410、411-420、421-430、431-440、441-450、451-460、461-470、471-480、481-490、491-500、501-600、601-700、701-800、801-900、901-1000、1001-2000、2001-3000、3001-4000、4001-5000和大于5000碱基。此外,对一个SNP可以使用一组以上的多重引物,引物组数包括但不限于1、2、3、4、5、6、7、8、9、10、10-20、21-30、31-40、41-50和大于50组。
此外,91组正向和反向引物被用于扩增21号染色体的其他区域,总共有100组引物(在反应中使用了200条引物)。这91个引物组被用于阐明大数目的引物可用于单个反应中而不产生大量的非特异带。在反应中可使用任何数目的引物,该数目包括但不限于1-10、11-20、21-30、31-40、41-50、51-60、61-70、71-80、81-90、91-100、101-200、201-300、301-400、401-500、501-600、601-700、701-800、801-900、901-1000、1001-2000、2001-3000、3001-4000、4001-5000、5001-6000、6001-7000、7001-8000、8001-9000、9001-10,000、10,001-20,000、20,001-30,000和大于30,000。
多重引物被设计以在引物的3’端具有相同的核苷酸。在这种情况下,多重引物以“AA”结束,其中A表示腺嘌呤。以这种方式设计引物以最小化引物二聚体的形成。然而,引物可以以任何核苷酸结束,这些核苷酸包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、腺嘌呤和鸟嘌呤的任何组合、腺嘌呤和胞嘧啶的任何组合、腺嘌呤和胸腺嘧啶的任何组合、鸟嘌呤和胞嘧啶的任何组合、鸟嘌呤和胸腺嘧啶的任何组合或胞嘧啶和胸腺嘧啶的任何组合。此外,多重引物可以在3’末端具有1、2、3、4、5、6、7、8、9、10或多于10个相同的核苷酸。
SNP TSC0397235的多重引物为:
正向引物:
5′CAAGTGTCCTAA 3′
反向引物:
5′CAGCTGCTAGAA 3′
SNP TSC0470003的多重引物为:
正向引物:
5′GGTTGAGGGCAA 3′
反向引物:
5′CACAGCGGGTAA 3′
SNP TSC1649726的多重引物为:
正向引物:
5′TTGACTTTTTAA 3′
反向引物:
5′ACAGAATGGGAA 3′
SNP TSC1261039的多重引物为:
正向引物:
5′TGCAGGTCACAA 3′
反向引物:
5′TTCTTCTTATAA 3′
SNP TSC0310507的多重引物为:
正向引物:
5′AGGACAACCTAA 3′
反向引物:
5′TGGTGTTCAGAA 3′
SNP TSC1650432的多重引物为:
正向引物:
5′TCAGCATATGAA 3′
反向引物:
5′GTTGCCACACAA 3′
SNP TSC1335008的多重引物为:
正向引物:
5′CCCAGCTAGCAA 3′
反向引物:
5′GGGTCACTGTAA 3′
SNP TSC0128307的多重引物为:
正向引物:
5′TTAAATACCCAA 3′
反向引物:
5′TTAGGAGGTTAA 3′
SNP TSC0259757的多重引物为:
正向引物:
5′ACACAGAATCAA 3′
反向引物:
5′CGCTGAGGTCAA 3′
在反应中包括91对额外的引物组,它们与21号染色体的不同区退火:
组1:
正向引物:
5′AAGTAGAGTCAA 3′
反向引物:
5′CTTCCCATGGAA 3′
组2:
正向引物:
5′TTGGTTATTAAA 3′
反向引物:
5′CAACTTACTGAA 3′
组3:
正向引物:
5′CACTAAGTGAAA 3′
反向引物:
5′CTCACCTGCCAA 3′
组4:
正向引物:
5′ATGCATATATAA 3′
反向引物:
5′AGAGATCAGCAA 3′
组5:
正向引物:
5′TATATTTTTCAA 3′
反向引物:
5′CAGAAAGCAGAA 3′
组6:
正向引物:
5′GTATTGGGTTAA 3′
反向引物:
5′CTGACCCAGGAA 3′
组7:
正向引物:
5′CAGTTTTCCCAA 3′
反向引物:
5′AGGGCACAGGAA 3′
组8:
正向引物:
5′GTATCAGAGGAA 3′
反向引物:
5′GCATGAAAAGAA 3′
组9:
正向引物:
5′GATTTGACAGAA 3′
反向引物:
5′TACAGTTTACAA 3′
组10:
正向引物:
5′TGTGATTTTTAA 3′
反向引物:
5′TTATGTTCTCAA 3′
组11:
正向引物:
5′CAAGTACTTGAA 3′
反向引物:
5′CTTGTGTGGCAA 3′
组12:
正向引物:
5′AGACTTCTGCAA 3′
反向引物:
5′GTTGTCTTTCAA 3′
组13:
正向引物:
5′GGGACACTCCAA 3′
反向引物:
5′ATTATTATTCAA 3′
组14:
正向引物:
5′ACATGATGACAA 3′
反向引物:
5′TCAATTATAGAA 3′
组15:
正向引物:
5′CTATGGGCTGAA 3′
反向引物:
5′TGTGTGCCTGAA 3′
组16:
正向引物:
5′CCATTTGTTGAA 3′
反向引物:
5′TCTCCATCAAAA 3′
组17:
正向引物:
5′AATGCTGACAAA 3′
反向引物:
5′TTTCATGTCCAA 3′
组18:
正向引物:
5′GGCCTCTTGGAA 3′
反向引物:
5′TCATTTTTTGAA 3′
组19:
正向引物:
5′GGACTACCATAA 3′
反向引物:
5′AGTCACTCAGAA 3′
组20:
正向引物:
5′CCTTGGCAGGAA 3′
反向引物:
5′TTTCTGGTAGAA 3′
组21:
正向引物:
5′CCCCCCCCCGAA 3′
反向引物:
5′GCCCAGGCAGAA 3′
组22:
正向引物:
5′GAATGCGAAGAA 3′
反向引物:
5′TTAGGTAGAGAA 3′
组23:
正向引物:
5′TGCTTTGGTCAA 3′
反向引物:
5′GCCCATTAATAA 3′
组24:
正向引物:
5′TGAGATCTTTAA 3′
反向引物:
5′CAGTTTGTTCAA 3′
组25:
正向引物:
5′GCTGGGCAAGAA 3′
反向引物:
5′AGTCAAAGTCAA 3′
组26:
正向引物:
5′TCTCTGCAGTAA 3′
反向引物:
5′TGAATAACTTAA 3′
组27:
正向引物:
5′CGGTTAGAAAAA 3′
反向引物:
5′CATCCCTTTCAA 3′
组28:
正向引物:
5′TCTCTTTCTGAA 3′
反向引物:
5′CTCAGATTGTAA 3′
组29:
正向引物:
5′TTTGCACCAGAA 3′
反向引物:
5′GGTTAACATGAA 3′
组30:
正向引物:
5′ATTATCAACTAA 3′
反向引物:
5′GCCATTTTTGTAA 3′
组31:
正向引物:
5′GATCTAGATGAA 3′
反向引物:
5′TTAATGTATTAA 3′
组32:
正向引物:
5′CTAGGGAGACAA 3′
反向引物:
5′TGGAGGAGACAA 3′
组33:
正向引物:
5′CATCACATTTAA 3′
反向引物:
5′GGGGTCCTGCAA 3′
组34:
正向引物:
5′CAGTTGTGCTAA 3′
反向引物:
5′TCTGCAGCCTAA 3′
组35:
正向引物:
5′GAGTCATTTAAA 3′
反向引物:
5′TCTATGGATTAA 3′
组36:
正向引物:
5′CAAAAAGTAGAA 3′
反向引物:
5′AATATACTCCAA 3′
组37:
正向引物:
5′CGTCCAGCACCAA 3′
反向引物:
5′GGATGGTGAGAA 3′
组38:
正向引物:
5′TCTCCTTTGTAA 3′
反向引物:
5′TCGTTATTTCAA 3′
组39:
正向引物:
5′GATTTTATAGAA 3′
反向引物:
5′AGACATAAGCAA 3′
组40:
正向引物:
5′TTCACCTCACAA 3′
反向引物:
5′GGATTGCTTGAA 3′
组41:
正向引物:
5′ACTGCATGTGAA 3′
反向引物:
5′TTTATCACAGAA 3′
组42:
正向引物:
5′TCAGTAACACAA 3′
反向引物:
5′TACATCTTTGAA 3′
组43:
正向引物:
5′TTGTTTCAGTAA 3′
反向引物:
5′TATGAGCATCAA 3′
组44:
正向引物:
5′CTCAGCAGGCAA 3′
反向引物:
5′ACCCCTGTATAA 3′
组45:
正向引物:
5′TCTGCTCAGCAA 3′
反向引物:
5′GTTCTTTTTAA 3′
组46:
正向引物:
5′GTGATAATCCAA 3′
反向引物:
5′GAGCCCTCAGAA 3′
组47:
正向引物:
5′TTTATTGGTTAA 3′
反向引物:
5′GGTACTGGGCAA 3′
组48:
正向引物:
5′AGTGTTTTTCAA 3′
反向引物:
5′TGTTATTGGTAA 3′
组49:
正向引物:
5′GCGCATTCACAA 3′
反向引物:
5′AAACAAAAGCAA 3′
组50:
正向引物:
5′TATATGATAGAA 3′
反向引物:
5′TCCCAGTTCCAA 3′
组51:
正向引物:
5′AAAGCCCATAAA 3′
反向引物:
5′TGTCATCCACAA 3′
组52:
正向引物:
5′TTGTGAATGCAA 3′
反向引物:
5′GTATTCATACAA 3′
组53:
正向引物:
5′TGACATAGGGAA 3′
反向引物:
5′AGCAAATTGCAA 3′
组54:
正向引物:
5′AGTAGATGTTAA 3′
反向引物:
5′AAAAGATAATAA 3′
组55:
正向引物:
5′ACCTCATGGGAA 3′
反向引物:
5′TGGTCGACCTAA 3′
组56:
正向引物:
5′TTTGCATGGTAA 3′
反向引物:
5′GCGGCTGCCGAA 3′
组57:
正向引物:
5′TCAGGAGTCTAA 3′
反向引物:
5′GCCTACCAGGAA 3′
组58:
正向引物:
5′ATCTTCTGTTAA 3′
反向引物:
5′AGGTAAGGACAA 3′
组59:
正向引物:
5′TGCTTTGAGGAA 3′
反向引物:
5′AACAGTTTTAAA 3′
组60:
正向引物:
5′TTAAATGTTTAA 3′
反向引物:
5′ATAGAAAATCAA 3′
组61:
正向引物:
5′GTGTTGTGTTAA 3′
反向引物:
5′GAGGACCTCGAA 3′
组62:
正向引物:
5′AGAGGCTGAGAA 3′
反向引物:
5′GGTATTTATTAA 3′
组63:
正向引物:
5′ATTTATCTGGAA 3′
反向引物:
5′AGTGCAAACTAA 3′
组64:
正向引物:
5′TGAACACCTTAA 3′
反向引物:
5′AATTTTTTCTAA 3′
组65:
正向引物:
5′TTACTATTATAA 3′
反向引物:
5′TGCTATAGTGAA 3′
组66:
正向引物:
5′TGGACTATGGAA 3′
反向引物:
5′CTGCAGTCCGAA 3′
组67:
正向引物:
5′GCTACTGCCCAA 3′
反向引物:
5′TCACATGGTGAA 3′
组68:
正向引物:
5′GTGGCTCTGGAA 3′
反向引物:
5′GAATTCCATTAA 3′
组69:
正向引物:
5′TGGGGTGTCCAA 3′
反向引物:
5′GCAAGCTCCGAA 3′
组70:
正向引物:
5′ATGTTTTTTCAA 3′
反向引物:
5′AGATCTGTTGAA 3′
组71:
正向引物:
5′AAGTGCTGTGAA 3′
反向引物:
5′ACTTTTTTGGAA 3′
组72:
正向引物:
5′AATCGGCAGGAA 3′
反向引物:
5′GGCATGTCACAA 3′
组73:
正向引物:
5′AGGAAGAAAGAA 3′
反向引物:
5′CAGTTTCACCAA 3′
组74:
正向引物:
5′CACAGAATTTAA 3′
反向引物:
5′AAGAATAAGTAA 3′
组75:
正向引物:
5′GGGATAGTACAA 3′
反向引物:
5′TTCCCATGATAA 3′
组76:
正向引物:
5′TGATTAGTTGAA 3′
反向引物:
5′GCATTCAGTGAA 3′
组77:
正向引物:
5′AGGGAATATTAA 3′
反向引物:
5′GACCTTAGGTAA 3′
组78:
正向引物:
5′TTCTTTTCACAA 3′
反向引物:
5′CCAAACTAAGAA 3′
组79:
正向引物:
5′GTGCTCTTAGAA 3′
反向引物:
5′ATGAGTTTAGAA 3′
组80:
正向引物:
5′ATGAGCATAGAA 3′
反向引物:
5′GACAAATGAGAA 3′
组81:
正向引物:
5′AAACCCAGAGAA 3′
反向引物:
5′CCTCACACAGAA 3′
组82:
正向引物:
5′CACACTGTGGAA 3′
反向引物:
5′CACTGTACCCAA 3′
组83:
正向引物:
5′GTAGTATTTCAA 3′
反向引物:
5′TGGATACACTAA 3′
组84:
正向引物:
5′CCCATGATTCAA 3′
反向引物:
5′TCATAGGAGGAA 3′
组85:
正向引物:
5′AGGAAAGAGAAA 3′
反向引物:
5′ATATGGTGATAA 3′
组86:
正向引物:
5′GATGCCATCCAA 3′
反向引物:
5′ATACTATTTCAA 3′
组87:
正向引物:
5′GTGTGCATGGAA 3′
反向引物:
5′AGGTGTTGAGAA 3′
组88:
正向引物:
5′CAGCCTGGGCAA 3′
反向引物:
5′GGAGCTCTACAA 3′
组89:
正向引物:
5′AACTAAGGTTAA 3′
反向引物:
5′AACTTATGTTAA 3′
组90:
正向引物:
5′ATCTCAACAGAA 3′
反向引物:
5′TAACAATGTGAA 3′
组91:
正向引物:
5′AAGGATCAGGAA 3′
反向引物:
5′CTCAAGTCTTAA 3′
多重PCR
围绕SNPs TSC0397235、TSC0470003、TSC1649726、TSC1261039、TSC0310507、TSC1650432、TSC1335008、TSC0128307和TSC0259757的21号染色体上的区域使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。该PCR反应使用在目标基因座上游和下游约130个碱基处退火的引物。该PCR反应用于增加目标基因座的拷贝数目以消除低数目基因组可能导致的任何误差。
为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用15ng模板人基因组DNA和5μM每种引物。
将浓度为5mM的2微升每种正向引物和反向引物合并到单个微离心管中并混合。在体积为40μl总的PCR反应物(1.5μl模板DNA、10.5μl无菌水、8μl引物混合物和20μl HotStar Taq)中使用8μl引物混合物。进行PCR的25次循环。使用下面的PCR条件:
(1)95℃15分钟;
(2)95℃30秒;
(3)4℃30秒;
(4)37℃30秒;
(5)重复步骤2-4二十四(24)次;
(6)72℃10分钟.
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
目标片段的纯化
使用Qiagen MinElute PCR purification kits(Qiagen,目录号28004)从反应物除去多余引物和核苷酸。按照随柱子提供的生产商的使用说明书进行反应。DNA在100μl无菌水中稀释。
PCR反应2
使用下面的引物组扩增SNP TSC0397235:
第一引物:
5′TTAGTCATCGCAGAATTCTACTTCTTTCTGAAGTGGGA 3′
第二引物:
5′GGACAGCTCGATGGGACTAATGCATACTC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座103个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC0470003:
第一引物:
5′GTAGCCACTGGTGAATTCGTGCCATCGCAAAAGAATAA 3′
第二引物:
5′ATTAGAATGATGGGGACCCCTGTCTTCCC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座80个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC1649726:
第一引物:
5′ACGCATAGGAAGGAATTCATTCTGACACGTGTGAGATA 3′
第二引物:
5′GAAATTGACCACGGGACTGCACACTTTTC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座113个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC1261039:
第一引物:
5′CGGTAAATCGGAGAATTCAAGTTGAGGCATGCATCCAT 3′
第二引物:
5′TCGGGGCTCAGCGGGACCACAGCCACTCC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座54个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC0310507:
第一引物:
5′TCTATGCACCACGAATTCAATATGTGTTCAAGGACATT 3′
第二引物:
5′TGCTTAATCGGTGGGACTTGTAATTGTAC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座93个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC1650432:
第一引物:
5′CGCGTTGTATGCGAATTCCCTGGGGTATAAAGATAAGA 3′
第二引物:
5′CTCACGGGAACTGGGACACCTGACCCTGC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座80个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC1335008:
第一引物:
5′GTCTTGCCGCTTGAATTCCCATAGAAGAATGCGCCAAA 3′
第二引物:
5′TTGAGTAGTACAGGGACACACTAACAGAC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座94个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC0128307:
第一引物:
5′AATACTGTAGGTGAATTCTTGCCTAAGCATTTTCCCAG 3′
第二引物:
5′GTGTTGACATTCGGGACTGTAATCTTGAC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座54个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
使用下面的引物组扩增SNP TSC0259757:
第一引物:
5′TCTGTAGATTCGGAATTCTTTAGAGCCTGTGCGCTGAG 3′
第二引物:
5′CGTACCAGTACAGGGACGCAAACTGAGAC 3′
第一引物在5’端含有生物素标签和限制酶EcoRI的识别位点,并被设计以在距离目标基因座100个碱基处退火。第二引物含有限制酶BsmFI的识别位点。
所有目标基因座都是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。在该实施例中,在分开的反应管中扩增目标基因座,但是它们也可以在单个反应中一起扩增。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。
1微升多重PCR反应的洗脱液(从MinElute柱洗脱的PCR产物)被用作每一PCR反应的模板DNA。当多重模板被用作模板时每种SNP以一式三份扩增。作为对照,每种SNP从15ng最初模板DNA(没有经历多重反应的DNA)扩增而来。可以对每个目标基因座优化每次反应中的模板DNA和引物的量。但是在该实施例中,使用5μM每种引物。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
琼脂糖凝胶分析
通过琼脂糖凝胶电泳分析从最初模板DNA得到的针对每个SNP的20微升PCR反应物中的4微升(见图18A)。通过琼脂糖电泳分析从多重模板得到的针对每个SNP的20微升PCR反应物中的4微升(见图18B)。
如在图18A中所看到的,对于从最初模板DNA扩增的SNP的8/9,见到高强度的一条带(泳道1-3,和5-9)。带迁移到这8种SNP中的每一种SNP的正确位置。从最初模板DNA对TSC1261039进行扩增产生一条高强度带(其迁移到正确位置)和一条低分子量的弱带(泳道4)。仅仅看到两条带,并且这些带可基于分子量清晰地分辨。此处描述的PCR方法允许从基因组DNA清楚地扩增目标基因座而不需目标基因座的浓缩或富集。
如在图18B中所看到的,用于从多重模板DNA扩增SNP TSC0397235、TSC0470003、TSC0310507和TSC0128307的引物产生了一条高强度带,其迁移到正确位置(泳道1、2、5和8)。尽管多重反应含有200种引物,但是没有导入额外的带。尽管多重引物长为12个碱基并且可能与其他序列而不是21号染色体上的序列退火,但是没有看见这样的产物,因为这样的产物带在第二PCR反应中没有扩增。第二PCR反应使用目标基因座特异的引物并使用不对称寡核苷酸和递增的退火温度,这使得可以从基因组特异扩增(见实施例1)。
从多重模板DNA对TSC1649726进行扩增产生了一条高强度带和两条较弱的带,它们可以基于分子量清楚地分开(见图18B,泳道3)。从多重模板DNA对TSC01261039进行扩增产生了一条正确分子量的高强度带和一条较低分子量的弱带(见图18B,泳道4)。低分子量带与从最初模板DNA对TSC1261039进行扩增所看到的带大小相同(比较图18A,泳道4和图18B,泳道4)。从而,对多重模板DNA进行TSC01261039的扩增不导入任何额外的非特异带。
从多重模板DNA对SNPs TSC1650432、TSC1335008和TSC0259757进行扩增产生了一条高强度带(其迁移到正确位置)和一条较弱的带(泳道6、7和9)。对于SNP TSC1650432和TSC0259757,较弱的带具有较低的分子量,并且可清楚地与目标带相区别(见图18B,泳道6和9)。对于SNPTSC1335008,较弱的带具有稍高的分子量。然而,正确的带可通过比较来自对最初模板DNA进行TSC1335008的扩增产物来鉴定(比较图18A,泳道7和图18B,泳道7)。也可对TSC1335008优化PCR条件。所有9种SNP在相同条件下扩增,其对经扩增的SNP产生清楚可辨的带。
目标片段的纯化
从基因组模板DNA分离PCR产物。PCR反应物的一半被转移到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645 692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的))的1个孔中。第一引物含有一个5’生物素标记,从而PCR产物结合至包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
分离的片段的限制酶消化
用结合并掺入到第二引物的PCR产物的识别位点的限制酶BsmFI消化纯化的PCR产物。按照随酶提供的用法说明书在Streptawell中进行消化。消化后,用PSB洗涤孔三次以除去切下的片段。
标记的核苷酸的掺入
用BsmF I进行限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中详细讨论的,SNP处两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。将下面的组分加入到每个填充反应中:1μl荧光标记的ddGTP,0.5μl未标记的ddNTPs(40μM),其含有除了鸟苷酸之外的所有核苷酸,2μ1 10×sequenase缓冲剂,0.25μl Sequenase和20μl反应物所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover、Md.)。所有其他标记试剂来自Amersham(Thermo Sequenase Dye Terminator CycleSequencing Core Kit,US 79565)。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化而从Streptawell释放经“填平”的DNA片段。在120转/分钟摇动下于37℃下进行消化1小时。
目标基因座的检测
将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio WhittakerMolecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(HoeferSQ3 Sequencer)上运行3小时。从测序仪取下凝胶并在Typhoon 9400Variable Mode Imager上扫描。通过荧光检测掺入的标记核苷酸。在每条带的周围划框并使用Typhoon 9400 Variable Mode Imager软件计算带的强度。
下面,描绘了用BsmF I消化后关于TSC0470003的5’突出端的示意图:
5′CTCT
3′GAGA       R  A  C  C
突出端位置    1  2  3  4
有义链(此处描述为顶部链)上对TSC0470003所观察到的核苷酸是腺嘌呤和鸟嘌呤。突出端的第三位相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dATP、dCTP和dTTP存在下使用荧光标记的ddGTP。填平反应后DNA分子的图示如下。
等位基因1  5′CTCT     G*
           3′GAGA     C  A  C  C
突出端位置             1  2  3  4
等位基因2  5′ CTCT    A  T  G*
           3′GAGA     T  A  C  C
突出端位置              1  2  3  4
看见了两条带;低分子量带相应于与突出端互补的1位用ddGTP填充的DNA分子,高分子量带相应于在与突出端互补的3位用ddGTP填充的DNA分子(见图19)。
计算从最初模板DNA和多重模板DNA扩增后TSC0470003处等位基因2与等位基因1的百分比。使用一种荧光标记的核苷酸在单个反应中检测两个等位基因减少了通过移液反应导入的误差和通过不同染料的量子系数导入的误差。
对于SNP TSC047003,通过将等位基因2的值与等位基因2的值和等位基因1的值的和相除计算等位基因2与等位基因1的百分比。对TSC047003所计算的最初模板DNA上等位基因2与等位基因1的百分比为0.539(见表XIX)。对多重模板DNA上的每个SNP进行3次PCR反应。多重模板DNA上TSC047003的等位基因2与等位基因1的平均百分比为0.49,标准差为0.0319(见表XIX)。由最初模板DNA和多重模板DNA得到的百分比之间没有统计学显著差异。
对于SNP TSC1261039,在最初模板DNA上对TSC1261039所计算的等位基因2与等位基因1的百分比为0.44(见表XIX)。对多重模板DNA上的每个SNP进行3次PCR反应(见图19B)。多重模板DNA上对于TSC1261039,等位基因2与等位基因1的平均百分比为0.468,标准差为0.05683(见表XIX)。由最初模板DNA和多重模板DNA得到的百分比之间没有统计学显著差异。
多重模板DNA上对于TSC1261039,等位基因2与等位基因1的百分比中见到的变化可能是由于移液误差。可通过增加重复数目减少变化。使用大数目的重复,可以得到具有最小统计变化的百分比。
同样,对于SNP TSC0310507和TSC1335008,在最初模板DNA和多重模板DNA上的等位基因2与等位基因1百分比之间没有统计学差异(见表XIX和图19C和19D)。从而,多重反应可用于增加含有目标基因座的染色体区域数而不影响可变位点处一个等位基因与另一个等位基因的百分比。
表XIX.进行和不进行多重反应时在不同SNP处等位基因2与等位基因1的百分比
TSC047003
  等位基因1   等位基因2     2/(2+1)
    IA   5535418   6487873     0.539608748
    M1   4804358   4886716     0.504249168
    M2   5549389   5958585     0.517778803
    M3   8356275   7030245     0.45690936
平均值(M1-M3)     0.49297911
标准差     0.031961429
TSC1261039
  等位基因1   等位基因2     2/(2+1)
    IA   3488765   2768066     0.442407027
    M1   3603388   2573244     0.41660957
    M2   4470423   5026872     0.529295131
    M3   4306015   36694012     0.46008898
平均值(M1-M3)     0.46866456
标准差     0.056830136
TSC0310507
  等位基因1   等位基因2     2/(2+1)
    IA   2966511   2688190     0.475390299
    M1   4084472   2963451     0.420471535
    M2   4509891   4052892     0.47331481
    M3   7173191   4642069     0.39288759
平均值(M1-M3)     0.428891312
标准差     0.040869352
TSC1335008
  等位基因1   等位基因2     2/(2+1)
    1A   2311629   2553016     0.524810341
    M1   794790   900879     0.531282343
    M2   1261568   1780689     0.5853184
    M3   1165156   1427840     0.550653
平均值(M1-M3)     0.555751248
标准差     0.027376412
此处描述的方法使用了两种不同的扩增反应扩增目标基因座。在第一种PCR反应中,寡核苷酸被设计以在目标基因座的上游和下游退火。不像常规的基因组扩增,这些引物不是简并的并且在距离目标基因座特定距离处退火。然而,由于引物的长度,可能引物与基因组的其他区域退火。这些引物被用于增加遗传分析可得到的DNA的量。
第二种PCR反应使用实施例1-6所描述的方法。引物被设计以扩增目标基因座,并且确定目标基因座处的序列。第二种PCR反应的条件允许从多重模板DNA特异扩增目标基因座。如果从多重反应没有产生任何非特异产物,那么它们不会阻止目标基因座的扩增。在四种分析的SNP处等位基因2与等位基因1的百分比没有统计学差异,不管扩增是否在最初模板DNA上或多重模板DNA上进行。
在该实施例中分析的SNP位于人21号染色体上。然而,这些方法可用于非人和人DNA,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y染色体。该多重方法可用于遗传突变的分析,这些遗传突变包括但不限于核苷酸置换、插入、缺失和重排。
只要起始模板DNA在量上受到限制时,上面的方法都可用于增加遗传分析可得到的模板DNA量。例如,具有恶性细胞的恶性前和侵入前损害构成了样品中细胞的一小部分,这减少了可以进行遗传分析的数目。此处描述的方法可增加用于遗传分析可得到的恶性DNA的量。同样,母亲血样中存在的胎儿基因组的数目通常较低;此处描述的方法可用于增加胎儿DNA的量。
实施例13
从怀孕女性的血液分离的血浆含有母亲模板DNA和胎儿模板DNA。如前面讨论的,母亲血浆中胎儿DNA的百分比随每个怀孕女性而变。然而,可以通过分析SNP确定胎儿DNA的百分比,其中母亲模板DNA是纯合的并且从血浆得到的模板DNA显示出杂合模式。
例如,假设SNP X可以是腺嘌呤或鸟嘌呤,并且对于SNP X,母亲DNA对鸟嘌呤是纯合的。在实施例6中描述的标记方法可用于确定血浆样品中模板DNA的序列。如果血浆样品含有胎儿DNA,其在SNP X处是杂合的,用IIS型限制酶BsmF I消化,并使用标记的ddGTP、未标记的dATP、dTTP和dCTP进行填充反应后预期得到下面的DNA分子。
母亲等位基因1  5′GGGT  G*
               3′CCCA  C  T  C  A
母亲等位基因2  5′GGGT  G*
               3′CCCA  C  T  C  A
胎儿等位基因1  5′GGGT  G*
               3′CCCA  C  T  C  A
胎儿等位基因2  5′GGGT  A  A  G*
               3′CCCA  T  T  C  A
看到两种信号;一种相应于在与突出端互补的1位用ddGTP填充的DNA分子,另一种相应于在与突出端互补的3位用ddGTP填充的DNA分子。然而,母亲DNA对鸟嘌呤是纯合的,鸟嘌呤相应于在与突出端互补的1位填充的DNA分子。从与突出端互补的3位用ddGTP填充的DNA分子得到的信号相应于腺嘌呤等位基因,其代表胎儿DNA。该信号成为胎儿DNA的信号标灯,并且可用于测量血浆样品中存在的胎儿DNA的量。
染色体之间胎儿DNA的量没有差异。例如,来自1号染色体的任何给定个体中胎儿DNA的百分比和来自2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y染色体的百分比相同。从而,在一条染色体上为SNP计算的等位基因比例可以与另一条染色体上为该SNP计算的等位基因比例相比较。
例如,在1号染色体上关于SNP的等位基因的比例可以等于在2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y染色体关于该SNP的等位基因的比例。然而,如果胎儿具有染色体异常,包括但不限于三体性或单体性,那么关于以异常拷贝数存在的染色体的比例将与其它染色体上的比例不同。
得到知情同意后从怀孕女性收集血液。血样用于阐明胎儿DNA,胎儿DNA可通过分析SNP而在母亲血浆中检测,其中母亲DNA为纯合的,并且来自怀孕妇女血浆的DNA的相同SNP显示杂合模式。
从全血制备血浆
从4支每支含有9ml血样的管子(Fischer Scientific,9ml EDTAVacuette tubes,目录号NC9897284)分离血浆。从给予知情同意的怀孕女性通过静脉穿刺得到血液。收集血液后,向每支管中加入甲醛(25μl血液)。将管置于4℃直到发货。这些管通过Federal Express发货,它们装在含有冰包的泡沫容器中。
将血样在1000转/分钟下离心10分钟。不使用离心机上的制动器。重复该离心步骤。将上清液转移到新管中并在3,000转/分钟下旋转10分钟。不使用离心机上的制动器。将来自四支管子的每种上清液合并并等分到两管中。血浆在-80℃下保存直到DNA被纯化。
使用QIAGEN提供的QIAmp DNA Blood Midi Kit(目录号51183)分离模板DNA。按照试剂盒中的使用说明书分离模板DNA。将来自血浆的模板DNA稀释为终体积20微升。
母亲DNA的分离
从上述样品除去血浆后,将1ml剩余血样(其通常被称作“棕黄层”)转移到新管。向每个样品加入1ml 1XPBS。使用QIAGEN提供的QIAmpDNA Blood Midi Kit(目录号51183)分离模板DNA。
纯合母亲SNP的鉴定
实施例8描述了鉴定在人群中高度可变的SNP或者为一个给定个体鉴定杂合SNP的方法。如在实施例8中描述的方法被应用于母亲模板DNA以鉴定13号染色体上的SNP,其中母亲DNA是纯合的。可以筛选任何数目的SNP。筛选的SNP的数目与需要分析的胎儿DNA中杂合SNP的数目成比例。
如在实施例6中详述的,一种标记的核苷酸可用于确定特定SNP处两个等位基因的序列。对该实施例所选择的SNP为可以在未标记的dATP、dTTP和dCTP存在下用标记的ddGTP确定其序列。但是,也可使用用经标记的ddATP、ddCTP或ddTTP测定序列的SNP。此外,可以选择将要用于分析的SNP,使得所有SNP都被相同核苷酸或四种核苷酸的组合标记。例如,如果要筛选400个SNP,可以选择100个使得用标记的ddATP确定序列,选择100个使得用标记的ddTTP确定序列,选择100个使得用标记的ddGTP确定序列,选择100个使得用标记的ddCTP确定序列,或者四种经标记核苷酸的任一组合。
鉴定了其中母亲DNA为纯合的29个SNP:TSC0052277、TSC1225391、TSC0289078、TSC1349804、TSC0870209、TSC0194938、TSC0820373、TSC0902859、TSC0501510、TSC1228234、TSC0082910、TSC0838335、TSC0818982、TSC0469204、TSC1084457、TSC0466177、TSC1270598、TSC1002017、TSC1104200、TSC0501389、TSC0039960、TSC0418134、TSC0603688、TSC0129188、TSC1103570、TSC0813449、TSC0701940、TSC0087962、和TSC0660274。杂合SNP将随不同个体而不同。
多重引物的设计
在母亲血浆中通常存在胎儿基因组的低拷贝数。为了增加13号染色体上目标基因座的拷贝数,设计引物以在每一目标基因座上游约130个碱基和下游130个碱基处退火。这样做是为了减少当用低数目的基因组进行时可能发生的统计采样误差,该误差可影响一个等位基因与另一个的比例(见实施例11)。引物长12个碱基。然而,可以使用任何长度的引物,这些长度包括但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36-45、46-55、56-65、66-75、76-85、86-95、96-105、106-115、116-125和大于125个碱基。所设计的引物与有义链和反义链均能退火。
引物被设计以在3’端以双核苷酸“AA”终止以减少引物二聚体的形成。然而,引物可被设计以在四种核苷酸的任一种和四种核苷酸的任何组合结束。
SNP TSC0052277的多重引物是
正向引物:
5′GACATGTTGGAA 3′
反向引物:
5′ACTTCCAGTTAA 3′
SNP TSC1225391的多重引物是:
正向引物:
5′GTTTCCTGTTAA 3′
反向引物:
5′CGATGATGACAA 3′
SNP TSC0289078的多重引物是:
正向引物:
5′GAGTAGAGACAA 3′
反向引物:
5′TCCCGGATACAA 3′
SNP TSC1349804的多重引物是:
正向引物:
5′CATCCTCTAGAA 3′
反向引物
5′TATTCCTGAGAA 3′
SNP TSC0870209的多重引物是:
正向引物:
5′AGTTTGTTTTAA 3′
反向引物
5′TATAAACGATAA 3′
SNP TSC0194938的多重引物是:
正向引物:
5′TTTGACCGATAA 3′
反向引物
5′TGACAGGACCAA 3′
SNP TSC0820373的多重引物是:
正向引物:
5′TTATTCATTCAA 3′
反向引物
5′AGTTTTTCACAA 3′
SNP TSC0902859的多重引物是:
正向引物:
5′CACCTCCCTGAA 3′
反向引物
5′CCAGATTGAGAA 3′
SNP TSC0501510的多重引物是:
正向引物:
5′TGTGTCCACCAA 3′
反向引物
5′CTTCTATTCCAA 3′
SNP TSC1228234的多重引物是:
正向引物:
5′TCACAATAGGAA 3′
反向引物
5′TACAAGTGAGAA 3′
SNP TSC0082910的多重引物是:
正向引物:
5′GAGTTTTCGTAA 3′
反向引物
5′GTGTGCCCCCAA 3′
SNP TSC0838335的多重引物是:
正向引物:
5′GCACCACTGCAA 3′
反向引物
5′GAACACAATGAA 3′
SNP TSC0818982的多重引物是:
正向引物:
5′TATCCTATTCAA 3′
反向引物
5′CAACCATTATAA 3′
SNP TSC0469204的多重引物是:
正向引物:
5′TATGCTTTACAA 3′
反向引物
5′TTTGTTTACCAA 3′
SNP TSC1084457的多重引物是:
正向引物:
5′AGGAAATTAGAA 3′
反向引物
5′TGTTAGACTTAA 3′
SNP TSC0466177的多重引物是:
正向引物:
5′TATTTGGAGGAA 3′
反向引物
5′GGCATTTGTCAA 3′
SNP TSC1270598的多重引物是:
正向引物:
5′ATACTCCAGGAA 3′
反向引物
5′CAGCCTGGACAA 3′
SNP TSC1002017的多重引物是:
正向引物:
5′CCATTGCAGTAA 3′
反向引物
5′AGGTTCTCATAA 3′
SNP TSC1104200的多重引物是:
正向引物:
5′TGTCATCATTAA 3′
反向引物
5′TGGTATTTGCAA 3′
SNP TSC0501389的多重引物是:
正向引物:
5′TAGGGTTTGTAA 3′
反向引物
5′CCCTAAGTAGAA 3′
SNP TSC0039960的多重引物是:
正向引物:
5′GTATTTCTTTAA 3′
反向引物
5′GAGTCTTCCCAA 3′
SNP TSC0418134的多重引物是:
正向引物:
5′CAGGTAGAGTAA 3′
反向引物
5′ATAGGATGTGAA 3′
SNP TSC0603688的多重引物是:
正向引物:
5′CAATGTGTATAA 3′
反向引物
5′AGAGGGCATCAA 3′
SNP TSC0129188的多重引物是:
正向引物:
5′CCAGTGGTCTAA 3′
反向引物
5′TAAACAATAGAA 3′
SNP TSC1103570的多重引物是:
正向引物:
5′GCACACTTTTAA 3′
反向引物
5′ATGGCTCTGCAA 3′
SNP TSC0813449的多重引物是:
正向引物:
5′GTCATCTTGTAA 3′
反向引物
5′TGCTTCATCTAA 3′
SNP TSC0701940的多重引物是:
正向引物:
5′AGAAAGGGGCAA 3′
反向引物
5′CTTTTCTTTCAA 3′
SNP TSC0087962的多重引物是:
正向引物:
5′CTACTCTCTCAA 3′
反向引物
5′ACAGCATTATAA 3′
SNP TSC0660274的多重引物是:
正向引物:
5′ACTGCTCTGGAA 3′
反向引物
5′GCAGAGGCACAA 3′
多重PCR
围绕上述29个SNP的13号染色体上的区域使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从模板基因组DNA扩增而来。该PCR反应使用在目标基因座上游和下游约150个碱基处退火的引物。将58中引物混合在一起并在单个反应中使用以扩增模板DNA。该PCR反应用于增加目标基因座的拷贝数目以消除低数目基因组导致的误差。
为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。可以为每个目标基因座优化每次反应中的模板DNA和引物的量。在该实施例中,使用20μl血浆模板DNA。
将浓度为5mM的2微升每种正向引物和反向引物合并到单个微离心管中并混合。在体积为50μl总的PCR反应物(20μl模板血浆DNA、1μl无菌水、4μl引物混合物和25μl HotStar Taq)中使用4μl引物混合物。进行PCR的25次循环。使用下面的PCR条件:
(1)95℃15分钟;
(2)95℃30秒;
(3)4℃30秒;
(4)37℃30秒;
(5)重复步骤2-4二十四(24)次;
(6)72℃10分钟。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。
也可以使用基因座扩增的其他方法增加目标基因座的拷贝数,这些方法包括但不限于引物延伸预扩增(PEP)(Zhang等,PNAS,89:5847-51,1992)、简并寡核苷酸引发的PCR(DOP-PCR)(Telenius,等,Genomics13:718-25,1992)、使用来自噬菌体29(其经历滚环复制)的DNA聚合酶的链置换扩增(Dean等,Genomic Research 11:1095-99,2001)、多次置换扩增(美国专利号6,124,120)、REPLI-gTM完整基因组扩增试剂盒和标记的PCR。
目标片段的纯化
使用Qiagen MinElute PCR purification kits(Qiagen,目录号28004)从反应物除去多余引物和核苷酸。按照随柱子提供的生产商的使用说明书进行反应。DNA在100μl无菌水中稀释。
PCR反应2
引物设计
SNP TSC0052277:
第一引物:
5′CTCCGTGGTATGGAATTCCACTCAAATCTTCATTCAGA 3′
第二引物:
5′ACGTCGGGTTACGGGACACCTGATTCCTC 3′
使用下面的引物组扩增SNP TSC1225391:
第一引物:
5′TACCATTGGTTTGAATTCTTGTTTCCTGTTAACCATGC 3′
第二引物:
5′GCCGAGTTCTACGGGACAGAAAAGGGAGC 3′
使用下面的引物组扩增SNP TSC0289078:
第一引物:
5′TGCAGTGATTTCGAATTCGAGACAATGCTGCCCAGTCA3′
第二引物:
5′ TCTAAATTCTCTGGGACCATTCCTTCAAC 3′
使用下面的引物组扩增SNP TSC1349804:
第一引物:
5′ACTAACAGCACTGAATTCCATGCTCTTGGACTTTCCAT 3′
第二引物:
5′TCCCCTAACGTTGGGACACAGAATACTAC 3′
使用下面的引物组扩增SNP TSC0870209:
第一引物:
5′GTCGACGATGGCGAATTCCTGCCACTCATTCAGTTAGC3′
第二引物:
5′GAACGGCCCACAGGGACCTGGCATAACTC 3′
使用下面的引物组扩增SNP TSC0194938:
第一引物:
5′TCATGGTAGCAGGAATTCTGCTTTGACCGATAAGGAGA3′
第二引物:
5′ACTGTGGGATTCGGGACTGTCTACTACCC 3′
使用下面的引物组扩增SNP TSC0820373:
第一引物:
5′ACCTCTCGGCCGGAATTCGGAAAAGTGTACAGATATCATT3′
第二引物:
5′GCCGGATACGAAGGGACGGCTCGTGACTC 3′
使用下面的引物组扩增SNP TSC0902859:
第一引物:
5′CCGTAGACTAAAGAATTCCCTGATGTCAGGCTGTCACC3′
第二引物:
5′ATCGGATCAGTCGGGACGGTGTCTTTGCC 3′
使用下面的引物组扩增SNP TSC0501510:
第一引物:
5′GCATAGGCGGGAGAATTCCCTGTGTCCACCAAAGTCGG3′
第二引物:
5′CCCACATAGGGCGGGACAAAGAGCTGAAC 3′
使用下面的引物组扩增SNP TSC1228234:
第一引物:
5′GGCTTGCCGAGCGAATTCTAGGAAAGATACGGAATCAA3′
第二引物:
5′TAACCCTCATACGGGACTTTCATGGAAGC 3′
使用下面的引物组扩增SNP TSC0082910:
第一引物:
5′ATGAGCACCCGGGAATTCTGATTGGAGTCTAGGCCAAA3′
第二引物:
5′TGCTCACCTTCTGGGACGTGGCTGGTCTC 3′
使用下面的引物组扩增SNP TSC0838335:
第一引物:
5′ACCGTCTGCCACGAATTCTGGAAAACATGCAGTCTGGT3′
第二引物:
5′TACACGGGAGGCGGGACAGGGTGATTAAC 3′
使用下面的引物组扩增SNP TSC0818982:
第一引物:
5′CTTAAAGCTAACGAATTCAGAGCTGTATGAAGATGCTT 3′
第二引物:
5′AACGCTAAAGGGGGGACAACATAATTGGC 3′
使用下面的引物组扩增SNP TSC0469204:
第一引物:
5′TTGTAAGAACGAGAATTCTGCAACCTGTCTTTATTGAA 3′
第二引物:
5′CTTCACCACTTTGGGACACTGAAGCCAAC 3′
使用下面的引物组扩增SNP TSC1084457:
第一引物:
5′AACCATTGATTTGAATTCGAAATGTCCACCAAAGTTCA 3′
第二引物:
5′TGTCTAGTTCCAGGGACGCTGTTACTTAC 3′
使用下面的引物组扩增SNP TSC0466177:
第一引物:
5′CGAAGGTAATGTGAATTCTGCCACAATTAAGACTTGGA3′
第二引物:
5′ATACCGGTTTTCGGGACAGATCCATTGAC 3′
使用下面的引物组扩增SNP TSC1270598:
第一引物:
5′CCTGAAATCCACGAATTCCACCCTGGCCTCCCAGTGCA3′
第二引物:
5′TAGATGGTAGGTGGGACAGGACTGGCTTC 3′
使用下面的引物组扩增SNP TSC1002017:
第一引物:
5′GCATATCTTAGCGAATTCCTGTGACTAATACAGAGTGC3′
第二引物:
5′CCAAATATGGTAGGGACGTGTGAACACTC 3′
使用下面的引物组扩增SNP TSC1104200:
第一引物:
5′TGCCGCTACAGGGAATTCATATGGCAGATATTCCTGAA3′
第二引物:
5′ACGTTGCGGACCGGGACTTCCACAGAGAGCC 3′
使用下面的引物组扩增SNP TSC0501389:
第一引物:
5′CTTCGCCCAATGGAATTCGGTACAGGGGTATGCCTTAT3′
第二引物:
5′TGCACTTCTGCCGGGACCAGAGGAGAAAC 3′
使用下面的引物组扩增SNP TSC0039960:
第一引物:
5’TGTGGGTATTCTGAATTCCACAAAATGGACTAACACGC3′
第二引物:
5′ACGTCGTTCAGTGGGACATTAAAAGGCTC 3′
使用下面的引物组扩增SNP TSC0418134:
第一引物:
5′GGTTATGTGTCAGAATTCTGAAACTAGTTTGGAAGTAC3′
第二引物:
5′GCCTCAGTTTCGGGGACAGTTCTGAGGAC 3′
使用下面的引物组扩增SNP TSC0603688:
第一引物:
5′TGTAACACGGCCGAATTCCTCATTTGTATGAAATAGGT3′
第二引物:
5′AATCTAACTTGAGGGACCGGCACACACAC 3′
使用下面的引物组扩增SNP TSC0129188:
第一引物:
5′AGTGTCCCCTTAGAATTCGCAGAGACACCACAGTGTGC3′
第二引物:
5′TTTGCTACAGTCGGGACCCTTGTGTGCTC 3′
使用下面的引物组扩增SNP TSC1103570:
第一引物:
5′AGCACATCACTAGAATTCAATACCATGTGTGAGCTCAA3′
第二引物:
5′AATCCTGCTTCCGGGACCTAACTTTGAAC 3′
使用下面的引物组扩增SNP TSC0813449:
第一引物:
5′TTTCATTTTCTGGAATTCCTCTAATGATTTTCTGGAGC 3′
第二引物:
5′CGTCGCCGCGTAGGGACTTTTTCTTCCAC 3′
使用下面的引物组扩增SNP TSC0701940:
第一引物:
5′TTACTTAATCCTGAATTCGAGAAAAGCCATGTTGATAA3′
第二引物:
5′TCATGGGTCGCTGGGACTTTGCCCTCTGC 3′
使用下面的引物组扩增SNP TSC0087962:
第一引物:
5′ACTAACAGCACTGAATTCATTTTACTATAATCTGCTAC3′
第二引物:
5′GTTAGCCGAGAAGGGACTGTCTGTGAAGC3′
使用下面的引物组扩增SNP TSC0660274:
第一引物:
5′AAATATGCAGCGGAATTCGTAAGTGACCTATTAATAAC3′
第二引物:
5′GCGATGGTTACGGGGACAGCCAGGCAACC 3′
每一第一引物在5’端含有生物素标签并含有EcoRI的限制酶识别位点,并被设计从目标基因座的特定距离处退火。这使得可以对目标基因座进行单个反应,因为每个目标基因座将迁移到不同位置(基于第一引物的退火位置)。第二引物含有BsmF I的限制酶识别位点。
所有目标基因座都是使用聚合酶链式反应(PCR,美国专利号4,683,195和4,683,202,此处引入作为参考)从多重的模板DNA扩增而来。在该实施例中,在分开的反应管中扩增目标基因座,但是它们也可以在单个PCR反应中一起扩增。为了增加特异性,使用“热-启动”PCR。使用QIAGEN提供的HotStarTaq Master Mix试剂盒(目录号203443)进行PCR反应。
可以为每个目标基因座优化每次反应中的模板DNA和引物的量。1μl从MinElute柱洗脱下来的多重模板DNA用于每个目标基因座的PCR反应中,并使用5μM每种引物。上述29种SNP从母亲DNA扩增而来(在PCR反应中使用15ng DNA;引物浓度如上所述)。进行PCR的40次循环。使用下面的PCR条件:
(1)95℃15分钟15秒;
(2)37℃30秒;
(3)95℃30秒;
(4)57℃30秒;
(5)95℃30秒;
(6)64℃30秒;
(7)95℃30秒;
(8)重复步骤6和7三十九(39)次;
(9)72℃5分钟;
在PCR的第一次循环中,退火温度约为第二引物的3’退火区的解链温度,其是37℃。PCR的第二次循环中的退火温度约为第一引物的3’区(其与模板DNA退火)的解链温度,其是57℃。PCR的第三次循环中的退火温度约为第二引物的全部序列的退火温度,其是64℃。剩下循环的退火温度为64℃。在PCR的头三次循环中将退火温度从TM1递增到TM2到TM3极大地提高了特异性。这些退火温度是代表性的,并且技术人员理解每一轮的退火温度取决于所用的特定引物。
通过尝试各种设置和使用产生最佳结果的参数可以优化变性、退火和延伸的温度和次数。在该实施例中,第一引物被设计以在离目标基因座不同距离处退火。技术人员理解第一引物的退火位置可以是离目标基因座5-10、11-15、16-20、21-25、26-30、31-35、36-40、41-45、46-50、51-55、56-60、61-65、66-70、71-75、76-80、81-85、86-90、91-95、96-100、101-105、106-110、111-115、116-120、121-125、126-130、131-140、140-160、160-180、180-200、200-220、220-240、240-260、260-280、280-300、300-350、350-400、400-450、450-500或大于500个碱基。
目标片段的纯化
从基因组模板DNA分离PCR产物。将每种PCR产物转移到透明的、高结合板Streptawell(来自Roche Diagnostics GmbH(目录号1 645 692,如在Roche Molecular Biochemicals,2001 Biochemicals Catalog所列的))的一个孔中。备选地,PCR产物可以合并到单个孔中,因为第一引物被设计以允许目标基因座基于分子量分离。第一引物含有一个5’生物素标记,从而PCR产物结合至包被有链亲和素的孔而基因组模板DNA不结合。使用热混合器(Eppendorf)以1000转/分钟在37℃下进行链亲和素结合反应20分钟。对每个孔吹气以除去未结合的物质,并在温和搅拌下用1X PBS洗涤3次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。
经分离片段的限制酶消化
用结合并掺入到第二引物的PCR产物上的识别位点的限制酶BsmFI消化纯化的PCR产物。按照随酶提供的用法说明书在Streptawell中进行消化。消化后,用PSB洗涤孔三次以除去切下的片段。
标记的核苷酸的掺入
用BsmF I的限制酶消化产生具有5’突出端(其含有SNP位点或目标基因座)和3’凹端的DNA片段。5’突出端作为在DNA聚合酶存在下允许一个或多个核苷酸掺入的模板。
如在实施例6中阐明的,SNP的两个等位基因的序列都可以用一种标记的核苷酸在存在其他未标记的核苷酸下来确定。将下面的组分加入到每个填充反应中:1μl荧光标记的ddGTP,0.5μl未标记的ddNTPs(40μM),其含有除了鸟嘌呤之外的所有核苷酸,2μl 10×sequenase缓冲剂,0.25μl Sequenase和20μl反应所需的水。填充反应在40℃下进行10分钟。非荧光标记的ddNTP购自Fermentas Inc.(Hanover,MD)。所有其他标记试剂来自Amersham(Thermo Sequenase Dye Terminator Cycle SequencingCore Kit,US 79565)。
标记后,每个Streptawell用1X PBS(100μl)洗涤3次。然后通过根据随酶提供的生产商的用法说明书,用限制酶EcoR I消化而从Streptawell释放经“填充”的DNA片段。在120转/分钟摇动下于37℃下进行消化1小时。
目标基因座的检测
从链亲和素基质释放后,将样品加到一块36cm 5%丙烯酰胺(尿素)凝胶(Bio Whittaker Molecular Applications,Long Ranger Run Gel Packs,目录号50691)的一个泳道中。样品在3000伏3分钟内电泳进凝胶中。凝胶在测序仪(Hoefer SQ3 Sequencer)上运行3小时。从测序仪移去凝胶并在Typhoon 9400 Variable Mode Imager上扫描。通过荧光检测掺入的标记核苷酸。
下面描绘了SNP TSC0838335的5’突出端的示意图。没有显示全部序列,仅仅显示了突出端部分(其中R表示可变位点)。
10/14      5′TAA
           3′ATT        R  A  C  A
           突出端位置    1  2  3  4
5’有义链(此处描述为顶部链)上对TSC0838335所观察到的核苷酸是腺嘌呤和鸟嘌呤。突出端的第三位核苷酸为胞嘧啶,其与鸟嘌呤互补。在未标记的dATP、dCTP和dTTP存在下经标记的ddGTP被用于确定两种等位基因的序列。
限制酶BsmF I被用于产生5’突出端,其一般从识别位点的10/14处切割。有时,BsmF I将从识别位点的11/15处切割并产生下面的突出端:
11/15      5′TA
           3′AT       T  R  A  C
     突出端位置        0  1  2  3
突出端中的0位为胸腺嘧啶,其与腺嘌呤互补。与突出端互补的0位被未标记的dATP填充,从而在该填充反应后,无论酶在识别位点的10/14或11/15切割都产生相同的分子。填充反应后产生的DNA分子描绘如下:
G等位基因10/14        5′TAA    G*
                      3′ATT    C  A  C  A
突出端位置                      1  2  3  4
G等位基因11/15        5′TA     A  G*
                      3′AT     T  C  A  C
突出端位置                      0  1  2  3
A等位基因10/14        5′TAAA   T  G*
                      3′ATTT   A  C  A
突出端位置                      1  2  3  4
A等位基因11/15        5′TA     A  A  T  G*
                      3′AT     T  T  A  C
突出端位置                      0  1  2  3
对于TSC0838335,扩增的母亲模板DNA显示为一条单一条带,其为迁移至预定位置的较大分子量带,对应于″A″等位基因(见图20,泳道1)。母亲模板DNA在SNP TSC0838335处为腺嘌呤纯合的。
但是,在泳道2中,分离自同一个体血浆的针对TSC0838335的多重模板DNA进行的扩增显示两条带:较低的分子量带(其对应于″G″等位基因)和较高的分子量带(其对应于″A″等位基因)。从怀孕女性血浆分离的模板DNA包含母亲模板DNA和胎儿模板DNA。
如在图20,泳道1所示,母亲模板DNA在该SNP处为腺嘌呤纯合的(比较泳道1和2)。″G″等位基因代表胎儿DNA。来自母亲模板DNA和胎儿模板DNA的信号可清楚分辨。″G″等位基因成为胎儿DNA的信号标灯,且可用于测定存在于样品中的胎儿DNA量。此外,一旦确定了给定样品中胎儿DNA在母亲血浆中的百分比,那么与该百分比的任何偏差表明染色体异常。该方法提供了用于检测胎儿染色体异常的第一种非侵入性方法。
如在图20,泳道3所示,对SNP TSC0418134进行的母亲DNA分析显示为一条单一条带,其为迁移至预定位置的较大分子量带,对应于腺嘌呤等位基因。同样,对分离自母亲血浆的多重模板DNA进行的分析显示为一条单一条带,其迁移至腺嘌呤等位基因的预定位置(见图20,泳道4)。在TSC0418134处母亲DNA和胎儿DNA均为腺嘌呤纯合的。
下面描述了TSC0129188 5′突出端的示意图,其中R表示可变位点:
    10/14    5′TCAT
             3′AGTA  R  A  C  T
    突出端位置        1  2  3  4
可变位点(R)上游的核苷酸不相应于有义链上的鸟嘌呤。从而,通过BsmF I的11/15切割性质产生的5’突出端将和通过10/14切割产生的5’突出端被相同地填充。在未标记的dATP、dTTP和dCTP存在下标记的ddGTP被用于填充反应。填充反应后产生的DNA分子描绘如下:
A等位基因10/14    5′TCAT    A  T  G*
                  3′AGTA    T  A  C  T
突出端位置                   1  2  3  4
G等位基因10/14    5′TCAT    G*
                  3′AGTA    C  A  C  T
突出端位置                   1  2  3  4
对SNP TSC0129188进行的母亲DNA分析得到单带,其相应于在与突出端互补的1位用ddGTP填充的DNA分子,该带代表“G”等位基因(见图20,泳道5)。对腺嘌呤等位基因没有检测到带,表明母亲DNA对鸟嘌呤是纯合的。
相反,对来自母亲血浆的多重模板DNA(其含有母亲DNA和胎儿DNA)的分析得到两条清楚的带(见图20,泳道6)。较低分子量带相应于“G”等位基因,较高分子量带相应于“A”等位基因。“A”等位基因代表胎儿DNA。从而,已经开发了将母亲DNA和胎儿DNA信号分开而不增加分离胎儿细胞这一复杂性的方法。此外,不需要父亲DNA的样品来检测母亲DNA和胎儿DNA之间的差异。
对于SNP TSC0501389,母亲DNA的分析得到单带,其迁移到较高分子量位置,该带相应于“A”等位基因。没有检测到相应于“G”等位基因的带。类似地,对SNP TSC0501389,来自母亲血浆的多重模板DNA的分析得到单带,其迁移到较高分子量位置,该带相应于“A”等位基因。母亲模板DNA和胎儿模板DNA对SNP TSC0501389处的腺嘌呤都是纯合的。
母亲DNA和来自血浆的模板DNA都来自相同样品。一种样品(其通过非侵入性方法得到)提供了母亲和胎儿的遗传指纹。
在母亲模板DNA对它们是纯合的29个SNP中,胎儿模板DNA在29个SNP中的两个是杂合的。胎儿DNA对剩下的27个SNP中和母亲模板DNA一样是纯合的(数据没有显示)。将母亲模板DNA和血浆模板DNA在给定SNP处进行纯合等位基因的比较提供了额外水平的质量控制。不可能母亲模板DNA和血浆模板DNA在相同SNP处对不同等位基因是纯合的。如果看到这种情况,将表明处理中发生了错误。
此处描述的方法阐明在母亲血浆样品中母亲遗传信号与胎儿遗传信号可以分离并区别。上面的实施例分析了位于13号染色体上的SNP,然而可以分析任何染色体,包括但不限于人1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y染色体和1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y胎儿染色体。
此外,此处描述的方法可用于检测任何生物样品中的胎儿DNA,这些样品包括但不限于细胞、组织、血样、血清、血浆、唾液、尿、泪、阴道分泌物、脐带血、羊膜液、胚胎组织、淋巴液、脑脊液、粘膜分泌物、腹水液、腹膜液、粪便或身体排出物。
此处描述的方法阐明了母亲样品中的胎儿DNA的百分比可通过分析SNP确定,其中母亲DNA是纯合的,并且从怀孕女性的血浆分离的DNA是杂合的。胎儿DNA的百分比可用于确定是否胎儿基因型有染色体疾病。
例如,如果通过对1号染色体(涉及1号染色体的染色体异常在妊娠早期终止妊娠)的分析计算样品中存在的胎儿DNA的百分比为30%,那么与30%胎儿染色体的任何偏离都表明染色体异常。例如,如果分析18号染色体上1个SNP或多个SNP时,胎儿DNA的百分比高于30%,这将表明存在18号染色体的额外拷贝。从任何染色体得到的胎儿DNA的计算百分比可以与任何其他染色体比较。尤其是,13号染色体上的胎儿DNA百分比可以与18和21号染色体上的胎儿DNA百分比比较。
该分析受到在每个SNP处有关一个等位基因与另一个等位基因的预期比例方面的知识支持。如在实施例9中所讨论的,不是所有杂合SNP都显示出50∶50的比例。对一个等位基因与另一个等位基因的预期比例的了解减少了必须分析的可变位点的总数。然而,即使没有对不同SNP预期比例的了解,也可以通过分析大数目的SNP来计算胎儿DNA的百分比。当SNP的取样大小足够大时,与预期比例值之间的统计差异将被消除。
此外杂合母亲SNP也提供了有用的信息。分析不限于纯合母亲SNP。例如,如果在母亲DNA的一个杂合SNP处,等位基因1与等位基因2的比例为1∶1,那么在血浆模板DNA中,比例将保持1∶1,除非胎儿DNA携带染色体异常。
上面的方法可用于检测胎儿DNA的突变,这些突变包括但不限于点突变、转变、颠换、易位、插入、缺失和重复。如在图20中所见到的,胎儿DNA可容易地与母亲DNA区别。上面的方法可用于确定任何基因的任何目标基因座的序列。
现在已经完整描述了本发明,本领域技术人员应该理解可以使用条件、参数等的宽的和等同范围实施本发明而不影响本发明的精神或范围或其任何实施方案。
此处引用的所有文件,例如科学出版物、专利和专利出版物都被完整引入作为参考,就像每篇文件被特别和独自地指出被完整地引入作为参考一样。如果引用的文件仅仅提供了文件的第一页,也意味着包括完整文件,即包括文件的剩下页。

Claims (66)

1.用于检测染色体异常的方法,所述方法包括:
(a)确定来自模板DNA的目标基因座处等位基因的序列,
(b)定量从(a)的目标基因座鉴定的杂合性目标基因座处等位基因的相对量,其中所述相对量以比率表示,且其中所述比率指示出存在或不存在染色体异常。
2.权利要求1的方法,其中所述模板DNA获自这样的来源,所述来源选自人、非人、哺乳动物、爬行动物、牛、猫、狗、山羊、猪、生猪、猴、猿、大猩猩、公牛、母牛、熊、马、绵羊、家禽、小鼠、大鼠、鱼、海豚、鲸和鲨鱼。
3.权利要求2的方法,其中模板DNA来自人源。
4.权利要求1的方法,其中模板DNA获自这样的样品,所述样品选自细胞、胎儿细胞、组织、血液、血清、血浆、唾液、尿、泪、阴道分泌物、脐带血、绒毛膜绒毛、羊膜液、胚胎组织、胚胎、四细胞胚胎、八细胞胚胎,16细胞胚胎、32细胞胚胎、64细胞胚胎、128细胞胚胎、256细胞胚胎、512细胞胚胎、1024细胞胚胎、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便或身体渗出液。
5.权利要求1的方法,其中对多个目标基因座处的等位基因测序并且对它们的相对量定量并表示为比率。
6.权利要求5的方法,其中所述多个目标基因座在多个染色体上。
7.权利要求3的方法,其中所述人为怀孕女性。
8.权利要求7的方法,其中来自所述怀孕女性的模板DNA选自来自细胞、组织、血液、血清、血浆、唾液、尿、泪、阴道分泌物、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便,或身体渗出液的样品。
9.权利要求4的方法,其中所述样品与细胞裂解抑制剂混合。
10.权利要求9的方法,其中所述细胞裂解抑制剂选自戊二醛、戊二醛衍生物、甲醛、福尔马林和甲醛衍生物。
11.权利要求9的方法,其中所述样品为血液。
12.权利要求9的方法,其中所述样品为来自怀孕女性的血液。
13.权利要求12的方法,其中所述血液来自胎儿处于某个妊娠龄的怀孕女性,所述妊娠龄选自0-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40、40-44、44-48、48-52和大于52周。
14.权利要求12的方法,其中所述模板DNA获自所述血液的血浆。
15.权利要求12的方法,其中所述模板DNA获自所述血液的血清。
16.权利要求14或15的方法,其中所述模板DNA包含母亲DNA和胎儿DNA的混合物。
17.权利要求16的方法,其中在进行(a)之前,对母亲DNA测序以鉴定纯合性目标基因座,并且进一步地其中所述纯合性目标基因座为在(a)的模板DNA中被分析的目标基因座。
18.权利要求16的方法,其中在进行(a)之前,对母亲DNA测序以鉴定杂合性目标基因座,并且进一步地其中所述杂合性目标基因座为在(a)的模板DNA中被分析的目标基因座。
19.权利要求1的方法,其中确定等位基因的序列包括:
(a)使用第一引物和第二引物扩增模板DNA上目标基因座的等位基因,其中第二引物含有限制酶的识别位点,从而用限制酶消化可产生含有目标基因座的5’突出端;
(b)用识别第二引物上识别位点的限制酶消化经扩增的DNA;
(c)通过使用含有目标基因座的5’突出端作为模板将核苷酸掺入到(b)的经消化DNA中;和
(d)通过测定(c)的DNA序列确定目标基因座处等位基因的序列。
20.权利要求19的方法,其中所述第一引物和第二引物含有含有可变核苷酸的限制酶识别位点的一部分,其中扩增后产生完整限制酶识别位点。
21.权利要求20的方法,其中限制酶识别位点为选自限制酶BsaJ I、BssK I、Dde I、EcoN I、Fnu4H I、Hinf I和ScrF I的识别位点。
22.权利要求19的方法,其中限制酶在离识别位点一段距离处切割DNA。
23.权利要求22的方法,其中识别位点为IIS型限制酶的识别位点。
24.权利要求23的方法,其中IIS型限制酶选自Alw I、Alw26 I、BbsI、Bbv I、BceA I、Bmr I、Bsa I、Bst71 I、BsmA I、BsmB I、BsmF I、BspM I、Ear I、Fau I、Fok I、Hga I、Pie I、Sap I、SSfaN I和Sthi32 I。
25.权利要求19的方法,其中扩增方法选自聚合酶链式反应、自动维持的序列反应、连接酶链式反应、cDNA末端的快速扩增、聚合酶链式反应和连接酶链式反应、Q-β噬菌体扩增、链置换扩增,和剪切重叠延伸聚合酶链式反应。
26.权利要求25的方法,其中所述扩增方法为PCR。
27.权利要求26的方法,其中聚合酶链式反应的第一次循环的退火温度约为与模板DNA退火的第二引物3’区部分的解链温度。
28.权利要求27的方法,其中聚合酶链式反应的第二次循环的退火温度约为与模板DNA退火的第一引物3’区部分的解链温度。
29.权利要求28的方法,其中聚合酶链式反应的剩下循环的退火温度约为完整第二引物的解链温度。
30.权利要求1的方法,其中确定序列包括选自:等位基因特异性PCR、质谱、杂交、引物延伸、荧光检测、荧光共振能量转移(FRET)、测序、Sanger双脱氧测序、DNA微阵列、southern印迹、狭线印迹、斑点印迹和MALDI-TOF质谱的方法。
31.权利要求1的方法,其中将一条染色体上杂合性目标基因座上的等位基因的所述比率相加并与一个不同染色体上杂合性目标基因座上等位基因的比率相比较,其中比率的不同表明存在染色体异常。
32.权利要求31的方法,其中比较的染色体为选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22号、X和Y染色体的染色体。
33.权利要求31的方法,其中比较了13、18和21号染色体上杂合性目标基因座上的等位基因的比例。
34.权利要求1的方法,其中所述目标基因座为单核苷酸多态性。
35.权利要求1的方法,其中所述目标基因座为突变。
36.确定胎儿DNA上目标基因座的序列的方法,所述方法包括:
(a)从怀孕女性得到样品,其中所述模板DNA包含胎儿DNA和母亲DNA;
(b)向(a)的所述样品加入细胞裂解抑制剂;和
(c)确定从(b)的所述样品得到的模板DNA上目标基因座的序列。
37.权利要求36的方法,其中所述来自怀孕女性的样品选自组织、细胞、血液、血清、血浆、尿和阴道分泌物。
38.权利要求37的方法,其中所述样品为血液。
39.权利要求36的方法,其中所述细胞裂解抑制剂选自戊二醛、戊二醛衍生物、甲醛、福尔马林和甲醛衍生物。
40.权利要求36的方法,其中步骤(c)前,分离模板DNA。
41.权利要求38的方法,其中所述模板DNA获自所述血液的血浆。
42.权利要求38的方法,其中所述模板DNA获自所述血液的血清。
43.权利要求36的方法,其中步骤(c)前,确定母亲模板DNA上目标基因座的序列。
44.权利要求36的方法,其中步骤(c)前,确定父亲模板DNA上目标基因座的序列。
45.权利要求36的方法,其中所述目标基因座为单核苷酸多态性。
46.权利要求36的方法,其中所述目标基因座为突变。
47.权利要求36的方法,其中确定了多个目标基因座的序列。
48.权利要求47的方法,其中多个目标基因座位于多个染色体上。
49.权利要求36的方法,其中确定序列包括:
(a)使用第一和第二引物扩增模板DNA上的目标基因座,其中第二引物含有一种限制酶的识别位点从而用该限制酶消化产生含有目标基因座的5’突出端;
(b)用识别第二引物上识别位点的限制酶消化扩增的DNA;
(c)通过使用含有目标基因座的5’突出端作为模板将核苷酸掺入(b)的消化的核苷酸;和
(d)通过确定(c)的DNA序列确定目标基因座的序列。
50.权利要求49的方法,其中所述第一和第二引物含有含有可变核苷酸的限制酶识别位点的一部分,其中消化后产生完整限制酶识别位点。
51.权利要求50的方法,其中限制酶选自BsaJ I、Bssk I、Dde I、EcoNI、Fnu4H I、Hinf I和ScrF I。
52.权利要求49的方法,其中限制酶在离识别位点一定距离处切割DNA。
53.权利要求52的方法,其中识别位点为IIS型限制酶的识别位点。
54.权利要求53的方法,其中IIS型限制酶选自Alw I、Alw26 I、BbsI、Bbv I、BceA I、Bmr I、Bsa I、Bst71 I、BsmA I、BsmB I、BsmF I、BspM I、Ear I、Fau I、Fok I、Hga I、Ple I、Sap I、SSfaN I、和Sthi32 I。
55.权利要求49的方法,其中所述扩增方法选自聚合酶链式反应、自动维持的序列反应、连接酶链式反应、cDNA末端的快速扩增、聚合酶链式反应和连接酶链式反应、Q-β噬菌体扩增、链置换扩增,和剪切重叠延伸聚合酶链式反应。
56.权利要求55的方法,其中所述扩增方法为PCR。
57.权利要求56的方法,其中聚合酶链式反应的第一次循环的退火温度为与模板DNA退火的第二引物的3’区的部分的解链温度。
58.权利要求57的方法,其中聚合酶链式反应的第二次循环的退火温度为与模板DNA退火的第一引物的3’区的部分的解链温度。
59.权利要求58的方法,其中聚合酶链式反应的剩下循环的退火温度约为完整第二引物的解链温度。
60.权利要求36的方法其中使用选自:等位基因特异性PCR、质谱、杂交、引物延伸、荧光偏振、荧光共振能量转移(FRET)、荧光检测、测序、Sanger双脱氧测序、DNA微阵列、southern印迹、狭线印迹、斑点印迹和MALDI-TOF质谱的方法确定目标基因座的序列。
61确定胎儿染色体上目标基因座的方法,所述方法包括:
(a)使用第一引物和第二引物扩增模板DNA上的目标基因座,其中第二引物含有限制酶的识别位点,从而用限制酶消化产生了含有目标基因座的5’突出端;
(b)用识别第二引物上的识别位点的限制酶消化扩增的DNA;
(c)通过使用含有目标基因座的5’突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和
(d)通过测定(c)的DNA的序列确定目标基因座等位基因的序列。
62.权利要求的方法61,还含有从怀孕女性的样品得到模板DNA的方法,其中细胞裂解抑制剂已经被加到样品中,并且其中所述模板DNA含有胎儿DNA和母亲DNA。
63.权利要求62的方法,其中所述来自怀孕女性的样品选自:组织、细胞、血液、血清、血浆、尿,和阴道分泌物。
64.权利要求63的方法,其中所述样品为血液。
65.权利要求62的方法,其中所述细胞裂解抑制剂选自戊二醛、戊二醛衍生物、甲醛、甲醛衍生物和福尔马林。
66.用于权利要求1到65中任意一项所述方法的试剂盒,其包含在所述方法中使用的引物组和一套使用说明书,其中引物组中的第二引物含有产生限制酶识别位点的序列,从而用该限制酶消化产生含有目标基因座的5’突出端。
CNA03809794XA 2002-03-01 2003-02-28 检测遗传疾病的方法 Pending CN1650032A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US36023202P 2002-03-01 2002-03-01
US60/360,232 2002-03-01
US10/093,618 2002-03-11
US10/093,618 US6977162B2 (en) 2002-03-01 2002-03-11 Rapid analysis of variations in a genome
US37835402P 2002-05-08 2002-05-08
US60/378,354 2002-05-08

Publications (1)

Publication Number Publication Date
CN1650032A true CN1650032A (zh) 2005-08-03

Family

ID=27792098

Family Applications (2)

Application Number Title Priority Date Filing Date
CNA03809794XA Pending CN1650032A (zh) 2002-03-01 2003-02-28 检测遗传疾病的方法
CNB038096196A Expired - Fee Related CN100519761C (zh) 2002-03-01 2003-02-28 基因组变异的快速分析

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB038096196A Expired - Fee Related CN100519761C (zh) 2002-03-01 2003-02-28 基因组变异的快速分析

Country Status (13)

Country Link
US (2) US7208274B2 (zh)
EP (2) EP1481092A4 (zh)
JP (2) JP2006508632A (zh)
KR (2) KR20040102024A (zh)
CN (2) CN1650032A (zh)
AU (2) AU2003225634B2 (zh)
BR (2) BR0308134A (zh)
CA (2) CA2477761A1 (zh)
CO (2) CO5631459A2 (zh)
IL (3) IL163600A0 (zh)
MX (2) MXPA04008477A (zh)
NZ (2) NZ535044A (zh)
WO (2) WO2003074723A2 (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101999003A (zh) * 2008-02-12 2011-03-30 诺瓦蒂斯公司 分离无细胞凋亡或胎儿核酸的方法
CN101715486B (zh) * 2007-05-04 2013-05-01 硅生物系统股份公司 用于非侵入性产前诊断的方法和装置
CN103131787A (zh) * 2013-03-11 2013-06-05 四川大学 基于y染色体snp遗传标记的法医学复合检测试剂盒
CN105296613A (zh) * 2015-09-24 2016-02-03 郑州市职业病防治院 一种人TERF1基因rs3863242位点多态性检测技术
CN107988343A (zh) * 2011-02-09 2018-05-04 纳特拉公司 非侵入性产前倍性识别方法
CN108048549A (zh) * 2006-06-14 2018-05-18 维里纳塔健康公司 使用样品拆分和dna标签进行稀有细胞分析
CN108315445A (zh) * 2018-04-26 2018-07-24 兰州大学 一种检测绵羊sry基因的单核苷酸多态性的方法与应用
US10174369B2 (en) 2010-05-18 2019-01-08 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10179937B2 (en) 2014-04-21 2019-01-15 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US10216896B2 (en) 2009-09-30 2019-02-26 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10227652B2 (en) 2005-07-29 2019-03-12 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10260096B2 (en) 2005-07-29 2019-04-16 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US10351906B2 (en) 2014-04-21 2019-07-16 Natera, Inc. Methods for simultaneous amplification of target loci
US10526658B2 (en) 2010-05-18 2020-01-07 Natera, Inc. Methods for simultaneous amplification of target loci
US10533219B2 (en) 2016-12-07 2020-01-14 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10590482B2 (en) 2010-05-18 2020-03-17 Natera, Inc. Amplification of cell-free DNA using nested PCR
US10894976B2 (en) 2017-02-21 2021-01-19 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
CN113265461A (zh) * 2021-07-02 2021-08-17 北京华诺奥美医学检验实验室有限公司 一种用于检测高频基因致病变异的引物组和探针组及试剂盒
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11306357B2 (en) 2010-05-18 2022-04-19 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11378498B2 (en) 2006-06-14 2022-07-05 Verinata Health, Inc. Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US11781187B2 (en) 2006-06-14 2023-10-10 The General Hospital Corporation Rare cell analysis using sample splitting and DNA tags

Families Citing this family (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7407943B2 (en) 2001-08-01 2008-08-05 Isis Pharmaceuticals, Inc. Antisense modulation of apolipoprotein B expression
US7888324B2 (en) 2001-08-01 2011-02-15 Genzyme Corporation Antisense modulation of apolipoprotein B expression
EP1478992A4 (en) * 2002-02-07 2007-03-21 Univ Utah Res Found METHOD FOR CREATING AND USING A MEDICAL TREATMENT PROTOCOL
BR0308134A (pt) 2002-03-01 2006-04-11 Ravgen Inc análise rápida das variações em um genoma
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
US20070178478A1 (en) * 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US7442506B2 (en) * 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US7511131B2 (en) 2002-11-13 2009-03-31 Genzyme Corporation Antisense modulation of apolipoprotein B expression
US8688385B2 (en) * 2003-02-20 2014-04-01 Mayo Foundation For Medical Education And Research Methods for selecting initial doses of psychotropic medications based on a CYP2D6 genotype
CN101985619B (zh) * 2003-10-08 2014-08-20 波士顿大学信托人 染色体异常的产前诊断方法
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
US7252946B2 (en) * 2004-01-27 2007-08-07 Zoragen, Inc. Nucleic acid detection
US20050287558A1 (en) 2004-05-05 2005-12-29 Crooke Rosanne M SNPs of apolipoprotein B and modulation of their expression
EP1624074A1 (fr) * 2004-08-06 2006-02-08 Neurolab Marqueurs et procédés pour le dépistage prénatal d'anomalies chromosomiques
EP1859050B1 (en) * 2005-03-18 2012-10-24 The Chinese University Of Hong Kong A method for the detection of chromosomal aneuploidies
GB0508983D0 (en) 2005-05-03 2005-06-08 Oxford Gene Tech Ip Ltd Cell analyser
EP3012760A1 (en) * 2005-11-26 2016-04-27 Natera, Inc. System and method for cleaning noisy genetic data and using data to make predictions
EP2505646A1 (en) 2006-05-05 2012-10-03 Isis Pharmaceuticals, Inc. Compounds and methods for modulating expression of CRP
JP4922778B2 (ja) * 2007-01-31 2012-04-25 株式会社日立ハイテクノロジーズ 遺伝子検査結果判定法およびプログラムおよびその装置
CN103480002A (zh) 2007-03-24 2014-01-01 基酶有限公司 施用与人载脂蛋白 b互补的反义寡核苷酸
CN103298950B (zh) * 2007-05-21 2015-01-21 健泰科生物技术公司 用于鉴定和治疗狼疮的方法和组合物
US20090038024A1 (en) * 2007-06-19 2009-02-05 The Regents Of The University Of California Cap/sorbs1 and diabetes
US20100304990A1 (en) * 2007-07-16 2010-12-02 Gifford David K Ruler arrays
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
HUE054639T2 (hu) 2007-07-23 2021-09-28 Univ Hong Kong Chinese Nukleinsav-szekvencia kiegyensúlyozatlanságának meghatározása
WO2010012002A1 (en) * 2008-07-25 2010-01-28 Saryna Medical Corporation Methods and systems for genetic analysis of fetal nucleated red blood cells
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2010107838A1 (en) 2009-03-16 2010-09-23 Isis Pharmaceuticals, Inc. Targeting apolipoprotein b for the reduction of apolipoprotein c-iii
EP2421955A4 (en) 2009-04-21 2012-10-10 Genetic Technologies Ltd METHODS OF OBTAINING F TAL GENETIC MATERIAL
US20110070590A1 (en) 2009-09-22 2011-03-24 Jan Rohozinski Primers and Methods for Determining RhD Zygosity
EP3241914B1 (en) 2009-11-05 2019-03-06 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
US9506110B2 (en) * 2009-12-15 2016-11-29 Agency For Science, Technology And Research Processing of amplified DNA fragments for sequencing
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
EP3382037B1 (en) 2010-01-19 2021-02-17 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acids in maternal samples
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
CN101851673B (zh) * 2010-01-26 2013-06-12 中国人民解放军总医院 一种检测人6种免疫相关基因的标签单核苷酸多态性位点方法
US8774488B2 (en) 2010-03-11 2014-07-08 Cellscape Corporation Method and device for identification of nucleated red blood cells from a maternal blood sample
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20120034603A1 (en) * 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
CA2807823C (en) 2010-08-24 2023-02-07 The Brigham And Women's Hospital, Inc. Methods for predicting anti-cancer response
CN102206701B (zh) * 2010-09-19 2015-01-21 深圳华大基因科技有限公司 遗传性疾病相关基因的鉴定方法
CN101962684B (zh) * 2010-11-04 2012-03-28 徐州师范大学 黄牛pcsk1基因的单核苷酸多态性及其检测方法
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US8756020B2 (en) 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
ES2943669T3 (es) 2011-01-25 2023-06-15 Hoffmann La Roche Cálculo de riesgo para la evaluación de aneuploidía fetal
PL2697392T3 (pl) * 2011-04-12 2016-08-31 Verinata Health Inc Rozdzielanie frakcji genomowych z wykorzystaniem liczby polimorfizmów
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
ES2768344T3 (es) 2011-06-17 2020-06-22 Myriad Genetics Inc Métodos y materiales para evaluar el desequilibrio alélico
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
CA2860312C (en) 2011-12-21 2022-07-12 Myriad Genetics, Inc. Methods and materials for assessing loss of heterozygosity
EP3415915A1 (en) 2012-02-23 2018-12-19 Children's Medical Center Corporation Methods for predicting anti-cancer response
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
NZ630278A (en) 2012-06-07 2017-02-24 Inst Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
CA2876731A1 (en) * 2012-06-15 2013-12-19 Harry Stylli Methods of detecting diseases or conditions
AU2013290102B2 (en) 2012-07-13 2018-11-15 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
WO2014015269A1 (en) 2012-07-19 2014-01-23 Ariosa Diagnostics, Inc. Multiplexed sequential ligation-based detection of genetic variants
WO2014134790A1 (zh) * 2013-03-06 2014-09-12 广州百赫医疗信息科技有限公司 神经纤维瘤病pcr诊断试剂盒
WO2014160080A1 (en) 2013-03-14 2014-10-02 Children's Medical Center Corporation Cancer diagnosis, treatment selection and treatment
US20160083796A1 (en) * 2013-05-06 2016-03-24 Capilet Genetics Ab Diagnostic test for skeletal atavism in horses
MX2016005798A (es) 2013-11-07 2016-11-28 Univ Leland Stanford Junior Acidos nucleicos libres de celulas para el analisis del microbioma humano y componentes del mismo.
EP3080292B1 (en) 2013-12-09 2022-02-02 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
EP3117011B1 (en) 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
ES2946251T3 (es) 2014-08-15 2023-07-14 Myriad Genetics Inc Métodos y materiales para evaluar la deficiencia de recombinación homóloga
KR101707536B1 (ko) * 2014-11-20 2017-02-16 한국과학기술원 컨트롤 조직 부재 샘플 내 낮은 빈도의 체성 결손 검출 방법
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US11168351B2 (en) 2015-03-05 2021-11-09 Streck, Inc. Stabilization of nucleic acids in urine
EP3279339B1 (en) 2015-03-31 2020-08-26 FUJIFILM Corporation Method for determining gene state of fetus
CN104892711B (zh) * 2015-05-18 2017-11-07 中国科学技术大学 基于芯片进行规模化快速制备单根寡核苷酸的方法
US20170145475A1 (en) 2015-11-20 2017-05-25 Streck, Inc. Single spin process for blood plasma separation and plasma composition including preservative
KR101961642B1 (ko) 2016-04-25 2019-03-25 (주)진매트릭스 절단된 상보적인 태그 절편을 이용한 표적 핵산 서열 검출 방법 및 그 조성물
US11506655B2 (en) 2016-07-29 2022-11-22 Streck, Inc. Suspension composition for hematology analysis control
CN108693131B (zh) * 2018-04-17 2023-12-01 云南中烟工业有限责任公司 一种烟草黄化病判定方法
CN110106238A (zh) * 2019-05-17 2019-08-09 北京康旭医学检验所有限公司 一种用于检测x染色体失活的双重pcr分子诊断试剂盒
CN112301119A (zh) * 2019-07-29 2021-02-02 北京宠耀基因科技服务有限公司 猫类多重遗传病筛查的方法、引物和试剂盒
KR102408378B1 (ko) * 2019-10-15 2022-06-14 프로지니어 주식회사 다중 바이오마커 검출 방법
JP2023184021A (ja) * 2022-06-17 2023-12-28 株式会社日立製作所 遺伝子分析方法、遺伝子分析装置、及び遺伝子分析用キット

Family Cites Families (107)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4521509A (en) 1982-11-24 1985-06-04 Research Corporation Method for degrading DNA
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US6197563B1 (en) 1985-03-28 2001-03-06 Roche Molecular Systems, Inc. Kits for amplifying and detecting nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5079352A (en) 1986-08-22 1992-01-07 Cetus Corporation Purified thermostable enzyme
US5541308A (en) 1986-11-24 1996-07-30 Gen-Probe Incorporated Nucleic acid probes for detection and/or quantitation of non-viral organisms
US4994372A (en) * 1987-01-14 1991-02-19 President And Fellows Of Harvard College DNA sequencing
US5817797A (en) * 1988-06-01 1998-10-06 The United States Of America As Represented By The Department Of Health And Human Services Sequencing DNA; a modification of the polymerase chain reaction
GB2222785B (en) * 1988-09-17 1992-02-12 Usui Kokusai Sangyo Kk Multi-layered pipe coating
US5066584A (en) 1988-09-23 1991-11-19 Cetus Corporation Methods for generating single stranded dna by the polymerase chain reaction
US5091310A (en) 1988-09-23 1992-02-25 Cetus Corporation Structure-independent dna amplification by the polymerase chain reaction
US5075216A (en) 1988-09-23 1991-12-24 Cetus Corporation Methods for dna sequencing with thermus aquaticus dna polymerase
CA1339731C (en) 1988-10-12 1998-03-17 Charles T. Caskey Multiplex genomic dna amplification for deletion detection
US5639611A (en) 1988-12-12 1997-06-17 City Of Hope Allele specific polymerase chain reaction
US5023171A (en) 1989-08-10 1991-06-11 Mayo Foundation For Medical Education And Research Method for gene splicing by overlap extension using the polymerase chain reaction
US5068191A (en) 1989-08-31 1991-11-26 The Biomembrane Institute Purified histo-blood group a glycosyltransferase and antibodies thereto
US5641628A (en) 1989-11-13 1997-06-24 Children's Medical Center Corporation Non-invasive method for isolation and detection of fetal DNA
EP0502037A1 (en) 1989-11-24 1992-09-09 Isis Innovation Limited Prenatal genetic determination
US5104792A (en) 1989-12-21 1992-04-14 The United States Of America As Represented By The Department Of Health And Human Services Method for amplifying unknown nucleic acid sequences
US6013431A (en) * 1990-02-16 2000-01-11 Molecular Tool, Inc. Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators
US5153117A (en) * 1990-03-27 1992-10-06 Genetype A.G. Fetal cell recovery method
US5098839A (en) * 1990-05-10 1992-03-24 New England Biolabs, Inc. Type ii restriction endonuclease obtainable from pseudomonas alcaligenes and a process for producing the same
US5635348A (en) * 1990-10-05 1997-06-03 Hoffmann-La Roche Inc. Method and probes for identifying bacteria found in blood
US5545552A (en) 1990-12-03 1996-08-13 Stratagene Purified thermostable pyrococcus furiosus DNA polymerase I
US6004744A (en) * 1991-03-05 1999-12-21 Molecular Tool, Inc. Method for determining nucleotide identity through extension of immobilized primer
CA2218875C (en) 1991-07-23 2000-11-07 The Research Foundation Of State University Of New York Improvements in the in situ pcr
US5759772A (en) 1992-07-23 1998-06-02 Wisconsin Alumni Research Foundation Method for determining the sex of an embryo
DK0590327T3 (da) 1992-09-11 2003-07-28 Hoffmann La Roche Påvisning af nukleinsyrer i blod
US5565339A (en) 1992-10-08 1996-10-15 Hoffmann-La Roche Inc. Compositions and methods for inhibiting dimerization of primers during storage of polymerase chain reaction reagents
GB9223035D0 (en) 1992-11-03 1992-12-16 Kiessling Cooper Ann A Preservation of peripheral blood & semen in fixatives that inactivate human pathogens
US5744301A (en) 1992-11-25 1998-04-28 Brigham And Women's Hospital Methods of detection of epstein barr virus induced genes expressed in the placenta
WO1995006137A1 (en) 1993-08-27 1995-03-02 Australian Red Cross Society Detection of genes
US6017699A (en) 1993-09-15 2000-01-25 The University Of Pittsburgh PCR identification and quantification of important Candida species
US5426026A (en) * 1993-09-15 1995-06-20 University Of Pittsburgh PCR identification of four medically important candida species using one primer pair and four species-specific probes
US5538848A (en) 1994-11-16 1996-07-23 Applied Biosystems Division, Perkin-Elmer Corp. Method for detecting nucleic acid amplification using self-quenching fluorescence probe
CH686982A5 (fr) 1993-12-16 1996-08-15 Maurice Stroun Méthode pour le diagnostic de cancers.
US5432054A (en) 1994-01-31 1995-07-11 Applied Imaging Method for separating rare cells from a population of cells
US6395547B1 (en) * 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5605793A (en) * 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6110709A (en) 1994-03-18 2000-08-29 The General Hospital Corporation Cleaved amplified modified polymorphic sequence detection methods
US5831065A (en) * 1994-04-04 1998-11-03 Lynx Therapeutics, Inc. Kits for DNA sequencing by stepwise ligation and cleavage
US5648222A (en) 1994-07-27 1997-07-15 The Trustees Of Columbia University In The City Of New York Method for preserving cells, and uses of said method
US5882857A (en) * 1995-06-07 1999-03-16 Behringwerke Ag Internal positive controls for nucleic acid amplification
US5631147A (en) 1995-09-21 1997-05-20 Becton, Dickinson And Company Detection of nucleic acids in cells by thermophilic strand displacement amplification
US6506602B1 (en) * 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6100029A (en) 1996-08-14 2000-08-08 Exact Laboratories, Inc. Methods for the detection of chromosomal aberrations
CA2275865C (en) * 1996-08-28 2006-12-12 The Johns Hopkins University School Of Medicine Method for detecting cell proliferative disorders
US5965363A (en) * 1996-09-19 1999-10-12 Genetrace Systems Inc. Methods of preparing nucleic acids for mass spectrometric analysis
CA2301875A1 (en) * 1996-09-19 1998-03-26 Genetrace Systems Methods of preparing nucleic acids for mass spectrometric analysis
US5858671A (en) 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
US6153410A (en) * 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
DE19717085C2 (de) 1997-04-23 1999-06-17 Bruker Daltonik Gmbh Verfahren und Geräte für extrem schnelle DNA-Vervielfachung durch Polymerase-Kettenreaktionen (PCR)
US20020119478A1 (en) * 1997-05-30 2002-08-29 Diagen Corporation Methods for detection of nucleic acid sequences in urine
US5998141A (en) 1997-07-10 1999-12-07 Millennium Pharmaceuticals, Inc. Intronic and polymorphic SR-BI nucleic acids and uses therefor
US6124120A (en) * 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
US6090553A (en) 1997-10-29 2000-07-18 Beckman Coulter, Inc. Use of uracil-DNA glycosylase in genetic analysis
US6033861A (en) * 1997-11-19 2000-03-07 Incyte Genetics, Inc. Methods for obtaining nucleic acid containing a mutation
AU746786B2 (en) * 1997-12-08 2002-05-02 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6391551B1 (en) * 1998-03-13 2002-05-21 Promega Corporation Detection of nucleic acid hybrids
US6268146B1 (en) 1998-03-13 2001-07-31 Promega Corporation Analytical methods and materials for nucleic acid detection
DE19813317A1 (de) * 1998-03-26 1999-09-30 Roche Diagnostics Gmbh Verbessertes Verfahren zur Primer Extension Präamplifikations-PCR
GB9808145D0 (en) * 1998-04-17 1998-06-17 Zeneca Ltd Assay
US6183958B1 (en) * 1998-05-06 2001-02-06 Variagenics, Inc. Probes for variance detection
US6673541B1 (en) * 1998-09-18 2004-01-06 Micromet Ag DNA amplification of a single cell
US6703228B1 (en) * 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
US6203989B1 (en) 1998-09-30 2001-03-20 Affymetrix, Inc. Methods and compositions for amplifying detectable signals in specific binding assays
WO2000035565A2 (en) * 1998-12-04 2000-06-22 Orbital Biosciences, Llc Ultrafiltration device and method of forming same
EP1024201B1 (en) 1999-01-27 2003-11-26 Commissariat A L'energie Atomique Microassay for serial analysis of gene expression and applications thereof
US6174681B1 (en) * 1999-03-05 2001-01-16 Mayo Foundation For Medical Education And Research Method and probe set for detecting cancer
US6225061B1 (en) 1999-03-10 2001-05-01 Sequenom, Inc. Systems and methods for performing reactions in an unsealed environment
US20020009394A1 (en) * 1999-04-02 2002-01-24 Hubert Koster Automated process line
US6582906B1 (en) * 1999-04-05 2003-06-24 Affymetrix, Inc. Proportional amplification of nucleic acids
FR2792000B1 (fr) * 1999-04-08 2003-04-11 Centre Nat Rech Scient Procede de cartographie d'une molecule d'adn comprenant une etape d'amplification ad infinitum
US6387621B1 (en) 1999-04-27 2002-05-14 University Of Utah Research Foundation Automated analysis of real-time nucleic acid amplification
US6440706B1 (en) * 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
JP3929775B2 (ja) 1999-09-13 2007-06-13 ニューゲン テクノロジーズ, インコーポレイテッド ポリヌクレオチド配列の線形等温増幅のための方法および組成物
US6221600B1 (en) 1999-10-08 2001-04-24 Board Of Regents, The University Of Texas System Combinatorial oligonucleotide PCR: a method for rapid, global expression analysis
US7741028B2 (en) * 1999-11-12 2010-06-22 Ambry Genetics Methods of identifying genetic markers in the human cystic fibrosis transmembrane conductance regulator (CFTR) gene
AU2001229576A1 (en) 2000-01-15 2001-07-24 Genelabs Technologies, Inc. Nucleic acid binding site assay and selection method
US6475736B1 (en) 2000-05-23 2002-11-05 Variagenics, Inc. Methods for genetic analysis of DNA using biased amplification of polymorphic sites
GB0016742D0 (en) 2000-07-10 2000-08-30 Simeg Limited Diagnostic method
US6664056B2 (en) 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
AU2002243263A1 (en) 2000-11-15 2002-07-24 Roche Diagnostics Corporation Methods and reagents for identifying rare fetal cells in the material circulation
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
EP1373574A4 (en) 2001-03-30 2007-01-03 Ge Healthcare Bio Sciences Ab P450 single nucleotide BIOCHIPs ANALYSIS
EP1256632A3 (en) * 2001-05-07 2004-01-02 Smithkline Beecham Corporation High throughput polymorphism screening
US20030044791A1 (en) * 2001-06-13 2003-03-06 Flemington Erik Kolstad Adaptor kits and methods of use
US20050037388A1 (en) 2001-06-22 2005-02-17 University Of Geneva Method for detecting diseases caused by chromosomal imbalances
WO2003000919A2 (en) * 2001-06-22 2003-01-03 University Of Geneva Method for detecting diseases caused by chromosomal imbalances
US6573300B2 (en) * 2001-08-24 2003-06-03 China Medical College Hospital Hydroxyurea treatment for spinal muscular atrophy
US6995841B2 (en) * 2001-08-28 2006-02-07 Rice University Pulsed-multiline excitation for color-blind fluorescence detection
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US7468244B2 (en) * 2001-09-27 2008-12-23 University Of Delaware Polymorphism detection and separation
US6617137B2 (en) * 2001-10-15 2003-09-09 Molecular Staging Inc. Method of amplifying whole genomes without subjecting the genome to denaturing conditions
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
BR0308134A (pt) * 2002-03-01 2006-04-11 Ravgen Inc análise rápida das variações em um genoma
US7442506B2 (en) * 2002-05-08 2008-10-28 Ravgen, Inc. Methods for detection of genetic disorders
US7727720B2 (en) * 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
US20070178478A1 (en) * 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
US7108976B2 (en) 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
JP2006521086A (ja) 2003-02-28 2006-09-21 ラブジェン, インコーポレイテッド 遺伝子疾患の検出方法

Cited By (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10266893B2 (en) 2005-07-29 2019-04-23 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10260096B2 (en) 2005-07-29 2019-04-16 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10392664B2 (en) 2005-07-29 2019-08-27 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10227652B2 (en) 2005-07-29 2019-03-12 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10240202B2 (en) 2005-11-26 2019-03-26 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10711309B2 (en) 2005-11-26 2020-07-14 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11306359B2 (en) 2005-11-26 2022-04-19 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10597724B2 (en) 2005-11-26 2020-03-24 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
CN108048549A (zh) * 2006-06-14 2018-05-18 维里纳塔健康公司 使用样品拆分和dna标签进行稀有细胞分析
US11378498B2 (en) 2006-06-14 2022-07-05 Verinata Health, Inc. Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US11781187B2 (en) 2006-06-14 2023-10-10 The General Hospital Corporation Rare cell analysis using sample splitting and DNA tags
CN101715486B (zh) * 2007-05-04 2013-05-01 硅生物系统股份公司 用于非侵入性产前诊断的方法和装置
CN101999003A (zh) * 2008-02-12 2011-03-30 诺瓦蒂斯公司 分离无细胞凋亡或胎儿核酸的方法
US10216896B2 (en) 2009-09-30 2019-02-26 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10522242B2 (en) 2009-09-30 2019-12-31 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10774380B2 (en) 2010-05-18 2020-09-15 Natera, Inc. Methods for multiplex PCR amplification of target loci in a nucleic acid sample
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US10526658B2 (en) 2010-05-18 2020-01-07 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10538814B2 (en) 2010-05-18 2020-01-21 Natera, Inc. Methods for simultaneous amplification of target loci
US10557172B2 (en) 2010-05-18 2020-02-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11312996B2 (en) 2010-05-18 2022-04-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11746376B2 (en) 2010-05-18 2023-09-05 Natera, Inc. Methods for amplification of cell-free DNA using ligated adaptors and universal and inner target-specific primers for multiplexed nested PCR
US10590482B2 (en) 2010-05-18 2020-03-17 Natera, Inc. Amplification of cell-free DNA using nested PCR
US11525162B2 (en) 2010-05-18 2022-12-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11519035B2 (en) 2010-05-18 2022-12-06 Natera, Inc. Methods for simultaneous amplification of target loci
US10597723B2 (en) 2010-05-18 2020-03-24 Natera, Inc. Methods for simultaneous amplification of target loci
US11482300B2 (en) 2010-05-18 2022-10-25 Natera, Inc. Methods for preparing a DNA fraction from a biological sample for analyzing genotypes of cell-free DNA
US10655180B2 (en) 2010-05-18 2020-05-19 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US10731220B2 (en) 2010-05-18 2020-08-04 Natera, Inc. Methods for simultaneous amplification of target loci
US10174369B2 (en) 2010-05-18 2019-01-08 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10793912B2 (en) 2010-05-18 2020-10-06 Natera, Inc. Methods for simultaneous amplification of target loci
US11306357B2 (en) 2010-05-18 2022-04-19 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11111545B2 (en) 2010-05-18 2021-09-07 Natera, Inc. Methods for simultaneous amplification of target loci
US11286530B2 (en) 2010-05-18 2022-03-29 Natera, Inc. Methods for simultaneous amplification of target loci
CN107988343A (zh) * 2011-02-09 2018-05-04 纳特拉公司 非侵入性产前倍性识别方法
CN103131787B (zh) * 2013-03-11 2014-05-21 四川大学 基于y染色体snp遗传标记的法医学复合检测试剂盒
CN103131787A (zh) * 2013-03-11 2013-06-05 四川大学 基于y染色体snp遗传标记的法医学复合检测试剂盒
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10597708B2 (en) 2014-04-21 2020-03-24 Natera, Inc. Methods for simultaneous amplifications of target loci
US11414709B2 (en) 2014-04-21 2022-08-16 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11319595B2 (en) 2014-04-21 2022-05-03 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11530454B2 (en) 2014-04-21 2022-12-20 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US10597709B2 (en) 2014-04-21 2020-03-24 Natera, Inc. Methods for simultaneous amplification of target loci
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US11371100B2 (en) 2014-04-21 2022-06-28 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11486008B2 (en) 2014-04-21 2022-11-01 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11390916B2 (en) 2014-04-21 2022-07-19 Natera, Inc. Methods for simultaneous amplification of target loci
US10179937B2 (en) 2014-04-21 2019-01-15 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11408037B2 (en) 2014-04-21 2022-08-09 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US11319596B2 (en) 2014-04-21 2022-05-03 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US10351906B2 (en) 2014-04-21 2019-07-16 Natera, Inc. Methods for simultaneous amplification of target loci
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
CN105296613A (zh) * 2015-09-24 2016-02-03 郑州市职业病防治院 一种人TERF1基因rs3863242位点多态性检测技术
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US11519028B2 (en) 2016-12-07 2022-12-06 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US11530442B2 (en) 2016-12-07 2022-12-20 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10577650B2 (en) 2016-12-07 2020-03-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10533219B2 (en) 2016-12-07 2020-01-14 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10894976B2 (en) 2017-02-21 2021-01-19 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
CN108315445A (zh) * 2018-04-26 2018-07-24 兰州大学 一种检测绵羊sry基因的单核苷酸多态性的方法与应用
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
CN113265461A (zh) * 2021-07-02 2021-08-17 北京华诺奥美医学检验实验室有限公司 一种用于检测高频基因致病变异的引物组和探针组及试剂盒

Also Published As

Publication number Publication date
IL163597A0 (en) 2005-12-18
JP2006523082A (ja) 2006-10-12
EP1481092A4 (en) 2006-08-09
CN1650031A (zh) 2005-08-03
EP1481097A1 (en) 2004-12-01
IL163600A0 (en) 2005-12-18
MXPA04008477A (es) 2005-10-26
US20040106102A1 (en) 2004-06-03
WO2003074723A2 (en) 2003-09-12
CA2477761A1 (en) 2003-09-12
WO2003074740A1 (en) 2003-09-12
AU2003217826A1 (en) 2003-09-16
EP1481097A4 (en) 2006-08-02
US20070196842A1 (en) 2007-08-23
BR0308134A (pt) 2006-04-11
CO5631457A2 (es) 2006-04-28
US7208274B2 (en) 2007-04-24
AU2003217826B2 (en) 2008-07-31
CA2477611A1 (en) 2003-09-12
IL163600A (en) 2011-07-31
CO5631459A2 (es) 2006-04-28
JP2006508632A (ja) 2006-03-16
WO2003074723A3 (en) 2003-11-27
KR20040105744A (ko) 2004-12-16
NZ535045A (en) 2008-04-30
AU2003225634A1 (en) 2003-09-16
EP1481092A2 (en) 2004-12-01
MXPA04008472A (es) 2005-09-20
CN100519761C (zh) 2009-07-29
BR0308161A (pt) 2006-06-06
NZ535044A (en) 2008-12-24
AU2003225634B2 (en) 2008-12-04
KR20040102024A (ko) 2004-12-03

Similar Documents

Publication Publication Date Title
CN1650032A (zh) 检测遗传疾病的方法
US8206926B2 (en) Restriction endonuclease enhanced polymorphic sequence detection
JP4468488B2 (ja) 組み合せたリガーゼ検出およびポリメラーゼ連鎖反応を用いる核酸配列相違の検出
US8652780B2 (en) Restriction endonuclease enhanced polymorphic sequence detection
CN1697882A (zh) 多重pcr
CN1863927A (zh) 核酸检测分析
US20090081737A1 (en) Methods and compositions for reducing the complexity of a nucleic acid sample
US20140323354A1 (en) Chemically Modified Ligase Cofactors, Donors and Acceptors
CN1688718A (zh) 检测靶序列的方法和组合物
US20160194695A1 (en) Nucleic acid amplification method using allele-specific reactive primer
KR100874378B1 (ko) 단일염기다형성을 이용한 한우육 판별방법
US20210189384A1 (en) Methods and compositions for amplicon concatenation
O’Donnell et al. Rapid detection of the R408W and I65T mutations in phenylketonuria by glycosylase mediated polymorphism detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication