首页> 中国专利> 确定多胎妊娠的胎儿基因组

确定多胎妊娠的胎儿基因组

摘要

提供了在有多个胎儿的妊娠期内确定母系和父系单倍型的遗传的技术。可在母体为杂合子并且父系遗传性等位基因已知(例如,父体为纯合子)的基因座处确定母系遗传。可使用两种类型的基因座,其中一种类型具有在第一母系单倍型上出现的父系等位基因,而另一种类型具有在第二母系单倍型上出现的父系等位基因。可由父体为杂合子而母体为纯合子的基因座确定父系遗传。可测量每个基因座处不同等位基因的量。量的比较(例如,使用每个等位基因的百分比浓度和阈值)可用于确定单倍型的遗传情况。单倍型可与目标病状相关联。

著录项

  • 公开/公告号CN105121660A

    专利类型发明专利

  • 公开/公告日2015-12-02

    原文格式PDF

  • 申请/专利权人 香港中文大学;

    申请/专利号CN201480012432.2

  • 发明设计人 卢煜明;赵慧君;陈君赐;

    申请日2014-03-17

  • 分类号C12Q1/68;

  • 代理机构北京英赛嘉华知识产权代理有限责任公司;

  • 代理人王达佐

  • 地址 中国香港新界

  • 入库时间 2023-12-18 12:26:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-09-28

    授权

    授权

  • 2015-12-30

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20140317

    实质审查的生效

  • 2015-12-02

    公开

    公开

说明书

相关申请案的交叉引用

本申请要求2013年3月15日提交的名称为“确定多胎妊娠的胎儿基 因组(DeterminingFetalGenomesForMultipleFetusPregnancies)”的美国临 时申请第61/789,992号的优先权,其全部内容以引用的方式并入本文用 于所有目的。

本申请与Lo等的名称为“FetalGenomicAnalysisFromAMaternal BiologicalSample”的共有美国专利公布第2011/0105353号;和Lo等的名 称为“MolecularTestingOfMultiplePregnancies”的美国专利公布第US 2013/0059733号相关,所述美国专利公布的公开内容以引用的方式整体 并入。

技术领域

本发明总体上涉及根据母体样品分析胎儿基因组,并且更特别地涉及 根据对母体样品中遗传片段的分析,测定多肽妊娠的全部或部分胎儿基因 组。

发明背景

1997年在母体血浆中发现游离的胎儿核酸为无创性产前诊断开辟了 新的可能性(LoYMD等Lancet1997;350:485-487;和美国专利第 6,258,540号)。这种技术已经迅速转变为临床应用,检测胎儿来源的、父 系遗传性基因或序列,例如用于胎儿性别确定、胎儿RhD状态确定及确 定胎儿是否已经遗传了父系遗传性突变(AmicucciP等ClinChem2000;46: 301-302;SaitoH等Lancet2000;356:1170;和ChiuRWK等Lancet2002; 360:998-1000)。该领域的最新进展已经使得能够由母体血浆核酸分析产 前诊断出胎儿染色体非整倍性,例如三体性21(LoYMD等NatMed2007; 13:218-223;TongYK等ClinChem2006;52:2194-2202;美国专利公布 2006/0252071;LoYMD等ProcNatlAcadSciUSA2007;104: 13116-13121;ChiuRWK等ProcNatlAcadSciUSA2008;105: 20458-20463;FanHC等ProcNatlAcadSci2008;105:16266-16271;美国 专利公布2007/0202525;和美国专利公布2009/0029377)。

重大最新进展的另一方面是使用单分子计数方法,例如数字PCR对 单基因疾病进行无创性产前诊断,其中母体和父体均携带相同突变。这已 经通过对母体血浆的相对突变剂量(RMD)分析实现(美国专利公布 2009/0087847;LunFMF等ProcNatlAcadSciUSA2008;105: 19920-19925;和ChiuRWK等TrendsGenet2009;25:324-331)。

然而,此类方法使用可能突变的先验知识来分析基因组的特定部分, 因此不可能鉴定潜伏或罕见突变或遗传病。进一步地,按照惯例已经通过 超声扫描(ChauhanSP等AmJObstetGynecol2010;203:305-315)或创性产 前诊断(例如羊膜穿刺术)(ChenCP等HumReprod2000;15:929-934)获得 了关于双胎妊娠的接合性的信息。

因此,需要提供可使用无创性技术鉴定多胎妊娠的全部或部分胎儿基 因组的新方法、系统和装置。

发明概述

本发明的方法提供了在有多个胎儿的妊娠期内确定母系和父系单倍 型的遗传的方法、系统和装置。可在母体为杂合子并且父系遗传性等位基 因已知(例如,父体为纯合子)的基因座处确定母系遗传。可使用两种类型 的基因座,其中一种类型具有在第一母系单倍型上出现的父系等位基因, 而另一种类型具有在第二母系单倍型上出现的父系等位基因。可由父体为 杂合子而母体为纯合子的基因座确定父系遗传。可测量每个基因座处不同 等位基因的量。量的比较(例如,使用每个等位基因的百分比浓度和阈值) 可用于确定单倍型遗传。单倍型可与目标病状相关联。

一些实施方案涉及与本文所述方法相关的系统和计算机可读介质。

参考以下详细描述和附图可获得对本发明实施方案的特性和优点的 更好理解。

附图简述

图1显示了根据本发明的实施方案,母体为纯合子而父体为杂合子的 两个基因座的实例。

图2是根据本发明的实施方案,确定多胎妊娠的胎儿中父系单倍型遗 传的方法200的流程图。

图3显示了根据本发明的实施方案,具有两种类型的基因座的标志的 假定父体和母体的单倍型。

图4A显示了对于图3所示基因座而言两个胎儿均已从母体遗传了 HapI的实例。图4B显示了当两个胎儿均已从母体遗传了HapI时,母体 血浆中父体和母体共有的等位基因(A等位基因)的百分比浓度的实例计 算。

图5A显示了对于图3所示基因座而言两个胎儿均已从母体遗传了 HapII的实例。图5B显示了当两个胎儿均已从母体遗传了HapII时,母 体血浆中父体和母体共有的等位基因(A等位基因)的百分比浓度的实例 计算。

图6A显示了对于图3所示基因座而言一个胎儿已从母体遗传了Hap I并且一个胎儿已从母体遗传了HapII实例。图6B显示了当一个胎儿已 从母体遗传了HapI并且另一个胎儿已从母体遗传了HapII时,母体血浆 中父体和母体共有的等位基因(A等位基因)的百分比浓度的实例计算。

图7A显示了对于两个胎儿的母系单倍型遗传的三种不同情况而言, 母系特异性等位基因(B等位基因)及父体和母体共有的等位基因(A等位 基因)的百分比浓度。

图7B说明了如何使用每个信息SNP基因座处的单独百分比浓度估计 对于特定类型的所有基因座而言,共有等位基因(A等位基因)的百分比浓 度。

图8是根据本发明的实施方案,使用两种类型的基因座确定母系单倍 型遗传的方法800的流程图。

图9是根据本发明的实施方案,使用一种类型的基因座确定母系单倍 型遗传的方法900的流程图。

图10A显示了在两个胎儿均已从母体遗传了HapI时,当胎儿贡献不 同的胎儿DNA百分比时对于α类和β类SNP而言母体血浆中共有等位 基因(A等位基因)的百分比浓度。

图10B显示了在两个胎儿均已从母体遗传了HapII时,当胎儿贡献 不同的胎儿DNA百分比时对于α类和β类SNP而言母体血浆中共有等 位基因(A等位基因)的百分比浓度。

图11A显示了在一个胎儿已从母体遗传了HapI并且另一个胎儿从母 体遗传了HapII时,当胎儿贡献不同的胎儿DNA百分比时对于α类和β 类SNP而言母体血浆中共有等位基因(A等位基因)的百分比浓度。

图11B显示了使用α类和β类SNP的A等位基因和三种情况下这两 种浓度的比率的表1150。

图12是根据本发明的实施方案,使用来自于两种类型的基因座的值 的比率确定母系单倍型遗传的方法1200的流程图。

图13是根据本发明的实施方案,母体和父体为杂合子时,确定在由 雄性受精的雌性的两个胎儿中母系单倍型的遗传的方法1300。

图14A和14B分别显示了情况1和情况2的预期α/β比率的分布。

图15是显示了情况1的染色体4长臂上染色体片段的RHDO分析的 表1500。

图16是显示了情况2的染色体4长臂上染色体片段的RHDO分析的 表1600。

图17显示了可与根据本发明的实施方案所述的系统和方法一起使用 的示例计算机系统10的方框图。

定义

如本公开中所使用的术语“生物样品”指取自受试者(例如,人(例如孕 妇))并且含有一种或多种目标核酸分子的任何样品。用于本发明实践中的 样品包括血浆、血清、血细胞、白细胞、网织红细胞和全血。出于一些目 的,也可使用唾液、胸膜液、汗、腹水、胆汁、尿、胰液、粪便或子宫颈 涂片样品。

术语“基因座(locus)”或其复数形式“基因座(loci)”是基因组上有变化 的任何长度的核苷酸(或碱基对)的位置或地址。

如本文所使用,术语“基因座”或其复数形式“基因座”是基因组上有变 化的任何长度的核苷酸(或碱基对)的位置或地址。术语“等位基因”指在相 同物理基因组基因座处,可能产生或可能不产生不同表型性状的替代性 DNA序列。在具有每条染色体(除男性人类受试者中的性染色体外)的两 个拷贝的任何特定二倍体生物中,每个基因的基因型均包括存在于该基因 座处,在纯合子中相同而在杂合子中不同的成对等位基因。一个种群或一 个物种的生物通常在不同个体间在每个基因座处包括多个等位基因。在种 群中发现一个以上等位基因的基因组基因座称为多态性位点。在基因座处 的等位变异可测,作为存在的等位基因的数量(即,多态性程度)或种群中 杂合子的比例(即,杂合率)。序列(例如基因)的存在或缺乏也视为一类等 位变异,因为基因座可包括所述序列或不包括所述序列。例如,可通过一 般在缺失序列之前和之后出现的序列连接鉴定序列(例如RHD基因)的这 种缺乏。如本文所使用,术语“多态性”指人类基因组中的任何个体间变异, 而不管其频率。此类变异的实例包括但不限于单核苷酸多态性、简单串联 重复多态性、插入-缺失多态性、突变(可致病)和拷贝数变异。

术语“单倍型”指在同一染色体或染色体区域上进行共同遗传的在多 个基因座处的等位基因的组合。单倍型可指少至一对基因座或指染色体区 域或指整条染色体。

“染色体区域”指特定染色体的多个核苷酸位置。染色体区域可为整条 染色体或较小分段。在正常人中,染色体区域将具有两个单倍型,一个对 于所述区域所在染色体的每个拷贝而言。所述两个单倍型在染色体区域上 可相同或不同。

如本公开中所使用的术语“阈值”或量意指用于对生物样品在两种或 更多种分类状态间-例如与特定表型病状或疾病或对表型病状或疾病的易 感性相关或关联的基因序列的存在或缺乏,做出判断的数值或量。例如, 如果参数大于阈值,则产生第一类的定量数据,或者如果参数小于阈值, 则产生不同类别的定量数据。

发明详述

实施方案可确定在有多个胎儿的妊娠期内确定母系和父系单倍型的 遗传。可由父体为杂合子而母体为纯合子的基因座确定父系遗传。父系特 异性等位基因的量(例如,那些等位基因的百分比浓度)可用于确定有多少 个胎儿已经遗传了带有父系特异性等位基因的单倍型。对胎儿中父系遗传 性单倍型的了解可用于确定胎儿遗传的母系单倍型。

可在母体为杂合子并且父系遗传性等位基因已知(例如,父体为纯合 子或确定了父系遗传性单倍型)的基因座处确定母系遗传。可使用两种类 型的基因座。一种类型具有在第一母系单倍型上出现的父系等位基因,而 另一种类型具有在第二母系单倍型上出现的父系等位基因。可测量每个基 因座处不同等位基因的量。量的比较(例如,使用每个等位基因的百分比 浓度和阈值)可用于确定单倍型遗传。并且,单倍型可与目标病状相关联, 可根据对哪些父系和/或母系单倍型遗传的确定,确定目标病状为遗传或 不遗传。

I.接合性

多胎妊娠指孕妇携带有一个以上胎儿的妊娠。双胎妊娠是最常见的多 胎妊娠形式。可将双胎妊娠表征为单卵(相同)和双卵(不相同)。虽然讨论 主要集中在双胎上,但是各方面也适用于更多数量的胎儿。

对母体血浆中存在的DNA片段的分析在双胎妊娠中-尤其是如果双 胎为双卵(不相同)时更复杂。即使在母体血浆中鉴定特定单倍型或特定疾 病相关多态性起源于胎儿,分析员仍面临另一个问题:如何确定是两个胎 儿均受到影响,还是仅有一个。

A.单卵性双胎

当孕妇携带一对单卵性双胎时,对胎儿的遗传分析可类似于用于分析 单胎妊娠的遗传分析。但是,双卵性双胎的可能性使得分析更加困难。为 了分析父系遗传,可将母系基因组中不存在的父系等位基因用作确定胎儿 遗传了哪个父系等位基因的标志。当已知父系等位基因在父体的特定单倍 型上时,可确定至少一个胎儿遗传了特定单倍型(单卵性时两个胎儿均遗 传)。

为了分析母系等位基因的遗传,因为不管胎儿遗传哪个母系等位基因, 在母体血浆中都可检测到两个母系等位基因,所以需要复杂的定量方法。 可比较母体血浆中两个母系等位基因的相对量,并且预计胎儿遗传的等位 基因将以更高浓度存在。在另一项实验中,比较母体血浆中两个母系等位 基因的相对量。当血浆样品中DNA的量有限时,这种相对单倍型剂量方 法可提供更精确的结果。在以引用的方式并入的美国专利第8,467,976号 中可找到关于相对单倍型剂量方法的详情。

B.双卵性双胎

如果一对双胎为双卵性,则两个胎儿可能从每个亲本遗传相同或不同 的等位基因。在这种情况下,需要更复杂的遗传分析来确定每个胎儿遗传 了哪个父系和母系等位基因。这种信息对分析单基因病和其它病状有用。

实施方案描述了分析多胎妊娠中胎儿对亲本单倍型的遗传的技术。所 述分析分为父系遗传分析及母系遗传分析。

II.父系遗传分析

在已知关于父体的基因型和/或单倍型信息时,可进行确定胎儿遗传 哪个父系单倍型。一些实施方案提供了通过鉴定和测量亲本特异性单倍型 确定亲本遗传的方法。

A.父系特异性单倍型的鉴定

对父系遗传的确定可通过分析母体为纯合子而父体为杂合子的基因 座进行。在这种情况下,在任一个或两个胎儿中可从父体遗传胎儿特异性 等位基因。

图1显示了根据本发明的实施方案,母体为纯合子而父体为杂合子的 两个基因座的实例。这两个基因座110、120相互靠近,以致在单次减数 分裂期间这两个基因座之间的重组不太可能。在该实例中,在基因座110 处,父系A等位基因与母系等位基因相同并且父系B等位基因在母体中 不存在,并且因此,为父系特异性。类似地,基因座120处的C等位基 因也为父系特异性。

在一个实施方案中,可确定两个不同基因座处父系特异性等位基因的 相位。等位基因的相位指关于其是在相同染色体上还是在不同的同源染色 体上的这些等位基因的关系。在位于相同染色体上的不同基因座处的等位 基因形成单倍型。因为可检测更多父系特异性等位基因,所以增加在每个 父系单倍型上分析的特异性基因座的数量可增加检测母体血浆的父系特 异性等位基因的灵敏度。检测的父系特异性等位基因的数量增加使推断胎 儿的父系遗传的准确性增加。

然后分析母体血浆DNA中这两个基因座的父系特异性等位基因。可 使用不同技术检测母体血浆中的这些父系特异性等位基因并且这些方法 将为本领域中的技术人员已知。这些方法的实例包括但不限于聚合酶链式 反应(PCR)、数字PCR、等位基因特异性PCR、DNA测序、引物延伸反 应、基于质谱分析的方法和下一代测序。

为确定两个胎儿是否遗传了相同的父系单倍型,可以分析两个父系单 倍型中的每一个的至少一个父系特异性等位基因。图1显示了两个父系单 倍型HapIII和HapIV。在该实例中,如果对于基因座110在母体血浆中 检测到B等位基因,这意味着至少一个胎儿遗传了父系单倍型HapIV。 类似地,如果对于基因座120在母体血浆中检测到C等位基因,则至少 一个胎儿遗传了父系HapIII。在双胎妊娠中,母体血浆中存在位于两个 父系单倍型中的每一个上的父系特异性等位基因表明,两个胎儿已经遗传 了不同的父系单倍型。如果在母体血浆中仅存在基因座110处的父系特异 性等位基因(B等位基因),但是基因座120处的父系特异性等位基因(C等 位基因)不存在,则两个胎儿均已遗传了父系HapIV。类似地,如果在母 体血浆中仅存在基因座120处的父系特异性等位基因(C等位基因),但是 基因座110处的父系特异性等位基因(B等位基因)不存在,则两个胎儿均 已遗传了父系HapIII。

母体血浆中父系单倍型上父系特异性等位基因的可检测性可受每个 胎儿所贡献的DNA百分比浓度和检测每个父系特异性等位基因的灵敏度 影响。在低胎儿DNA百分比浓度的存在下,即使在胎儿已经遗传了父系 特异性等位基因时,在母体血浆也不能检测出所述等位基因。为减少错误 断定胎儿未遗传父系单倍型的机会,可分析父系单倍型上更多数量的父系 特异性等位基因。

B.确定父系遗传的方法

图2是根据本发明的实施方案,确定多胎妊娠的胎儿中父系单倍型遗 传的方法200的流程图。实施方案可分析双卵性双胎胎儿中的父系遗传。 方法200可使用从怀有一个以上胎儿的雌性获得的生物样品。生物样品包 括雌性和两个胎儿的游离DNA。常常使用血液相关样品,例如血浆、血 清、血细胞、白细胞、网织红细胞或全血。其它样品类型包括尿、唾液、 阴道分泌物、来自雌性生殖道的洗液、泪和汗。

可以各种方式,例如使用数字PCR、测序或其它适合技术分析生物 样品。所述分析可提供基因组内某些基因座处等位基因数量的计数。例如, 可将序列读数与参考基因组比对并且将序列读数中的等位基因保存在存 储器内。在另一个实施方案中,PCR信号可表示包括与特定基因座和等 位基因的标记探针相对应的DNA片段的孔数(或进行RT-PCR的特定孔中 的量)。可用计算机系统进行方法200。

在方框210处,鉴定第一染色体上第一组的一个或多个第一基因座。 在每个基因座处,父体为第一等位基因和第二等位基因的杂合子,并且母 体为第一等位基因的纯合子。第一等位基因在第一染色体区域(例如,整 条染色体或仅仅一部分)的第一单倍型上。第二父系单倍型具有第二等位 基因。

正如本领域中技术人员将已知的那样,可用各种方式为母体进行基因 型分析。例如,可分析来自母体细胞的DNA,并且可将仅检测到一个等 位基因的基因座鉴定为纯合子。

可用各种方式测定父体的第一单倍型。在一个实施方案中,可对父体 进行基因型分析并且可根据可由父体对应的特定种群测定的参考单倍型 (例如由特定种族群体测定的参考)确定单倍型。在另一个实施方案中,可 分析父体的生物样品以测定第一单倍型。

在方框220处,测量在生物样品的DNA片段中存在于第一等位基因 座处的各个第一等位基因的第一量。如上所述,可用接收序列读数或PCR 读数(例如许多孔的颜色信号)的计算机测定第二量。计算机可测定与特定 第一基因座相对应的DNA片段的数量并且为具有第二等位基因的此类 DNA片段计数(例如,具有特定颜色的孔的数量或具有第二等位基因的比 对序列读数的数量)。

在一些实施方案中,使用已经获得的序列数据通过计算进行分析。适 合技术的选择包括US2011/0105353A1和US2013/0059733A1中提供的 技术。作为通过每个基因座测序的替代方法,使用者可使用特异性探针或 PCR引物对特定等位基因进行试验。在实际物理测序步骤的意义上讲, 测量可具“选择性”和/或屏蔽、过滤或以其它方式选择由此获得的序列数 据以获得在目标单倍型和/或与单倍型相联的等位基因处或周围的读数。

在方框230处,任选地标准化第一量。在其它实施方案中,第一量未 标准化。在一个实施方案中,通过除以第一基因座处第二等位基因的第二 量标准化第一量。在另一个实施方案中,可通过将第一量除以第一基因座 处DNA片段的总量进行标准化。结果可提供第一等位基因的百分比浓度。

然后按照每个等位基因的计数单独除以所有等位基因一起的计数,计 算每个基因座处等位基因的百分比浓度。增加生物(母体)样品的读数数量 增加了评估的准确性。可单独分析每个基因座并且为达成共识而组合结果。 可选地,根据其是否与第一单倍型相关联,将所有基因座处的等位基因的 计数总和到一起。

在方框240处,将标准化第一量与第一阈值比较。在一个实施方案中, 使用第一量的原始值时,第一阈值可为零(或其他相对较小的非标准化值), 以致第一等位基因的任何检测均可表示母体样品中第一单倍型的存在。因 为仅根据一些第一等位基因的存在假定了第一单倍型的存在,而不知道第 一等位基因的百分比或其它标准化值,所以这种分析实质上更定性。并且, 不知道是否两个胎儿均已遗传了第一等位基因。

在其它实施方案中,可设置更高的阈值以便在对一个或多个第一等位 基因的检测可能由于(例如)所用生化法(例如,测序或PCR)的误差而错误 时,避免可产生假阳性的虚假数据。

在方框250处,根据所述比较确定第一单倍型的遗传。如上所述,所 述确定可以是当第一量或标准化第一量超过第一阈值时,至少一个胎儿已 经遗传了第一单倍型。

在一些实施方案中,可使用一个以上阈值。此类实例可以是在测定第 一等位基因的百分比浓度时。如果生物样品中的总胎儿DNA百分比已知 和/或是单独的。这种定量测量允许鉴定是一个胎儿还是两个胎儿具有目 标单倍型。

例如,如果百分比浓度高于第一阈值,则将两个胎儿均鉴定为已经遗 传了所述单倍型。如果百分比浓度不显著大于零(例如,小于第二阈值), 则将两个胎儿均鉴定为尚未遗传了所述单倍型。如果百分比浓度不高于第 一阈值,但是大于第二阈值,则可将其中一个胎儿确定为遗传了第一单倍 型而另一个没有。

在一个特定实例中,假定总胎儿DNA百分比为10%,每个胎儿贡献 5%。考虑到测量的统计准确度,第一阈值可介于7-9%之间,或为可在5% 和10%之间区别的任何适合百分比。考虑到测量的统计精确度,第二阈 值可介于2-4%之间,或为可在0%和5%之间区别的任何适合百分比。在 一些实施方案中,每个胎儿所贡献的单独DNA百分比可能未知,但是可 以根据其它样品的测量假定一个典型范围。因此,在此类情况下仍可测定 阈值。

可由母体样品中来自于每个胎儿的DNA的相对量或百分比测定用于 这种分析的阈值。阈值可区别没有来自于任一胎儿的等位基因贡献、来自 于一个胎儿的贡献或来自于两个胎儿的贡献。关于为每位患者或作为一个 整体的种群设置阈值的更多信息,在US2011/0105353A1和US 2013/0059733A1中提供了更多详情。

在方框250处,对于第一染色体区域的第二单倍型而言,可重复方框 210-250。例如,可鉴定一个或多个第二基因座,例如具有第二单倍型(图 1中的HapIII)上的父系特异性等位基因的基因座120。关于是否至少一个 胎儿已经遗传了第二单倍型,可进行测定。因此,这种测定可与对第一单 倍型的遗传测定相结合。如果确定两种单倍型均被遗传,则一个胎儿遗传 其中一种单倍型。如果仅确定一个单倍型被遗传,则可确定两个胎儿均遗 传相同单倍型。因此,可对两个胎儿进行关于遗传的测定。

如果测定了百分比浓度并用于第一单倍型,则可使用第二单倍型的百 分比浓度由第一基因座的百分比浓度和阈值确认确定的遗传。

当确定了遗传的父系单倍型时,可以确定母体为杂合子的基因座处遗 传的等位基因。关于父系遗传性等位基因的这种信息可用于确定胎儿的母 系单倍型的遗传。

C.鉴定基因座

可在分析含有母系和胎儿DNA的混合物的生物样品之前、期间或之 后获得亲本基因组的数据。可通过为来自于父本的生物样品测序获得父系 基因组序列。可通过为在妊娠之前所取的另一生物样品,或基本上不含胎 儿DNA的生物样品例如放血组织或毛囊测序获得母系基因组序列。可选 地,可通过对妊娠期间所取的母体血浆或样品的定量评估推断出父本和/ 或母本基因组的相关部分。

在一些实施方案中,然后可通过与来自其它家族成员,例如当前妊娠 胎儿的同胞,或来自祖父母的基因型等的基因型信息比较,将任一亲本的 基因型信息扩展为所述亲本的单倍型信息。也可通过本领域中技术人员众 所周知的其它方法构建所述亲本的单倍型。此类方法的实例包括基于单分 子分析的方法例如数字PCR(DingC和CantorCR.ProcNatlAcadSciUSA 2003;100:7449-7453;RuanoG等ProcNatlAcadSciUSA1990;87: 6296-6300)、精子单倍型分析(LienS等CurrProtocHumGenet2002;第1 章:1.6单元)和成像技术(XiaoM等HumMutat2007;28:913-921)。其它方 法包括基于等位基因特异性PCR(Michalatos-BeloinS等NucleicAcidsRes 1996;24:4841-4843;LoYMD等NucleicAcidsRes1991;NucleicAcidsRes 19:3561-3567)、克隆和限制性酶切(SmirnovaAS等Immunogenetics2007; 59:93-8)等的方法。还有其它方法基于种群中允许由统计评估推论母系单 倍型的单倍型域的分布和连锁不平衡结构(ClarkAG.MolBiolEvol1990; 7:111-22;10:13-9;SalemRM等HumGenomics2005;2:39-66)。

也可根据其与特定区域,例如单倍型已知或存在目标遗传特点的区域 的接近度选择用于分析的基因座。因此,可选择单倍型已知的区域内的基 因座。相互靠近的基因座可与相同单倍型相关联,并且将间隔有单倍型, 只要它们之间尚无染色体交叉。使用者有权选择放大或减小分析的染色体 区域。因为母体样品中将有更多DNA相关,所以放大所述区域增加了分 析的精确度。然而,放大所述区域也冒有之间发生交叉事件的风险,在所 述情况下等位基因的遗传不能准确预测单倍型的遗传。

在一个实施方案中,要分析的基因座是致病基因。在这种情况下,两 个目标父系等位基因可为致病突变和非致病等位基因。在另一个实施方案 中,要分析的基因座是与遗传病中涉及的基因相关联的多态体。在这种情 况下,两个目标父系等位基因将是与突变基因相关联的等位基因和与正常 (即,非突变)基因相关联的另一个等位基因。

D.临床评估

可通过定位与基因可遗传病状相关的父系单倍型评价父系遗传性常 染色体显性病状。例如,这可使用数字PCR、染色体分选、家属研究和 由种群单倍型信息推断进行。然后可鉴定母体血浆中与特定单倍型相关的 父系特异性疾病。在母体样品(例如,母体血浆)中存在位于目标单倍型上 的父系特异性等位基因可表示一个或两个胎儿已经遗传了所述病状。

可通过鉴定母体血浆中位于相同父系单倍型上的等位基因,确定是否 其中一个胎儿已经遗传了父系单倍型,评估常染色体隐性病状。对疾病相 关等位基因的检测可表明至少一个胎儿已经遗传了疾病相关的父系单倍 型。因此,第一等位基因中的一个或多个和/或第二等位基因中的一个或 多个与目标表型相关联。并且,目标表型可为疾病或疾病易感性。

III.母系遗传分析

因为母系来源的DNA构成了母体血浆中大部分的DNA,所以妊娠 期间对多个胎儿的母系遗传的分析很复杂。胎儿来源的DNA占一小部分 (例如,10%级),在双胎妊娠中是来自于两个胎儿的DNA的组合。因此, 如下所述,使用定量方法区分和表征胎儿DNA。

A.相对单倍型剂量(RHDO)分析

对于RHDO分析而言,本发明的一个实施方案是集中在母体为杂合 子而父体为纯合子的基因座的类别上。这样消除了必须同时分析母系和父 系等位基因的必要性。因此将纯合的SNP定义为对RHDO分析提供信息。

图3显示了根据本发明的实施方案,具有两种类型的基因座的标志的 假定父体和母体的单倍型。仅显示了母体为杂合子而父体为纯合子的基因 座。在该图解中,对这些信息基因座鉴定了两个等位基因(例如单核苷酸 多态性(SNP))。也可使用其它类型的多态性,例如微卫星多态性。虽然部 分讨论可提到SNP,但是可使用其它类型的多态性(变异)。

作为RHDO分析的一部分,SNP可分为两类,α类和β类。α类SNP 是父系等位基因与位于HapI上的母系等位基因相同的SNP基因座,并 且β类SNP是父系等位基因与位于HapII上的母系等位基因相同的SNP 基因座。因为HapI和HapII的分配随意,所以可在分析之前交换地定义 HapI和HapII。

在该实例中,因为父体在所述基因座处为纯合子,所以HapIII和Hap IV相同。然而,在其它实施方案中,父体并非纯合子,但是例如通过确 定遗传的父系单倍型已知父系遗传性等位基因。

在双卵性双胎妊娠中,存在母系单倍型遗传的三种可能性:

●两个胎儿均已从母体遗传了HapI(图4A);

●两个胎儿均已从母体遗传了HapII(图5A);

●一个胎儿从母体遗传了HapI而一个从母体遗传了HapII(图6A)。

图4A显示了与图3所示相同的母体和父体的单倍型。显示两个胎儿 均已从母体遗传了HapI。每个胎儿的另一种单倍型与HapIII或HapIV 相对应,因为二者在所示基因座处等效。

图4B显示了当两个胎儿均已从母体遗传了HapI时,母体血浆中父 体和母体共有的等位基因(A等位基因)的百分比浓度的实例计算。假定每 个胎儿贡献母体血浆中总DNA的10%并且母体贡献总血浆DNA的80%。 对于α类SNP而言,B等位基因仅存在于母系基因组中。因此,母体血 浆中B等位基因的百分比浓度为40%并且A等位基因(母体和父体之间的 共有等位基因)的百分比浓度为60%。对于β类SNP而言,胎儿和母体均 为A和B等位基因的杂合子。因此母体血浆中A等位基因的百分比浓度 为50%。

图5B显示了当两个胎儿均已从母体遗传了HapII时,母体血浆中父 体和母体共有的等位基因(A等位基因)的百分比浓度的实例计算。假定每 个胎儿贡献母体血浆中总DNA的10%,并且母体贡献80%。对于α类 SNP而言,胎儿和母体均为A和B等位基因的杂合子。因此母体血浆中 A等位基因的百分比浓度为50%。对于β类SNP而言,B等位基因仅存 在于母系基因组中,但不存在于胎儿中。因此,母体血浆中B等位基因 的百分比浓度为40%并且A等位基因的百分比浓度为60%。

图6B显示了当一个胎儿已从母体遗传了HapI并且另一个胎儿已从 母体遗传了HapII时,母体血浆中父体和母体共有的等位基因(A等位基 因)的百分比浓度的实例计算。假定每个胎儿贡献母体血浆中总DNA的 10%并且母体贡献总血浆DNA的80%,则对于α类和β类SNP而言A 等位基因的百分比浓度均为55%。

B.预测值与实际百分比浓度的比较

以上实例假定了胎儿DNA的特定百分比浓度。可通过几种方法,包 括分析其它基因座处母体和父体之间的胎儿特异性表观遗传标记和多态 性标记,测定胎儿DNA的百分比浓度。在US2013/0059733A1中描述了 测量母体血浆中双胎的百分比浓度及每个胎儿的贡献的方法。

对A等位基因或B等位基因(或二者)的百分比浓度进行统计分析以 区分三种情况。为了下面的讨论,仍假定了每个胎儿贡献样品中DNA片 段总量的10%的实例。在后面的部分中解决了胎儿贡献不同胎儿DNA百 分比的实施方案。

图7A显示了对于两个胎儿的母系单倍型遗传的三种不同情况而言, 母系特异性等位基因(B等位基因)及父体和母体共有的等位基因(A等位 基因)的百分比浓度。图7A中,假定两个胎儿中的每一个均贡献母体血 浆总DNA的10%,并且假定了对于α类SNP和β类SNP而言共有等位 基因(A等位基因)的预测百分比浓度。可用实验方法测量SNP基因座的A 等位基因的百分比浓度,然后与预测值比较以确定哪个最佳遗传模式最有 可能。

可将目标区域内相同类型的全部SNP(α或β)的A和B等位基因的等 位基因数合计在一起以计算α类和β类SNP的合计百分比浓度。可测定 合计百分比浓度与预测值的偏差。可推断产生最小总偏差的模式是双胎胎 儿中的母系遗传。

图7A中,当一个胎儿已经从母体遗传了HapI而另一个已经从母体 遗传了HapII时,使用α类和β类SNP测定的共有等位基因(A等位基因) 的百分比浓度将相同。如果两个胎儿均已从母体遗传了HapI,则A等位 基因的百分比浓度对于α类SNP而言将比对于β类SNP而言更高。相反, 如果两个胎儿均已遗传了HapII,则百分比浓度对于β类SNP而言将比 对于α类SNP而言更高。

比较使用α类和β类SNP测定的共有等位基因(A等位基因)的百分 比浓度以确定其是否在统计上不同。例如,如果基于α类和β类SNP的 共有等位基因的百分比浓度在统计上没有不同,则一个胎儿已经从母体遗 传了HapI而一个已经从母体遗传了HapII。可选地,如果α类SNP的共 有等位基因的百分比浓度在统计上明显高于β类SNP的共有等位基因的 百分比浓度,则两个胎儿均已从母体遗传了HapI。如果α类SNP的共有 等位基因的百分比浓度在统计上明显低于β类SNP的共有等位基因的百 分比浓度,则表明两个胎儿均已从母体遗传了HapII。

在另一个实施方案中,可计算α类基因座和β类基因座的百分比浓 度(或其它量)的比率。可将这个比率与列710中的比率作比较。

不同的统计试验均可用于确定α类和β类SNP的共有等位基因的百 分比浓度是否在统计上不同。这些方法的实例包括(但不限于)序贯概率比 检验(SPRT)、学生t检验、Mann-Whitney秩和检验、卡方检验(Chisquare test)。

图7B说明了如何使用每个信息SNP基因座处的单独百分比浓度估计 对于特定类型的所有基因座而言,共有等位基因(A等位基因)的百分比浓 度。然后可构建所有SNP基因座的百分比浓度分布并且可由分布的峰值 确定测量的百分比浓度。可进行这种统计分析,而不是合计所有A等位 基因的计数和所有B等位基因的计数。

因此,可计算每个基因座处量的单独比率(例如,百分比浓度)。然后 可使用这些单独比率获得总体比率(例如,总体百分比浓度)。因此,可使 用单独比率的平均值、中值或其它统计值(例如,分布的峰值)测定总体比 率,可将总体比率与阈值作比较。

C.使用两种类型的基因座确定母系遗传的方案

在一个实施方案中,在定量过程中两种类型的基因座均可用于确定母 系单倍型的遗传。例如,α类基因座可用于确定是否两个胎儿均已遗传了 相同的单倍型。并且,β类基因座可用于确定是否每个胎儿遗传了不同的 单倍型。

图8是根据本发明的实施方案,使用两种类型的基因座确定母系单倍 型遗传的方法800的流程图。方法800可分析双卵性双胎胎儿中的母系遗 传。对从母本获得的样品进行分析,其中所述样品含有来自于每个胎儿的 母系DNA和胎儿DNA(例如,游离DNA)。任何生物样品(例如,如本文 所定义)均可使用,条件是所述样品含有胎儿DNA。如同其它方法一样, 方法800使用计算机系统。

在方框810处,鉴定第一染色体上第一组的一个或多个第一基因座。 雌性在每个第一基因座处为各个第一等位基因和各个第二等位基因的杂 合子。第一母系单倍型具有第一等位基因并且第二母系单倍型具有第二等 位基因。第一等位基因可接近特定染色体上的目标遗传特点。第一组基因 座可与本文实例中所述的α类基因座相对应。

在方框820处,确定两个胎儿从父体遗传了第一基因座处的各个第一 等位基因。在一个实施方案中,可确定父体为各个第一等位基因的纯合子, 因此不管遗传哪个父系单倍型,都将遗传第一等位基因。可使用父系样品 进行父体的这种基因型分型。在另一个实施方案中,方法200可用于确定 遗传的父系单倍型。因为确定了父系单倍型,所以即使父体在第一基因座 处为杂合子,也可以确定第一基因座处的父系遗传性等位基因。

因此,如果首先确定了父系遗传,则没有必要将母系遗传的分析限于 父体为纯合子而母体为杂合子的基因座。也可使用两个亲本均为杂合子的 基因座,因为亲本遗传指示了哪个父系等位基因已经传代给两个胎儿。根 据该信息,可将基因座分为属于第一组或第二组。

在方框830处,鉴定第一染色体上第二组的一个或多个第二基因座。 在第二组的每个第二基因座处,第一母系单倍型具有各个第三等位基因并 且第二母系单倍型具有各个第四等位基因。第一组等位基因可与本文实例 中所述的β类基因座相对应。

在方框840处,确定两个胎儿从父体遗传了第二基因座处的各个第四 等位基因。如以上对方框820所述,可确定对来自于父体的第四等位基因 遗传的确定。例如,父体在第二基因座的每个基因座处均为各个第四等位 基因的纯合子。在另一个实施方案中,父体在第二基因座处为杂合子,但 是可使用方法200,使用其它基因座确定从特定父系单倍型遗传的各个第 四等位基因,方法200可使用一组不同的基因座(例如,母体为纯合子的 基因座)。

在方框850处,计算机系统测量在来自于雌性的生物样品的DNA片 段中存在于第一基因座的各个第一等位基因的第一量和各个第二等位基 因的第二量。例如,可为DNA片段测序以获得序列读数,并且可将读数 与参考基因组比对以鉴定与第一基因座对齐的读数。可为具有第一和第二 等位基因的读数的数量计数以分别测定第一量和第二量。在其它实施方案 中,如本文或其它并入文件中所述,使用其它技术。

在方框860处,计算机系统测量在生物样品的DNA片段中存在于第 二基因座的各个第三等位基因的第三量和各个第四等位基因的第四量。可 按与第一量和第二量相似的方式计算第三量和第四量。

在一些实施方案中,所述量可标准化,例如以测定特定等位基因的百 分比浓度。因此,第一量可对应于带第一等位基因的DNA片段的计数除 以所有第一基因座处DNA片段的总数。可按相似方式确定第二量的标准 化。可使用第二基因座处DNA片段的总数确定第三量和第四量的标准化。

在方框870处,使用四个量确定两个胎儿中母系单倍型的遗传。在一 个实施方案中,然后由测量的四个量确定母系遗传,如下:

(i)当第一量在统计上高于第二量并且第三量在统计上等于第四量时, 两个胎儿均已遗传了第一母系单倍型;

(ii)当第一量在统计上等于第二量并且第四量在统计上高于第三量 时,两个胎儿均已遗传了第二母系单倍型;或

(iii)当第一量在统计上高于第二量时并且当第四量在统计上高于第 三量时,其中一个胎儿已经遗传了第一母系单倍型而另一个已经遗传了第 二母系单倍型。

可通过使用阈值,例如需要规定数量的标准偏差确定量是否在统计上 较高。阈值可取决于仅仅可对所有胎儿和/或单个胎儿计算的胎儿DNA百 分比浓度。

在一个实施方案中,可将第一量直接与第二量减去阈值作比较。以这 种方式,当第一量大于第二量减去阈值时可视两个量之差在统计上较高。

在另一个实施方案中,由第一量和第二量测定参数(例如,差异或比 率),并且将参数与阈值比较以了解第一量是否在统计上高于第二量。对 于统计差异或统计相等性的其它测定,也可以这样做。在一个实施方式中, 用于不同测定的阈值可不同,例如(iii)的阈值需要比(i)和(ii)更低的统计偏 差。

如上所述,如果胎儿DNA的百分比为20%,每个胎儿贡献10%,则 对于(i)和(ii)而言确定统计相等性与统计上更高可区别50%(相等性)和 60%(更高)。因此,如果参数(例如,百分比浓度)大于55%,处于50%和 60%的中间,则用于测定统计上更高的阈值可能为真。也可使用第一量与 第二量的比率,这样将对α类基因座60%为A等位基因的情况提供1.5。

对于(iii)确定统计上更高可区别50%和55%。因此,根据所需灵敏度 和特异性,阈值可介于51-54%之间。也可使用第一量与第二量的比率, 这样将对α类基因座55%为A等位基因的情况提供1.22。

D.使用一种类型的基因座确定母系遗传的方法

在一些实施方案中,仅使用一种类型的基因座。例如,图7A显示了 α类基因座的50%、55%和60%的三种差比。可将比率与不同阈值比较以 区别这些不同分类。

图9是根据本发明的实施方案,使用一种类型的基因座确定母系单倍 型遗传的方法900的流程图。方法900使用来自于包括来自母体和胎儿的 DNA(例如,游离DN)的母体生物样品的数据。

在方框910处,鉴定第一染色体上第一组的一个或多个第一基因座。 在每个第一基因座处母体为各个第一等位基因和各个第二等位基因的杂 合子。第一母系单倍型具有第一等位基因并且第二母系单倍型具有第二等 位基因。可按与方框810相似的方式进行方框910。

在方框920处,确定两个胎儿均从父体遗传了第一基因座处的各个第 一等位基因。可按与方框820相似的方式进行方框920。如上所述,可按 不同顺序进行不同步骤。例如,可在分析母体样品之前、期间或之后获得 亲本基因组的数据并且可使用任何适合的DNA技术(例如,测序或PCR)。

在方框930处,计算机系统测量在母体生物样品的DNA片段中存在 于第一基因座的各个第一等位基因的第一量和各个第二等位基因的第二 量。可按与方框850相似的方式进行方框920。

在方框940处,计算第一量和第二量的比率。所述比率可具有不同形 式。例如,第一量除以第二量;第二量除以第一量;第一量除以第一量和 第二量之和;或第二量除以第一量和第二量之和。

在方框950处,使用所述比率确定两个胎儿中母系单倍型的遗传。在 一个实施方案中,然后由测量的四个量确定母系遗传,如下:

(i)当所述比率大于第一阈值时,将两个胎儿均鉴定为已经遗传了第 一母系单倍型;

(ii)当所述比率小于第二阈值时,将两个胎儿均鉴定为已经遗传了第 二母系单倍型;或

(iii)当所述比率小于第三阈值而大于第四阈值时,将其中一个胎儿鉴 定为遗传了第一母系单倍型而将另一个胎儿鉴定为遗传了第二母系单倍 型,第三阈值小于或等于第一阈值,并且第四阈值大于或等于第二阈值且 小于第三阈值。

可由母体样品中来自于每个胎儿的DNA的相对量或百分比测定用于 这种分析的阈值。阈值可区别不同分类。在图7A的实例中,第一阈值可 在60%和55%之间区别,并且特别地确定是否可将样品分类为遗传HapI 的胎儿。正如为了获得更高特异性可能发生那样,当存在不确定范围时, 第三阈值可小于第一阈值。第二阈值可在50%和55%之间区别,并且特 别地确定是否可将样品分类为遗传HapII的胎儿。正如为了获得更高特 异性可能发生那样,当存在不确定范围时,第四阈值可大于第二阈值。

在一个实施方案中,为了直接由雄性和雌性患者之间共有等位基因的 百分比浓度确定母系遗传,既定两个阈值。存在两个胎儿、一个胎儿或没 有胎儿已经遗传了各个单倍型这三种情况。每种情况均将各自形成具有图 7B所示特性的连锁等位基因的百分比浓度随中值递减的分布。例如,如 果两个胎儿均贡献生物样品中5%的DNA,则三种情况的百分比浓度的中 值将分别为约60%、55%和50%(图7A)。设置阈值以区分所述情况。判 别由两个胎儿而不是一个胎儿遗传的第一或较高阈值将设为约57.5%。判 别由一个胎儿而不是两者都不遗传的第二或较低阈值将设为约52.5%。

可通过为来自于父体的生物样品测序获得父系基因座序列。可通过为 在妊娠之前所取的生物样品,或基本上不含胎儿DNA的生物样品例如放 血组织或毛囊测序获得母系基因组序列。可选地,可通过对妊娠期间所取 的母体血浆或样品的定量评估推断出父本和/或母本基因组的相关部分。

也可根据其与特定染色体区域或存在目标遗传特点的接近度选择用 于分析的基因座。当相互靠近时可选择第一基因座并且将间隔有单倍型, 只要它们之间尚无染色体交叉。使用者可放大或减小分析的染色体区域。 因为母体样品中将有更多DNA相关,所以放大所述区域增加了分析的精 确度。然而,放大所述区域也冒有之间发生交叉事件的风险,在所述情况 下等位基因的遗传不能准确预测单倍型的遗传。

在一个实施方案中,然后按照每个等位基因的计数单独除以所有等位 基因一起的计数,计算每个基因座处等位基因的比率。增加母体样品的读 数数量增加了评估的准确性。可单独分析每个基因座并且例如,如图7B 所示,为达成共识而组合结果。可选地,将所有基因座处的等位基因的计 数总和到一起。

E.向母体血浆中贡献不同量的DNA的胎儿

当孕妇携带双胎胎儿时,两个胎儿可释放不同量的DNA进入母体循 环。因此,来自于两个胎儿的胎儿DNA百分比浓度可以不同。

图10A显示了在两个胎儿均已从母体遗传了HapI时,当胎儿贡献不 同的胎儿DNA百分比时对于α类和β类SNP而言母体血浆中共有等位 基因(A等位基因)的百分比浓度。在该实例中,胎儿1贡献a%并且胎儿2 贡献b%。对于β类基因座而言,因为两个等位基因相等,所以百分比保 持为50%。但是,因为A等位基因更丰富,所以α类基因座的百分比变 化。百分比按照公式F=50%+(a%+b%)/2。

图10B显示了在两个胎儿均已从母体遗传了HapII时,当胎儿贡献 不同的胎儿DNA百分比时对于α类和β类SNP而言母体血浆中共有等 位基因(A等位基因)的百分比浓度。在该实例中,胎儿1贡献a%并且胎 儿2贡献b%。对于α类基因座而言,因为两个等位基因相等,所以百分 比保持为50%。但是,因为A等位基因更丰富,所以β类基因座的百分 比变化。百分比按照公式F=50%+(a%+b%)/2。

图11A显示了在一个胎儿已从母体遗传了HapI并且另一个胎儿从母 体遗传了HapII时,当胎儿贡献不同的胎儿DNA百分比时,对于α类和 β类SNP而言母体血浆中共有等位基因(A等位基因)的百分比浓度。在该 实例中,胎儿1贡献a%并且胎儿2贡献b%。对于两类基因座而言,丰 富的等位基因的百分比随胎儿贡献而变化。对于α类基因座而言,百分 比变为F=50%+a%/2。并且,β类基因座的百分比变为F=50%+b%/2。

图11B显示了使用α类和β类SNP的A等位基因的百分比浓度及三 种情况下,即两个胎儿均已遗传母系HapI,两个胎儿均已遗传母系HapII 和两个胎儿已遗传不同的母系单倍型,这两种浓度的比率的表1150。列 1160显示了与三种情况相对应的α类基因座的共有等位基因A的预期比 率。列1160显示了与三种情况相对应的β类基因座的共有等位基因A的 预期比率。列1180显示了来自于其它列的参数的比率,即α类的值相对 于β类的值的比率。如下一部分中所述,实施方法可使用列1180中的值 测定来自于两类基因座的浓度的比率的阈值。

F.使用比率之比的方法

在一个实施方案中,方法900可使用比率(例如,如同列1180中α类 和β类的比率之比)。例如,方框940中使用的比率可为列1180中的比率。 为使用此类比率,使用两种类型的基因座。另外,可使用列1180中的比 率进行方法800。下面描述了此类方法。

图12是根据本发明的实施方案,使用来自于两种类型的基因座的值 的比率确定母系单倍型遗传的方法1200的流程图。方法1200使用来自于 包括来自母体和胎儿的DNA(例如,游离DN)的母体生物样品的数据。

可按与方法800的方框810-840相同的方式进行方框1210-1240。

在方框1250处,计算在母体生物样品的DNA片段中存在于第一基 因座的各个第一等位基因的第一量与各个第二等位基因的第二量的第一 比率。在一个实施方案中,第一比率为第一量除以第二量。在另一个实施 方案中,第一比率为第一量除以第一量和第二量之和以提供第一等位基因 的百分比浓度。

在方框1260处,计算在生物样品的DNA片段中存在于所述第二基 因座的各个第三等位基因的第三量与各个第四等位基因的第四量的第二 比率。如本文所述,第一、第二、第三和第四量由对生物样品的测量,例 如使用测序或PCR数据获得。

在方框1270处,计算第一比率与第二比率的第三比率。在一个实施 方案中,如图11B所示,第三比率为第三量除以第四量。在另一个实施 方案中,第三比率是第三量除以第三量和第四量之和。

在方框1280处,使用所述比率确定两个胎儿中母系单倍型的遗传。 在一个实施方案中,然后由测量的四个量确定母系遗传,如下:

(i)当第三比率大于第一阈值时,将两个胎儿均鉴定为已经遗传了第 一母系单倍型;

(ii)当第三比率小于第二阈值时,将两个胎儿均鉴定为已经遗传了第 二母系单倍型,第一阈值大于第二阈值;或

(iii)当第三比率小于第三阈值而大于第四阈值时,将其中一个胎儿鉴 定为遗传了第一母系单倍型而将另一个胎儿鉴定为遗传了第二母系单倍 型,第三阈值小于或等于第一阈值,并且第四阈值大于或等于第二阈值且 小于第三阈值。

在一个实施方案中,可通过先确定是第一比率(α类)还是第二比率(β 类)更高,进行方框1280。这样可区别是否两个胎儿均已遗传了HapI或 HapII。这样确定之后,那些选项中仅一个成立。然后,可确定是否第三 比率接近其余两个值。例如,如果a>b,则可确定α类和β类基因座附近 的浓度比率是否更接近两个值中的一个:

(1+a%+b%)或

可使用任何适合的统计检验测定使用的特定阈值或阈值。统计检验, 例如但不限于序贯概率比检验(SPRT)、标准混合模型(McLachlanGand PeelD.Multivariatenormalmixtures.Finitemixturemodels2004:p81-116. JohnWiley&SonsPress)、二项式混合模型和泊松混合模型(McLachlanG andPeelD.Mixtureswithnon-normalcomponents,Finitemixturemodels 2004:p135-174.JohnWiley&SonsPress)均可用于本文所述的方法中。例 如,如果第三比率在统计上不同于以上两个值,则可测定阈值。可选地, 可使用计算机模似来确定哪个真值与检验情况的比值更相适宜(QuJZ等 ClinChem.2013;59:427-35)。

G.临床评估

可通过分析与疾病基因座相关联的染色体区域评估母系遗传性常染 色体疾病。如果两个胎儿均遗传了与疾病等位基因相关联的母系单倍型, 则两个胎儿均将受所述病状影响。如果推断两个胎儿已经遗传了不同的母 系单倍型,则仅其中一个胎儿将受影响。如果两个胎儿均遗传与正常等位 基因相关联的母系单倍型,则两个胎儿均不会受影响。

通过考虑父系单倍型的遗传评估常染色体隐性疾病。如果两个胎儿均 遗传与疾病等位基因相关联的父系单倍型,则根据对母系单倍型遗传的分 析,我们可以确定胎儿是否会受所述病状影响或将为携带者。如果两个胎 儿均遗传正常的父系等位基因,则对母系单倍型遗传的分析可确定胎儿是 否为所述病状的携带者。如果两个胎儿遗传不同的父系单倍型和不同的母 系单倍型,则有50%机会是一个胎儿受影响而另一个正常并且有50%机 会是两个胎儿均为所述病状的携带者。

IV.母体和父体为杂合子

引申开来,上述实施方案背后的原理可应用于其它遗传模式中。如上 所述,两个胎儿可遗传相同的父系遗传性等位基因。并且,即使在父体为 杂合子的情况下也可确定父系遗传性等位基因。例如,可由母体为纯合子 而父体为杂合子的基因座确定父系遗传性等位基因,并且然后可确定单倍 型上其它基因座处的父系遗传性等位基因。但是,一些实施方案可在父系 遗传性等位基因未知时使用。

在一个实施方案中,可使用母系和父系基因型均为A等位基因和B 等位基因的杂合子的基因座确定母系遗传,并且父系遗传性等位基因在所 有胎儿中不相同或未知。测量母体血浆中这两种单倍型的存在将分解为5 个范围。例如,如果两个胎儿各自贡献母体血浆中10%的DNA,则测量 的A等位基因的比例贡献将为约40%(如果两个胎儿均为纯合子B); 45%(如果一个胎儿为纯合子B而另一个为杂合子);50%(如果两个胎儿均 为杂合子或一个为纯合子A而另一个为纯合子B);55%(如果一个胎儿为 纯合子A而另一个为杂合子);和60%(如果二者均为纯合子A)。为区别 5种可能情况,定义了四个截断量。为解决这种复杂性,通常对于血浆样 品而言需要比亲本为纯合子A时更多的DNA读数。

也可在每个基因座存在两个以上等位变体时测定母系遗传。因此,如 果在特定基因座处母系基因型为AB并且父系基因型为CD,则在母体血 浆中测得的DNA的量将这样分解,以致A的比例贡献将分解为40%(如 果两个胎儿均为BC或BD)、45%(如果胎儿为AC或AD连同BC或BD) 和50%(如果两个胎儿均为AC或AD)。如果母系基因型为AB并且父系 基因型为AC,则在母体血浆中测得的DNA的量将分解为5个范围,与 在亲本基因型为AB的情况下在A等位基因方面一样,但是在B等位基 因方面较低。

图13是根据本发明的实施方案,母体和父体为杂合子时,确定在由 雄性受精的雌性的两个胎儿中母系单倍型的遗传的方法1300。方法1300 使用来自于母体的,例如包括雌性和两个胎儿的游离DNA的生物样品。

在方框1310处,鉴定第一染色体上第一组的一个或多个第一基因座。 在每个第一基因座处雌性为各个第一等位基因和各个第二等位基因的杂 合子。第一母系单倍型具有第一等位基因并且第二母系单倍型具有第二等 位基因。在第一基因座处雄性也为杂合子。第一组可为任一类型的基因座。

在方框1320处,测量生物样品的DNA片段中存在于第一基因座处 的各个第一等位基因的第一量。可按与其它测量操作相似的方式进行方框 1320。

在方框1330处,测量生物样品中来自于第一基因座的DNA片段的 第二量。第二量可与位于其中一个第一基因座的任何DNA片段相对应。 指示DNA片段(带任何等位基因)来自于其中一个第一基因座的任何信号 均可用于测定第二量。例如,此类信号可以是与其中一个第一基因座对齐 的序列读数或PCR中与其中一个第一基因座的探针相对应的孔的颜色。

在方框1340处,计算第一量和第二量的比率。例如,如本文所述, 所述比率可为任何定额。

在方框1350处,使用所述比率确定两个胎儿中母系单倍型的遗传。 在一个实施方案中,然后确定母系遗传,如下:

(i)当所述比率大于第一阈值时,将两个胎儿均鉴定为已经遗传了第 一母系单倍型;

(ii)当所述比率小于第二阈值时,将两个胎儿均鉴定为已经遗传了第 二母系单倍型。

可确定其它母系遗传。在一些实施方案中,与以上第一实例中相同, 第一父系单倍型具有第一等位基因并且第二母系单倍型具有第二等位基 因。当所述比率在统计上等于50%时,可将两个胎儿均鉴定为在一个或 多个第一基因座(例如,在域处)为杂合子,或一个胎儿为第一等位基因的 纯合子(例如,AA)而另一个胎儿为第二等位基因的纯合子(例如,BB)。 另一个实例包括当所述比率大于第二阈值(例如,以区别上述实例中的40% 和45%)且小于第三阈值(例如,以区别上述实例中的45%和50%)时,鉴 定在一个或多个第一基因座处一个胎儿为第二等位基因的纯合子(例如, BB)而另一个胎儿为杂合子(例如,AB)。因此,第三阈值小于第一阈值。 另一个实例包括当所述比率小于第一阈值(例如,以区别上述实例中的60% 和55%)并且大于第四阈值(例如,以区别上述实例中的50%和55%)时, 鉴定在一个或多个第一基因座处一个胎儿为第一等位基因的纯合子(例如, AA)而另一个胎儿为杂合子(例如,在域处)。因此,第四阈值大于第三阈 值。

在一些实施方案中,第一父系单倍型具有各个第三等位基因(例如, C)并且第二父系单倍型具有各个第四等位基因(例如,D)。当所述比率小 于第一阈值并且大于第二阈值时,可将一个胎儿鉴定为第一等位基因及第 三或第四等位基因中任一个的杂合子(例如,AC或AD)。可将另一个胎儿 鉴定为第二等位基因及第三或第四等位基因中任一个的杂合子(例如,BC 或BD)。

V.三胞胎

也可根据本发明的原理,在包括两个以上胎儿的妊娠期间解析母系遗 传。例如,考虑到母体为杂合子AB而父体为纯合子AA时的实例,并且 存在三个胎儿(三胞胎),各自在母体血浆样品中贡献10%的DNA。A的 比例贡献将分解为50%(如果三个胎儿均为杂合子);55%(如果两个为杂合 子而一个为纯合子A);60%(如果一个为杂合子而两个为纯合子A);及 65%(如果三个胎儿均为纯合子A)。对于多于两个的多胎妊娠而言,通常 对于血浆样品而言需要更多DNA读数以提供充分的分辨度。

因此,在一个实施方案中,当第一量在统计上等于第二量(例如,所 述比率~50%的值)时,将三个胎儿鉴定为在所述一个或多个第一基因座处 为杂合子。当所述比率小于第三阈值(例如,以区别60%和55%)并且大于 第四阈值(例如,以区别50%和55%)时,可鉴定在所述一个或多个第一基 因座处两个胎儿为杂合子而一个胎儿为第一等位基因的纯合子。当所述比 率大于第一阈值(例如,以区别60%和55%)并且小于第五阈值(例如,以 区别65%和60%)时,可鉴定在所述一个或多个第一基因座处两个胎儿为 第一等位基因的纯合子而一个胎儿为杂合子。当所述比率大于第五阈值时, 可鉴定三个胎儿全部为第一等位基因的纯合子。

VI.实施例

以下部分提供了说明本发明的一些原理的非限制性工作实例。

A.从双卵性双胎获得并测量DNA

经知会同意,在香港威尔斯亲王医院妇产科(DepartmentofObstetrics andGynaecologyofthePrinceofWalesHospital,HongKong)征募两名各自 双胎妊娠的孕妇。在怀孕21周和25周采集血样。分娩后单独地从每个胎 儿采集脐带血。这项研究经香港中文大学-新界东医院联网临床研究伦理 联席委员会(JointChineseUniversityofHongKong–HospitalAuthorityNew TerritoriesEastClusterClinicalResearchEthicsCommittee)批准。

在4℃下1,600g离心母体血样10分钟。在4℃下16,000g再次离心血 浆部分10分钟以去除任何残留的血细胞。在室温下2,500g离心血细胞部 分5分钟以去除任何残留的血浆。用DSPTMDNABloodMiniKitTM(Qiagen) 提取血浆DNA。用QIAampTMDNABloodMiniKitTM(Qiagen)提取脐带血 DNA。用AffymetrixTM基因组-全人类SNP阵列6.0SystemTM(Affymetrix) 为从脐带血样品中提取的基因组DNA进行基因型分析。通过基因型分析 确认每位受试者中两对双胞胎均为双卵性。

用双末端样品制备试剂盒TM(Illumina)构建血浆DNA测序库。使用约 30ng的DNA制备每个库。然后使用定制设计的SureSelectTarget EnrichmentSystemTM(AgilentTechnologies)使这些库进行靶标富集。捕获 库覆盖分布于14条染色体(chr)上的5.5Mb基因组区域,如下:chr1(0.33 Mb)、chr2(0.30Mb)、chr3(0.62Mb)、chr4(0.32Mb)、chr5(0.33Mb)、chr7 (0.31Mb)、chr8(0.62Mb)、chr9(0.31Mb)、chr13(0.30Mb)、chr15(0.33Mb)、 chr17(0.66Mb)、chr19(0.35Mb)、chr20(0.34Mb)和chr22(0.30Mb)。

在Hi-Seq2000测序仪(Illumina)上通过标准双末端方法(Illumina)为所 述库测序,每个末端的读数长度为50bp。用测序流动池的2个泳道为每 个库测序。使用SOAP2算法将所有序列读数与重复序列未屏蔽的人类参 考基因组(Hg18)比对。

通过母体血浆中父系遗传性胎儿等位基因的百分比浓度测定胎儿 DNA的百分比浓度。根据母体血浆中有两个不同等位基因的任何SNP基 因座处其作为次要等位基因的存在,鉴定父系遗传性胎儿等位基因。

根据母体血浆中父系遗传性胎儿等位基因的百分比浓度的分布,估计 母体血浆中胎儿DNA的总百分比浓度。对于情况1和2而言,测定胎儿 DNA百分比浓度分别为22.6%和30.6%。使用所有信息基因座处胎儿DNA 百分比浓度的分布测定单个双胎胎儿对母体血浆DNA的贡献。

B.分析与结论

用于这种分析目的的信息基因座是母体为纯合子但是至少一个胎儿 为杂合子并且已经从父体遗传了不同等位基因的那些SNP基因座。对于 情况1而言,母体血浆中两个胎儿贡献的胎儿DNA百分比浓度为10%和 11.6%。对于情况2而言,母体血浆中两个胎儿贡献的胎儿DNA百分比 浓度为12.4%和18.2%。

对每位孕妇,进行RHDO分析以确定两个胎儿已经遗传了相同还是 不同的母系单倍型。在本实施例中使用位于染色体4长臂上的区域说明 RHDO分析。根据胎儿脐带血的基因型分析,对于情况1的该区域而言, 两个胎儿已经遗传了不同的母系单倍型。对于情况2而言,两个胎儿已经 遗传了相同的母系单倍型。使用家系分析确定父系基因型。在这项RHDO 分析中,仅使用母体为杂合子而父体为纯合子的SNP基因座。在其它实 施方案中,当确定了父系单倍型的遗传时,母体和父体均为杂合子的SNP 基因座也可用于RHDO分析。

在这项分析中,使用概率比阈值确定使用α类和β类SNP(α/β比率) 测定的百分比浓度是否与双胎胎儿的哪个母系单倍型遗传模式最相适宜。 对于每种情况而言,根据两个胎儿的百分比浓度对α/β比率进行模拟分析。 在二项式分布中生成5,000个数据点以模拟对于α类SNP和β类SNP而 言共有等位基因的百分比浓度分布的序列读数。确定了对于(a)两个胎儿 均已遗传了相同母系单倍型,或(b)两个胎儿已遗传了不同母系单倍型的 情况而言,α/β比率的分布。

图14A和14B分别显示了情况1和情况2的预期α/β比率的分布。 根据两种可能遗传模式的α/β比率的预期分布,测定截断量以辨别两个胎 儿已经遗传了相同还是不同的母系单倍型。在该特定实施例中,使用1200 的让步比计算上下限阈值。α/β比率大于上限阈值表明两个胎儿已经遗传 了相同母系单倍型并且α/β比率小于下限阈值表明两个胎儿已经遗传了 不同母系单倍型。对于情况1而言,由模拟分析推断的上下限阈值分别为 1.113和1.098。对于情况2而言,由模拟分析推断的上下限阈值分别为 1.170和1.158。

图15是显示了情况1的染色体4长臂上染色体片段的RHDO分析的 表1500。因为这种分析的统计功效取决于分析的序列读数的数量,所以 将5,000用作分类区段中序列读数数量的阈值要求。换言之,每个RHDO 分类区段中SNP的数量将可变并且在分析中这些SNP基因座的总测序读 数将大于5,000。对于第一RHDO分类区段而言,测定α/β比率为0.97837, 比由模拟分析推断的下限阈值1.098小。

这个结果是对于该区域而言,两个胎儿已经遗传了两个不同的母系单 倍型。第一分类区段下游的SNP用于进一步RHDO分析并且结果表明两 个胎儿遗传不同的母系单倍型。该区域内总计9个RHDO分类区段显示 相同结论。通过两个胎儿的基因型结果确认这些结果正确。

图16是显示了情况2的染色体4长臂上染色体片段的RHDO分析的 表1600。对于RHDO分类区段1,测定α/β比率为1.299,比由模拟分析 推断的上限阈值1.170大。

这个结果表明对于该区域而言,两个胎儿已经遗传了相同的母系单倍 型。另外,使用α类SNP测定的百分比浓度高于使用β类SNP测定的百 分比浓度。这表明两个胎儿已经遗传了母系HapI(图10A)。

第一分类区段中所述区域下游的SNP用于进一步RHDO分析并且该 区域内总计9个RHDO分类区段显示相同结论。通过两个胎儿的基因型 结果确认这些结果正确。

VII.计算机系统

本文提到的任何计算机系统均可利用任何适合数量的子系统。图17 中显示了计算机设备10中此类子系统的实例。在一些实施方案中,计算 机系统包括单台计算机设备,其中所述子系统可为所述计算机设备的组件。 在其它实施方案中,计算机系统可包括多台计算机设备,每一台均为带内 部组件的子系统。

图17所示的子系统经由系统总线75相连。显示了附加子系统,例如 打印机74、键盘78、存储设备79、耦合至显示适配器82的监控器76等。 耦合至I/O控制器71的外围设备和输入/输出(I/O)设备可通过本领域中已 知的任何数量的装置,例如输入/输出(I/O)端口977(例如,USB、) 连接到计算机系统。例如,I/O端口77或外部接口81(例如以太网(Ethernet)、 Wi-Fi等)可用于将计算机系统10连接到广域网例如互联网、鼠标输入设 备或扫描仪。经由系统总线75互连允许中央处理器73与每个子系统通信 并且控制来自于系统存储器72或存储设备79(例如,硬盘(例如硬盘驱动 器或光盘))的指令的执行,以及子系统间信息的交换。系统存储器72和/ 或存储设备79可具体化计算机可读介质。本文提到的任何数据均可从一 个组件输出到另一个组件并且可输出给用户。

计算机系统可包括,例如通过外部接口81或通过内部接口连接在一 起的多个相同组件或子系统。在一些实施方案中,计算机系统、子系统或 设备可通过网络通信。在此类情况下,将一台计算机视为客户端而将另一 台计算机视为服务器,其中每一台均可为相同计算机系统的一部分。客户 端和服务器各自可包括多个系统、子系统或组件。

应理解可呈控制逻辑形式,使用硬件(例如专用集成电路)和/或使用计 算机软件,用一般可编程的处理器以模块化或集成方式执行本发明的任何 实施方案。如本文所使用,处理器包括相同集成芯片上的多核处理器,或 单一电路板上或联网的多个处理单元。根据本文提供的公开内容和教导, 本领域中的普通技术人员将了解并认识到使用硬件及硬件和软件的组合 执行本发明的实施方案的其它方式和/或方法。

本申请中描述的任何软件组件或功能均可作为将由处理器执行的软 件代码,使用任何适合的计算机语言,例如Java、C、C++、C#或脚本语 言例如Perl或Python,使用例如常规或面向对象的技术实现。软件代码 可作为一系列指令或命令存储在用于存储和/或传输的计算机可读介质上, 适合的介质包括随机存取存储器(RAM)、只读存储器(ROM)、磁介质(例 如硬盘驱动器或软盘)或光学介质(例如光盘(CD)或数字多用盘(DVD))、闪 速存储器等。计算机可读介质可为此类存储或传输设备的任何组合。

此类程序也可使用适于经由与各种协议相符的有线、光纤和/或无线 网络,包括互联网传输的载波信号编码和传输。同样,可使用用此类程序 编码的数据信号产生根据本发明实施方案所述的计算机可读介质。用程序 代码编码的计算机可读介质可与兼容设备一起包装或与其它设备分开(例 如,经由互联网下载)提供。任何此类计算机可读介质均可存在于单个计 算机产品(例如硬盘驱动器、CD或整个计算机系统)上或内部,并且可存 在于系统或网络内的不同计算机产品上或内部。计算机系统可包括监控器、 打印机,或用于为用户提供本文提到的任何结果的其它适合显示器。

可用包括可配置用于进行所述步骤的一个或多个处理器的计算机系 统完全或部分地进行本文所述任何方法。因此,实施方案可涉及配置用于 进行本文所述任何方法的步骤的计算机系统,可能有进行各个步骤或各组 步骤的不同组件。虽然作为编号步骤呈现,但是本文方法的步骤可同时或 按不同顺序进行。另外,这些步骤中的一部分可与来自于其它方法的其它 步骤中的一部分一起使用。同样,整个步骤或一部分可任选。另外,任何 方法的任何步骤均可用用于进行这些步骤的模块、电路或其它装置进行。

在不背离本发明实施方案的精神和范围的前提下,特定实施方案的具 体细节可以任何适合方式组合。然而,本发明的其它实施方案可涉及关于 每个单独方面或这些单独方面的特定组合的特定实施方案。

为了说明和描述的目的,已经提出了以上对本发明示例性实施方案的 描述。其并非旨在详尽无遗或将本发明限于所述精确形式,并且根据以上 教导许多修改和变化是可能的。选择并描述实施方案以便最好地解释本发 明的原理及其实际应用,从而使得本领域中的其它技术人员能够最好地将 本发明用于不同实施方案中并且做出适于预期特定用途的各种修改。

除非明确指出相反,则叙述“一种”、“一个”或“所述”旨在意为“一个 或多个”。

本文提到的所有专利、专利申请、出版物和描述均以引用的方式整体 并入用于所有目的。没有承认为现有技术。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号