首页> 中国专利> 芸苔属基因组测定

芸苔属基因组测定

摘要

本发明描述了用于检测、鉴定和定量芸苔属A基因组DNA的方法和组合物。所述方法是芸苔属A基因组特异性的、并且不与能造成卡诺拉种植地污染的其他芸苔属物种、作物或近缘杂草交叉反应。

著录项

  • 公开/公告号CN104334743A

    专利类型发明专利

  • 公开/公告日2015-02-04

    原文格式PDF

  • 申请/专利权人 纳幕尔杜邦公司;

    申请/专利号CN201380026343.9

  • 发明设计人 M.C.哈蒙;N.L.亨德森;C.X.钟;

    申请日2013-05-23

  • 分类号C12Q1/68;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人邹雪梅

  • 地址 美国特拉华州威尔明顿

  • 入库时间 2023-12-17 03:57:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    专利权的转移 IPC(主分类):C12Q 1/68 专利号:ZL2013800263439 登记生效日:20220906 变更事项:专利权人 变更前权利人:纳幕尔杜邦公司 变更后权利人:科迪华农业科技有限责任公司 变更事项:地址 变更前权利人:美国.特拉华州.威尔明顿 变更后权利人:美国印第安纳州

    专利申请权、专利权的转移

  • 2017-05-03

    授权

    授权

  • 2015-06-17

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20130523

    实质审查的生效

  • 2015-02-04

    公开

    公开

说明书

技术领域

本公开整体涉及植物分子生物学。更具体地,其涉及芸苔属 (Brassica)基因组DNA的检测。

背景技术

芸苔属(Brassica)物种被用作植物油、动物饲料、蔬菜和调味品的来 源。用于蔬菜生产的芸苔属(Brassica)植物包括卷心菜、菜花、西兰花、 羽衣甘蓝、大头菜、芥菜和芜菁甘蓝。然而,在世界范围内,芸苔属 (Brassica)物种最重要的经济用途是生产种子来源的植物油。种植用于油 生产的主要芸苔属(Brassica)物种是油菜(B.napus),之后是芥菜(B. juncea)和芜菁(B.rapa)。油菜(B.napus)、芥菜(B.juncea)和芜菁 (B.rapa)的种子被称为油菜籽。主要种植用于油生产的芸苔属 (Brassica)物种通常被称为油料种子油菜。在北美,卡诺拉(一种油料种 子油菜类型,选择它是因为种子中芥酸和芥子油甙水平低)是种植的主要 芸苔属(Brassica)植物,用于生产人们食用的植物油。

卡诺拉包括三种油料种子芸苔属(Brassica)物种(油菜(B. napus)、芜菁(B.rapa)、芥菜(B.juncea)),全世界种植超过8千万 英亩。卡诺拉是芸苔属(Brassica)植物的成员,芸苔属(Brassica)植物 包括多种商业化种植的植物物种。

目前全世界正在培育转基因卡诺拉作为解决农业生产问题的方法。随 着转基因卡诺拉和其他转基因作物的发展,各国已经制订法规以鉴定转基 因材料和其衍生产品。由于其定量和定性的可靠性,聚合酶链反应 (PCR)方法已被普遍接受作为转基因检测所选方法。这种方法通常需要 对转基因和相对应的参照基因进行扩增和检测,并且比较转基因的数量和 参照基因的数量。这种系统需要对转基因特异性的一组两个引物和检测探 针,以及另一组针对内源性参照基因的物种特异性的引物和探针。

出于标记和可追踪的目的,已经开发了转基因检测测定以满足各国的 需要。欧盟法规619/2011规定了检测方法的结果表示为相对于分类单元特 异性参照系统的转基因质量分数。为了产生稳定的测试结果,对于“分类 单元”特异性的实时PCR测定的靶标需要不仅是分类单元特异性的,而且 是在不同遗传背景下定量稳定的。

在大多数作物中,用于开发特异性PCR测定的靶标物种是独特的,诸 如用于玉米(Zea mays)、大豆(Glycine max)、和水稻(Oryza  sativa)。例如,在玉米(玉米(Zea mays))技术领域,没有其它紧密相 关的类似玉蜀黍属(Zea)物种交叉污染玉米(Zea mays)地,从而使玉米 转基因的定量复杂化。然而,卡诺拉是很不一样的。

U的三角形(图1)描绘了油菜(B.napus)、芜菁(B.rapa)、芥菜 (B.juncea)和三种其它芸苔属(Brassica)物种之间的进化和关系 (Nagaharu U(1935)Genome analysis in Brassica with special reference to  the experimental formation of B.napus and peculiar mode of fertilization.Japan. J.Bot 7:389-452)。通过进化,3个基础物种(黑芥(B.nigra)、甘蓝(B. oleracea)和芜菁(B.rapa))混合以形成三种异源四倍体物种(埃塞俄比 亚芥(B.carinata)、油菜(B.napus)和芥菜(B.juncea))。在卡诺拉存 在的情况下,这三个物种(芥菜(B.juncea),油菜(B.napus)和芜菁 (B.rapa)共享A-基因组(图1)。

如果能证明内源性系统特异性检测A-基因组,将为多种应用(包括在 芥菜(B.juncea)、油菜(B.napus)和芜菁(B.rapa)中转基因卡诺拉的 相对定量)提供内源性参照系统。例如,当前最多的商业转基因卡诺拉是 油菜(B.napus),然而,A-特异性的内源性参照系统可用于针对其他两个 物种(芜菁(B.rapa)和芥菜(B.juncea)的未来转基因的检测方法。除了 能够检测芜菁(B.rapa)、油菜(B.napus)和芥菜(B.juncea)的宽泛的 品种范围,在此类交叉检测降低了该测定精确度的情况下,该测定一定无 法检测可能污染卡诺拉谷物或其他主要作物的黑芥(B.nigra)、埃塞俄比 亚芥(B.carinata)、甘蓝(B.oleracea)和其它相关物种。更有甚者,其 他密切相关的芸苔属(Brassica)近种会污染卡诺拉种植地,包括但不限于 亚麻荠(Camelina sativa)、菥蓂(Thlaspi arvense)、狗芥(Erucastrum  gallicum)、野萝卜(Raphanus raphanistrum)、萝卜(Raphanus sativus) 和野芥(Sinapis arvensis)。对于卡诺拉而言,从标记和可追溯性的角度 看,挑战是对于构成卡诺拉作物的物种是特异性的实时PCR测定方法的鉴 定。

当前存在若干内源性参照系统用于使用实时PCR测量经基因修饰的卡 诺拉的相对百分比。然而,这些系统不是可靠的内源性参照系统(Wu等 人,(2010)Comparison of Five Endogenouse Reference Genes for Specific  PCR Detection and Quantification of Brassica napus,J.Agric.Food Chem,58: 2812-2817)。它们不是针对分类单元或感兴趣的作物特异性的,并且它们 也未显示出在分类单元或作物内横跨全部代表性的样品的稳定性。

本公开涉及芸苔属(Brassica)A-基因组特异性的、并且与能造成卡诺 拉种植地污染的其他芸苔属(Brassica)物种、作物或近缘杂草没有显著交 叉反应的检测和量化方法。此外当测试来自各种不同地理区域的多个品种 的样品时,该内源性靶标在三个A-基因组物种中的每个内是稳定的。

发明内容

本文提供了用于检测、鉴定和定量芸苔属(Brassica)A基因组DNA 的组合物和方法。

第一方面特征为检测并定量样品中芸苔属(Brassica)A基因组DNA 的量。该方法包括特异性扩增芸苔属(Brassica)A基因组的基因组DNA 片段(其中所述扩增DNA片段包含选自SEQ ID NO:25、26、27、28和35 的基因组区域的核苷酸序列中的至少一个)以及从芸苔属(Brassica)A基 因组的扩增片段检测并定量芸苔属(Brassica)A基因组。

在一个实施例中,芸苔属(Brassica)A基因组的所述扩增片段包含 SEQ ID NO:29、30、或31中的至少一个的核苷酸序列,所述核苷酸序列 选自约50至约核苷酸位点400、50至约核苷酸位点100、50至约核苷酸位 点350、400至约核苷酸位点350、400至约核苷酸位点200、以及400至约 核苷酸位点100的核苷酸位点。

在一个实施例中,芸苔属(Brassica)A基因组的所述扩增片段包含 (i)SEQ ID NO:29、30、或31中的至少一个的核苷酸序列,或(ii)SEQ  ID NO:29、30、或31中的至少一个的核苷酸序列,其中所述核酸片段选自 SEQ ID NO:29、30、或31的以下核苷酸位点:约50至约核苷酸位点 400、50至约核苷酸位点100、50至约核苷酸位点350、400至约核苷酸位 点350、400至约核苷酸位点200、以及400至约核苷酸位点100的核苷酸 位点。

在一个实施例中,使用包含选自SEQ ID NO:17、18、19、20、21、 22、23、和24的核苷酸序列的引物对进行所述扩增。

在一个实施例中,所述基因组DNA包含FatA基因。

在其它实施例中,所述扩增基本上不扩增芸苔属(Brassica)B基因组 DNA和C基因组DNA。

另一方面特征在于确定样品中芸苔属(Brassica)转基因事件的相对量 的方法。所述方法包括进行芸苔属(Brassica)A基因组特异性聚合酶链反 应,其中所述分析具体包括扩增芸苔属(Brassica)A基因组的基因组 DNA片段,其中所述扩增DNA片段包含选自SEQ ID NO:25、26、27、 28、和35的基因组区域的核苷酸序列中的至少一个;确定样品中芸苔属 (Brassica)A基因组DNA的总量;针对转基因事件进行事件特异性测定 以确定样品中所述转基因事件的量;以及,将所述转基因事件DNA的量与 所述样品中芸苔属(Brassica)A基因组DNA的总量进行比较。

在一个实施例中,所述芸苔属(Brassica)A基因组的扩增片段包含从 核苷酸位点约50至约400的SEQ ID NO:29、30、或31中至少一个的核苷 酸序列。

在一个实施例中,使用包含选自SEQ ID NO:17、18、19、20、21、 22、23、和24的核苷酸序列的引物对进行所述扩增。

在其它实施例中,所述基因组DNA包含FatA基因。

在一个实施例中,所述扩增基本上不扩增芸苔属(Brassica)B基因组 DNA和C基因组DNA。

另一方面特征在于确定样品中芸苔属(Brassica)转基因事件的偶然存 在的方法。所述方法包括获取怀疑包含芸苔属(Brassica)转基因事件的样 品;使用引物进行芸苔属(Brassica)A基因组特异性聚合酶链反应,其中 所述引物结合至芸苔属(Brassica)A基因组的基因组区域,所述基因组区 域选自从核苷酸位点约50至约400的SEQ ID NO:29、30、或31中的至少 一个的核苷酸序列;确定所述样品中芸苔属(Brassica)A基因组DNA的 总量;针对转基因事件进行事件特异性定量测定以确定样品中所述转基因 事件DNA的量;以及,将所述转基因事件的量与所述样品中芸苔属 (Brassica)的总量进行比较。

在一个实施例中,所述引物选自SEQ ID NO:17、18、19、20、21、 22、23、和24。

另一个方面特征在于扩增子,所述扩增子包含选自SEQ ID NO:25、 26、27、28、和35的基因组区域的核苷酸序列中的至少一个,其中所述扩 增子不长于500碱基对。

另一个方面特征在于寡核苷酸,所述寡核苷酸包含选自SEQ ID NO: 17、18、19、20、21、22、23、和24的核苷酸序列,其中所述寡核苷酸为 约15-500核苷酸。

另一个方面特征在于检测试剂盒,所述检测试剂盒包含寡核苷酸和一 种或更多种反应组分以进行定量反应,所述寡核苷酸包含选自SEQ ID NO: 17、18、19、20、21、22、23、和24的核苷酸序列,其中所述寡核苷酸是 少于约50核苷酸。

另一个方面特征在于确定芸苔属(Brassica)性状的性状纯度的方法。 所述方法包括获得芸苔属(Brassica)性状的样本;以及通过特异性扩增芸 苔属(Brassica)A基因组的基因组DNA片段进行芸苔属(Brassica)A基 因组特异性测定,其中所述扩增DNA片段包含选自SEQ ID NO:25、26、 27、28、和35的基因组区域的核苷酸序列中的至少一个、以及从芸苔属 (Brassica)A基因组的扩增片段检测并定量芸苔属(Brassica)A基因 组。

在一个实施例中,所述性状选自RT73、RT200、MON88302、DP- 073496、HCN92、T45(HCN28)、23-18-17、23-198、OXY-235、MS1、 MS3、MS6、MS8、RF1、RF2、RF3、和Topas 19/2。

在一个实施例中,所述确定包括进行定量聚合酶链反应。

另一个方面特征在于建立芸苔属(Brassica)种子批的纯度,所述方法 包括进行聚合酶链反应,其中所述寡核苷酸引物或探针能够将芸苔属 (Brassica)A基因组与芸苔属(Brassica)B和C基因组区域区分开,其 中所述寡核苷酸引物和/或探针结合至芸苔属(Brassica)A基因组的靶区 域,所述靶区域包含选自SEQ ID NO:25、26、27、28、和35的核苷酸序 列。

在一个实施例中,所述寡核苷酸引物和/或探针包含选自SEQ ID NO: 19、20、21、22、23、和24的核苷酸序列。

另一个方面特征在于对芸苔属(Brassica)样品中转基因元件的定量方 法。所述方法包括进行聚合酶链反应,其中所述寡核苷酸引物或探针能够 将芸苔属(Brassica)A基因组与芸苔属(Brassica)B和C基因组区域区 分开,所述寡核苷酸引物或探针结合至芸苔属(Brassica)A基因组的靶区 域,所述靶区域包含选自SEQ ID NO:29、30、和31的核苷酸序列;进行 转基因元件特异性定量聚合酶链反应;以及,通过与样品中芸苔属 (Brassica)A基因组DNA的量进行比较,确定卡诺拉样品中存在的转基 因元件的量。

另外的方面特征在于确定怀疑包含芸苔属(Brassica)A基因组的种子 样品的种子纯度。所述方法包括特异性扩增芸苔属(Brassica)A基因组的 基因组DNA,其中所述扩增DNA包含选自SEQ ID NO:25、26、27、28 和35的基因组区域的核苷酸序列中的至少一个;以及,基于存在或不存在 芸苔属(Brassica)A基因组来确定所述种子样品的纯度。

在其它实施例中,所述种子样品包括西兰花、抱子甘蓝、芥菜种子、 菜花、散叶甘蓝、卷心菜、羽衣甘蓝、大头菜、芥菜或芜菁甘蓝中的至少 一种。

在其它实施例中,所述种子样品包括但不限于西兰花、抱子甘蓝、芥 菜种子、菜花、散叶甘蓝、卷心菜、羽衣甘蓝、大头菜、芥菜或芜菁甘 蓝。

另一个方面特征在于确定芸苔属(Brassica)A基因组的存在和/或量 的方法。所述方法具体包括将芸苔属(Brassica)A基因组的DNA与探针 杂交(其中所述探针选择性地结合至选自SEQ ID NO:25、26、27、28、和 35的基因组区域的核苷酸序列中的至少一个,任选地在高严格性条件 下);以及,检测芸苔属(Brassica)A基因组的存在和/或量。

在一个实施例中,所述探针结合至芸苔属(Brassica)A基因组的基因 组区域,所述基因组区域选自SEQ ID NO:29、30、或31中的至少一个的 核苷酸序列从核苷酸位点约50至约400。

在另一个实施例中,所述探针包含SEQ ID NO:19、20、21、22、23 或24的核苷酸序列。

另一个方面特征在于对芸苔属(Brassica)A基因组的区域测序的方 法。所述方法包括获得DNA样品;以及,进行所述DNA样品的测序反 应,其中所述被测序区域包含选自SEQ ID NO:25、26、27、28和35的基 因组区域的核苷酸序列中的至少一个。

相比于检测其他基因组(例如,芸苔属(Brassica)B和芸苔属 (Brassica)C基因组)的基因组DNA,本文所公开的方法和组合物对芸苔 属(Brassica)A基因组进行区分检测。

附图说明以及序列表

根据以下的详细描述和附图以及序列表,可以更全面地理解本公开, 以下的详细描述和附图以及序列表形成本申请的一部分。此序列表中以一 个字母代码表示核苷酸序列字符,以三个字母代码表示氨基酸,如Nucleic  Acids Research 13:3021-3030(1985)和Biochemical Journal 219(No. 2):345-373(1984)所描述的IUPAC-IUBMB标准中所规定,它们全文 以引用方式全文并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵 循37C.F.R.§ 1.822所示的规定。

图1显示了“U”的三角形,其描绘了芸苔属(Brassica)的不同植物 物种之间的关系(Nagaharu U(1935)Genome analysis in Brassica with  special reference to the experimental formation of B.napusand peculiar mode of  fertilization.Japan.J.Bot 7:389-452)。染色体的数量用n表示。黑芥(B. nigra)、甘蓝(B.oleracea)、和芜菁(B.rapa)是三种基础物种。异源四 倍体物种是埃塞俄比亚芥(B.carinata)、芥菜(B.juncea)和油菜(B. napus)。

图2-A显示了FatA的六个共有序列的进化关系。

图2-B显示了53个测序品种分组至所述六个共有序列中。

图3显示了所述FatA共有序列的比对结果。圆圈显示了A-特异性的 区域或碱基。灰色加亮的碱基显出了用于FatA(A)实时PCR测定的引物 和探针的位置。从左至右:第一、第二和第三高亮区分别表示正向引物、 探针和反向引物。带下划线的碱基显示在共有序列内的多义位点。在图中 比对的序列是A1序列(SEQ ID NO:29)、A3(SEQ ID NO:31)、A2 (SEQ ID NO:30)、B(SEQ ID NO:32)、C2(SEQ ID NO:34)和C1 (SEQ ID NO:33)。

序列描述以及所附序列表遵循如37C.F.R.§1.821-1.825所列出的关于 专利申请中核苷酸和/或氨基酸序列公开的规定。此序列表中以单个字母代 码表示核苷酸序列,以三个字母代码表示氨基酸,如Nucleic Acids Res. 13:3021-3030(1985)和Biochemical J.219(2):345-373(1984)中所述 IUPAC-IUBMB标准所定义,它们以引用方式并入本文。用于核苷酸和氨 基酸序列数据的符号和格式遵循如37C.F.R.§1.822所示的规定。

SEQ ID NO:1是来自甘蓝型油菜(Brassica napus)的FatA-A1共有核 苷酸序列。用于生成SEQ ID NO:1的品种包括45H73、NS1822BC、 46A76、NS5536BC、43A56、NW1717M、NW4219BC、NW4201BC、 436554、458967、531273、458941、469735、458605、305278和633153。

SEQ ID NO:2是来自芜菁(Brassica rapa)的FatA-A1.2共有核苷酸序 列。用于生成SEQ ID NO:2的品种包括Tobin、257229、163496、649190 和390962。

SEQ ID NO:3是来自芥菜(Brassica juncea)的FatA-A1.3共有核苷酸 序列。用于生成SEQ ID NO:3的品种包括JS0917BC、JS0936BC、 JS1056BC、JS1260MC、JS1432MC、418956、458942、603011和649156。

SEQ ID NO:4是来自甘蓝型油菜(Brassica napus)的FatA-A2.1共有 核苷酸序列。用于生成SEQ ID NO:4的品种包括458954、469735和 311729。

SEQ ID NO:5是来自芜菁(Brassica rapa)的FatA-A2.2共有核苷酸序 列。用于生成SEQ ID NO:5的品种包括163496、347600、346882和 390962。

SEQ ID NO:6是来自芜菁(Brassica rapa)的FatA-A2.3共有核苷酸序 列。用于生成SEQ ID NO:6的品种包括Reward。

SEQ ID NO:7是来自芜菁(Brassica rapa)的FatA-A3.1共有核苷酸序 列。用于生成SEQ ID NO:7的品种包括Tobin、Klondike、Reward、 41P95、257229、649159、163496和649190。

SEQ ID NO:8是来自芥菜(Brassica juncea)的FatA-B.1共有核苷酸 序列。用于生成SEQ ID NO:8的品种包括JS0879BC、JS0917BC、 JS0936BC、JS1056BC、JS1260MC、JS1432MC、418956、458942、603011 和649156。

SEQ ID NO:9是来自埃塞俄比亚芥(Brassica carinata)的FatA-B.2共 有核苷酸序列。用于生成SEQ ID NO:9的品种包括649155和597822。

SEQ ID NO:10是来自黑芥(Brassica nigra)的FatA-B.3共有核苷酸 序列。用于生成SEQ ID NO:10的品种包括273638和633142。

SEQ ID NO:11是来自甘蓝型油菜(Brassica napus)的FatA-C1.1共有 核苷酸序列。用于生成SEQ ID NO:11的品种包括45H73、NS1822BC、 46A76、NS5536BC、46A56、NW1717M、NW4219BC、NW4201BC、 436554、458967、458954、531273、458941、469735、458605、311729、 305278和633153。

SEQ ID NO:12是来自甘蓝(Brassica oleracea)的FatA-C1.2共有核苷 酸序列。用于生成SEQ ID NO:12的品种包括28888、29800、365148、 29790、28852和30862。

SEQ ID NO:13是来自甘蓝(Brassica oleracea)的FatA-C1.3共有核苷 酸序列。用于生成SEQ ID NO:13的品种包括32550。

SEQ ID NO:14是来自甘蓝(Brassica oleracea)的FatA-C2.1共有核苷 酸序列。用于生成SEQ ID NO:14的品种包括249556、29041、29800、 30862、30724和32550。

SEQ ID NO:15是来自埃塞俄比亚芥(Brassica carinata)的FatA-C2.2 共有核苷酸序列。用于生成SEQ ID NO:15的品种包括649155和597822。

SEQ ID NO:16是来自芥菜(Brassica juncea)的FatA-其他共有核苷酸 序列。用于生成SEQ ID NO:16的品种包括JS1260MC。

SEQ ID NO:17是09-0-2812引物,用于从来自“U”的三角形中的六 个芸苔属(Brassica)物种的若干品种中PCR出约500碱基的产物。09-0- 2812对应于芥菜(Brassica juncea)的Genbank FatA序列(登录号 AJ294419)的1500-1530(5′至3′)位点。

SEQ ID NO:18是09-0-2813引物,用于从来自“U”的三角形中六个 芸苔属(Brassica)物种的若干品种中PCR出约500碱基的产物。09-0- 2813对应于芥菜(Brassica juncea)的Genbank FatA序列(登录号 AJ294419)的2226-2197(5′至3′)位点。

SEQ ID NO:19是09-0-3249测定引物,用于A-特异性实时PCR测 定。

SEQ ID NO:20是09-0-3251FatA A-基因组特异性实时PCR测定引 物。

SEQ ID NO:21是09-QP87引物,用于FatA A-基因组特异性实时PCR 测定。

SEQ ID NO:22是11-0-4046FatA-A-基因组特异性的基于凝胶的PCR 测定引物。11-0-4046对应于甘蓝型油菜(Brassica napus)Genbank FatA序 列(登录号X87842)的位点1782-1813(5′至3′)。11-0-4046对应于芥菜 (Brassica juncea)Genbank FatA序列(登录号AJ294419)的位点62-93 (5′至3′)。

SEQ ID NO:23是11-0-4047FatA的基于凝胶的PCR测定引物。11-0- 4047对应于甘蓝型油菜(Brassica napus)Genbank FatA序列(登录号 X87842)的位点2001-1971(5′至3′)。11-0-4047对应于芥菜(Brassica  juncea)GenBank FatA序列(登录号AJ294419)的位点279-252(5′至 3′)。

SEQ ID NO:24是11-0-4253FatA的基于凝胶的PCR测定引物。11-0- 4253对应于甘蓝型油菜(Brassica napus)Genbank FatA序列(登录号 X87842)的位点1918-1889(5′至3′)。11-0-4253对应于芥菜(Brassica  juncea)Genbank FatA序列(登录号AJ294419)的位点196-167(5′至 3′)。

SEQ ID NO:25是SEQ ID NO:29、30和31的14核苷酸共有区域。

SEQ ID NO:26是SEQ ID NO:29、30和31的15核苷酸共有区域。

SEQ ID NO:27是SEQ ID NO:29、30和31的13核苷酸共有区域。

SEQ ID NO:28是SEQ ID NO:29、30和31的15核苷酸共有区域。

SEQ ID NO:29是用于比对的A1共有序列。

SEQ ID NO:30是用于比对的A2共有序列。

SEQ ID NO:31是用于比对的A3共有序列。

SEQ ID NO:32是用于比对的B共有序列。

SEQ ID NO:33是用于比对的C1共有序列。

SEQ ID NO:34是用于比对的C2共有序列。

SEQ ID NO:35是SEQ ID NO:29、30和31的15核苷酸共有区域。

SEQ ID NO:36是CruA 09-O-2809引物。

SEQ ID NO:37是CruA 09-O-2811引物。

SEQ ID NO:38是HMG-I/Y 09-0-2807引物。

SEQ ID NO:39是HMG-I/Y 09-0-2808引物。

SEQ ID NO:40是CruA MDB510正向引物。

SEQ ID NO:41是MDB511反向引物。

SEQ ID NO:42是CruA TM003探针。

SEQ ID NO:43是FatA FatA-F正向引物。

SEQ ID NO:44是FatA FatA-R反向引物。

SEQ ID NO:45是FatA FatA-P探针。

SEQ ID NO:46是HMG-I/Y hmg-F正向引物。

SEQ ID NO:47是HMG-I/Y hmg-R反向引物。

SEQ ID NO:48是HMG-I/Y hmg-P探针。

SEQ ID NO:49是BnACCg8acc1正向引物。

SEQ ID NO:50是BnACCg8acc2反向引物。

SEQ ID NO:51是BnACCg8accp探针。

SEQ ID NO:52是PEP pep-F正向引物。

SEQ ID NO:53是PEP pep-R反向引物。

SEQ ID NO:54是PEP pep-P探针。

具体实施方式

本发明所公开的是芸苔属(Brassica)A-基因组特异性的、并且与能造 成卡诺拉种植地污染的其他芸苔属(Brassica)物种、作物或近缘杂草基本 不交叉反应的检测和量化方法。当测试来自各种不同地理区域的多个品种 的样品时,所检测的内源性靶标是在三种A-基因组物种中的每一个内稳定 的。

单位、前缀、和符号以它们的国际单位制(SI)接受的形式表示。除 非另外指明,核酸是以5′至3′方向从左往右写;并且氨基酸序列是以氨基 至羧基方向从左往右写。本说明书中提及的数值范围包括限定该范围的数 字,并且包括在该限定范围内的每一个整数。核苷酸在本文中可以IUPAC- IUBMB命名委员会推荐的它们的单字母符号表示。说明书作为一个整体引 用时,下面定义的术语就定义得更全面。本说明书通篇提供的章节标题是 为了方便起见而提供,并不是对本公开的各种对象和实施例的限制。

本文示出的每篇参考文献的公开内容根据它们与本文所述的材料和方 法相关联的程度,据此全文以引用的方式并入。

除非上下文另外明确规定,否则如本文和所附权利要求书中所用的单 数形式“一个”、“一种”以及“所述”包括复数涵义。因此,例如,引 用“一株植物(a plant)”包括多株此类植物,引用“一个细胞(a  cell)”包括一个或多个细胞以及它们为本领域技术人员所知的等同物,诸 如此类。

如本文所用,术语“包括”意为“包括但不限于”。

“植物”包括对整个植株、植物器官、植物组织、植物繁殖体、种子 和植物细胞以及相同的子代的引用。植物细胞包括但不限于来自种子、悬 浮培养物、胚、分生区域、愈伤组织、叶、根、苗、配子体、孢子体、花 粉和小孢子的细胞。

如本文所用,术语“卡诺拉”是指一类在种子中具有低水平芥子油甙 和芥酸的芸苔属(Brassica)。存在三种卡诺拉品质的芸苔属(Brassica) 物种,包括油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea)。

术语“双子叶植物”和“双子叶的植物”本文互换使用。

术语“双子叶植物”是指被子植物的子类也被称为“双子叶植物 纲”,并且包括整个植株、植物器官(例如,叶、茎、根,等等)、种 子、植物细胞、以及相同的其子代的引用。如本文所用,植物细胞包括但 不限于种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、苗、配子 体、孢子体、花粉和小孢子。

术语“转基因植物”是指在其基因组中包含异源多核苷酸的植物。异 源多核苷酸一般被稳定地整合进基因组中,使得该多核苷酸传递至连续的 世代。异源多核苷酸可单独地或作为重组表达盒的部分整合进基因组中。 本文所用的“转基因”包括因异源核酸存在而已经改变了基因型的任何细 胞、细胞系、愈伤组织、组织、植物部分或植物,包括初始进行此类改变 的转基因生物体或细胞,以及从初始的转基因生物或细胞通过杂交或无性 繁殖产生的那些转基因生物体或细胞。如本文所用,术语“转基因”不涵 盖通过常规植物育种方法(即,杂交)或通过诸如随机异花受精、非重组 病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件 导致的基因组(染色体基因组或染色体外基因组)改变。

转基因“事件”是通过用异源的DNA构建体(所述异源的DNA构建 体包括包含目的转基因的核酸表达盒)转化植物细胞、将所述转基因插入 植物基因组所得的一组植物再生、以及特征在于特定基因组位置的插入的 特定植物的选择而产生的。一个事件通过所述转基因的表达被表型上表 征。在基因水平上,一个事件是植物基因构成的一部分。术语“事件”也 指通过转化体和另一个品种之间的有性杂交所产生的包括所述异源DNA的 子代。甚至在与轮回亲本重复回交后,来自转化的亲本的插入DNA以及旁 侧DNA存在于与杂交子代相同的染色体位置上。术语“事件”也指来自初 始转化体(包含插入DNA和紧邻所述插入DNA的旁侧序列)的DNA,期 望将其转移至接受了包括目的转基因的插入DNA的子代,作为包含所述插 入DNA的一个亲本系(例如,初始转化体和自交所得的子代)和不包含所 述插入DNA的亲本系的有性杂交的结果。

如本文所用,“插入DNA”是指在表达盒内用于转化植物材料的异源 DNA,而“旁侧DNA”可包含生物体(诸如植物)中天然存在的基因组 DNA,或经由转化过程导入的外源(异源性的)DNA,其对于初始插入的 DNA分子是外来的,例如与转化事件相关联的片段。本文所用的“旁侧区 域”或“旁侧序列”是指至少20、50、100、200、300、400、1000、 1500、2000、2500、或5000碱基对或更大的序列,其位于所述初始外源插 入DNA分子的紧接上游和邻接上游或紧接下游和邻接下游。

如本文所用,“探针”是附接了常规的可检测标记或报告基因分子 (例如,放射性同位素、配体、化学发光标记、酶等)的分离的多核苷 酸。此类探针与靶标多核苷酸的一条链互补,在本例中,与来自靶标样 品、来自包括DNA(例如,来自感兴趣的性状)的样品的分离的DNA的 一条链互补。探针不仅包括脱氧核糖核酸或核糖核酸,还包括聚酰胺和能 够特异性检测靶标DNA序列的存在的其他探针材料。

如本文所用,“引物”是分离的多核苷酸,其通过核酸杂交与互补的 靶标DNA链退火以形成引物和靶标DNA链之间的杂交体,然后通过聚合 酶(例如DNA聚合酶)沿着所述靶标DNA链延伸。引物对是指它们的作 用在于扩增靶标多核苷酸,例如,通过聚合酶链反应(PCR)或其它常规 核酸扩增方法。“PCR”或“聚合酶链反应”是用于扩增特异性DNA片段 的技术(参见美国专利4,683,195和4,800,159;以引用方式并入本文)。能 够使用本文所公开的引物的任何组合使得所述引物对允许检测芸苔属 (Brassica)A-基因组。

具有足够核苷酸长度的探针和引物结合至靶标DNA序列并特异性检测 和/或鉴定感兴趣的多核苷酸。已经认识到能够通过操作者确定杂交条件或 反应条件来获得这种结果。该长度可以是可用于所选择的检测方法中的足 够长度的任何长度。一般来讲,所用的长度是8、11、14、16、18、20、 22、24、26、28、30、40、50、75、100、200、300、400、500、600、700 个核苷酸或更多个、或在约11-20、20-30、30-40、40-50、50-100、100- 200、200-300、300-400、400-500、500-600、600-700、700-800、或更多个 核苷酸之间。此类探针和引物能够在高严格性杂交条件下特异性杂交至靶 序列。虽然通过常规方法可以设计与靶标DNA序列不同并且保持特异性检 测和/或鉴定靶标DNA序列的能力的探针,但根据实施例,探针和引物可 具有与靶序列完全DNA序列同一性的连续的核苷酸。因此,探针和引物能 够与靶标多核苷酸共享约80%,85%,90%,91%,92%,93%,94%, 95%,96%,97%,98%,99%或更高的序列同一性、或与靶标多核苷酸互 补、或可与靶标序列相差1、2、3、4、5、6或更多个核苷酸。探针能被用 作引物,但是大体上设计来结合至靶标DNA或RNA并且不用于扩增过 程。

能够使用特异性引物扩增整合片段以制备扩增子,所述扩增子能被用 作“特异性探针”或自身能被检测用于鉴定生物学样品中感兴趣的多核苷 酸。另选地,在PCR反应中能使用探针以允许所述扩增事件的检测(即, Taqman探针或MGB探针)(也被称为实时PCR)。当在允许探针与样品 结合的条件下所述探针与生物学样品的多核苷酸杂交时,能够检测到这种 结合并且因此允许指示生物学样品中事件的存在。本领域已经阐述了此类 界定探针的鉴定。在一个实施例中,所述特异性探针是在最优化的条件 下,特异性杂交至所期望位置的5′或3′旁侧区域内的区域,并也可包含与 其邻接的外源DNA的一部分的序列。所述特异性探针可包含与所述靶标 DNA的特定区域至少80%、80至85%之间、85至90%之间、90至95%之 间、以及95至100%之间相同(或互补)的序列。

如本文所用,“扩增DNA”或“扩增片段”或“扩增子”是指靶标多 核苷酸(核酸模板的一部分)的多核苷酸扩增的产物。

“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互 换使用并且是任选含有合成的、非天然的或改变的核苷酸碱基的单链或双 链的RNA或DNA聚合物。核苷酸(通常以它们的5′-单磷酸形式存在)可 以用如下它们的单字母名称指代:“A”表示腺苷酸或脱氧腺苷酸(分别对 应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或 脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤 (A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A 或C或T,“I”表示肌苷,并且“N”表示任意核苷酸。

术语“单核苷酸多态性”或“SNP”是当基因组(或其它共有的序 列)中单个核苷酸-ATCG-在一个物种的成员之间(或在个体中 配对的染色体之间)不同时所发生的DNA序列变异。例如,来自不同个体 的两段被测序的DNA片段,AAGCCTA与AAGCTTA,包含单个核苷酸的 差异。在这种情况下我们说有两个等位基因:C和T。几乎全部一般的 SNP都仅具有两个等位基因。

可使用多种技术检测等位基因(Nakitandwe等人,2007;其以引用方 式并入本文)。

“多肽”、“肽”、“氨基酸序列”和“蛋白质”在本文中可互换使 用,是指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基 是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用 于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和 “蛋白质”还可包括修饰,所述修饰包括但不限于糖基化、脂质连接、硫 酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。

探针和引物在严格性杂交条件下特异性杂交至靶标序列。杂交参考文 献包括但不限于Herzer和Englert,2002Palmisano等人,2005;该参考文 献以引用方式并入本文。

术语“在严格条件下”指两个序列在中或高严格条件下杂交。更具体 地讲,中严格条件可由本领域的普通技术人员例如根据DNA长度来容易地 确定。基本条件如Sambrook等人,Molecular Cloning:A Laboratory  Manual,第三版,第6章和第7章,Cold Spring Harbor Laboratory Press, 2001所示,并且包括使用硝化纤维滤膜的预洗涤溶液5×SSC,0.5%SDS, 1.0mM EDTA(pH8.0),杂交条件为约50%的甲酰胺,2×SSC至6×SSC, 在约40-50℃下进行(或其它类似的杂交溶液,诸如Stark溶液,在约50% 的甲酰胺中,在约42℃下进行)并且洗涤条件为例如约40-60℃,0.5- 6×SSC,0.1%SDS。优选地,中严格条件包括在约50℃和6×SSC条件下杂 交(并洗涤)。高严格条件也可由本领域的技术人员例如根据DNA长度来 容易地确定。

一般来讲,此类条件包括在比中严格条件更高的温度和/或更低的盐浓 度下杂交和/或洗涤(例如在约65℃,6×SSC至0.2×SSC,优选地6×SSC, 更优选地2×SSC,最优选地0.2×SSC条件下杂交)。例如,高严格条件可 包括如上所述杂交并在大约65-68℃,0.2×SSC,0.1%SDS条件下洗涤。在 杂交和洗涤缓冲液中可以用SSC(1×SSC为0.15M NaCl和15mM柠檬酸 钠)取代SSPE(1×SSPE为0.15M NaCl,10mM NaH2PO4和1.25mM  EDTA,pH 7.4);在完成杂交后洗涤15分钟。

使用可商购获得的杂交试剂盒也是可能的,所述试剂盒使用无放射性 的底物作为探针。特异性的例子包括与ECL直接标记&检测系统杂交 (Amersham)。严格条件包括,例如,使用所述试剂盒包括的杂交缓冲液 在42℃杂交4小时,所述缓冲液补充有5%(w/v)封闭液和0.5M NaCl, 并在0.4%SDS,0.5×SSC中,在55℃下洗涤两次,每次20分钟,然后在 2×SSC中,在室温下洗涤一次,时间5分钟。如本文所用,“扩增DNA” 或“扩增子”是指靶标核酸序列(核酸模板的一部分)的核酸扩增的产 物。

“基因组”在用于植物细胞时不仅涵盖存在于细胞核中的染色体 DNA,而且还包括存在于细胞的亚细胞组分(例如线粒体、质粒)中的细 胞器DNA。基因组区域是指被靶向以被特异性检测(例如,通过扩增反应 或通过直接测序)的基因组的一部分。

针对序列而言的“异源”是指来自外来物种的序列,或者如果来自相 同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座 的显著改变的序列。

术语“同源”是指核酸序列通过天然的或人工的过程来源于共同的祖 先基因(例如,是相同的基因家族的成员),并因此通常具有序列相似性 的核酸序列。通常,同源核酸具有充分的序列同一性,使得序列中的一个 或其互补序列能够在选择性杂交条件下与另一序列选择性地杂交。术语 “选择性杂交”包括指在严格杂交条件下,核酸序列与特定核酸靶标序列 以比其与非靶标核酸序列的杂交更高的可检测程度(例如至少2倍于背 景)杂交,并指基本排除了非靶标核酸。选择性杂交的序列彼此之间具有 约至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同 一性。表现出与参考核酸至少一些程度的同源性的核酸可以为唯一的或与 该参考核酸或它的互补序列相同。

“信使RNA(mRNA)”是指无内含子并且可由细胞翻译成蛋白质的 RNA。

“cDNA”是指与mRNA模板互补并且利用逆转录酶从mRNA模板合 成的DNA。cDNA可以是单链的或者可以用DNA聚合成酶I的Klenow片 段转化成双链形式。

“分离的”是指物质,诸如核酸分子和/或蛋白质,该物质基本上不含 在天然存在的环境中通常伴随该物质或与其反应的组分,或者说是该物质 被从所述组分去除。分离的多核苷酸可从它们天然存在于其中的宿主细胞 纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该 术语也涵盖重组多核苷酸和化学合成的多核苷酸。

“重组体”是指例如通过化学合成或者通过用基因工程技术操纵分离 的核酸片段来实现的两个原本分离的序列片段的人工组合。“重组体”也 包括指已经通过引入异源核酸而进行了修饰的细胞或载体,或源于经这样 修饰的细胞的细胞,但不涵盖由天然发生的事件(如自发突变、自然转化/ 转导/转座)对细胞或载体的改变,诸如没有蓄意的人为干扰而发生的那 些。

“重组DNA构建体”是指在自然界中通常不会一起存在的核酸片段的 组合。因此,重组DNA构建体可包含源于不同来源的调控序列和编码序 列,或源于相同来源但以不同于通常天然存在的方式排列的调控序列和编 码序列。

“调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游 (3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或 者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、 内含子和多腺苷酸化识别序列。术语“调控序列”和“调控元件”在本文 中可互换使用。

“启动子”是指能够控制另一核酸片段转录的核酸片段。

“植物启动子功能”是能够控制

植物细胞中的转录的启动子,无论其是否来源于植物细胞。

“组织特异性启动子”和“组织优选启动子”可互换使用,并且是指 主要但非必须专一地在一种组织或器官中表达,而是也可在一种特定细胞 中表达的启动子。

“发育调控的启动子”是指其活性由发育事件决定的启动子。

术语“可操作地连接”是指核酸片段连接成单一片段,使得其中一个 核酸片段的功能受到另一个核酸片段的调控。例如,在启动子能够调控核 酸片段的转录时,该启动子与该核酸片段进行了可操作地连接。

“表达”是指功能产物的产生。因此,核酸片段的表达可以指核酸片 段的转录(如生成mRNA或功能RNA的转录)和/或mRNA翻译成前体或 成熟蛋白质。

“表型”是指细胞或生物体的可检测的特征。

有关将核酸片段(例如重组DNA构建体)插入细胞内的“导入”意指 “转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原 核细胞中,在该细胞中核酸片段可整合进细胞的基因组(如染色体、质 粒、质体或线粒体DNA)内,转变成自主的复制子或瞬时表达(如转染的 mRNA)。

“转化细胞”是将核酸片段(如重组DNA构建体)引入其中的任何细 胞。

在此所用的“转化”是指稳定转化和瞬时转化两者。

“稳定转化”是指将核酸片段引入宿主生物体的基因组中,导致基因 稳定遗传。一旦稳定转化,核酸片段稳定地整合进宿主生物体和任何后续 世代的基因组中。

“瞬时转化”是指将核酸片段引入宿主生物体的核中或包含DNA的细 胞器中,引起基因表达而无基因稳定遗传。

扩增

体外扩增技术是本领域中为人们所熟知的。足以指导技术人员使用此 类体外方法,包括聚合酶链反应(PCR)、连接酶链反应(LCR)、Qβ-复 制酶扩增和其它RNA聚合酶介导的技术(例如,NASBA)的技术的例 子,见于Berger、Sambrook和Ausubel(全部参见上文)以及Mullis等人 ((1987)美国专利4,683,202);PCR Protocols,A Guide to Methodsand  Applications((Innis等人编辑)Academic Press Inc.,San Diego Academic  Press Inc.San Diego,CA(1990)(Innis));Arnheim & Levinson ((1990年10月1日)C&EN 36-47);The Journal Of NIH Research(1991)3,81-94;Kwoh等人.((1989)Proc.Natl.Acad.Sci.USA 86, 1173);Guatelli等人.((1990)Proc.Natl.Acad.Sci.USA87,1874); Lomell等人.((1989)J.Clin.Chem.35,1826);Landegren等人. ((1988)Science241,1077-1080);Van Brunt((1990)Biotechnology8,291-294);Wu和Wallace((1989)Gene4,560);Barringer等人 ((1990)Gene 89,117)、以及Sooknanan和Malek((1995) Biotechnology13:563-564)。克隆体外扩增核酸的改进的方法描述于 Wallace等人,美国专利5,426,039中。通过PCR扩增大的核酸的改进的方 法总结于Cheng等人(1994)Nature369:684以及其中的参考文献中,在 其中产生了最多40kb的PCR扩增子。技术人员将会知道使用逆转录酶和聚 合酶,基本上能够将任何RNA转化成适于限制性消化、PCR扩增和测序的 双链DNA。参见Ausubel、Sambrook和Berger,全部参见上文。

在本文所述公开的一个实施例中,芸苔属(Brassica)A基因组的扩增 片段包含(i)SEQ ID NO:29、30或31中的至少一个的核苷酸序列;或 (ii)SEQ ID NO:29、30或31中的至少一个的核酸片段,其中所述核酸片 段选自SEQ ID NO:29、30或31的以下核苷酸位点:约50至约核苷酸位点 400、50至约核苷酸位点100、50至约核苷酸位点350、400至约核苷酸位 点350、400至约核苷酸位点200、以及400至约核苷酸位点100。芸苔属 (Brassica)A基因组的扩增片段包含SEQ ID NO:29、30或31中的至少一 个的核酸片段,其中所述核酸片段选自约50至约核苷酸位点400的核苷酸 位点。这可包括但不限于约位点50至约位点400的任何单个数字位数区 间。该核酸片段可包含在核苷酸位点50至核苷酸位点400之间的任何扩增 片段和包括核苷酸位点50至核苷酸位点400的任何扩增片段。

在本公开的一个实施例中,所述检测方法包括对包含芸苔属 (Brassica)A基因组的基因组DNA的生物学样品测序,其中所述基因组 DNA包含(i)SEQ ID NO:29、30、或31中的至少一个的核苷酸序列;或 (ii)SEQ ID NO:29、30、或31中的至少一个的核酸序列,其中所述核酸 片段是选自SEQ ID NO:29、30、或31或其互补序列的以下核苷酸位点: 约50至约核苷酸位点400、50至约核苷酸位点100、50至约核苷酸位点 350、400至约核苷酸位点350、400至约核苷酸位点200、以及400至约核 苷酸位点100。经测序的所述基因组DNA的部分可为在SEQ ID NO:29、 30、或31中的一个内的任何区域。

通过这些方法制备的所述扩增子可通过多种方法检测。

用作引物(例如,在扩增反应中)的寡核苷酸和用作核酸序列探针的 寡核苷酸通常,根据Beaucage和Caruthers((1981)Tetrahedron Lett.22: 1859)描述的固相亚磷酰胺三酯方法化学地合成,或者能够简单地以商品 方式订购。

使用本文所公开的组合物和本领域熟知的方法能够开发DNA检测试剂 盒。

在两种核酸或多肽序列的上下文中的“序列同一性”或“同一性”是 指在特定比较窗口上进行比对以寻求最大对应时两种序列中相同的残基。

“百分比序列同一性”是指通过在比较窗口中比较两种最优化地对齐 的序列确定的值。百分比通过以下方法进行计算:确定两序列具有相同核 苷酸或氨基酸残基的位点的数目,确定匹配位点的数目,将该匹配位点的 数目除以比较窗口中位点的总数,并将所得结果乘以100来获得序列同一 性的百分比。

已经认识到当序列同一性百分比用于蛋白质时,不同的残基位点的差 异常常在于保守的氨基酸取代,其中氨基酸残基被取代为具有相似化学性 质(例如电荷或疏水性)的其它氨基酸残基,并因此不改变该分子的功能 特性。当序列出现保守取代差异时,可上调序列同一性百分比以进行针对 取代的保守性质的校正。由此类保守取代导致的序列差异被称为具有“序 列相似性”或“相似性”。用于进行此调节的方法是本领域技术人员所熟 知的。通常这涉及给一个保守取代评分为部分而不是完全错配,因此提高 序列同一性百分比。因此例如其中一个相同氨基酸得分为1,而非保守取代 得分为零,保守取代得分介于零和1之间。按照例如Meyers和Miller (1988)Computer Applic.Biol.Sci.4:11-17的算法计算保守取代的评分, 例如,如程序PC/GENE(Intelligenetics,Mountain View,California, USA)中所应用的。

比对序列以供比较的方法是本领域中众所周知的。用于比较的最优化 的序列比对可通过Smith和Waterman的局部同源性算法((1981)Adv.Appl.Math.2:482);Needleman和Wunsch的同源比对算法((1970)J.Mol.Biol.48:443);Pearson和Lipman的相似性搜索算法((1988)Proc.Natl.Acad.Sci.USA85:2444);以及这些算法的计算机化的应用进行, 所述计算机化的应用包括但不限于:在PC/Gene程序(Intelligenetics, Mountain View,California)中的CLUSTAL;Wisconsin Genetics Software  Package(Genetics Computer Group(GCG),Madison,Wisconsin,USA) 中的GAP、BESTFIT、BLAST、FASTA、和TFASTA;CLUSTAL程序详 述于Higgins和Sharp((1988)Gene73:237-244);Higgins和Sharp ((1989)CABIOS5:151-153);Corpet等人((1988)Nucleic Acids  Research16:10881-90);Huang等人((1992)Computer Applications in  the Biosciences8:155-65)、和Pearson等人((1994)Methods in  Molecular Biology24:307-331)。

能够被用于数据库相似性检索的BLAST家族的程序包括:用于针对核 苷酸数据库序列检索核苷酸查询序列的BLASTN;用于针对蛋白质数据库 序列检索核苷酸查询序列的BLASTX;用于针对蛋白质数据库序列检索蛋 白质查询序列的BLASTP;用于针对核苷酸数据库序列检索蛋白质查询序 列的TBLASTN;和用于针对核苷酸数据库序列检索核苷酸查询序列的 TBLASTX。参见,例如,Current Protocols in Molecular Biology,第19 章,Ausubel等人编辑,(1995)Greene Publishing和Wiley-Interscience, New York;Altschul等人,1990,J.Mol.Biol.215:403-410;和Altschul等 人(1997)Nucleic Acids Res.25:3389-3402。

用于进行BLAST分析的软件是可公开获得的,例如,通过美国国立生 物技术信息中心(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)。该算法包括首先通过鉴定查询序列中长 度为W的短字节来鉴定高评分序列对(HSP),所述短字节当与数据库序 列中相同长度的字节对齐时,或者是匹配的,或者是满足某些正值的阈值 分数T。T被称为相邻字节分数阈值。这些初始的相邻字节命中作为种子用 于开始进行检索,以发现包含它们的更长的HSP。然后,这些字节的命中 在两个方向上沿每一序列延伸,直到累积的比对分数不能再增加为止。就 核苷酸序列而言,使用参数M(对一对匹配残基的奖励分数;总是>0)和 N(对错配残基的罚分;总是<0)来计算累积分数。就氨基酸序列而言, 评分矩阵被用于计算累积的分数。字节命中在每一方向上的延伸当出现下 列情况时停止:累积的比对分数从其达到的最高值降低数值X;由于一个 或多个负值评分的残基对齐,累积的分数达到零或更低;或达到序列之一 的末端。BLAST算法的参数W、T、和X确定了比对的灵敏度和速度。 BLASTN程序(用于核苷酸序列)默认采用11的字长(W)、10的期望值 (E)、100的截止阈值(cutoff)、M=5、N=-4,并对两条链均进行比较。 就氨基酸序列而言,BLASTP程序默认采用3的字长(W)、10的期望值 (E)、和BLOSUM62评分矩阵(参见,例如,Henikoff & Henikoff (1989)Proc.Natl.Acad.Sci.USA89:10915)。

除了计算百分比序列同一性之外,BLAST算法还进行两种序列之间相 似度的统计学分析(参见,例如,Karlin & Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877)。BLAST算法提供的一种相似度的测量是 最小和概率(P(N)),其提供了两种核苷酸或氨基酸序列之间偶然地发 生匹配的概率的指示。

BLAST检索假定蛋白质能够被模式化为随机序列。然而,许多实际的 蛋白质包含非随机序列区域,其可以是均聚束(homopolymeric tract)、短 周期重复、或富含一种或更多种氨基酸的区域。此类低复杂度的区域可能 在不相关的蛋白质之间对齐,即使蛋白质的其它区域是完全相异的。多种 低复杂度过滤程序能够被用于减少此类低复杂度的对齐。例如,SEG (Wooten和Federhen(1993)Comput.Chem.17:149-163)和XNU (Claverie和States(1993)Comput.Chem.17:191-201)低复杂度过滤器 能够被单独地或组合地使用。

本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如 下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T. Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory  Press:Cold Spring Harbor,1989(下文称为“Sambrook”)。

实例

下列实验方法和结果提供了关于与本公开的实施相关的规程和方法的 特定方面的附加的细节。不受限制地提供了用于说明受权利要求书保护的 本发明的实例,这些实例涉及本领域的技术人员所熟知的、并且详述于本 文引用的参考文献中的规程的应用。

实例1A-基因组特异性的内源性参照系统的开发

植物材料的选择

从构成“U”的三角形的六种芸苔属(Brassica)物种选择来自各个国 家的种子:埃塞俄比亚芥(B.carinata)、芥菜(B.juncea)、油菜(B. napus)、黑芥(B.nigra)、甘蓝(B.oleracea),和芜菁(B.rapa)(以 及芜菁(B.rapa)亚种)品种(图1)。本研究中也包括了存在于卡诺拉中 或周围的芸苔属(Brassica)-相关物种。其包括:亚麻荠(Camelina  sitava)、狗芥(Erucastrum gallicum)、菥蓂(Thlaspi arvense)、白芥 (Sinapis alba)和野芥(Sinapis arvensis)(以及野芥(S.arvensis)亚 种)。也包括来自其他作物的种子:玉米、水稻、高粱、番茄、棉花、大 豆。大部分种子是接收自Pioneer Hybrid Inc.(Georgetown,Ontario, Canada),也接收自USDA(United States Department of Agriculture) (Ames,IA和Geneva,NY)。表1显示了所用种子的来源。对于可购自 USDA的那些种子,USDA登陆号(ACNO)包括在内。

表1:种子来源。斜体字表示用于测序的种子品种。ACNO代表得自 USDA的种子的登陆号。ACNO=登陆号;注意:来自ACNO 633153的序 列被分配给A和C重叠群两者,这表明该品种实际上可能是油菜(B. napus)(AACC)品种(参见本文实例3)。两种黑芥(B.nigra)品种 (ACNO 633142和ACNO 649156)被分配给两个不同的共有序列,表明这 两个品种不是相同的物种(参见本文实例3)。

从种子提取基因组DNA

为了保证一致性,使用相同的DNA提取方法从种子中提取所有基因组 DNA:基于CTAB的裂解方法,将沉淀的DNA通过Qiagen Genomic Tip (Qiagen Inc,Valencia,CA)用于进一步纯化。针对玉米(Zea mays)、 大豆(Gycine max)和甘蓝型油菜(Brassica napus)对该DNA提取规程进 行了室内验证。使用PicoGreen测定(Molecular探针;Eugene,OR)对所 有DNA样品进行定量。对于测定的特异性比较,大多数DNA进行了总共 9次反应的测试(即3轮,每轮一式三份)。例外情况列于表2中。

表2:例外情况(测试少于9次重复的DNA)

引物和探针

本文所用的引物是由Integrated DNA Technologies(Coralville,Iowa) 合成的,并且探针是由Applied Biosystems(Carlsbad,CA)合成的。在表 3中列出了用于生成测序用的PCR产物的所有引物的序列;并且在表4中 列出了用于特异性测试的所有引物和探针的序列。如相关参考文献中所述 标记所有探针,除了HMG-I/Y探针9。由于SDS2.3软件没有针对HEX的 检测器,由于VIC染料荧光波长与HEX染料相似,用VIC替换HEX来标 记HMG-I/Y探针。

表3:用于生成PCR产物的引物。Genbank中没有发现埃塞俄比亚芥(B.carinata)或黑芥(B.nigra)的CruA、FatA、或HMG-I/Y基因的序

Genbank登陆号

表4:实时PCR引物和探针。星号指示如参考文献中所述标记所有探针,除了HMG-I/Y探针;使用VIC-TAMRA替代HEX-TAMRA。双星号指示FatA(A)描述了本文所公开的A-基因组特异性测定

表4中的参考文献

1.EURL方法,用于检测:1)T45(http://gmo- crl.jrc.ec.europa.eu/summaries/T45_validated_RTPCR_method.pdf) ,2)MS8(http://gmo- crl.jrc.ec.europa.eu/summaries/Ms8_validated_Method_Corrected%20v  ersion%201.pdf),3)RF3(http://gmo- crl.jrc.ec.europa.eu/summaries/Rf3_validated_Method.pdf),和4) RT73(http://gmo- crl.jrc.ec.europa.eu/summaries/RT73_validated_Method.pdf)

2.Wu,Y.,Wu,G.,Xiao,L.,Lu,C.Event-Specific Qualitative和 Quantitative PCR Detection Methods for Transgenic Rapeseed Hybrids  MS1×RF1and MS1×RF2;J.Agric.Food Chem.2007,55,8380- 8389

3.Weng,H.;Yang,L.;Liu,Z.;Ding,J.;Pan,A.;Zhang,D. Novel reference gene,High-mobility-group protein I/Y,used in  qualitative and real-time quantitative polymerase chain reaction  detection of transgenic rapeseed cultivarsl J.AOAC Int.2005,88, 577-584

4.Hernandez,M.;Rio,A.;Esteve,T.;Prat,S.;Pla,M.A  rapeseed-specific gene,Acetyl-CoA Carboxylase,can be used as a  reference for qualitative and real-time quantitative PCR detection of  transgenes from mixedfood samples.J.Agric.Food Chem.(2001 年,49,第3622-3627页)。

5.Zeitler,R.;Rietsch,K.;Vaiblinger,H.Validation of real-time  PCR methods for the quantification of transgenic contaminations in  rapeseed;Eur Food Res Technol(2002)214:346-351。

CruA、HMG I/Y和FatA PCR设计和模板DNA的选择

为了设计A-基因组特异性的内源性实时PCR测定,选择了三个基因: CruA、HMG I/Y和FatA。从来自“U”的三角形中六个物种的多个品种的 这些基因扩增约500bp区域并测序。在来自“U”的三角形的六个成员的可 用序列中所识别的保守区设计引物。虽然对于所有三个基因而言序列不是 得自所有六个芸苔属(Brassica)物种,但是在可用序列的保守区进行比对 并设计引物。为了捕获A-基因组物种(芜菁(B.rapa)油菜(B.napus)和 芥菜(B.juncea))的序列多样性,从各种地理区域选择了来自若干品种的 种子(N=38)以开发所述测定。从剩余的3个物种(花椰菜(B. olearcea)、埃塞俄比亚芥(B.carinata)和黑芥(B.nigra))测序的品种 数量较少(N=15)。

针对FatA、CruA和HMG基因的PCR/克隆/测序区域的引物设计

选择来自“U”的三角形的物种的FatA、CruA和HMG的GenBank序 列,进行比对以找到用于设计引物的保守序列,并且从这些基因的每一个 扩增约500bp的区域。表3示出在比对中所用序列的Genbank登陆号,以 及所选择的引物的位点和扩增子的大小(根据油菜(B.napus)检索)。对 于这三个基因没有对埃塞俄比亚芥(B.carinata)和黑芥(B.nigra)可用的 Genbank序列。

选择引物对每个基因的一个区域进行PCR、克隆和测序。对于CruA, 所选择的引物(09-O-2809/09-O-2811)涵盖了引用的实时测定 (MDB410,MDB511,TM003),将实时PCR扩增子的5’延伸了599个 碱基并且3′延伸了47个碱基。对于HMG-I/Y,所选择的引物(09-O-2807/ 09-O-2808)涵盖了引用的实时测定(hmg-F,hmg-R,hmg-P),将实时 PCR扩增子的5’延伸了273个碱基并且3′延伸了131个碱基。对于FatA, 所选择的引物(09-O-2812/09-O-2813)位于FatA测定(FatA-F,FatA-R, FatA-P)的稍下游,删去了5’的32个碱基并将实时PCR扩增子的3′延伸了 462个碱基。

PCR、清理和克隆

将从53个种子品种(参见表1中斜体的品种)分离的基因组DNA (100-120ng)作为模板,用于PCR将要克隆和测序的感兴趣的区域。种子 的选择包括来自各种地理区域的多个品种:油菜(B.napus)(N=17),芥 菜(B.juncea)(N=9),芜菁(B.rapa)(N=12),黑芥(B.nigra) (N=3),埃塞俄比亚芥(B.carinata)(N=2)和甘蓝(B.oleracea) (N=10)。将经纯化的PCR产物克隆至PGEM-T Easy载体。使用T7和 SP6载体引物,选择约6个克隆用于测序。在一些情况下,分离并测序更多 克隆以实现在异源四倍体物种中两种基因组的覆盖。

A-特异性的实时PCR引物和探针的序列分析和优化

使用Sequencher v.4.8对来自CruA、HMG和FatA基因的经克隆的 PCR产物进行序列分析。在Vector NTI中得到最终重叠群的比对结果。在 设计了A-基因组的FatA特异性的若干引物/探针组合后,基于A-基因组特 异性、循环阈值(Ct)和PCR效率选择了最佳的引物/探针组合。基于Ct 值(循环阈值)、ΔRn值和PCR效率选择了最佳的引物和探针浓度。

一旦所述测定被最优化,用油菜(B.napus)基因组DNA制备稀释系 列。将40ng/ul基因组DNA稀释液以1∶2系列稀释4倍。该稀释系列在最 优化的实时测定中进行测试,使用5ul稀释液(在PCR中加入的模板DNA 范围从200ng至12.5ng)。对PCR效率和R2系数进行了评估。

用六个内源性的实时PCR测定进行特异性测试

选择了六个油菜籽内源性的实时PCR测定进行所述特异性测试,包括 本文所述的FatA(A)测定。为了一致性,所有反应包括15ul的主混合物 (包括引物、探针、水和10ul的Applied Biosystems TaqMan Universal PCR  Master Mix w/o AmpErase UNG)和5ul的20ng/ul基因组DNA(=100ng基 因组DNA),终反应体积为20ul。在相关参考文献中阐述了引物和探针浓 度,并列于表4中。

用于实时PCR运行的循环参数如下:在95℃初始变性10分钟;95℃ 15秒(变性),60℃60秒(退火和延伸),循环40次。在Applied  Biosystems 7900HT仪中的384孔板上进行所述实时PCR运行。使用 Applied Biosystems序列检测系统(SDS)v.2.3分析数据。对于所测试样品 (参见表1)的大多数,在三次独立的实时PCR运行中将所述PCR运行一 式三份。一些DNA供应有限,其运行的PCR轮次为两次和/或更少。参见 表2对具有有限供应的DNA的每一个测定中运行和重复的数量的描述。由 于PCR结果差而非缺乏DNA,品种NW4219BC、469735、JS0879BC、 JS0917BC和597829具有较少的重复。

实例2:对CruA、HMG I/Y和FatA区域进行测序

所选择的引物在所有六个物种中产生了扩增。为了使在异源四倍体物 种(油菜(B.napus),芥菜(B.juncea)和埃塞俄比亚芥(B.carinata)) 内的基因组同时进行扩增的可能性最大化,选择了另外的克隆。

一旦从在六个物种内的多个品种克隆了PCR产物,为了增加从所得的 PCR产物捕获所有潜在的多样性的机会,选择了若干克隆(≥6)用于测 序。对于异源四倍体物种,目的是同时获得来自两个基因组的序列。

随后的测序分析,对于异源四倍体物种为了填补基因组覆盖中的间 隙,选择一些另外的克隆并测序。

实例3:将序列数据分配至共有序列代表的基因组

将所述共有序列分配至各个共有序列组,并且基于基础物种(芜菁(B. rapa),甘蓝(B.oleracea)和黑芥(B.nigra))与异源四倍体物种(油菜 (B.napus),芥菜(B.juncea)和埃塞俄比亚芥(B.carinata))的重叠, 将这些(共有序列组)进一步分配至A、B或C基因组。由于物种之间的 A、B和C基因组的基因变异,在某些情况下每个基因组界定的共有序列多 于一个。

CruA

对于CruA测序项目,鉴定了两个A和两个C基因组共有序列。然 而,界定B基因组的共有序列是困难的。从芥菜(B.juncea)(AABB)克 隆的PCR产物全在A共有序列内。此外,若干芥菜(B.juncea)品种难以 进行PCR。两个埃塞俄比亚芥(B.carinata)(BBCC)品种产生的克隆的 PCR产物仅来自C基因组。确定B共有序列的困难可能是由于引物很难结 合至B基因组或B序列与A共有序列没有显著的差异。经测序的来自埃塞 俄比亚芥(B.carinata)(BBCC)和黑芥(B.nigra)(BB)的品种数量有 限也导致很难区分B共有序列。来自ACNO 633153的序列被同时分配给A 和C重叠群的两者,这表明该品种是混合型,并且实际上是一种油菜(B. napus)(AACC)品种。两个黑芥(B.nigra)品种(ACNO 633142和 ACNO 649156)被分配至2个不同的共有序列:633142分配至未区分的共 有序列,而649156分配至A共有序列,表明这两个品种不是相同的物种。 在来自CruA的两个A基因组共有序列中,没有合适的保守区用于设计实 时测定。

HMG

对于HMG测序项目,鉴定了四个A基因组共有序列,和一个C基因 组共有序列。同样的,不能鉴定B共有序列,或者是因为它不能与A和C 共有序列区分开,或者是因为它不能用PCR引物扩增。所有来自芥菜(B. juncea)品种(AABB)的序列被分配至A共有序列,不同的是ACNO 458942被分配至A和C。黑芥(B.nigra)品种(BB)被分配至A基因 组,埃塞俄比亚芥(B.carinata)品种(BBCC)被分配至C共有序列。不 能得到针对B基因组的共有序列可能是由于引物与B基因组的靶标的结合 效率低,或者是由于与A共有序列重叠。对小样品量的黑芥(B.nigra)和 埃塞俄比亚芥(B.carinata)品种进行了测序,这可能使得更难提出B共有 序列。至于CruA,ACNO 633153与分配至A和C基因组共有序列的序列 分在一组。两个黑芥(B.nigra)物种分组在两个不同的共有序列中: ACNO 633142不与A或C共有序列一组,而ACNO 649156与A共有序列 一组。不能从HMG的序列区鉴定出保守的A-基因组-特异性区域。

FatA

对于FatA,存在六个共有序列:对于A-基因组有三个,对于C基因 组有两个,对于B基因组有一个。来自ACNO 633153的序列被分组至C1 和A1重叠群,证明它是油菜(B.napus)而不是芜菁(B.rapa)品种。此 外,ACNO 649156序列分组在A和B共有序列内,证明它是芥菜(B. juncea)品种而非黑芥(B.nigra)。在VNTI中比对来自FatA的六个共有 序列,在图2-A中显示了推测的六个序列的进化关系。图2-B显示了各种 物种在六个共有序列中的分布。

实例4:A-特异性实时PCR测定的设计和优化

在所有三个A共有序列的FatA中保守的区域设计若干实时引物和探 针,并且与B基因组和C基因组的FatA不同。选择给出最低Ct值和最高 PCR效率的引物/探针组用于进一步分析。在图3中的共有序列比对中显示 了所选择的引物和探针。

在更小的组上测试了特异性后,最优化了实时PCR测定。在来自油菜 (B.napus)品种45H73的DNA的稀释系列上进行了三次运行(实时PCR 测定)。这些运行的结果示于表5中。

表5:来自FatA(A)测定的3个实时PCR运行的斜率和R2

运行 斜率 R2 PCR效率(%) 1 -3.39 0.997 97.2 2 -3.42 0.997 96.1 3 -3.41 0.996 96.5

实例5:六种油菜籽内源性实时PCR测定的特异性比较

为了证实与现有系统相比FatA(A)实时PCR测定提供了更高的特异 性,一组DNA进行了Fat(A)测定以及五种其它油菜籽内源性实时PCR 测定。DNA的来源包括:1)在序列分析中使用的种子品种(去掉了 ACNO 649156);2)埃塞俄比亚芥(B.carinata)和黑芥(B.nigra)的另 外的品种;3)可能污染卡诺拉种植地的其它物种;和4)来自各种其他作 物的种子。对于表4中所述的各种测定,使用参考文献中所述的引物和探 针(和反应中的终浓度)运行实时测定。在大多数情况下,实时测定运行3 个独立的PCR运行,每次一式三份。由于DNA得率的变化,一些DNA供 应量有限,重复和/或运行较少(参见表2)。在表6中示出了来自这个特 异性测试的平均Ct值。

除了一个例外(黑芥(B.nigra)品种ACNO 273638),对于所有测试 的DNA,FatA(A)测定产生的平均Ct值≥35,除了包含A-基因组的芸苔 属(Brassica)物种:油菜(B.napus)、芜菁(B.rapa)和芥菜(B. juncea)品种。在FatA(A)测定中ACNO 273638黑芥(B.nigra)品种的 平均Ct值比其它A-基因组样品晚约9个循环,因此有可能这个黑芥(B. nigra)样品被A-基因组物种中的一个污染了。在这个品种的测序过程中没 有检测到A基因组,但如果扩增是由于污染了A基因组DNA,基于延迟的 Ct值它的水平非常低。

与FatA(A)测定相比,所有测试的其他测定显示出较少的特异性; 例如,与非芸苔属(Brassica)物种的交叉反应和/或与A-基因组没有特异 性。BnACCg8检测了A和B基因组和白芥(Sinapis alba)、Sinapis  arvenis(以及野芥(Sinapis arvensis)arvensis亚种);PEP检测了A和C 基因组;以及,HMG主要检测了A和B与C基因组的一些交叉反应以及 与一些野芥(Sinapis arvensis)品种的交叉反应。CruA测定显示检测了所 有A、B和C基因组以及相关的物种菥蓂(Thlaspi arvense)、狗芥 (Erucastrum gallicum)、野萝卜(Raphanus raphanistrum)、萝卜 (Raphanus sativus)、白芥(Sinapis alba)和野芥(Sinapis arvensis)(以 及亚种:野芥(Sinapis arvensis)arvensis亚种)。FatA测定检测了A、B 和C基因组,以及亚麻荠(Camelina sativa)、野萝卜(Raphanus  raphanistrum)、萝卜(Raphanus sativus)、白芥(Sinapis alba)、野芥 (Sinapis arvensis)(以及亚种:野芥(Sinapis arvensis)arvensis亚种)和 拟南芥(Arabidopsis thaliana)。

表6:六个内源性的实时PCR系统的平均Ct值。UDT表示未测定或在这个测定中检测不到

实例6:在每个A-基因组物种内测试异质性

除了特异性,期望的内源性参照系统不会表现出品种间的等位基因变 异。FatA(A)测定识别了A-基因组,因此具有不同单倍体基因组大小的 三种不同物种。因此,稳定性测量被限制在对每个物种内的品种的Ct值的 比较。通过将Ct比较限制在物种内的那些品种,消除了由基础物种(芜菁 (B.rapa),AA)和异源四倍体物种(芥菜(B.juncea)/AABB和油菜 (B.napus)/AACC)之间基因组大小的变化导致的Ct变化。这个分析的 结果示于表7中。对于油菜(B.napus),Ct值的范围是从21.6至22.5;对 于芜菁(B.rapa)Ct值的范围是从20.7至22.1,而对于芥菜(B.juncea) Ct值的范围是从21.5至22.0。在油菜(B.napus)和芥菜(B.juncea)物种 中,Ct范围在1个Ct值以内;而对于芜菁(B.rapa)Ct范围在1.4个Ct以 内。在所有情况下,平均值的偏差在1个Ct值以内。

表7:FatA(A-基因组特异性)内源性的参照实时PCR测定的异质性测试。注意:来自ACNO 633153的序列被同时分配给A和C重叠群的两 者,这表明该品种实际上可能是油菜(B.napus)(AACC)品种(参见本 文实例3)。

尽管已经出于清楚和理解的目的以一些细节在上文进行了描述,对于 本领域的技术人员而言,从对本公开的阅读中将显而易见的是,能够进行 形式和细节上的多种改变而不背离真实范围。例如,上文描述的全部的技 术、方法、组合物、设备和系统可以以多种组合被使用。本申请所引用的 任何出版物、专利、专利申请、或其它文件都是出于全部目的以全文引用 的方式并入本文,其引用程度就如同将每个出版物、专利、专利申请、或 其它文件个别地出于全部目的以全文引用的方式并入本文。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号