首页> 中国专利> 编码参与类异戊二烯合成的蛋白质的核酸序列

编码参与类异戊二烯合成的蛋白质的核酸序列

摘要

本发明提供了产生类异戊二烯化合物含量及组成改变了的植物和种子的方法。这些方法尤其用于提高植物中的类异戊二烯水平,以及在宿主植物细胞中提供所希望的类异戊二烯组成。

著录项

  • 公开/公告号CN1353760A

    专利类型发明专利

  • 公开/公告日2002-06-12

    原文格式PDF

  • 申请/专利权人 卡尔根尼有限公司;

    申请/专利号CN00808457.2

  • 申请日2000-04-14

  • 分类号C12N15/53;C12N15/82;A01H5/00;A01N65/00;

  • 代理机构11245 北京纪凯知识产权代理有限公司;

  • 代理人程伟

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 14:19:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-08

    专利权有效期届满 IPC(主分类):C12N15/53 授权公告日:20080514 申请日:20000414

    专利权的终止

  • 2011-02-02

    专利权的转移 IPC(主分类):C12N15/53 变更前: 变更后: 登记生效日:20101227 申请日:20000414

    专利申请权、专利权的转移

  • 2008-05-14

    授权

    授权

  • 2002-06-12

    公开

    公开

  • 2002-05-29

    实质审查的生效

    实质审查的生效

说明书

                      引言

本专利申请要求美国在先申请60/129,899(于1999年4月15日提交)以及美国在先申请60/146,461(于1999年7月30日提交)的优先权。

技术领域

本发明涉及核酸与氨基酸的序列和构建体,及其相关方法。

背景

类异戊二烯类化合物广泛地存在于所有生物体中。植物合成多种系列的类异戊二烯类化合物,超过22,000种之多(Connolly和Hill(1992)类萜词典(Dictionary of Terpenoids),Chapman和Hall,NewYork,NY)。在植物中,类异戊二烯类化合物在特定的细胞功能诸如固醇的生成中起重要作用,促成真核细胞膜的构造以及存在于泛醌和质体醌、生长调节剂(如脱落酸、赤霉素、油菜素类固醇)或光合色素叶绿素和类胡萝卜素的非环聚异戊二烯化合物的侧链。尽管其它的植物性类异戊二烯类化合物的生理作用(比如,多种系列的次级代谢产物的生理作用)并不明显,但是已知有些类异戊二烯类化合物在介导对不同的环境挑战的适应性反应中起关键作用。尽管类异戊二烯类化合物的结构和功能具有显著的多样性,但是它们都源自单一种代谢前体,即异戊烯二磷酸(IPP)(Wright,(1961)生物化学年鉴(Annu.Rev.Biochem.),20:525-548;Spurgeon和Porter,(1981)“Biosynthesisof Isoprenoid Compounds”,Porter和Spurgeon编辑,第一卷,第1-46页,John Wiley New York出版)。

在高等植物的叶绿体中,存在着源自类异戊二烯途径的若干独特和相互关联的生化途径,它们导致次级代谢产物(包括生育酚)的生成。生育酚(即,维生素E)不仅在植物中起着至关重要的作用,而且从哺乳动物的营养角度来看也是重要的。在质体中,生育酚占总醌库的量达到40%。

生育酚和生育三烯酚(不饱和生育酚的衍生物)是众所周知的抗氧化剂,在保护细胞免受自由基损害以及预防多种疾病(包括心脏病、癌症、白内障、视网膜病、早老性痴呆和神经变性)中起重要的作用,而且已经表明它们对关节炎症状以及在抗衰老中具有有益的效应。维生素E被用于鸡饲料中,以提高鸡肉的货架寿命、外观、香味和氧化稳定性,以及将母育酚从饲料转移到鸡蛋中。已经表明,维生素E对家畜动物的正常生育是必需的,并改善家畜动物的总体表现和增强其免疫力。在动物饲料中补充维生素E还可赋予奶制品氧化稳定性。

天然生育酚作为补充物,在过去的三年里,对其需求一直在以10-20%的速度稳定地增长。目前,对天然生育酚的需求超过了供给,已知天然生育酚的生物活性,高于合成得到的生育酚的外消旋混合物。天然生育酚都是d-立体异构体,而合成α-生育酚是八种d,1-α-生育酚异构体的混合物,只有其中的一种(占12.5%)与天然d-α-生育酚完全相同。天然d-α-生育酚,与其它天然生育酚或生育三烯酚相比,具有最高的维生素E活性(1.49IU/mg)。合成α-生育酚的维生素E活性为1.1IU/mg。1995年,世界市场对生育酚精制原料的需求为10.2亿美元;其中合成物质占市场的85-88%,剩下的12-15%为天然物质。天然生育酚和生育三烯酚的最佳来源物为植物油和谷类产品。当前,大部分的天然维生素E是产自γ-生育酚,而γ-生育酚又出自豆油加工,随后通过化学修饰可将其转化为α-生育酚(α-生育酚表现出最高的生物活性)。

不通过化学修饰而提高植物中生育酚和生育三烯酚(特别是那些能够直接使用的更希望得到的化合物)水平的方法,将有助于本领域中,这是由于这些分子表现出更好的功能性和生物可利用性。

另外,希望得到这样的方法,其可增加宿主植物细胞中其它类异戊二烯衍生化合物的产量。而且,还需要在宿主植物细胞中产生特定的类异戊二烯化合物的方法。

                 发明概述

本发明涉及D-1-脱氧木酮糖5-磷酸还原异构酶(dxr),更具体地,涉及dxr的多核苷酸和多肽。本发明的多核苷酸和多肽包括源自真核细胞来源物的那些多核苷酸和多肽。

因而,本发明的一个方面涉及编码D-1-脱氧木酮糖5-磷酸还原异构酶蛋白质的分离的多核苷酸序列。更具体地,本发明提供了编码来自植物源的dxr蛋白质的分离的核酸序列。

本发明的另一个方面涉及寡核苷酸,其中包括部分或完整的dxr编码序列。

本发明的又一个方面提供了可用于转录或者转录及翻译(表达)dxr的重组DNA构建体。更具体地,本发明提供了能够在宿主细胞中转录或者转录及翻译的构建体。

在本发明的另一个方面中,提供了在宿主细胞或其后代中产生dxr的方法。更具体地,用可以用于转录或者转录及翻译dxr的DNA构建体对宿主细胞进行了转化或转染。含有dxr的重组细胞也是本发明的一部分。

另一方面,本发明涉及使用多核苷酸和多肽序列改变宿主细胞(尤其是宿主植物细胞)中的类异戊二烯含量的方法。在本文中还构思了含有如此改变的类异戊二烯含量的植物细胞。

通过表达dxr而得到的被修饰的植物、种子和油也被认为是本发明的一部分。

                   附图简述

图1提供了拟南芥菜属dxr序列和大肠杆菌(E.coli)dxr序列之间的氨基酸顺序。

图2提供了甲羟戊酸以及非甲羟戊酸途径的类异戊二烯途径流程图。

                    发明详述

本发明尤其提供了用于改变(例如提高和减低)类异戊二烯水平和/或调整它们在宿主细胞中比例的组合物和方法。更具体地,本发明提供用于调整宿主植物细胞中类异戊二烯含量的多核苷酸、多肽及其使用方法。

类异戊二烯类化合物源自5-碳构造单元、异戊二烯二磷酸(IPP),它是通用的异戊二烯单元和常见的类异戊二烯前体。类异戊二烯类化合物包含一组在结构上多种多样的化合物,其可分为两类:初级和次级代谢产物(Chappell,1995,植物生理学和植物分子生物学年鉴(Annu.Rev.Plant Physiol.Plant Mol.Biol.),46:521-547)。初级代谢产物包括这样一些类异戊二烯类化合物,它们对膜完整性、光保护、协调发育程序以及将生化功能锚定于特定的膜系统是必需的。这样的初级代谢产物包括但不限于固醇、类胡萝卜素、叶绿素、生长调节剂,以及多萜醇、醌和蛋白质的聚戊二烯醇(polyprenol)取代物。次级代谢产物介导植物与环境间的重要相互作用,但对植物的生存并不是必需的。次级代谢产物包括但不限于生育酚、单萜类化合物、倍半萜类化合物和二萜类化合物。

许多年来,一直认为IPP是通过众所周知的乙酸/甲羟戊酸途径合成的。但是,最近的研究已证实还存在一种不依赖于甲羟戊酸的替代途径,用于IPP的生物合成(Horbach等人,(1993)FEMS Microbiol.Lett.111:135-140;Rohmer等人,(1993)生物化学杂志(Biochem.J),259:517-524)。该IPP生物合成的非甲羟戊酸途径最初是在细菌中被表征的,后来在绿藻和高等植物中也被表征(关于最近的综述,见Lichtenthaler等人,(1997)植物生理学(Physiol.Plant.),101:642-652以及Eisenreich等人,1998,化学生物学(Chem.Biol.),5:R221-R223)。这个新的不依赖甲羟戊酸途径的第一步反应是(羟乙基)硫胺素(源自丙酮酸)与D-甘油醛3-磷酸的Cl醛基的缩合反应,生成D-1-脱氧木酮糖5-磷酸(Broers,(1994)博士论文:Eidgenossische TechnischeHochschule,苏黎世,瑞士;Rohmer等人,(1996)美国化学学会杂志(J.Am.Chem.Soc.),118:2564-2566)。在大肠杆菌中,D-1-脱氧木酮糖(最可能是以D-1-脱氧木酮糖5-磷酸的形式存在)被有效地引入到甲基萘醌和泛醌的戊烯侧链中(Broers,(1994)同上;Rosa Putra等人,1998,Tetrahedron Lett.,39:23-26)。在植物中,也报道了D-1-脱氧木酮糖引入到类异戊二烯类化合物中(Zeidler等人,1997,Z.Naturforsch 52c:15-23;Arigoni等人,1997,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA),94:10600-10605;Sagner等人,(1998)化学通讯(Chem.Commun.),2:221-222)。另外,D-1-脱氧木酮糖还被描述为硫胺素和吡哆醇的生物合成前体。在大肠杆菌中D-1-脱氧木酮糖是硫胺素上噻唑环的连续五个碳单元(C4’-C4-C5-C5’-C5”)的前体分子(Therisod等人,1998,生物化学与生物物理学研究通讯(Biochem.Biophys.Res.Comm.),98:374-379;David等人(1981)美国化学学会杂志,103:7341-7342),在高等植物叶绿体中也是如此(Julliard和Douce,1991,美国国家科学院院刊,88:2042-2045)。还很好地记载了对D-1-脱氧木酮糖在大肠杆菌中生物合成吡哆醇中的作用(Hill等人,(1989)美国化学学会杂志,111:1916-1917;Kennedy等人,(1995)美国化学学会杂志,117:1661-1662;Hill等人,(1996)生物化学杂志(J.Biol.Chem.),271:30426-30435)。最近,已报道在细菌(Sprenger等人,(1997)美国国家科学院院刊,94:12957-12962;Lois等人,(1998)美国国家科学院院刊,95:2105-2110)和植物(Lange等人,(1998)美国国家科学院院刊,95:2100-2104;Bouvier等人,(1998)植物生理学(Plant Physiol.),117:1423-1431)中已克隆了编码1-脱氧-D-木酮糖5-磷酸合酶的基因。图2提供了说明类异戊二烯途径的流程图。

尽管现在还没有表征出1-脱氧-D-木酮糖5-磷酸与IPP之间的中间体,但是Rohmer与其同事已经提出将2-C-甲基-D-赤藓醇4-磷酸作为细菌中类异戊二烯生物合成的第一个关键前体(Duvold等人,(1997)Tetrahedron Lett.,38:4769-4772;Duvold等人,1997,Tetrahedron Lett.,38:6181-6184)。催化1-D-脱氧-D-木酮糖5-磷酸转变为2-C-甲基-D-赤藓醇4-磷酸的1-脱氧-D-木酮糖5-磷酸还原异构酶,最近已在大肠杆菌中被克隆和表征(Takahashi等人,1998,美国国家科学院院刊,95:99879-9884)。最近Sagner等人分别在Tetrahedron Lett.,(1998),39:23-26和化学通讯,(1998),2:221-222中报道了通过1-脱氧-D-木酮糖5-磷酸的分子内重排在植物中生物合成2-C-甲基-D-赤藓醇。

本发明提供了参与从1-脱氧木酮糖-5-磷酸生成2-C-甲基-D-赤藓醇-4-磷酸的多核苷酸和多肽的序列,其被称为1-脱氧-D-木酮糖5-磷酸还原异构酶或dxr。本发明还提供了在宿主细胞中产生表达改变了的dxr的构建体和方法,以及修饰类异戊二烯途径(包括对通过类异戊二烯途径的生物合成流的修饰)的方法,和在宿主细胞中产生特定种类的类异戊二烯类化合物的方法。分离的多核苷酸、蛋白质和多肽

本发明的第一个方面涉及分离的dxr多核苷酸。本发明的多核苷酸序列包括编码本发明多肽(它具有选自序列表中列出的序列组的推定氨基酸序列)的分离的多核苷酸,还涉及与这些序列及其变异体紧密相关的其它多核苷酸序列。

本发明提供了一种多核苷酸序列,其整个序列与在序列表中列出的每个编码序列完全相同。本发明还提供了成熟多肽或其片段的编码序列,以及与其它编码序列诸如那些编码导肽或分泌序列、前-、原-或前原-蛋白质序列处于同一读框中的成熟多肽或其片段的编码序列。该多核苷酸还可包含非编码序列,例如包括但不限于非编码的5’和3’序列,诸如转录但不翻译的序列、终止信号、核糖体结合位点、稳定mRNA的序列、内含子、多腺苷酸化信号和编码所添加氨基酸的添加编码序列。例如,可以将一个标记序列包括在内,以促进融合多肽的纯化。本发明的多核苷酸还包括含有结构基因和控制基因表达的天然结合序列的多核苷酸。

本发明还包括下式的多核苷酸:

              X-(R1)n-(R2)-(R3)n-Y

其中,位于5’末端的X是氢,位于3’末端的Y是氢或金属,R1和R3为任何核酸残基,n是一个介于1-3000之间的整数(优选介于1-1000之间),R2是本发明的核酸序列,尤其是选自序列表列出的核酸序列并优选SEQ ID NO:1中的那些核酸序列。在上式中,R2是有方向性的,其5’末端残基位于左边,结合于R1,而其3’末端残基位于右边,结合于R3。用一组R(R大于1)表示的任何核酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。

本发明还涉及本文所述的多核苷酸的变异体,它们编码本发明的多肽的变异体。那些本发明的多核苷酸片段的变异体,可被用于合成本发明的全长多核苷酸。优选的实施方案为编码多肽变异体的多核苷酸,其中对本发明的多肽序列的5-10,1-5,1-3,2,1或无氨基酸残基被以任何组合替代、添加或缺失。特别优选沉默的替代、添加和缺失,因为它们不会改变该多核苷酸或多肽的性能或活性。

本发明的进一步优选的实施方案为:在多核苷酸全长内与编码本发明多肽的多核苷酸有至少50%、60%或70%相同性的多核苷酸,以及与这种多核苷酸互补的多核苷酸。更优选含有其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少80%相同性的区域的多核苷酸。在这一点上,尤其优选其全长与编码本发明多肽的多核苷酸及其互补多核苷酸有至少90%相同性,特别优选那些有至少95%相同性的多核苷酸序列。进一步地,非常优选那些有至少97%相同性的多核苷酸序列,而且尤其非常优选那些有至少98%和99%相同性的多核苷酸序列,其中最优选那些有至少99%相同性的多核苷酸序列。

优选的实施方案为这样的多核苷酸,它们所编码的多肽基本上保留了与成熟多肽(由序列表中列出的多核苷酸编码)相同的生物学功能或活性。

本发明进一步涉及可与上述序列杂交的多核苷酸。更具体地,本发明涉及在严格条件下可与上述多核苷酸杂交的多核苷酸。本文所用的术语“严格条件”和“严格杂交条件”是指在序列间具有至少95%(优选至少97%)相同性的情况下,一般会发生杂交反应。严格杂交条件的一个例子是,在含有50%甲酰胺、5×SSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5×Denhardt’s溶液、10%硫酸葡聚糖和20毫克/毫升变性剪切鲑精DNA的溶液中,在42℃温育过夜,随后在0.1×SSC中于大约65℃冲洗杂交载体。其它的杂交和冲洗条件是公知的,并且在Sambrook等人的分子克隆:实验室手册(MolecularCloning:A Laboratory Manual),Cold Spring Harbor,NY(1989)第二版,尤其是第11章中有例子。

本发明还提供一种基本上由一种多核苷酸序列组成的多核苷酸,这样的多核苷酸可如此获得:在严格杂交条件下,用在多核苷酸序列表中列出的多核苷酸序列或其片段序列作为探针,筛选含有该种多核苷酸序列的完整基因的合适的文库;然后分离所述的核苷酸序列。用于获得这样一种多核苷酸的片段包括例如本文中所述的探针和引物。

正如本文所讨论的关于本发明的多核苷酸测定法,例如,本发明的多核苷酸可被用作RNA、cDNA或基因组DNA的杂交探针,以分离全长cDNA或编码多肽的基因组克隆,以及分离与序列表中列出的多核苷酸具有高度序列相似性的其它基因的cDNA或基因组克隆。这样的探针一般含有至少15个碱基。优选地,这样的探针具有至少30个碱基并可以具有至少50个碱基。尤其优选的探针将具有30-50个碱基,其中包括30和50个在内。

含有或含于序列表中列出的多核苷酸序列的每一种基因,其编码区可以利用序列表中提供的DNA序列筛选,以合成寡核苷酸。然后,使用与本发明的基因的序列具有序列互补性的标记寡核苷酸,对cDNA、基因组DNA或mRNA的文库进行筛选,以鉴定可与探针杂交的文库中的成员。例如,制备与dxr序列相应的合成的寡核苷酸。以寡核苷酸为引物,以聚合酶链式反应(PCR)技术获得dxr基因的5’和3’末端序列。或者,在可以根据特定的dxr肽制备出低简并性寡核苷酸的情况下,也可以将这样的探针直接用于筛选基因文库,以获得dxr基因序列。尤其是,筛选噬菌体载体中的cDNA文库有助于这种方法,因为杂交的背景较低。

一般地,使用核酸探针所获得的dxr序列显示出,靶dxr序列与用作探针的编码序列之间60-70%的序列相同。但是,也可以获得低至50-60%序列相同性的长序列。核酸探针可以是长的核酸序列片段,也可以是较短的寡核苷酸探针。当使用较长的核酸片段作为探针时(大于大约100bp),为了从靶样品中获得与探针序列具有20-50%偏差(即,50-80%的序列同源性)的序列,在进行筛选时可以将杂交的严格性降低。寡核苷酸探针可以比编码dxr酶的完整核酸序列短许多,但至少也应该为大约10个,优选至少为大约15个,更优选至少为大约20个核苷酸。当使用较短的区域作探针时,与较长的区域相比,希望能达到更高的序列相同性程度。因此,希望鉴定出高度保守的氨基酸序列区,以设计寡核苷酸探针,用于探测和回收其它相关的dxr基因。较短的探针对于聚合酶链式反应(PCR)常常特别有用,并且在可以鉴定出高度保守序列的情况下尤其如此(参见,Gould等人,1989,美国国家科学院院刊,86:1934-1938)。

本发明的另一方面涉及dxr多肽。这种多肽包括:在序列表中列出的分离的多肽及其多肽和片段,尤其是那些显示dxr活性并且与从序列表所列序列中选出的多肽序列具有至少50%、60%或70%,优选至少80%,更优选至少90%,最优选至少95%相同性的多肽,还包括这些多肽的组成部分,其中多肽的组成部分优选包含至少30个氨基酸,更优选包含至少50个氨基酸。

“相同性”,正如本领域所熟知的,是两种或更多种多肽序列间或者两种或更多种多核苷酸序列间的相互关系,其可通过比较这些序列而确定。在本领域中,“相同性”也指多肽或多核苷酸序列间的序列相关性程度,其可通过对这些序列一串串地进行比对而确定。“相同性”可以容易地通过已知的方法计算出,这些方法包括但不限于:在计算分子生物学(Computational Molecular Biology,Lesk,A.M.编辑,牛津大学出版社,纽约,1988);生物计算:信息学和基因组计划(Biocomputing:Informatics and Genome Projects,Smith,D.W.编辑,Academic Press,纽约,1993);序列数据的计算机分析(第一部分)(Computer Analysis of Sequence Data,Part I,Griffin,A.M.和Griffin,H.G.编辑,Humana Press,New Jersey,1994);分子生物学中的序列分析(Sequence Analysis in Molecular Biology,von Heinje,G.,AcademicPress,1987);Sequence Analysis Primers,Gribscov,M.和Devereux,J.编辑,Stockton Press,纽约,(1991);以及Carillo,H.和Lipman,D.,SIAM应用计算杂志(SIAM J Applied Math.),48:1073(1988)中描述的那些方法。在设计确定相同性的方法时,目的就是给出待测试序列间的最大匹配。而且,确定相同性的方法被编写在可公开获得的程序中。可用于确定两种序列间相同性的电脑程序包括但不限于:GCG(Devereux,J.等人,1984,核酸研究(Nucleic Acids Research),12(1):387);一组五个BLAST的程序,其中的三个用于核酸序列查询(BLASTN、BLASTX和TBLASTX),两个用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson,1994,生物技术趋势(Trends inBiotechnolgy),12:76-80;Birren等人,基因组分析(Genome Analysis),1:543-559(1997))。BLAST X程序可以从NCBI和其它途径公开获得(BLAST手册,Altschul,S.等人,NCBI NLM NIH,Bethesda,MD20894;Altschul,S.等人,分子生物学杂志(J.Mol.Biol),215:403-410(1990))。众所周知的Smith Waterman算法也可用于确定相同性。

多肽序列比较参数一般包括:

算法:Needleman和Wusch,分子生物学杂志,48:443-453(1970)

比较矩阵:BLOSSUM62,来自Hentikoff和Hentikoff,美国国家科学院院刊,89:10915-10919(1992)

空位处罚分:12

空位长度处罚分:4

能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数,连同对末端空位没有处罚分,就是进行肽比较的缺省设置参数。

多核苷酸序列比较的参数包括:

算法:Needleman和Wusch,分子生物学杂志,48:443-453(1970)

比较矩阵:匹配=+10,错配=0

空位处罚分:50

空位长度处罚分:3

能够采用这些参数的一个程序,可从Genetics Computer Group,Madison,Wisconsin公开获得,这个程序被称为“空位”程序。上述参数就是进行核酸比较的缺省设置参数。

本发明还包括下式的多肽:

              X-(R1)n-(R2)-(R3)n-Y

其中,位于氨基末端的X是氢,位于羧基末端的Y是氢或金属,R1和R3为任何氨基酸残基,n是一个介于1-1000之间的整数,R2是本发明的氨基酸序列,尤其是选自序列表中列出的氨基酸序列,优选在SEQ ID NO:2中提供的序列编码的那些氨基酸序列。在上式中,R2是有方向性的,其氨基末端残基位于左边,结合于R1,而其羧基末端残基位于右边,结合于R3。用一组R(R大于1)表示的任何氨基酸残基片段,可以是杂聚物,也可以是均聚物,优选为杂聚物。

本发明的多肽包括由多核苷酸编码的分离的多肽,其中的多核苷酸含有选自本文序列表中列出的序列。

本发明的多肽可以是成熟的蛋白质或者可以是融合蛋白质的一部分。

这些多肽的片段和变异体也被认为是本发明的一部分。一个片段就是一个变异体多肽,它所具有的氨基酸序列与前面描述的多肽的氨基酸序列的一部分而不是全部完全相同。这些片段可以独立存在,也可以含于一个更大的多肽中,其中该片段形成一部分或一个区域,最优选是形成单一连续区域。优选的片段为具有生物学活性的片段,它们可以介导本发明多肽的活性,其中包括那些具有相似活性或提高活性或降低活性的片段。本发明还包括那些在动物尤其是人中具有抗原性或免疫原性的片段。

这些多肽的变异体还包括与序列表中列出的序列不同的多肽,这些不同是由保守氨基酸的取代产生的,即一个氨基酸残基被另一个具有相似性质的氨基酸残基取代。一般地,这中取代发生在Ala、Val、Leu和Ile之间,Ser和Thr之间,Asp和Glu之间,Asn和Gln之间,Lys和Arg之间,Phe和Tyr之间。尤其优选其中5-10、1-5、1-3个或者1个氨基酸被以任何组合取代、缺失或添加的变异体。

那些是本发明多肽片段的变异体,通过肽合成可用于产生相应的全长多肽。因而,可将这些变异体用作生成本发明的全长多肽的中间体。

本发明的多核苷酸和多肽可用于,例如,转化宿主细胞诸如植物宿主细胞,正如本文所进一步讨论的。

本发明还提供了编码多肽的多核苷酸,其中的多肽为成熟蛋白质再加上添加的氨基或羧基末端氨基酸,或者成熟的多肽中的氨基酸(例如,当蛋白质的成熟形式具有多于一个多肽链时)。这种序列可以,例如,在蛋白质从前体到成熟形式的转变加工中起作用,帮助蛋白质转运,缩短或延长蛋白质半寿期,或者在蛋白质的测定或生产中简化操作。预期可使用胞内酶从成熟的蛋白质中除去任何添加的氨基酸。

具有融合到一种或多种前序列(prosequence)的成熟形式的多肽的前体蛋白质,可能是该多肽的无活性形式。一般地,当前序列被除去时,无活性前体被激活。在激活之前可以将一部分或者全部前序列除去。这种前体蛋白质一般称为前蛋白质。所使用的构建体和方法

我们尤其感兴趣的是将核苷酸序列用于重组DNA构建体,以指导本发明的dxr序列在宿主细胞中的转录或转录及翻译(表达)。表达型构建体一般含有宿主细胞中的功能性启动子,该启动子有效地连接到本发明的编码dxr的核酸序列,还含有宿主细胞中的功能性转录终止区。在本发明中尤其感兴趣的宿主细胞包括但不限于真菌细胞、酵母细胞、细菌细胞、哺乳动物细胞和植物细胞。

当序列的排列方式使得第一种核酸序列影响到第二种核酸序列的功能时,这两种核酸序列就是“有效地连接”或“有效地结合”。优选地,这两种序列是单一连续核酸分子的一部分,更优选地,这两种序列相邻。例如,如果一个启动子调节或介导一个基因在细胞中的转录,那么,所述启动子就与所述基因进行了有效地连接。

本领域的技术人员会认识到,在植物细胞中有许多功能性启动子,并且已在文献中对它们进行了描述。还展望了叶绿体和质体特异性启动子,叶绿体或质体中功能性启动子,以及在叶绿体或质体中有效的启动子。

一组植物功能性启动子为组成型启动子如CaMV35S或FMV35S启动子,它们在大多数植物器官中产生高水平的表达。已将CaMV35S和FMV35S启动子的增强或复制版本用于本发明的实践中(Odell等人,1985,自然(Nature),313:810-812;Rogers,美国专利5378619)。另外,可优选让dxr基因在植物的特定组织(如叶、茎、根、块茎、种子、果实等)中表达,并且所选择的启动子应具有所需要的组织和发育特异性。

尤其感兴趣的是,使本发明的核酸序列从转录起始区开始表达,并优先在植物种子组织中表达。这种优先在种子中转录起始的序列例子包括那些源自编码植物储藏蛋白质基因序列或者油料种子中参与脂肪酸生物合成的基因的序列。这种启动子的例子包括来自诸如napin(Kirdle等人,1991,种子科学研究(Seed Sci.Res.),1:209-219)、菜豆蛋白、玉米醇溶蛋白、大豆胰蛋白酶抑制剂、ACP、硬脂酰-ACP去饱和酶、大豆β-conglycin的α’亚单位(大豆7s,(Chen等人,1986,美国国家科学院院刊,83:8560-8564))和油质蛋白的基因的5’调节区。

指导具有dxr的蛋白质定位于特定的亚细胞隔离空间例如线粒体、内质网、液泡、叶绿体或其它质体性隔离空间中,也许是有益的。例如,当将本发明的目的基因靶向质体诸如叶绿体以表达时,构建体也要使用指导基因至质体的序列。这种序列在本文中称为叶绿体转运肽(CTP)或质体转运肽(PTP)。这样,在没有将目的基因直接插入到质体中的情况下,表达型构建体将另外含有编码转运肽的基因,从而指导目的基因至质体。叶绿体转运肽可以是源自目的基因,也可以是源自具有CTP的异种序列。这种转运肽在本领域中是公知的。参见例如,VonHeijne等人,植物分子生物学研究(Plant Mol.Biol.Rep.),9:104-126(1991);Clark等人,生物化学杂志(J.Biol.Chem.),264:17544-17550(1989);della-Cioppa等人,植物生理学(Plant Physiol.),84:965-968(1987);Romer等人,生物化学与生物物理学研究通讯(Biochem.Biophys.Res.Commun.),196:1414-1421(1993);以及Shah等人,科学(Science),233:478-481(1986)。

根据目的用途,构建体可以含有编码整个dxr蛋白质或其一个组成部分的核酸序列。例如,当需要反义抑制给定的dxr蛋白质时,就不需要完整的dxr序列。而且,当用于构建体中的dxr序列是旨在用作探针时,则制备只含有dxr编码序列的特定组成部分(例如,被发现是编码高度保守的dxr区的序列)的构建体可能是有益的。

技术人员会认识到,用于抑制内源序列在宿主细胞中表达的方法有许多。这种方法包括但不限于反义抑制(Smith等人,1988,自然,334:724-726)、共抑制(Napoli等人,植物细胞(Plant Cell),2:279-289)、核酶(PCT公开说明书,WO 97/10328)以及有义与反义的组合(Waterhouse等人,1998,美国国家科学院院刊,95:13959-13964)。在宿主细胞中抑制内源序列的方法一般使用了转录或转录及翻译至少一部分待抑制序列。这种序列可以与内源序列的编码区同源,也可以与内源序列的非编码区同源。

本发明的植物表达构建体也可以提供调节转录本的终止区。转录本的终止区可以由编码dxr的DNA序列提供,或者由不同基因来源的方便的转录终止区提供,例如,与转录本起始区天然结合的转录本终止区。技术人员会认识到,任何能够在植物细胞中终止转录的方便的转录本终止区,都可以在本发明的构建体中予以采用。

或者,也可以将构建体制备为可以指导dxr序列直接从宿主植物细胞的质体表达。这种构建体和方法为本领域所公知,并一般描述于,例如,Svab等人,1990,美国国家科学院院刊,87:8526-8530;Svab和Maliga,1993,美国国家科学院院刊,90:913-917;以及美国专利5693507中。

本发明的构建体也可用于这样的方法:用表达添加基因(参与类异戊二烯化合物生成)的添加构建体,通过类异戊二烯途径改变代谢流。这样的序列包括但不限于1-脱氧木酮糖5-磷酸合酶。

而且,本发明的构建体也能够用于转化方法中,其中使用在生成特定的类异戊二烯化合物(诸如生育酚、类胡萝卜素、固醇、单萜、倍半萜和双萜)中提供编码蛋白质的添加核酸序列的表达的添加的构建体。参与生成类胡萝卜素的核酸序列和方法在例如描述于PCT公开说明书WO 99/07867中。参与生成生育酚的核酸序列包括但不限于γ-生育酚甲基转移酶(Shintani等人,1998,科学,282(5396):2098-2100)、生育酚环化酶、生育酚甲基转移酶、叶绿基异戊二烯基转移酶、牻牛儿牻牛儿焦磷酸氢化酶、牻牛儿牻牛儿焦磷酸合酶。

当将含有表达型构建体的重组DNA构建体引入到植物的细胞、组织、器官中或植物中时,我们就认为植物的细胞、组织、器官或植物已被转化、转染或转基因。转基因或转化的细胞或植物也包括细胞或植物的后代,以及由育种项目而产生的后代,该育种项目在杂交试验中采用这样的转基因植物作为亲本,并且这些后代由于dxr核酸序列的存在而表现出变化的表型。

具有dxr编码序列并作为提高或减低其表达的目的DNA序列的植物表达或转录型构建体,可用于广泛多种植物生命体中。用于本发明方法的尤其优选的植物包括但不限于:金合欢、苜蓿、茴香树、苹果树、apricot、洋蓟、arugula、石刁柏、鳄梨树、芭蕉属植物、大麦、豆科植物、甜菜、黑莓、乌饭树、嫩茎花椰菜、brussels sprout、卷心菜、canola、罗马甜瓜、胡萝卜、木薯、花椰菜、芹菜、樱桃树、菊苣属植物、cilantro、柠檬、clementines、咖啡树、玉米、棉花、黄瓜、Douglas冷杉、茄子、苣荬菜、escarole、桉树属植物、茴香、无花果属植物、大蒜、葫芦属植物、葡萄、葡萄柚、加甜味烟草、jicama、kiwifruit、莴苣、韭葱、柠檬树、lime、Loblolly松树、芒果、甜瓜、菌类植物、油桃、坚果、燕麦属植物、油棕榈、菜籽油油菜、okra、洋葱、柑橘属植物、一种装饰性植物、番木瓜树、欧芹、豌豆、桃树、花生、梨树、胡椒属植物、柿树、松树、菠萝、车前草、李属植物、石榴树、杨属植物、马铃薯、南瓜、quince、放射状松树、radicchio、小萝卜、木莓、水稻、黑麦、高粱、Southern松树、大豆、菠菜、草莓、糖甜菜、甘蔗、向日葵、白薯、sweetgum、红橘树、茶树、烟草、西红柿、triticale、草皮、芜菁、一种葡萄树、西瓜、小麦、薯蓣属植物和zucchini。

尤其优选这样的植物,它们参与生成食用或工业用途的植物油。最特别优选温带油料作物。感兴趣的温带油料作物包括但不限于:油菜仔(Canula和高芥子酸变种)、向日葵、红花、棉花、大豆、花生、椰子和油棕以及玉米。依据引入重组构建体至宿主细胞内所使用的方法,也许需要其它DNA序列。重要的是,本发明适用于双子叶种类的植物和单子叶种类的植物,并可以容易地适用于新的和/或改进的转化和调节技术。

尤其感兴趣的是,在植物中使用了dxr构建体,以产生这样的植物或植物体部分(其中包括但不限于叶、茎、根、生殖性部分和种子),在具有转化植物细胞的植物体部分中,生育酚的含量被改变。

为了进行免疫学筛选,用纯化的蛋白质或其组成部分注射兔或小鼠就可以制备针对该蛋白质的抗体,这种制备抗体的方法为本领域人员所公知。可以制备产生单克隆抗体或多克隆抗体,尽管在一般情况下多克隆抗体对于基因分离更有用。可以进行Western分析,以确定在所希望的植物种类的粗提取物中有相关蛋白质的存在,例如采用针对被编码蛋白质的抗体通过交叉反应来确定。当观察到交叉反应时,通过筛选代表所希望植物种类的表达文库,将编码相关蛋白质的基因分离。表达文库可构建于多种可商购载体中,包括λgtll,正如在Sambrook等人的分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual),Cold Spring Harbor Laboratory,Cold Spring Harbor,New York第二版(1989)中所描述的。

为了证实被鉴定为dxr酶的核酸序列所编码的蛋白质的活性和特异性,采用杆状病毒表达系统在昆虫细胞培养物中进行了体外测定。这种杆状病毒表达系统为本领域所公知,并且在Lee等人的美国专利5348886中有描述,本文引用其全部作为参考。

另外,可以制备其它表达型构建体,以使用不同的表达系统测定蛋白质活性。将这种表达型构建体转化到酵母或原核细胞宿主内并测定dxr活性。这种表达系统为本领域所公知,并可容易地通过商业途径获得。

除了在本发明中所描述的序列外,用于本发明的DNA编码序列也可源自藻、真菌、细菌、哺乳动物来源物、植物等。可以使用与dxr的保守核苷酸或氨基酸序列相应的特征序列,在已有的数据库中进行同源性搜索,从而从其它来源物诸如植物和微生物中分离相当、相关基因。也可以在EST数据库中进行搜索。而且,本发明还包含在功能上、酶本身方面与本文所公开的相当的DNA序列编码酶的用途,其中该DNA序列是本文中所公开的与遗传密码的简并性相一致的核酸序列的简并性相当物。使用任何这些方法所鉴定的编码序列,对其功能的证实,可以通过缺乏特异性生化反应或者已经发生突变的合适生物体(例如,聚胞蓝细菌属(Synechocystis)、Schewanella、酵母、假单胞菌属(Pseudomonas)、红细菌科(Rhodobacteria)等)的突变体的互补来实现。DNA编码区的序列可以依据密码子的使用选择性,通过基因合成予以最优化,从而在特定的宿主中实现表达的最大化。

在获得这种转基因植物中,转化方法对于本发明并不是非常重要,并且当前有多种植物转化方法可供使用。另外,如果有更新可用于转化作物的方法,此后可以直接应用这些新方法。例如,天然对农杆菌属(Agrobacterium)感染敏感的许多植物种类,可以通过农杆菌属介导转化的三分或二分载体方法予以成功地转化。在许多情况下,希望使构建体的一侧或两侧都与T-DNA相连,优选使左侧和右侧与T-DNA相连,更优选使右侧相连。这在构建体使用根癌农杆菌(A.tumefaciens)或毛根农杆菌(A.rhizogenes)作为转化方式时显得尤其有用,尽管T-DNA边缘区在其它转化方式中也有用途。另外,已经开发了显微注射、DNA颗粒轰击和电穿孔技术,这些技术可以转化多种单子叶和双子叶植物种类。

在正常情况下,在DNA构建体中将包含这种结构基因,它具有在宿主中表达所必需的调节区并提供对转化细胞的选择。该基因可以提供对一种细胞毒试剂例如抗生素、重金属、毒素等的抗性,通过互补对营养缺陷型宿主提供原养型,提供病毒免疫力等等。根据不同宿主种类的数目,引入表达型构建体或其组分,可以使用一种或多种标记,从而对不同的宿主种类使用不同的选择条件。

在使用农杆菌属转化植物细胞时,可以使用这样一种载体,其被引入农杆菌属宿主后,可与存在于农杆菌属宿主中的T-DNA或Ti-或Ri-质粒进行同源重组。含有T-DNA(用于重组)的Ti-或Ri-质粒可以被接臂(能引起瘿的形成)的,也可以被断臂(不能引起瘿的形成)的,在后一种情况下,只要vir基因存在于转化的农杆菌属宿主中就是可行的。接臂的质粒能够产生正常植物细胞与瘿的混合物。

在将农杆菌属用作转化宿主植物细胞的媒介物的情况下,将通过T-DNA边缘区相连的表达或转录构建体插入到一种宽宿主范围的载体中,这种载体具有在大肠杆菌以及农杆菌属中复制的能力,在文献中有对多种宽宿主范围载体的描述。通常使用的是pRK2或其衍生物。参见例如,Ditta等人,1980,美国国家科学院院刊,77:7347-7351以及EPA 0120515,此处引用作为参考。或者,也可以将准备在植物细胞中表达的序列插入到含有独立的复制序列的载体中,其中的一个复制序列在大肠杆菌中稳定载体,另一个在农杆菌属稳定载体。见例如,MacBride等人,1990,植物分子生物学(Plant Mol.Bol.),14:269-276,其中使用了pRiHRI复制起点(Jouanin等人,1985,分子普通遗传学(Mol.Gen.Genet.),201:370-374),并使植物表达载体在宿主农杆菌属细胞中的稳定性增加。

包括表达型构建体和T-DNA的可以是一种或多种标记,它们允许对转化的农杆菌属以及转化的植物细胞进行选择。已经开发了若干种用于植物细胞的标记,诸如对氯霉素、卡那霉素、氨基糖苷G418、潮霉素等的抗性,本发明并不要求必须使用某种标记,而是根据特定的宿主以及构建的方式优选一种或另一种标记。

在使用农杆菌属转化植物细胞时,可以将外植体与转化的农杆菌属合并在一起并温育足够的时间以使转化发生,细菌被杀死,然后将植物细胞培养于合适的选择培性养基中。一旦愈伤组织形成,通过使用合适的植物激素(采用公知的方法)可以催促茎干形成,然后将茎干转移到生根培养基中以再生植物。接着可以让植物生长结种,然后将种子用于建立重复生产以及用于分离植物油。

有几个可能的方法,用来获得含有多个表达型构建体的本发明的植物细胞。本发明包含了任何用于生成植物的方法,该植物具有一种构建体,其具有编码本发明的表达型构建体的DNA序列,以及至少一种其它构建体,其具有另一种编码酶的DNA序列。例如,可以通过将两种表达型构建体合在单一种转化载体中,或使用独立的载体将表达型构建体与第二种构建体同时用于转化植物,其中的每一种载体均表达所需要的基因。还可以将第二种构建体引入到已经用dxr表达型构建体转化的植物中,或者也可以将一个是表达dxr构建体、另一个是表达第二种构建体的被转化植物,互相进行杂交,从而使两种构建体合于同一植物中。

可以将本发明的核酸序列用于构建体中,以提供在多种宿主细胞(真核细胞和原核细胞)中该序列的表达。本发明的宿主细胞优选包括单子叶和双子叶植物细胞。

一般地,技术人员对那些描述大分子(例如,DNA分子、质粒等)的构建、操作和分离,产生重组生物体以及筛选和分离克隆(参见例如,Sambrook等人的分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual),Cold Spring Harbor Press(1989);Maliga等人,植物分子生物学方法(Methods in Plant Molecular Biology),Cold SpringHarbor Press(1985),其全部内容在此处引入作为参考;Birren等人,基因组分析:分析DNA(Genome Analysis:Analysing DNA),1,NewYork,其全部内容在此处引入作为参考)的特定条件及方法的标准资料都很熟悉。

在昆虫细胞中表达序列的方法在本领域中是公知的。杆状病毒表达载体是重组的昆虫病毒,其中已将所选择的外源基因的编码序列插入到杆状病毒启动子的后面,以取代病毒基因,例如,多角体蛋白基因(Smith和Summers,美国专利4745051,其全部内容在此处引入作为参考)。杆状病毒表达载体为本领域所公知,并在例如Doerfler,1968,Curr.Top.Microbiol.Immunol.,131:51-68;Luckrow和Summers,1988a,生物技术(Bio/Technology),6:47-55;Miller,1988,微生物学年鉴(Annual Review ofMicrobiology),42:177-199;Summers,1988,Curr.Comm.Molecular Biology,Cold Spring Harbor Press,Cold Spring Harbor,N.Y;Summers和Smith,1988,杆状病毒载体和昆虫细胞培养的方法手册(A Manual of Methods for Baculovirus Vectors and Insect CellCulture Procedures),Texas Ag.Exper.Station Bullentin No.1555中对其进行了描述,其全部内容在此处引入作为参考。

在真菌宿主细胞中表达目的核酸序列的方法为本领域所公知。真菌宿主细胞可以是例如,酵母细胞或丝状真菌细胞。在酵母细胞中表达目的DNA序列的方法一般描述于“酵母的遗传学和分子生物学指南“(Guide to Yeast Genetics and Molecular Biolgy),Guthrie和Fink编辑,酶学方法(Methods in Enzymology),Academic Press,Inc.,第194卷(1991年);以及“基因表达技术”(Gene Expression Technology),Goeddel编辑,酶学方法,Academic Press,Inc.,第185卷(1991年)。

可用作表达宿主的哺乳动物细胞是本领域所公知的,其中包括许多无限增殖化细胞系,可从美国典型培养物保藏中心(ATCC,Manassas,VA)得到它们,诸如Hela细胞、中国仓鼠卵巢(CHO)细胞、幼小仓鼠肾(BHK)细胞和若干其它细胞系。用于哺乳动物细胞的合适的启动子也是本领域所公知的,其中包括但不限于病毒性启动子诸如来自猴病毒40(SV40)(Fiers等人,1978,自然,273:113,此处引入其全部内容作为参考)、劳斯肉瘤病毒(RSV)、腺病毒(ADV)和牛乳头瘤病毒(BPV)的启动子。哺乳动物细胞也需要终止子序列和poly-A添加序列。也可以将提高表达的增强子序列包括在内,并且也希望含有可促进基因扩增的序列(例如,甲氨蝶呤抗性基因)。

适于在哺乳动物细胞中复制的载体是本领域所公知的,其中可包括病毒性复制子,或者能够确保将编码表位的适当序列整合到宿主基因组中的序列。已经对那些极大地促进重组病毒构建的质粒载体进行了描述(参见例如,Mackett等人,1984,病毒学杂志(J.Virol.),49:857;Chakrabarti等人,1985,分子细胞生物学(Mol.Cell.Biol.),5:3403;Moss,哺乳动物细胞基因转移载体(Gene Transfer Vectors forMammalian Cells),Miller和Calos编辑,Cold Spring Harbor Laboratory,N.Y.,1987年,第10页;此处引入上述全部文献的全部内容作为参考)。

到目前为止,我们已对本发明进行了综述,通过参考下面的实施例,将更容易了解本发明,所给出的这些实施例,仅用于说明,而不是构成对本发明的限制。

                          实施例

实施例1:2-C-甲基-D-赤藓醇的合成

根据Duvold等人的Tetrahedron Lett.,38:4769-4772(1997)以及Duvold等人的Tetrahedron Lett.,38:6181-6184(1997),并进行相应的改变以适应更大量生产,合成了具有大约80%(如有错误,可予更正)的2-C-甲基-D-赤藓醇。将3-甲基-2(5H)-呋喃糖(200mg,2mmol)的无水乙醚(20ml)溶液,在氩气下,于0℃在15分钟长的时间,加入到搅拌的LiAlH4(46mg,1.2mmol)无水乙醚(20ml)悬浮液中。将反应混合物在0℃下再搅拌2小时。将饱和NH4Cl溶液(2ml)缓慢地加入到其中,直到将过量LiAlH4破坏。在用1M HCl溶液酸化直到所有的铝盐被溶解后,用乙酸乙酯(6×12ml)对液相进行萃取。将合并的有机相层用饱和盐水冲洗,然后用无水Na2SO4干燥。在减压条件下将溶剂除去后,将此二醇粗品(177mg)溶于二氯甲烷(20ml),然后在催化量的二甲胺吡啶(12mg)存在下在乙酸酐/三乙胺混合液(2∶3,体积/体积,1ml)中直接乙酰化15分钟。在减压条件下将溶剂和过量的试剂蒸发掉。采用急骤柱层析(Flash column chromotography)(Still等人,1978)(己烷/乙酸乙酯,4∶1,体积/体积),得到纯的双乙酸酯(330mg,86%)。于0℃搅拌下,在有手性osmylation试剂AD-混合物-b(2.5g)和CH3SO2NH2(152mg,1.6mmol)存在下在叔丁醇/水(1∶1,体积/体积,6ml)中对该双乙酸酯(300mg,1.6mmol)进行对映体选择性二羟基化。24小时后,用固体Na2SO3终止反应,并继续搅拌30分钟。用乙酸乙酯重复萃取(6×12ml)和急骤层析(乙酸乙酯),获得一种仅含2-C-甲基-D-赤藓醇双乙酸酯的混合物(312mg,88%产率)(得自部分分子内转酯化作用)。在有碱性大孔树脂Amberlyst A-26(OH-型)(每毫摩尔150毫克)的存在下在甲醇(30ml)中于室温过夜,进行定量脱乙酰化(Reed等人,1981)。在对树脂进行过滤和对溶剂进行蒸发后,就可直接获得纯的2-C-甲基-D-赤藓醇(190mg,75%的总产率)。

实施例2:大肠杆菌dxr基因的定点标记插入诱变

使用从野生型大肠杆菌菌株W3110中分离的基因组DNA(Kohara等人,1987)以及引物P1(5’-CTCTGGATGTCATATGAAGCAACTC-3’(SEQ ID NO:3),其中下划线的ATG相当于dxr基因的翻译起始密码子)和P2(5’-CCGCATAACACCGCCAACC-3’(SEQ ID NO:4),其位于yaeS基因的3’侧翼区域),PCR扩增从dxr基因5’区至yaeS基因3’侧翼区域的延伸区。PCR反应混合物的终体积为50μl,其中含有DNA模板(100ng)、每种引物0.5μM、每种脱氧核苷三磷酸200μM、pH调至8.8的Tris-HCl 20mM、MgSO42mM、KCl 10mM、(NH4)2SO4 10mM、BSA 0.1mg/ml和Triton X-100 0.1%。将样品用矿物油覆盖,在94℃温育3分钟,然后冷却至80℃。加入Pfu DNA聚合酶(1.25个单位,Stratagene),然后将反应混合物温育30个循环,其中每个循环为:94℃45秒、59℃ 45秒和72℃ 10分钟,循环完成后,接最后一步72℃10分钟。扩增后,根据制造商的说明书方法对PCR产物进行3’末端加腺嘌呤,然后将腺苷酰化的产物克隆到pGEM-f载体(Promega)中,以生成质粒pMJ1。将存在于质粒pCAT19(Fuqua,1992)中的CAT(氯霉素乙酰转移酶)基因用PstI和XbaI消化切割出来,用T4 DNA聚合酶处理,然后通过钝端连接克隆到dxr基因中的独有AsuII位点上(在用T4 DNA聚合酶处理后),得到质粒pMJ2。使用了限制酶图谱以鉴定这种克隆,其中的CAT基因与dxr基因处于同一方向。将从质粒pMJ2中切割下来的SpeI-SphI片段亚克隆至质粒pBR322的NheI-SphI位点上,构建出质粒pMJ3。用PstI消化使质粒pMJ3线性化,用小牛肠碱性磷酸酶(GibcoBRL)温育,用琼脂糖凝胶电泳纯化。用2μg纯化的线性质粒pMJ3转化大肠杆菌菌株JC7623(Winans等人,1985)。将转化细胞涂于补充有2mM 2-C-甲基-D-赤藓醇(ME)以及氯霉素(17μg/mL)的LB平板(Ausubel等人,1987)上。将既显示氯霉素抗性又显示ME营养缺陷的克隆选择出来供进一步研究。使用引物P3(5’-GCACACTTCCACTGTGTGTG-3’(SEQ IDNO:5),其位于frr基因的5’区域)和P2,通过PCR检测CAT基因已插入到dxr基因中。将这些克隆中的一个(被指定为菌株JC7623 dxr:CAT),用于互补实验。

实施例3:cDNA末端快速扩增(RACE)

为了鉴定推定为编码1-脱氧-D-木酮糖5-磷酸还原异构酶(DXR)的同源物的植物核酸序列,用最近克隆的大肠杆菌DXR(Takahashi等人,1998)的完整氨基酸序列作为查询序列,利用TBLASTN程序搜索国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)的非冗余(Non-Redundant)数据库。在该查询序列与由拟南芥(A.thaliana)基因组克隆MQB2(收录号ABOO9053)的7个推测的外显子所编码的氨基酸序列之间发现了相当水平的相同性(40-64%)。

为了证实与推定的拟南芥DXR基因相对应的mRNA序列的存在,用克隆MOB2的核苷酸序列(从核苷酸29247延伸至31317)作为查询序列,利用BLASTN程序搜索NCBI的EST数据库(dbEST)。发现了两个拟南芥EST克隆(12OE8T7和65F11XP3’,收录号分别为T43949和AA586087),它们含有与查询序列的不同区域相同的核苷酸序列。对cDNA插入物的测序表明,这两个克隆有重叠。最长的cDNA中含有一个开放读框,它编码一个329个残基的多肽,其与大肠杆菌DXR的C-末端区域有41.6%的相同性(相似性53.2%),这就表明这两个cDNA编码了被认为是拟南芥酶的截短形式。

按Dean等人(1985)的描述,纯化光照生长12天的拟南芥(Columbia变种)籽苗中的总RNA。采用Life Technologies/Gibco BRL的5’-RACE-系统(2.0版本),根据提供商的指示,进行cDNA末端快速扩增(RACE)。使用1μg RNA样品作为模板以及寡核苷酸DXR-GSP1(5’-ATTCGAACCAGCAGCTAGAG-3’(SEQ ID NO:6),与SEQ ID NO:1中显示的核苷酸+767至+786互补)作为特定的下游引物,合成cDNA的第一链。在对cDNA进行纯化和同聚物加尾后,进行两个嵌套式PCR反应。在第一个PCR反应中,特定的下游引物为寡核苷酸DXR-GSP2(5’-CCAGTAGATCCAACGATAGAG-3’(SEQID NO:7),与SEQ ID NO:1中显示的核苷酸+530至+550互补),上游引物为寡核苷酸5’-RACE-AAP(试剂盒中提供)。在第二个PCR反应中,特定的下游引物为寡核苷酸DXR-GSP3(5’-GGCCATGCTGGAGGAGGTTG-3’(SEQ ID NO:8),与SEQ ID NO:1中显示的核苷酸+456至+475互补),上游引物为寡核苷酸AUAP(试剂盒中提供)。在这两个PCR反应中,扩增过程均起始于样品的变性(在94℃下3分钟),冷却至80℃,然后加入Taq DNA聚合酶。第一个PCR反应的混合物温育15个循环,每个循环为94℃30秒、55℃30秒和72℃1分钟,循环完成后,接最后一步72℃ 5分钟。将所得到的样品按1比10稀释于第二个PCR反应混合物中,然后温育30个循环,每个循环为94℃ 30秒、61℃30秒和72℃ 1分钟,最后一步为72℃ 5分钟。用琼脂糖凝胶电泳对最终的扩增产物进行纯化,然后克隆到质粒pBluescript SK+上并进行测序(SEQ ID NO:1)。

实施例4:从拟南芥中克隆1-脱氧-D-木酮糖5-磷酸还原异构酶的cDNA

为了确定推定的DXR基因的5’区域,使用RACE技术对相应的转录起始位点进行定位。在对大肠杆菌的DXR与从拟南芥基因组克隆推导出的氨基酸序列进行比对的基础上,设计了引物。在SEQ IDNO:2中提供了从拟南芥菜属的dxr核酸序列(SEQ ID NO:1)推导出的氨基酸序列。用拟南芥籽苗的RNA作为模板,用寡核苷酸DXR-GSP1作为引物,合成了cDNA的第一条链。其中的寡核苷酸与SEQ ID NO:1中显示的基因组序列+767位至+786位间的区域互补。随后,进行两个嵌套式PCR反应,以扩增mRNA的5’末端。用于第一及第二个嵌套式PCR反应的下游特定引物分别与从+530位至+550位(引物DXR-GSP2)和+456位至+475位(引物DXR-GSP3)的区域互补。对与主要扩增产物对应的4个克隆进行了测序并发现它们都具有相同的5’末端,该末端与SEQ ID NO:1中显示的基因组序列的+1位腺嘌呤相对应。

通过两个连续PCR反应,从源自拟南芥(Columbia变种)的细胞系T87悬浮液的cDNA文库中,扩增含有拟南芥菜属完整的DXR编码序列的cDNA。将一份文库用乙醇进行沉淀,然后再悬浮于水中。第一个PCR反应的混合物终体积为25μl,其中含有:DNA模板(相当于cDNA文库的4×105个空斑形成单位),上游引物DXR-34(5’-CAAGAGTAGTAGTGCGGTTCTCTGG-3’(SEQ ID NO:9),与SEQID NO:1中显示的序列+34至+58相对应)0.5μM,下游引物DXR-E2(5’-CAGTTTGGCTTGTTCGGATCACAG-3’(SEQ ID NO:10),与SEQ ID NO:1中显示的核苷酸序列+3146至+3169互补)0.5μM,每种脱氧核苷三磷酸200μM、pH调至8.8的Tris-HCl 20mM、MgSO42mM、KCl 10mM、(NH4)2SO4 10mM、BSA 0.1mg/ml和Triton X-1000.1%。将样品用矿物油覆盖,在94℃下温育3分钟,然后冷却至80℃。加入Pfu DNA聚合酶(1.25个单位,Stratagene),然后将反应混合物温育35个循环,每个循环为94℃ 30秒、55℃40秒和72℃ 6.5分钟,循环完成后,接最后一步72℃ 15分钟。用水将反应混合物按1∶10稀释,取出5μl用作第二个PCR的模板,进行第二个PCR的条件,除了将反应体积增加到50μl和将循环数减至15个以外,均与所描述的前面的扩增条件相同。用琼脂糖凝胶电泳对扩增产物进行纯化,然后克隆到质粒pBluescript SK+上。将所得质粒命名为pDXR-At。

这样,使用DXR-34和DXR-E2(分别与基因组序列的从+34位至+58位以及+3146位至+3169位的延伸区域相对应)为引物,从cDNA文库中通过PCR获得了编码拟南芥的完整DXR的cDNA克隆。通过DNA测序,证实了所扩增的cDNA的相同性。对cDNA与基因组序列所进行的比对表明,拟南芥DXR基因含有12个外显子和11个内含子,其延伸区域为3.2Kb(SEQ ID NO:1)。

所克隆的cDNA编码一个477个氨基酸残基的蛋白质,其推定的分子量为52kDa。对拟南芥与大肠杆菌的DXR所进行的比对(图1)显示,这个植物酶有一个具有质体转移肽的典型特征的79个残基的N-末端延伸(von Heijne等人,1989)。这两个蛋白质显示42.7%的相同性(54.3%的相似性)。

实施例5:表达型构建体的制备

为了在大肠杆菌中表达拟南芥DXR,从质粒pDXR-At中PCR扩增DXR cDNA的编码氨基酸残基81-477的区域,并将其克隆到经过修饰的质粒pBAD-GFPuv(Clontech)中。在这个质粒中,表达是由PBAD启动子驱动的,该启动子可被阿拉伯糖诱导和被葡萄糖抑制。首先,对质粒pBAD-GFPuv进行修饰,依照Kunkel等人的方法(Kunkel等人,1987)采用定点诱变将位于pBR322ori和araC编码区之间的NdeI位点(4929-4931位)除去。将寡核苷酸pBAD-mutl(5’-CTGAGAGTGCACCATCTGCGGTGTGAAATACC-3’(SEQ ID NO:11))用作诱变引物。将所生成的质粒指定为pBAD-Mi。接着,通过PCR将NdeI和EcoRI限制位点引入到拟南芥DXR cDNA的合适部位中,其中使用质粒pDXR-At作为模板,使用寡核苷酸5’-MVKPI(5’-GGCATATGGTGAAACCCATCTCTATCGTTGGATC-3’(SEQ ID NO:12),与在SEQ ID NO:1中列出的核苷酸序列+522至+544互补,其中下划线序列含有NdeI位点)和DXR-END(5’-ACGAATTCATTATGCATGAACTGGCCTAGCACC-3’(SEQ ID NO:13),与在SEQ ID NO:1中列出的核苷酸序列+2997至+3018互补,其中下划线序列含有EcoRI位点)作为诱变引物。用NdeI和EcoRI消化PCR扩增产物并将其克隆到用相同的限制酶消化的质粒pBAD-M1中。这就使得质粒pBAD-M1中的GFPuv编码序列被拟南芥DXR的相应的编码序列替代。将所得质粒(被指定为pBAD-DXR)引入到菌株XL1-Blue中。在互补实验中,编码GFPuv的质粒pBAD-M1被作为对照使用。

实施例6:拟南芥dxr的分析

通过互补实验分析一株其所携带的dxr基因中有一处被破坏的大肠杆菌(菌株JC7623 dxr.:CAT)(见实施例2),已建立了所克隆的拟南芥DXR的功能。菌株JC7623 dxr.:CAT的生长需要2-C-甲基-D-赤藓醇(ME)。在互补实验中,我们使用了拟南芥DXR的从氨基酸81至477所延伸的一段区域(见SEQ ID NO:2),它不包括推定的质体转移肽。将合适的cDNA片段克隆到质粒pBAD-GFPuv的一个衍生物中,并处于PBAD启动子的控制之下,然后将所得到的质粒(pBAD-DXR)引入到JC7623 dxr.-CAT菌株中。从PBAD启动子的表达可被阿拉伯糖诱导和被葡萄糖抑制。用阿拉伯糖诱导可以使含有质粒pBAD-DXR的菌株JC7623 dxr.-CAT在没有ME存在的情况下生长,而在有葡萄糖存在的情况下没有观察到该菌株的任何生长。携带控制质粒pBAD-M1的菌株JC7623 dxr.,:CAT在有阿拉伯糖存在、缺乏ME的培养基上并不生长。携带质粒pBAD-DXR或者pBAD-GFPuv的菌株JC7623 dxr.-CAT在含有ME的培养基上生长。这些结果明确无误地证实了所克隆的拟南芥cDNA编码一个功能性DXR。

在本发明中所提到的所有出版物和专利申请,都表示了本发明所属于的本领域技术人员的技术水平。本文中被引用作为参考的所有出版物和专利申请,都是以特定的和独立的方式引用作为参考。

尽管前面已通过例证和实施例对本发明进行了一些详细描述,以便对本发明有一个清楚的理解,但是很显然,在所附的权利要求书的范围内,还可以对本发明进行某些变化和修饰。

                          序列表<110>卡尔根尼有限公司(Calgene LLC)<120>涉及类异戊二烯合成的核酸序列<130>17142/00/WO<150>US 60/129,899<151>1999-04-15<150>US 60/146,461<151>1999-07-30<150>PCT/US00/10367<151>2000-04-14<160>13<210>1<211>3400<212>DNA<213>拟南芥菜属种<400>1cttgttacta aatgctcagc gaaatcttta aaaaatgaca aaaatctgtt gggtaccatt       60caaatccaga ttcctttctt atcatcatct ctctctctca cactgtttat ctgattcgtc      120ttctctgata atcaagagta gtagtgcggt tctctggaaa atattcgatt tttaaaagac      180tctgatgatg acattaaact cactatctcc agctgaatcc aaagctattt ctttcttgga      240tacctccagg ttcaatccaa tccctaaact ctcaggtttc ttcttcttcc tctcttcttt      300cctcctcctt ggtcaactct cttttcgatt aaagttgcaa actttcatta gttgtcttag      360gctcttgtga atttctctat ctaggtaatc tgttatttct tcaattcgat tttttttggt      420ttgctttagg tcgtagagtt ttaaatttta catctttgga gtgtttcaca ggtgggttta      480gtttgaggag gaggaatcaa gggagaggtt ttggaaaagg tgttaagtgt tcagtgaaag      540tgcagcagca acaacaacct cctccagcat ggcctgggag agctgtccct gaggcgcctc      600gtcaatcttg ggatggacca aaacccatct ctatcgttgg atctactggt tctattggca      660ctcaggtttt atttcgatta aggcattatt gtgcagttct tgagtatgac cagactttaa      720gtttgtctta tgaatgacta gactcataga agaatgatat ttttttctta ctgagttatt      780gttgcatcat ttttatcgac aagaacttcc attttgcaga cattggatat tgtggctgag      840aatcctgaca aattcagagt tgtggctcta gctgctggtt cgaatgttac tctacttgct      900gatcaggtaa gttggcttca tttgtaaaaa aattagtatt gagtctctcc aatttgtcat      960tcagaccact tggaattcag tttaattctc agttcagtgg tagtatcata agcaagatag     1020tattaactcg ttatgtatca gatcaaacca gagaaatcag gttctggttt aggcttttgc     1080ttctgcaatc tcaagaaatc tctatagtat ggttctgtga ttctattttg aatggtggca     1140ggtaaggaga tttaagcctg cattggttgc tgttagaaac gagtcactga ttaatgagct     1200taaagaggct ttagctgatt tggactataa actcgagatt attccaggag agcaaggagt     1260gattgaggtt agttcatttg ttagttttga ttgtagtgta gataggtttt tacttattat     1320gttcatcaac aggttgcccg acatcctgaa gctgtaaccg ttgttaccgg aatagtaggt     1380tgtgcgggac taaaggtata tactctaatt ttttgttatt aaaccttatt aagaggatat     1440gaaaaaagaa agttgcagat gataaagctt gttgcttatt tttactgcag cctacggttg     1500ctgcaattga agcaggaaag gacattgctc ttgcaaacaa agagacatta atcgcaggtg     1560gtcctttcgt gcttccgctt gccaacaaac ataatgtaaa gattcttccg gcagattcag     1620aacattctgc catatttcag gtatcacaaa tcacatagaa ttaagtacct caactttcat     1680attgagttca gcgttggtct taatgcaagt tcaacctctg gcaatttgag tgaaaaatct     1740tcttttatgt tctctagtgt attcaaggtt tgcctgaagg cgctctgcgc aagataatct     1800tgactgcatc tggtggagct tttaggtttg tttcgatatt cttctctctc tgcatagact     1860ttttttcttc tcaattctcg tttggttaat ggaaactttt cactggattt tgaaaaaggg     1920attggcctgt cgaaaagcta aaggaagtta aagtagcgga tgcgttgaag catccaaact     1980ggaacatggg aaagaaaatc actgtggact ctgctacgct tttcaacaag gttaagatta     2040ttttctccta aggttaaact ctgattttga aaataccttt gatcaaggta gatgagttct     2100tgattttttg aaacagggtc ttgaggtcat tgaagcgcat tatttgtttg gagctgagta     2160tgacgatata gagattgtca ttcatccgca aagtatcata cattccatga ttgaaacaca     2220ggtcttgctg aaacattact aactaaatta ttatttttcc ggttttaaaa aaataactgt     2280ataacatgta tttgttttgt tccacaggat tcatctgtgc ttgctcaatt gggttggcct     2340gatatgcgtt taccgattct ctacaccatg tcatggcccg atagagttcc ttgttctgaa     2400gtaacttggc caagacttga cctttgcaag taagctaacc acatttatat actctctgtt     2460tatcaagtgt gaagctaagc ttagttgaaa attttaatta tcaccaagaa aagttcccca     2520atcttgtttt cagtttggtt ttaggttgtt tagataagat aaaaaatgaa accgaatcgg     2580tcttcggttt ggttttgcaa ttggttattt tgctactgtt ttggtgtgga tcagttaaac     2640tgggttagga ccactgcctt atctatcagc attcagcacc taaaaccaaa agttgtttac     2700aattgtggat tttggcagac tcggttcatt gactttcaag aaaccagaca atgtgaaata     2760cccatccatg gatcttgctt atgctgctgg acgagctgga ggcacaatga ctggagttct     2820cagcgccgcc aatgagaaag ctgttgaaat gttcattgat gaaaagtaag aattattttt     2880cagttttgag catctcaatg aagttcttga tacgaatcac aattgtttat attctcactt     2940ttgtttacag gataagctat ttggatatct tcaaggttgt ggaattaaca tgcgataaac     3000atcgaaacga gttggtaaca tcaccgtctc ttgaagagat tgttcactat gacttgtggg     3060cacgtgaata tgccgcgaat gtgcagcttt cttctggtgc taggccagtt catgcatgaa     3120gaattggttg ttggaagaac ataaggaagc ttctgaggaa atgttgaaag aagattagtg     3180tagagaatgg ggtactactt aatagcgttt ttggcaagga ttatggattg tgtagctaat     3240ttatctgtga tccgaacaag ccaaactgat aatttgaaac catttttacc aataaaaccg     3300agcttaattg tttcacatta tatgattaat tacattcatc taagggttct tgaaaagcct     3360ctgagcttca tgagtagagt tcgcatctcc tgttgtcgtc                           3400<210> 2<211> 476<212> PRT<213> 拟南芥菜属种<400> 2Met Met Thr Leu Asn Ser Leu Ser Pro Ala Glu Ser Lys Ala Ile Ser1               5                  10                  15Phe Leu Asp Thr Ser Arg Phe Asn Pro Ile Pro Lys Leu Ser Gly Gly

        20                  25                  30Phe Ser Leu Arg Arg Arg Asn Gln Gly Arg Gly Gly Lys Gly Val Lys

    35                  40                  45Cys Ser Val Lys Val Gln Gln Gln Gln Gln Pro Pro Pro Ala Trp Pro

50                  55                  60Gly Arg Ala Val Pro Glu Ala Pro Arg Gln Ser Trp Asp Gly Pro Lys65                  70                  75                  80Pro Ile Ser Ile Val Gly Ser Thr Gly Ser Ile G1y Thr Gln Thr Leu

            85                  90                  95Asp Ile Val Ala Glu Asn Pro Asp Lys Phe Arg Val Val Ala Leu Ala

        100                 105                 110Ala Gly Ser Asn Val Thr Leu Leu Ala Asp Gln Val Arg Arg Phe Lys

    115                 120                 125Pro Ala Leu Val Ala Val Arg Asn Glu Ser Leu Ile Asn Glu Leu Lys

130                 135                 140Glu Ala Leu Ala Asp Leu Asp Tyr Lys Leu Glu Ile Ile Pro Gly Glu145                 150                 155                 160Gln Gly Val Ile Glu Val Ala Arg His Pro Glu Ala Val Thr Val Val

            165                 170                 175Thr Gly Ile Val Gly Cys Ala Gly Leu Lys Pro Thr Val Ala Ala Ile

        180                 185                 190Glu Ala Gly Lys Asp Ile Ala Leu Ala Asn Lys Glu Thr Leu Ile Ala

    195                 200                 205Gly Gly Pro Phe Val Leu Pro Leu Ala Asn Lys His Asn Val Lys Ile

210                 215                 220Leu Pro Ala Asp Ser Glu His Ser Ala Ile Phe Gln Cys Ile Gln Gly225                 230                 235                 240Leu Pro Glu Gly Ala Leu Arg Lys Ile Ile Leu Thr Ala Ser Gly Gly

            245                 250                 255Ala Phe Arg Asp Trp Pro Val Glu Lys Leu Lys Glu Val Lys Val Ala

        260                 265                 270Asp Ala Leu Lys His Pro Asn Trp Asn Met Gly Lys Lys Ile Thr Val

    275                 280                 285Asp Ser Ala Thr Leu Phe Asn Lys Gly Leu Glu Val Ile Glu Ala His

290                 295                 300Tyr Leu Phe Gly Ala Glu Tyr Asp Asp Ile Glu Ile Val Ile His Pro305                 310                 315                 320Gln Ser Ile Ile His Ser Met Ile Glu Thr Gln Asp Ser Ser Val Leu

            325                 330                 335Ala Gln Leu Gly Trp Pro Asp Met Arg Leu Pro Ile Leu Tyr Thr Met

        340                 345                 350Ser Trp Pro Asp Arg Val Pro Cys Ser Glu Val Thr Trp Pro Arg Leu

    355                 360                 365Asp Leu Cys Lys Leu Gly Ser Leu Thr Phe Lys Lys Pro Asp Asn Val

370                 375                 380Lys Tyr Pro Ser Met Asp Leu Ala Tyr Ala Ala Gly Arg Ala Gly Gly385                 390                 395                 400Thr Met Thr Gly Val Leu Ser Ala Ala Asn Glu Lys Ala Val Glu Met

            405                 410                 415Phe Ile Asp Glu Lys Ile Ser Tyr Leu Asp Ile Phe Lys Val Val Glu

        420                 425                 430Leu Thr Cys Asp Lys His Arg Asn Glu Leu Val Thr Ser Pro Ser Leu

    435                 440                 445Glu Glu Ile Val His Tyr Asp Leu Trp Ala Arg Glu Tyr Ala Ala Asn

450                 455                 460Val Gln Leu Ser Ser Gly Ala Arg Pro Val His Ala465                 470                 475<210> 3<211> 25<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 3ctctggatgt catatgaagc aactc                       25<210> 4<211> 19<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 4ccgcataaca ccgccaacc                              19<210> 5<211> 20<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 5gcacacttcc actgtgtgtg                             20<210> 6<211> 20<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 6attcgaacca gcagctagag                             20<210> 7<211> 21<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 7ccagtagatc caacgataga g                           21<210> 8<211> 20<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 8ggccatgctg gaggaggttg                             20<210> 9<211> 25<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 9caagagtagt agtgcggttc tctgg                       25<210> 10<211> 24<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 10cagtttggct tgttcggatc acag                        24<210> 11<211> 32<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 11ctgagagtgc accatctgcg gtgtgaaata cc               32<210> 12<211> 34<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 12ggcatatggt gaaacccatc tctatcgttg gatc             34<210> 13<211> 33<212> DNA<213> 人工序列<220><223> 合成寡核苷酸<400> 13acgaattcat tatgcatgaa ctggcctagc acc              33

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号