首页> 中国专利> 在次生壁沉积期间优先在次生有壁细胞中表达的来自棉花的编码几丁质酶的DNA分子和相应的启动子

在次生壁沉积期间优先在次生有壁细胞中表达的来自棉花的编码几丁质酶的DNA分子和相应的启动子

摘要

本发明涉及分离的编码内源性棉花几丁质酶的核酸分子及相应的启动子,其在次生壁沉积期间优先在次生有壁细胞中表达。也公开了由该核酸分子编码的多肽,将分离的核酸分子与启动子连接的DNA构建体,掺入到表达系统、宿主细胞、植物或植物种子中的所述DNA构建体。本发明也涉及将分离的启动子与第二DNA连接的DNA构建体,以及含有所述DNA构建体的表达系统、宿主细胞、植物或植物种子。也公开了赋予对昆虫和真菌的抗性、调控纤维纤维素含量的方法,以及在次生壁沉积期间优先在次生有壁细胞中表达基因的方法。

著录项

  • 公开/公告号CN1761751A

    专利类型发明专利

  • 公开/公告日2006-04-19

    原文格式PDF

  • 申请/专利权人 得克萨斯科技大学;

    申请/专利号CN200480007132.1

  • 申请日2004-01-23

  • 分类号C12N15/29(20060101);C12N15/82(20060101);C12N15/87(20060101);C12N5/04(20060101);A01H5/00(20060101);

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人刘晓东

  • 地址 美国得克萨斯

  • 入库时间 2023-12-17 17:12:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2009-12-02

    授权

    授权

  • 2006-06-14

    实质审查的生效

    实质审查的生效

  • 2006-04-19

    公开

    公开

说明书

这是2001年7月30日递交的美国专利申请流水号No.09/918,083的部分继续申请,特此全文并入作为参考。

                    发明领域

本发明涉及在次生细胞壁沉积期间在次生有壁细胞中表达的基因和相应基因的启动子。

                    发明背景

棉花(陆地棉(Gosssypium hirsutum L.)和包括海岛棉(G.barbadense L.)、亚洲棉(G.arboreum L.)和草棉(G.herbaceousL.)在内的其它棉种)是一种对全世界的农业有巨大经济重要性的农作物,其纤维细胞是种皮经分化的表皮细胞。在成熟时,按照从内到外的方向,纤维细胞由细胞腔、次生细胞壁、初生细胞壁以及薄的蜡质外皮构成。初生细胞壁由果胶化合物、半纤维素成分、纤维素以及蛋白质构成。次生细胞壁主要由纤维素(约95%)及小量的、尚未最后鉴定的其它成分构成。

棉花纤维发育的特点是有开始、初生细胞壁沉积、次生细胞壁沉积、以及干燥这些阶段。在纤维发育的初生壁阶段,发生初生壁沉积以促进纤维伸长。在纤维发育的次生壁阶段,发生次生壁沉积以实现纤维增厚。出生和次生细胞壁沉积涉及每一阶段特有的所有细胞壁成分的合成,以及所述分子向质膜外侧有组织的细胞壁中的装配。数以百计的基因是植物纤维分化和发育所必需的。有关体外翻译的纤维蛋白(Delmer等,“New Approaches to the Study of CelluloseBiosynthesis ”,J.Cell Sci.Suppl.2:33-50(1985))、从纤维中分离的蛋白(Graves和Stewart,“Analysis of the ProteinConstituency of Developing Cotton Fibers”,J.Exp.Bot.,39:59-69(1988))、以及特定基因的分析(Wilkins等,“MolecularGenetics of Developing Cotton Fibers”,in Basra编,CottonFibers: Developmental Biology,Quality Improvement,andTextile Processing,Haworth Press:New York,p.231-270(1999))的工作清楚地表明了在细胞的各个发育阶段期间的差异性基因表达。然而,仅鉴定出了少数参与大量纤维特异性或纤维增强的结构蛋白、酶、多糖、或者蜡质的生物合成中的基因(John等,“Gene Expressionin Cotton(Gossypium hirsutum L.)Fiber:Cloning of the mRNAs”,Proc.Natl.Acad.Sci.USA,89:5769-5773(1992);John,“Characterization of a Cotton(Gossypium hirsutumn L.)FibermRNA(Fb-B6)”,Plant Physio.107:1477-1478(1995))。由于这些基因以及它们与环境的相互作用决定着纤维的质量,因此它们的鉴定和表征被认为是棉花作物改良的很重要的方面。

特别是,次生细胞壁如何合成,它们怎样帮助植物发挥功能、适应、和防御,以及它们的性能如何转化成工业实用性都是与基础生物学机理、生态学以及植物改良有关的重要的问题。植物次生细胞壁是在一些特化的细胞类型中合成,以利于特殊的功能,如水的长距离传导(管状分子)、蒸腾的控制(保卫细胞)、以及种子的散布(棉花纤维)。这些次生细胞壁具有更高含量的高张力强度纤维素,通常超过40%重量,并且比初生细胞壁要厚很多。所以,它们的半纤维素、果胶、以及蛋白质含量减少,最极端的减少发生在棉花纤维次生细胞壁的情形下,其中约有95%纤维素。另一方面,在初生壁沉积期间,纤维素含量典型地是9-30%(w/w)(Meinert等,“Changes inBiochemical Composition of the Cell Wall of the Cotton FiberDuring Development”,Plant Physio.59:1088-1097(1977);Darvll等,“The Primary Cell Walls of Flowering Plants”,TheBiochemistry of Plants,1:91-162(1980);Smook,Handbook forPulp and Paper Technologists,Vancouver,Canada:Angus WildePublications,p.15(1992))。因为次生细胞壁比较坚固,并且代表了化学纤维素的大量来源,故它们业已被开发作为例如木材和棉花纤维的重要可再生资源。

棉花纤维细胞具有包括次生壁沉积的两种不同的发育阶段。有关纤维长度和重量增加、形态学、细胞壁组成、纤维素合成速率、以及基因表达的许多研究已经证实下面所概述的纤维发育阶段,并且最近的综述包含许多一手参考文献以证实这些事实(Delmer,“CelluloseBiosynthesis in Developing Cotton Fibers”,in Basra编,Cotton Fibers:Developmental Biology,Quality Improvement,andTextile Processing New York,New York:Haworth Press,pp.85-112(1999);Ryser,“Cotton Fiber Initiation andHistodifferentiation”,in Basra编,Cotton Fibers:Developmental Biology,Quality Improvement,and TextileProcessing,New York,New York:Haworth Press,pp.1-46(1999);Wilkins等,“Molecular Genetics of Developing Cotton Fibers”,Basra编,Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processig,New York,New York:Haworth Press,pp.231-270(1999))。继经由表皮细胞突起在表面之上而进行的纤维起始后,纤维伸长便开始了。初生壁沉积是必需的,以促进纤维伸长,纤维开始后,初生壁沉积单独持续至少12天。这个时期独一无二地代表了纤维发育的初生壁阶段。然后,次生壁沉积开始,而初生壁沉积仍继续,尽管通常以较慢的速度进行。纤维发育的这个阶段代表初生和次生壁沉积之间的转变,其在陆地棉中典型地在开花后(DPA)14-17天之间开始。随后,纤维伸长和初生壁沉积停止,典型地在18-24DPA之间,而次生壁沉积独一无二地持续到34-50DPA。纤维发育的每个阶段的起始时间和持续时间的差异取决于棉花栽培品种和温度条件(DeLanghe,“Lint Deve lopment”in Mauney编,Cotton Physiology,pp.325-349,The Cotton Foundation,Memphis,Tennessee(1986);Haigler等,“Cultured Cotton Ovules asModels for Cotton Fiber Development Under Low Temperatures”,Plant Physio.,95:88-96(1991);Thaker等,“GenotypicVariation and Inf luence of Diurnal Temperature on Cotton FiberDevelopment”,Field Crops Research,22:129-141(1989))。例如,在田间生长的海岛棉中,直到20DPA后才发生广泛的次生壁沉积,伸长会持续到39DPA,次生壁沉积在48DPA时停止(Schubert等,“Growth and Development of the Lint Fibers of Pima S-4 Cotton”,Crop Sci.,16:539-543(1976))。

在纤维发育的初生壁、转变、以及次生壁阶段,纤维素合成的速率分别从低到中、到高变化(Meinert等,“Changes in BiochemicalComposition of the Cell Wall of the Cotton Fiber DuringDevelopment”,Plant Physiol.,59:1088-1097(1977);Martin,“Cool-Temperature-Induced Changes in Metabolism Related toCellulose Synthesis in Cotton Fibers,Ph.D.dissertation,Texas Tech University,Lubbock,TX,U.S.A.(1999))。一个实例见于在恒定34℃的最适温度时培养的棉花胚珠中发育的纤维,在该温度下进行纤维发育的整个阶段的速率达到最大。将从在这种条件下所培养的陆地棉的两个棉花栽培品种的胚珠上的纤维得到的结果结合,初生壁沉积伴随低速率的纤维素合成持续到12-14DPA,在14-16DPA开始初生和次生细胞沉积之间的转变以及中等速率的纤维素合成,而次生壁沉积伴随着在16-21 DPA时开始的高速率纤维素合成而继续进行(Martin,“Cool-Temperature-Induced Changes inMetabolism Related to Cellulose Synthesisin Cotton Fibers,Ph.D.dissertation,Texas Tech University,Lubbock,TX,U.S.A.(1999))。其它生物化学特征证明了转变期经由中等速率的纤维素合成的次生壁沉积起始标志着不同的发育事件:新型壁材料的纤维素含量急剧增加,结果在一天内整个纤维壁中纤维素的总百分比实现加倍(Meinert等,“Changes in Biochemical Composition of the CellWall of the Cotton Fiber During Development”,Plant Physio.,59:1088-1097(1977)),呼吸速率短暂下降,纤维中UDP-葡萄糖和葡萄糖-6-P的细胞间池开始增加(Martin,“Cool-Temperature-Induced Changesin Metabolism Related toCellulose Synthesis in Cotton Fibers,Ph.D.dissertation,Texas Tech University,Lubbock,TX,U.S.A.(1999))。这些是次生壁沉积突然开始的迹象(DeLanghe,“Lint Development”,Mauney编,Cotton Physiology,pp.325-349,The Cotton Foundation,Memphis,Tennessee(1986))。

初生和次生壁沉积似乎受不同的遗传因子控制(Kohel等,“FiberElongation and Dry Weight Changes in Mutant Lines of Cotton”,Crop Sci.,14:471-474(1974)),而且两个阶段有可能通过遗传工程被独立地操纵,以获得纺织品工业所期望的更长的、更强的、更细(更小直径)、以及更成熟(与次生壁厚度相关)的纤维。可是,只有更多地认识调控和有助于纤维发育的每个阶段的基因才能达到这个目标。

在纤维成熟后,保护性的棉蒴打开,干燥的纤维常常在植物上悬挂几周直到整株作物成熟(除非由致死性的冷冻温度终止)及植物生长平息或者化学杀死以便收获。在这期间,纤维遭受真菌的酶活性降解,这常常通过潮湿的秋季气候而被增强(Simpson等,“TheGeographical Distribution of Certain Pre-Harvest MicrobialInfections of Cotton Fiber in the U.S.Cotton Belt”,PlantDisease Reporter 55:714-718(1971))。在有些年份,这种田间等待的时间导致了纤维等级的实质性下降,结果生产者承受被打折扣的价格并危害优质纱线和织物的生产。因此,关于如何将纤维完好无损的从田间运到纺织厂的更多知识将提高棉花生产的效率。与达到这个目标有关的是更好地理解可在纤维中引入或提高的抗真菌降解的内源性保护。

特别地,由于它们在植物中的防御作用(Gooday,“Aggressive andDefensive Roles for Chitinases”,in Jolles编,Chitin andChitinases,Birkh user Verlag:Basel,pp.157-170(1999)),已经在不同植物物种中表征了众多几丁质酶基因和蛋白。几丁质酶基因和蛋白质家族一直是许多综述(包括Graham等,“CellularCoordination of Molecular Responses in Plant Defense”,Molecular Plant-Microbe Interactions:MPMI,4:415-422(1991);Cutt等,“Pathogenesis-Related Proteins”,in Boller编,GenesInvolved in Plant Defense,Springer Verlag/New York.pp.209-243(1992);Meins等,“The Primary Structure of PlantPathogenesis-Related Glucanohydrolases and Their Genes”,Boller编,Genes Involved in Plant Defense,Springer Verlag/NewYork,p.245-282(1992);Collinge等,“Plant Chitinases”,Plant J.,3:31-40(1993);Sahai等,“Chitinases of Fungi andPlants:Their Involvement in Morphogenesis and Host-ParasiteInteraction,”FEMS Microbiology Rev.11:317-338(1993);Meins等,“Plant Chitinase Genes”,Plant Molecular Biology Reporter,12:522-528(1994);Hamel等,“Structural and EvolutionaryRelationships Among Chitinases of Flowering Plants”,Journalof Molecular Evolution,44:614-624(1997))和一本编撰的书(Jolles编,Chitin and Chitinases,Birkh user Verlag:Basel,340pp(1999))的主题。这些资料包含许多关于下面所概述的公知事实的一手参考文献。几丁质酶是一组在植物中可通过病原体攻击而诱导的基因中的一种,与真菌细胞壁和昆虫外骨骼中频繁出现的壳多糖相应。在它们的防御性作用中,几丁质酶催化壳多糖水解。结构性壳多糖以晶状微丝存在,由β-1,4-连接的N-乙酰-D-葡糖胺残基的线性均聚物(GlcNAc)n构成。壳多糖水解可保护植物抵御掠夺者或病原体,特别是侵入性的真菌,这是通过削弱或溶解它们的体结构而实现的。尤其是与可去除壳多糖微丝层的β-1,3-葡聚糖酶相联合,几丁质酶可通过削弱的菌丝壁导致菌丝梢溶解,抑制许多真菌的生长。这已通过在培养物中以及转基因植物中真菌生长的抑制而得到证实,其中显示降低的病原体损害与增强的几丁质酶活性相关。先前业已在棉花叶和根中表征了具有可能的防御功能的几丁质酶的基因表达或活性(Liu等,“Detection of Pathogenesis-Related Proteins in CottonPlants”,Physiological and Molecular Plant Pathology,47:357-363(1995);Hudspeth等,“Characterization and Expressionof Chitinase and 1,3-β-Glucanase Genes in Cotton”,PlantMolecular Biology,31:911-916(1996);Dubery等,“InducedDefence Responses in Cotton Leaf Disks by Elicitors FromVerticillium dahliae”,Phytochemistry 44:1429-1434(1997))。

一些几丁质酶一经真菌侵入就被诱导,在侵入的真菌菌丝周围积累(Benhamou等,“Subcellular Localization of Chitinase and ItsPotential Substrate in Tomato Root Tissues Infected WithFusarium Oxysporium F.Sp.Radicislycopersici”,Plant Physiolog,92:1108-1120(1990);Wubben等,“Subcellular Localization ofPlant Chitinases and 1,3-β-Glucanases in Cladosporium Fulvum(Syn.Fulvia Fulva)-Infected Toma to Leaves”,Physiological andMolecular Plant Pathology 41:23-32(1992))。其它几丁质酶明显地组成型地存在于特别易受侵袭的植物部分中,如表皮细胞、根皮层细胞、气孔、花部分,以及维管细胞。这些结论是由通过原位杂交对几丁质酶mRNA的定位和在几丁质酶启动子的调控下对GuS报告基因表达模式的分析两者得到的(Samac等,“Developmental andPathogen-Induced Activation of the Arabidopsis AcidicChitinase Promoter”,The Plant Cell,3:1063-1072(1991);Zhu等,“Stress Induction and Developmental Regulation of a RiceChitinase Promoter in Transgenic Tobacco”,The Plant Journal,3:203-212(1993);Bcher等,“Primary Structure and Expressionof Acidic(ClassII)Chitinase in Potato”,Plant MolecularBiology,35:749-761(1997);Ancillo等,“A Distinct Memberof the Basic(Class I)Chitinase Gene Family in Potato isSpecifically Expressed in Epidermal Cells”,.Plant MolecularBiology,39:1137-1151(1999))。在另一种预期可能在破坏的组织中有真菌侵入的情况下,乙烯在豆切除区诱导了几丁质酶(delCampillo等,“Identification and Kinetics of Accumulation ofProteins Induced by Ethylene in Bean Abscission Zones”,PlantPhysiology,98:955-961(1991))。这些研究中均没有包含对棉花纤维的分析或者证明棉花纤维中几丁质酶活性或几丁质酶相关蛋白的存在。

其它研究显示一些几丁质酶在植物中具有发育的作用,尽管真正的结构性壳多糖并非植物体的天然部分(Meins等,“The PrimaryStructure of Plant Pathogenesis-Related Glucanohydrolases andTheir Genes”,Boller编,Genes Involved in Plant Defense,Springer Verlag/New York,p.245-282(1992))。已经证明具有发育作用的几丁质酶同工酶至少有时明显不同于那些在应激反应和防御中有作用的几丁质酶(Mauch等,“Antifungal Hydrolases in PeaTissue.I.Purification and Characterization of Two Chitinasesand Two β-1,3-Glucanases Differentially Regulated DuringDevelopment and in Response to Fungal Infection”PlantPhysiology,87:325-333(1988))。防御性几丁质酶在裂解糖间键前结合短链单N-乙酰-葡糖胺链(可能3-6个残基)(Robertus等,“TheStructure and Action of Chitinases”,Jolles编,Chitin andChitinases,Birkh user Verlag:Basel,pp.125-136(1999))。因此,几丁质酶家族中的酶也可结合其它分子如糖蛋白或信号转导分子内的N-乙酰-葡糖胺寡聚物。此类分子可能在信号转导中有作用,以调控发育转变所必需的基因表达级联,或者在执行发育程序的生物合成过程中有作用。

以前对次生壁沉积的调控或在分子水平上的功能的研究集中在纤维素、半纤维素、木质素、或蛋白生物合成中所涉及的少数基因上。在这些途径中,木质素合成已经被最全面地研究,并在转基因植物中受到操纵(Merkle等,“Forest Biotechnology”,Current Opinion inBiotechnology.11:298-302(2000))。然而,棉花纤维不含木质素(Haigler,“The Functions and Biogenesis of Native Cellulose”,Zeronian编,Cellulose Chemistry and Its Applications,EllisHorwood:Chichester,England,pp.30-83(1985))。在一些次生壁内的半纤维素多糖包括木聚糖和葡甘露聚糖,但是棉花纤维次生壁不含显著量的任何相似分子(Haigler,“The Functions andBiogenesis of Native Cellulose”,Zeronian编,CelluloseChemistry and Its Applications,Ellis Horwood:Chichester,England,pp.30-83(1985))。仅鉴定出了两种在棉花纤维次生壁中具有可能的结构作用的蛋白质。其中之一是H6,它是一种在次生壁沉积期间累积至可检测水平的阿拉伯半乳聚糖型蛋白,尽管其基因的表达在包括初生壁沉积的快速伸长期即开始(John等,“Characterization of mRNA for a Proline-Rich Protein of CottonFiber”,Plant Physiology 108:669-676(1995))。第二个是FbL2A,它缺乏与任何已知蛋白的同源性,但是其高度重复序列和高度亲水性提示其可能具有结构性作用,或者在干燥期间保护棉花纤维。该基因的表达在初生到次生壁转变时(15DPA)微弱地开始,并且到20DPA时更强(Rinehart等,“Tissue-Specific and DevelopmentalRegulation of Cotton Gene FbL2A”,Plant Physiology,112:1331-1341(1996))。

在棉花纤维次生壁沉积期间基因表达和/或活性增强的以及与纤维素合成的调节相关的酶包括纤维素合成酶、蔗糖合成酶、蔗糖磷酸合成酶、以及UDP-葡萄糖焦磷酸化酶(Basra deng,“SucroseHydrolysis in Relation to Development of Cotton(Gossypium spp.)Fibres”,Indian Journal of Experimental Botany,28:985-988(1990);Wafer等,“Enzyme Activities in Developing CottonFibres”,Plant Physiology and Biochemistry 32:697-702(1994);Amor等,“A Membrane-Associated Form of Sucrose Synthase andits Potential Role in Synthesis of Cellulose and Callose inPlants”,Proc.Nat′l.Acad.Sci.U.S.A.,92:9353-9357(1995);Pear等,“Higher Plants Contain Homologs of the Bacterial celAGenes Encoding the Catalytic Subunit of Cellulose Synthase”,Proc.Nat′l.Acad.Sci.U.S.A.,93:12637-12642(1996);Tummala,“Response of Sucrose Phosphate Synthase Activity to CoolTemperatures in Cotton”,M.S.thesis,Texas Tech University,Lubbock,Tx(1996))。UDP-葡萄糖焦磷酸化酶将葡萄糖-1-P转化为UDP-葡萄糖,或者介导逆向反应。在纤维素合成的情形下,蔗糖合成酶被认为会降解蔗糖,并向纤维素合成酶提供UDP-葡萄糖。纤维素合成酶将葡萄糖转移到正在延伸的β-1,4-连接的纤维素聚合物上,而游离的UDP再循环到蔗糖合成酶上。蔗糖磷酸合成酶可能使用果糖-6-P(例如,来源于由蔗糖合成酶的降解作用释放的果糖)和UDP-葡萄糖用于合成另外的蔗糖以支持纤维素合成(Delmer,“CelluloseBiosynthesis in Developing Cotton Fibers”,Basra编,CottonFibers:Developmental Biology,Quality Improvement,andTextile Processing,Haworth Press:New York,pp.85-112(1999))。

上面刚刚讨论的所有酶在导致形成β-1,4-连接的葡聚糖聚合物的糖代谢路径内运转。来自其它系统和棉花纤维的证据暗示(存在着)与葡聚糖聚合物的形成同时发生或在其后的其它可能的纤维素合成调节点,尽管不完全理解相关的途径和蛋白。其它相关蛋白的实例包括可能作为葡聚糖链编辑器或者有一些其它作用的β-1,4-葡聚糖酶(Delmer,“Cellulose Biosynthesis:Exciting Times For aDifficult Field of Study”,Ann.Rev.Plant Physiol.Mol.Biol.,50:245-276(1999))和可能作为纤维素生物合成引物的糖蛋白(Lukowitz等,“Arabidopsis cytl Mutants are Deficient in aMannose-1-Phosphate Guanyltransferase and Point to aRequirement of N-Linked Glycosylation for CelluloseBiosynthesis”,Proc.Nat′l.Acad.Sci.U.S.A.,98:2262-2267(2001))。下调β-1,4-葡聚糖酶或糖蛋白合成的突变会导致其它系统中纤维素含量减少(Nicol等,“Plant Cell Expansion:Scaling theWall”,Current Opinion in Cell Biology,1:12-17(1998);Lukowitz等,“Arabidopsis cytl Mutants are Deficient in aMannose-1-Phosphate Guanyltransferase and Point to aRequirement of N-Linked Glycosylation for CelluloseBiosynthesis”,Proc.Nat ′l.Acad.Sci.U.S.A.,98:2262-2267(2001))。在拟南芥(Arabidopsis)中,木质部次生壁特异性纤维素合成酶基因的突变会导致纤维素含量降低和软弱的木质部壁(Turner等,“Collapsed Xylem Phenotype of Arabidopsis IdentifiesMutants Deficient in Cellulose Deposition in the SecondaryCell Wall”,Plant Cell 9:689-701(1997))。在棉花中,菠菜蔗糖磷酸合成酶表达的增强会导致在冷暗循环下生长的植物的纤维壁中纤维素含量增加(Haigler等,“Transgenic Cotton Over-Expressing Sucrose Phosphate Synthase Produces Higher QualityFibers With Increased Cellulose Content and Has Enhanced SeedCotton Yield”Abstract 477.In:Proceedings of Plant Biology2000,July 15-19,San Diego,CA,American Society of PlantPhysiologists,Rockville,MD,(2000))。这些发现显示有可能操纵次生壁中纤维素的量,但是目前还没有充分鉴定可能被有益地操纵的靶基因。

鉴定处于组织特异性和发育调节下的基因的研究对于理解蛋白在纤维发育和细胞壁构架中的作用很重要(John,“StructuralCharacterization of Genes Corresponding to Cotton Fiber mRNA,E6:Reduced E6 Protein in Transgenic Plants by Antisense Gene”,Plant Mol.Biol.,30:297-306(1996))。另外,此类基因和它们的调控元件是通过遗传工程改良纤维的重要工具(John,“Prospectsfor Modification of Fibers Through Genetic Engineering ofCotton”,Gebelein编,Industrial Biotechnological Polymers,Lancaster,PA:Technomic,pp.69-79(1995);John,“GeneticEngineering Strategies for Cotton Fiber Modification.in:A.S.Basra(编),Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processing,The Haworth Press,New York,pp.271-289(1999))。

在许多实例中,发育性地调控转基因、使之在适当的发育阶段在纤维细胞中具有特有的或者优先的表达将会比较理想。这种调控可通过能优先启动的启动子最方便地完成。

启动子是指导细胞中RNA转录的DNA元件。与其它指定基因表达的组织和时间特异性的调控元件一起,启动子调控生物体的发育。因此,一直共同努力从品种繁多的植物和动物中鉴定和分离启动子。

许多启动子在异源系统中恰当地发挥作用。例如,从植物基因如rbcS、Cab、查耳酮合成酶,以及来自烟草和拟南芥的蛋白酶抑制剂中获取的启动子都在异源转基因植物中有功能(Benfey等,“RegulatedGenes in Transgenic Plants”,Science,244:174-181,(1989))。转基因植物的具体实例包括大豆7s种子贮藏蛋白基因在转基因烟草植物中的组织特异性和发育调控的表达(Chen等,“A DNA SequenceElement That Confers Seed-Specific Enhancement to aConstitutive Promoter”,EMBO J.7:297-302,(1988)),以及拟南芥(Arabidopsis thaliana)叶绿素a/b结合蛋白基因启动子在转基因烟草中的光依赖性的器官特异性表达(Ha等,“Identification ofUpstream Regulatory Elements Involved in the DevelopmentalExpression of the Arabidopsis thaliana Cab-1 Gene”,Proc.Natl.Acad.Sci.USA,85:8017-8021,(1988))。类似地,在转基因烟草中证明了可厌氧性诱导的玉米蔗糖合成酶-1启动子活性(Yang等,“Maize Sucrose Synthase-1 Promoter Directs PhloemCell-Specific Expression of Gus Gene in Transgenic TobaccoPlants”,Proc.Natl.Acad.Sci.USA 87:4144-4148,(1990))。发现番茄花粉启动子可在转基因拟南芥和烟草中指导组织特异性和发育调控的基因表达(Twell等,“Pollen-Specific Gene Expression inTransgenic Plants Coordinate Regulation of Two Different TomatoGene Promoters During Mierosporogenesis”,Development 109:705-714,(1990))。因此,可利用一些植物启动子在植物组织中以发育调控的方式表达外来蛋白。

也已经在纤维细胞中证明了基因的组织特异性和发育调控的表达。这些基因中的几个,如E6、液泡ATP酶以及脂质转移型蛋白,在初生壁沉积期间在棉花纤维中具有强表达(Wilkins等,“MolecularGenetics of Developing Cotton Fibers”,Basra编辑,Cotton Fibers:Developmental Biology,Quality Improvement,and TextileProcessing,Haworth Press:New York,p.231-270(1999);Orford等,“Expression of a Lipid Transfer Protein Gene Family DuringCotton Fibre Development”,Biochimica and Biophysica Acta,1483:275-284(2000))。其它基因在纤维发育期间表现出短暂表达。例如,Rac在初生到次生壁阶段转变时瞬时表达(Delmer等,“GenesEncoding Small GTP-Binding Proteins Analogous to Mammalian Racare Preferentially Expressed in Developing Cotton Fibers”,Mol.Gen.Genet.,248:43-51(1995)),另一种脂质转移型蛋白,FS18 A(Orford等,“Characterization of a Cotton Gene ExpressedLate in Fibre Cell Elongation”,Theoretical and Applied Genetics,98:757-764(1999)),在次生壁沉积期间第24 DPA时瞬时表达。另一个基因,H6,在10-24 DPA之间表达,该时间阶段包括初生和早期次生壁沉积二者,但是,这种基因的启动子在初生壁沉积期间开始其活性后,存在基因表达的转录后调节,从而H6蛋白仅在次生壁沉积期间第15-40DPA累积(John等,“Characterization of mRNA for aProline-Rich Prote in of Cotton Fiber”,Plant Physiology,108:669-676(1995))。在基因表达水平上,先前仅仅证明某些纤维素合成酶基因在次生壁沉积期间在棉花纤维中具有优先的和延长的表达,尽管在初生壁沉积期间和在植物的其它部分有较低水平的表达。另外,纤维素合成酶直到20 DPA才显示强表达,在17 DPA观察到仅有微弱的表达(Pear等,“Higher Plants Contain Homologs of theBacterial celA Genes Encoding the Catalytic Subunit ofCellulose Synthase”,Proc.Nat′l.Acad.Sci.U.S.A.,93:12637-12642(1996))。另一个基因,FbL2A,在初生向次生壁转变时得到上调(在15DPA微弱,在20DPA强烈)(Rinehart等,“Tissue-Specific and Developmental Regulation of Cotton GeneFbL2A”,Plant Physiology,112:1331-1341(1996))。

在棉花纤维中所表达的任一基因都是含有有用启动子的候选基因,其中一种特殊类型的有用启动子是那些与其它细胞类型和/或发育阶段相比优先在纤维和/或次生有壁细胞中表达的启动子。在纤维发育的初生壁阶段期间优先表达的启动子也将具有特殊用途。获得在棉花纤维和棉花植物其它部分中的某些受限制的细胞类型(例如,次生有壁细胞)中表达的启动子可能也是有利的。具有不同强度的启动子也有价值,因为不同的遗传工程目标可通过在细胞或组织中存在的不同量的外来蛋白而最好地实现。处理任何特定物种的生物技术产业将最终期望并需要启动子“工具箱”,以便可选择对任何特殊用途最适当的启动子。每个启动子将具有就驱动基因表达的细胞、组织或发育特异性、基因表达强度、在基因表达水平上对基因插入位置效应的敏感性程度、对基因沉默以及任何数量的影响转录的其它类似现象的敏感性而言的独特特点的组合。

已经分离了少数在棉花纤维中表达的基因的启动子,并在稳定转化的棉花中、针对在纤维发育的时间进程中的两个或多个时间点的关系进行了测试,其中所述测试包括启动子与“报告”基因或者是推定有用的遗传工程策略一部分的基因的融合。观察到三种主要模式,一种以Gh10启动子为典型代表(用于酰基载体蛋白),其驱动外源基因在整个纤维发育期间表达(Song等,“Expression of a Promoter froma Fiber-Specific Acyl Carrier Protein Gene in Transgenic CottonPlants”,Proc.Beltwide Cotton Conf.,1:486-488(1998))。第二种模式以E6启动子为典型代表,其驱动基因在棉花纤维发育的初生壁阶段优先表达(美国专利No.5,521,078,John)。第三种模式由FbL2A基因的启动子说明。该启动子通过与两个报告基因(多羟基链烷酸合成酶或PHA合成酶,一种用特异性抗体检测的酶,以及乙酰乙酰辅酶A还原酶,一种具有可通过酶测定法监控的活性的酶)融合并转化棉花来测试(Rinehart等,“Tissue-Specific and DevelopmentalRegulation of Cotton Gene FbL2A”,Plant Physiology,112:1331-1341(1996))。然而,使用这两种启动子/报告基因构建体,得到的关于FbL2A启动子有用性的数据在某种程度上存在矛盾。当乙酰乙酰辅酶A还原酶基因在FbL2A启动子的控制下时,在5-10 DPA时在初生壁沉积期间在棉花纤维中检测到乙酰乙酰辅酶A还原酶活性,并且在独立转化的植物家族中在次生壁沉积期间到20 DPA有一致的显著活性,在35 DPA达到活性高峰,活性持续直到45 DPA(Rinehart等,“Tissue-Specific and Deve lopmental Regulation of CottonGene FbL2A”,Plant Physiology,112:1331-1341(1996))。然而,20DPA后的酶活性可能是由于长寿的信使RNA或在15-20 DPA(这是数据直接显示FbL2A基因表达是在其自身启动子的控制下的时期)合成的蛋白质之故。相反,当PHA合成酶基因在FbL2A启动子控制下时,用于免疫学检测转化植物中PHA合成酶的Western印迹显示在次生壁沉积期间在20 DPA仅有非常微弱的信号,在25 DPA只有痕量信号,而在30或35 DPA没有信号(Rinehart等,“Tissue-Specific andDevelopmental Regulation of Cotton Gene FbL2A”,PlantPhysiology,112:1331-1341(1996))。此外,在来自CaMV病毒的推定的组成型35S启动子控制下的PHA合成酶基因与在初生壁沉积期间在10 DPA时PHA合成酶蛋白的检测信号强并微弱持续到次生壁沉积的35 DPA相关。在次生壁沉积期间的比较模式与在次生壁沉积的20 DPA附近FbL2A启动子的瞬时表达一致。数据也显示FbL2A启动子将在初生壁沉积期间在棉花纤维中驱动外源基因微弱地表达(Rinehart等,“Tissue-Specific and Developmental Regulation of Cotton GeneFbL2A”,Plant Physiology,112:1331-1341(1996))。此外,在颁予John的美国专利No.6,211,430中的图形数据显示FbL2A启动子活性直到20 DPA(次生壁沉积开始后约5天)才比较显著,并且直到31 DPA(次生壁沉积开始后约16天)才可检测到最大外源乙酰乙酰辅酶A还原酶活性的50%。

因此,具有将在次生有壁细胞特别是纤维中在整个次生壁沉积期间优先并强烈地(即强烈地并持续地(例如,以大于或等于其最大活性的50%)从次生壁沉积起始到其终止)驱动基因表达的启动子将是有用的。次生壁沉积的起始定义为当棉花纤维的干重/单位长度开始增加或者当任何细胞的干重/单位表面积开始增加的时间点,这是介由含有高于30%(w/w)纤维素的新型壁材料的合成实现的。在陆地棉的棉花纤维的情况下,当棉花植物在温室或大田中在典型条件下(白天温度26-34℃,夜晚温度20-26℃,光照强度高于或等于1000μ爱因斯坦/m2/s,适当的水和矿物营养)生长时,预期这将在14-17DPA之间发生。此外,具有将驱动基因仅在或者优先在次生有壁细胞如纤维中表达,而在其它细胞类型中没有表达或将表达降到最小的启动子将是有用的。

本发明致力于达到这些目标。

                            发明概述

本发明涉及分离的来自棉花的核酸分子,其编码与几丁质酶相关的内源性棉花蛋白,该核酸分子在次生壁沉积期间优先在次生有壁细胞中表达。也公开了由该分离的核酸分子编码的多肽。

本发明的另一方面涉及DNA构建体,其中包括可操作地连接到第二DNA的5′端以诱导该第二DNA转录的DNA启动子,所述第二DNA是分离的核酸分子,还包含可操作地连接到第二DNA上的3′调控区。该DNA构建体可被掺入到表达系统、宿主细胞、植物,或者植物种子中。

本发明的另一方面涉及一种分离的DNA启动子,其适于诱导由与该DNA启动子可操作地结合的第二DNA所编码的蛋白的表达。该DNA启动子是从棉花中分离的,并在次生壁沉积期间优先在次生有壁细胞中驱动表达。

本发明的另一个方面涉及DNA构建体,其中包含分离的DNA启动子,编码蛋白质或多肽的第二DNA,其中所述DNA启动子可操作地连接到第二DNA的5′以诱导第二DNA的转录,还包含可操作地连接到第二DNA上的3′调控区。该DNA构建体可被掺入到表达系统、宿主细胞、植物或者植物种子中。

也公开了赋予植物抵御昆虫和真菌的抗性的方法,包括用本发明的分离的核酸分子转化植物。

本发明的另一方面涉及调控植物纤维的纤维素含量的方法,包括用本发明的分离的核酸分子转化植物。

本发明的另一方面涉及在植物次生壁沉积期间优先在次生有壁细胞中表达基因的方法,包括用包含本发明的分离DNA启动子的DNA构建体转化植物。

在本发明中公开的分离的核酸分子在次生壁沉积期间当细胞活性强烈向纤维素合成倾斜时优先在次生有壁细胞如纤维中表达的这一发现与在纤维素合成中相应几丁质酶相关蛋白的发育作用是一致的。备选地,棉蒴打开后所述蛋白可被“贮藏”在棉花纤维细胞壁中等待真菌攻击。然而,在棉花纤维中具有这种防御性功能的任何几丁质酶可能是相对无效的,因为棉花纤维可被数种真菌感染和严重破坏(Simpson等,“The Geographical Distribution of CertainPre-Harvest Microbial Infections of Cotton Fiber in the U.S.Cotton Belt”,Plant Disease Reporter,55:714-718(1971))。无论是起发育性或防御性作用,操作这些几丁质酶相关蛋白在纤维中的表达可能对纤维作物的产量和质量具有重要的影响。例如,可在生物合成期间提高或减少纤维的纤维素含量和/或在作物收获和加工期间保护其免于真菌降解。

另外,在正常植物的次生壁沉积期间优先在次生有壁细胞如纤维中表达的基因的启动子可能对纤维的遗传工程有价值,能够实现:(1)在正常和应激条件下提高农业生产力和(2)提高依赖于次生壁沉积期间的修饰的纤维改良性质。由于没有编码在整个次生壁沉积期间在次生有壁细胞如纤维中优先和强烈表达的功能蛋白的已知基因,因而没有启动子可用来驱动外源基因优先地和强烈地在纤维次生壁沉积的整个持续期间表达。在本发明中所公开的启动子可用于实现这些目标,同时避免对植物生长和发育或纤维发育的其它阶段的多效影响或将其降到最低,所述多效影响可能会降低目的效果的优势。

                    附图的简短说明

图1是经过差异显示技术,分别从陆地棉cv.Coker 312的18和12 DPA棉花纤维中分离的RNA中产生的经标记cDNA片段的凝胶胶片放射自显影图象。箭头指向18 DPA棉花纤维独有的条带,其对应于随后命名为F285的基因,显示与几丁质酶具有同源性。

图2显示对胶片曝光过夜的Northern印迹,其中显示了从各种棉花组织中分离的总RNA。上面框显示用针对F285的探针孵育,而底部框显示用针对18S RNA的探针孵育,以显示在每一泳道中RNA上样的比较水平,期望其是15μg/泳道。

图3显示Northern印迹,示意说明了更具体的纤维发育时间进程。上面框显示用针对F285的探针孵育,而底部框显示用针对18S RNA的探针孵育,以显示在每一泳道中RNA上样的比较水平。

图4举例说明在下列各种组织的蛋白提取物中检测几丁质酶的活性:

1区:8DPA温室生长的纤维,蛋白提取前未处理

2区:17DPA温室生长的纤维,蛋白提取前未处理

3区:24温室生长的纤维,蛋白提取前未处理

4区:31温室生长的纤维,蛋白提取前未处理

5区:18天叶子,蛋白提取前未处理

6区:18天叶子,在种植后16天用水处理

7区:18天叶子,在种植后16天用水杨酸(SA)处理

8区:阴性对照(水)

9区:8DPA培养的纤维,用水处理

10区:8DPA培养的纤维,在6DPA用SA处理

11区:阴性对照(BSA溶液)

12区:阳性对照(商品化的细菌几丁质酶)

图5显示Northern印迹,检验SA或乙烯利(ethephon)(ETH)诱导的F285的表达。上面框显示用针对F285的探针孵育,而底部框显示用针对18S RNA的探针孵育,以显示在每一泳道中RNA上样的比较水平。在每个泳道上方标出组织和预处理(如果有的话)。如果有的话,将处理应用于种植后16天的幼苗,并在两天后收获器官。如果有的话,将处理应用于在6 DPA的胚珠,在8 DPA进行收获。

图6显示用EcoR I和Hind III限制性酶消化并用F285全长cDNA、以及随后用其基因家族的另一个成员-TAG1的片段探测的棉花基因组DNA的Southern印迹。

图7显示测试TAG1表达的Northern印迹。上面框显示用针对TAG1的探针孵育,底部框显示用针对18S RNA的探针孵育,以显示在每一泳道中RNA上样的比较水平。在每一泳道的上面标出所测试的组织,包括根、茎和叶,以及18 DPA剥离的胚珠、8 DPA的纤维,以及24 DPA的纤维。

图8是用于转化实验的含有不同长度启动子的质粒构建体的示意图。

图9A-B显示来自启动子/GUS转化植物的附着有纤维的棉籽。在照片上记录有种龄(DPA)。13-17 DPA照片(图9A)是来自1.8-16-17b株。21、27、和40DPA照片(图9B)分别来自2.2-7-14b、2.2-47-5a和2.2-55-1a株。对于所有3个启动子长度的许多株都观察到一致的结果。与底物孵育1小时。在13 DPA没有明显的蓝色,到14 DPA在纤维的一些区域出现非常微弱的蓝色,到16 DPA在一些区域发展了深蓝色,到17 DPA出现均匀的亮蓝色。深蓝色在活纤维中持续存在,至少直到测试的最后一天,即40 DPA。从27 DPA种子中抽出一些纤维以显示种子表皮中的非纤维细胞并不表达GUS。

图10A-D举例说明短棉绒纤维(linter)仍然是白色,而皮棉(lint)纤维是深蓝色。图10A显示,当从种子中除去皮棉纤维时,白色棉绒纤维边缘覆盖了残留的蓝色皮棉纤维(2.2-47-1c株)。图10B显示选择性抽掉短棉绒纤维(图的中央),并紧邻仍然附着到种子上的蓝皮棉纤维(右上角)(2.2-47-5a株)放置。图10C-D显示棉绒纤维(1.4-8-8a株)是活的,并参与次生壁沉积,如螺旋状微丝(图10C,DIC和箭头)和环绕颗粒状原生质体的厚壁(图10D,明视野)所示。

图11A-B显示在明视野镜片(图11A)和偏振镜片(图11B)中所示的经包埋和切片的叶柄组织(2.2-2-2a株)的相同区域的显微照片。在偏振光学中白色双折射指示存在晶状材料如纤维素,具有高度有序的纤维素微丝的厚次生壁显示更明亮的双折射。微波辅助的石蜡包埋方法(Ruzin,Plant Microtechnique and Microscopy,322 pp,OxfordUniv.Press,Oxford(1999),特此全文并入作为参考)允许保留娇嫩的形成层(图11A,双箭头),其含有双折射晶体。木质部在底部,而韧皮部在左上角。在图11A中,由GUS活性产生的蓝色在两个韧皮部细胞中比较微弱,在一些木质部细胞比较强。偏振图象的比较显示所有蓝细胞具有更厚的细胞壁,如通过亮白色双折射所显示的那样,而GUS通常不在未开始加厚其壁的相邻细胞中表达。具有最厚壁的细胞(可通过DIC和偏振看见)并非正在表达GUS,因为它们已经完成了它们的发育程序并已死亡,变成了维管组织中的传导细胞或支持纤维。

图12A-B举例说明与其它组织相比纤维中染色强度的比较。大于或等于17 DPA的纤维1小时后染成强蓝色(图12A和B),但是在适度表达株中的植物组织仅在4-24小时后具有可见的染色(图12A;1.8-16-7b株)(染色4小时通常等同于染色24小时。1小时和24小时切片在植物中相邻)。在最强烈表达的株中,植物组织也在1小时后具有可见的染色(图12B;2.2-47-5a株)。

                       发明详述

本发明涉及来自棉花的编码内源性棉花几丁质酶的分离核酸分子。该核酸分子在次生壁沉积期间优先在次生有壁细胞中表达。

在次生壁沉积期间优先在次生有壁细胞中表达是指在次生壁沉积期间在次生有壁细胞中的基因表达水平高于其它细胞类型或在细胞发育的其它阶段100倍。基因表达的比较水平可通过各种标准分子生物学技术进行评定,包括半定量的Northern印迹和实时定量PCR。

“次生壁”定义为通常大于或等于0.2μm厚、并且除其它成分(可能包括其它多糖、蛋白、酚分子和/或木质素)外含有大于或等于30%(w/w)纤维素的植物细胞壁。具有次生壁的细胞可具有任何形状,在成熟期可以是活的或者死亡的。典型地,次生有壁细胞通常见于纤维中,但是也见于其它细胞类型中,包括一些增厚的表皮或实质细胞。

词语“纤维”常用于统称享有形状拉长、且在通常但不总是被描述为次生壁的厚细胞壁中有大量纤维素的共同特征的多组植物细胞类型。这种壁可能是或可能不是木质化的,且这类细胞的原生质体在成熟期可能仍然是活的或者可能不是。这样的纤维具有许多工业用途,例如在木材和加工的木材产品、纸、纺织品、帆布和制箱材料、绳索、刷子和扫帚、填充物和填塞物、堵缝、其它材料的加固、以及纤维衍生物的生产中。在一些工业中,术语“纤维”通常包括厚壁传导细胞如维管和管胞,以及许多个别纤维细胞的纤维性聚集体。这里术语“纤维”使用其范围最广的含义,例如包括:(a)木质部的厚壁传导和非传导细胞;(b)木质部外起源的纤维,包括来自韧皮部、树皮、地面组织、以及表皮的那些纤维;和(c)来自茎、叶、根、种子和花或花序(如在刷子和扫帚的生产中使用的高粱(Sorghurn vuhgare)的那些花序)的纤维。除了树的木材、棉花和饲料作物之外,本发明还适用于所有纤维,包括,但并非限于农业残渣如玉米、甘蔗、和可在制浆中使用的稻杆、亚麻、大麻、苎麻、黄麻、洋麻、木棉(kapok)、椰纤维、竹子、寄生藤、马尼拉麻和龙舌兰属(Agave spp)(例如,剑麻)中的纤维。

在本发明的一个实施方案中,次生有壁细胞是棉花纤维。典型地,棉花纤维是皮棉纤维。皮棉纤维比棉绒纤维(也称短绒纤维)早几天开始伸长。短绒纤维非常短,不能用作纺织纤维,而是提供化学纤维素的来源。在碾碎榨油前从棉籽中除去短绒纤维,它们每磅仅值9.7美分,而长皮棉纤维通常卖到每磅40-60美分。在另一个实施方案中,次生有壁细胞是茎的木质部和韧皮部细胞、下胚轴或根。

本发明的分离的核酸分子可具有SEQ ID NO:1的核苷酸序列,在文中标识为F 285,序列如下:

ATG GAG GCC AAA TGG CTG CTA TGT TTT ACA ATG GCA GCA CTA ATG GCA

GTG TCA AAT GGC CAG GAA TCA GTG AAG CCA TTG GTG AAG ATA GTT AAA

GGC AAG AAA CTT TGT GAT AAA GGG TGG GAA TGT AAA GGG TGG TCA CAG

TTT TGT TGT AAC CAA ACC ATT TCT GAT TAT TTC CGA ACT TAT CAA TTT

GAG AAC CTT TTC GCT AAA CGT AAT ACA CCG GTG GCA CAT GCG GTT GGG

TTC TGG GAT TAC CAT TCT TTC ATT ACG GCG GCG GCT CAG TAT CAG CCT

CAT GGT TTT GGT ACC ACC GGC GGT AAG CTG CAG AGC ATG AAG GAA GTG

GCA GCT TTT CTT GGA CAT GTC GGC AGC AAA ACT TCA TGT GGT TAT GGA

GTG GCA ACT GGG GGA CCA TTG GCT TGG GGT CTA TGC TAC AAC AAG GAA

ATG AGT CCT AGC AAA TTG TAT TGT GAT GAT TAC TAC AAA TAC ACC TAC

CCT TGC ACT CCT GGA GTT TCT TAC CAT GGC CGT GGT GCC TTG CCT ATC

TAT TGG AAC TAC AAC TAT GGA GAA ACA GGC GAC GCA TTG AAG GTG GAC

TTA TTG AAC CAC CCT GAA TAC ATA GAA AAC AAT GCA ACC TTA GCT TTC

CAG GCA GCA CTC TGG AGA TGG ATG ACA CCG GTG AAG AAA CAC CAA CCG

TCG GCC CAC GAC GTG TTT GTC GGC AGC TGG AAA CCG ACC AAG AAC GAC

ACG TTG GCC AAG CGG GTC CCG GGG TTT GGA GCC ACC ATG AAT GTG CTC

TAT GGA GAT CAA GTT TGT GGG CGA GGT GAT GTT GAC ACC ATG AAC AAC

ATC ATC TCT CAT TAC CTT TCT TAC CTT GAC CTA ATG GGA GTT GGG AGA

GAA GAG GCA GGA CCC CAT GAA GTG CTC ACA TGT GAA GAA CAA AAG CCT

TTC ACT GTA TCT CCT TCT TCT GCA TCA TCA TCA TCA TCA TCT TGA

或者,本发明的分离的核酸分子可具有SEQ ID NO:3的核苷酸序列,在文中标识为F 286,序列如下:

ATGGAAGCCAAATGGCTGGTTCTTTTTTCAGTGGCGGCAATGCTGGTGGCACTGGCCAACTGCCAG

GAATCGTTGAAGCCATTGGTGAAGATGGTAAAGGGCAAGAAGCTGTGTGACAAAGGGTGGGAATGT

AAAGGGTGGTCAAAGTATTGTTGCAACCATACCATTTCTGATTACTTCCAAACTTACCAGTTTGAG

GACCTTTTTGCGAAGCGTAACACGCCGGTAGCACATGCGGTTGGGTTCTGGGATTACCATTCCTTC

ATTACTGCTGCTGCTCAGTATCAGCCTCATGGATTTGGTACCACCGGGGAAAAGCTCCAGAATATG

AAGGAAGTCGCTGCTTTTCTTGGACATGTCGGCAGCAAAACTTCATGTGGCTATGGAGTCGCTACC

GGGGGACCATTGGCTTGGGGTCTTTGCTACAACAAAGAAATGAGCCCTAGCAAAATATATTGCGAT

GATTACTATAAATACACCTATCCTTGCACACCAGGAGTCTCATATCATGGCCGTGGTGCCTTGCCT

ATCTACTGGAACTACAACTATGGGGAAACTGGAGAGGCTTTGAAGGTGGACTTGTTGAACCACCCA

GAATACTTAGAAGACAACGCAACCTTGGCTTTCCAGACAGCAATGTGGAGGTGGATGACGCCGATG

AAGAAACACCAACCCTCAGCCCATGACGTTTTCGTTGGCAACTGGAAACCAACCAAGAACGACACC

TTGGCCAAGAGGGTTCCAGGTTTTGGAACCACCATGAATGTTCTTTATGGTGACCAAGTTTGTGGT

CAAGGTGATAGTGATTCCATGAACAATATGATCTCTCATTACCTTTATTACCTTGACCTTTTGGGA

GTTGGCCGAGAAGAAGCTGGTCCTCATGATATGCTCACCTGTGAAGAACAAGAACCCTTCACTGTT

TCTCCCTCATCTGCAACATCATCATGA

本发明的分离的核酸分子也可包括在严谨条件下与具有SEQ ID NO:1或SEQ ID NO:3所述序列的DNA分子可杂交的核苷酸序列,其中所述严谨条件的特征在于在61℃的温度下,包括1 x SSC的杂交缓冲液。

所述SEQ ID NO:1的分离的核酸分子编码具有如下SEQ ID NO:2所示的推定氨基酸序列的蛋白质或多肽:

MEAKWLLCFTMAALMAVSNGQESVKPLVKIVKGKKLCDKGWECKGWSQFCCNQTISDYFRTYQFEN

LFAKRNTPVAHAVGFWDYHSFITAAAQYQPHGFGTTGGKLQSMKEVAAFLGHVGSKTSCGYGVATG

GPLAWGLCYNKEMSPSKLYCDDYYKYTYPCTPGVSYHGRGALPIYWNYNYGETGDALKVDLLNHPE

YIENNATLAFQAALWRWMTPVKKHQPSAHDVFVGSWKPTKNDTLAKRVPGFGATMNVLYGDQVCGR

GDVDTMNNIISHYLSYLDLMGVGREEAGPHEVLTCEEQKPFTVSPSSASSSSSS

所述SEQ ID NO:3的分离的核酸分子编码具有如下SEQ ID NO:4所示的推定氨基酸序列的蛋白质或多肽:

MEAKWLVLFSVAAMLVALANCQESLKPLVKMVKGKKLCDKGWECKGWSKYCCNHTISDYFQTYQFE

DLFAKRNTPVAHAVGFWDYHSFITAAAQYQPHGFGTTGEKLQNMKEVAAFLGHVGSKTSCGYGVAT

GGPLAWGLCYNKEMSPSKIYCDDYYKYTYPCTPGVSYHGRGALPIYWNYNYGETGEALKVDLLNHP

EYLEDNATLAFQTAMWRWMTPMKKHQPSAHDVFVGNWKPTKNDTLAKRVPGFGTTMNVLYGDQVCG

QGDSDSMNNMISHYLYYLDLLGVGREEAGPHDMLTCEEQEPFTVSPSSATSS

本发明的另一种合适的分离核酸分子编码包括如下SEQ ID NO:5所示氨基酸序列的蛋白质或多肽:

GRGALPIYWNYNYGETGDAL

本发明的分离的核酸分子也可编码包括具有与SEQ ID NO:5至少60%同一性的氨基酸序列的蛋白质或多肽。

本发明的另一种合适的分离核酸分子编码包括如下SEQ ID NO:6所示氨基酸序列的蛋白质或多肽:

MKEVAAFLGHVGSKTSCGYGVATGGPLAWGLCYNKEMSP

本发明的分离的核酸分子也可编码包括具有与SEQ ID NO:6至少75%同一性的氨基酸序列的蛋白质或多肽。

SEQ ID NO:2和SEQ ID NO:4的氨基酸序列显示与在棉花纤维的防御或发育中很重要的植物几丁质酶有同源性。本发明也涉及由本发明的分离的核酸分子编码的、具有对应于SEQ ID NO:2或SEQ ID NO:4的氨基酸序列的多肽。或者,本发明的多肽可包括SEQ ID NO:5或SEQ ID NO:6的氨基酸序列或者具有与SEQ ID NO:5至少60%同一性的氨基酸序列或者具有与SEQ ID NO:6至少75%同一性的氨基酸序列。

本发明的分离的核酸分子在14到17 DPA开始优先在棉花纤维中表达,优选地一直延续到次生壁沉积结束。最优选地,本发明的分离的核酸分子在14到17 DPA开始优先在棉花纤维中表达,直到40 DPA。本发明的分离的核酸分子是第一种与已知在次生壁沉积期间优先在纤维中表达的几丁质酶具有同源性的棉花基因。该基因与次生壁沉积的精确时间调控提示可操纵该基因来改变纤维发育或防御特性。

在本发明的优选形式中,本发明的分离的核酸分子是在DNA构建体中,所述DNA构建体包括可操作地连接到编码蛋白质或多肽的第二DNA的5′以诱导所述第二DNA转录的DNA启动子。该第二DNA包括本发明的分离的核酸分子。3′调控区可操作地连接到所述第二DNA上。

在另一个实施方案中,本发明是包括包含本发明DNA构建体的合适载体的表达系统。该表达系统包含所插入的蛋白质编码序列转录和翻译必需的元件。在制备用于表达的DNA构建体中,可正常地将各种DNA序列插入或替换到细菌质粒中。可使用任何方便的质粒,其特征是具有细菌的复制系统、允许在细菌中选择的标记、以及通常一个或多个独特的、方便地定位的限制性位点。有许多质粒(称作为转化载体)可用于植物转化。载体的选择将取决于优选的转化技术和用于转化的靶物种。使用根癌农杆菌(Agrobacterium tumefaciens),一种导致冠瘿的土传细菌,可用许多载体进行稳定转化。冠瘿的特征是在感染植物的下部茎干和主根上发展的肿瘤或瘿。这些肿瘤是由于部分细菌质粒DNA转移和掺入到植物染色体DNA中所导致的。这种转移DNA(T-DNA)与植物细胞的正常基因一起表达。质粒DNA pTI或Ti-DNA(意为“肿瘤诱导质粒”)含有T-DNA移动到植物中所必需的vir基因。T-DNA携带编码在植物调控因子以及细菌营养(冠瘿碱)的生物合成中所涉及的蛋白质的基因。T-DNA通过两个25bp称为“边界序列”的不完全的正向重复序列确定了界限。通过除去癌基因和冠瘿碱基因,并用目的基因替换它们,可将外源DNA转移到植物中而不形成肿瘤或根癌农杆菌的增殖(Fraley等,“Expression of BacterialGenes in Plant Cells”,Proc.Nat′l Acad.Sci.USA,80:4803-4807(1983),特此全文并入作为参考)。

进一步改善这种技术,得到双元载体系统(Bevan,M.,“BinaryAgrobacterium Vectors for Plant Transformation”,Nucleic AcidsRes.,12:8711-8721(1984),特此全文并入作为参考)。在这种系统中,从pTi中除去了所有T-DNA序列(包括边界区),并将含有T-DNA的第二载体引入到根癌农杆菌中。这种第二载体具有可在大肠杆菌(E.coli)和根癌农杆菌中复制的优点,并含有便于转基因克隆的多克隆位点。通常使用的载体的一个实例是pBin19(Frisch,等,“CompleteSequence of the Binary Vector Bin19”,Plant Molec.Biol.,27:405-409(1995),特此全文并入作为参考)。任何现在已知的或以后描述的用于植物转化的适当载体对于本发明的使用都是合适的。

授予Cohen和Boyer的美国专利No.4,237,224(特此全文并入作为参考)中描述了使用限制性酶切割和用DNA连接酶的连接生产重组质粒形式的表达系统。这些重组质粒然后通过转化的手段引入单细胞培养物中并在其中复制,所述培养物包括在组织培养物中生长的原核生物和真核细胞。

如上所述,本发明的DNA构建体一经克隆到表达系统中,它们易于掺入到宿主细胞中。可介由转化,特别是转导、接合、诱动或电穿孔将重组分子引入到细胞中。可使用现有技术中的标准克隆操作将DNA序列克隆到载体中,如Sambrook等,Molecular Cloning:ALaboratory Manual,Second Edition,Cold Springs Laboratory,Cold Springs Harbor,New York(1989)所述,特此全文并入作为参考。合适的宿主细胞包括,但不限于:细菌、病毒、酵母、哺乳动物细胞、昆虫、植物等。优选地,宿主细胞是细菌细胞(例如,土壤杆菌)或植物细胞。植物细胞的实例包括来自树、饲料作物、棉花、玉米、甘蔗、和可在制浆中使用的稻杆、亚麻、大麻、苎麻、黄麻、洋麻、木棉、椰纤维、竹子、寄生藤、马尼拉麻、以及龙舌兰属(例如,剑麻)的细胞。最优选地,植物细胞来自棉花。

在本发明的其它实施方案中,植物或种子是通过用本发明的DNA构建体转化来生产的。

本发明也涉及赋予对昆虫和真菌的抗性的方法,包括用含有本发明编码几丁质酶的核酸分子的DNA构建体转化植物。可利用本发明的DNA构建体赋予品种繁多的纤维生产植物以对昆虫和真菌的抗性,所述植物例如是树、饲料作物、棉花、玉米、甘蔗、和可在制浆中使用的水稻茎、亚麻、大麻、苎麻、黄麻、洋麻、木棉、椰纤维、竹子、寄生藤、马尼拉麻、以及龙舌兰属(例如,剑麻)。该DNA构建体特别适于向棉花赋予抗性。

一种用本发明的核酸分子转化植物细胞的途径是宿主细胞的粒子轰击(也称为生物弹道转化)。这可通过数种方式之一来完成。第一种方法包括推动惰性或生物活性颗粒进入细胞。这种技术在美国专利No.4,945,050,5,036,006和5,100,792中公开,所有专利都授予Sanford等,特此将其全文并入作为参考。通常,这种方法包括在有效穿透细胞的外表面并掺入其内部的条件下推动惰性或生物活性颗粒进入细胞。当利用惰性颗粒时,可通过用含有异源DNA的载体包被颗粒而将载体引入到细胞中。可选地,可用载体围绕靶细胞,从而载体通过颗粒的激活而被带到细胞中。也可将生物活性颗粒(例如,含有载体和异源DNA的干燥细菌细胞)推进到植物细胞中。也可使用现在已知的或以后发展的颗粒轰击的其它变形。

原生质体中的瞬时表达使得可进行基因表达的定量研究,这是由于细胞群体极大(在106数量级)。为了将DNA递送到原生质体内部,已经提出了数种方法,但是最常见的是电穿孔(Fromm等,“Expressionof Genes Transferred Into Monocot and Dicot Plants byElectroporation”,Proc.Natl.Acad.Sci.USA 82:5824-5828(1985),特此全文并入作为参考)和聚乙二醇(PEG)介导的DNA摄取(Krens等,“In Vitro Transformation of Plant Protoplasts withTi-Plasmid DNA”,Nature 296:72-74(1982),特此全文并入作为参考)。在电穿孔期间,通过由于暴露于电场中而引起的细胞膜渗透性的可逆变化将DNA引入到细胞内。PEG转化通过改变膜的弹而引入DNA。不像电穿孔,PEG转化不需要任何特殊仪器,而转化效率可同样地高。另一种将本发明的基因构建体引入到宿主细胞中的适当的方法是原生质体与其它实体如小细胞、细胞、溶酶体、或者其它含有嵌合基因的可融合脂质表面体的融合(Fraley等,“Liposome-MediatedDelivery of Tobacco Mosaic-Virus RNA Into Tobacco Protoplasts-ASensitive Assay for Monitoring Liposome-ProtoplastInteractions”,Proc.Natl.Acad.Sci.USA,79:1859-1863(1982),特此全文并入作为参考)。

稳定的转化体对于本发明的方法是优选的。稳定地将DNA构建体引入到植物细胞中的适当的方法是用事先由该DNA构建体转化的根癌农杆菌或发根土壤杆菌(Agrobacterium rhizogenes)感染植物细胞。在现有技术中已知的适当的条件下,使转化的植物细胞生长形成芽或根,并进一步发育成植物。在本发明的一个实施方案中,使用Frary等,Plant Cell Reports,16:235(1996)(特此全文并入作为参考)的方法产生转化体,以转化幼苗外植体。

适于转化的植物组织包括,但不限于:花芽、叶组织、根组织、下胚轴组织、分生组织、合子和体细胞胚、大孢子和花药。

转化后,可选择和再生转化的植物细胞。优选地,首先使用与本发明的DNA构建体一起同时引入到宿主细胞中的选择标记鉴定转化细胞。最广泛使用的用于基因融合实验的报告基因是uidA,也称之为gusA或GUS,这是一种来自大肠杆菌的编码β-葡糖醛酸糖苷酶(也称之为GUS蛋白)的基因(Jefferson等,“GUS Fusions:βGlucuronidase as a Sensitive and Versatile Gene Fusion Markerin Higher Plants”,EMBO Journal,6:3901-3907(1987),特此全文并入作为参考)。GUS是68.2kd的蛋白质,其天然形式以四聚体起作用。它不需要辅因子或特殊的离子环境,尽管它可被二价阳离子象Cu2+或Zn2+抑制。GUS在存在巯基还原剂象β-巯基乙醇或二硫苏糖醇(DTT)时有活性。

其它合适的选择标记包括、但不限于编码抗生素抗性的标记,如赋予卡那霉素抗性的nptII基因(Fraley等.“Expression ofBacterial Genes in Plant Cells”,Proc.Natl.Acad.Sci.USA80:4803-4807(1983),其在这里以其整体并入作为参考)和赋予氨甲蝶呤抗性的dhfr基因(Bourouis等,“Vectors Containing aProkaryotic Dihydrofolate Reductase Gene Transform DrosophilaCells to Methotrexate-Resistance”,EMBO J.,2:1099-1104(1983),特此全文并入作为参考)。

一旦获得重组植物细胞或组织,即有可能从其再生发育完全的植物。再生手段随植物的物种不同而变化,但是通常首先提供经转化的原生质体的悬液或含有经转化外植体的培养皿。形成愈伤组织,并可从愈伤组织诱导芽,随后生根。或者,可在愈伤组织中诱导胚形成。这些胚如原始胚那样发芽形成植株。培养基通常将含有各种氨基酸和激素,如生长素和细胞分裂素。向培养基中添加谷氨酸和脯氨酸也是有利的,对于诸如玉米和苜蓿这样的物种尤其如此。有效再生将取决于培养基、基因型、以及培养物的培养史。如果控制了这三个变量,则再生通常是可再现和可重复的。

在Evans等,Handbook of Plant Cell Cultures,Vol.1:(MacMillan Publishing Co.,New York,1983);和Vasil I.R.(编),Cell Culture and Somatic Cell Genetics of Plants,Acad.Press,Orlando,Vol.I,1984,and Vol.III(1986)(特此全文并入作为参考)中描述了自培养的原生质体再生植株。

已知实际上所有植物均可从所培养的细胞或组织中再生,包括但不限于:棉花、水稻、小麦、大麦、黑麦、向日葵、花生、玉米、马铃薯、甘薯、黄豆、豌豆、菊苣、莴苣、苣荬菜、卷心菜、花椰菜、花茎甘蓝、芜菁、小萝卜、菠菜、洋葱、大蒜、茄子、胡椒、芹菜、胡萝卜、倭瓜、南瓜、小胡瓜、黄瓜、苹果、梨、甜瓜、草莓、葡萄、覆盆子、菠萝、大豆、烟草、番茄、高粱、以及甘蔗的所有主要品种。

将本发明的核酸分子稳定地掺入到转基因植物中后,可通过有性杂交或通过制备栽培品种将其转移到其它植物中。关于有性杂交,视待杂交的物种可使用许多标准育种技术中的任何一种。可根据本领域技术人员已知的普通农业操作繁殖栽培品种。或者,从转基因植物中回收转基因种子。然后将种子种植在土壤中并使用常规操作进行培养,以生产转基因植物。

本发明也涉及调控植物纤维中的纤维素含量的方法,包括用含有本发明编码几丁质酶的核酸分子的DNA构建体转化植物。可使用相同的途径用上述的本发明核酸分子转化植物细胞。可利用本发明的DNA构建体通过调控纤维素合成来调整品种繁多的纤维生产植物中的纤维发育,所述纤维生产植物例如有树、饲料作物、棉花、玉米、甘蔗、和可在制浆中使用的稻杆、亚麻、大麻、苎麻、黄麻、洋麻、木棉、椰纤维、竹子、寄生藤、马尼拉麻、以及龙舌兰属(例如,剑麻)。所述DNA构建体特别适于调控棉花的纤维发育。

几类证据暗示几丁质酶分布于健康植物器官中,且几丁质酶在胚发生中的一种发育作用已经被很好地描述。体细胞胚发生缺陷型的胡萝卜突变体可通过向培养基中添加酸性糖基化的胞外几丁质酶(EP3)得以补救(de Jong等,“A Carrot Somatic Embryo Mutant is Rescuedby Chitinase”,Plant Cell,4:425-433(1992),特此全文并入作为参考)。这种补救可通过添加脂几丁质寡糖(Schmidt等,“SignalMolecules Involved in Plant Embryogenesis”,Plant MolecularBiology 26:1305-1313(1994),其在这里以其整体并入作为参考)以及通过某些、但不是所有其它几丁质酶(Kragh等,“Characterization of Chitinases Able to Rescue Somatic Embryosof the Temperature-Sensitive Carrot Variant TS11”,PlantMolecular Biology,31:631-645(1996),特此全文并入作为参考)而加倍。EP3基因在小亚群的幼果细胞和成熟种子中表达,提示几丁质酶起释放几丁质寡聚物作为发育中合子胚的发育信号的作用(可能是再起始细胞分裂)(van Hengel,“Expression Patterns of theCarrot EP3 Endochitinase Genes in Suspension Cultures and inDeveloping Seeds”,Plant Physiology,117:43-53(1998),特此全文并入作为参考)。几丁质酶基因表达也与其它物种中的体细胞胚发生相关(Dong等,“Endochitinase and β-1,3-Glucanase Genesare Developmentally Regulated During Somatic Embryogenesis inPiceaglauca”,Planta 201:189-194(1997),特此全文并入作为参考)。阿拉伯半乳聚糖蛋白(AGPs)是体细胞胚发生所必需的另一类分子,一些胡萝卜AGPs含有葡糖胺和N-乙酰-D-葡糖胺,并对几丁质酶的裂解敏感。用几丁质酶对AGPs预处理会使得它们在促进胡萝卜原生质体的胚发育中更有活性,暗示几丁质酶的胚补救可由它们对AGPs的水解作用介导(van Hengel等,“N-Acetylglucosamine andGlucosamine-Containing Arabinogalactan Proteins ControlSomatic Embryogenesis”,Plant Physiology,125:1880-1890(2001),特此全文并入作为参考)。在这种情况下,AGPs将是几丁质酶的一种内源性底物。已经发现,AGP型蛋白在棉花纤维次生壁沉积期间发生累积(John等,“Characterization of mRNA for aProline-Rich Protein of Cotton Fiber”,Plant Physiology,108:669-676(1995),特此全文并入作为参考)。

几丁质酶与其它几种健康植物组织相关,包括正在发芽的种子(Petruzzelli等“Distinct Ethylene-and Tissue-SpecificRegulation ouf β-1,3-Glucanases and Chitinases During PeaSeed Gennination”,Planta,209:195-201(1999),特此全文并入作为参考)。几丁质酶基因表达与从烟草细胞外植体从头开始的花形成相关(Neale等,“Chitinase,B-1,3-Glucanase,Osmotin,andExtensin are Expressed in Tobacco Explants During FlowerFonnation”,Plant Cell,2:673-684(1990),特此全文并入作为参考)。已经在健康的矮牵牛花(Petunia)的花中发现有几丁质酶酶活性,花药裂开后在柱头中活性特别高(Leung,“Invo lvement of PlantChitinases in Sexual Reproduction of Higher Plants”,Phytochemistry,31:1899-1900(1992),特此全文并入作为参考)。类似地,在花药和黄豆雌蕊的上部(含有柱头)均鉴定出了与碱性几丁质酶免疫学相关的蛋白质(del Campillo等,“Occurrence of 9.5Cellulase and Other Hydrolases in Flower Reproductive OrgansUndergoing Major Cell WallDisruption”,Plant Physiologv,99:1015-1020(1992),特此全文并入作为参考)。在花中,几丁质酶可能具有发育作用,或者对成功繁育至关重要的脆弱组织的可能的真菌侵犯中具有防御作用。从悬浮培养物中各种植物物种的初生和次生细胞壁中提取的并在其N端测序的一些蛋白质与来自法国黄豆(P80800,P80808,P80792,P82432)和烟草(P80783,P8233)数据库中的几丁质酶序列有同源性(Robertson等,“Differential Extraction andProtein Sequencing Reveals Major Differences in Patterns ofPrimary Cell Wall Proteins from Plants”,The Journal ofBiological Chemistry,272:15841-15848(1997);Blee等,“Proteomic Analysis Reveals a Novel Set of Cell Wall Proteinsin a Transformed Tobacco Cell Culture That SynthesizesSecondary Walls as Determined by Biochemical and MorphologicalParameters”,Planta,212:404-415(2001),特此全文并入作为参考)。然而,由于N端测序后仅有短肽序列(最大18个氨基酸)可供利用,不能得到在这些细胞壁中存在真正的几丁质酶的确切结论。

除了与胚补救相关的含有N-乙酰-葡糖胺的AGPs外(van Hengel等,“N-Acetylglucosamine and Glucosamine-ContainingArabinogalactan Proteins Control Somatic Embryogenesis”,Plant Physiology 125:1880-1890(2001),特此全文并入作为参考),一直没有在结构或功能水平上表征植物几丁质酶的内源性底物。然而,有证据显示多种分子类型的内源性几丁质酶底物存在于健康植物中。例如,用电子密集型胶体金标记的结合几丁质的凝集素、小麦胚凝集素(WGA)、或者几丁质酶在健康的榆树、番茄、茄子和马铃薯植物中非常密集地标记了其维管次生壁细胞。相邻的初生壁或中央板区不被标记,这证实了该反应的特异性(Benhamou等,“AttemptedLocalization of Substrate for Chitinases in Plant Cells RevealsAbundant N-Acetyl-D-Glucosamine Resides in Secondary Walls”,Biologie Cellulaire,67:341-350(1989),特此全文并入作为参考)。这种标记不能通过用蛋白酶预处理消化蛋白质或微生物几丁质酶而消除,但是可通过脂肪酶预处理消化脂质而消除。脂肪酶处理后标记的消失似乎将这些次生壁分子置于与胚补救有关的含N-乙酰-葡糖胺的AGPs不同的类型。更确切地说,该数据提示几丁质寡聚物存在于次生细胞壁中含脂质的分子内或者与其有关。

已知含有几丁质寡聚物和脂质(从C16:0到C20:4变化的单脂肪酰基)的分子以脂几丁质寡糖(lipochitin oligosaccharide,LCOs)的形式(其由结瘤细菌(根瘤菌属(Rhizobium))合成并分泌)会诱导由它们的植物宿主形成共生根瘤(Bakkers等,“Function ofChitin Oligosaccharides in Plant and Animal Development”,Jolles编,Chitin and Chitinases,Birkhuser Verlag:Basel,pp.71-84(1999),特此全文并入作为参考)。这表明植物具有识别由外源生物体提供的此类分子作为发育信号的能力,在此情形下起始瘤形成。此外,类似的分子可能内源性地存在于植物内。植物香豌豆(Lathyrusodoratus)花的提取物中亲脂性化合物的薄层层析(TLC)显示它们以类似于LCOs的方式迁移,并且它们中的一些易受几丁质酶消化的影响(Spaink等,“Rhizobial Lipo-Oligosaccharide Signals and TheirRole in Plant Morphogenesis:Are Analogous Lipophilic ChitinDerivatives Produced by the Plant?”,Australian Journal ofPlant Physiology 20:381-392(1993),特此全文并入作为参考)。

与LCOs相似的内源性植物分子可能含有可由内源性植物几丁质酶释放的调节生长的几丁质寡聚物。已经描述过的有关几丁质酶对胚补救的数据提供了一个实例。同样,番茄悬浮细胞响应于LCOs或几丁质寡聚物(如可能是通过有限的几丁质酶作用而从更为复杂的内源性分子中释放出来)而瞬时地提高其培养基的pH(Staehelin等,“Perception of Rhizobium Nodulation Factors by Toma to Cellsand Inactivation by Root Chitinases”Proc.Nat’1.Acad.Sci.U.S.A.,91:2196-2200(1994),特此全文并入作为参考)。其它与几丁质寡聚物相关的植物响应包括抗真菌的植物抗毒素的合成、几丁质酶的诱导、K+和Cl-释放的诱导、以及H2O2的合成(Gooday,“Aggressive and Defensive Roles for Chitinases”,Jolles编,Chitin and Chitinases,Birkhuser Verlag:Basel,pp.157-170(1999),特此全文并入作为参考)。经转化而过表达来自根瘤菌属的LCO合成基因(NodA和NodB,可单独地或相联合)的烟草植物降低了生长并改变了叶的形状(Schmidt等,“Alteration of Plant Growthand Development by Rhizobium noda and Nodb Genes Involved inthe Synthesis of Oligosaccharide Signal Molecules”,The PlantJournal,4:651-658(1993),特此全文并入作为参考),提示NodA和NodB可干扰形态发生所必需的植物生物合成过程(Bakkers等,“Function of Chitin Oligosaccharides in Plant and AnimalDevelopment”,Jolles编,Chitin and Chitinases,BirkhuserVerlag:Basel,pp.71-84(1999),特此全文并入作为参考)。这种干扰可发生在多种水平上。然而,由于总的生长速度和正常植物器官的形态发生都在很大程度上取决于纤维素合成,因此有可能NodA和NodB直接干扰纤维素合成。也许NodA和NodB结合并不适当地加工内源性的含N-乙酰-葡糖胺的植物底物,产生纤维素合成所必需的内源性分子的无功能类似物。

相反,经转化而过表达I型玉米酸性几丁质酶的烟草植物显示了几丁质酶活性和幼苗干重之间的正相关(Patil等,“PossibleCorrelation Between Increased Vigour and Chitinase ActivityExpression in Tobacco”,Journal of Experimental Botany,48:1943-1950(1997),特此全文并入作为参考),其具有大量纤维素组分。尽管没有提供机理解释,有可能外源几丁质酶活性导致过量产生刺激纤维素合成的几丁质寡聚物。几丁质寡聚物可作为发育信号或作为纤维素合成过程中的直接参与者而调控纤维素合成。例如,含N-乙酰葡糖胺的透明质酸杂聚物的寡聚物(β-1,4-GlcA β-1,3-GlcNAc)n与特殊受体相互作用,激活Rho和Racl GTP酶,导致肌动蛋白细胞骨架的重建(Lee等,“Hyaluronan:A Multifunctional,Megadalton,Stealth Molecule”,Current Opinion in Cell Biology,12:581-586(2000),特此全文并入作为参考)。肌动蛋白细胞骨架的重建在棉花纤维中在初生向次生壁转变时发生,以介导纤维素微丝改变的取向(Seagull,“Cytoskeletal Involyement in Cotton Fiber Growth andDevelopment”,Micron,24:643-660(1993),特此全文并入作为参考)。Rac基因在此重建之际在棉花纤维中瞬时表达(Delmer等,“Genes Encoding Small GTP-Binding Proteins Analogous toMammalian Rac are Preferentially Expressed in Developing CottonFibers”,Mol.Gen.Genet.,248:43-51(1995),特此全文并入作为参考),相关的H2O2突发也可能介导这种转变(Potikha等,“TheInvolvement of Hydrogen Peroxide in the Differentiation ofSecondary Walls in Cotton Fibers”,Plant Physiology,119:849-858(1999),特此全文并入作为参考)。然而,在本发明中所公开的分离的核酸分子在整个次生壁沉积期间的延长表达支持了其对在初生到次生壁转变时涉及Rac和H2O2的信号转导级联和细胞骨架组建的瞬时调节以外的作用。

可用其它系统用类推的方法提出本发明中所公开的分离的核酸分子参与棉花纤维纤维素合成的其它可能性。LCOs或类似分子如多萜醇-(N-乙酰-葡糖胺)n可向蛋白质提供含几丁质的寡糖,作为在生物合成过程中的引物(Spaink等,“Rhizobial Lipo-OligosaccharideSignals and Their Role in Plant Morphogenesis:Are AnalogousLipophilic Chitin Derivatives Produced by the Plant?”,Australian Journal of Plant Physiology,20:381-392(1993),特此全文并入作为参考),正如昆虫中的几丁质生物合成所例示的那样(Palli等,“Molecular and Biochemical Aspects of ChitinSynthesis Inhibition”,Jolles编,Chitin and Chitinases,Birkhuser Verlag:Basel,pp.85-98(1999),特此全文并入作为参考)。业已指出几乎没有注意到两种真菌几丁质酶和卵溶菌酶在转糖基反应中作为催化剂这一事实(Collinge等,“Plant Chitinases”,Plant J.3:31-40(1993),特此全文并入作为参考)。拟南芥cytl突变体缺乏足够的甘露糖-1-磷酸鸟苷酸转移酶活性,所以它们在蛋白质的N-糖基化所必需的GDP-甘露糖的生产方面是缺陷型的。它们也表现出纤维素含量有5倍的下降,且不能进行正常的胚发育(Lukowitz等,“Arabidopsis cytl Mutants are Deficient in aMannose-1-Phosphate Guanyltransferase and Point to aRequirement of N-Linked Glycosylation for CelluloseBiosynthesis”,Proc.Nat′l.Acad.Sci.U.S.A.,98:2262-2267(2001),特此全文并入作为参考)。由于N-糖基化抑制剂-衣霉素,也导致纤维素缺乏,这些作者提出N-糖基化的肽可能作为纤维素合成的引物起作用,这是有关纤维素合成的确需要引物的备受争论的古老假说的重现(Maclachlan,“Does β-Glucan Synthesis Need APrimer”,Brown,Jr.,编,Cellulose and Other Natural PolymerSystems:Biogenesis,Structure,and Degradation,Plenum Press:NY,pp.327-339(1982),特此全文并入作为参考)。

本发明的另一方面涉及分离的DNA启动子,其适于诱导可操作地与该DNA启动子结合的第二DNA所编码的蛋白的表达。该DNA启动子是从棉花中分离的,并在次生壁沉积期间优先在次生有壁细胞中驱动表达。通常,次生有壁细胞是棉花纤维,特别是皮棉纤维。在另一个实施方案中,次生有壁细胞是茎的木质部和韧皮部细胞、下胚轴或根。本发明的分离的DNA启动子可用于驱动异源蛋白在次生壁沉积期间仅在或优先在次生有壁细胞如纤维中的表达。如果所述蛋白质若在其它阶段或在其它细胞类型中强烈表达则可能有不利的多效影响,那么这尤其重要。这种启动子应当类似地可用于其它用途,由于许多重要的纤维特性是在发育的次生壁阶段决定的,故大量次生壁代表了包括酶或结构分子在内的新纤维成分的潜在“贮藏”点。

基因调控和表达是胞内和胞外因子的复杂的相互作用。拟南芥具有145Mb大小的基因组,含有约25,000个基因(Ausubel,“Arabidopsis Genome:A Milestone in Plant Biology”,PlantPhysiology,124:1451-1454(2000),特此全文并入作为参考)。为了具有有组织的生长和对环境的适当反应,这些基因必需完美协调地表达。这是通过差异的基因表达实现的,其中植物能够视发育的阶段、组织类型、以及来自环境的特异性诱导物而开关不同基因。

植物细胞具有数种机制来控制基因表达,它们可在转录、转录后、翻译以及翻译后水平上发挥作用。然而,当RNA聚合酶II与DNA和多种蛋白因子相互作用以起始mRNA的合成时,可在转录水平上阐明多数差异表达(Roeder,“The Role of Initiation Factors inTranscription by RNA Polymerase II”,Trends in BiochemicalScience,21:327-335(1996),特此全文并入作为参考)。参与这种转录前相互作用的DNA区被称作“启动子”。启动子通常紧邻基因编码区的5′端。

通过测序、比较、以及修饰植物启动子,已有可能在它们的DNA序列中鉴定有功能的元件。所有已知的启动子都由两个一般的元件构成:核心区和调控区(Kornberg,“RNA Polymerase II TranscriptionControl”,Trends in Biochemical Science,21:325-326(1996),特此全文并入作为参考)。

核心区紧邻编码区5′端的上游,是转录过程必需的;然而,在数量方面其仅负责整个基因表达中的一小部分。核心区约100bp长,并且包括TATA盒和转录起始位点。TATA盒是大约13bp长的序列,富含胸腺嘧啶和腺嘌呤残基,具有共有序列TC/GTATAT/AA1-3C/TA。TATA盒存在于绝大多数、但不是所有编码蛋白质的基因的启动子中(Roeder,“The Role of Initiation Factors in Transcription by RNAPolymerase II”,Trends in Biochemical Science 21:327-335(1996),特此全文并入作为参考)。这是与RNA聚合酶II(RNA Pol II)和与通用转录因子(TAFs)直接相互作用的位点,二者是转录复合物的必需部分(Verrijzer等,“TAFs Mediated TranscriptionalActivation and Promoter Selectivity”,Trends in BiochemicalScience,21:338-342(1996),特此全文并入作为参考)。通用因子是存在于所有细胞中的蛋白质,并且从酵母到人都非常保守(Guarente等,“Conservation and Evolution of Transcriptional Mechanismsin Eukaryotes”,Trends in Genetics,8:27-32(1992),特此全文并入作为参考)。

调控区位于核心区的更上游,可能长2kb或者甚至更长。这个区域负责控制基因表达,可以是抑制或增强RNA聚合酶II的活性。调控区由数个大小从4到300bp变化的“盒”或元件组成。这些元件是参与调节基因的差异性表达的特异性蛋白的结合位点,并赋予细胞特异性或基因特异性表达。蛋白质在这个水平上与TFIID相互作用,提高其在启动子结合中的稳定性,增强转录。多个元件和它们的相应因子的存在在转录中产生协同效应。

启动子系统的最为动态的部分是蛋白质因子与DNA以及与复合物中的其它蛋白质的相互作用。对于这些相互作用,蛋白质必需含有识别DNA的小沟或大沟以及糖-磷酸主链的特定表面特征的结构域(Travers,“DNA-Protein Interactions”,St.Edmundsbury Pres,Bury St.Edmunds,Great Britain(1993),特此全文并入作为参考)。与这一功能相关的最常见的结构域是螺旋-转角-螺旋(HTH)基序、Zn结合域或锌指、以及亮氨酸拉链卷曲螺旋(b-ZIP)(Brunelle等,“Transcription Regulatory Proteins in Higher Plants”,Current Opinions in Genetics and Development,3:254-258(1993),特此全文并入作为参考)。不是所有转录调节物都结合DNA。蛋白质对蛋白质的相互作用负责杂二聚体或均二聚体的形成,其继而作为正调节物起作用,或作为负调节物起作用,避免形成活性二聚体。这些因子的合成或活化可通过特殊刺激物诱导,在有些情况下涉及磷酸化级联(Brunelle等,“Transcription Regulatory Proteins in HigherPlants”,Cunent Opinions in Genetics and Development,3:254-258(1993),特此全文并入作为参考)。

在转录起始的当前模型中,TBP经过DNA螺旋的小沟结合TATA盒。TFIIA可稳定这种可被改变的离子条件或DNA结合元件中的突变削弱的结合。TFIIB结合TBP,使其氨基末端区朝向下游起始位点。这种氨基末端序列在不同物种中并不保守,这提示有不同的调控路径(Roeder,“The Role of Initiation Factors in Transcription by RNApolymerase II”,Trends in Biochemical Science,21:327-335(1996),特此全文并入作为参考)。同样地,象拟南芥这样的植物可含有两种不同的TBPs(Gasch等,“Arabidopsis Thaliana Contains TwoGenes for TFIID”,Nature,346:390-394(1990),特此全文并入作为参考)。

TBP结合TATA盒的同时,TFIIF结合RNA聚合酶II,产生复合物,其随后结合TFIIB的氨基末端结构域,覆盖约40bp的启动子区。最终,TFIIE和TFIIH恰好在起始位点上游结合该复合物,诱导启动子解链(双链打开)并继续转录和延伸(Roeder,“The Role of InitiationFactors in Transcription by RNA Polymerase II”,Trends inBiochemical Science 21:327-335(1996),特此全文并入作为参考)。

根据本发明的一种合适DNA启动子分子具有下列SEQ ID NO:7的核苷酸序列:

CTGAGACCAGCGTTCAACATCGATGAAAATTTGTTTTAACAATGAGAACTGCAAATCCTCCATAGT

CTTCTAACATTTCAACATTCGAAATCTCGAAAAGAAATTGGCTTGATATGATTTATTTAGGGTGTT

AATTTTATGTATTATAATAATGCACAAATTGATATTTTATGCATCACATTTAATATTTTTAAAGTA

TATAATATCAAATCATTTTATGAAAATAAAAATACCAAATAATACATAAATTGATAGTTCAAGTAT

TTCATTAAAAATTTTCAAAATATAAATATCATATTGAAACATTTTATAAAAGAATAGATACCAAAT

ATGACATCATCCCCTGTTGAGAGTAACCAAACACTGTTTTCATCCAGCCCATGAGAAGTATTTGGC

CCAAAAGCAAAAGTTTCAGTACAATGAATTATGAATCCCAAAAAAACCCCAAGTGGTCCAGGTCCA

AGCCAGTCTAGGGCTGAGGAAAGAAATGGAAAAATTGAAAAGTAATTCCAGGGTCTGATTCAATTT

TATTAAATTTAGTTTGATTTTGGTTTCGGTTCATAAATTTAAAAATAATTTTAAAATGTTATATAA

AACTGTTTTTTAAAAATAAATTAATCAATAATCTAAAACGATAAAAATGGCGATTTGAATTAAGCT

CATATTTTGAAAAAAAAATAAAAATTATCTCATCCAGAACTGATTAAAACCGAACCGATGAATCCT

AGAAGCCAAGCCAAGTGTGCAGAGTAAGAATAGAACATCAACATTTTGCTTTAAGCTTTTCGTTGC

TTGCACTCTAAGAAGCATAAAACGCAAGCAAAACTTGACACTAGTGTGAGTGTGAGTGCCCATCAT

TCATCAACCCTGAAAATCGCCCTTCCCCTAATCAGTTCTAACCTCACTTTCTAACACTTTCACTGC

AGCACTCAAAAACATTCGCCGAATCTTTACTATAAACTCCCAGTGTTGGTTTCTCCACTCCAAACC

CAAACCACGACCACCACATTTTGCTTCGTATCTTTGATA

这一核苷酸序列长1.0kb(1,029bp)。有下划线的是结合RNA聚合酶的TATAAA盒,以及CAAT盒增强子元件。紧跟该核苷酸序列的是候选起始序列ATGGA。该候选起始序列后12个碱基处是另一候选起始序列ATGGC。

根据本发明的另一种合适DNA启动子分子具有下列SEQ ID NO:8所示的核苷酸序列:

AACCTCTCGAGCTGCCATATTGGGTTTTTCACTACCCACCTCTTCATTAAATGTATCTTCAACCTC

TCAACTCCTTTCACCACCAGACGAATCTTCTTTAGCAAAATCAAAATGACCTTATGAAAATTTAGC

ACGTCCACCTCCAGATTCAAAGGCTGTGAATCCCCAACTTCGGAAATTGTTCATCTCCACATTCAA

GAATAATGAGTTCCTCAATTTGTTTTAACTGATTAGCCGATATTAAGCGAGTTAGACTCCATGGAA

ATAAAATCACCCTAATAAATAGCAACGCTTTTGAACGTCTCTAGGTTCCAAGCGTGCTAAGGAGCG

CCAGTAACTTCAATCCAAGTTGTGCGAAAACGTATGAAATGGAACTGAGACCAGCGTTCAACATCG

ATGAAAATTTGTTTTAACAATGAGAACTGCAAATCCTCCATAGTCTTCTAACATTTCAACATTCGA

AATCTCGAAAAGAAATTGGCTTGATATGATTTATTTAGGGTGTTAATTTTATGTATTATAATAATG

CACAAATTGATATTTTATGCATCACATTTAATATTTTTAAAGTATATAATATCAAATCATTTTATG

AAAATAAAAATACCAAATAATACATAAATTGATAGTTCAAGTATTTCATTAAAAATTTTCAAAATA

TAAATATCATATTGAAACATTTTATAAAAGAATAGATACCAAATATGACATCATCCCCTGTTGAGA

GTAACCAAACACTGTTTTCATCCAGCCCATGAGAAGTATTTGGCCCAAAAGCAAAAGTTTCAGTAC

AATGAATTATGAATCCCAAAAAAACCCCAAGTGGTCCAGGTCCAAGCCAGTCTAGGGCTGAGGAAA

GAAATGGAAAAATTGAAAAGTAATTCCAGGGTCTGATTCAATTTTATTAAATTTAGTTTGATTTTG

GTTTCGGTTCATAAATTTAAAAATAATTTTAAAATGTTATATAAAACTGTTTTTTAAAAATAAATT

AATCAATAATCTAAAACGATAAAAATGGCGATTTGAATTAAGCTCATATTTTGAAAAAAAAATAAA

AATTATCTCATCCAGAACTGATTAAAACCGAACCGATGAATCCTAGAAGCCAAGCCAAGTGTGCAG

AGTAAGAATAGAACATCAACATTTTGCTTTAAGCTTTTCGTTGCTTGCACTCTAAGAAGCATAAAA

CGCAAGCAAAACTTGACACTAGTGTGAGTGTGAGTGCCCATCATTCATCAACCCTGAAAATCGCCC

TTCCCCTAATCAGTTCTAACCTCACTTTCTAACACTTTCACTGCAGCACTCAAAAACATTCGCCGA

ATCTTTACTATAAACTCCCAGTGTTGGTTTCTCCACTCCAAACCCAAACCACGACCACCACATTTT

GCTTCGTATCTTTGATA

这一核苷酸序列长1.4kb(1,403bp)。有下划线的是结合RNA聚合酶的TATAAA盒,以及CAAT盒增强子元件。紧跟该核苷酸序列的是候选起始序列ATGGA。该候选起始序列后12个碱基处是另一候选起始序列ATGGC。

根据本发明的另一种合适DNA启动子分子具有下列SEQ ID NO:9所示的核苷酸序列:

CTTCAATCTCTGCCAATGATCTCACCTTCTTCTTCACACCATCAACAGTAATTATCGTCGAATAGG

GATTATGCACTACAGTGTTTTGCATTGCTACTCCCATGGAGTCCTCCACCCTAACTCTACTTGTAG

GACTCCTAACTAACGAATTGCAAAGGGTTTCGCGACCCGAATTGTTCCCTTTCTGACAACCCAAGT

CCACTTAGGTTCAATCATATTTAAATTCGTATCAACAATCTCCTCAGCCGACCAATTCACAGCTTT

CAAATCTGCTCCGCAACCCACCATTTGATCGTGACCAAAGTGTGAACTTGCCTTCAACAAATCAGG

CCCAGAGCCTCGTTCTAATCATTTCTCGAGGCAATAGCAATAGTTGGGTCTAAGTTCTCTGCTAAT

TCCTTTGATTTCCTAGAACCTCTCGAGCTGCCATATTGGGTTTTTCACTACCCACCTCTTCATTAA

ATGTATCTTCAACCTCTCAACTCCTTTCACCACCAGACGAATCTTCTTTAGCAAAATCAAAATGAC

CTTATGAAAATTTAGCACGTCCACCTCCAGATTCAAAGGCTGTGAATCCCCAACTTCGGAAATTGT

TCATCTCCACATTCAAGAATAATGAGTTCCTCAATTTGTTTTAACTGATTAGCCGATATTAAGCGA

GTTAGACTCCATGGAAATAAAATCACCCTAATAAATAGCAACGCTTTTGAACGTCTCTAGGTTCCA

AGCGTGCTAAGGAGCGCCAGTAACTTCAATCCAAGTTGTGCGAAAACGTATGAAATGGAACTGAGA

CCAGCGTTCAACATCGATGAAAATTTGTTTTAACAATGAGAACTGCAAATCCTCCATAGTCTTCTA

ACATTTCAACATTCGAAATCTCGAAAAGAAATTGGCTTGATATGATTTATTTAGGGTGTTAATTTT

ATGTATTATAATAATGCACAAATTGATATTTTATGCATCACATTTAATATTTTTAAAGTATATAAT

ATCAAATCATTTTATGAAAATAAAAATACCAAATAATACATAAATTGATAGTTCAAGTATTTCATT

AAAAATTTTCAAAATATAAATATCATATTGAAACATTTTATAAAAGAATAGATACCAAATATGACA

TCATCCCCTGTTGAGAGTAACCAAACACTGTTTTCATCCAGCCCATGAGAAGTATTTGGCCCAAAA

GCAAAAGTTTCAGTACAATGAATTATGAATCCCAAAAAAACCCCAAGTGGTCCAGGTCCAAGCCAG

TCTAGGGCTGAGGAAAGAAATGGAAAAATTGAAAAGTAATTCCAGGGTCTGATTCAATTTTATTAA

ATTTAGTTTGATTTTGGTTTCGGTTCATAAATTTAAAAATAATTTTAAAATGTTATATAAAACTGT

TTTTTAAAAATAAATTAATCAATAATCTAAAACGATAAAAATGGCGATTTGAATTAAGCTCATATT

TTGAAAAAAAAATAAAAATTATCTCATCCAGAACTGATTAAAACCGAACCGATGAATCCTAGAAGC

CAAGCCAAGTGTGCAGAGTAAGAATAGAACATCAACATTTTGCTTTAAGCTTTTCGTTGCTTGCAC

TCTAAGAAGCATAAAACGCAAGCAAAACTTGACACTAGTGTGAGTGTGAGTGCCCATCATTCATCA

ACCCTGAAAATCGCCCTTCCCCTAATCAGTTCTAACCTCACTTTCTAACACTTTCACTGCAGCACT

CAAAAACATTCGCCGAATCTTTACTATAAACTCCCAGTGTTGGTTTCTCCACTCCAAACCCAAACC

ACGACCACCACATTTTGCTTCGTATCTTTGATA

这一核苷酸序列长1.8kb(1,815bp)。有下划线的是结合RNA聚合酶的TATAAA盒,以及CAAT盒增强子元件。紧跟该核苷酸序列的是候选起始序列ATGGA。该候选起始序列后12个碱基处是另一候选起始序列ATGGC。

根据本发明的另一种合适DNA启动子分子具有下列SEQ ID NO:10所示的核苷酸序列:

ATGAAACATCTTCGTACTCATATCTGAAACTCCAGCTTCTTGATCCTCAATGATAATTAAATCCTC

ACTATCACTCGCATTCACCTCGAGCAGCTTCGCAAATTGAAATGTTTCCTTAGCTTCCTTCACTAT

ACTTGCGATTCCCAATGACAGAGTCAGTAAGGGAACCATTAACAATACGATCATCCGTTCTTTGCT

TCTTCACCAGACACCACACCTTTAGATATGATTGGTTTTCTACCTCTACGTTTTTGCTTCTTTTTT

TTTTTTAACCAAAGTCATCACTTTTTCTTCAATCTCTGCCAATGATCTCACCTTCTTCTTCACACC

ATCAACAGTAATTATCGTCGAATAGGGATTATGCACTACAGTGTTTTGCATTGCTACTCCCATGGA

GTCCTCCACCCTAACTCTACTTGTAGGACTCCTAACTAACGAATTGCAAAGGGTTTCGCGACCCGA

ATTGTTCCCTTTCTGACAACCCAAGTCCACTTAGGTTCAATCATATTTAAATTCGTATCAACAATC

TCCTCAGCCGACCAATTCACAGCTTTCAAATCTGCTCCGCAACCCACCATTTGATCGTGACCAAAG

TGTGAACTTGCCTTCAACAAATCAGGCCCAGAGCCTCGTTCTAATCATTTCTCGAGGCAATAGCAA

TAGTTGGGTCTAAGTTCTCTGCTAATTCCTTTGATTTCCTAGAACCTCTCGAGCTGCCATATTGGG

TTTTTCACTACCCACCTCTTCATTAAATGTATCTTCAACCTCTCAACTCCTTTCACCACCAGACGA

ATCTTCTTTAGCAAAATCAAAATGACCTTATGAAAATTTAGCACGTCCACCTCCAGATTCAAAGGC

TGTGAATCCCCAACTTCGGAAATTGTTCATCTCCACATTCAAGAATAATGAGTTCCTCAATTTGTT

TTAACTGATTAGCCGATATTAAGCGAGTTAGACTCCATGGAAATAAAATCACCCTAATAAATAGCA

ACGCTTTTGAACGTCTCTAGGTTCCAAGCGTGCTAAGGAGCGCCAGTAACTTCAATCCAAGTTGTG

CGAAAACGTATGAAATGGAACTGAGACCAGCGTTCAACATCGATGAAAATTTGTTTTAACAATGAG

AACTGCAAATCCTCCATAGTCTTCTAACATTTCAACATTCGAAATCTCGAAAAGAAATTGGCTTGA

TATGATTTATTTAGGGTGTTAATTTTATGTATTATAATAATGCACAAATTGATATTTTATGCATCA

CATTTAATATTTTTAAAGTATATAATATCAAATCATTTTATGAAAATAAAAATACCAAATAATACA

TAAATTGATAGTTCAAGTATTTCATTAAAAATTTTCAAAATATAAATATCATATTGAAACATTTTA

TAAAAGAATAGATACCAAATATGACATCATCCCCTGTTGAGAGTAACCAAACACTGTTTTCATCCA

GCCCATGAGAAGTATTTGGCCCAAAAGCAAAAGTTTCAGTACAATGAATTATGAATCCCAAAAAAA

CCCCAAGTGGTCCAGGTCCAAGCCAGTCTAGGGCTGAGGAAAGAAATGGAAAAATTGAAAAGTAAT

TCCAGGGTCTGATTCAATTTTATTAAATTTAGTTTGATTTTGGTTTCGGTTCATAAATTTAAAAAT

AATTTTAAAATGTTATATAAAACTGTTTTTTAAAAATAAATTAATCAATAATCTAAAACGATAAAA

ATGGCGATTTGAATTAAGCTCATATTTTGAAAAAAAAATAAAAATTATCTCATCCAGAACTGATTA

AAACCGAACCGATGAATCCTAGAAGCCAAGCCAAGTGTGCAGAGTAAGAATAGAACATCAACATTT

TGCTTTAAGCTTTTCGTTGCTTGCACTCTAAGAAGCATAAAACGCAAGCAAAACTTGACACTAGTG

TGAGTGTGAGTGCCCATCATTCATCAACCCTGAAAATCGCCCTTCCCCTAATCAGTTCTAACCTCA

CTTTCTAACACTTTCACTGCAGCACTCAAAAACATTCGCCGAATCTTTACTATAAACTCCCAGTGT

TGGTTTCTCCACTCCAAACCCAAACCACGACCACCACATTTTGCTTCGTATCTTTGATA

这一核苷酸序列长2.1kb(2,105bp)。有下划线的是结合RNA聚合酶的TATAAA盒,以及CAAT盒增强子元件。紧跟该核苷酸序列的是候选起始序列ATGGA。该候选起始序列后12个碱基处是另一候选起始序列ATGGC。

除了上面4种DNA启动子分子,长度为:(a)长于SEQ ID NO:10但包括SEQ ID NO:10;或(b)比SEQ ID NO:10短任何数目的碱基的其它启动子也可用于本发明中。也有可能创建含有SEQ ID NO:10内所包含的关键调控元件的有用的人工核苷酸聚合物,所述调控元件是实现下述目的所必需的,并且足够的:驱动如具有SEQ ID NO:10所示核苷酸序列或任何更短片段的启动子所示的基因表达,或者以其它有用的方式修饰所证实的基因表达模式。例如,所选定的调控元件可在SEQ ID NO:10内鉴定出来,并人工融合而产生修饰的启动子,其会将基因表达局限于所述启动子目前有用的特定细胞类型中的任何一种中,例如仅仅局限于棉花皮棉纤维发育的次生壁阶段。类似地,可鉴定特定的调控基序或结构域,以便缺失而向所述启动子片段提供更多的细胞类型特异性。公认启动子内调控基序或结构域的不同组合将指导基因在组织内不同的细胞群中表达(Capone等,“Expressionin Different Populations of Cells of the Root Meristem isControlled by Different Doma ins of the rol B Promoter”,PlantMol.Biol.,25:681-691(1994),特此全文并入作为参考)。“基序”或“结构域”分别指启动子DNA中较短(例如,典型地4-11)或较长(例如,典型地12-300)的含氮碱基序列,它们是涉及作为转录的细胞和发育控制一部分的互补蛋白质转录因子或其它调控因子的结合位点或其它反应位点。本领域技术人员公知通过基序或结构域的融合或缺失来人工操纵天然启动子,以影响其强度、特异性和/或对某些转录因子的反应(Ohneda等,“A Minigene Containing Four Discrete CisElements Recapitulates GATA-1 Gene Expression in vivo”,GenesCells,7:1243-1254(2002);Lee等,“TranscriptionalRegulation of Xbr-la/X-yent 2 Homeobox Gene:Analysis of itsPromoter Region”,Biochem.Biophys.Res.Commun.,298:815-823(2002);Buzeli等,“Tissue-Specific Regulation of BiP Genes:A Cis-Acting Regulatory Domain is Required for BiP PromoterActivity in Plant Meristems”,Plant Mol.Biol.,50:757-71(2002),特此全文并入作为参考)。作为F286启动子中的一个具体实例,烟草中rolB的维管表达所必需的基序ACTTTA(表9中的#140)(Baumann等,“The DNA Binding Site of the Dof Protein NtBBF1is Essential for Tissue-Specific and Auxin-RegulatedExpression of the Rol B Oncogenein Plants”,Plant Cell,11:323-333(1999),特此全文并入作为参考)有可能被缺失或突变,以帮助将F286启动子活性局限在发育的次生壁阶段的皮棉纤维中。也有可能通过在基因表达构建体中纳入来自F286基因的内含子或来自该基因的3′非翻译端的结构域而赋予F286启动子或其人工衍生物以额外的效用。

本发明的分离的DNA启动子可从次生壁沉积起始时开始驱动可操作地偶联的DNA分子在棉花纤维中的表达,通常在14到17DPA,并优选地持续到次生壁沉积终止之时。最优选地,本发明的分离的DNA启动子从14到17DPA开始直到40DPA期间驱动可操作地偶联的DNA分子在棉花纤维中的表达。为了鉴定能在任何所选的细胞类型或发育阶段中优先调控的启动子,本领域技术人员公知应当首先找到以所期望的方式优先被转录的mRNAs。一旦将启动子和外源基因可操作性地连接在基因表达构建体中、通过转化而掺入到宿主的DNA中后,这将极大地提高相应基因的分离启动子以相同方式驱动外源基因表达的机会。启动子活性的保守模式常常发生在异种物种以及所分离的启动子的来源物种中,但是启动子的性能最终必需通过经验测试来确定。

若干用于鉴定在两种组织、细胞类型、环境条件等之间差异表达的基因的技术在现有技术中目前是标准的,其中假定代表两种状态的活体材料可以在适于RNA提取和纯化的合理条件下分离和分开。棉花纤维理想地适于这种目标,因为它们是可以很容易地与种子分离开的长的单细胞,并且因为纤维发育的两个重要的阶段,即初生和次生臂沉积,在发育时间上仅有部分重叠。先前的有关分离在棉花纤维中具有优先表达的基因和能优先启动的基因启动子的工作很好地显示了这些事实和适合于棉花的方法细节(美国专利No.5,474,925,John等;美国专利No.5,521,078,John,特此全文并入作为参考)。这种工作也具有双重目的,因为与其它细胞和组织相比优先地或差异地在纤维中或者在纤维的不同发育阶段表达的基因,将常常是在决定纤维发育和纤维属性中具有决定性作用的基因,所述纤维属性可转化为用于工业用途的纤维品质。待比较的两种状态的总RNA将含有仅代表在每种状态中所表达的基因的不同mRNAs群。然后可通过任何数目的标准技术比较两种mRNAs群(或者逆转录后它们的对应cDNAs),包括:(a)cDNAs的差异显示;(b)cDNAs文库的示差筛选;(c)比较两个独立制备的cDNAs文库之间的表达序列标签(ESTs);(d)对来自一种扣除cDNAs文库的ESTs的测序,其中在制备cDNAs文库前富集优先在一种组织中表达的mRNA;(e)cDNA AFLP;(f)基因表达系列分析(SAGE);或(g)微阵列分析。在任何特定情形中这些技术之间的选择现在主要根据方便性、习惯和/或必需资源的可获得性作出,必要的技术细节已被广泛公开(Hunt等,(编)“Functional Genomics”,253pp OxfordUniversity Press:Oxford(2000),特此全文并入作为参考)。

在这些技术的绝大多数中,假阳性是有可能的,因此每种目的基因的优先表达必需通过标准技术如Northern印迹或RT-PCR、使用来自每种状态中的分离RNA作为基于目的序列的探针或引物的靶标进行证实。或者,更有效地,微阵列分析中可以用来源于两种感兴趣状态的RNA的探针同时筛选许多候选的差异表达基因。如果证实了基因表达模式以预期的模式优先表达,那么应继续分离启动子,直接测试其在遗传工程化的细胞或组织(在瞬时转化的情形中)或生物体(在稳定转化的情形中)中驱动外源基因表达的效用是合理的。这些技术在现有技术中是标准的,包括在棉花领域中,其中可很容易地发现许多详细的方法(美国专利No.5,474,925,John等;美国专利No.5,521,078,John,特此全文并入作为参考)。

可通过数种标准技术从基因组DNA中分离基因的启动子,包括:(a)用来自目的cDNA的探针对基因组文库进行杂交筛选和(b)PCR。这些操作对于本领域技术人员是公知的,且可根据方便或习惯而很容易地选择适当的方法。关于编码序列上游多少5′序列是驱动在体内所观察到的基因表达模式所必需的没有固定的规律,并且实际上可能也存在有助于体内表达方式的内含子和/或3′调控元件。然而,通常首先分离和测试紧邻编码序列5′的1到3kb序列的启动子活性。另外,常常测试几个长度比最长序列更短的序列,以确定将以期望的方式起作用的最小区域。这种启动子缺失实验也是鉴定启动子内关键调控元件的首要途径,尽管这种信息并非总是直到被关键转录因子结合的基序通过另外的实验被直接鉴定出来才能被揭示出。也存在没被提到的将产生类似结果和信息的其它途径。

在本发明的优选的形式中,本发明的分离的DNA启动子在包括分离的DNA启动子、编码蛋白质或多肽的第二DNA的DNA构建体中。DNA启动子可操作地连接到第二DNA的5′,以诱导该第二DNA的转录。3′调控区可操作地连接到该第二DNA上。

适于在本发明的DNA构建体中使用的编码蛋白质的DNA的一种形式是本发明的分离的核酸分子,优选包括在严谨条件下与具有根据SEQ ID NO:1或SEQ ID NO:3所示序列的DNA分子可杂交的核苷酸序列的核酸分子(其中严谨条件的特征是在61℃温度下包含1 x SSC的杂交缓冲液),具有SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列的核酸分子,编码包括SEQ ID NO:5或SEQ ID NO:6所示氨基酸序列或者与SEQ ID NO:5具有至少60%同一性的氨基酸序列或者与SEQ IDNO:6具有至少75%同一性的氨基酸序列的蛋白质或多肽的核酸分子,或者编码具有SEQ ID NO:2或SEQ ID NO:4所示氨基酸序列的蛋白质或多肽的核酸分子。

适于在本发明中使用的编码蛋白质的DNA包括已被扩增、经化学方法修饰、或者被别的方式修饰的DNA。此类编码蛋白的DNAs的修饰可通过例如用限制性内切酶处理DNA进行,以产生能被可操作地连接到启动子上的DNA片段。修饰也可通过如定点诱变的技术进行。

编码蛋白质的DNA也包括完全合成的、半合成的或者生物学来源的DNA,如由RNA通过逆转录获得的DNA。这种DNA包括,但不限于,如那些来自细菌、酵母、动物或病毒的非植物基因;经修饰的基因,基因的一部分,嵌合基因,以及编码氨基酸的DNA,其中所述氨基酸是化学前体或有商业价值的生物制剂,如聚合物或生物聚合物(Pool等,“In Search of the Plastic Potato”,Science 245:1187-1189(1989),特此全文并入作为参考)。合适的DNA是其表达有益于转基因植物或者以其它方式使DNA在纤维发育的次生壁阶段优先驱动表达的DNA启动子的控制下表达比较有利的任何DNA。

纤维工业的总目标是遗传改造植物使其具有改良的纤维品质特性和可操作的品质特性,从而可特异性地生产纤维用于不同的产品终用途。这个目标涉及纤维的传统的品质特性,其可通过操纵纤维中已有的发育或生物化学路径来改变,也涉及可能只有通过遗传工程才能赋予的更多新特性。例如,棉花纤维具有传统的长度、纤维直径、成熟、强度、可染性、和浅绿与褐色的品质特性,以及潜在的新特性如蓝色或者新酶或聚合物的贮藏,每一种都有其附加的价值。棉花纤维的若干传统品质特性大量地或主要地取决于厚的次生壁和其纤维含量,特别是成熟、强度和可染性。现代纺纱技术和高质量纺织品的生产更偏好细的(小直径)、长的、强力的、成熟纤维(这意味着强度更高和可染性)。甚至纤维长度和直径在某种程度上也取决于次生壁起始的时间,此时伸长减慢下来,纤维直径变得更为紧缩。因为次生壁构成几乎全部纤维(约95%体积的成熟纤维),并且是纤维发育的最长时期,这样将需要在这个阶段的遗传工程以向棉花纤维赋予新颜色或者在腔或次生壁中贮藏大量的期望外源分子。

因此,可在本发明中表达的其它编码蛋白的DNA分子的实例包括,但不限于,正常及突变两种形式的同源和异源纤维素合成酶(CesA基因)(Arioli等,“Molecular Analysis of Cellulose Biosynthesisin Arabidopsis”,Science 279:717-720(1998);Holland等,“AComparative Analysis of the Plant Cellulose Synthase(CesA)Gene Family”,Plant Physiol.123:1313-1324(2000),特此全文并入作为参考);可调整纤维素中碳分配的基因(Delmer,“CelluloseBiosynthesis in Developing Cotton Fibers”in:A.S.Basra(编),Cotton Fibers:Developmental Biology,Quality Improvement,andTextile Processing,The Haworth Press,New York,pp.85-112(1999),特此全文并入作为参考)如蔗糖合成酶(Amor等,“AMembrane-Associated Form of Sucrose Synthase and Its PotentialRole Synthesis of Cellulose and Callose in Plants”,Proc.Natl.Acad.Sci.USA 92:9353-9357(1995),特此全文并入作为参考)、蔗糖磷酸合成酶(Haigler等,“Transgenic Cotton Over-ExpressingSucrose Phosphate Synthase Produces Higher Quality Fibers withIncreased Cellulose Content and Has Enhanced Seed Cotton Yield”Abstract 477.在:Proceedings of Plant Biology 2000,July 15-19,San Diego,CA.American Society of Plant Physiologists,Rockville,MD,(2000),特此全文并入作为参考)、UDPG焦磷酸化酶(Waffler和Meier,“Enzyme Activitiesin Developing CottonFibers”,Plant Physio.Biochem.32:697-702(1994),特此全文并入作为参考)、无机焦磷酸酶(Geigenberger等,“Overexpressionof Pyrophosphatase Leads to Increased Sucrose Degradation andStarch Synthesis,Increased Activities of Enzymes forSucrose-Starch Interconversions,and Increased Levels ofNucleotides in Growing Potato Tubers”,Planta,205:428-437(1998),特此全文并入作为参考)、己糖激酶(Smeekens,“SugarRegulation of Gene Expression”,Curr.Op.Plant Biol.,1:230-234(1998),特此全文并入作为参考)、以及转化酶(Sturm和Tang,“The Sucrose-Cleaving Enzymes of Plants are Crucial forDevelopment,Growth,and Carbon Partitioning”,Trends PlantSci.,4:401-407(1999),特此全文并入作为参考);可能影响纤维素的分子和生物物理特性、包括聚合度、结晶度、微晶大小以及微丝取向的基因(即,编码如下蛋白的基因:包括共结晶蛋白聚合物或纤维素结合结构域,和多糖合成以及其它酶)(Delmer,“CelluloseBiosynthesis:Exciting Times for a Difficult Field of Study”,Ann.Rev.Plant Physio.Mol.Biol.50:245-276(1999);Delmer,“Cellulose Biosynthesis in Developing Cotton Fibers.A.S.Basra(编),Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processing,The Haworth Press,NewYork,pp.85-112(1999);Hsieh,“Structural Development ofCotton Fibers.A.S.Basra(编),Cotton Fibers:DevelopmentalBiology.Quality Improvement,and Textile Processing,TheHaworth Press,New York,pp.137-166(1999),特此全文并入作为参考);转录因子如可延长伸长生长和/或改变次生壁沉积的时间点或程度的MYB基因(Wilkins和Jernstedt,“Molecular Genetics ofDeveloping Cotton Fibers.A.S.Basra(编),Cotton Fibers:Developmental Biology,Quality Improvement,and TextileProcessing,The Haworth Press,New York,pp.231-270(1999),特此全文并入作为参考);影响植物激素的合成和改变纤维特性的基因(John,“Genetic Engineering Strategies for Cotton FiberModification.in:A.S.Basra(编),Cotton Fibers:DevelopmentalBiology,Quality Improvement,and Textile Processing,TheHaworth Press,New York,pp.271-289(1999),特此全文并入作为参考);有关可能影响纤维特性的细胞骨架元件或细胞骨架相关蛋白的基因(Seagull,“Cytoskeletal Involvement in Cotton FiberGrowth and Development”,Micron,24:643-660(1993),特此全文并入作为参考);有关可能改变膜特性并因此改善纤维品质的脂类合成或修饰酶的基因,包括在应激环境条件下发生的改变(Haigler,“The Crystallinity of Cotton Cellulose in Relation to CottonImprovement”,Proc.Cotton Fiber Cellulose:Structure,Function,and Utilization Conference,National Cotton Council of America:Memphis,TN.,p.211-225(1992),特此全文并入作为参考);可能在次生壁沉积期间通过提高或降低的活性而延长或增加伸长生长的酶,如木葡聚糖内转糖基酶(xyloglucan endotransferase)、过氧化物酶、苹果霉素(expansin)、或者液泡ATP酶(Wilkins和Jemstedt,“Molecular Genetics of Developing Cotton Fibers.A.S.Basra(编),Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processing,The Haworth Press,NewYork,pp.231-270(1999),特此全文并入作为参考);有关可被保留在纤维腔中或被整合到细胞壁内以提高纤维强度或改变其纺织特性的蛋白质或塑性聚合物的基因(John,“Genetic EngineeringStrategies for Cotton Fiber Modification”,A.S.Basra(编),Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processing,The Haworth Press,NewYork,pp.271-289(1999);Guda等,“Hyperexpression of anEnvironmentally Friendly Synthetic Polymer Gene”,Biotechnology Letters,17:745-750(1995),特此全文并入作为参考);有关可将其它碳水化合物整合到细胞壁内并改变纤维特性的植物细胞壁基质生物合成酶或它们的调控蛋白的基因(Haigler,“TheRelationship Between Polymerization and Crystallization inCellulose Biogenesis”,C.H.Haigler和P.Weimer,编,Biosynthesis and Biodegradation of Cellulose,New York:Marcel Dekker,pp.99-124(1991);Andrawis等,“Cotton FiberAnnexins:A Potential Role in the Regulation of CalloseSynthase”,Plant J.,3:763-772(1993),特此全文并入作为参考);编码分子如鞣酸、木栓质、或可赋予纤维以有价值颜色的染料的基因(Ryser,“Cotton Fiber Initiation and Histodifferentiation”,A.S.Basra(编),Cotton Fibers:Developmental Biology,QualityImprovement,and Textile Processing.The Haworth Press,NewYork,pp.1-46(1999),特此全文并入作为参考);有关可改变棉花纤维的吸收性和强度的分子如角质、木栓质、或蜡的基因(May,“GeneticVariation in Fiber Quality”,A.S.Basra(编),Cotton Fibers:Developmental Biology,Quality Improvement,and TextileProcessing,The Haworth Press,New York,pp.183-230(1999);Ryser,“Cotton Fiber Initiation and Histodifferentiation”,in:A.S.Basra(编),Cotton Fibers:Developmental Biology,Quality Improvement,and Textile Processing,The Haworth Press,New York,pp.1-46(1999),特此全文并入作为参考);以及编码信号转导分子如可调控各纤维发育阶段之间的转换的Rac的基因(Delmer等,“Genes Encoding Small GTP-Binding ProteinsAnalogous to Mammalian rac are Preferentially Expressed inDeveloping Cotton Fibers”,Mol.Gen.Genet.248:43-51(1995),特此全文并入作为参考)。

已有关于在转基因植物中操纵若干类这些基因而影响纤维素含量和/或纤维品质的实例。这些策略或者类似或相似策略中的任何一种可被有利地应用于棉花纤维,特别是以优先的方式应用于棉花纤维发育的次生壁时期。例如,业已在模式植物拟南芥中通过操纵纤维素合成酶的表达水平和/或突变而正向地或负向地操纵了纤维素含量并改变了纤维素结晶度(美国专利No.6,495,740,Arioli等,特此全文并入作为参考)。该工作也提供了作为改变纤维素含量和/或特点的副效应而操纵碳水化合物分配的实例,因为在某些情形中淀粉优先累积。已经操纵了蔗糖合成酶以提高玉米茎中的纤维素含量,其中具有高纤维含量(美国专利申请公开No.20030005482,Dhuuga等,特此全文并入作为参考)。另外,业已操纵了在CaMV 35S启动子控制下的蔗糖磷酸合成酶,以提高转基因棉花中的纤维品质(美国专利No.6,472,588,Haigler等,特此全文并入作为参考),并且,通过将遗传改变限制到纤维发育的次生壁阶段可获得更多好处。也已通过操纵生长激素-细胞分裂素的合成而改变了棉花纤维品质(美国专利No.6,329,570,Martineau,特此全文并入作为参考)。另外,已在纤维腔和细胞壁中累积了酶和纤维素结合蛋白(美国专利No.5,474,925,John等,特此全文并入作为参考)。此外,已在棉花纤维腔中累积了对棉花纺织特性具有有利作用的热塑性聚合物(John,“Genetic EngineeringStrategies for Cotton Fiber Modification”,A.S.Basra(编),Cotton Fibers:Developmental Biology,Quality Improvement,andTextile  Processing,The Haworth  Press,New York,pp.271-289(1999),特此全文并入作为参考)。另外,内切-β-1,4-葡聚糖酶(一种纤维素)和靶向细胞壁的纤维素结合域业已证明可在其它植物中提高纤维量、纤维素含量、和植物生长速率、产量、以及可消化性(美国专利No.6,323,023,Shoseyov等;美国专利No.6,184,440,Obed等,特此全文并入作为参考)。能交联细胞壁蛋白的过氧化物酶也已证明可提高棉花纤维强度(美国专利No.5,869,720,John,特此全文并入作为参考)。已经在转基因植物中操纵过颜色(美国专利No.6,222,097,McBride等,特此全文并入作为参考)。因此,尽管一些改变可能在发育的初生壁阶段具有有利的作用,但是,通过将遗传工程化的改变靶向到以很大程度影响纤维的工业用途的纤维发育次生壁阶段,许多此类改变将可能使本发明更有优势。上文列表仅是举例说明而非限制,在此纳入仅仅是用于举例说明在许多将遗传改变靶向到纤维发育的次生壁时期将有好处的有用策略中使用本发明的可行性。

本发明的DNA构建体也包括可操作的3′调控区,其选自能提供mRNA的正确转录终止和多聚腺苷酸化以在植物细胞中表达的3′调控区等,该3′调控区可操作地连接到编码所选蛋白的DNA分子上。已知许多3′调控区可在植物中操作。示范性的3′调控区包括、但不限于胭脂氨酸合成酶3′调控区(Fraley,等,“Expression of Bacterial Genesin Plant Cells”,Proc.Natl Acad.Sci.USA 80:4803-4807(1983),特此全文并入作为参考)和花椰菜花叶病毒3′调控区(Odell,等,“Identification of DNA Sequences Required for Activity of theCauliflower Mosaic Virus 35S Promoter”,Nature,313(6005):810-812(1985),特此全文并入作为参考)。事实上,已知可在植物中操作的任何3′调控区均足够用于本发明DNA构建体编码序列的正确表达。

可使用在Sambrook等,Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Press,NY(1989)(特此全文并入作为参考)中描述的众所周知的分子克隆技术,将编码蛋白质的DNA分子、本发明的启动子和3′调控区连接起来。

在另一个实施方案中,本发明是一种表达系统,其中包括含有上述本发明DNA构建体的合适载体。本发明也包括包含上述的本发明DNA构建体的宿主细胞、通过用所述DNA构建体转化所生产的转基因植物和种子。

本发明也涉及一种在植物中次生壁沉积期间优先在次生有壁细胞中表达基因的方法,包括用包含本发明分离的DNA启动子的DNA构建体转化植物。典型地,次生有壁细胞是纤维。可利用本发明的DNA构建体在种类繁多的生产纤维的植物中在次生壁沉积期间表达基因,所述植物例如有树、饲料作物、棉花、玉米、甘蔗、和可在制浆中使用的稻杆、亚麻、大麻、苎麻、黄麻、洋麻、木棉、椰纤维、竹子、寄生藤、马尼拉麻、和龙舌兰属(例如,剑麻)。所述DNA构建体特别适于在棉花的次生壁沉积期间表达基因。基本上,此法是通过在可有效地响应于启动子而产生DNA分子转录的条件下用本发明的DNA构建体转化植物细胞来完成,如上所述。转化的方法可导致在启动子的控制下瞬时或稳定表达DNA。优选地,由于转化的结果,本发明的DNA构建体被稳定地插入到重组植物细胞的基因组中,当然瞬时表达也用于重要目的,特别是当所研究的植物生长缓慢时。

产生嵌合分子的基因融合系统是研究启动子活性的非常有力的工具。然而,尽管已经发展了许多用于植物的转化和再生方案,但是其仍然需要至少3个月(在烟草的情况中)或长达6-12个月(在棉花的情况中)的时间才能获得可被评价的稳定转化体植物。即便是在那时,也需要更多的时间来评价在象花或果实这样的组织中的表达。作为备选方法,在组织或原生质体中的瞬时表达可提供一种快速和常常可靠的方法,可在进行稳定转化前产生信息。另外,这种方法可避免由于所引入的DNA插入到染色体中的非表达区而致的可能的负“位置效应”。

                         实施例

提供下列实施例以举例说明本发明的实施方案,这些实施例决不应被理解成限制本发明的范围。

实施例1-在次生壁沉积期间优先在纤维中表达的cDNA克隆F285的鉴定

使用如在Liang等,“Differential Display of Eukaryotic DNAby Means of the Polymerase Chain Reaction”Science,257:967-970(1992)(特此全文并入作为参考)中所描述的差异显示,鉴定在棉花纤维的次生壁阶段差异表达的基因。该技术具有下列步骤:(a)在存在锚定的寡聚dT(例如,dT12-XY,其中X和Y表示A、C、G或T,不允许TT)时逆转录两个或多个不同的总RNA群,以产生mRNA亚群的cDNA片段;(b)在存在同一锚定寡聚dT(10聚体寡核苷酸的任意序列)和35S-或33P-dATP+dNTPs时扩增cDNA片段;以及(c)在非变性测序凝胶中通过大小分离扩增的cDNA片段,并通过放射自显影在胶片上检测。通过凝胶泳道之间的比较鉴定差异存在的cDNA,将其从凝胶中切下来,通过PCR再扩增,克隆,并通过测序和Northern印迹进行分析。

对于这里所描述的结果,d(T)12-GA用作锚定的引物,而GTCCTGGGTT(SEQ ID NO:11)作为随机的10聚体(称作W17),其以10聚体试剂盒购自于Operon Technologies(Almeda,CA)。根据在Wilkins等,“Isolation of RNA from Plant Tissue.Krieg(编)A LaboratoryGuide to RNA:Isolation,Analysis,and Synthesis”,p21-40,Wiley Liss,New York(1996)(特此全文并入作为参考)中所描述的方法,从陆地棉Coker 312栽培品种的组织中分离总RNA,所述组织具体地是12和18DPA棉花纤维,以及剥去纤维的胚珠和在几个其它一些阶段的分离纤维。根据在Song等,“Improved Procedures forDifferential Display of Transcripts from Cotton Tissues”,Plant Mol.Biol.Rep.,13:174-181(1995)(特此全文并入作为参考)中所描述的方法进行差异显示,只是使用2.5μl M-MuLV逆转录酶,并且35S用作放射性标记。也使差异显示凝胶电泳足够长距离,使得仅保留≥300bp的cDNAs,这避免了绝大多数来自非翻译区的cDNAs。

使用TA克隆试剂盒(In Vitrogen Inc.,Carlsbad,CA)克隆18DPA特异的cDNA(图1),测序,并用于Northern杂交,如稍后在实施例2中所描述的。部分测序显示cDNA与已知的几丁质酶具有同源性。随后的鉴定全长cDNA(其被称作F285;见实施例3)的工作显示所述10聚体与GTCCCGGGGTT746(SEQ ID NO:1的736-746位核苷酸)匹配,但是该引物有核苷酸错配和单核苷酸缺失,这两者都发生在其5′端。这些结果与其它报道中有关10聚体引物更耐受5′端的错配的结果是一致的(Bauer等,“Identification of DifferentiallyExpressed mRNA Species by an Improved Differential DisplayProcedure(DDRT-PCR)”,Nucleic Acids Res.,21:4272-4280(1993);Liang等,“Differential Display and Cloning of MessengerRNAs from Human Breast Cancer Versus Mammary Epithelial Cells”,Cancer Res.52:6966-6968(1992),特此全文并入作为参考)。

实施例2-F285在次生壁沉积期间在纤维中的表达

Northern印迹分析是对从温室生长的陆地棉栽培品种Coker 312(自然光照和约白天32℃/夜晚22℃)的各种组织中提取的总RNA进行的。将总RNA(15μg/泳道)在1.2%琼脂糖凝胶上上样,电泳,转移到硝酸纤维素膜上,加热固定(1.5小时;80℃),并用32P标记的F285探针杂交(65℃,过夜)。洗膜(0.1xSSC,0.1%SDS,65℃,15分钟),将胶片暴露于放射自显影胶片(17小时;-80℃)。除去同一印迹,并用32P标记的18S核糖体RNA探针作为对照再探测。

RNA印迹显示F285基因在温室生长的纤维中仅在次生壁阶段的18、24和27DPA时表达(图2)。在初生壁沉积期间在8DPA的纤维中,或者在8、18和24DPA的叶、茎、根、或剥去纤维的胚珠中都没有表达的迹象。(由于上样的RNA水平较低,来自8和18DPA的被剥除胚珠的数据不太好。然而,即使上样量较低,与18、24和27DPA纤维所表现的类似的任何强表达也应是显而易见的。)

更详细的时间分析显示在温室生长的纤维中到12DPA时表达还没有开始,但是到15DPA时表达很强,并且直到31DPA时仍然很强(图3)。因此,F285的转录在13-15DPA时开始,这接近于棉花植物在温室条件下(大约白天32℃/夜晚22℃)生长时棉花纤维中次生壁沉积的开始。

实施例3-F285的测序和其翻译的氨基酸序列与其它蛋白质的比较

基于F285 cDNA的序列,合成刚好位于多聚T尾之前的31聚体寡核苷酸引物(5′CAATGGCTATATGTGACTCATTCAATCACAC;SEQ ID NO:12)并在对来自21DPA Acala-SJ2棉花纤维mRNAs的UniZAP-XR cDNA文库(Stratagene,La Jolla,CA;由D.P.Delmer博士惠赠)进行的PCR筛选中与SK引物(CGCTCTAGAACTAGTGGATC:SEQ ID NO:13)一起使用。PCR反应由5μl煮沸的文库裂解物作为模板、每种引物1μM、每种dNTP 200μM、200μM MgCl2、以及0.5单位Taq聚合酶构成。PCR反应条件是:34个循环,每个循环是95℃(30分钟),55℃(1分钟),和72℃(2分钟),随后在72℃延伸(5分钟)。对PCR产物进行凝胶纯化,克隆到TA克隆载体(InVitrogen,Carlsbad,CA)中,并对两条链完全测序。对所产生的1273bp长的CDNA的分析显示具有957bp的单一开放读框,其被命名为F 285(SEQ ID NO:1)。

推断的318个残基的氨基酸序列(SEQ ID NO:2)具有的预测pI为7.98,预测的分子量是35,246Da。翻译的蛋白具有氨基酸多样化的混合,预测的N-末端信号序列,以及如下翻译后修饰的位点:N-糖基化、四种不同类型的蛋白激酶的磷酸化;酰胺化;以及N-肉豆蔻酰化。F285蛋白混合有亲水和疏水区、α螺旋的伸展区、延长链、和无规卷曲,并且预测没有跨膜α螺旋。

将F285核苷酸序列以所有可能的阅读框翻译并检查它们与其它氨基酸序列的同源性的BLASTX搜索显示与众多的几丁质酶有同源性。BLASTX搜索证实仅有两个密切的F285同系物,它们是通过拟南芥基因组的测序而发现的,一个位于3号染色体上(BAA94976.1;与F 285有76.28%氨基酸同一性),一个位于1号染色体上(AAF29391.1,也被命名为AAL37737;与F 285有67.49%氨基酸同一性)。下文将它们称之为F285的拟南芥同系物。下一个密切匹配的是来自小叶南芥(Arabis microphylla)的几丁质酶(AAF69789.1;与F285有35.22%氨基酸同一性)(Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targets of Selection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考))))。BLAST搜索也证实F285类似于、但又显著不同于数据库中的全长或几乎全长的棉花几丁质酶(Q39799、Q39785、AAD11255和S72528,其中所列出的前三个序列非常密切相关)(见表1)。用F285翻译的氨基酸序列进行的BLASTP搜索未发现任何额外的高度相似序列,其中与AAF69789.1紧密相关的另一南芥序列(Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targets ofSelection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考)除外,它被认为是第三高度匹配的序列。

将BAA94976.1、AAF69789.1和Q39799的氨基酸序列各自与F285氨基酸序列进行CLUSTAL W多序列比对,以比较在每个位置上氨基酸的同一性、相似性或差异(表1)。与南芥的几丁质酶(BLAST评分212;35.22%相同的氨基酸)或棉花的几丁质酶(BLAST评分196;31.66%相同的氨基酸)相比,F285与其拟南芥同系物更相似(BLAST评分542;76.28%相同的氨基酸)。由于南芥属含有拟南芥的最近的近亲(Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targetsof Selection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考),因此这四个序列之间的比较性距离是F285和其拟南芥同系物代表新的一类几丁质酶相关蛋白的首个指征。

                        表1

      来自CLUSTAL W多序列比对的结果和BLASTX数据

                             CLUSTAL W 氨基酸比较          BLASTX数据

                               强       弱

与F285(318个氨基酸) 相同   相似   相似   差异   评分  E

比较

最匹配,

拟南芥/BAA94976.1

(333个氨基酸)         76.28%  9.91%   3.60%   10.21%  542     e-153

最接近的其它属,

小叶南芥/AAF69789.1

(299个氨基酸;部分序

列)                   35.22%  19.18%  11.01%  34.59%  2126    e-54

最接近的棉花,

陆地棉/Q39799

(338个氨基酸)         31.66%  20.12%  11.54%  36.69%  196     4e-49

F285与几丁质酶在与活性位点对应的区域(在所结合底物的0.6nm内;Brameld等,“The Role of Enzyme Distortion in the SingleDisplacement Mechanism of Family 19 Chitinases”,Proc.Nat′l.Acad.Sci.U.S.A.95:4276-4281(1998),特此全文并入作为参考)同源,包括在许多几丁质酶中对于结合几丁质很重要的位点(NYNY附近)(Verburg等,“Identification of an Essential TyrosineResidue in the Catalytic Site of a Chitinase Isolated From Zeamlays That is Selectively Modified During Inactivation With1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide”,J.Biol.Chem.,267:3886-3893(1992);Hamel等,“Structural andEvolutionary Relationships Among Chitinases of FloweringPlants”,J.Mol.Evol.,44:614-624(1997);Bishop等,“RapidEvolution in Plant Chitinases:Molecular Targets of Selectionin Plant-Pathogen Coevolution,Proc.Natl.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考;表2)。几丁质是在昆虫的外骨骼和真菌的细胞壁中发现的结构多糖,一种β-1,4-连接的N-乙酰葡糖胺均聚物(Hamel等,“Structural and EvolutionaryRelationships Among Chitinases of Flowering Plants”,J.Mol.Evol.,44:614-624(1997),特此全文并入作为参考)。然而,在这里,“结合几丁质”是指该酶与在几丁质水解期间与该酶相互作用的N-乙酰葡糖胺残基短链(大概3-6个糖)的结合,所述残基(Robertus等,“The Structure and Action of Chitinases”,Jolles编,Chitinand Chitinases,Birkh user Verlag:Basel,pp.125-136(1999),特此全文并入作为参考)。因此,具有相似的活性位点拓扑结构的酶可与在其它分子或在分离中发现的N-乙酰葡糖胺寡聚物结合。同样地,其可与在杂聚物或糖蛋白内含有N-乙酰葡糖胺的其它分子相互作用。例如,一些几丁质酶具有溶菌酶活性(Sahai等,“Chitinases ofFungi and Plants:Their Involvement in Morphogenesis andHost-Parasite Interaction”,FEMS Microbiol.Rev.,11:317-338(1993),特此全文并入作为参考),即能降解细菌肽聚糖,其含有N-乙酰葡糖胺和N-乙酰胞壁酸的杂聚物。

                          表2

            F285和其它相关序列之间的比较

      159                                                    217

F285  TYPCTPGVSYHGRGALPIYWNYNYGETGDALKVDLLNHPEYIENNATLAFQAALWRWMT

Com1  .................+.......+..+.......+....+...........+.....

      (SEQ ID NO:14)

Com2  .+..+..KR.+...++Q+S......LC.R.+G.....+.+L+A.+.++..+..+.F...

      (SEQ ID NO:15)

Com3  +...+..K+.+...++Q+S......+C.R.++.....+.+L+++++.++.++.+.F...

      (SEQ ID NO:16)

                      * *  * 

Com1:F285(SEQ ID NO:2的第159-217位氨基酸)和其最接近的拟南芥同系物(BAA94976;SEQ ID NO:14)之间的比较,F285与其在通过BLASTX搜索所揭示的相似蛋白中最匹配。

Com2:F285和小叶南芥几丁质酶(AAF69789;SEQ ID NO:15)之间的比较。这是在除拟南芥之外的物种中发现的最密切匹配的蛋白,并且是BLASTX搜索所揭示的第三匹配蛋白。

Com3:F285和陆地棉(棉花)几丁质酶(Q 39799;SEQ ID NO:16)之间的比较,F285与该酶是通过BLASTX搜索所揭示的所有棉花几丁质酶中最为匹配的。这是所揭示的序列中第37匹配的。

符号:

点(.):序列之间相同氨基酸的位置

加号(+):弱或强相似的氨基酸的取代位置

在Com1-Com3中的字母:该位置上被取代的不相似氨基酸的单字母密码,其定义了“不同”取代-见表3。

Com3中的下划线:真正的几丁质酶的活性位点中的区域

Com3中的星号(*):通过诱变证明在真正的几丁质酶中对于功能很关键的残基(Verburg等,“Identification of an EssentialTyrosine Residue in the Catalytic Site of a ChitinaseIsolated From Zea mays Thatis Selectively Modified DuringInactivation With 1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide”,J.Biol.Chem.,267:3886-3893(1992);Bishop等,“Rapid Evolution in Plant Chitinases:MolecularTargets of Selection in Plant-Pathogen Coevolution,Proc.Nat’1.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考)

在表1和2中所列出的南芥蛋白与拟南芥I型几丁质酶同源,其已经证明有几丁质分解活性和抗真菌的防御活性(Bishop等,“RapidEvolution in Plant Chitinases:Molecular Targets of Selectionin Plant-Pathogen Coevolution,Proc.Natal.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考)。然而,没有证明F285或其拟南芥同系物的功能。在数据库中作为完全测序的拟南芥基因组的一部分公开后,F285的拟南芥同系物被归为糖基水解酶家族19中的几丁质酶(CAZy,Carbohydrate-Active Enzymes;http://afmb.cnrs-mrs.fr/CAZY/index.html,特此全文并入作为参考)。家族19中的酶预计会水解具有异头构型(anomeric configuration)翻转的几丁质寡糖(chitooligosaccharides)(Henrissat,“Classification of Chitinase Modules”,in Jolles编,Chitinand Chitinases,Basel:Birkhauser Verlag,pp.137-156(1999),特此全文并入作为参考)。然而,就与几丁质酶的总体相似性而言,可在F285和其两个拟南芥同系物与真正的几丁质酶之间鉴定出功能结构域中的具体差异。例如,F285和其拟南芥同系物缺乏一些、但并非所有几丁质酶中典型的特性:(a)将有助于与几丁质相互作用的富含半胱氨酸的N-末端几丁质结合结构域;(b)催化区前的富含P(脯氨酸)/T(苏氨酸)的铰链区;以及(c)C-末端的液泡靶向结构域(Meins等,“The Primary Structure of Plant Pathogenesis-RelatedGlucanohydrolases and Their Genes”,in Boller编,GenesInvolved in Plant Defense,Springer Verlag/New York,p.245-282(1992),特此全文并入作为参考)。在缺乏液泡靶向结构域时,预计F285将被分泌到质膜外。其肉豆蔻酰化位点也使得其能够通过共价添加肉豆蔻酸(一种C14饱和脂肪酸)而酰化,这将便于与质膜的可逆性相互作用(Thompson等,“Lipid-Linked Proteins of Plants”,Prog.Lipid Res.,39:19-39(2000),特此全文并入作为参考)。

另外,F285和其拟南芥同系物在通过诱变证明对典型几丁质酶的功能很关键的区域(Iseli-Gamboni等,“Mutation of Either of TwoEssential Glutamates Converts the Catalytic Domain of TobaccoClass I Chitinase Into a Chitin-Binding Lectin”,Plant Sci.,134:45-51(1998),其在这里将其整体和其中的参考资料并入作为参考)以及在通过晶体结构预测对于催化、活性位点几何学或底物结合很重要的其它区域(Hart等,“The Refined Crystal Structure ofan Endochitinase From Hordeum vulgare L.Seeds at 1.8AResolution”,J.Mol.Biol.,248:402-413(1995);Hamel等,“Structural and Evolutionary Relationships Among Chitinasesof Flowering Plants”,J.Mol.Evol.,44:614-624(1997);Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targetsof Selection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.97:5322-5327(2000),特此全文并入作为参考)中具有非保守性氨基酸取代(即,用不同的或不类似的化学类型的氨基酸)。例如,在南芥几丁质酶中推定为底物结合位点的11个氨基酸中(Bishop等,“Rapid Evolution in Plant Chitinases:MolecularTargets of Selection in Plant-Pathogen Coevolution.Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考),在F285中两个未改变,三个被相似的氨基酸取代,六个被不相似的氨基酸取代。这提示F285虽然与几丁质酶相关,但可能具有独特的蛋白结构,可发挥独特的细胞作用。这些非保守性改变以及根据对几丁质酶的预期在F285和其拟南芥同系物的序列中被保留的氨基酸中的一些总结于表3中(从中Hamel等,“Structural andEvolutionary Relationships Among Chitinases of FloweringPlants”,J.Mol.Evol.,44:614-624(1997);Bishop等,“RapidEvolution in Plant Chitinases:Molecular Targets of Selectionin Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000)中搜集,特此全文并入作为参考)。通过诱变证明了带星号(*)的氨基酸对真正的几丁质酶的功能很重要(Iseli-Gamboni等,“Mutation of Either of Two Essential GlutamatesConverts the Catalytic Domain of Tobacco Class I Chitinase Intoa Chitin-Binding Lectin”,Plant Sci.,134:45-51(1998),其在这里将其整体和其中的参考资料并入作为参考)。由于其以前在文献中的注解,南芥几丁质酶的序列一直被用作参照氨基酸编号系统(Bishop等,“Rapid Evolution in Plant Chitinases:MolecularTargets of Selection in Plant-Pathogen Coevolution,Proc.Natl.Acad.Sci.U.S.A.97:5322-5327(2000),特此全文并入作为参考)。当显示氨基酸取代时,在F285和其拟南芥同系物中的该位置上发现相同的取代,如在脚注中注解的AAF29391.1是个例外。“取代类型”是如在CLUSTAL W多序列比对程序中所定义的那样。

                          表3

       几丁质酶中功能氨基酸与F285蛋白序列的比较

南芥    F285   预期的氨基酸  发现的氨基酸  取代类型

位置  位置

141     122     *谷氨酸(E)      赖氨酸(K)       强烈相似

142     123     苏氨酸(T)       相同

163     144     *谷氨酸(E)      相同

177     160     色氨酸(W)1     酪氨酸(Y)       强烈相似

192     175     *谷氨酰胺(Q)    脯氨酸(P)       不同的

194     177     *丝氨酸(S)      酪氨酸(Y)       不同的

197     180     *酪氨酸(Y)2    相同(在NYNY中)

198     181     天冬酰胺(N)     相同(在NYNY中)

273     257     *天冬酰胺(N)    酪氨酸(Y)       不同的

*通过诱变证明为几丁质酶活性所需的氨基酸(Iseli-Gamboni等,“Mutation of Either of Two Essential Glutamates Convertsthe Catalytic Domain of Tobacco Class I Chitinase Into aChitin-Binding Lectin”,Plant Sci.,134:45-51(1998),特此全文并入作为参考)。

1在AAF29391.1中被保留为W,而在4种棉花几丁质酶的3种(Q39799、Q39785、和AAD11255)中发现是Y。F285与数据库中的所有4种棉花几丁质酶的其它比较与此表一致。

2在F285的另一拟南芥同系物AAF29391.1中变成F。

F285、其最接近的拟南芥同系物以及其它几丁质酶之间的差异可通过将它们在NYNY(底物结合位点)附近的相似序列与针对几类几丁质酶所述的推定共有序列的比较而突出显示出来(Hamel等,“Structural and Evolutionary Relationships Among Chitinasesof Flowering Plants”,J.Mol.Evol.,44:614-624(1997),特此全文并入作为参考),其中以南芥几丁质酶(AAF69789.1)作为共有型序列的代表(Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targets of Selection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考)。在这种情况下,在所有序列、包括推定的共有序列中插入的缺口可产生最好的相互比对。如在表4中所见,F285和其拟南芥同系物的序列在与共有序列和南芥序列的比对中可被认为是:(a)添加Y,结果是含有NYNY的疏水区得以加长;(b)缺失QLS,结果是保守的P(在所列出的39个几丁质酶序列中有38个,Hamel等,“Structural and Evolutionary Relationships Among Chitinasesof Flowering Plants”,J.Mol.Evol.,44:614-624(1997),特此全文并入作为参考)更靠近NYNY区;和(c)添加AL,结果是保守的GRG(在所列出的39个几丁质酶序列中的38个中,Hamel等,“Structural and Evolutionary Relationships Among Chitinasesof Flowering Plants”,J.Mol.Evol.,44:614-624(1997),特此全文并入作为参考)距离NYNY区有5个残基。尽管这种推理是假设性的,但其中强调了与以前所描述的几丁质酶序列相比,F285和其拟南芥同系物序列之间的差别。Q和S二者都被证明在一些几丁质酶中对于催化是必需的(Hamel等,“Structural and EvolutionaryRelationships Among Chitinases of Flowering Plants”,J.Mol.Evol.,44:614-624(1997);Bishop等,“Rapid Evolution in PlantChitinases:Molecular Targets of Selection in Plant-PathogenCoevolution,Proc.Nat′l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考),它们中任何一个被不同氨基酸的取代(表2和3)或假设的缺失(表4)可导致F285和其拟南芥同系物的功能背离对几丁质酶通常所期望的功能。或者说,F285和其拟南芥同系物可能是以前未被认识到的几丁质酶类型,具有独特的细胞作用。

                      表4

      几丁质酶共有序列、南芥几丁质酶、F285、

    和与F285最接近的拟南芥同系物之间的最佳比对

                       * *   *

共有            GRG--PIQLS-wNYNYGpAGrAI(SEQ ID NO:17)

AAF69789        ...--.M...-......LC....

F285        170 ...AL..---Y......ET.D.L 189

BAA94976       ...AL.V---Y......QT.E.L

                      +          x+ x +

符号:

-:在序列中插入的缺口,以实现为最佳相互比对目的。

点(.):序列之间相同氨基酸的位点

加号(+):与共有序列相比微弱或强烈相似氨基酸取代的位点。

x:与共有序列(SEQ ID NO:17)相比不同氨基酸的位点。

AAF69789(SEQ ID NO:15的第170-189位氨基酸)、F285(SEQ ID NO:2的第170-189位氨基酸)、BAA94976(SEQ ID NO:14的第170-189位氨基酸)中的字母:该位置上取代氨基酸单字母代码

BAA94976中的下划线:真正的几丁质酶的活性位点中的区域共有序列上的星号(*):证明对真正的几丁质酶功能关键的残基(Verburg等,“Identification of an Essential TyrosineResidue in the Catalytic Site of a Chitinase Isolated FromZea mays That is Selectively Modified During InactivationWith 1-ethyl-3-(3-dimethylaminopropyl)-carbodiimide”,J.Biol.Chem.,267:3886-3893(1992);Bishop等,“RapidEvolution in Plant Chitinases:Molecular Targets ofSelection in Plant-Pathogen Coevolution,Proc.Nat’l.Acad.Sci.U.S.A.,97:5322-5327(2000),特此全文并入作为参考)

在以前限定了部分“签名序列”的区域中观察到F285和其拟南芥同系物与其它家族19几丁质酶之间的类似差异,所述区域含有在糖基水解酶的这个家族中推定不变的氨基酸(其下被划线)的区域(Robertus等,“The Structure and Action of Chitinases”,inJolles编,Chitin and Chitinases,pp.125-136(1999),特此全文并入作为参考;表5)。该签名序列含有两个谷氨酸残基(E;在F285的第122和144位上),其已经通过诱变被证明是催化性残基(Iseli-Gamboni等,“Mutation of Either of Two EssentialGlutamates Converts the Catalytic Domain of Tobacco Class IChitinase Into a Chitin-Binding Lectin”,PlantSci.,134:45-51(1998),特此全文并入作为参考)。在F285和其拟南芥同系物中,在122位置处的推定的保守性催化性E被K取代,K是非常相似的氨基酸,尽管其在pH6时带正电而E带负电,并且它具有R基氨基末端而E具有羧基末端。通过定向诱变用A(一种不同类型的氨基酸)取代这个E在一些几丁质酶中消除了催化活性,将蛋白质改变成结合几丁质的凝集素(Iseli-Gamboni等,“Mutation of Eitherof Two Essential Glutamates Converts the Catalytic Domain ofTobacco Class I Chitinase Into a Chitin-Binding Lectin”,PlantSci.,134:45-51(1998),特此全文并入作为参考)。然而,在F285中改变成K的效果还不知道,尽管用相似氨基酸的取代可导致几丁质酶的结合相互作用发生改变(Bishop等,“Rapid Evolution in PlantChitinases:Molecular Targets of Selection in Plant-PathogenCoevolution,Proc.Nat′l.Acad.Sci.U.S.A..97:5322-5327(2000),特此全文并入作为参考)。在推定不变的签名序列残基内也有许多用类似氨基酸取代的其它实例。另外,在推定不变的签名序列残基内,在F285和其拟南芥同系物中存在三个被不同氨基酸取代的位点(用x表示)。它们比用相似氨基酸进行的取代更有可能具有重要的功能结果。注意在这个区域中F285和其拟南芥同系物的序列是相同的,提示与签名序列相比它们两者显示的变化对于它们的特定功能非常重要。相反,具有防御作用的南芥几丁质酶的序列(Bishop等,“Rapid Evolution in Plant Chitinases:Molecular Targets ofSelection in Plant-Pathogen Coevolution,Proc.Nat′l.Acad.Sci.U.S.A.97:5322-5327(2000),特此全文并入作为参考)与签名序列中不变氨基酸的区域恰好匹配,并且仅在其它位置上具有相似取代。

                           表5

    家族19签名序列的一部分、南芥几丁质酶、F285

     以及与F285最接近的拟南芥同系物之间的比较

                         *                     *

签名序列   KREVAAFLAQTSHETTGGWATAPDGAFAWGYCFKQERGA(SEQ

            ID NO:18)

AAF69789    .K.I...FG...........S....P.S........QNP(SEQ

            ID NO:19)

F285     109MK......GHVGSK.SC.YGV.TG.PL...L.YNK.MSP 133

BAA94976    MK......GHVGSK.SC.YGV.TG.PL...L.YNK.MSP(SEQ

            ID NO:20)

            + +   +++++x+ +x +++ ++ +++  x +++  x++

符号:

签名序列(SEQ ID NO:18)中的下划线:以前确定为不可变的氨基酸区域签名序列上的星号(*):通过诱变证明是真正的几丁质酶中的催化位点的残基(Iseli-Gamboni等,“Mutation of Either of TwoEssential Glutamates Converts the Catalytic Domain ofTobacco Class I Chitinase Into a Chitin-Binding Lectin”,Plant Sci.,134:45-51(1998),特此全文并入作为参考)

点(.):序列之间相同氨基酸的位点

加号(+):与签名序列相比微弱或强烈相似氨基酸取代的位点。

x:与签名序列相比不同氨基酸取代的位点。

AAF69789(SEQ ID NO:19)、F285(SEQ ID NO:2的第109-133位氨基酸)、和BAA94976(SEQ ID NO:20)中的字母:该位置处取代氨基酸的单字母代码

总之,数据显示,与序列数据库中的许多几丁质酶相比,F285和其最接近的拟南芥同系物相互之间更为相似。该数据说明F285和其拟南芥同系物有可能具有的功能与以前所描述的几丁质酶的功能多少有点不同。底物结合位点附近和催化区中的蛋白质结构改变可能对于F285和其拟南芥同系物的特定功能和/或最佳功能很重要。例如,这些蛋白质可能与在仍未被鉴定的底物分子中存在的N-乙酰-葡糖胺寡聚物或杂聚物相互作用。可能的底物分子可包括含有N-乙酰-葡糖胺的均聚或杂聚寡聚物的信号分子或糖蛋白,而不仅是昆虫或真菌中的结构性几丁质(Sahai等,“Chitinases of Fungi and Plants:TheirInvolvement in Morphogenesis and Host-Parasite Interaction”,FEMS Microbiology Rev.,11:317-338(1993),特此全文并入作为参考)。

通过分析在特定发育事件(棉花纤维中次生壁沉积的起始和继续)的环境中基因表达的变化发现了F285以及仅仅通过拟南芥基因组的完全测序发现了F285的拟南芥同系物这一事实提示这些几丁质酶相关蛋白在植物中的表达更为罕见。这种可能性与各种棉花组织的Northern印迹的数据(图2)一致。F285和其最接近的拟南芥同系物之间很高的跨物种氨基酸同一性(76%相同;表1)直观地提示这些蛋白质在植物的生命中具有关键作用,可能是发育作用。相反,例如由与F285更不相同的南芥AAF69789.1和棉花Q39799编码的几丁质酶,已经最清楚地显示与防御作用有关。F285的拟南芥同系物的存在提供了一条通过标准的分子生物学技术筛选拟南芥插入突变体贮库来测试蛋白质功能的有效途径。另外,在拟南芥或棉花中可通过标准分子生物学技术中的反义或RNAi技术下调基因表达。

实施例4-几丁质酶活性的鉴定

为了开始研究F285的同族蛋白的生物学作用,在存在或缺乏水杨酸(SA)和乙烯利(ETH)(产生乙烯的化合物)时,在温室生长和培养的棉花纤维以及幼苗叶片中鉴定几丁质酶活性。根据以前在Haigler等,“Cultured Cotton Ovules as Models for Cotton FiberDevelopment Under Low Temperatures”,Plant Physiology,95:88-96(1991)(特此全文并入作为参考)中所描述的方法,使用SA和ETH喷洒叶或棉花胚珠,外加所培养的纤维,因为这些化合物在许多其它系统中会诱导几丁质酶(Cutt等,“Pathogenesis-RelatedProteins”,in Boller编,Genes Involved in Plant Defense,NewYork,New York:Springer-Verlag/Wien,pp.209-243(1992),特此全文并入作为参考)。种植后16天,用SA(2mM,pH6.8)、ETH(1mg/ml;2-氯乙基磷酸)或水(作为对照)喷洒幼苗(至临界值水平),用塑料袋宽松地覆盖,2天后收获叶和茎。到收获时,经SA和水处理的秧苗看起来很健康,只是在叶片和子叶上有很少的坏死区域。然而,经ETH处理的秧苗有约1/3的叶片脱离。将在1DPA培养的胚珠在6DPA时从培养瓶中移出,类似地喷洒,并重新置于瓶中,在8DPA收获纤维。将组织提取物的小滴(10μg总蛋白;经Mauch等,“AntifungalHydrolases in Pea Tissue.I.Purification and Characterizationof Two Chitinases and Two β-1,3-Glucanases DifferentiallyRegulated During Development and in Response to FungalInfection”Plant Physiology,87:325-333(1988)的方法提取,特此全文并入作为参考)或对照溶液施加到含有悬浮的乙二醇几丁质的聚丙烯酰胺凝胶区域上(图4中由1-12所示),并在37℃孵育1小时使发挥酶活性。施加对聚合几丁质具有高亲和力的荧光增亮剂Tinopal LPW,并将凝胶用UV光激发。随后,通过测量清除(降解)在聚丙烯酰胺凝胶中悬浮的水溶性乙二醇几丁质的能力来检测组织提取物中的几丁质酶活性(Trudel等,“Detection of ChitinaseActivity After Polyacrylamide Gel Electrophoresis”,Anal.Biochem.,178:362-366(1989),特此全文并入作为参考)。暗区显示在该位置中的聚合几丁质被降解,结果荧光染料不再与其结合。因此,暗区显示了所施加的溶液中的几丁质酶活性。

阳性对照(第12区)显示强几丁质酶活性。阴性对照(第8和11区)显示没有几丁质酶活性。被检验的所有棉花组织都显示几丁质酶活性,而在这种定性试验中没有观察到SA诱导的酶活性。

实施例5-通过SA诱导纤维中F285的表达

进行Northern印迹,以显示F285启动子是否对许多其它植物几丁质酶的相同诱导信号有反应性(图5)。用水进行的处理作为阴性对照。如泳道标记所示在8和24DPA测试纤维,在处理后18天收获茎和叶组织,如果有的话,在16天收获。在用SA或ETH处理的叶中或者在用BTH处理的秧苗茎中发现没有诱导了F285的表达。然而,在用SA处理的来自培养胚珠的8DPA纤维中检测到弱表达,但是在用ETH或水处理的8DPA纤维中没有检测到表达(将印迹对胶片曝光4天)。这些数据提示F285启动子对其它防御基因的诱导剂仅微弱地反应,这可能是支持F285的发育作用的有利结果。

实施例6-鉴定可能的F285基因家族

图6显示了用EcoR1和Hind III限制性酶消化、并用F285全长CDNA探测的棉花基因组DNA(从18龄秧苗的叶子中制备)的Southern印迹;所显示的条带模式提示有4到5个家族成员。为了着手理解可能的F285基因家族的基因组和功能的多样性,在纤维cDNA文库的PCR筛选中使用来自F285序列3’非翻译端附近的特色区域(6个TAG重复)内的引物,随后克隆扩增的PCR产物。选择3个克隆用于插入物末端测序,发现其中一个与其它两个不同。这个克隆被称作TAG1,将之用于Southern(图6)和Northern杂交(图7)。切下用于F285杂交的基因组DNA印迹,并用TAG1再探测,其以不同的杂交强度与相似的一组片段杂交。因此,F285和TAG1在DNA水平上是相关的。

TAG1在温室生长的纤维中在8DPA(初生壁阶段)时表达,并且在24DPA(次生壁阶段)的纤维中上调。在剥离纤维的胚珠中(尽管不能排除一些污染性纤维部分)以及在根和茎中也检测到弱表达。在叶子中没有检测到表达。因此,TAG1的表达模式比F285更广泛。

实施例7-F285的启动子和称作F286的F285同系物的鉴定

为了尝试从棉花中分离F285启动子区,在标准杂交条件(Sambrook等,Molecular Cloning:A Laboratory Manual,第二版,ColdSprings Laboratory,Cold Springs Harbor,New York(1989),特此并入作为参考)下筛选λFix II中定制的陆地棉cv.Acala SJ-2棉花基因组文库(Stratagene,La Jolla,CA;由T.Wilkins博士惠赠)。整个F285 cDNA克隆使用Prime-a-Gene标记系统试剂盒(Promega,Madison,WI)用32P标记,并在初步筛选中与尼龙膜(Hybond-N,Amersham,Uppsala,Sweden)上浸提的大约5×105个噬菌斑杂交。获得了6个杂交噬菌斑,从5个噬菌斑的培养物中分离噬菌体DNA,并进行Xba I限制性酶消化。限制性图谱显示来自每个噬菌斑的DNA中有至少4个条带。与相同F285探针的Southern杂交显示仅一个条带(大小约4.4kb)与F285片段的探针杂交。将该大约4.4kb的片段从琼脂糖凝胶中切下来,并通过Jetsorb凝胶提取试剂盒(PGC Scientific,Gaitthersburg,MD)纯化,用于亚克隆。

为了亚克隆上述4.4kb片段,载体pBS(Stratagene,La Jolla,CA)用Xba I消化,使用小牛肠磷酸酶(Promega,Madison,WI)去磷酸化,并使用T4连接酶和标准方法(Sambrook等,Molecular Cloning:ALaboratory Manual,第二版,Cold Springs Laboratory,ColdSprings Harbor,New York(1989),特此全文并入作为参考)与4.4kb片段连接。然后,将连接反应转化到大肠杆菌(E.coli)DH 5α细胞(Promega,Madison,WI)中,在X-gal/I PTG LB琼脂板上选择转化体。被称作47A的质粒DNA用QiaGen xIAprep Spin Miniprep试剂盒(Qiagen,Almeda,CA)分离,用于进一步操作和测序。

为了鉴定克隆47A内的推定的启动子区,使用T3启动子序列(来自载体pBS)作为起始正向引物,而代表F285cDNA序列(SEQ ID NO:1)的第159-178位核苷酸的合成的寡核苷酸引物用作起始反向引物,在一个核心研究所中用于基于PCR的自动测序。基于新产生的序列,设计另外的引物,以连续步骤继续进行染色体步移,直到对两个链完全测定了基因组DNA的2.34kb区的序列。这种测序方法对于本领域的技术人员是众所周知的(Sambrook等,“Molecular Cloning,ALaboratory Manual”,第三版,Cold Spring Harbor Laboratory Press:Cold Spring Harbor,NY,pp 12.10-12.100(2001))。该2.34kb序列包括90bp的5′编码区,在克隆47A中所包含的编码序列上游的所有5’区,以及145bp的pBS载体。预计编码序列上游的5’区含有启动子。

使用BLAST 2序列程序,将F285 cDNA序列与来自克隆47A的序列比对。在90bp的重叠的编码区中,仅70bp是完全相同的(77%同一性),表明所鉴定的启动子片段可能属于与F285同源的基因。因此,通过上述染色体步移方法,使用合成的寡核苷酸引物(5′GAGTGTGAGTGCCCATCATT3′;SEQ ID NO:10的第1916-1935位核苷酸)作为起始正向引物以及T7启动子序列(来自载体pBS)作为起始反向引物,对克隆47A的插入片段的剩余部分在两条链上完全测序。使用基因预测程序(Burge等,“Finding the Genes in Genomic DNA”,Curr.Opin.Struct.Biol.8:346-354(1998),特此全文并入作为参考)对克隆47A的序列进行分析,揭示其含有两个外显子(376bp和575bp)和一个居间的内含子(131bp)。该推定的CDNA序列被称作F286(SEQ ID NO:3),其显示:(a)在核苷酸水平上与F285cDNA有85.0%同源性;和(b)在氨基酸水平上与F285cDNA有87.46%同一性和97.18%相似性。(除去最易变的30个氨基酸的N-末端信号序列,则这两个编码序列之间有89.93%同一性和97.92%相似性)。两个编码序列之间的高度相关性显示F285和F286是同源基因,且那些不相同的氨基酸散布在整个蛋白质中。因此,预期用F285cDNA探针所产生的Norhtern印迹将反映F285和F286两者的表达。预期两个基因在棉花纤维次生壁阶段中表达都强烈增加,尽管它们的5’非翻译区(UTR)不相同(基于F285 cDNA中5′UTR的部分序列)。

因此将F286编码序列上游的2.1kb片段称作F286启动子,这个区域可能含有指导F286正确的时间和空间表达所必需的所有调控元件。由于缺乏关于有效F286启动的确切长度的信息,PCR扩增F286基因序列中推定的翻译起始密码子上游的4种长度的基因组片段:2.1kb(SEQ ID NO:10),1.8kb(SEQ ID NO:9),1.4kb(SEQ ID NO:8)和1.0kb(SEQ ID NO:7)。使用Turbo pfu校正型DNA聚合酶(Stratagene,La Jolla,CA)以提高扩增的准确度。四个正向引物是:对于2.1kb,

5’GCTGAGTCGACGATATCGAATTCCTGCAGCC 3’(SEQ ID NO:21);

对于1.8kb,

5’GCTGAGTCGACCTTCAATCTCTGCCAATGATC 3’(SEQ ID NO:22);

对于1.4kb,

5’GCTGAGTCGACAACCTCTCGAGCTGCCATAT 3’(SEQ ID NO:23);

以及对于1.0kb,

5’GCTGAGTCGACCTGAGACCAGCGTTCAACAT 3’(SEQ ID NO:24).

将Sal I限制性识别位点序列(有下划线)和5个上游核苷酸人工引入到每个引物中,导致Sal I位点成为扩增的启动子片段的一部分。每个不同长度的F285片段的反向引物是相同的:5’GCTAGTCTAGATATCAAAGATACGAAGCAAAATG 3’(SEQ ID NO:25).

这个引物相当于刚好位于起始密码子之前的启动子序列,其中人为添加了Xba I限制性位点(斜体的)和5个上游核苷酸。通过棉花的稳定转化,功能性地测试所扩增的四种长度的启动子片段。

实施例8-新型几丁质酶中共有序列的鉴定

如以前所描述的那样,F285和F286具有拟南芥同系物BAA94976(与F285有76.28%的氨基酸同一性)和AAL37737(也称作AAF29391.1;与F285有67.49%的氨基酸同一性;在核苷酸序列中,双重录入为AF422178和AF422179)。BAA94976和AAL37737在氨基酸序列中有70%相同(Zhong等,“Mutation of a Chitinase-Like Gene CausesEctopic Deposition of Lignin,Aberrant Cell Shapes,andOverproduction of Ethylene”,Plant Cell,14:165-179(2002),特此全文并入作为参考)。AF422178中的突变导致乙烯产量提高,木质素的异位沉积,异常的细胞形状,以及在拟南芥花序茎的木髓中有一些不完全的初生细胞壁。除了显示乙烯的生产过多导致一些异常表型外,所述突变的主要的和次要影响无法区分开,提示AAL37737与细胞壁或纤维素合成没有特殊联系。其在拟南芥的所有器官中的表达,不能被通常可诱导防御性几丁质酶表达的化学制剂所诱导,以及突变时与许多发育畸变的相互关系显示,AF422178在拟南芥中是正常植物生长和发育所必需的(Zhong等,“Mutation of a Chitinase-LikeGene Causes Ectopic Deposition of Lignin,Aberrant Cell Shapes,and Overproduction of Ethylene”,Plant Cell,14:165-179(2002),特此全文并入作为参考)。

F285、F286、BAA94976和AAL37737可能全部都是具有发育重要性(更具体地是如前面所讨论的在细胞壁和/或纤维素合成中的发育重要性)的独特几丁质酶类型中的成员。因此,F285、F286和BAA94976应该是次生壁沉积期间所必需的酶类型中的一些成员,而AAL37737可能是初生壁沉积期间所必需的酶类型中的一员。尽管在不同细胞和/或发育阶段中有活性,但是预期这些“细胞壁/纤维素”几丁质酶具有相似的功能,它们的高度氨基酸保守性可支持这一观点(在这四种蛋白质的氨基酸序列中仅有19.2%差异,包括来自两个物种的蛋白)。这种差异中的大约一半发生在前40个氨基酸中,暗示功能区在发育阶段和物种之间甚至更为高度地保守。

基于保守功能的假设,可将所有四种蛋白的序列与代表更典型的防御性几丁质酶的氨基酸序列比较,以便在这种新“细胞壁/纤维素相关”类型的几丁质酶内鉴定独特的共有序列。如前面所讨论的那样,南芥AAF69789是防御性几丁质酶的一个实例,并且方便地,在Zhong等,“Mutation of a Chitinase-Like Gene Causes EctopicDeposition of Lignin,Aberrant Cell Shapes,and Overproductionof Ethylene”,Plant Cell,14:165-179(2002)(特此全文并入作为参考)中将另外5种防御性的几丁质酶与拟南芥BAA94976和AAL37737进行了比对。Zhong等仅仅使用这种比对来显示BAA94976和AAL37737与其它几丁质酶的相似性,具体地是指出在所有比对的蛋白中被认为在所有几丁质酶中比较保守的5个氨基酸残基的保守性,并显示所有蛋白中一些普遍化的氨基酸保守。表4(几丁质酶共有序列)和表5(家族19的签名序列)已经举例说明了可在“次生壁”几丁质酶F285和BAA94976对“防御性”几丁质酶南芥AAF68789之间比较更长的功能区,以显示F285和其同系物的确代表了几丁质酶新类型。(比较的区域被定义为有功能的,因为如在表4和5中所示,每个区域含有通过诱变被证明对真正的几丁质酶的功能很关键的2个或多个氨基酸。)

通过在序列比较中纳入“细胞壁/纤维素”F286和AAL37737以及5种混杂性“防御”几丁质酶,如在Zhong等,“Mutation of aChitinase-Like Gene Causes Ectopic Deposition of Lignin,Aberrant Cell Shapes,and Overproductionof Ethylene”,PlantCell,14:165-179(2002)(特此全文并入作为参考)所提到的,人们可进一步在该“细胞壁/纤维素”几丁质酶新类型内鉴定保守序列,并显示它们在相当的氨基酸长度范围内不同于来自“防御性”几丁质酶的相同功能结构域。

就与表5中家族19签名序列对应的区域而言,“细胞壁/纤维素”几丁质酶在39个氨基酸的区域中具有90%同一性(和97.4%相似性)。下面在表6中的序列比对显示了基于相同氨基酸的共有序列。

                         表6

             家族19签名序列区(39个氨基酸)

F285        MKEVAAFLGHVGSKTSCGYGVATGGPLAWGLCYNKEMSP(residue 109-133 of SEQ ID NO:2)

F286        MKEVAAFLGHVGSKTSCGYGVATGGPLAWGLCYNKEMSP(residue 109-133 of SEQ ID NO:4)

BAA94976    MKEVAAFLGHVGSKTSCGYGVATGGPLAWGLCYNKEMSP(residue 109-133 of SEQ ID NO:20)

AAL37737   QKEMAAFLGHVASKTSCGYGVATGGPLAWGLCYNREMSP(SEQ ID NO:26)

            x..+.......+......................+....

  共有      -KE-AAFLGHV-SKTSCGYGVATGGPLAWGLCYN-EMSP(SEQ ID NO:27)

符号:

x:所有四种序列中出现不同氨基酸的位置

加号(+):所有四种序列中微弱或强烈相似氨基酸取代的位置

就与表4中的几丁质酶共有序列对应的区域而言,“细胞壁/纤维素,,几丁质酶在20个氨基酸的区域中具有75%同一性(和95%相似性)。下面表7中所列的序列比对显示了基于相同氨基酸的共有序列。

                             表7

                 几丁质酶共有序列区(20个氨基酸)

F285         GRGALPIYWNYNYGETGDAL (residue 170-189 of SEQ ID NO:2)

F286         GRGALPIYWNYNYGETGEAL (residue 170-189 of SEQ ID NO:4)

BAA94976     GRGALPVYWNYNYGQTGEAL (residue 170-189 of SEQ ID NO:20)

AAL37737    GRGALPIYWNFNYGAAGEAL (SEQ ID NO:28)

             ......+...+...x+.+..

  共有       GRGALP-YWN-NYG--G-AL (SEQ ID NO:29)

符号:

x:所有四种序列中出现不同氨基酸的位置

加号(+):所有四种序列中微弱或强烈相似氨基酸取代的位置

如果将南芥“防御性”几丁质酶AAF69789加入到这些比对中,则家族19签名序列在所有5种基因中变成38.5%相同/82%相似,几丁质酶共有序列变成50%相同/75%相似。在仅添加一种“防御性”几丁质酶时所有5种序列之间的相关性即大量下降证实了“细胞壁/纤维素”几丁质酶代表不同的类型。通过检查BAA94976和AAL37737与Zhong等,“Mutation of a Chitinase-Lik Gene Causes Ectopic Depositionof Lignin,Aberrant Cell Shapes,and OverproductionofEthylene”,Plant Cell,14:165-179(2002)(特此全文并入作为参考)中的5种其它防御性几丁质酶的相互比对证实了相同的结论。在家族19签名序列中,5种“防御性”几丁质酶与“细胞壁/纤维素”几丁质酶具有59-64%同一性。在几丁质酶共有序列中,该5种“防御性”几丁质酶与“细胞壁/纤维素”几丁质酶具有45-50%同一性。相对于单独4种“细胞壁/纤维素”几丁质酶之间的比较而言,两个百分率都极大地降低。

由于在“细胞壁/纤维素”几丁质酶的这些功能域中的特色,可以推测这种不同类型的几丁质酶的特点是如上面所显示的那些相似的区域中的共有序列。具体地,这里的分析预测“细胞壁/纤维素”类型的几丁质酶中的其它成员将与家族19签名序列区中的“细胞壁/纤维素”共有序列具有高于或等于75%同一性,与“细胞壁/纤维素”几丁质酶共有序列具有高于或等于60%同一性。75%和60%的数字落在所述四种已知“细胞壁/纤维素”几丁质酶单独比较的数值和与“防御性”几丁质酶联合比较的数值之间。这些百分率允许不同物种的基因之间由于相似氨基酸取代导致的某些预期的偏差,但是暗示仍保持该新类型“细胞壁/纤维素”几丁质酶的特色。

实施例9-产生稳定转化的棉花植物

扩増的F286-2.1kb、F286-1.8kb、F286-1.4kb和F286-1.0kb启动子片段随后用Sal I+Xba I消化,并亚克隆到双元Ti质粒pBI101(可从Clontech,Palo Alto,California商业上获得;图8)的相应位点中。pBI101双元载体是适于棉花转化的许多载体中的一种。所购买的质粒pBI101含有在NOS启动子控制下的NPTII转移酶基因并具有NOS终止子,其提供植物转化的可选择标记。pBI101也含有编码β-葡糖醛酸糖苷酶(GUS)的GUS报告基因,包括起始和终止密码子以及NOS终止子。GusA基因通常被导入到转基因植物中,作为测试基因启动子功能的“报告基因”。相关的原理和方法是公知的,并有充分描述(Gallagher(编),“Gus Protocols:Using the GUS Gene As aReporter of Gene Expression”,221pp,Academic Press,New York(1992),特此全文并入作为参考)。将刚刚描述的4种启动子片段克隆到GUS基因的5′,以产生4种独立的基因表达构建体:pBI101-2.1、pBI101-1.8、pBI101-1.4和pBI101-1.0。在4种新构建体的每一种中,GUS将仅在由F286-2.1kb、F286-1.8kb、F286-1.4kb和F286-1.0kb启动子片段所确定的时间和空间模式下表达。

通过三亲交配(Svab等,“Generation of Transgenic TobaccoPlants by Cocultivation of Leaf Disks with Agrobacterium BinaryVector”,Maliga等(编),Methods in Plant Molecular Biology:ALaboratory Course Manual,pp.55-77,Cold Spring HarborLaboratory Press(1995),特此全文并入作为参考),将这4种新构建体中的每一种单独导入到土壤杆菌(Agrobacterium)EHA 105株中(Hood等,“New Agrobacterium Helper Plasmids for GeneTransfer to Plants”,Transgenic Research,2:208-218(1993),特此全文并入作为参考)。使包含实验质粒的土壤杆菌在转化前在含有卡那霉素(50g/ml)的Luria Broth培养基中生长到OD=0.5-0.6,然后1∶20稀释到含有葡萄糖(0.3g/ml)但缺乏植物激素的Murashige和Skoog′s矿物盐和维生素(M-5519;Sigma ChemicalCompany,St.Louis,MO)中。稀释的细菌用于感染大约0.5cm的棉花(陆地棉cv.Coker 312)下胚轴区段。

通常根据在Bayley等,“Engineering 2,4-D Resistance inCotton”,Theoretical and Applied Genetics,83:645-649(1992);Trolinder等,“Somatic Embryogenesis and Plant Regeneration inCotton(Gossypium hirsutum L.)”,Plant Cell Reports,6:231-234(1987);Umbeck等,“Genetically Transformed Cotton(Gossypiumhirsutum L.)Plants”,Bio/Technology,5:263-266(1987);美国专利No.5,159,135,Umbeck;Dang,“Expression of a Cotton Fiber‘Specific’Gene Promoter in Tobacco and Cotton”,96pp,Ph.D.dissertation,Texas Tech University,Lubbock,TX(1996)(特此全文并入作为参考)中所描述的方法完成棉花(陆地棉cv.Coker312-17或-5a,原种)下胚轴部分的转化和经由体细胞胚发生的植物再生。N.Trolinder博士(USDA-ARS,Lubbock,TX)对cv Coker 312进行了高胚发生性原种选择并馈赠了种子。转化和再生方法包括下胚轴部分与土壤杆菌共培养、无菌转化的愈伤组织在选择培养基上的生长、胚发生性愈伤组织在悬浮培养物中的增殖以及胚成熟和发芽这些主要步骤,对于每个独立株历时大约8个月。避免组织培养中的时间过长,以便将有害的体细胞克隆变异(包括不育性)降到最低。

方法的细节如下。秧苗是在25×150mm试管中,30℃,7-12天,16小时荧光/8小时黑暗,在固化(2g/l Gelrite;Kelco Co,San Diego,CA)Stewart′s培养基(pH 6.8;Stewart等,“In Ovulo EmbryoCulture and Seedling Development of Cotton(Gossypium hirsutumL.)”,Planta,137:113-117(1977),特此全文并入作为参考)上从酸脱棉(delinted)的无菌浸胀种子(70%EtOH 2分钟,用水彻底清洗,在无菌水中浸泡,7-8小时或过夜)中萌发。用如早先描述的方法所制备的土壤杆菌接种(30秒-5分钟)下胚轴片段(大约0.5cm)。通过毛细吸收除去过量的细菌后,将下胚轴在含有30g/l葡萄糖,2mg/l NAA和0.1mg/l细胞分裂素的固化(2g/l Gelrite)MS培养基(Sigma Chemical Company,M-5519;pH5.8)中培养3-4天(21-25℃),以发生感染。将下胚轴片段转移到加有50μg/ml卡那霉素(仅用于选择转化组织的生长)和500μg/ml头孢噻肟(也称作头孢氨噻,用于杀死土壤杆菌)的相同培养基中并培养(30℃,光照),每2-4周将下胚轴片段转移到新的培养基上(避免培养基中的褐化)。在至少6周(典型地9-12周;可将具有至少0.5cm直径的愈伤组织在转移时从下胚轴块中分离出来)结束时,将具有中等生长速度的易碎的愈伤组织(优选浅灰/绿色并且直径0.5-1cm)转移到50ml烧瓶中的悬浮培养物中,其中烧瓶中具有外加30g/l葡萄糖、1.9g/l KNO3和25μg/ml卡那霉素的15ml MS,用于胚增殖(生长2-4周,直到细胞达到培养基的大约1/2体积,振荡,30℃,光照)。细胞/胚(在培养物中,在澄清的培养基中是纯白色、褐色或者绿色的)通过沉淀收集,大的愈伤组织块用机械方法破碎,并且除去褐色的愈伤组织块。将组织在悬浮培养基中冲洗3次,以10倍组织体积在悬浮培养基中重悬,将2ml等分试样重复铺于100×20mm Petri平板中的固化(2g/lGelright)悬浮培养基上,只是使用50μg/ml卡那霉素。培养平板(30℃;光照;2-4周)直到发育成胚(≥3mm),将其转移到含有5g/l蔗糖、1.5g/l Gelrite和5g/l琼脂的Stewart′s培养基中,用于胚成熟(30℃,光照,10-14天)。当长出真正的叶子时,将小植物体转移到带有塑料组织培养物盖(Frank Moses,Rhyno Manufacturing,Riverside,CA)的1品脱罐头瓶中的相同培养基中,使之生长(30℃,16小时荧光/8小时黑暗)。当秧苗高至5-8cm并具有5个真正叶子时,在第二个节上制备茎插条,并在相同培养基中再生根(7-14天)。在该克隆具有3-5个大约4cm长的白根时,将它转移到土壤中,并通过渐渐穿透宽松覆盖的塑料袋而逐渐变硬,之后将之转移到温室中。

分别接种1040、1710和1040个下胚轴块用于1.8、1.4和1.0kb试验的测试,对于2.1kb的测试以更大规模进行,即接种2750个下胚轴块,这解释了为何对于每个测试最后可供利用的株系的数目不同。转基因“系”指来源于一个原始愈伤组织块的植物,因为它们确保代表了一个或多个(在不同胚中)转化事件。

对在温室中生长并形成棉蒴的2.1、1.8和1.4kb试验的T0和T1植物,对发育的纤维、幼态和成熟植物组织、以及植物繁殖组织进行GUS表达模式的组织学分析。在T0和T1植物之间,组织特异性表达模式相同。对于1.0kb试验,在T0时筛选幼态和成熟植物组织。在T1时的系统测试分别对2.1、1.8和1.4kb试验的21、6和8个株的幼苗进行,所有这些幼苗都显示卡那霉素抗性。介由在35S CaMV启动子控制下的NPTII基因的卡那霉素抗性(所述外源基因表达盒中的抗生素选择标记)显示了外源基因插入和表达。卡那霉素抗性棉花秧苗在卡那霉素培养基中形成侧根,而未转化的或空转化的秧苗仅产生主根而无侧根。

采用在Umbeck等,“Inheritance and Expression of Genes forKanamycin and Chloramphenicol Resistance in Transgenic CottonPlants”,Crop Science,29:196-201(1989)(特此全文并入作为参考)中所描述的方法并略加改动,测定萌发种子在含有卡那霉素的固化培养基内形成侧根的能力(Stewart′s矿物盐和维生素,pH6.8,2g/l Gelrigh,50μg/l卡那霉素)。使来自每个T0植物的24颗酸脱棉的灭菌T1种子在生长室中(低光照;30℃)在卡那霉素培养基(10-12ml/试管)上萌发,5-7天后评分,从根上轻轻除去卡那霉素培养基后,将在培养基内形成侧根的植物转移到土壤中。将每胚2-4个抗性植物(根据可利用的)转移到土壤中。对经在35S CaMV启动子控制下的GUS基因转化的3个株的种子(由R.D.Allen惠赠;Song等,“Expression of Two Tissue-Specific Promoters in TransgenicCotton Plants”,The Journal of Cotton Science,4:217-223(2000),特此全文并入作为参考)类似地处理,将这些种子的抗性秧苗加上未转化的亲代C312-17种植在温室中。

在正常萌发(向下长出根和向上长出芽)的种子中,计数卡那霉素抗性:卡那霉素敏感性的分离,这样在一些情况中初步评价基因插入位点的数量。分离比例数据是初步的,因为需要72个萌发的种子在p≤0.01水平评价由两个独立插入位点产生的15∶1分离比率。对于按正常孟德尔遗传的性状,抗卡那霉素的T1种子(排除并且不考虑空转化的)将是具有下列特征的分离群体:(a)如果是一个基因插入位点,则为1/3++和2/3+0种子;以及(b)如果是在非同源染色体上的两个基因插入位点,则为1/8++++,1/4+++0,3/8++00和1/4+000种子。由于基因插入的双位点以及基因插入对基因表达的可能的位置效应,这四组(++++,+++0,++00和+000)本身并不是在遗传上或必然地在功能上等同。基因插入位点的数目没有解释在一个染色体位点上外源基因的可能的串联重复。如果在同一或同源染色体上存在多个基因插入位点,那么其它更为复杂的分离比也是有可能的。

实施例10-组织学方法和结果

如在Gallagher(编)“Gus Protocols:Using the GUS Gene Asa Reporter of Gene Expression,221pp,Academic Press,New York(1992)(特此全文并入作为参考)中所述,GUS在葡糖醛酸和5-溴-4-氯-3-吲哚部分之间的β1葡糖醛酸键处裂解组织化学底物(例如,X-GlcA:5-溴-4-氯-3-吲哚-β-D-葡糖醛酸,环己基铵盐)。不溶于水的蓝色二氯-二溴-靛青在酶切位点沉淀,提供了某种细胞和组织中gusA表达的定性标记。通过标准方案对整个植物部分(如果小的话)或者切片进行加工以测试GUS反应性。切片是通过在包埋后用剃刀片或者用切片机手工制备的,所述包埋例如是通过微波辅助方案进行的石蜡包埋,以保存娇嫩的组织如形成层(Ruzin,Plant Microtechniqueand Microscopy,322pp,Oxford Univ.Press,Oxford(1999),特此全文并入作为参考)。在解剖和/或复合光显微镜中进行蓝色评价(或者如果使用暗视野光学则是红色)。明视野微分干涉相差(DIC)和暗视野光学可用于揭示GUS定位和植物结构,而偏振光学的平行检查可揭示植物细胞壁的厚度以及植物细胞壁内有组织的纤维素微丝,以协助评价其中有GUS的细胞类型。

对多个幼态T1植物系的分析显示,较长的启动子(2.1和1.8kb)会导致GUS表达的沉默,而用1.4kb启动子没有观察到这种效果(表8)。

                         表8

2.1、1.8和1.4kb试验的T1株中GUS的存在或缺乏的组织学分析

试验            #检验的株                   #阳性株                      #阴性株                     GUS沉默%

  21  9  12  57%  6  2  4  66%  8  8  0  0
    2.1kb     1.8kb    1.4kb

因此,对于缺乏外源基因沉默,优选1.4kb启动子,从而由转化0过程产生的有用株的数量被最大化。对于2.1和1.8kb试验,在预期为阳性表达的植物的所有组织中都观察到GUS表达的沉默。选择用于分析的组织预期是正在生长的组织,而株系中的阴性结果经再次试验验证。由于在卡那霉素抗性的植物中观察到GUS表达的沉默,因此35SCaMV启动子和F286启动子一定受到导致GUS基因沉默的因子的不同影响。当在特定基因组微环境中进行启动子/基因插入时,F286启动子中更上游的负调控元件可能起抑制基因表达的功能。使用在植物顺式作用调控DNA元件中发现的推定的调控基序的PLACE数据库(Higo等,“Plant cis-Acting Regulatory DNA Elements(PLACE)Database”,Nucleic Acids Research,27:297-300(1999),特此全文并入作为参考)寻找可能仅在2.1和1.8kb启动子片段中1.4kb片段上游的区域内存在的基序。表9显示至少8个基序符合这个标准,这些构成了基因表达差异调控的可能基础,包括更长片段更为频繁的沉默。另外,通过PLACE没被鉴定的其它基序可能负责所观察到的基因沉默。在2.1kb或更短片段内的不同调控基序进一步说明了可将关键调控元件(在表9中所显示的那些和其它仍不知道的元件)可人为地融合到有用的启动子中,并缺失如上面所讨论的对于预期目的并非必需或有用的其它基序。

通过将来自成熟T0植物和幼态T1植物的组织学结果相结合,可得到下列关于GUS表达的发育模式的观察结果。这些结果对于2.1kb、1.8kb和1.4kb试验是相同的。这些结果可概括为所有三个启动子长度都在棉花植物内优先在各种次生有壁细胞中驱动基因表达,所有这些细胞都含有纤维素作为主要成分。在1.0kb试验的T0植物中观察到类似的结果。改变植物茎中的纤维素含量有许多商业应用,在这种生物技术策略中F286启动子将会是有用的。通过排除其在下列细胞组织中的基因表达,进一步突出了该启动子的效用:(a)叶、子叶、苞叶、花瓣和种子的次生有壁维管细胞和保卫细胞;(b)与长棉花皮棉纤维(lint fiber)一同发育的短棉绒纤维(linter);和(c)典型的实质细胞如光合的叶肉以及茎和根的庞大的基本组织。

表9

F286启动子中存在的推定的调控基序

    #  调控元件  在F286启动  子中的位置  启动子  类型  共有序列推定的调控作用    1     2  GATABOX   CAATBOX1    22(-)     49(+)  F286-2.1   F286-2.1    GATA     CAAT光调控的和组织特异性表达组织特异性表达
  3   4   5  6  7   8  9  10  11  12  13    14  15  16    17  18  19  20  21   22    23  24    25  26  27  28  29    30    GATABOX   GT1CONSENSUS   IBOXCORE  GTGANTG10  GATABOX   GTGANTG10  GTGANTG10  INRNTPSADB  CAATBOX1  GTGANTG10  CCAATBOX1    CAATBOX1  CAATBOX1  CIACADIANLELHC    DOFCOREZM  GTGANTG10  DOFCOREZM  TAAAGSTKST1  GATABOX   CIACADIANLELHC    CAATBOX1  CCAATBOX1    REALPHALGLHCB21  POLLEN1LELAT52  SEF4MOTIFGM7S  DOFCOREZM  MARTBOX    MARTBOX    53(+)   53(+)   53(+)  66(-)  70(-)   72(-)  82(-)  101(-)  103(-)  127(-)  145(+)    146(+)  176(+)  176(+)    193(-)  203(-)  219(-)  219(-)  224(+)   224(-)    230(-)  230(-)    231(-)  236(-)  249(+)  259(-)  260(+)    261(+)    F286-2.1   F286-2.1   F286-2.1  F286-2.1  F286-2.1   F286-2.1  F286-2.1  F286-2.1  F286-2.1  F286-2.1  F286-2.1    F286-2.1  F286-2.1  F286-2.1    F286-2.1  F286-2.1  F286-2.1  F286-2.1  F286-2.1   F286-2.1    F286-2.1  F286-2.1    F286-2.1  F286-2.1  F286-2.1  F286-2.1  F286-2.1    F286-2.1    GATA   GRWAAW   GATAA  GTGA  GATA   GTGA  GTGA  YTCANTYY  CAAT  GTGA  CCAAT    CAAT  CAAT  CAANNNNATC  (SEQ ID NO:  30)  AAAG  GTGA  AAAG  TAAAG  GATA   CAANNNNATC  (SEQ ID NO:  30)  CAAT  CCAAT    AACCAA  AGAAA  RTTTTTR  AAAG  TTWTWTTWTT  (SEQ ID NO:  31)  TTWTWTTWTT  (SEQ ID NO:  31)  光调控的和组织  特异性表达  许多光调控基因  中的结合位点  光调控的活性  花粉特异性  光调控的和组织  特异性表达  花粉特异性  花粉特异性  光反应性转录  组织特异性表达  花粉特异性  在真核基因的5′非  编码区中存在的共同  序列  组织特异性表达  组织特异性表达  番茄Lhc基因的昼夜  节律表达必需的   组织特异性表达  花粉特异性  组织特异性表达  保卫细胞特异性表达  光调控的和组织特异  性表达  番茄Lhc基因的昼夜  节律表达必需的   组织特异性表达 在真核基因的5′非编  码区中存在的共同序  列  植物光敏素调控  花粉特异性  种子特异性  组织特异性表达  在基质附着区中存在  的“T-盒”基序   在基质附着区中发现  的“T-盒”基序 
  31    32  33  34    35  36  37  38  39   40  41  42  43    44  45  46  47   48  49   50  51   52    53  54  55  56   57  58  59  60  61   MARTBOX    GT1CORE  REALPHALGLHCB21  CIACADIANLELHC    TBOXATGAPB  DOFCOREZM  GTGANTG10  DOFCOREZM  GT1CONSENSUS   POLLEN1LELAT52  INRNTPSADB  CAATBOX1  CCAATBOX1    CCAATBOX1  GTGANTG10  GTGANTG10  RAV1AAT   MYBCORE  GT1CONSENSUS   IBOXCORE  GATABOX   CGACGOSAMY3    CAATBOX1  CAATBOX1  -300ELEMENT  PROLAMINBOX-OSG  L  DOFCOREZM  CAATBOX1  DOFCOREZM  POLLEN1LELAT52  SEF3MOTIFGM   262(+)    270(-)  272(+)  275(+)    275(-)  276(+)  283(-)  286(-)  287(-)   289(-)  293(+)  295(+)  304(+)    305(+)  313(-)  325(-)  334(+)   334(-)  342(-)   343(-)  344(-)   347(-)    381(-)  340(-)  442(+)  442(+)   445(+)  464(-)  472(-)  473(-)  481(+)   F286-2.1    F286-2.1  F286-2.1  F286-2.1    F286-2.1  F286-2.1  F286-2.1  F286-2.1  F286-2.1   F286-2.1  F286-1.8  F286-1.8  F286-1.8    F286-1.8  F286-1.8  F286-1.8  F286-1.8   F286-1.8  F286-1.8   F286-1.8  F286-1.8   F286-1.8    F286-1.8  F286-1.8  F286-1.8  F286-1.8   F286-1.8  F286-1.8  F286-1.8  F286-1.8  F286-1.8   TTWTWTTWTT  (SEQ ID NO:  31)  GGTTAA  AACCAA  CAANNNNATC  (SEQ ID NO:  30)  ACTTTG  AAAG  GTGA  AAAG  GRWAAW   AGAAA  YTCANTYY  CAAT  CCAAT    CCAAT  GTGA  GTGA  CAACA   CNGTTR  GRWAAW   GATAA  GATA   CGACG    CAAT  CAAT  TGHAAARK  TGCAAAG   AAAG  CAAT  AAAG  AGAAA  AACCCA   在基质附着区中发现  的“T-盒”基序   光调控的  植物光敏素调控  番茄Lhc基因的昼夜  节律表达必需的   光调控的  组织特异性表达  花粉特异性  组织特异性表达  许多光调控基因中的  结合位点  花粉特异性  光反应性转录  组织特异性表达  在真核基因的5′非编  码区中发现的共同序  列  组织特异性表达  花粉特异性  花粉特异性  拟南芥转录因子RAV1  的结合共有序列  水应激相关的  许多光调控基因中的  结合位点  光调控的活性  光调控的和组织特异  性表达  在水稻Amy3D和  Amy3E淀粉酶基因中  发现的  组织特异性表达  组织特异性表达  胚乳特异性  胚乳特异性   组织特异性表达  组织特异性表达  组织特异性表达  花粉特异性  在球蛋白基因中发现  的大豆共有序列
  62  63  64   65     66   67   68  69  70   71    72  73  74  75   76  77  78  79  80  81  82   83  84  85  86  87   88  89  90    91  CAATBOX1  ROOTMOTIFTAPOX1  SEF1MOTIF   TATABOXOSPAL     GATABOX   RAV1AAT   CCA1ATLHCB1  CAATBOX1  LTRECOREAT-COR1  5  CCAATBOX1    CAATBOX1  GTGANTG10  DOFCOREZM  SEF3MOTIFGM   EBOXBNNAPA  EBOXBNNAPA  GTGANTG10  TBOXATGAPB  DOFCOREZM  GTGANTG10  RAV1AAT   POLLEN1LELAT52  CAATBOX1  CAATBOX1  DOFCOREZM  GT1CONSENSUS   ROOTMOTIFTAPOX1  CAATBOX1  CCAATBOX1    SEF3MOTIFGM  501(+)  506(+)  506(+)   507(+)     519(-)   522(+)   523(+)  525(+)  537(+)   541(+)    542(+)  546(-)  552(-)  570(+)   577(+)  577(-)  586(+)  591(-)  592(+)  597(+)  610(+)   643(-)  653(+)  659(+)  690(-)  695(-)   720(+)  722(-)  722(-)    724(-)  F286-1.8  F286-1.8  F286-1.8   F286-1.8     F286-1.8   F286-1.8   F286-1.8  F286-1.8  F286-1.8   F286-1.8    F286-1.8  F286-1.8  F286-1.8  F286-1.8   F286-1.8  F286-1.8  F286-1.8  F286-1.8  F286-1.8  F286-1.8  F286-1.8   F286-1.8  F286-1.4  F286-1.4  F286-1.4  F286-1.4   F286-1.4  F286-1.4  F286-1.4    F286-1.4  CAAT  ATATTT  ATATTTAWW   TATTTAA     GATA   CAACA   AAMAATCT  CAAT  CCGAC   CCAAT    CAAT  GTGA  AAAG  AACCCA   CANNTG  CANNTG  GTGA  ACTTTG  AAAG  GTGA  CAACA   AGAAA  CAAT  CAAT  AAAG  GRWAAW   ATATT  CAAT  CCAAT    AACCCA  组织特异性表达  根特异性  在球蛋白基因中发现  的大豆共有序列  一旦结合OsTBP2,DNA  弯曲,其便于水稻PAL  基因(维管相关的)  的转录  光调控的和组织特异  性表达  拟南芥转录因子RAV1  的结合共有序列  植物光敏素调控  组织特异性表达  低温反应性元件的核  心,应激相关的  在真核基因的5′非编  码区中发现的共同序  列  组织特异性表达  花粉特异性  组织特异性表达  在球蛋白基因中发现  的大豆共有序列  贮藏蛋白相关的  贮藏蛋白相关的  花粉特异性  光相关的  组织特异性表达  花粉特异性  拟南芥转录因子RAV1  的结合共有序列  花粉特异性  组织特异性表达  组织特异性表达  组织特异性表达  许多光调控基因中的  结合位点  根特异性  组织特异性表达  在真核基因的5′非编  码区中发现的共同序  列  在球蛋白基因中发现  的大豆共有序列
   92   93  94  95   96  97  98  99  100  101   102  103  104   105  106  107  108  109  110  111   112  113   114  115  116  117  118  119  120  121   122   123  124   125   GT1CONSENSUS   GTGANTG10  L1BOXATPDF1  GATABOX   DOFCOREZM  GTGANTG10  DOFCOREZM  TAAAGSTKST1  QELEMENTZMZM13  GT1CONSENSUS   DOFCOREZM  GTGANTG10  GT1CONSENSUS   CAATBOX1  -10PEHVPSBD  INRNTPSADB  CAATBOX1  MYB2AT  MYBCORE  GATABOX   ROOTMOTIFTAPOX1  GT1CONSENSUS   TATABOX5  GTGANTG10  DOFCOREZM  INRNTPSADB  CAATBOX1  RBCSCONSENSUS  INRNTPSADB  RAV1AAT   GT1CONSENSUS   CAATBOX1  RAV1AAT   DOFCOREZM   728(-)   732(-)  751(+)  757(-)   777(-)  780(-)  799(-)  799(-)  816(-)  825(+)   854(+)  861(+)  877(+)   881(-)  901(-)  915(+)  917(+)  927(+)  927(-)  940(+)   941(+)  964(+)   966(-)  974(-)  995(-)  1042(+)  1044(+)  1045(+)  1075(-)  1092(+)   1102(+)   1117(+)  1156(+)   1174(+)   F286-1.4   F286-1.4  F286-1.4  F286-1.4   F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4   F286-1.4  F286-1.4  F286-1.4   F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4   F286-1.4  F286-1.4   F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.4  F286-1.0   F286-1.0   F286-1.0  F286-1.0   F286-1.0   GRWAAW   GTGA  TAAATGYA  GATA   AAAG  GTGA  AAAG  TAAAG  AGGTCA  GRWAAW   AAAG  GTGA  GRWAAW   CAAT  TATTC  YTCANTYY  CAAT  TAACTG  CNGTTR  GATA   ATATT  GRWAAW   TTATTT  GTGA  AAAG  YTCANTYY  CAAT  AATCCAA  YTCANTYY  CAACA   GRWAAW   CAAT  CAACA   AAAG  的大豆共有序列  许多光调控基因中的  结合位点  花粉特异性  L1层特异性基因表达  光调控的和组织特异  性表达  组织特异性表达  花粉特异性  组织特异性表达  保卫细胞特异性表达  花粉特异性  许多光调控基因中的  结合位点  组织特异性表达  花粉特异性  许多光调控基因中的  结合位点  组织特异性表达  光反应性启动子元件  光反应性转录  组织特异性表达  应激反应的  水应激相关的  光调控的和组织特异  性表达  根特异性  许多光调控基因中的  结合位点  TATA元件  花粉特异性  组织特异性表达  光反应性转录  组织特异性表达  rbcS一般共有序列  光反应性转录  拟南芥转录因子RAV1  的结合共有序列  许多光调控基因中的  结合位点  组织特异性表达  拟南芥转录因子RAV1  的结合共有序列  组织特异性表达
  126  127  128    129   130  131  132  133   134  135  136  137  138  139  140     141  142  143  144   145   146  147  148  149  150  151   152  153   154    POLLEN1LELAT52  CAATBOX1  CCAATBOX1    GATABOX   TATA box  TATABOX5  CAATBOX1  GATABOX   ROOTMOTIFTAPOX1  GTGANTG10  ROOTMOTIFTAPOX1  ROOTMOTIFTAPOX1  SEF4MOTIFGM7S  TAAAGSTKST1  NTBBF1ARROLB     DOFCOREZM  TATABOX4  ROOTMOTIFTAPOX1  GATABOX   GT1CONSENSUS   TATABOX5  SEF4MOTIFGM7S  TATABOX5  POLASIG3  CAATBOX1  GATABOX   SEF4MOTIFGM7S  GT1CONSENSUS   MARARS    1176(+)  1180(-)  1180(-)    1188(+)   1195(-)  1196(+)  1237(-)  1240(+)   1241(+)  1253(-)  1261(-)  1262(+)  1264(+)  1269(+)  1269(-)     1270(+)  1274(+)  1279(-)  1281(-)   1297(+)   1299(-)  1302(-)  1312(-)  1313(+)  1325(-)  1328(+)   1347(-)  1352(-)   1358(-)    F286-1.0  F286-1.0  F286-1.0    F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0     F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0   F286-1.0    AGAAA  CAAT  CCAAT    GATA   TAAATAA  TTATTT  CAAT  GATA   ATATT  GTGA  ATATT  ATATT  RTTTTTR  TAAAG  ACTTTA     AAAG  TATATAA  ATATT  GATA   GRWAAW   TTATTT  RTTTTTR  TTATTT  AATAAT  CAAT  GATA   RTTTTTR  GRWAAW   WTTTATRTTT  W  (SEQ ID NO:  花粉特异性  组织特异性表达  在真核基因的5′非编  码区中发现的共同序  列  光调控的和组织特异  性表达  TATA元件  TATA元件  组织特异性表达  光调控的和组织特异  性表达  根特异性  花粉特异性  根特异性  根特异性  种子特异性  保卫细胞特异性表达  组织特异性表达(包  括维管)和生长素诱  导,在rolB癌基因中  发现的  组织特异性表达  TATA元件  根特异性  光调控的和组织特异  性表达  许多光调控基因中的  结合位点  TATA元件  种子特异性  TATA元件  Poly A信号  组织特异性表达  光调控的和组织特异  性表达  种子特异性  许多光调控基因中的  结合位点  在MAR中发现的“ARS  元件” 
   155  156  157   158  159   160  161  162  163  164   165  166  167   168  169  170   171  172  173  174  175  176  177  178  179   180   181  182  183  184  185  186  187  188   ROOTMOTIFTAPOX1  TATABOX2  SEF1MOTIF   ROOTMOTIFTAPOX1  GATABOX   ROOTMOTIFTAPOX1  CAATBOX1  DOFCOREZM  -10PEHVPSBD  GATABOX   ROOTMOTIFTAPOX1  MYBCORE  RAV1AAT   MYBPLANT  REALPHALGLHCB21  2SSEEDPROTBANAP   CANBNNAPA  DOFCOREZM  DOFCOREZM  CAATBOX1  EBOXBNNAPA  EBOXBNNAPA  DOFCOREZM  POLLEN1LELAT52  GT1CONSENSUS   GT1CONSENSUS   INRNTPSADB  CAATBOX1  _300ELEMENT  DOFCOREZM  INRNTPSADB  CAATBOX1  POLAS IG1  REALPHALGLHCB21   1360(-)  1362(+)  1362(-)   1366(-)  1368(-)   1372(+)  1374(-)  1390(+)  1392(-)  1398(+)   1405(-)  1421(+)  1422(-)   1432(+)  1433(+)  1435(+)   1435(+)  1477(+)  1483(+)  1495(+)  1523(+)  1523(-)  1559(+)  1561(+)  1567(+)   1568(+)   1571(-)  1573(-)  1575(+)  1578(+)  1598(+)  1600(+)  1604(-)  1625(-)   F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  32)  ATATT  TATAAAT  ATATTTAWW   ATATT  GATA   ATATT  CAAT  AAAG  TATTCT  GATA   ATATT  CNGTTR  CAACA   MACCWAMC  AACCAA  CAAACAC   CNAACAC  AAAG  AAAG  CAAT  CANNTG  CANNTG  AAAG  AGAAA  GRWAAW   GRWAAW   YTCANTYY  CAAT  TGHAAARK  AAAG  YTCANTYY  CAAT  AATAAA  AACCAA   根特异性  TATA盒  在球蛋白基因中发现  的大豆共有序列  根特异性  光调控的和组织特异  性表达  根特异性  组织特异性表达  组织特异性表达  光反应性启动子元件  光调控的和组织特异  性表达  根特异性  水应激相关的  拟南芥转录因子RAV1  的结合共有序列  植物MYB结合位点  植物光敏素调控  在许多贮藏蛋白中保  守的  种子特异性  组织特异性表达  组织特异性表达  组织特异性表达  贮藏蛋白相关的  贮藏蛋白相关的  组织特异性表达  花粉特异性  许多光调控基因中的  结合位点  许多光调控基因中的  结合位点  光反应性转录  组织特异性表达  胚乳特异性  组织特异性表达  光反应性转录  组织特异性表达  Poly A信号  植物光敏素调控
  189  190  191  192  193  194   195  196  197  198   199   200  201  202  203  204   205    206    207  208  209   210  211   212  213  214  215  216   217   218  219  220  221  LTRE1HVBLT49  SEF4MOTIFGM7S  TATABOX5  TATABOX4  TATABOX4  TATAPVTRNALEU   SEF4MOTIFGM7S  TATABOX5  CAATBOX1  GATABOX   GT1CONSENSUS   IBOXCORE  SEF4MOTIFGM7S  ERELEE4  ROOTMOTIFTAPOX1  GT1CONSENSUS   MARTBOX    MARTBOX    TATABOX5  SEF4MOTIFGM7S  GT1CONSENSUS   IBOXCORE  GATABOX   EBOXBNNAPA  DPBFCOREDCDC3  EBOXBNNAPA  -10PEHVPSBD  BOXIINTPATPB   RAV1AAT   DOFCOREZM  TAAAGSTKST1  DOFCOREZM  WBOXATNPR1  1629(-)  1645(-)  1648(-)  1664(-)  1665(+)  1665(-)   1682(-)  1685(-)  1697(+)  1711(+)   1711(+)   1711(+)  1713(-)  1725(-)  1739(+)  1746(+)   1749(-)    1751(-)    1753(-)  1756(-)  1761(-)   1762(-)  1763(-)   1815(+)  1815(-)  1816(-)  1830(-)  1833(+)   1842(+)   1852(-)  1852(-)  1859(-)  1904(+)  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0    F286-1.0    F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  CCGAAA  RTTTTTR  TTATTT  TATATAA  TATATAA  TTTATATA   RTTTTTR  TTATTT  CAAT  GATA   GRWAAW   GATAA  RTTTTTR  AWTTCAAA  ATATT  GRWAAW   TTWTWTTWTT  (SEQ ID NO:  31)  TTWTWTTWTT  (SEQ ID NO:  31)  TTATTT  RTTTTTR  GRWAAW   GATAA  GATA   CANNTG  ACACNNG  CANNTG  TATTCT  ATAGAA   CAACA   AAAG  TAAAG  AAAG  TTGAC  低温反应性元件  种子特异性  TATA元件  TATA元件  TATA元件  植物tRNA基因中的  TATA样基序  种子特异性  TATA元件  组织特异性表达  光调控的和组织特异  性表达  许多光调控基因中的  结合位点  光调控活性  种子特异性  乙烯反应性元件  根特异性  许多光调控基因中的  结合位点  在基质附着区中发现  的“T盒”基序   在基质附着区中发现  的“T盒”基序   TATA元件  种子特异性  许多光调控基因中的  结合位点  光调控活性  光调控的和组织特异  性表达  贮藏蛋白相关的  ABA反应性和胚指定  贮藏蛋白相关的  光反应性启动子元件  在烟草质体atpB基因  启动子中发现的  拟南芥转录因子RAV1  的结合共有序列  组织特异性表达  保卫细胞特异性表达  组织特异性表达  在拟南芥NPR1基因中
   222  223  224  225  226   227  228  229  230  231  232  233  234  235  236  237  238  239   240  241  242   243  244   245  246    DPBFCOREDCDC3  DPBFCOREDCDC3  GTGANTG10  GTGANTG10  GT1CONSENSUS   INRNTPSADB  GTGANTG10  DOFCOREZM  POLLEN1LELAT52  CANBNNAPA  DOFCOREZM  GTGANTG10  SEF4MOTIFGM7S  DOFCOREZM  TAAAGSTKST1  DPBFCOREDCDC3  CANBNNAPA  RAV1AAT   REALPHALGLHCB21  POLLEN1LELAT52  SEF3MOTIFGM   SV40COREENHAN  GATABOX   DOFCOREZM  GATABOX    1907(+)  1910(-)  1915(+)  1921(+)  1947(+)   1978(+)  1979(-)  1982(-)  1983(-)  1986(+)  1992(-)  1995(-)  2008(-)  2026(-)  2026(-)  2041(-)  2044(-)  2045(-)   2047(-)  2051(-)  2064(+)   2068(-)  2096(-)   2099(-)  2103(+)    F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0  F286-1.0   F286-1.0  F286-1.0   F286-1.0  F286-1.0    ACACNNG  ACACNNG  GTGA  GTGA  GRWAAW   YTCANTYY  GTGA  AAAG  AGAAA  CNAACAC  AAAG  GTGA  RTTTTTR  AAAG  TAAAG  ACACNNG  CNAACAC  CAACA   AACCCA  AGAAA  AACCCA   GTGGWWHG  GATA   AAAG  GATA   发现的“W盒”  ABA反应性和胚指定  ABA反应性和胚指定  花粉特异性  花粉特异性  许多光调控基因中的  结合位点  光反应性转录  花粉特异性  组织特异性表达  花粉特异性  种子特异性  组织特异性表达  花粉特异性  种子特异性  组织特异性表达  保卫细胞特异性表达  ABA反应性和胚指定  种子特异性  拟南芥转录因子RAV1  的结合共有序列  植物光敏素调控  花粉特异性  在球蛋白基因中发现  的大豆共有序列  SV40核心增强子  光调控的和组织特异  性表达  组织特异性表达  光调控的和组织特异  性表达
基序以它们在启动子片段中出现的顺序列出,从F286编码序列上游的5′端开始。在“位置”中的(+)和(-):对于(+),指含有报道的F286启动子序列的DNA链;对于(-),指互补的DNA链。“启动子类型”表示该长度的片段和所有更长的片段的将含有所示基序。用粗体显示仅在2.1kb和1.8kb片段中发现的、而在更短的1.4kb和1.0kb片段中并未发现的基序。B:C,G或T;D:A,G或T;H:A,C或T;K:G或T;M:A或C;N:A,C,G或T;R:A或G;S:C或G;V:A,C或G;W:A或T;Y:C或T。

在棉花皮棉纤维中,启动子驱动GUS在14DPA时开始表达,到17DPA时表达非常强(图9)。在底物中孵育≤30分钟后,在≥17DPA纤维中观察到的亮蓝色量暗示GUS在纤维中的表达强度。外层种子表皮的非纤维细胞不表达GUS(图9;27DPA种子)。通过干涉相差(DIC)显微镜对单个纤维进行检查,显示GUS表达的开始与含有螺旋状微丝的增厚的纤维壁的发育一致,两者都显示次生壁沉积的开始。在17DPA时GUS的强烈表达(图9)很可能显示所有纤维到那时已经转换成次生壁沉积,与在14-16DPA之间仅少量纤维进入这个发育阶段形成对比。到17DPA时,微粒上的皮棉纤维也强烈染成蓝色,显微镜检证实它们开始了次生壁沉积。

在活纤维中亮蓝色持续存在至少到40DPA(图9)。基于由F285/F286基因的Northern印迹所显示的表达模式,预期在这个阶段GUS继续表达。这些同源基因从15DPA到31DPA(测试的最后一天)表达,且GUS的组织学分析与该发现一致。同样地,定量结果显示在18和24DPA之间对于所有三个启动子长度而言GUS的量都增加。

在27DPA时在棉绒纤维(也称作短绒纤维)中GUS不表达(图10)。棉绒纤维比皮棉纤维晚几天开始伸长。棉绒纤维制造厚纤维素壁并代表了重要的的碳汇集(Berlin,“The Outer Epidermis of theCottonSeed”,in:Mauney等(编)Cotton Physiology,pp.375-414,The Cotton Foundation,Memphis(1986),特此全文并入作为参考)。棉花纤维品质的改变,尤其是那些需要更多碳配置的改变,优先针对更有价值的皮棉纤维,而F286启动子通过提供满足这个目标的工具而具有额外的效用。

在成熟T0植物和/或幼态T1植物中,GUS在其它次生有壁细胞中表达,所述细胞包括:(a)在种皮的内珠被中的那些细胞;(b)叶、茎和幼芽内发育的萼片上的毛状体;(c)茎、下胚轴、根和雄蕊柱的厚壁维管细胞(木质部和韧皮部中);(d)花药的纤维药室内壁;和(e)花粉壁的厚纤维素性花粉内壁。从形成层处的手工切片中分离并在正面视野中观察的木质部组织清楚地显示在伸长的纤维束中选择性的阳性HUS染色。在一些情况中表达是短暂的:较老的/成熟的毛状体和维管细胞并非阳性染色,并且有时候器官完全是阴性的,大概是因为其并非正在生长中。随着离主干距离的增加,侧枝中的表达强度也增强,这与其中正形成更多次生壁的迅速生长区中的表达增强一致。在棉花纤维中的阳性染色和在营养组织中的阳性染色之间有一致的连锁关系一若没有观察到其中之一,则也不会观察到另一个。

尽管检查了许多时期(从正在生长的芽开始)的叶并且在EtOH中清除了叶绿素以便不错过微弱的蓝染色,但是在除了毛状体外的叶细胞中没有观察到GUS表达。在花瓣或叶维管细胞或保卫细胞(都有次生壁)中没有观察到GUS表达。对于子叶和苞片获得了相同的阴性结果。种子表面上的保卫细胞也仍然保持未被染色。

包埋和经过加工用于GUS活性分析的组织切片证实启动子活性与正在产生厚的次生细胞壁的细胞有特殊联系(图11)。

定性的GUS表达强度排列为2.1kb>1.4kb>1.8kb,这与定量的结果一致。1.0kb试验的初步结果显示在营养和繁殖组织中的GUS表达可能具有与3个较长启动子片段类似的强度。结合成熟(m)和幼态植物(J)的结果,在不同组织中的定性GUS表达强度是:根(j)>叶柄(m)>下胚轴(j)>侧支(m)>主茎(m&j)。然而,这些结果可能与细胞内的表达水平关系很小,而与组织内次生壁形成细胞的密度更相关。数据提示启动子功能在棉花纤维中比在其它纤维中更强,因为观察到在≥17DPA棉花纤维中在<1小时强染色,而在营养组织中,根据通常获得可见的蓝色所必需的时间,凭经验确定为≥4小时(图12A;中等水平表达株中的典型结果)。一个例外发生在强表达株2.2-47中(见下面的定量结果),其中在其它组织中1小时后观察到蓝色(图12B),但是中等水平表达株的行为对于在组织之间用组织学方法比较表达强度更有用。因此,F286启动子在棉花皮棉纤维中表达增强最高。

实施例11-定量的方法和结果

如上所述,使卡那霉素抗性T1秧苗在温室中生长直到开花。在开花的那天将白色的花作标记,在18-24DPA时收获正常大小的棉蒴。已证实棉蒴可在液氮中被急骤冷冻,并且在-80℃贮藏,而不会明显将组织GUS反应降至最低。定量试验显示来自冷冻棉蒴的值更高,这大概是由于当用剪刀剪碎新鲜纤维以便于GUS提取时发生的蛋白水解活性之故。因此,从以前收集的冷冻棉蒴中分批进行组织学和定量测定。

敲开冷冻的棉蒴,从棉蒴组织中分离种子,通过轻轻研磨从所有种子中分离纤维,之后在液氮下通过猛烈研磨将单独的纤维磨成粉。在试验中所使用的所有种子都具有典型的大小,具有它们生长时期的典型纤维。GUS的提取和测定按照Gallagher(编)“Gus Protocols:Using the GUS Gene as a Reporter of Gene Expression”,221pp.,Academic Press,New York(1992)(特此全文并入作为参考)中所描述的进行。用荧光底物4-甲基伞形酮酰-β-D-葡糖醛酸苷(MUG)测量GUS活性。MUG被GUS水解,且反应用碱性0.2M Na2CO3终止。碳酸盐也导致所释放的成分7-羟基-4-甲基香豆素(4-甲基伞形酮;MU)成为完全荧光的。在荧光计(355nm激发/460nm发射)中测定MU荧光。用纯化的GUS[大肠杆菌VII-A型;Sigma Chem;0.2-2.0ng/μl]制备标准曲线,通过Bradford试验测定棉花纤维提取物中的蛋白含量,将数据表示为GUS占总蛋白中的百分率。使用纯化的GUS,确定了反应的淬灭不是由棉花纤维提取物的内源性成分所导致的。作为对照,在未转化的棉花的纤维中进行测定,从所有报告值中减去相当于总蛋白中0.112%GUS的背景值。

在18DPA,即在纤维中观察到均一蓝色一天后,1.4、1.8和2.1kb试验显示类似的Avg%GUS/植物均值(表10)。单个数据组含有大量重叠的值。一个例外是在2.1试验中对于两个单独的植物2.1-2-2a-1和2.1-47-1a-1观察到最高值(1.256和1.357%GUS)。这些株显示在T1代,T1分离比分别是14∶0和19∶0,这表明了多基因插入位点。在这些系的每一个内测试的其它植物GUS的水平较低,与它们具有更少拷贝的外源基因表达盒一致。因此,当存在于多拷贝的表达盒内时,2.1kb启动子可驱动最高的蛋白表达。该2.1kb启动子可能是优选的长度,可用于驱动最高的基因表达。1.4和1.8kb试验都包括了具有表现出多基因插入位点的T1分离比的株(例如,1.4-32-2a、1.4-41-6a和1.8-16-11a),所测试的1.4kb株的数量使得高表达显现的概率与2.1kb试验相同。然而,由于秧苗是通过随机方式置于试验中的(仅仅基于侧根形成的卡那霉素抗性),因此有可能没有测试到具有1.4和1.8kb表达盒的最高拷贝数量的植物。具有通常与一个基因插入位点一致的分离比的株(例如,1.4-11-3b、5b;1.4-32-1a;1.4-43-5a;1.4-44-1a、1.8-16-12a、2.1-2-3a、2.2-55-8a)中,单个植物GUS%的范围是0.187-0.756,在1.4、1.8和2.1kb试验之间没有明显差别。推测这些值是由于在分离的T1群中一个或两个拷贝的外源基因表达盒产生的。

                        表10

         以GUS占总蛋白百分率表示的GUS的定量分析

      株              T1       DPA      GUS在           Avg            Avg           Avg           T1分离

                      植物              总蛋白%        GUS/%         GUS/%        GUS/           计数

                                        中的百分率      植物           胚            试验

  1.4  2  8 a  2  18  0.289  2∶4  1.4  2  8 a  2  18  0.197  0.243  0.243  1.4  8  14 a  1  18  0.582  8∶4  1.4  8  14 a  1  18  0.397  0.490  0.490  1.4  11  3 b  1  18  0.806  11∶5  1.4  11  3 b  1  18  0.705  0.756  0.756  1.4  11  5 b  2  18  0.445  10∶6  1.4  11  5 b  2  18  0.779  0.612  0.612  1.4  32  1 a  1  18  0.471  13∶5  1.4  32  1 a  1  18  0.481  0.476  1.4  32  1 a  2  18  0.401  1.4  32  1 a  2  18  0.425  0.413  0.444  1.4  32  2 a  1  18  0.577  14∶1  1.4  32  2 a  1  18  0.646  0.612  1.4  32  2 a  2  18  0.547  1.4  32  2 a  2  18  0.403  0.475  0.544  1.4  34  5 a  1  18  0.187  0.187  0.187  17∶5  1.4  34  7 a  1  18  0.348  0.348  4∶5  1.4  34  7 a  2  18  0.475  0.475  0.412

  1.4  36  3  a  1  18  0.141  3∶11  1.4  36  3  a  1  18  0.192  0.167  0.167  1.4  41  6  a  2  18  0.676  11∶1  1.4  41  6  a  2  18  0.439  1.4  41  6  a  2  18  0.574  0.563  0.563  1.4  41  7  a  1  18  0.525  1.4  41  7  a  1  18  0.556  0.540  0.540  1.4  44  1  a  1  18  0.658  11∶3  1.4  44  1  a  1  18  0.559  0.608  0.608  0.464  1.8  8  3  a  1  18  0.516  0.516  4∶5  1.8  8  3  a  2  18  0.110  1.8  8  3  a  2  18  0.180  0.145  0.330  1.8  8  17  a  1  18  0.236  0.236  0.236  5∶5  1.8  16  11  a  2  18  0.482  17∶1  1.8  16  11  a  2  18  0.376  1.8  16  11  a  2  18  0.660  0.506  0.506  1.8  16  12  a  1  18  0.292  14∶3  1.8  16  12  a  1  18  0.373  0.332  1.8  16  12  a  2  18  0.442  1.8  16  12  a  2  18  0.467  0.455  0.394  0.367

                                            表10(续)(18DPA)

                              以GUS占总蛋白百分率表示的GUS的定量分析

      株              T1       DPA      GUS在          Avg            Avg            Avg            T1分离

                      植物              总蛋白%       GUS/%         GUS/%         GUS/            计数

                                        中的百分率     植物           胚             试验

  2.1  2  2 a  1  18  1.331  14∶0  2.1  2  2 a  1  18  1.181  1.256  2.1  2  2 a  2  18  0.451  2.1  2  2 a  2  18  0.573  0.512  0.884  2.1  2  3 a  2  18  0.603  0.603  0.603  13∶5  2.1  28  1 a  2  18  0.176  0.176  0.176  3∶7  2.1  28  3 b  2  18  0.275  0.275  0.275  9∶4  2.1  38  4 a  1  18  0.227  0.227  0.227  5∶1  2.1  39  13 a  2  18  0.444  5∶1  2.1  39  13 a  2  18  0.380  0.412  0.412  2.1  47  1 a  1  18  1.351  19∶0  2.1  47  1 a  1  18  1.363  1.357  2.1  47  1 a  2  18  0.937
  2.1  47  1 a  2  18  0.690  0.813  1.085  2.1  47  4 a  1  18  0.587  14∶1  2.1  47  4 a  1  18  0.692  0.640  0.640  2.1  55  8 a  1  18  0.407  0.407  17∶5  2.1  55  8 a  2  18  0.573  0.573  0.490  2.1  55  10 a  1  18  0.378  18∶3  2.1  55  10 a  1  18  0.421  0.399  0.399  2.1  93  1 a  1  18  0.387  0.387  0.387  4∶12  2.1  101  1 b  1  18  0.728  4∶0  2.1  101  1 b  1  18  0.713  0.720  0.720  0.525  35S  25  16  1  18  2.463  35S  25  16  1  18  2.288  2.375  35S  25  16  3  18  1.974  35S  25  16  3  18  2.437  2.205  2.290  35S  30  11  2  18  1.817  35S  30  11  2  18  2.226  2.022  2.022  35S  39  17  1  18  1.958  1.958  35S  39  17  2  18  1.037  35S  39  17  2  18  1.089  1.063  1.510  1.940

                                                  表10(续)

                             以GUS占总蛋白百分率表示的GUS的定量分析

     株               T1      DPA     GUS在          Avg           Avg          Avg            T1分离

                      植物            总蛋白%       GUS/%        GUS/%       GUS/           计数

                                      中的百分率     植物          胚           试验

  1.4  2  8 a  1  24  1.217  1.217  1.217  2∶4  1.4  11  3 b  1  24  1.271  1.271  1.271  11∶5  1.4  32  1 a  24  0.598  0.598  0.598  13∶5  1.4  32  2 a  2  24  0.731  0.731  0.731  14∶1  1.4  34  7 a  2  24  0.711  0.711  0.711  4∶5  1.4  36  3 a  1  24  0.510  0.510  0.510  3∶11  1.4  41  6 a  2  24  0.497  0.497  0.497  1.4  44  1 a  1  24  0.518  0.518  0.518  0.757  11∶3  1.8  16  12 a  1  24  0.508  0.508  14∶3  1.8  16  12 a  2  24  0.765  0.765  0.636  0.636
  2.1   2  2a    1    24    0.845    14∶0  2.1   2  2a    1    24    1.171    1.008    1.008  2.1  39  13a    2    24    0.356    0.356    0.356    5∶1  2.1  47  1a    1    24    1.142    1.142    19∶0  2.1  47  1a    2    24    1.341    1.341    1.241  2.1  47  4a    1    24    0.602  2.1  47  4a    1    24    1.095    0.848  2.1  47  4a    2    24    0.846    0.846    0.847  2.1  55  10a    1    24    0.491    0.491    0.491    18∶3  2.1  101  1b    1    24    0.927    0.927    0.927    0.812    4∶0  35S  25  16    1    24    0.864  35S  25  16    1    24    1.271    1.068  35S  25  16    2    24    1.539    1.539    1.304  35S  30  11    2    24    1.120    1.120    1.120    1.212

·株名,例如1.4-2-8a,具有下列成分:‘1.4’=用于转化的F286启动子的长度。‘ 2’=一块独特的愈伤组织。‘8a’=从该块愈伤组织中产生的特殊胚。来自相同株的多个胚可能代表或可能不代表相同的转化事件。

·交替的灰色底纹突出了不同的转基因株。

·T1分离计数=来自卡那霉素培养基上侧根形成的卡那霉素抗性:卡那霉素敏感性。

在18DPA,35S CaMY启动子试验显示%GUS比所测试的任何长度的F286启动子都高3.70-5.29倍(表11)。然而,这个结果不是相对启动子强度的指示,因为35S CaMV启动子从棉花纤维发育的一开始时就驱动基因表达,如通过其在以前的试验中用作对照启动子所证明的那样(Dang,“Expression of a Cotton Fiber′Specific′GenePromoter in Tobacco and Cotton”,96pp.,Ph. D.dissertation,Texas Tech University,Lubbock,TX(1996),特此全文并入作为参考)。所以,在35S CaMY试验的纤维中gusA基因已被开启18天,但是在F286启动子试验中始终如一地仅开启一天。如以前所描述的,GUS蛋白非常稳定并且随时间累积,使得难于辨别更早开始的转录和更强的启动子活性。然而,1.4、1.8和2.1kb F286启动子试验显示在18DPA和24DPA之间%GUS增加(平均数=增加0.283%),而35S CaMV启动子试验显示在相同时期下降(-0.728%)。因此,除了将基因表达局限到纤维发育的次生壁阶段外,F286启动子也优选用于在次生壁沉积的较长时期维持更为一致的基因表达水平。

                                     表11

                     3种长度的F286启动子和35S CaMV启动子

                    在18和24DPA时GUS占总蛋白百分率的平均值

DPA                             测试的启动子

                              F286-2.1kb                 F286-1.8kb                F286-1.4kb                35S CaMV

  0.525  0.367  0.464  1.940  0.812  0.636  0.757  1.212  +0.287%  +0.269%  +0.293%  -0.728%
    18     24   百分率变化

尽管出于举例说明的目的已经详细描述了本发明,但是应当理解的是此类细节仅用于该目的,并且本领域技术人员可在不偏离本发明的精神和下列权利要求所定义的范围的情况下对此作出各种改变。

                          序列表

<110>Texas Tech University

<120>在次生壁沉积期间优先在次生有壁细胞中表达的来自棉花的编码几丁质酶的DNA分子和相应的启

动子 

<130>201304/1053

<140>PCT/US2004/001816

<141>2004-01-23

<150>10/350.696

<151>2003-01-23

<160>32

<170>PatentIn Ver.2.1

<210>1

<211>957

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>1

atggaggcca aatggctgct atgttttaca atggcagcac taatggcagt gtcaaatggc 60

caggaatcag tgaagccatt ggtgaagata gttaaaggca agaaactttg tgataaaggg 120

tgggaatgta aagggtggtc acagttttgt tgtaaccaaa ccatttctga ttatttccga 180

acttatcaat ttgagaacct tttcgctaaa cgtaatacac cggtggcaca tgcggttggg 240

ttctgggatt accattcttt cattacggcg gcggctcagt atcagcctca tggttttggt 300

accaccggcg gtaagctgca gagcatgaag gaagtggcag cttttcttgg acatgtcggc 360

agcaaaactt catgtggtta tggagtggca actgggggac cattggcttg gggtctatgc 420

tacaacaagg aaatgagtcc tagcaaattg tattgtgatg attactacaa atacacctac 480

ccttgcactc ctggagtttc ttaccatggc cgtggtgcct tgcctatcta ttggaactac 540

aactatggag aaacaggcga cgcattgaag gtggacttat tgaaccaccc tgaatacata 600

gaaaacaatg caaccttagc tttccaggca gcactctgga gatggatgac accggtgaag 660

aaacaccaac cgtcggccca cgacgtgttt gtcggcagct ggaaaccgac caagaacgac 720

acgttggcca agcgggtccc ggggtttgga gccaccatga atgtgctcta tggagatcaa 780

gtttgtgggc gaggtgatgt tgacaccatg aacaacatca tctctcatta cctttcttac 840

cttgacctaa tgggagttgg gagagaagag gcaggacccc atgaagtgct cacatgtgaa 900

gaacaaaagc ctttcactgt atctccttct tctgcatcat catcatcatc atcttga    957

<210>2

<211>318

<212>PRT

<213>陆地棉(Gossypium hirsutum)

<400>2

Met Glu Ala Lys Trp Leu Leu Cys Phe Thr Met Ala Ala Leu Met Ala

  1               5                  10                  15

Val Ser Asn Gly Gln Glu Ser Val Lys Pro Leu Val Lys Ile Val Lys

             20                  25                  30

Gly Lys Lys Leu Cys Asp Lys Gly Trp Glu Cys Lys Gly Trp Ser Gln

         35                  40                  45

Phe Cys Cys Asn Gln Thr Ile Ser Asp Tyr Phe Arg Thr Tyr Gln Phe

     50                  55                  60

Glu Asn Leu Phe Ala Lys Arg Asn Thr Pro Val Ala His Ala Val Gly

 65                  70                  75                  80

Phe Trp Asp Tyr His Ser Phe Ile Thr Ala Ala Ala Gln Tyr Gln Pro

                 85                  90                  95

His Gly Phe Gly Thr Thr Gly Gly Lys Leu Gln Ser Met Lys Glu Val

            100                 105                 110

Ala Ala Phe Leu Gly His Val Gly Ser Lys Thr Ser Cys Gly Tyr Gly

        115                 120                 125

Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys Tyr Asn Lys Glu

    130                 135                 140

Met Ser Pro Ser Lys Leu Tyr Cys Asp Asp Tyr Tyr Lys Tyr Thr Tyr

145                 150                 155                 160

Pro Cys Thr Pro Gly Val Ser Tyr His Gly Arg Gly Ala Leu Pro Ile

                165                 170                 175

Tyr Trp Asn Tyr Asn Tyr Gly Glu Thr Gly Asp Ala Leu Lys Val Asp

            180                 185                 190

Leu Leu Asn His Pro Glu Tyr Ile Glu Asn Asn Ala Thr Leu Ala Phe

        195                 200                 205

Gln Ala Ala Leu Trp Arg Trp Met Thr Pro Val Lys Lys His Gln Pro

    210                 215                 220

Ser Ala His Asp Val Phe Val Gly Ser Trp Lys Pro Thr Lys Asn Asp

225                 230                 235                 240

Thr Leu Ala Lys Arg Val Pro Gly Phe Gly Ala Thr Met Asn Val Leu

                245                 250                 255

Tyr Gly Asp Gln Val Cys Gly Arg Gly Asp Val Asp Thr Met Asn Asn

            260                 265                 270

Ile Ile Ser His Tyr Leu Ser Tyr Leu Asp Leu Met Gly Val Gly Arg

        275                 280                 285

Glu Glu Ala Gly Pro His Glu Val Leu Thr Cys Glu Glu Gln Lys Pro

    290                 295                 300

Phe Thr Val Ser Pro Ser Ser Ala Ser Ser Ser Ser Ser Ser

305                 310                 315

<210>3

<211>951

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>3

atggaagcca aatggctggt tcttttttca gtggcggcaa tgctggtggc actggccaac 60

tgccaggaat cgttgaagcc attggtgaag atggtaaagg gcaagaagct gtgtgacaaa 120

gggtgggaat gtaaagggtg gtcaaagtat tgttgcaacc ataccatttc tgattacttc 180

caaacttacc agtttgagga cctttttgcg aagcgtaaca cgccggtagc acatgcggtt 240

gggttctggg attaccattc cttcattact gctgctgctc agtatcagcc tcatggattt 300

ggtaccaccg gggaaaagct ccagaatatg aaggaagtcg ctgcttttct tggacatgtc 360

ggcagcaaaa cttcatgtgg ctatggagtc gctaccgggg gaccattggc ttggggtctt 420

tgctacaaca aagaaatgag ccctagcaaa atatattgcg atgattacta taaatacacc 480

tatccttgca caccaggagt ctcatatcat ggccgtggtg ccttgcctat ctactggaac 540

tacaactatg gggaaactgg agaggctttg aaggtggact tgttgaacca cccagaatac 600

ttagaagaca acgcaacctt ggctttccag acagcaatgt ggaggtggat gacgccgatg 660

aagaaacacc aaccctcagc ccatgacgtt ttcgttggca actggaaacc aaccaagaac 720

gacaccttgg ccaagagggt tccaggtttt ggaaccacca tgaatgttct ttatggtgac 780

caagtttgtg gtcaaggtga tagtgattcc atgaacaata tgatctctca ttacctttat 840

taccttgacc ttttgggagt tggccgagaa gaagctggtc ctcatgatat gctcacctgt 900

gaagaacaag aacccttcac tgtttctccc tcatctgcaa catcatcatg a          951

<210>4

<211>316

<212>PRT

<213>陆地棉(Gossypium hirsutum)

<400>4

Met Glu Ala Lys Trp Leu Val Leu Phe Ser Val Ala Ala Met Leu Val

  1               5                  10                  15

Ala Leu Ala Asn Cys Gln Glu Ser Leu Lys Pro Leu Val Lys Met Val

             20                  25                  30

Lys Gly Lys Lys Leu Cys Asp Lys Gly Trp Glu Cys Lys Gly Trp Ser

         35                  40                  45

Lys Tyr Cys Cys Asn His Thr Ile Ser Asp Tyr Phe Gln Thr Tyr Gln

     50                  55                  60

Phe Glu Asp Leu Phe Ala Lys Arg Asn Thr Pro Val Ala His Ala Val

 65                  70                  75                  80

Gly Phe Trp Asp Tyr His Ser Phe Ile Thr Ala Ala Ala Gln Tyr Gln

                 85                  90                  95

Pro His Gly Phe Gly Thr Thr Gly Glu Lys Leu Gln Asn Met Lys Glu

            100                 105                 110

Val Ala Ala Phe Leu Gly His Val Gly Ser Lys Thr Ser Cys Gly Tyr

        115                 120                 125

Gly Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys Tyr Asn Lys

    130                 135                 140

Glu Met Ser Pro Ser Lys Ile Tyr Cys Asp Asp Tyr Tyr Lys Tyr Thr

145                 150                 155                 160

Tyr Pro Cys Thr Pro Gly Val Ser Tyr His Gly Arg Gly Ala Leu Pro

                165                 170                 175

Ile Tyr Trp Asn Tyr Asn Tyr Gly Glu Thr Gly Glu Ala Leu Lys Val

            180                 185                 190

Asp Leu Leu Asn His Pro Glu Tyr Leu Glu Asp Asn Ala Thr Leu Ala

        195                 200                 205

Phe Gln Thr Ala Met Trp Arg Trp Met Thr Pro Met Lys Lys His Gln

    210                 215                 220

Pro Ser Ala His Asp Val Phe Val Gly Asn Trp Lys Pro Thr Lys Asn

225                 230                 235                 240

Asp Thr Leu Ala Lys Arg Val Pro Gly Phe Gly Thr Thr Met Asn Val

                245                 250                 255

Leu Tyr Gly Asp Gln Val Cys Gly Gln Gly Asp Ser Asp Ser Met Asn

            260                 265                 270

Asn Met Ile Ser His Tyr Leu Tyr Tyr Leu Asp Leu Leu Gly Val Gly

        275                 280                 285

Arg Glu Glu Ala Gly Pro His Asp Met Leu Thr Cys Glu Glu Gln Glu

    290                 295                 300

Pro Phe Thr Val Ser Pro Ser Ser Ala Thr Ser Ser

305                 310                 315

<210>5

<211>20

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>5

Gly Arg Gly Ala Leu Pro Ile Tyr Trp Asn Tyr Asn Tyr Gly Glu Thr

  1               5                  10                  15

Gly Asp Ala Leu

             20

<210>6

<211>39

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>6

Met Lys Glu Val Ala Ala Phe Leu Gly His Val Gly Ser Lys Thr Ser

  1               5                  10                  15

Cys Gly Tyr Gly Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys

             20                  25                  30

Tyr Asn Lys Glu Met Ser Pro

         35

<210>7

<211>1029

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>7

ctgagaccag cgttcaacat cgatgaaaat ttgttttaac aatgagaact gcaaatcctc 60

catagtcttc taacatttca acattcgaaa tctcgaaaag aaattggctt gatatgattt 120

atttagggtg ttaattttat gtattataat aatgcacaaa ttgatatttt atgcatcaca 180

tttaatattt ttaaagtata taatatcaaa tcattttatg aaaataaaaa taccaaataa 240

tacataaatt gatagttcaa gtatttcatt aaaaattttc aaaatataaa tatcatattg 300

aaacatttta taaaagaata gataccaaat atgacatcat cccctgttga gagtaaccaa 360

acactgtttt catccagccc atgagaagta tttggcccaa aagcaaaagt ttcagtacaa 420

tgaattatga atcccaaaaa aaccccaagt ggtccaggtc caagccagtc tagggctgag 480

gaaagaaatg gaaaaattga aaagtaattc cagggtctga ttcaatttta ttaaatttag 540

tttgattttg gtttcggttc ataaatttaa aaataatttt aaaatgttat ataaaactgt 600

tttttaaaaa taaattaatc aataatctaa aacgataaaa atggcgattt gaattaagct 660

catattttga aaaaaaaata aaaattatct catccagaac tgattaaaac cgaaccgatg 720

aatcctagaa gccaagccaa gtgtgcagag taagaataga acatcaacat tttgctttaa 780

gcttttcgtt gcttgcactc taagaagcat aaaacgcaag caaaacttga cactagtgtg 840

agtgtgagtg cccatcattc atcaaccctg aaaatcgccc ttcccctaat cagttctaac 900

ctcactttct aacactttca ctgcagcact caaaaacatt cgccgaatct ttactataaa 960

ctcccagtgt tggtttctcc actccaaacc caaaccacga ccaccacatt ttgcttcgta 1020

tctttgata                                                         1029

<210>8

<211>1403

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>8

aacctctcga gctgccatat tgggtttttc actacccacc tcttcattaa atgtatcttc 60

aacctctcaa ctcctttcac caccagacga atcttcttta gcaaaatcaa aatgacctta 120

tgaaaattta gcacgtccac ctccagattc aaaggctgtg aatccccaac ttcggaaatt 180

gttcatctcc acattcaaga ataatgagtt cctcaatttg ttttaactga ttagccgata 240

ttaagcgagt tagactccat ggaaataaaa tcaccctaat aaatagcaac gcttttgaac 300

gtctctaggt tccaagcgtg ctaaggagcg ccagtaactt caatccaagt tgtgcgaaaa 360

cgtatgaaat ggaactgaga ccagcgttca acatcgatga aaatttgttt taacaatgag 420

aactgcaaat cctccatagt cttctaacat ttcaacattc gaaatctcga aaagaaattg 480

gcttgatatg atttatttag ggtgttaatt ttatgtatta taataatgca caaattgata 540

ttttatgcat cacatttaat atttttaaag tatataatat caaatcattt tatgaaaata 600

aaaataccaa ataatacata aattgatagt tcaagtattt cattaaaaat tttcaaaata 660

taaatatcat attgaaacat tttataaaag aatagatacc aaatatgaca tcatcccctg 720

ttgagagtaa ccaaacactg ttttcatcca gcccatgaga agtatttggc ccaaaagcaa 780

aagtttcagt acaatgaatt atgaatccca aaaaaacccc aagtggtcca ggtccaagcc 840

agtctagggc tgaggaaaga aatggaaaaa ttgaaaagta attccagggt ctgattcaat 900

tttattaaat ttagtttgat tttggtttcg gttcataaat ttaaaaataa ttttaaaatg 960

ttatataaaa ctgtttttta aaaataaatt aatcaataat ctaaaacgat aaaaatggcg 1020

atttgaatta agctcatatt ttgaaaaaaa aataaaaatt atctcatcca gaactgatta 1080

aaaccgaacc gatgaatcct agaagccaag ccaagtgtgc agagtaagaa tagaacatca 1140

acattttgct ttaagctttt cgttgcttgc actctaagaa gcataaaacg caagcaaaac 1200

ttgacactag tgtgagtgtg agtgcccatc attcatcaac cctgaaaatc gcccttcccc 1260

taatcagttc taacctcact ttctaacact ttcactgcag cactcaaaaa cattcgccga 1320

atctttacta taaactccca gtgttggttt ctccactcca aacccaaacc acgaccacca 1380

cattttgctt cgtatctttg ara                                         1403

<210>9

<211>1815

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>9

cttcaatctc tgccaatgat ctcaccttct tcttcacacc atcaacagta attatcgtcg 60

aatagggatt atgcactaca gtgttttgca ttgctactcc catggagtcc tccaccctaa 120

ctctacttgt aggactccta actaacgaat tgcaaagggt ttcgcgaccc gaattgttcc 180

ctttctgaca acccaagtcc acttaggttc aatcatattt aaattcgtat caacaatctc 240

ctcagccgac caattcacag ctttcaaatc tgctccgcaa cccaccattt gatcgtgacc 300

aaagtgtgaa cttgccttca acaaatcagg cccagagcct cgttctaatc atttctcgag 360

gcaatagcaa tagttgggtc taagttctct gctaattcct ttgatttcct agaacctctc 420

gagctgccat attgggtttt tcactaccca cctcttcatt aaatgtatct tcaacctctc 480

aactcctttc accaccagac gaatcttctt tagcaaaatc aaaatgacct tatgaaaatt 540

tagcacgtcc acctccagat tcaaaggctg tgaatcccca acttcggaaa ttgttcatct 600

ccacattcaa gaataatgag ttcctcaatt tgttttaact gattagccga tattaagcga 660

gttagactcc atggaaataa aatcacccta ataaatagca acgcttttga acgtctctag 720

gttccaagcg tgctaaggag cgccagtaac ttcaatccaa gttgtgcgaa aacgtatgaa 780

atggaactga gaccagcgtt caacatcgat gaaaatttgt tttaacaatg agaactgcaa 840

atcctccata gtcttctaac atttcaacat tcgaaatctc gaaaagaaat tggcttgata 900

tgatttattt agggtgttaa ttttatgtat tataataatg cacaaattga tattttatgc 960

atcacattta atatttttaa agtatataat atcaaatcat tttatgaaaa taaaaatacc 1020

aaataataca taaattgata gttcaagtat ttcattaaaa attttcaaaa tataaatatc 1080

atattgaaac attttataaa agaatagata ccaaatatga catcatcccc tgttgagagt 1140

aaccaaacac tgttttcatc cagcccatga gaagtatttg gcccaaaagc aaaagtttca 1200

gtacaatgaa ttatgaatcc caaaaaaacc ccaagtggtc caggtccaag ccagtctagg 1260

gctgaggaaa gaaatggaaa aattgaaaag taattccagg gtctgattca attttattaa 1320

atttagtttg attttggttt cggttcataa atttaaaaat aattttaaaa tgttatataa 1380

aactgttttt taaaaataaa ttaatcaata atctaaaacg ataaaaatgg cgatttgaat 1440

taagctcata ttttgaaaaa aaaataaaaa ttatctcatc cagaactgat taaaaccgaa 1500

ccgatgaatc ctagaagcca agccaagtgt gcagagtaag aatagaacat caacattttg 1560

ctttaagctt ttcgttgctt gcactctaag aagcataaaa cgcaagcaaa acttgacact 1620

agtgtgagtg tgagtgccca tcattcatca accctgaaaa tcgcccttcc cctaatcagt 1680

tctaacctca ctttctaaca ctttcactgc agcactcaaa aacattcgcc gaatctttac 1740

tataaactcc cagtgttggt ttctccactc caaacccaaa ccacgaccac cacattttgc 1800

ttcgtatctt tgata                                                  1815

<210>10

<211>2105

<212>DNA

<213>陆地棉(Gossypium hirsutum)

<400>10

atgaaacatc ttcgtactca tatctgaaac tccagcttct tgatcctcaa tgataattaa 60

atcctcacta tcactcgcat tcacctcgag cagcttcgca aattgaaatg tttccttagc 120

ttccttcact atacttgcga ttcccaatga cagagtcagt aagggaacca ttaacaatac 180

gatcatccgt tctttgcttc ttcaccagac accacacctt tagatatgat tggttttcta 240

cctctacgtt tttgcttctt tttttttttt aaccaaagtc atcacttttt cttcaatctc 300

tgccaatgat ctcaccttct tcttcacacc atcaacagta attatcgtcg aatagggatt 360

atgcactaca gtgttttgca ttgctactcc catggagtcc tccaccctaa ctctacttgt 420

aggactccta actaacgaat tgcaaagggt ttcgcgaccc gaattgttcc ctttctgaca 480

acccaagtcc acttaggttc aatcatattt aaattcgtat caacaatctc ctcagccgac 540

caattcacag ctttcaaatc tgctccgcaa cccaccattt gatcgtgacc aaagtgtgaa 600

cttgccttca acaaatcagg cccagagcct cgttctaatc atttctcgag gcaatagcaa 660

tagttgggtc taagttctct gctaattcct ttgatttcct agaacctctc gagctgccat 720

attgggtttt tcactaccca cctcttcatt aaatgtatct tcaacctctc aactcctttc 780

accaccagac gaatcttctt tagcaaaatc aaaatgacct tatgaaaatt tagcacgtcc 840

acctccagat tcaaaggctg tgaatcccca acttcggaaa ttgttcatct ccacattcaa 900

gaataatgag ttcctcaatt tgttttaact gattagccga tattaagcga gttagactcc 960

atggaaataa aatcacccta ataaatagca acgcttttga acgtctctag gttccaagcg 1020

tgctaaggag cgccagtaac ttcaatccaa gttgtgcgaa aacgtatgaa atggaactga 1080

gaccagcgtt caacatcgat gaaaatttgt tttaacaatg agaactgcaa atcctccata 1140

gtcttctaac atttcaacat tcgaaatctc gaaaagaaat tggcttgata tgatttattt 1200

agggtgttaa ttttatgtat tataataatg cacaaattga tattttatgc atcacattta 1260

atatttttaa agtatataat atcaaatcat tttatgaaaa taaaaatacc aaataataca 1320

taaattgata gttcaagtat ttcattaaaa attttcaaaa tataaatatc atattgaaac 1380

attttataaa agaatagata ccaaatatga catcatcccc tgttgagagt aaccaaacac 1440

tgttttcatc cagcccatga gaagtatttg gcccaaaagc aaaagtttca gtacaatgaa 1500

ttatgaatcc caaaaaaacc ccaagtggtc caggtccaag ccagtctagg gctgaggaaa 1560

gaaatggaaa aattgaaaag taattccagg gtctgattca attttattaa atttagtttg 1620

attttggttt cggttcataa atttaaaaat aattttaaaa tgttatataa aactgttttt 1680

taaaaataaa ttaatcaata atctaaaacg ataaaaatgg cgatttgaat taagctcata 1740

ttttgaaaaa aaaataaaaa ttatctcatc cagaactgat taaaaccgaa ccgatgaatc 1800

ctagaagcca agccaagtgt gcagagtaag aatagaacat caacattttg ctttaagctt 1860

ttcgttgctt gcactctaag aagcataaaa cgcaagcaaa acttgacact agtgtgagtg 1920

tgagtgccca tcattcatca accctgaaaa tcgcccttcc cctaatcagt tctaacctca 1980

ctttctaaca ctttcactgc agcactcaaa aacattcgcc gaatctttac tataaactcc 2040

cagtgttggt ttctccactc caaacccaaa ccacgaccac cacattttgc ttcgtatctt 2100

tgata                                                             2105

<210>11

<211>10

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:来自Operon Technologies(Almeda,CA)的10聚体

试剂盒的随机10聚体(W17)

<400>11

gtcctgggtt                                               10

<210>12

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>12

caatggctat atgtgactca ttcaatcaca c                       31

<210>13

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>13

cgctctagaa ctagtggatc                                    20

<210>14

<211>59

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>相似的

<222>(18)

<223>18位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(26)

<223>26位上的X是与E微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(29)

<223>29位上的X是与D微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(37)

<223>37位上的X是与N微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(42)

<223>42位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(54)

<223>54位上的X是与L微弱或强烈相似的氨基酸

<400>14

Thr Tyr Pro Cys Thr Pro Gly Val Ser Tyr His Gly Arg Gly Ala Leu

  1               5                  10                  15

Pro Xaa Tyr Trp Asn Tyr Asn Tyr Gly Xaa Thr Gly Xaa Ala Leu Lys

             20                  25                  30

Val Asp Leu Leu Xaa His Pro Glu Tyr Xaa Glu Asn Asn Ala Thr Leu

         35                  40                  45

Ala Phe Gln Ala Ala Xaa Trp Arg Trp Met Thr

     50                  55

<210>15

<211>59

<212>PRT

<213>小叶南芥(Arabis microphylla)

<220>

<221>相似的

<222>(2)

<223>2位上的X是与Y微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(5)

<223>5位上的X是与T微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(11)

<223>11位上的X是与H微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(15)

<223>15位上的X是与A微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(16)

<223>16位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(18)

<223>18位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(31)

<223>31位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(38)

<223>38位上的X是与H微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(40)

<223>40位上的X是与E微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(42)

<223>42位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(45)

<223>45位上的X是与N微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(47)

<223>47位上的X是与T微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(48)

<223>48位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(51)

<223>51位上的X是与Q微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(54)

<223>54位上的X是与L微弱或强烈相似的氨基酸

<400>15

Thr Xaa Pro Cys Xaa Pro Gly Lys Arg Tyr Xaa Gly Arg Gly Xaa Xaa

  1               5                  10                  15

Gln Xaa Ser Trp Asn Tyr Asn Tyr Gly Leu Cys Gly Arg Ala Xaa Gly

             20                  25                  30

Val Asp Leu Leu Asn Xaa Pro Xaa Leu Xaa Ala Asn Xaa Ala Xaa Xaa

         35                  40                  45

Ala Phe Xaa Ala Ala Xaa Trp Phe Trp Met Thr

     50                  55

<210>16

<211>59

<212>PRT

<213>陆地棉(Gossypium hirsutum)

<220>

<221>相似的

<222>(1)

<223>1位上的X是与T微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(5)

<223>5位上的X是与T微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(9)

<223>9位上的X是与S微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(11)

<223>1位上的X是与H微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(15)

<223>15位上的X是与A微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(16)

<223>16位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(18)

<223>18位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(26)

<223>26位上的X是与E微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(31)

<223>31位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(32)

<223>32位上的X是与K微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(38)

<223>38位上的X是与H微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(40)

<223>40位上的X是与E微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(42)

<223>42位上的X是与I微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(43)

<223>43位上的X是与E微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(44)..(45)

<223>44和45位上的X是与N微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(46)

<223>46位上的X是与A微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(48)

<223>48位上的X是与L微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(49)

<223>49位上的X是与A微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(51)

<223>51位上的X是与Q微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(52)

<223>52位上的X是与A微弱或强烈相似的氨基酸

<220>

<221>相似的

<222>(54)

<223>54位上的X是与L微弱或强烈相似的氨基酸

<220>

<400>16

Xaa Tyr Pro Cys Xaa Pro Gly Lys Xaa Tyr Xaa Gly Arg Gly Xaa Xaa

  1               5                  10                  15

Gln Xaa Ser Trp Asn Tyr Asn Tyr Gly Xaa Cys Gly Arg Ala Xaa Xaa

             20                  25                  30

Val Asp Leu Leu Asn Xaa Pro Xaa Leu Xaa Xaa Xaa Xaa Xaa Thr Xaa

         35                  40                  45

Xaa Phe Xaa Xaa Ala Xaa Trp Phe Trp Met Thr

     50                  55

<210>17

<211>20

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>17

Gly Arg Gly Pro Ile Gln Leu Ser Trp Asn Tyr Asn Tyr Gly Pro Ala

  1               5                  10                  15

Gly Arg Ala Ile

             20

<210>18

<211>39

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:推定的未改变氨基酸的签名序列

<400>18

Lys Arg Glu Val Ala Ala Phe Leu Ala Gln Thr Ser His Glu Thr Thr

  1               5                  10                  15

Gly Gly Trp Ala Thr Ala Pro Asp Gly Ala Phe Ala Trp Gly Tyr Cys

             20                  25                  30

Phe Lys Gln Glu Arg Gly Ala

         35

<210>19

<211>39

<212>PRT

<213>小叶南芥(Arabis microphylla)

<400>19

Lys Lys Glu Ile Ala Ala Phe Phe Gly Gln Thr Ser His Glu Thr Thr

  1               5                  10                  15

Gly Gly Trp Ala Ser Ala Pro Asp Gly Pro Phe Ser Trp Gly Tyr Cys

             20                  25                  30

Phe Lys Gln Glu Gln Asn Pro

         35

<210>20

<211>39

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>20

Met Lys Glu Val Ala Ala Phe Leu Gly His Val Gly Ser Lys Thr Ser

  1               5                  10                  15

Cys Gly Tyr Gly Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys

             20                  25                  30

Tyr Asn Lys Glu Met Ser Pro

         35

<210>21

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>21

gctgagtcga cgatatcgaa ttcctgcagc c                       31

<210>22

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>22

gctgagtcga ccttcaatct ctgccaatga tc                      32

<210>23

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>23

gctgagtcga caacctctcg agctgccata t                       31

<210>24

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>24

gctgagtcga cctgagacca gcgttcaaca t                       31

<210>25

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:引物

<400>25

gctagtctag atatcaaaga tacgaagcaa aatg                    34

<210>26

<211>39

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>26

Gln Lys Glu Met Ala Ala Phe Leu Gly His Val Ala Ser Lys Thr Ser

  1               5                  10                  15

Cys Gly Tyr Gly Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys

             20                  25                  30

Tyr Asn Arg Glu Met Ser Pro

         35

<210>27

<211>35

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>27

Lys Glu Ala Ala Phe Leu Gly His Val Ser Lys Thr Ser Cys Gly Tyr

  1               5                  10                  15

Gly Val Ala Thr Gly Gly Pro Leu Ala Trp Gly Leu Cys Tyr Asn Glu

             20                  25                  30

Met Ser Pro

         35

<210>28

<211>20

<212>PRT

<213>拟南芥(Arabidopsis thaliana)

<400>28

Gly Arg Gly Ala Leu Pro Ile Tyr Trp Asn Phe Asn Tyr Gly Ala Ala

  1               5                  10                  15

Gly Glu Ala Leu

             20

<210>29

<211>15

<212>PRT

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>29

Gly Arg Gly Ala Leu Pro Tyr Trp Asn Asn Tyr Gly Gly Ala Leu

  1               5                  10                  15

<210>30

<211>10

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<220>

<221>不确定的

<222>(4)..(7)

<223>4-7位上的N是A或G或C或T(确切的序列不确定)

<400>30

caannnnatc                                               10

<210>31

<211>10

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>31

ttwtwttwtt                                               10

<210>32

<211>11

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:共有序列

<400>32

wtttatrttt w                                             11

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号