公开/公告号CN1665934A
专利类型发明专利
公开/公告日2005-09-07
原文格式PDF
申请/专利权人 国际植物研究所;
申请/专利号CN03806546.0
申请日2003-03-18
分类号C12N15/82;C12N9/10;A61K38/02;
代理机构北京纪凯知识产权代理有限公司;
代理人程伟
地址 荷兰瓦赫恩
入库时间 2023-12-17 16:25:17
法律状态公告日
法律状态信息
法律状态
2019-03-08
未缴年费专利权终止 IPC(主分类):C12N15/82 授权公告日:20100526 终止日期:20180318 申请日:20030318
专利权的终止
2010-07-07
专利申请权的转移 IPC(主分类):C12N15/82 变更前: 变更后: 登记生效日:20100601 申请日:20030318
专利申请权、专利权的转移
2010-05-26
授权
授权
2005-11-02
实质审查的生效
实质审查的生效
2005-09-07
公开
公开
技术领域
发明涉及哺乳动物N-乙酰葡萄糖胺基转移酶III(GnTIII)在植物中的表达,及其在产生具有等分(bisected)的寡糖和末端GlcNAc残基数量增加的糖蛋白中的应用。发明进一步涉及含有GnTIII的催化位点、高尔基体和/或内质网(ER)蛋白的跨膜结构区、或含有ER固位信号的修饰的GNTIII的杂合蛋白,及其在产生糖蛋白中的用途,该糖蛋白具有的寡糖缺少免疫原性木糖和岩藻糖残基。
背景技术
N-乙酰葡萄糖胺基转移酶(GIcNAc-转移酶)是在典型的N连接聚糖的三甘露糖核心结构中的甘露糖之一上添加了N乙酰葡萄糖胺(GlcNAc)残基的“分支”酶。已知至少有6个很少或没有序列同源性的GlcNAc-转移酶。除了不同的蛋白结构以外,这些GlcNAc转移酶也具有不同的酶特性和底物特异性。所有都是典型的II型跨膜蛋白,具有胞浆结构区、跨膜锚着点和具有催化结构区的细胞外主干区。
值得注意的GlcNAc-转移酶是GlcNAc-转移酶III(GnTIII)。GnTIII也已知是UDP-N乙酰葡萄糖胺:β-D-甘露糖甙β(1,4)-N-乙酰葡萄糖胺基-转移酶III(EC2.4.1.144),在细胞糖蛋白的复合型N-连接聚糖中插入了等分的GlcNAc残基(综述见Taniguchi等人,“在用糖基转移酶基因转染的细胞中鉴定和定性糖蛋白功能的一种glycomic方法”Proteomics 1:239247,2001)。GnTIII通过β(1,4)连接向N-连接的聚糖的三甘露糖核心结构中的β-连接的甘露糖上添加了GlcNAc。GnTIII首先在母鸡的输卵管中被鉴定(Narasimhan S.,“控制糖蛋白的合成。UDP-GlcNAc:糖肽β4-N乙酰葡萄糖胺基转移酶III,母鸡输卵管中的一种酶,在β14连接中向N-糖基寡糖的三甘露糖核心的β-连接甘露糖中添加了GlcNAc”The.Journal of Biological Chemistry 257:10235-10242,1982),但在也已报道在多种类型的大鼠肝细胞瘤、人血清、肝细胞瘤和肝硬变患者的肝和肝细胞瘤组织中有高水平的活性(Ishibashi等人,“人血清和肝细胞瘤组织中的N-乙酰葡萄糖胺基转移酶III:在肝硬变和肝细胞瘤患者中增加的活性”Clinical ChimicaActa 185:325,1989;Narishimhan等人,“在由乳清酸所促发的大鼠肝癌形成过程中肝瘤体中N-乙酰葡萄糖胺基转移酶III的表达”Journal of BiologicalChemistiy 263:1273-1281,1988;Nishikawa等人,“在大鼠正常和肝细胞瘤组织中测定N-乙酰葡萄糖胺基转移酶III,IV和V”Biochimica et Biophysica Acta1035:313-318,1990;Pascale等人,“在由不同的大鼠肝癌生成模型产生的肝瘤体中N-乙酰葡萄糖胺基转移酶III的表达”Carcinogenesis 10:961964,1989)。糖蛋白上等分的寡糖与抗体依赖的细胞毒性有关(ADCC)。ADCC是对抗体靶向细胞的细胞溶解性攻击,并由淋巴细胞受体与抗体恒定区(Fc)的结合触发。在缺少GnTIII活性的重组中国仓鼠卵巢(CHO)生产细胞系中GnTIII的可控表达产生的抗体具有等分的寡糖,并具有优化的ADCC活性(Davies等人,“在重组抗CD20 CHO生产细胞系中表达GnTIII:具有改变的糖型的抗体的表达通过与FcγRIII的更高亲和性引起ADCC的增加”Biotechnology and Bioengineering 74:288-294,2001;Umana等人,“具有优化的抗体依赖的细胞毒活性的抗神经母细胞瘤IgG1的改造糖型”Nature Biotechnology 17:176-180,1999)。ADCC活性与存在于重组抗体上的Fc区相关的截断复合体寡糖水平有良好的相关性好(Umana等人,“具有优化的抗体依赖的细胞毒活性的抗神经母细胞瘤IgG1的改造糖型”NatureBiotechnology 17:176-180,1999)。来自GnTIII的截断GlcNAc残基可影响糖链的构象,其方式是不是β(1,4)-半乳糖基转移酶的其他的糖基转移酶如GlcNAc-转移酶II和α1,6-墨角藻糖基转移酶不再发挥作用(Tanigichi等人,2001)。在CHO细胞中GnTIII的过度表达是致命的。
与典型的哺乳动物生产细胞系如CHO细胞相比,转基因植物通常可被认为是一种治疗性蛋白的安全的生产系统。但是植物糖蛋白,在寡糖结构上与哺乳动物在几个方面都是有区别的。它们缺少末端的半乳糖和唾液酸,具有一个另外的核心木糖和不同的连接核心岩藻糖(α-1,3)而不是(α-1,6)。象CHO和其他的药学生产细胞系,它们也完全缺少等分的寡糖。植物具有产生共有核心结构,GN2M3GN2的能力,但已经发现了优势M3 GN2变异体,显示通过氨基己糖苷酶去掉了末端的GN。
N-连接聚糖的生物发生从脂质连接的寡糖部分(Glc3Man9GIcNAc2-)开始,后者被全部转移至内质网(ER)中的初级多肽链上。通过ER中和顺式-高尔基室中的外切糖苷酶经过一系列的修整反应,所谓的“高甘露糖”(Man9GlcNAc2至Man5GlcNAc2)聚糖形成了。随后,复合体型聚糖的形成启动了通过GnT1首个GlcNAc向Man5GlCNAC2上的转移,进一步通过甘露糖苷酶II(Mann)的修整形成GlcNAcMan3 GlcNAc2。当糖蛋白通过分泌通路被加工时,复合体聚糖的生物合成在几种其他的糖基转移酶的作用下继续进行,通过GnTII在高尔基体中转移第二个GlcNAc残基以及其他的单糖残基至GIcNAcMan3GlcNAc2。就复合体聚糖的形成来说,植物和哺乳动物是不同的。在植物,复合体聚糖的特征是存在与Man-3连接的β(1,2)-木糖残基和/或与GlcNAcl连接的α(1.3)-岩藻糖残基,而不是与GlcNAc-1连接的α(1,6)-岩藻糖残基(Lerouge.P.等人,“植物中N-糖蛋白的生物合成:最近的进展和未来的趋势”Plant Mol Biol 38:31-48,1998)。已经分离了编码相应木糖基(XylT)和岩藻糖基(FucT)转移酶的基因(Strasser R,“来自Arabidopsis thaliana的β1,2-木糖基转移酶cDNA的分子克隆和功能性表达”FEES Lett.472:105-8,2000;Leiter,H.等人,“GDP-L-Fuc的纯化,cDNA克隆和表达:来自绿豆的Asn连接GlcNAcα1,3-墨角藻糖基转移酶”J Biol Chem.274:21830,1999)。木糖和岩藻糖抗原决定簇已知是具有高度免疫抗原性的,可能是变应原,在植物用来生产治疗性糖蛋白时可能会引起问题。而且,许多过敏的患者的血清含有针对这些抗原决定簇的IgE,用含有重组蛋白的木糖和岩藻糖治疗这些患者尤其可使他们处于危险之中。另外,这种被血清中IgE所作用的糖类可能会在使用植物提取物进行体外检测的过程中引起假阳性,因为有证据表明这些糖类特异性IgE与变态反应并没有关系。植物不具有β(1,4)半乳糖基转移酶或α(2,6)唾液酸转移酶,因此植物聚糖缺少在哺乳动物聚糖中经常发现的β(1,4)半乳糖和末端α(2,6)NeuAc残基(Vitale和Chrispeels,“在植物凝集素的生物合成中的短暂存在的N-乙酰葡萄糖胺:在高尔基体中附着,在蛋白体中去除”J Cell5/0/99:133-140,1984;Lerouge,P.等人,“植物中N-糖蛋白的生物合成:最近的进展和未来的趋势”Plant Mol Biol 38:31-48,1998)。
最终的聚糖结构不仅仅由参与其生物合成中的酶的存在而决定,而且也决定于多种酶促反应的特定序列的广泛延伸。后者是通过不连续的螯合和这些酶经过ER和高尔基体的相对位置来控制的,是由转移酶的决定簇之间的相互作用和转移酶所要前往的亚高尔基体的特殊特性所介导的。许多使用杂合分子的研究已经发现了几种糖基转移酶的跨膜结构区在其亚高尔基分选过程中具有重要作用(Grabenhorst E.等人,J.Biol.Chem.274:36107-36116,1999;Colley,K.,Glycobiology.7:1-13,1997,Munro,S.,Trends Cell Biol.8:11-15,1998;Gleeson P.A.,Histochem.Cell Biol.109:517-532,1998)。
与用于药物工业中的哺乳动物生产细胞系相似,植物中产生的糖蛋白缺少GnTIII活性。植物不仅缺少GnTIII活性,而且完全缺少GnTIII样序列。另外,植物也缺少GnTIV,GnTV和GnTVI序列,而且还有唾液酸残基。(普遍使用的细胞表达系统包括植物的主要糖基化标志的概况见,Jenkins等人,“获得糖基化:对生物技术工业的意义”Nature Biotechnology 14:975-979,1996)。然而,植物是非常有力的生产系统。植物公认是安全的、不含对人有感染性的微粒。植物生产是容易上规模的,且可以控制N-连接的糖基化作用(Bakker等人,“转基因植物生产的抗体的半乳糖延伸聚糖”Proc.Nat.Acad.Sci.USA98:2899-2904,2001).
已经报道了在导入人β(1,4)-半乳糖基转移酶基因后可产生半乳糖基化的重组单克隆抗体(Mabs)的转基因烟草(hGalT;Bakker等人,“转基因植物产生的抗体的半乳糖延伸聚糖”Proc.Nat.Acad Sci.USA 98:2899-2904,2001;WO01/31044和WO01/31045)。
通过改变糖基化模式可改进治疗性糖蛋白(Davies等人,“在重组的抗CD20CHO生产细胞系中表达GnTIII:用改变的糖型表达的抗体通过与FcγRIII更高的亲和力引起ADCC的增加”Biotechnology and Bioengineering 74:288-294,2001;Umana等人,“具有优化的抗体依赖的细胞毒活性的抗成神经细胞瘤IgG1的基因工程糖型”Nature Biotechnology 17:176-180,1999;Fukuta等人,“人干扰素-γ糖链结构的重构Remodeling”Glycobiology 10:421-430,2000;Misaizu等人,“在肾脏处理重组人红细胞生成素中N-连接糖链触角结构的作用”Blood86:4097-4104,1995;Sburlati等人,“通过在中国仓鼠卵巢细胞中过度表达β-1,4-N-乙酰葡萄糖胺基转移酶III合成重组IFN-β的截断糖型”Biotechnology Prog.14:189-192,1998)。EPO更高级的寡糖触角结构,例如,由于减少了肾脏的过滤,在体内可导致活性增加(Misaizu等人,“在肾脏处理重组人红细胞生成素中N-连接糖链触角结构的作用”Blood 86:4097-4104,1995)。这种高级糖型的生物合成可用两种方法使用正常生产细胞系的“标准”糖基化结构来完成。第一步是在纯化过程中浓缩特异的糖型,第二步是在多肽链中导入突变。后者可在糖蛋白中变换糖基化位点,引起不同的糖基化方式,形成可达性的差异。一条补充的路线是通过生产细胞系本身的遗传工程。通过在生产细胞系中表达糖基转移酶和糖苷酶基因可获得新的糖基化方式。这些基因编码的酶向细胞糖蛋白的聚糖上添加特异的糖类,或从其上去除。几种糖基转移酶基因已经被导入CHO细胞中以控制糖型的生物合成。其中之一是GnTIII。糖基转移酶GnTIII参与N-连接聚糖的分支,并引起GlcNAc残基的截断。CHO细胞和其他的生产细胞系典型地缺少GnTIII活性(Stanley,P.和C.A.Campbell,“中国仓鼠卵巢细胞中蓖麻蛋白抗性的显性基因突变可诱导UDP-GIcNAc:糖肽β-4-N-乙酰葡萄糖胺基转移酶III活性”Journal of Biological Chemistry 261:13370-13378,1984)。CHO中GnTIII的表达可如所期望的那样形成等分的复合体寡糖,但过度表达导致生长抑制,对细胞是有毒性的。同样,另一个可导入三角糖链的糖基转移酶GnTV的过度表达也可导致生长抑制,表明这可能是糖基转移酶过度表达的一种普遍特征(Umana等人,“具有优化的抗体依赖细胞毒活性的抗成神经细胞瘤IgG1的改造糖型”Nature Biotechnology 17:176-180,1999)。
因此,需要提供一种手段来在植物中产生糖蛋白,所述的糖蛋白具有人类相容性的非免疫原性等分的寡糖。
发明的概述
发明涉及在植物中表达哺乳动物N-乙酰葡萄糖胺基转移酶III(GnTIII),及其在产生具有等分寡糖和末端GlcNAc残基数量增加的糖蛋白中的应用。发明进一步涉及含有GnTIII的催化位点、高尔基体和/或内质网(ER)蛋白的跨膜结构区、或含有ER固位信号的修饰的GNTIII的杂合蛋白,及其在产生糖蛋白中的应用,该糖蛋白具有的寡糖缺少免疫原性木糖和岩藻糖残基。
在一个实施方案中,本发明期望获得一种植物宿主系统,含有或表达一种哺乳动物UDP-N乙酰葡萄糖胺:(β-D-甘露糖苷β(1,4)-N乙酰葡萄糖胺基转移酶(GnTIII)酶(核苷酸序列:SEQ ID NO.:1,Genbank I.D.号AL022312(Dunham,I.等人,Nature 402:489-495,1999);蛋白序列:SEQ ID NO.:2,Genbank I.D.号Q09327),其中所述的GnTIII在所述植物宿主系统中存在的复合体型N-连接聚糖中插入了等分的N乙酰葡萄糖胺(GlcNAc)残基。
在本发明的一个特殊的实施例中,植物宿主系统进一步含有一种含有等分寡糖的异源糖蛋白或其功能片段,特别是半乳糖残基。GnTIII向所述的异源糖蛋白中插入了等分的N-GlcNAc残基。
在一个实施方案中,本发明期望获得一种表达含有等分的寡糖的异源糖蛋白的植物宿主系统的方法。在一个实施方案中,该法包括将表达异源糖蛋白的一种植物于表达所述GnTIII的植物杂交繁育,从所述的杂交繁育中获得子代,选择期望的表达所述异源糖蛋白和表达哺乳动物GnTIII的子代植物。可选择的是,所述的植物宿主系统可通过将一种编码所述哺乳动物GnTIII的核酸和编码所述异源糖蛋白的核酸导入植物或其部分中,并分离表达所述异源糖蛋白和表达通常不存在于植物中的哺乳动物GnTIII的植物或其部分而获得。而且,本发明涉及从所述植物中获得所述异源糖蛋白的方法,包括使用上述的任何一种步骤获得植物宿主系统,并进一步分离所述的异源糖蛋白。
在另一个实施方案中,预期的是本发明的植物宿主系统进一步含有一种功能性哺乳动物酶,可提供通常不存在于植物中的N-聚糖生物合成,因此,例如提供了如WO01/21045(在此引入以供参考)中所述通过添加半乳糖延伸N-连接聚糖的能力。在另一个实施方案中,本发明进一步预期一种植物宿主系统,其中所述的植物宿主系统包括将一种植物与含有所述哺乳动物GnTIII的植物杂交繁育,所述的前者植物含有一种功能性蛋白如转运子蛋白或酶(如,一种哺乳动物蛋白)或其功能性片段,其中所述的蛋白可提供N-聚糖的生物合成。在另一个实施方案中,本发明预期从所述杂交繁育中获得子代,并选择表达所述功能蛋白,例如一种转运子蛋白或酶或功能片段的期望子代植物。还是在本发明的另一个实施方案中,预期表达的蛋白可提供N-聚糖的生物合成和哺乳动物GnTIII。仍然还是在另一个实施方案中,本发明预期一种植物宿主系统,其中所述的编码GnTIII的核酸和编码功能蛋白(例如,一种转运子蛋白或酶[例如,哺乳动物的酶]或其功能片段)的核酸可提供N-聚糖的生物合成,并分离表达可提供N-聚糖生物合成和所述哺乳动物GnTIII的功能蛋白或其功能片段的所述植物或其部分。尽管本发明不限制任何特殊的理论或机制,但相信这样的结合增加异源糖蛋白的半乳糖基化,另外,在一个实施方案中,预期GnTIII和其他可提供N-糖基化作用的蛋白如GalT也可经过一个转化载体被同时导入。
在一个实施方案中,本发明预期一种植物宿主系统,包括表达所述的异源糖蛋白(其中,所述的异源糖蛋白的糖基化作用增加)以及获得所述植物宿主系统或所述异源糖蛋白的方法。在另一个实施方案中,植物宿主系统的获得可通过将一种植物与含有异源糖蛋白的一种植物杂交繁育,其中前面所述的植物含有哺乳动物GnTIII和一种功能蛋白(例如,可提供正常未在植物中发现的N-聚糖生物合成的一种转运子或一种酶[如,哺乳动物的酶]或其功能性片段),然后选择所述的子代植物。仍然在另一个实施方案中,预期所述的异源糖蛋白可通过导入编码以下的核酸序列而获得,1)所述的GnTIII,2)可提供正常未在植物中发现的N-聚糖生物合成的所述功能蛋白或酶和3)将所述的异源糖蛋白导入所述的植物中或其部分中,并分离表达所述核酸序列的所述植物或其部分。在本发明的另一个实施方案中,预期异源糖蛋白可从植物宿主系统中被分离和纯化。
在本发明的一个实施方案中,预期一种杂合蛋白,其中所述的杂合蛋白包括1)含有哺乳动物GnTIII的催化部分的一种分离的杂合蛋白和2)例如来自真核细胞内质网或高尔基体的蛋白的跨膜部分。在另一个实施方案中,本发明也预期一种修饰的哺乳动物GnTIII,其含有一种固位信号如KDEL以在ER中保留所述的GnTIII。仍然在另一个实施方案中,本发明预期编码以下的核酸序列1)所述的杂合蛋白和所述的修饰的哺乳动物GnTIII,2)含有所述核酸序列的载体和3)含有所述序列的植物宿主系统。在一个实施方案中,这些杂合蛋白和修饰的GnTIII的作用是在内质网(ER)和/或高尔基体中重新定位GnTIII活性。在另一个实施方案中,本发明预期了获得这些杂合蛋白和修饰的GnTIII蛋白的方法,例如通过将编码所述杂合蛋白或修饰的GnTIII蛋白的序列导入一种植物或其部分。尽管本发明并不限制任何特殊的理论或机制,但相信这种重新定位的结果是,等分的GlcNAc更早地被导入这些反应的N-聚糖生物合成序列中,防止随后的酶反应,结果,在植物宿主系统(例如,本发明的植物宿主系统)中表达的异源蛋白将缺少木糖或岩藻糖,并含有增加数量的末端GlcNAc。因此,本发明的一个实施方案预期一种提供植物宿主系统的方法,所述的宿主系统表达一种异源糖蛋白(所述的植物宿主系统具有延伸含有半乳糖的N-连接聚糖的能力),包括将一种含有所述1)杂合蛋白或所述的修饰GnTIII的植物与含有所述异源蛋白的植物杂交繁育和2)选择所述的期望的子代。在另一个实施方案中,本发明预期将编码以下的核酸序列导入一种植物或其部分中,该序列编码1)所述的修饰GnTIII或所述的杂合蛋白和所述的异源糖蛋白和2)分离表达具有延伸能力的异源糖蛋白和含有半乳糖的N-连接聚糖的所述植物或其部分。仍然在另一个实施方案中,本发明预期一种方法,可获得所述的期望异源糖蛋白,所述的方法包括从所述植物或其部分中分离所述的糖蛋白。
在一个实施方案中,本发明预期植物来源的糖蛋白或其功能片段可用来生产药物组合物(例如,一种抗体,一种激素,一种疫苗抗原,一种酶等等)。在另一个实施方案中,本发明预期一种药物组合物,它也含有现在被提供的糖蛋白或其功能片段。
在一个实施方案中,本发明预期GnTIII的变异体或突变体。术语“变异体”和“突变体”当用于多肽时,是指互相一个或多个氨基酸有差异的氨基酸序列,通常是相关的多肽。在另一个实施方案中,本发明预期具有“保守”变化的变异体,其中取代的氨基酸具有相似的结构或化学特性。保守氨基酸取代的一种类型是指具有相似侧链的残基的互换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸,酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸,精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和蛋氨酸。优选的保守氨基酸取代基是:缬氨酸(V)-亮氨酸(L)-异亮氨酸(I),苯丙氨酸(F)-酪氨酸(Y),赖氨酸(K)-精氨酸(R),丙氨酸(A)-缬氨酸(V),和天冬酰胺(N)-谷氨酰胺(Q)。
仍然在另一个实施方案中,本发明预期具有“非保守”改变的变异体(如,用色氨酸替换甘氨酸)。相似的较小变异也包括氨基酸去除或插入(即,添加),或两者都有。确定许多氨基酸残基被取代和如何取代,插入或去除而不丢失生物学活性的指导可使用本领域中熟知的计算机程序,例如DNAStar软件。变异体可在功能试验中被检测。对于保守和非保守变异体,优选的变异体的变化少于10%,优选少于5%,仍然更为优选的是少于2%(不论取代,去除等等)。
在一个实施方案中,本发明预期一种植物宿主(细胞)系统,包含一种哺乳动物UDP-N-乙酰葡萄糖胺:β-D甘露糖苷β(1,4)-N-乙酰葡萄糖胺基转移酶(GnTIII)酶(或其部分或其变异体,其中所述的GnTIII将等分的N-乙酰葡萄糖胺(GlcNAc)残基插入进存在于所述植物宿主系统中的糖蛋白的复合体型N-连接聚糖中)。在另一个实施方案中,本发明预期一种植物宿主,其中所述的GnTIII是人GnTIII。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是植物的一部分。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是植物的一部分,该植物选自细胞,叶,胚,胼胝,茎,果皮,原生质体,根,块茎,核,胚乳和胚芽。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是整个植物。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包含一种异源糖蛋白(或其功能片段)。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白包括抗体,或其片段(如,Fc,Fv,Fab,Fab2)。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白或其功能片段包括等分的寡糖。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白(或其功能片段)包括具有半乳糖残基的等分的聚糖。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的植物是烟草。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包括选自可提供N-聚糖生物合成的转运子或(哺乳动物)酶(或其功能片段)的一种功能蛋白。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的酶是(人)β-1,4半乳糖基转移酶。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包括一种具有更多数量的半乳糖残基的异源糖蛋白。仍然在另一个实施方案中,本发明预期的植物宿主系统包括编码哺乳动物GnTIII蛋白的核酸序列。仍然在另一个实施方案中,本发明预期的植物宿主系统包括一种载体,它含有编码哺乳动物GnTIII蛋白的核酸序列。仍然在另一个实施方案中,本发明预期的植物宿主,进一步包括编码一种功能蛋白的核酸序列,所述功能蛋白选自可提供N-葡萄糖的生物合成的转运子或(哺乳动物)酶或其功能片段。
在一个实施方案中,本发明预期一种方法(可获得表达具有等分的寡糖的异源糖蛋白的植物宿主系统),包括a)将表达异源糖蛋白的一种植物与a杂交繁育,b)从所述的杂交繁育中获得子代,和c)选择期望的子代植物(表达所述的异源糖蛋白和表达通常不存在于植物中的哺乳动物GnTIII)。在另一个实施方案中,本发明预期这种方法,其中所述的期望子代植物可表达所述的具有等分的寡糖的异源糖蛋白。仍然在另一个实施方案中,本发明预期这种方法,其中所述的植物宿主系统是转基因植物。
在一个实施方案中,本发明预期一种方法,可获得具有等分的寡糖的异源糖蛋白,包括a)将编码通常不存在于植物中的GnTIII的核酸序列导入植物宿主系统中和编码异源糖蛋白的核酸序列中,和b)分离所述的异源糖蛋白。在另一个实施方案中,本发明预期这种方法,其中所述的核酸序列被导入植物细胞中,所述的植物细胞被再生进植物中。仍然在另一个实施方案中,本发明预期相同的方法,其中所述的核酸序列通过用载体转化所述植物宿主系统被导入植物宿主系统中,所述载体在植物中含有通常在植物中不存在的编码GnTIII的酸序列和编码异源糖蛋白的核酸序列。仍然在另一个实施方案中,本发明预期该方法,其中所述的核酸序列通过用载体转化所述植物宿主系统被导入植物宿主系统中,所述载体在植物中含有通常在植物中不存在的编码GnTIII的核酸序列和编码异源糖蛋白的核酸序列。仍然在另一个实施方案中,本发明预期该方法,其中所述的核酸序列通过用在植物宿主系统中含有通常在植物中不存在的编码GnTIII的核酸序列的载体和含有编码异源糖蛋白的核酸序列的载体转化所述植物被导入植物宿主系统中。仍然在另一个实施方案中,本发明预期一种方法,以获得具有等分的寡糖的异源糖蛋白,包括培植再生的植物。24.根据权利要求20的方法,
在一个实施方案中,本发明预期一种方法,以获得期望的糖蛋白(或其功能片段),包括a)培植植物宿主系统(直至所述的植物达到可收获的程度)和b)收获所述的植物(并分馏获得分馏的植物原料,和c)从所述的分馏的植物原料中至少部分分离所述的糖蛋白)。在另一个实施方案中,本发明预期得到通过预期的方法可获得的植物。
在一个实施方案中,本发明预期一种方法,以获得含有功能蛋白的植物宿主系统,该功能蛋白选自可提供N-聚糖生物合成的转运子或一种(哺乳动物)酶或其功能片段,以及一种哺乳动物GnTIII,包括将含有一种功能蛋白的植物与根据权利要求5中的植物杂交繁育,其中所述的功能蛋白如可提供N-聚糖生物合成的转运子或(哺乳动物)酶或其功能片段,从所述的杂交繁育中回收子代,并选择表达所述功能蛋白的期望的子代植物,从而提供N-聚糖生物合成的转运子或(哺乳动物)酶或其功能片段,以及所述的GnTII。在另一个实施方案中,本发明预期根据计划的方法获得的转基因植物。
在一个实施方案中,本发明预期一种方法,以增加在植物宿主系统中表达的异源糖蛋白的半乳糖基化作用,包括将编码GnTIII的核酸序列和以下序列导入表达所述异源糖蛋白的所述植物宿主系统中,并分离所述的糖蛋白,其中所述“以下序列”选自编码通常不存在于植物中的转运子或(哺乳动物)酶或功能片段。
在一个实施方案中,本发明预期一种植物来源的含有等分寡糖的糖蛋白。
在一个实施方案中,本发明预期使用本发明预期的植物宿主系统来产生期望的糖蛋白或其功能片段。在另一个实施方案中,本发明预期所述的糖蛋白或其功能片段包含等分的寡糖。仍然在另一个实施方案中,本发明预期一种由本发明预期的方法获得的植物来源的糖蛋白或其功能片段。仍然在另一个实施方案中,本发明预期一种糖蛋白或其功能片段,本发明预期用来生产药物组合物。仍然在另一个实施方案中,本发明预期一种组合物,包含一种糖蛋白或其功能片段,如本发明所预期的那样。
在一个实施方案中,本发明预期一种分离的杂合蛋白,其含有GnTIII的活性位点,和蛋白的跨膜区,所述的蛋白位于真核细胞的内质网或高尔基体中。在另一个实施方案中,本发明预期本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是一种酶。仍然在另一个实施方案中,本发明预期根据本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是糖基转移酶。仍然在另一个实施方案中,本发明预期本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是选自下列的糖基转移酶:甘露糖苷酶1,甘露糖苷酶II,GnTI,GnTII,XylT和FucT。仍然在另一个实施方案中,本发明预期根据本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是植物蛋白。仍然在另一个实施方案中,本发明预期一种编码本发明蛋白的分离的核酸序列。仍然在另一个实施方案中,本发明预期一种载体,包含本发明的分离的核酸序列。仍然在另一个实施方案中,本发明预期一种植物,它含有本发明的分离核酸序列。仍然在另一个实施方案中,本发明预期本发明的植物,它进一步含有编码异源糖蛋白的核酸序列。
在一个实施方案中,本发明预期一种方法(提供能够表达一种具有用半乳糖延伸N-连接聚糖的能力的异源糖蛋白的转基因植物),包括a)将转基因植物与本发明的植物杂交繁育,b)从所述的杂交繁育中回收子代和c)选择期望的子代植物(表达所述的重组蛋白和表达参与正常植物中不存在的(哺乳动物)N-聚糖生物合成的功能性(哺乳动物)酶)。
在一个实施方案中,本发明预期一种方法,可提供能够表达,具有使用半乳糖延伸N-连接聚糖的能力的异源糖蛋白的转基因植物,包括导入本发明的核酸序列和编码所述异源糖蛋白的核酸序列。
在一个实施方案中,本发明预期一种方法,包括:a)提供:i)一种植物细胞,和ii)一种含有编码GNTIII酶的核酸的表达载体;和b)在表达所述酶的条件下将所述的表达载体导入所述的植物细胞。在另一个实施方案中,本发明预期该方法,其中所述的编码GNTIII的核酸包括SEQ ID NO:1的核酸序列。
在一个实施方案中,本发明预期一种方法,包括:a)提供:i)一种植物细胞,ii)含有编码GNTIII酶核酸的第一个表达载体,和iii)含有编码异源糖蛋白的核酸的第二个表达载体;和b)在表达所述杂合酶和所述异源蛋白的条件下,将所述第一个和第二个表达载体导入所述植物细胞中。在另一个实施方案中,本发明预期,其中所述的异源蛋白是一种抗体或抗体片段。
在一个实施方案中,本发明预期一种方法,包括:a)提供:i)含有第一个表达载体的第一种植物,所述的第一种载体含有编码GNTIII酶的核酸,和ii)含有第二个表达载体的第二种植物,所述的第二个载体含有编码异源蛋白的核酸;和b)将所述的第一种植物和所述的第二种植物杂交繁育产生可表达所述杂合酶和所述异源蛋白的子代。
在一个实施方案中,本发明预期一种植物,含有第一个和第二个表达载体,所述的第一个载体含有编码GNTIII酶的核酸,所述的第二个载体含有编码异源蛋白的核酸。在另一个实施方案中,本发明预期该方法,其中所述的异源蛋白是一种抗体或抗体片段。
附图描述
图1A和1B显示了(A)从对照烟草植物叶中分离的N-连接聚糖的MALDI-TOF质谱和(B)从用人GnTIII转化的选择的GnTM-17烟草叶中分离的N-连接聚糖。见表1中的结构。
图2显示了在随后ManI,GnTI,Manll,和GnTII的作用下,高甘露糖型聚糖(M9)加工为复合型聚糖。也要指出的是Gal T和/或GnTIII在反应链中不同点上的作用将产生的何种结构。由岩藻糖基转移酶和木糖基转移酶催化的反应并未指示。核心GlcNAc(Gn)未指示。Gn=GlcNAc,Gnb=等分的GlcNAc,G=半乳糖,以及M=甘露糖。
图3A和3B显示了(A)携带编码聚糖修饰酶的基因的T-DNA构建物,可有效地产生半乳糖基化的等分聚糖,它缺少免疫原性的木糖和岩藻糖,以及(B)携带抗体轻链和重链基因的T-DNA构建物。TmXyl=木糖基转移酶的跨膜结构区,TmGnTI=GnT的跨膜结构区,P=启动子,R=选择标记物,L=抗体轻链,以及H=抗体重链。
图4A和4B显示了GnTIII的核苷酸序列(SEQ ID NO:1,图4(A)的下划线部分,蛋白序列(SEQ ID NO:2,图4B的下划线部分),包括一个c-myc标记。可经受保守氨基酸取代的残基在定义章节中进行定义。
图5A和5B显示了(A)质粒pDAB4005的图谱,以及(B)质粒pDAB4005(SEQ IDNO:8)的核苷酸序列。
图6A和6B显示了(A)质粒pDAB7119的图谱和(B)质粒pDAB7119(SEQ ID NO:9)的核苷酸序列,包括拼接位点。
图7A和7B显示了(A)质粒pDAB8504的图谱和(B)质粒pDAB8504(SEQ ID NO:10)的核苷酸序列。
图8A和8B显示了(A)质粒pDAB7113的图谱和(B)质粒pDABVl13(SEQ ID NO:11)包括拼接位点的核苷酸序列。
图9A和9B显示了对照和GnTIII玉米的糖蛋白的MALDI-TOF质谱。从(A)对照玉米和(B)选择的GnTIII玉米的胼胝中分离的糖蛋白的N-聚糖的质谱比较。GnTIII玉米是用人GnTIII基因序列通过转化获得的,通过凝集素印迹,使用E-PFIA进行选择。见表3,数据的注释包含在图9A和9B中。
图10显示了没有c-mac标记的GntIII的全部核苷酸序列(SEQ ID NO:7)。
图11显示了来自对照和GnTIII-2的糖蛋白的MALDI-TOF质谱。见,表4的结构和缩写。
图12显示了转基因玉米胼胝标本的代表性印迹,表示由于表达GntIII基因而改变的凝集素结合。
图13显示了转基因玉米胼胝标本的代表型印迹,表示c-myc抗原决定簇的表达。
图14A和14B显示了来自(A)对照和(B)GnTIII玉米植物的糖蛋白的MALDI-TOF质谱。
定义
术语“蛋白”和“多肽”是指一些包括经肽键结合在一起的氨基酸的化合物,可相互互换使用。由基因编码的“蛋白”或“多肽”并不限于由基因编码的氨基酸序列,但包括蛋白的翻译后修饰。
术语“糖蛋白”是指具有共价附着的糖单位的蛋白,经丝氨酸或苏氨酸的OH基团键合(O糖基化)或通过天冬酰胺的酰胺NH2(N糖基化)键合。“糖蛋白”可包括,但不限于,例如大多数的分泌蛋白(血清白蛋白是主要的例外)和暴露在浆膜外表面上的蛋白。已发现的糖残基包括,但不限于:甘露糖,N乙酰葡萄糖胺,N乙酰基半乳糖胺,半乳糖,岩藻糖和唾液酸。
当在此叙述的术语“氨基酸序列”是指蛋白分子的氨基酸序列,“氨基酸序列”和类似术语,如“多肽”或“蛋白”并不意味要将氨基酸序列限制在于在此叙述的蛋白分子有关的完全的,天然的氨基酸序列。而且,“氨基酸序列”可从编码蛋白的核酸序列中推导出来。
术语“部分”当用于说明蛋白时(如在“给定蛋白的部分”)是指该蛋白的片段。片段的大小范围可从4个氨基酸残基至整个氨基酸序列减一个氨基酸。
术语“嵌合体”当用于说明多肽时是指从不同基因获得的两个或多个编码序列的表达产物,已经被克隆在一起,在翻译后可作为一个单独的多肽序列。嵌合的多肽也可指“杂合”多肽。编码序列包括从相同或不同种属生物体中获得的序列。
术语“融合”当用于说明多肽时是指与外源蛋白片段连接(融合伴侣)的含有目的蛋白的嵌合蛋白。融合伴侣可起很多功能,包括增强目的多肽的可溶性,以及提供“亲和标记”允许从宿主细胞或从上清液或两者中纯化重组的融合多肽。如果需要,融合伴侣可在纯化后或当中从目的蛋白中去除。
术语“同系物”或“同源的”当用于说明多肽时是指在两种多肽之间序列同一性有很高的程度,或在三维结构之间有很高程度的相似性,或在活性位点和作用机制之间有很高的相似性。在一个优选的实施例中,同系物与参考序列具有超过60%的序列同一性,更优选的是超过75%的序列同一性,仍然是更为优选的是超过90%的序列同一性。
当用于多肽时,术语“实质上的同一性”的含义是两个肽序列,当最佳线性排比时,如通过程序GAP或BESTFIT采用缺省的缝隙补偿,具有至少80%的序列同一性,优选至少90%的序列同一性,更优选的是至少95%的序列同一性或更多(例如,99%的序列同一性)。优选,不相同的残基位点在保守氨基酸取代上是不同的。
术语“变异体”和“突变体”当用于说明多肽时是指一条氨基酸序列与另一条一个或多个氨基酸是不同的,通常是相关的多肽。变异体具有“保守的”变化,其中取代的氨基酸具有相似的结构或化学特性。一个类型的保守氨基酸取代是指具有相似侧链的残基的可交换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸,一组具有脂肪族-羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺谷氨酰胺;一组具有芳香族侧链的氨基酸是苯丙氨酸,酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸,精氨酸和组氨酸;一组具有含硫侧链的氨基酸是半胱氨酸和蛋氨酸。优选的保守氨基酸取代基团是:缬氨酸(V)-亮氨酸(L)-异亮氨酸(I),苯丙氨酸(F)-酪氨酸(Y),赖氨酸(K)-精氨酸(R),丙氨酸(A)-缬氨酸(V),和天冬酰胺(N)-谷氨酰胺(Q)。较罕见的是,变异体可具有“非保守”改变(如,用色氨酸替换甘氨酸)。相似的最小变异也包括氨基酸删除或插入(即,添加),或两者都有。确定氨基酸残基被取代和有多少被取代,插入或去除而不丢失生物学活性的指导可使用本领域中熟知的计算机程序,例如DNAStar软件。变异体可在功能测定中被检测。优选的变异体少于10%,优选少于5%,仍然更为优选的是少于2%改变(无论取代,删除等等)。
当用于说明多肽时,术语“结构区”是指一种多肽的片段,具有独特的结构和/或功能特性;典型地,这种特性在不同的多肽之间是相似的。该片段典型地包括邻近的氨基酸,尽管也可以包括一起发挥作用的氨基酸或由于折叠或其他的构型而紧密靠近的氨基酸。
术语“基因”是指一种核酸序列(如,DNA或RNA),其含有产生RNA,多肽或其前体(如,胰岛素原)所必需的编码序列。功能多肽可被全长编码序列或编码序列的任何部分编码,只要保留期望的多肽活性或功能特性(如,酶活性,配体结合,信号转导等)。术语“部分”当用于说明基因时是指该基因的片段。片段的大小范围从几个核苷酸(如,十个核苷酸)至整条基因序列减去1个核苷酸。因此,“含有至少一部分基因的核苷酸”可能包含基因的片段或整条基因。
术语“基因”也包括结构基因的编码区,包括位于5’和3’末端编码序列邻近的序列,在每个末端的距离大约为1kb,这样基因对应于全长mRNA的长度。位于编码区5’和存在于mRNA上的序列是指5’未翻译序列。位于3’或编码区下游的序列和存在于mRNA上的序列是指3’非翻译序列。术语“基因”包括基因的cDNA和基因组形式。基因的基因组形式或克隆包含称为“内含子”或“插入区”或“插入序列”的非编码序列间隔的编码区。内含子是被转录为核RNA(hnRNA)的基因片段;内含子可含有调控元件如增强子。内含子从核中或原始的转录物中被去除或“拼接去掉”;因此内含子不存在于信使RNA(mRNA)转录物中。mRNA在翻译过程中的功能是在新生多肽中指定序列或氨基酸的顺序。
除了含有内含子,基因的基因组形式也包括位于序列5’和3’末端上的序列,该序列位于RNA转录物上。这些序列是指“侧翼”序列或区域(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’侧翼区可含有调控序列如启动子和增强子,可控制或影响基因的转录。3’侧翼序列可含有可引导转录终止,翻译后断裂和聚腺苷化作用的序列。
术语“异源”当用于说明基因时是指编码不在其天然环境中的因子的基因(即,可人工改变)。例如,异源基因包括被导入另一种属中的一种种属的基因。异源基因也包括已经以某种方式改变的生物体所固有的基因(如,突变的,加入了多个拷贝,与非天然启动子或增强子序列连接的基因等)。异源基因可含有一些基因序列,它们包括基因的cDNA形式,cDNA序列可以正义(产生mRNA)或反义的方向表达(产生与mRNA转录物互补的反义RNA转录物)。异源基因与内源基因的区别是异源基因序列典型地与含有调控元件如启动子的核苷酸序列连接,对于异源基因编码的蛋白发现所述启动子与基因天然是不相关的或与染色体中的基因序列是不相关的,或与自然未发现的染色体部分有关(如,在正常情况下不表达基因的位点表达的基因)。
“异源糖蛋白”是来自植物宿主系统以外物种的糖蛋白。糖蛋白包括但不限于抗体,激素,生长因子和生长因子受体,抗原,细胞因子和血液制品。
“植物宿主系统”可包括,但不限于包括但不限于植物细胞,植物器官和/或植物组织的植物或其部分。植物可以是单子叶植物(单子叶),其是显花植物,其晶胚有一个子叶或种子叶片,包括但不限于百合,草,玉米(玉米),稻米,谷类包括燕麦,小麦和大麦,兰花,鸢尾属植物,洋葱和棕榈。可选择地,植物可以是双子叶植物(双子叶),包括但不限于烟草(烟草属),番茄,马铃薯,荚果(如,紫花苜蓿和大豆),玫瑰,雏菊,仙人掌,紫罗兰和浮萍。植物也可以是苔藓,包括但不限于Physcomitrella patens。发明进一步是针对一种方法,通过将编码所述GnTIII的核酸导入植物或其部分,表达所述的GnTIII,并分离表达所述GnTIII的所述植物或其部分,从而在植物宿主系统中获得所述等分GlcNAc。
术语“目的核苷酸序列”或“目的核酸序列”是指任何核苷酸序列(如,RNA或DNA),由本领域的普通技术人员由于任何原因(如,治疗疾病,赋予改良的特性等等)认为期望要的操作。这种核苷酸序列包括但不限于,结构基因的编码序列(如,报告子基因,选择标记物基因,癌基因,药物抗性基因,生长因子等),和不编码mRNA或蛋白产物的非编码调控序列(如,启动子序列,聚腺苷化化序列,终止序列,增强子序列和其他类似序列)。本发明预期表达由目的核苷酸序列编码的异源蛋白和一种或多种杂合酶的宿主细胞。
术语“结构的”当用于说明基因或核苷酸或核酸序列时是指一条基因或核苷酸或核酸序列,其最终的表达产物是一种蛋白(如酶或结构蛋白),rRNA,sRNA,tRNA等。
术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指含有两个或更多脱氧核糖核苷酸或核糖核苷酸的分子,优选超过三个,通常超过十个。准确的大小依赖于许多因素,它们依次要依赖于寡核苷酸的最终功能或用途。可以任何方式产生寡核苷酸,包括化学合成,DNA复制,逆转录或其组合。
术语“具有编码一种基因的核苷酸序列的寡核苷酸”或“编码特定多肽的核酸序列”是指含有基因编码区的核酸序列,或换句话说,编码基因产物的核酸序列。编码区可存在于cDNA,基因组DNA或RNA形式中。当存在于DNA形式中,寡核苷酸可以是单链(即,有义链)或双链。合适的控制元件如增强子/启动子,拼接点,聚腺苷化信号等,如果需要正确的启动原始RNA转录物的转录和/或准确的加工,可以置于紧靠基因编码区的位置。可选择的是,用于本发明表达载体中的编码区可含有内源性增强子/启动子,拼接点,插入序列,聚腺苷化信号,等,或内源和外源控制元件的组合。
术语“重组”当用于说明核酸分子时,是指包含通过分子生物学技术连接在一起的核酸片段的核酸分子。“重组”当用于说明蛋白或多肽时是指可采用重组核酸分子表达的蛋白分子。
如在此所使用的,术语“互补”或“互补性”用于说明根据碱基配对原则有关联的核苷酸序列。例如,序列5’AGT-3’与序列5’-ACT-3’互补。互补型可以是“部分”或“全部”。“部分”互补性是根据碱基配对原则一个或多个核酸碱基不匹配。在核酸之间的“全部”或“完全”互补性是每个和任何一个核酸碱基与另一个碱基在碱基配对原则下相匹配。核酸链之间互补的程度对核酸链之间杂交的效率和强度具有明显的作用。
如在此所使用的核酸序列的“互补体”是指一条核苷酸序列,其核酸显示与核酸序列的核酸具有全部的互补性。例如,本发明预期SEQ ID NO:1的互补体。
术语“同源性”当用于核酸时是指互补性的程度。有部分同源(即,部分同一性)或完全同源(即,完全的同一性)。部分互补的序列是可至少部分抑制来自与靶核酸杂交的完全互补序列的序列,是指使用功能性术语“实质上同源的”。抑制靶序列与完全互补序列的杂交可采用杂交试验来检测(Southern或Northern印迹,溶液杂交和类似方法),在低严紧条件下进行。实质上同源的序列或探针(即,能够与另一个目的寡核苷酸杂交的寡核苷酸)将竞争和抑制完全同源序列与靶标在低严紧条件下的结合(即,杂交作用)。这并不是说低严紧条件是非特异性结合所允许的条件;低严紧条件需要,两条需要与另一条序列的结合是特异性(即,选择性)的相互作用。通过使用恰好缺少部分的互补性(如低于大约30%的同一性)第二靶标可检测到缺少非特异结合;在没有非特异性结合时,探针将不与第二个非互补性的靶标杂交。
当用于说明双链核酸序列如cDNA或基因组克隆时,术语“实质上同源”是指任何在如前所述的低严紧条件下与双链核酸序列的单链或双链杂交的探针。
当用于说明单链核酸序列时,术语“实质上同源”是指任何可与单链核酸序列在如前所述的低严紧条件下杂交的探针。
下面的术语是用来描述两个或更多多核苷酸之间的序列关系:“参考序列”,“序列同一性”,“序列同一性的百分比”和“实质上的同一性”。“参考序列”是一条用作序列比较根据的指定序列;参考序列可以是更大序列的一个子集,例如在序列列表中指定的全长cDNA序列的片段或含有一条完整的基因序列。通常,参考序列在长度是至少为20个核苷酸,经常为至少25个核苷酸,经常至少为50个核苷酸。由于两个多核苷酸每个都(1)含有两个多核苷酸之间相似的一条序列(即,完整的多核苷酸序列的一部分),和(2)可进一步含有两个核苷酸之间不同的序列,两个(或更多)多核苷酸之间的序列比较典型地通过在“比较窗”上比较两个核苷酸的序列而进行,以鉴定和比较序列局部区域的相似性。如在此所使用的“比较窗”是指至少20个连续核苷酸位置的概念性片段,其中所述的多核苷酸序列可与至少20个连续核苷酸的参考序列比较,其中所述的比较窗中的多核苷酸序列部分为进行两条序列的最佳线性排比,包括与参考序列(不包含插入或删除)比较20%或更少的插入或删除(即,间隙)。为了在比较窗中进行线性排比,序列的最佳线性排比可选择通过Smith和Waterman的局部同源算法来执行[Smith和Waterman,Adv.Appl.Math.2:482(1981)],通过Needleman和Wunsch的同源线性排比算法执行[Needleman和Wunsch,.J.Mol.Biol.48:443(1970)],通过Pearson和Lipman的相似性搜索法执行[Pearson和Lipman,Proc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)],通过这些算法程序化来实现(GAP,BESTFIT,FASTA,和TFASTA在Wisconsin Genetics软件包7.0版,Genetics Computer Group,575Science Dr.,Madison,Wis.),或通过观察,和多种方法所产生的最佳线性排比执行(即,在比较窗中产生最高的同源百分比)。术语“序列同一性”的含义是两个多核苷酸序列在比较窗上是相同的(即,在一个核苷酸比较一个核苷酸的基础上)。术语“序列同一性的百分比”的计算是通过在比较窗上比较两个最佳线性排比的序列,测定在两条序列中核酸碱基(如,A,T,C,G,U,或I)相同的位点的数量,产生匹配位点的数量,将匹配位点的数量除以比较窗中位点的总数量(即,窗的大小),将结果乘以100得到序列同一性的百分比。在此所使用的术语“实质上的同一性”表示了多核苷酸序列的一种特征,在具有至少20个核苷酸位点,经常是至少25-50个核苷酸的比较窗上与参考序列相比,其中所述的多核苷酸包括具有至少85%序列同一性的序列,优选至少90至95%序列同一性,更普遍的是至少99%序列同一性,其中所述的序列同一性的百分比的计算可通过将参考序列与多核苷酸序列比较,后者可含有在比较窗上总共20%或更少的参考序列的删除或插入。参考序列可以是更大的序列的子集,例如,本发明中声明的组合物全长序列的片段。
术语“杂交”是指互补核酸的配对。杂交和杂交的强度(即,核酸之间结合作用的强度)受一些因素的影响,如核酸之间的互补性程度,所涉及条件的严紧,形成杂交的Tm,和核酸内G∶C比例。在其结构中含有互补核酸配对的单个分子称为“自身杂交”。
术语“Tm”是指核酸的“解链温度”。在解链温度下,一组双链核酸分子半解离成为单链。计算核酸Tm的方程在本领域中是熟知的。如在标准参考所示,当核酸在1M NaCl的水溶液中时,Tm值的简单估算可通过下面的方程来计算:Tm=81.5+0.41(%G+C)(见,如Anderson和Young,定量滤膜杂交,核酸杂交[1985])。其他的参考包括更复杂的计算法,要考虑结构以及序列的特性来计算Tm。
术语“严紧”是指温度,离子强度和存在其他化合物如有机溶剂的条件,在这种条件下可进行核酸的杂交。在“高严紧”条件下,核酸碱基配对仅发生在具有很高互补碱基序列频数的核酸片段之间。因此,经常需要“低严紧”的条件,核酸来自有遗传多样性的生物体,因为互补序列的频数通常是很少的。
当用于说明核酸杂交时“低严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整为7.4),0.1%SDS,5X Denhardt’s试剂[50X Denhardt’s每500ml含有:5g Ficoll(400型,Pharmacia),5g BSA(片段V;Sigma)]和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由5XSSPE,0.1%SDS组成的溶液中在42℃冲洗。
当用于核酸杂交时“中严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整为7.4),0.5%SDS,5X Denhardt’s试剂和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由1.0X SSPE,1.0%SDS组成的溶液中在42℃冲洗。
当用于核酸杂交时“高严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整位7.4),0.5%SDS,5X Denhardt’s试剂和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由0.1X SSPE,1.0%SDS组成的溶液中在42℃冲洗。
已知的是大量相当的条件可用来组成低严紧条件;可考虑的因素如探针的长度和特性(DNA,RNA,碱基组成)和靶标的特性(DNA,RNA,碱基组成,存在于溶液中或被固定,等),盐类的浓度和其他成分(如,存在或缺少甲酰胺,硫酸葡聚糖,聚乙二醇),可改变杂交溶液产生不同于但等价于上述所列举条件的低严紧杂交条件。另外,本领域已知在高严紧条件下可促进杂交的条件(如,增加杂交的温度和/或冲洗步骤,在杂交溶液中使用甲酰胺,等等)。
另外,术语“相当的”当用于杂交条件时,因为涉及目的杂交条件,其含义是杂交的条件和目的杂交条件可引起具有相同范围的同源性百分比(%)的核酸序列的杂交。例如,如果目的杂交条件可引起第一条核酸序列与其他的和第一条核酸序列具有50%至70%同源性的核酸序列的杂交,如果其他的杂交条件也可引起第一条核酸序列与其他的和第一条核酸序列具有50%至70%同源性的核酸序列的杂交,则另一个杂交条件被认为相当于目的杂交条件。
当用于核酸杂交时,本领域已知大量的相当条件可用来组成低或高的严紧条件;可考虑的因素如探针的长度和特性(DNA,RNA,碱基组合物)和靶标的特性(DNA,RNA,碱基组合物,存在于溶液中或被固定,等),盐类的浓度和其他成分(如,存在或缺少甲酰胺,硫酸葡聚糖,聚乙二醇),可改变杂交溶液产生不同于但等价于上述所列举条件的低或高严紧杂交条件。
术语“野生型”当用于说明基因时,是指具有从天然来源分离基因的特征。术语“野生型”当用于说明基因产物时,是指具有从天然来源分离的基因产物的特征。术语“天然产生的”当用于一种物体时是指该物体可在自然中发现。例如,存在于一种生物体(包括病毒)中,可从天然的来源中分离,没有被人类有意地在实验室中修饰的多肽或多核苷酸序列是天然产生的。野生型基因经常是在群体中最常被观察到的基因,因此被人为地指定为基因的“正常”或“野生型”形式。相反,术语“修饰”或“突变体”当用于基因或基因产物时,分别是指当与野生型基因或基因产物相比较时,在序列和/或功能特性(即,特征改变)中显示有修饰作用的基因或基因产物。要注意的是天然产生的突变体可被分离;当与野生型基因或基因产物相比较时,可根据其具有改变的特征而被鉴定。
因此,当用于核苷酸序列时,术语“变异体”和“突变体”是指与另一条序列,通常是相关的核苷酸序列有一个或多个核苷酸差异的核酸序列。“变异”是两条不同的核苷酸序列之间的差异;典型地,一条序列是参考序列。
术语“多态性位点”是指存在于在群体成员之间显示有变异的群体中存在的遗传位点(即,最普遍的等位基因的频数小于0.95)。因此,“多态性”是指在一个群体中的两个或多个变异体中存在的一种特征。“单核苷酸多态性”(或SNP)是指单一碱基的遗传位点,它可被至少两个不同的核苷酸中的一个占据。相反,“单态性位点”是指一种遗传位点,在此位点上,在群体的成员之间很少或未发现变异(通常是指一种位点,在此位点上在群体的基因库中最普遍的等位基因的频数超过0.95)。
“移框突变”是指在核苷酸序列中的突变,通常是由单个核苷酸(或两个或四个核苷酸)的插入或删除引起的,可引起编码单摆的结构DNA序列的正确可读框的改变。改变的可读框通常可引起翻译的氨基酸序列改变或截短。
“拼接突变”是指通过影响正确的RNA拼接而影响基因表达的任何突变。拼接突变是由于在可改变拼接位点的内含子-外显子边界上的突变产生的。
术语“检测试验”是指可检测序列或变异核酸序列的存在或缺如的试验(如,在特殊基因的指定等位基因中的突变或多态性,如GnTIII基因,SEQ ID NO:1,图4A),或检测特殊蛋白的存在或缺如(如,GnTIII,SEQ ID NO:2,图4B)或特殊蛋白的结构或活性或作用(如,GnTIII活性),在特殊蛋白上检测糖基化部分(如,N-连接的聚糖)或检测特殊蛋白的变异体的存在或缺如。
术语“反义”是指一种脱氧核糖核酸序列,其脱氧核糖核苷酸残基的序列是与5’至3’方向相反的,与DNA双螺旋的有义链中的脱氧核糖核苷酸残基的序列有关。DNA双螺旋的“有义链”是指DNA双螺旋中的一条链,它可以其天然状态被细胞转录为“有义mRNA”。因此,“反义”序列是与DNA双螺旋中非编码链具有相同序列的序列。术语“反义RNA”是指与靶原始转录物或mRNA的所有或部分互补的RNA转录物,可通过干扰其原始转录物或mRNA的加工,转运和/或翻译来阻断靶基因的表达。反义RNA可与特殊基因转录物的任何部分互补,即5’非编码序列,3’非编码序列,内含子,或编码序列。另外,如在此所使用的,反义RNA可含有核糖酶序列的区域,该序列可增加反义RNA阻断基因表达的效力。“核糖酶”是指接触反应性RNA,包括序列特异性的核糖核酸内切酶。“反义抑制”是指产生能够阻止靶蛋白表达的反义RNA转录物。
“扩增”是涉及模板特异性的一种特殊的核酸复制。要与非特异性模板复制相对比(即,复制是模板依赖性的而不依赖特殊的模板)。模板特异性在此要与复制的精度(即,合成正确的多核苷酸序列)和核苷酸(核糖-或脱氧核糖-)特异性区分。模板特异性经常被描述为“靶”特异性。靶序列是“靶标”,其意义是被搜索以便从其他的核酸中挑选出来。为了这种分选,已经设计了扩增技术。
模板特异性可通过选择酶在大多数扩增技术中可达到。扩增酶在使用的条件下,将在核酸的非均匀混合物中仅处理特异的核酸序列。例如,对于Q3复制酶,MDV-1 RNA是复制酶的特异模板(Kacian等人,Proc.Natl.Acad.Sci.USA,69:3038,1972)。其他的核酸不能被这种扩增酶所复制。同样,对于T7 RNA聚合酶,这种扩增酶对其自身的启动子有严格的特异性(Chamberlain等人,Nature,228:227,1970)。对于T4 DNA连接酶,酶不能连接两个寡核苷酸或多核苷酸,其中在寡核苷酸或多核苷酸底物和连接结合点处的模板是不匹配的(Wu和Wallace,Genomics.4:560,1989)。最后,Taq和Pfu聚合酶,由于其能够在高温下发挥作用,发现对于结合的序列显示有很高的特异性,因此可由引物来确定;高温可产生热力学条件,促进引物与靶序列的杂交,但不与非靶序列杂交(H.A.Erlich(主编),PCR技术,Stockton Press,1989)。
术语“可扩增的核酸”是指可通过任何扩增方法扩增的核酸。预期“可扩增的核酸”通常包括“样本模板”。
术语“样本模板”是指来自被分析存在“靶标”(下面将说明)的样本的核酸。相反,“背景模板”用于说明的不是样本模板,存在或不存在于样本中的核酸。背景模板通常大多数是可被忽略的。可能是残留物的结果,或可能由于存在核酸污染物,可从样本中纯化清除。例如,在待测样本中来自非检测生物体的核酸可能存在成为背景。
术语“引物”是指一种寡核苷酸,不管是天然存在的被纯化的限制性消化产物或合成产生的,当置于一定条件下时能够作为启动合成点,在此条件下可诱导与核酸链互补的引物延伸产物的合成(即,存在核苷酸和诱导剂如DNA聚合酶,并在合适的温度和pH下)。引物优选单链以获得扩增的最大效率,但可选择双链。如果是双链,引物首先要被处理,其双链要在被用来制备延伸产物之前被分离。优选引物是寡脱氧核糖核苷酸。引物必须足够长以准备在诱导剂的存在下启动延伸产物的合成。引物的准确长度依赖于许多因素,包括温度,引物的来源和使用的方法。
术语“探针”是指一种寡核苷酸(即,核苷酸序列),不管是天然存在的被纯化的限制性消化产物或合成产生的,重组的或通过PCR扩增的,能够与另一个目的寡核苷酸杂交。探针可以是单链或双链。探针可用于特殊基因序列的检测,鉴定和分离。预期任何在本发明中使用的探针将用任何“报告分子”进行标记,以便可在任何检测系统中可检测到,包括但不限于酶(如,ELISA以及酶组织化学测定),荧光,放射活性,和发光系统。并不想使本发明限制于任何特殊的检测系统或标记。
术语“靶标”,当用于聚合酶链式反应中时,是指用于聚合酶链式反应中的引物所结合的核酸的区域。因此要从其他的核酸序列中搜寻“靶标”将其分选出来。“片段”的定义是在靶序列中的核酸区域。
术语“聚合酶链式反应”(″PCR″)是指K.B.Mullis美国专利Nos.4,683,195,4,683,202,和4,965,188的方法,描述了在基因组DNA的混合物中不需要克隆或纯化增加靶序列区段的浓度的方法。这种扩增靶序列的过程包括将含有期望靶序列的DNA混合物中导入大量的过量的两种寡核苷酸引物,然后在DNA聚合酶的存在下进行准确序列的热循环。两种引物与其各自双链靶序列的链是互补的。为了影响扩增,混合物被变性,引物然后退火在靶分子中成为其互补序列。退火后,引物用聚合酶延伸以便形成新的互补链对。变性,引物退火和聚合酶延伸的步骤可被重复许多次(即,变性,退火和延伸组成一个“循环”;可以有许多“循环”),得到高浓度的期望靶序列的扩增区段。期望靶序列的扩增区段的长度可通过引物相互的相对位置来确定,因此,其长度是可控制的参数。由于该过程的重复性,该方法是指“聚合酶链式反应”(此后称为“PCR”)。因为靶序列的期望扩增区段成为混合物中优势的序列(就浓度而言),它们被称为是“PCR扩增的”。
采用PCR,可能要扩增基因组DNA中的特异靶序列的单个拷贝,以达到几种不同方法学可检测到的水平(如,与标记探针的杂交;掺入生物素化的引物,然后用亲和素酶共轭检测;掺入32P-标记的脱氧核苷酸三磷酸盐,如dCTP或dATP进扩增的区段)。除了基因组DNA以外,任何寡核苷酸或多核苷酸序列要用合适的一组引物分子来进行扩增。特别是,PCR过程本身所产生的扩增区段本身是随后PCR扩增反应的有效模板。
术语“PCR产物”,“PCR片段”和“扩增产物”是指在两次或多次变性,退火和延伸PCR步骤的循环后得到的化合物混合物。这些术语包括一条或多条靶序列的一个或多个区段扩增的情况。
术语“扩增试剂”是指扩增期望要的除引物,核酸模板和扩增酶以外的那些试剂(脱氧核糖核酸三磷酸盐,缓冲液等)。典型地,扩增试剂和其他反应组分被置于和包含在反应容器中(检测管,微孔等)。
术语“逆转录酶”或“RT-PCR”是指PCR的类型,其中起始材料是mRNA。起始mRNA采用逆转录酶被酶转换为互补的DNA或“cDNA”。然后cDNA被用作“模板”进行“PCR”反应。
术语“基因表达”是指将基因中编码的遗传信息通过基因的“转录”转换成RNA(如,mRNA,rRNA,tRNA,或snRNA)的过程(即,经RNA聚合酶的酶作用),通过mRNA的“翻译”转换为蛋白。基因表达可在该过程中许多阶段被调节。“上调”或“活化”是指增加基因表达产物产量的调节(即,RNA或蛋白),而“下调”或“阻抑”是指减少产量的调节。参与上调或下调的分子(如,转录因子)经常分别称为“活化物”和“阻遏物”。
术语“可操作地组合”,“以可操作地顺序”和“可操作的连接”是指核酸序列的连接方式是产生能够引导指定基因的转录和/或期望蛋白分子合成的分子。术语也指氨基酸序列连接方式是可产生功能性蛋白。
术语“调控元件”是指一种遗传元件可控制核酸序列表达的一些方面。例如,启动子是一种调控元件可促进可操作连接的编码区转录的启动。其他的调控元件是拼接信号,聚腺苷化信号,终止信号等。
在真核细胞中的转录控制信号包括“启动子”和“增强子”元件。启动子和增强子包括可与参与转录的细胞蛋白特异相互作用的DNA序列的短阵列(Maniatis等人,Science 236:1237,1987)。启动子和增强子已经从多种真核细胞来源中分离出来,包括酵母,昆虫,哺乳动物和植物细胞中的基因。启动子和增强子元件也已经从病毒中分离,类似的控制元件,如启动子也在原核生物中发现了。选择特殊的启动子和增强子依赖于用来表达目的蛋白的细胞类型。一些真核生物启动子和增强子具有很宽的宿主范围,而其他则在有限的细胞类型的子集中有功能(其综述见Voss等人,Trends Biochem.Sci.,11:287,1986;和Maniatis等人,见前1987)。
术语“启动子元件”,“启动子”或“启动子序列”是指一种DNA序列,位于DNA聚合物编码区的5’末端(即,前方)。自然界中已知的大多数启动子的位置是在被转录的区域之前。启动子的功能是一种开关,可活化基因的表达。如果基因被活化,可称为被转录,或参与了转录。转录涉及从基因合成mRNA。因此,启动子的作用是一种转录调控元件,也可提供基因转录为mRNA的起始位点。
启动子可以是组织特异性或细胞特异性的。术语“组织特异性”当用于启动子时,是指能够引导目的核苷酸序列在相对缺少相同目的核苷酸序列表达的不同类型的组织(如,根)中选择性表达为特异的组织类型(如花瓣)。启动子的组织特异性的评价可通过,例如可操作的将一种报告基因与启动子序列连接产生报告子构建物,将报告子构建物导入植物的基因组中,这样报告子构建物被整合进所得到的转基因植物的每一个组织中,并在转基因植物的不同组织中检测报告基因的表达(如,检测mRNA,蛋白或由报告基因编码的蛋白活性)。相对在其他组织中报告基因的表达水平检测到一种或多种组织中报告基因表达的更高水平显示了启动子对该组织是特异的,在其中检测到更高水平的表达。术语“细胞类型特异性”当用于启动子时,是指能够引导目的核苷酸序列在一种特异类型的细胞中选择性表达的启动子,在相同组织的不同类型细胞中相对缺少相同目的核苷酸序列的表达。术语“细胞类型特异性”当用于启动子时,也表示能够在单一组织中的一个区域内促进目的核苷酸序列选择性表达的启动子。启动子的细胞类型特异性可采用本领域熟知的方法进行评价,如免疫组织化学染色。简言之,组织切片可在石蜡中包埋,石蜡切片用一抗反应,该抗体是目的核苷酸序列所编码的多肽产物特异的,该序列的表达是由启动子所控制的。一抗所特异的标记(如,过氧化物交联的)二抗可与切片组织结合,可通过显微镜进行特异结合检测(如,采用亲和素/生物素)。
启动子可以是结构性或可调节性的。术语“结构性”当用于启动子时的含义是能够在缺少刺激物(如,热休克,化学物质,光等)的情况下能够引导可操作连接的核酸序列的转录的启动子。典型地,结构性启动子能够在实质上任何细胞和任何组织中引导转基因表达的启动子。相反,“可调节性”启动子是能够在刺激物存在的情况下(如,热休克,化学物质,光等)引导可操作连接的核酸序列达到一定转录水平的启动子,该水平不同于缺少刺激物时可操作连接的核酸序列的转录水平。
术语用细菌“感染”和“感染”是指靶生物学样本(如,细胞,组织等)与细菌在一定条件下的共孵育,这样包含在细菌中的核酸序列被导入靶生物学样本中的一种或多种细胞中。
术语“土壤杆菌”是指一种土生的,革兰氏阴性的,杆状的植物致病细菌,可引起冠瘿病。术语“土壤杆菌”包括但不限于根癌土壤杆菌菌株,(典型地可在感染的植物中引起冠瘿病),和rhizogens土壤杆菌(可在感染的宿主植物中引起发根病)。土壤杆菌感染植物细胞通常可引起感染细胞产生冠瘿碱(如,胭脂碱,农杆碱,章鱼碱等)。因此,可引起胭脂碱产生的土壤杆菌菌株(如,菌株LBA4301,C58,A208)是指“胭脂碱型”土壤杆菌;可引起章鱼碱产生的土壤杆菌菌株(如,菌株LBA4404,Ach5,B6)是指“章鱼碱型”土壤杆菌;可引起农杆碱(如,菌株EHA105,EHA101,A281)产生的土壤杆菌是指“农杆碱型”土壤杆菌。
术语“调节区”是指基因的5’转录但未翻译的区域,位置起始于启动子下游,正好在基因翻译起始点之前结束。
术语“启动子区域”是指DNA聚合物编码区的上游开始区域,典型地长度在大约500bp和4kb之间,长度优选在大约1至1.5kb。
相反,“可诱导的”启动子是能够在刺激物的存在下(如,热休克,化学物质,光等)引导可操作连接的核酸序列达到一定的转录水平,不同于缺少刺激物时可操作连接的核酸序列转录的水平。
术语“调控元件”是指可控制核酸序列表达的一些方面的遗传元件。例如,启动子是一种可促进可操作连接的编码区转录起始的一种调控元件。其他的调控元件是拼接信号,聚腺苷化信号,终止信号等。
增强子和/或启动子可能是“内源性”或“外源性”或“异源的”。“内源性”增强子或启动子是在基因组中天然与指定基因连接的。“外源性”或“异源的”增强子或启动子是通过遗传操作与基因并排线性排比的(即,分子生物学技术)这样基因的转录可由连接的增强子或启动子所引导。例如,可操作的与第一条基因组合的内源性启动子可被分离,移除,放置与第二条基因可操作地组合,因此使其可操作地与第二条基因组合成为“异源启动子”。可预期多种这样的组合(如,第一条和第二条基因可来自相同的物种,或来自不同的物种)。
术语“自然连接的”或“自然定位的”当用来说明核酸序列的相对位置时,含义是核酸序列所固有的相对位置。
在表达载体上“拼接信号”的存在经常可在真核生物宿主细胞中引起重组转录物的高水平表达。拼接信号可介导内汉字从原始RNA转录物中的移除,并包括拼接供体和受体位点(Sambrook等人,分子克隆:实验室手册,第二版,Cold SpringHarbor Laboratory Press,New York[1989]16.7-16.8页)。普遍使用的拼接供体和受体位点是来自SV40的16S RNA拼接点。
在真核细胞中有效表达重组的DNA序列需要引导所得到转录物有效终止和聚腺苷化的表达信号。转录终止信号通常在聚腺苷化信号的下游发现,长度为几百个核苷酸。在此所使用的术语“poly(A)位点”或“poly(A)序列”表示可引导新生RNA转录物终止和聚腺苷化化的DNA序列。重组转录物需要有效的聚腺苷化,因为缺少poly(A)尾的转录物是不稳定的,迅速被降解。在表达载体中使用的poly(A)信号可以是“异源”或“内源的”。内源的poly(A)信号是在基因组的指定基因编码区3’末端天然发现的。异源poly(A)信号是已经从一条基因中分离,并位于另一条基因3’端。普遍使用的异源poly(A)信号是SV40 poly(A)信号。SV40poly(A)信号包含在237bp BamHI/BclI限制片段上,引导终止和聚腺苷化作用(Sambrook,见前,16.6-16.7)。
术语“载体”是指任何遗传元件,如质粒,噬菌体,转座子,粘粒,染色体,逆转录病毒,病毒体,或类似的遗传元件,当与适当的控制元件结合时能够进行复制,可将基因序列传递至细胞中和/或在细胞之间传递。因此,该术语包括克隆和表达载体以及病毒载体。
如在此所使用的术语“表达载体”是指含有期望编码序列(或编码序列)的重组DNA分子-如在下面要详述的杂合酶的编码序列-和可操作连接的编码序列在特殊的宿主细胞或生物体中表达所必需的合适的核酸序列。在原核生物中表达期望的核酸序列通常包括启动子,操纵基因(可选择的),和核糖体结合位点,经常与其他序列并排在一起。真核生物细胞已知使用启动子,增强子,和终止和聚腺苷化信号。本发明并不想被限制于具有特殊元件的特殊表达载体或表达载体。
术语“转染”是指将外源DNA导入细胞中。转染可通过本领域中已知的各种方法来完成,包括磷酸钙-DNA共沉淀,DEAE-葡聚糖介导的转染,聚凝胺介导的转染,玻璃珠,电穿孔,微注射,脂质体融合,脂染(lipofection),原生质体融合,病毒感染,biolistics(即,微粒轰击)和类似方法。
术语“稳定的转染”或“稳定转染的”是指外源DNA导入和整合进转染细胞的基因组中。术语“稳定的转染体”是指已经稳定的将外源DNA整合进基因组DNA中的细胞。
术语“短暂转染”或“短暂被转染”是指外源DNA被导入细胞中,其中外源DNA不能被整合进转染细胞的基因组中。外源DNA可在转染细胞的核中维持几天。在这段时间中,外源DNA受到调节性的控制,可在染色体中支配内源基因的表达。术语“暂时的转染体”是指已经摄取外源DNA的细胞,但不能整合这种DNA。
术语“磷酸钙共沉淀”是指将核酸导入细胞中的技术。当核酸作为磷酸钙-核酸共沉淀物显现时,细胞对核酸的摄取可被增强。Graham和van der Eb(Graham和van der Eb,Virol.,52:456,1973)最初的技术被改良为几组以对特殊类型的细胞进行优化。本领域已经很了解这些大量的改良方法。
术语“轰击的”,“轰击”和“生物弹轰击”是指朝向靶生物样本(如,细胞,组织等)加速微粒的过程,以便在靶生物样本细胞的细胞膜上造成伤口和/或让这些微粒进入靶生物样本中。生物弹轰击的方法在本领域中是已知的(如,美国专利No.5,584,807,其内容在此引入以供参考),可从商业渠道中购买到(如,氦气驱动的微型发射加速器(PDS-1000/He,BioRad)。
当用于植物组织时,术语“微创伤”是指在该组织中形成了显微镜可见到的伤口。微创伤可通过,例如在此所述的微粒轰击来实现。
如在此所使用的术语“植物”是指多个植物细胞,它们可大量被分化为存在于植物发育任何阶段中的结构。这种结构包括但不限于,果实,芽,茎,叶,花瓣等。术语“植物组织”包括分化和未分化的植物组织,包括但不限于根,芽,叶,花粉,种子,肿瘤组织和多种类型的培养细胞(如,单个细胞,原生质体,胚,胼胝,原始球茎样体等)。植物组织可以是in planta,器官培养,组织培养,或细胞培养。类似地,“植物细胞”可以是培养的细胞或植物的一部分。
术语“转基因”当用于说明细胞时,是指含有转基因的细胞,或其基因组已经通过导入转基因而被改变。术语“转基因”当用于说细胞,组织或植物时分别是指含有转基因的细胞,组织或植物,其中组织的一个或多个细胞含有一种转基因(如编码本发明杂合酶的基因),或一种其基因组已经通过导入转基因被改变的植物。转基因细胞,组织和植物可通过几种方法而产生,包括将含有核酸(通常是DNA)的“转基因”导入靶细胞中或将转基因通过人为的干预整合进靶细胞的染色体中,如通过在此所述的方法。
在此所使用的术语“转基因”是指任何通过试验操作被导入细胞基因组中的核酸序列。转基因可以是“内源DNA序列”,或“异种DNA序列”(即,“外源DNA”)。术语“内源DNA序列”是指在它要被导入的细胞中天然发现的核苷酸序列,只要它不含有相对于天然序列的某些修饰作用(如,点突变,存在选择性标记物基因,或其他类似的修饰)。术语“异种DNA序列”是指一种核苷酸序列,它连接于,或被操作要连接于自然条件下它不连接的核酸序列,或它在自然条件下不同的位点被连接。异种DNA对于它被导入的细胞不是内源性的,但已经从其他的细胞中获得。异种DNA也包括含有某些修饰作用的内源性DNA序列。通常,尽管不是必须的,异种DNA可编码正常情况下它被表达的细胞不能产生的RNA和蛋白。异种DNA的实例包括报告基因,转录和翻译调控序列,选择性标记蛋白(如,可赋予药物抗性的蛋白),或其他相似的元件。
术语“外源基因”是指任何可通过试验操作被导入细胞基因组中的核酸(如,基因序列),可包含在该细胞中发现的基因序列只要被导入的基因含有相对于天然基因的某些修饰作用(如,点突变,存在选择性标记物基因,或其他类似的修饰作用)。
在此所使用的术语“转化”是指将转基因导入细胞中。细胞的转化可以是稳定或暂时的。术语“暂时转化”或“暂时转化的”是指将一条或多条转基因在不将转基因整合进宿主细胞基因组的情况下导入细胞中。暂时的转化可通过,例如酶联免疫吸收测定(ELISA)来检测,该方法可检测一条或多条转基因编码多肽的存在。可选择地,暂时的转化可通过检测转基因(如,uid A基因)编码蛋白(如,β-葡糖醛酸酶)的活性而被检测到,如在此所证明的(如,通过用X-gluc染色组织化学测定GUS酶活性,X-gluc可在GUS酶存在的情况下产生蓝色沉淀;采用GUS-光试剂盒(Tropix)化学发光测定GUS酶活性)。术语“暂时转化株”是指暂时掺入一条或多条转基因的细胞。相反,术语“稳定转化”或“稳定转化的”是指将一条或多条转基因导入和整合进细胞的基因组中。通过将细胞基因组DNA与能够结合一条或多条转基因的核酸序列Sounthern印迹杂交,可测定细胞的稳定转化。可选择地,细胞的稳定转化也可通过细胞基因组DNA的聚合酶链式反应扩增转基因新来检测。术语“稳定的转化株”是指已经将一条或多条转基因稳定的整合进基因组DNA中的细胞。因此,稳定的转化株要与暂时的转化株区分,因为来自稳定转化株的基因组DNA含有一条或多条转基因,来自暂时转化株的基因组DNA不含有转基因。
术语“宿主细胞”是指任何能够复制和/或转录和/或翻译异种基因的细胞。因此,“植物细胞”是指任何真核生物或原核生物细胞(如,细菌细胞如大肠杆菌,酵母细胞,哺乳动物细胞,禽类细胞,两栖动物细胞,植物细胞,鱼类细胞,和昆虫细胞),无论是在体外或体内。例如,宿主细胞可位于转基因动物体内。
术语“转化株”或“转化细胞”包括原代的转化细胞和来自该细胞的培养物,与转递的数量无关。由于事先或无意中的突变,所有的子代在DNA的含量上并不是完全相同的。如在原始转化细胞中所筛选的一样,具有相同功能性的突变子代包括在转化株的定义中。
术语“选择性标记”是指编码一种酶的基因,所述酶的活性可将对抗生素或药物的抗性赋予表达选择性标记物的细胞,或使其表达可检测到的一种性状(如,发光或荧光)。选择性标记物可以是“阳性的”或“阴性的”。阳性选择性标记物的实例包括新霉素磷酸转移酶(NPTII)基因,可赋予对G418和卡那霉素的抗性,和细菌潮霉素磷酸转移酶基因(hyg),赋予对抗生素潮霉素的抗性。阴性选择性标记物编码的酶活性,当细胞在合适的选择性培养基中生长时,其表达对细胞是有细胞毒性的。例如,HSV-tk基因通常可用作阴性选择性标记物。HSV-tk基因在生长于更昔洛韦或无环鸟苷中的细胞中的表达是细胞毒性的;因此,细胞在含有更昔洛韦或无环鸟苷的选择性培养基中的生长可筛选掉表达功能性HSV TK酶的细胞。
术语“报告基因”是指编码一种可被测定的蛋白的基因。报告基因的实例包括,但不限于,荧光素酶(见,如deWet等人,Mol.Cell.Biol.7:725,1987和美国专利Nos.,6,074,859;5,976,796;5,674,713;和5,618,682;所有在此引入以供参考),绿荧光蛋白(如,GenBank编号U43284;大量GFP变异体可从CLONTECH实验室购得,Palo Alto,CA),氯霉素乙酰转移酶,β-半乳糖苷酶,碱性磷酸酶,和辣根过氧化物酶。
术语“过度表达”是指在转基因生物体中基因产物的产量超过了正常或未转化生物体中的生产水平。术语“共抑制”是指可引起外源和内源基因表达抑制的与内源性基因实质上同源的外源基因的表达。如在此所使用的,术语“改变的水平”是指在转基因生物体中基因产物的产量在量或比例上与正常或未转化生物体是不同的。
术语″Southern印迹分析″和″Southern印迹″和″Southern″指在琼脂糖或丙烯酰胺凝胶上的DNA分析,其中DNA按照大小被分离或分段,然后将DNA从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。然后固定的DNA与标记的探针接触以检测与所用探针互补的DNA种类。在电泳之前,可用限制性酶分裂DNA。电泳后,DNA可被部分地去嘌呤并在转移到固体支持物上之前或转移过程中变性。Southern印迹是分子生物学家标准的工具(J.Sambrook等人分子克隆:实验室手册,Cold Spring Harbor Press,NY,pp 931-9.58,1989)。
术语″Northern印迹分析″和’″Northern印迹″和″Northern″指RNA的分析,通过在琼脂糖凝胶上电泳RNA以按照大小分离RNA,然后将RNA从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。然后用标记的探针探测固定的RNA以检测与所用探针互补的RNA种类。Northern印迹是分子生物学家标准的工具(J.Sambrook等人,见上,pp7.39-7.52,1989)。
术语″Western印迹分析″和″Western印迹″和″Western″指分析固定在支持物如硝酸纤维素或膜上的蛋白(或多肽)。含有至少一种蛋白的混合物首先在丙烯酰胺凝胶上分离,然后将分离的蛋白从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。固定的蛋白与具有抗至少一种目的抗原反应的至少一种抗体接触。可用各种方法检测结合的抗体,包括使用放射标记的抗体。
术语″抗原决定簇″指使抗原与特定抗体接触的部分(即,抗原决定簇)。当蛋白或蛋白片段被用来免疫宿主动物时,蛋白的许多区可诱导产生与蛋白指定区域或三维结构特异结合的抗体;这些区域或结构被称为抗原决定簇。抗原决定簇可与完整的抗原(即,用于引起免疫反应的″免疫原″)竞争与抗体的结合。
术语″分离的″当用于叙述核酸时,如在″分离的核酸序列″中指被鉴定并分离自一个或多个其它成分(如,分离自含该核酸的细胞,或分离自至少一个污染的核酸,或分离自一个或多个蛋白、一个或多个脂质)的核酸序列,这些成分在其天然来源中通常与该核酸相关联。分离的核酸是以不同于其天然中所见的形式或位置存在的核酸。相反,非分离的核酸是以其天然状态存在的核酸如DNA和RNA。例如,特定的DNA序列(如,基因)在宿主细胞染色体上发现接近邻近的基因;RNA序列,如编码特定蛋白的特定mRNA序列,在细胞中发现与编码许多蛋白的许多其它mRNA混合。但是,作为例子,含例如SEQ ID NO:1的分离核酸序列包括通常含有例如SEQ ID NO:1的细胞中所包含的这种核酸序列,核酸序列在染色体或染色体外的位置不同于天然细胞,或另外侧面有不同于天然的核酸序列。分离的核酸序列可以单链或双链的形式存在。当分离的核酸序列要用于表达蛋白时,该核酸序列将最少含有至少部分正义或编码链(即,核酸序列可以是单链的)。可选择地,可同时含有正义和反义链(即,核酸序列可以是双链的)。
术语″纯化的″指取自其天然环境(或其天然环境发成分)并被分离或分离的核酸或氨基酸序列分子。因此,″分离的核酸序列″可以是纯化的核酸序列。″实质上纯化的″分子至少60%、优选地至少75%、更优选地至少90%不含与其天然相关联的其它成分。如这里所用,术语″纯化的″或″纯化″也指从样本中去除杂质。杂质蛋白的去除引起样本中目的多肽百分比的升高。在另一个实例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,通过去除宿主细胞蛋白纯化多肽;样本中重组多肽的百分比因而升高。本发明预期不仅纯化的(包括实质上纯化的)而且未纯化的杂合酶。
术语含给定多核苷酸序列或多肽″的组合物″广泛地指含有给定多核苷酸序列或多肽的任何组合物。该组合物可包含水溶液。含编码GnTIII或其片段的多核苷酸序列的组合物可被用作杂交探针。在此情况下,编码GnTIII的多核苷酸序列代表性地用于含盐(如,NaCl)、清洗剂(如,SDS)和其它成分(如,Denhardt’s溶液、奶粉、鲑精DNA,等)的水溶液中。
术语″待测化合物″指能够用于治疗或预防病害、疾病、疾患或身体功能紊乱,或另外改变样本生理学或细胞状态的任何化学物、药剂、药品,等。待测化合物包括已知的和潜在的治疗化合物。待测化合物可以通过采用本发明的筛选方法确定要是治疗性的。″已知的治疗化合物″指在这种治疗或预防中已经显示有效的治疗化合物(如,通过动物试验或先前给予人类的经验)。
如这里所用,术语″反应″当用在测定时指产生可检测的信号(如,报告蛋白的累积,离子浓度增加,可检测化学产物的积累)。
术语″样本″以其最广泛的含义被使用。在一种含义中,它可以指动物细胞或组织。在另一种含义中,它意味着包括获取自任何来源的标本或培养物,以及生物学和环境样本。生物学样本可获取自植物或动物(包括人类),并包括液体、固体、组织和气体。环境样本包括环境原料如表面材料、土壤、水和工业样本。这些实施例并非要解释为限制可应用于本发明的样本类型。
术语″融合蛋白″指一种蛋白,其中至少一个局部或部分来自第一个蛋白,另一个局部或部分来自第二个蛋白。术语″杂合酶″指一种是功能酶的融合蛋白,其中至少一个局部或部分来自第一个种类,另一个局部或部分来自第二个种类。本发明优选的杂合酶是功能性糖基转移酶(或其部分),其中至少一个局部或部分来自植物,另一个局部或部分来自哺乳动物(如人)。
术语″导入细胞″就核酸(如载体)而言是要包括本领域称为的″转化″或″转染″或″转导″。细胞的转化可以是稳定的或暂时的,本发明试图在以下两个条件下导入载体,一方面是稳定表达的条件,另一方面仅暂时表达的条件。术语″暂时的转化″或″暂时地转化″指将一个或多个转基因导入细胞而转基因没有整合进宿主细胞基因组。暂时的转化可通过例如酶联免疫吸附试验(ELISA)检测,它检测存在由一个或多个转基因编码的多肽。可选择地,暂时的转化可通过检测由转基因(如,抗体基因)编码的蛋白(如,结合抗原的抗体)活性而得到检测。术语″暂时的转化株″指暂时地并入了一个或多个转基因的细胞。相反,术语″稳定的转化″或″稳定地转化″指引导并整合一个或多个转基因到细胞基因组中。细胞的稳定转化可通过细胞基因组DNA的Southern印迹杂交而检测,其核酸序列能够与一个或多个转基因结合。可选择地,细胞的稳定转化还可通过细胞基因组DNA的聚合酶链式反应(PCR)扩增转基因序列而被检测。术语″稳定的转化株″指在基因组DNA中已稳定地整合了一个或多个转基因的细胞。因此,稳定转化株与暂时转化株的不同在于,稳定转化株的基因组DNA含有一个或多个转基因,而暂时转化株的基因组DNA不含转基因。
″等分的寡糖″应当定义为一种寡糖,它含有例如两个甘露糖基团,另一个糖类部分附着在寡糖甘露糖残基上。等分寡核苷酸的例子在表1中给出。
发明的详细描述
在本发明植物宿主细胞中表达的GnTIII(例如,SEQ ID NO:1,图4A)是哺乳动物GnTIII。在特殊的实施方案中,GnTIII是人GnTIII(例如,SEQ ID NO:2,图4B)。在特殊的实施例中,GnTIII也可与哺乳动物GnTIII的氨基酸序列具有80%的同一性,更优选地至少大约90%,甚至更优选地至少大约95%,最优选地至少大约97%(此后称为″同源的多肽″),其在性质上保留该哺乳动物GnTIII的活性。除了目标多肽序列平均包括查询氨基酸序列的每100个氨基酸有达到5个的氨基酸改变以外,与查询氨基酸序列具有至少例如95%氨基酸序列″同一性″的多肽等同于查询序列。换句话说,为获得与查询氨基酸序列具有至少95%氨基酸序列同一性的多肽,相当于目标序列氨基酸残基的5%可被另一个氨基酸插入、删除或取代。参照序列的这些改变可发生在参照氨基酸序列的氨基或羧基末端位置,或这些末端位置间的任何地方,或者单独地散布在参照序列的残基间,或者在参照序列中呈一个或多个连续的基团。
确定查询序列(本发明的序列)与目标序列间最佳总体匹配,也称为全局序列联配,可以采用Brutlag等人的运算法则(Com.App.Biosci.6:237-245,1990)为基础的FASTDB计算机程序来测定。在序列线性排比中,查询和目标序列要么都是核苷酸序列,要么都是氨基酸序列。该全局联配的结果表示为同一性百分比。在FASTDB氨基酸排列中所用的优选参数是:矩阵=PAM 0,k-数组=2,错配补偿=1,连接补偿=20,随机选择基团长度=0,截断计分=1,窗口大小=序列长度,缝隙补偿=5,缝隙大小补偿=0.05,窗口大小=500或目标氨基酸序列的长度,无论哪个较短者。
如果由于N-或C-末端删除而非因为内部删除,目标序列短于查询序列,必须对结果进行手工修正。这是因为在计算总同一性百分比时,FASTDB程序不计算目标序列的N-和C-末端截断。对于在N-和C-末端截断的目标序列,相对于查询序列,同一性百分比是通过计算查询序列的残基数目来修正的,作为查询序列总碱基的百分比,这些残基是目标序列的N-和C-末端,但不与相应的目标残基匹配/定位。通过FASTDB序列线性排比的结果确定残基是否是匹配的/定位的。然后从同一性百分比中减去此百分比,通过上述FASTDB程序采用特定的参数计算以获得最终的同一性百分比计分。此最终的同一性百分比计分正是为本发明所用的。为手工调整同一性百分比计分,仅考虑目标序列不与查询序列匹配/定位的N-和C-末端残基。即,仅有查询残基位于目标序列最远的N-和C-末端残基之外。
在本发明植物宿主细胞中表达的GnTIII由核酸序列编码,后者与编码哺乳动物GnTIII氨基酸序列的核酸序列具有至少80%的同一性,更优选地至少大约90%,甚至更优选地至少大约95%,最优选地至少大约97%(此后称为″同源的多肽″),其在性质上保留该哺乳动物GnTIII的活性。核酸序列可以是RNA或DNA序列。
与本发明参照核苷酸序列具有95%″同一性″的多核苷酸等同于参照序列,除了包括编码多肽的参照核苷酸序列的每100个核苷酸平均有达到5个的点突变的多核苷酸以外。换句话说,为获得与参照核苷酸序列具有至少95%核苷酸序列同一性的多核苷酸,相当于参照序列中5%的核苷酸可被删除或另一个核苷酸取代,或相当于参照序列中总核苷酸5%的核苷酸数目被插入参照序列。查询序列可以是完整的序列、ORF(开放阅读框)或如这里所述的任何指定的片段。
为实用的目的,可以按惯例采用已知的计算机程序确定任何特定的核酸分子或多肽是否与本发明的核苷酸序列至少90%、95%、96%、97%、98%或99%相同。确定查询序列(本发明的序列)与目标序列间最佳的总体匹配,也称为全局序列联配法,可以采用以Brutlag等人的运算法则(Com.App.Biosci.6:237-245,1990)为基础的FASTDB计算机程序来测定。在序列联配中,查询和目标序列都是DNA序列。RNA序列可以通过转换U(尿苷)为T(胸腺嘧啶)进行比较。该全局序列联配的结果表示为同一性百分比。在FASTDB DNA序列线性排比以计算同一性百分比中所用的优选参数是:矩阵-单式的,k-数组=4,错配补偿=1,连接补偿=30,随机选择基团长度=0,截断计分=1,缝隙补偿=5,缝隙大小补偿=0.05,窗口大小=500或目标核苷酸序列的长度,无论哪个较短者。
本发明还包括与编码所述哺乳动物GnTIII的核酸序列杂交的多核苷酸。当单链形式的多核苷酸可以在适当的温度和溶液离子强度条件下退火为其它多核苷酸时(见,Sambrook等人,见上),多核苷酸与另一个多核苷酸″杂交″。温度和离子强度条件决定杂交的″严紧″。为初步筛选同源的核酸,可以使用相当于42℃温度的低严紧杂交条件,如,5X SSC,0.1%SDS,0.25%牛奶,和无甲酰胺;或40%甲酰胺,5X SSC,0.5%SDS)。中严紧杂交条件相当于55℃的较高温度,如40%甲酰胺及5X或6X SCC。高严紧杂交条件相当于65℃的最高温度,如50%甲酰胺,5X或6X SCC。尽管依杂交的严紧,碱基间的错配是可能的,但杂交需要两个核酸含有互补的序列。杂交核酸的适当严紧依赖于核酸的长度和互补的程度,其可变量为本领域熟知。两个核苷酸序列间相似性或同源性的程度越高,具有其序列的核酸杂交的Tm值(解链温度)越高。核酸杂交的相对稳定性(对应于较高的Tm)按下列顺序下降:RNA:RNA,DNA:RNA,DNA:DNA。
GnTIII和其它异源蛋白在植物宿主系统中的表达
在一个实施方案中,编码哺乳动物GnTIII或其它异源蛋白,如异源的糖蛋白或哺乳动物糖基转移酶的核酸可被插入适当的表达载体中,即,含有转录和翻译插入编码序列的必要元件的载体,或在RNA病毒载体情况下,含有复制和翻译的必要元件,以及可选择的标记物。这些元件包括但不限于启动子区、信号序列、5’非翻译序列、依赖于结构基因组是否装配有起始密码子、以及转录和翻译终止序列。获得这种载体的方法是本领域已知的(见WO01/29242的综述)。
适合于在植物中表达的启动子序列在本领域有描述,如WO91/198696。这些包括非结构性启动子或结构性启动子,如胭脂碱合成酶和章鱼碱合成酶启动子,花椰菜花叶病毒(CaMV)19S和35S启动子,和玄参花叶病毒(FMV)35启动子(U.S.专利No.6,051,753)。所用的启动子还可以是定向的组织特异启动子,例如靶向胚乳、糊粉层、胚芽、果皮、茎干、叶、核仁、块茎、根,等。
信号序列允许在适当的地方加工和转位蛋白。信号可以源自植物或可能为非植物信号序列。信号肽指引初生多肽到内质网,在此多肽随后进行翻译后修饰。信号肽可以由本领域的技术人员常规地确定。它们典型地具有三重结构,在N-末端具有正电荷的氨基酸,随后是疏水区,然后在疏水性还原区内有分裂位点。
转录终止常规地在转录起始调控区的相反末端。它可以与转录起始区相关联,或来自不同基因,并可被选择以增强表达。实例是来自土壤杆菌Ti质粒的NOS终止子和稻米α-淀粉酶终止子。还可添加聚腺苷尾。实例包括但不限于土壤杆菌章鱼碱合成酶信号(Gielen等人,EMBO.J.3:835-846,1984)或同一种类的胭脂碱合成酶(Depicker等人,Mol.Appl.Genet.1:561-573,1982)。
可包括增强子以增加异源蛋白的转录和/或使其最大化。这些包括但不限于肽输出信号序列,密码子应用,内含子,聚腺苷,和转录终止位点(见,WO01/29242)。
标记物包括除草剂抗性和原核生物可选择的标记物。这种标记物包括抗生素抗性,如氨苄青霉素,四环素,卡那霉素和大观霉素。特殊实例包括但不限于编码链霉素抗性的链霉素磷酸转移酶(spt)基因,编码卡那霉素或遗传霉素抗性的新霉素磷酸转移酶(nptIl)基因,编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。
构建的载体可采用本领域已知的程序导入植物宿主系统(综述于WO01/29242和WO01/31045)。载体可被修饰以介导含根癌土壤杆菌载体同源区的植物转化质粒,是来自根癌土壤杆菌的T-DNA边缘区。可选择地,本发明方法中使用的载体可以是土壤杆菌载体。导入载体的方法包括但不限于微注射,通过在微珠或粒子基质中或表面上带有核酸的微粒子高速生物弹穿透,和电穿孔。载体可被导入植物细胞、组织或器官中。在特殊的实施例中,一旦确定存在异源基因,植物可采用本领域已知的程序再生。
哺乳动物GnTIII的应用
哺乳动物GnTIII的表达得到糖蛋白上等分的N-聚糖。等分的N-聚糖对于某些哺乳动物糖蛋白的生物学活性是重要的。特别地,等分的单克隆抗体具有增强的ADCC(抗体-依赖的细胞毒性)。引入等分结构引起新的或最优化的功能性并增加糖蛋白的生物利用度,如因为肾脏清除的减少,触角类型的增加延长了半衰期。因此,本发明涉及含所述异源糖蛋白的植物宿主系统,该糖蛋白具有等分的寡糖,特别是等分的GlcNAc残基,以及涉及产生所述糖蛋白的方法。
此外,同野生型植物(植物N-聚糖含有远少于哺乳动物N-聚糖的GlcNAc残基)相比,植物中GnTIII的表达引起末端GlcNAc的急剧升高。植物中产生的植物糖蛋白或重组糖蛋白的N-聚糖上更多的GlcNAc残基与哺乳动物糖蛋白的N-聚糖相似。由于植物中GnTIII表达引入的植物N-聚糖(和植物产生的重组糖蛋白如Mabs)中的等分GlcNAc似乎防止了β-N-乙酰己糖胺酶对N-聚糖的降解。更多的GlcNAc残基意味着添加末端半乳糖的β(1,4)-半乳糖基转移酶(GalT)的更多受体底物。GnTIII和功能蛋白如转运子或可提供N-聚糖生物合成的(哺乳动物)酶或其功能片段共表达,如半乳糖基转移酶如GAIT,或GnTIII植物与GaIT植物的杂交,反之亦然,导致这些植物产生的半乳糖苷化糖蛋白增加。因此,本发明涉及含所述哺乳动物GnTIII和所述功能蛋白的植物宿主系统;该植物宿主系统可进一步包含异源糖蛋白,相对于不含所述哺乳动物GnTIII和所述功能蛋白的植物宿主系统产生的异源糖蛋白,其半乳糖苷化增加,并涉及产生所述植物宿主系统的方法和产生所述糖蛋白的方法。
通过接种具有土壤杆菌菌株的植物细胞或组织,或通过上述程序如电穿孔、微注射、在微珠或粒子基质中或表面上带有核酸的微粒子高速生物弹穿透和电穿孔,可以建立产生生产具有商业目的的剪接糖蛋白的稳定转化植物,所述的土壤杆菌菌株中含有载体,后者包含编码GnTIII、任选地N-糖基化修饰酶的核苷酸序列和编码商业目的的异源糖蛋白的核苷酸序列。可选择地,通过同时接种(共转化)两个或以上各自携带载体的土壤杆菌菌株,或直接用所述的载体共转化植物细胞或组织可以产生生产具有商业目的的剪接糖蛋白的稳定转化植物,所述的载体含有编码GnTIII、任选地N-糖基化修饰酶的核苷酸序列或编码商业目的的糖蛋白的核苷酸序列。可选择地,通过具有修饰的N-糖基化的植物与表达编码商业目的蛋白的核苷酸序列的植物的(多重)杂交可以产生生产具有商业目的的剪接糖蛋白的稳定转化植物。在所有这些过程中,载体还可以含有赋予选择剂抗性的核苷酸序列。
如本领域技术人员所知,为了获得涉及N-糖基化、GnTIII的蛋白和商业目的糖蛋白或多肽的满意表达,核苷酸序列可适应于宿主植物的特殊转录和翻译加工结构。例如,可导入编码区的沉默突变以改善密码子应用,并可使用特殊的启动子以在相关的植物组织中驱动所述基因的表达。可使用发育上调节的或能够随意诱导的启动子以保证在适当的时间表达,例如,仅在植物组织已从田里收获并被带至控制条件下之后。在所有这些情况下,应当选择那些在相同细胞中表达的糖基化修饰蛋白和商业目的糖蛋白的表达基因盒,以使期望的翻译后修饰为所述糖蛋白。
如上所述,在特殊的实施例中,能够用于本发明方法中的植物是烟草植物,或至少与烟草属相关的的植物,但是,发明也特别规定使用其它相对容易转化的植物,如拟南芥属或玉米,或与其相关的植物。使用浮萍为产生重组糖蛋白提供了特别的优势。植物通常是小且经植物萌芽无性繁殖的。然而,大多数浮萍种类具有更大型植物的所有组织和器官,包括根、茎干、花、种子和叶。浮萍作为一种普通液体溶液表面上的自由漂浮植物,可廉价和非常快速地生长,从中可以容易地收获之。它们还可以生长在富营养的废水上,产生有价值的产物而同时清洁废水以再利用。特别与药剂应用相关的,浮萍可以在储藏和控制的条件下在室内生长。例如,稳定转化的浮萍可以在与各自含(二元)载体的土壤杆菌菌株(共)接种后从组织或细胞再生,所述载体含有一个或多个编码N-糖基化修饰酶的目的核苷酸序列和/或编码商业目的异源糖蛋白的基因。例如,浮萍植物可包括Spirodella属、Wolffia属、Wolffiella属或Lemna属、浮萍、Lemnaminiscula和Lemna gibba。还有苔藓类如小立碗藓,因其可以在储藏的条件下廉价生长而提供一定的优势。另外,小立碗藓的单倍体基因组相对地易于操作。
在番茄果类中的表达也提供特别的优势。番茄可以在储藏和控制的条件下在温室中容易地生长,番茄果类的生物产量可以全年连续地大量收获。含目的糖蛋白的含水部分可以容易地从番茄果中分离出来,这使糖蛋白纯化比较容易。在其它作物贮藏器官中的表达也是吸引人的选择对象,包括但不限于玉米仁、马铃薯块茎和油菜籽或向日葵种子,在器官中为在适当位置的收获和加工技术提供了巨大的生物产量。就花蜜中分泌的糖蛋白的纯度和同质性而言,在花蜜中的表达提供了特殊的优势。
可选择地,含异源糖蛋白的植物与按照本发明含GnTIII和任选的至少一个功能性哺乳动物蛋白的植物杂交,所述功能蛋白如转运子或可生物合成通常在植物中不存在的N-聚糖的酶,从所述杂交中收获果实,并选择期望的子代植物,后者表达所述异源糖蛋白和表达GnTIII和任选地表达通常在植物中不存在的与哺乳动物样N-聚糖生物合成相关的功能性(哺乳动物)酶。此过程已知为异花授粉。在优选的实施例中,发明提供了按照本发明的方法,进一步包括选择期望的表达所述重组蛋白的子代植物,所述重组蛋白含有等分的寡糖,特别是半乳糖残基和/或半乳糖苷化增加。由于提供了这种植物,本发明还准备使用转基因植物产生期望的糖蛋白或其功能片段,特别地其中所述的糖蛋白或其功能片段含有等分的寡糖和/或半乳糖苷化增加。
本发明又提供了获得期望糖蛋白或其功能片段的方法,包括按照发明培养植物直至所述植物已达到可采集利用的阶段,例如当生长了足够的生物产量可以有效收获时,随后用本领域已知的确定技术收获所述植物并用本领域已知的确定技术分馏所述植物以获得分馏的植物原料,以及从所述分馏的植物原料中至少部分地分离所述糖蛋白。采用本领域已知的方法可筛选期望蛋白的存在,优选地采用检测生物学活性位点产生可检测信号的方式的筛选试验。此信号可直接地或间接地产生。这种检测的实例包括ELISA或放免试验。
由于GnTIII表达而导入的等分GlcNAc残基也可用来通过″阻断″活性糖苷酶如β-N-乙酰己糖胺酶防止N-聚糖中的糖类去除(降解),并防止其它糖类添加至N-连接的聚糖上(由″其它″后续的糖基转移酶基因驱动),如岩藻糖化作用、木糖化作用。通过控制定位(如通过提供其它亚细胞靶信号)和/或控制表达水平(如在单个转基因植物中可变化的水平或采用不同的启动子),可能调节糖型组合物。因此,在包含重组糖蛋白的植物糖蛋白中导入等分的GlcNAc残基抑制了糖类的掺入,通过阻断活性α-1,3岩藻糖转移酶抑制α-1,3-岩藻糖掺入,通过阻断α-1,4-岩藻糖转移酶抑制α-1,4-岩藻糖掺入,通过阻断β-1,2-木糖转移酶抑制β-1,2-木糖掺入,通过阻断β-1,3-半乳糖基转移酶抑制β-1,3-半乳糖掺入,以及通过阻断β-N-乙酰己糖胺酶的活性去除/降解添加到N-聚糖上的糖类,特别是末端GlcNAc残基,通过阻断β-1,4半乳糖苷酶抑制末端β-1,4-半乳糖的掺入(如专利申请WO01/31045所提供的,通过表达β-1,4-半乳糖基转移酶而添加)。因此以此方式,GnTIII的控制表达和等分GlcNAc残基的控制导入可被用来操纵糖型组合物和/或限制糖型的异质性。
GnTIII和GnTIII杂合蛋白的修饰
本发明进一步涉及包括哺乳动物GnTIII的催化部分和蛋白跨膜部分的分离杂合蛋白,所述蛋白存在于真核细胞的内质网或高尔基体内。发明还涉及修饰的哺乳动物GnTIII,其中跨膜区被去除,但含有保留信号如KDEL以在ER中保留所述GnTIII。
含有第一个酶的跨膜部分和第二个酶的催化部分的杂合酶的编码核酸序列可按如下获得。从第二个酶上去除编码跨膜部分的序列,保留编码第二个酶C-末端部分的核酸序列,后者包括催化位点。通过PCR分离或获得第一个酶跨膜部分的编码序列,并与第二个酶C-末端部分的编码序列连接。
通过去除编码跨膜片段的序列并用它代替蛋氨酸(翻译起始)密码子,以及通过在半乳糖基转移酶的最后密码子和终止密码子之间插入编码ER保留信号的核酸序列如编码KDEL(氨基酸残基序列:赖氨酸-天门冬氨酸-谷氨酸-亮氨酸)的序列,可获得保留在ER中的编码蛋白特别是酶如半乳糖基转移酶、甘露糖苷酶和N-乙酰葡萄糖胺转移酶的核酸序列(Rothman,1987)。
除控制表达以外,通过发展GnTIII酶部分的编码基因序列与其它糖基转移酶的跨膜区或存在于内质网(ER)或高尔基体膜内的酶/蛋白的跨膜区融合,或通过添加所谓的保留信号如但不限于KDEL以保留在ER中,也可控制GnTIII活性的重新定位。这种重新定位调节特定糖类添加到包括重组糖蛋白的糖蛋白的N-连接聚糖,并防止它们去除。
GnTIII跨膜区与例如但不限于GnTI(TmGnTI)、甘露糖苷酶II(TmManII)、木糖基转移酶(TmXyl)或α-1,3岩藻糖基转移酶(TmFuc)的跨膜区的交换,使GnTIII较早地表达并在图2的20至22位置导入等分的GlcNAc。这阻止后续的糖基转移酶,如木糖转移酶和岩藻糖转移酶,作用于底物引起缺少Xyl和Fuc的糖型的作用。重要地,通过β-1,4)-半乳糖基转移酶(GalT)作用添加末端半乳糖不受等分GlcNAc-的抑制。GalT的共表达(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)引起结构的相似,如图2中用20、21和22标注的箭头右侧所指示的。尽管缺乏免疫原性的木糖和岩藻糖残基,但这些结构仅有一个臂加工成复合型聚糖。为使其它臂也转换,除GnTIII重新定位外,甘露糖苷酶II(ManII)和GnTII也在高尔基体内重新定位以在聚糖加工程序中较早起作用。这可以几种方式确定。例如,通过以GnTI(TmGnTI)的跨膜区交换其各自的跨膜区,这引起重新定位到图2中指示为5的位置。可选择地,MarnII和GnTII都可以通过去除跨膜高尔基靶区域并提供剩余的具有ERC-末端保留信号(如,氨基酸残基KDEL)的酶片段而重新定位于ER。然后,表达GaIT(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)以及重新定位型的GnTIII(如TmXyl-GnTIII)、ManII(如TmGnTI-ManII)和GnTII(如TmGnTI-GnTII)的植物可以与表达目的重组糖蛋白的植物杂交(图3),或可以用编码目的糖蛋白的基因如编码抗体的基因重新转化。这可以产生重组糖蛋白,它具有含末端半乳糖残基的等分聚糖但缺乏木糖和岩藻糖。转化过程和杂交(相互授粉)过程描述于上。
在另一个实施方案中,具有甘露糖苷酶H(TmManII-GnTIII)或木糖转移酶(Tmxyl-GnTIII)跨膜区的GnTIII与TmXyl-GalT、TmGnTI-GnTII、TmGnTI-ManII结合。此结合可通过共表达获得,或经异花授粉通过相关基因的结合而获得,并得到在核心序列上缺少木糖和岩藻糖、但在三甘露糖核心上具有等分GlcNAc残基以及具有末端半乳糖的糖蛋白,包括重组糖蛋白。
实施例
评价了植物中导入GnTIII对植物糖蛋白聚糖上出现等分寡糖的影响。克隆人GnTIII基因,提供C-末端c-myc标记以分析标记的融合蛋白的表达,这些全部处于植物调控元件的控制之下以在烟草中导入。已显示,GnTIII在植物中表达,且该表达在内源性植物糖蛋白上产生等分寡糖结构。含至少两个GlcNAc残基的N-聚糖量超过普通烟草植物两倍。显著地,如对内源性植物糖蛋白的分离聚糖的基质辅助的激光解吸离子化飞行时间质谱(MALDI-TOF)分析所见,GnTIII的表达还引起复合型N-聚糖降解产物的显著下降。这些数据提示,烟草中可引起N-聚糖上导入等分结构的GnTIII的表达防止聚糖被β-N-乙酰己糖胺酶降解。在代表性地存在于三甘露糖核心(Man-α-1-3和Man-α-1-6)上的其它GlcNAc-β1-2连接中,β-N-乙酰己糖胺酶对非还原的末端GlcNAc和β-N-乙酰葡萄糖胺(GaINAC)裂解具有广泛的特异性。
实施例1
质粒和植物转化。PAC克隆RP5-1104E15 GnTIII(SEQ ID NO:1,图4A)从PieterJ.de long,Children’s Hospital Oakland Research Institute(CHORI)处获得,并可以从Sanger中心索取获得,作为克隆组HBRC_l.sc的部分。克隆源自男性人类血液并可以经http://www.sanger.ac.ulc/Teams/Team63/CloneRequest/(来自人染色体22q12.3-13.1;The Wellcome Trust Sanger Institute,Wellcome Trust Genome Campus,Hinxton,Cambridge,CBK)ISA,UK;www.sanger.ac.uk)索要。
人GnTIII基因从所述PAC克隆采用AccuTaq LA DNA聚合酶(SigmaAldrich)和引物GNT3F(5’atactcgagttaacaatgaagatgagacgct-3’;SEQ ID NO:3)和GNTSRmyc(5’-tatggatcctaattcagatcctcttctgagatgag-3’;SEQ ID NO:4)通过PCR克隆。寡聚物来自Eurogentec(Belgium)。PCR在PerkinElmerCetus 480热循环仪(ABI/PE)上按照厂家说明采用AccuTaq聚合酶的最佳条件进行。得到的片段被克隆进pBluescribe SK+(Stratagene,Inc.,La Jolla,CA USA)的EcoRV位点,并验证序列。特别地采用如所描述的荧光标记双脱氧核苷酸(Sanger等人,“采用双脱氧链末端抑制剂的DNA测序″Proc.Nat.Acad.Sci.USA 74:5463-5467,1977)进行测序,反应混合物在Applied Biosystems 370A或380自动化DNA测序仪上运行。数据采用可在网上免费获取的不同软件模块进行分析,并与数据库中存在的人GnTIII DNA序列进行比较。
随后,含C-末端c-myc标记的GnTIII基因的1.6kb Hpal/BamHI片段被克隆进pUCAP35S的Sma/BglII位点(Van Engelen等人,″抗体亚单位基因的并列表达在转基因烟草的根内产生高水平的功能抗体″Plant Molecular Biology 26:1701-1710,1994),并命名为pAMV-GnTIII。具有修饰的GnTIII基因的花椰菜花叶病毒35S(CaMV35S)20启动子表达基因盒随后被克隆作为二元载体pBINPLUS中的AscI/PacI片段(VanEngelen等人,″抗体亚单位基因的并列表达在转基因烟草的根内产生高水平的功能抗体″Plant Molecular Biology 26:1701-1710,1994),得到pBINPLUSGnTIII,并通过电穿孔导入根癌土壤杆菌株Ag10。烟草品种Samsun NN的转化如前所述(Horsch等人,″转移基因进入植物的简单和通用的方法″Science 227:1229-1231,1985)。如所述选择16个独立的转基因植物并在温室中养至成熟。分析叶子原料表达的GnTIII(SEQ ID NO:2,图4B)和内源性细胞糖蛋白的聚糖组合物。
实施例2
表达分析。烟草叶的总蛋白提取物按前面的描述制备(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)。样本中存在的蛋白量通过Bradford方法(Bradford,M.M.,″利用蛋白-染料结合原理定量微生物蛋白量的快速和敏感的方法″Anal Biochem 72:248-254,1976)采用牛血清白蛋白作为标准品来进行评估。在预制的10或12%SDS-PAGE凝胶(Bio-Rad)上,固定量的蛋白样本在还原条件下跑电泳。彩虹色的分子量蛋白标记物来自Amersham。Western印迹分析基本上如所述进行(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad. Sci.USA 98:2899-2904,2001)。分离的蛋白用Bio-Rad Mini Trans-blot电泳转移杯在3[环己氨基]-1-丙磺酸(CAPS)缓冲液中60min被转移到硝酸纤维素(BA85,Schleicher和Schuell或Trans-Blot转移介质,Bio-Rad)上。采用过氧物酶标记的c-myc抗体,通过亲合印迹分析GnTIII-c-myc融合蛋白的表达。通过用生物素化血球凝集性植物血凝素(E-PHA;Vector Laboratories)孵育,显现内源性烟草糖蛋白中等分寡糖的导入。采用Roche的Lumi-Light Western印迹底物(Roche Diagnostics GmbH,Mannheim,Germany),在Lumi-Imager F1装置(BoehringerMannheim GmbH,Mannheim,Germany)上用LumiAnalyst软件(3.0版)通过增强的化学发光进行检测。
实施例3
基质辅助的激光解吸离子化时间飞行质谱(MALDI-TOF)质谱分析。为分析聚糖结构,从用人GnTIII(GnTIII-17)转化的所选植物烟草叶中分离细胞蛋白。如所述(Elbers等人,2001)进行蛋白分离和N-聚糖的制备。如所述,N-聚糖在质谱分析前在无孔的石墨化碳-黑柱(Carbograph Ultra Clean Tubes,Alltech Associates)上脱盐。在Micromass(Manchester,U.K.)Tof spec E MALDI-TOF质谱仪上检测MALDI-TOF光谱。基本上如所述(Elbers等人,2001),通过采用2,5-二羟苯甲酸作为基质以正性模式进行质谱。
人GnTIII的表达在N.烟草的内源性糖蛋白上导入了等分N-聚糖。人GnTIII通过土壤杆菌介导的二元载体pBINPLUSGnTIII转化导入烟草植物中,所述载体含载有完全编码序列的cDNA,编码序列在结构性CaMV35S启动子控制下与C-末端c-myc标记融合。获得了60个独立的卡那霉素抗性选择的转基因苗,用c-myc抗体分析GnTIII-c-myc融合蛋白的表达。分析显示,所有苗均以不同的水平表达基因。选择14株,生根并转移至温室。采用c-myc抗体选择的高表达GnTIII-c-myc融合蛋白的一株植物(GnTIII-17),被采用与生物素化植物血凝素E-PHA的特异性结合试验来分析内源性烟草糖蛋白的N-聚糖上等分GlcNAc残基的出现。蛋白提取物的SDS-PAGE后转移到硝酸纤维素上,并采用与生物素化E-PHA植物血凝素的特异性结合试验进行分析,显示GnTIII-17的内源性烟草糖蛋白含有等分寡糖而对照烟草则不含。GnTIII-17在温室内繁殖以进一步通过MALDI-TOF详细分析聚糖的结构。
实施例4
在野生型和选择的转基因GnTIII-17烟草植物中的寡糖分布和等分复合体寡糖的水平。从对照烟草植物和选择的GnTIII-17植物的嫩叶中分离内源性糖蛋白,以详细调查人GnTIII的表达对N-连接于糖蛋白的聚糖结构的影响。用图1所示的MALDI-TOF比较分离自糖蛋白的N-聚糖结构,糖蛋白存在于对照野生型烟草植物叶和GnTIII-17植物叶中。MALDI-TOF可以检测N-聚糖(糖型)库中不同的分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Mans到n、Man9,后者的范围从截短结构的a、XM3GN2到m、GN3FXM3GN2(结构见表1;数据总结见表2)。除了对照植物N-聚糖特征外(图1A),来自GnTIII-17植物的聚糖混合物(图1B)的MALDI-TOF MS显示至少两个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表1和表2)。这些寡糖,GN3XM3GN2(i)和GN3FXM3GN2(k)各自代表总体的8%和31%,含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。
如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2XM3GN2和GN2FXM3GN2结构是否具有等分寡糖或其程度。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。
根据观察的过度表达GnTIII的CHO细胞的致死率(Umana等人,″具有最优化的抗体-依赖的细胞毒活性的抗成神经细胞瘤IgGl的加工糖型”Nature Biotechnology17:176-180,1999),引人注目地,具有显著量等分聚糖的转基因植物看起来表型是完全正常可以授粉(能够异花授粉和自授粉)。
实施例5
人GnTIII在烟草中的表达似乎能防止N-聚糖被D-N乙酰己糖胺酶降解并使末端N-葡糖胺化(glucosaminylation)加倍。提取物的MALDI-TOF分析清楚地显示,经GnTIII酶的作用,在细胞烟草蛋白的复合型N-连接聚糖中,至少糖型总体的40%现在具有等分GlcNAc。而且,GnTIII-17内源性糖蛋白的复合型N-连接聚糖总体的70%具有两个或三个末端GlcNAc残基,相比野生型烟草大约为30%(表1)。观察到的在烟草中表达GnTIII时至少40%等分复合型N-连接聚糖的重新合成(图1B,表1和表2),与大部分的FXM3GN2(b,从30%至4%)和GNFXM3GN2(f,从10至2%)的消失及较小程度的GN2FXM3GN2(j,从29%至19%)的消失一致。另外,这还与GN2XM3GN2(h)从野生型烟草中的4%显著地增至GnTIII-17中的14%相一致。是否后面GnTIII植物中的GN2XM3GN2(h)具有第二个GlcNAc与N-连接聚糖三甘露糖核心的β-连接甘露糖相连,从而得到GnTIII活性,或与三甘露糖核心的第二个α-连接的甘露糖相连,仍有待研究(见上)。
由于缺少GnTI活性的拟南芥属突变体在内源性糖蛋白的N-聚糖中不含木糖和岩藻糖残基,野生型烟草植物中占N-连接聚糖40%的糖类a、b和c被认为是获得GnTI活性后来自内源性烟草糖蛋白成熟聚糖的降解产物(Von Schaewen等人,″分离缺少N-乙酰葡萄糖胺转移酶I且不能合成高尔基体修饰的复合体N-连接聚糖的阿布属植物突变体″Plant Physiology 102:1109-1118,1993)。GnTIII-17中这些结构的7倍减少(40%>6%)以及GNXM3GN2和XM3GN2的3倍下降(12%>4%)提示,导入等分GlcNAc防止成熟的N-连接聚糖被内源性糖苷酶,特别是去除末端GlcNAc的β-N乙酰己糖胺酶降解。期望由成熟,全长N-连接聚糖降解产生的N-连接聚糖的总量因此减少了5倍(从52%至10%)。
实施例6
玉米转化的载体构建和DNA制备。通过以下方法用PCR从质粒pAMV-GNTIII获得人GNTIII基因及其3’c-myc免疫检测标记。设计和合成分别与hGNTIFI基因5’和3’端同源的引物MS20和MS19,以在基因3’端添加Pmel位点和终止密码子。
MS20(5’Ncol位点):5’-CCATGGTGATGAGACGCTAC-3’(SEQ ID NO:5)
MS19(添加终止和Pmel位点3’):5’-GTTTAAACCTAGGATCCTAATTCAGATCCTCT-3’(SEQ ID NO:6)
在凝胶电泳确定正确大小的PCR产物后,用QIAquick Gel ExtractionKit(Qiagen,Valencia,CA)从凝胶中回收1.6kbp的PCR产物。用Ncol和Pmel消化含Zmubi/GUS/per5基因盒(Christensen等人,Plant Molec.Biol.18:675-689,1992)的质粒4005(见,SEQ ID NO:8)(图5A和5B)以释放GUS基因,用QIAquick GelExtraction Kit(Qiagen,Valencia,CA)从凝胶中回收载体片段。
用Ncol和Pmel消化后,PCR来源的hGNTIII片段与用Ncol和Pmel消化pDAB4005后留下的载体片段连接以产生中间体质粒pDAB7119(见SEQ ID NO:9)(图6A和6B)。用Spel和Sphl切割中间体质粒pDAB7119以释放hGNTIII植物表达基因盒,用T4 DNA聚合酶处理之以产生平端。
含RB7 MAR序列的质粒pDAB8504(SEQ ID NO:10)(见图7A和7B)被Srfl消化并用T4 DNA聚合酶钝化末端。用小牛肠磷酸酶处理后,连接处理的8504片段和hGNTIII植物表达基因盒以产生质粒pDAB 7113(SEQ ID NO:10)(见图8A和8B),它含有与目的基因和可选择标记基因盒侧面连接的RB7 MAR序列,如:RB7 MAR//Zmubi启动子/hGNTIII/per5 3’UTR//稻米肌动蛋白启动子(D.McElroy等人,″分离有效的肌动蛋白启动子用于稻米转化″The Plant Cell 2:163-171,1990)/PAT/Zm脂肪酶3’UTR//RB7MAR。
通过测序检验GNTIII序列的完整性(Big Dye Terminator Cycle SequencingReady Reaction,Applied Biosystems,Foster City,CA),证实编码人GNTIII酶。发现了一个碱基改变,G384->384,但此取代不影响编码的氨基酸,脯氨酸128。
质粒pDAB7113在2L培养基(LB+氨苄)中生长并用Qiagen质粒Giga试剂盒纯化以产生5毫克纯化的质粒用于转化植物细胞。
实施例7
玉米细胞转化。质粒pDAB7113被用WHISKERS-介导的DNA转移导入玉米细胞,基本上如以下这些引用文献所描述,(Frame,B.等人,″通过碳化硅强化水晶-介导的转化产生可繁殖的转基因玉米植物″Plant J.6:941-948,1994;Thompson,J.等人,″利用碳化硅强化水晶的玉米转化:综述″Euphytica 85:75-80,1995;P.Song,C.Q.Cai,M.Skokut,B.Kosegi,和J.Petolino,″定量的实时PCR作为筛选工具在强化水晶-来源的转基因玉米中估计转基因拷贝的数目″Plant Cell Rep.20:948-954,2002;它们均在此引入以供参考)。
强化水晶介导的转化日前,形成胚芽的玉米悬浮细胞培养物在培养基G-N6(N6培养基含30gm/L蔗糖,100mg/L肌醇,和2mg/L 2,4-D)中传代培养。在实验日,细胞用渗压剂通过与含甘露醇和山梨醇各0.2摩尔的G-N6培养基一起振摇30分钟预处理。36ml细胞转移至含50ml G-N6培养基的250ml离心瓶中,其中添加8.1ml 5%(w/v)的碳化硅强化水晶培养基悬液(Silar SC-9,Advanced Composite Materials,Greer,S.C.),加170μl 1mg/ml的质粒溶液(TE缓冲液)。含细胞、强化水晶和DNA的离心瓶在改良的Red Devil牌涂剂搅拌器上剧烈搅动10秒。然后,强化水晶化的细胞在添加一半水平渗压剂的培养基中振摇两个小时。通过消毒的Buchner漏斗过滤回收针状单晶化的细胞,滤纸置于半固体G-N6培养基上1周。1周后,滤器移到含1mg/L Herbiace(20%bialaphos的商业配方,Meiji Seika,Tokyo,Japan)的半固体G-N6培养基上。两周后,从滤纸上去除细胞,与溶化的也含7gm/L Seaplaque琼脂糖(BioWhittaker.Rockland,Maine)的G-N6+1mg/L Herbiace(G-N6+1H)培养基混合,并铺在G-N6+1H固体培养基上面。平板在暗处30℃培养。植入后5-7周回收抗选择剂的克隆,并单独转移至新鲜的G-N6+1H培养基上以进一步增加组织量。
实施例8
插入DNA拷贝数目的分子分析。每个转基因分离物的组织单独在冷冻干燥机中冻干,并通过标准的方法(DNAeasy 96 Plant Kit,Qiagen)提取DNA。插入的转基因DNA的拷贝数目通过可从Third Wave Technologies(Third Wave Technologies,Madison,Wisconsin,twt.com)获得的Invader操作系统来评估。通过Third Wave Technologies公司特别地为PAT可选择标记设计引物,其拷贝数目相对于内源性玉米α-微管蛋白基因的基因组DNA拷贝数目进行评估。
实施例9
检测转基因玉米胼胝由于表达Gntlll基因而改变的与植物血凝素的结合。按如下方法对100个单独分离的独特转基因试验中获得的胼胝样本进行提取。每个试验的样本新鲜冷冻于96孔的集簇管盒(Costar 1.2ml聚丙烯,带盖)中,每孔内有钢和钨珠。每孔加入450μl提取缓冲液(25mM磷酸钠pH6.6,100mM NaCl,30mM硫酸氢钠,1%v/vTriton X-100),在Kleco Bead Mill上3分钟全速将样本盒研磨成粉。平板2500rpm离心(4℃)10分钟。提取物移到96孔深孔板中,冷冻贮藏。所有筛选试验在这些独立试验的提取物上进行。
进行蛋白分析(微量滴定板方案,BioRad 500-0006)以确定每次提取的总蛋白。每个样本25μg蛋白放入20μl上样缓冲液(Laemmli,U.K.Nature 277:680(1970))中。在Tris/氨基乙酸/SDS电泳缓冲液(BioRad 161-077)中以65mA电泳凝胶(4-20%Criterion PAGE凝胶,12+2孔,BioRad 345-0032)。在转移缓冲液(电泳缓冲液加20%v/v甲醇)中浸泡10分钟后,用半干的吸水纸(150mA/1.5hrs)将凝胶移到硝酸纤维素膜上。在阻断缓冲液(20mM Tris,144mM NaCl,0.5%v/v Tween 20,10%vv/v脱脂奶粉)中室温孵育膜30分钟,然后去除阻断缓冲液并用含2.5μg/ml初始检测植物血凝素(菜豆属红细胞凝集素E,生物素化的,Vector Laboratories B-1125)的阻断缓冲液置换。初始检测植物血凝素在膜上室温孵育1小时。去除初始检测溶液,用阻断缓冲液冲洗膜一次,加入第二检测溶液(抗生物素蛋白-HRP,BioRad 170-6528,1∶5000,加分子量标记检测剂,StrepT肌动蛋白-HRP,BioRad 161-0380,1∶10,000的阻断缓冲液。第二检测试剂在膜上室温孵育1小时。在阻断、第一和第二试剂步骤过程中,溶液在印迹上混合。然后,去除第二检测试剂,用含0.5%Tween 20的Tris缓冲盐(20mM Tris,144mM NaCl)冲洗膜3次,每次10分钟,再一次5分钟。滴干多余的冲洗溶液后,印迹在底物ECL(Pierce 34080)中浸湿1分钟,排去过剩的ECL溶液,将膜与胶片接触。每个凝胶中包括阴性对照以区别现在转基因胼胝提取物上这种检测等分聚糖的植物血凝素试剂可以显现的新糖蛋白带。
E-PHA结合的阳性试验结果(表5)被定为0(阴性)、1(1个加号,弱)、2(2个加号,中等强度)或3(3个加号,最强等级)。选择定为2或3的胼胝以产生质量分析的样本。汇集样本25、26、33、48、55、56和59以产生用于聚糖亚结构MALDI-TOF分析的蛋白提取物。凝胶印迹实施例(图12)显示样本19至27。
实施例10
检测转基因玉米胼胝的c-myc抗原决定簇表达。按如下方法对100个单独分离的独特转基因试验中获得的胼胝样本进行提取。每个试验的样本新鲜冷冻于96孔集簇管盒(Costar 1.2ml聚丙烯,带盖)中,每孔内有钢和钨珠。每孔加入450μl提取缓冲液(25mM磷酸钠pH6.6,100mM NaCl,30mM硫酸氢钠,1%v/v Triton X-100),在KlecoBead Mill上3分钟全速将样本盒研磨成粉。平板2500rpm离心(4℃)10分钟。提取物移到96孔深孔板中,冷冻贮藏。所有筛选试验在这些独立试验的提取物上进行。
进行蛋白分析(微量滴定板方案,BioRad 500-0006)以确定每次提取的总蛋白。每个样本25μg蛋白放入20μl上样缓冲液(Laemmli,U.K.Nature 277:680(1970))中。在Tris/氨基乙酸/SDS电泳缓冲液(BioRad 161-0772)中以65mA电泳凝胶(4-20%Criterion PAGE凝胶,每胶12+2孔,BioRad 345-0032)。在转移缓冲液(电泳缓冲液加20%甲醇)中浸泡10分钟后,用半干的吸水纸(150mA/1.5hrs)将凝胶移到硝酸纤维素膜上。在阻断缓冲液(20mM Tris,144mM NaCl,0.5%v/v Tween 20,10%vv/v奶粉)中室温孵育膜30分钟,然后去除阻断缓冲液并用初始检测试剂置换,阻断缓冲液中含鼠抗c-myc克隆9E10(sigma M5546)1μg/ml。室温孵育1小时后,去除初始检测试剂,用阻断缓冲液冲洗膜。然后加入第二检测试剂,1∶10,000的抗鼠-HEP(BioRad170-6516)加1∶10,000的分子量标记检测试剂(StrepT肌动蛋白-HRP,BioRad161-0380)的阻断缓冲液,在膜上室温孵育1小时。在阻断、第一和第二试剂步骤过程中,溶液在印迹上混合。去除第二检测试剂,用含0.5%Tween 20的Tris缓冲盐(20mMTris,144mM NaCl)冲洗膜3次,每次10分钟,另加一个5分钟冲洗。排去过剩的冲洗溶液后,膜在ECL试剂(Pierce 34080)中浸湿1分钟,排干液体,然后接触胶片。
如上详述的,来自独立试验1-100的胼胝样本筛选c-myc抗原决定簇的表达。然后,分析样本3、11、12、26、31、55和64,显示存在预测分子量范围50-55千道尔顿的带。汇集这些胼胝样本以产生用于MALDI-TOF聚糖分析的蛋白样本。代表性的印迹显示于图13。
实施例11
制备用于聚糖质谱分析的提取物。从几个玉米胼胝试验的组合胼胝中制备样本,根据植物血凝素印迹试验采用E-PHA检测这些胼胝为GnTIII转基因表达阳性。新鲜收集胼胝组织并-80℃冷冻贮藏,然后在液氮中使之成为细粉末。称重的样本加入提取缓冲液(5mM EDTA,0.5mM PMSF,20mM亚硫酸氢钠,150mM磷酸钠缓冲液pH7.4,和0.4mMPVPP可溶的MW 40,000)中,4℃搅拌30分钟。5000xG 4℃离心后,收集上清。在上清中添加硫酸铵和冲洗缓冲液(5mM EDTA,150mM磷酸钠缓冲液,pH7.4)至终浓度为20%(w/v)硫酸铵。5000xG 4℃离心5分钟后,将上清移至新鲜管中,另外加入硫酸铵和冲洗缓冲液至60%(w/v)硫酸铵。此制剂4℃搅拌过夜,然后以10,000xG离心20分钟。在5ml冲洗缓冲液中回收沉淀,-80℃冷冻,然后在4℃冻干至干燥。样本送到实验室进行聚糖分析。
实施例12
玉米植物从转基因胼胝组织的再生。为从转化的胼胝中再生植物,组织置于再生培养基上,培养基含MS基础盐和维生素(Murashige T.和F.Skoog,Physiol Plant15:473-497,1962),30g/l蔗糖,5mg/l 6-苯甲基氨基嘌呤(BA),0.025mg/l 2,4-二氯苯氧基乙酸(2,4-D),1mg/l Herbiace(20% bialaphos的商业配方,Meiji Seika,Tokyo,Japan),和2.5g/l Gelrite,pH5.7。培养物在日光下生长。当幼苗达到1-3cm长时,转移进含SH基础盐和维生素(Schenk R和A.C.Hildebrandt,Can J Bot50:199-204,1972)、10g/l蔗糖、1g/l肌醇和2.5g/l Gelrite pH5.8的容器中。
通过植物血凝素E-PHA与内源性蛋白结合的改变筛选表达GNTIII的植物。然后筛选结合E-PHA的样本,如实施例9中所述,见上。完全按照下面实施例13的描述制备胼胝样本的蛋白提取物和20%/60%硫酸铵沉淀。通过植物血凝素印迹试验筛选表达GNTIII基因的一个植物,每一个植物分别再生自23个独立试验。这些试验中的4个产生E-PHA结合的阳性信号。这4个试验在胼胝阶段也检测为阳性。汇集再生自那4个试验的植物以产生通过MALDI-TOF进行聚糖分析的蛋白提取物。
实施例13
在野生型和选择的转基因玉米胼胝中的寡糖分布和等分复合体寡糖的水平。从对照玉米胼胝和根据植物血凝素印迹试验采用E-PHA选择的表达GnTIII的玉米胼胝中分离内源性糖蛋白。另外,本发明还试图提取c-myc标记的样本。E-PHA和c-myc标记的样本可以是胼胝、植物细胞、植物组织或完整的植物,如上面定义部分所定义的。从胼胝中存在的糖蛋白中分离的N-聚糖的结构比较见图9A和9B。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Man5到1、Man8,后者的范围从截短结构的a、XM3GN2到m、bGN3FXM3GN2(见表3)。除了对照胼胝N-聚糖的特征外(图9A),来自选择的表达GnTIII的玉米胼胝的聚糖混合物(图9B)的MALDI-TOF MS显示至少一个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表3)。此GN3XM3GN2(m)寡糖代表总体的20%并含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2XM3GN2(h)和GN2FXM3GN2(k)结构是否具有等分寡糖或其程度。同非转化的对照玉米细胞相比,两者均在GnTIII玉米细胞中增加了数量。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。
除了GnTIII玉米中出现糖类结构m(bGN3FXM3GN2)以外,如表3所示,从对照和GnTIII玉米的糖型比较中明显看到,带有高甘露糖型N-聚糖(M4及更高)结构的量下降了超过两倍(从19%到7%),这可能主要是由于GnTIII玉米与对照玉米相比含M4的N-聚糖减少(从10%到总数的1%)。另外,具有两个或以上GlcNAc残基的糖型的量从16%增加到42%(对照相比GnTIII)。
在跟踪实验中,从对照玉米胼胝和根据Western印迹试验分析存在c-myc标记序列而选择的表达GnTIII的玉米胼胝中分离内源性糖蛋白。从胼胝中存在的糖蛋白中分离的N-聚糖的结构比较见表4。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示对照玉米中被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Man5到1、Man8,后者的范围从截短结构的a、XM3GN2到k、GN2FXM3GN2。
显著地,在表达GnTIII的转基因玉米中(表4,GnTIII-2),只有3种异构体可被检测:FXM3GN2(b;占总量的9%),GN2FXM3GN2/bGN2FXM3GN2(k;占38%)和bGN3FXM3GN2(m;占54%)。尚不清楚描述为k(GN2FXM3GN2/bGN2FXM3GN2)的结构是否具有等分寡糖以及其程度如何。同对照玉米相比,GnTIII玉米中它的存在显著增加。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。
除了GnTIII玉米中出现的糖类结构m(bGN3FXM3GN2)之外(54%),如表4中总结的,从对照和GnTIII玉米的糖型比较中明显看到,相对于对照玉米,GnTIII玉米中带有高甘露糖型N-聚糖(M4及更高)结构的量降至0。另外,具有两个或以上(3)GlcNAc残基的N-聚糖总量从16%增加到92%(对照比GnTIII),提示导入等分GlcNAc残基防止了以前在转基因GnTIII烟草观察到的内源性己糖胺酶对聚糖的降解。
另外,MALDI-TOF质谱数据(图11)证实了等分GlcNAc结构。
实施例14
在野生型和选择的转基因玉米植物中的寡糖分布和等分复合体寡糖的水平。从对照玉米植物叶和选择的表达GnTIII的玉米植物叶中分离内源性糖蛋白,根据Western印迹试验或采用E-PHA的植物血凝素印迹试验分析存在c-myc标记序列选择玉米。从叶子中存在的糖蛋白中分离的N-聚糖的结构比较见表6。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+或(M+K)+加合物的离子混合物,高甘露糖型N-聚糖的范围从f、Man6到h、Man8,成熟N-聚糖的范围从截短结构的a、XM3GN2到对照玉米植物中的g、GN2FXM3GN2和转基因GnTIII玉米植物中的i,bGN3FXM3GN2。
除了对照植物N-聚糖特征外(图A),来自选择的表达GnTIII的玉米植物的聚糖混合物(图B)的MALDI-TOF MS显示至少一个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表6)。此GN3XM3GN2(i)寡糖代表总体的15%并含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2FXM3GN2(g)结构是否具有等分寡糖或其程度。同对照玉米植物相比,它在GnTIII玉米中增多(23%相比对照的5%)。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。除此以外,如表6所述,从对照和GnTIII玉米植物的糖型比较中明显看到,带有FXM3GN2结构的量下降了两倍(从59%到30%),具有两个或以上GlcNAc残基的糖型量从5%增加至38%(对照比GnTIII)。
此外,图14显示从对照玉米(A)和选择的GnTIII-玉米植物叶中分离的糖蛋白N-聚糖的MALDI-TOF质谱比较。GnTIII玉米植物通过用人GnTIII基因序列转化而获得,通过Western印迹试验采用c-myc标记或E-PHA植物血凝素进行选择。结构和缩写见表6。
应当理解,本发明并不限于这里描述的特定方法学、方案、细胞系、载体和试剂等,因为这些可改变。还应当理解,这里所用的术语仅仅是为了描述特定实施例而使用,并非要限制本发明的范围。必须注意到,如这里和附加权利要求中所用的,单数形式的″一个″和″该″包括复数的含义,除非文中另有明确规定。
除非另外说明,这里所用的所有技术和科学术语与本发明所属的领域内普通技术人员通常理解的含义相同。
这里声明和描述的发明并非要通过这里公开的实施例限制范围,因为这些实施例意图作为本发明几个方面的例证。任何相当的实施例预期在此发明的范围内。确实,本领域技术人员从前面的描述中很清楚本发明在这里所显示和描述之外的各种修改。这些修改也预期在附加权利要求的范围内。
这里引用了许多参考文献,其公开发表物在此全部引入以供参考。
表1.从对照和选择的GnTIII-17植物中分离的N-聚糖总库的结构、分子量和百分比。
表2.从对照烟草和选择的GnTIII-17植物中分离的内源性糖蛋白N-聚糖的质谱(MALDI-TOF)分析结果的比较.见表1.
表3.对照和转基因GnTIII玉米中观察的N-聚糖纵览
比较对照的非转化玉米和能被标注的表达GnTIII的转基因玉米胼胝中发现的内源性糖蛋白的N-聚糖结构(总数的%)。经MALDI-TOF分析获得的相应质谱在下面举出,糖类在″名称″栏下表示。等分的GlcNAc残基被描述为bGN。
表4.在对照和转基因GnTIII玉米-2中观察的N-聚糖图解纵览.
比较对照的非转化玉米和能被标注的表达GnTIII的转基因玉米胼胝中发现的内源性糖蛋白的N-聚糖结构(%总数)。转基因玉米用c-myc标记选择。经MALDI-TOF分析获得的相应质谱在下面举出,糖类在″名称″栏下表示。等分的GlcNAc残基被描述为bGN。
表5.E-PHA结合的阳性试验结果.
表6.在对照和转基因GnTIII玉米植物中观察的N-聚糖图解纵览.
序列表
<110>国际植物研究所
<120>GNTIII在植物中的表达
<130>62862A-P033313WO
<150>US-60/365,769
<151>2002-03-19
<150>US-60/368,047
<151>2002-03-26
<160>27
<170>PatentIn version 3.2
<210>1
<211>1642
<212>DNA
<213>人类
<400>1
ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca 60
tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct 120
ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg 180
ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc 240
tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc 300
tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac 360
ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg 420
ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg 480
ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac 540
ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg 600
tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc 660
tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt 720
ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg 780
gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg 840
gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg 900
gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg 960
agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct 1020
tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg 1080
aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc 1140
gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg 1200
gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct 1260
cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact 1320
tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc 1380
gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc 1440
acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca 1500
acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg 1560
gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag 1620
aagaggatct gaattaggat cc 1642
<210>2
<211>544
<212>PRT
<213>人类
<400>2
Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly
1 5 10 15
Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val
20 25 30
Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser
35 40 45
Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro
50 55 60
Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu
65 70 75 80
Leu Gln Pro Leu Pro Pro Ser Lys Ala Ala Glu Glu Leu His Arg Val
85 90 95
Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys
100 105 110
Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro
115 120 125
Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser
130 135 140
Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly
145 150 155 160
Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly
165 170 175
Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn
180 185 190
Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val
195 200 205
Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg
210 215 220
Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser
225 230 235 240
Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met
245 250 255
Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val
260 265 270
Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala
275 280 285
Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu
290 295 300
Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile Asp Asp Ala Asp Glu
305 310 315 320
Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp
325 330 335
Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe
340 345 350
Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp
355 360 365
Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg
370 375 380
Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly
385 390 395 400
His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly
405 410 415
Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu
420 425 430
Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp
435 440 445
Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp
450 455 460
Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His
465 470 475 480
Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr
485 490 495
Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly
500 505 510
Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu
515 520 525
Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn
530 535 540
<210>3
<211>31
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>3
atactcgagt taacaatgaa gatgagacgc t 31
<210>4
<211>35
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>4
tatggatcct aattcagatc ctcttctgag atgag 35
<210>5
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>5
ccatggtgat gagacgctac 20
<210>6
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>6
gtttaaacct aggatcctaa ttcagatcct ct 32
<210>7
<211>1602
<212>DNA
<213>人类
<400>7
atgaagatga gacgctacaa gctctttctc atgttctgta tggccggcct gtgcctcatc 60
tccttcctgc acttcttcaa gaccctgtcc tatgtcacct tcccccgaga actggcctcc 120
ctcagcccta acctggtgtc cagctttttc tggaacaatg ccccggtcac gccccaggcc 180
agccccgagc caggaggccc tgacctgctg cgtaccccac tctactccca ctcgcccctg 240
ctgcagccgc tgccgcccag caaggcggcc gaggagctcc accgggtgga cttggtgctg 300
cccgaggaca ccaccgagta tttcgtgcgc accaaggccg gcggcgtctg cttcaaaccc 360
ggcaccaaga tgctggagag gccgcccccg ggacggccgg aggagaagcc tgagggggcc 420
aacggctcct cggcccggcg gccaccccgg tacctcctga gcgcccggga gcgcacgggg 480
ggccgaggcg cccggcgcaa gtgggtggag tgcgtgtgcc tgcccggctg gcacggaccc 540
agctgcggcg tgcccactgt ggtgcagtac tccaacctgc ccaccaagga gcggctggtg 600
cccagggagg tgccgcgccg cgtcatcaac gccatcaacg tcaaccacga gttcgacctg 660
ctggacgtgc gcttccacga gctgggcgac gtggtggacg cctttgtggt gtgcgagtcc 720
aacttcacgg cttatgggga gccgcggccg ctcaagttcc gggagatgct gaccaatggc 780
accttcgagt acatccgcca caaggtgctc tatgtcttcc tggaccactt cccgcccggc 840
ggccggcagg acggctggat cgccgacgac tacctgcgca ccttcctcac ccaggacggc 900
gtctcgcggc tgcgcaacct gcggcccgac gacgtcttca tcattgacga tgcggacgag 960
atcccggccc gtgacggcgt ccttttcctc aagctctacg atggctggac cgagcccttc 1020
gccttccaca tgcgcaagtc gctctacggc ttcttctgga agcagccggg caccctggag 1080
gtggtgtcag gctgcacggt ggacatgctg caggcagtgt atgggctgga cggcatccgc 1140
ctgcgccgcc gccagtacta caccatgccc aacttcagac agtatgagaa ccgcaccggc 1200
cacatcctgg tgcagtggtc gctgggcagc cccctgcact tcgccggctg gcactgctcc 1260
tggtgcttca cgcccgaggg catctacttc aagctcgtgt ccgcccagaa tggcgacttc 1320
ccacgctggg gtgactacga ggacaagcgg gacctgaact acatccgcgg cctgatccgc 1380
accgggggct ggttcgacgg cacgcagcag gagtacccgc ctgcagaccc cagcgagcac 1440
atgtatgcgc ccaagtacct gctgaagaac tacgaccggt tccactacct gctggacaac 1500
ccctaccagg agcccaggag cacggcggcg ggcgggtggc gccacagggg tcccgaggga 1560
aggccgcccg cccggggcaa actggacgag gcggaagtct ag 1602
<210>8
<211>7027
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>8
catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg 60
caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgcagtgca 120
gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta agttataaaa 180
aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca 240
tatatttaaa ctttaatcta cgaataatat aatctatagt actacaataa tatcagtgtt 300
ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga gtattttgac 360
aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat 420
agcttcacct atataatact tcatccattt tattagtaca tccatttagg gtttagggtt 480
aatggttttt atagactaat ttttttagta catctatttt attctatttt agcctctaaa 540
ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa 600
taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa 660
acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac 720
ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca 780
tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg 840
ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc 900
ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg ctccttcgct 960
ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt tccccaacct 1020
cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac ccgtcggcac 1080
ctccgcttca aggtacgccg ctcgtcctcc cccccccccc ctctctacct tctctagatc 1140
ggcgttccgg tccatgcatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt 1200
agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg 1260
tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct 1320
ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt 1380
ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt 1440
catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg 1500
gagtagaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt 1560
gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag 1620
gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg 1680
ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact 1740
gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt 1800
catagttacg agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg 1860
tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc 1920
ttgagtacct atctattata ataaacaagt atgttttata attattttga tcttgatata 1980
cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc 2040
tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt 2100
ctgcagggta cccccggggt cgaccatggt aaggggcagc caccaccacc accaccacat 2160
ggtccgtcct gtagaaaccc caacccgtga aatcaaaaaa ctcgacggcc tgtgggcatt 2220
cagtctggat cgcgaaaact gtggaattga tcagcgttgg tgggaaagcg cgttacaaga 2280
aagccgggca attgctgtgc caggcagttt taacgatcag ttcgccgatg cagatattcg 2340
taattatgcg ggcaacgtct ggtatcagcg cgaagtcttt ataccgaaag gttgggcagg 2400
ccagcgtatc gtgctgcgtt tcgatgcggt cactcattac ggcaaagtgt gggtcaataa 2460
tcaggaagtg atggagcatc agggcggcta tacgccattt gaagccgatg tcacgccgta 2520
tgttattgcc gggaaaagtg tacgtatcac cgtttgtgtg aacaacgaac tgaactggca 2580
gactatcccg ccgggaatgg tgattaccga cgaaaacggc aagaaaaagc agtcttactt 2640
ccatgatttc tttaactatg ccggaatcca tcgcagcgta atgctctaca ccacgccgaa 2700
cacctgggtg gacgatatca ccgtggtgac gcatgtcgcg caagactgta accacgcgtc 2760
tgttgactgg caggtggtgg ccaatggtga tgtcagcgtt gaactgcgtg atgcggatca 2820
acaggtggtt gcaactggac aaggcactag cgggactttg caagtggtga atccgcacct 2880
ctggcaaccg ggtgaaggtt atctctatga actgtgcgtc acagccaaaa gccagacaga 2940
gtgtgatatc tacccgcttc gcgtcggcat ccggtcagtg gcagtgaagg gcgaacagtt 3000
cctgattaac cacaaaccgt tctactttac tggctttggt cgtcatgaag atgcggactt 3060
acgtggcaaa ggattcgata acgtgctgat ggtgcacgac cacgcattaa tggactggat 3120
tggggccaac tcctaccgta cctcgcatta cccttacgct gaagagatgc tcgactgggc 3180
agatgaacat ggcatcgtgg tgattgatga aactgctgct gtcggcttta acctctcttt 3240
aggcattggt ttcgaagcgg gcaacaagcc gaaagaactg tacagcgaag aggcagtcaa 3300
cggggaaact cagcaagcgc acttacaggc gattaaagag ctgatagcgc gtgacaaaaa 3360
ccacccaagc gtggtgatgt ggagtattgc caacgaaccg gatacccgtc cgcaagtgca 3420
cgggaatatt tcgccactgg cggaagcaac gcgtaaactc gacccgacgc gtccgatcac 3480
ctgcgtcaat gtaatgttct gcgacgctca caccgatacc atcagcgatc tctttgatgt 3540
gctgtgcctg aaccgttatt acggatggta tgtccaaagc ggcgatttgg aaacggcaga 3600
gaaggtactg gaaaaagaac ttctggcctg gcaggagaaa ctgcatcagc cgattatcat 3660
caccgaatac ggcgtggata cgttagccgg gctgcactca atgtacaccg acatgtggag 3720
tgaagagtat cagtgtgcat ggctggatat gtatcaccgc gtctttgatc gcgtcagcgc 3780
cgtcgtcggt gaacaggtat ggaatttcgc cgattttgcg acctcgcaag gcatattgcg 3840
cgttggcggt aacaagaaag ggatcttcac tcgcgaccgc aaaccgaagt cggcggcttt 3900
tctgctgcaa aaacgctgga ctggcatgaa cttcggtgaa aaaccgcagc agggaggcaa 3960
acaatgataa tgagctcgtt taaactgagg gcactgaagt cgcttgatgt gctgaattgt 4020
ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat tttatcatat 4080
gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta ataactcaat 4140
gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct gtgatgtttt 4200
gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac ctgtttcttg 4260
aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc tgtgctttgt 4320
aacataacaa ttgttacggc atatatccaa cggccggcct agctagccac ggtggccaga 4380
tccactagtt ctagagcggc cgcttaattc actggccgtc gttttacaac gtcgtgactg 4440
ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 4500
gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 4560
cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat 4620
atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc 4680
gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca 4740
agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg 4800
cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat 4860
ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 4920
atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 4980
tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 5040
cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 5100
agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 5160
taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 5220
tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 5280
catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 5340
ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 5400
ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa 5460
catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 5520
aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 5580
aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 5640
taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 5700
atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 5760
gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa 5820
tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 5880
ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 5940
gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 6000
agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 6060
aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 6120
agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 6180
tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 6240
atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 6300
taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 6360
gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 6420
gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 6480
aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta 6540
tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 6600
gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 6660
cttttgcagg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 6720
ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 6780
cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg 6840
ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 6900
gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat 6960
gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 7020
ctatgac 7027
<210>9
<211>6818
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>9
cctgcagatc cccggggatc ctctagagtc gacctgcagt gcagcgtgac ccggtcgtgc 60
ccctctctag agataatgag cattgcatgt ctaagttata aaaaattacc acatattttt 120
tttgtcacac ttgtttgaag tgcagtttat ctatctttat acatatattt aaactttaat 180
ctacgaataa tataatctat agtactacaa taatatcagt gttttagaga atcatataaa 240
tgaacagtta gacatggtct aaaggacaat tgagtatttt gacaacagga ctctacagtt 300
ttatcttttt agtgtgcatg tgttctcctt tttttttgca aatagcttca cctatataat 360
acttcatcca ttttattagt acatccattt agggtttagg gttaatggtt tttatagact 420
aattttttta gtacatctat tttattctat tttagcctct aaattaagaa aactaaaact 480
ctattttagt ttttttattt aataatttag atataaaata gaataaaata aagtgactaa 540
aaattaaaca aatacccttt aagaaattaa aaaaactaag gaaacatttt tcttgtttcg 600
agtagataat gccagcctgt taaacqccgt cgacgagtct aacggacacc aaccagcgaa 660
ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg gcatctctgt cgctgcctct 720
ggacccctct cgagagttcc gctccaccgt tggacttgct ccgctgtcgg catccagaaa 780
ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc tcctctcacg 840
gcacggcagc tacgggggat tcctttccca ccgctccttc gctttccctt cctcgcccgc 900
cgtaataaat agacaccccc tccacaccct ctttccccaa cctcgtgttg ttcggagcgc 960
acacacacac aaccagatct cccccaaatc cacccgtcgg cacctccgct tcaaggtacg 1020
ccgctcgtcc tccccccccc cccctctcta ccttctctag atcggcgttc cggtccatgc 1080
atggttaggg cccggtagtt ctacttctgt tcatgtttgt gttagatccg tgtttgtgtt 1140
agatccgtgc tgctagcgtt cgtacacgga tgcgacctgt acgtcagaca cgttctgatt 1200
gctaacttgc cagtgtttct ctttggggaa tcctgggatg gctctagccg ttccgcagac 1260
gggatcgatt tcatgatttt ttttgtttcg ttgcataggg tttggtttgc ccttttcctt 1320
tatttcaata tatgccgtgc acttgtttgt cgggtcatct tttcatgctt ttttttgtct 1380
tggttgtgat gatgtggtct ggttgggcgg tcgttctaga tcggagtaga attctgtttc 1440
aaactacctg gtggatttat taattttgga tctgtatgtg tgtgccatac atattcatag 1500
ttacgaattg aagatgatgg atggaaatat cgatctagga taggtataca tgttgatgcg 1560
ggttttactg atgcatatac agagatgctt tttgttcgct tggttgtgat gatgtggtgt 1620
ggttgggcgg tcgttcattc gttctagatc ggagtagaat actgtttcaa actacctggt 1680
gtatttatta attttggaac tgtatgtgtg tgtcatacat cttcatagtt acgagtttaa 1740
gatggatgga aatatcgatc taggataggt atacatgttg atgtgggttt tactgatgca 1800
tatacatgat ggcatatgca gcatctattc atatgctcta accttgagta cctatctatt 1860
ataataaaca agtatgtttt ataattattt tgatcttgat atacttggat gatggcatat 1920
gcagcagcta tatgtggatt tttttagccc tgccttcata cgctatttat ttgcttggta 1980
ctgtttcttt tgtcgatgct caccctgttg tttggtgtta cttctgcagg gtacccccgg 2040
ggtcgaccat ggtgatgaga cgctacaagc tctttctcat gttctgtatg gccggcctgt 2100
gcctcatctc cttcctgcac ttcttcaaga ccctgtccta tgtcaccttc ccccgagaac 2160
tggcctccct cagccctaac ctggtgtcca gctttttctg gaacaatgcc ccggtcacgc 2220
cccaggccag ccccgagcca ggaggccctg acctgctgcg taccccactc tactcccact 2280
cgcccctgct gcagccgctg ccgcccagca aggcggccga ggagctccac cgggtggact 2340
tggtgctgcc cgaggacacc accgagtatt tcgtgcgcac caaggccggc ggcgtctgct 2400
tcaaacccgg caccaagatg ctggagaggc cccccccggg acggccggag gagaagcctg 2460
agggggccaa cggctcctcg gcccggcggc caccccggta cctcctgagc gcccgggagc 2520
gcacgggggg ccgaggcgcc cggcgcaagt gggtggagtg cgtgtgcctg cccggctggc 2580
acggacccag ctgcggcgtg cccactgtgg tgcagtactc caacctgccc accaaggagc 2640
ggctggtgcc cagggaggtg ccgcgccgcg tcatcaacgc catcaacgtc aaccacgagt 2700
tcgacctgct ggacgtgcgc ttccacgagc tgggcgacgt ggtggacgcc tttgtggtgt 2760
gcgagtccaa cttcacggct tatggggagc cgcggccgct caagttccgg gagatgctga 2820
ccaatggcac cttcgagtac atccgccaca aggtgctcta tgtcttcctg gaccacttcc 2880
cgcccggcgg ccggcaggac ggctggatcg ccgacgacta cctgcgcacc ttcctcaccc 2940
aggacggcgt ctcgcggctg cgcaacctgc ggcccgacga cgtcttcatc attgacgatg 3000
cggacgagat cccggcccgt gacggcgtcc ttttcctcaa gctctacgat ggctggaccg 3060
agcccttcgc cttccacatg cgcaagtcgc tctacggctt cttctggaag cagccgggca 3120
ccctggaggt ggtgtcaggc tgcacggtgg acatgctgca ggcagtgtat gggctggacg 3180
gcatccgcct gcgccgccgc cagtactaca ccatgcccaa cttcagacag tatgagaacc 3240
gcaccggcca catcctggtg cagtggtcgc tgggcagccc cctgcacttc gccggctggc 3300
actgctcctg gtgcttcacg cccgagggca tctacttcaa gctcgtgtcc gcccagaatg 3360
gcgacttccc acgctggggt gactacgagg acaagcggga cctgaactac atccgcggcc 3420
tgatccgcac cgggggctgg ttcgacggca cgcagcagga gtacccgcct gcagacccca 3480
gcgagcacat gtatgcgccc aagtacctgc tgaagaacta cgaccggttc cactacctgc 3540
tggacaaccc ctaccaggag cccaggagca cggcggcggg cgggtggcgc cacaggggtc 3600
ccgagggaag gccgcccgcc cggggcaaac tggacgaggc ggaagtcgaa caaaaactca 3660
tctcagaaga ggatctgaat taggatccta ggtttaaact gagggcactg aagtcgcttg 3720
atgtgctgaa ttgtttgtga tgttggtggc gtattttgtt taaataagta agcatggctg 3780
tgattttatc atatgatcga tctttggggt tttatttaac acattgtaaa atgtgtatct 3840
attaataact caatgtataa gatgtgttca ttcttcggtt gccatagatc tgcttatttg 3900
acctgtgatg ttttgactcc aaaaaccaaa atcacaactc aataaactca tggaatatgt 3960
ccacctgttt cttgaagagt tcatctacca ttccagttgg catttatcag tgttgcagcg 4020
gcgctgtgct ttgtaacata acaattgttc acggcatata tccacggccg gcctagctag 4080
ccacggtggc cagatccact agttctagag cggccgctta attcactggc cgtcgtttta 4140
caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 4200
cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 4260
cgcagcctga atggcgaatg gcgcctgatg cggtattttc tccttacgca tctgtgcggt 4320
atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc 4380
cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca 4440
tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg 4500
tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat 4560
gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga 4620
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 4680
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt 4740
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg 4800
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg 4860
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg 4920
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag 4980
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca 5040
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg 5100
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc 5160
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg 5220
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg 5280
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac 5340
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg 5400
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg 5460
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact 5520
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa 5580
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt 5640
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 5700
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 5760
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 5820
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 5880
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 5940
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 6000
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 6060
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 6120
ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg 6180
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 6240
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 6300
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 6360
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct 6420
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga 6480
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg 6540
cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg 6600
aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag 6660
gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt 6720
cacacaggaa acagctatga ccatgattac gccaagctag cggccgcatt cccgggaagc 6780
taggccaccg tggcccgcct gcaggggaag cttgcatg 6818
<210>10
<211>7545
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>10
cgattaaaaa tctcaattat atttggtcta atttagtttg gtattgagta aaacaaattc 60
gaaccaaacc aaaatataaa tatatagttt ttatatatat gcctttaaga ctttttatag 120
aattttcttt aaaaaatatc tagaaatatt tgcgactctt ctggcatgta atatttcgtt 180
aaatatgaag tgctccattt ttattaactt taaataattg gttgtacgat cactttctta 240
tcaagtgtta ctaaaatgcg tcaatctctt tgttcttcca tattcatatg tcaaaaccta 300
tcaaaattct tatatatctt tttcgaattt gaagtgaaat ttcgataatt taaaattaaa 360
tagaacatat cattatttag gtatcatatt gatttttata cttaattact aaatttggtt 420
aactttgaaa gtgtacatca acgaaaaatt agtcaaacga ctaaaataaa taaatatcat 480
gtgttattaa gaaaattctc ctataagaat attttaatag atcatatgtt tgtaaaaaaa 540
attaattttt actaacacat atatttactt atcaaaaatt tgacaaagta agattaaaat 600
aatattcatc taacaaaaaa aaaaccagaa aatgctgaaa acccggcaaa accgaaccaa 660
tccaaaccga tatagttggt ttggtttgat tttgatataa accgaaccaa ctcggtccat 720
ttgcacccct aatcataata gctttaatat ttcaagatat tattaagtta acgttgtcaa 780
tatcctggaa attttgcaaa atgaatcaag cctatatggc tgtaatatga atttaaaagc 840
agctcgatgt ggtggtaata tgtaatttac ttgattctaa aaaaatatcc caagtattaa 900
taatttctgc taggaagaag gttagctacg atttacagca aagccagaat acaatgaacc 960
ataaagtgat tgaagctcga aatatacgaa ggaacaaata tttttaaaaa aatacgcaat 1020
gacttggaac aaaagaaagt gatatatttt ttgttcttaa acaagcatcc cctctaaaga 1080
atggcagttt tcctttgcat gtaactatta tgctcccttc gttacaaaaa ttttggacta 1140
ctattgggaa cttcttctga aaatagtggc caccgcttaa ttaaggcgcg ccatgcccgg 1200
gcaagcggcc gcttaattaa atttaaatgt ttaaactagg aaatccaagc ttgggctgca 1260
ggtcaatccc attgcttttg aagcagctca acattgatct ctttctcgag gtcattcata 1320
tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa ggtaagatta cctggtcaaa 1380
agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat cggtaataaa aggtggccca 1440
aagtgaaatt tactcttttc tactattata aaaattgagg atgtttttgt cggtactttg 1500
atacgtcatt tttgtatgaa ttggttttta agtttattcg cttttggaaa tgcatatctg 1560
tatttgagtc gggttttaag ttcgtttgct tttgtaaata cagagggatt tgtataagaa 1620
atatctttaa aaaaacccat atgctaattt gacataattt ttgagaaaaa tatatattca 1680
ggcgaattct cacaatgaac aataataaga ttaaaatagc tttcccccgt tgcagcgcat 1740
gggtattttt tctagtaaaa ataaaagata aacttagact caaaacattt acaaaaacaa 1800
cccctaaagt tcctaaagcc caaagtgcta tccacgatcc atagcaagcc cagcccaacc 1860
caacccaacc caacccaccc cagtccagcc aactggacaa tagtctccac acccccccac 1920
tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag ccaaaaaaaa aaaaagaaag 1980
aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc gtgggggccg gaaacgcgag 2040
gaggatcgcg agccagcgac gaggccggcc ctccctccgc ttccaaagaa acgcccccca 2100
tcgccactat atacataccc ccccctctcc tcccatcccc ccaaccctac caccaccacc 2160
accaccacct ccacctcctc ccccctcgct gccggacgac gcctcccccc tccccctccg 2220
ccgccgccgc gccggtaacc accccgcccc tctcctcttt ctttctccgt tttttttttc 2280
cgtctcggtc tcgatctttg gccttggtag tttgggtggg cgagaggcgg cttcgtgcgc 2340
gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg gggctctcgc cggcgtggat 2400
ccggcccgga tctcgcgggg aatggggctc tcggatgtag atctgcgatc cgccgttgtt 2460
gggggagatg atggggggtt taaaatttcc gccatgctaa acaagatcag gaagagggga 2520
aaagggcact atggtttata tttttatata tttctgctgc ttcgtcaggc ttagatgtgc 2580
tagatctttc tttcttcttt ttgtgggtag aatttgaatc cctcagcatt gttcatcggt 2640
agtttttctt ttcatgattt gtgacaaatg cagcctcgtg cggagctttt ttgtaggtag 2700
accatggctt ctccggagag gagaccagtt gagattaggc cagctacagc agctgatatg 2760
gccgcggttt gtgatatcgt taaccattac attgagacgt ctacagtgaa ctttaggaca 2820
gagccacaaa caccacaaga gtggattgat gatctagaga ggttgcaaga tagataccct 2880
tggttggttg ctgaggttga gggtgttgtg gctggtattg cttacgctgg gccctggaag 2940
gctaggaacg cttacgattg gacagttgag agtactgttt acgtgtcaca taggcatcaa 3000
aggttgggcc taggatccac attgtacaca catttgctta agtctatgga ggcgcaaggt 3060
tttaagtctg tggttgctgt tataggcctt ccaaacgatc catctgttag gttgcatgag 3120
gctttgggat acacagcccg gggtacattg cgcgcagctg gatacaagca tggtggatgg 3180
catgatgttg gtttttggca aagggatttt gagttgccag ctcctccaag gccagttagg 3240
ccagttaccc agatctgagg taccctgagc tcggtcgcag cgtgtgcgtg tccgtcgtac 3300
gttctggccg gccgggcctt gggcgcgcga tcagaagcgt tgcgttggcg tgtgtgtgct 3360
tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg atcgcgtggt caaggcccgt 3420
gtgctttaaa gacccaccgg cactggcagt gagtgttgct gcttgtgtag gctttggtac 3480
gtatgggctt tatttgcttc tggatgttgt gtactacttg ggtttgttga attattatga 3540
gcagttgcgt attgtaattc agctgggcta cctggacatt gttatgtatt aataaatgct 3600
ttgctttctt ctaaagatct ttaagtgctg aattcatatt tcctcctgca gggtttaaac 3660
ttgccgtggc ctattttcag aagaagttcc caatagtagt ccaaaatttt tgtaacgaag 3720
ggagcataat agttacatgc aaaggaaaac tgccattctt tagaggggat gcttgtttaa 3780
gaacaaaaaa tatatcactt tcttttgttc caagtcattg cgtatttttt taaaaatatt 3840
tgttccttcg tatatttcga gcttcaatca ctttatggtt ctttgtattc tggctttgct 3900
gtaaatcgta gctaaccttc ttcctagcag aaattattaa tacttgggat atttttttag 3960
aatcaagtaa attacatatt accaccacat cgagctgctt ttaaattcat attacagcca 4020
tataggcttg attcattttg caaaatttcc aggatattga caacgttaac ttaataatat 4080
cttgaaatat taaagctatt atgattaggg gtgcaaatgg accgagttgg ttcggtttat 4140
atcaaaatca aaccaaacca actatatcgg tttggattgg ttcggttttg ccgggttttc 4200
agcattttct ggtttttttt ttgttagatg aatattattt taatcttact ttgtcaaatt 4260
tttgataagt aaatatatgt gttagtaaaa attaattttt tttacaaaca tatgatctat 4320
taaaatattc ttataggaga attttcttaa taacacatga tatttattta ttttagtcgt 4380
ttgactaatt tttcgttgat gtacactttc aaagttaacc aaatttagta attaagtata 4440
aaaatcaata tgatacctaa ataatgatat gttctattta attttaaatt atcgaaattt 4500
cacttcaaat tcgaaaaaga tatataagaa ttttgataga ttttgacata tgaatatgga 4560
agaacaaaga gattgacgca ttttagtaac acttgataag aaagtgatcg tacaaccaat 4620
tatttaaagt taataaaaat ggagcacttc atatttaacg aaatattaca tgccagaaga 4680
gtcgcaaata tttctagata ttttttaaag aaaattctat aaaaagtctt aaaggcatat 4740
atataaaaac tatatattta tattttggtt tggttcgaat ttgttttact caataccaaa 4800
ctaaattaga ccaaatataa ttgggatttt taatcgcggc ccactagtca ccggtgtagc 4860
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 4920
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 4980
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 5040
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 5100
gctgcgcacg ctgcgcacgc tgcgcacgct tcctcgctca ctgactcgct gcgctcggtc 5160
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 5220
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 5280
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 5340
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 5400
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 5460
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 5520
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5580
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5640
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5700
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 5760
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5820
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5880
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5940
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 6000
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 6060
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 6120
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 6180
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 6240
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 6300
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 6360
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 6420
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 6480
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 6540
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 6600
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 6660
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 6720
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 6780
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 6840
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 6900
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 6960
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 7020
gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 7080
acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat 7140
gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 7200
gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 7260
tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa 7320
ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc attcaggctg 7380
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 7440
gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt 7500
tgtaaaacga cggccagtga attacaccgg tgtgatcatg ggccg 7545
<210>11
<211>11643
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>11
cgattaaaaa cccaattata tttggtctaa tttagtttgg tattgagtaa aacaaattcg 60
aaccaaacca aaatataaat atatagtttt tatatatatg cctttaagac tttttataga 120
attttcttta aaaaatatct agaaatattt gcgactcttc tggcatgtaa tatttcgtta 180
aatatgaagt gctccatttt tattaacttt aaataattgg ttgtacgatc actttcttat 240
caagtgttac taaaatgcgt caatctcttt gttcttccat attcatatgt caaaatctat 300
caaaattctt atatatcttt ttcgaatttg aagtgaaatt tcgataattt aaaattaaat 360
agaacatatc attatttagg tatcatattg atttttatac ttaattacta aatttggtta 420
actttgaaag tgtacatcaa cgaaaaatta gtcaaacgac taaaataaat aaatatcatg 480
tgttattaag aaaattctcc tataagaata ttttaataga tcatatgttt gtaaaaaaaa 540
ttaattttta ctaacacata tatttactta tcaaaaattt gacaaagtaa gattaaaata 600
atattcatct aacaaaaaaa aaaccagaaa atgctgaaaa cccggcaaaa ccgaaccaat 660
ccaaaccgat atagttggtt tggtttgatt ttgatataaa ccgaaccaac tcggtccatt 720
tgcaccccta atcataatag ctttaatatt tcaagatatt attaagttaa cgttgtcaat 780
atcctggaaa ttttgcaaaa tgaatcaagc ctatatggct gtaatatgaa tttaaaagca 840
gctcgatgtg gtggtaatat gtaatttact tgattctaaa aaaatatccc aagtattaat 900
aatttctgct aggaagaagg ttagctacga tttacagcaa agccagaata caaagaacca 960
taaagtgatt gaagctcgaa atatacgaag gaacaaatat ttttaaaaaa atacgcaatg 1020
acttggaaca aaagaaagtg atatattttt tgttcttaaa caagcatccc ctctaaagaa 1080
tggcagtttt cctttgcatg taactattat gctcccttcg ttacaaaaat tttggactac 1140
tattgggaat tcttctgaaa atagtggcca ccgcttaatt aaggcgcgcc atgccccctg 1200
cagatccccg gggatcctct agagtcgacc tgcagtgcag cgtgacccgg tcgtgcccct 1260
ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 1320
tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttaatctac 1380
gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 1440
cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 1500
ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 1560
catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 1620
tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 1680
tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 1740
taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 1800
gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 1860
cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1920
ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1980
gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 2040
ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta 2100
ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac 2160
acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc 2220
tcgtcctccc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatgcatgg 2280
ttagggcccg gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat 2340
ccgtgctgct agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta 2400
acttgccagt gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga 2460
tcgatttcat gatttttttt gtttcgttgc atagggtttg gtttgccctt ttcctttatt 2520
tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc atgctttttt ttgtcttggt 2580
tgtgatgatg tggtctggtt gggcggtcgt tctagatcgg agtagaattc tgtttcaaac 2640
tacctggtgg atttattaat tttggatctg tatgtgtgtg ccatacatat tcatagttac 2700
gaattgaaga tgatggatgg aaatatcgat ctaggatagg tatacatgtt gatgcgggtt 2760
ttactgatgc atatacagag atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt 2820
gggcggtcgt tcattcgttc tagatcggag tagaatactg tttcaaacta cctggtgtat 2880
ttattaattt tggaactgta tgtgtgtgtc atacatcttc atagttacga gtttaagatg 2940
gatggaaata tcgatctagg ataggtatac atgttgatgt gggttttact gatgcatata 3000
catgatggca tatgcagcat ctattcatat gctctaacct tgagtaccta tctattataa 3060
taaacaagta tgttttataa ttattttgat cttgatatac ttggatgatg gcatatgcag 3120
cagctatatg tggatttttt tagccctgcc ttcatacgct atttatttgc ttggtactgt 3180
ttcttttgtc gatgctcacc ctgttgtttg gtgttacttc tgcagggtac ccccggggtc 3240
gaccatggtg atgagacgct acaagctctt tctcatgttc tgtatggccg gcctgtgcct 3300
catctccttc ctgcacttct tcaagaccct gtcctatgtc accttccccc gagaactggc 3360
ctccctcagc cctaacctgg tgtccagctt tttctggaac aatgccccgg tcacgcccca 3420
ggccagcccc gagccaggag gccctgacct gctgcgtacc ccactctact cccactcgcc 3480
cctgctgcag ccgctgccgc ccagcaaggc ggccgaggag ctccaccggg tggacttggt 3540
gctgcccgag gacaccaccg agtatttcgt gcgcaccaag gccggcggcg tctgcttcaa 3600
acccggcacc aagatgctgg agaggccccc cccgggacgg ccggaggaga agcctgaggg 3660
ggccaacggc tcctcggccc ggcggccacc ccggtacctc ctgagcgccc gggagcgcac 3720
ggggggccga ggcgcccggc gcaagtgggt ggagtgcgtg tgcctgcccg gctggcacgg 3780
acccagctgc ggcgtgccca ctgtggtgca gtactccaac ctgcccacca aggagcggct 3840
ggtgcccagg gaggtgccgc gccgcgtcat caacgccatc aacgtcaacc acgagttcga 3900
cctgctggac gtgcgcttcc acgagctggg cgacgtggtg gacgcctttg tggtgtgcga 3960
gtccaacttc acggcttatg gggagccgcg gccgctcaag ttccgggaga tgctgaccaa 4020
tggcaccttc gagtacatcc gccacaaggt gctctatgtc ttcctggacc acttcccgcc 4080
cggcggccgg caggacggct ggatcgccga cgactacctg cgcaccttcc tcacccagga 4140
cggcgtctcg cggctgcgca acctgcggcc cgacgacgtc ttcatcattg acgatgcgga 4200
cgagatcccg gcccgtgacg gcgtcctttt cctcaagctc tacgatggct ggaccgagcc 4260
cttcgccttc cacatgcgca agtcgctcta cggcttcttc tggaagcagc cgggcaccct 4320
ggaggtggtg tcaggctgca cggtggacat gctgcaggca gtgtatgggc tggacggcat 4380
ccgcctgcgc cgccgccagt actacaccat gcccaacttc agacagtatg agaaccgcac 4440
cggccacatc ctggtgcagt ggtcgctggg cagccccctg cacttcgccg gctggcactg 4500
ctcctggtgc ttcacgcccg agggcatcta cttcaagctc gtgtccgccc agaatggcga 4560
cttcccacgc tggggtgact acgaggacaa gcgggacctg aactacatcc gcggcctgat 4620
ccgcaccggg ggctggttcg acggcacgca gcaggagtac ccgcctgcag accccagcga 4680
gcacatgtat gcgcccaagt acctgctgaa gaactacgac cggttccact acctgctgga 4740
caacccctac caggagccca ggagcacggc ggcgggcggg tggcgccaca ggggtcccga 4800
gggaaggccg cccgcccggg gcaaactgga cgaggcggaa gtcgaacaaa aactcatctc 4860
agaagaggat ctgaattagg atcctaggtt taaactgagg gcactgaagt cgcttgatgt 4920
gctgaattgt ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat 4980
tttatcatat gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta 5040
ataactcaat gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct 5100
gtgatgtttt gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac 5160
ctgtttcttg aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc 5220
tgtgctttgt aacataacaa ttgttcacgg catatatcca cggccggcct agctagccac 5280
ggtggccaga tccactaggg gcaagcggcc gcttaattaa atttaaatgt ttaaactagg 5340
aaatccaagc ttgggctgca ggtcaatccc attgcttttg aagcagctca acattgatct 5400
ctttctcgag gtcattcata tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa 5460
ggtaagatta cctggtcaaa agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat 5520
cggtaataaa aggtggccca aagtgaaatt tactcttttc tactattata aaaattgagg 5580
atgtttttgt cggtactttg atacgtcatt tttgtatgaa ttggttttta agtttattcg 5640
cttttggaaa tgcatatctg tatttgagtc gggttttaag ttcgtttgct tttgtaaata 5700
cagagggatt tgtataagaa atatctttaa aaaaacccat atgctaattt gacataattt 5760
ttgagaaaaa tatatattca ggcgaattct cacaatgaac aataataaga ttaaaatagc 5820
tttcccccgt tgcagcgcat gggtattttt tctagtaaaa ataaaagata aacttagact 5880
caaaacattt acaaaaacaa cccctaaagt tcctaaagcc caaagtgcta tccacgatcc 5940
atagcaagcc cagcccaacc caacccaacc caacccaccc cagtccagcc aactggacaa 6000
tagtctccac acccccccac tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag 6060
ccaaaaaaaa aaaaagaaag aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc 6120
gtgggggccg gaaacgcgag gaggatcgcg agccagcgac gaggccggcc ctccctccgc 6180
ttccaaagaa acgcccccca tcgccactat atacataccc ccccctctcc tcccatcccc 6240
ccaaccctac caccaccacc accaccacct ccacctcctc ccccctcgct gccggacgac 6300
gcctcccccc tccccctccg ccgccgccgc gccggtaacc accccgcccc tctcctcttt 6360
ctttctccgt tttttttttc cgtctcggtc tcgatctttg gccttggtag tttgggtggg 6420
cgagaggcgg cttcgtgcgc gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg 6480
gggctctcgc cggcgtggat ccggcccgga tctcgcgggg aatggggctc tcggatgtag 6540
atctgcgatc cgccgttgtt gggggagatg atggggggtt taaaatttcc gccatgctaa 6600
acaagatcag gaagagggga aaagggcact atggtttata tttttatata tttctgctgc 6660
ttcgtcaggc ttagatgtgc tagatctttc tttcttcttt ttgtgggtag aatttgaatc 6720
cctcagcatt gttcatcggt agtttttctt ttcatgattt gtgacaaatg cagcctcgtg 6780
cggagctttt ttgtaggtag accatggctt ctccggagag gagaccagtt gagattaggc 6840
cagctacagc agctgatatg gccgcggttt gtgatatcgt taaccattac attgagacgt 6900
ctacagtgaa ctttaggaca gagccacaaa caccacaaga gtggattgat gatctagaga 6960
ggttgcaaga tagataccct tggttggttg ctgaggttga gggtgttgtg gctggtattg 7020
cttacgctgg gccctggaag gctaggaacg cttacgattg gacagttgag agtactgttt 7080
acgtgtcaca taggcatcaa aggttgggcc taggatccac attgtacaca catttgctta 7140
agtctatgga ggcgcaaggt tttaagtctg tggttgctgt tataggcctt ccaaacgatc 7200
catctgttag gttgcatgag gctttgggat acacagcccg gggtacattg cgcgcagctg 7260
gatacaagca tggtggatgg catgatgttg gtttttggca aagggatttt gagttgccag 7320
ctcctccaag gccagttagg ccagttaccc agatctgagg taccctgagc tcggtcgcag 7380
cgtgtgcgtg tccgtcgtac gttctggccg gccgggcctt gggcgcgcga tcagaagcgt 7440
tgcgttggcg tgtgtgtgct tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg 7500
atcgcgtggt caaggcccgt gtgctttaaa gacccaccgg cactggcagt gagtgttgct 7560
gcttgtgtag gctttggtac gtatgggctt tatttgcttc tggatgttgt gtactacttg 7620
ggtttgttga attattatga gcagttgcgt attgtaattc agctgggcta cctggacatt 7680
gttatgtatt aataaatgct ttgctttctt ctaaagatct ttaagtgctg aattcatatt 7740
tcctcctgca gggtttaaac ttgccgtggc ctattttcag ccgaattccc aatagtagtc 7800
caaaattttt gtaacgaagg gagcataata gttacatgca aaggaaaact gccattcttt 7860
agaggggatg cttgtttaag aacaaaaaat atatcacttt cttttgttcc aagtcattgc 7920
gtattttttt aaaaatattt gttccttcgt atatttcgag cttcaatcac tttatggttc 7980
tttgtattct ggctttgctg taaatcgtag ctaaccttct tcctagcaga aattattaat 8040
acttgggata tttttttaga atcaagtaaa ttacatatta ccaccacatc gagctgcttt 8100
taaattcata ttacagccat ataggcttga ttcattttgc aaaatttcca ggatattgac 8160
aacgttaact taataatatc ttgaaatatt aaagctatta tgattagggg tgcaaatgga 8220
ccgagttggt tcggtttata tcaaaatcaa accaaaccaa ctatatcggt ttggattggt 8280
tcggttttgc cgggttttca gcattttctg gttttttttt tgttagatga atattatttt 8340
aatcttactt tgtcaaattt ttgataagta aatatatgtg ttagtaaaaa ttaatttttt 8400
ttacaaacat atgatctatt aaaatattct tataggagaa ttttcttaat aacacatgat 8460
atttatttat tttagtcgtt tgactaattt ttcgttgatg tacactttca aagttaacca 8520
aatttagtaa ttaagtataa aaatcaatat gatacctaaa taatgatatg ttctatttaa 8580
ttttaaatta tcgaaatttc acttcaaatt cgaaaaagat atataagaat tttgatagat 8640
tttgacatat gaatatggaa gaacaaagag attgacgcat tttagtaaca cttgataaga 8700
aagtgatcgt acaaccaatt atttaaagtt aataaaaatg gagcacttca tatttaacga 8760
aatattacat gccagaagag tcgcaaatat ttctagatat tttttaaaga aaattctata 8820
aaaagtctta aaggcatata tataaaaact atatatttat attttggttt ggttcgaatt 8880
tgttttactc aataccaaac taaattagac caaatataat tgggttttta atcgcggccc 8940
actagtcacc ggtgtagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 9000
tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 9060
gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 9120
ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 9180
cgtattgggc gctcttccgc tgcgcacgct gcgcacgctg cgcacgcttc ctcgctcact 9240
gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 9300
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 9360
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 9420
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 9480
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 9540
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc 9600
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 9660
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 9720
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 9780
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 9840
aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 9900
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 9960
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 10020
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg 10080
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 10140
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 10200
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 10260
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 10320
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 10380
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 10440
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 10500
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 10560
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 10620
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 10680
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 10740
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 10800
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 10860
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 10920
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 10980
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 11040
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 11100
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa 11160
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 11220
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 11280
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 11340
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 11400
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 11460
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 11520
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 11580
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tacaccggtg tgatcatggg 11640
ccg 11643
<210>12
<211>115
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>12
catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg 60
caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgca 115
<210>13
<211>19
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>13
gggtaccccc ggggtcgac 19
<210>14
<211>17
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>14
taatgagctc gtttaaa 17
<210>15
<211>55
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>15
cggccggcct agctagccac ggtggccaga tccactagtt ctagagcggc cgctt 55
<210>16
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>16
cctgcagatc cccggggatc ctctagagtc gacctgca 38
<210>17
<211>19
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>17
gggtaccccc ggggtcgac 19
<210>18
<211>138
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>18
tggccaccgc ttaattaagg cgcgccatgc ccgggcaagc ggccgcttaa ttaaatttaa 60
atgtttaaac taggaaatcc aagcttgggc tgcaggtcaa tcccattgct tttgaagcag 120
ctcaacattg atctcttt 138
<210>19
<211>14
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>19
ggtaccctga gctc 14
<210>20
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>20
gaattcatat ttcctcctgc agggtttaaa cttgccgtgg c 41
<210>21
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>21
cggcccacta gtcaccggtg t 21
<210>22
<211>27
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>22
gcgcacgctg cgcacgctgc gcacgct 27
<210>23
<211>22
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>23
acaccggtgt gatcatgggc cg 22
<210>24
<211>69
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>24
tggccaccgc ttaattaagg cgcgccatgc cccctgcagatccccgggga tcctctagag 60
tcgacctgc 69
<210>25
<211>144
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>25
cggccggcct agctagccac ggtggccaga tccactaggg gcaagcggcc gcttaattaa 60
atttaaatgt ttaaactagg aaatccaagc ttgggctgca ggtcaatccc attgcttttg 120
aagcagctca acattgatct cttt 144
<210>26
<211>14
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>26
ggtaccctga gctc 14
<210>27
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成的
<400>27
gaattcatat ttcctcctgc agggtttaaa cttgccgtgg c 41
机译: GnTIII(UDP-正-乙基葡萄糖胺:β-D甘露糖苷β(1,4)-N-乙酰氨基葡萄糖转移酶III)在植物中的表达
机译: GnTIII(UDP-N-乙酰氨基葡萄糖:β-D甘露糖苷Beta(1,4)-N-乙酰氨基葡萄糖基转移酶III)在植物中的表达。
机译: GnTIII(UDP-N-乙酰氨基葡萄糖:β-D甘露糖苷Beta(1,4)-N-乙酰氨基葡萄糖基转移酶III)在植物中的表达。