首页> 中国专利> GNTIII(UDP-N乙酰葡萄糖胺:β-D-甘露糖苷β(1,4)-N-乙酰葡萄糖胺基-转移酶III)在植物中的表达

GNTIII(UDP-N乙酰葡萄糖胺:β-D-甘露糖苷β(1,4)-N-乙酰葡萄糖胺基-转移酶III)在植物中的表达

摘要

本发明涉及的领域是在转基因植物中糖蛋白的加工,这些植物可用作生产含有这些糖蛋白的重组生物药用蛋白或药学组合物的有成本效益和避免污染的工厂。本发明提供了含有提供通常在植物中不存在的哺乳动物GnTIII的功能性哺乳动物酶,所述的植物另外含有至少第二种通常在植物中不存在的哺乳动物蛋白或其功能片段。

著录项

  • 公开/公告号CN1665934A

    专利类型发明专利

  • 公开/公告日2005-09-07

    原文格式PDF

  • 申请/专利权人 国际植物研究所;

    申请/专利号CN03806546.0

  • 申请日2003-03-18

  • 分类号C12N15/82;C12N9/10;A61K38/02;

  • 代理机构北京纪凯知识产权代理有限公司;

  • 代理人程伟

  • 地址 荷兰瓦赫恩

  • 入库时间 2023-12-17 16:25:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-08

    未缴年费专利权终止 IPC(主分类):C12N15/82 授权公告日:20100526 终止日期:20180318 申请日:20030318

    专利权的终止

  • 2010-07-07

    专利申请权的转移 IPC(主分类):C12N15/82 变更前: 变更后: 登记生效日:20100601 申请日:20030318

    专利申请权、专利权的转移

  • 2010-05-26

    授权

    授权

  • 2005-11-02

    实质审查的生效

    实质审查的生效

  • 2005-09-07

    公开

    公开

说明书

技术领域

发明涉及哺乳动物N-乙酰葡萄糖胺基转移酶III(GnTIII)在植物中的表达,及其在产生具有等分(bisected)的寡糖和末端GlcNAc残基数量增加的糖蛋白中的应用。发明进一步涉及含有GnTIII的催化位点、高尔基体和/或内质网(ER)蛋白的跨膜结构区、或含有ER固位信号的修饰的GNTIII的杂合蛋白,及其在产生糖蛋白中的用途,该糖蛋白具有的寡糖缺少免疫原性木糖和岩藻糖残基。

背景技术

N-乙酰葡萄糖胺基转移酶(GIcNAc-转移酶)是在典型的N连接聚糖的三甘露糖核心结构中的甘露糖之一上添加了N乙酰葡萄糖胺(GlcNAc)残基的“分支”酶。已知至少有6个很少或没有序列同源性的GlcNAc-转移酶。除了不同的蛋白结构以外,这些GlcNAc转移酶也具有不同的酶特性和底物特异性。所有都是典型的II型跨膜蛋白,具有胞浆结构区、跨膜锚着点和具有催化结构区的细胞外主干区。

值得注意的GlcNAc-转移酶是GlcNAc-转移酶III(GnTIII)。GnTIII也已知是UDP-N乙酰葡萄糖胺:β-D-甘露糖甙β(1,4)-N-乙酰葡萄糖胺基-转移酶III(EC2.4.1.144),在细胞糖蛋白的复合型N-连接聚糖中插入了等分的GlcNAc残基(综述见Taniguchi等人,“在用糖基转移酶基因转染的细胞中鉴定和定性糖蛋白功能的一种glycomic方法”Proteomics 1:239247,2001)。GnTIII通过β(1,4)连接向N-连接的聚糖的三甘露糖核心结构中的β-连接的甘露糖上添加了GlcNAc。GnTIII首先在母鸡的输卵管中被鉴定(Narasimhan S.,“控制糖蛋白的合成。UDP-GlcNAc:糖肽β4-N乙酰葡萄糖胺基转移酶III,母鸡输卵管中的一种酶,在β14连接中向N-糖基寡糖的三甘露糖核心的β-连接甘露糖中添加了GlcNAc”The.Journal of Biological Chemistry 257:10235-10242,1982),但在也已报道在多种类型的大鼠肝细胞瘤、人血清、肝细胞瘤和肝硬变患者的肝和肝细胞瘤组织中有高水平的活性(Ishibashi等人,“人血清和肝细胞瘤组织中的N-乙酰葡萄糖胺基转移酶III:在肝硬变和肝细胞瘤患者中增加的活性”Clinical ChimicaActa 185:325,1989;Narishimhan等人,“在由乳清酸所促发的大鼠肝癌形成过程中肝瘤体中N-乙酰葡萄糖胺基转移酶III的表达”Journal of BiologicalChemistiy 263:1273-1281,1988;Nishikawa等人,“在大鼠正常和肝细胞瘤组织中测定N-乙酰葡萄糖胺基转移酶III,IV和V”Biochimica et Biophysica Acta1035:313-318,1990;Pascale等人,“在由不同的大鼠肝癌生成模型产生的肝瘤体中N-乙酰葡萄糖胺基转移酶III的表达”Carcinogenesis 10:961964,1989)。糖蛋白上等分的寡糖与抗体依赖的细胞毒性有关(ADCC)。ADCC是对抗体靶向细胞的细胞溶解性攻击,并由淋巴细胞受体与抗体恒定区(Fc)的结合触发。在缺少GnTIII活性的重组中国仓鼠卵巢(CHO)生产细胞系中GnTIII的可控表达产生的抗体具有等分的寡糖,并具有优化的ADCC活性(Davies等人,“在重组抗CD20 CHO生产细胞系中表达GnTIII:具有改变的糖型的抗体的表达通过与FcγRIII的更高亲和性引起ADCC的增加”Biotechnology and Bioengineering 74:288-294,2001;Umana等人,“具有优化的抗体依赖的细胞毒活性的抗神经母细胞瘤IgG1的改造糖型”Nature Biotechnology 17:176-180,1999)。ADCC活性与存在于重组抗体上的Fc区相关的截断复合体寡糖水平有良好的相关性好(Umana等人,“具有优化的抗体依赖的细胞毒活性的抗神经母细胞瘤IgG1的改造糖型”NatureBiotechnology 17:176-180,1999)。来自GnTIII的截断GlcNAc残基可影响糖链的构象,其方式是不是β(1,4)-半乳糖基转移酶的其他的糖基转移酶如GlcNAc-转移酶II和α1,6-墨角藻糖基转移酶不再发挥作用(Tanigichi等人,2001)。在CHO细胞中GnTIII的过度表达是致命的。

与典型的哺乳动物生产细胞系如CHO细胞相比,转基因植物通常可被认为是一种治疗性蛋白的安全的生产系统。但是植物糖蛋白,在寡糖结构上与哺乳动物在几个方面都是有区别的。它们缺少末端的半乳糖和唾液酸,具有一个另外的核心木糖和不同的连接核心岩藻糖(α-1,3)而不是(α-1,6)。象CHO和其他的药学生产细胞系,它们也完全缺少等分的寡糖。植物具有产生共有核心结构,GN2M3GN2的能力,但已经发现了优势M3 GN2变异体,显示通过氨基己糖苷酶去掉了末端的GN。

N-连接聚糖的生物发生从脂质连接的寡糖部分(Glc3Man9GIcNAc2-)开始,后者被全部转移至内质网(ER)中的初级多肽链上。通过ER中和顺式-高尔基室中的外切糖苷酶经过一系列的修整反应,所谓的“高甘露糖”(Man9GlcNAc2至Man5GlcNAc2)聚糖形成了。随后,复合体型聚糖的形成启动了通过GnT1首个GlcNAc向Man5GlCNAC2上的转移,进一步通过甘露糖苷酶II(Mann)的修整形成GlcNAcMan3 GlcNAc2。当糖蛋白通过分泌通路被加工时,复合体聚糖的生物合成在几种其他的糖基转移酶的作用下继续进行,通过GnTII在高尔基体中转移第二个GlcNAc残基以及其他的单糖残基至GIcNAcMan3GlcNAc2。就复合体聚糖的形成来说,植物和哺乳动物是不同的。在植物,复合体聚糖的特征是存在与Man-3连接的β(1,2)-木糖残基和/或与GlcNAcl连接的α(1.3)-岩藻糖残基,而不是与GlcNAc-1连接的α(1,6)-岩藻糖残基(Lerouge.P.等人,“植物中N-糖蛋白的生物合成:最近的进展和未来的趋势”Plant Mol Biol 38:31-48,1998)。已经分离了编码相应木糖基(XylT)和岩藻糖基(FucT)转移酶的基因(Strasser R,“来自Arabidopsis thaliana的β1,2-木糖基转移酶cDNA的分子克隆和功能性表达”FEES Lett.472:105-8,2000;Leiter,H.等人,“GDP-L-Fuc的纯化,cDNA克隆和表达:来自绿豆的Asn连接GlcNAcα1,3-墨角藻糖基转移酶”J Biol Chem.274:21830,1999)。木糖和岩藻糖抗原决定簇已知是具有高度免疫抗原性的,可能是变应原,在植物用来生产治疗性糖蛋白时可能会引起问题。而且,许多过敏的患者的血清含有针对这些抗原决定簇的IgE,用含有重组蛋白的木糖和岩藻糖治疗这些患者尤其可使他们处于危险之中。另外,这种被血清中IgE所作用的糖类可能会在使用植物提取物进行体外检测的过程中引起假阳性,因为有证据表明这些糖类特异性IgE与变态反应并没有关系。植物不具有β(1,4)半乳糖基转移酶或α(2,6)唾液酸转移酶,因此植物聚糖缺少在哺乳动物聚糖中经常发现的β(1,4)半乳糖和末端α(2,6)NeuAc残基(Vitale和Chrispeels,“在植物凝集素的生物合成中的短暂存在的N-乙酰葡萄糖胺:在高尔基体中附着,在蛋白体中去除”J Cell5/0/99:133-140,1984;Lerouge,P.等人,“植物中N-糖蛋白的生物合成:最近的进展和未来的趋势”Plant Mol Biol 38:31-48,1998)。

最终的聚糖结构不仅仅由参与其生物合成中的酶的存在而决定,而且也决定于多种酶促反应的特定序列的广泛延伸。后者是通过不连续的螯合和这些酶经过ER和高尔基体的相对位置来控制的,是由转移酶的决定簇之间的相互作用和转移酶所要前往的亚高尔基体的特殊特性所介导的。许多使用杂合分子的研究已经发现了几种糖基转移酶的跨膜结构区在其亚高尔基分选过程中具有重要作用(Grabenhorst E.等人,J.Biol.Chem.274:36107-36116,1999;Colley,K.,Glycobiology.7:1-13,1997,Munro,S.,Trends Cell Biol.8:11-15,1998;Gleeson P.A.,Histochem.Cell Biol.109:517-532,1998)。

与用于药物工业中的哺乳动物生产细胞系相似,植物中产生的糖蛋白缺少GnTIII活性。植物不仅缺少GnTIII活性,而且完全缺少GnTIII样序列。另外,植物也缺少GnTIV,GnTV和GnTVI序列,而且还有唾液酸残基。(普遍使用的细胞表达系统包括植物的主要糖基化标志的概况见,Jenkins等人,“获得糖基化:对生物技术工业的意义”Nature Biotechnology 14:975-979,1996)。然而,植物是非常有力的生产系统。植物公认是安全的、不含对人有感染性的微粒。植物生产是容易上规模的,且可以控制N-连接的糖基化作用(Bakker等人,“转基因植物生产的抗体的半乳糖延伸聚糖”Proc.Nat.Acad.Sci.USA98:2899-2904,2001).

已经报道了在导入人β(1,4)-半乳糖基转移酶基因后可产生半乳糖基化的重组单克隆抗体(Mabs)的转基因烟草(hGalT;Bakker等人,“转基因植物产生的抗体的半乳糖延伸聚糖”Proc.Nat.Acad Sci.USA 98:2899-2904,2001;WO01/31044和WO01/31045)。

通过改变糖基化模式可改进治疗性糖蛋白(Davies等人,“在重组的抗CD20CHO生产细胞系中表达GnTIII:用改变的糖型表达的抗体通过与FcγRIII更高的亲和力引起ADCC的增加”Biotechnology and Bioengineering 74:288-294,2001;Umana等人,“具有优化的抗体依赖的细胞毒活性的抗成神经细胞瘤IgG1的基因工程糖型”Nature Biotechnology 17:176-180,1999;Fukuta等人,“人干扰素-γ糖链结构的重构Remodeling”Glycobiology 10:421-430,2000;Misaizu等人,“在肾脏处理重组人红细胞生成素中N-连接糖链触角结构的作用”Blood86:4097-4104,1995;Sburlati等人,“通过在中国仓鼠卵巢细胞中过度表达β-1,4-N-乙酰葡萄糖胺基转移酶III合成重组IFN-β的截断糖型”Biotechnology Prog.14:189-192,1998)。EPO更高级的寡糖触角结构,例如,由于减少了肾脏的过滤,在体内可导致活性增加(Misaizu等人,“在肾脏处理重组人红细胞生成素中N-连接糖链触角结构的作用”Blood 86:4097-4104,1995)。这种高级糖型的生物合成可用两种方法使用正常生产细胞系的“标准”糖基化结构来完成。第一步是在纯化过程中浓缩特异的糖型,第二步是在多肽链中导入突变。后者可在糖蛋白中变换糖基化位点,引起不同的糖基化方式,形成可达性的差异。一条补充的路线是通过生产细胞系本身的遗传工程。通过在生产细胞系中表达糖基转移酶和糖苷酶基因可获得新的糖基化方式。这些基因编码的酶向细胞糖蛋白的聚糖上添加特异的糖类,或从其上去除。几种糖基转移酶基因已经被导入CHO细胞中以控制糖型的生物合成。其中之一是GnTIII。糖基转移酶GnTIII参与N-连接聚糖的分支,并引起GlcNAc残基的截断。CHO细胞和其他的生产细胞系典型地缺少GnTIII活性(Stanley,P.和C.A.Campbell,“中国仓鼠卵巢细胞中蓖麻蛋白抗性的显性基因突变可诱导UDP-GIcNAc:糖肽β-4-N-乙酰葡萄糖胺基转移酶III活性”Journal of Biological Chemistry 261:13370-13378,1984)。CHO中GnTIII的表达可如所期望的那样形成等分的复合体寡糖,但过度表达导致生长抑制,对细胞是有毒性的。同样,另一个可导入三角糖链的糖基转移酶GnTV的过度表达也可导致生长抑制,表明这可能是糖基转移酶过度表达的一种普遍特征(Umana等人,“具有优化的抗体依赖细胞毒活性的抗成神经细胞瘤IgG1的改造糖型”Nature Biotechnology 17:176-180,1999)。

因此,需要提供一种手段来在植物中产生糖蛋白,所述的糖蛋白具有人类相容性的非免疫原性等分的寡糖。

发明的概述

发明涉及在植物中表达哺乳动物N-乙酰葡萄糖胺基转移酶III(GnTIII),及其在产生具有等分寡糖和末端GlcNAc残基数量增加的糖蛋白中的应用。发明进一步涉及含有GnTIII的催化位点、高尔基体和/或内质网(ER)蛋白的跨膜结构区、或含有ER固位信号的修饰的GNTIII的杂合蛋白,及其在产生糖蛋白中的应用,该糖蛋白具有的寡糖缺少免疫原性木糖和岩藻糖残基。

在一个实施方案中,本发明期望获得一种植物宿主系统,含有或表达一种哺乳动物UDP-N乙酰葡萄糖胺:(β-D-甘露糖苷β(1,4)-N乙酰葡萄糖胺基转移酶(GnTIII)酶(核苷酸序列:SEQ ID NO.:1,Genbank I.D.号AL022312(Dunham,I.等人,Nature 402:489-495,1999);蛋白序列:SEQ ID NO.:2,Genbank I.D.号Q09327),其中所述的GnTIII在所述植物宿主系统中存在的复合体型N-连接聚糖中插入了等分的N乙酰葡萄糖胺(GlcNAc)残基。

在本发明的一个特殊的实施例中,植物宿主系统进一步含有一种含有等分寡糖的异源糖蛋白或其功能片段,特别是半乳糖残基。GnTIII向所述的异源糖蛋白中插入了等分的N-GlcNAc残基。

在一个实施方案中,本发明期望获得一种表达含有等分的寡糖的异源糖蛋白的植物宿主系统的方法。在一个实施方案中,该法包括将表达异源糖蛋白的一种植物于表达所述GnTIII的植物杂交繁育,从所述的杂交繁育中获得子代,选择期望的表达所述异源糖蛋白和表达哺乳动物GnTIII的子代植物。可选择的是,所述的植物宿主系统可通过将一种编码所述哺乳动物GnTIII的核酸和编码所述异源糖蛋白的核酸导入植物或其部分中,并分离表达所述异源糖蛋白和表达通常不存在于植物中的哺乳动物GnTIII的植物或其部分而获得。而且,本发明涉及从所述植物中获得所述异源糖蛋白的方法,包括使用上述的任何一种步骤获得植物宿主系统,并进一步分离所述的异源糖蛋白。

在另一个实施方案中,预期的是本发明的植物宿主系统进一步含有一种功能性哺乳动物酶,可提供通常不存在于植物中的N-聚糖生物合成,因此,例如提供了如WO01/21045(在此引入以供参考)中所述通过添加半乳糖延伸N-连接聚糖的能力。在另一个实施方案中,本发明进一步预期一种植物宿主系统,其中所述的植物宿主系统包括将一种植物与含有所述哺乳动物GnTIII的植物杂交繁育,所述的前者植物含有一种功能性蛋白如转运子蛋白或酶(如,一种哺乳动物蛋白)或其功能性片段,其中所述的蛋白可提供N-聚糖的生物合成。在另一个实施方案中,本发明预期从所述杂交繁育中获得子代,并选择表达所述功能蛋白,例如一种转运子蛋白或酶或功能片段的期望子代植物。还是在本发明的另一个实施方案中,预期表达的蛋白可提供N-聚糖的生物合成和哺乳动物GnTIII。仍然还是在另一个实施方案中,本发明预期一种植物宿主系统,其中所述的编码GnTIII的核酸和编码功能蛋白(例如,一种转运子蛋白或酶[例如,哺乳动物的酶]或其功能片段)的核酸可提供N-聚糖的生物合成,并分离表达可提供N-聚糖生物合成和所述哺乳动物GnTIII的功能蛋白或其功能片段的所述植物或其部分。尽管本发明不限制任何特殊的理论或机制,但相信这样的结合增加异源糖蛋白的半乳糖基化,另外,在一个实施方案中,预期GnTIII和其他可提供N-糖基化作用的蛋白如GalT也可经过一个转化载体被同时导入。

在一个实施方案中,本发明预期一种植物宿主系统,包括表达所述的异源糖蛋白(其中,所述的异源糖蛋白的糖基化作用增加)以及获得所述植物宿主系统或所述异源糖蛋白的方法。在另一个实施方案中,植物宿主系统的获得可通过将一种植物与含有异源糖蛋白的一种植物杂交繁育,其中前面所述的植物含有哺乳动物GnTIII和一种功能蛋白(例如,可提供正常未在植物中发现的N-聚糖生物合成的一种转运子或一种酶[如,哺乳动物的酶]或其功能性片段),然后选择所述的子代植物。仍然在另一个实施方案中,预期所述的异源糖蛋白可通过导入编码以下的核酸序列而获得,1)所述的GnTIII,2)可提供正常未在植物中发现的N-聚糖生物合成的所述功能蛋白或酶和3)将所述的异源糖蛋白导入所述的植物中或其部分中,并分离表达所述核酸序列的所述植物或其部分。在本发明的另一个实施方案中,预期异源糖蛋白可从植物宿主系统中被分离和纯化。

在本发明的一个实施方案中,预期一种杂合蛋白,其中所述的杂合蛋白包括1)含有哺乳动物GnTIII的催化部分的一种分离的杂合蛋白和2)例如来自真核细胞内质网或高尔基体的蛋白的跨膜部分。在另一个实施方案中,本发明也预期一种修饰的哺乳动物GnTIII,其含有一种固位信号如KDEL以在ER中保留所述的GnTIII。仍然在另一个实施方案中,本发明预期编码以下的核酸序列1)所述的杂合蛋白和所述的修饰的哺乳动物GnTIII,2)含有所述核酸序列的载体和3)含有所述序列的植物宿主系统。在一个实施方案中,这些杂合蛋白和修饰的GnTIII的作用是在内质网(ER)和/或高尔基体中重新定位GnTIII活性。在另一个实施方案中,本发明预期了获得这些杂合蛋白和修饰的GnTIII蛋白的方法,例如通过将编码所述杂合蛋白或修饰的GnTIII蛋白的序列导入一种植物或其部分。尽管本发明并不限制任何特殊的理论或机制,但相信这种重新定位的结果是,等分的GlcNAc更早地被导入这些反应的N-聚糖生物合成序列中,防止随后的酶反应,结果,在植物宿主系统(例如,本发明的植物宿主系统)中表达的异源蛋白将缺少木糖或岩藻糖,并含有增加数量的末端GlcNAc。因此,本发明的一个实施方案预期一种提供植物宿主系统的方法,所述的宿主系统表达一种异源糖蛋白(所述的植物宿主系统具有延伸含有半乳糖的N-连接聚糖的能力),包括将一种含有所述1)杂合蛋白或所述的修饰GnTIII的植物与含有所述异源蛋白的植物杂交繁育和2)选择所述的期望的子代。在另一个实施方案中,本发明预期将编码以下的核酸序列导入一种植物或其部分中,该序列编码1)所述的修饰GnTIII或所述的杂合蛋白和所述的异源糖蛋白和2)分离表达具有延伸能力的异源糖蛋白和含有半乳糖的N-连接聚糖的所述植物或其部分。仍然在另一个实施方案中,本发明预期一种方法,可获得所述的期望异源糖蛋白,所述的方法包括从所述植物或其部分中分离所述的糖蛋白。

在一个实施方案中,本发明预期植物来源的糖蛋白或其功能片段可用来生产药物组合物(例如,一种抗体,一种激素,一种疫苗抗原,一种酶等等)。在另一个实施方案中,本发明预期一种药物组合物,它也含有现在被提供的糖蛋白或其功能片段。

在一个实施方案中,本发明预期GnTIII的变异体或突变体。术语“变异体”和“突变体”当用于多肽时,是指互相一个或多个氨基酸有差异的氨基酸序列,通常是相关的多肽。在另一个实施方案中,本发明预期具有“保守”变化的变异体,其中取代的氨基酸具有相似的结构或化学特性。保守氨基酸取代的一种类型是指具有相似侧链的残基的互换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸,酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸,精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和蛋氨酸。优选的保守氨基酸取代基是:缬氨酸(V)-亮氨酸(L)-异亮氨酸(I),苯丙氨酸(F)-酪氨酸(Y),赖氨酸(K)-精氨酸(R),丙氨酸(A)-缬氨酸(V),和天冬酰胺(N)-谷氨酰胺(Q)。

仍然在另一个实施方案中,本发明预期具有“非保守”改变的变异体(如,用色氨酸替换甘氨酸)。相似的较小变异也包括氨基酸去除或插入(即,添加),或两者都有。确定许多氨基酸残基被取代和如何取代,插入或去除而不丢失生物学活性的指导可使用本领域中熟知的计算机程序,例如DNAStar软件。变异体可在功能试验中被检测。对于保守和非保守变异体,优选的变异体的变化少于10%,优选少于5%,仍然更为优选的是少于2%(不论取代,去除等等)。

在一个实施方案中,本发明预期一种植物宿主(细胞)系统,包含一种哺乳动物UDP-N-乙酰葡萄糖胺:β-D甘露糖苷β(1,4)-N-乙酰葡萄糖胺基转移酶(GnTIII)酶(或其部分或其变异体,其中所述的GnTIII将等分的N-乙酰葡萄糖胺(GlcNAc)残基插入进存在于所述植物宿主系统中的糖蛋白的复合体型N-连接聚糖中)。在另一个实施方案中,本发明预期一种植物宿主,其中所述的GnTIII是人GnTIII。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是植物的一部分。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是植物的一部分,该植物选自细胞,叶,胚,胼胝,茎,果皮,原生质体,根,块茎,核,胚乳和胚芽。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的系统是整个植物。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包含一种异源糖蛋白(或其功能片段)。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白包括抗体,或其片段(如,Fc,Fv,Fab,Fab2)。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白或其功能片段包括等分的寡糖。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的异源糖蛋白(或其功能片段)包括具有半乳糖残基的等分的聚糖。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的植物是烟草。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包括选自可提供N-聚糖生物合成的转运子或(哺乳动物)酶(或其功能片段)的一种功能蛋白。仍然在另一个实施方案中,本发明预期植物宿主系统,其中所述的酶是(人)β-1,4半乳糖基转移酶。仍然在另一个实施方案中,本发明预期植物宿主系统,进一步包括一种具有更多数量的半乳糖残基的异源糖蛋白。仍然在另一个实施方案中,本发明预期的植物宿主系统包括编码哺乳动物GnTIII蛋白的核酸序列。仍然在另一个实施方案中,本发明预期的植物宿主系统包括一种载体,它含有编码哺乳动物GnTIII蛋白的核酸序列。仍然在另一个实施方案中,本发明预期的植物宿主,进一步包括编码一种功能蛋白的核酸序列,所述功能蛋白选自可提供N-葡萄糖的生物合成的转运子或(哺乳动物)酶或其功能片段。

在一个实施方案中,本发明预期一种方法(可获得表达具有等分的寡糖的异源糖蛋白的植物宿主系统),包括a)将表达异源糖蛋白的一种植物与a杂交繁育,b)从所述的杂交繁育中获得子代,和c)选择期望的子代植物(表达所述的异源糖蛋白和表达通常不存在于植物中的哺乳动物GnTIII)。在另一个实施方案中,本发明预期这种方法,其中所述的期望子代植物可表达所述的具有等分的寡糖的异源糖蛋白。仍然在另一个实施方案中,本发明预期这种方法,其中所述的植物宿主系统是转基因植物。

在一个实施方案中,本发明预期一种方法,可获得具有等分的寡糖的异源糖蛋白,包括a)将编码通常不存在于植物中的GnTIII的核酸序列导入植物宿主系统中和编码异源糖蛋白的核酸序列中,和b)分离所述的异源糖蛋白。在另一个实施方案中,本发明预期这种方法,其中所述的核酸序列被导入植物细胞中,所述的植物细胞被再生进植物中。仍然在另一个实施方案中,本发明预期相同的方法,其中所述的核酸序列通过用载体转化所述植物宿主系统被导入植物宿主系统中,所述载体在植物中含有通常在植物中不存在的编码GnTIII的酸序列和编码异源糖蛋白的核酸序列。仍然在另一个实施方案中,本发明预期该方法,其中所述的核酸序列通过用载体转化所述植物宿主系统被导入植物宿主系统中,所述载体在植物中含有通常在植物中不存在的编码GnTIII的核酸序列和编码异源糖蛋白的核酸序列。仍然在另一个实施方案中,本发明预期该方法,其中所述的核酸序列通过用在植物宿主系统中含有通常在植物中不存在的编码GnTIII的核酸序列的载体和含有编码异源糖蛋白的核酸序列的载体转化所述植物被导入植物宿主系统中。仍然在另一个实施方案中,本发明预期一种方法,以获得具有等分的寡糖的异源糖蛋白,包括培植再生的植物。24.根据权利要求20的方法,

在一个实施方案中,本发明预期一种方法,以获得期望的糖蛋白(或其功能片段),包括a)培植植物宿主系统(直至所述的植物达到可收获的程度)和b)收获所述的植物(并分馏获得分馏的植物原料,和c)从所述的分馏的植物原料中至少部分分离所述的糖蛋白)。在另一个实施方案中,本发明预期得到通过预期的方法可获得的植物。

在一个实施方案中,本发明预期一种方法,以获得含有功能蛋白的植物宿主系统,该功能蛋白选自可提供N-聚糖生物合成的转运子或一种(哺乳动物)酶或其功能片段,以及一种哺乳动物GnTIII,包括将含有一种功能蛋白的植物与根据权利要求5中的植物杂交繁育,其中所述的功能蛋白如可提供N-聚糖生物合成的转运子或(哺乳动物)酶或其功能片段,从所述的杂交繁育中回收子代,并选择表达所述功能蛋白的期望的子代植物,从而提供N-聚糖生物合成的转运子或(哺乳动物)酶或其功能片段,以及所述的GnTII。在另一个实施方案中,本发明预期根据计划的方法获得的转基因植物。

在一个实施方案中,本发明预期一种方法,以增加在植物宿主系统中表达的异源糖蛋白的半乳糖基化作用,包括将编码GnTIII的核酸序列和以下序列导入表达所述异源糖蛋白的所述植物宿主系统中,并分离所述的糖蛋白,其中所述“以下序列”选自编码通常不存在于植物中的转运子或(哺乳动物)酶或功能片段。

在一个实施方案中,本发明预期一种植物来源的含有等分寡糖的糖蛋白。

在一个实施方案中,本发明预期使用本发明预期的植物宿主系统来产生期望的糖蛋白或其功能片段。在另一个实施方案中,本发明预期所述的糖蛋白或其功能片段包含等分的寡糖。仍然在另一个实施方案中,本发明预期一种由本发明预期的方法获得的植物来源的糖蛋白或其功能片段。仍然在另一个实施方案中,本发明预期一种糖蛋白或其功能片段,本发明预期用来生产药物组合物。仍然在另一个实施方案中,本发明预期一种组合物,包含一种糖蛋白或其功能片段,如本发明所预期的那样。

在一个实施方案中,本发明预期一种分离的杂合蛋白,其含有GnTIII的活性位点,和蛋白的跨膜区,所述的蛋白位于真核细胞的内质网或高尔基体中。在另一个实施方案中,本发明预期本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是一种酶。仍然在另一个实施方案中,本发明预期根据本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是糖基转移酶。仍然在另一个实施方案中,本发明预期本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是选自下列的糖基转移酶:甘露糖苷酶1,甘露糖苷酶II,GnTI,GnTII,XylT和FucT。仍然在另一个实施方案中,本发明预期根据本发明的蛋白,其中所述的位于真核细胞内质网或高尔基体中的蛋白是植物蛋白。仍然在另一个实施方案中,本发明预期一种编码本发明蛋白的分离的核酸序列。仍然在另一个实施方案中,本发明预期一种载体,包含本发明的分离的核酸序列。仍然在另一个实施方案中,本发明预期一种植物,它含有本发明的分离核酸序列。仍然在另一个实施方案中,本发明预期本发明的植物,它进一步含有编码异源糖蛋白的核酸序列。

在一个实施方案中,本发明预期一种方法(提供能够表达一种具有用半乳糖延伸N-连接聚糖的能力的异源糖蛋白的转基因植物),包括a)将转基因植物与本发明的植物杂交繁育,b)从所述的杂交繁育中回收子代和c)选择期望的子代植物(表达所述的重组蛋白和表达参与正常植物中不存在的(哺乳动物)N-聚糖生物合成的功能性(哺乳动物)酶)。

在一个实施方案中,本发明预期一种方法,可提供能够表达,具有使用半乳糖延伸N-连接聚糖的能力的异源糖蛋白的转基因植物,包括导入本发明的核酸序列和编码所述异源糖蛋白的核酸序列。

在一个实施方案中,本发明预期一种方法,包括:a)提供:i)一种植物细胞,和ii)一种含有编码GNTIII酶的核酸的表达载体;和b)在表达所述酶的条件下将所述的表达载体导入所述的植物细胞。在另一个实施方案中,本发明预期该方法,其中所述的编码GNTIII的核酸包括SEQ ID NO:1的核酸序列。

在一个实施方案中,本发明预期一种方法,包括:a)提供:i)一种植物细胞,ii)含有编码GNTIII酶核酸的第一个表达载体,和iii)含有编码异源糖蛋白的核酸的第二个表达载体;和b)在表达所述杂合酶和所述异源蛋白的条件下,将所述第一个和第二个表达载体导入所述植物细胞中。在另一个实施方案中,本发明预期,其中所述的异源蛋白是一种抗体或抗体片段。

在一个实施方案中,本发明预期一种方法,包括:a)提供:i)含有第一个表达载体的第一种植物,所述的第一种载体含有编码GNTIII酶的核酸,和ii)含有第二个表达载体的第二种植物,所述的第二个载体含有编码异源蛋白的核酸;和b)将所述的第一种植物和所述的第二种植物杂交繁育产生可表达所述杂合酶和所述异源蛋白的子代。

在一个实施方案中,本发明预期一种植物,含有第一个和第二个表达载体,所述的第一个载体含有编码GNTIII酶的核酸,所述的第二个载体含有编码异源蛋白的核酸。在另一个实施方案中,本发明预期该方法,其中所述的异源蛋白是一种抗体或抗体片段。

附图描述

图1A和1B显示了(A)从对照烟草植物叶中分离的N-连接聚糖的MALDI-TOF质谱和(B)从用人GnTIII转化的选择的GnTM-17烟草叶中分离的N-连接聚糖。见表1中的结构。

图2显示了在随后ManI,GnTI,Manll,和GnTII的作用下,高甘露糖型聚糖(M9)加工为复合型聚糖。也要指出的是Gal T和/或GnTIII在反应链中不同点上的作用将产生的何种结构。由岩藻糖基转移酶和木糖基转移酶催化的反应并未指示。核心GlcNAc(Gn)未指示。Gn=GlcNAc,Gnb=等分的GlcNAc,G=半乳糖,以及M=甘露糖。

图3A和3B显示了(A)携带编码聚糖修饰酶的基因的T-DNA构建物,可有效地产生半乳糖基化的等分聚糖,它缺少免疫原性的木糖和岩藻糖,以及(B)携带抗体轻链和重链基因的T-DNA构建物。TmXyl=木糖基转移酶的跨膜结构区,TmGnTI=GnT的跨膜结构区,P=启动子,R=选择标记物,L=抗体轻链,以及H=抗体重链。

图4A和4B显示了GnTIII的核苷酸序列(SEQ ID NO:1,图4(A)的下划线部分,蛋白序列(SEQ ID NO:2,图4B的下划线部分),包括一个c-myc标记。可经受保守氨基酸取代的残基在定义章节中进行定义。

图5A和5B显示了(A)质粒pDAB4005的图谱,以及(B)质粒pDAB4005(SEQ IDNO:8)的核苷酸序列。

图6A和6B显示了(A)质粒pDAB7119的图谱和(B)质粒pDAB7119(SEQ ID NO:9)的核苷酸序列,包括拼接位点。

图7A和7B显示了(A)质粒pDAB8504的图谱和(B)质粒pDAB8504(SEQ ID NO:10)的核苷酸序列。

图8A和8B显示了(A)质粒pDAB7113的图谱和(B)质粒pDABVl13(SEQ ID NO:11)包括拼接位点的核苷酸序列。

图9A和9B显示了对照和GnTIII玉米的糖蛋白的MALDI-TOF质谱。从(A)对照玉米和(B)选择的GnTIII玉米的胼胝中分离的糖蛋白的N-聚糖的质谱比较。GnTIII玉米是用人GnTIII基因序列通过转化获得的,通过凝集素印迹,使用E-PFIA进行选择。见表3,数据的注释包含在图9A和9B中。

图10显示了没有c-mac标记的GntIII的全部核苷酸序列(SEQ ID NO:7)。

图11显示了来自对照和GnTIII-2的糖蛋白的MALDI-TOF质谱。见,表4的结构和缩写。

图12显示了转基因玉米胼胝标本的代表性印迹,表示由于表达GntIII基因而改变的凝集素结合。

图13显示了转基因玉米胼胝标本的代表型印迹,表示c-myc抗原决定簇的表达。

图14A和14B显示了来自(A)对照和(B)GnTIII玉米植物的糖蛋白的MALDI-TOF质谱。

定义

术语“蛋白”和“多肽”是指一些包括经肽键结合在一起的氨基酸的化合物,可相互互换使用。由基因编码的“蛋白”或“多肽”并不限于由基因编码的氨基酸序列,但包括蛋白的翻译后修饰。

术语“糖蛋白”是指具有共价附着的糖单位的蛋白,经丝氨酸或苏氨酸的OH基团键合(O糖基化)或通过天冬酰胺的酰胺NH2(N糖基化)键合。“糖蛋白”可包括,但不限于,例如大多数的分泌蛋白(血清白蛋白是主要的例外)和暴露在浆膜外表面上的蛋白。已发现的糖残基包括,但不限于:甘露糖,N乙酰葡萄糖胺,N乙酰基半乳糖胺,半乳糖,岩藻糖和唾液酸。

当在此叙述的术语“氨基酸序列”是指蛋白分子的氨基酸序列,“氨基酸序列”和类似术语,如“多肽”或“蛋白”并不意味要将氨基酸序列限制在于在此叙述的蛋白分子有关的完全的,天然的氨基酸序列。而且,“氨基酸序列”可从编码蛋白的核酸序列中推导出来。

术语“部分”当用于说明蛋白时(如在“给定蛋白的部分”)是指该蛋白的片段。片段的大小范围可从4个氨基酸残基至整个氨基酸序列减一个氨基酸。

术语“嵌合体”当用于说明多肽时是指从不同基因获得的两个或多个编码序列的表达产物,已经被克隆在一起,在翻译后可作为一个单独的多肽序列。嵌合的多肽也可指“杂合”多肽。编码序列包括从相同或不同种属生物体中获得的序列。

术语“融合”当用于说明多肽时是指与外源蛋白片段连接(融合伴侣)的含有目的蛋白的嵌合蛋白。融合伴侣可起很多功能,包括增强目的多肽的可溶性,以及提供“亲和标记”允许从宿主细胞或从上清液或两者中纯化重组的融合多肽。如果需要,融合伴侣可在纯化后或当中从目的蛋白中去除。

术语“同系物”或“同源的”当用于说明多肽时是指在两种多肽之间序列同一性有很高的程度,或在三维结构之间有很高程度的相似性,或在活性位点和作用机制之间有很高的相似性。在一个优选的实施例中,同系物与参考序列具有超过60%的序列同一性,更优选的是超过75%的序列同一性,仍然是更为优选的是超过90%的序列同一性。

当用于多肽时,术语“实质上的同一性”的含义是两个肽序列,当最佳线性排比时,如通过程序GAP或BESTFIT采用缺省的缝隙补偿,具有至少80%的序列同一性,优选至少90%的序列同一性,更优选的是至少95%的序列同一性或更多(例如,99%的序列同一性)。优选,不相同的残基位点在保守氨基酸取代上是不同的。

术语“变异体”和“突变体”当用于说明多肽时是指一条氨基酸序列与另一条一个或多个氨基酸是不同的,通常是相关的多肽。变异体具有“保守的”变化,其中取代的氨基酸具有相似的结构或化学特性。一个类型的保守氨基酸取代是指具有相似侧链的残基的可交换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸,丙氨酸,缬氨酸,亮氨酸和异亮氨酸,一组具有脂肪族-羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺谷氨酰胺;一组具有芳香族侧链的氨基酸是苯丙氨酸,酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸,精氨酸和组氨酸;一组具有含硫侧链的氨基酸是半胱氨酸和蛋氨酸。优选的保守氨基酸取代基团是:缬氨酸(V)-亮氨酸(L)-异亮氨酸(I),苯丙氨酸(F)-酪氨酸(Y),赖氨酸(K)-精氨酸(R),丙氨酸(A)-缬氨酸(V),和天冬酰胺(N)-谷氨酰胺(Q)。较罕见的是,变异体可具有“非保守”改变(如,用色氨酸替换甘氨酸)。相似的最小变异也包括氨基酸删除或插入(即,添加),或两者都有。确定氨基酸残基被取代和有多少被取代,插入或去除而不丢失生物学活性的指导可使用本领域中熟知的计算机程序,例如DNAStar软件。变异体可在功能测定中被检测。优选的变异体少于10%,优选少于5%,仍然更为优选的是少于2%改变(无论取代,删除等等)。

当用于说明多肽时,术语“结构区”是指一种多肽的片段,具有独特的结构和/或功能特性;典型地,这种特性在不同的多肽之间是相似的。该片段典型地包括邻近的氨基酸,尽管也可以包括一起发挥作用的氨基酸或由于折叠或其他的构型而紧密靠近的氨基酸。

术语“基因”是指一种核酸序列(如,DNA或RNA),其含有产生RNA,多肽或其前体(如,胰岛素原)所必需的编码序列。功能多肽可被全长编码序列或编码序列的任何部分编码,只要保留期望的多肽活性或功能特性(如,酶活性,配体结合,信号转导等)。术语“部分”当用于说明基因时是指该基因的片段。片段的大小范围从几个核苷酸(如,十个核苷酸)至整条基因序列减去1个核苷酸。因此,“含有至少一部分基因的核苷酸”可能包含基因的片段或整条基因。

术语“基因”也包括结构基因的编码区,包括位于5’和3’末端编码序列邻近的序列,在每个末端的距离大约为1kb,这样基因对应于全长mRNA的长度。位于编码区5’和存在于mRNA上的序列是指5’未翻译序列。位于3’或编码区下游的序列和存在于mRNA上的序列是指3’非翻译序列。术语“基因”包括基因的cDNA和基因组形式。基因的基因组形式或克隆包含称为“内含子”或“插入区”或“插入序列”的非编码序列间隔的编码区。内含子是被转录为核RNA(hnRNA)的基因片段;内含子可含有调控元件如增强子。内含子从核中或原始的转录物中被去除或“拼接去掉”;因此内含子不存在于信使RNA(mRNA)转录物中。mRNA在翻译过程中的功能是在新生多肽中指定序列或氨基酸的顺序。

除了含有内含子,基因的基因组形式也包括位于序列5’和3’末端上的序列,该序列位于RNA转录物上。这些序列是指“侧翼”序列或区域(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5’或3’)。5’侧翼区可含有调控序列如启动子和增强子,可控制或影响基因的转录。3’侧翼序列可含有可引导转录终止,翻译后断裂和聚腺苷化作用的序列。

术语“异源”当用于说明基因时是指编码不在其天然环境中的因子的基因(即,可人工改变)。例如,异源基因包括被导入另一种属中的一种种属的基因。异源基因也包括已经以某种方式改变的生物体所固有的基因(如,突变的,加入了多个拷贝,与非天然启动子或增强子序列连接的基因等)。异源基因可含有一些基因序列,它们包括基因的cDNA形式,cDNA序列可以正义(产生mRNA)或反义的方向表达(产生与mRNA转录物互补的反义RNA转录物)。异源基因与内源基因的区别是异源基因序列典型地与含有调控元件如启动子的核苷酸序列连接,对于异源基因编码的蛋白发现所述启动子与基因天然是不相关的或与染色体中的基因序列是不相关的,或与自然未发现的染色体部分有关(如,在正常情况下不表达基因的位点表达的基因)。

“异源糖蛋白”是来自植物宿主系统以外物种的糖蛋白。糖蛋白包括但不限于抗体,激素,生长因子和生长因子受体,抗原,细胞因子和血液制品。

“植物宿主系统”可包括,但不限于包括但不限于植物细胞,植物器官和/或植物组织的植物或其部分。植物可以是单子叶植物(单子叶),其是显花植物,其晶胚有一个子叶或种子叶片,包括但不限于百合,草,玉米(玉米),稻米,谷类包括燕麦,小麦和大麦,兰花,鸢尾属植物,洋葱和棕榈。可选择地,植物可以是双子叶植物(双子叶),包括但不限于烟草(烟草属),番茄,马铃薯,荚果(如,紫花苜蓿和大豆),玫瑰,雏菊,仙人掌,紫罗兰和浮萍。植物也可以是苔藓,包括但不限于Physcomitrella patens。发明进一步是针对一种方法,通过将编码所述GnTIII的核酸导入植物或其部分,表达所述的GnTIII,并分离表达所述GnTIII的所述植物或其部分,从而在植物宿主系统中获得所述等分GlcNAc。

术语“目的核苷酸序列”或“目的核酸序列”是指任何核苷酸序列(如,RNA或DNA),由本领域的普通技术人员由于任何原因(如,治疗疾病,赋予改良的特性等等)认为期望要的操作。这种核苷酸序列包括但不限于,结构基因的编码序列(如,报告子基因,选择标记物基因,癌基因,药物抗性基因,生长因子等),和不编码mRNA或蛋白产物的非编码调控序列(如,启动子序列,聚腺苷化化序列,终止序列,增强子序列和其他类似序列)。本发明预期表达由目的核苷酸序列编码的异源蛋白和一种或多种杂合酶的宿主细胞。

术语“结构的”当用于说明基因或核苷酸或核酸序列时是指一条基因或核苷酸或核酸序列,其最终的表达产物是一种蛋白(如酶或结构蛋白),rRNA,sRNA,tRNA等。

术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指含有两个或更多脱氧核糖核苷酸或核糖核苷酸的分子,优选超过三个,通常超过十个。准确的大小依赖于许多因素,它们依次要依赖于寡核苷酸的最终功能或用途。可以任何方式产生寡核苷酸,包括化学合成,DNA复制,逆转录或其组合。

术语“具有编码一种基因的核苷酸序列的寡核苷酸”或“编码特定多肽的核酸序列”是指含有基因编码区的核酸序列,或换句话说,编码基因产物的核酸序列。编码区可存在于cDNA,基因组DNA或RNA形式中。当存在于DNA形式中,寡核苷酸可以是单链(即,有义链)或双链。合适的控制元件如增强子/启动子,拼接点,聚腺苷化信号等,如果需要正确的启动原始RNA转录物的转录和/或准确的加工,可以置于紧靠基因编码区的位置。可选择的是,用于本发明表达载体中的编码区可含有内源性增强子/启动子,拼接点,插入序列,聚腺苷化信号,等,或内源和外源控制元件的组合。

术语“重组”当用于说明核酸分子时,是指包含通过分子生物学技术连接在一起的核酸片段的核酸分子。“重组”当用于说明蛋白或多肽时是指可采用重组核酸分子表达的蛋白分子。

如在此所使用的,术语“互补”或“互补性”用于说明根据碱基配对原则有关联的核苷酸序列。例如,序列5’AGT-3’与序列5’-ACT-3’互补。互补型可以是“部分”或“全部”。“部分”互补性是根据碱基配对原则一个或多个核酸碱基不匹配。在核酸之间的“全部”或“完全”互补性是每个和任何一个核酸碱基与另一个碱基在碱基配对原则下相匹配。核酸链之间互补的程度对核酸链之间杂交的效率和强度具有明显的作用。

如在此所使用的核酸序列的“互补体”是指一条核苷酸序列,其核酸显示与核酸序列的核酸具有全部的互补性。例如,本发明预期SEQ ID NO:1的互补体。

术语“同源性”当用于核酸时是指互补性的程度。有部分同源(即,部分同一性)或完全同源(即,完全的同一性)。部分互补的序列是可至少部分抑制来自与靶核酸杂交的完全互补序列的序列,是指使用功能性术语“实质上同源的”。抑制靶序列与完全互补序列的杂交可采用杂交试验来检测(Southern或Northern印迹,溶液杂交和类似方法),在低严紧条件下进行。实质上同源的序列或探针(即,能够与另一个目的寡核苷酸杂交的寡核苷酸)将竞争和抑制完全同源序列与靶标在低严紧条件下的结合(即,杂交作用)。这并不是说低严紧条件是非特异性结合所允许的条件;低严紧条件需要,两条需要与另一条序列的结合是特异性(即,选择性)的相互作用。通过使用恰好缺少部分的互补性(如低于大约30%的同一性)第二靶标可检测到缺少非特异结合;在没有非特异性结合时,探针将不与第二个非互补性的靶标杂交。

当用于说明双链核酸序列如cDNA或基因组克隆时,术语“实质上同源”是指任何在如前所述的低严紧条件下与双链核酸序列的单链或双链杂交的探针。

当用于说明单链核酸序列时,术语“实质上同源”是指任何可与单链核酸序列在如前所述的低严紧条件下杂交的探针。

下面的术语是用来描述两个或更多多核苷酸之间的序列关系:“参考序列”,“序列同一性”,“序列同一性的百分比”和“实质上的同一性”。“参考序列”是一条用作序列比较根据的指定序列;参考序列可以是更大序列的一个子集,例如在序列列表中指定的全长cDNA序列的片段或含有一条完整的基因序列。通常,参考序列在长度是至少为20个核苷酸,经常为至少25个核苷酸,经常至少为50个核苷酸。由于两个多核苷酸每个都(1)含有两个多核苷酸之间相似的一条序列(即,完整的多核苷酸序列的一部分),和(2)可进一步含有两个核苷酸之间不同的序列,两个(或更多)多核苷酸之间的序列比较典型地通过在“比较窗”上比较两个核苷酸的序列而进行,以鉴定和比较序列局部区域的相似性。如在此所使用的“比较窗”是指至少20个连续核苷酸位置的概念性片段,其中所述的多核苷酸序列可与至少20个连续核苷酸的参考序列比较,其中所述的比较窗中的多核苷酸序列部分为进行两条序列的最佳线性排比,包括与参考序列(不包含插入或删除)比较20%或更少的插入或删除(即,间隙)。为了在比较窗中进行线性排比,序列的最佳线性排比可选择通过Smith和Waterman的局部同源算法来执行[Smith和Waterman,Adv.Appl.Math.2:482(1981)],通过Needleman和Wunsch的同源线性排比算法执行[Needleman和Wunsch,.J.Mol.Biol.48:443(1970)],通过Pearson和Lipman的相似性搜索法执行[Pearson和Lipman,Proc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)],通过这些算法程序化来实现(GAP,BESTFIT,FASTA,和TFASTA在Wisconsin Genetics软件包7.0版,Genetics Computer Group,575Science Dr.,Madison,Wis.),或通过观察,和多种方法所产生的最佳线性排比执行(即,在比较窗中产生最高的同源百分比)。术语“序列同一性”的含义是两个多核苷酸序列在比较窗上是相同的(即,在一个核苷酸比较一个核苷酸的基础上)。术语“序列同一性的百分比”的计算是通过在比较窗上比较两个最佳线性排比的序列,测定在两条序列中核酸碱基(如,A,T,C,G,U,或I)相同的位点的数量,产生匹配位点的数量,将匹配位点的数量除以比较窗中位点的总数量(即,窗的大小),将结果乘以100得到序列同一性的百分比。在此所使用的术语“实质上的同一性”表示了多核苷酸序列的一种特征,在具有至少20个核苷酸位点,经常是至少25-50个核苷酸的比较窗上与参考序列相比,其中所述的多核苷酸包括具有至少85%序列同一性的序列,优选至少90至95%序列同一性,更普遍的是至少99%序列同一性,其中所述的序列同一性的百分比的计算可通过将参考序列与多核苷酸序列比较,后者可含有在比较窗上总共20%或更少的参考序列的删除或插入。参考序列可以是更大的序列的子集,例如,本发明中声明的组合物全长序列的片段。

术语“杂交”是指互补核酸的配对。杂交和杂交的强度(即,核酸之间结合作用的强度)受一些因素的影响,如核酸之间的互补性程度,所涉及条件的严紧,形成杂交的Tm,和核酸内G∶C比例。在其结构中含有互补核酸配对的单个分子称为“自身杂交”。

术语“Tm”是指核酸的“解链温度”。在解链温度下,一组双链核酸分子半解离成为单链。计算核酸Tm的方程在本领域中是熟知的。如在标准参考所示,当核酸在1M NaCl的水溶液中时,Tm值的简单估算可通过下面的方程来计算:Tm=81.5+0.41(%G+C)(见,如Anderson和Young,定量滤膜杂交,核酸杂交[1985])。其他的参考包括更复杂的计算法,要考虑结构以及序列的特性来计算Tm。

术语“严紧”是指温度,离子强度和存在其他化合物如有机溶剂的条件,在这种条件下可进行核酸的杂交。在“高严紧”条件下,核酸碱基配对仅发生在具有很高互补碱基序列频数的核酸片段之间。因此,经常需要“低严紧”的条件,核酸来自有遗传多样性的生物体,因为互补序列的频数通常是很少的。

当用于说明核酸杂交时“低严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整为7.4),0.1%SDS,5X Denhardt’s试剂[50X Denhardt’s每500ml含有:5g Ficoll(400型,Pharmacia),5g BSA(片段V;Sigma)]和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由5XSSPE,0.1%SDS组成的溶液中在42℃冲洗。

当用于核酸杂交时“中严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整为7.4),0.5%SDS,5X Denhardt’s试剂和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由1.0X SSPE,1.0%SDS组成的溶液中在42℃冲洗。

当用于核酸杂交时“高严紧条件”包括的条件相当于在42℃在由5X SSPE(43.8g/l NaCl,6.9g/l NaH2PO4(H2O和1.85g/l EDTA,pH用NaOH调整位7.4),0.5%SDS,5X Denhardt’s试剂和100μg/ml变性鲑鱼精DNA组成的溶液中进行结合或杂交,然后当使用的探针长度为大约500个核苷酸时,在由0.1X SSPE,1.0%SDS组成的溶液中在42℃冲洗。

已知的是大量相当的条件可用来组成低严紧条件;可考虑的因素如探针的长度和特性(DNA,RNA,碱基组成)和靶标的特性(DNA,RNA,碱基组成,存在于溶液中或被固定,等),盐类的浓度和其他成分(如,存在或缺少甲酰胺,硫酸葡聚糖,聚乙二醇),可改变杂交溶液产生不同于但等价于上述所列举条件的低严紧杂交条件。另外,本领域已知在高严紧条件下可促进杂交的条件(如,增加杂交的温度和/或冲洗步骤,在杂交溶液中使用甲酰胺,等等)。

另外,术语“相当的”当用于杂交条件时,因为涉及目的杂交条件,其含义是杂交的条件和目的杂交条件可引起具有相同范围的同源性百分比(%)的核酸序列的杂交。例如,如果目的杂交条件可引起第一条核酸序列与其他的和第一条核酸序列具有50%至70%同源性的核酸序列的杂交,如果其他的杂交条件也可引起第一条核酸序列与其他的和第一条核酸序列具有50%至70%同源性的核酸序列的杂交,则另一个杂交条件被认为相当于目的杂交条件。

当用于核酸杂交时,本领域已知大量的相当条件可用来组成低或高的严紧条件;可考虑的因素如探针的长度和特性(DNA,RNA,碱基组合物)和靶标的特性(DNA,RNA,碱基组合物,存在于溶液中或被固定,等),盐类的浓度和其他成分(如,存在或缺少甲酰胺,硫酸葡聚糖,聚乙二醇),可改变杂交溶液产生不同于但等价于上述所列举条件的低或高严紧杂交条件。

术语“野生型”当用于说明基因时,是指具有从天然来源分离基因的特征。术语“野生型”当用于说明基因产物时,是指具有从天然来源分离的基因产物的特征。术语“天然产生的”当用于一种物体时是指该物体可在自然中发现。例如,存在于一种生物体(包括病毒)中,可从天然的来源中分离,没有被人类有意地在实验室中修饰的多肽或多核苷酸序列是天然产生的。野生型基因经常是在群体中最常被观察到的基因,因此被人为地指定为基因的“正常”或“野生型”形式。相反,术语“修饰”或“突变体”当用于基因或基因产物时,分别是指当与野生型基因或基因产物相比较时,在序列和/或功能特性(即,特征改变)中显示有修饰作用的基因或基因产物。要注意的是天然产生的突变体可被分离;当与野生型基因或基因产物相比较时,可根据其具有改变的特征而被鉴定。

因此,当用于核苷酸序列时,术语“变异体”和“突变体”是指与另一条序列,通常是相关的核苷酸序列有一个或多个核苷酸差异的核酸序列。“变异”是两条不同的核苷酸序列之间的差异;典型地,一条序列是参考序列。

术语“多态性位点”是指存在于在群体成员之间显示有变异的群体中存在的遗传位点(即,最普遍的等位基因的频数小于0.95)。因此,“多态性”是指在一个群体中的两个或多个变异体中存在的一种特征。“单核苷酸多态性”(或SNP)是指单一碱基的遗传位点,它可被至少两个不同的核苷酸中的一个占据。相反,“单态性位点”是指一种遗传位点,在此位点上,在群体的成员之间很少或未发现变异(通常是指一种位点,在此位点上在群体的基因库中最普遍的等位基因的频数超过0.95)。

“移框突变”是指在核苷酸序列中的突变,通常是由单个核苷酸(或两个或四个核苷酸)的插入或删除引起的,可引起编码单摆的结构DNA序列的正确可读框的改变。改变的可读框通常可引起翻译的氨基酸序列改变或截短。

“拼接突变”是指通过影响正确的RNA拼接而影响基因表达的任何突变。拼接突变是由于在可改变拼接位点的内含子-外显子边界上的突变产生的。

术语“检测试验”是指可检测序列或变异核酸序列的存在或缺如的试验(如,在特殊基因的指定等位基因中的突变或多态性,如GnTIII基因,SEQ ID NO:1,图4A),或检测特殊蛋白的存在或缺如(如,GnTIII,SEQ ID NO:2,图4B)或特殊蛋白的结构或活性或作用(如,GnTIII活性),在特殊蛋白上检测糖基化部分(如,N-连接的聚糖)或检测特殊蛋白的变异体的存在或缺如。

术语“反义”是指一种脱氧核糖核酸序列,其脱氧核糖核苷酸残基的序列是与5’至3’方向相反的,与DNA双螺旋的有义链中的脱氧核糖核苷酸残基的序列有关。DNA双螺旋的“有义链”是指DNA双螺旋中的一条链,它可以其天然状态被细胞转录为“有义mRNA”。因此,“反义”序列是与DNA双螺旋中非编码链具有相同序列的序列。术语“反义RNA”是指与靶原始转录物或mRNA的所有或部分互补的RNA转录物,可通过干扰其原始转录物或mRNA的加工,转运和/或翻译来阻断靶基因的表达。反义RNA可与特殊基因转录物的任何部分互补,即5’非编码序列,3’非编码序列,内含子,或编码序列。另外,如在此所使用的,反义RNA可含有核糖酶序列的区域,该序列可增加反义RNA阻断基因表达的效力。“核糖酶”是指接触反应性RNA,包括序列特异性的核糖核酸内切酶。“反义抑制”是指产生能够阻止靶蛋白表达的反义RNA转录物。

“扩增”是涉及模板特异性的一种特殊的核酸复制。要与非特异性模板复制相对比(即,复制是模板依赖性的而不依赖特殊的模板)。模板特异性在此要与复制的精度(即,合成正确的多核苷酸序列)和核苷酸(核糖-或脱氧核糖-)特异性区分。模板特异性经常被描述为“靶”特异性。靶序列是“靶标”,其意义是被搜索以便从其他的核酸中挑选出来。为了这种分选,已经设计了扩增技术。

模板特异性可通过选择酶在大多数扩增技术中可达到。扩增酶在使用的条件下,将在核酸的非均匀混合物中仅处理特异的核酸序列。例如,对于Q3复制酶,MDV-1 RNA是复制酶的特异模板(Kacian等人,Proc.Natl.Acad.Sci.USA,69:3038,1972)。其他的核酸不能被这种扩增酶所复制。同样,对于T7 RNA聚合酶,这种扩增酶对其自身的启动子有严格的特异性(Chamberlain等人,Nature,228:227,1970)。对于T4 DNA连接酶,酶不能连接两个寡核苷酸或多核苷酸,其中在寡核苷酸或多核苷酸底物和连接结合点处的模板是不匹配的(Wu和Wallace,Genomics.4:560,1989)。最后,Taq和Pfu聚合酶,由于其能够在高温下发挥作用,发现对于结合的序列显示有很高的特异性,因此可由引物来确定;高温可产生热力学条件,促进引物与靶序列的杂交,但不与非靶序列杂交(H.A.Erlich(主编),PCR技术,Stockton Press,1989)。

术语“可扩增的核酸”是指可通过任何扩增方法扩增的核酸。预期“可扩增的核酸”通常包括“样本模板”。

术语“样本模板”是指来自被分析存在“靶标”(下面将说明)的样本的核酸。相反,“背景模板”用于说明的不是样本模板,存在或不存在于样本中的核酸。背景模板通常大多数是可被忽略的。可能是残留物的结果,或可能由于存在核酸污染物,可从样本中纯化清除。例如,在待测样本中来自非检测生物体的核酸可能存在成为背景。

术语“引物”是指一种寡核苷酸,不管是天然存在的被纯化的限制性消化产物或合成产生的,当置于一定条件下时能够作为启动合成点,在此条件下可诱导与核酸链互补的引物延伸产物的合成(即,存在核苷酸和诱导剂如DNA聚合酶,并在合适的温度和pH下)。引物优选单链以获得扩增的最大效率,但可选择双链。如果是双链,引物首先要被处理,其双链要在被用来制备延伸产物之前被分离。优选引物是寡脱氧核糖核苷酸。引物必须足够长以准备在诱导剂的存在下启动延伸产物的合成。引物的准确长度依赖于许多因素,包括温度,引物的来源和使用的方法。

术语“探针”是指一种寡核苷酸(即,核苷酸序列),不管是天然存在的被纯化的限制性消化产物或合成产生的,重组的或通过PCR扩增的,能够与另一个目的寡核苷酸杂交。探针可以是单链或双链。探针可用于特殊基因序列的检测,鉴定和分离。预期任何在本发明中使用的探针将用任何“报告分子”进行标记,以便可在任何检测系统中可检测到,包括但不限于酶(如,ELISA以及酶组织化学测定),荧光,放射活性,和发光系统。并不想使本发明限制于任何特殊的检测系统或标记。

术语“靶标”,当用于聚合酶链式反应中时,是指用于聚合酶链式反应中的引物所结合的核酸的区域。因此要从其他的核酸序列中搜寻“靶标”将其分选出来。“片段”的定义是在靶序列中的核酸区域。

术语“聚合酶链式反应”(″PCR″)是指K.B.Mullis美国专利Nos.4,683,195,4,683,202,和4,965,188的方法,描述了在基因组DNA的混合物中不需要克隆或纯化增加靶序列区段的浓度的方法。这种扩增靶序列的过程包括将含有期望靶序列的DNA混合物中导入大量的过量的两种寡核苷酸引物,然后在DNA聚合酶的存在下进行准确序列的热循环。两种引物与其各自双链靶序列的链是互补的。为了影响扩增,混合物被变性,引物然后退火在靶分子中成为其互补序列。退火后,引物用聚合酶延伸以便形成新的互补链对。变性,引物退火和聚合酶延伸的步骤可被重复许多次(即,变性,退火和延伸组成一个“循环”;可以有许多“循环”),得到高浓度的期望靶序列的扩增区段。期望靶序列的扩增区段的长度可通过引物相互的相对位置来确定,因此,其长度是可控制的参数。由于该过程的重复性,该方法是指“聚合酶链式反应”(此后称为“PCR”)。因为靶序列的期望扩增区段成为混合物中优势的序列(就浓度而言),它们被称为是“PCR扩增的”。

采用PCR,可能要扩增基因组DNA中的特异靶序列的单个拷贝,以达到几种不同方法学可检测到的水平(如,与标记探针的杂交;掺入生物素化的引物,然后用亲和素酶共轭检测;掺入32P-标记的脱氧核苷酸三磷酸盐,如dCTP或dATP进扩增的区段)。除了基因组DNA以外,任何寡核苷酸或多核苷酸序列要用合适的一组引物分子来进行扩增。特别是,PCR过程本身所产生的扩增区段本身是随后PCR扩增反应的有效模板。

术语“PCR产物”,“PCR片段”和“扩增产物”是指在两次或多次变性,退火和延伸PCR步骤的循环后得到的化合物混合物。这些术语包括一条或多条靶序列的一个或多个区段扩增的情况。

术语“扩增试剂”是指扩增期望要的除引物,核酸模板和扩增酶以外的那些试剂(脱氧核糖核酸三磷酸盐,缓冲液等)。典型地,扩增试剂和其他反应组分被置于和包含在反应容器中(检测管,微孔等)。

术语“逆转录酶”或“RT-PCR”是指PCR的类型,其中起始材料是mRNA。起始mRNA采用逆转录酶被酶转换为互补的DNA或“cDNA”。然后cDNA被用作“模板”进行“PCR”反应。

术语“基因表达”是指将基因中编码的遗传信息通过基因的“转录”转换成RNA(如,mRNA,rRNA,tRNA,或snRNA)的过程(即,经RNA聚合酶的酶作用),通过mRNA的“翻译”转换为蛋白。基因表达可在该过程中许多阶段被调节。“上调”或“活化”是指增加基因表达产物产量的调节(即,RNA或蛋白),而“下调”或“阻抑”是指减少产量的调节。参与上调或下调的分子(如,转录因子)经常分别称为“活化物”和“阻遏物”。

术语“可操作地组合”,“以可操作地顺序”和“可操作的连接”是指核酸序列的连接方式是产生能够引导指定基因的转录和/或期望蛋白分子合成的分子。术语也指氨基酸序列连接方式是可产生功能性蛋白。

术语“调控元件”是指一种遗传元件可控制核酸序列表达的一些方面。例如,启动子是一种调控元件可促进可操作连接的编码区转录的启动。其他的调控元件是拼接信号,聚腺苷化信号,终止信号等。

在真核细胞中的转录控制信号包括“启动子”和“增强子”元件。启动子和增强子包括可与参与转录的细胞蛋白特异相互作用的DNA序列的短阵列(Maniatis等人,Science 236:1237,1987)。启动子和增强子已经从多种真核细胞来源中分离出来,包括酵母,昆虫,哺乳动物和植物细胞中的基因。启动子和增强子元件也已经从病毒中分离,类似的控制元件,如启动子也在原核生物中发现了。选择特殊的启动子和增强子依赖于用来表达目的蛋白的细胞类型。一些真核生物启动子和增强子具有很宽的宿主范围,而其他则在有限的细胞类型的子集中有功能(其综述见Voss等人,Trends Biochem.Sci.,11:287,1986;和Maniatis等人,见前1987)。

术语“启动子元件”,“启动子”或“启动子序列”是指一种DNA序列,位于DNA聚合物编码区的5’末端(即,前方)。自然界中已知的大多数启动子的位置是在被转录的区域之前。启动子的功能是一种开关,可活化基因的表达。如果基因被活化,可称为被转录,或参与了转录。转录涉及从基因合成mRNA。因此,启动子的作用是一种转录调控元件,也可提供基因转录为mRNA的起始位点。

启动子可以是组织特异性或细胞特异性的。术语“组织特异性”当用于启动子时,是指能够引导目的核苷酸序列在相对缺少相同目的核苷酸序列表达的不同类型的组织(如,根)中选择性表达为特异的组织类型(如花瓣)。启动子的组织特异性的评价可通过,例如可操作的将一种报告基因与启动子序列连接产生报告子构建物,将报告子构建物导入植物的基因组中,这样报告子构建物被整合进所得到的转基因植物的每一个组织中,并在转基因植物的不同组织中检测报告基因的表达(如,检测mRNA,蛋白或由报告基因编码的蛋白活性)。相对在其他组织中报告基因的表达水平检测到一种或多种组织中报告基因表达的更高水平显示了启动子对该组织是特异的,在其中检测到更高水平的表达。术语“细胞类型特异性”当用于启动子时,是指能够引导目的核苷酸序列在一种特异类型的细胞中选择性表达的启动子,在相同组织的不同类型细胞中相对缺少相同目的核苷酸序列的表达。术语“细胞类型特异性”当用于启动子时,也表示能够在单一组织中的一个区域内促进目的核苷酸序列选择性表达的启动子。启动子的细胞类型特异性可采用本领域熟知的方法进行评价,如免疫组织化学染色。简言之,组织切片可在石蜡中包埋,石蜡切片用一抗反应,该抗体是目的核苷酸序列所编码的多肽产物特异的,该序列的表达是由启动子所控制的。一抗所特异的标记(如,过氧化物交联的)二抗可与切片组织结合,可通过显微镜进行特异结合检测(如,采用亲和素/生物素)。

启动子可以是结构性或可调节性的。术语“结构性”当用于启动子时的含义是能够在缺少刺激物(如,热休克,化学物质,光等)的情况下能够引导可操作连接的核酸序列的转录的启动子。典型地,结构性启动子能够在实质上任何细胞和任何组织中引导转基因表达的启动子。相反,“可调节性”启动子是能够在刺激物存在的情况下(如,热休克,化学物质,光等)引导可操作连接的核酸序列达到一定转录水平的启动子,该水平不同于缺少刺激物时可操作连接的核酸序列的转录水平。

术语用细菌“感染”和“感染”是指靶生物学样本(如,细胞,组织等)与细菌在一定条件下的共孵育,这样包含在细菌中的核酸序列被导入靶生物学样本中的一种或多种细胞中。

术语“土壤杆菌”是指一种土生的,革兰氏阴性的,杆状的植物致病细菌,可引起冠瘿病。术语“土壤杆菌”包括但不限于根癌土壤杆菌菌株,(典型地可在感染的植物中引起冠瘿病),和rhizogens土壤杆菌(可在感染的宿主植物中引起发根病)。土壤杆菌感染植物细胞通常可引起感染细胞产生冠瘿碱(如,胭脂碱,农杆碱,章鱼碱等)。因此,可引起胭脂碱产生的土壤杆菌菌株(如,菌株LBA4301,C58,A208)是指“胭脂碱型”土壤杆菌;可引起章鱼碱产生的土壤杆菌菌株(如,菌株LBA4404,Ach5,B6)是指“章鱼碱型”土壤杆菌;可引起农杆碱(如,菌株EHA105,EHA101,A281)产生的土壤杆菌是指“农杆碱型”土壤杆菌。

术语“调节区”是指基因的5’转录但未翻译的区域,位置起始于启动子下游,正好在基因翻译起始点之前结束。

术语“启动子区域”是指DNA聚合物编码区的上游开始区域,典型地长度在大约500bp和4kb之间,长度优选在大约1至1.5kb。

相反,“可诱导的”启动子是能够在刺激物的存在下(如,热休克,化学物质,光等)引导可操作连接的核酸序列达到一定的转录水平,不同于缺少刺激物时可操作连接的核酸序列转录的水平。

术语“调控元件”是指可控制核酸序列表达的一些方面的遗传元件。例如,启动子是一种可促进可操作连接的编码区转录起始的一种调控元件。其他的调控元件是拼接信号,聚腺苷化信号,终止信号等。

增强子和/或启动子可能是“内源性”或“外源性”或“异源的”。“内源性”增强子或启动子是在基因组中天然与指定基因连接的。“外源性”或“异源的”增强子或启动子是通过遗传操作与基因并排线性排比的(即,分子生物学技术)这样基因的转录可由连接的增强子或启动子所引导。例如,可操作的与第一条基因组合的内源性启动子可被分离,移除,放置与第二条基因可操作地组合,因此使其可操作地与第二条基因组合成为“异源启动子”。可预期多种这样的组合(如,第一条和第二条基因可来自相同的物种,或来自不同的物种)。

术语“自然连接的”或“自然定位的”当用来说明核酸序列的相对位置时,含义是核酸序列所固有的相对位置。

在表达载体上“拼接信号”的存在经常可在真核生物宿主细胞中引起重组转录物的高水平表达。拼接信号可介导内汉字从原始RNA转录物中的移除,并包括拼接供体和受体位点(Sambrook等人,分子克隆:实验室手册,第二版,Cold SpringHarbor Laboratory Press,New York[1989]16.7-16.8页)。普遍使用的拼接供体和受体位点是来自SV40的16S RNA拼接点。

在真核细胞中有效表达重组的DNA序列需要引导所得到转录物有效终止和聚腺苷化的表达信号。转录终止信号通常在聚腺苷化信号的下游发现,长度为几百个核苷酸。在此所使用的术语“poly(A)位点”或“poly(A)序列”表示可引导新生RNA转录物终止和聚腺苷化化的DNA序列。重组转录物需要有效的聚腺苷化,因为缺少poly(A)尾的转录物是不稳定的,迅速被降解。在表达载体中使用的poly(A)信号可以是“异源”或“内源的”。内源的poly(A)信号是在基因组的指定基因编码区3’末端天然发现的。异源poly(A)信号是已经从一条基因中分离,并位于另一条基因3’端。普遍使用的异源poly(A)信号是SV40 poly(A)信号。SV40poly(A)信号包含在237bp BamHI/BclI限制片段上,引导终止和聚腺苷化作用(Sambrook,见前,16.6-16.7)。

术语“载体”是指任何遗传元件,如质粒,噬菌体,转座子,粘粒,染色体,逆转录病毒,病毒体,或类似的遗传元件,当与适当的控制元件结合时能够进行复制,可将基因序列传递至细胞中和/或在细胞之间传递。因此,该术语包括克隆和表达载体以及病毒载体。

如在此所使用的术语“表达载体”是指含有期望编码序列(或编码序列)的重组DNA分子-如在下面要详述的杂合酶的编码序列-和可操作连接的编码序列在特殊的宿主细胞或生物体中表达所必需的合适的核酸序列。在原核生物中表达期望的核酸序列通常包括启动子,操纵基因(可选择的),和核糖体结合位点,经常与其他序列并排在一起。真核生物细胞已知使用启动子,增强子,和终止和聚腺苷化信号。本发明并不想被限制于具有特殊元件的特殊表达载体或表达载体。

术语“转染”是指将外源DNA导入细胞中。转染可通过本领域中已知的各种方法来完成,包括磷酸钙-DNA共沉淀,DEAE-葡聚糖介导的转染,聚凝胺介导的转染,玻璃珠,电穿孔,微注射,脂质体融合,脂染(lipofection),原生质体融合,病毒感染,biolistics(即,微粒轰击)和类似方法。

术语“稳定的转染”或“稳定转染的”是指外源DNA导入和整合进转染细胞的基因组中。术语“稳定的转染体”是指已经稳定的将外源DNA整合进基因组DNA中的细胞。

术语“短暂转染”或“短暂被转染”是指外源DNA被导入细胞中,其中外源DNA不能被整合进转染细胞的基因组中。外源DNA可在转染细胞的核中维持几天。在这段时间中,外源DNA受到调节性的控制,可在染色体中支配内源基因的表达。术语“暂时的转染体”是指已经摄取外源DNA的细胞,但不能整合这种DNA。

术语“磷酸钙共沉淀”是指将核酸导入细胞中的技术。当核酸作为磷酸钙-核酸共沉淀物显现时,细胞对核酸的摄取可被增强。Graham和van der Eb(Graham和van der Eb,Virol.,52:456,1973)最初的技术被改良为几组以对特殊类型的细胞进行优化。本领域已经很了解这些大量的改良方法。

术语“轰击的”,“轰击”和“生物弹轰击”是指朝向靶生物样本(如,细胞,组织等)加速微粒的过程,以便在靶生物样本细胞的细胞膜上造成伤口和/或让这些微粒进入靶生物样本中。生物弹轰击的方法在本领域中是已知的(如,美国专利No.5,584,807,其内容在此引入以供参考),可从商业渠道中购买到(如,氦气驱动的微型发射加速器(PDS-1000/He,BioRad)。

当用于植物组织时,术语“微创伤”是指在该组织中形成了显微镜可见到的伤口。微创伤可通过,例如在此所述的微粒轰击来实现。

如在此所使用的术语“植物”是指多个植物细胞,它们可大量被分化为存在于植物发育任何阶段中的结构。这种结构包括但不限于,果实,芽,茎,叶,花瓣等。术语“植物组织”包括分化和未分化的植物组织,包括但不限于根,芽,叶,花粉,种子,肿瘤组织和多种类型的培养细胞(如,单个细胞,原生质体,胚,胼胝,原始球茎样体等)。植物组织可以是in planta,器官培养,组织培养,或细胞培养。类似地,“植物细胞”可以是培养的细胞或植物的一部分。

术语“转基因”当用于说明细胞时,是指含有转基因的细胞,或其基因组已经通过导入转基因而被改变。术语“转基因”当用于说细胞,组织或植物时分别是指含有转基因的细胞,组织或植物,其中组织的一个或多个细胞含有一种转基因(如编码本发明杂合酶的基因),或一种其基因组已经通过导入转基因被改变的植物。转基因细胞,组织和植物可通过几种方法而产生,包括将含有核酸(通常是DNA)的“转基因”导入靶细胞中或将转基因通过人为的干预整合进靶细胞的染色体中,如通过在此所述的方法。

在此所使用的术语“转基因”是指任何通过试验操作被导入细胞基因组中的核酸序列。转基因可以是“内源DNA序列”,或“异种DNA序列”(即,“外源DNA”)。术语“内源DNA序列”是指在它要被导入的细胞中天然发现的核苷酸序列,只要它不含有相对于天然序列的某些修饰作用(如,点突变,存在选择性标记物基因,或其他类似的修饰)。术语“异种DNA序列”是指一种核苷酸序列,它连接于,或被操作要连接于自然条件下它不连接的核酸序列,或它在自然条件下不同的位点被连接。异种DNA对于它被导入的细胞不是内源性的,但已经从其他的细胞中获得。异种DNA也包括含有某些修饰作用的内源性DNA序列。通常,尽管不是必须的,异种DNA可编码正常情况下它被表达的细胞不能产生的RNA和蛋白。异种DNA的实例包括报告基因,转录和翻译调控序列,选择性标记蛋白(如,可赋予药物抗性的蛋白),或其他相似的元件。

术语“外源基因”是指任何可通过试验操作被导入细胞基因组中的核酸(如,基因序列),可包含在该细胞中发现的基因序列只要被导入的基因含有相对于天然基因的某些修饰作用(如,点突变,存在选择性标记物基因,或其他类似的修饰作用)。

在此所使用的术语“转化”是指将转基因导入细胞中。细胞的转化可以是稳定或暂时的。术语“暂时转化”或“暂时转化的”是指将一条或多条转基因在不将转基因整合进宿主细胞基因组的情况下导入细胞中。暂时的转化可通过,例如酶联免疫吸收测定(ELISA)来检测,该方法可检测一条或多条转基因编码多肽的存在。可选择地,暂时的转化可通过检测转基因(如,uid A基因)编码蛋白(如,β-葡糖醛酸酶)的活性而被检测到,如在此所证明的(如,通过用X-gluc染色组织化学测定GUS酶活性,X-gluc可在GUS酶存在的情况下产生蓝色沉淀;采用GUS-光试剂盒(Tropix)化学发光测定GUS酶活性)。术语“暂时转化株”是指暂时掺入一条或多条转基因的细胞。相反,术语“稳定转化”或“稳定转化的”是指将一条或多条转基因导入和整合进细胞的基因组中。通过将细胞基因组DNA与能够结合一条或多条转基因的核酸序列Sounthern印迹杂交,可测定细胞的稳定转化。可选择地,细胞的稳定转化也可通过细胞基因组DNA的聚合酶链式反应扩增转基因新来检测。术语“稳定的转化株”是指已经将一条或多条转基因稳定的整合进基因组DNA中的细胞。因此,稳定的转化株要与暂时的转化株区分,因为来自稳定转化株的基因组DNA含有一条或多条转基因,来自暂时转化株的基因组DNA不含有转基因。

术语“宿主细胞”是指任何能够复制和/或转录和/或翻译异种基因的细胞。因此,“植物细胞”是指任何真核生物或原核生物细胞(如,细菌细胞如大肠杆菌,酵母细胞,哺乳动物细胞,禽类细胞,两栖动物细胞,植物细胞,鱼类细胞,和昆虫细胞),无论是在体外或体内。例如,宿主细胞可位于转基因动物体内。

术语“转化株”或“转化细胞”包括原代的转化细胞和来自该细胞的培养物,与转递的数量无关。由于事先或无意中的突变,所有的子代在DNA的含量上并不是完全相同的。如在原始转化细胞中所筛选的一样,具有相同功能性的突变子代包括在转化株的定义中。

术语“选择性标记”是指编码一种酶的基因,所述酶的活性可将对抗生素或药物的抗性赋予表达选择性标记物的细胞,或使其表达可检测到的一种性状(如,发光或荧光)。选择性标记物可以是“阳性的”或“阴性的”。阳性选择性标记物的实例包括新霉素磷酸转移酶(NPTII)基因,可赋予对G418和卡那霉素的抗性,和细菌潮霉素磷酸转移酶基因(hyg),赋予对抗生素潮霉素的抗性。阴性选择性标记物编码的酶活性,当细胞在合适的选择性培养基中生长时,其表达对细胞是有细胞毒性的。例如,HSV-tk基因通常可用作阴性选择性标记物。HSV-tk基因在生长于更昔洛韦或无环鸟苷中的细胞中的表达是细胞毒性的;因此,细胞在含有更昔洛韦或无环鸟苷的选择性培养基中的生长可筛选掉表达功能性HSV TK酶的细胞。

术语“报告基因”是指编码一种可被测定的蛋白的基因。报告基因的实例包括,但不限于,荧光素酶(见,如deWet等人,Mol.Cell.Biol.7:725,1987和美国专利Nos.,6,074,859;5,976,796;5,674,713;和5,618,682;所有在此引入以供参考),绿荧光蛋白(如,GenBank编号U43284;大量GFP变异体可从CLONTECH实验室购得,Palo Alto,CA),氯霉素乙酰转移酶,β-半乳糖苷酶,碱性磷酸酶,和辣根过氧化物酶。

术语“过度表达”是指在转基因生物体中基因产物的产量超过了正常或未转化生物体中的生产水平。术语“共抑制”是指可引起外源和内源基因表达抑制的与内源性基因实质上同源的外源基因的表达。如在此所使用的,术语“改变的水平”是指在转基因生物体中基因产物的产量在量或比例上与正常或未转化生物体是不同的。

术语″Southern印迹分析″和″Southern印迹″和″Southern″指在琼脂糖或丙烯酰胺凝胶上的DNA分析,其中DNA按照大小被分离或分段,然后将DNA从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。然后固定的DNA与标记的探针接触以检测与所用探针互补的DNA种类。在电泳之前,可用限制性酶分裂DNA。电泳后,DNA可被部分地去嘌呤并在转移到固体支持物上之前或转移过程中变性。Southern印迹是分子生物学家标准的工具(J.Sambrook等人分子克隆:实验室手册,Cold Spring Harbor Press,NY,pp 931-9.58,1989)。

术语″Northern印迹分析″和’″Northern印迹″和″Northern″指RNA的分析,通过在琼脂糖凝胶上电泳RNA以按照大小分离RNA,然后将RNA从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。然后用标记的探针探测固定的RNA以检测与所用探针互补的RNA种类。Northern印迹是分子生物学家标准的工具(J.Sambrook等人,见上,pp7.39-7.52,1989)。

术语″Western印迹分析″和″Western印迹″和″Western″指分析固定在支持物如硝酸纤维素或膜上的蛋白(或多肽)。含有至少一种蛋白的混合物首先在丙烯酰胺凝胶上分离,然后将分离的蛋白从凝胶转移到固体支持物如硝酸纤维素或尼龙膜上。固定的蛋白与具有抗至少一种目的抗原反应的至少一种抗体接触。可用各种方法检测结合的抗体,包括使用放射标记的抗体。

术语″抗原决定簇″指使抗原与特定抗体接触的部分(即,抗原决定簇)。当蛋白或蛋白片段被用来免疫宿主动物时,蛋白的许多区可诱导产生与蛋白指定区域或三维结构特异结合的抗体;这些区域或结构被称为抗原决定簇。抗原决定簇可与完整的抗原(即,用于引起免疫反应的″免疫原″)竞争与抗体的结合。

术语″分离的″当用于叙述核酸时,如在″分离的核酸序列″中指被鉴定并分离自一个或多个其它成分(如,分离自含该核酸的细胞,或分离自至少一个污染的核酸,或分离自一个或多个蛋白、一个或多个脂质)的核酸序列,这些成分在其天然来源中通常与该核酸相关联。分离的核酸是以不同于其天然中所见的形式或位置存在的核酸。相反,非分离的核酸是以其天然状态存在的核酸如DNA和RNA。例如,特定的DNA序列(如,基因)在宿主细胞染色体上发现接近邻近的基因;RNA序列,如编码特定蛋白的特定mRNA序列,在细胞中发现与编码许多蛋白的许多其它mRNA混合。但是,作为例子,含例如SEQ ID NO:1的分离核酸序列包括通常含有例如SEQ ID NO:1的细胞中所包含的这种核酸序列,核酸序列在染色体或染色体外的位置不同于天然细胞,或另外侧面有不同于天然的核酸序列。分离的核酸序列可以单链或双链的形式存在。当分离的核酸序列要用于表达蛋白时,该核酸序列将最少含有至少部分正义或编码链(即,核酸序列可以是单链的)。可选择地,可同时含有正义和反义链(即,核酸序列可以是双链的)。

术语″纯化的″指取自其天然环境(或其天然环境发成分)并被分离或分离的核酸或氨基酸序列分子。因此,″分离的核酸序列″可以是纯化的核酸序列。″实质上纯化的″分子至少60%、优选地至少75%、更优选地至少90%不含与其天然相关联的其它成分。如这里所用,术语″纯化的″或″纯化″也指从样本中去除杂质。杂质蛋白的去除引起样本中目的多肽百分比的升高。在另一个实例中,重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达,通过去除宿主细胞蛋白纯化多肽;样本中重组多肽的百分比因而升高。本发明预期不仅纯化的(包括实质上纯化的)而且未纯化的杂合酶。

术语含给定多核苷酸序列或多肽″的组合物″广泛地指含有给定多核苷酸序列或多肽的任何组合物。该组合物可包含水溶液。含编码GnTIII或其片段的多核苷酸序列的组合物可被用作杂交探针。在此情况下,编码GnTIII的多核苷酸序列代表性地用于含盐(如,NaCl)、清洗剂(如,SDS)和其它成分(如,Denhardt’s溶液、奶粉、鲑精DNA,等)的水溶液中。

术语″待测化合物″指能够用于治疗或预防病害、疾病、疾患或身体功能紊乱,或另外改变样本生理学或细胞状态的任何化学物、药剂、药品,等。待测化合物包括已知的和潜在的治疗化合物。待测化合物可以通过采用本发明的筛选方法确定要是治疗性的。″已知的治疗化合物″指在这种治疗或预防中已经显示有效的治疗化合物(如,通过动物试验或先前给予人类的经验)。

如这里所用,术语″反应″当用在测定时指产生可检测的信号(如,报告蛋白的累积,离子浓度增加,可检测化学产物的积累)。

术语″样本″以其最广泛的含义被使用。在一种含义中,它可以指动物细胞或组织。在另一种含义中,它意味着包括获取自任何来源的标本或培养物,以及生物学和环境样本。生物学样本可获取自植物或动物(包括人类),并包括液体、固体、组织和气体。环境样本包括环境原料如表面材料、土壤、水和工业样本。这些实施例并非要解释为限制可应用于本发明的样本类型。

术语″融合蛋白″指一种蛋白,其中至少一个局部或部分来自第一个蛋白,另一个局部或部分来自第二个蛋白。术语″杂合酶″指一种是功能酶的融合蛋白,其中至少一个局部或部分来自第一个种类,另一个局部或部分来自第二个种类。本发明优选的杂合酶是功能性糖基转移酶(或其部分),其中至少一个局部或部分来自植物,另一个局部或部分来自哺乳动物(如人)。

术语″导入细胞″就核酸(如载体)而言是要包括本领域称为的″转化″或″转染″或″转导″。细胞的转化可以是稳定的或暂时的,本发明试图在以下两个条件下导入载体,一方面是稳定表达的条件,另一方面仅暂时表达的条件。术语″暂时的转化″或″暂时地转化″指将一个或多个转基因导入细胞而转基因没有整合进宿主细胞基因组。暂时的转化可通过例如酶联免疫吸附试验(ELISA)检测,它检测存在由一个或多个转基因编码的多肽。可选择地,暂时的转化可通过检测由转基因(如,抗体基因)编码的蛋白(如,结合抗原的抗体)活性而得到检测。术语″暂时的转化株″指暂时地并入了一个或多个转基因的细胞。相反,术语″稳定的转化″或″稳定地转化″指引导并整合一个或多个转基因到细胞基因组中。细胞的稳定转化可通过细胞基因组DNA的Southern印迹杂交而检测,其核酸序列能够与一个或多个转基因结合。可选择地,细胞的稳定转化还可通过细胞基因组DNA的聚合酶链式反应(PCR)扩增转基因序列而被检测。术语″稳定的转化株″指在基因组DNA中已稳定地整合了一个或多个转基因的细胞。因此,稳定转化株与暂时转化株的不同在于,稳定转化株的基因组DNA含有一个或多个转基因,而暂时转化株的基因组DNA不含转基因。

″等分的寡糖″应当定义为一种寡糖,它含有例如两个甘露糖基团,另一个糖类部分附着在寡糖甘露糖残基上。等分寡核苷酸的例子在表1中给出。

发明的详细描述

在本发明植物宿主细胞中表达的GnTIII(例如,SEQ ID NO:1,图4A)是哺乳动物GnTIII。在特殊的实施方案中,GnTIII是人GnTIII(例如,SEQ ID NO:2,图4B)。在特殊的实施例中,GnTIII也可与哺乳动物GnTIII的氨基酸序列具有80%的同一性,更优选地至少大约90%,甚至更优选地至少大约95%,最优选地至少大约97%(此后称为″同源的多肽″),其在性质上保留该哺乳动物GnTIII的活性。除了目标多肽序列平均包括查询氨基酸序列的每100个氨基酸有达到5个的氨基酸改变以外,与查询氨基酸序列具有至少例如95%氨基酸序列″同一性″的多肽等同于查询序列。换句话说,为获得与查询氨基酸序列具有至少95%氨基酸序列同一性的多肽,相当于目标序列氨基酸残基的5%可被另一个氨基酸插入、删除或取代。参照序列的这些改变可发生在参照氨基酸序列的氨基或羧基末端位置,或这些末端位置间的任何地方,或者单独地散布在参照序列的残基间,或者在参照序列中呈一个或多个连续的基团。

确定查询序列(本发明的序列)与目标序列间最佳总体匹配,也称为全局序列联配,可以采用Brutlag等人的运算法则(Com.App.Biosci.6:237-245,1990)为基础的FASTDB计算机程序来测定。在序列线性排比中,查询和目标序列要么都是核苷酸序列,要么都是氨基酸序列。该全局联配的结果表示为同一性百分比。在FASTDB氨基酸排列中所用的优选参数是:矩阵=PAM 0,k-数组=2,错配补偿=1,连接补偿=20,随机选择基团长度=0,截断计分=1,窗口大小=序列长度,缝隙补偿=5,缝隙大小补偿=0.05,窗口大小=500或目标氨基酸序列的长度,无论哪个较短者。

如果由于N-或C-末端删除而非因为内部删除,目标序列短于查询序列,必须对结果进行手工修正。这是因为在计算总同一性百分比时,FASTDB程序不计算目标序列的N-和C-末端截断。对于在N-和C-末端截断的目标序列,相对于查询序列,同一性百分比是通过计算查询序列的残基数目来修正的,作为查询序列总碱基的百分比,这些残基是目标序列的N-和C-末端,但不与相应的目标残基匹配/定位。通过FASTDB序列线性排比的结果确定残基是否是匹配的/定位的。然后从同一性百分比中减去此百分比,通过上述FASTDB程序采用特定的参数计算以获得最终的同一性百分比计分。此最终的同一性百分比计分正是为本发明所用的。为手工调整同一性百分比计分,仅考虑目标序列不与查询序列匹配/定位的N-和C-末端残基。即,仅有查询残基位于目标序列最远的N-和C-末端残基之外。

在本发明植物宿主细胞中表达的GnTIII由核酸序列编码,后者与编码哺乳动物GnTIII氨基酸序列的核酸序列具有至少80%的同一性,更优选地至少大约90%,甚至更优选地至少大约95%,最优选地至少大约97%(此后称为″同源的多肽″),其在性质上保留该哺乳动物GnTIII的活性。核酸序列可以是RNA或DNA序列。

与本发明参照核苷酸序列具有95%″同一性″的多核苷酸等同于参照序列,除了包括编码多肽的参照核苷酸序列的每100个核苷酸平均有达到5个的点突变的多核苷酸以外。换句话说,为获得与参照核苷酸序列具有至少95%核苷酸序列同一性的多核苷酸,相当于参照序列中5%的核苷酸可被删除或另一个核苷酸取代,或相当于参照序列中总核苷酸5%的核苷酸数目被插入参照序列。查询序列可以是完整的序列、ORF(开放阅读框)或如这里所述的任何指定的片段。

为实用的目的,可以按惯例采用已知的计算机程序确定任何特定的核酸分子或多肽是否与本发明的核苷酸序列至少90%、95%、96%、97%、98%或99%相同。确定查询序列(本发明的序列)与目标序列间最佳的总体匹配,也称为全局序列联配法,可以采用以Brutlag等人的运算法则(Com.App.Biosci.6:237-245,1990)为基础的FASTDB计算机程序来测定。在序列联配中,查询和目标序列都是DNA序列。RNA序列可以通过转换U(尿苷)为T(胸腺嘧啶)进行比较。该全局序列联配的结果表示为同一性百分比。在FASTDB DNA序列线性排比以计算同一性百分比中所用的优选参数是:矩阵-单式的,k-数组=4,错配补偿=1,连接补偿=30,随机选择基团长度=0,截断计分=1,缝隙补偿=5,缝隙大小补偿=0.05,窗口大小=500或目标核苷酸序列的长度,无论哪个较短者。

本发明还包括与编码所述哺乳动物GnTIII的核酸序列杂交的多核苷酸。当单链形式的多核苷酸可以在适当的温度和溶液离子强度条件下退火为其它多核苷酸时(见,Sambrook等人,见上),多核苷酸与另一个多核苷酸″杂交″。温度和离子强度条件决定杂交的″严紧″。为初步筛选同源的核酸,可以使用相当于42℃温度的低严紧杂交条件,如,5X SSC,0.1%SDS,0.25%牛奶,和无甲酰胺;或40%甲酰胺,5X SSC,0.5%SDS)。中严紧杂交条件相当于55℃的较高温度,如40%甲酰胺及5X或6X SCC。高严紧杂交条件相当于65℃的最高温度,如50%甲酰胺,5X或6X SCC。尽管依杂交的严紧,碱基间的错配是可能的,但杂交需要两个核酸含有互补的序列。杂交核酸的适当严紧依赖于核酸的长度和互补的程度,其可变量为本领域熟知。两个核苷酸序列间相似性或同源性的程度越高,具有其序列的核酸杂交的Tm值(解链温度)越高。核酸杂交的相对稳定性(对应于较高的Tm)按下列顺序下降:RNA:RNA,DNA:RNA,DNA:DNA。

GnTIII和其它异源蛋白在植物宿主系统中的表达

在一个实施方案中,编码哺乳动物GnTIII或其它异源蛋白,如异源的糖蛋白或哺乳动物糖基转移酶的核酸可被插入适当的表达载体中,即,含有转录和翻译插入编码序列的必要元件的载体,或在RNA病毒载体情况下,含有复制和翻译的必要元件,以及可选择的标记物。这些元件包括但不限于启动子区、信号序列、5’非翻译序列、依赖于结构基因组是否装配有起始密码子、以及转录和翻译终止序列。获得这种载体的方法是本领域已知的(见WO01/29242的综述)。

适合于在植物中表达的启动子序列在本领域有描述,如WO91/198696。这些包括非结构性启动子或结构性启动子,如胭脂碱合成酶和章鱼碱合成酶启动子,花椰菜花叶病毒(CaMV)19S和35S启动子,和玄参花叶病毒(FMV)35启动子(U.S.专利No.6,051,753)。所用的启动子还可以是定向的组织特异启动子,例如靶向胚乳、糊粉层、胚芽、果皮、茎干、叶、核仁、块茎、根,等。

信号序列允许在适当的地方加工和转位蛋白。信号可以源自植物或可能为非植物信号序列。信号肽指引初生多肽到内质网,在此多肽随后进行翻译后修饰。信号肽可以由本领域的技术人员常规地确定。它们典型地具有三重结构,在N-末端具有正电荷的氨基酸,随后是疏水区,然后在疏水性还原区内有分裂位点。

转录终止常规地在转录起始调控区的相反末端。它可以与转录起始区相关联,或来自不同基因,并可被选择以增强表达。实例是来自土壤杆菌Ti质粒的NOS终止子和稻米α-淀粉酶终止子。还可添加聚腺苷尾。实例包括但不限于土壤杆菌章鱼碱合成酶信号(Gielen等人,EMBO.J.3:835-846,1984)或同一种类的胭脂碱合成酶(Depicker等人,Mol.Appl.Genet.1:561-573,1982)。

可包括增强子以增加异源蛋白的转录和/或使其最大化。这些包括但不限于肽输出信号序列,密码子应用,内含子,聚腺苷,和转录终止位点(见,WO01/29242)。

标记物包括除草剂抗性和原核生物可选择的标记物。这种标记物包括抗生素抗性,如氨苄青霉素,四环素,卡那霉素和大观霉素。特殊实例包括但不限于编码链霉素抗性的链霉素磷酸转移酶(spt)基因,编码卡那霉素或遗传霉素抗性的新霉素磷酸转移酶(nptIl)基因,编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。

构建的载体可采用本领域已知的程序导入植物宿主系统(综述于WO01/29242和WO01/31045)。载体可被修饰以介导含根癌土壤杆菌载体同源区的植物转化质粒,是来自根癌土壤杆菌的T-DNA边缘区。可选择地,本发明方法中使用的载体可以是土壤杆菌载体。导入载体的方法包括但不限于微注射,通过在微珠或粒子基质中或表面上带有核酸的微粒子高速生物弹穿透,和电穿孔。载体可被导入植物细胞、组织或器官中。在特殊的实施例中,一旦确定存在异源基因,植物可采用本领域已知的程序再生。

哺乳动物GnTIII的应用

哺乳动物GnTIII的表达得到糖蛋白上等分的N-聚糖。等分的N-聚糖对于某些哺乳动物糖蛋白的生物学活性是重要的。特别地,等分的单克隆抗体具有增强的ADCC(抗体-依赖的细胞毒性)。引入等分结构引起新的或最优化的功能性并增加糖蛋白的生物利用度,如因为肾脏清除的减少,触角类型的增加延长了半衰期。因此,本发明涉及含所述异源糖蛋白的植物宿主系统,该糖蛋白具有等分的寡糖,特别是等分的GlcNAc残基,以及涉及产生所述糖蛋白的方法。

此外,同野生型植物(植物N-聚糖含有远少于哺乳动物N-聚糖的GlcNAc残基)相比,植物中GnTIII的表达引起末端GlcNAc的急剧升高。植物中产生的植物糖蛋白或重组糖蛋白的N-聚糖上更多的GlcNAc残基与哺乳动物糖蛋白的N-聚糖相似。由于植物中GnTIII表达引入的植物N-聚糖(和植物产生的重组糖蛋白如Mabs)中的等分GlcNAc似乎防止了β-N-乙酰己糖胺酶对N-聚糖的降解。更多的GlcNAc残基意味着添加末端半乳糖的β(1,4)-半乳糖基转移酶(GalT)的更多受体底物。GnTIII和功能蛋白如转运子或可提供N-聚糖生物合成的(哺乳动物)酶或其功能片段共表达,如半乳糖基转移酶如GAIT,或GnTIII植物与GaIT植物的杂交,反之亦然,导致这些植物产生的半乳糖苷化糖蛋白增加。因此,本发明涉及含所述哺乳动物GnTIII和所述功能蛋白的植物宿主系统;该植物宿主系统可进一步包含异源糖蛋白,相对于不含所述哺乳动物GnTIII和所述功能蛋白的植物宿主系统产生的异源糖蛋白,其半乳糖苷化增加,并涉及产生所述植物宿主系统的方法和产生所述糖蛋白的方法。

通过接种具有土壤杆菌菌株的植物细胞或组织,或通过上述程序如电穿孔、微注射、在微珠或粒子基质中或表面上带有核酸的微粒子高速生物弹穿透和电穿孔,可以建立产生生产具有商业目的的剪接糖蛋白的稳定转化植物,所述的土壤杆菌菌株中含有载体,后者包含编码GnTIII、任选地N-糖基化修饰酶的核苷酸序列和编码商业目的的异源糖蛋白的核苷酸序列。可选择地,通过同时接种(共转化)两个或以上各自携带载体的土壤杆菌菌株,或直接用所述的载体共转化植物细胞或组织可以产生生产具有商业目的的剪接糖蛋白的稳定转化植物,所述的载体含有编码GnTIII、任选地N-糖基化修饰酶的核苷酸序列或编码商业目的的糖蛋白的核苷酸序列。可选择地,通过具有修饰的N-糖基化的植物与表达编码商业目的蛋白的核苷酸序列的植物的(多重)杂交可以产生生产具有商业目的的剪接糖蛋白的稳定转化植物。在所有这些过程中,载体还可以含有赋予选择剂抗性的核苷酸序列。

如本领域技术人员所知,为了获得涉及N-糖基化、GnTIII的蛋白和商业目的糖蛋白或多肽的满意表达,核苷酸序列可适应于宿主植物的特殊转录和翻译加工结构。例如,可导入编码区的沉默突变以改善密码子应用,并可使用特殊的启动子以在相关的植物组织中驱动所述基因的表达。可使用发育上调节的或能够随意诱导的启动子以保证在适当的时间表达,例如,仅在植物组织已从田里收获并被带至控制条件下之后。在所有这些情况下,应当选择那些在相同细胞中表达的糖基化修饰蛋白和商业目的糖蛋白的表达基因盒,以使期望的翻译后修饰为所述糖蛋白。

如上所述,在特殊的实施例中,能够用于本发明方法中的植物是烟草植物,或至少与烟草属相关的的植物,但是,发明也特别规定使用其它相对容易转化的植物,如拟南芥属或玉米,或与其相关的植物。使用浮萍为产生重组糖蛋白提供了特别的优势。植物通常是小且经植物萌芽无性繁殖的。然而,大多数浮萍种类具有更大型植物的所有组织和器官,包括根、茎干、花、种子和叶。浮萍作为一种普通液体溶液表面上的自由漂浮植物,可廉价和非常快速地生长,从中可以容易地收获之。它们还可以生长在富营养的废水上,产生有价值的产物而同时清洁废水以再利用。特别与药剂应用相关的,浮萍可以在储藏和控制的条件下在室内生长。例如,稳定转化的浮萍可以在与各自含(二元)载体的土壤杆菌菌株(共)接种后从组织或细胞再生,所述载体含有一个或多个编码N-糖基化修饰酶的目的核苷酸序列和/或编码商业目的异源糖蛋白的基因。例如,浮萍植物可包括Spirodella属、Wolffia属、Wolffiella属或Lemna属、浮萍、Lemnaminiscula和Lemna gibba。还有苔藓类如小立碗藓,因其可以在储藏的条件下廉价生长而提供一定的优势。另外,小立碗藓的单倍体基因组相对地易于操作。

在番茄果类中的表达也提供特别的优势。番茄可以在储藏和控制的条件下在温室中容易地生长,番茄果类的生物产量可以全年连续地大量收获。含目的糖蛋白的含水部分可以容易地从番茄果中分离出来,这使糖蛋白纯化比较容易。在其它作物贮藏器官中的表达也是吸引人的选择对象,包括但不限于玉米仁、马铃薯块茎和油菜籽或向日葵种子,在器官中为在适当位置的收获和加工技术提供了巨大的生物产量。就花蜜中分泌的糖蛋白的纯度和同质性而言,在花蜜中的表达提供了特殊的优势。

可选择地,含异源糖蛋白的植物与按照本发明含GnTIII和任选的至少一个功能性哺乳动物蛋白的植物杂交,所述功能蛋白如转运子或可生物合成通常在植物中不存在的N-聚糖的酶,从所述杂交中收获果实,并选择期望的子代植物,后者表达所述异源糖蛋白和表达GnTIII和任选地表达通常在植物中不存在的与哺乳动物样N-聚糖生物合成相关的功能性(哺乳动物)酶。此过程已知为异花授粉。在优选的实施例中,发明提供了按照本发明的方法,进一步包括选择期望的表达所述重组蛋白的子代植物,所述重组蛋白含有等分的寡糖,特别是半乳糖残基和/或半乳糖苷化增加。由于提供了这种植物,本发明还准备使用转基因植物产生期望的糖蛋白或其功能片段,特别地其中所述的糖蛋白或其功能片段含有等分的寡糖和/或半乳糖苷化增加。

本发明又提供了获得期望糖蛋白或其功能片段的方法,包括按照发明培养植物直至所述植物已达到可采集利用的阶段,例如当生长了足够的生物产量可以有效收获时,随后用本领域已知的确定技术收获所述植物并用本领域已知的确定技术分馏所述植物以获得分馏的植物原料,以及从所述分馏的植物原料中至少部分地分离所述糖蛋白。采用本领域已知的方法可筛选期望蛋白的存在,优选地采用检测生物学活性位点产生可检测信号的方式的筛选试验。此信号可直接地或间接地产生。这种检测的实例包括ELISA或放免试验。

由于GnTIII表达而导入的等分GlcNAc残基也可用来通过″阻断″活性糖苷酶如β-N-乙酰己糖胺酶防止N-聚糖中的糖类去除(降解),并防止其它糖类添加至N-连接的聚糖上(由″其它″后续的糖基转移酶基因驱动),如岩藻糖化作用、木糖化作用。通过控制定位(如通过提供其它亚细胞靶信号)和/或控制表达水平(如在单个转基因植物中可变化的水平或采用不同的启动子),可能调节糖型组合物。因此,在包含重组糖蛋白的植物糖蛋白中导入等分的GlcNAc残基抑制了糖类的掺入,通过阻断活性α-1,3岩藻糖转移酶抑制α-1,3-岩藻糖掺入,通过阻断α-1,4-岩藻糖转移酶抑制α-1,4-岩藻糖掺入,通过阻断β-1,2-木糖转移酶抑制β-1,2-木糖掺入,通过阻断β-1,3-半乳糖基转移酶抑制β-1,3-半乳糖掺入,以及通过阻断β-N-乙酰己糖胺酶的活性去除/降解添加到N-聚糖上的糖类,特别是末端GlcNAc残基,通过阻断β-1,4半乳糖苷酶抑制末端β-1,4-半乳糖的掺入(如专利申请WO01/31045所提供的,通过表达β-1,4-半乳糖基转移酶而添加)。因此以此方式,GnTIII的控制表达和等分GlcNAc残基的控制导入可被用来操纵糖型组合物和/或限制糖型的异质性。

GnTIII和GnTIII杂合蛋白的修饰

本发明进一步涉及包括哺乳动物GnTIII的催化部分和蛋白跨膜部分的分离杂合蛋白,所述蛋白存在于真核细胞的内质网或高尔基体内。发明还涉及修饰的哺乳动物GnTIII,其中跨膜区被去除,但含有保留信号如KDEL以在ER中保留所述GnTIII。

含有第一个酶的跨膜部分和第二个酶的催化部分的杂合酶的编码核酸序列可按如下获得。从第二个酶上去除编码跨膜部分的序列,保留编码第二个酶C-末端部分的核酸序列,后者包括催化位点。通过PCR分离或获得第一个酶跨膜部分的编码序列,并与第二个酶C-末端部分的编码序列连接。

通过去除编码跨膜片段的序列并用它代替蛋氨酸(翻译起始)密码子,以及通过在半乳糖基转移酶的最后密码子和终止密码子之间插入编码ER保留信号的核酸序列如编码KDEL(氨基酸残基序列:赖氨酸-天门冬氨酸-谷氨酸-亮氨酸)的序列,可获得保留在ER中的编码蛋白特别是酶如半乳糖基转移酶、甘露糖苷酶和N-乙酰葡萄糖胺转移酶的核酸序列(Rothman,1987)。

除控制表达以外,通过发展GnTIII酶部分的编码基因序列与其它糖基转移酶的跨膜区或存在于内质网(ER)或高尔基体膜内的酶/蛋白的跨膜区融合,或通过添加所谓的保留信号如但不限于KDEL以保留在ER中,也可控制GnTIII活性的重新定位。这种重新定位调节特定糖类添加到包括重组糖蛋白的糖蛋白的N-连接聚糖,并防止它们去除。

GnTIII跨膜区与例如但不限于GnTI(TmGnTI)、甘露糖苷酶II(TmManII)、木糖基转移酶(TmXyl)或α-1,3岩藻糖基转移酶(TmFuc)的跨膜区的交换,使GnTIII较早地表达并在图2的20至22位置导入等分的GlcNAc。这阻止后续的糖基转移酶,如木糖转移酶和岩藻糖转移酶,作用于底物引起缺少Xyl和Fuc的糖型的作用。重要地,通过β-1,4)-半乳糖基转移酶(GalT)作用添加末端半乳糖不受等分GlcNAc-的抑制。GalT的共表达(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)引起结构的相似,如图2中用20、21和22标注的箭头右侧所指示的。尽管缺乏免疫原性的木糖和岩藻糖残基,但这些结构仅有一个臂加工成复合型聚糖。为使其它臂也转换,除GnTIII重新定位外,甘露糖苷酶II(ManII)和GnTII也在高尔基体内重新定位以在聚糖加工程序中较早起作用。这可以几种方式确定。例如,通过以GnTI(TmGnTI)的跨膜区交换其各自的跨膜区,这引起重新定位到图2中指示为5的位置。可选择地,MarnII和GnTII都可以通过去除跨膜高尔基靶区域并提供剩余的具有ERC-末端保留信号(如,氨基酸残基KDEL)的酶片段而重新定位于ER。然后,表达GaIT(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)以及重新定位型的GnTIII(如TmXyl-GnTIII)、ManII(如TmGnTI-ManII)和GnTII(如TmGnTI-GnTII)的植物可以与表达目的重组糖蛋白的植物杂交(图3),或可以用编码目的糖蛋白的基因如编码抗体的基因重新转化。这可以产生重组糖蛋白,它具有含末端半乳糖残基的等分聚糖但缺乏木糖和岩藻糖。转化过程和杂交(相互授粉)过程描述于上。

在另一个实施方案中,具有甘露糖苷酶H(TmManII-GnTIII)或木糖转移酶(Tmxyl-GnTIII)跨膜区的GnTIII与TmXyl-GalT、TmGnTI-GnTII、TmGnTI-ManII结合。此结合可通过共表达获得,或经异花授粉通过相关基因的结合而获得,并得到在核心序列上缺少木糖和岩藻糖、但在三甘露糖核心上具有等分GlcNAc残基以及具有末端半乳糖的糖蛋白,包括重组糖蛋白。

实施例

评价了植物中导入GnTIII对植物糖蛋白聚糖上出现等分寡糖的影响。克隆人GnTIII基因,提供C-末端c-myc标记以分析标记的融合蛋白的表达,这些全部处于植物调控元件的控制之下以在烟草中导入。已显示,GnTIII在植物中表达,且该表达在内源性植物糖蛋白上产生等分寡糖结构。含至少两个GlcNAc残基的N-聚糖量超过普通烟草植物两倍。显著地,如对内源性植物糖蛋白的分离聚糖的基质辅助的激光解吸离子化飞行时间质谱(MALDI-TOF)分析所见,GnTIII的表达还引起复合型N-聚糖降解产物的显著下降。这些数据提示,烟草中可引起N-聚糖上导入等分结构的GnTIII的表达防止聚糖被β-N-乙酰己糖胺酶降解。在代表性地存在于三甘露糖核心(Man-α-1-3和Man-α-1-6)上的其它GlcNAc-β1-2连接中,β-N-乙酰己糖胺酶对非还原的末端GlcNAc和β-N-乙酰葡萄糖胺(GaINAC)裂解具有广泛的特异性。

实施例1

质粒和植物转化。PAC克隆RP5-1104E15 GnTIII(SEQ ID NO:1,图4A)从PieterJ.de long,Children’s Hospital Oakland Research Institute(CHORI)处获得,并可以从Sanger中心索取获得,作为克隆组HBRC_l.sc的部分。克隆源自男性人类血液并可以经http://www.sanger.ac.ulc/Teams/Team63/CloneRequest/(来自人染色体22q12.3-13.1;The Wellcome Trust Sanger Institute,Wellcome Trust Genome Campus,Hinxton,Cambridge,CBK)ISA,UK;www.sanger.ac.uk)索要

人GnTIII基因从所述PAC克隆采用AccuTaq LA DNA聚合酶(SigmaAldrich)和引物GNT3F(5’atactcgagttaacaatgaagatgagacgct-3’;SEQ ID NO:3)和GNTSRmyc(5’-tatggatcctaattcagatcctcttctgagatgag-3’;SEQ ID NO:4)通过PCR克隆。寡聚物来自Eurogentec(Belgium)。PCR在PerkinElmerCetus 480热循环仪(ABI/PE)上按照厂家说明采用AccuTaq聚合酶的最佳条件进行。得到的片段被克隆进pBluescribe SK+(Stratagene,Inc.,La Jolla,CA USA)的EcoRV位点,并验证序列。特别地采用如所描述的荧光标记双脱氧核苷酸(Sanger等人,“采用双脱氧链末端抑制剂的DNA测序″Proc.Nat.Acad.Sci.USA 74:5463-5467,1977)进行测序,反应混合物在Applied Biosystems 370A或380自动化DNA测序仪上运行。数据采用可在网上免费获取的不同软件模块进行分析,并与数据库中存在的人GnTIII DNA序列进行比较。

随后,含C-末端c-myc标记的GnTIII基因的1.6kb Hpal/BamHI片段被克隆进pUCAP35S的Sma/BglII位点(Van Engelen等人,″抗体亚单位基因的并列表达在转基因烟草的根内产生高水平的功能抗体″Plant Molecular Biology 26:1701-1710,1994),并命名为pAMV-GnTIII。具有修饰的GnTIII基因的花椰菜花叶病毒35S(CaMV35S)20启动子表达基因盒随后被克隆作为二元载体pBINPLUS中的AscI/PacI片段(VanEngelen等人,″抗体亚单位基因的并列表达在转基因烟草的根内产生高水平的功能抗体″Plant Molecular Biology 26:1701-1710,1994),得到pBINPLUSGnTIII,并通过电穿孔导入根癌土壤杆菌株Ag10。烟草品种Samsun NN的转化如前所述(Horsch等人,″转移基因进入植物的简单和通用的方法″Science 227:1229-1231,1985)。如所述选择16个独立的转基因植物并在温室中养至成熟。分析叶子原料表达的GnTIII(SEQ ID NO:2,图4B)和内源性细胞糖蛋白的聚糖组合物。

实施例2

表达分析。烟草叶的总蛋白提取物按前面的描述制备(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad.Sci.USA 98:2899-2904,2001)。样本中存在的蛋白量通过Bradford方法(Bradford,M.M.,″利用蛋白-染料结合原理定量微生物蛋白量的快速和敏感的方法″Anal Biochem 72:248-254,1976)采用牛血清白蛋白作为标准品来进行评估。在预制的10或12%SDS-PAGE凝胶(Bio-Rad)上,固定量的蛋白样本在还原条件下跑电泳。彩虹色的分子量蛋白标记物来自Amersham。Western印迹分析基本上如所述进行(Bakker等人,″通过转基因植物产生的抗体的半乳糖延伸的聚糖″Proc.Nat.Acad. Sci.USA 98:2899-2904,2001)。分离的蛋白用Bio-Rad Mini Trans-blot电泳转移杯在3[环己氨基]-1-丙磺酸(CAPS)缓冲液中60min被转移到硝酸纤维素(BA85,Schleicher和Schuell或Trans-Blot转移介质,Bio-Rad)上。采用过氧物酶标记的c-myc抗体,通过亲合印迹分析GnTIII-c-myc融合蛋白的表达。通过用生物素化血球凝集性植物血凝素(E-PHA;Vector Laboratories)孵育,显现内源性烟草糖蛋白中等分寡糖的导入。采用Roche的Lumi-Light Western印迹底物(Roche Diagnostics GmbH,Mannheim,Germany),在Lumi-Imager F1装置(BoehringerMannheim GmbH,Mannheim,Germany)上用LumiAnalyst软件(3.0版)通过增强的化学发光进行检测。

实施例3

基质辅助的激光解吸离子化时间飞行质谱(MALDI-TOF)质谱分析。为分析聚糖结构,从用人GnTIII(GnTIII-17)转化的所选植物烟草叶中分离细胞蛋白。如所述(Elbers等人,2001)进行蛋白分离和N-聚糖的制备。如所述,N-聚糖在质谱分析前在无孔的石墨化碳-黑柱(Carbograph Ultra Clean Tubes,Alltech Associates)上脱盐。在Micromass(Manchester,U.K.)Tof spec E MALDI-TOF质谱仪上检测MALDI-TOF光谱。基本上如所述(Elbers等人,2001),通过采用2,5-二羟苯甲酸作为基质以正性模式进行质谱。

人GnTIII的表达在N.烟草的内源性糖蛋白上导入了等分N-聚糖。人GnTIII通过土壤杆菌介导的二元载体pBINPLUSGnTIII转化导入烟草植物中,所述载体含载有完全编码序列的cDNA,编码序列在结构性CaMV35S启动子控制下与C-末端c-myc标记融合。获得了60个独立的卡那霉素抗性选择的转基因苗,用c-myc抗体分析GnTIII-c-myc融合蛋白的表达。分析显示,所有苗均以不同的水平表达基因。选择14株,生根并转移至温室。采用c-myc抗体选择的高表达GnTIII-c-myc融合蛋白的一株植物(GnTIII-17),被采用与生物素化植物血凝素E-PHA的特异性结合试验来分析内源性烟草糖蛋白的N-聚糖上等分GlcNAc残基的出现。蛋白提取物的SDS-PAGE后转移到硝酸纤维素上,并采用与生物素化E-PHA植物血凝素的特异性结合试验进行分析,显示GnTIII-17的内源性烟草糖蛋白含有等分寡糖而对照烟草则不含。GnTIII-17在温室内繁殖以进一步通过MALDI-TOF详细分析聚糖的结构。

实施例4

在野生型和选择的转基因GnTIII-17烟草植物中的寡糖分布和等分复合体寡糖的水平。从对照烟草植物和选择的GnTIII-17植物的嫩叶中分离内源性糖蛋白,以详细调查人GnTIII的表达对N-连接于糖蛋白的聚糖结构的影响。用图1所示的MALDI-TOF比较分离自糖蛋白的N-聚糖结构,糖蛋白存在于对照野生型烟草植物叶和GnTIII-17植物叶中。MALDI-TOF可以检测N-聚糖(糖型)库中不同的分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Mans到n、Man9,后者的范围从截短结构的a、XM3GN2到m、GN3FXM3GN2(结构见表1;数据总结见表2)。除了对照植物N-聚糖特征外(图1A),来自GnTIII-17植物的聚糖混合物(图1B)的MALDI-TOF MS显示至少两个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表1和表2)。这些寡糖,GN3XM3GN2(i)和GN3FXM3GN2(k)各自代表总体的8%和31%,含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。

如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2XM3GN2和GN2FXM3GN2结构是否具有等分寡糖或其程度。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。

根据观察的过度表达GnTIII的CHO细胞的致死率(Umana等人,″具有最优化的抗体-依赖的细胞毒活性的抗成神经细胞瘤IgGl的加工糖型”Nature Biotechnology17:176-180,1999),引人注目地,具有显著量等分聚糖的转基因植物看起来表型是完全正常可以授粉(能够异花授粉和自授粉)。

实施例5

人GnTIII在烟草中的表达似乎能防止N-聚糖被D-N乙酰己糖胺酶降解并使末端N-葡糖胺化(glucosaminylation)加倍。提取物的MALDI-TOF分析清楚地显示,经GnTIII酶的作用,在细胞烟草蛋白的复合型N-连接聚糖中,至少糖型总体的40%现在具有等分GlcNAc。而且,GnTIII-17内源性糖蛋白的复合型N-连接聚糖总体的70%具有两个或三个末端GlcNAc残基,相比野生型烟草大约为30%(表1)。观察到的在烟草中表达GnTIII时至少40%等分复合型N-连接聚糖的重新合成(图1B,表1和表2),与大部分的FXM3GN2(b,从30%至4%)和GNFXM3GN2(f,从10至2%)的消失及较小程度的GN2FXM3GN2(j,从29%至19%)的消失一致。另外,这还与GN2XM3GN2(h)从野生型烟草中的4%显著地增至GnTIII-17中的14%相一致。是否后面GnTIII植物中的GN2XM3GN2(h)具有第二个GlcNAc与N-连接聚糖三甘露糖核心的β-连接甘露糖相连,从而得到GnTIII活性,或与三甘露糖核心的第二个α-连接的甘露糖相连,仍有待研究(见上)。

由于缺少GnTI活性的拟南芥属突变体在内源性糖蛋白的N-聚糖中不含木糖和岩藻糖残基,野生型烟草植物中占N-连接聚糖40%的糖类a、b和c被认为是获得GnTI活性后来自内源性烟草糖蛋白成熟聚糖的降解产物(Von Schaewen等人,″分离缺少N-乙酰葡萄糖胺转移酶I且不能合成高尔基体修饰的复合体N-连接聚糖的阿布属植物突变体″Plant Physiology 102:1109-1118,1993)。GnTIII-17中这些结构的7倍减少(40%>6%)以及GNXM3GN2和XM3GN2的3倍下降(12%>4%)提示,导入等分GlcNAc防止成熟的N-连接聚糖被内源性糖苷酶,特别是去除末端GlcNAc的β-N乙酰己糖胺酶降解。期望由成熟,全长N-连接聚糖降解产生的N-连接聚糖的总量因此减少了5倍(从52%至10%)。

实施例6

玉米转化的载体构建和DNA制备。通过以下方法用PCR从质粒pAMV-GNTIII获得人GNTIII基因及其3’c-myc免疫检测标记。设计和合成分别与hGNTIFI基因5’和3’端同源的引物MS20和MS19,以在基因3’端添加Pmel位点和终止密码子。

MS20(5’Ncol位点):5’-CCATGGTGATGAGACGCTAC-3’(SEQ ID NO:5)

MS19(添加终止和Pmel位点3’):5’-GTTTAAACCTAGGATCCTAATTCAGATCCTCT-3’(SEQ ID NO:6)

在凝胶电泳确定正确大小的PCR产物后,用QIAquick Gel ExtractionKit(Qiagen,Valencia,CA)从凝胶中回收1.6kbp的PCR产物。用Ncol和Pmel消化含Zmubi/GUS/per5基因盒(Christensen等人,Plant Molec.Biol.18:675-689,1992)的质粒4005(见,SEQ ID NO:8)(图5A和5B)以释放GUS基因,用QIAquick GelExtraction Kit(Qiagen,Valencia,CA)从凝胶中回收载体片段。

用Ncol和Pmel消化后,PCR来源的hGNTIII片段与用Ncol和Pmel消化pDAB4005后留下的载体片段连接以产生中间体质粒pDAB7119(见SEQ ID NO:9)(图6A和6B)。用Spel和Sphl切割中间体质粒pDAB7119以释放hGNTIII植物表达基因盒,用T4 DNA聚合酶处理之以产生平端。

含RB7 MAR序列的质粒pDAB8504(SEQ ID NO:10)(见图7A和7B)被Srfl消化并用T4 DNA聚合酶钝化末端。用小牛肠磷酸酶处理后,连接处理的8504片段和hGNTIII植物表达基因盒以产生质粒pDAB 7113(SEQ ID NO:10)(见图8A和8B),它含有与目的基因和可选择标记基因盒侧面连接的RB7 MAR序列,如:RB7 MAR//Zmubi启动子/hGNTIII/per5 3’UTR//稻米肌动蛋白启动子(D.McElroy等人,″分离有效的肌动蛋白启动子用于稻米转化″The Plant Cell 2:163-171,1990)/PAT/Zm脂肪酶3’UTR//RB7MAR。

通过测序检验GNTIII序列的完整性(Big Dye Terminator Cycle SequencingReady Reaction,Applied Biosystems,Foster City,CA),证实编码人GNTIII酶。发现了一个碱基改变,G384->384,但此取代不影响编码的氨基酸,脯氨酸128。

质粒pDAB7113在2L培养基(LB+氨苄)中生长并用Qiagen质粒Giga试剂盒纯化以产生5毫克纯化的质粒用于转化植物细胞。

实施例7

玉米细胞转化。质粒pDAB7113被用WHISKERS-介导的DNA转移导入玉米细胞,基本上如以下这些引用文献所描述,(Frame,B.等人,″通过碳化硅强化水晶-介导的转化产生可繁殖的转基因玉米植物″Plant J.6:941-948,1994;Thompson,J.等人,″利用碳化硅强化水晶的玉米转化:综述″Euphytica 85:75-80,1995;P.Song,C.Q.Cai,M.Skokut,B.Kosegi,和J.Petolino,″定量的实时PCR作为筛选工具在强化水晶-来源的转基因玉米中估计转基因拷贝的数目″Plant Cell Rep.20:948-954,2002;它们均在此引入以供参考)。

强化水晶介导的转化日前,形成胚芽的玉米悬浮细胞培养物在培养基G-N6(N6培养基含30gm/L蔗糖,100mg/L肌醇,和2mg/L 2,4-D)中传代培养。在实验日,细胞用渗压剂通过与含甘露醇和山梨醇各0.2摩尔的G-N6培养基一起振摇30分钟预处理。36ml细胞转移至含50ml G-N6培养基的250ml离心瓶中,其中添加8.1ml 5%(w/v)的碳化硅强化水晶培养基悬液(Silar SC-9,Advanced Composite Materials,Greer,S.C.),加170μl 1mg/ml的质粒溶液(TE缓冲液)。含细胞、强化水晶和DNA的离心瓶在改良的Red Devil牌涂剂搅拌器上剧烈搅动10秒。然后,强化水晶化的细胞在添加一半水平渗压剂的培养基中振摇两个小时。通过消毒的Buchner漏斗过滤回收针状单晶化的细胞,滤纸置于半固体G-N6培养基上1周。1周后,滤器移到含1mg/L Herbiace(20%bialaphos的商业配方,Meiji Seika,Tokyo,Japan)的半固体G-N6培养基上。两周后,从滤纸上去除细胞,与溶化的也含7gm/L Seaplaque琼脂糖(BioWhittaker.Rockland,Maine)的G-N6+1mg/L Herbiace(G-N6+1H)培养基混合,并铺在G-N6+1H固体培养基上面。平板在暗处30℃培养。植入后5-7周回收抗选择剂的克隆,并单独转移至新鲜的G-N6+1H培养基上以进一步增加组织量。

实施例8

插入DNA拷贝数目的分子分析。每个转基因分离物的组织单独在冷冻干燥机中冻干,并通过标准的方法(DNAeasy 96 Plant Kit,Qiagen)提取DNA。插入的转基因DNA的拷贝数目通过可从Third Wave Technologies(Third Wave Technologies,Madison,Wisconsin,twt.com)获得的Invader操作系统来评估。通过Third Wave Technologies公司特别地为PAT可选择标记设计引物,其拷贝数目相对于内源性玉米α-微管蛋白基因的基因组DNA拷贝数目进行评估。

实施例9

检测转基因玉米胼胝由于表达Gntlll基因而改变的与植物血凝素的结合。按如下方法对100个单独分离的独特转基因试验中获得的胼胝样本进行提取。每个试验的样本新鲜冷冻于96孔的集簇管盒(Costar 1.2ml聚丙烯,带盖)中,每孔内有钢和钨珠。每孔加入450μl提取缓冲液(25mM磷酸钠pH6.6,100mM NaCl,30mM硫酸氢钠,1%v/vTriton X-100),在Kleco Bead Mill上3分钟全速将样本盒研磨成粉。平板2500rpm离心(4℃)10分钟。提取物移到96孔深孔板中,冷冻贮藏。所有筛选试验在这些独立试验的提取物上进行。

进行蛋白分析(微量滴定板方案,BioRad 500-0006)以确定每次提取的总蛋白。每个样本25μg蛋白放入20μl上样缓冲液(Laemmli,U.K.Nature 277:680(1970))中。在Tris/氨基乙酸/SDS电泳缓冲液(BioRad 161-077)中以65mA电泳凝胶(4-20%Criterion PAGE凝胶,12+2孔,BioRad 345-0032)。在转移缓冲液(电泳缓冲液加20%v/v甲醇)中浸泡10分钟后,用半干的吸水纸(150mA/1.5hrs)将凝胶移到硝酸纤维素膜上。在阻断缓冲液(20mM Tris,144mM NaCl,0.5%v/v Tween 20,10%vv/v脱脂奶粉)中室温孵育膜30分钟,然后去除阻断缓冲液并用含2.5μg/ml初始检测植物血凝素(菜豆属红细胞凝集素E,生物素化的,Vector Laboratories B-1125)的阻断缓冲液置换。初始检测植物血凝素在膜上室温孵育1小时。去除初始检测溶液,用阻断缓冲液冲洗膜一次,加入第二检测溶液(抗生物素蛋白-HRP,BioRad 170-6528,1∶5000,加分子量标记检测剂,StrepT肌动蛋白-HRP,BioRad 161-0380,1∶10,000的阻断缓冲液。第二检测试剂在膜上室温孵育1小时。在阻断、第一和第二试剂步骤过程中,溶液在印迹上混合。然后,去除第二检测试剂,用含0.5%Tween 20的Tris缓冲盐(20mM Tris,144mM NaCl)冲洗膜3次,每次10分钟,再一次5分钟。滴干多余的冲洗溶液后,印迹在底物ECL(Pierce 34080)中浸湿1分钟,排去过剩的ECL溶液,将膜与胶片接触。每个凝胶中包括阴性对照以区别现在转基因胼胝提取物上这种检测等分聚糖的植物血凝素试剂可以显现的新糖蛋白带。

E-PHA结合的阳性试验结果(表5)被定为0(阴性)、1(1个加号,弱)、2(2个加号,中等强度)或3(3个加号,最强等级)。选择定为2或3的胼胝以产生质量分析的样本。汇集样本25、26、33、48、55、56和59以产生用于聚糖亚结构MALDI-TOF分析的蛋白提取物。凝胶印迹实施例(图12)显示样本19至27。

实施例10

检测转基因玉米胼胝的c-myc抗原决定簇表达。按如下方法对100个单独分离的独特转基因试验中获得的胼胝样本进行提取。每个试验的样本新鲜冷冻于96孔集簇管盒(Costar 1.2ml聚丙烯,带盖)中,每孔内有钢和钨珠。每孔加入450μl提取缓冲液(25mM磷酸钠pH6.6,100mM NaCl,30mM硫酸氢钠,1%v/v Triton X-100),在KlecoBead Mill上3分钟全速将样本盒研磨成粉。平板2500rpm离心(4℃)10分钟。提取物移到96孔深孔板中,冷冻贮藏。所有筛选试验在这些独立试验的提取物上进行。

进行蛋白分析(微量滴定板方案,BioRad 500-0006)以确定每次提取的总蛋白。每个样本25μg蛋白放入20μl上样缓冲液(Laemmli,U.K.Nature 277:680(1970))中。在Tris/氨基乙酸/SDS电泳缓冲液(BioRad 161-0772)中以65mA电泳凝胶(4-20%Criterion PAGE凝胶,每胶12+2孔,BioRad 345-0032)。在转移缓冲液(电泳缓冲液加20%甲醇)中浸泡10分钟后,用半干的吸水纸(150mA/1.5hrs)将凝胶移到硝酸纤维素膜上。在阻断缓冲液(20mM Tris,144mM NaCl,0.5%v/v Tween 20,10%vv/v奶粉)中室温孵育膜30分钟,然后去除阻断缓冲液并用初始检测试剂置换,阻断缓冲液中含鼠抗c-myc克隆9E10(sigma M5546)1μg/ml。室温孵育1小时后,去除初始检测试剂,用阻断缓冲液冲洗膜。然后加入第二检测试剂,1∶10,000的抗鼠-HEP(BioRad170-6516)加1∶10,000的分子量标记检测试剂(StrepT肌动蛋白-HRP,BioRad161-0380)的阻断缓冲液,在膜上室温孵育1小时。在阻断、第一和第二试剂步骤过程中,溶液在印迹上混合。去除第二检测试剂,用含0.5%Tween 20的Tris缓冲盐(20mMTris,144mM NaCl)冲洗膜3次,每次10分钟,另加一个5分钟冲洗。排去过剩的冲洗溶液后,膜在ECL试剂(Pierce 34080)中浸湿1分钟,排干液体,然后接触胶片。

如上详述的,来自独立试验1-100的胼胝样本筛选c-myc抗原决定簇的表达。然后,分析样本3、11、12、26、31、55和64,显示存在预测分子量范围50-55千道尔顿的带。汇集这些胼胝样本以产生用于MALDI-TOF聚糖分析的蛋白样本。代表性的印迹显示于图13。

实施例11

制备用于聚糖质谱分析的提取物。从几个玉米胼胝试验的组合胼胝中制备样本,根据植物血凝素印迹试验采用E-PHA检测这些胼胝为GnTIII转基因表达阳性。新鲜收集胼胝组织并-80℃冷冻贮藏,然后在液氮中使之成为细粉末。称重的样本加入提取缓冲液(5mM EDTA,0.5mM PMSF,20mM亚硫酸氢钠,150mM磷酸钠缓冲液pH7.4,和0.4mMPVPP可溶的MW 40,000)中,4℃搅拌30分钟。5000xG 4℃离心后,收集上清。在上清中添加硫酸铵和冲洗缓冲液(5mM EDTA,150mM磷酸钠缓冲液,pH7.4)至终浓度为20%(w/v)硫酸铵。5000xG 4℃离心5分钟后,将上清移至新鲜管中,另外加入硫酸铵和冲洗缓冲液至60%(w/v)硫酸铵。此制剂4℃搅拌过夜,然后以10,000xG离心20分钟。在5ml冲洗缓冲液中回收沉淀,-80℃冷冻,然后在4℃冻干至干燥。样本送到实验室进行聚糖分析。

实施例12

玉米植物从转基因胼胝组织的再生。为从转化的胼胝中再生植物,组织置于再生培养基上,培养基含MS基础盐和维生素(Murashige T.和F.Skoog,Physiol Plant15:473-497,1962),30g/l蔗糖,5mg/l 6-苯甲基氨基嘌呤(BA),0.025mg/l 2,4-二氯苯氧基乙酸(2,4-D),1mg/l Herbiace(20% bialaphos的商业配方,Meiji Seika,Tokyo,Japan),和2.5g/l Gelrite,pH5.7。培养物在日光下生长。当幼苗达到1-3cm长时,转移进含SH基础盐和维生素(Schenk R和A.C.Hildebrandt,Can J Bot50:199-204,1972)、10g/l蔗糖、1g/l肌醇和2.5g/l Gelrite pH5.8的容器中。

通过植物血凝素E-PHA与内源性蛋白结合的改变筛选表达GNTIII的植物。然后筛选结合E-PHA的样本,如实施例9中所述,见上。完全按照下面实施例13的描述制备胼胝样本的蛋白提取物和20%/60%硫酸铵沉淀。通过植物血凝素印迹试验筛选表达GNTIII基因的一个植物,每一个植物分别再生自23个独立试验。这些试验中的4个产生E-PHA结合的阳性信号。这4个试验在胼胝阶段也检测为阳性。汇集再生自那4个试验的植物以产生通过MALDI-TOF进行聚糖分析的蛋白提取物。

实施例13

在野生型和选择的转基因玉米胼胝中的寡糖分布和等分复合体寡糖的水平。从对照玉米胼胝和根据植物血凝素印迹试验采用E-PHA选择的表达GnTIII的玉米胼胝中分离内源性糖蛋白。另外,本发明还试图提取c-myc标记的样本。E-PHA和c-myc标记的样本可以是胼胝、植物细胞、植物组织或完整的植物,如上面定义部分所定义的。从胼胝中存在的糖蛋白中分离的N-聚糖的结构比较见图9A和9B。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Man5到1、Man8,后者的范围从截短结构的a、XM3GN2到m、bGN3FXM3GN2(见表3)。除了对照胼胝N-聚糖的特征外(图9A),来自选择的表达GnTIII的玉米胼胝的聚糖混合物(图9B)的MALDI-TOF MS显示至少一个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表3)。此GN3XM3GN2(m)寡糖代表总体的20%并含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2XM3GN2(h)和GN2FXM3GN2(k)结构是否具有等分寡糖或其程度。同非转化的对照玉米细胞相比,两者均在GnTIII玉米细胞中增加了数量。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。

除了GnTIII玉米中出现糖类结构m(bGN3FXM3GN2)以外,如表3所示,从对照和GnTIII玉米的糖型比较中明显看到,带有高甘露糖型N-聚糖(M4及更高)结构的量下降了超过两倍(从19%到7%),这可能主要是由于GnTIII玉米与对照玉米相比含M4的N-聚糖减少(从10%到总数的1%)。另外,具有两个或以上GlcNAc残基的糖型的量从16%增加到42%(对照相比GnTIII)。

在跟踪实验中,从对照玉米胼胝和根据Western印迹试验分析存在c-myc标记序列而选择的表达GnTIII的玉米胼胝中分离内源性糖蛋白。从胼胝中存在的糖蛋白中分离的N-聚糖的结构比较见表4。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示对照玉米中被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+加合物的离子混合物,前者的范围从d、Man5到1、Man8,后者的范围从截短结构的a、XM3GN2到k、GN2FXM3GN2。

显著地,在表达GnTIII的转基因玉米中(表4,GnTIII-2),只有3种异构体可被检测:FXM3GN2(b;占总量的9%),GN2FXM3GN2/bGN2FXM3GN2(k;占38%)和bGN3FXM3GN2(m;占54%)。尚不清楚描述为k(GN2FXM3GN2/bGN2FXM3GN2)的结构是否具有等分寡糖以及其程度如何。同对照玉米相比,GnTIII玉米中它的存在显著增加。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。

除了GnTIII玉米中出现的糖类结构m(bGN3FXM3GN2)之外(54%),如表4中总结的,从对照和GnTIII玉米的糖型比较中明显看到,相对于对照玉米,GnTIII玉米中带有高甘露糖型N-聚糖(M4及更高)结构的量降至0。另外,具有两个或以上(3)GlcNAc残基的N-聚糖总量从16%增加到92%(对照比GnTIII),提示导入等分GlcNAc残基防止了以前在转基因GnTIII烟草观察到的内源性己糖胺酶对聚糖的降解。

另外,MALDI-TOF质谱数据(图11)证实了等分GlcNAc结构。

实施例14

在野生型和选择的转基因玉米植物中的寡糖分布和等分复合体寡糖的水平。从对照玉米植物叶和选择的表达GnTIII的玉米植物叶中分离内源性糖蛋白,根据Western印迹试验或采用E-PHA的植物血凝素印迹试验分析存在c-myc标记序列选择玉米。从叶子中存在的糖蛋白中分离的N-聚糖的结构比较见表6。MALDI-TOF可以检测N-聚糖(糖型)库中的不同分子种类,显示被分配给高甘露糖(Man)型N-聚糖和成熟N-聚糖的(M+Na)+或(M+K)+加合物的离子混合物,高甘露糖型N-聚糖的范围从f、Man6到h、Man8,成熟N-聚糖的范围从截短结构的a、XM3GN2到对照玉米植物中的g、GN2FXM3GN2和转基因GnTIII玉米植物中的i,bGN3FXM3GN2。

除了对照植物N-聚糖特征外(图A),来自选择的表达GnTIII的玉米植物的聚糖混合物(图B)的MALDI-TOF MS显示至少一个离子由于人GnTIII酶的作用分配给N-连接的聚糖(比较见表6)。此GN3XM3GN2(i)寡糖代表总体的15%并含有三个GlcNAc残基,分别与N-连接聚糖的三甘露糖核心结构的三个甘露糖之一连接。如这里进行的经MALDI-TOF对聚糖结构的分析不能区别与甘露糖连接的GlcNAc残基β(1,2)-或β(1,4)-。因此,不清楚GN2FXM3GN2(g)结构是否具有等分寡糖或其程度。同对照玉米植物相比,它在GnTIII玉米中增多(23%相比对照的5%)。需要另外的实验来显示这些结构是常态与等分寡糖的混合物或单一化合物。除此以外,如表6所述,从对照和GnTIII玉米植物的糖型比较中明显看到,带有FXM3GN2结构的量下降了两倍(从59%到30%),具有两个或以上GlcNAc残基的糖型量从5%增加至38%(对照比GnTIII)。

此外,图14显示从对照玉米(A)和选择的GnTIII-玉米植物叶中分离的糖蛋白N-聚糖的MALDI-TOF质谱比较。GnTIII玉米植物通过用人GnTIII基因序列转化而获得,通过Western印迹试验采用c-myc标记或E-PHA植物血凝素进行选择。结构和缩写见表6。

应当理解,本发明并不限于这里描述的特定方法学、方案、细胞系、载体和试剂等,因为这些可改变。还应当理解,这里所用的术语仅仅是为了描述特定实施例而使用,并非要限制本发明的范围。必须注意到,如这里和附加权利要求中所用的,单数形式的″一个″和″该″包括复数的含义,除非文中另有明确规定。

除非另外说明,这里所用的所有技术和科学术语与本发明所属的领域内普通技术人员通常理解的含义相同。

这里声明和描述的发明并非要通过这里公开的实施例限制范围,因为这些实施例意图作为本发明几个方面的例证。任何相当的实施例预期在此发明的范围内。确实,本领域技术人员从前面的描述中很清楚本发明在这里所显示和描述之外的各种修改。这些修改也预期在附加权利要求的范围内。

这里引用了许多参考文献,其公开发表物在此全部引入以供参考。

表1.从对照和选择的GnTIII-17植物中分离的N-聚糖总库的结构、分子量和百分比。

表2.从对照烟草和选择的GnTIII-17植物中分离的内源性糖蛋白N-聚糖的质谱(MALDI-TOF)分析结果的比较.见表1.

m/z类型野生型endoGnTlll-17endo1065XM3841079FM3301211FXM33041257M5231268GNXM3401414GNFXM31021419M6351471GNbGNXM3141471GN2XM341581M7341617GN2FXM329191617GNbGNXM31674GN2bGNXM3081743M8241820GN2bGNFXM30311905M912            合计99100

表3.对照和转基因GnTIII玉米中观察的N-聚糖纵览

比较对照的非转化玉米和能被标注的表达GnTIII的转基因玉米胼胝中发现的内源性糖蛋白的N-聚糖结构(总数的%)。经MALDI-TOF分析获得的相应质谱在下面举出,糖类在″名称″栏下表示。等分的GlcNAc残基被描述为bGN。

结构缩写    m/z名称    玉米胼胝    对照GnTIIIXM3GN2    1065a    15FXM3GN2    1211b    3736XM4GN2    1227c    61M5GN2    1257d    11GNFXM3GN2    1414e    123M6GN2    1419f    54GNXM4GN2    1430a    3GN2XM3GN2    1471h3bGN2XM3GN2GNFXM4GN2    1576i    1M7GN2    1581j    11GN2FXM3GN2    1617k    1619bGN2FXM3GN2M8GN2    1743l    1bGN3FXM3GN2    1820m20合计    8493

表4.在对照和转基因GnTIII玉米-2中观察的N-聚糖图解纵览.

比较对照的非转化玉米和能被标注的表达GnTIII的转基因玉米胼胝中发现的内源性糖蛋白的N-聚糖结构(%总数)。转基因玉米用c-myc标记选择。经MALDI-TOF分析获得的相应质谱在下面举出,糖类在″名称″栏下表示。等分的GlcNAc残基被描述为bGN。

结构缩写    m/z名称玉米胼胝对照GnTIII-2XM3GN2    1065a1FXM3GN2    1211b379XM4GN2    1227c6M5GN2    1257d1GNFXM3GN2    1414e         12M6GN2    1419f5GNXM4GN2    1430g3GN2XM3GN2    1471hbGN2XM3GN2GNFXM4GN2    1576i1M7GN2    1581j         1GN2FXM3GN2    1617k1638bGN2FXM3GN2M8GN2    1743l1bGN3FXM3GN2    1820m54合计84101

表5.E-PHA结合的阳性试验结果.

样本ID号E-PHA结合等级包括在集合的阳性样本中    1.    不清楚    2.    不清楚    3.    1    4.    0    5.    0    6.    0    7.    0    8.    0    9.    0    10.    不清楚    11.    不清楚    12.    1    13.    1    14.    0    15.    0    16.    0    17.    0    18.    0    19.    0    20.    0    21.    0    22.    0    23.    1    24.    1    25.    3    是    26.    3    是    27.    0    28.    0    29.    0    30.    0    31.    0    32.    0    33.    2    是    34.    1    35.    0    36.    0    37.    不清楚    38.    1    39.    0    40.    1    41.    1    42.    0    43.    0    44.    不清楚    45.    0

    46.    0    47.    0    48.    2    是    49.    0    50.    0    51.    0    52.    0    53.    0    54.    1    55.    2    是    56.    2    是    57.    2    是    58.    1    59.    2    是    60.    0    61.    0    62.    0    63.    0    64.    0    65.    0    66.    0    67.    0    68.    0    69.    阴性对照

表6.在对照和转基因GnTIII玉米植物中观察的N-聚糖图解纵览.

 结构缩写    m/z    名称   玉米植物   对照  GnTIII XM3GN2    1065    a    4  14 FM3GN2    1079    b    2 FXM3GN2    1211    c    59  30 XM4GN2    1227    d    3  12 GNFXM3GN2    1414    e    10  6 M6GN2    1419    f    2 GN2FXM3GN2    1617    g    5  23 bGN2FXM3GN2 M8GN2    1743    h    1 bGN3FXM3GN2    1820    i  15                               合计    86  100

                             序列表

<110>国际植物研究所

<120>GNTIII在植物中的表达

<130>62862A-P033313WO

<150>US-60/365,769

<151>2002-03-19

<150>US-60/368,047

<151>2002-03-26

<160>27

<170>PatentIn version 3.2

<210>1

<211>1642

<212>DNA

<213>人类

<400>1

ccatggtgat gagacgctac aagctctttc tcatgttctg tatggccggc ctgtgcctca      60

tctccttcct gcacttcttc aagaccctgt cctatgtcac cttcccccga gaactggcct     120

ccctcagccc taacctggtg tccagctttt tctggaacaa tgccccggtc acgccccagg     180

ccagccccga gccaggaggc cctgacctgc tgcgtacccc actctactcc cactcgcccc     240

tgctgcagcc gctgccgccc agcaaggcgg ccgaggagct ccaccgggtg gacttggtgc     300

tgcccgagga caccaccgag tatttcgtgc gcaccaaggc cggcggcgtc tgcttcaaac     360

ccggcaccaa gatgctggag aggccgcccc cgggacggcc ggaggagaag cctgaggggg     420

ccaacggctc ctcggcccgg cggccacccc ggtacctcct gagcgcccgg gagcgcacgg     480

ggggccgagg cgcccggcgc aagtgggtgg agtgcgtgtg cctgcccggc tggcacggac     540

ccagctgcgg cgtgcccact gtggtgcagt actccaacct gcccaccaag gagcggctgg     600

tgcccaggga ggtgccgcgc cgcgtcatca acgccatcaa cgtcaaccac gagttcgacc     660

tgctggacgt gcgcttccac gagctgggcg acgtggtgga cgcctttgtg gtgtgcgagt     720

ccaacttcac ggcttatggg gagccgcggc cgctcaagtt ccgggagatg ctgaccaatg     780

gcaccttcga gtacatccgc cacaaggtgc tctatgtctt cctggaccac ttcccgcccg     840

gcggccggca ggacggctgg atcgccgacg actacctgcg caccttcctc acccaggacg     900

gcgtctcgcg gctgcgcaac ctgcggcccg acgacgtctt catcattgac gatgcggacg     960

agatcccggc ccgtgacggc gtccttttcc tcaagctcta cgatggctgg accgagccct    1020

tcgccttcca catgcgcaag tcgctctacg gcttcttctg gaagcagccg ggcaccctgg    1080

aggtggtgtc aggctgcacg gtggacatgc tgcaggcagt gtatgggctg gacggcatcc    1140

gcctgcgccg ccgccagtac tacaccatgc ccaacttcag acagtatgag aaccgcaccg    1200

gccacatcct ggtgcagtgg tcgctgggca gccccctgca cttcgccggc tggcactgct    1260

cctggtgctt cacgcccgag ggcatctact tcaagctcgt gtccgcccag aatggcgact    1320

tcccacgctg gggtgactac gaggacaagc gggacctgaa ctacatccgc ggcctgatcc    1380

gcaccggggg ctggttcgac ggcacgcagc aggagtaccc gcctgcagac cccagcgagc    1440

acatgtatgc gcccaagtac ctgctgaaga actacgaccg gttccactac ctgctggaca    1500

acccctacca ggagcccagg agcacggcgg cgggcgggtg gcgccacagg ggtcccgagg    1560

gaaggccgcc cgcccggggc aaactggacg aggcggaagt cgaacaaaaa ctcatctcag    1620

aagaggatct gaattaggat cc                                             1642

<210>2

<211>544

<212>PRT

<213>人类

<400>2

Met Val Met Arg Arg Tyr Lys Leu Phe Leu Met Phe Cys Met Ala Gly

1               5                   10                  15

Leu Cys Leu Ile Ser Phe Leu His Phe Phe Lys Thr Leu Ser Tyr Val

            20                  25                  30

Thr Phe Pro Arg Glu Leu Ala Ser Leu Ser Pro Asn Leu Val Ser Ser

        35                  40                  45

Phe Phe Trp Asn Asn Ala Pro Val Thr Pro Gln Ala Ser Pro Glu Pro

    50                  55                  60

Gly Gly Pro Asp Leu Leu Arg Thr Pro Leu Tyr Ser His Ser Pro Leu

65                  70                  75                  80

Leu Gln Pro Leu Pro Pro Ser Lys Ala Ala Glu Glu Leu His Arg Val

                85                  90                  95

Asp Leu Val Leu Pro Glu Asp Thr Thr Glu Tyr Phe Val Arg Thr Lys

            100                 105                 110

Ala Gly Gly Val Cys Phe Lys Pro Gly Thr Lys Met Leu Glu Arg Pro

        115                 120                 125

Pro Pro Gly Arg Pro Glu Glu Lys Pro Glu Gly Ala Asn Gly Ser Ser

    130                 135                 140

Ala Arg Arg Pro Pro Arg Tyr Leu Leu Ser Ala Arg Glu Arg Thr Gly

145                 150                 155                 160

Gly Arg Gly Ala Arg Arg Lys Trp Val Glu Cys Val Cys Leu Pro Gly

                165                 170                 175

Trp His Gly Pro Ser Cys Gly Val Pro Thr Val Val Gln Tyr Ser Asn

            180                 185                 190

Leu Pro Thr Lys Glu Arg Leu Val Pro Arg Glu Val Pro Arg Arg Val

        195                 200                 205

Ile Asn Ala Ile Asn Val Asn His Glu Phe Asp Leu Leu Asp Val Arg

    210                 215                 220

Phe His Glu Leu Gly Asp Val Val Asp Ala Phe Val Val Cys Glu Ser

225                 230                 235                 240

Asn Phe Thr Ala Tyr Gly Glu Pro Arg Pro Leu Lys Phe Arg Glu Met

                245                 250                 255

Leu Thr Asn Gly Thr Phe Glu Tyr Ile Arg His Lys Val Leu Tyr Val

            260                 265                 270

Phe Leu Asp His Phe Pro Pro Gly Gly Arg Gln Asp Gly Trp Ile Ala

        275                 280                 285

Asp Asp Tyr Leu Arg Thr Phe Leu Thr Gln Asp Gly Val Ser Arg Leu

    290                 295                 300

Arg Asn Leu Arg Pro Asp Asp Val Phe Ile Ile Asp Asp Ala Asp Glu

305                 310                 315                 320

Ile Pro Ala Arg Asp Gly Val Leu Phe Leu Lys Leu Tyr Asp Gly Trp

                325                 330                 335

Thr Glu Pro Phe Ala Phe His Met Arg Lys Ser Leu Tyr Gly Phe Phe

            340                 345                 350

Trp Lys Gln Pro Gly Thr Leu Glu Val Val Ser Gly Cys Thr Val Asp

        355                 360                 365

Met Leu Gln Ala Val Tyr Gly Leu Asp Gly Ile Arg Leu Arg Arg Arg

    370                 375                 380

Gln Tyr Tyr Thr Met Pro Asn Phe Arg Gln Tyr Glu Asn Arg Thr Gly

385                 390                 395                 400

His Ile Leu Val Gln Trp Ser Leu Gly Ser Pro Leu His Phe Ala Gly

                405                 410                 415

Trp His Cys Ser Trp Cys Phe Thr Pro Glu Gly Ile Tyr Phe Lys Leu

            420                 425                 430

Val Ser Ala Gln Asn Gly Asp Phe Pro Arg Trp Gly Asp Tyr Glu Asp

        435                 440                 445

Lys Arg Asp Leu Asn Tyr Ile Arg Gly Leu Ile Arg Thr Gly Gly Trp

    450                 455                 460

Phe Asp Gly Thr Gln Gln Glu Tyr Pro Pro Ala Asp Pro Ser Glu His

465                 470                 475                 480

Met Tyr Ala Pro Lys Tyr Leu Leu Lys Asn Tyr Asp Arg Phe His Tyr

                485                 490                 495

Leu Leu Asp Asn Pro Tyr Gln Glu Pro Arg Ser Thr Ala Ala Gly Gly

            500                 505                 510

Trp Arg His Arg Gly Pro Glu Gly Arg Pro Pro Ala Arg Gly Lys Leu

        515                 520                 525

Asp Glu Ala Glu Val Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn

    530                 535                 540

<210>3

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>3

atactcgagt taacaatgaa gatgagacgc t                                     31

<210>4

<211>35

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>4

tatggatcct aattcagatc ctcttctgag atgag                                 35

<210>5

<211>20

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>5

ccatggtgat gagacgctac                                                  20

<210>6

<211>32

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>6

gtttaaacct aggatcctaa ttcagatcct ct                                   32

<210>7

<211>1602

<212>DNA

<213>人类

<400>7

atgaagatga gacgctacaa gctctttctc atgttctgta tggccggcct gtgcctcatc      60

tccttcctgc acttcttcaa gaccctgtcc tatgtcacct tcccccgaga actggcctcc     120

ctcagcccta acctggtgtc cagctttttc tggaacaatg ccccggtcac gccccaggcc     180

agccccgagc caggaggccc tgacctgctg cgtaccccac tctactccca ctcgcccctg     240

ctgcagccgc tgccgcccag caaggcggcc gaggagctcc accgggtgga cttggtgctg     300

cccgaggaca ccaccgagta tttcgtgcgc accaaggccg gcggcgtctg cttcaaaccc     360

ggcaccaaga tgctggagag gccgcccccg ggacggccgg aggagaagcc tgagggggcc     420

aacggctcct cggcccggcg gccaccccgg tacctcctga gcgcccggga gcgcacgggg     480

ggccgaggcg cccggcgcaa gtgggtggag tgcgtgtgcc tgcccggctg gcacggaccc     540

agctgcggcg tgcccactgt ggtgcagtac tccaacctgc ccaccaagga gcggctggtg     600

cccagggagg tgccgcgccg cgtcatcaac gccatcaacg tcaaccacga gttcgacctg     660

ctggacgtgc gcttccacga gctgggcgac gtggtggacg cctttgtggt gtgcgagtcc     720

aacttcacgg cttatgggga gccgcggccg ctcaagttcc gggagatgct gaccaatggc     780

accttcgagt acatccgcca caaggtgctc tatgtcttcc tggaccactt cccgcccggc     840

ggccggcagg acggctggat cgccgacgac tacctgcgca ccttcctcac ccaggacggc     900

gtctcgcggc tgcgcaacct gcggcccgac gacgtcttca tcattgacga tgcggacgag     960

atcccggccc gtgacggcgt ccttttcctc aagctctacg atggctggac cgagcccttc    1020

gccttccaca tgcgcaagtc gctctacggc ttcttctgga agcagccggg caccctggag    1080

gtggtgtcag gctgcacggt ggacatgctg caggcagtgt atgggctgga cggcatccgc    1140

ctgcgccgcc gccagtacta caccatgccc aacttcagac agtatgagaa ccgcaccggc    1200

cacatcctgg tgcagtggtc gctgggcagc cccctgcact tcgccggctg gcactgctcc    1260

tggtgcttca cgcccgaggg catctacttc aagctcgtgt ccgcccagaa tggcgacttc    1320

ccacgctggg gtgactacga ggacaagcgg gacctgaact acatccgcgg cctgatccgc    1380

accgggggct ggttcgacgg cacgcagcag gagtacccgc ctgcagaccc cagcgagcac    1440

atgtatgcgc ccaagtacct gctgaagaac tacgaccggt tccactacct gctggacaac    1500

ccctaccagg agcccaggag cacggcggcg ggcgggtggc gccacagggg tcccgaggga    1560

aggccgcccg cccggggcaa actggacgag gcggaagtct ag                       1602

<210>8

<211>7027

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>8

catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg       60

caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgcagtgca      120

gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta agttataaaa      180

aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca      240

tatatttaaa ctttaatcta cgaataatat aatctatagt actacaataa tatcagtgtt      300

ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga gtattttgac      360

aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat      420

agcttcacct atataatact tcatccattt tattagtaca tccatttagg gtttagggtt      480

aatggttttt atagactaat ttttttagta catctatttt attctatttt agcctctaaa      540

ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa      600

taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa      660

acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac      720

ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca      780

tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg      840

ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc      900

ctcctcctcc tctcacggca cggcagctac gggggattcc tttcccaccg ctccttcgct      960

ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt tccccaacct     1020

cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac ccgtcggcac     1080

ctccgcttca aggtacgccg ctcgtcctcc cccccccccc ctctctacct tctctagatc     1140

ggcgttccgg tccatgcatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt     1200

agatccgtgt ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg     1260

tcagacacgt tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct     1320

ctagccgttc cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt     1380

ggtttgccct tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt     1440

catgcttttt tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg   1500

gagtagaatt ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt   1560

gccatacata ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag   1620

gtatacatgt tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg   1680

ttgtgatgat gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact   1740

gtttcaaact acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt   1800

catagttacg agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg   1860

tgggttttac tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc   1920

ttgagtacct atctattata ataaacaagt atgttttata attattttga tcttgatata   1980

cttggatgat ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc   2040

tatttatttg cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt   2100

ctgcagggta cccccggggt cgaccatggt aaggggcagc caccaccacc accaccacat   2160

ggtccgtcct gtagaaaccc caacccgtga aatcaaaaaa ctcgacggcc tgtgggcatt   2220

cagtctggat cgcgaaaact gtggaattga tcagcgttgg tgggaaagcg cgttacaaga   2280

aagccgggca attgctgtgc caggcagttt taacgatcag ttcgccgatg cagatattcg   2340

taattatgcg ggcaacgtct ggtatcagcg cgaagtcttt ataccgaaag gttgggcagg   2400

ccagcgtatc gtgctgcgtt tcgatgcggt cactcattac ggcaaagtgt gggtcaataa   2460

tcaggaagtg atggagcatc agggcggcta tacgccattt gaagccgatg tcacgccgta   2520

tgttattgcc gggaaaagtg tacgtatcac cgtttgtgtg aacaacgaac tgaactggca   2580

gactatcccg ccgggaatgg tgattaccga cgaaaacggc aagaaaaagc agtcttactt   2640

ccatgatttc tttaactatg ccggaatcca tcgcagcgta atgctctaca ccacgccgaa   2700

cacctgggtg gacgatatca ccgtggtgac gcatgtcgcg caagactgta accacgcgtc   2760

tgttgactgg caggtggtgg ccaatggtga tgtcagcgtt gaactgcgtg atgcggatca   2820

acaggtggtt gcaactggac aaggcactag cgggactttg caagtggtga atccgcacct   2880

ctggcaaccg ggtgaaggtt atctctatga actgtgcgtc acagccaaaa gccagacaga   2940

gtgtgatatc tacccgcttc gcgtcggcat ccggtcagtg gcagtgaagg gcgaacagtt   3000

cctgattaac cacaaaccgt tctactttac tggctttggt cgtcatgaag atgcggactt   3060

acgtggcaaa ggattcgata acgtgctgat ggtgcacgac cacgcattaa tggactggat   3120

tggggccaac tcctaccgta cctcgcatta cccttacgct gaagagatgc tcgactgggc   3180

agatgaacat ggcatcgtgg tgattgatga aactgctgct gtcggcttta acctctcttt   3240

aggcattggt ttcgaagcgg gcaacaagcc gaaagaactg tacagcgaag aggcagtcaa   3300

cggggaaact cagcaagcgc acttacaggc gattaaagag ctgatagcgc gtgacaaaaa   3360

ccacccaagc gtggtgatgt ggagtattgc caacgaaccg gatacccgtc cgcaagtgca   3420

cgggaatatt tcgccactgg cggaagcaac gcgtaaactc gacccgacgc gtccgatcac   3480

ctgcgtcaat gtaatgttct gcgacgctca caccgatacc atcagcgatc tctttgatgt   3540

gctgtgcctg aaccgttatt acggatggta tgtccaaagc ggcgatttgg aaacggcaga   3600

gaaggtactg gaaaaagaac ttctggcctg gcaggagaaa ctgcatcagc cgattatcat   3660

caccgaatac ggcgtggata cgttagccgg gctgcactca atgtacaccg acatgtggag   3720

tgaagagtat cagtgtgcat ggctggatat gtatcaccgc gtctttgatc gcgtcagcgc   3780

cgtcgtcggt gaacaggtat ggaatttcgc cgattttgcg acctcgcaag gcatattgcg   3840

cgttggcggt aacaagaaag ggatcttcac tcgcgaccgc aaaccgaagt cggcggcttt   3900

tctgctgcaa aaacgctgga ctggcatgaa cttcggtgaa aaaccgcagc agggaggcaa   3960

acaatgataa tgagctcgtt taaactgagg gcactgaagt cgcttgatgt gctgaattgt   4020

ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat tttatcatat   4080

gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta ataactcaat   4140

gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct gtgatgtttt   4200

gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac ctgtttcttg   4260

aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc tgtgctttgt   4320

aacataacaa ttgttacggc atatatccaa cggccggcct agctagccac ggtggccaga   4380

tccactagtt ctagagcggc cgcttaattc actggccgtc gttttacaac gtcgtgactg   4440

ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg   4500

gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg   4560

cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat   4620

atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc   4680

gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg cttacagaca   4740

agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg   4800

cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca tgataataat   4860

ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt   4920

atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct   4980

tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc   5040

cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa   5100

agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg   5160

taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt   5220

tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg   5280

catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac   5340

ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc   5400

ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt ttttgcacaa   5460

catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc   5520

aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt   5580

aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga   5640

taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa   5700

atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa   5760

gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg atgaacgaaa   5820

tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt   5880

ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt   5940

gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg   6000

agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt   6060

aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca   6120

agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac   6180

tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac   6240

atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct   6300

taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg   6360

gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca   6420

gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt   6480

aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa acgcctggta   6540

tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc   6600

gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc   6660

cttttgcagg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa   6720

ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag   6780

cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg   6840

ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga   6900

gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt tacactttat   6960

gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag   7020

ctatgac                                                             7027

<210>9

<211>6818

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>9

cctgcagatc cccggggatc ctctagagtc gacctgcagt gcagcgtgac ccggtcgtgc    60

ccctctctag agataatgag cattgcatgt ctaagttata aaaaattacc acatattttt   120

tttgtcacac ttgtttgaag tgcagtttat ctatctttat acatatattt aaactttaat   180

ctacgaataa tataatctat agtactacaa taatatcagt gttttagaga atcatataaa   240

tgaacagtta gacatggtct aaaggacaat tgagtatttt gacaacagga ctctacagtt   300

ttatcttttt agtgtgcatg tgttctcctt tttttttgca aatagcttca cctatataat   360

acttcatcca ttttattagt acatccattt agggtttagg gttaatggtt tttatagact   420

aattttttta gtacatctat tttattctat tttagcctct aaattaagaa aactaaaact   480

ctattttagt ttttttattt aataatttag atataaaata gaataaaata aagtgactaa   540

aaattaaaca aatacccttt aagaaattaa aaaaactaag gaaacatttt tcttgtttcg   600

agtagataat gccagcctgt taaacqccgt cgacgagtct aacggacacc aaccagcgaa   660

ccagcagcgt cgcgtcgggc caagcgaagc agacggcacg gcatctctgt cgctgcctct   720

ggacccctct cgagagttcc gctccaccgt tggacttgct ccgctgtcgg catccagaaa   780

ttgcgtggcg gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc tcctctcacg   840

gcacggcagc tacgggggat tcctttccca ccgctccttc gctttccctt cctcgcccgc   900

cgtaataaat agacaccccc tccacaccct ctttccccaa cctcgtgttg ttcggagcgc   960

acacacacac aaccagatct cccccaaatc cacccgtcgg cacctccgct tcaaggtacg  1020

ccgctcgtcc tccccccccc cccctctcta ccttctctag atcggcgttc cggtccatgc  1080

atggttaggg cccggtagtt ctacttctgt tcatgtttgt gttagatccg tgtttgtgtt  1140

agatccgtgc tgctagcgtt cgtacacgga tgcgacctgt acgtcagaca cgttctgatt  1200

gctaacttgc cagtgtttct ctttggggaa tcctgggatg gctctagccg ttccgcagac  1260

gggatcgatt tcatgatttt ttttgtttcg ttgcataggg tttggtttgc ccttttcctt  1320

tatttcaata tatgccgtgc acttgtttgt cgggtcatct tttcatgctt ttttttgtct  1380

tggttgtgat gatgtggtct ggttgggcgg tcgttctaga tcggagtaga attctgtttc  1440

aaactacctg gtggatttat taattttgga tctgtatgtg tgtgccatac atattcatag  1500

ttacgaattg aagatgatgg atggaaatat cgatctagga taggtataca tgttgatgcg  1560

ggttttactg atgcatatac agagatgctt tttgttcgct tggttgtgat gatgtggtgt  1620

ggttgggcgg tcgttcattc gttctagatc ggagtagaat actgtttcaa actacctggt  1680

gtatttatta attttggaac tgtatgtgtg tgtcatacat cttcatagtt acgagtttaa  1740

gatggatgga aatatcgatc taggataggt atacatgttg atgtgggttt tactgatgca  1800

tatacatgat ggcatatgca gcatctattc atatgctcta accttgagta cctatctatt  1860

ataataaaca agtatgtttt ataattattt tgatcttgat atacttggat gatggcatat  1920

gcagcagcta tatgtggatt tttttagccc tgccttcata cgctatttat ttgcttggta  1980

ctgtttcttt tgtcgatgct caccctgttg tttggtgtta cttctgcagg gtacccccgg  2040

ggtcgaccat ggtgatgaga cgctacaagc tctttctcat gttctgtatg gccggcctgt  2100

gcctcatctc cttcctgcac ttcttcaaga ccctgtccta tgtcaccttc ccccgagaac  2160

tggcctccct cagccctaac ctggtgtcca gctttttctg gaacaatgcc ccggtcacgc  2220

cccaggccag ccccgagcca ggaggccctg acctgctgcg taccccactc tactcccact   2280

cgcccctgct gcagccgctg ccgcccagca aggcggccga ggagctccac cgggtggact   2340

tggtgctgcc cgaggacacc accgagtatt tcgtgcgcac caaggccggc ggcgtctgct   2400

tcaaacccgg caccaagatg ctggagaggc cccccccggg acggccggag gagaagcctg   2460

agggggccaa cggctcctcg gcccggcggc caccccggta cctcctgagc gcccgggagc   2520

gcacgggggg ccgaggcgcc cggcgcaagt gggtggagtg cgtgtgcctg cccggctggc   2580

acggacccag ctgcggcgtg cccactgtgg tgcagtactc caacctgccc accaaggagc   2640

ggctggtgcc cagggaggtg ccgcgccgcg tcatcaacgc catcaacgtc aaccacgagt   2700

tcgacctgct ggacgtgcgc ttccacgagc tgggcgacgt ggtggacgcc tttgtggtgt   2760

gcgagtccaa cttcacggct tatggggagc cgcggccgct caagttccgg gagatgctga   2820

ccaatggcac cttcgagtac atccgccaca aggtgctcta tgtcttcctg gaccacttcc   2880

cgcccggcgg ccggcaggac ggctggatcg ccgacgacta cctgcgcacc ttcctcaccc   2940

aggacggcgt ctcgcggctg cgcaacctgc ggcccgacga cgtcttcatc attgacgatg   3000

cggacgagat cccggcccgt gacggcgtcc ttttcctcaa gctctacgat ggctggaccg   3060

agcccttcgc cttccacatg cgcaagtcgc tctacggctt cttctggaag cagccgggca   3120

ccctggaggt ggtgtcaggc tgcacggtgg acatgctgca ggcagtgtat gggctggacg   3180

gcatccgcct gcgccgccgc cagtactaca ccatgcccaa cttcagacag tatgagaacc   3240

gcaccggcca catcctggtg cagtggtcgc tgggcagccc cctgcacttc gccggctggc   3300

actgctcctg gtgcttcacg cccgagggca tctacttcaa gctcgtgtcc gcccagaatg   3360

gcgacttccc acgctggggt gactacgagg acaagcggga cctgaactac atccgcggcc   3420

tgatccgcac cgggggctgg ttcgacggca cgcagcagga gtacccgcct gcagacccca   3480

gcgagcacat gtatgcgccc aagtacctgc tgaagaacta cgaccggttc cactacctgc   3540

tggacaaccc ctaccaggag cccaggagca cggcggcggg cgggtggcgc cacaggggtc   3600

ccgagggaag gccgcccgcc cggggcaaac tggacgaggc ggaagtcgaa caaaaactca   3660

tctcagaaga ggatctgaat taggatccta ggtttaaact gagggcactg aagtcgcttg   3720

atgtgctgaa ttgtttgtga tgttggtggc gtattttgtt taaataagta agcatggctg   3780

tgattttatc atatgatcga tctttggggt tttatttaac acattgtaaa atgtgtatct   3840

attaataact caatgtataa gatgtgttca ttcttcggtt gccatagatc tgcttatttg   3900

acctgtgatg ttttgactcc aaaaaccaaa atcacaactc aataaactca tggaatatgt   3960

ccacctgttt cttgaagagt tcatctacca ttccagttgg catttatcag tgttgcagcg   4020

gcgctgtgct ttgtaacata acaattgttc acggcatata tccacggccg gcctagctag   4080

ccacggtggc cagatccact agttctagag cggccgctta attcactggc cgtcgtttta   4140

caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc   4200

cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg   4260

cgcagcctga atggcgaatg gcgcctgatg cggtattttc tccttacgca tctgtgcggt   4320

atttcacacc gcatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc   4380

cagccccgac acccgccaac acccgctgac gcgccctgac gggcttgtct gctcccggca   4440

tccgcttaca gacaagctgt gaccgtctcc gggagctgca tgtgtcagag gttttcaccg   4500

tcatcaccga aacgcgcgag acgaaagggc ctcgtgatac gcctattttt ataggttaat   4560

gtcatgataa taatggtttc ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga   4620

acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa   4680

ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt   4740

gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg   4800

ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg   4860

gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg   4920

agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag   4980

caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca   5040

gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg   5100

agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc   5160

gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg   5220

aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg   5280

ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac   5340

tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg   5400

tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg   5460

gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact   5520

atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa   5580

ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt   5640

aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag   5700

ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct   5760

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt   5820

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg   5880

cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct   5940

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc   6000

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg   6060

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa   6120

ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg   6180

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg   6240

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga   6300

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt   6360

ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct   6420

gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga   6480

acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg   6540

cctctccccg cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg   6600

aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag   6660

gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt   6720

cacacaggaa acagctatga ccatgattac gccaagctag cggccgcatt cccgggaagc   6780

taggccaccg tggcccgcct gcaggggaag cttgcatg                           6818

<210>10

<211>7545

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>10

cgattaaaaa tctcaattat atttggtcta atttagtttg gtattgagta aaacaaattc    60

gaaccaaacc aaaatataaa tatatagttt ttatatatat gcctttaaga ctttttatag   120

aattttcttt aaaaaatatc tagaaatatt tgcgactctt ctggcatgta atatttcgtt   180

aaatatgaag tgctccattt ttattaactt taaataattg gttgtacgat cactttctta   240

tcaagtgtta ctaaaatgcg tcaatctctt tgttcttcca tattcatatg tcaaaaccta   300

tcaaaattct tatatatctt tttcgaattt gaagtgaaat ttcgataatt taaaattaaa   360

tagaacatat cattatttag gtatcatatt gatttttata cttaattact aaatttggtt   420

aactttgaaa gtgtacatca acgaaaaatt agtcaaacga ctaaaataaa taaatatcat   480

gtgttattaa gaaaattctc ctataagaat attttaatag atcatatgtt tgtaaaaaaa   540

attaattttt actaacacat atatttactt atcaaaaatt tgacaaagta agattaaaat   600

aatattcatc taacaaaaaa aaaaccagaa aatgctgaaa acccggcaaa accgaaccaa   660

tccaaaccga tatagttggt ttggtttgat tttgatataa accgaaccaa ctcggtccat   720

ttgcacccct aatcataata gctttaatat ttcaagatat tattaagtta acgttgtcaa   780

tatcctggaa attttgcaaa atgaatcaag cctatatggc tgtaatatga atttaaaagc   840

agctcgatgt ggtggtaata tgtaatttac ttgattctaa aaaaatatcc caagtattaa   900

taatttctgc taggaagaag gttagctacg atttacagca aagccagaat acaatgaacc   960

ataaagtgat tgaagctcga aatatacgaa ggaacaaata tttttaaaaa aatacgcaat  1020

gacttggaac aaaagaaagt gatatatttt ttgttcttaa acaagcatcc cctctaaaga  1080

atggcagttt tcctttgcat gtaactatta tgctcccttc gttacaaaaa ttttggacta  1140

ctattgggaa cttcttctga aaatagtggc caccgcttaa ttaaggcgcg ccatgcccgg  1200

gcaagcggcc gcttaattaa atttaaatgt ttaaactagg aaatccaagc ttgggctgca  1260

ggtcaatccc attgcttttg aagcagctca acattgatct ctttctcgag gtcattcata  1320

tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa ggtaagatta cctggtcaaa  1380

agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat cggtaataaa aggtggccca  1440

aagtgaaatt tactcttttc tactattata aaaattgagg atgtttttgt cggtactttg  1500

atacgtcatt tttgtatgaa ttggttttta agtttattcg cttttggaaa tgcatatctg  1560

tatttgagtc gggttttaag ttcgtttgct tttgtaaata cagagggatt tgtataagaa  1620

atatctttaa aaaaacccat atgctaattt gacataattt ttgagaaaaa tatatattca  1680

ggcgaattct cacaatgaac aataataaga ttaaaatagc tttcccccgt tgcagcgcat  1740

gggtattttt tctagtaaaa ataaaagata aacttagact caaaacattt acaaaaacaa  1800

cccctaaagt tcctaaagcc caaagtgcta tccacgatcc atagcaagcc cagcccaacc  1860

caacccaacc caacccaccc cagtccagcc aactggacaa tagtctccac acccccccac  1920

tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag ccaaaaaaaa aaaaagaaag  1980

aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc gtgggggccg gaaacgcgag  2040

gaggatcgcg agccagcgac gaggccggcc ctccctccgc ttccaaagaa acgcccccca  2100

tcgccactat atacataccc ccccctctcc tcccatcccc ccaaccctac caccaccacc  2160

accaccacct ccacctcctc ccccctcgct gccggacgac gcctcccccc tccccctccg  2220

ccgccgccgc gccggtaacc accccgcccc tctcctcttt ctttctccgt tttttttttc  2280

cgtctcggtc tcgatctttg gccttggtag tttgggtggg cgagaggcgg cttcgtgcgc  2340

gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg gggctctcgc cggcgtggat  2400

ccggcccgga tctcgcgggg aatggggctc tcggatgtag atctgcgatc cgccgttgtt  2460

gggggagatg atggggggtt taaaatttcc gccatgctaa acaagatcag gaagagggga  2520

aaagggcact atggtttata tttttatata tttctgctgc ttcgtcaggc ttagatgtgc  2580

tagatctttc tttcttcttt ttgtgggtag aatttgaatc cctcagcatt gttcatcggt  2640

agtttttctt ttcatgattt gtgacaaatg cagcctcgtg cggagctttt ttgtaggtag  2700

accatggctt ctccggagag gagaccagtt gagattaggc cagctacagc agctgatatg  2760

gccgcggttt gtgatatcgt taaccattac attgagacgt ctacagtgaa ctttaggaca  2820

gagccacaaa caccacaaga gtggattgat gatctagaga ggttgcaaga tagataccct  2880

tggttggttg ctgaggttga gggtgttgtg gctggtattg cttacgctgg gccctggaag  2940

gctaggaacg cttacgattg gacagttgag agtactgttt acgtgtcaca taggcatcaa  3000

aggttgggcc taggatccac attgtacaca catttgctta agtctatgga ggcgcaaggt  3060

tttaagtctg tggttgctgt tataggcctt ccaaacgatc catctgttag gttgcatgag  3120

gctttgggat acacagcccg gggtacattg cgcgcagctg gatacaagca tggtggatgg  3180

catgatgttg gtttttggca aagggatttt gagttgccag ctcctccaag gccagttagg  3240

ccagttaccc agatctgagg taccctgagc tcggtcgcag cgtgtgcgtg tccgtcgtac   3300

gttctggccg gccgggcctt gggcgcgcga tcagaagcgt tgcgttggcg tgtgtgtgct   3360

tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg atcgcgtggt caaggcccgt   3420

gtgctttaaa gacccaccgg cactggcagt gagtgttgct gcttgtgtag gctttggtac   3480

gtatgggctt tatttgcttc tggatgttgt gtactacttg ggtttgttga attattatga   3540

gcagttgcgt attgtaattc agctgggcta cctggacatt gttatgtatt aataaatgct   3600

ttgctttctt ctaaagatct ttaagtgctg aattcatatt tcctcctgca gggtttaaac   3660

ttgccgtggc ctattttcag aagaagttcc caatagtagt ccaaaatttt tgtaacgaag   3720

ggagcataat agttacatgc aaaggaaaac tgccattctt tagaggggat gcttgtttaa   3780

gaacaaaaaa tatatcactt tcttttgttc caagtcattg cgtatttttt taaaaatatt   3840

tgttccttcg tatatttcga gcttcaatca ctttatggtt ctttgtattc tggctttgct   3900

gtaaatcgta gctaaccttc ttcctagcag aaattattaa tacttgggat atttttttag   3960

aatcaagtaa attacatatt accaccacat cgagctgctt ttaaattcat attacagcca   4020

tataggcttg attcattttg caaaatttcc aggatattga caacgttaac ttaataatat   4080

cttgaaatat taaagctatt atgattaggg gtgcaaatgg accgagttgg ttcggtttat   4140

atcaaaatca aaccaaacca actatatcgg tttggattgg ttcggttttg ccgggttttc   4200

agcattttct ggtttttttt ttgttagatg aatattattt taatcttact ttgtcaaatt   4260

tttgataagt aaatatatgt gttagtaaaa attaattttt tttacaaaca tatgatctat   4320

taaaatattc ttataggaga attttcttaa taacacatga tatttattta ttttagtcgt   4380

ttgactaatt tttcgttgat gtacactttc aaagttaacc aaatttagta attaagtata   4440

aaaatcaata tgatacctaa ataatgatat gttctattta attttaaatt atcgaaattt   4500

cacttcaaat tcgaaaaaga tatataagaa ttttgataga ttttgacata tgaatatgga   4560

agaacaaaga gattgacgca ttttagtaac acttgataag aaagtgatcg tacaaccaat   4620

tatttaaagt taataaaaat ggagcacttc atatttaacg aaatattaca tgccagaaga   4680

gtcgcaaata tttctagata ttttttaaag aaaattctat aaaaagtctt aaaggcatat   4740

atataaaaac tatatattta tattttggtt tggttcgaat ttgttttact caataccaaa   4800

ctaaattaga ccaaatataa ttgggatttt taatcgcggc ccactagtca ccggtgtagc   4860

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca   4920

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa   4980

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag   5040

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc   5100

gctgcgcacg ctgcgcacgc tgcgcacgct tcctcgctca ctgactcgct gcgctcggtc   5160

gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa   5220

tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt   5280

aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa   5340

aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt   5400

ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg   5460

tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc   5520

agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc   5580

gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta   5640

tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct   5700

acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc   5760

tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa   5820

caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa   5880

aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa   5940

aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt   6000

ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac   6060

agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc   6120

atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc   6180

cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata   6240

aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc   6300

cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc   6360

aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca   6420

ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa   6480

gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca   6540

ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt   6600

tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt   6660

tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg   6720

ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga   6780

tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc   6840

agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg   6900

acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag   6960

ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg   7020

gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg   7080

acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat   7140

gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg   7200

gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc   7260

tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat gcggtgtgaa   7320

ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc attcaggctg   7380

cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa   7440

gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt   7500

tgtaaaacga cggccagtga attacaccgg tgtgatcatg ggccg                    7545

<210>11

<211>11643

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>11

cgattaaaaa cccaattata tttggtctaa tttagtttgg tattgagtaa aacaaattcg      60

aaccaaacca aaatataaat atatagtttt tatatatatg cctttaagac tttttataga     120

attttcttta aaaaatatct agaaatattt gcgactcttc tggcatgtaa tatttcgtta     180

aatatgaagt gctccatttt tattaacttt aaataattgg ttgtacgatc actttcttat     240

caagtgttac taaaatgcgt caatctcttt gttcttccat attcatatgt caaaatctat     300

caaaattctt atatatcttt ttcgaatttg aagtgaaatt tcgataattt aaaattaaat     360

agaacatatc attatttagg tatcatattg atttttatac ttaattacta aatttggtta     420

actttgaaag tgtacatcaa cgaaaaatta gtcaaacgac taaaataaat aaatatcatg     480

tgttattaag aaaattctcc tataagaata ttttaataga tcatatgttt gtaaaaaaaa     540

ttaattttta ctaacacata tatttactta tcaaaaattt gacaaagtaa gattaaaata     600

atattcatct aacaaaaaaa aaaccagaaa atgctgaaaa cccggcaaaa ccgaaccaat     660

ccaaaccgat atagttggtt tggtttgatt ttgatataaa ccgaaccaac tcggtccatt     720

tgcaccccta atcataatag ctttaatatt tcaagatatt attaagttaa cgttgtcaat     780

atcctggaaa ttttgcaaaa tgaatcaagc ctatatggct gtaatatgaa tttaaaagca     840

gctcgatgtg gtggtaatat gtaatttact tgattctaaa aaaatatccc aagtattaat     900

aatttctgct aggaagaagg ttagctacga tttacagcaa agccagaata caaagaacca     960

taaagtgatt gaagctcgaa atatacgaag gaacaaatat ttttaaaaaa atacgcaatg    1020

acttggaaca aaagaaagtg atatattttt tgttcttaaa caagcatccc ctctaaagaa    1080

tggcagtttt cctttgcatg taactattat gctcccttcg ttacaaaaat tttggactac    1140

tattgggaat tcttctgaaa atagtggcca ccgcttaatt aaggcgcgcc atgccccctg    1200

cagatccccg gggatcctct agagtcgacc tgcagtgcag cgtgacccgg tcgtgcccct    1260

ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg    1320

tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttaatctac    1380

gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa    1440

cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat    1500

ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt    1560

catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt    1620

tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat    1680

tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat    1740

taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta    1800

gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag    1860

cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac    1920

ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc    1980

gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac    2040

ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc gcccgccgta    2100

ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg gagcgcacac    2160

acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc    2220

tcgtcctccc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatgcatgg    2280

ttagggcccg gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat    2340

ccgtgctgct agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta    2400

acttgccagt gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga    2460

tcgatttcat gatttttttt gtttcgttgc atagggtttg gtttgccctt ttcctttatt    2520

tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc atgctttttt ttgtcttggt    2580

tgtgatgatg tggtctggtt gggcggtcgt tctagatcgg agtagaattc tgtttcaaac    2640

tacctggtgg atttattaat tttggatctg tatgtgtgtg ccatacatat tcatagttac    2700

gaattgaaga tgatggatgg aaatatcgat ctaggatagg tatacatgtt gatgcgggtt    2760

ttactgatgc atatacagag atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt    2820

gggcggtcgt tcattcgttc tagatcggag tagaatactg tttcaaacta cctggtgtat    2880

ttattaattt tggaactgta tgtgtgtgtc atacatcttc atagttacga gtttaagatg    2940

gatggaaata tcgatctagg ataggtatac atgttgatgt gggttttact gatgcatata    3000

catgatggca tatgcagcat ctattcatat gctctaacct tgagtaccta tctattataa    3060

taaacaagta tgttttataa ttattttgat cttgatatac ttggatgatg gcatatgcag    3120

cagctatatg tggatttttt tagccctgcc ttcatacgct atttatttgc ttggtactgt    3180

ttcttttgtc gatgctcacc ctgttgtttg gtgttacttc tgcagggtac ccccggggtc    3240

gaccatggtg atgagacgct acaagctctt tctcatgttc tgtatggccg gcctgtgcct    3300

catctccttc ctgcacttct tcaagaccct gtcctatgtc accttccccc gagaactggc    3360

ctccctcagc cctaacctgg tgtccagctt tttctggaac aatgccccgg tcacgcccca    3420

ggccagcccc gagccaggag gccctgacct gctgcgtacc ccactctact cccactcgcc    3480

cctgctgcag ccgctgccgc ccagcaaggc ggccgaggag ctccaccggg tggacttggt    3540

gctgcccgag gacaccaccg agtatttcgt gcgcaccaag gccggcggcg tctgcttcaa   3600

acccggcacc aagatgctgg agaggccccc cccgggacgg ccggaggaga agcctgaggg   3660

ggccaacggc tcctcggccc ggcggccacc ccggtacctc ctgagcgccc gggagcgcac   3720

ggggggccga ggcgcccggc gcaagtgggt ggagtgcgtg tgcctgcccg gctggcacgg   3780

acccagctgc ggcgtgccca ctgtggtgca gtactccaac ctgcccacca aggagcggct   3840

ggtgcccagg gaggtgccgc gccgcgtcat caacgccatc aacgtcaacc acgagttcga   3900

cctgctggac gtgcgcttcc acgagctggg cgacgtggtg gacgcctttg tggtgtgcga   3960

gtccaacttc acggcttatg gggagccgcg gccgctcaag ttccgggaga tgctgaccaa   4020

tggcaccttc gagtacatcc gccacaaggt gctctatgtc ttcctggacc acttcccgcc   4080

cggcggccgg caggacggct ggatcgccga cgactacctg cgcaccttcc tcacccagga   4140

cggcgtctcg cggctgcgca acctgcggcc cgacgacgtc ttcatcattg acgatgcgga   4200

cgagatcccg gcccgtgacg gcgtcctttt cctcaagctc tacgatggct ggaccgagcc   4260

cttcgccttc cacatgcgca agtcgctcta cggcttcttc tggaagcagc cgggcaccct   4320

ggaggtggtg tcaggctgca cggtggacat gctgcaggca gtgtatgggc tggacggcat   4380

ccgcctgcgc cgccgccagt actacaccat gcccaacttc agacagtatg agaaccgcac   4440

cggccacatc ctggtgcagt ggtcgctggg cagccccctg cacttcgccg gctggcactg   4500

ctcctggtgc ttcacgcccg agggcatcta cttcaagctc gtgtccgccc agaatggcga   4560

cttcccacgc tggggtgact acgaggacaa gcgggacctg aactacatcc gcggcctgat   4620

ccgcaccggg ggctggttcg acggcacgca gcaggagtac ccgcctgcag accccagcga   4680

gcacatgtat gcgcccaagt acctgctgaa gaactacgac cggttccact acctgctgga   4740

caacccctac caggagccca ggagcacggc ggcgggcggg tggcgccaca ggggtcccga   4800

gggaaggccg cccgcccggg gcaaactgga cgaggcggaa gtcgaacaaa aactcatctc   4860

agaagaggat ctgaattagg atcctaggtt taaactgagg gcactgaagt cgcttgatgt   4920

gctgaattgt ttgtgatgtt ggtggcgtat tttgtttaaa taagtaagca tggctgtgat   4980

tttatcatat gatcgatctt tggggtttta tttaacacat tgtaaaatgt gtatctatta   5040

ataactcaat gtataagatg tgttcattct tcggttgcca tagatctgct tatttgacct   5100

gtgatgtttt gactccaaaa accaaaatca caactcaata aactcatgga atatgtccac   5160

ctgtttcttg aagagttcat ctaccattcc agttggcatt tatcagtgtt gcagcggcgc   5220

tgtgctttgt aacataacaa ttgttcacgg catatatcca cggccggcct agctagccac   5280

ggtggccaga tccactaggg gcaagcggcc gcttaattaa atttaaatgt ttaaactagg   5340

aaatccaagc ttgggctgca ggtcaatccc attgcttttg aagcagctca acattgatct   5400

ctttctcgag gtcattcata tgcttgagaa gagagtcggg atagtccaaa ataaaacaaa   5460

ggtaagatta cctggtcaaa agtgaaaaca tcagttaaaa ggtggtataa agtaaaatat   5520

cggtaataaa aggtggccca aagtgaaatt tactcttttc tactattata aaaattgagg   5580

atgtttttgt cggtactttg atacgtcatt tttgtatgaa ttggttttta agtttattcg   5640

cttttggaaa tgcatatctg tatttgagtc gggttttaag ttcgtttgct tttgtaaata   5700

cagagggatt tgtataagaa atatctttaa aaaaacccat atgctaattt gacataattt   5760

ttgagaaaaa tatatattca ggcgaattct cacaatgaac aataataaga ttaaaatagc   5820

tttcccccgt tgcagcgcat gggtattttt tctagtaaaa ataaaagata aacttagact   5880

caaaacattt acaaaaacaa cccctaaagt tcctaaagcc caaagtgcta tccacgatcc   5940

atagcaagcc cagcccaacc caacccaacc caacccaccc cagtccagcc aactggacaa   6000

tagtctccac acccccccac tatcaccgtg agttgtccgc acgcaccgca cgtctcgcag   6060

ccaaaaaaaa aaaaagaaag aaaaaaaaga aaaagaaaaa acagcaggtg ggtccgggtc   6120

gtgggggccg gaaacgcgag gaggatcgcg agccagcgac gaggccggcc ctccctccgc   6180

ttccaaagaa acgcccccca tcgccactat atacataccc ccccctctcc tcccatcccc   6240

ccaaccctac caccaccacc accaccacct ccacctcctc ccccctcgct gccggacgac   6300

gcctcccccc tccccctccg ccgccgccgc gccggtaacc accccgcccc tctcctcttt   6360

ctttctccgt tttttttttc cgtctcggtc tcgatctttg gccttggtag tttgggtggg   6420

cgagaggcgg cttcgtgcgc gcccagatcg gtgcgcggga ggggcgggat ctcgcggctg   6480

gggctctcgc cggcgtggat ccggcccgga tctcgcgggg aatggggctc tcggatgtag   6540

atctgcgatc cgccgttgtt gggggagatg atggggggtt taaaatttcc gccatgctaa   6600

acaagatcag gaagagggga aaagggcact atggtttata tttttatata tttctgctgc   6660

ttcgtcaggc ttagatgtgc tagatctttc tttcttcttt ttgtgggtag aatttgaatc   6720

cctcagcatt gttcatcggt agtttttctt ttcatgattt gtgacaaatg cagcctcgtg   6780

cggagctttt ttgtaggtag accatggctt ctccggagag gagaccagtt gagattaggc   6840

cagctacagc agctgatatg gccgcggttt gtgatatcgt taaccattac attgagacgt   6900

ctacagtgaa ctttaggaca gagccacaaa caccacaaga gtggattgat gatctagaga   6960

ggttgcaaga tagataccct tggttggttg ctgaggttga gggtgttgtg gctggtattg   7020

cttacgctgg gccctggaag gctaggaacg cttacgattg gacagttgag agtactgttt   7080

acgtgtcaca taggcatcaa aggttgggcc taggatccac attgtacaca catttgctta   7140

agtctatgga ggcgcaaggt tttaagtctg tggttgctgt tataggcctt ccaaacgatc   7200

catctgttag gttgcatgag gctttgggat acacagcccg gggtacattg cgcgcagctg   7260

gatacaagca tggtggatgg catgatgttg gtttttggca aagggatttt gagttgccag   7320

ctcctccaag gccagttagg ccagttaccc agatctgagg taccctgagc tcggtcgcag   7380

cgtgtgcgtg tccgtcgtac gttctggccg gccgggcctt gggcgcgcga tcagaagcgt   7440

tgcgttggcg tgtgtgtgct tctggtttgc tttaatttta ccaagtttgt ttcaaggtgg   7500

atcgcgtggt caaggcccgt gtgctttaaa gacccaccgg cactggcagt gagtgttgct   7560

gcttgtgtag gctttggtac gtatgggctt tatttgcttc tggatgttgt gtactacttg   7620

ggtttgttga attattatga gcagttgcgt attgtaattc agctgggcta cctggacatt   7680

gttatgtatt aataaatgct ttgctttctt ctaaagatct ttaagtgctg aattcatatt   7740

tcctcctgca gggtttaaac ttgccgtggc ctattttcag ccgaattccc aatagtagtc   7800

caaaattttt gtaacgaagg gagcataata gttacatgca aaggaaaact gccattcttt   7860

agaggggatg cttgtttaag aacaaaaaat atatcacttt cttttgttcc aagtcattgc   7920

gtattttttt aaaaatattt gttccttcgt atatttcgag cttcaatcac tttatggttc   7980

tttgtattct ggctttgctg taaatcgtag ctaaccttct tcctagcaga aattattaat   8040

acttgggata tttttttaga atcaagtaaa ttacatatta ccaccacatc gagctgcttt   8100

taaattcata ttacagccat ataggcttga ttcattttgc aaaatttcca ggatattgac   8160

aacgttaact taataatatc ttgaaatatt aaagctatta tgattagggg tgcaaatgga   8220

ccgagttggt tcggtttata tcaaaatcaa accaaaccaa ctatatcggt ttggattggt   8280

tcggttttgc cgggttttca gcattttctg gttttttttt tgttagatga atattatttt   8340

aatcttactt tgtcaaattt ttgataagta aatatatgtg ttagtaaaaa ttaatttttt   8400

ttacaaacat atgatctatt aaaatattct tataggagaa ttttcttaat aacacatgat   8460

atttatttat tttagtcgtt tgactaattt ttcgttgatg tacactttca aagttaacca   8520

aatttagtaa ttaagtataa aaatcaatat gatacctaaa taatgatatg ttctatttaa   8580

ttttaaatta tcgaaatttc acttcaaatt cgaaaaagat atataagaat tttgatagat   8640

tttgacatat gaatatggaa gaacaaagag attgacgcat tttagtaaca cttgataaga   8700

aagtgatcgt acaaccaatt atttaaagtt aataaaaatg gagcacttca tatttaacga   8760

aatattacat gccagaagag tcgcaaatat ttctagatat tttttaaaga aaattctata   8820

aaaagtctta aaggcatata tataaaaact atatatttat attttggttt ggttcgaatt   8880

tgttttactc aataccaaac taaattagac caaatataat tgggttttta atcgcggccc   8940

actagtcacc ggtgtagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt   9000

tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt   9060

gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg   9120

ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg   9180

cgtattgggc gctcttccgc tgcgcacgct gcgcacgctg cgcacgcttc ctcgctcact   9240

gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta   9300

atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag   9360

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc   9420

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta   9480

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg   9540

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc   9600

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac   9660

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac   9720

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg   9780

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga   9840

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt   9900

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag   9960

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct  10020

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg  10080

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat  10140

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc  10200

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg  10260

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct  10320

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca  10380

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg  10440

ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg  10500

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc  10560

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag  10620

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg  10680

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag  10740

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat  10800

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg  10860

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca  10920

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca  10980

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat  11040

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag  11100

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa  11160

gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt  11220

ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc  11280

acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt  11340

gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg  11400

caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc  11460

cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta  11520

ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg  11580

ttttcccagt cacgacgttg taaaacgacg gccagtgaat tacaccggtg tgatcatggg  11640

ccg                                                                11643

<210>12

<211>115

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>12

catgattacg ccaagctagc ggccgcattc ccgggaagct aggccaccgt ggcccgcctg     60

caggggaagc ttgcatgcct gcagatcccc ggggatcctc tagagtcgac ctgca         115

<210>13

<211>19

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>13

gggtaccccc ggggtcgac                                                   19

<210>14

<211>17

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>14

taatgagctc gtttaaa                                                     17

<210>15

<211>55

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>15

cggccggcct agctagccac ggtggccaga tccactagtt ctagagcggc cgctt           55

<210>16

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>16

cctgcagatc cccggggatc ctctagagtc gacctgca                              38

<210>17

<211>19

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>17

gggtaccccc ggggtcgac                                                   19

<210>18

<211>138

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>18

tggccaccgc ttaattaagg cgcgccatgc ccgggcaagc ggccgcttaa ttaaatttaa       60

atgtttaaac taggaaatcc aagcttgggc tgcaggtcaa tcccattgct tttgaagcag      120

ctcaacattg atctcttt                                                    138

<210>19

<211>14    

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>19

ggtaccctga gctc                                                        14

<210>20

<211>41

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>20

gaattcatat ttcctcctgc agggtttaaa cttgccgtgg c                          41

<210>21

<211>21

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>21

cggcccacta gtcaccggtg t                                                21

<210>22

<211>27

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>22

gcgcacgctg cgcacgctgc gcacgct                                          27

<210>23

<211>22

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>23

acaccggtgt gatcatgggc cg                                               22

<210>24

<211>69

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>24

tggccaccgc ttaattaagg cgcgccatgc cccctgcagatccccgggga tcctctagag    60

tcgacctgc                                                           69

<210>25

<211>144

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>25

cggccggcct agctagccac ggtggccaga tccactaggg gcaagcggcc gcttaattaa   60

atttaaatgt ttaaactagg aaatccaagc ttgggctgca ggtcaatccc attgcttttg  120

aagcagctca acattgatct cttt                                         144

<210>26

<211>14

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>26

ggtaccctga gctc                                                    14

<210>27

<211>41

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>27

gaattcatat  ttcctcctgc agggtttaaa cttgccgtgg c                     41

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号