首页> 中国专利> 新的基于蜕皮激素受体的可诱导的基因表达系统

新的基于蜕皮激素受体的可诱导的基因表达系统

摘要

本发明涉及生物技术或遗传工程领域。具体地,本发明涉及基因表达领域。更具体的,本发明涉及新的基于蜕皮激素受体的可诱导的基因表达系统和在宿主细胞中调控基因表达的方法,应用于如基因治疗、大规模生产蛋白及抗体,基于细胞的高效筛选化验、功能性基因组学和调控转基因动植物特性等方面。

著录项

  • 公开/公告号CN1422334A

    专利类型发明专利

  • 公开/公告日2003-06-04

    原文格式PDF

  • 申请/专利权人 罗姆和哈斯公司;

    申请/专利号CN01807844.3

  • 申请日2001-03-21

  • 分类号C12N15/63;C12N15/85;C12N15/12;C12N15/62;C07K14/705;C07K14/72;A01H5/00;C12Q1/68;G01N33/68;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人唐伟杰

  • 地址 美国宾夕法尼亚

  • 入库时间 2023-12-17 14:44:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2007-09-26

    专利申请权、专利权的转移专利权的转移 变更前: 变更后: 登记生效日:20070824 申请日:20010321

    专利申请权、专利权的转移专利权的转移

  • 2007-03-14

    授权

    授权

  • 2003-08-20

    实质审查的生效

    实质审查的生效

  • 2003-06-04

    公开

    公开

说明书

本申请要求同时待审的2000年3月22日申请的序列号60/191355的美国临时申请和同时待审的2001年2月20日申请的序列号为60/269799的美国临时申请的优先权。

发明领域

本发明涉及生物技术或遗传工程领域。具体的,本发明涉及基因表达领域。更具体的,本发明涉及新的基于蜕皮激素受体的可诱导的基因表达系统和运用这个可诱导的基因表达系统在宿主细胞中调控基因表达的方法。

发明背景

在遗传工程领域,准确控制基因表达是研究、操作和控制发育及其他生理过程的很有价值的工具。基因表达是复杂的生物学过程,包括许多特异性的蛋白-蛋白相互作用。为引发基因表达,即产生必要的RNA作为蛋白合成的第一步,必须将转录激活因子带到控制基因转录的启动子附近。典型的,转录因子自身去联合带有至少一个DNA结合结构域的蛋白,该DNA结合结构域同基因启动子区域的DNA结合位点结合。这样,为使基因表达发生,必须将带有DNA结合结构域和反式激活结构域的蛋白带到基因启动子区域的正确的位置上,该反式激活结构域位于与DNA结合结构域适当距离的地方。

传统的转基因方法利用对细胞类型特异的启动子驱动所设计的转基因的表达。将含转基因的DNA构建物整合到宿主基因组中。当由转录激活因子引发时,转基因就在给定的细胞类型中发生表达。

调节外源基因在细胞中表达的另一种方法是通过可诱导的启动子。这种可诱导的启动子的应用事例包括:PR1-a启动子、原核阻遏物-操纵基因系统、免疫抑止-免疫亲和蛋白系统、和高等真核转录激活系统,如甾类激素受体系统和下文所述系统等。

西红柿的PR1-a启动子在系统遭到病源物袭击后获得抗性反应时被诱导。使用PR1-a启动子的局限是它经常对外源物质和如病源物、UV-B照射和污染物等外来因子产生反应。已有记述关于基于热休克、干扰素和重金属诱导启动子的基因调节系统(Wurn等,1986,Proc.Natl.Acad.Sci.USA 83:5414-5418;Arnheiter等,1990 Cell 62:51-61;Fimus等1992 Nucleic Acids Research 20:27550-27560)。然而,这些系统的局限在其表达非目标基因的效果。这些系统也都是不严密的。

原核阻遏物-操作基因系统利用细菌的阻遏蛋白及其所结合的独特的操作基因DNA序列。来自大肠杆菌的四环素(“Tet”)和乳糖阻遏物-操作基因的系统被用于在动植物中控制基因表达。在Tet系统,四环素结合到TetR阻遏物蛋白上,导致其构像变化而从操作基因上释放阻遏蛋白,从而允许转录发生。在乳糖系统,乳糖操作子对存在乳糖或其它合成的类似物,如异丙基-b-D-巯基半乳糖苷等反应而被激活。可惜,这类系统的应用因其配体,即四环素和乳糖的不稳定化学性质、毒性、天然存在、或在发生诱导或抑止作用时所需的较高浓度水平而受到限制。由于类似的原因,在动物中这些系统的利用受到限制。

免疫抑制分子,如FK506、纳巴霉素和环孢菌素A能结合免疫亲和蛋白FKBP12、亲环蛋白等。利用这个信息,建立通用策略:简单的通过在两种蛋白的每一种上放置FK506或其一上放FK506而另一上放环孢菌素A,而将任意两种蛋白带到一起。合成的FK506的同二聚体(FK1012)或融合的FK506-环孢菌素的复合物(FKCsA)可用于诱导这些分子的二聚化。(Spencer等,1993,Science 262:1019-24;Belshaw等,1996,Proc.Natl.Acad.Sci.USA 93:4604-7)。Gal4 DNA结合结构域融合到FKBP12而VP16激活因子结构域融合到亲环蛋白,而且FKCsA复合物用于显示异二聚化和报告基因在含有Gal4结合位点的启动子的控制下的激活。然而不幸的是,这个系统所含免疫抑制剂具有不利的副作用,因此限制了它作为多种哺乳动物基因开关(开关)的应用。

如甾类激素受体系统的高等真核转录激活系统仍在被使用。甾类激素受体属于核受体超家族,并且在脊椎动物和无脊椎动物细胞中都有发现。可惜,用激活受体的甾类化合物来调节基因表达,尤其是在动植物中,因其在这些有机体的多种其他天然生物学途径中起作用而受到限制。为克服这样的困难,开发了使用昆虫蜕皮激素受体(EcR)的另一种系统。

昆虫的生长、蜕皮和发育受蜕皮甾类激素(蜕皮的激素)和保幼激素的调节(Dhadialla,等,1998.Annu.Rev.Entomol.43:545-569)。昆虫中蜕皮激素的分子靶包括至少蜕皮激素受体(EcR)和超气孔ultraspiracle蛋白(USP)。EcR是表征为具有签名(signature)DNA、配体结合结构域及激活结构域的核受体超家族的成员(Koelle,等1991,Cell,67:59-77)。EcR受体对如松甾酮A和muristerone A的许多甾类化合物起反应。近来有报道关于具有蜕皮甾类拮抗剂活性的非甾类化合物,包括Rohm和Haas公司在世界范围出售的商品杀虫剂tebufenozide和methoxyfenozide(见国际专利申请第PCT/EP96/00686和美国专利5530028)。这两种类似物对其他有机体有很好的安全界限。

国际专利申请第PCT/US97/05330(WO97/38117)公开了调控外源基因表达的方法,其中,含有外源基因和蜕皮激素反应元件的DNA构建物被第二个含有蜕皮激素受体的DNA构建物激活,该蜕皮激素受体在存在相应的配体及随便一种能够作为沉默伙伴(silent partner)的受体时,结合蜕皮激素反应元件而诱导基因表达。所选蜕皮激素受体是从果蝇Drosophila melanogaster中分离的。典型的,这种系统需要沉默伙伴的存在,优选类视黄醇X受体(RXR),来提供最佳激活。在哺乳动物细胞,昆虫蜕皮激素受体(EcR)同类视黄醇X受体(RXR)异二聚化并以配体依赖的方式调节靶基因的表达。国际专利申请第PCT/US98/14215(WO99/02683)公布了分离自蚕蛾Bombyx mori的蜕皮激素受体在哺乳动物系统起作用而不需要外源二聚体伙伴。

美国专利第5880333公布了用于植物的果蝇Drosophilamelanogaster的EcR和超气孔蛋白(USP)异二聚体系统,其中反式激活结构域和DNA结合结构域位于两种不同的杂台蛋白上。可惜,该系统在动物细胞不能有效地诱导报告基因表达。(对比,见下面的实施例1,2)。

在以上每一种情况中,反式激活结构域和DNA结合结构域(不论国际专利申请第PCT/US98/14215中天然的EcR或是国际专利申请第PCT/US97/05330中修饰过的EcR)整合在一个单个分子中,而其他异二聚化伙伴,USP或者RXR,以其天然状态应用。

上述基于EcR的基因调控系统的缺点包括无配体时相当程度的背景活性和这些系统不能对动植物都适用(见美国专利第5880333)。对于多数依赖基因表达调控的应用,这些基于EcR的系统不能令人满意。因此,本领域需要改进的系统可以准确调控外源基因在动植物中的表达。这样改进的系统对如基因治疗、大规模生产蛋白及抗体,基于细胞的高效筛选化验、功能性基因组学和调控转基因动物的特性等应用方面有用。简单、紧凑并依赖相对便宜、容易得到的且对宿主低毒性的配体的改进的系统将对调控生物学系统有用。

这里引用了多种发表物,其公开的全部内容都作为本文参考文献。然而,这里对任何参考文献的引用不可被理解为是同意这些参考文献作为本申请的“现有技术”。

发明简述

本发明涉及新的基于蜕皮激素受体的可诱导的基因表达系统、用于该新的可诱导的基因表达系统的新的受体多核苷酸和多肽、和使用这个可诱导的基因表达系统在宿主细胞中调整基因表达的方法。具体地,申请人的发明涉及改进的基因表达调控系统,包括编码含截短突变的受体多肽的多核苷酸。

具体来说,本发明涉及一种基因表达调控系统,包括:a)能够在宿主细胞表达的第一基因表达盒(cassette),包括编码第一多肽的多核苷酸。第一多肽包括:i)DNA结合结构域,它可识别与被表达调控基因相联的反应元件;和ii)配体结合结构域,含来自核受体的配体结合结构域;和b)能够在宿主细胞表达的第二基因表达盒(cassette),包括编码第二多肽的多核苷酸序列,第二多肽包括:i)反式激活结构域;和ii)配体结合结构域,含来自超气孔受体以外核受体的配体结合结构域;其中DNA结合结构域和反式激活结构域来自非蜕皮激素受体、非维甲酸类的X受体、且非超气孔受体的一种多肽,;第一多肽与第二多肽的配体结合结构域不同且二聚化。

在一个具体的实施方案中,第一多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域。

在一个具体的实施方案中,第二多肽的配体结合结构域包括类视黄醇X受体的配体结合结构域。

在一个优选实施方案中,第一多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域而第二多肽的配体结合结构域包括类视黄醇X受体的配体结合结构域。

本发明也涉及一种基因表达调控系统。根据本发明进一步包括:c)第三基因表达盒,包括:i)同第一多肽的DNA结合结构域结合的反应元件;ii)被第二多肽的反式激活结构域激活的启动子;和iii)其表达将被调控的基因。

本发明也涉及分离的编码截短EcR或截短RXR多肽的多核苷酸,其中这种截短突变影响配体结合活性或配体敏感性。

具体的,本发明涉及分离的编码因含截短突变而减弱所述EcR和RXR多肽配体结合活性或配体敏感性的截短EcR或截短RXR多肽的多核苷酸。在一个具体实施方案中,本发明涉及分离的编码因含截短突变而减弱所述EcR和RXR多肽的甾类结合活性或甾类敏感性的截短EcR或截短RXR多肽的多核苷酸。在另一个具体的实施方案中,本发明涉及分离的编码因含截短突变而减弱所述EcR和RXR多肽的非甾类结合活性或非甾类敏感性的截短EcR或截短RXR多肽的多核苷酸。

本发明涉及分离的编码因含截短突变而增强所述EcR和RXR多肽配体结合活性或配体敏感性的截短EcR或截短RXR多肽的多核苷酸。在一个具体实施方案中,本发明涉及分离的编码因含截短突变而增强所述EcR和RXR多肽的甾类结合活性或甾类敏感性的截短EcR或截短RXR多肽的多核苷酸。在另一个具体的实施方案中,本发明涉及分离的编码因含截短突变而增强所述EcR和RXR多肽的非甾类结合活性或非甾类敏感性的截短EcR或截短RXR多肽的多核苷酸。

本发明也涉及分离的,编码含截短突变的截短RXR多肽的多核苷酸,其中截短的维甲酸类X受体多肽和与其二聚化伙伴的异二聚体对配体的敏感性被该截短突变增强。在一个具体实施方案中,其二聚化伙伴是蜕皮激素受体多肽。

根据申请人的发明,本发明也涉及分离的由多核苷酸编码的多肽。具体的,本发明涉及分离的含截短突变的截短EcR和RXR多肽,其中EcR和RXR多肽由根据本发明的多核苷酸编码。

这样,本发明也涉及分离的含截短EcR和RXR多肽其中截短突变影响该EcR和RXR多肽配体结合活性和配体敏感性的截短突变。

申请人的发明也涉及根据本发明用基因表达调控系统在宿主细胞中调控基因表达的方法。具体的,申请人的发明提供在含被调控基因的宿主细胞中调控基因表达的方法,包括步骤:a)根据本发明将基因表达调控系统引入宿主细胞;和b)向宿主细胞引入与基因表达调控系统的第一和第二多肽的配体结合结构域独立组合的配体;其中要表达的基因是一个嵌合基因的一个组成部分,嵌合基因包括:i)反应元件,含与第一多肽DNA结合结构域结合的结构域;ii)被第二多肽的反式激活结构域激活的启动子;和iii)其表达将被调控的基因。由此可以形成包括配体、第一多肽和第二多肽的复合物,且由此复合物在宿主细胞中调节基因表达。

申请人的发明也提供分离的含根据本发明可诱导的基因表达系统的宿主细胞。本发明也涉及分离的含根据本发明多核苷酸和多肽的宿主细胞。相应的,申请人的发明也涉及含根据本发明的宿主细胞的非人生物。

附图简述

图1:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-CfEcRDEF嵌合多肽的第一基因表达盒和编码VP16AD-MmRXRDEF嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.1)

图2:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-CfEcRDEF嵌合多肽的第一基因表达盒和编码VP16AD-CfUSPDEF嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.2)

图3:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-MmRXRDEF嵌合多肽的第一基因表达盒和编码VP16AD-CfEcRCDEF嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.3)

图4:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-MmRXRCDEF嵌合多肽的第一基因表达盒和编码VP16AD-DmEcRDEF嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.4)

图5:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-CfUSPDEF嵌合多肽的第一基因表达盒和编码VP16AD-CfEcRCDEF嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.5)

图6:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-CfEcRDEF-VP16AD嵌合多肽的第一基因表达盒。按实施例1所述制备(开关1.6)

图7:基于蜕皮激素受体的基因表达系统,包括编码VP16AD-CfEcRCDEF嵌合多肽的第一基因表达盒。按实施例1所述制备(开关1.7)

图8:基于蜕皮激素受体的基因表达系统,包括编码VP16AD-DmEcRCDEF嵌合多肽的第一基因表达盒和编码嵌合多肽MmRXR的第二基因表达盒。按实施例1所述制备(开关1.8)

图9:基于蜕皮激素受体的基因表达系统,包括编码嵌合多肽VP16AD-CfEcRCDEF的第一基因表达盒和编码MmRXR嵌合多肽的第二基因表达盒。按实施例1所述制备(开关1.9)

图10:基于蜕皮激素受体的基因表达系统,包括编码Gal4DBD-CfEcRCDEF嵌合多肽的基因表达盒。按实施例1所述制备(开关1.10)

图11:同VP16MmRXRDE,pFRLUc和pTKRL质粒DNA一起转染NIH3T3细胞的GAL4CfEcRA/BCDEF,GAL4CfEcRCDEFGAL4CfEcR1/2CDEF,GAL4CfEcRDEF,GAL4CfEcREF,GAL4CfEcRDE截短突变的表达数据。

图12:同VP16MmRXRE,pFRLUc和pTKRL质粒DNA一起转染3T3细胞的GAL4CfEcRA/BCDEF,GAL4CfEcRCDEF GAL4CfEcR1/2CDEF,GAL4CfEcRDEF,GAL4CfEcREF,GAL4CfEcRDE截短突变的表达数据。

图13:同GAL4CfEcRCDEF,pFRLUc和pTKRL质粒DNA一起转染NIH3T3细胞的VP16MmRXRA/BCDEF,VP16MmRXRCDEF,VP16MmRXRDEF,VP16MmRXREF,VP16MmRXRBam-EF,VP16MmRXRAF2del构建物的表达数据。

图14:同GAL4CfEcRDEF,pFRLUc和pTKRL质粒DNA一起转染NIH3T3细胞的VP16MmRXRA/BCDEF,VP16MmRXRCDEF,VP16MmRXRDEF,VP16MmRXREF,VP16MmRXRBam-EF,VP16MmRXRAF2del构建物的表达数据。

图15:同GAL4CfEcRDEF,pFRLUc和pTKRL质粒DNA一起转染NIH3T3细胞的多种截短的CfEcR和MmRXR受体对的表达数据。

发明详述

申请人开发了改进的基于蜕皮激素的可诱导的基因表达系统,包括影响配体结合活性或配体敏感性的蜕皮激素受体或类视黄醇X受体多肽的截短突变。这种突变效果是可以增加或减弱配体结合活性或配体敏感性,并且可以是甾类或非甾类特异的。因此,申请人的发明提供一种改进的基于蜕皮激素的诱导基因表达的系统,用于调控目的基因在宿主细胞中的表达。在一个特别合适的实施方案中,申请人的发明提供背景基因表达减弱而对低于微摩尔级浓度的非甾类配体反应的可诱导的基因表达系统。因此,申请人新的可诱导的基因表达系统及其在宿主细胞中调控基因表达方法的应用克服了当前其他可用的基因表达系统的局限性,并为专业人士提供了控制基因表达的有效方法。

本发明提供可用于在原核和真核宿主细胞中调控基因表达的新的可诱导的基因表达系统。申请人的发明对如基因治疗、大规模生产蛋白及抗体、基于细胞的高效筛选化验、功能基因组学和调控转基因有机体的特性等应用方面有用。定义

在此公开文件中使用了一些术语和缩略语。下面提供定义,应有助于理解本发明的范围和实施。

在具体的实施方案中,术语“大约(about)”和“近似(approximately)”是指在20%以内,优选10%以内,更优选5%以内,并更优选在某一给定值和范围的1%以内。

术语“实质上不含(substantially free)”是指含A的组成(其中A可以是分离的蛋白、DNA分子、载体、重组的宿主细胞,等等),当该组成中蛋白、DNA、载体(依A和B的所属种类而定)的重量的75%为A时,就实质上不含B(其中B包括一或多种污染的蛋白、DNA、载体等)。优选,在组成中,A至少占A+B种类重量的90%,更优选至少占重量的99%。也优选,实质上不含污染物的组成含仅仅一种分子重量类型,它具有目的种类的活性或特性。

用于本发明的术语“分离的(isolated)”是指从其最初的环境(其天然存在时的环境)中分出的生物学物质。

例如,多肽在动植物中的天然存在状态不是“分离的”。相同的多核苷酸从其天然存在的周围核酸中分离出。术语“纯化的”不要求存在的物质为绝对纯净的形式,而排除其他物质的存在。这是一个相对性的定义。

从起始物或天然材料中纯化至少一个数量级后,多核苷酸就是纯化的状态,优选2或3,且更优选4或5个数量级。

核酸是由共价联接称作核苷的亚基构成的多聚物。核酸包括多聚核糖核酸(RNA)和多聚脱氧核糖核酸(DNA),这两者都可以是单链或双链的。DNA包括但不限于cDNA,基因组DNA,质粒DNA,合成的DNA,和半合成的DNA。DNA可以是线性,环状或超螺旋。

核酸分子指核糖核苷(腺苷、鸟苷、尿苷、胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷、脱氧胞苷;“DNA分子”)的单链或双链螺旋形式的磷酯多聚形式或其磷酯类似物,如硫代磷酸酯和硫酯。双链DNA-DNA,DNA-RNA,和RNA-RNA螺旋都有可能。术语核酸分子,及具体的DNA或RNA分子,仅指分子的初级和2级结构,而不限于任何具体的3级结构。因此,这个术语包括所得的双链DNA,及其他,线性或环状DNA分子(如限制性片段)、质粒、和染色体。讨论具体的双链DNA时,序列描述依据常规,仅仅给出沿DNA的非转录链的5’到3’方向的序列。(即,其序列与mRNA同源的单链)。重组DNA是经历分子生物学操作的DNA分子。

术语“片段”是指相对所指核酸较短的核苷酸序列,并且,一般情况下,含与所指核酸相同的核苷酸序列。根据本发明这种核酸片段适合时可以是较大多核苷酸的一个组成部分。这种片段包括,或者含有根据本发明的某核酸的长度范围从至少8,10,12,15,18,20,到25,30,40,50,70,80,100,200,500,1000,或1500连续的核苷酸构成的寡聚核苷酸。

如在此所用的,“分离的核酸片段”是随便含有合成的、非天然或改变的核苷酸碱基的单链或双链RNA或DNA多聚物。分离的DNA形式的核酸片段可以包括一或多个cDNA,基因组DNA或合成的DNA的部分。

“基因”是指编码多肽的一组核苷酸,且包括cDNA和基因组DNA核酸。“基因”也指表达具体蛋白或多肽的核酸片段,包括编码序列前面的(5’非编码序列)和后面的(3’非编码序列)调节序列。“天然基因”指如自然状态中带有自己的调节序列的基因。“嵌合基因”指任何非天然基因,含有实际上不在一起的调节和/或编码序列。相应的,嵌合基因可以含有不同来源的调节和编码序列,或者同一来源但以不同于自然状态的方式安排的调节或编码序列。嵌合基因可以含不同来源的编码序列和/或不同来源的调节序列。“内源基因”指存在于有机体基因组中其自然位点的天然基因。“外源”基因或“异源”基因指不正常存在于宿主细胞中,而是通过基因转移引入到宿主细胞中的基因。外源基因可包括插入非天然有机体的天然基因,或嵌合基因。转基因指通过转化步骤引入基因组的基因。

“异源”DNA是指细胞中或细胞的染色体上不天然存在的DNA。优选,异源DNA包括细胞的外源DNA。

术语“基因组”包括染色体及线粒体、质体和病毒DNA或RNA。

当某核酸分子的单链形式在适合的温度和溶液离子强度条件下能与另一个核酸分子,如cDNA,基因组DNA或RNA,退火成双链,则这个核酸分子与另一个核酸分子“可杂交”(见Sambrook等,1989infra)。杂交和洗涤条件为人们所熟知,并有例述于Sambrook,J.,Fritsch,E.F.和Maniatis,T.的《(分子克隆:实验指南)》第二版,冷泉港实验室出版社,冷泉港(1989),具体其中第11章和表11.1(全部参考引用)。杂交的“严紧性(stringency)”决定于温度和离子强度条件。

可以调节严紧性条件来筛选适度相似的片段,如一定亲缘关系的有机体的同源序列,或高相似片段,如较近亲缘的有机体的产生相同功能酶的基因。对初步筛选同源核酸,可用低严紧性杂交条件,对应于55℃的Tm,例如,5×SSC,0.1%SDS,0.25%牛奶,且不含甲酰氨;或30%甲酰氨,5×SSC,0.5%SDS)。中等严紧性杂交条件对应于较高的Tm,例如,40%甲酰氨,和5×或6×SSC.高严紧性杂交条件对应最高的Tm,例如,50%甲酰氨,5×或6×SSC。杂交要求两种核酸含互补序列,尽管依赖杂交的严紧性,碱基间的错配仍是可能的。

术语“互补的”用于描述核苷酸碱基之间可以相互杂交的关系。例如,对于DNA,腺苷同胸苷互补而胞苷同写苷互补。相应的,本发明也包括分离的,与在此公开并使用的完整序列及其相当相似的核酸序列互补的核酸片段。

在一个具体的实施方案,术语“标准杂交条件”是指Tm为55℃,并运用上述设置条件。在一个优选的实施方案,Tm为60℃,在一个更优选的实施方案中,Tm是65℃。

杂交后洗涤也决定严紧性条件。一套优选的条件应用如下一系列洗涤:以6×SSC,0.5%SDS室温洗涤15分钟开始,接着在45℃用2×SSC,0.5%SDS,30分钟,然后50℃,0.2×SSC,0.5%SDS,洗30分钟两遍。更优选的一套条件用高温,其中除最好2遍30分钟2×SSC,0.5%SDS洗涤温度提高到60℃,其他条件同上。另一套优选高严紧性条件用65℃,0.1×SSC,0.5%SDS,作最后两次洗涤。杂交要求两种核酸含互补序列,尽管由于杂交的严紧性,碱基间的错配是可能的。

杂交核酸适合的严紧性取决于核酸的长度和互补的程度,本领域所熟知的变量。两核酸序列间相似或同源的程度越大,这些序列的核酸的杂交Tm值越高。核酸杂交的相对稳定性(对应于较高的Tm)依下述顺序降低:RNA:RNA,DNA:RNA,DNA:DNA。对大于100核苷酸序列的杂交,计算Tm的等式已经推导出来了(见Sambrook等,supra,9.50-0.51)对于较短核酸的杂交,即寡核苷酸,错配的位置更加重要,而且寡核苷酸的长度决定其特异性(见Sambrook等,supra,11.7-11.8)

在一个实施方案中,可杂交核酸的长度是至少10个核苷酸。优选的杂交核苷酸的最小长度是至少15个核苷酸;更优选至少20个核苷酸;最优选长度是至少30核苷酸。而且,专业人士将知道根据如探针长度等因素,对温度和溶液盐浓度进行必要的调整。

术语“探针”指能够与互补的单链目标核酸碱基配对形成双链分子的单链核酸分子。

如在此所用,术语“寡核苷酸”指一般至少18个核苷酸的,可以同基因组DNA分子、cDNA分子、质粒DNA、或mRNA杂交的核苷酸。寡核苷酸可以用如32P-核苷酸或共价接有标记如生物素的核苷酸标记。标记的核苷酸可用作探针来检测某种核酸的存在。寡核苷酸(其单或双都可以标记)可用作PCR引物,克隆某核酸的全长或片段,或检测某种核酸的存在。寡核苷酸也可用于同DNA分子形成3螺旋。一般来说,寡核苷酸可合成制得,优选用核酸合成仪。相应的,寡核苷酸可用非天然发生的磷酯类似键,如硫酯键等制得。

“引物”是可以同目标核酸序列杂交形成双链核酸区域,作为在适合条件下DNA合成的起始点的寡核苷酸。这种引物可用于聚合酶链式反应。

“聚合酶链反应”缩写为PCR并意为体外用酶扩增特定核酸序列的方法。PCR包括重复的温度循环系列,其中每循环包括3步:模板核酸变性分离目标分子的双链,将单链的PCR寡核苷酸引物退火到模板核酸上,和用DNA聚合酶延伸退火的引物。PCR提供检测模板分子存在与否,及在定量或半定量条件确定起始核酸池(Pool)中目标分子的相对量的方法。

“反转录-聚合酶链式反应”缩写为RT-PCR,意指体外用酶从RNA分子产生出目标cDNA之后,以上述方式从目标cDNA分子中扩增特异核酸序列的方法。TR-PCR提供检测模板分子存在与否,及在定量或半定量条件确定起始核酸池(Pool)中目标分子的相对量的方法。

DNA“编码序列”是指当处于适合的调节序列控制下时,体外或体内,在细胞中被转录并翻译为多肽的双链DNA序列。“适合的调节序列”是指位于编码序列的上游(5’非编码区)、中间,或下游(3’非编码区)的核酸序列,它可以影响相关编码序列的转录,RNA加工或稳定性,或翻译。调节序列可以包括启动子、翻译前导序列、内含子、聚腺苷酸化识别序列,RNA加工位点、效应物结合位点和茎环结构。编码区的范围由5’氨基末端的起始密码子和3’酰基末端的翻译停止密码子决定。编码区可以包括,但不限于,原核序列、来自RNA的cDNA、基因组DNA序列,甚至合成的DNA序列。如果要在真核细胞中表达编码序列,聚腺苷酸化信号和转录结束序列通常位于编码区的3’端。

“开放读码筐”缩写为ORF,并指一段核酸序列,DNA,cDNA,或RNA,包含翻译起始信号或起始密码子,如ATG,和AUG,和终止密码子,并且可以被翻译成多肽的序列。

术语“头对头”这里描述两个多核苷酸序列的相互方向。当其一的编码链的5’末端与另一的编码链的5’末端临近,而每个多核苷酸的转录从离开另一个多核苷酸的5’末端的方向进行,这两个多核苷酸的相互位置是头对头。术语“头对头”可以缩写为(5’)-to-(5’),也可以用符合表示为(←→)或(3’←5’5’→3’)。

术语“尾对尾”这里描述两个多核苷酸序列的相互方向。当其一的编码链的3’末端与另一的编码链的3’末端临近,而每个多核苷酸的转录从向着另一个多核苷酸的方向进行,这两个多核苷酸的相互位置是尾对尾。术语“尾对尾”可以缩写为(3’)-to-(3’),也可以用符合表示为(→←)或(5’→3’3’←5’)。

术语“头对尾”这里描述两个多核苷酸序列的相互方向。当其一的编码链的5’末端与另一的编码链的3’末端临近,而每个多核苷酸的转录向着与另一个多核苷酸相同的方向进行,这两个多核苷酸的相互位置是头对尾。术语“头对尾”可以缩写为(5’)-to-(3’),也可以用符合表示为(→→)或(5’→3’5’→3’)。

术语“下游”是指位于参考核酸序列3’的核苷酸序列。具体的,下游核苷酸序列一般与转录起点后面的序列有关。例如,翻译起始密码子位于转录起点的下游。

术语“上游”是指位于参考核酸序列5’的核苷酸序列。具体的,上游核苷酸序列一般与位于编码序列或转录起点5’边的序列有关。例如,大多数启动子位于转录起点的上游。

术语“限制性内切酶”和“限制性酶”是指可以结合并切割双链DNA中特定的核苷酸序列的酶。

“同源重组”指将一段外源DNA序列插入到另一个DNA分子中,如将载体插入染色体。优选,进行同源重组时载体对准特异的染色体位点。对特异的同源重组,载体同染色体序列有足够长的同源区域,来允许互补结合并将载体整合到染色体中。同源区更长,且序列相似程度更大时,同源重组的效率会增加。

对于本发明,可以使用本领域所熟知的多种方法来扩增一段多核苷酸。一旦建立合适的宿主系统和生长调节,重组的表达载体就可以大量增殖而制备得。如所述,使用的表达载体包括,但不限于以下载体及其衍生物:人或动物载体如痘苗病毒或腺病毒;昆虫病毒如杆状病毒;酵母载体;噬菌体载体(如,λ)和质粒和粘粒DNA载体,以上仅提到少数。

“载体”是任何将一段核酸克隆或转移到宿主细胞中的方式。载体可以是能接有另一个DNA片段而引起所接片段复制的复制子。复制子是,能在其自己控制下复制,具有自主DNA体内复制单位功能的遗传因子(如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括由体外、来自体内或体内将地核酸引入细胞的病毒或非病毒方式。本领域已知的大量载体可用于核酸操作,将反应元件和启动子整合到基因中等。可能的载体包括,例如质粒和改造的病毒,包括如λ衍生物的噬菌体,或质粒如PBR322或pUC质粒衍生物,或Bluescript载体。例如,将对应反应元件和启动子的DNA片段插入适合的载体可以通过将适合的DNA片段联接到所选的具有互补粘性末端的载体上来完成。也可以,经酶法修饰DNA分子末端或通过在DNA末端联接核酸序列(联接头linker)产生任何位点。这种载体可被工程操作而含有选择性标记基因,用于选择细胞基因组中整合有标记的细胞。这种标记可以鉴定和/或选择整合且表达标记编码蛋白的宿主细胞。

病毒载体,且尤其是反转录病毒载体,用于在细胞内及活体动物对象的广泛种类的基因递送应用。可用的病毒载体包括而不限于反转录病毒、腺伴随(adeno-associated)病毒、痘病毒、杆状病毒、痘苗病毒、单纯疱疹病毒、Epstein-Barr病毒、腺病毒、双粒病毒组和花椰菜花叶病毒载体。非病毒载体包括质粒、脂质体、带电脂类(细胞转染剂)、DNA-蛋白复合物和生物多聚物。除了一段核酸,载体还可以包含一个或多个调节基因,和/或用于筛选、测量和监控核酸转移结果(转移到哪个组织,表达的时间长度等)的选择性标记。

术语“质粒”指经常带有一个不属于细胞中心代谢的基因,且通常以环状双链DNA的形式存在的染色体外遗传因子。这些因子可以是自主复制序列、基因组整合序列、噬菌体或任何来源的单链或双链DNA或RNA的线性、环状、超螺旋核苷酸序列,其中一些核苷酸序列接入或整合在一个独特的构建物中,该构建物能够沿适合的3’不翻译序列为所选基因产物在细胞中引入启动子片段和DNA序列。

“克隆载体”是“复制子”,一个单位长度的连续复制且含有复制起点的一段核酸,优选DNA,如质粒、噬菌体或粘粒,可以接有其他核酸片段而使之复制。克隆载体可以在一种细胞类型中复制而在另一种中表达。(“穿梭载体”)。

可用本领域熟知的方法将载体引入合适的宿主细胞,如,转染、电穿孔、微量注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沉淀、脂转染(脂质体融合)、使用基因枪或DNA载体转运蛋白(见Wu等1992,J.Biol.Chem.267:963-967;Wu和Wu,1998,J.Biol.Chem.263:14621-14624;和Hartmut等,加拿大专利申请第2012311,频布于1990,3月15)

本发明的多核苷酸可以通过体内脂转染引入。在过去十年,脂质体体外包装和转染核酸的应用一直在增加。可用为减少脂质体介导转染所遇困难和危险而设计的人工合成阳离子脂类制备脂质体来体内转染编码标记的基因(Felgner等,1987,PNAS 84:7413;Mackey等1988.Proc.Natl.Acad.Sci.U.S.A.85:8027-8031;和Ulmer等1993 Science 259:1745-1748)。使用阳离子脂类可以利于包装带负电的核酸,并且利于同带负电的细胞膜融合(Felgner和Ringold,1989 Science 337:387-388)。国际专利公开文件WO96/17823和WO95/18863和美国专利第5459127号中记述来对转移核酸非常有效的脂类化合物及其组成。用脂转染将外源基因引入体内的特定器官具有某些实用优点。脂质体对特定细胞的分子靶是优点之一。显然在有细胞异质性的组织,如胰腺、肝、肾和脑,将转染导向某种细胞类型是非常有利的。为了准确靶向,脂类可以化学偶联其他分子(Mackey等,1988,supra)。目标蛋白,如激素或神经递质和如抗体等蛋白,或者非-肽分子都可以同脂质体化学偶联。

其他分子也可利于体内转染核酸,如阳离子寡肽(如WO95/21931)、衍生于DNA结合蛋白的肽类(如WO96/25508)、或阳离子多聚物(如WO95/21931).

也可以将裸露的DNA质粒体内引入载体(见美国专利第5693622,5589466和5580859)。还可以用受体介导的DNA递送方法(Curiel等,1992 Hum.Gene Ther.3:147-154;和Wu and Wu,1987.J.Biol.Chem.262:4429-4432)。

术语“转染”是指细胞吸收外源或异源RNA或DNA。当外源或异源RNA或DNA被引入到细胞中以后,细胞就被这样的RNA或DNA转染了。当转染的RNA或DNA导致表型变化时,细胞就被外源或异源的DNA或RNA转化了。转化的RNA或DNA可以整合(共价联接)到组成细胞基因组的染色体DNA中。

“转化”指将核酸片段转移到宿主有机体的基因组中,导致遗传上稳定的遗传特征。含有转化的核酸的宿主有机体称作“转基因”或“重组的”或“转化的”有机体。

术语“遗传区域”是指核酸分子或核苷酸序列的一段含编码多肽的基因的区域。

另外,含根据本发明的多核苷酸的重组载体可包含一或多个细胞宿主的起点,标记或选择性标记,在这些细胞突主中寻求其扩增或表达。

术语“选择性标记”意为鉴定因子,通常是抗生素或化学药品的抗性基因,可通过标记基因的效果而被选出,效果即抗生素抗性、抗除草剂抗性、可比色的标记、酶、荧光标记等,用这些效果跟踪所关注的核酸的遗传性质和/或鉴定遗传目的核酸的细胞或有机体。本领域已知并应用的选择性标志基因有:对氨卞青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、bialaphos除草剂、磺胺类药等的抗性基因;和用作表型标记的基因,如花青素调节基因、异戊烷基转移酶等。

术语“报告基因”意为编码鉴定因子的核酸序列,该因子可通过报告基因的效果而被鉴定的。其中用这些效果跟踪目的核酸的遗传性质、鉴定遗传目的核酸的细胞或有机体、和/或测量基因表达诱导或转录。本领域已知并应用的报告基因有:萤光素酶(Luc)、绿色荧光蛋白(GFP),氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡萄糖苷酶(Gus)等。选择性标记也可以作为报告基因。

“启动子”是能够控制编码序列或功能RNA表达的DNA序列。一般,编码序列位于启动子序列的3’。启动子可以完整状态来自天然基因,或者含有合成的DNA部分。本领域记述人员知道,不同的启动子可以指导某种基因在不同的组织或细胞类型,或发育的不同阶段中,或对不同环境或生理调节反应而进行表达。导致基因在大多数细胞类型多数时间内表达的启动子通常称为“组成型启动子”。导致基因在特定类型的细胞中表达的启动子一般称作“细胞特异的启动子”或“组织特异的启动子”。导致基因在发育或细胞分化的特定阶段表达的启动子称为“发育特异的启动子”或“细胞分化特异的启动子”。可被诱导且导致基因在细胞接受药物、生物学分子、化学物质、配体、光照等诱导启动子的处理后表达的启动子一般称为“可诱导启动子”或“可调控启动子”。进一步应该注意,既然在大多数情况下调控序列的确切边界并不完全确切,所以不同长度的DNA片段可以有相同的启动子活性。

“启动子序列”是可以在细胞中结合RNA聚合酶并起始转录下游(3’方向)编码序列的DNA调控区域。为定义本发明,启动子序列以转录起始点界定其3’末端,向上游延伸(5’方向)包括以高于背景水平起始转录所必须的最少碱基或元素。在启动子序列中有转录起始位点(简便定义例如,通过用核酸酶S1作图),及负责结合RNA聚合酶的蛋白结合结构域(共有序列)。

当RNA聚合酶将编码序列转录成mRNA,然后经过反式-RNA拼接(如果编码序列含内含子)并翻译成编码序列所编码的蛋白时,编码序列“受控于”细胞中的转录和翻译控制序列。

“转录和翻译控制序列”是如启动子、增强子、终止子等,供在宿主细胞中表达编码序列的DNA调控序列。在真核细胞中,多聚腺苷酸信号是控制序列。

术语“反应元件”指通过向启动子传达反应性的一个或多个顺式DNA元件,其启动子通过与第一嵌合基因的DNA结合区域相互作用而被调节。这种DNA元件可以是(完美或不完美的)回文序列或由序列基元(motif)或被可变数量的核苷酸分离的半位点构成。半位点可以相似或相同,并以同向或反向重复,或单独的半位点,或多个临近半位点顺序串联的方式排布。根据整合反应元件的细胞或有机体的性质的不同,反应元件可包含分离自不同有机体最小的启动子。第一杂交蛋白的DNA结合结构域在有或无配体时结合反应元件的DNA序列而在此反应元件控制下引发或抑制下游基因的转录。天然蜕皮激素受体反应元件DNA序列的例子有:RRGG/TTCANTGAC/ACYY(见Cherbas L.等(1991),Genes Dev.5,120-131);AGGTCAN(n)AGGTCA,其中N(n)可以是一或多个间隔核苷酸(见D’Avino PP.等(1995),Mol.Cell.Endocrinol,113,1-9);和GGGTTGAATGAATTT(见Antoniewski C.等(1994).Mol.Cell Biol.14,4465-4474)。

术语“操作性联接的(operably linked)”指在一个单个核酸片段上联接核酸序列,而使其一的功能受到另一的影响。例如,当启动子能够影响编码序列的表达时,这个启动子与编码序列就是操作性联接的(即编码序列受启动子的转录控制)。编码序列可以有义或反义方向同调控序列操作性联接。

术语“表达”,如所用,是指转录且稳定积累来自核酸或多核苷酸的有义(mRNA)或反义RNA。表达也指将mRNA翻译成蛋白或多肽。

术语“盒”、“表达盒”和“基因表达盒”指能在特定的限制性位点或通过同源重组插入到核酸或多核苷酸中的一段DNA。该DNA片段包括编码目标蛋白的多核苷酸,并且设计该盒与限制性位点,保证盒插入到适合的转录或翻译读码筐中去。“转化盒”指特定的载体,含有编码目标多肽的多核苷酸,而且除该多核苷酸外,还具有帮助转化某种宿主细胞的元件。本发明的盒、表达盒、基因表达盒和转化盒也可以包括在宿主细胞中允许增强编码目标多肽的多核苷酸的表达的元件。这些元件可以包括但不限于:启动子、最小启动子,增强子、反应元件、终止子序列、多聚腺苷酸序列等。

为本发明的目的,术语“基因开关”是指带有启动子的反应元件,和基于EcR的系统的联合。该EcR系统,在有一或多种配体存在时,调节整合有反应元件和启动子的基因表达。

术语“调节”意为诱导、减弱或抑制核酸或基因表达,分别导致诱导、减弱或抑制蛋白或多肽生产。

本发明的质粒或载体可以进一步包括至少一个适于在宿主细胞中驱动基因表达的启动子。术语“表达载体”指设计的,在转化到宿主细胞后可以表达所插入的核酸序列的载体、质粒或媒介物。克隆的基因,即插入的核酸序列,通常处于控制元件如启动子、最小启动子、增强子等的控制下。用于在宿主细胞中驱动核酸表达的起始控制区或启动子有很多,且为本领域技术人员所熟知。实际上任何能够驱动这些基因的启动子都适合本发明,包括且不限于:病毒启动子、植物启动子,细菌启动子、动物启动子、哺乳动物启动子、合成的启动子、组成型启动子、组织特异启动子的、发育特异的启动子、可诱导启动子、光调节启动子;CYC1,HIS3,GAL1,GAL4,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI,碱性磷酸酶启动子(用于在糖酵母中表达);AOX1启动子(用在毕赤氏酵母中表达);b-内酰胺酶,lac,ara,tet,trp,IPL,IPR,T7,tac和trc启动子(用于在大肠杆菌中表达);光调节的、种子特异的、花粉特异的、子房特异的、病源性或疾病相关的、花椰菜花叶病毒(cauliflower mosaic)35S、最小CMV 35S、木薯叶脉花叶病毒(CsVMV)、叶绿素a/b结合蛋白、1,5-二磷酸核酮糖羧化酶、茎尖特异的、根特异的、几丁质酶、逆境诱导的、水稻通各罗杆状病毒、植物超级启动子、马铃薯亮氨酸氨肽酶、硝酸还原酶、甘露氨酸合成酶、胭脂氨酸合成酶、泛素、玉米醇溶蛋白和花青素启动子(用于在植物细胞表达);本领域已知的动物和哺乳动物启动子包括而不限于:SV40早期(SV40e)启动子区域、含有劳氏肉瘤病毒(RSV)3’长末端重复序列的启动子、腺病毒癌基因早期(E1A)启动子或腺病毒的后期主要启动子(MLP)基因、巨细胞病毒早期启动子,单纯疱疹病毒(HSV)胸腺嘧啶激酶(TK)启动子、延长因子1α(EF1)启动子、磷酸甘油酸激酶(PGK)启动子、泛素(Ubc)启动子、清蛋白启动子、小鼠金属硫蛋白-L启动子的调节序列、和转录控制区、遍在启动子(HPRT、波形蛋白、α肌动蛋白、微管蛋白等)、中间纤维(结蛋白、神经丝、角蛋白、GFAP等)的启动子、治疗性基因(MDR,CFTR或VIII型因子等)的启动子和具有组织特异性且用于转基因动物的启动子,如在胰腺腺泡细胞中有活性的弹性蛋白I基因的控制区域;在胰腺β细胞中有活性的胰岛素基因控制区域,在淋巴细胞中有活性的免疫球蛋白基因的控制区域,在睾丸、乳房、淋巴和肥大细胞中有活性的小鼠乳腺癌病毒控制区域,清蛋白基因,在肝中有活性的Apo AI和Apo AII控制区域,在肝中有活性的α-胎儿球蛋白,在肝中有活性的α-抗胰蛋白酶基因控制区域,在骨髓细胞有活性的β球蛋白控制区域,在大脑少突神经胶质细胞中有活性的髓磷脂碱性蛋白,在骨骼肌中有活性的髓磷脂轻链-2基因控制区域和在下丘脑活性的促性腺释放激素基因控制区域,丙酮酸激酶启动子,绒毛蛋白启动子,脂肪酸结合肠蛋白启动子,平滑肌细胞α肌动蛋白启动子等。在本发明的一个优选实施方案中,启动子选自下组:花椰菜花叶病毒35S启动子、木薯叶脉花叶病毒(CsVMV)启动子、花椰菜花叶病毒35S最小启动子、延长因子1α(EF1)启动子、磷酸甘油酸激酶(PGK)启动子、泛素(Ubc)启动子和清蛋白启动子。另外,可以通过增加增强子或调节序列等修饰这些表达序列。

可用于本发明实施方案的增强子包括而不限于:西红柿花叶病毒增强子、花椰菜花叶病毒35S增强子、西红柿蚀刻病毒增强子、1,5-二磷酸核酮糖羧化酶增强子、水稻通各罗杆状病毒增强子和其他植物和病毒基因增强子等。

终止控制区域,即终止子或多聚腺苷酸序列,可以衍生自优选宿主的多种天然基因。或者并非必需终止位点,但是优选含有终止位点的情况。在本发明的一个优选实施方案中,终止控制区域可以包含或衍生自:合成序列、合成的多聚腺苷酸信号、SV40晚期多聚腺苷酸信号、SV40多聚腺苷酸信号、牛生长素(BGH)多聚腺苷酸信号、胭脂碱合成酶(nos)、花椰菜花叶病毒(CaMV)、章鱼肉碱合成酶(OCS)、Agrocateum、病毒和植物终止序列等。

术语“3’非编码序列”或“3’不翻译区(UTR)”指位于编码序列下游(3’)的DNA序列,且含有多聚腺苷酸[poly(A)]识别序列和其他编码能影响mRNA加工或基因表达的调控信号的序列。多聚腺苷酸通常表征为影响向mRNA前体的3’末端加多聚腺苷酸序列段。

“调控区域”是能够调节第二个核酸序列表达的核酸序列。调节区域可以包括天然负责表达特定核酸(同源区域)的序列或者可以包括不同起源的,负责表达不同的蛋白或甚至合成的蛋白(某种异源区域)的序列。具体地,这些序列可以是以特异或非特异的方式和可诱导或不可诱导的方式激活或抑制基因转录的原核、真核或病毒基因或衍生序列。调控区域包括复制起点、RNA拼接位点、启动子、增强子、转录终止序列和引导进入目标细胞的分泌途径的信号序列。

来自“异种来源”的调控区域是同被表达的核酸并不天然相联的调控区域。异源调控区域包括有不同种的调控区域、不同基因的调控区域、杂交的调控区域和并不天然存在而由本领域普通技术人员设计的调控序列。

“RNA转录物”指RNA聚合酶催化转录某DNA序列的产物。RNA转录物同DNA序列完全互补时,称作初级转录物,或者当它是对初级转录物的转录后加工衍生而来的RNA序列时,被称为成熟RNA。“信使RNA(mRNA)”指不含内含子且可被细胞翻译为蛋白的RNA。“cDNA”指来自mRNA并与之互补的双链DNA。“有义”RNA指包含mRNA并因此可被细胞翻译成蛋白的RNA转录物。“反义RNA”指与目标初级转录物mRNA全部或部分互补并阻止目标基因表达的RNA转录物。反义RNA的互补性可以是同特定基因的任何部分,即5’非编码序列、3’非编码序列或编码序列。“功能性RNA”指反义RNA、核酶RNA或其它尽管不被翻译,但影响细胞内过程的RNA。

“多肽”是共价联接氨基酸残基构成的多聚化合物。氨基酸具有下述一般结构:

根据侧链R将氨基酸分为7组:(1)脂肪侧链,(2)侧链含羟基(OH),(3)侧链含硫原子,(4)侧链含酸性或酰氨基团,(5)侧链含碱性基团,(6)侧链含芳香环,和(7)脯氨酸,其侧链与氨基融合的亚氨酸。本发明的多肽优选含有至少14个氨基酸。

“蛋白质”是在活细胞中具有一定结构和功能的多肽。

“分离的多肽”或“分离的蛋白”是实质上不含有那些同它在天然状态正常相关的其它化合物(如,其它蛋白或多肽、核酸、碳水化合物、脂类)的多肽或蛋白。“分离的”含义并不排除同其它化合物人工或合成的混合物,或者存在有不影响其生物学活性的杂质和可能由于不完全的纯化、加入稳定剂、或复合到药学可接受的制剂中而存在其他杂质。

本发明中多肽的“片段”应理解为其氨基酸序列比参考多肽短而其全长的氨基酸序列组成同参考多肽相同。适当情况下,这些片段可以作为较大多肽的一个部分而被包含于其中。本发明多肽的这些片段长度可以是10,15,20,30,到40,50,100,200或300个氨基酸。

多肽或蛋白的“变体(variant)”是由该多肽或蛋白衍生而来且保留至少一种该多肽或蛋白的生物学性质的任何类似物、片段、衍生物或突变体。多肽或蛋白的不同变体可以在自然界共存。这些变体可以是由编码该蛋白的结构基因的核苷酸序列的不同所表征的等位变异,或与不同的拼接或转录后修饰相关。技术人员可以生产具有单个或多个氨基酸替换、缺失、增加或取代的变体。这些变体可以包括,且不限于:(a)其中一或多个氨基酸被保守或非保守氨基酸替换的变体,(b)其中给多肽或蛋白增加一或多个氨基酸的变体,(c)其中一或多个氨基酸含有取代基的变体,和(d)该多肽或蛋白同其他多肽如血清清蛋白融合的变体。获得这些变体的技术,有遗传的(抑制、缺失、突变等)、化学的、和酶学技术,是本领域普通技术人员所已知的。变体多肽优选含有至少14个氨基酸。

“异源蛋白”指细胞中不天然产生的蛋白。

“成熟蛋白”指被翻译后加工过的多肽,即其中已经去掉了存在于初级翻译产物中的前肽(pre-or propeptide)。“前体”蛋白指mRNA的翻译初级产物,即前肽仍存在其中。前肽可以但不限于是细胞内定位信号。

术语“信号肽”指在分泌性成熟蛋白之前的氨末端多肽。信号肽从成熟肽上切下,所以成熟肽不含信号肽。信号肽具有跨细胞膜系统导向和转运分泌性蛋白的功能。信号肽也称作信号蛋白。

信号序列包含在表达于细胞表面的蛋白的编码序列的开头。该序列编码信号肽,位于成熟多肽的N-末端旁边,引导宿主细胞转运多肽。术语“转运信号序列”在此是指这类信号序列。可以发现转运信号序列同大量种类的真核或原核的天然蛋白相联,并且经常在两种有机体中都起作用。

术语“同源性”指两个多核苷酸或两个多肽部分相同的百分比。可以用领域内已知的技术确定其中一份同另一分序列的对应性。例如,可以通过排比序列信息并使用方便的计算机程序直接比较两个多肽分子的序列信息而决定其同源性。另外,还可以在同源区域能够形成稳定双螺旋的条件下杂交多核苷酸,然后用单链特异的核酸酶消化并测定消化后片段的大小,来决定其同源性。

此处所用的,术语“同源”的所有语法形式和拼写变体都指具有“共同进化起源”的蛋白之间的关系,这些蛋白包括超家族(如,免疫球蛋白超家族)和不同种的同源蛋白(如,肌球蛋白的轻链等)(Reeck等,1987,Cell 50:667)。这些蛋白(及其编码基因)具有序列同源性,如反映在其较高程度的序列相似性。

相应的,术语“序列相似性”以其所有的语法形式都指有或没有共同进化起源的蛋白的氨基酸序列或核酸序列之间的对应性和相同程度(见,Reeck等,1987,Cell 50:667)。此处所用的,术语“同源”的所有语法形式和拼写变体都指具有“共同进化起源”的蛋白之间的关系,这些蛋白包括超家族和不同种的同源蛋白(Reeck等,1987,Cell 50:667)。这些蛋白(及其编码基因)具有序列同源性,如其较高程度的序列相似性所反映的。然而,在通常应用和本申请中,术语“同源的”,当被副词如“高度地”修饰时,可以指序列相似性并不指共有进化起源。

在一个具体的实施方案中,当在DNA序列的确定长度中至少50%(优选至少75%,且更优选至少90%或95%)的核苷酸相对应时,这两个DNA序列就是“相当同源”或“相当相似”。可以通过用序列数据库中的标准软件比较序列,或者在例如为某种系统特定的严紧条件下进行Southern杂交实验来确定相当同源的序列。确定的适合杂交的条件属于本领域技术。见例如,Sambrook等,1989,supra。

如在此所用的,“相当相似”指核酸片段,其中改变一或多个核苷酸碱基导致一或多个氨基酸替换,但不影响DNA序列编码的蛋白的功能性质。“相当相似”也指核酸片段,其中改变一或多个核苷酸碱基不影响核酸片段通过反义或共抑制技术调节基因表达变化的功能。“相当相似”也指本发明中对核酸片段的修饰,如缺失或插入不会实质性影响得到的转录物的功能性质的一或多个核苷酸碱基。因此可以认为本发明不仅包含特定的范例序列。每种建议的修饰都属于本领域常规技术,只要确定其能够保留所编码蛋白的生物学活性。

而且,技术人员意识到本发明包括的相当相似的序列也以其在严紧条件下(0.1×SSC,0.1%SDS,65℃,并用2×SSC,0.1%SDS洗涤,之后用0.1×SSC,0.1%SDS洗涤)同此处所例述的序列进行杂交的能力来定义。本发明中相当相似的核酸片段是那些同这里所报道的DNA序列至少有70%相同的DNA序列。本发明优选的相当相似的核酸片段是那些同这里所报道的DNA序列至少有80%相同的DNA序列。更优选的核酸序列同这里所报道的DNA序列至少有90%相同。进一步更优选的是同这里所报道的DNA序列至少有95%相同的DNA序列。

两个氨基酸序列有大于约40%的氨基酸相同或大于60%相似(功能性相同)时,就是“相当同源”或“相当相似”。优选,使用例如GCG(Genetic Computer Group,Program Manual for the GCGPackage,Version 7,Madison,Wisconsin)堆积程序通过排比而确定相似或同源的序列。

术语“对应于”这里用于指相似或同源序列,确切位置是否同与之相比较相似性或同源性的分子相同或不同。核酸或氨基酸序列的排比可以包括空位。这样,术语“对应于”指序列相似性,而不是计数氨基酸残基或核苷酸碱基的数量。

氨基酸或核苷酸序列的“相当部分(substantial portion)”包含多肽中足够的氨基酸或基因中足够的核苷酸序列,使本领域专业人员可通过手工评价序列,或通过使用如BLAST(Basic Local AlignmentSearch Tool;Altschul,S.F.等,(1993)J.Mol.Biol.215:403-410;也可见www.ncbi.nlm.nih.gov/BLAST/)等计算机自动化的序列比对和确定方法而推断其多肽或基因。一般,必须有含10个或更多相邻氨基酸的序列或含30个或更多核苷酸的序列才能推断某多肽或核酸序列同某已知蛋白或基因同源。而且,对于核苷酸序列,含20-30相邻核苷酸的基因特异的寡聚核苷酸探针可以用于依赖序列的基因确定(如Southern杂交)和分离(如对菌落或噬菌体斑进行原位杂交)方法。而且,12-15碱基的短的寡核苷酸可作为扩增刊物用于PCR反应,而获得含有引物序列的特定的核酸片段。相应的,核苷酸序列的“相当部分”包含有足够可以特异性鉴定和/或分离含该序列的核酸片段的序列。

如本领域所知,术语“同一性百分率”,是由序列对比决定的,两种或更多多肽序列,或两种或更多的多核苷酸序列的关系。本领域内,“同一性”也指,依情况而定的多肽或多核苷酸序列间由这些序列链之间的比较而决定的序列相关性的程度。可以很容易的计算出“同一性”和“相似性”的已知方法,包括而不限于下列文献所记述的方法:Computational Molecular Biology(Lesk,A.M.,ed.)牛津大学出版社,New York(1988);Biocomputing:Informatics and GenomeProjeets(Smith,D.W.,ed)Academic Press,New York(1993);ComDuterAnalysis of Sequence Data,PartI(Griffin,A.M.,and Griffin,H.G.,eds)Humama Press,New Jersey(1994);Sequence Analysis in MolecularBiology(von Heinje,G.,ed.)Academic Press(1987);和Sequence AnalysisPrimer(Gribskov,M.and Devereux,J.eds)Stockton Press,New York(1991)。设计能够在所测试序列间得到最佳比对的优选的同一性确定方法。同一性和相似性确定方法已经被编为公开可用的计算机程序。可以使用LASERGENE生物信息计算包(computing suite)的Megalign程序(DNASTAR Inc.,Madison,WI)来完成序列排比和同一性百分比的计算。多序列排比可以用Clustal排比方法(Higgins and Sharp(1989)CABIOS.5:151-153)以默认参数(GAP PENALTY=10,GAP LENGTHPENALTY=10)来完成。用Clustal方法进行两两排比的默认参数可以选择:KTUPLE 1,GAP PENALTY=3,WINDOW=5且DIAGONALSSAVED=5。

术语“序列分析软件”指任何用于分析核苷酸或氨基酸序列的计算机算法和软件程序。“序列分析软件”可以是商品出售的或者独立开发的。典型的序列分析软件,包括而不限于GCG程序包(WisconsinPackage Version 9.0,Genetics Computer Group(GCG),Madison,WI),BLASTP,BLASTN,BLASTX(Altschul et al.,J.Mol.Biol.215:403-410(1990),和DNASTAR(DNASTAR,Inc.1228 S.Park St.Madison,WI 53715 USA)。在本申请中应该理解,使用序列分析软件进行分析时,除非另外设定,分析结果是以所用程序参考的“默认值”为基础。

“合成的基因”可以由用本领域已知步骤化学合成的寡聚核苷酸构建块(building block)组装而成。联接并退火构建块形成基因片段,再将后者以酶学方法组装成完整的基因。关于某DNA序列,“化学合成的”是指其核苷酸成分是体外联接的。可用成熟的方法步骤手工化学合成DNA,或使用多种商品形式的机器完成自动的化学合成。相应的,为得到最佳基因表达,依据优化核苷酸序列,使其反映宿主细胞密码子偏好的原则剪裁基因。专业人员喜欢通过偏向选用宿主细胞喜好的密码子而增加基因表达成功的可能性。可依据对宿主细胞序列信息已知的基因的调查而确定优选的密码子。本发明基因表达调控系统

申请人现在展示,将反式激活和DNA结合结构域放在两种不同的蛋白上而将其分开,结果导致在无配体存在时背景活性大大降低而有配体存在时活性显著高于背景。申请人改进的基因表达系统包括两个嵌合的基因表达;其一编码融合于一个核受体多肽的DNA结合结构域;其二编码融合于一个核受体多肽的反式激活结构域。第一蛋白和第二蛋白的相互作用有效地将DNA结合结构域同反式激活结构域相联系。由于DNA结合结构域和反式激活结构域位于两个不同的蛋白,在无配体存在时背景活性大大降低。

一般来说,本发明的可诱导的基因表达系统包括a)可在宿主细胞表达的第一嵌合基因,含有编码第一杂合多肽的多核苷酸,第一杂合多肽含有i)识别被表达调控基因所联反义元件的DNA结合结构域;和ii)含有核受体配体结合结构域的配体结合结构域;和b)可在宿主细胞表达的第二嵌合基因,含有编码第二杂合多肽的多核苷酸,第二杂合多肽含有i)反式激活结构域;和ii)含有核受体配体结合结构域的配体结合结构域,该核受体不是超气孔蛋白(USP);而且第一杂合多肽和第二杂合多肽的配体结合结构域是不同的并且二聚化。

这个双杂交系统开发一对相互作用的蛋白,让转录激活结构域处于相对DNA结合结构域更有利的位置,使得当DNA结合结构域同基因的DNA结合位点结合时,反式激活结构域能更有效的激活启动子(见例如,美国专利第5283173)。同国际专利申请PCT/US97/05330和PCT/US98/14215中公开的两个系统相比,这个双杂交系统是显著改进的基因表达调控系统。

本发明基于蜕皮激素受体的基因表达调控系统可以是同二聚化的或者是异二聚化的。功能性EcR复合体指含有两个甾类受体家族成员,一个来自多种昆虫的蜕皮激素受体蛋白,和一个超气孔(USP)蛋白或USP的脊椎动物同源蛋白,类视黄醇X受体(见Yao,等(1993)Nature366,476-479;Yao,等(1992)Cell 71,63-72)的异二聚体复合物。然而,复合物也可以是如下所述的同二聚体。功能性蜕皮甾类受体复合物也可以包括其他蛋白如亲免蛋白。甾类受体蛋白家族的其他成员,已知作为转录因子的(如DHR38或βFTZ-l),也可以是EcR、USP、和/或RXR的依赖配体型或不依赖配基的二聚化伙伴。而且,可能也需要其他辅因子如通常所知的辅激活蛋白(也称作连接物或传递物)。这些蛋白不同DNA序列特异地结合,也不参与基本转录。它们通过多种机制,包括活化激活物的DNA结合,通过影响染色质结构,或介导激活物一起始复合物的相互作用,而对转录激活发挥影响作用。这种辅激活蛋白的例子有RIP140,TIF1,RAP46/Bag-1,ARA70,SRC-1/NCo A-1。TIF2/GRIP/NCoA-2,ACTR/AIB1/RAC3/pCIP及混栖(promiscuous)辅激活蛋白C反义元件B结合蛋白,CBP/p300(综述可见Glass,等,Curr.Opin.Cell Biol.9:222-223,1997)。还有,可能也需要一般已知为协阻抑物(也即阻遏蛋白、沉默子或沉默中介体)的蛋白辅因子在无配体存在时有效抑制转录活化。这些协阻抑物可以同未连配体的蜕皮激素受体相互作用而沉默反应元件的活性。当前的证据表明结合配体改变受体的构像,而导致释放协阻抑物并募集上述的辅激活蛋白,由此废止其沉默作用的活性。协阻抑物的例子有N-CoR和SMRT(综述见Horwitz,等Mol.Endocrinol.10:1167-1177,1996)。这些辅因子可以是细胞或有机体内生的,或者是以可调控或不可调控形式表达转基因而外源加入的。蜕皮激素受体蛋白、USP、或RXR的同二聚体复合物也可以在某些情况下行使其功能。

蜕皮激素受体复合物典型地包括蛋白,核受体超家族的成员,其中所有成员表片为存在有氨末端反式激活结构域、DNA结合结构域(“DBD”)和通过铰链区同DBD分开的配体结合结构域(“LBD”)。如这里所用,术语“DNA结合结构域”包含DNA结合蛋白的最小肽序列,直至DNA结合蛋白的全长,只要该DNA结合结构域能发挥与特定的反义元件相联的功能。核受体超家族的成员也表征为含有4到5个结构域:A/B,C,D,E,和一些成员含有的F(见Evans,Science 2240:889-895(1988))。“A/B”结构域对应反式激活结构域,“C”对应DNA结合结构域,“D”对应铰链区,而“E”对应配体结合结构域。该家族的一些成员在LBD的酰基末端具有另一个反式结构域,对应“F”。

DBD表征为存在2个半胱氨酸锌指蛋白,其间是2个氨基酸基元(motif),P盒子和D盒子,它们传达对蜕皮激素反义元件的特异性。这些结构域可以是天然的,修饰后的,或是异源受体蛋白的不同结构域的嵌合体。EcR受体,就像甾类受体家族的亚群,也具有负责异二聚化性质的并不十分确定的区域。因为EcR,USP,和RXR的结构域本身就是模块化的,LBD,DBD,和反式激活结构域可以互换。

已知整合来自蜕皮激素受体复合物成分的基因开关系统。然而,在这些已知的系统,只要使用EcR,它就是与同一个分子的天然或改造的DNA结合结构域及反式激活结构域相联的。USP或RXR典型地用作沉默伙伴。我们现在展示,当DNA结合结构域及反式激活结构域在同一个分子时,无配体存在时的背景活性较高,而这种活性当DNA结合结构域及反式激活结构域在不同的分子中时被大大降低,也就是说,分别处于同二聚体或异二聚体复合物中的两个伙伴上面。当与甾族配体如松甾酮A(“PonA”)或muristerone(“MurA”)相比时,该双杂交系统也提供对非甾类配体,如二酰肼,改进的敏感性。也就是说,在较低浓度时,相比于甾类配基、非甾类配基提供更高的活性。另外,由于基元EcR基因开关的反式激活经常是依赖细胞系的,所以很容易改造开关系统而得到对应每种应用的最大反式激活能力。而且,该双杂交系统避免了使用未改造RXR作开关伙伴时经常发生的由RXR过表达而引起的副作用。在这个双杂交系统,去掉了EcR或RXR的天然的DNA结合和反式激活结构域。因此,这些嵌合分子就很少有机会同细胞中存在的其他甾类激素受体相互作用,结果减少副作用。

具体的,申请人的发明涉及基因表达调控系统,包含:a)能够在宿主细胞表达的第一基因表达盒(cassette),包括编码第一多肽的多核苷酸。第一多肽包括:i)DNA结合结构域,可识别与被表达调控基因相联的反应元件;和ii)配体结合结构域,含核受体上的配体结合结构域;和b)能够在宿主细胞表达的第二基因表达盒(cassette),包括编码第二多肽的多核苷酸序列。第二多肽包括:i)反式激活结构域;和ii)配体结合结构域,含核受体但不是超气孔受体上的配体结合结构域;其中DNA结合结构域和反式激活结构域来自蜕皮激素受体、维甲酸类的X受体、或超气孔受体以外的一种多肽;第一多肽与第二多肽的配体结合结构域异不同且聚化。

本发明也涉及一种基因表达调控系统根据本发明进一步包括:c)第三基因表达盒,包括:i)同第一多肽的DNA结合结构域结合的反应元件;ii)被第二多肽的反式激活结构域激活的启动子;和iii)其表达将被调控的基因。

在一个具体的实施方案中,被表达调控的基因对于宿主细胞是同源基因。在另一个具体的实施方案中,被表达调控的基因对于宿主细胞是异源基因。

在一个具体的实施方案中,第一多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域。

在另一个具体的实施方案中,第一多肽的配体结合结构域包括甲酸类X受体的配体结合结构域。

在一个具体的实施方案中,第二多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域。

在另一个具体的实施方案中,第二多肽的配体结合结构域包括类视黄醇X受体的配体结合结构域。

在一个优选实施方案中,第一多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域而第二多肽的配体结合结构域包括类视黄醇X受体的配体结合结构域。

在另一个优选实施方案中,第一多肽的配体结合结构域包括类视黄醇X受体的配体结合结构域而第二多肽的配体结合结构域包括蜕皮激素受体的配体结合结构域。

优选,配体结合结构域是EcR或RXR相关的甾类/甲状腺激素核受体家族成员配体结合结构域,或其类似物、联合物、或其修改物。更优选,LBD来自EcR或RXR。进一步更优选,LBD来自截短的EcR或RXR。可以通过本领域任何方法实现截短突变,包括而不限于限制性内切酶消化/缺失,PCR介导/寡聚核苷酸引导的缺失,化学突变,UV链断裂等。

优选,EcR是选自下列组的昆虫EcR:鳞翅目EcR、双翅目EcR、节肢动物EcR、同翅目EcR和半翅目EcR。更优选,所用EcR是云杉蚜虫Choristoneura fumiferana EcR(“CfEcR”)、Tenebrio molitor EcR(“TmEcR”)、Manduca Sexta EcR(“MsEcR”)、Heliothies virescensEcR(“HvEcR”),蚕蛾Bombyx mori EcR(“BmEcR”)、果蝇Drosophilamelanogaster EcR(“DmEcR”)、蚊子Aedes aegypti EcR(“AaEcR”)、大苍蝇Lucilia capitata EcR(“LcEcR”)、地中海果蝇Ceratitis capitataEcR(“CcEcR”)蝗虫Locusta migratoria EcR(“LmEcR”)、蚜虫Myzus persicae EcR(“MpEcR”)、招潮螃蟹Uca pugilator EcR(“UpEcR”)、或蜱Amblyomma americanum EcR(“AmaEcR”)。进一步更优选,LBD来自云杉蚜虫Choristoneura fumiferana EcR(“CfEcR”)或果蝇Drosophila melanogaster EcR(“DmEcR”)。

优选,LBD来自截短的昆虫EcR。昆虫EcR多肽截短包含有至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失。更优选,昆虫EcR多肽截短包含有至少部分多肽结构域的缺失。进一步更优选,昆虫EcR多肽截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,昆虫EcR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个优选的实施方案中,编码蜕皮激素受体配体结合结构域的多核苷酸含有选自下组的核酸序列:SEQ ID NO:1,SEQ ID NO:2,SEQ IDNO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQID NO:8,SEQ ID NO:9,和SEQ ID NO:10。

在另一个优选的实施方案中,蜕皮激素受体配体结合结构域含有选自下组的多肽序列:SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQID NO:18,SEQ ID NO:19,和SEQ ID NO:20。

优选,RXR多肽是小鼠的Mus musculus RXR(“MmRXR”)或人的Homo sapiens RXR(“HsRXR”)。RXR多肽可以是RXRα,RXRβ,RXRγ等同工型(isoform)。

优选,LBD来自截短的RXR。RXR多肽截短包含有至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失。更优选,RXR多肽截短包含有至少部分多肽结构域的缺失。进一步更优选,RXR多肽截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,RXR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个优选的实施方案中,编码类视黄醇X受体配体结合结构域的多核苷酸含有选自下组的核酸序列:SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQID NO:27,SEQ ID NO:28,SEQ ID NO:29,和SEQ ID NO:30。

在另一个优选的实施方案中,类视黄醇X受体配体结合结构域含有选自下组的多肽序列:SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQID NO:38,SEQ ID NO:39,和SEQ ID NO:40。

为本发明的目的,EcR和RXR也包括合成的和嵌合的EcR和RXR及其同源物。

DNA结合结构域可以是任何带有已知反应元件的DNA结合结构域,包括合成的和嵌合的DNA结合结构域,或其类似物、联合物,或者修改物。优选,DBD是GAL4 DBD,LexA DBD,转录因子DBD,甾类/甲状腺激素核受体超家族成员的DBD,细菌LacZ DBD,酵母putDBD。更优选,DBD是GAL4 DBD[SEQ ID NO:41(多核苷酸)或SEQ IDNO:42(多肽)],或LexA DBD[SEQ ID NO:43(多核苷酸)或SEQ IDNO:44(多肽)]。

反式激活结构域(缩写为“AD”或“TA”)可以是任何甾类/甲状腺激素核受体AD,合成或嵌合AD,聚谷氨酸AD,碱性或酸性氨基酸AD,VP16 AD,GAL4 AD,NF-κB AD,BP64 AD,或其类似物、联合物,或者修改物。优选,AD是合成或嵌合AD,或者来自VP16,GAL4,或NF-κB。更优选,AD是VP16 AD[SEQ ID NO:45(多核苷酸)或SEQ IDNO:46(多肽)]。

反应元件(“RE”)可以是任何带有已知DNA结合结构域的反应元件,或其类似物、联合物,或者修改物。优选,RE是来自GAL4、LexA,甾类/甲状腺激素核受体的RE,或者识别合成的DNA结合结构域的合成的RE。较优选,RE是包含多核苷酸序列SEQ ID NO:47的GAL4 RE或含有多核苷酸序列SEQ ID NO:48的LexA 8X操纵子。优选,第一杂合多肽实质上不含反式激活结构域而第二杂合多肽实质上不含DNA结合结构域。为本发明的目的,“实质上不含”意思是所讨论的蛋白不含有所讨论结构域的足够序列而去提供激活或结合活性。

如下文所述,本发明所用配体,当与EcR,USP,RXR的配体结合结构域或其他反过来结合在基因所连的反应元件上的多肽联合时,提供了外部暂时性的基因表达调控方法。结合机制或本发明的多种成分互相结合的顺序,即配体与受体、第一多肽与反应元件、第二多肽与启动子等,并不关键。配体结合到EcR,USP,RXR或其他蛋白的配体结合结构域,导致基因表达或抑制。该机制不排除配基结合EcR、USP、或RXR,并且导致形成活性同二聚体,(如EcR+EcR或USP+USP)的可能性优选,改变一或多个受体结构域,产生嵌合的基因开关。典型的,一或三个结构域,DBD,LBD,和反式激活结构域,选自与其他结构域不同的来源,而使得嵌合基因及结果的杂交蛋白在选定的宿主细胞或有机体中具有最优化的反式激活活性、配体互补结合、和对特定反应元件的识别能力。而且,反应元件本身可以被修饰或替换成其他DNA结合蛋白结构域的反应元件,其他蛋白如酵母的GAL-4蛋白(见Sadowski,等(1988)Nature,335:563-564)或大肠杆菌的LexA蛋白(见Brent和Ptashne(1985),Cell,43:729-736),或为了同为特定相互作用(见,例如,Kim等(1997),Proc.Natl.Acad.Sci.,USA,94:3616-3620)而设计、修饰和选择的蛋白相互作用来实现该特定目的而合成的适于嵌合受体的反应元件。嵌合系统的另一个优点是其允许根据所需最终结果选择用于驱动基因表达的启动子。这样的双重控制在基因治疗领域可能是非常重要的,尤其是当产生细胞毒性蛋白时,因为无论是表达的时间还是表达发生的细胞都可以被控制。当连接有适合的启动子的基因引入到受体细胞以后,外源基因的表达将受控于本发明系统的存在。启动子可以是组成型的,或诱导调控的,或可以是组织特异性的(即,只在特定类型的细胞中表达)或特异于有机体特定发育阶段的。本发明的基因表达盒

本发明新的基于蜕皮激素受体的可诱导的基因表达系统包括新的能在宿主细胞表达的基因表达盒,其中基因表达盒包含编码杂合多肽的多核苷酸。因此,申请人的发明也提供用于本发明基因表达系统的新的基因表达盒。

具体的,本发明提供包含编码杂合多肽的多核苷酸的基因表达盒。杂合多肽包含:或者1)识别反应元件的DNA结合结构域和核受体的配体结合结构域,或者2)反式激活结构域和核受体的配体结合结构域,其中反式激活结构域来自非EcR,非RXR,且非USP的核受体。

在一个具体的实施方案中,基因表达盒编码含有能识别反应元件的DNA结合结构域和蜕皮激素受体配体结合结构域的杂合多肽,其中DNA结合结构域来自非蜕皮激素受体的核受体。

在另一个具体的实施方案中,基因表达盒编码含有能识别反应元件的DNA结合结构域和类视黄醇X受体配体结合结构域的杂合多肽,其中DNA结合结构域来自非类视黄醇X受体的核受体。

DNA结合结构域可以是任何带有已知反应元件的DNA结合结构域,包括合成的和嵌合的DNA结合结构域,或其类似物、联合物,或者修改物。优选,DBD是GAL4 DBD,LexA DBD,转录因子DBD,甾类/甲状腺激素核受体超家族成员DBD,细菌LacZ DBD,酵母putDBD。更优选,DBD是GAL4 DBD[SEQ ID NO:41(多核苷酸)或SEQ IDNO:42(多肽)],或LexA DBD[SEQ ID NO:43(多核苷酸)或SEQ IDNO:44(多肽)]。

在另一个具体的实施方案中,基因表达盒编码含有反式激活结构域和蜕皮激素受体配体结合结构域的杂合多肽,其中反式激活结构域来自非蜕皮激素受体的核受体。

在另一个具体的实施方案中,基因表达盒编码含有反式激活结构域和类视黄醇X受体配体结合结构域的杂合多肽,其中反式激活结构域来自非类视黄醇X受体的核受体。

反式激活结构域(缩写为“AD”或“TA”)可以是任何甾类/甲状腺激素核受体AD,合成或嵌合AD,聚谷氨酸AD,碱性或酸性氨基酸AD,VP16 AD,GAL4 AD,NF-κB AD,BP64 AD,或类似物、联合物,或者修改物。优选,AD是合成或嵌合AD,或者来自VP16,GAL4,或NF-κB。更优选,AD是VP16 AD[SEQ ID NO:45(多核苷酸)或SEQ IDNO:46(多肽)]。

优选,配体结合结构域是EcR或RXR相关的甾类/甲状腺激素核受体家族成员配体结合结构域,或其类似物、联合物、或修改物。更优选,LBD来自EcR或RXR。进一步更优选,LBD来自截短的EcR或RXR。

优选,EcR是选自下列组的昆虫EcR:鳞翅目EcR、双翅目EcR、节肢动物EcR、同翅目EcR和半翅目EcR。更优选,所用EcR是云杉蚜虫Choristoneura fumiferana EcR(“CfEcR”)、Tenebrio molitor EcR(“TmEcR”)、Manduca Sexta EcR(“MsEcR”)、Heliothies virescensEcR(“HvEcR”),蚕蛾Bombyx mori EcR(“BmEcR”)、果蝇Drosophilamelanogaster EcR(“DmEcR”)、蚊子Aedes aegypti EcR(“AaEcR”)、大苍蝇Lucilia capitata EcR(“LcEcR”)、地中海果蝇Ceratitis capitataEcR(“CcEcR”)蝗虫Locusta migratoria EcR(“LmEcR”)、蚜虫Myzus persicae EcR(“MpEcR”)、招潮螃蟹Uca pugilator EcR(“UpEcR”)、或蜱Amblyomma americanum EcR(“AmaEcR”)。进一步更优选,LBD来自云杉蚜虫Choristoneura fumiferana EcR(“CfEcR”)或果蝇Drosophila melanogaster EcR(“DmEcR”)。

优选,LBD来自截短的昆虫EcR。昆虫EcR多肽截短包含有至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失。更优选,昆虫EcR多肽截短包含有至少部分多肽结构域的缺失。进一步更优选,昆虫EcR多肽截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,昆虫EcR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个优选的实施方案中,编码蜕皮激素受体配体结合结构域的多核苷酸含有选自下组的核酸序列:SEQ ID NO:1,SEQ ID NO:2,SEQ IDNO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQID NO:8,SEQ ID NO:9,和SEQ ID NO:10。

在另一个优选的实施方案中,蜕皮激素受体配体结合结构域含有选自下组的多肽序列:SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQID NO:18,SEQ ID NO:19,和SEQ ID NO:20。

优选,RXR多肽是小鼠的Mus musculus RXR(“MmRXR”)或人的Homo sapiens RXR(“HsRXR”)。RXR多肽可以是RXRα,RXRβ,RXRγ等同工型(isoform)。

优选,LBD来自截短的RXR。RXR多肽截短包含有至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失。更优选,RXR多肽截短包含有至少部分多肽结构域的缺失。进一步更优选,RXR多肽截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,RXR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个优选的实施方案中,编码类视黄醇X受体配体结合结构域的多核苷酸含有选自下组的核酸序列:SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQID NO:27,SEQ ID NO:28,SEQ ID NO:29,和SEQ ID NO:30。

在另一个优选的实施方案中,类视黄醇X受体配体结合结构域含有选自下组的多肽序列:SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQID NO:38,SEQ ID NO:39,和SEQ ID NO:40。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,由含选自GAL4 DBD(SEQ ID NO:41),或LexA DBD(SEQ ID NO:43)的核酸序列的多核苷酸编码DNA结合结构域和由含选自下组的核酸序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ IDNO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,和SEQ ID NO:10的多核苷酸编码的蜕皮激素受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,含选自GAL4 DBD(SEQ ID NO:42),或LexA DBD(SEQ ID NO:42)的多肽序列的DNA结合结构域和含选自下组的氨基酸序列:SEQ IDNO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQ ID NO:19,和SEQ ID NO:20的蜕皮激素受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,由含选自GAL4 DBD(SEQ ID NO:41),或LexA DBD(SEQ ID NO:43)的核酸序列的多核苷酸编码DNA结合结构域和由含选自下组的核酸序列:SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQID NO:29,和SEQ ID NO:30的多核苷酸编码的类视黄醇X受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,含选自GAL4 DBD(SEQ ID NO:41),或LexA DBD(SEQ ID NO:43)的多肽序列的DNA结合结构域和含选自下组的氨基酸序列:SEQ IDNO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQ ID NO:39,和SEQ ID NO:40的类视黄醇X受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,由含核酸序列SEQ ID NO:45的多核苷酸编码的反式激活结构域,和由含选自下组的核酸序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,和SEQ ID NO:10的多核苷酸编码的蜕皮激素受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码的杂合多肽含有,含氨基酸序列SEQ ID NO:46的反式激活结构域,和含选自下组的氨基酸序列:SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:18,SEQID NO:19,和SEQ ID NO:20的蜕皮激素受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码杂合多肽含有,由含核酸序列SEQ ID NO:45的多核苷酸编码的反式激活结构域,和由含选自下组的核酸序列:SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQID NO:28,SEQ ID NO:29,和SEQ ID NO:30的多核苷酸编码的类视黄醇X受体的配体结合结构域。

在另一个优选的实施方案中,基因表达盒编码杂合多肽含有,由含氨基酸序列SEQ ID NO:46的反式激活结构域,和由含选自下组的氨基酸序列:SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38,SEQID NO:39,和SEQ ID NO:40的类视黄醇X受体的配体结合结构域。

为本发明的目的,EcR和RXR也包括合成的和嵌合的EcR和RXR及其同源物。本发明的多核苷酸

本发明新的基于蜕皮激素受体的可诱导的基因表达系统包括含有编码截短的EcR或RXR多肽的多核苷酸的基因表达盒。其中的多肽含有截短突变并对在宿主细胞中调节基因表达的方法有用。

因此,本发明也涉及编码含有截短突变的EcR或RXR多肽的多核苷酸。具体地,本发明也涉及分离的编码含有影响配体结合活性或配体敏感性的截短突变的EcR或RXR多肽的多核苷酸。

优选,该截短突变导致编码含有一个至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失的截短的EcR多肽或截短的RXR多肽的多核苷酸。更优选,EcR或RXR多肽的截短包含有至少部分多肽结构域的缺失。进一步更优选,EcR或RXR多肽的截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,EcR或RXR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个具体的实施方案中,根据本发明EcR多核苷酸包含选自下组的多核苷酸序列:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,SEQ ID NO:9,和SEQ ID NO:10。在一个具体的实施方案中,根据本发明多核苷酸编码蜕皮激素受体多肽,后者含有选自下组的氨基酸序列:SEQ ID NO:11(CfEcR-CDEF),SEQ ID NO:12(CfEcR-1/2CDEF,其含有C结构域的最后33酰基末端氨基酸),SEQ ID NO:13(CfEcR-DEF),SEQ ID NO:14(CfEcR-EF),SEQ ID NO:15(CfEcR-DE),SEQ ID NO:16(DmEcR-CDEF),SEQ IDNO:17(DmEcR-1/2CDEF),SEQ ID NO:18(DmEcR-DEF),SEQ IDNO:19(DmEcR-EF),和SEQ ID NO:20(DmEcR-DE)。

在另一个具体的实施方案中,根据本发明RXR多核苷酸包含选自下组的多核苷酸序列:SEQ ID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:24,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQID NO:28,SEQ ID NO:29,和SEQ ID NO:30。在一个具体的实施方案中,根据本发明多核苷酸编码截短的类视黄醇X受体多肽,后者含有选自下组的氨基酸序列:SEQ ID NO:31(MmRXR-CDEF),SEQ ID NO:32(MmRXR-DEF),SEQ ID NO:33(MmRXR-EF),SEQ ID NO:34(MmRXR-截短的EF),SEQ ID NO:35(MmRXR-E),SEQ IDNO:36(HsRXR-CDEF),SEQ ID NO:37(HsRXR-DEF),SEQ IDNO:38(HsRXR-EF),SEQ ID NO:39(HsRXR-截短的EF),和SEQ IDNO:40(HsRXR-E)。

本发明也涉及分离的多核苷酸,编码含有减弱EcR或RXR多肽的配体结合活性或配体敏感性的截短突变的EcR或RXR多肽的多核苷酸。在一个具体的实施方案中,本发明涉及分离的多核苷酸,编码含有减弱EcR或RXR多肽的甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽的多核苷酸。在一个优选的实施方案中,本发明涉及分离的多核苷酸,编码含有减弱EcR多肽的甾类结合活性或甾类敏感性的截短突变的EcR多肽的多核苷酸,其中多核苷酸序列含有核酸序列SEQID NO:3(CfEcR-DEF)、SEQ ID NO:4(CfEcR-EF)、SEQ IDNO:8(DmEcR-DEF)、或SEQ ID NO:9(DmEcR-EF)。在另一个具体的实施方案中,本发明涉及分离的多核苷酸,编码含有减弱EcR或RXR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽的多核苷酸。在一个优选的实施方案中,本发明涉及分离的多核苷酸,编码含有减弱EcR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR多肽的多核苷酸,其中多核苷酸序列含有核酸序列SEQ ID NO:4(CfEcR-EF)、或SEQ ID NO:9(DmEcR-EF)。

特别地,本发明涉及分离的多核苷酸,编码含有增强EcR或RXR多肽的配体结合活性或配体敏感性的截短突变的EcR或RXR多肽的多核苷酸。在一个具体的实施方案中,本发明涉及分离的多核苷酸,编码含有增强EcR或RXR多肽的甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽的多核苷酸。在另一个具体的实施方案中,本发明涉及分离的多核苷酸,编码含有增强EcR或RXR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽的多核苷酸。在一个优选的实施方案中,本发明涉及分离的多核苷酸,编码含有增强EcR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR多肽的多核苷酸,其中多核苷酸序列含有核酸序列SEQ ID NO:3(CfEcR-DEF)、或SEQID NO:8(DmEcR-DEF)。

本发明也涉及分离的多核苷酸,其编码含有增强异二聚体配体敏感性的截短突变的类视黄醇X受体多肽。该异二聚体含截短的类视黄醇X受体盒一个二聚化伙伴。优选,分离的编码含有增强异二聚体配体敏感性的截短突变的类视黄醇X受体多肽的多核苷酸含有选自下组的多核苷酸序列:SEQ ID NO:23(MmRXR-EF),SEQ ID NO:24(MmRXR-截短的EF),SEQ ID NO:28(HsRXR-EF),SEQ ID NO:29(HsRXR-截短的EF)。在一个具体的实施方案中,二聚化伙伴是蜕皮激素受体多肽。优选,二聚化伙伴是截短的蜕皮激素受体多肽。更优选,二聚化伙伴是缺失A/B/C结构域的蜕皮激素受体多肽。进一步更优选,二聚化伙伴是含有氨基酸序列SEQ ID NO:13(CfEcR-DEF)、或SEQ IDNO:18(DmEcR-DEF)的EcR多肽。本发明的多肽

本发明新的基于蜕皮激素受体的可诱导的基因表达系统包括含有编码截短的EcR或RXR多肽的,并对在宿主细胞中调节基因表达的方法有用的多核苷酸。因此,本发明也涉及分离的由根据本发明的多核苷酸或基因表达盒编码的截短的EcR或RXR多肽。具体的,本发明涉及分离的,由根据本发明的多核苷酸编码的含有影响配体结合活性或配体敏感性的截短突变的截短的EcR或RXR多肽。

本发明涉及分离的含有截短突变的截短的EcR或RXR多肽。具体的,本发明涉及分离的含有影响配体结合活性或配体敏感性的截短突变的截短的EcR或RXR多肽。

优选,截短突变导致含有一个至少1,2,3,4,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,105,115,110,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220,225,230,235,240,245,250,255,260,或265个氨基酸的缺失的截短的EcR多肽或截短的RXR多肽。更优选,EcR或RXR多肽的截短包含有至少部分多肽结构域的缺失。进一步更优选,EcR或RXR多肽的截短包含有至少一个完整多肽结构域的缺失。在一个具体的实施方案中,EcR或RXR多肽截短包含有至少A/B-结构域的缺失,C-结构域的缺失,D-结构域的缺失,E-结构域的缺失,F-结构域的缺失,A/B/C-结构域的缺失,A/B/1/2-C-结构域的缺失,A/B/C/D-结构域的缺失,A/B/C/D/F-结构域的缺失,A/B/F-结构域的缺失,A/B/C/F-结构域的缺失。也可以联合几个完全或部分结构域的缺失。

在一个优选的实施方案中,编码分离的截短的蜕皮激素受体多肽的多核苷酸含有选自下组的多核苷酸序列:SEQ ID NO:1(CfEcR-CDEF),SEQ ID NO:2(CfEcR-1/2CDEF),SEQ ID NO:3(CfEcR-DEF),SEQID NO:4(CfEcR-EF),SEQ ID NO:5(CfEcR-DE),SEQ IDNO:6(DmEcR-CDEF),SEQ ID NO:7(DmEcR-1/2CDEF),SEQ IDNO:8(DmEcR-DEF),SEQ ID NO:9(DmEcR-EF),和SEQ IDNO:10(DmEcR-DE)。在另一个优选的实施方案中,分离的截短的蜕皮激素受体多肽含有选自下组的氨基酸序列:SEQ ID NO:11(CfEcR-CDEF),SEQ ID NO:12(CfEcR-1/2CDEF),SEQ ID NO:13(CfEcR-DEF),SEQ ID NO:14(CfEcR-EF),SEQ ID NO:15(CfEcR-DE),SEQ ID NO:16(DmEcR-CDEF),SEQ IDNO:17(DmEcR-1/2CDEF),SEQ ID NO:18(DmEcR-DEF),SEQ IDNO:19(DmEcR-EF),和SEQ ID NO:20(DmEcR-DE)。

在一个优选的实施方案中,编码分离的截短的类视黄醇X受体多肽的多核苷酸含有选自下组的多核苷酸序列:SEQ ID NO:21(MmRXR-CDEF),SEQ ID NO:22(MmRXR-DEF),SEQ ID NO:23(MmRXR-EF),SEQ ID NO:24(MmRXR-截短的EF),SEQ ID NO:25(MmRXR-E),SEQ ID NO:26(HsRXR-CDEF),SEQ IDNO:27(HsRXR-DEF),SEQ ID NO:28(HsRXR-EF),SEQ IDNO:29(HsRXR-截短的EF),和SEQ ID NO:30(HsRXR-E)。在另一个优选的实施方案中,分离的截短的类视黄醇X受体多肽含有选自下组的氨基酸序列:SEQ ID NO:31(MmRXR-CDEF),SEQ ID NO:32(MmRXR-DEF),SEQ ID NO:33(MmRXR-EF),SEQ ID NO:34(MmRXR-截短的EF),SEQ ID NO:35(MmRXR-E),SEQ IDNO:36(HsRXR-CDEF),SEQ ID NO:37(HsRXR-DEF),SEQ IDNO:38(HsRXR-EF),SEQ ID NO:39(HsRXR-截短的EF),和SEQ IDNO:40(HsRXR-E)。

本发明涉及分离的含有减弱EcR或RXR多肽配体结合活性或配体敏感性的截短突变的EcR或RXR多肽,其中编码多肽的多核苷酸含有选自下组的多核苷酸序列:SEQ ID NO:1(CfEcR-CDEF),SEQ ID NO:2(CfEcR-1/2CDEF),SEQ ID NO:3(CfEcR-DEF),SEQ ID NO:4(CfEcR-EF),SEQ ID NO:5(CfEcR-DE),SEQ IDNO:6(DmEcR-CDEF),SEQ ID NO:7(DmEcR-1/2CDEF),SEQ IDNO:8(DmEcR-DEF),SEQ ID NO:9(DmEcR-EF),SEQ IDNO:10(DmEcR-DE),SEQ ID NO:21(MmRXR-CDEF),SEQ ID NO:22(MmRXR-DEF),SEQ ID NO:23(MmRXR-EF),SEQ ID NO:24(MmRXR-截短的EF),SEQ ID NO:25(MmRXR-E),SEQ IDNO:26(HsRXR-CDEF),SEQ ID NO:27(HsRXR-DEF),SEQ IDNO:28(HsRXR-EF),SEQ ID NO:29(HsRXR-截短的EF),和SEQ IDNO:30(HsRXR-E)。

因此,本发明涉及分离的含有减弱EcR或RXR多肽配体结合活性或配体敏感性的截短突变的EcR或RXR多肽,其中多肽含有选自下组的氨基酸序列:SEQ ID NO:11(CfEcR-CDEF),SEQ ID NO:12(CfEcR-1/2CDEF),SEQ ID NO:13(CfEcR-DEF),SEQ ID NO:14(CfEcR-EF),SEQ ID NO:15(CfEcR-DE),SEQ IDNO:16(DmEcR-CDEF),SEQ ID NO:17(DmEcR-1/2CDEF),SEQ IDNO:18(DmEcR-DEF),SEQ ID NO:19(DmEcR-EF),SEQ IDNO:20(DmEcR-DE),SEQ ID NO:31(MmRXR-CDEF),SEQ ID NO:32(MmRXR-DEF),SEQ ID NO:33(MmRXR-EF),SEQ ID NO:34(MmRXR-截短的EF),SEQ ID NO:35(MmRXR-E),SEQ IDNO:36(HsRXR-CDEF),SEQ ID NO:37(HsRXR-DEF),SEQ IDNO:38(HsRXR-EF),SEQ ID NO:39(HsRXR-截短的EF),和SEQ IDNO:40(HsRXR-E)。

在一个具体的实施方案中,本发明涉及分离的含有减弱EcR或RXR多肽甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的编码含有减弱EcR多肽的甾类结合活性或甾类敏感性的截短突变的EcR多肽,其中编码EcR多肽的多核苷酸序列含有核酸序列SEQ ID NO:3(CfEcR-DEF)、SEQ IDNO:4(CfEcR-EF)、SEQ ID NO:8(DmEcR-DEF)、或SEQ IDNO:9(DmEcR-EF)。相应的,本发明涉及分离的含有减弱EcR或RXR多肽甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的编码含有减弱EcR多肽的甾类结合活性或甾类敏感性的截短突变的EcR多肽,其中EcR多肽含有氨基酸序列SEQ ID NO:13(CfEcR-DEF)、SEQ ID NO:14(CfEcR-EF)、SEQ ID NO:18(DmEcR-DEF)、或SEQ ID NO:19(DmEcR-EF)。

在一个具体的实施方案中,本发明涉及分离的含有减弱EcR或RXR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的编码含有减弱EcR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR多肽,其中编码EcR多肽的多核苷酸序列含有核酸序列:SEQ ID NO:4(CfEcR-EF)、或SEQ ID NO:9(DmEcR-EF)。相应的,本发明涉及分离的含有减弱EcR或RXR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的含有减弱EcR多肽的非甾类结合活性或非甾类敏感性的截短突变的EcR多肽,其中EcR多肽含有氨基酸序列:SEQ ID NO:14(CfEcR-EF)、或SEQ IDNO:19(DmEcR-EF)。

特别地,本发明涉及分离的含有增强EcR或RXR多肽配体结合活性或配体敏感性的截短突变的EcR或RXR多肽,其中编码多肽的多核苷酸含有选自下组的多核苷酸序列:SEQ ID NO:1(CfEcR-CDEF),SEQID NO:2(CfEcR-1/2CDEF),SEQ ID NO:3(CfEcR-DEF),SEQ IDNO:4(CfEcR-EF),SEQ ID NO:5(CfEcR-DE),SEQ IDNO:6(DmEcR-CDEF),SEQ ID NO:7(DmEcR-1/2CDEF),SEQ IDNO:8(DmEcR-DEF),SEQ ID NO:9(DmEcR-EF),SEQ IDNO:10(DmEcR-DE),SEQ ID NO:21(MmRXR-CDEF),SEQ ID NO:22(MmRXR-DEF),SEQ ID NO:23(MmRXR-EF),SEQ ID NO:24(MmRXR-截短的EF),SEQ ID NO:25(MmRXR-E),SEQ IDNO:26(HsRXR-CDEF),SEQ ID NO:27(HsRXR-DEF),SEQ IDNO:28(HsRXR-EF),SEQ ID NO:29(HsRXR-截短的EF),和SEQ IDNO:30(HsRXR-E)。

因此,本发明涉及分离的含有增强EcR或RXR多肽配体结合活性或配体敏感性的截短突变的EcR或RXR多肽,其中多肽含有选自下组的氨基酸序列:SEQ ID NO:11(CfEcR-CDEF),SEQ ID NO:12(CfEcR-1/2CDEF),SEQ ID NO:13(CfEcR-DEF),SEQ ID NO:14(CfEcR-EF),SEQ ID NO:15(CfEcR-DE),SEQ IDNO:16(DmEcR-CDEF),SEQ ID NO:17(DmEcR-1/2CDEF),SEQ IDNO:18(DmEcR-DEF),SEQ ID NO:19(DmEcR-EF),SEQ IDNO:20(DmEcR-DE),SEQ ID NO:31(MmRXR-CDEF),SEQ ID NO:32(MmRXR-DEF),SEQ ID NO:33(MmRXR-EF),SEQ ID NO:34(MmRXR-截短的EF),SEQ ID NO:35(MmRXR-E),SEQ IDNO:36(HsRXR-CDEF),SEQ ID NO:37(HsRXR-DEF),SEQ IDNO:38(HsRXR-EF),SEQ ID NO:39(HsRXR-截短的EF),和SEQ IDNO:40(HsRXR-E)。

本发明涉及分离的含有增强EcR或RXR多肽配体结合活性或配体敏感性的截短突变的EcR或RXR多肽。在一个具体的实施方案中,本发明涉及分离的含有增强EcR或RXR多肽甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽。相应的,本发明涉及分离的含有增强EcR或RXR多肽甾类结合活性或甾类敏感性的截短突变的EcR或RXR多肽。

在另一个具体的实施方案中,本发明涉及分离的含有增强EcR或RXR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的含有增强EcR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR多肽,其中编码EcR多肽的多核苷酸序列含有核酸序列SEQ ID NO:3(CfEcR-DEF)、或SEQ ID NO:8(DmEcR-DEF)。相应的,本发明涉及分离的含有增强EcR或RXR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR或RXR多肽。在一个优选的实施方案中,本发明涉及分离的含有增强EcR多肽非甾类结合活性或非甾类敏感性的截短突变的EcR多肽,其中EcR多肽含有氨基酸序列SEQ ID NO:13(CfEcR-DEF)、或SEQ IDNO:18(DmEcR-DEF)。

本发明也涉及分离的多核苷酸,其编码含有增强异二聚体配体敏感性的截短突变的类视黄醇X受体多肽。该异二聚体含截短的类视黄醇X受体和一个二聚化伙伴。优选,含有增强异二聚体配体敏感性的截短突变的类视黄醇X受体分离的多肽由含有选自下组的多核苷酸序列:SEQID NO:23(MmRXR-EF),SEQ ID NO:24(MmRXR-截短的EF),SEQID NO:28(HsRXR-EF),SEQ ID NO:29(HsRXR-截短的EF)的多核苷酸编码。更优选,分离出的含有增强异二聚体配体敏感性的截短突变的类视黄醇X受体多肽含有选自下组的氨基酸序列:SEQ ID NO:33(MmRXR-EF),SEQ ID NO:34(MmRXR-截短的EF),SEQ IDNO:38(HsRXR-EF),SEQ ID NO:39(HsRXR-截短的EF)。

在一个具体的实施方案中,二聚化伙伴是蜕皮激素受体多肽。优选,二聚化伙伴是截短的蜕皮激素受体多肽。更优选,二聚化伙伴是缺失A/B/C结构域的蜕皮激素受体多肽。进一步更优选,二聚化伙伴是含有氨基酸序列SEQ ID NO:13(CfEcR-DEF)、或SEQ IDNO:18(DmEcR-DEF)的EcR多肽。本发明调控基因表达的方法

申请人的发明也涉及在宿主细胞中使用根据本发明的基因表达调控系统调控基因表达的方法。具体地,申请人的发明提供在宿主细胞中调控基因表达的方法,包括步骤:a)向宿主细胞引入根据本发明的基因表达调控系统,和b)向宿主细胞引入同基因表达调控系统的第一多肽和第二多肽的配体结合结构域独立组合的配体;其中被表达基因是一个基因表达盒的组成部分,该基因表达盒包含:i)反应性元件,含有同第一多肽DNA结合结构域发生结合的结构域;ii)被第二多肽的反式激活结构激活的启动子;和iii)其表达将被调控的基因,由此形成含有配体、基因表达调控系统第一多肽和基因表达调控系统第二多肽的复合体,而由这个复合体在宿主细胞中调控基因表达。

用申请人的方法在宿主细胞中表达的目的基因可以是内源基因或异源基因。所需的基因或蛋白的核酸或氨基酸序列信息存放于公共可及的数据库中,如GENEBANK,EMBL,Swiss-Port,和PIR,或在多种生物学相关的期刊出版物中。因此,本领域专业人员可以得到实际上所有已知基因的核酸序列信息。可以利用这些信息构建所需的构建物,用于在所述申请人方法的基因表达盒中插入目的基因。

用申请人的方法可在宿主细胞中表达的目的基因的例子有且不限于:由植物生产的作为疫苗的抗原、如α-淀粉酶、肌醇六磷酸酶、葡聚糖酶(glucanes)和木聚糖酶(xylanse)等的酶,对昆虫、线虫、真菌、细菌、病毒和非生物逆境、营养物(nutraceuticals)、药物、维生素的抗性基因、改变氨基酸组成的基因,抗除草剂基因,耐冻、耐干旱和耐热的基因,工业产品、油、蛋白、碳水化合物、抗氧化物、雄性不育植株、花、燃料、及其他产量特性的基因,编码有治疗作用的多肽或产物的基因,如某些基因,可以提供、调控、减轻、改正和/或恢复某些多肽,这些多肽对治疗某种状态、疾病、异常、官能障碍、遗传缺陷等是重要的。

可以接受的配体是任何可以调节基因表达的配体,在其存在下,双杂交系统的DNA结合结构域同反应元件结合能导致基因表达的激活或抑制。优选配体包括松甾酮、muristerone A,如美国专利第6013836、5117057、5530028和5378726号中公开的N,N’-二酰肼;如欧洲专利申请第461809号公布的二苯甲酰烷基氰肼;如美国专利第5225443中公布的N-烷基-N,N’-二芳酰肼;欧洲申请第234994中公布的N-酰基-N-烷基羰基肼;如美国专利第4985461中记述的N-芳酰基-N-烷基-N’-芳酰肼;上述每种配体在此作为参考文献,而其他类似物包括3,5-二-叔丁基-4-羟基-N-异丁基苯甲酰胺,8-O-乙酰哈帕苷等。

优选,用于申请人调控基因表达方法的配体是具有下列分子式的化合物:其中:E是含叔碳的(C4-C6)烷基或含叔碳的氰基(C3-C5)烷基;R1是H,Me,Et,i-Pr,F,甲酰基,CF3,CHF2,CHCl2,CH2F,CH2Cl,CH2OH,CH2OMe,CH2CN,CN,CoCH,1-丙炔基,2-丙炔基,乙烯基,OH,OMe,OEt,环丙基,CF2CF3,CH=CHCN,烯丙基,叠氮基,SCN,或SCHF2;R2是H,Me,Et,n-Pr,i-Pr,甲酰基,CF3,CHF2,CHCl2,CH2F,CH2Cl,CH2OH,CH2OMe,CH2CN,CN,CoCH,1-丙炔基,2-丙炔基,乙烯基,Ac,F,Cl,OH,OMe,OEt,O-n-Pr,OAc,NMe2,NEt2,SMe,SEt,SOCF3,OCF2CF2H,COEt,环丙基,CF2CF3,CH=CHCN,烯丙基,叠氮基,OCF3,OCHF2,O-i-Pr,SCN,SCHF2,SOMe,NH-CN,或与R3及R2和R3所连的苯基碳一起,形成亚乙二氧基,氧与苯基碳相邻的二氢呋喃基环,或氧与苯基碳相邻的二氢吡喃基环;R3是H,Et,或与R2及R2和R3所连的苯基碳一起,形成亚乙二氧基,氧与苯基碳相邻的二氢呋喃基环,或氧与苯基碳相邻的二氢吡喃基环;

R4,R5,和R6独立地是H,Me,Et,F,Cl,Br,甲酰基,CF3,CHF2,CHCl2,CH2F,CH2Cl,CH2OH,CN,CoCH,1-丙炔基,2-丙炔基,乙烯基,OMe,OEt,SMe,或SEt。

申请人的发明提供原核和真核宿主细胞中的基因表达调控。因此,本发明也涉及在选自下组的宿主细胞中调控基因表达的方法:细菌细胞,真菌细胞,酵母细胞,植物细胞,动物细胞,和哺乳动物细胞。优选,宿主细胞是酵母细胞、植物细胞、鼠细胞,或人细胞。

转基因宿主中的表达可应用于表达包括且不限于治疗性多肽、途径中间体等的多种目的多肽;可应用于调节宿主中已有途径来合成宿主本来不能合成的新产物;基于细胞的化验;等等。而且,基因产物可能有助于宿主得到更高的生长产出或建立其他可利用的生长模式。本发明的宿主细胞和非人生物

如上所述,本发明的基因表达调控系统可用于在宿主细胞中调控基因表达。在转基因宿主细胞中的表达对于多种目的基因的表达有用。因此,申请人的发明提供分离的包含根据本发明的基因表达系统的宿主细胞。本发明也提供分离的包含根据本发明的基因表达盒的宿主细胞。申请人的发明提供分离的包含根据本发明的多核苷酸和多肽的宿主细胞。分离的宿主细胞可以是原核或真核细胞。

优选,宿主细胞选自下组:细菌细胞,真菌细胞,酵母细胞,植物细胞,动物细胞,和哺乳动物细胞。优选宿主细胞的例子包括而不限于:真菌或酵母种,如曲霉属、木霉属、糖酵母属、毕赤氏酵母属、假丝酵母属、汉逊氏酵母属、或如下述这些属的细菌种:集胞蓝细菌属、聚球蓝细菌属、沙门氏菌属、芽孢杆菌属、不动杆菌属、红球菌属、链霉菌属、埃希氏菌属、假单胞菌属、甲烷单胞菌属、甲基细菌属、产碱菌属、集胞蓝细菌属、鱼腥蓝细菌属、硫杆菌属、甲烷杆菌属和克雷伯氏菌属,植物、动物和哺乳动物宿主细胞。更优选,宿主细胞是酵母细胞,植物细胞,鼠细胞或人细胞。

在一个具体的实施方案中,宿主细胞是选自糖酵母属、毕赤氏酵母属、假丝酵母属宿主细胞的酵母细胞。

在另一个具体的实施方案中,宿主细胞是选自包括苹果、拟南芥、bajra、香蕉、大麦、豆类、甜菜、blackgram、鹰嘴豆、红辣椒、黄瓜、茄子、favabean、玉米、瓜、粟、绿豆、燕麦、黄秋葵、Panicum、番木瓜、花生、豌豆、青椒、鸽子豆(pigeonpea)、菠萝、菜豆(Phaseolus)、马铃薯、南瓜(pumpkin)、水稻、高梁、大豆、南瓜(squash)、甘蔗、糖甜菜、向日葵、红薯、茶、西红柿、烟草、西瓜和小麦宿主细胞的植物细胞。

在另一个具体的实施方案中,宿主细胞是鼠细胞。

在另一个具体的实施方案中,宿主细胞是人细胞。

宿主细胞转化是本领域内所熟知的,并且可以通过多种方法实现,这些方法包括但不限于:电穿孔、病毒感染、质粒/载体转染,非病毒载体介导的转染,农杆菌介导的转化,粒子轰击等。目标基因产物的表达包括在适合的条件下培养转化的宿主细胞,并且诱导转化的基因表达。培养条件和原核和真核细胞基因表达的操作流程为本领域所熟知(见实施例的一般方法部分)。可以收获细胞并根据对基因产物特异的操作流程分离基因产物。

另外,可以选择宿主细胞,使它能够以某种特定方式调节所插入的多核苷酸的表达,或修饰并加工多肽产物。不同的宿主细胞具有特征化的且特异性的机制来进行蛋白质的翻译和翻译后加工和修饰(如,糖基化、剪切[如,对于信号序列])。为保证对表达的外源蛋白进行所需的修饰和加工,可以选择适合的细胞系或宿主系统。例如,用细菌系统生产无糖基化的核心蛋白产物。然而,细菌中表达的多肽可能折叠的不正确。在酵母中表达可以生产糖基化的产物。真核细胞表达可以增加异源蛋白被“天然”的糖基化及折叠的可能性。而且,在哺乳动物细胞表达可以提供重建,或建成多肽活性的工具。进一步,不同载体/宿主的表达系统会不同程度的影响加工反应,如蛋白水解切割等。

申请人的发明也涉及含有根据本发明的分离的宿主细胞的非人生物。优选,非人生物选自下组,细菌、真菌、酵母、植物、动物、哺乳动物。更优选,非人生物是酵母、植物、小鼠、大鼠、家兔、猫、狗、牛、山羊、猪、马、绵羊、猴子或黑猩猩。

在一个具体的实施方案中,非人生物是选自糖酵母属、毕赤氏酵母属、假丝酵母属的酵母。

在另一个具体的实施方案中,非人生物是选自下组的植物:苹果、拟南芥、bajra、香蕉、大麦、豆类、甜菜、blackgram、鹰嘴豆、红辣椒、黄瓜、茄子、favabean、玉米、瓜、粟、绿豆、燕麦、黄秋葵、Panicum、番木瓜、花生、豌豆、青椒、鸽子豆(pigeonpea)、菠萝、菜豆(Phaseolus)、马铃薯、南瓜(pumpkin)、水稻、高梁、大豆、南瓜(squash)、甘蔗、糖甜菜、向日葵、红薯、茶、西红柿、烟草、西瓜和小麦。

在另一个具体的实施方案中,非人生物是Mus musculus小鼠。测量基因的表达/转录

申请人发明方法中一个有用的测量是关于细胞的转录状态,包括RNA的鉴定和丰度,优选mRNA种类。可以方便的以现有几种基因表达技术中的任何一种方法测量cDNA丰度而完成这样的测量。

核酸化验技术是确定差异mRNA表达的有用技术。这种技术包括,例如寡核苷酸芯片和DNA微阵。这些技术依赖于DNA片段或对应不同的基因的寡聚核苷酸,或某些cDNA,这些cDNA固定在固体支持物上,且能与由细胞、组织或整个有机体提取的总mRNA池制备而得并被转化为cDNA的探针杂交。寡聚核苷酸芯片是用影印石版技术在基质上合成的寡聚核苷酸阵列。生产的芯片可以分析多达1700个基因。DNA微阵(microarray)是DNA样品阵列,典型的是PCR产物,被机器操作印在显微镜载片上。通过全长或部分长度的目标DNA序列分析每一个基因。带有多达10000基因的微阵现在可以商品形式常规制备。这两种技术的主要差异是寡聚核苷酸芯片典型地利用允许分级出短DNA分子的25-mer寡聚核苷酸,而微阵的较长的DNA靶,大约1000碱基对,可以在分级复杂的DNA混合物时提供更高的灵敏性。

申请人发明方法中另一个有用的测量是关于,用本领域熟知的方法测量细胞内存在的蛋白组成种类的丰度而确定细胞的翻译状态。

当需要确定与多种生理功能相关的基因时,可以化验下述功能,如细胞生长、凋亡、衰老、分化、附着、与特定分子结合、与另外的细胞结合、细胞组织、器官形成、细胞内运输、运输辅助、能量转化、代谢、肌生成、神经生成和/或造血作用等的变化。

而且,用申请人的方法,可用选择性标记或报告基因的表达测量基因表达调控。

其他检测基因表达产物的方法是本领域所熟知的,并且包括Southern印迹(DNA检测),点或线印迹(DNA,RNA),Northern印迹(RNA)和RT-PCR(RNA)分析。尽管不很优选,可以用标记的蛋白来检测与之杂交的特定的核酸序列。

在某些情况,有必要扩增核酸序列的数量。可以使用包括下述的一或多种合适的方法来完成,例如,聚合酶链式反应(“PCR”)、配体链式反应(“LCR”),链置换扩增(“SDA”),基于转录的扩增等等。PCR的实施依据已知技术,其中,例如在杂交条件下,存在热稳定DNA聚合酶时,用与特定被检测序列的每条链对应的寡聚核苷酸引物处理核酸样品。由于引物同特定序列的每条链足够互补而与之杂交,所以每个合成引物的延伸产物分别同两条核酸链中的每一条链互补。由每个引物合成的延伸产物也作为模板,用同样的引物进行下一次延伸产物的合成。经过足够数量循环的延伸产物合成以后,可以上述方法分析样品,评估是否存在被检测序列。

参考下述作为本发明样板的非限制性实施例,可以更好的理解本发明。

实施例

一般方法

这里所用的标准重组DNA和分子克隆技术是本领域所熟知的,且详述于Sambrook,J.Fritsch,E.F.和Maniatis,T.的Molecular Cloning:A Laboratory Manual;Cold Spring Habor Laboratory Press:ColdSpring Harbor,(1989)(Maniatis)和T.J.Silhavy,M.L.Bennan,及L.W.Enquist的Expriments with Gene Fusions,Cold Spring HaborLaboratory,Cold Spring Habor,N.Y.(1984)和Ausubel,F.M.等的Current Protocols in Moleucular Biololgy,Greene PublishingConcepts and Laboratory Exercises,第二版,2000,CRC press,NewYork;KMA Gartland和MR Davey的Agrobacterium Protocols,1995,Humana Press,Totowa,New Jersey;P.Maliga等,1995的Methods inPlant Molecular Biology,Cold Spring Habor Lab Press,New York;和Sambrook,等1989的Molecular Cloning,Cold Spring HaborLaboratory Press,New York。

适合细菌培养维持并生长的材料和方法是本领域所熟知的。适合在下面实施例中使用的技术可以在下述参考中找到:Manual of methodsfor General Bacteriology(Philipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg and G.Briggs Phillips,eds),American Society for Microbiology,Washington,DC.(1994)或在Biotechnololgy中,Thomas D.Brock的:A Textbook ofIndustrial Microbiology,第二版,Sinauer Associates,Inc.,Sunderland,MA(1989)。除非特别申明,用于维持并培养宿主细菌的所有试剂、限制性酶和材料来自Aldrich Chemicals(Milwaukee,WI),DIFCOLaboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),或SigmaChemical Company(St.Louis,MO)。

可使用Genetics Computer Group Inc.(Wisconsin PackageVersion 9.0,Genetics Computer Group(GCG),Madison,WI)的程序包完成对遗传序列的操作。使用GCG程序“Pileup”时,可以缺口创建(gap creation)默认值为12,和缺口延伸(gap extension)默认值为4。使用CGC程序“Gap”或“Bestfit”时,可以默认的缺口创建处罚(penalty)为50,并且默认的缺口延伸处罚为3。在GCG程序参数没有预定的任何情况下,在这些或其他GCG程序中可以使用默认值。

缩写词意义如下:“h”指小时,“min”指分钟,“sec”指秒,“d”指天,“μl”指微升,“ml”指毫升,“L”指升,“μM”指微摩尔,“mM”指毫摩尔,“μg”指微克,“mg”毫克,“A”指腺嘌呤或腺嘌呤核苷,“T”指胸腺嘧啶或胸苷,“G”指鸟嘌呤或鸟苷,“C”指胞嘧啶或胞苷,“xg”指几倍重力,“nt”指核苷酸,“aa”指氨基酸,“bp”指碱基对,“kb”指千碱基,“k”指千,“μ”指微,“℃”指摄氏度。

实施例1

开发申请人改进的基于EcR的可诱导的基因表达调控系统是为了用于包括基因治疗、在宿主细胞表达目的蛋白、生产转基因有机体和基于细胞的化验等多种应用。这个实施例记述了关于本发明基于EcR的可诱导的基因表达调控系统所用的几个基因表达盒的构建和评价。

在包括哺乳动物细胞的多种细胞背景下,昆虫蜕皮激素受体(EcR)同类视黄醇X受体异二聚化,并且一但结合配体就在蜕皮激素反应元件的控制下反式激活基因。申请人以云杉蚜虫Choristoneura fumiferana的EcR(“CfEcR”;其全长多核苷酸和多肽序列分别出列于SEQ IDNO:49,和SEQ ID NO:50),C.fumiferana的超气孔蛋白(“CfUSP”;其全长多核苷酸和多肽序列分别出列于SEQ ID NO:51,和SEQ ID NO:52)和小鼠Mus musculus的RXRα(MmRXRα;其全长多核苷酸和多肽序列分别出列于SEQ ID NO:53,和SEQ ID NO:54)为基础构建了几个基于EcR的基因表达盒。制备的受体构建物包含来自EcR和RXR或USP的配体结合结构域;来自GAL4或EcR的DNA结合结构域;和VP16的反式激活结构域。报告基因构建物包括报告基因,萤光素酶或LacZ,它们操作性联接于含GAL4或EcR/USP结合位点(反应元件)的合成的启动子构建物。这些受体和受体构建物的多种组合共转染到CHO,NIH3T3,CV1和293细胞中。使用4种不同的配体来检查基因诱导压(potential)(诱导的数量级)和配体特异性及敏感性:2种甾类配体(松甾酮A和muristerone A)和2种非甾类配体(N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼和N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼,它们以剂量依赖的方式在宿主细胞中诱导报告基因表达。在加入配体以后的24小时或48小时检测报告基因的表达活性。

基因表达盒:基于蜕皮激素受体的,可化学诱导的基因表达盒(开关)用本领域标准的克隆方法构建如下。下面为每个开关的制备和组成的简述。

1.1-GAL4EcR/VP16RXR:来自云杉蚜虫Choristoneurafumiferana EcR的D,E,和F结构域(“CfEcRDEF”;SEQ ID NO:3)同GAL4的DNA结合结构域(“DNABD”,SEQ ID NO:41)融合,并置于SV40e启动子(SEQ ID NO:55)的控制下。小鼠(Mus musculus)RXR(“MmRXRDEF”,SEQ ID NO:22)同来自VP16的反式激活结构域(“VP16AD”;SEQ ID NO:45)融合并且置于并置于SV40c启动子(SEQ ID NO:55)的控制下。5个一致的GAL4结合位点(“5XGAL4RE”:包括5,含SEQ ID NO:47的GAL4RE)同合成的E1b最小启动子(SEQID NO:56)融合并置于萤光素酶基因(SEQ ID NO:57)上游。

1.2-GAL4EcR/VP16USP:除了用云杉蚜虫USP的D,E,和F结构域(“CfUSPDEF”;SEQ ID NO:58)代替MmRXRDEF以外,该构建物以与开关1.1相同的方式制备。本实施例所用的该构建物与美国专利第5880333中公开的那些相似,只是其中所用USP来自Choristoneurafumiferana而非所用的Drosophila melanogaster。

1.3-GAL4RXR/VP16CfEcR:MmRXRDEF(SEQ ID NO:22)与GAL4DNABD(SEQ ID NO:41)融合,而CfEcRCDEF(SEQ ID NO:1)与VP16AD(SEQ ID NO:45)融合。

1.4-GAL4RXR/VP16DmEcR:除了用DmEcRCDEF(SEQ IDNO:6)代替CfEcRCDEF以外,该构建物以与开关1.3相同的方式制备。

1.5-GAL4USP/VP16CfEcR:除了用CfUSPDEF(SEQ IDNO:58)代替MmRXRDEF以外,该构建物以以与开关1.3相同的方式制备。

1.6-GAL4RXRCfEcRVP16:制备该构建物,将GAL4DNABD同VP16AD置于同一个分子中。GAL4DNABD(SEQ ID NO:41)同VP16AD(SEQ ID NO:45)同CfEcRDEF(SEQ ID NO:3)分别在其N末端和C末端融合。将融合物置于置于SV40e启动子(SEQ ID NO:55)的控制下。

1.7-VP16CfEcR:制备该构建物,将CfEcRCDEF(SEQ ID NO:1)同VP16AD(SEQ ID NO:45)融合,并置于SV40e启动子(SEQ ID NO:55)的控制下。将来自基因hsp27的6个蜕皮激素反应元件(“EcRE”;SEQID NO:59)置于启动子和萤光素酶基因(SEQ ID NO:57)的上游。此开关很可能使用内源RXR。

1.8-DmVgRXR:这个系统购自Invitrogen Corp.,Carlsbad,California。它含有果蝇Drosophila melanogaster的EcR(“DmEcR”),其所带的修饰过的DNABD融合于VP16AD,且位于CMV启动子(SEQID NO:60)的控制下。全长的MmRXR(SEQ ID NO:53)位于RSV启动子(SEQ ID NO:61)的控制下。报告基因,pIND(SP1)LacZ,含有5个拷贝的修饰过的蜕皮激素反应元件(“EcRE”,E/GRE),3个拷贝的SP1增强子,和最小热休克启动子,这些全部位于LacZ报告基因上游。

1.9-CfVgRXR:除了用含部分A/B结构域和全部CDEF结构域的截短的CfEcR(SEQ ID NO:62(多核苷酸))和(SEQ ID NO:63(多肽))代替DmEcR以外,该构建物以与开关1.8相同的方式制备。

1.10-CfVgRXRdel:除了删掉MmRXR(SEQ ID NO:53)以外,该例以与开关1.9相同的方式制备。

细胞系:这些实验使用4种细胞系:CHO,中国仓鼠Cricetulusgriseus卵巢细胞系;NIH3T3(3T3)小鼠Mus musculus细胞系;293人Homo sapieus肾细胞系和CV1非洲绿猴肾细胞系。以相对应的培养基维持每种细胞并在到达60%汇合度(confluency)时传代。培养和维持细胞的标准方法如下。

转染:评价几种市售的脂因子和电穿孔方法并开发了每种细胞的最佳转染条件。CHO,NIH3T3(3T3),293和CV1细胞培养至60%汇合度。以下述方法将在事例1.1到1.10中所述多种开关构建物对应的DNA转染到CHO细胞,NIH3T3(3T3)细胞,293细胞或CV1细胞中。

CHO细胞:到达60-80%汇合度的时候收获细胞,并以2.5,1.0或0.5ml培养基中分别含250000,100000,50000个细胞的浓度平板接种到6或12或24孔板,培养基含10%胎牛血清。第二天,用培养基漂洗细胞然后转染细胞4个小时。发现对于这些细胞,LipofectAMINETM2000(Life Technologies Inc)是最好的转染试剂。对于12孔板,将4μl LipofectAMINETM2000同100μl培养基混合。将1.0μg报告基因构建物和0.25μg受体构建物加入转染混合物。加入二级报告基因构建物[pTKRL(Promega);0.1μg/转染混合物],它含有被操作性联接并位于胸腺嘧啶激酶(TK)组成型启动子的控制下的Renilla萤光素酶(SEQ ID NO:64),而且被用于标准化。将转染混合物用涡选混合器混合并在室温放置30分钟。在培养结束的时候,将转染混合物加入到维持在400μl培养基中的细胞中。然后在37℃和5%CO2中,培养细胞4小时。培养结束时,加入500μl含20%FBS和DMSO(对照)或某适用配体的DMSO溶液的培养基,在37℃和5%CO2中培养细胞24-48小时。收获细胞并检测报告基因的活性。对于6和24孔板,步骤相同,只是所用试剂量对6孔板加倍,对24孔板减半。

NIH3T3细胞:对于3T3细胞,发现SuperfectTM(Qiagen Inc.)是最佳转染试剂。以相同于所述对CHO细胞的步骤处理3T3细胞,有两点改动。当细胞到达50%汇合度的时候进行平板接种。对6,或12,或24孔板的每孔分别接种125000或50000或25000个细胞。将GAL4EcR/VP16RXR和报告基因载体DNA转染到NIH3T3细胞,在含有PonA,MurA,N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼或N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼的培养基中培养48小时。配体处理方式同上述CHO细胞部分。

293细胞:发现对于293细胞,LipofectAMINETM2000(LifeTechnologies)是最好的脂因子。以相同于所述对CHO细胞的步骤处理293细胞,只是将该细胞平板接种于有生物被膜的(biocoated)平板以防凝块。配体处理方式同上述CHO细胞部分。

CV1细胞:发现对于CV1细胞,LipofectAMINETMplus(LifeTechnologies)是最好的脂因子。以相同于所述对NIH3T3细胞的步骤处理CV1细胞。

配体:松甾酮A和Muristerone A购自Sigma Chemical Company。两种非甾类N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼或N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼是合成的稳定的蜕皮甾类,由Rohm and Haas Company合成。所有配体溶于DMSO,并且不论对照还是处理中的DMSO终浓度都维持在0.1%。

报告基因检测:在加入配体,24-48小时后收获细胞。向24或12或24孔板的每个孔中分别加入125,250或500μl被动裂解缓冲液(来自Promega Corporation的双重-萤光素酶TM报告基因检测系统的部分)。将平板置于旋转摇动器15分钟。化验20μl裂解液。按照说明书指导,用Promega Corporation的双重-萤光素酶TM报告基因检测系统测量萤光素酶活性。按照说明书指导,用TROPIX的Galacto-StarTM检测试剂盒测量β-半乳糖苷酶。用Renilla萤光素酶作标准,将所有的萤光素酶和β-半乳糖苷酶活性标准化。用配体处理过的细胞的标准化的相对光单位(“RLU”)除以DMSO处理的细胞(未处理对照)的标准化的RLU,就计算出活性倍数。

这些实验结果提供于下列表中。

                                表1

               在CHO细胞中,用多种开关反式激活报告基因

    开关组成  50μM N-(2-乙基-3-甲氧基苄基)-N’-(3,  5-二甲基苄基)-N’-叔丁基肼的平均激活倍数 1.1 GAL4EcR+VP16RXR     pGAL4RELuc 1.2 GAL4EcR+VP16USP     pGAL4RELuc 1.3 GAL4RXR+VP16CfEcR     pGAL4RELuc 1.4 GALARXR+VP16DmEcR     pGAL4RELuc 1.5 GAL4USP+VP16CfEcR     pGAL4RELuc 1.6 GAL4CfEcRVP16     pGAL4RELuc 1.7 VP16CfEcR     pEcRELuc 1.8 DmVgRXR+MmRXR     pIND(SP1)LacZ    267    2    85    312    2    9    36    14
 1.9  CfVgRXR+MmRXR      pIND(SP1)LacZ 1.10 CfVgRXR      pIND(SP1)LacZ 27 29

                                表2

               在3T3细胞中,用多种开关反式激活报告基因

    开关组成    N-(2-乙基-3-甲氧基苄基)-N’-(3,5    -二甲基苄基)-N’-叔丁基肼的平均倍数激活 1.1 GAL4EcR+VP16RXR     pGAL4RELuc 1.2 GAL4EcR+VP16USP     pGAL4RELuc 1.3 GAL4RXR+VP16CfEcR     pGAL4RELuc 1.4 GAL4RXR+VP16DmEcR     pGAL4RELuc 1.5 GAL4USP+VP16CfEcR     pGAL4RELuc 1.6 GAL4CfEcRVP16     pGAL4RELuc 1.7 VP16CfEcR     pEcRELuc 1.8 DmVgRXR+MmRXR     pIND(SP1)LacZ 1.9 CfVgRXR+MmRXr     pIND(SP1)LacZ 1.10 CfVgRXR      pIND(SP1)LacZ    1118    2    47    269    3    7    1    21    19    2

                                表3

                在293细胞中,用多种开关反式激活报告基因

    开关组成    N-(2-乙基-3-甲氧基苄基)-N’-(3,5    -二甲基苄基)-N’-叔丁基肼的平均激活倍数 1.1 GAL4EcR+VP16RXR     pGAL4RELuc 1.2 GAL4EcR+VP16USP     pGAL4RELuc 1.3 GAL4RXR+VP16CfEcR     pGAL4RELuc 1.4 GAL4RXR+VP16DmEcR     pGAL4RELuc 1.5 GAL4USP+VP16CfEcR     pGAL4RELuc 1.6 GAL4CfEcRVP16     pGAL4RELuc    125    2    17    3    2    3
 1.7 VP16CfEcR     pEcRELuc 1.8 DmVgRXR+MmRXR     pIND(SP1)LacZ 1.9 CfVgRXR+MmRXR     pIND(SP1)LacZ 1.10 CfVgRXR      pIND(SP1)LacZ 2 21 12 3

                                     表4

                   在CV1细胞中,用多种开关反式激活报告基因

    开关组成    N-(2-乙基-3-甲氧基苄基)-N’-(3,5    -二甲基苄基)-N’-叔丁基肼的平均倍数激活 1.1 GAL4EcR+VP16RXR     pGAL4RELuc 1.2 GAL4EcR+VP16USP     pGAL4RELuc 1.3 GAL4RXR+VP16CfEcR     pGAL4RELuc 1.4 GAL4RXR+VP16DmEcR     pGAL4RELuc 1.5 GAL4USP+VP16CfEcR     pGAL4RELuc 1.6 GAL4CfEcRVP16     pGAL4RELuc 1.7 VP16CfEcR     pEcReLuc 1.8 DmVgRXR+MmRXR     pIND(SP1)LacZ 1.9 CfVgRXR+MmRXR     pIND(SP1)LacZ 1.10 CfVgRXR      pIND(SP1)LacZ    279    2    25    80    3    6    1    12    7    1

                                     表5

                 在3T3细胞中,通过甾类和非甾类反式激活报告基因

                      GAL4CfEcRDEF/VP16MmXRDEF(开关1.1)

    配体    1.0μM浓度的平均诱导倍数 1.松甾酮A 2.Muristerone A 3.N-(2-乙基-3-甲氧基苄基)-N’-(3,   5-二甲基苄基)-N’-叔丁基肼 4.N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)   -N’-(3,5-二甲基苄基)-N’-叔丁基肼    10    1.0    116    601

                                   表6

               在3T3细胞中,通过甾类和非甾类反式激活报告基因

                    GAL4MmRXRDEF/VP16CfEcRCDEF(开关1.3)

    配体    1.0μM浓度的平均诱导倍数 1.松甾酮A 2.Muristerone A 3.N-(2-乙基-3-甲氧基苄基)-N’-(3,5   -二甲基苄基)-N’-叔丁基肼 4.N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)   -N’-(3,5-二甲基苄基)-N’-叔丁基肼    1.0    1.0    71    54

申请人的结果说明非甾类蜕皮激素拮抗剂,N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼和N-(3,4-(1,2-亚乙二氧基)-2-甲基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼,相比于对果蝇Drosophila melanogaster EcR(DmEcR),是对CfEcR更有力的激活剂。(见表1-4)。而且,在检测的哺乳动物细胞系,作为CfEcR的异二聚化伙伴,MmRXR比CfUSP效果好(见表1-4)。另外,申请人的可诱导基因表达调控系统在使用外源MmRXR时比只依赖内源RXR水平时表现效果更好(见表1-4)。

申请人的结果也显示,在基于CfEcR的可诱导基因表达系统中,与甾类配体,松甾酮A和Muristerone A相比,非甾类蜕皮激素拮抗剂在更低浓度(即,灵敏性增加)诱导报告基因表达。

在测试的10个基于EcR的基因开关中,GAL4EcR/VP16RXR开关(开关1.1)在所有被检查的4种细胞系中比任何其他开关表现效果好,并且对非甾类敏感性比对甾类的高。这些结果也说明将激活结构域和DNA结合结构域置于两个不同伙伴个体上,相比与将AD和DNABD一起放在两个伙伴中的某一个上时,减弱背景活性。因此,AD和DNABD分处于两个伙伴之间的开关形式应用于基于EcR的基因开关时效果更好。

而且,基于MmRXR/EcR的开关比基于CfUSP/EcR的开关表现效果好,后者在没有配体存在时背景活性比前者高。

最后,GAL4EcR/VP16RXR开关(开关1.1)对非甾类敏感性比对甾类的高(见表5和6)。具体的,甾类配体在浓度为50μM时起始反式激活,而非甾类配体在低于1μM(低于微摩尔级)浓度时起始反式激活。

实施例2

本实施例记述申请人进一步分析本发明改进的基于EcR的可诱导基于表达系统中的截短的EcR和RXR多肽。为确定两受体的最佳组合和长度,使得开关具有a)在有配体存在时诱导作用最大;b)在无配体存在时背景最低;c)对配体浓度高敏感性;和d)在配体和受体之间的交叉反应最小。申请人在NIH3T3细胞中制做并分析了几种CfEcR和MmRXR受体多肽的截短突变。

简要来说,编码EcR和RXR多肽的多核苷酸在结构域A/B,C,D,E,和F的联接处被截短,并如实施例1所述与编码CfEcR的GAL4 DNA结合结构域的多核苷酸(SEQ ID NO:41),或与编码MmRXR的VP16激活结构域的多核苷酸(SEQ ID NO:45)融合。在NIH3T3细胞中检测得到的受体截短/融合多肽。用编码萤光素酶的质粒pFRLUC(Stratagene)作报告基因构建物,并且用受控于组成型TK启动子的编码Renilla萤光素酶多肽的pTKRL(Promega)来标准化上述转染。以一式三份的重复进行分析,并以上述方法确定荧光素酶量的平均值。

编码截短的蜕皮激素受体多肽的基因表达盒

基因表达盒含有:编码同GAL4 DNA结合结构域(SEQ IDNO:41):GAL4CfEcRA/BCDEF(全长CfEcRA/BCDEF;SEQ ID NO:49),GAL4CfEcRCDEF(CfEcRCDEF;SEQ ID NO:1),GAL4CfEcR1/2CDEF(CfEcR1/2CDEF;SEQ ID NO:2),GAL4CfEcRDEF(CfEcRDEF;SEQ ID NO:3),GAL4CfEcREF(CfEcREF;SEQ ID NO:4),GAL4CfEcRDE(CfEcRDE;SEQ ID NO:5)融合的全长或截短的CfEcR多肽的多核苷酸。将该基因表达盒同VP16MmRXRDEF(构建如实施例1.1;图11)或VP16MmRXREF[构建如实施例1.1;只是用MmRXREF(SEQ IDNO:23)代替MmRXRDEF;图12],以及pFRLUc和pTKRL质粒DNA一起转染到NIH3T3细胞中。在有0、1、5或25μMN-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼或PonA存在时培养转染的细胞48小时。收获,裂解细胞并在细胞裂解液中测定萤光素酶报告基因活性。给出总的蝇萤光素酶相对光单位。每条棒顶端的数值是该处理的最大诱导倍数。

申请人的结果显示MmRXR的EF结构域就足够用,并且比该受体的DEF结构域表现效果好(见图11和12)。申请人也展示,一般来说EcR/RXR受体组合对PonA不敏感(见图11和12)。如图11和12所示,GAL4CfEcRCDEF杂合多肽(SEQ ID NO:7)比其他任何CfEcR杂合多肽的表现效果都好。

编码截短的类视黄醇X受体多肽的基因表达盒

基因表达盒含有:编码同VP16反式激活结合结构域(SEQ IDNO:45):VP16MmRXRA/BCDEF(全长MmRXRA/BCDEF;SEQ IDNO:53),VP16MmRXRCDEF(MmRXRCDEF;SEQ ID NO:21),VP16MmRXRDEF(MmRXRDEF;SEQ ID NO:22),VP16MmRXREF(MmRXREF;SEQ ID NO:23),VP16MmRXRBam-EF(“MmRXRBam-EF”或“MmRXR-截短的EF”;SEQ ID NO:24),VP16MmRXRAF2del(“MmRXRAF2del”或“MmRXR-E”;SEQ ID NO:25)构建物融合的全长或截短的MmRXR多肽的多核苷酸。将该基因表达盒同GAL4CfEcRCDEF(构建如实施例1.1;图13)或GAL4CfEcRDEF[构建如实施例1.1;只是用CfEcRDEF(SEQ ID NO:3)代替CfEcRCDEF;图14],以及上述的pFRLUc和pTKRL质粒DNA一起转染到NIH3T3细胞中。在有0、1、5或25μMN-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼或PonA存在时培养转染的细胞48小时。收获,裂解细胞并在细胞裂解液中测定萤光素酶报告基因活性。给出总的蝇萤光素酶相对光单位。每条棒顶端的数值是该处理的最大诱导倍数。

申请人的结果显示,在所有测试的MmRXR截短突变中,MmRXREF受体是CfEcR的最佳伙伴(图13和14)。用MmRXREF时,CfEcRCDEF表现比CcfERDEF更好的诱导效果。缺失AF2(缩写为“EF-AF2del”)或E结构域的螺旋(helices)1-3(缩写为“EF-Bamdel”)导致RXR受体与NIH3T3细胞中的CfEcRCDEF(图13)或CfEcRDEF(图14)结合为二聚体时的基因诱导能力和配体敏感性减弱。一般,基于CfEcR/RXR的开关对非甾类N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼的敏感性高于对甾类PonA。

实施例3

本实施例记述申请人关于编码影响配体结合活性或配体敏感性或同时两者的截短的EcR或RXR受体多肽的基因表达盒的进一步分析。简要来说,在NIH3T3细胞的一个单个实验中进一步分析,按实施例1和2所述构建的嵌合受体对的6种不同组合。表7出列这6个受体对组合及其对应的样品序号。

                                 表7

                 NIH3T3细胞中的CfEcR+MmRXR截短受体组合

  图15X-轴样品序号  EcR多肽构建物    RXR多肽构建物    样品1和2 GAL4CfEcRCDEF VP16RXRA/BCDEF(全长)    样品3和4 GAL4CfEcRCDEF VP16RXRDEF    样品5和6 GAL4CfEcRCDEF VP16RXREF    样品7和8 GAL4CfEcRDEF VP16RXRA/BCDEF(全长)    样品9和10 GAL4CfEcRDEF VP16RXRDEF    样品11和12 GAL4CfEcRDEF VP16RXREF

上述受体构建物对,同报告基因质粒pFRLuc按上述方法一同转染到NIH3T3细胞中。将6个CfEcR截短突变受体组合分成同样的两组,并用甾类(图15中x-轴的奇数)或非甾类(图15中x-轴的偶数)处理。具体的,在存在有0、1、5或25μM PonA(甾类)或N-(2-乙基-3-甲氧基苄基)-N’-(3,5-二甲基苄基)-N’-叔丁基肼(非甾类)配体的培养基中培养细胞。测量报告基因活性并给出总RLU值。每条棒顶端的数值是该处理的最大诱导倍数并且是3次重复实验的平均值。

如图15所示,无论以总RLU值还是诱导倍数来看,CfEcRCDEF/MmRXREF受体组合都是最佳开关对(比较1-6柱和7-12柱)。这证实了申请人在实施例2中记述的发现(图11-14)。同样的编码截短的EcR或RXR受体多肽的基因表达盒也在人肺癌细胞系A549(ATCC)中进行检测并且得到了类似的结果(数据未出示)。

                          序列表<110>Rohm and Haas Company

 Palli,Subba Reddy

 Kapitskaya,Marianna Zinovjevna

 Cress,Dean Ervin<120>新的基于蜕皮激素受体的可诱导的基因表达系统<130>RH0020<140>PCT/US 01/09050<141>2001-03-21<150>60/191,355<151>2000-03-22<150>60/269,799<151>2001-02 20<160>64<170>PatentIn version 3.0<210>1<211>1288<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>1aagggccctg cgccccgtca gcaagaggaa ctgtgtctgg tatgcgggga cagagcctcc      60ggataccact acaatgcgct cacgtgtgaa gggtgtaaag ggttcttcag acggagtgtt     120accaaaaatg cggtttatat ttgtaaattc ggtcacgctt gcgaaatgga catgtacatg     180cgacggaaat gccaggagtg ccgcctgaag aagtgcttag ctgtaggcat gaggcctgag     240tgcgtagtac ccgagactca gtgcgccatg aagcggaaag agaagaaagc acagaaggag     300aaggacaaac tgcctgtcag cacgacgacg gtggacgacc acatgccgcc cattatgcag    360tgtgaacctc cacctcctga agcagcaagg attcacgaag tggtcccaag gtttctctcc    420gacaagctgt tggagacaaa ccggcagaaa aacatccccc agttgacagc caaccagcag    480ttccttatcg ccaggctcat ctggtaccag gacgggtacg agcagccttc tgatgaagat    540ttgaagagga ttacgcagac gtggcagcaa gcggacgatg aaaacgaaga gtctgacact    600cccttccgcc agatcacaga gatgactatc ctcacggtcc aacttatcgt ggagttcgcg    660aagggattgc cagggttcgc caagatctcg cagcctgatc aaattacgct gcttaaggct    720tgctcaagtg aggtaatgat gctccgagtc gcgcgacgat acgatgcggc ctcagacagt    780gttctgttcg cgaacaacca agcgtacact cgcgacaact accgcaaggc tggcatggcc    840tacgtcatcg aggatctact gcacttctgc cggtgcatgt actctatggc gttggacaac    900atccattacg cgctgctcac ggctgtcgtc atcttttctg accggccagg gttggagcag    960ccgcaactgg tggaagaaat ccagcggtac tacctgaata cgctccgcat ctatatcctg   1020aaccagctga gcgggtcggc gcgttcgtcc gtcatatacg gcaagatcct ctcaatcctc   1080tctgagctac gcacgctcgg catgcaaaac tccaacatgt gcatctccct caagctcaag   1140aacagaaagc tgccgccttt cctcgaggag atctgggatg tggcggacat gtcgcacacc   1200caaccgccgc ctatcctcga gtcccccacg aatctctagc ccctgcgcgc acgcatcgcc   1260gatgccgcgt ccggccgcgc tgctctga                                      1288<210>2<211>1110<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>2gcggtttata tttgtaaatt cggtcacgct tgcgaaatgg acatgtacat gcgacggaaa     60tgccaggagt gccgcctgaa gaagtgctta gctgtaggca tgaggcctga gtgcgtagta    120cccgagactc agtgcgccat gaagcggaaa gagaagaaag cacagaagga gaaggacaaa    180ctgcctgtca gcacgacgac ggtggacgac cacatgccgc ccattatgca gtgtgaacct    240ccacctcctg aagcagcaag gattcacgaa gtggtcccaa ggtttctctc cgacaagctg    300ttggagacaa accggcagaa aaacatcccc cagttgacag ccaaccagca gttccttatc    360gccaggctca tctggtacca ggacgggtac gagcagcctt ctgatgaaga tttgaagagg    420attacgcaga cgtggcagca agcggacgat gaaaacgaag agtctgacac tcccttccgc    480cagatcacag agatgactat cctcacggtc caacttatcg tggagttcgc gaagggattg    540ccagggttcg ccaagatctc gcagcctgat caaattacgc tgcttaaggc ttgctcaagt    600gaggtaatga tgctccgagt cgcgcgacga tacgatgcgg cctcagacag tgttctgttc    660gcgaacaacc aagcgtacac tcgcgacaac taccgcaagg ctggcatggc ctacgtcatc    720gaggatctac tgcacttctg ccggtgcatg tactctatgg cgttggacaa catccattac    780gcgctgctca cggctgtcgt catcttttct gaccggccag ggttggagca gccgcaactg    840gtggaagaaa tccagcggta ctacctgaat acgctccgca tctatatcct gaaccagctg    900agcgggtcgg cgcgttcgtc cgtcatatac ggcaagatcc tctcaatcct ctctgagcta    960cgcacgctcg gcatgcaaaa ctccaacatg tgcatctccc tcaagctcaa gaacagaaag   1020ctgccgcctt tcctcgagga gatctgggat gtggcggaca tgtcgcacac ccaaccgccg   1080cctatcctcg agtcccccac gaatctctag                                    1110<210>3<211>1054<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>3cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag     60aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt    120atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt    180ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac    240cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat    300gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct    360gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag    420ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt    480aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca    540gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc    600atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg    660gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg    720gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat    780atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca    840atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag    900ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg    960cacacccaac cgccgcctat cctcgagtcc cccacgaatc tctagcccct gcgcgcacgc   1020atcgccgatg ccgcgtccgg ccgcgctgct ctga                               1054<210>4<211>735<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>4taccaggacg ggtacgagca gccttctgat gaagatttga agaggattac gcagacgtgg     60cagcaagcgg acgatgaaaa cgaagagtct gacactccct tccgccagat cacagagatg    120actatcctca cggtccaact tatcgtggag ttcgcgaagg gattgccagg gttcgccaag    180atctcgcagc ctgatcaaat tacgctgctt aaggcttgct caagtgaggt aatgatgctc    240cgagtcgcgc gacgatacga tgcggcctca gacagtgttc tgttcgcgaa caaccaagcg    300tacactcgcg acaactaccg caaggctggc atggcctacg tcatcgagga tctactgcac    360ttctgccggt gcatgtactc tatggcgttg gacaacatcc attacgcgct gctcacggct    420gtcgtcatct tttctgaccg gccagggttg gagcagccgc aactggtgga agaaatccag    480cggtactacc tgaatacgct ccgcatctat atcctgaacc agctgagcgg gtcggcgcgt    540tcgtccgtca tatacggcaa gatcctctca atcctctctg agctacgcac gctcggcatg    600caaaactcca acatgtgcat ctccctcaag ctcaagaaca gaaagctgcc gcctttcctc    660gaggagatct gggatgtggc ggacatgtcg cacacccaac cgccgcctat cctcgagtcc    720cccacgaatc tctag                                                     735<210>5<211>960<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>5cctgagtgcg tagtacccga gactcagtgc gccatgaagc ggaaagagaa gaaagcacag     60aaggagaagg acaaactgcc tgtcagcacg acgacggtgg acgaccacat gccgcccatt    120atgcagtgtg aacctccacc tcctgaagca gcaaggattc acgaagtggt cccaaggttt    180ctctccgaca agctgttgga gacaaaccgg cagaaaaaca tcccccagtt gacagccaac    240cagcagttcc ttatcgccag gctcatctgg taccaggacg ggtacgagca gccttctgat    300gaagatttga agaggattac gcagacgtgg cagcaagcgg acgatgaaaa cgaagagtct    360gacactccct tccgccagat cacagagatg actatcctca cggtccaact tatcgtggag    420ttcgcgaagg gattgccagg gttcgccaag atctcgcagc ctgatcaaat tacgctgctt    480aaggcttgct caagtgaggt aatgatgctc cgagtcgcgc gacgatacga tgcggcctca    540gacagtgttc tgttcgcgaa caaccaagcg tacactcgcg acaactaccg caaggctggc    600atggcctacg tcatcgagga tctactgcac ttctgccggt gcatgtactc tatggcgttg    660gacaacatcc attacgcgct gctcacggct gtcgtcatct tttctgaccg gccagggttg    720gagcagccgc aactggtgga agaaatccag cggtactacc tgaatacgct ccgcatctat    780atcctgaacc agctgagcgg gtcggcgcgt tcgtccgtca tatacggcaa gatcctctca    840atcctctctg agctacgcac gctcggcatg caaaactcca acatgtgcat ctccctcaag    900ctcaagaaca gaaagctgcc gcctttcctc gaggagatct gggatgtggc ggacatgtcg    960<210>6<211>1878<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>6ggacctgcgc cacgggtgca agaggagctg tgcctggttt gcggcgacag ggcctccggc     60taccactaca acgccctcac ctgtgagggc tgcaaggggt tctttcgacg cagcgttacg    120aagagcgccg tctactgctg caagttcggg cgcgcctgcg aaatggacat gtacatgagg    180cgaaagtgtc aggagtgccg cctgaaaaag tgcctggccg tgggtatgcg gccggaatgc    240gtcgtcccgg agaaccaatg tgcgatgaag cggcgcgaaa agaaggccca gaaggagaag    300gacaaaatga ccacttcgcc gagctctcag catggcggca atggcagctt ggcctctggt    360ggcggccaag actttgttaa gaaggagatt cttgacctta tgacatgcga gccgccccag    420catgccacta ttccgctact acctgatgaa atattggcca agtgtcaagc gcgcaatata    480ccttccttaa cgtacaatca gttggccgtt atatacaagt taatttggta ccaggatggc    540tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag    600agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg    660attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc    720acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac    780cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa    840atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg    900atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg    960ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta   1020cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag   1080ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc   1140tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat   1200gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc   1260gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc   1320gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc   1380cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta   1440caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt   1500cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc   1560gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac   1620atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct   1680gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt   1740gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg   1800ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag   1860cactcgacga ctgcatag                                                 1878<210>7<211>1752<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>7gccgtctact gctgcaagtt cgggcgcgcc tgcgaaatgg acatgtacat gaggcgaaag     60tgtcaggagt gccgcctgaa aaagtgcctg gccgtgggta tgcggccgga atgcgtcgtc    120ccggagaacc aatgtgcgat gaagcggcgc gaaaagaagg cccagaagga gaaggacaaa    180atgaccactt cgccgagctc tcagcatggc ggcaatggca gcttggcctc tggtggcggc    240caagactttg ttaagaagga gattcttgac cttatgacat gcgagccgcc ccagcatgcc    300actattccgc tactacctga tgaaatattg gccaagtgtc aagcgcgcaa tataccttcc    360ttaacgtaca atcagttggc cgttatatac aagttaattt ggtaccagga tggctatgag    420cagccatctg aagaggatct caggcgtata atgagtcaac ccgatgagaa cgagagccaa    480acggacgtca gctttcggca tataaccgag ataaccatac tcacggtcca gttgattgtt    540gagtttgcta aaggtctacc agcgtttaca aagatacccc aggaggacca gatcacgtta    600ctaaaggcct gctcgtcgga ggtgatgatg ctgcgtatgg cacgacgcta tgaccacagc    660tcggactcaa tattcttcgc gaataataga tcatatacgc gggattctta caaaatggcc    720ggaatggctg ataacattga agacctgctg catttctgcc gccaaatgtt ctcgatgaag    780gtggacaacg tcgaatacgc gcttctcact gccattgtga tcttctcgga ccggccgggc    840ctggagaagg cccaactagt cgaagcgatc cagagctact acatcgacac gctacgcatt    900tatatactca accgccactg cggcgactca atgagcctcg tcttctacgc aaagctgctc    960tcgatcctca ccgagctgcg tacgctgggc aaccagaacg ccgagatgtg tttctcacta   1020aagctcaaaa accgcaaact gcccaagttc ctcgaggaga tctgggacgt tcatgccatc   1080ccgccatcgg tccagtcgca ccttcagatt acccaggagg agaacgagcg tctcgagcgg   1140gctgagcgta tgcgggcatc ggttgggggc gccattaccg ccggcattga ttgcgactct   1200gcctccactt cggcggcggc agccgcggcc cagcatcagc ctcagcctca gccccagccc   1260caaccctcct ccctgaccca gaacgattcc cagcaccaga cacagccgca gctacaacct   1320cagctaccac ctcagctgca aggtcaactg caaccccagc tccaaccaca gcttcagacg   1380caactccagc cacagattca accacagcca cagctccttc ccgtctccgc tcccgtgccc   1440gcctccgtaa ccgcacctgg ttccttgtcc gcggtcagta cgagcagcga atacatgggc   1500ggaagtgcgg ccataggacc catcacgccg gcaaccacca gcagtatcac ggctgccgtt   1560accgctagct ccaccacatc agcggtaccg atgggcaacg gagttggagt cggtgttggg   1620gtgggcggca acgtcagcat gtatgcgaac gcccagacgg cgatggcctt gatgggtgta   1680gccctgcatt cgcaccaaga gcagcttatc gggggagtgg cggttaagtc ggagcactcg   1740acgactgcat ag                                                       1752<210>8<211>1650<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>8cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc     60cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc    120ttggcctctg gtggeggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc    180gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa    240gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg    300taccaggatg gctatgagca gccatctgaa gaggatctea ggcgtataat gagtcaaccc    360gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc    420acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag    480gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca    540cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg    600gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc    660caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc    720ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac    780atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc    840ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc    900gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc    960tgggacgttc atgccatccc gccatcggtc cagtcgcacc ttcagattac ccaggaggag   1020aacgagcgtc tcgagcgggc tgagcgtatg cgggcatcgg ttgggggcgc cattaccgcc   1080ggcattgatt gcgactctgc ctccacttcg gcggcggcag ccgcggccca gcatcagcct   1140cagcctcagc cccagcccca accctcctcc ctgacccaga acgattccca gcaccagaca   1200cagccgcagc tacaacctca gctaccacct cagctgcaag gtcaactgca accccagctc   1260caaccacagc ttcagacgca actccagcca cagattcaac cacagccaca gctccttccc   1320gtctccgctc ccgtgcccgc ctccgtaacc gcacctggtt ccttgtccgc ggtcagtacg   1380agcagcgaat acatgggcgg aagtgcggcc ataggaccca tcacgccggc aaccaccagc   1440agtatcacgg ctgccgttac cgctagctcc accacatcag cggtaccgat gggcaacgga   1500gttggagtcg gtgttggggt gggcggcaac gtcagcatgt atgcgaacgc ccagacggcg   1560atggccttga tgggtgtagc cctgcattcg caccaagagc agcttatcgg gggagtggcg   1620gttaagtcgg agcactcgac gactgcatag                                    1650<210>9<211>1338<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>9tatgagcagc catctgaaga ggatctcagg cgtataatga gtcaacccga tgagaacgag     60agccaaacgg acgtcagctt tcggcatata accgagataa ccatactcac ggtccagttg    120attgttgagt ttgctaaagg tctaccagcg tttacaaaga taccccagga ggaccagatc    180acgttactaa aggcctgctc gtcggaggtg atgatgctgc gtatggcacg acgctatgac    240cacagctcgg actcaatatt cttcgcgaat aatagatcat atacgcggga ttcttacaaa    300atggccggaa tggctgataa cattgaagac ctgctgcatt tctgccgcca aatgttctcg    360atgaaggtgg acaacgtcga atacgcgctt ctcactgcca ttgtgatctt ctcggaccgg    420ccgggcctgg agaaggccca actagtcgaa gcgatccaga gctactacat cgacacgcta    480cgcatttata tactcaaccg ccactgcggc gactcaatga gcctcgtctt ctacgcaaag    540ctgctctcga tcctcaccga gctgcgtacg ctgggcaacc agaacgccga gatgtgtttc    600tcactaaagc tcaaaaaccg caaactgccc aagttcctcg aggagatctg ggacgttcat    660gccatcccgc catcggtcca gtcgcacctt cagattaccc aggaggagaa cgagcgtctc    720gagcgggctg agcgtatgcg ggcatcggtt gggggcgcca ttaccgccgg cattgattgc    780gactctgcct ccacttcggc ggcggcagcc gcggcccagc atcagcctca gcctcagccc    840cagccccaac cctcctccct gacccagaac gattcccagc accagacaca gccgcagcta    900caacctcagc taccacctca gctgcaaggt caactgcaac cccagctcca accacagctt    960cagacgcaac tccagccaca gattcaacca cagccacagc tccttcccgt ctccgctccc   1020gtgcccgcct ccgtaaccgc acctggttcc ttgtccgcgg tcagtacgag cagcgaatac   1080atgggcggaa gtgcggccat aggacccatc acgccggcaa ccaccagcag tatcacggct   1140gccgttaccg ctagctccac cacatcagcg gtaccgatgg gcaacggagt tggagtcggt   1200gttggggtgg gcggcaacgt cagcatgtat gcgaacgccc agacggcgat ggccttgatg   1260ggtgtagccc tgcattcgca ccaagagcag cttatcgggg gagtggcggt taagtcggag   1320cactcgacga ctgcatag                                                 1338<210>10<211>969<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>10cggccggaat gcgtcgtccc ggagaaccaa tgtgcgatga agcggcgcga aaagaaggcc     60cagaaggaga aggacaaaat gaccacttcg ccgagctctc agcatggcgg caatggcagc    120ttggcctctg gtggcggcca agactttgtt aagaaggaga ttcttgacct tatgacatgc    180gagccgcccc agcatgccac tattccgcta ctacctgatg aaatattggc caagtgtcaa    240gcgcgcaata taccttcctt aacgtacaat cagttggccg ttatatacaa gttaatttgg    300taccaggatg gctatgagca gccatctgaa gaggatctca ggcgtataat gagtcaaccc    360gatgagaacg agagccaaac ggacgtcagc tttcggcata taaccgagat aaccatactc    420acggtccagt tgattgttga gtttgctaaa ggtctaccag cgtttacaaa gataccccag    480gaggaccaga tcacgttact aaaggcctgc tcgtcggagg tgatgatgct gcgtatggca    540cgacgctatg accacagctc ggactcaata ttcttcgcga ataatagatc atatacgcgg    600gattcttaca aaatggccgg aatggctgat aacattgaag acctgctgca tttctgccgc    660caaatgttct cgatgaaggt ggacaacgtc gaatacgcgc ttctcactgc cattgtgatc    720ttctcggacc ggccgggcct ggagaaggcc caactagtcg aagcgatcca gagctactac    780atcgacacgc tacgcattta tatactcaac cgccactgcg gcgactcaat gagcctcgtc    840ttctacgcaa agctgctctc gatcctcacc gagctgcgta cgctgggcaa ccagaacgcc    900gagatgtgtt tctcactaaa gctcaaaaac cgcaaactgc ccaagttcct cgaggagatc    960tgggacgtt                                                            969<210>11<211>412<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>11Lys Gly Pro Ala Pro Arg Gln Gln Glu Glu Leu Cys Leu Val Cys Gly1               5                   10                  15Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu Thr Cys Glu Gly Cys

        20                  25                  30Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn Ala Val Tyr Ile Cys

    35                  40                  45Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr Met Arg Arg Lys Cys

50                  55                  60Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val Gly Met Arg Pro Glu65                  70                  75                   80Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu Lys Lys

            85                  90                  95Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr Val Asp

        100                 105                 110Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro Glu Ala

    115                 120                 125Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys Leu Leu

130                 135                 140Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln145                 150                 155                 160Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro

            165                 170                 175Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp

        180                 185                 190Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr Glu Met

    195                 200                 205Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu Pro

210                 215                 220Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala225                 230                 235                 240Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr Asp Ala

            245                 250                 255Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp

        260                 265                  270ASn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu Leu His

    275                 280                 285Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His Tyr Ala

290                 295                 300Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln305                 310                 315                 320Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg

            325                 330                 335Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser Val Ile

        340                 345                 350Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu Gly Met

    355                 360                 365Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu

370                 375                 380Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser His Thr385                 390                 395                 400Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu

            405                 410<210>12<211>412<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>12Lys Gly Pro Ala Pro Arg Gln Gln Glu Glu Leu Cys Leu Val Cys Gly1               5                   10                  15Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu Thr Cys Glu Gly Cys

        20                  25                  30Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn Ala Val Tyr lle Cys

    35                  40                  45Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr Met Arg Arg Lys Cys

50                  55                  60Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val Gly Met Arg Pro Glu65                  70                  75                   80Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu Lys Lys

            85                  90                  95Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr Val Asp

        100                 105                 110Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro Glu Ala

    115                 120                 125Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys Leu Leu

130                 135                 140Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln145                 150                 155                 160Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro

            165                 170                 175Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp

        180                 185                 190Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr Glu Met

    195                 200                 205Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu Pro

210                 215                 220Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala225                 230                 235                 240Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr Asp Ala

            245                 250                 255Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp

        260                 265                 270Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu Leu His

    275                 280                 285Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His Tyr Ala

290                 295                 300Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln305                 310                 315                 320Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg

            325                 330                 335Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser Val Ile

        340                 345                 350Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu Gly Met

    355                 360                 365Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu

370                 375                 380Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser His Thr385                 390                 395                 400Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn Leu

            405                 410<210>13<211>334<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>13Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu1               5                   10                  15Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr

        20                  25                  30Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Prc

    35                  40                  45Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys

50                  55                  60Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn65                  70                  75                  80Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu

            85                  90                  95Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln

        100                 105                 110Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr

    115                 120                 125Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly

130                 135                 140Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu145                 150                 155                 160Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr

            165                 170                 175Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr

        180                 185                 190Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu

    195                 200                 205Leu His Phe Cys Arg Cys Met Tyr Ser Mer Ala Leu Asp Asn Ile His

210                 215                 220Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu225                 230                 235                 240Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr

            245                 250                 255Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser

        260                 265                 270Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu

    275                 280                 285Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg

290                 295                 300Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser305                 310                 315                 320His Thr Gln Pro Pro Pro lle Leu Glu Ser Pro Thr Asn Leu

            325                 330<210>14<211>244<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>14Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile1               5                   10                  15Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr

        20                  25                  30Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile

    35                  40                  45Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro

50                  55                  60Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu65                  70                  75                  80Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala

            85                  90                  95Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala

        100                 105                 110Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met

    115                 120                 125Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe

130                 135                 140Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln145                 150                 155                 160Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser

            165                 170                 175Gly Ser Ala Arg Ser Ser Val lle Tyr Gly Lys Ile Leu Ser Ile Leu

        180                 185                 190Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser

    195                 200                 205Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp

210                 215                 220Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser225                 230                 235                 240Pro Thr Asn Leu<210>15<211>320<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>15Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys Arg Lys Glu1               5                   10                  15Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser Thr Thr Thr

        20                  25                  30Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro Pro Pro Pro

    35                  40                  45Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu Ser Asp Lys

50                  55                  60Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn65                  70                  75                  80Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu

            85                  90                  95Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln

        100                 105                 110Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr

    115                 120                 125Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly

130                 135                 140Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu145                 150                 155                 160Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala Arg Arg Tyr

            165                 170                 175Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr

        180                 185                 190Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile Glu Asp Leu

    195                 200                 205Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp Asn Ile His

210                 215                 220Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg Pro Gly Leu225                 230                 235                 240Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr

            245                 250                 255Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser

        260                 265                 270Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu

    275                 280                 285Gly Met Gln ASn Ser Asn Met Cys Ile Ser Leu Lys Leu Lys Asn Arg

290                 295                 300Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala Asp Met Ser305                 310                 315                 320<210>16<211>625<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>16Gly Pro Ala Pro Arg Val Gln Glu Glu Leu Cys Leu Val Cys Gly Asp1               5                   10                  15Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu Thr Cys Glu Gly Cys Lys

        20                  25                  30Gly Phe Phe Arg Arg Ser Val Thr Lys Ser Ala Val Tyr Cys Cys Lys

    35                  40                  45Phe Gly Arg Ala Cys Glu Met Asp Met Tyr Met Arg Arg Lys Cys Gln

50                  55                  60Glu Cys Arg Leu Lys Lys Cys Leu Ala Val Gly Met Arg Pro Glu Cys65                  70                  75                  80Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg Glu Lys Lys Ala

            85                  90                  95Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser Ser Gln His Gly

        100                 105                 110Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp Phe Val Lys Lys

    115                 120                 125Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln His Ala Thr Ile

130                 135                 140Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln Ala Arg Asn Ile145                 150                 155                 160Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr Lys Leu Ile Trp

            165                 170                 175Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile

        180                 185                 190Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg

    195                 200                 205His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe

210                 215                 220Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile225                 230                 235                 240Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala

            245                 250                 255Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg

        260                 265                 270Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile

    275             280                     285Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp

290                 295                 300Asn ValG lu Tyr Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg305                 310                 315                 320Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr

            325                 330                 335Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser

        340                 345                 350Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu

    355                 360                 365Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu

370                 375                 380Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His385                 390                 395                 400Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu

            405                 410                 415Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly

        420                 425                 430Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala

    435                 440                 445Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro

450                 455                 460Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu465                 470                 475                 480Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu

            485                 490                 495Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro

        500                 505                 510Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro

    515                 520                 525Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser

530                 535                 540Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala545                 550                 555                 560Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly

            565                 570                 575Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn

        580                 585                 590Ala Gln Thr Ala Met Ala Leu Met Gly ValAla Leu His Ser His Gln

    595                 600                605Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr

610                 615                 620Ala625<210>17<211>583<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>17Ala Val Tyr Cys Cys Lys Phe Gly Arg Ala Cys Glu Met Asp Met Tyr1               5                   10                  15Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val

        20                  25                  30Gly Met Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys

    35                  40                  45Arg Arg Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser

50                  55                  60Pro Ser Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly65                  70                  75                  80Gln Asp Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro

            85                  90                  95Pro Gln His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys

        100                 105                 110Cys Gln Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val

    115                 120                 125Ile Tyr Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu

130                 135                 140Glu Asp Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln145                 150                 155                 160Thr Asp Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val

            165                 170                 175Gln Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile

        180                 185                 190Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val

    195                 200                 205Met Met Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile

210                 215                 220Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala225                 230                 235                 240Gly Met Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met

            245                 250                 255Phe Ser Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile

        260                 265                 270Val Ile Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu

    275                 280                 285Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn

290                 295                 300Arg His Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu305                 310                 315                 320Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met

            325                 330                 335Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu

        340                 345                 350Glu Ile Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu

    355                 360                 365Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met

370                 375                 380Arg Ala Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser385                 390                 395                 400Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro

            405                 410                 415Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His

        420                 425                 430Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly

    435                 440                 445Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro

450                 455                 460Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro465                 470                 475                 480Ala Ser Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser

            485                 490                 495Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr

        500                 505                 510Thr Ser Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala

    515                 520                 525Val Pro Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn

530                 535                 540Val Ser Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val545                 550                 555                 560Ala Leu His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys

            565                 570                 575Ser Glu His Ser Thr Thr Ala

        580<210>18<211>549<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>18Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg1               5                   10                  15Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser

        20                  25                  30Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp

    35                  40                  45Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln

50                  55                  60His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln65                  70                  75                  80Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr

            85                  90                  95Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp

        100                 105                 110Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp

    115                 120                 125Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu

130                 135                 140Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln145                 150                 155                 160Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

            165                 170                 175Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe

        180                 185                 190Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met

    195                 200                 205Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser

210                 215                 220Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile225                 230                 235                 240Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile

            245                 250                 255Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His

        260                 265                 270Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile

    275                 280                 285Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe

290                 295                 300Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile305                 310                 315                 320Trp Asp Val His Ala Ile Pro Pro Ser Val Gln Ser His Leu Gln Ile

            325                 330                 335Thr Gln Glu Glu Asn Glu Arg Leu Glu Arg Ala Glu Arg Met Arg Ala

        340                 345                 350Ser Val Gly Gly Ala Ile Thr Ala Gly Ile Asp Cys Asp Ser Ala Ser

    355                 360                 365Thr Ser Ala Ala Ala Ala Ala Ala Gln His Gln Pro Gln Pro Gln Pro

370                 375                 380Gln Pro Gln Pro Ser Ser Leu Thr Gln Asn Asp Ser Gln His Gln Thr385                 390                 395                 400Gln Pro Gln Leu Gln Pro Gln Leu Pro Pro Gln Leu Gln Gly Gln Leu

            405                 410                 415Gln Pro Gln Leu Gln Pro Gln Leu Gln Thr Gln Leu Gln Pro Gln Ile

        420                 425                 430Gln Pro Gln Pro Gln Leu Leu Pro Val Ser Ala Pro Val Pro Ala Ser

    435                 440                445Val Thr Ala Pro Gly Ser Leu Ser Ala Val Ser Thr Ser Ser Glu Tyr

450                 455                 460Met Gly Gly Ser Ala Ala Ile Gly Pro Ile Thr Pro Ala Thr Thr Ser465                 470                 475                 480Ser Ile Thr Ala Ala Val Thr Ala Ser Ser Thr Thr Ser Ala Val Pro

            485                 490                 495Met Gly Asn Gly Val Gly Val Gly Val Gly Val Gly Gly Asn Val Ser

        500                 505                 510Met Tyr Ala Asn Ala Gln Thr Ala Met Ala Leu Met Gly Val Ala Leu

    515                 520                 525His Ser His Gln Glu Gln Leu Ile Gly Gly Val Ala Val Lys Ser Glu

530                 535                 540His Ser Thr Thr Ala545<210>19<21l>445<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>19Tyr Glu Gln Pro Ser Glu Glu Asp Leu Arg Arg Ile Met Ser Gln Pro1               5                   10                  15Asp Glu Asn Glu Ser Gln Thr Asp Val Ser Phe Arg His Ile Thr Glu

        20                  25                  30Ile Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu

    35                  40                  45Pro Ala Phe Thr Lys Ile Pro Gln Glu Asp Gln Ile Thr Leu Leu Lys

50                  55                  60Ala Cys Ser Ser Glu Val Met Met Leu Arg Met Ala Arg Arg Tyr Asp65                  70                  75                  80His Ser Ser Asp Ser Ile Phe Phe Ala Asn Asn Arg Ser Tyr Thr Arg

            85                  90                  95Asp Ser Tyr Lys Met Ala Gly Met Ala Asp Asn Ile Glu Asp Leu Leu

        100                 105                 110His Phe Cys Arg Gln Met Phe Ser Met Lys Val Asp Asn Val Glu Tyr

    115                 120                 125Ala Leu Leu Thr Ala Ile Val Ile Phe Ser Asp Arg Pro Gly Leu Glu

130                 135                 140Lys Ala Gln Leu Val Glu Ala Ile Gln Ser Tyr Tyr Ile Asp Thr Leu145                 150                 155                 160Arg Ile Tyr Ile Leu Asn Arg His Cys Gly Asp Ser Met Ser Leu Val

            165                 170                 175Phe Tyr Ala Lys Leu Leu Ser Ile Leu Thr Glu Leu Arg Thr Leu Gly

        180                 185                 190Asn Gln Asn Ala Glu Met Cys Phe Ser Leu Lys Leu Lys Asn Arg Lys

    195                 200                 205Leu Pro Lys Phe Leu Glu Glu Ile Trp Asp Val His Ala Ile Pro Pro

210                 215                 220Ser Val Gln Ser His Leu Gln Ile Thr Gln Glu Glu Asn Glu Arg Leu225                 230                 235                 240Glu Arg Ala Glu Arg Met Arg Ala Ser Val Gly Gly Ala Ile Thr Ala

            245                 250                 255Gly Ile Asp Cys Asp Ser Ala Ser Thr Ser Ala Ala Ala Ala Ala Ala

        260                 265                 270Gln His Gln Pro Gln Pro Gln Pro Gln Pro Gln Pro Ser Ser Leu Thr

    275                 280                 285Gln Asn Asp Ser Gln His Gln Thr Gln Pro Gln Leu Gln Pro Gln Leu

290                 295                 300Pro Pro Gln Leu Gln Gly Gln Leu Gln Pro Gln Leu Gln Pro Gln Leu305                 310                 315                 320Gln Thr Gln Leu Gln Pro Gln Ile Gln Pro Gln Pro Gln Leu Leu Pro

            325                 330                 335Val Ser Ala Pro Val Pro Ala Ser Val Thr Ala Pro Gly Ser Leu Ser

        340                 345                 350Ala Val Ser Thr Ser Ser Glu Tyr Met Gly Gly Ser Ala Ala Ile Gly

    355                 360                 365Pro Ile Thr Pro Ala Thr Thr Ser Ser Ile Thr Ala Ala Val Thr Ala

370                 375                 380Ser Ser Thr Thr Ser Ala Val Pro Met Gly Asn Gly Val Gly Val Gly385                 390                 395                 400Val Gly Val Gly Gly Asn Val Ser Met Tyr Ala Asn Ala Gln Thr Ala

            405                 410                 415Met Ala Leu Met Gly Val Ala Leu His Ser His Gln Glu Gln Leu Ile

        420                 425                 430Gly Gly Val Ala Val Lys Ser Glu His Ser Thr Thr Ala

    435                 440                 445<210>20<21l>323<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>20Arg Pro Glu Cys Val Val Pro Glu Asn Gln Cys Ala Met Lys Arg Arg1               5                   10                  15Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Met Thr Thr Ser Pro Ser

        20                  25                  30Ser Gln His Gly Gly Asn Gly Ser Leu Ala Ser Gly Gly Gly Gln Asp

    35                  40                  45Phe Val Lys Lys Glu Ile Leu Asp Leu Met Thr Cys Glu Pro Pro Gln

50                  55                  60His Ala Thr Ile Pro Leu Leu Pro Asp Glu Ile Leu Ala Lys Cys Gln65                  70                  75                  80Ala Arg Asn Ile Pro Ser Leu Thr Tyr Asn Gln Leu Ala Val Ile Tyr

            85                  90                  95Lys Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Glu Glu Asp

        100                 105                 1l0Leu Arg Arg Ile Met Ser Gln Pro Asp Glu Asn Glu Ser Gln Thr Asp

    115                 120                 125Val Ser Phe Arg His Ile Thr Glu Ile Thr Ile Leu Thr Val Gln Leu

130                 135                 140Ile Val Glu Phe Ala Lys Gly Leu Pro Ala Phe Thr Lys Ile Pro Gln145                 150                 155                 160Glu Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met

            165                 170                 175Leu Arg Met Ala Arg Arg Tyr Asp His Ser Ser Asp Ser Ile Phe Phe

        180                 185                 190Ala Asn Asn Arg Ser Tyr Thr Arg Asp Ser Tyr Lys Met Ala Gly Met

    195                 200                 205Ala Asp Asn Ile Glu Asp Leu Leu His Phe Cys Arg Gln Met Phe Ser

210                 215                 220Met Lys Val Asp Asn Val Glu Tyr Ala Leu Leu Thr Ala Ile Val Ile225                 230                 235                 240Phe Ser Asp Arg Pro Gly Leu Glu Lys Ala Gln Leu Val Glu Ala Ile

            245                250                  255Gln Ser Tyr Tyr Ile Asp Thr Leu Arg Ile Tyr Ile Leu Asn Arg His

        260                 265                 270Cys Gly Asp Ser Met Ser Leu Val Phe Tyr Ala Lys Leu Leu Ser Ile

    275                 280                 285Leu Thr Glu Leu Arg Thr Leu Gly Asn Gln Asn Ala Glu Met Cys Phe

290                 295                 300Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Lys Phe Leu Glu Glu Ile305                 310                 315                 320Trp Asp Val<210>21<211>987<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>21tgtgctatct gtggggaccg ctcctcaggc aaacactatg gggtatacag ttgtgagggc     60tgcaagggct tcttcaagag gacagtacgc aaagacctga cctacacctg ccgagacaac    120aaggactgcc tgatcgacaa gagacagcgg aaccggtgtc agtactgccg ctaccagaag    180tgcctggcca tgggcatgaa gcgggaagct gtgcaggagg agcggcagcg gggcaaggac    240cggaatgaga acgaggtgga gtccaccagc agtgccaacg aggacatgcc tgtagagaag    300attctggaag ccgagcttgc tgtcgagccc aagactgaga catacgtgga ggcaaacatg    360gggctgaacc ccagctcacc aaatgaccct gttaccaaca tctgtcaagc agcagacaag    420cagctcttca ctcttgtgga gtgggccaag aggatcccac acttttctga gctgccccta    480gacgaccagg tcatcctgct acgggcaggc tggaacgagc tgctgatcgc ctccttctcc    540caccgctcca tagctgtgaa agatgggatt ctcctggcca ccggcctgca cgtacaccgg    600aacagcgctc acagtgctgg ggtgggcgcc atctttgaca gggtgctaac agagctggtg    660tctaagatgc gtgacatgca gatggacaag acggagctgg gctgcctgcg agccattgtc    720ctgttcaacc ctgactctaa ggggctctca aaccctgctg aggtggaggc gttgagggag    780aaggtgtatg cgtcactaga agcgtactgc aaacacaagt accctgagca gccgggcagg    840tttgccaagc tgctgctccg cctgcctgca ctgcgttcca tcgggctcaa gtgcctggag    900cacctgttct tcttcaagct catcggggac acgcccatcg acaccttcct catggagatg    960ctggaggcac cacatcaagc cacctag                                        987<210>22<211>789<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>22aagcgggaag ctgtgcagga ggagcggcag cggggcaagg accggaatga gaacgaggtg     60gagtccacca gcagtgccaa cgaggacatg cctgtagaga agattctgga agccgagctt    120gctgtcgagc ccaagactga gacatacgtg gaggcaaaca tggggctgaa ccccagctca    180ccaaatgacc ctgttaccaa catctgtcaa gcagcagaca agcagctctt cactcttgtg    240gagtgggcca agaggatccc acacttttct gagctgcccc tagacgacca ggtcatcctg    300ctacgggcag gctggaacga gctgctgatc gcctccttct cccaccgctc catagctgtg    360aaagatggga ttctcctggc caccggcctg cacgtacacc ggaacagcgc tcacagtgct    420ggggtgggcg ccatctttga cagggtgcta acagagctgg tgtctaagat gcgtgacatg    480cagatggaca agacggagct gggctgcctg cgagccattg tcctgttcaa ccctgactct    540aaggggctct caaaccctgc tgaggtggag gcgttgaggg agaaggtgta tgcgtcacta    600gaagcgtact gcaaacacaa gtaccctgag cagccgggca ggtttgccaa gctgctgctc    660cgcctgcctg cactgcgttc catcgggctc aagtgcctgg agcacctgtt cttcttcaag    720ctcatcgggg acacgcccat cgacaccttc ctcatggaga tgctggaggc accacatcaa    780gccacctag                                                            789<210>23<211>714<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>23gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag     60actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt    120accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg    180atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg    240aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc    300ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgetggggt gggcgccatc    360tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg    420gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac    480cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa    540cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg    600cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg    660cccatcgaca ccttcctcat ggagatgctg gaggcaccac atcaagccac ctag          714<210>24<211>536<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>24ggatcccaca cttttctgag ctgcccctag acgaccaggt catcctgcta cgggcaggct     60ggaacgagct gctgatcgcc tccttctccc accgctccat agctgtgaaa gatgggattc    120tcctggccac cggcctgcac gtacaccgga acagcgctca cagtgctggg gtgggcgcca    180tctttgacag ggtgctaaca gagctggtgt ctaagatgcg tgacatgcag atggacaaga    240cggagctggg ctgcctgcga gccattgtcc tgttcaaccc tgactctaag gggctctcaa    300accctgctga ggtggaggcg ttgagggaga aggtgtatgc gtcactagaa gcgtactgca    360aacacaagta ccctgagcag ccgggcaggt ttgccaagct gctgctccgc ctgcctgcac    420tgcgttccat cgggctcaag tgcctggagc acctgttctt cttcaagctc atcggggaca    480cgcccatcga caccttcctc atggagatgc tggaggcacc acatcaagcc acctag        536<210>25<211>672<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>25gccaacgagg acatgcctgt agagaagatt ctggaagccg agcttgctgt cgagcccaag     60actgagacat acgtggaggc aaacatgggg ctgaacccca gctcaccaaa tgaccctgtt    120accaacatct gtcaagcagc agacaagcag ctcttcactc ttgtggagtg ggccaagagg    180atcccacact tttctgagct gcccctagac gaccaggtca tcctgctacg ggcaggctgg    240aacgagctgc tgatcgcctc cttctcccac cgctccatag ctgtgaaaga tgggattctc    300ctggccaccg gcctgcacgt acaccggaac agcgctcaca gtgctggggt gggcgccatc    360tttgacaggg tgctaacaga gctggtgtct aagatgcgtg acatgcagat ggacaagacg    420gagctgggct gcctgcgagc cattgtcctg ttcaaccctg actctaaggg gctctcaaac    480cctgctgagg tggaggcgtt gagggagaag gtgtatgcgt cactagaagc gtactgcaaa    540cacaagtacc ctgagcagcc gggcaggttt gccaagctgc tgctccgcct gcctgcactg    600cgttccatcg ggctcaagtg cctggagcac ctgttcttct tcaagctcat cggggacacg    660cccatcgaca cc                                                        672<210>26<211>1123<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>26tgcgccatct gcggggaccg ctcctcaggc aagcactatg gagtgtacag ctgcgagggg     60tgcaagggct tcttcaagcg gacggtgcgc aaggacctga cctacacctg ccgcgacaac    120aaggactgcc tgattgacaa gcggcagcgg aaccggtgcc agtactgccg ctaccagaag    180tgcctggcca tgggcatgaa gcgggaagcc gtgcaggagg agcggcagcg tggcaaggac    240cggaacgaga atgaggtgga gtcgaccagc agcgccaacg aggacatgcc ggtggagagg    300atcctggagg ctgagctggc cgtggagccc aagaccgaga cctacgtgga ggcaaacatg    360gggctgaacc ccagctcgcc gaacgaccct gtcaccaaca tttgccaagc agccgacaaa    420cagcttttca ccctggtgga gtgggccaag cggatcccac acttctcaga gctgcccctg    480gacgaccagg tcatcctgct gcgggcaggc tggaatgagc tgctcatcgc ctccttctcc    540caccgctcca tcgccgtgaa ggacgggatc ctcctggcca ccgggctgca cgtccaccgg    600aacagcgccc acagcgcagg ggtgggcgcc atctttgaca gggtgctgac ggagcttgtg    660tccaagatgc gggacatgca gatggacaag acggagctgg gctgcctgcg cgccatcgtc    720ctctttaacc ctgactccaa ggggctctcg aacccggccg aggtggaggc gctgagggag    780aaggtctatg cgtccttgga ggcctactgc aagcacaagt acccagagca gccgggaagg    840ttcgctaagc tcttgctccg cctgccggct ctgcgctcca tcgggctcaa atgcctggaa    900catctcttct tcttcaagct catcggggac acacccattg acaccttcct tatggagatg    960ctggaggcgc cgcaccaaat gacttaggcc tgcgggccca tcctttgtgc ccacccgttc   1020tggccaccct gcctggacgc cagctgttct tctcagcctg agccctgtcc ctgcccttct   1080ctgcctggcc tgtttggact ttggggcaca gcctgtcact gct                     1123<210>27<211>925<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>27aagcgggaag ccgtgcagga ggagcggcag cgtggcaagg accggaacga gaatgaggtg     60gagtcgacca gcagcgccaa cgaggacatg ccggtggaga ggatcctgga ggctgagctg    120gccgtggagc ccaagaccga gacctacgtg gaggcaaaca tggggctgaa ccccagctcg    180ccgaacgacc ctgtcaccaa catttgccaa gcagccgaca aacagctttt caccctggtg    240gagtgggcca agcggatccc acacttctca gagctgcccc tggacgacca ggtcatcctg    300ctgcgggcag gctggaatga gctgctcatc gcctccttct cccaccgctc catcgccgtg    360aaggacggga tcctcctggc caccgggctg cacgtccacc ggaacagcgc ccacagcgca    420ggggtgggcg ccatctttga cagggtgctg acggagcttg tgtccaagat gcgggacatg    480cagatggaca agacggagct gggctgcctg cgcgccatcg tcctctttaa ccctgactcc    540aaggggctct cgaacccggc cgaggtggag gcgctgaggg agaaggtcta tgcgtccttg    600gaggcctact gcaagcacaa gtacccagag cagccgggaa ggttcgctaa gctcttgctc    660cgcctgccgg ctctgcgctc catcgggctc aaatgcctgg aacatctctt cttcttcaag    720ctcatcgggg acacacccat tgacaccttc cttatggaga tgctggaggc gccgcaccaa    780atgacttagg cctgcgggcc catcctttgt gcccacccgt tctggccacc ctgcctggac    840gccagctgtt cttctcagcc tgagccctgt ccctgccctt ctctgcctgg cctgtttgga    900ctttggggca cagcctgtca ctgct                                          925<210>28<211>850<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>28gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag     60accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc    120accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg    180atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg    240aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc    300ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc    360tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg    420gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac    480ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag    540cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg    600cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca    660cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc    720gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct    780cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc    840tgtcactgct                                                           850<210>29<211>670<2t2>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>29atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg     60aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc    120ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc    180tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg    240gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac    300ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag    360cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg    420cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca    480cccattgaca ccttccttat ggagatgctg gaggcgccgc accaaatgac ttaggcctgc    540gggcccatcc tttgtgccca cccgttctgg ccaccctgcc tggacgccag ctgttcttct    600cagcctgagc cctgtccctg cccttctctg cctggcctgt ttggactttg gggcacagcc    660tgtcactgct                                                           670<210>30<211>672<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>30gccaacgagg acatgccggt ggagaggatc ctggaggctg agctggccgt ggagcccaag     60accgagacct acgtggaggc aaacatgggg ctgaacccca gctcgccgaa cgaccctgtc    120accaacattt gccaagcagc cgacaaacag cttttcaccc tggtggagtg ggccaagcgg    180atcccacact tctcagagct gcccctggac gaccaggtca tcctgctgcg ggcaggctgg    240aatgagctgc tcatcgcctc cttctcccac cgctccatcg ccgtgaagga cgggatcctc    300ctggccaccg ggctgcacgt ccaccggaac agcgcccaca gcgcaggggt gggcgccatc    360tttgacaggg tgctgacgga gcttgtgtcc aagatgcggg acatgcagat ggacaagacg    420gagctgggct gcctgcgcgc catcgtcctc tttaaccctg actccaaggg gctctcgaac    480ccggccgagg tggaggcgct gagggagaag gtctatgcgt ccttggaggc ctactgcaag    540cacaagtacc cagagcagcc gggaaggttc gctaagctct tgctccgcct gccggctctg    600cgctccatcg ggctcaaatg cctggaacat ctcttcttct tcaagctcat cggggacaca    660cccattgaca cc                                                        672<210>31<211>328<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>31Cys Ala Ile Cys Gly Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr1               5                   10                  15Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp

        20                  25                  30Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg

    35                  40                  45Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met

50                  55                  60Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp65                  70                  75                  80Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met

            85                  90                  95Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr

        100                 105                 110Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn

    115                 120                 125Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr

130                135                 140Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu145                 150                 155                 160Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile

            165                 170                 175Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu

        180                 185                 190Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val

    195                 200                 205Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg

210                 215                 220Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val225                 230                 235                 240Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu

            245                 250                 255Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His

        260                 265                 270Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu

    275                 280                 285Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe

290                 295                 300Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met305                 310                 315                 320Leu Glu Ala Pro His Gln Ala Thr

            325<210>32<211>262<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>32Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn1               5                   10                  15Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val

        20                  25                  30Glu Lys Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr

    35                  40                  45Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro

50                  55                  60Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val65                  70                  75                  80Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp

            85                  90                  95Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser

        100                 105                 110Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr

    115                 120                 125Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala

130                 135                 140Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met

145                 150                 155                 160Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe

            165                 170                 175Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu

        180                 185                 190Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr

    195                 200                 205Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala

210                 215                 220Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys225                 230                 235                 240Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu

            245                 250                 255Ala Pro His Gln Ala Thr

        260<210>33<211>237<212>PRT<213>人工序列<220><22l>misc_feature<223>新序列<400>33Ala Asn Glu Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala1               5                   10                  15Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

        20                  25                  30Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

    35                  40                  45Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50                  55                  60Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp65                  70                  75                  80Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

            85                  90                  95Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

        100                 105                 110His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

    115                 120                 125Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130                 135                 140Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn145                 150                 155                 160Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

            165                 170                 175Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

        180                 185                 190Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

    195                 200                 205Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210                 215                 220Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala Thr225                 230                 235<210>34<211>177<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>34Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu1               5                   10                  15Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

        20                  25                  30Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His

    35                  40                  45Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala lle Phe Asp Arg Val

50                  55                  60Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr65                  70                  75                  80Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys

            85                  90                  95Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr

        100                 105                 110Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly

    115                 120                 125Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130                 135                 140Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr145                 150                 155                 160Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Ala

            165                 170                 175Thr<210>35<211>224<212>PRT<213>人工序列<220><22l>misc_feature<223>新序列<400>35Ala Asn G1u Asp Met Pro Val Glu Lys Ile Leu Glu Ala Glu Leu Ala1               5                   10                  15Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

        20                  25                  30Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

    35                  40                  45Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50                  55                  60Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp65                  70                  75                  80Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

            85                  90                  95Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

        100                 105                 110His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

    115                 120                 125Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130                 135                 140Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn145                 150                 155                 160Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

            165                 170                 175Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

        180                 185                 190Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

    195                 200                 205Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210                 215                 220<210>36<211>328<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>36Cys Ala Ile Cys G1y Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr1               5                   10                  15Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp

        20                  25                  30Leu Thr Tyr Thr Cys Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg

    35                  40                  45Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met

50                  55                  60Gly Met Lys Arg Glu Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp65                  70                  75                  80Arg Asn Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met

            85                  90                  95Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr

        100                 105                 1l0Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn

    115                 120                 125Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr

130                 135                 140Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu145                 150                 155                 160Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile

            165                 170                 175Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu

        180                 185                 190Ala Thr Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val

    195                 200                 205Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg

210                 215                 220Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val225                 230                 235                 240Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu

            245                 250                 255Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His

        260                 265                 270Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu

    275                 280                 285Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe

290                 295                 300Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met305                 310                 315                 320Leu Glu Ala Pro His Gln Met Thr

            325<210>37<211>262<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>37Lys Arg Glu Ala Val Gln Glu Glu Arg G1n Arg G1y Lys Asp Arg Asn1               5                   10                  15Glu Asn Glu Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val

        20                  25                  30Glu Arg Ile Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr

    35                  40                  45Tyr Val Glu Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro

50                  55                  60Val Thr Asn Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val65                  70                  75                  80Glu Trp Ala Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp

            85                  90                  95Gln Val Ile Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser

        100                 105                 110Phe Ser His Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr

    115                 120                 125Gly Leu His Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala

130                 135                 140Ile Phe Asp Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met145                 150                 155                 160G1n Met Asp Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe

            165                 170                 175Asn Pro Asp Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu

        180                 185                 190Arg Glu Lys Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr

    195                 200                 205Pro Glu Gln Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala

210                 215                 220Leu Arg Ser Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys225                 230                 235                 240Leu Ile Gly Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu

            245                 250                 255Ala Pro His Gln Met Thr

        260<210>38<211>237<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>38Ala Asn Glu Asp Met Pro Val Glu Arg Ile Leu Glu Ala Glu Leu Ala1               5                   10                  15Val Glu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

        20                  25                  30Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

    35                  40                  45Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50                  55                  60Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp65                  70                  75                  80Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

            85                  90                  95Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

        100                 105                 110His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

    115                 120                 125Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130                 135                 140Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn145                 150                 155                 160Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

            165                 170                 175Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

        180                 185                 190Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

    195                 200                 205Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210                 215                 220Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met Thr225                 230                 235<210>39<211>177<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>39Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu1               5                   10                  15Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser

        20                  25                  30Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His

    35                  40                  45Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val

50                  55                  60Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr65                  70                  75                   80Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys

            85                  90                  95Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys ValTyr

        100                 105                 110Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly

    115                 120                 125Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly

130                 135                 140Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr145                 150                 155                 160Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His Gln Met

            165             170             175Thr<210>40<211>224<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>40Ala Asn Glu Asp Met Pro ValGlu Arg Ile Leu Glu Ala Glu Leu Ala1               5                  10                  15ValGlu Pro Lys Thr Glu Thr Tyr Val Glu Ala Asn Met Gly Leu Asn

       20                  25                  30Pro Ser Ser Pro Asn Asp Pro Val Thr Asn Ile Cys Gln Ala Ala Asp

    35                  40                   45Lys Gln Leu Phe Thr Leu Val Glu Trp Ala Lys Arg Ile Pro His Phe

50                  55                  60Ser Glu Leu Pro Leu Asp Asp Gln Val Ile Leu Leu Arg Ala Gly Trp65                  70                  75                  80Asn Glu Leu Leu Ile Ala Ser Phe Ser His Arg Ser Ile Ala Val Lys

            85                  90                  95Asp Gly Ile Leu Leu Ala Thr Gly Leu His Val His Arg Asn Ser Ala

        100                 105                 110His Ser Ala Gly Val Gly Ala Ile Phe Asp Arg Val Leu Thr Glu Leu

    115                 120                 125Val Ser Lys Met Arg Asp Met Gln Met Asp Lys Thr Glu Leu Gly Cys

130                 135                 140Leu Arg Ala Ile Val Leu Phe Asn Pro Asp Ser Lys Gly Leu Ser Asn145                 150                 155                 160Pro Ala Glu Val Glu Ala Leu Arg Glu Lys Val Tyr Ala Ser Leu Glu

            165                 170                 175Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln Pro Gly Arg Phe Ala Lys

        180                 185                 190Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile Gly Leu Lys Cys Leu

    195                 200                 205Glu His Leu Phe Phe Phe Lys Leu Ile Gly Asp Thr Pro Ile Asp Thr

210                 215                 220<210>41<211>441<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>41atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag     60tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac    120tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg    180ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt    240ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat    300aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta    360acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt    420caaagacagt tgactgtatc g                                              441<210>42<211>147<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>42Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu1               5                   10                  15Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu

        20                  25                  30Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro

    35                  40                  45Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu

50                  55                  60Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile65                  70                  75                  80Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu

            85                  90                  95Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala

        100                 105                 1l0Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser

    115                 120                 125Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu

130                 135                 140Thr Val Ser145<210>43<211>606<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>43atgaaagcgt taacggccag gcaacaagag gtgtttgatc tcatccgtga tcacatcagc     60cagacaggta tgccgccgac gcgtgcggaa atcgcgcagc gtttggggtt ccgttcccca    120aacgcggctg aagaacatct gaaggcgctg gcacgcaaag gcgttattga aattgtttcc    180ggcgcatcac gcgggattcg tctgttgcag gaagaggaag aagggttgcc gctggtaggt    240cgtgtggctg ccggtgaacc acttctggcg caacagcata ttgaaggtca ttatcaggtc    300gatccttcct tattcaagcc gaatgctgat ttcctgctgc gcgtcagcgg gatgtcgatg    360aaagatatcg gcattatgga tggtgacttg ctggcagtgc ataaaactca ggatgtacgt    420aacggtcagg tcgttgtcgc acgtattgat gacgaagtta ccgttaagcg cctgaaaaaa    480cagggcaata aagtcgaact gttgccagaa aatagcgagt ttaaaccaat tgtcgtagat    540cttcgtcagc agagcttcac cattgaaggg ctggcggttg gggttattcg caacggcgac    600tggctg                                                               606<210>44<211>202<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>44Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg1               5                   10                  15Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

        20                  25                  30Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys

    35                  40                  45Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50                  55                  60Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly65                  70                  75                  80Arg Val Ala Ala Gly Glu Pro Leu Leu Ala Gln Gln His Ile Glu Gly

            85                  90                  95His Tyr Gln Val Asp Pro Ser Leu Pne Lys Pro Asn Ala Asp Phe Leu

        100                 105                 110Leu Arg Val Ser Gly Met Ser Met Lys Asp lle Gly Ile Met Asp Gly

    115                 120                 125Asp Leu Leu Ala Val His Lys Thr Gln Asp Val Arg Asn Gly Gln Val

130                 135                 140Val Val Ala Arg Ile Asp Asp Glu Val Thr Val Lys Arg Leu Lys Lys145                 150                 155                 160Gln Gly Asn Lys Val Glu Leu Leu Pro Glu Asn Ser Glu Phe Lys Pro

            165                 170                 175Ile Val Val Asp Leu Arg Gln Gln Ser Phe Thr Ile Glu Gly Leu Ala

        180                 185                 190ValGly Val Ile Arg Asn Gly Asp Trp Leu

   195                 200<210>45<211>271<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>45atgggcccta aaaagaagcg taaagtcgcc cccccgaccg atgtcagcct gggggacgag     60ctccacttag acggcgagga cgtggcgatg gcgcatgccg acgcgctaga cgatttcgat    120ctggacatgt tgggggacgg ggattccccg gggccgggat ttacccccca cgactccgcc    180ccctacggcg ctctggatat ggccgacttc gagtttgagc agatgtttac cgatgccctt    240ggaattgacg agtacggtgg ggaattcccg g                                   271<210>46<211>90<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>46Met Gly Pro Lys Lys Lys Arg Lys Va1 Ala Pro Pro Thr Asp Val Ser1               5                   10                  15Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His

        20                  25                  30Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp

    35                  40                  45Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala

50                  55                  60Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu65                  70                  75                  80Gly Ile Asp Glu Tyr Gly Gly Glu Phe Pro

            85                  90<210>47<211>19<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>47ggagtactgt cctccgagc                              19<210>48<211>666<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>48ggatccccag cttggaattc gacaggttat cagcaacaac acagtcatat ccattctcaa     60ttagctctac cacagtgtgt gaaccaatgt atccagcacc acctgtaacc aaaacaattt    120tagaagtact ttcactttgt aactgagctg tcatttatat tgaattttca aaaattctta    180cttttttttt ggatggacgc aaagaagttt aataatcata ttacatggca ttaccaccat    240atacatatcc atatacatat ccatatctaa tcttacctcg actgctgtat ataaaaccag    300tggttatatg tacagtactg ctgtatataa aaccagtggt tatatgtaca gtacgtcgac    360tgctgtatat aaaaccagtg gttatatgta cagtactgct gtatataaaa ccagtggtta    420tatgtacagt acgtcgaggg atgataatgc gattagtttt ttagccttat ttctggggta    480attaatcagc gaagcgatga tttttgatct attaacagat atataaatgc aaaaactgca    540taaccacttt aactaatact ttcaacattt tcggtttgta ttacttctta ttcaaatgta    600ataaaagtat caacaaaaaa ttgttaatat acctctatac tttaacgtca aggagaaaaa    660actata                                                               666<210>49<211>1542<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>49ctggacctga aacacgaagt ggcttaccga ggggtgctcc caggccaggt gaaggccgaa     60ccgggggtcc acaacggcca ggtcaacggc cacgtgaggg actggatggc aggcggcgct    120ggtgccaatt cgccgtctcc gggagcggtg gctcaacccc agcctaacaa tgggtattcg    180tcgccactct cctcgggaag ctacgggccc tacagtccaa atgggaaaat aggccgtgag    240gaactgtcgc cagcttcaag tataaatggg tgcagtacag atggcgaggc acgacgtcag    300aagaagggcc ctgcgccccg tcagcaagag gaactgtgtc tggtatgcgg ggacagagcc    360tccggatacc actacaatgc gctcacgtgt gaagggtgta aagggttctt cagacggagt    420gttaccaaaa atgcggttta tatttgtaaa ttcggtcacg cttgcgaaat ggacatgtac    480atgcgacgga aatgccagga gtgccgcctg aagaagtgct tagctgtagg catgaggcct    540gagtgcgtag tacccgagac tcagtgcgcc atgaagcgga aagagaagaa agcacagaag    600gagaaggaca aactgcctgt cagcacgacg acggtggacg accacatgcc gcccattatg    660cagtgtgaac ctccacctcc tgaagcagca aggattcacg aagtggtccc aaggtttctc    720tccgacaagc tgttggagac aaaccggcag aaaaacatcc cccagttgac agccaaccag    780cagttcctta tcgccaggct catctggtac caggacgggt acgagcagcc ttctgatgaa    840gatttgaaga ggattacgca gacgtggcag caagcggacg atgaaaacga agagtctgac    900actcccttcc gccagatcac agagatgact atcctcacgg tccaacttat cgtggagttc    960gcgaagggat tgccagggtt cgccaagatc tcgcagcctg atcaaattac gctgcttaag   1020gcttgctcaa gtgaggtaat gatgctccga gtcgcgcgac gatacgatgc ggcctcagac   1080agtgttctgt tcgcgaacaa ccaagcgtac actcgcgaca actaccgcaa ggctggcatg   1140gcctacgtca tcgaggatct actgcacttc tgccggtgca tgtactctat ggcgttggac   1200aacatccatt acgcgctgct cacggctgtc gtcatctttt ctgaccggcc agggttggag   1260cagccgcaac tggtggaaga aatccagcgg tactacctga atacgctccg catctatatc   1320ctgaaccagc tgagcgggtc ggcgcgttcg tccgtcatat acggcaagat cctctcaatc   1380ctctctgagc tacgcacgct cggcatgcaa aactccaaca tgtgcatctc cctcaagctc   1440aagaacagaa agctgccgcc tttcctcgag gagatctggg atgtggcgga catgtcgcac   1500acccaaccgc cgcctatcct cgagtccccc acgaatctct ag                      1542<210>50<211>513<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>50Leu Asp Leu Lys His Glu Val Ala Tyr Arg Gly Val Leu Pro Gly Gln1               5                   10                  15Val Lys Ala Glu Pro Gly Val His Asn Gly Gln Val Asn Gly His Val

        20                  25                  30Arg Asp Trp Met Ala Gly Gly Ala Gly Ala Asn Ser Pro Ser Pro Gly

    35                  40                  45Ala Val Ala Gln Pro Gln Pro ASn Asn Gly Tyr Ser Ser Pro Leu Ser

50                  55                  60Ser Gly Ser Tyr Gly Pro Tyr Ser Pro Asn Gly Lys Ile Gly Arg Glu65                  70                  75                  80Glu Leu Ser Pro Ala Ser Ser Ile Asn Gly Cys Ser Thr Asp Gly Glu

            85                  90                  95Ala Arg Arg Gln Lys Lys Gly Pro Ala Pro Arg Gln Gln Glu Glu Leu

        100                 105                 110Cys Leu Val Cys Gly Asp Arg Ala Ser Gly Tyr His Tyr Asn Ala Leu

    115                 120                 125Thr Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg Ser Val Thr Lys Asn

130                 135                 140Ala Val Tyr Ile Cys Lys Phe Gly His Ala Cys Glu Met Asp Met Tyr145                 150                 155                 160Met Arg Arg Lys Cys Gln Glu Cys Arg Leu Lys Lys Cys Leu Ala Val

            165                 170                 175Gly Met Arg Pro Glu Cys Val Val Pro Glu Thr Gln Cys Ala Met Lys

        180                 185                 190Arg Lys Glu Lys Lys Ala Gln Lys Glu Lys Asp Lys Leu Pro Val Ser

    195                 200                 205Thr Thr Thr Val Asp Asp His Met Pro Pro Ile Met Gln Cys Glu Pro

210                 215                 220Pro Pro Pro Glu Ala Ala Arg Ile His Glu Val Val Pro Arg Phe Leu225                 230                 235                 240Ser Asp Lys Leu Leu Glu Thr Asn Arg Gln Lys Asn Ile Pro Gln Leu

            245                 250                 255Thr Ala Asn Gln Gln Phe Leu Ile Ala Arg Leu Ile Trp Tyr Gln Asp

        260                 265                 270Gly Tyr Glu Gln Pro Ser Asp Glu Asp Leu Lys Arg Ile Thr Gln Thr

    275                 280                 285Trp Gln Gln Ala Asp Asp Glu Asn Glu Glu Ser Asp Thr Pro Phe Arg

290                 295                 300Gln Ile Thr Glu Met Thr Ile Leu Thr Val Gln Leu Ile Val Glu Phe305                 310                 315                 320Ala Lys Gly Leu Pro Gly Phe Ala Lys Ile Ser Gln Pro Asp Gln Ile

            325                 330                 335Thr Leu Leu Lys Ala Cys Ser Ser Glu Val Met Met Leu Arg Val Ala

        340                 345                 350Arg Arg Tyr Asp Ala Ala Ser Asp Ser Val Leu Phe Ala Asn Asn Gln

    355                 360                 365Ala Tyr Thr Arg Asp Asn Tyr Arg Lys Ala Gly Met Ala Tyr Val Ile

370                 375                 380Glu Asp Leu Leu His Phe Cys Arg Cys Met Tyr Ser Met Ala Leu Asp385                 390                 395                 400Asn Ile His Tyr Ala Leu Leu Thr Ala Val Val Ile Phe Ser Asp Arg

            405                 410                 415Pro Gly Leu Glu Gln Pro Gln Leu Val Glu Glu Ile Gln Arg Tyr Tyr

            420             425                 430Leu Asn Thr Leu Arg Ile Tyr Ile Leu Asn Gln Leu Ser Gly Ser Ala

        435             440                 445Arg Ser Ser Val Ile Tyr Gly Lys Ile Leu Ser Ile Leu Ser Glu Leu

    450             455                 460Arg Thr Leu Gly Met Gln Asn Ser Asn Met Cys Ile Ser Leu Lys Leu465                 470                 475                 480Lys Asn Arg Lys Leu Pro Pro Phe Leu Glu Glu Ile Trp Asp Val Ala

            485                 490                 495Asp Met Ser His Thr Gln Pro Pro Pro Ile Leu Glu Ser Pro Thr Asn

        500             505             510Leu<210>51<211>4375<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>51tgtaattttg atgggcgccg tgatgcaccg tgtgccatat tgccatccag tcgaatagaa     60aaaaaaaaaa aaaaaaaaat atcagttgtt ttgtccctcg ctcgctttcg agtgtattcg    120gaatattaga cgtcataatt cacgagtgtc ttttaaattt atatagcgat tagcggggcc    180gtttgttgga cgtgcgcttg cgtttagtgg agtgcaggga tagtgaggcg agtatggtag    240ttcgtggtca tgtcaagtgt ggcgaagaaa gacaagccga cgatgtcggt gacggcgctg    300atcaactggg cgcggccggc gccgccaggc ccgccgcagc cgcagtcagc gtcgcctgcg    360ccggcagcca tgctgcagca gctcccgacg cagtcaatgc agtcgttaaa ccacatccca    420actgtcgatt gctcgctcga tatgcagtgg cttaatttag aacctggatt catgtcgcct    480atgtcacctc ctgagatgaa accagacacc gccatgcttg atgggctacg agacgacgcc    540acttcgccgc ctaacttcaa gaactacccg cctaatcacc ccctgagtgg ctccaaacac    600ctatgctcta tatgcggcga cagggcgtct gggaagcact atggggtgta cagttgcgaa    660ggatgcaagg gtttcttcaa gcggaccgtc cggaaggacc tgtcgtacgc ttgccgggag    720gagcggaact gcatcataga caagcgacaa aggaaccgat gccagtactg ccgctatcaa    780aagtgtttgg cttgcggtat gaagcgagag gcggtgcaag aggagcgcca gaggaatgct    840cgcggcgcgg aggatgcgca cccgagtagc tcggtgcagg taagcgatga gctgtcaatc    900gagcgcctaa cggagatgga gtctttggtg gcagatccca gcgaggagtt ccagttcctc    960cgcgtggggc ctgacagcaa cgtgcctcca cgttaccgcg cgcccgtctc ctccctctgc   1020caaataggca acaagcaaat agcggcgttg gtggtatggg cgcgcgacat ccctcatttc   1080gggcagctgg agctggacga tcaagtggta ctcatcaagg cctcctggaa tgagctgcta   1140ctcttcgcca tcgcctggcg ctctatggag tatttggaag atgagaggga gaacggggac   1200ggaacgcgga gcaccactca gccacaactg atgtgtctca tgcctggcat gacgttgcac   1260cgcaactcgg cgcagcaggc gggcgtgggc gccatcttcg accgcgtgct gtccgagctc   1320agtctgaaga tgcgcacctt gcgcatggac caggccgagt acgtcgcgct caaagccatc   1380gtgctgctca accctgatgt gaaaggactg aagaatcggc aagaagttga cgttttgcga   1440gaaaaaatgt tctcttgcct ggacgactac tgccggcggt cgcgaagcaa cgaggaaggc   1500cggtttgcgt ccttgctgct gcggctgcca gctctccgct ccatctcgct caagagcttc   1560gaacacctct acttcttcca cctcgtggcc gaaggctcca tcagcggata catacgagag   1620gcgctccgaa accacgcgcc tccgatcgac gtcaatgcca tgatgtaaag tgcgatacac   1680gccctgccga tgtgagaaga actatggcta atagaagcga aactgaatac atctagggtg   1740ggacttaact tgggactatc attaaagtat cacgcaaatt atgcgtagtc agaaagtcgc   1800gtcgatcaaa cttttttata aacgaattga gtttctaacg actgcaacac agcggagttt   1860tgcttctgat agtttttatt ctaatggtta agatgcttta cacgggcatt attgacattc   1920aagtgtaagt ggaagttgac aaccttgaca tttatatcac gtttgtaatt ggttaaataa   1980attaattaat cacaagtaag actaacatca acgtcacgat actaacgcca tttagtgata   2040tttttcatgt caagaaactc attgttttga taaaatattt ttctaattac tccagtgaac   2100tcatccaaat gtgacccagt ttcccgcaga gttgcccgtg taaaatcatc tttagggaca   2160tatcccccgc tatctcatga aattccaagg atcagtaggg gccaattccc ccgatgtgtt   2220gggaggcaga attttcgata atctacgact attgttagcc tacgaattag ttgaattttt   2280tgaaattatt tttattaagt cgccactttc caaacacatc agcagggtat atgtgcaatt   2340ttgtaacgat aactctattc atttctgata tttatcgaaa ttttatctta cataacatgc   2400tggctggtcc aggtgtttgg tagttacata tgtatctacg gtttgtttta aattatagct   2460tttttattgt aatctgtata aaattgagtt atcttacttc acactacgat cgagtaaacc   2520catcgtcagc tacgaaaaac taatcgtata aggcgtaaga gtaaataact aattgacaac   2580cagcaacgag gaccacctca gtcctcgtgc ttacattgtg ccgtagctta atatgatgga   2640agctgtcgtc gttacgacat tagataaagt gcatgaatac caaaaatgta ccatcccgta   2700ctgatctctc atgctctcgc tgcgtgggac ccgtgtcgag tgtcgtaagg actgactaat   2760attttagact aggcgtctat gcttcagtaa ttccttatac atattataag tcatccaaat   2820aacgagtaag gcggcatgtt gagatcagca ttccgagagt caaagagccc ctaacgtgac   2880tgagaagtag agacaataca ctgattttct gagatgaacg caaccgagat tgacactaaa   2940aatctattta tggatttcaa aatggcgatg cttgattgtc tgcggcgtgg atagactgaa   3000atgggtttgc ttaacactgg atattgtttt tattagttaa tagtcttaca ttgcaagttg   3060gtaattcggt gctaatatcg accggtttgt taactatcta acggttccca gtgtcaggca   3120cacatctttc ccaagcagac aacgcaagag tgtacaaaat gtacatgtta caaaataagg   3180aacattcgtc ggataagtgt aacagttgat aggtaaagaa aatggggccg cctctttatt   3240attacgtagc cgtaaaatta ttaacgtatt tagtttagat gttcagctaa ttaggataat   3300tctatttgtc gagtacctag atgtccatag tgaattaata taataattag actgttacgc   3360gtaggtaatt ataaagttta ccaaatctct cttcaaagca aaaactttgt acacttccgt   3420actgagacgt cgtagcttat tctgattcac gaaatatttg gatcacattg ttacaaggcg   3480accgtcacgt agtatatgat tatttacaaa tgacacgtat gtatcaatgc tataagtgtt   3540ttcgttacat atgtcggtgc tttaacgtgc atttcgatgt gcagattaaa aatagcaaga   3600aatcttgaaa ttgttttaga aaatatttga tttccttatt gaaagttatt tttaaatgta   3660aatatttcgt aatcataata attatgtatt gtgtagttat ttcaccttta cggttgggat   3720attatttaat ggtggcctac gaaagtgatt ataaccatcc gcgtcctcaa aaaggccagt   3780ttatttttgt acctcataca tactaattac gtaagtaata tcaggcgaat ggttgactaa   3840caactaacca gtattaaaaa ttaaaagact tcgtcctaat aaaatgtaat atctatgtat   3900aaaaatgaaa aatctggcgt ataataggta aaattaaact agattgttaa tgaatgtgat   3960gtctcataaa cgtttagttt ttaatgagaa acatgtttag tcgcctacta taagacgaga   4020cggcaagctc accgagttaa ctcgtaaaca ggaatgttga aaaagatgac acaatttata   4080tttggtattg aaattatgac taaccatgcg ctctatcgtt tgttatggat gcatagtatt   4140gctgttgaaa ataatggaat taggtaatta ctgcattaat gttgaaaact tgatattatt   4200ctatggttgg gtatgaattc tatgttggaa gtgttgcagc ggttgtaaag atgatttata   4260atgatgttca ctaaatatct gactaaatgt aagttatttt tttttgtata gacatagctt   4320taagatgaag gtgattaaac tttatcctta tcacaataaa aaaaaaaaaa aaaaa        4375<210>52<21l>472<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>52Met Ser Ser Val Ala Lys Lys Asp Lys Pro Thr Met Ser Val Thr Ala1               5                   10                  15Leu Ile Asn Trp Ala Arg Pro Ala Pro Pro Gly Pro Pro Gln Pro Gln

        20                  25                  30Ser Ala Ser Pro Ala Pro Ala Ala Met Leu Gln Gln Leu Pro Thr Gln

    35                  40                  45Ser Met Gln Ser Leu Asn His Ile Pro Thr Val Asp Cys Ser Leu Asp

50                  55                  60Met Gln Trp Leu Asn Leu Glu Pro Gly Phe Met Ser Pro Met Ser Pro65                  70                  75                  80Pro Glu Met Lys Pro Asp Thr Ala Met Leu Asp Gly Leu Arg Asp Asp

            85                  90                  95Ala Thr Ser Pro Pro Asn Phe Lys Asn Tyr Pro Pro Asn His Pro Leu

        100                 105                 110Ser Gly Ser Lys His Leu Cys Ser Ile Cys Gly Asp Arg Ala Ser Gly

    115                 120                 125Lys His Tyr Gly Val Tyr Ser Cys Glu Gly Cys Lys Gly Phe Phe Lys

130                 135                 140Arg Thr Val Arg Lys Asp Leu Ser Tyr Ala Cys Arg Glu Glu Arg Asn145                 150                 155                 160Cys Ile Ile Asp Lys Arg Gln Arg Asn Arg Cys Gln Tyr Cys Arg Tyr

            165                 170                 175Gln Lys Cys Leu Ala Cys Gly Met Lys Arg Glu Ala Val Gln Glu Glu

        180                 185                 190Arg Gln Arg Asn Ala Arg Gly Ala Glu Asp Ala His Pro Ser Ser Ser

    195                 200                 205Val Gln Val Ser Asp Glu Leu Ser Ile Glu Arg Leu Thr Glu Met Glu

210                 215                 220Ser Leu Val Ala Asp Pro Ser Glu Glu Phe Gln Phe Leu Arg Val Gly225                 230                 235                 240Pro Asp Ser Asn Val Pro Pro Arg Tyr Arg Ala Pro Val Ser Ser Leu

            245                 250                 255Cys Gln Ile Gly Asn Lys Gln Ile Ala Ala Leu Val Val Trp Ala Arg

        260                 265                 270Asp Ile Pro His Phe Gly Gln Leu Glu Leu Asp Asp Gln Val Val Leu

    275                 280                 285Ile Lys Ala Ser Trp Asn Glu Leu Leu Leu Phe Ala Ile Ala Trp Arg

290                 295                 300Ser Met Glu Tyr Leu Glu Asp Glu Arg Glu Asn Gly Asp Gly Thr Arg305                 310                 315                 320Ser Thr Thr Gln Pro Gln Leu Met Cys Leu Met Pro Gly Met Thr Leu

            325                 330                 335His Arg Asn Ser Ala Gln Gln Ala Gly Val Gly Ala Ile Phe Asp Arg

        340                 345                 350Val Leu Ser Glu Leu Ser Leu Lys Met Arg Thr Leu Arg Met Asp Gln

    355                 360                 365Ala Glu Tyr Val Ala Leu Lys Ala Ile Val Leu Leu Asn Pro Asp Val

370                 375                 380Lys Gly Leu Lys Asn Arg Gln Glu Val Asp Val Leu Arg Glu Lys Met385                 390                 395                 400Phe Ser Cys Leu Asp Asp Tyr Cys Arg Arg Ser Arg Ser Asn Glu Glu

            405                 410                 415Gly Arg Phe Ala Ser Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser Ile

        420                 425                 430Ser Leu Lys Ser Phe Glu His Leu Tyr Phe Phe His Leu Val Ala Glu

    435                 440                 445Gly Ser Ile Ser Gly Tyr Ile Arg Glu Ala Leu Arg Asn His Ala Pro

450                 455                 460Pro Ile Asp Val Asn Ala Met Met465                 470<210>53<211>1404<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>53atggacacca aacatttcct gccgctcgac ttctctaccc aggtgaactc ttcgtccctc     60aactctccaa cgggtcgagg ctccatggct gtcccctcgc tgcacccctc cttgggtccg    120ggaatcggct ctccactggg ctcgcctggg cagctgcact ctcctatcag caccctgagc    180tcccccatca atggcatggg tccgcccttc tctgtcatca gctcccccat gggcccgcac    240tccatgtcgg tacccaccac acccacattg ggcttcggga ctggtagccc ccagctcaat    300tcacccatga accctgtgag cagcactgag gatatcaagc cgccactagg cctcaatggc    360gtcctcaagg ttcctgccca tccctcagga aatatggcct ccttcaccaa gcacatctgt    420gctatctgtg gggaccgctc ctcaggcaaa cactatgggg tatacagttg tgagggctgc    480aagggcttct tcaagaggac agtacgcaaa gacctgacct acacctgccg agacaacaag    540gactgcctga tcgacaagag acagcggaac cggtgtcagt actgccgcta ccagaagtgc    600ctggccatgg gcatgaagcg ggaagctgtg caggaggagc ggcagcgggg caaggaccgg    660aatgagaacg aggtggagtc caccagcagt gccaacgagg acatgcctgt agagaagatt    720ctggaagccg agcttgctgt cgagcccaag actgagacat acgtggaggc aaacatgggg    780ctgaacccca gctcaccaaa tgaccctgtt accaacatct gtcaagcagc agacaagcag    840ctcttcactc ttgtggagtg ggccaagagg atcccacact tttctgagct gcccctagac    900gaccaggtca tcctgctacg ggcaggctgg aacgagctgc tgatcgcctc cttctcccac    960cgctccatag ctgtgaaaga tgggattctc ctggccaccg gcctgcacgt acaccggaac   1020agcgctcaca gtgctggggt gggcgccatc tttgacaggg tgctaacaga gctggtgtct   1080aagatgcgtg acatgcagat ggacaagacg gagctgggct gcctgcgagc cattgtcctg   1140ttcaaccctg actctaaggg gctctcaaac cctgctgagg tggaggcgtt gagggagaag   1200gtgtatgcgt cactagaagc gtactgcaaa cacaagtacc ctgagcagcc gggcaggttt   1260gccaagctgc tgctccgcct gcctgcactg cgttccatcg ggctcaagtg cctggagcac   1320ctgttcttct tcaagctcat cggggacacg cccatcgaca ccttcctcat ggagatgctg   1380gaggcaccac atcaagccac crag                                          1404<210>54<211>467<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>54Met Asp Thr Lys His Phc Leu Pro Leu Asp Phc Ser Thr Gln Val Asn1               5                   10                  15Ser Ser Ser Leu Asn Ser Pro Thr Gly Arg Gly Ser Met Ala Val Pro

        20                  25                  30Ser Leu His Pro Ser Leu Gly Pro Gly Ile Gly Ser Pro Leu Gly Ser

    35                  40                  45Pro Gly Gln Leu His Ser Pro Ile Ser Thr Leu Ser Ser Pro Ile Asn

50                  55                  60Gly Met Gly Pro Pro Phe Ser Val Ile Ser Ser Pro Met Gly Pro His65                  70                  75                  80Ser Met Ser Val Pro Thr Thr Pro Thr Leu Gly Phe Gly Thr Gly Ser

            85                  90                  95Pro Gln Leu Asn Ser Pro Met Asn Pro Val Ser Ser Thr Glu Asp Ile

        100                 105                 110Lys Pro Pro Leu Gly Leu Asn Gly Val Leu Lys Val Pro Ala His Pro

    115                 120                 125Ser Gly Asn Met Ala Ser Phe Thr Lys His Ile Cys Ala Ile Cys Gly

130                 135                 140Asp Arg Ser Ser Gly Lys His Tyr Gly Val Tyr Ser Cys Glu Gly Cys145                 150                 155                 160Lys Gly Phe Phe Lys Arg Thr Val Arg Lys Asp Leu Thr Tyr Thr Cys

            165                 170                 175Arg Asp Asn Lys Asp Cys Leu Ile Asp Lys Arg Gln Arg Asn Arg Cys

        180                 185                 190Gln Tyr Cys Arg Tyr Gln Lys Cys Leu Ala Met Gly Met Lys Arg Glu

    195                 200                 205Ala Val Gln Glu Glu Arg Gln Arg Gly Lys Asp Arg Asn Glu Asn Glu

210                 215                 220Val Glu Ser Thr Ser Ser Ala Asn Glu Asp Met Pro Val Glu Lys Ile225                 230                 235                 240Leu Glu Ala Glu Leu Ala Val Glu Pro Lys Thr Glu Thr Tyr Val Glu

            245                 250                 255Ala Asn Met Gly Leu Asn Pro Ser Ser Pro Asn Asp Pro Val Thr Asn

        260                 265                 270Ile Cys Gln Ala Ala Asp Lys Gln Leu Phe Thr Leu Val Glu Trp Ala

    275                 280                 285Lys Arg Ile Pro His Phe Ser Glu Leu Pro Leu Asp Asp Gln Val Ile

290                 295                 300Leu Leu Arg Ala Gly Trp Asn Glu Leu Leu Ile Ala Ser Phe Ser His305                 310                 315                 320Arg Ser Ile Ala Val Lys Asp Gly Ile Leu Leu Ala Thr Gly Leu His

            325                 330                 335Val His Arg Asn Ser Ala His Ser Ala Gly Val Gly Ala Ile Phe Asp

        340                 345                 350Arg Val Leu Thr Glu Leu Val Ser Lys Met Arg Asp Met Gln Met Asp

    355                 360                 365Lys Thr Glu Leu Gly Cys Leu Arg Ala Ile Val Leu Phe Asn Pro Asp

370                 375                 380Ser Lys Gly Leu Ser Asn Pro Ala Glu Val Glu Ala Leu Arg Glu Lys385                 390                 395                 400Val Tyr Ala Ser Leu Glu Ala Tyr Cys Lys His Lys Tyr Pro Glu Gln

            405                 410                 415Pro Gly Arg Phe Ala Lys Leu Leu Leu Arg Leu Pro Ala Leu Arg Ser

        420                 425                 430Ile Gly Leu Lys Cys Leu Glu His Leu Phe Phe Phe Lys Leu Ile Gly

    435                 440                 445Asp Thr Pro Ile Asp Thr Phe Leu Met Glu Met Leu Glu Ala Pro His

450                 455                 460Gln Ala Thr465<210>55<211>309<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>55ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt     60agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca    120tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa    180ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag    240aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag    300gcctaggct                                                            309<210>56<211>24<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>56tatataatgg atccccgggt accg                                            24<210>57<211>1653<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>57atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatcctct agaggatgga     60accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt    120gcttttacag atgcacatat cgaggtgaac atcacgtacg cggaatactt cgaaatgtcc    180gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta    240tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt    300gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgaacatt    360tcgcagccta ccgtagtgtt tgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa    420aaaaaattac caataatcca gaaaattatt atcatggatt ctaaaacgga ttaccaggga    480tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat    540tttgtaccag agtcctttga tcgtgacaaa acaattgcac tgataatgaa ttcctctgga    600tctactgggt tacctaaggg tgtggccctt ccgcatagaa ctgcctgcgt cagattctcg    660catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt    720gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt    780cgagtcgtct taatgtatag atttgaagaa gagctgtttt tacgatccct tcaggattac    840aaaattcaaa gtgcgttgct agtaccaacc ctattttcat tcttcgccaa aagcactctg    900attgacaaat acgatttatc taatttacac gaaattgctt ctgggggcgc acctctttcg    960aaagaagtcg gggaagcggt tgcaaaacgc ttccatcttc cagggatacg acaaggatat   1020gggctcactg agactacatc agctattctg attacacccg agggggatga taaaccgggc   1080gcggtcggta aagttgttcc attttttgaa gcgaaggttg tggatctgga taccgggaaa   1140acgctgggcg ttaatcagag aggcgaatta tgtgtcagag gacctatgat tatgtccggt   1200tatgtaaaca atccggaagc gaccaacgcc ttgattgaca aggatggatg gctacattct   1260ggagacatag cttactggga cgaagacgaa cacttcttca tagttgaccg cttgaagtct   1320ttaattaaat acaaaggata tcaggtggcc cccgctgaat tggaatcgat attgttacaa   1380caccccaaca tcttcgacgc gggcgtggca ggtcttcccg acgatgacgc cggtgaactt   1440cccgccgccg ttgttgtttt ggagcacgga aagacgatga cggaaaaaga gatcgtggat   1500tacgtcgcca gtcaagtaac aaccgcgaaa aagttgcgcg gaggagttgt gtttgtggac   1560gaagtaccga aaggtcttac cggaaaactc gacgcaagaa aaatcagaga gatcctcata   1620aaggccaaga agggcggaaa gtccaaattg taa                                1653<210>58<211>867<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>58aagcgagagg cggtgcaaga ggagcgccag aggaatgctc gcggcgcgga ggatgcgcac     60ccgagtagct cggtgcaggt aagcgatgag ctgtcaatcg agcgcctaac ggagatggag    120tctttggtgg cagatcccag cgaggagttc cagttcctcc gcgtggggcc tgacagcaac    180gtgcctccac gttaccgcgc gcccgtctcc tccctctgcc aaataggcaa caagcaaata    240gcggcgttgg tggtatgggc gcgcgacatc cctcatttcg ggcagctgga gctggacgat    300caagtggtac tcatcaaggc ctcctggaat gagctgctac tcttcgccat cgcctggcgc    360tctatggagt atttggaaga tgagagggag aacggggacg gaacgcggag caccactcag    420ccacaactga tgtgtctcat gcctggcatg acgttgcacc gcaactcggc gcagcaggcg    480ggcgtgggcg ccatcttcga ccgcgtgctg tccgagctca gtctgaagat gcgcaccttg    540cgcatggacc aggccgagta cgtcgcgctc aaagccatcg tgctgctcaa ccctgatgtg    600aaaggactga agaatcggca agaagttgac gttttgcgag aaaaaatgtt ctcttgcctg    660gacgactact gccggcggtc gcgaagcaac gaggaaggcc ggtttgcgtc cttgctgctg    720cggctgccag ctctccgctc catctcgctc aagagcttcg aacacctcta cttcttccac    780ctcgtggccg aaggctccat cagcggatac atacgagagg cgctccgaaa ccacgcgcct    840ccgatcgacg tcaatgccat gatgtaa                                        867<210>59<211>225<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>59tcgacattgg acaagtgcat tgaacccttg tctctcgaga gacaaggggg ttcaatgcac     60ttgtccaatg tcgagagaca agggggttca atgcacttgt ccaatgtcga gagacaaggg    120ggttcaatgc acttgtccaa tgtcgagaga caagggggtt caatgcactt gtccaatgtc    180gagagacaag ggggttcaat gcacttgtcc aatgtcgact ctaga                    225<210>60<211>619<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>60cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt     60gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca    120atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc    180aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta    240catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac    300catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg    360atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg    420ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt    480acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg    540ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg    600ggaacggtgc attggaacg                                                 619<210>61<211>262<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>61atgtagtctt atgcaatact cttgtagtct tgcaacatgg taacgatgag ttagcaacat     60gccttacaag gagagaaaaa gcaccgtgca tgccgatagg tggaagtaag gtggtacgat    120cgtgccttat taggaaggca acagacgggt ctgacatgga ttggacgaac cactgaattc    180cgcattgcag agatattgta tttaagtgcc tagctcgata caataaacgc catttgacca    240ttcaccacat tggagtgcac ct                                             262<210>62<211>1247<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>62tctatttcct caggccgtga ggaactgtcg ccagcttcaa gtataaatgg gtgcagtaca     60gatggcgagg cacgacgtca gaagaagggc cctgcgcccc gtcagcaaga ggaactgtgt    120ctggtatgcg gggacagagc ctccggatac cactacaatg cgctcacgtg tgaagggtgt    180aaagggttct tcagacggag tgttaccaaa aatgcggttt atatttgtaa attcggtcac    240gcttgcgaaa tggacatgta catgcgacgg aaatgccagg agtgccgcct gaagaagtgc    300ttagctgtag gcatgaggcc tgagtgcgta gtacccgaga ctcagtgcgc catgaagcgg    360aaagagaaga aagcacagaa ggagaaggac aaactgcctg tcagcacgac gacggtggac    420gaccacatgc cgcccattat gcagtgtgaa cctccacctc ctgaagcagc aaggattcac    480gaagtggtcc caaggtttct ctccgacaag ctgttggaga caaaccggca gaaaaacatc    540ccccagttga cagccaacca gcagttcctt atcgccaggc tcatctggta ccaggacggg    600tacgagcagc cttctgatga agatttgaag aggattacgc agacgtggca gcaagcggac    660gatgaaaacg aagagtctga cactcccttc cgccagatca cagagatgac tatcctcacg    720gtccaactta tcgtggagtt cgcgaaggga ttgccagggt tcgccaagat ctcgcagcct    780gatcaaatta cgctgcttaa ggcttgctca agtgaggtaa tgatgctccg agtcgcgcga    840cgatacgatg cggcctcaga cagtgttctg ttcgcgaaca accaagcgta cactcgcgac    900aactaccgca aggctggcat ggcctacgtc atcgaggatc tactgcactt ctgccggtgc    960atgtactcta tggcgttgga caacatccat tacgcgctgc tcacggctgt cgtcatcttt   1020tctgaccggc cagggttgga gcagccgcaa ctggtggaag aaatccagcg gtactacctg   1080aatacgctcc gcatctatat cctgaaccag ctgagcgggt cggcgcgttc gtccgtcata   1140tacggcaaga tcctctcaat cctctctgag ctacgcacgc tcggcatgca aaactccaac   1200atgtgcatct ccctcaagct caagaacaga aagctgccgc ctttcct                 1247<210>63<211>440<212>PRT<213>人工序列<220><221>misc_feature<223>新序列<400>63Ser Ile Ser Ser Gly Arg Glu Glu Leu Ser Pro Ala Ser Ser Ile Asn1               5                   10                  15Gly Cys Ser Thr Asp Gly Glu Ala Arg Arg Gln Lys Lys Gly Pro Ala

        20                  25                  30Pro Arg Gln Gln Glu Glu Leu Cys Leu Val Cys Gly Asp Arg Ala Ser

    35                  40                  45Gly Tyr His Tyr Asn Ala Leu Thr Cys Glu Gly Cys Lys Gly Phe Phe

50                  55                  60Arg Arg Ser Val Thr Lys Asn Ala Val Tyr Ile Cys Lys Phe Gly His65                  70                  75                  80Ala Cys Glu Met Asp Met Tyr Met Arg Arg Lys Cys Gln Glu Cys Arg

            85                  90                  95Leu Lys Lys Cys Leu Ala Val Gly Met Arg Pro Glu Cys Val Val Pro

        100                 105                 110Glu Thr Gln Cys Ala Met Lys Arg Lys Glu Lys Lys Ala Gln Lys Glu

    115                 120                 125Lys Asp Lys Leu Pro Val Ser Thr Thr Thr Val Asp Asp His Met Pro

130                 135                 140Pro Ile Met Gln Cys Glu Pro Pro Pro Pro Glu Ala Ala Arg Ile His145                 150                 155                 160Glu Val Val Pro Arg Phe Leu Ser Asp Lys Leu Leu Glu Thr Asn Arg

            165                 170                 175Gln Lys Asn Ile Pro Gln Leu Thr Ala Asn Gln Gln Phe Leu Ile Ala

        180                 185                 190Arg Leu Ile Trp Tyr Gln Asp Gly Tyr Glu Gln Pro Ser Asp Glu Asp

    195                 200                 205Leu Lys Arg Ile Thr Gln Thr Trp Gln Gln Ala Asp Asp Glu Asn Glu

210                 215                 220Glu Ser Asp Thr Pro Phe Arg Gln Ile Thr Glu Met Thr Ile Leu Thr225                 230                 235                 240Val Gln Leu Ile Val Glu Phe Ala Lys Gly Leu Pro Gly Phe Ala Lys

            245                 250                 255Ile Ser Gln Pro Asp Gln Ile Thr Leu Leu Lys Ala Cys Ser Ser Glu

        260                 265                 270Val Met Met Leu Arg Val Ala Arg Arg Tyr Asp Ala Ala Ser Asp Ser

    275                 280                 285Val Leu Phe Ala Asn Asn Gln Ala Tyr Thr Arg Asp Asn Tyr Arg Lys

290                 295                 300Ala Gly Met Ala Tyr Val Ile Glu Asp Leu Leu His Phe Cys Arg Cys305                 310                 315                 320Met Tyr Ser Met Ala Leu Asp Asn Ile His Tyr Ala Leu Leu Thr Ala

            325                 330                 335Val Val Ile Phe Ser Asp Arg Pro Gly Leu Glu Gln Pro Gln Leu Val

        340                 345                 350Glu Glu Ile Gln Arg Tyr Tyr Leu Asn Thr Leu Arg Ile Tyr Ile Leu

    355                 360                 365Asn Gln Leu Ser Gly Ser Ala Arg Ser Ser Val Ile Tyr Gly Lys Ile

370                 375                 380Leu Ser Ile Leu Ser Glu Leu Arg Thr Leu Gly Met Gln Asn Ser Asn385                 390                 395                 400Met Cys Ile Ser Leu Lys Leu Lys Asn Arg Lys Leu Pro Pro Phe Leu

            405                 410                 415Glu Glu Ile Trp Asp Val Ala Asp Met Ser His Thr Gln Pro Pro Pro

        420                 425                 430Ile Leu Glu Ser Pro Thr Asn Leu

    435                 440<210>64<211>943<212>DNA<213>人工序列<220><221>misc_feature<223>新序列<400>64atgacttcga aagtttatga tccagaacaa aggaaacgga tgataactgg tccgcagtgg    60tgggccagat gtaaacaaat gaatgttctt gattcattta ttaattatta tgattcagaa    120aaacatgcag aaaatgctgt tattttttta catggtaacg cggcctcttc ttatttatgg    180cgacatgttg tgccacatat tgagccagta gcgcggtgta ttataccaga ccttattggt    240atgggcaaat caggcaaatc tggtaatggt tcttataggt tacttgatca ttacaaatat    300cttactgcat ggtttgaact tcttaattta ccaaagaaga tcatttttgt cggccatgat    360tggggtgctt gtttggcatt tcattatagc tatgagcatc aagataagat caaagcaata    420gttcacgctg aaagtgtagt agatgtgatt gaatcatggg atgaatggcc tgatattgaa    480gaagatattg cgttgatcaa atctgaagaa ggagaaaaaa tggttttgga gaataacttc    540ttcgtggaaa ccatgttgcc atcaaaaatc atgagaaagt tagaaccaga agaatttgca    600gcatatcttg aaccattcaa agagaaaggt gaagttcgtc gtccaacatt atcatggcct    660cgtgaaatcc cgttagtaaa aggtggtaaa cctgacgttg tacaaattgt taggaattat    720aatgcttatc tacgtgcaag tgatgattta ccaaaaatgt ttattgaatc ggacccagga    780ttcttttcca atgctattgt tgaaggtgcc aagaagtttc ctaatactga atttgtcaaa    840gtaaaaggtc ttcatttttc gcaagaagat gcacctgatg aaatgggaaa atatatcaaa    900tcgttcgttg agcgagttct caaaaatgaa caataattct aga                      943

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号