首页> 中国专利> 在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法

在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法

摘要

本发明公开了一种在毕赤酵母细胞器中表达制备酪氨酸激酶的方法及制备的重组酪氨酸激酶,其具有下列结构通式:PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1是具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列;PTS2是具有下列结构式R/K-L/I/V-X

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-11-09

    未缴年费专利权终止 IPC(主分类):C12N9/12 授权公告日:20100908 终止日期:20150907 申请日:20060907

    专利权的终止

  • 2010-09-08

    授权

    授权

  • 2007-04-25

    实质审查的生效

    实质审查的生效

  • 2007-02-28

    公开

    公开

说明书

技术领域

本发明涉及基因工程和蛋白质分离纯化领域,特别涉及一种在毕赤酵母(Pichia pastoris)细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法。

背景技术

酪氨酸激酶(Tyrosine kinase)是一种能选择性地使不同底物的酪氨酸残基磷酸化的酶,可大致分为受体型酪氨酸激酶和非受体型酪氨酸激酶。受体型酪氨酸激酶代表如:表皮生长因子受体(EGFR)、血小板衍生生长因子受体(PDGFR)、成纤维细胞生长因子受体(FGFR)、人激酶插入区受体(Homo sapiens kinase insert domain receptor,简称KDR)等。其中,KDR也称为人血管内皮细胞生长因子受体2(简称vEGFR2),其是一种受体型酪氨酸激酶,它在Genebank蛋白数据库中的登陆号为:NP_002244,KDR具有血管内皮细胞生长因子受体活性,在血管发育、血管增生和调节血管渗透性等方面具有重要功能。而非受体型酪氨酸激酶代表如:Src、ABL、FAK等。

虽然磷酸化的酪氨酸仅占体内磷酸化氨基酸的0.5%,但是一系列证据表明,酪氨酸磷酸化在许多细胞调节过程中起着重要作用。这些作用体现在T细胞和B细胞的活化、对外来刺激的反应、有丝分裂、细胞分化和形成、血管增生、神经递质的转导、细胞周期的生长控制、转录调节、葡萄糖的摄取、肿瘤的产生以及细胞凋亡等过程。因此,酪氨酸激酶功能的紊乱可以导致许多疾病。正常情况下,细胞的酪氨酸激酶磷酸化作用是由酪氨酸激酶和酪氨酸磷酸酶拮抗调节来维持平衡的。但是,如基因突变、基因融合、自分泌和旁分泌循环等病理机制,会导致酪氨酸激酶的持续活化,从而阻断了其对细胞分化、生长和凋亡等的调节功能,诱发肿瘤。鉴于酪氨酸激酶在肿瘤分子病原学上的重要作用,强效的酪氨酸激酶抑制剂可能在肿瘤的治疗中有着重要意义。近年来,蛋白酪氨酸激酶广泛地被作为抗肿瘤药物筛选的靶标蛋白。

目前酪氨酸激酶的获取方法有限,成本昂贵,一般采用下列方法:

1)从肿瘤细胞或组织中分离纯化

Wolfgang Webe等(The Journal of Biological Chemistry,1984,259(23):14631~14636)用免疫亲和层析的方法,从大量表达EGFR的A431细胞(人阴道上皮癌细胞)中分离纯化得到了内皮细胞生长因子(EGF)受体。但这种方法成本极高、产量少。

2)采用昆虫表达体系进行表达

Greenfield等(The EMBO Journal,1988,7(1):139~146)将编码EGFR的cDNA克隆入杆状病毒载体pAc373,转染SF9昆虫细胞,表达出具有活性的EGFR。但是昆虫表达系统表达存在成本高、产量低等缺点。

3)采用原核表达系统进行表达

李林等(第二军医大学学报,2004,25(12):1353~1356)将EGFR-RTK的cDNA片段插入pQE30质粒,转染大肠杆菌M15,IPTG诱导表达融合蛋白,表达的包涵体蛋白经复性后亲和层析法纯化,ELISA方法测定蛋白具有生物学活性。虽然此法较传统的昆虫细胞表达系统简便与经济,但是EGFR-RTK在大肠杆菌中绝大多数是以包涵体形式存在,后续的蛋白复性工艺收率较低。

发明内容

本发明最主要的目的在于克服现有技术的缺陷,提供一种低成本、表达量高的重组酪氨酸激酶及其制备方法。

为此,本发明人首先筛选生长繁殖迅速、成本低的表达系统,其中毕赤酵母(Pichia pastoris)是一种优良的表达系统,具有表达量高、稳定性好、分泌量高、能进行多种翻译后加工修饰、遗传背景清楚、生长繁殖迅速、工艺简单、生产成本低等优点。

然而由于酪氨酸激酶介导细胞信号转导途径,并调节细胞的生长、凋亡等多种功能。一般基因工程菌胞内的表达重组蛋白积累在细胞质中。如果按常规方法直接在毕赤酵母细胞质中表达酪氨酸激酶,该激酶会影响酵母细胞的正常功能,对酵母细胞产生毒性甚至导致细胞死亡。故而目前尚未有在毕赤酵母中成功表达酪氨酸激酶的报道。为了避免对细胞产生毒害且免受蛋白酶降解,本发明人通过诸多试验研究发现,将酪氨酸激酶定位至毕赤酵母的细胞器,如过氧化物酶体中进行表达可解决此问题。

为了使酪氨酸激酶定位在细胞器中表达,本发明在现有酪氨酸激酶蛋白的C端或N端加上可使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号(Peroxisomal Targeting Signal,PTS)。其中,所说的过氧化物酶体定位信号PTS可以是现有文献报道的任何具有上述功能的肽,其通常是由若干个氨基酸组成的短肽,如加在C端的PTS1具有下列结构通式:丝氨酸/丙氨酸/半胱氨酸-赖氨酸/组氨酸/精氨酸-亮氨酸/甲硫氨酸(S/A/C-K/H/R-L/M)(见文献Ann Rev Cell Biol,1993,9:445-478);加在N端的PTS2具有下列结构通式:精氨酸/赖氨酸-亮氨酸/异亮氨酸/缬氨酸-X5-组氨酸/谷氨酰胺-亮氨酸/丙氨酸R/K-L/I/V-X5-H/Q-L/A(见文献J Biol Chem,1994,269:7558-7563),X5代表任意五个氨基酸。其中,上述符号“/”代表“或”的意思。

因此,本发明在毕赤酵母细胞器中表达的重组酪氨酸激酶,其具有下列结构通式:PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1是具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列的三肽;PTS2是具有下列结构式R/K-L/I/V-X5-H/Q-L/A的氨基酸序列的九肽,其中X5代表任意五个氨基酸。

本发明所说的酪氨酸激酶可以是任何能使不同底物的酪氨酸残基磷酸化的酶,包括受体型酪氨酸激酶EGFR、PDGFR、FGFR和KDR等,以及非受体型酪氨酸激酶Src、ABL及FAK等。

在本发明一较佳例中,所述酪氨酸激酶为KDR(氨基酸序列如序列表中SEQ ID No.2所示),所述PTS1的氨基酸序列为SKL(丝氨酸-赖氨酸-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ ID No.2所示的KDR的氨基酸序列末端再加上SKL,具体参见序列表中SEQ ID No.7所示氨基酸序列中的第261-629位氨基酸序列。

本发明的另一较佳例中,所述酪氨酸激酶为非受体型酪氨酸激酶Src(氨基酸序列如序列表中SEQ ID No.16所示),所述PTS2的氨基酸序列为RLNNLATQL(精氨酸-亮氨酸-天冬酰胺-天冬酰胺-亮氨酸-丙氨酸-苏氨酸-谷氨酰胺-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ IDNo.16所示的Src的氨基酸序列前面再加上RLNNLATQL,具体参见序列表中SEQ ID No.19所示氨基酸序列中全部或第3-547位氨基酸序列,其中,第1-2位是优选pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,而添加的包含有起始密码子ATG的Kozak序列ATGGCT对应的氨基酸序列。

因此,显然上述两较佳例的重组酪氨酸激酶还可以是将所述氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加且具有相同酶活性的,由这些序列如序列表中SEQ ID No.7所示的第261-629位氨基酸序列或SEQ IDNo.19所示的第3-547位氨基酸序列衍生的蛋白质,比如在C末端和/或N末端添加一个或数个氨基酸,如与载体编码的氨基酸融合、不影响序列的修饰形式上的差异等情况。

本发明的另一目的是提供上述在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA。

显然,该cDNA是由一种编码酪氨酸激酶的任何核苷酸序列加上编码上述过氧化物酶体定位信号PTS的核苷酸序列构成。

已公开的编码一种酪氨酸激酶KDR的核苷酸序列如序列表中SEQ IDNo.1所示。然而,所述酪氨酸激酶为人源的,而毕赤酵母翻译系统与动物细胞翻译系统存在着差异,其氨基酸密码子的使用频率不同。当毕赤酵母表达外源蛋白质时,如果外源基因转录的mRNA中密码子的分配情况与毕赤酵母相似,则细胞能正常进行蛋白质翻译,蛋白在翻译过程中出现错误的频率较少。反之如果mRNA带有较多的稀有密码子,毕赤酵母内识别稀有密码子的tRNA量不能满足翻译过程中的需要,会使外源蛋白在翻译水平上出现移码突变、翻译水平下降等障碍,从而影响基因的表达。因此为提高表达水平,更佳地,本发明优选针对毕赤酵母密码子偏爱性的酪氨酸激酶蛋白的基因序列,如序列表中SEQ ID No.3所示的核苷酸序列。

以过氧化物酶体定位信号PTS1的氨基酸序列为SKL时为例,编码SKL的碱基序列为TCCAAGTTG,故上述重组酪氨酸激酶一较佳例——重组KDR的cDNA可以是SEQ ID No.1所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.5所示的核苷酸序列;或者是SEQ ID No.3所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.4所示的核苷酸序列;也可以是其它任何能编码由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质所对应的碱基序列的末端加上TCCAAGTTG。

而已公开的编码另一种酪氨酸激酶Src的核苷酸序列如序列表中SEQID No.15所示(GeneBank登陆号为NM_005417)。

以过氧化物酶体定位信号PTS2的氨基酸序列为RLNNLATQL时为例,编码RLNNLATQL的碱基序列为AGATTGAACAACTTGGCTACTCAATTG,故上述另一较佳例——重组Src的cDNA可以是SEQ ID No.15所示的核苷酸序列前端加上AGATTGAACAACTTGGCTACTCAATTG,即为序列表中SEQID No.17所示的核苷酸序列中的7-1641位核苷酸序列,SEQ ID No.17所示的核苷酸序列中第1-6位碱基是使用pPIC3.5K质粒作为表达载体时,为保证正确地开始翻译目的基因而加入的包含有起始密码子ATG的Kozak序列ATGGCT;本发明重组Src的cDNA也可以是其它任何能编码由序列表中SEQ ID No.16所示的氨基酸序列组成的蛋白质所对应的碱基序列的前端加上AGATTGAACAACTTGGCTACTCAATTG。

更佳地,本发明将酪氨酸激酶和标记蛋白融合表达,这样做的技术优势在于可以通过对标记蛋白的测定来间接检测激酶的表达量,便于在菌种筛选、发酵和纯化过程中实时监测酪氨酸激酶的活性和产量。

因此,本发明的再一目的是提供一种上述重组酪氨酸激酶的衍生融合蛋白,其为标记蛋白与酪氨酸激酶的融合蛋白。

本发明优选的标记蛋白为荧光蛋白。因为荧光蛋白无论在原核或真核细胞中表达,当用一定波长激发时,都能产生一种很亮的荧光(生理科学进展,2002,33:(4),364~366)。此外,荧光蛋白还具有低毒性、不干扰正常的细胞活动等优点。

将酪氨酸激酶和荧光蛋白融合表达,可以通过荧光显微镜、荧光酶标仪或流式细胞仪等快速检测荧光强度来间接检测激酶的表达量,并可在菌种筛选、发酵和纯化过程中通过荧光强度检测实时监测酪氨酸激酶的活性和产量。

本领域的技术人员知晓,荧光蛋白包括绿色、黄色、红色荧光蛋白等,这些不同颜色的荧光蛋白均可用于本发明。

为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,本发明在荧光蛋白和酪氨酸激酶之间引入了凝血酶(thrombin)酶切位点(氨基酸序列LVPRGS),这样可以用凝血酶从融合蛋白中酶切得到酪氨酸激酶。

本领域的技术人员知晓,为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,除了在荧光蛋白和酪氨酸激酶之间引入了凝血酶酶切位点外,其他酶切位点还有肠激酶位点(氨基酸序列DDDDK),Xa因子位点(氨基酸序列IEGR),HRV 3C位点(氨基酸序列LEVLFQGP)等,这些酶切位点均可用于本发明。

在本发明一较佳实施例中,所述的衍生融合蛋白中含有的标记蛋白选用绿色荧光蛋白(GFP),GFP是来源于水母(Aequorea victoria)的一条由238个氨基酸组成的多肽链(其氨基酸序列如序列表中SEQ ID No.10所示,核苷酸序列如SEQ ID No.9所示);所述酶切位点选用凝血酶酶切位点;该衍生融合蛋白具有序列表中SEQ ID No.7所示的第15-629位氨基酸序列,其中第15~252位为GFP的氨基酸序列,第253-254位为核酸酶EcoRI位点,第255-260位为凝血酶酶切位点的氨基酸序列,第261-629位为重组酪氨酸激酶KDR的氨基酸序列;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.6所示的第43-1887位核苷酸序列。

更佳地,为了简化纯化工艺,降低生产成本,本发明在荧光蛋白和酪氨酸激酶融合蛋白的N端加了便于亲和纯化的纯化标记蛋白或肽,如多聚组氨酸(His-tag)序列(6-10个组氨酸),这样可以通过镍离子亲和层析或其它方法纯化激酶。当然,除了多聚组氨酸序列,其他现有便于纯化的纯化标记蛋白或肽均可用于本发明,例如GST Tag、S Tag、T7 Tag、CBD Tag等(见pET system manual,www.novagen.com)。

上述包括多聚组氨酸序列的衍生融合蛋白具有序列表中SEQ ID No.7所示的全部或第3-629位氨基酸序列,其中,第1-2位为包含有起始密码子ATG的Kozak序列ATGGCT编码的2个氨基酸,第3-12位为His-tag(10个组氨酸组成);编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ IDNo.6的全部或第7-1887位碱基序列所示,相应地,SEQ ID No.6中的第1-6位为包含有起始密码子ATG的Kozak序列ATGGCT。

本发明所说的“Kozak序列”是指在使用pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,通常需要在目的基因前端加入一段包含有ATG的Kozak序列(Multi-Copy Pichia Expression Kit,Version E,Invitrogen)。其中ATG相当于随后目的基因的起始密码子,ATG后面的三个核苷酸可以是G开头的任何三个核苷酸。在本发明的两个较佳实施例中添加的ATGGCT即为一段合适的Kozak序列,当然如本领域的技术人员所知晓,ATG后面的三个核苷酸可以不仅限于GCT。

当然,本发明也可以将酪氨酸激酶单和上述纯化标记蛋白或肽融合表达。在本发明的一较佳例中,采用GST-tag作为纯化标记(其氨基酸序列如序列表中SEQ ID No.21所示,核苷酸序列如SEQ ID No.20所示),并在酪氨酸激酶Src和纯化标记之间引入了肠激酶(EK)酶切位点(氨基酸序列DDDDK),这样可以用肠激酶从融合蛋白中酶切得到酪氨酸激酶。本例中的衍生融合蛋白具有序列表中SEQ ID No.19所示的全部或第3-777位氨基酸序列,其中,第1-547或3-547位为重组酪氨酸激酶Src的氨基酸序列,第548-552位为EK酶切位点的氨基酸序列,第553-554位为EcoRI位点,第555-777位为GST-tag;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.18的全部或第7-2331位碱基序列所示。

本发明的再一目的是提供一种含有上述目的蛋白基因序列的重组表达载体。

该重组表达载体可以包括下列核苷酸序列之一:

1)上述重组酪氨酸激酶,如重组KDR的cDNA核苷酸序列,例如序列表中SEQ ID No.4、SEQ ID No.5所示的碱基序列以及其他编码由序列表SEQID No.7所示的氨基酸序列中第261-629位氨基酸组成的蛋白质所对应的碱基序列;或是重组Src的cDNA核苷酸序列,例如序列表中SEQ ID No.17所示的全部或第7-1641位碱基序列以及其他编码由序列表SEQ ID No.19所示的全部或第3-547位氨基酸组成的蛋白质所对应的碱基序列;

2)上述荧光蛋白和酪氨酸激酶的融合蛋白(如GFP-KDR)的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的第43-1887位碱基序列;

3)上述含有多聚组氨酸的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的全部或7-1887位碱基序列;或是含有GST-tag的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.18所示的全部或第7-2331位碱基序列。

本领域技术人员知晓,重组表达载体可以是能方便地进行重组DNA操作并能导致目的蛋白序列表达的任何载体。载体的选择一般取决于载体与待引入载体的宿主细胞之间的相容性。载体可以是自主复制性载体,即作为一种染色体外实体存在的载体,其复制不依赖于染色体的复制。载体可含有保证自主复制的任何元件。另外,载体也可以是这样一种载体,当引入宿主细胞后,可以整合到基因组中并与所整合的染色体一起复制。

本发明的表达载体优选的含有一种或多种使转化细胞能得到方便筛选的选择性标记。选择性标记是一种基因,其产物提供抗生素抗性、杀生物剂或病毒抗性、重金属抗性等。如提供抗生素抗性的氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。适当的表达载体的选择取决于待表达的目的蛋白及所选表达宿主细胞。本发明的表达宿主细胞为毕赤酵母,故选用的表达载体为适用于毕赤酵母的现有任何载体,包括但不限于pPIC衍生质粒pPIC3.5K、pPIC9K,或它们的衍生物。

本发明的又一目的是提供含有本发明的目的基因和重组表达载体的宿主细胞,其用于目标酪氨酸激酶的重组生产。将含有本发明的目的基因的重组表达载体引入宿主细胞中,使载体作为染色体整合体保持于其中。术语“宿主细胞”还包括由于复制期间发生突变而与亲代细胞不同的亲代细胞的任何子代。

本发明中所用的宿主细胞是真核表达宿主——毕赤酵母细胞,所述的毕赤酵母包括但不限于现有的GS115、KM71菌株等。

本发明的另一目的是提供上述重组酪氨酸激酶的制备方法。

本发明制备方法的关键在于将酪氨酸激酶定位至毕赤酵母细胞器过氧化物酶体中进行表达,其包括在编码酪氨酸激酶的任何基因序列上连接使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号PTS(如PTS1或PTS2)的基因序列,从而构成在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA核苷酸序列,接着制备含有该cDNA核苷酸序列的重组表达载体,将所述重组表达载体转化真核表达宿主毕赤酵母,培养转化体,将培养物分离纯化的步骤。

所述的表达载体如上述的pPIC衍生质粒,真核表达宿主为毕赤酵母GS115、KM71菌株等。制备重组表达载体和转化体可采用现有基因工程技术。如制备上述含有多聚组氨酸、表达GFP-KDR衍生融合蛋白(His-GFP-KDR)的重组载体时,可分别在KDR基因的两端引入EcoRI和NotI酶切位点,GFP基因两端引入PstI和EcoRI酶切位点,His-tag基因两端引入XbaI-SnaBI和PstI酶切位点;分别将His-tag与GFP以PstI酶切位点相连,将均经EcoRI/NotI酶切处理后的pPIC3.5K与KDR连接,再将上述两者经SnaBI/EcoRI酶切处理后连接,得到最终表达载体pPIC3.5K-plus。又如制备上述含有GST-tag、表达Src衍生融合蛋白(GST-Src)的重组表达载体时,可分别在Src基因的两端引入SnaBI和EcoRI酶切位点,GST-tag基因两端引入EcoRI和AvrII酶切位点;将均经SnaBI/EcoRI酶切处理后的pPIC3.5K与Src连接得质粒Src-pPIC3.5K,再将均经EcoRI/AvrII酶切处理后的Src-pPIC3.5K与GST-tag连接,得到最终表达载体Src-GST-pPIC3.5K。而向毕赤酵母细胞中引入重组表达载体的方法可以是原生质体转化、电穿孔法、PEG法以及LiCl法等。培养转化体及将培养物分离纯化的方法也均可采用现有技术(参见J.萨母布鲁克等编的《分子克隆实验指南》)。

本发明的效果在于:本发明将酪氨酸激酶定位在过氧化物酶体这一毕赤酵母的细胞器中,减少了激酶对宿主毕赤酵母菌株的毒害,首次实现了酪氨酸激酶在酵母中的大量表达制备。本发明还通过优化酪氨酸激酶cDNA的密码子,使其适合在毕赤酵母中表达。同时将酪氨酸激酶基因和荧光蛋白融合表达,以便于激酶的监测。最后本发明在融合蛋白的N端或C端加了便于亲和纯化的氨基酸序列,可以简化纯化工艺,减少纯化的成本。同时毕赤酵母表达的酪氨酸激酶不会形成包涵体,要比大肠杆菌表达具有更好的优势。通过以上技术的应用,本发明实现了高生物活性的酪氨酸激酶在毕赤酵母中低成本、大量制备。

附图说明

图1为现有酪氨酸激酶KDR基因序列(上行)、本发明针对毕赤酵母密码子偏爱性而优化的KDR基因序列(中行,其中与原基因序列相同的碱基未列出)以及它们编码的KDR氨基酸序列(下行)。

图2为带有His-tag、GFP和KDR基因的重组表达载体构建示意图。

图3为PCR扩增GFP和KDR图谱,其中control为对照。

图4为PCR验证重组表达载体质粒pPIC3.5K-plus的图谱。

图5为Ni柱亲和纯化本发明衍生融合蛋白His-GFP-KDR结果。

图6为带有Src和GST-tag基因的重组表达载体构建示意图。

图7为GST-Agarose亲和层析柱亲和纯化本发明衍生融合蛋白GST-Src结果。

具体实施方式

下面用实施例来进一步说明本发明,但本发明并不受其限制。

下列实施例中的材料与方法为:

所采用的分子克隆技术参见J.萨母布鲁克等编的《分子克隆实验指南》。

所使用的工具酶均购自TaKaRa生物公司(大连,中国),具体的反应条件和使用的方法均参考商品说明书。

下面的商品化质粒和大肠杆菌株用于基因克隆:

pBlueScript(+)和pUC19购自天根生化科技(北京)有限公司;

pDEST15购自Invitrogen公司;

pPIC3.5K、大肠杆菌Top10、毕赤酵母GS115、KM71菌株购自Invitrogen。

λ-DNA HindIII Marker(Takala,大连宝生物公司),

Ni亲和层析柱(Ni Sepharose 6 Fast Flow,GE公司),

GST-Agarose亲和层析柱(Amersham Pharmacia Biotech公司)。

实施例1  重组酪氨酸激酶KDR的制备及活性试验

实施例1.1  带有His-tag序列的重组质粒的制备

His-tag基因序列由63个碱基组成,见序列表SEQ ID NO:8,该序列由商业化合成[生工生物工程(上海)有限公司]。该序列的5’端含XbaI-SnaBI酶切位点(5’端第4-15位碱基)以及包含有起始密码子的Kozak序列ATGGCT(5’端第19-24位碱基),3’端含PstI酶切位点(3’端第4-9位碱基)。

该序列经限制性内切酶XbaI和PstI酶切,用T4连接酶连接,克隆入经XbaI和PstI酶切的商用pBlueScript(+)的XbaI和PstI位点处,获得带有His-tag序列的重组质粒His-pBlueScript(+)。

实施例1.2  带有His-tag序列和绿色荧光蛋白GFP基因序列的重组质粒的制备

GFP基因序列由717个碱基(序列表SEQ ID NO:9)组成,设计合成了PCR引物P1和P2,其中P1引入了DNA酶切位点PstI,P2引入了DNA酶切位点EcoRI。

P1:5’-AAACTGCAGATGTCTAAAGGTGAAGAATTATTC-3’

           PstI                      (SEQ ID NO:11)

P2:5’-CCGGAATTCTTTGTACAATTCATCCATAC-3’

           EcoRI                     (SEQ ID NO:12)

利用上述引物对P1和P2,以含有该GFP基因的pUC19重组质粒为模板(参考Microbiology,1997,143:303-311),通过如下PCR反应扩增得到一个732bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,46℃退火1分钟,72℃延伸1.5分钟循环反应5次,然后再94℃变性1分钟,52℃退火1分钟,72℃延伸1.5分钟循环反应25次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3所示),经限制性内切酶PstI和EcoRI酶切,用T4连接酶连接,克隆入经PstI和EcoRI酶切的实施例1.1的His-pBlueScript(+)的PstI和EcoRI位点处,获得带有His-tag序列和GFP序列的重组质粒His-GFP-pBlueScript(+)。

实施例1.3  KDR基因序列的优化制备及过氧化物酶体的定位信号的引入

KDR基因序列由1098个碱基组成,在不改变氨基酸的前提下,对KDR基因的密码子进行优化。KDR氨基酸序列如SEQ ID NO:2所示;原核苷酸序列如SEQ ID NO:1所示、优化后的序列如SEQ ID NO:3所示,两组核苷酸序列对比参见图1。优化后的序列由公司[生工生物工程(上海)有限公司]商业化全合成,并克隆在商用pBlueScript(+)载体上。

以pBlueScript(+)载体上优化的KDR基因为模板,设计合成了PCR引物P3和P4,其中P3引入了DNA酶切位点EcoRI以及凝血酶酶切位点(双波浪线表示,对应的氨基酸序列为LVPRGS),P4引入了DNA酶切位点AvrII-NotI及过氧化物酶体的定位信号SKL(双下划线标记)。

P3:

5’-CCGGAATTCCTGGTCCCCAGAGGCTCTATGGACCCTGATGAGTTG-3’

        EcoRI                        (SEQ ID NO:13)

P4:

5’-CATTAGCGGCCGCCCTAGGCTACTAGTCCTGCTGAGCG

TT-3’     AvrII-NotI                (SEQ ID NO:14)

利用上述引物对P3和P4,以含有该KDR基因的pBlueScript(+)载体为模板,通过如下PCR反应扩增得到一个1159bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,60℃退火1分钟,72℃延伸1.5分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3)。

实施例1.4  带有KDR序列的重组质粒的构建

将实施例1.3所得PCR反应片段经限制性内切酶EcoRI和NotI酶切,用T4连接酶连接,克隆入经EcoRI和NotI酶切的商用pPIC3.5K的EcoRI和NotI位点处,获得带有KDR序列的重组质粒KDR-pPIC3.5K。

实施例1.5  含有His-tag片段以及GFP-KDR片段的表达载体的构建

用限制性内切酶XbaI和EcoRI酶切实施例1.2中所得的重组质粒His-GFP-pBlueScript(+),以及琼脂糖凝胶电泳回收His-GFP片段,用T4连接酶连接,克隆入经XbaI和EcoRI酶切的实施例1.4所得的KDR-pPIC3.5K的XbaI和EcoRI位点处,获得最终目的表达载体pPIC3.5K-plus(如图2)。转化大肠杆菌Top10后筛选重组子,用引物对P1和P4进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2kb左右,得到6个阳性克隆(见图4中的3-4、6-9泳道),取8号菌经DNA测序仪(仪器型号3730)测定该片段序列,其核苷酸序列如SEQ ID NO:6所示,氨基酸序列如SEQ ID NO:7所示,表明扩增序列与既定目标序列完全相符。其中,除去His-tag后的GFP-KDR融合蛋白(含凝血酶酶切位点)的cDNA核苷酸序列如SEQ ID NO:6所示序列的第43-1887位,氨基酸序列如SEQID NO:7所示序列的第15-629位;而除去GFP及凝血酶酶切位点的本发明重组酪氨酸激酶KDR的cDNA核苷酸序列如SEQ ID NO:4所示,即SEQ IDNO:6所示序列的第781-1887位,氨基酸序列如SEQ ID NO:7所示序列的第261-629位。

实施例1.6  含有KDR序列的重组宿主菌的构建

用限制性内切酶SacI将实施例1.5中所得的重组质粒pPIC3.5K-plus线性化,电转化入毕赤酵母宿主菌GS115感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,用流式细胞仪检测荧光强度以判断各菌株的表达情况,结果表明1号菌(命名为Pichia KDR No.1)在24小时时荧光强度几何平均值为1618.31,是各菌株中表达量最高的。

实施例1.7  产生GFP-KDR的基因工程菌的发酵培养及GFP-KDR的分离纯化

1.基因工程菌(毕赤酵母)的发酵培养

将实施例1.6中所得的基因工程菌Pichia KDR No.1菌株接种于BSM培养基中(参考Sreekrishna K,Kropp KE(1996)Pichia pastoris.In:Wolf K,eds.,Non-Conventional Yeast in Biotechnology:A Handbook.Berlin:Springer-Verlag,pp.203-253),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。

2.GFP-KDR的分离、纯化

按上述条件培养工程菌过程中,每隔6小时取样用流式细胞仪检测荧光强度。当荧光强度出现下降时,停止发酵培养。经测定,酪氨酸激酶融合蛋白的最大表达量为260mg/L。

将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,Ni亲和层析柱分离纯化,以50mM磷酸盐溶液(含250mM咪唑)进行洗脱。洗脱曲线见图5。样品上样至Ni柱之后,先用含20mM咪唑的平衡,再用250mM咪唑洗脱,250mM咪唑洗脱峰即为目标蛋白峰,之后再用1M的咪唑洗脱则没有蛋白洗下。

将纯化的GFP-KDR激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下:

  样品  阴性对照  阳性对照  本发明纯化样品  酶活  0.117  1.093  2.032

其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶KDR具有高的活性。

为了进一步评价纯化的重组KDR的生物活性,采用商用KDR特异性抑制剂进行KDR抑制实验。结果表明当抑制剂PTK789、SU11248、SU5416的浓度为10-5mol/L时,三者对KDR的抑制率分别为78.6%、60.4%、77.2%,均高于50%,这进一步说明本发明纯化的重组酪氨酸激酶KDR具有良好的生物活性。

实施例2  重组酪氨酸激酶Src的制备及活性测定

实施例2.1  Src基因序列的制备及过氧化物酶体的定位信号的引入

Src基因序列由1608个碱基(序列表SEQ ID NO:15)组成,设计合成了PCR引物P5和P6,其中P5引入了DNA酶切位点SnaBI以及过氧化物酶体的定位信号RLNNLATQL(双下划线标记),SnaBI酶切位点与定位信号之间引入包含有起始密码子的Kozak序列ATGGCT,在P6引入了DNA酶切位点EcoRI以及肠激酶酶切位点(双波浪线表示,对应的氨基酸序列为DDDDK)。

P5:5’-CTGTACGTAATGGCT

           SnaBIATGGGTAGCAACAAGAGC-3’                      (SEQ ID NO:22)

P6:5’-CGAGAATTCCTTGTCGTCGTCATCGAGGTTCTCCCCGGGCTGGTA-3’       EcoRI                        (SEQ ID NO:23)

利用上述引物对P5和P6,以含有该Src基因的质粒pBA3CS(BMCBiochemistry,2002,3:32)为模板,通过如下PCR反应扩增得到一个1674bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,65℃退火1分钟,72℃延伸2分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段。

实施例2.2  带有GST-tag序列的重组质粒的制备

GST-tag基因序列由669个碱基组成,见序列表SEQ ID NO:20,设计合成了PCR引物P7和P8,从商业化质粒pDEST15(Invitrogen公司)上扩增得到GST-tag基因序列,其中P7引入了DNA酶切位点EcoRI,P8引入了DNA酶切位点AvrII。

P7:5’-CCGGAATTCTCCCCTATACTAGGTTATTGG-3’

           EcoRI                  (SEQ ID NO:24)

P8:5’-CAACCTAGGCTACTAACGCGGAACCAGATCCGATTT-3’

            AvrII                 (SEQ ID NO:25)

利用上述引物对P7和P8,以含有该GST-tag基因的pDEST15载体为模板,通过如下PCR反应扩增得到一个693bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,54℃退火1分钟,72℃延伸1分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段,经限制性内切酶EcoRI和AvrII酶切,用T4连接酶连接,克隆入经EcoRI和AvrII酶切的商用pPIC3.5K的EcoRI和AvrII位点处,获得带有GST-tag序列的重组质粒GST-pPIC3.5K。

实施例2.3  含有GST-tag片段以及Src片段的表达载体的构建

将实施例2.1所得PCR反应片段经限制性内切酶SnaBI和EcoRI酶切,用T4连接酶连接,克隆入经SnaBI和EcoRI酶切的实施例2.2的GST-pPIC3.5K的SnaBI和EcoRI位点处,获得带有Src序列的最终目的表达载体Src-GST-pPIC3.5K。转化大肠杆菌Top10后筛选重组子,用引物对P5和P8进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2355bp,得到8个阳性克隆,取1号菌经DNA测序仪(仪器型号3730)测定该片段序列,其10-2346位核苷酸序列如SEQ ID NO:18所示,氨基酸序列如SEQ ID NO:19所示,表明扩增序列与既定目标序列完全相符。其中,除去GST-tag及肠激酶酶切位点后的Src重组蛋白单体的cDNA核苷酸序列如SEQ ID NO:18所示序列的第1-1641位(第1-6位为包含启动密码子的Kozak序列),氨基酸序列如SEQ ID NO:19所示序列的第1-547位(相应地第1-2位为Kozak序列编码的两个氨基酸)。

实施例2.4  含有Src序列的重组宿主菌的构建

用限制性内切酶SacI将实施例2.3中所得的重组质粒Src-GST-pPIC3.5K线性化,电转化入毕赤酵母宿主菌KM71感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,玻璃珠破壁之后,用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性以判断各菌株的表达情况,结果表明5号菌(命名为Pichia Src No.5)在24小时时酶活是各菌株中最高的。

实施例2.5  产生Src的基因工程菌的发酵培养及Src的分离纯化

1.基因工程菌(毕赤酵母)的发酵培养

将实施例2.4中所得的基因工程菌Pichia Src No.5菌株接种于BSM培养基中(方法参考实施例1.7),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。

2.Src的分离、纯化

按上述条件培养工程菌过程中,每隔6小时取样用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性。当活性出现下降时,停止发酵培养。

将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,GST-Agarose亲和层析柱(Amersham Pharmacia Biotech)分离纯化,以50mM磷酸盐溶液(含50mmol/L Tris,0.15mol/L NaCl,2.5mmol/L CaCl2,pH7.5)进行洗脱,收集目的蛋白。洗脱曲线见图7。

将纯化的Src激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下:

  样品  阴性对照  阳性对照  本发明纯化样品  酶活  0.103  1.032  1.857

其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶Src具有高的活性。

                           序列表

<110>华东理工大学;中国科学院上海药物研究所

<120>在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备

     方法

<130>061709C

<160>25

<170>PatentIn version 3.3

<210>1

<211>1098

<212>DNA

<213>人(human)

<220>

<221>CDS

<222>(1)..(1098)

<400>1

atg gat cca gat gaa ctc cca ttg gat gaa cat tgt gaa cga ctg cct     48

Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro

1               5                   10                  15

tat gat gcc agc aaa tgg gaa ttc ccc aga gac cgg ctg aag cta ggt     96

Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly

            20                  25                  30

aag cct ctt ggc cgt ggt gcc ttt ggc caa gtg att gaa gca gat gcc    144

Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala

        35                  40                  45

ttt gga att gac aag aca gca act tgc agg aca gta gca gtc aaa atg    192

Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met

    50                  55                  60

ttg aaa gaa gga gca aca cac agt gag cat cga gct ctc atg tct gaa    240

Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu

65                  70                  75                  80

ctc aag atc ctc att cat att ggt cac cat ctc aat gtg gtc aac ctt    288

Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu

                85                  90                  95

cta ggt gcc tgt acc aag cca gga ggg cca ctc atg gtg att gtg gaa    336

Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu

            100                 105                 110

ttc tgc aaa ttt gga aac ctg tcc act tac ctg agg agc aag aga aat    384

Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn

        115                 120                 125

gaa ttt gtc ccc tac aag acc aaa ggg gca cga ttc cgt caa ggg aaa    432

Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys

    130                 135                 140

gac tac gtt gga gca atc cct gtg gat ctg aaa cgg cgc ttg gac agc    480

Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser

145                 150                 155                 160

atc acc agt agc cag agc tca gcc agc tct gga ttt gtg gag gag aag    528

Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys

                165                 170                 175

tcc ctc agt gat gta gaa gaa gag gaa gct cct gaa gat ctg tat aag    576

Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys

            180                 185                 190

gac ttc ctg acc ttg gag cat ctc atc tgt tac agc ttc caa gtg gct    624

Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala

        195                 200                 205

aag ggc atg gag ttc ttg gca tcg cga aag tgt atc cac agg gac ctg    672

Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu

    210                 215                 220

gcg gca cga aat atc ctc tta tcg gag aag aac gtg gtt aaa atc tgt    720

Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys

225                 230                 235                 240

gac ttt ggc ttg gcc cgg gat att tat aaa gat cca gat tat gtc aga    768

Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg

                245                 250                 255

aaa gga gat gct cgc ctc cct ttg aaa tgg atg gcc cca gaa aca att    816

Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile

            260                 265                 270

ttt gac aga gtg tac aca atc cag agt gac gtc tgg tct ttt ggt gtt    864

Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val

        275                 280                 285

ttg ctg tgg gaa ata ttt tcc tta ggt gct tct cca tat cct ggg gta    912

Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val

    290                 295                 300

aag att gat gaa gaa ttt tgt agg cga ttg aaa gaa gga act aga atg    960

Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met

305                 310                 315                 320

agg gcc cct gat tat act aca cca gaa atg tac cag acc atg ctg gac   1008

Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp

                325                 330                 335

tgc tgg cac ggg gag ccc agt cag aga ccc acg ttt tca gag ttg gtg   1056

Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val

            340                 345                 350

gaa cat ttg gga aat ctc ttg caa gct aat gct cag cag gat            1098

Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp

        355                 360                 365

<210>2

<211>366

<212>PRT

<213>人(human)

<400>2

Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro

1               5                   10                  15

Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly

            20                  25                  30

Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala

        35                  40                  45

Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met

    50                  55                  60

Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu

65                  70                  75                  80

Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu

                85                  90                  95

Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu

            100                 105                 110

Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn

        115                 120                 125

Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys

    130                 135                 140

Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser

145                 150                 155                 160

Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys

                165                 170                 175

Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys

            180                 185                 190

Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala

        195                 200                 205

Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu

    210                 215                 220

Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys

225                 230                 235                 240

Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg

                245                 250                 255

Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile

            260                 265                 270

Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val

        275                 280                 285

Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val

    290                 295                 300

Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met

305                 310                 315                 320

Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp

                325                 330                 335

Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val

            340                 345                 350

Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp

        355                 360                 365

<210>3

<211>1098

<212>DNA

<213>人工序列(Artificial)

<220>

<223>针对毕赤酵母密码子偏爱性优化的酪氨酸激酶KDR的核苷酸序列

<400>3

atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct     60

aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt    120

ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt    180

gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag    240

ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt    300

actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc    360

acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc    420

cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct    480

atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat    540

gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg    600

atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc    660

catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc    720

gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc    780

agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag    840

tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct    900

taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg    960

cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga    1020

gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa    1080

gctaacgctc agcaggac                                                  1098

<210>4

<211>1107

<212>DNA

<213>人工序列(Artificial)

<220>

<223>含毕赤酵母过氧化物酶体定位信号SKL且密码子优化的酪氨酸激酶KDR的核苷

     酸序列

<220>

<221>transit_peptide

<222>(1099)..(1107)

<400>4

atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct     60

aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt    120

ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt    180

gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag    240

ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt    300

actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc    360

acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc    420

cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct    480

atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat    540

gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg    600

atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc    660

catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc    720

gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc    780

agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag    840

tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct    900

taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg    960

cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga   1020

gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa   1080

gctaacgctc agcaggactc caagttg                                       1107

<210>5

<211>1107

<212>DNA

<213>人工序列(Artificial)

<220>

<223>含毕赤酵母过氧化物酶体定位信号SKL的酪氨酸激酶KDR的核苷酸序列

<220>

<221>transit_peptide

<222>(1099)..(1107)

<400>5

atggatccag atgaactccc attggatgaa cattgtgaac gactgcctta tgatgccagc     60

aaatgggaat tccccagaga ccggctgaag ctaggtaagc ctcttggccg tggtgccttt    120

ggccaagtga ttgaagcaga tgcctttgga attgacaaga cagcaacttg caggacagta    180

gcagtcaaaa tgttgaaaga aggagcaaca cacagtgagc atcgagctct catgtctgaa    240

ctcaagatcc tcattcatat tggtcaccat ctcaatgtgg tcaaccttct aggtgcctgt    300

accaagccag gagggccact catggtgatt gtggaattct gcaaatttgg aaacctgtcc    360

acttacctga ggagcaagag aaatgaattt gtcccctaca agaccaaagg ggcacgattc    420

cgtcaaggga aagactacgt tggagcaatc cctgtggatc tgaaacggcg cttggacagc    480

atcaccagta gccagagctc agccagctct ggatttgtgg aggagaagtc cctcagtgat    540

gtagaagaag aggaagctcc tgaagatctg tataaggact tcctgacctt ggagcatctc    600

atctgttaca gcttccaagt ggctaagggc atggagttct tggcatcgcg aaagtgtatc    660

cacagggacc tggcggcacg aaatatcctc ttatcggaga agaacgtggt taaaatctgt    720

gactttggct tggcccggga tatttataaa gatccagatt atgtcagaaa aggagatgct    780

cgcctccctt tgaaatggat ggccccagaa acaatttttg acagagtgta cacaatccag    840

agtgacgtct ggtcttttgg tgttttgctg tgggaaatat tttccttagg tgcttctcca    900

tatcctgggg taaagattga tgaagaattt tgtaggcgat tgaaagaagg aactagaatg    960

agggcccctg attatactac accagaaatg taccagacca tgctggactg ctggcacggg   1020

gagcccagtc agagacccac gttttcagag ttggtggaac atttgggaaa tctcttgcaa   1080

gctaatgctc agcaggattc caagttg                                       1107

<210>6

<211>1887

<212>DNA

<213>人工序列(Artificial)

<220>

<223>含His-tag、GFP、凝血酶酶切位点、KDR、SKL的融合蛋白的核苷酸序列

<220>

<221>CDS

<222>(1)..(1887)

<400>6

atg gct cat cac cac cat cat cat cat cat cat cat ctg cag atg tct    48

Met Ala His His His His His His His His His His Leu Gln Met Ser

1               5                   10                  15

aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt gaa tta    96

Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu

            20                  25                  30

gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa ggt gaa    144

Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu

        35                  40                  45

ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt act act    192

Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr

    50                  55                  60

ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc ggt tat    240

Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr

65                  70                  75                  80

ggt gtt caa tgt ttt gct aga tac cca gat cat atg aaa caa cat gac    288

Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp

                85                  90                  95

ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga act att    336

Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile

            100                 105                 110

ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc aag ttt    384

Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe

        115                 120                 125

gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att gat ttt    432

Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe

    130                 135                 140

aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac tat aac    480

Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn

145                 150                 155                 160

tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt atc aaa    528

Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys

                165                 170                 175

gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt caa tta    576

Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu

            180                 185                 190

gct gac cat tat caa caa aat act cca att ggt gat ggt cca gtc ttg    624

Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu

        195                 200                 205

tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc aaa gat    672

Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp

    210                 215                 220

cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt act gct    720

Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala

225                 230                 235                 240

gct ggt att acc cat ggt atg gat gaa ttg tac aaa gaa ttc ctg gtc    768

Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val

                245                 250                 255

ccc aga ggc tct atg gac cct gat gag ttg cca ttg gat gaa cac tgc    816

Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys

            260                 265                 270

gag cgt ttg cct tac gac gcc tct aag tgg gag ttc cct aga gat aga    864

Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg

        275                 280                 285

ttg aag ttg gga aag cca ctt ggt aga gga gcc ttt ggt caa gtc att    912

Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile

    290                 295                 300

gag gct gac gcc ttc gga atc gac aag acc gct acc tgc cgt acc gtt    960

Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val

305                 310                 315                 320

gct gtc aaa atg ttg aaa gag gga gct acc cac tct gaa cat aga gcc   1008

Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala

                325                 330                 335

ttg atg tcc gag ttg aag atc ctt atc cac att ggt cat cac ttg aat   1056

Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn

            340                 345                 350

gtt gtc aac ttg ttg ggt gct tgt act aag cca ggt gga cca ttg atg   1104

Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met

        355                 360                 365

gtc att gtc gag ttt tgc aag ttt ggt aac ctt tcc acc tac ctt aga   1152

Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg

    370                 375                 380

tcc aag cgt aac gag ttc gtc cca tac aag act aag ggt gct aga ttc   1200

Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe

385                 390                 395                 400

cgt caa gga aag gac tat gtt ggt gct atc cca gtt gat ttg aag cgt   1248

Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg

                405                 410                 415

aga ttg gat tct atc act tct tct caa tcc tcc gct tct tcc gga ttc   1296

Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe

            420                 425                 430

gtt gag gag aag tct ctt tct gat gtc gag gaa gag gaa gcc cca gag   1344

Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu

        435                 440                 445

gac ctt tac aaa gac ttt ctt act ttg gaa cac ttg atc tgt tac tcc    1392

Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser

    450                 455                 460

ttc cag gtc gcc aaa ggt atg gag ttt ctt gcc tct aga aag tgc atc    1440

Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile

465                 470                 475                 480

cat cgt gac ctt gct gct cgt aac atc ttg ttg tct gaa aag aat gtc    1488

His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val

                485                 490                 495

gtc aag atc tgc gac ttc gga ctt gct cgt gac atc tac aag gac cca    1536

Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro

            500                 505                 510

gac tac gtt aga aag gga gac gcc aga ttg cct ttg aag tgg atg gct    1584

Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala

        515                 520                 525

cca gaa act atc ttc gat aga gtc tac acc atc cag tcc gat gtc tgg    1632

Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp

    530                 535                 540

tcc ttt gga gtt ctt ttg tgg gag agc ttc tct ctt gga gcc tct cct    1680

Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro

545                 550                 555                 560

tac cct gga gtt aag att gat gaa gag ttc tgt aga cgt ttg aag gaa    1728

Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu

                565                 570                 575

gga act aga atg cgt gct cct gac tac act act cct gag atg tat cag    1776

Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln

            580                 585                 590

acc atg ctt gac tgt tgg cat gga gaa cca tct caa cgt cca act ttc    1824

Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe

        595                 600                 605

tcc gag ctt gtt gag cac ctt gga aac ctt ctt caa gct aac gct cag    1872

Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asr Ala Gln

    610                 615                 620

cag gac tcc aag ttg                                                1887

Gln Asp Ser Lys Leu

625

<210>7

<211>629

<212>PRT

<213>人工序列(Artificial)

<220>

<223>Synthetic Construct

<400>7

Met Ala His His His His His His His His His His Leu Gln Met Ser

1               5                   10                  15

Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu

            20                  25                  30

Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu

        35                  40                  45

Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr

    50                  55                  60

Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr

65                  70                  75                  80

Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp

                85                  90                  95

Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile

            100                 105                 110

Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe

        115                 120                 125

Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe

    130                 135                 140

Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn

145                 150                 155                 160

Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys

                165                 170                 175

Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu

            180                 185                 190

Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu

        195                 200                 205

Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp

    210                 215                 220

Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala

225                 230                 235                 240

Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val

                245                 250                 255

Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys

            260                 265                 270

Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg

        275                 280                 285

Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val  Ile

    290                 295                 300

Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val

305                 310                 315                 320

Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala

                325                 330                 335

Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn

            340                 345                 350

Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met

        355                 360                 365

Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg

    370                 375                 380

Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe

385                 390                 395                 400

Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg

                405                 410                 415

Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe

            420                 425                 430

Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu

        435                 440                 445

Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser

    450                 455                 460

Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile

465                 470                 475                 480

His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val

                485                 490                 495

Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro

            500                 505                 510

Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala

        515                 520                 525

Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp

    530                 535                 540

Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro

545                 550                 555                 560

Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu

                565                 570                 575

Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln

            580                 585                 590

Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe

        595                 600                 605

Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln

    610                 615                 620

Gln Asp Ser Lys Leu

625

<210>8

<211>63

<212>DNA  

<213>人工序列(Artificial)

<220>

<223>编码His-tag的核苷酸序列

<400>8

gactctagat acgtaaccat ggctcatcac caccatcatc atcatcatca tcatctgcag    60

tag                                                                  63

<210>9

<211>717

<212>DNA

<213>水母(Aequorea victoria)

<220>

<221>CDS

<222>(1)..(717)

<400>9

atg tct aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt     48

Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1               5                   10                  15

gaa tta gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa     96

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

            20                  25                  30

ggt gaa ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt    144

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

        35                  40                  45

act act ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc    192

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe

    50                  55                  60

ggt tat ggt gtt caa tgt ttt gct aga tac cea gat cat atg aaa caa    240

Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln

65                  70                  75                  80

cat gac ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga    288

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

                85                  90                  95

act att ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc    336

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

            100                 105                 110

aag ttt gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att    384

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

        115                 120                 125

gat ttt aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac    432

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

    130                 135                 140

tat aac tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt    480

Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly

145                 150                 155                 160

atc aaa gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt    528

Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

                165                 170                 175

caa tta gct gac cat tat caa caa aat act cca att ggt gat ggt cca    576

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

            180                 185                 190

gtc ttg tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc    624

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser

        195                 200                 205

aaa gat cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt    672

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

    210                 215                 220

act gct gct ggt att acc cat ggt atg gat gaa ttg tac aaa taa        717

Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys

225                 230                 235

<210>10

<211>238

<212>PRT

<213>水母(Aequorea victoria)

<400>10

Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val

1               5                   10                  15

Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu

            20                  25                  30

Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys

        35                  40                  45

Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe

    50                  55                  60

Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln

65                  70                  75                  80

His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg

                85                  90                  95

Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val

            100                 105                 110

Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile

        115                 120                 125

Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn

    130                 135                 140

Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly

145                 150                 155                 160

Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val

                165                 170                 175

Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro

            180                 185                 190

Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser

        195                 200                 205

Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val

    210                 215                 220

Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys

225                 230                 235

<210>11

<211>33

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P1

<400>11

aaactgcaga tgtctaaagg tgaagaatta ttc                                 33

<210>12

<211>29

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P2

<400>12

ccggaattct ttgtacaatt catccatac                                       29

<210>13

<211>45

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P3

<400>13

ccggaattcc tggtccccag aggctctatg gaccctgatg agttg                     45

<210>14

<211>49

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P4

<400>14

cattagcggc cgccctaggc tactacaact tggagtcctg ctgagcgtt                 49

<210>15

<211>1608

<212>DNA

<213>人(human)

<220>

<221>CDS

<222>(1)..(1608)

<400>15

atg ggt agc aac aag agc aag ccc aag gat gcc agc cag cgg cgc cgc    48

Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg

1               5                   10                  15

agc ctg gag ccc gcc gag aac gtg cac ggc gct ggc ggg ggc gct ttc    96

Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe

            20                  25                  30

ccc gcc tcg cag acc ccc agc aag cca gcc tcg gcc gac ggc cac cgc    144

Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg

        35                  40                  45

ggc ccc agc gcg gcc ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc    192

Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe

    50                  55                  60

gga ggc ttc aac tcc tcg gac acc gtc acc tcc ccg cag agg gcg ggc    240

Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly

65                  70                  75                  80

ccg ctg gcc ggt gga gtg acc acc ttt gtg gcc ctc tat gac tat gag    288

Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu

                85                  90                  95

tct agg acg gag aca gac ctg tcc ttc aag aaa ggc gag cgg ctc cag    336

Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln

            100                 105                 110

att gtc aac aac aca gag gga gac tgg tgg ctg gcc cac tcg ctc agc    384

Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser

        115                 120                 125

aca gga cag aca ggc tac atc ccc agc aac tac gtg gcg ccc tcc gac    432

Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp

    130                 135                 140

tcc atc cag gct gag gag tgg tat ttt ggc aag atc acc aga cgg gag    480

Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu

145                 150                 155                 160

tca gag cgg tta ctg ctc aat gca gag aac ccg aga ggg acc ttc ctc    528

Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu

                165                 170                 175

gtg cga gaa agt gag acc acg aaa ggt gcc tac tgc ctc tca gtg tct    576

Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser

            180                 185                 190

gac ttc gac aac gcc aag ggc ctc aac gtg aag cac tac aag atc cgc    624

Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg

        195                 200                 205

aag ctg gac agc ggc ggc ttc tac atc acc tcc cgc acc cag ttc aac    672

Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn

    210                 215                 220

agc ctg cag cag ctg gtg gcc tac tac tcc aaa cac gcc gat ggc ctg    720

Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu

225                 230                 235                 240

tgc cac cgc ctc acc acc gtg tgc ccc acg tcc aag ccg cag act cag    768

Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln

                245                 250                 255

ggc ctg gcc aag gat gcc tgg gag atc cct cgg gag tcg ctg cgg ctg     816

Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu

            260                 265                 270

gag gtc aag ctg ggc cag ggc tgc ttt ggc gag gtg tgg atg ggg acc     864

Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr

        275                 280                 285

tgg aac ggt acc acc agg gtg gcc atc aaa acc ctg aag cct ggc acg     912

Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr

    290                 295                 300

atg tct cca gag gcc ttc ctg cag gag gcc cag gtc atg aag aag ctg     960

Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu

305                 310                 315                 320

agg cat gag aag ctg gtg cag ttg tat gct gtg gtt tca gag gag ccc    1008

Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro

                325                 330                 335

att tac atc gtc acg gag tac atg agc aag ggg agt ttg ctg gac ttt    1056

Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe

            340                 345                 350

ctc aag ggg gag aca ggc aag tac ctg cgg ctg cct cag ctg gtg gac    1104

Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp

        355                 360                 365

atg gct gct cag atc gcc tca ggc atg gcg tac gtg gag cgg atg aac    1152

Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn

    370                 375                 380

tac gtc cac cgg gac ctt cgt gca gcc aac atc ctg gtg gga gag aac    1200

Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn

385                 390                 395                 400

ctg gtg tgc aaa gtg gcc gac ttt ggg ctg gct cgg ctc att gaa gac    1248

Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp

                405                 410                 415

aat gag tac acg gcg cgg caa ggt gcc aaa ttc ccc atc aag tgg acg    1296

Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr

            420                 425                 430

gct cca gaa gct gcc ctc tat ggc cgc ttc acc atc aag tcg gac gtg    1344

Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val

        435                 440                 445

tgg tcc ttc ggg atc ctg ctg act gag ctc acc aca aag gga cgg gtg    1392

Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val

    450                 455                 460

ccc tac cct ggg atg gtg aac cgc gag gtg ctg gac cag gtg gag cgg    1440

Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg

465                 470                 475                 480

ggc tac cgg atg ccc tgc ccg ccg gag tgt ccc gag tcc ctg cac gac    1488

Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp

                485                 490                 495

ctc atg tgc cag tgc tgg cgg aag gag cct gag gag cgg ccc acc ttc    1536

Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe

            500                 505                 510

gag tac ctg cag gcc ttc ctg gag gac tac ttc acg tcc acc gag ccc    1584

Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro

        515                 520                 525

cag tac cag ccc ggg gag aac ctc                                    1608

Gln Tyr Gln Pro Gly Glu Asn Leu

    530                 535

<210>16

<211>536

<212>PRT

<213>人(human)

<400>16

Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg

1               5                   10                  15

Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe

            20                  25                  30

Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg

        35                  40                  45

Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe

    50                  55                  60

Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly

65                  70                  75                  80

Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu

                85                  90                  95

Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln

            100                 105                 110

Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser

        115                 120                 125

Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp

    130                 135                 140

Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu

145                 150                 155                 160

Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu

                165                 170                 175

Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser

            180                 185                 190

Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg

        195                 200                 205

Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn

    210                 215                 220

Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu

225                 230                 235                 240

Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln

                245                 250                 255

Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu

            260                 265                 270

Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr

        275                 280                 285

Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr

    290                 295                 300

Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu

305                 310                 315                 320

Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro

                325                 330                 335

Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe

            340                 345                 350

Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp

        355                 360                 365

Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn

    370                 375                 380

Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn

385                 390                 395                 400

Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp

                405                 410                 415

Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr

            420                 425                 430

Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val

        435                 440                 445

Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val

    450                 455                 460

Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg

465                 470                 475                 480

Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp

                485                 490                 495

Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe

            500                 505                 510

Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro

        515                 520                 525

Gln Tyr Gln Pro Gly Glu Asn Leu

    530                 535

<210>17

<211>1641

<212>DNA

<213>人工序列(Artificial)

<220>

<223>含毕赤酵母过氧化物酶体定位信号RLNNLATQL的酪氨酸激酶Src的核苷酸序

     列

<220>

<221>transit_peptide

<222>(7)..(33)

<400>17

atggctagat tgaacaactt ggctactcaa ttgatgggta gcaacaagag caagcccaag     60

gatgccagcc agcggcgccg cagcctggag cccgccgaga acgtgcacgg cgctggcggg    120

ggcgctttcc ccgcctcgca gacccccagc aagccagcct cggccgacgg ccaccgcggc    180

cccagcgcgg ccttcgcccc cgcggccgcc gagcccaagc tgttcggagg cttcaactcc    240

tcggacaccg tcacctcccc gcagagggcg ggcccgctgg ccggtggagt gaccaccttt    300

gtggccctct atgactatga gtctaggacg gagacagacc tgtccttcaa gaaaggcgag    360

cggctccaga ttgtcaacaa cacagaggga gactggtggc tggcccactc gctcagcaca    420

ggacagacag gctacatccc cagcaactac gtggcgccct ccgactccat ccaggctgag    480

gagtggtatt ttggcaagat caccagacgg gagtcagagc ggttactgct caatgcagag    540

aacccgagag ggaccttcct cgtgcgagaa agtgagacca cgaaaggtgc ctactgcctc    600

tcagtgtctg acttcgacaa cgccaagggc ctcaacgtga agcactacaa gatccgcaag    660

ctggacagcg gcggcttcta catcacctcc cgcacccagt tcaacagcct gcagcagctg    720

gtggcctact actccaaaca cgccgatggc ctgtgccacc gcctcaccac cgtgtgcccc    780

acgtccaagc cgcagactca gggcctggcc aaggatgcct gggagatccc tcgggagtcg    840

ctgcggctgg aggtcaagct gggccagggc tgctttggcg aggtgtggat ggggacctgg    900

aacggtacca ccagggtggc catcaaaacc ctgaagcctg gcacgatgtc tccagaggcc    960

ttcctgcagg aggcccaggt catgaagaag ctgaggcatg agaagctggt gcagttgtat   1020

gctgtggttt cagaggagcc catttacatc gtcacggagt acatgagcaa ggggagtttg   1080

ctggactttc tcaaggggga gacaggcaag tacctgcggc tgcctcagct ggtggacatg   1140

gctgctcaga tcgcctcagg catggcgtac gtggagcgga tgaactacgt ccaccgggac   1200

cttcgtgcag ccaacatcct ggtgggagag aacctggtgt gcaaagtggc cgactttggg   1260

ctggctcggc tcattgaaga caatgagtac acggcgcggc aaggtgccaa attccccatc   1320

aagtggacgg ctccagaagc tgccctctat ggccgcttca ccatcaagtc ggacgtgtgg   1380

tccttcggga tcctgctgac tgagctcacc acaaagggac gggtgcccta ccctgggatg    1440

gtgaaccgcg aggtgctgga ccaggtggag cggggctacc ggatgccctg cccgccggag    1500

tgtcccgagt ccctgcacga cctcatgtgc cagtgctggc ggaaggagcc tgaggagcgg    1560

cccaccttcg agtacctgca ggccttcctg gaggactact tcacgtccac cgagccccag    1620

taccagcccg gggagaacct c                                              1641

<210>18

<211>2337

<212>DNA

<213>人工序列(Artificial)

<220>

<223>含RLNNLATQL、Src、肠激酶酶切位点、GST-tag的融合蛋白的核苷酸序列

<220>

<221>CDS

<222>(1)..(2337)

<400>18

atg gct aga ttg aac aac ttg gct act caa ttg atg ggt agc aac aag     48

Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys

1               5                   10                  15

agc aag ccc aag gat gcc agc cag cgg cgc cgc agc ctg gag ccc gcc     96

Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala

            20                  25                  30

gag aac gtg cac ggc gct ggc ggg ggc gct ttc ccc gcc tcg cag acc    144

Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr

        35                  40                  45

ccc agc aag cca gcc tcg gcc gac ggc cac cgc ggc ccc agc gcg gcc    192

Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala

    50                  55                  60

ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc gga ggc ttc aac tcc    240

Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser

65                  70                  75                  80

tcg gac acc gtc acc tcc ccg cag agg gcg ggc ccg ctg gcc ggt gga    288

Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly

                85                  90                  95

gtg acc acc ttt gtg gcc ctc tat gac tat gag tct agg acg gag aca    336

Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr

            100                 105                 110

gac ctg tcc ttc aag aaa ggc gag cgg ctc cag att gtc aac aac aca    384

Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr

        115                 120                 125

gag gga gac tgg tgg ctg gcc cac tcg ctc agc aca gga cag aca ggc    432

Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly

    130                 135                 140

tac atc ccc agc aac tac gtg gcg ccc tcc gac tcc atc cag gct gag    480

Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu

145                 150                 155                 160

gag tgg tat ttt ggc aag atc acc aga cgg gag tca gag cgg tta ctg    528

Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu

                165                 170                 175

ctc aat gca gag aac ccg aga ggg acc ttc ctc gtg cga gaa agt gag    576

Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu

            180                 185                 190

acc acg aaa ggt gcc tac tgc ctc tca gtg tct gac ttc gac aac gcc    624

Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala

        195                 200                 205

aag ggc ctc aac gtg aag cac tac aag atc cgc aag ctg gac agc ggc    672

Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly

    210                 215                 220

ggc ttc tac atc acc tcc cgc acc cag ttc aac agc ctg cag cag ctg    720

Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu

225                 230                 235                 240

gtg gcc tac tac tcc aaa cac gcc gat ggc ctg tgc cac cgc ctc acc    768

Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr

                245                 250                 255

acc gtg tgc ccc acg tcc aag ccg cag act cag ggc ctg gcc aag gat    816

Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp

            260                 265                 270

gcc tgg gag atc cct cgg gag tcg ctg cgg ctg gag gtc aag ctg ggc    864

Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly

        275                 280                 285

cag ggc tgc ttt ggc gag gtg tgg atg ggg acc tgg aac ggt acc acc    912

Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr

    290                 295                 300

agg gtg gcc atc aaa acc ctg aag cct ggc acg atg tct cca gag gcc    960

Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala

305                 310                 315                 320

ttc ctg cag gag gcc cag gtc atg aag aag ctg agg cat gag aag ctg   1008

Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu

                325                 330                 335

gtg cag ttg tat gct gtg gtt tca gag gag ccc att tac atc gtc acg   1056

Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr

            340                 345                 350

gag tac atg agc aag ggg agt ttg ctg gac ttt ctc aag ggg gag aca    1104

Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr

        355                 360                 365

ggc aag tac ctg cgg ctg cct cag ctg gtg gac atg gct gct cag atc    1152

Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile

    370                 375                 380

gcc tca ggc atg gcg tac gtg gag cgg atg aac tac gtc cac cgg gac    1200

Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp

385                 390                 395                 400

ctt cgt gca gcc aac atc ctg gtg gga gag aac ctg gtg tgc aaa gtg    1248

Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val

                405                 410                 415

gcc gac ttt ggg ctg gct cgg ctc att gaa gac aat gag tac acg gcg    1296

Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala

            420                 425                 430

cgg caa ggt gcc aaa ttc ccc atc aag tgg acg gct cca gaa gct gcc    1344

Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala

        435                 440                 445

ctc tat ggc cgc ttc acc atc aag tcg gac gtg tgg tcc ttc ggg atc    1392

Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile

    450                 455                 460

ctg ctg act gag ctc acc aca aag gga cgg gtg ccc tac cct ggg atg    1440

Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met

465                 470                 475                 480

gtg aac cgc gag gtg ctg gac cag gtg gag cgg ggc tac cgg atg ccc    1488

Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro

                485                 490                 495

tgc ccg ccg gag tgt ccc gag tcc ctg cac gac ctc atg tgc cag tgc    1536

Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys

            500                 505                 510

tgg cgg aag gag cct gag gag cgg ccc acc ttc gag tac ctg cag gcc    1584

Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala

        515                 520                 525

ttc ctg gag gac tac ttc acg tcc acc gag ccc cag tac cag ccc ggg    1632

Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly

    530                 535                 540

gag aac ctc gat gac gac gac aag gaa ttc tcc cct ata cta ggt tat    1680

Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr

545                 550                 555                 560

tgg aaa att aag ggc ctt gtg caa ccc act cga ctt ctt ttg gaa tat    1728

Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr

                565                 570                 575

ctt gaa gaa aaa tat gaa gag cat ttg tat gag cgc gat gaa ggt gat    1776

Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp

            580                 585                 590

aaa tgg cga aac aaa aag ttt gaa ttg ggt ttg gag ttt ccc aat ctt    1824

Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu

        595                 600                 605

cct tat tat att gat ggt gat gtt aaa tta aca cag tct atg gcc atc    1872

Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile

    610                 615                 620

ata cgt tat ata gct gac aag cac aac atg ttg ggt ggt tgt cca aaa    1920

Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys

625                 630                 635                 640

gag cgt gca gag att tca atg ctt gaa gga gcg gtt ttg gat att aga    1968

Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg

                645                 650                 655

tac ggt gtt tcg aga att gca tat agt aaa gac ttt gaa act ctc aaa    2016

Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys

            660                 665                 670

gtt gat ttt ctt agc aag cta cct gaa atg ctg aaa atg ttc gaa gat    2064

Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp

        675                 680                 685

cgt tta tgt cat aaa aca tat tta aat ggt gat cat gta acc cat cct    2112

Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro

    690                 695                 700

gac ttc atg ttg tat gac gct ctt gat gtt gtt tta tac atg gac cca    2160

Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro

705                 710                 715                 720

atg tgc ctg gat gcg ttc cca aaa tta gtt tgt ttt aaa aaa cgt att    2208

Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile

                725                 730                 735

gaa gct atc cca caa att gat aag tac ttg aaa tcc agc aag tat ata    2256

Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile

            740                 745                 750

gca tgg cct ttg cag ggc tgg caa gcc acg ttt ggt ggt ggc gac cat    2304

Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His

        755                 760                 765

cct cca aaa tcg gat ctg gtt ccg cgt tag tag                        2337

Pro Pro Lys Ser Asp Leu Val Pro Arg

    770                 775

<210>19

<211>777

<212>PRT

<213>人工序列(Artificial)

<220>

<223>Synthetic Construct

<400>19

Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys

1               5                   10                  15

Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala

            20                  25                  30

Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr

        35                  40                  45

Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala

    50                  55                  60

Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser

65                  70                  75                  80

Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly

                85                  90                  95

Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr

            100                 105                 110

Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr

        115                 120                 125

Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly

    130                 135                 140

Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu

145                 150                 155                 160

Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu

                165                 170                 175

Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu

            180                 185                 190

Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala

        195                 200                 205

Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly

    210                 215                 220

Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu

225                 230                 235                 240

Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr

                245                 250                 255

Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp

            260                 265                 270

Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly

        275                 280                 285

Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr

    290                 295                 300

Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala

305                 310                 315                 320

Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu

                325                 330                 335

Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr

            340                 345                 350

Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr

        355                 360                 365

Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile

    370                 375                 380

Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp

385                 390                 395                 400

Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val

                405                 410                 415

Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala

            420                 425                 430

Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala

        435                 440                 445

Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile

    450                 455                 460

Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met

465                 470                 475                 480

Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro

                485                 490                 495

Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys

            500                 505                 510

Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala

        515                 520                 525

Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly

    530                 535                 540

Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr

545                 550                 555                 560

Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr

                565                 570                 575

Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp

            580                 585                 590

Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu

        595                 600                 605

Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile

    610                 615                 620

Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys

625                 630                 635                 640

Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg

                645                 650                 655

Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys

            660                 665                 670

Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp

        675                 680                 685

Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro

    690                 695                 700

Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro

705                 710                 715                 720

Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile

                725                 730                 735

Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile

            740                 745                 750

Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His

        755                 760                 765

Pro Pro Lys Ser Asp Leu Val Pro Arg

    770                 775

<210>20

<211>669

<212>DNA

<213>人(human)

<220>

<221>CDS

<222>(1)..(669)

<400>20

tcc cct ata cta ggt tat tgg aaa att aag ggc ctt gtg caa ccc act    48

Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr

1               5                   10                  15

cga ctt ctt ttg gaa tat ctt gaa gaa aaa tat gaa gag cat ttg tat    96

Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr

            20                  25                  30

gag cgc gat gaa ggt gat aaa tgg cga aac aaa aag ttt gaa ttg ggt    144

Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly

        35                  40                  45

ttg gag ttt ccc aat ctt cct tat tat att gat ggt gat gtt aaa tta    192

Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu

    50                  55                  60

aca cag tct atg gcc atc ata cgt tat ata gct gac aag cac aac atg    240

Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met

65                 70                 75                 80

ttg ggt ggt tgt cca aaa gag cgt gca gag att tca atg ctt gaa gga    288

Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly

                85                 90                 95

gcg gtt ttg gat att aga tac ggt gtt tcg aga att gca tat agt aaa    336

Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys

            100                 105                 110

gac ttt gaa act ctc aaa gtt gat ttt ctt agc aag cta cct gaa atg    384

Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met

        115                 120                 125

ctg aaa atg ttc gaa gat cgt tta tgt cat aaa aca tat tta aat ggt    432

Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly

    130                 135                 140

gat cat gta acc cat cct gac ttc atg ttg tat gac gct ctt gat gtt    480

Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val

145                 150                 155                 160

gtt tta tac atg gac cca atg tgc ctg gat gcg ttc cca aaa tta gtt    528

Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val

                165                 170                 175

tgt ttt aaa aaa cgt att gaa gct atc cca caa att gat aag tac ttg    576

Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu

            180                 185                 190

aaa tcc agc aag tat ata gca tgg cct ttg cag ggc tgg caa gcc acg    624

Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr

        195                 200                 205

ttt ggt ggt ggc gac cat cct cca aaa tcg gat ctg gtt ccg cgt        669

Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg

    210                 215                 220

<210>21

<211>223

<212>PRT

<213>人(human)

<400>21

Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr

1               5                   10                  15

Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr

            20                  25                  30

Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly

        35                  40                  45

Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu

    50                  55                  60

Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met

65                  70                  75                  80

Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly

                85                  90                  95

Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys

            100                 105                 110

Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met

        115                 120                 125

Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly

    130                 135                 140

Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val

145                 150                 155                 160

Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val

                165                 170                 175

Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu

            180                 185                 190

Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr

        195                 200                 205

Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg

    210                 215                 220

<210>22

<211>60

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P5

<400>22

ctgtacgtaa tggctagatt gaacaacttg gctactcaat tgatgggtag caacaagagc    60

<210>23

<211>45

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P6

<400>23

cgagaattcc ttgtcgtcgt catcgaggtt ctccccgggc tggta              45

<210>24

<211>30

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P7

<400>24

ccggaattct cccctatact aggttattgg                               30

<210>25

<211>36

<212>DNA

<213>人工序列(Artificial)

<220>

<223>引物P8

<400>25

caacctaggc tactaacgcg gaaccagatc cgattt                        36

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号