法律状态公告日
法律状态信息
法律状态
2016-11-09
未缴年费专利权终止 IPC(主分类):C12N9/12 授权公告日:20100908 终止日期:20150907 申请日:20060907
专利权的终止
2010-09-08
授权
授权
2007-04-25
实质审查的生效
实质审查的生效
2007-02-28
公开
公开
技术领域
本发明涉及基因工程和蛋白质分离纯化领域,特别涉及一种在毕赤酵母(Pichia pastoris)细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法。
背景技术
酪氨酸激酶(Tyrosine kinase)是一种能选择性地使不同底物的酪氨酸残基磷酸化的酶,可大致分为受体型酪氨酸激酶和非受体型酪氨酸激酶。受体型酪氨酸激酶代表如:表皮生长因子受体(EGFR)、血小板衍生生长因子受体(PDGFR)、成纤维细胞生长因子受体(FGFR)、人激酶插入区受体(Homo sapiens kinase insert domain receptor,简称KDR)等。其中,KDR也称为人血管内皮细胞生长因子受体2(简称vEGFR2),其是一种受体型酪氨酸激酶,它在Genebank蛋白数据库中的登陆号为:NP_002244,KDR具有血管内皮细胞生长因子受体活性,在血管发育、血管增生和调节血管渗透性等方面具有重要功能。而非受体型酪氨酸激酶代表如:Src、ABL、FAK等。
虽然磷酸化的酪氨酸仅占体内磷酸化氨基酸的0.5%,但是一系列证据表明,酪氨酸磷酸化在许多细胞调节过程中起着重要作用。这些作用体现在T细胞和B细胞的活化、对外来刺激的反应、有丝分裂、细胞分化和形成、血管增生、神经递质的转导、细胞周期的生长控制、转录调节、葡萄糖的摄取、肿瘤的产生以及细胞凋亡等过程。因此,酪氨酸激酶功能的紊乱可以导致许多疾病。正常情况下,细胞的酪氨酸激酶磷酸化作用是由酪氨酸激酶和酪氨酸磷酸酶拮抗调节来维持平衡的。但是,如基因突变、基因融合、自分泌和旁分泌循环等病理机制,会导致酪氨酸激酶的持续活化,从而阻断了其对细胞分化、生长和凋亡等的调节功能,诱发肿瘤。鉴于酪氨酸激酶在肿瘤分子病原学上的重要作用,强效的酪氨酸激酶抑制剂可能在肿瘤的治疗中有着重要意义。近年来,蛋白酪氨酸激酶广泛地被作为抗肿瘤药物筛选的靶标蛋白。
目前酪氨酸激酶的获取方法有限,成本昂贵,一般采用下列方法:
1)从肿瘤细胞或组织中分离纯化
Wolfgang Webe等(The Journal of Biological Chemistry,1984,259(23):14631~14636)用免疫亲和层析的方法,从大量表达EGFR的A431细胞(人阴道上皮癌细胞)中分离纯化得到了内皮细胞生长因子(EGF)受体。但这种方法成本极高、产量少。
2)采用昆虫表达体系进行表达
Greenfield等(The EMBO Journal,1988,7(1):139~146)将编码EGFR的cDNA克隆入杆状病毒载体pAc373,转染SF9昆虫细胞,表达出具有活性的EGFR。但是昆虫表达系统表达存在成本高、产量低等缺点。
3)采用原核表达系统进行表达
李林等(第二军医大学学报,2004,25(12):1353~1356)将EGFR-RTK的cDNA片段插入pQE30质粒,转染大肠杆菌M15,IPTG诱导表达融合蛋白,表达的包涵体蛋白经复性后亲和层析法纯化,ELISA方法测定蛋白具有生物学活性。虽然此法较传统的昆虫细胞表达系统简便与经济,但是EGFR-RTK在大肠杆菌中绝大多数是以包涵体形式存在,后续的蛋白复性工艺收率较低。
发明内容
本发明最主要的目的在于克服现有技术的缺陷,提供一种低成本、表达量高的重组酪氨酸激酶及其制备方法。
为此,本发明人首先筛选生长繁殖迅速、成本低的表达系统,其中毕赤酵母(Pichia pastoris)是一种优良的表达系统,具有表达量高、稳定性好、分泌量高、能进行多种翻译后加工修饰、遗传背景清楚、生长繁殖迅速、工艺简单、生产成本低等优点。
然而由于酪氨酸激酶介导细胞信号转导途径,并调节细胞的生长、凋亡等多种功能。一般基因工程菌胞内的表达重组蛋白积累在细胞质中。如果按常规方法直接在毕赤酵母细胞质中表达酪氨酸激酶,该激酶会影响酵母细胞的正常功能,对酵母细胞产生毒性甚至导致细胞死亡。故而目前尚未有在毕赤酵母中成功表达酪氨酸激酶的报道。为了避免对细胞产生毒害且免受蛋白酶降解,本发明人通过诸多试验研究发现,将酪氨酸激酶定位至毕赤酵母的细胞器,如过氧化物酶体中进行表达可解决此问题。
为了使酪氨酸激酶定位在细胞器中表达,本发明在现有酪氨酸激酶蛋白的C端或N端加上可使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号(Peroxisomal Targeting Signal,PTS)。其中,所说的过氧化物酶体定位信号PTS可以是现有文献报道的任何具有上述功能的肽,其通常是由若干个氨基酸组成的短肽,如加在C端的PTS1具有下列结构通式:丝氨酸/丙氨酸/半胱氨酸-赖氨酸/组氨酸/精氨酸-亮氨酸/甲硫氨酸(S/A/C-K/H/R-L/M)(见文献Ann Rev Cell Biol,1993,9:445-478);加在N端的PTS2具有下列结构通式:精氨酸/赖氨酸-亮氨酸/异亮氨酸/缬氨酸-X5-组氨酸/谷氨酰胺-亮氨酸/丙氨酸R/K-L/I/V-X5-H/Q-L/A(见文献J Biol Chem,1994,269:7558-7563),X5代表任意五个氨基酸。其中,上述符号“/”代表“或”的意思。
因此,本发明在毕赤酵母细胞器中表达的重组酪氨酸激酶,其具有下列结构通式:PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1是具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列的三肽;PTS2是具有下列结构式R/K-L/I/V-X5-H/Q-L/A的氨基酸序列的九肽,其中X5代表任意五个氨基酸。
本发明所说的酪氨酸激酶可以是任何能使不同底物的酪氨酸残基磷酸化的酶,包括受体型酪氨酸激酶EGFR、PDGFR、FGFR和KDR等,以及非受体型酪氨酸激酶Src、ABL及FAK等。
在本发明一较佳例中,所述酪氨酸激酶为KDR(氨基酸序列如序列表中SEQ ID No.2所示),所述PTS1的氨基酸序列为SKL(丝氨酸-赖氨酸-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ ID No.2所示的KDR的氨基酸序列末端再加上SKL,具体参见序列表中SEQ ID No.7所示氨基酸序列中的第261-629位氨基酸序列。
本发明的另一较佳例中,所述酪氨酸激酶为非受体型酪氨酸激酶Src(氨基酸序列如序列表中SEQ ID No.16所示),所述PTS2的氨基酸序列为RLNNLATQL(精氨酸-亮氨酸-天冬酰胺-天冬酰胺-亮氨酸-丙氨酸-苏氨酸-谷氨酰胺-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ IDNo.16所示的Src的氨基酸序列前面再加上RLNNLATQL,具体参见序列表中SEQ ID No.19所示氨基酸序列中全部或第3-547位氨基酸序列,其中,第1-2位是优选pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,而添加的包含有起始密码子ATG的Kozak序列ATGGCT对应的氨基酸序列。
因此,显然上述两较佳例的重组酪氨酸激酶还可以是将所述氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加且具有相同酶活性的,由这些序列如序列表中SEQ ID No.7所示的第261-629位氨基酸序列或SEQ IDNo.19所示的第3-547位氨基酸序列衍生的蛋白质,比如在C末端和/或N末端添加一个或数个氨基酸,如与载体编码的氨基酸融合、不影响序列的修饰形式上的差异等情况。
本发明的另一目的是提供上述在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA。
显然,该cDNA是由一种编码酪氨酸激酶的任何核苷酸序列加上编码上述过氧化物酶体定位信号PTS的核苷酸序列构成。
已公开的编码一种酪氨酸激酶KDR的核苷酸序列如序列表中SEQ IDNo.1所示。然而,所述酪氨酸激酶为人源的,而毕赤酵母翻译系统与动物细胞翻译系统存在着差异,其氨基酸密码子的使用频率不同。当毕赤酵母表达外源蛋白质时,如果外源基因转录的mRNA中密码子的分配情况与毕赤酵母相似,则细胞能正常进行蛋白质翻译,蛋白在翻译过程中出现错误的频率较少。反之如果mRNA带有较多的稀有密码子,毕赤酵母内识别稀有密码子的tRNA量不能满足翻译过程中的需要,会使外源蛋白在翻译水平上出现移码突变、翻译水平下降等障碍,从而影响基因的表达。因此为提高表达水平,更佳地,本发明优选针对毕赤酵母密码子偏爱性的酪氨酸激酶蛋白的基因序列,如序列表中SEQ ID No.3所示的核苷酸序列。
以过氧化物酶体定位信号PTS1的氨基酸序列为SKL时为例,编码SKL的碱基序列为TCCAAGTTG,故上述重组酪氨酸激酶一较佳例——重组KDR的cDNA可以是SEQ ID No.1所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.5所示的核苷酸序列;或者是SEQ ID No.3所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.4所示的核苷酸序列;也可以是其它任何能编码由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质所对应的碱基序列的末端加上TCCAAGTTG。
而已公开的编码另一种酪氨酸激酶Src的核苷酸序列如序列表中SEQID No.15所示(GeneBank登陆号为NM_005417)。
以过氧化物酶体定位信号PTS2的氨基酸序列为RLNNLATQL时为例,编码RLNNLATQL的碱基序列为AGATTGAACAACTTGGCTACTCAATTG,故上述另一较佳例——重组Src的cDNA可以是SEQ ID No.15所示的核苷酸序列前端加上AGATTGAACAACTTGGCTACTCAATTG,即为序列表中SEQID No.17所示的核苷酸序列中的7-1641位核苷酸序列,SEQ ID No.17所示的核苷酸序列中第1-6位碱基是使用pPIC3.5K质粒作为表达载体时,为保证正确地开始翻译目的基因而加入的包含有起始密码子ATG的Kozak序列ATGGCT;本发明重组Src的cDNA也可以是其它任何能编码由序列表中SEQ ID No.16所示的氨基酸序列组成的蛋白质所对应的碱基序列的前端加上AGATTGAACAACTTGGCTACTCAATTG。
更佳地,本发明将酪氨酸激酶和标记蛋白融合表达,这样做的技术优势在于可以通过对标记蛋白的测定来间接检测激酶的表达量,便于在菌种筛选、发酵和纯化过程中实时监测酪氨酸激酶的活性和产量。
因此,本发明的再一目的是提供一种上述重组酪氨酸激酶的衍生融合蛋白,其为标记蛋白与酪氨酸激酶的融合蛋白。
本发明优选的标记蛋白为荧光蛋白。因为荧光蛋白无论在原核或真核细胞中表达,当用一定波长激发时,都能产生一种很亮的荧光(生理科学进展,2002,33:(4),364~366)。此外,荧光蛋白还具有低毒性、不干扰正常的细胞活动等优点。
将酪氨酸激酶和荧光蛋白融合表达,可以通过荧光显微镜、荧光酶标仪或流式细胞仪等快速检测荧光强度来间接检测激酶的表达量,并可在菌种筛选、发酵和纯化过程中通过荧光强度检测实时监测酪氨酸激酶的活性和产量。
本领域的技术人员知晓,荧光蛋白包括绿色、黄色、红色荧光蛋白等,这些不同颜色的荧光蛋白均可用于本发明。
为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,本发明在荧光蛋白和酪氨酸激酶之间引入了凝血酶(thrombin)酶切位点(氨基酸序列LVPRGS),这样可以用凝血酶从融合蛋白中酶切得到酪氨酸激酶。
本领域的技术人员知晓,为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,除了在荧光蛋白和酪氨酸激酶之间引入了凝血酶酶切位点外,其他酶切位点还有肠激酶位点(氨基酸序列DDDDK),Xa因子位点(氨基酸序列IEGR),HRV 3C位点(氨基酸序列LEVLFQGP)等,这些酶切位点均可用于本发明。
在本发明一较佳实施例中,所述的衍生融合蛋白中含有的标记蛋白选用绿色荧光蛋白(GFP),GFP是来源于水母(Aequorea victoria)的一条由238个氨基酸组成的多肽链(其氨基酸序列如序列表中SEQ ID No.10所示,核苷酸序列如SEQ ID No.9所示);所述酶切位点选用凝血酶酶切位点;该衍生融合蛋白具有序列表中SEQ ID No.7所示的第15-629位氨基酸序列,其中第15~252位为GFP的氨基酸序列,第253-254位为核酸酶EcoRI位点,第255-260位为凝血酶酶切位点的氨基酸序列,第261-629位为重组酪氨酸激酶KDR的氨基酸序列;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.6所示的第43-1887位核苷酸序列。
更佳地,为了简化纯化工艺,降低生产成本,本发明在荧光蛋白和酪氨酸激酶融合蛋白的N端加了便于亲和纯化的纯化标记蛋白或肽,如多聚组氨酸(His-tag)序列(6-10个组氨酸),这样可以通过镍离子亲和层析或其它方法纯化激酶。当然,除了多聚组氨酸序列,其他现有便于纯化的纯化标记蛋白或肽均可用于本发明,例如GST Tag、S Tag、T7 Tag、CBD Tag等(见pET system manual,www.novagen.com)。
上述包括多聚组氨酸序列的衍生融合蛋白具有序列表中SEQ ID No.7所示的全部或第3-629位氨基酸序列,其中,第1-2位为包含有起始密码子ATG的Kozak序列ATGGCT编码的2个氨基酸,第3-12位为His-tag(10个组氨酸组成);编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ IDNo.6的全部或第7-1887位碱基序列所示,相应地,SEQ ID No.6中的第1-6位为包含有起始密码子ATG的Kozak序列ATGGCT。
本发明所说的“Kozak序列”是指在使用pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,通常需要在目的基因前端加入一段包含有ATG的Kozak序列(Multi-Copy Pichia Expression Kit,Version E,Invitrogen)。其中ATG相当于随后目的基因的起始密码子,ATG后面的三个核苷酸可以是G开头的任何三个核苷酸。在本发明的两个较佳实施例中添加的ATGGCT即为一段合适的Kozak序列,当然如本领域的技术人员所知晓,ATG后面的三个核苷酸可以不仅限于GCT。
当然,本发明也可以将酪氨酸激酶单和上述纯化标记蛋白或肽融合表达。在本发明的一较佳例中,采用GST-tag作为纯化标记(其氨基酸序列如序列表中SEQ ID No.21所示,核苷酸序列如SEQ ID No.20所示),并在酪氨酸激酶Src和纯化标记之间引入了肠激酶(EK)酶切位点(氨基酸序列DDDDK),这样可以用肠激酶从融合蛋白中酶切得到酪氨酸激酶。本例中的衍生融合蛋白具有序列表中SEQ ID No.19所示的全部或第3-777位氨基酸序列,其中,第1-547或3-547位为重组酪氨酸激酶Src的氨基酸序列,第548-552位为EK酶切位点的氨基酸序列,第553-554位为EcoRI位点,第555-777位为GST-tag;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.18的全部或第7-2331位碱基序列所示。
本发明的再一目的是提供一种含有上述目的蛋白基因序列的重组表达载体。
该重组表达载体可以包括下列核苷酸序列之一:
1)上述重组酪氨酸激酶,如重组KDR的cDNA核苷酸序列,例如序列表中SEQ ID No.4、SEQ ID No.5所示的碱基序列以及其他编码由序列表SEQID No.7所示的氨基酸序列中第261-629位氨基酸组成的蛋白质所对应的碱基序列;或是重组Src的cDNA核苷酸序列,例如序列表中SEQ ID No.17所示的全部或第7-1641位碱基序列以及其他编码由序列表SEQ ID No.19所示的全部或第3-547位氨基酸组成的蛋白质所对应的碱基序列;
2)上述荧光蛋白和酪氨酸激酶的融合蛋白(如GFP-KDR)的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的第43-1887位碱基序列;
3)上述含有多聚组氨酸的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的全部或7-1887位碱基序列;或是含有GST-tag的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.18所示的全部或第7-2331位碱基序列。
本领域技术人员知晓,重组表达载体可以是能方便地进行重组DNA操作并能导致目的蛋白序列表达的任何载体。载体的选择一般取决于载体与待引入载体的宿主细胞之间的相容性。载体可以是自主复制性载体,即作为一种染色体外实体存在的载体,其复制不依赖于染色体的复制。载体可含有保证自主复制的任何元件。另外,载体也可以是这样一种载体,当引入宿主细胞后,可以整合到基因组中并与所整合的染色体一起复制。
本发明的表达载体优选的含有一种或多种使转化细胞能得到方便筛选的选择性标记。选择性标记是一种基因,其产物提供抗生素抗性、杀生物剂或病毒抗性、重金属抗性等。如提供抗生素抗性的氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。适当的表达载体的选择取决于待表达的目的蛋白及所选表达宿主细胞。本发明的表达宿主细胞为毕赤酵母,故选用的表达载体为适用于毕赤酵母的现有任何载体,包括但不限于pPIC衍生质粒pPIC3.5K、pPIC9K,或它们的衍生物。
本发明的又一目的是提供含有本发明的目的基因和重组表达载体的宿主细胞,其用于目标酪氨酸激酶的重组生产。将含有本发明的目的基因的重组表达载体引入宿主细胞中,使载体作为染色体整合体保持于其中。术语“宿主细胞”还包括由于复制期间发生突变而与亲代细胞不同的亲代细胞的任何子代。
本发明中所用的宿主细胞是真核表达宿主——毕赤酵母细胞,所述的毕赤酵母包括但不限于现有的GS115、KM71菌株等。
本发明的另一目的是提供上述重组酪氨酸激酶的制备方法。
本发明制备方法的关键在于将酪氨酸激酶定位至毕赤酵母细胞器过氧化物酶体中进行表达,其包括在编码酪氨酸激酶的任何基因序列上连接使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号PTS(如PTS1或PTS2)的基因序列,从而构成在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA核苷酸序列,接着制备含有该cDNA核苷酸序列的重组表达载体,将所述重组表达载体转化真核表达宿主毕赤酵母,培养转化体,将培养物分离纯化的步骤。
所述的表达载体如上述的pPIC衍生质粒,真核表达宿主为毕赤酵母GS115、KM71菌株等。制备重组表达载体和转化体可采用现有基因工程技术。如制备上述含有多聚组氨酸、表达GFP-KDR衍生融合蛋白(His-GFP-KDR)的重组载体时,可分别在KDR基因的两端引入EcoRI和NotI酶切位点,GFP基因两端引入PstI和EcoRI酶切位点,His-tag基因两端引入XbaI-SnaBI和PstI酶切位点;分别将His-tag与GFP以PstI酶切位点相连,将均经EcoRI/NotI酶切处理后的pPIC3.5K与KDR连接,再将上述两者经SnaBI/EcoRI酶切处理后连接,得到最终表达载体pPIC3.5K-plus。又如制备上述含有GST-tag、表达Src衍生融合蛋白(GST-Src)的重组表达载体时,可分别在Src基因的两端引入SnaBI和EcoRI酶切位点,GST-tag基因两端引入EcoRI和AvrII酶切位点;将均经SnaBI/EcoRI酶切处理后的pPIC3.5K与Src连接得质粒Src-pPIC3.5K,再将均经EcoRI/AvrII酶切处理后的Src-pPIC3.5K与GST-tag连接,得到最终表达载体Src-GST-pPIC3.5K。而向毕赤酵母细胞中引入重组表达载体的方法可以是原生质体转化、电穿孔法、PEG法以及LiCl法等。培养转化体及将培养物分离纯化的方法也均可采用现有技术(参见J.萨母布鲁克等编的《分子克隆实验指南》)。
本发明的效果在于:本发明将酪氨酸激酶定位在过氧化物酶体这一毕赤酵母的细胞器中,减少了激酶对宿主毕赤酵母菌株的毒害,首次实现了酪氨酸激酶在酵母中的大量表达制备。本发明还通过优化酪氨酸激酶cDNA的密码子,使其适合在毕赤酵母中表达。同时将酪氨酸激酶基因和荧光蛋白融合表达,以便于激酶的监测。最后本发明在融合蛋白的N端或C端加了便于亲和纯化的氨基酸序列,可以简化纯化工艺,减少纯化的成本。同时毕赤酵母表达的酪氨酸激酶不会形成包涵体,要比大肠杆菌表达具有更好的优势。通过以上技术的应用,本发明实现了高生物活性的酪氨酸激酶在毕赤酵母中低成本、大量制备。
附图说明
图1为现有酪氨酸激酶KDR基因序列(上行)、本发明针对毕赤酵母密码子偏爱性而优化的KDR基因序列(中行,其中与原基因序列相同的碱基未列出)以及它们编码的KDR氨基酸序列(下行)。
图2为带有His-tag、GFP和KDR基因的重组表达载体构建示意图。
图3为PCR扩增GFP和KDR图谱,其中control为对照。
图4为PCR验证重组表达载体质粒pPIC3.5K-plus的图谱。
图5为Ni柱亲和纯化本发明衍生融合蛋白His-GFP-KDR结果。
图6为带有Src和GST-tag基因的重组表达载体构建示意图。
图7为GST-Agarose亲和层析柱亲和纯化本发明衍生融合蛋白GST-Src结果。
具体实施方式
下面用实施例来进一步说明本发明,但本发明并不受其限制。
下列实施例中的材料与方法为:
所采用的分子克隆技术参见J.萨母布鲁克等编的《分子克隆实验指南》。
所使用的工具酶均购自TaKaRa生物公司(大连,中国),具体的反应条件和使用的方法均参考商品说明书。
下面的商品化质粒和大肠杆菌株用于基因克隆:
pBlueScript(+)和pUC19购自天根生化科技(北京)有限公司;
pDEST15购自Invitrogen公司;
pPIC3.5K、大肠杆菌Top10、毕赤酵母GS115、KM71菌株购自Invitrogen。
λ-DNA HindIII Marker(Takala,大连宝生物公司),
Ni亲和层析柱(Ni Sepharose 6 Fast Flow,GE公司),
GST-Agarose亲和层析柱(Amersham Pharmacia Biotech公司)。
实施例1 重组酪氨酸激酶KDR的制备及活性试验
实施例1.1 带有His-tag序列的重组质粒的制备
His-tag基因序列由63个碱基组成,见序列表SEQ ID NO:8,该序列由商业化合成[生工生物工程(上海)有限公司]。该序列的5’端含XbaI-SnaBI酶切位点(5’端第4-15位碱基)以及包含有起始密码子的Kozak序列ATGGCT(5’端第19-24位碱基),3’端含PstI酶切位点(3’端第4-9位碱基)。
该序列经限制性内切酶XbaI和PstI酶切,用T4连接酶连接,克隆入经XbaI和PstI酶切的商用pBlueScript(+)的XbaI和PstI位点处,获得带有His-tag序列的重组质粒His-pBlueScript(+)。
实施例1.2 带有His-tag序列和绿色荧光蛋白GFP基因序列的重组质粒的制备
GFP基因序列由717个碱基(序列表SEQ ID NO:9)组成,设计合成了PCR引物P1和P2,其中P1引入了DNA酶切位点PstI,P2引入了DNA酶切位点EcoRI。
P1:5’-AAACTGCAGATGTCTAAAGGTGAAGAATTATTC-3’
PstI (SEQ ID NO:11)
P2:5’-CCGGAATTCTTTGTACAATTCATCCATAC-3’
EcoRI (SEQ ID NO:12)
利用上述引物对P1和P2,以含有该GFP基因的pUC19重组质粒为模板(参考Microbiology,1997,143:303-311),通过如下PCR反应扩增得到一个732bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,46℃退火1分钟,72℃延伸1.5分钟循环反应5次,然后再94℃变性1分钟,52℃退火1分钟,72℃延伸1.5分钟循环反应25次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3所示),经限制性内切酶PstI和EcoRI酶切,用T4连接酶连接,克隆入经PstI和EcoRI酶切的实施例1.1的His-pBlueScript(+)的PstI和EcoRI位点处,获得带有His-tag序列和GFP序列的重组质粒His-GFP-pBlueScript(+)。
实施例1.3 KDR基因序列的优化制备及过氧化物酶体的定位信号的引入
KDR基因序列由1098个碱基组成,在不改变氨基酸的前提下,对KDR基因的密码子进行优化。KDR氨基酸序列如SEQ ID NO:2所示;原核苷酸序列如SEQ ID NO:1所示、优化后的序列如SEQ ID NO:3所示,两组核苷酸序列对比参见图1。优化后的序列由公司[生工生物工程(上海)有限公司]商业化全合成,并克隆在商用pBlueScript(+)载体上。
以pBlueScript(+)载体上优化的KDR基因为模板,设计合成了PCR引物P3和P4,其中P3引入了DNA酶切位点EcoRI以及凝血酶酶切位点(双波浪线表示,对应的氨基酸序列为LVPRGS),P4引入了DNA酶切位点AvrII-NotI及过氧化物酶体的定位信号SKL(双下划线标记)。
P3:
5’-CCGGAATTCCTGGTCCCCAGAGGCTCTATGGACCCTGATGAGTTG-3’
EcoRI (SEQ ID NO:13)
P4:
5’-CATTAGCGGCCGCCCTAGGCTACTAGTCCTGCTGAGCG
TT-3’ AvrII-NotI (SEQ ID NO:14)
利用上述引物对P3和P4,以含有该KDR基因的pBlueScript(+)载体为模板,通过如下PCR反应扩增得到一个1159bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,60℃退火1分钟,72℃延伸1.5分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3)。
实施例1.4 带有KDR序列的重组质粒的构建
将实施例1.3所得PCR反应片段经限制性内切酶EcoRI和NotI酶切,用T4连接酶连接,克隆入经EcoRI和NotI酶切的商用pPIC3.5K的EcoRI和NotI位点处,获得带有KDR序列的重组质粒KDR-pPIC3.5K。
实施例1.5 含有His-tag片段以及GFP-KDR片段的表达载体的构建
用限制性内切酶XbaI和EcoRI酶切实施例1.2中所得的重组质粒His-GFP-pBlueScript(+),以及琼脂糖凝胶电泳回收His-GFP片段,用T4连接酶连接,克隆入经XbaI和EcoRI酶切的实施例1.4所得的KDR-pPIC3.5K的XbaI和EcoRI位点处,获得最终目的表达载体pPIC3.5K-plus(如图2)。转化大肠杆菌Top10后筛选重组子,用引物对P1和P4进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2kb左右,得到6个阳性克隆(见图4中的3-4、6-9泳道),取8号菌经DNA测序仪(仪器型号3730)测定该片段序列,其核苷酸序列如SEQ ID NO:6所示,氨基酸序列如SEQ ID NO:7所示,表明扩增序列与既定目标序列完全相符。其中,除去His-tag后的GFP-KDR融合蛋白(含凝血酶酶切位点)的cDNA核苷酸序列如SEQ ID NO:6所示序列的第43-1887位,氨基酸序列如SEQID NO:7所示序列的第15-629位;而除去GFP及凝血酶酶切位点的本发明重组酪氨酸激酶KDR的cDNA核苷酸序列如SEQ ID NO:4所示,即SEQ IDNO:6所示序列的第781-1887位,氨基酸序列如SEQ ID NO:7所示序列的第261-629位。
实施例1.6 含有KDR序列的重组宿主菌的构建
用限制性内切酶SacI将实施例1.5中所得的重组质粒pPIC3.5K-plus线性化,电转化入毕赤酵母宿主菌GS115感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,用流式细胞仪检测荧光强度以判断各菌株的表达情况,结果表明1号菌(命名为Pichia KDR No.1)在24小时时荧光强度几何平均值为1618.31,是各菌株中表达量最高的。
实施例1.7 产生GFP-KDR的基因工程菌的发酵培养及GFP-KDR的分离纯化
1.基因工程菌(毕赤酵母)的发酵培养
将实施例1.6中所得的基因工程菌Pichia KDR No.1菌株接种于BSM培养基中(参考Sreekrishna K,Kropp KE(1996)Pichia pastoris.In:Wolf K,eds.,Non-Conventional Yeast in Biotechnology:A Handbook.Berlin:Springer-Verlag,pp.203-253),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。
2.GFP-KDR的分离、纯化
按上述条件培养工程菌过程中,每隔6小时取样用流式细胞仪检测荧光强度。当荧光强度出现下降时,停止发酵培养。经测定,酪氨酸激酶融合蛋白的最大表达量为260mg/L。
将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,Ni亲和层析柱分离纯化,以50mM磷酸盐溶液(含250mM咪唑)进行洗脱。洗脱曲线见图5。样品上样至Ni柱之后,先用含20mM咪唑的平衡,再用250mM咪唑洗脱,250mM咪唑洗脱峰即为目标蛋白峰,之后再用1M的咪唑洗脱则没有蛋白洗下。
将纯化的GFP-KDR激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下:
其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶KDR具有高的活性。
为了进一步评价纯化的重组KDR的生物活性,采用商用KDR特异性抑制剂进行KDR抑制实验。结果表明当抑制剂PTK789、SU11248、SU5416的浓度为10-5mol/L时,三者对KDR的抑制率分别为78.6%、60.4%、77.2%,均高于50%,这进一步说明本发明纯化的重组酪氨酸激酶KDR具有良好的生物活性。
实施例2 重组酪氨酸激酶Src的制备及活性测定
实施例2.1 Src基因序列的制备及过氧化物酶体的定位信号的引入
Src基因序列由1608个碱基(序列表SEQ ID NO:15)组成,设计合成了PCR引物P5和P6,其中P5引入了DNA酶切位点SnaBI以及过氧化物酶体的定位信号RLNNLATQL(双下划线标记),SnaBI酶切位点与定位信号之间引入包含有起始密码子的Kozak序列ATGGCT,在P6引入了DNA酶切位点EcoRI以及肠激酶酶切位点(双波浪线表示,对应的氨基酸序列为DDDDK)。
P5:5’-CTGTACGTAATGGCT
SnaBIATGGGTAGCAACAAGAGC-3’ (SEQ ID NO:22)
P6:5’-CGAGAATTCCTTGTCGTCGTCATCGAGGTTCTCCCCGGGCTGGTA-3’ EcoRI (SEQ ID NO:23)
利用上述引物对P5和P6,以含有该Src基因的质粒pBA3CS(BMCBiochemistry,2002,3:32)为模板,通过如下PCR反应扩增得到一个1674bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,65℃退火1分钟,72℃延伸2分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段。
实施例2.2 带有GST-tag序列的重组质粒的制备
GST-tag基因序列由669个碱基组成,见序列表SEQ ID NO:20,设计合成了PCR引物P7和P8,从商业化质粒pDEST15(Invitrogen公司)上扩增得到GST-tag基因序列,其中P7引入了DNA酶切位点EcoRI,P8引入了DNA酶切位点AvrII。
P7:5’-CCGGAATTCTCCCCTATACTAGGTTATTGG-3’
EcoRI (SEQ ID NO:24)
P8:5’-CAACCTAGGCTACTAACGCGGAACCAGATCCGATTT-3’
AvrII (SEQ ID NO:25)
利用上述引物对P7和P8,以含有该GST-tag基因的pDEST15载体为模板,通过如下PCR反应扩增得到一个693bp的DNA片段:以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,54℃退火1分钟,72℃延伸1分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段,经限制性内切酶EcoRI和AvrII酶切,用T4连接酶连接,克隆入经EcoRI和AvrII酶切的商用pPIC3.5K的EcoRI和AvrII位点处,获得带有GST-tag序列的重组质粒GST-pPIC3.5K。
实施例2.3 含有GST-tag片段以及Src片段的表达载体的构建
将实施例2.1所得PCR反应片段经限制性内切酶SnaBI和EcoRI酶切,用T4连接酶连接,克隆入经SnaBI和EcoRI酶切的实施例2.2的GST-pPIC3.5K的SnaBI和EcoRI位点处,获得带有Src序列的最终目的表达载体Src-GST-pPIC3.5K。转化大肠杆菌Top10后筛选重组子,用引物对P5和P8进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2355bp,得到8个阳性克隆,取1号菌经DNA测序仪(仪器型号3730)测定该片段序列,其10-2346位核苷酸序列如SEQ ID NO:18所示,氨基酸序列如SEQ ID NO:19所示,表明扩增序列与既定目标序列完全相符。其中,除去GST-tag及肠激酶酶切位点后的Src重组蛋白单体的cDNA核苷酸序列如SEQ ID NO:18所示序列的第1-1641位(第1-6位为包含启动密码子的Kozak序列),氨基酸序列如SEQ ID NO:19所示序列的第1-547位(相应地第1-2位为Kozak序列编码的两个氨基酸)。
实施例2.4 含有Src序列的重组宿主菌的构建
用限制性内切酶SacI将实施例2.3中所得的重组质粒Src-GST-pPIC3.5K线性化,电转化入毕赤酵母宿主菌KM71感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,玻璃珠破壁之后,用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性以判断各菌株的表达情况,结果表明5号菌(命名为Pichia Src No.5)在24小时时酶活是各菌株中最高的。
实施例2.5 产生Src的基因工程菌的发酵培养及Src的分离纯化
1.基因工程菌(毕赤酵母)的发酵培养
将实施例2.4中所得的基因工程菌Pichia Src No.5菌株接种于BSM培养基中(方法参考实施例1.7),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。
2.Src的分离、纯化
按上述条件培养工程菌过程中,每隔6小时取样用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性。当活性出现下降时,停止发酵培养。
将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,GST-Agarose亲和层析柱(Amersham Pharmacia Biotech)分离纯化,以50mM磷酸盐溶液(含50mmol/L Tris,0.15mol/L NaCl,2.5mmol/L CaCl2,pH7.5)进行洗脱,收集目的蛋白。洗脱曲线见图7。
将纯化的Src激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下:
其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶Src具有高的活性。
序列表
<110>华东理工大学;中国科学院上海药物研究所
<120>在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备
方法
<130>061709C
<160>25
<170>PatentIn version 3.3
<210>1
<211>1098
<212>DNA
<213>人(human)
<220>
<221>CDS
<222>(1)..(1098)
<400>1
atg gat cca gat gaa ctc cca ttg gat gaa cat tgt gaa cga ctg cct 48
Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro
1 5 10 15
tat gat gcc agc aaa tgg gaa ttc ccc aga gac cgg ctg aag cta ggt 96
Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly
20 25 30
aag cct ctt ggc cgt ggt gcc ttt ggc caa gtg att gaa gca gat gcc 144
Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala
35 40 45
ttt gga att gac aag aca gca act tgc agg aca gta gca gtc aaa atg 192
Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met
50 55 60
ttg aaa gaa gga gca aca cac agt gag cat cga gct ctc atg tct gaa 240
Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu
65 70 75 80
ctc aag atc ctc att cat att ggt cac cat ctc aat gtg gtc aac ctt 288
Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu
85 90 95
cta ggt gcc tgt acc aag cca gga ggg cca ctc atg gtg att gtg gaa 336
Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu
100 105 110
ttc tgc aaa ttt gga aac ctg tcc act tac ctg agg agc aag aga aat 384
Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn
115 120 125
gaa ttt gtc ccc tac aag acc aaa ggg gca cga ttc cgt caa ggg aaa 432
Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys
130 135 140
gac tac gtt gga gca atc cct gtg gat ctg aaa cgg cgc ttg gac agc 480
Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser
145 150 155 160
atc acc agt agc cag agc tca gcc agc tct gga ttt gtg gag gag aag 528
Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys
165 170 175
tcc ctc agt gat gta gaa gaa gag gaa gct cct gaa gat ctg tat aag 576
Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys
180 185 190
gac ttc ctg acc ttg gag cat ctc atc tgt tac agc ttc caa gtg gct 624
Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala
195 200 205
aag ggc atg gag ttc ttg gca tcg cga aag tgt atc cac agg gac ctg 672
Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu
210 215 220
gcg gca cga aat atc ctc tta tcg gag aag aac gtg gtt aaa atc tgt 720
Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys
225 230 235 240
gac ttt ggc ttg gcc cgg gat att tat aaa gat cca gat tat gtc aga 768
Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg
245 250 255
aaa gga gat gct cgc ctc cct ttg aaa tgg atg gcc cca gaa aca att 816
Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile
260 265 270
ttt gac aga gtg tac aca atc cag agt gac gtc tgg tct ttt ggt gtt 864
Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val
275 280 285
ttg ctg tgg gaa ata ttt tcc tta ggt gct tct cca tat cct ggg gta 912
Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val
290 295 300
aag att gat gaa gaa ttt tgt agg cga ttg aaa gaa gga act aga atg 960
Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met
305 310 315 320
agg gcc cct gat tat act aca cca gaa atg tac cag acc atg ctg gac 1008
Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp
325 330 335
tgc tgg cac ggg gag ccc agt cag aga ccc acg ttt tca gag ttg gtg 1056
Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val
340 345 350
gaa cat ttg gga aat ctc ttg caa gct aat gct cag cag gat 1098
Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp
355 360 365
<210>2
<211>366
<212>PRT
<213>人(human)
<400>2
Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro
1 5 10 15
Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly
20 25 30
Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala
35 40 45
Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met
50 55 60
Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu
65 70 75 80
Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu
85 90 95
Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu
100 105 110
Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn
115 120 125
Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys
130 135 140
Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser
145 150 155 160
Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys
165 170 175
Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys
180 185 190
Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala
195 200 205
Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu
210 215 220
Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys
225 230 235 240
Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg
245 250 255
Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile
260 265 270
Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val
275 280 285
Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val
290 295 300
Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met
305 310 315 320
Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp
325 330 335
Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val
340 345 350
Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp
355 360 365
<210>3
<211>1098
<212>DNA
<213>人工序列(Artificial)
<220>
<223>针对毕赤酵母密码子偏爱性优化的酪氨酸激酶KDR的核苷酸序列
<400>3
atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct 60
aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt 120
ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt 180
gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag 240
ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt 300
actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc 360
acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc 420
cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct 480
atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat 540
gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg 600
atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc 660
catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc 720
gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc 780
agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag 840
tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct 900
taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg 960
cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga 1020
gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa 1080
gctaacgctc agcaggac 1098
<210>4
<211>1107
<212>DNA
<213>人工序列(Artificial)
<220>
<223>含毕赤酵母过氧化物酶体定位信号SKL且密码子优化的酪氨酸激酶KDR的核苷
酸序列
<220>
<221>transit_peptide
<222>(1099)..(1107)
<400>4
atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct 60
aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt 120
ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt 180
gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag 240
ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt 300
actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc 360
acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc 420
cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct 480
atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat 540
gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg 600
atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc 660
catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc 720
gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc 780
agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag 840
tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct 900
taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg 960
cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga 1020
gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa 1080
gctaacgctc agcaggactc caagttg 1107
<210>5
<211>1107
<212>DNA
<213>人工序列(Artificial)
<220>
<223>含毕赤酵母过氧化物酶体定位信号SKL的酪氨酸激酶KDR的核苷酸序列
<220>
<221>transit_peptide
<222>(1099)..(1107)
<400>5
atggatccag atgaactccc attggatgaa cattgtgaac gactgcctta tgatgccagc 60
aaatgggaat tccccagaga ccggctgaag ctaggtaagc ctcttggccg tggtgccttt 120
ggccaagtga ttgaagcaga tgcctttgga attgacaaga cagcaacttg caggacagta 180
gcagtcaaaa tgttgaaaga aggagcaaca cacagtgagc atcgagctct catgtctgaa 240
ctcaagatcc tcattcatat tggtcaccat ctcaatgtgg tcaaccttct aggtgcctgt 300
accaagccag gagggccact catggtgatt gtggaattct gcaaatttgg aaacctgtcc 360
acttacctga ggagcaagag aaatgaattt gtcccctaca agaccaaagg ggcacgattc 420
cgtcaaggga aagactacgt tggagcaatc cctgtggatc tgaaacggcg cttggacagc 480
atcaccagta gccagagctc agccagctct ggatttgtgg aggagaagtc cctcagtgat 540
gtagaagaag aggaagctcc tgaagatctg tataaggact tcctgacctt ggagcatctc 600
atctgttaca gcttccaagt ggctaagggc atggagttct tggcatcgcg aaagtgtatc 660
cacagggacc tggcggcacg aaatatcctc ttatcggaga agaacgtggt taaaatctgt 720
gactttggct tggcccggga tatttataaa gatccagatt atgtcagaaa aggagatgct 780
cgcctccctt tgaaatggat ggccccagaa acaatttttg acagagtgta cacaatccag 840
agtgacgtct ggtcttttgg tgttttgctg tgggaaatat tttccttagg tgcttctcca 900
tatcctgggg taaagattga tgaagaattt tgtaggcgat tgaaagaagg aactagaatg 960
agggcccctg attatactac accagaaatg taccagacca tgctggactg ctggcacggg 1020
gagcccagtc agagacccac gttttcagag ttggtggaac atttgggaaa tctcttgcaa 1080
gctaatgctc agcaggattc caagttg 1107
<210>6
<211>1887
<212>DNA
<213>人工序列(Artificial)
<220>
<223>含His-tag、GFP、凝血酶酶切位点、KDR、SKL的融合蛋白的核苷酸序列
<220>
<221>CDS
<222>(1)..(1887)
<400>6
atg gct cat cac cac cat cat cat cat cat cat cat ctg cag atg tct 48
Met Ala His His His His His His His His His His Leu Gln Met Ser
1 5 10 15
aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt gaa tta 96
Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu
20 25 30
gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa ggt gaa 144
Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu
35 40 45
ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt act act 192
Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr
50 55 60
ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc ggt tat 240
Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr
65 70 75 80
ggt gtt caa tgt ttt gct aga tac cca gat cat atg aaa caa cat gac 288
Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp
85 90 95
ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga act att 336
Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile
100 105 110
ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc aag ttt 384
Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe
115 120 125
gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att gat ttt 432
Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe
130 135 140
aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac tat aac 480
Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn
145 150 155 160
tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt atc aaa 528
Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys
165 170 175
gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt caa tta 576
Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu
180 185 190
gct gac cat tat caa caa aat act cca att ggt gat ggt cca gtc ttg 624
Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu
195 200 205
tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc aaa gat 672
Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp
210 215 220
cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt act gct 720
Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala
225 230 235 240
gct ggt att acc cat ggt atg gat gaa ttg tac aaa gaa ttc ctg gtc 768
Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val
245 250 255
ccc aga ggc tct atg gac cct gat gag ttg cca ttg gat gaa cac tgc 816
Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys
260 265 270
gag cgt ttg cct tac gac gcc tct aag tgg gag ttc cct aga gat aga 864
Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg
275 280 285
ttg aag ttg gga aag cca ctt ggt aga gga gcc ttt ggt caa gtc att 912
Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile
290 295 300
gag gct gac gcc ttc gga atc gac aag acc gct acc tgc cgt acc gtt 960
Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val
305 310 315 320
gct gtc aaa atg ttg aaa gag gga gct acc cac tct gaa cat aga gcc 1008
Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala
325 330 335
ttg atg tcc gag ttg aag atc ctt atc cac att ggt cat cac ttg aat 1056
Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn
340 345 350
gtt gtc aac ttg ttg ggt gct tgt act aag cca ggt gga cca ttg atg 1104
Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met
355 360 365
gtc att gtc gag ttt tgc aag ttt ggt aac ctt tcc acc tac ctt aga 1152
Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg
370 375 380
tcc aag cgt aac gag ttc gtc cca tac aag act aag ggt gct aga ttc 1200
Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe
385 390 395 400
cgt caa gga aag gac tat gtt ggt gct atc cca gtt gat ttg aag cgt 1248
Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg
405 410 415
aga ttg gat tct atc act tct tct caa tcc tcc gct tct tcc gga ttc 1296
Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe
420 425 430
gtt gag gag aag tct ctt tct gat gtc gag gaa gag gaa gcc cca gag 1344
Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu
435 440 445
gac ctt tac aaa gac ttt ctt act ttg gaa cac ttg atc tgt tac tcc 1392
Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser
450 455 460
ttc cag gtc gcc aaa ggt atg gag ttt ctt gcc tct aga aag tgc atc 1440
Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile
465 470 475 480
cat cgt gac ctt gct gct cgt aac atc ttg ttg tct gaa aag aat gtc 1488
His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val
485 490 495
gtc aag atc tgc gac ttc gga ctt gct cgt gac atc tac aag gac cca 1536
Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro
500 505 510
gac tac gtt aga aag gga gac gcc aga ttg cct ttg aag tgg atg gct 1584
Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala
515 520 525
cca gaa act atc ttc gat aga gtc tac acc atc cag tcc gat gtc tgg 1632
Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp
530 535 540
tcc ttt gga gtt ctt ttg tgg gag agc ttc tct ctt gga gcc tct cct 1680
Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro
545 550 555 560
tac cct gga gtt aag att gat gaa gag ttc tgt aga cgt ttg aag gaa 1728
Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu
565 570 575
gga act aga atg cgt gct cct gac tac act act cct gag atg tat cag 1776
Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln
580 585 590
acc atg ctt gac tgt tgg cat gga gaa cca tct caa cgt cca act ttc 1824
Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe
595 600 605
tcc gag ctt gtt gag cac ctt gga aac ctt ctt caa gct aac gct cag 1872
Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asr Ala Gln
610 615 620
cag gac tcc aag ttg 1887
Gln Asp Ser Lys Leu
625
<210>7
<211>629
<212>PRT
<213>人工序列(Artificial)
<220>
<223>Synthetic Construct
<400>7
Met Ala His His His His His His His His His His Leu Gln Met Ser
1 5 10 15
Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu
20 25 30
Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu
35 40 45
Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr
50 55 60
Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr
65 70 75 80
Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp
85 90 95
Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile
100 105 110
Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe
115 120 125
Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe
130 135 140
Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn
145 150 155 160
Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys
165 170 175
Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu
180 185 190
Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu
195 200 205
Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp
210 215 220
Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala
225 230 235 240
Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val
245 250 255
Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys
260 265 270
Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg
275 280 285
Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile
290 295 300
Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val
305 310 315 320
Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala
325 330 335
Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn
340 345 350
Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met
355 360 365
Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg
370 375 380
Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe
385 390 395 400
Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg
405 410 415
Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe
420 425 430
Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu
435 440 445
Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser
450 455 460
Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile
465 470 475 480
His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val
485 490 495
Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro
500 505 510
Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala
515 520 525
Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp
530 535 540
Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro
545 550 555 560
Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu
565 570 575
Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln
580 585 590
Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe
595 600 605
Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln
610 615 620
Gln Asp Ser Lys Leu
625
<210>8
<211>63
<212>DNA
<213>人工序列(Artificial)
<220>
<223>编码His-tag的核苷酸序列
<400>8
gactctagat acgtaaccat ggctcatcac caccatcatc atcatcatca tcatctgcag 60
tag 63
<210>9
<211>717
<212>DNA
<213>水母(Aequorea victoria)
<220>
<221>CDS
<222>(1)..(717)
<400>9
atg tct aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt 48
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
gaa tta gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa 96
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
20 25 30
ggt gaa ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt 144
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
act act ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc 192
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe
50 55 60
ggt tat ggt gtt caa tgt ttt gct aga tac cea gat cat atg aaa caa 240
Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
cat gac ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga 288
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
act att ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc 336
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
100 105 110
aag ttt gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att 384
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
gat ttt aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac 432
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
tat aac tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt 480
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
atc aaa gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt 528
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
165 170 175
caa tta gct gac cat tat caa caa aat act cca att ggt gat ggt cca 576
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
180 185 190
gtc ttg tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc 624
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
195 200 205
aaa gat cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt 672
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
210 215 220
act gct gct ggt att acc cat ggt atg gat gaa ttg tac aaa taa 717
Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210>10
<211>238
<212>PRT
<213>水母(Aequorea victoria)
<400>10
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe
50 55 60
Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val
165 170 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro
180 185 190
Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser
195 200 205
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val
210 215 220
Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210>11
<211>33
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P1
<400>11
aaactgcaga tgtctaaagg tgaagaatta ttc 33
<210>12
<211>29
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P2
<400>12
ccggaattct ttgtacaatt catccatac 29
<210>13
<211>45
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P3
<400>13
ccggaattcc tggtccccag aggctctatg gaccctgatg agttg 45
<210>14
<211>49
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P4
<400>14
cattagcggc cgccctaggc tactacaact tggagtcctg ctgagcgtt 49
<210>15
<211>1608
<212>DNA
<213>人(human)
<220>
<221>CDS
<222>(1)..(1608)
<400>15
atg ggt agc aac aag agc aag ccc aag gat gcc agc cag cgg cgc cgc 48
Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg
1 5 10 15
agc ctg gag ccc gcc gag aac gtg cac ggc gct ggc ggg ggc gct ttc 96
Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe
20 25 30
ccc gcc tcg cag acc ccc agc aag cca gcc tcg gcc gac ggc cac cgc 144
Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg
35 40 45
ggc ccc agc gcg gcc ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc 192
Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe
50 55 60
gga ggc ttc aac tcc tcg gac acc gtc acc tcc ccg cag agg gcg ggc 240
Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly
65 70 75 80
ccg ctg gcc ggt gga gtg acc acc ttt gtg gcc ctc tat gac tat gag 288
Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu
85 90 95
tct agg acg gag aca gac ctg tcc ttc aag aaa ggc gag cgg ctc cag 336
Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln
100 105 110
att gtc aac aac aca gag gga gac tgg tgg ctg gcc cac tcg ctc agc 384
Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser
115 120 125
aca gga cag aca ggc tac atc ccc agc aac tac gtg gcg ccc tcc gac 432
Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp
130 135 140
tcc atc cag gct gag gag tgg tat ttt ggc aag atc acc aga cgg gag 480
Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu
145 150 155 160
tca gag cgg tta ctg ctc aat gca gag aac ccg aga ggg acc ttc ctc 528
Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu
165 170 175
gtg cga gaa agt gag acc acg aaa ggt gcc tac tgc ctc tca gtg tct 576
Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser
180 185 190
gac ttc gac aac gcc aag ggc ctc aac gtg aag cac tac aag atc cgc 624
Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg
195 200 205
aag ctg gac agc ggc ggc ttc tac atc acc tcc cgc acc cag ttc aac 672
Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn
210 215 220
agc ctg cag cag ctg gtg gcc tac tac tcc aaa cac gcc gat ggc ctg 720
Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu
225 230 235 240
tgc cac cgc ctc acc acc gtg tgc ccc acg tcc aag ccg cag act cag 768
Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln
245 250 255
ggc ctg gcc aag gat gcc tgg gag atc cct cgg gag tcg ctg cgg ctg 816
Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu
260 265 270
gag gtc aag ctg ggc cag ggc tgc ttt ggc gag gtg tgg atg ggg acc 864
Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr
275 280 285
tgg aac ggt acc acc agg gtg gcc atc aaa acc ctg aag cct ggc acg 912
Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr
290 295 300
atg tct cca gag gcc ttc ctg cag gag gcc cag gtc atg aag aag ctg 960
Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu
305 310 315 320
agg cat gag aag ctg gtg cag ttg tat gct gtg gtt tca gag gag ccc 1008
Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro
325 330 335
att tac atc gtc acg gag tac atg agc aag ggg agt ttg ctg gac ttt 1056
Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe
340 345 350
ctc aag ggg gag aca ggc aag tac ctg cgg ctg cct cag ctg gtg gac 1104
Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp
355 360 365
atg gct gct cag atc gcc tca ggc atg gcg tac gtg gag cgg atg aac 1152
Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn
370 375 380
tac gtc cac cgg gac ctt cgt gca gcc aac atc ctg gtg gga gag aac 1200
Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn
385 390 395 400
ctg gtg tgc aaa gtg gcc gac ttt ggg ctg gct cgg ctc att gaa gac 1248
Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp
405 410 415
aat gag tac acg gcg cgg caa ggt gcc aaa ttc ccc atc aag tgg acg 1296
Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr
420 425 430
gct cca gaa gct gcc ctc tat ggc cgc ttc acc atc aag tcg gac gtg 1344
Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val
435 440 445
tgg tcc ttc ggg atc ctg ctg act gag ctc acc aca aag gga cgg gtg 1392
Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val
450 455 460
ccc tac cct ggg atg gtg aac cgc gag gtg ctg gac cag gtg gag cgg 1440
Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg
465 470 475 480
ggc tac cgg atg ccc tgc ccg ccg gag tgt ccc gag tcc ctg cac gac 1488
Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp
485 490 495
ctc atg tgc cag tgc tgg cgg aag gag cct gag gag cgg ccc acc ttc 1536
Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe
500 505 510
gag tac ctg cag gcc ttc ctg gag gac tac ttc acg tcc acc gag ccc 1584
Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro
515 520 525
cag tac cag ccc ggg gag aac ctc 1608
Gln Tyr Gln Pro Gly Glu Asn Leu
530 535
<210>16
<211>536
<212>PRT
<213>人(human)
<400>16
Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg
1 5 10 15
Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe
20 25 30
Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg
35 40 45
Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe
50 55 60
Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly
65 70 75 80
Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu
85 90 95
Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln
100 105 110
Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser
115 120 125
Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp
130 135 140
Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu
145 150 155 160
Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu
165 170 175
Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser
180 185 190
Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg
195 200 205
Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn
210 215 220
Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu
225 230 235 240
Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln
245 250 255
Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu
260 265 270
Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr
275 280 285
Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr
290 295 300
Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu
305 310 315 320
Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro
325 330 335
Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe
340 345 350
Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp
355 360 365
Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn
370 375 380
Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn
385 390 395 400
Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp
405 410 415
Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr
420 425 430
Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val
435 440 445
Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val
450 455 460
Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg
465 470 475 480
Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp
485 490 495
Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe
500 505 510
Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro
515 520 525
Gln Tyr Gln Pro Gly Glu Asn Leu
530 535
<210>17
<211>1641
<212>DNA
<213>人工序列(Artificial)
<220>
<223>含毕赤酵母过氧化物酶体定位信号RLNNLATQL的酪氨酸激酶Src的核苷酸序
列
<220>
<221>transit_peptide
<222>(7)..(33)
<400>17
atggctagat tgaacaactt ggctactcaa ttgatgggta gcaacaagag caagcccaag 60
gatgccagcc agcggcgccg cagcctggag cccgccgaga acgtgcacgg cgctggcggg 120
ggcgctttcc ccgcctcgca gacccccagc aagccagcct cggccgacgg ccaccgcggc 180
cccagcgcgg ccttcgcccc cgcggccgcc gagcccaagc tgttcggagg cttcaactcc 240
tcggacaccg tcacctcccc gcagagggcg ggcccgctgg ccggtggagt gaccaccttt 300
gtggccctct atgactatga gtctaggacg gagacagacc tgtccttcaa gaaaggcgag 360
cggctccaga ttgtcaacaa cacagaggga gactggtggc tggcccactc gctcagcaca 420
ggacagacag gctacatccc cagcaactac gtggcgccct ccgactccat ccaggctgag 480
gagtggtatt ttggcaagat caccagacgg gagtcagagc ggttactgct caatgcagag 540
aacccgagag ggaccttcct cgtgcgagaa agtgagacca cgaaaggtgc ctactgcctc 600
tcagtgtctg acttcgacaa cgccaagggc ctcaacgtga agcactacaa gatccgcaag 660
ctggacagcg gcggcttcta catcacctcc cgcacccagt tcaacagcct gcagcagctg 720
gtggcctact actccaaaca cgccgatggc ctgtgccacc gcctcaccac cgtgtgcccc 780
acgtccaagc cgcagactca gggcctggcc aaggatgcct gggagatccc tcgggagtcg 840
ctgcggctgg aggtcaagct gggccagggc tgctttggcg aggtgtggat ggggacctgg 900
aacggtacca ccagggtggc catcaaaacc ctgaagcctg gcacgatgtc tccagaggcc 960
ttcctgcagg aggcccaggt catgaagaag ctgaggcatg agaagctggt gcagttgtat 1020
gctgtggttt cagaggagcc catttacatc gtcacggagt acatgagcaa ggggagtttg 1080
ctggactttc tcaaggggga gacaggcaag tacctgcggc tgcctcagct ggtggacatg 1140
gctgctcaga tcgcctcagg catggcgtac gtggagcgga tgaactacgt ccaccgggac 1200
cttcgtgcag ccaacatcct ggtgggagag aacctggtgt gcaaagtggc cgactttggg 1260
ctggctcggc tcattgaaga caatgagtac acggcgcggc aaggtgccaa attccccatc 1320
aagtggacgg ctccagaagc tgccctctat ggccgcttca ccatcaagtc ggacgtgtgg 1380
tccttcggga tcctgctgac tgagctcacc acaaagggac gggtgcccta ccctgggatg 1440
gtgaaccgcg aggtgctgga ccaggtggag cggggctacc ggatgccctg cccgccggag 1500
tgtcccgagt ccctgcacga cctcatgtgc cagtgctggc ggaaggagcc tgaggagcgg 1560
cccaccttcg agtacctgca ggccttcctg gaggactact tcacgtccac cgagccccag 1620
taccagcccg gggagaacct c 1641
<210>18
<211>2337
<212>DNA
<213>人工序列(Artificial)
<220>
<223>含RLNNLATQL、Src、肠激酶酶切位点、GST-tag的融合蛋白的核苷酸序列
<220>
<221>CDS
<222>(1)..(2337)
<400>18
atg gct aga ttg aac aac ttg gct act caa ttg atg ggt agc aac aag 48
Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys
1 5 10 15
agc aag ccc aag gat gcc agc cag cgg cgc cgc agc ctg gag ccc gcc 96
Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala
20 25 30
gag aac gtg cac ggc gct ggc ggg ggc gct ttc ccc gcc tcg cag acc 144
Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr
35 40 45
ccc agc aag cca gcc tcg gcc gac ggc cac cgc ggc ccc agc gcg gcc 192
Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala
50 55 60
ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc gga ggc ttc aac tcc 240
Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser
65 70 75 80
tcg gac acc gtc acc tcc ccg cag agg gcg ggc ccg ctg gcc ggt gga 288
Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly
85 90 95
gtg acc acc ttt gtg gcc ctc tat gac tat gag tct agg acg gag aca 336
Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr
100 105 110
gac ctg tcc ttc aag aaa ggc gag cgg ctc cag att gtc aac aac aca 384
Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr
115 120 125
gag gga gac tgg tgg ctg gcc cac tcg ctc agc aca gga cag aca ggc 432
Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly
130 135 140
tac atc ccc agc aac tac gtg gcg ccc tcc gac tcc atc cag gct gag 480
Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu
145 150 155 160
gag tgg tat ttt ggc aag atc acc aga cgg gag tca gag cgg tta ctg 528
Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu
165 170 175
ctc aat gca gag aac ccg aga ggg acc ttc ctc gtg cga gaa agt gag 576
Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu
180 185 190
acc acg aaa ggt gcc tac tgc ctc tca gtg tct gac ttc gac aac gcc 624
Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala
195 200 205
aag ggc ctc aac gtg aag cac tac aag atc cgc aag ctg gac agc ggc 672
Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly
210 215 220
ggc ttc tac atc acc tcc cgc acc cag ttc aac agc ctg cag cag ctg 720
Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu
225 230 235 240
gtg gcc tac tac tcc aaa cac gcc gat ggc ctg tgc cac cgc ctc acc 768
Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr
245 250 255
acc gtg tgc ccc acg tcc aag ccg cag act cag ggc ctg gcc aag gat 816
Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp
260 265 270
gcc tgg gag atc cct cgg gag tcg ctg cgg ctg gag gtc aag ctg ggc 864
Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly
275 280 285
cag ggc tgc ttt ggc gag gtg tgg atg ggg acc tgg aac ggt acc acc 912
Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr
290 295 300
agg gtg gcc atc aaa acc ctg aag cct ggc acg atg tct cca gag gcc 960
Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala
305 310 315 320
ttc ctg cag gag gcc cag gtc atg aag aag ctg agg cat gag aag ctg 1008
Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu
325 330 335
gtg cag ttg tat gct gtg gtt tca gag gag ccc att tac atc gtc acg 1056
Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr
340 345 350
gag tac atg agc aag ggg agt ttg ctg gac ttt ctc aag ggg gag aca 1104
Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr
355 360 365
ggc aag tac ctg cgg ctg cct cag ctg gtg gac atg gct gct cag atc 1152
Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile
370 375 380
gcc tca ggc atg gcg tac gtg gag cgg atg aac tac gtc cac cgg gac 1200
Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp
385 390 395 400
ctt cgt gca gcc aac atc ctg gtg gga gag aac ctg gtg tgc aaa gtg 1248
Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val
405 410 415
gcc gac ttt ggg ctg gct cgg ctc att gaa gac aat gag tac acg gcg 1296
Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala
420 425 430
cgg caa ggt gcc aaa ttc ccc atc aag tgg acg gct cca gaa gct gcc 1344
Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala
435 440 445
ctc tat ggc cgc ttc acc atc aag tcg gac gtg tgg tcc ttc ggg atc 1392
Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile
450 455 460
ctg ctg act gag ctc acc aca aag gga cgg gtg ccc tac cct ggg atg 1440
Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met
465 470 475 480
gtg aac cgc gag gtg ctg gac cag gtg gag cgg ggc tac cgg atg ccc 1488
Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro
485 490 495
tgc ccg ccg gag tgt ccc gag tcc ctg cac gac ctc atg tgc cag tgc 1536
Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys
500 505 510
tgg cgg aag gag cct gag gag cgg ccc acc ttc gag tac ctg cag gcc 1584
Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala
515 520 525
ttc ctg gag gac tac ttc acg tcc acc gag ccc cag tac cag ccc ggg 1632
Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly
530 535 540
gag aac ctc gat gac gac gac aag gaa ttc tcc cct ata cta ggt tat 1680
Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr
545 550 555 560
tgg aaa att aag ggc ctt gtg caa ccc act cga ctt ctt ttg gaa tat 1728
Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr
565 570 575
ctt gaa gaa aaa tat gaa gag cat ttg tat gag cgc gat gaa ggt gat 1776
Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp
580 585 590
aaa tgg cga aac aaa aag ttt gaa ttg ggt ttg gag ttt ccc aat ctt 1824
Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu
595 600 605
cct tat tat att gat ggt gat gtt aaa tta aca cag tct atg gcc atc 1872
Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile
610 615 620
ata cgt tat ata gct gac aag cac aac atg ttg ggt ggt tgt cca aaa 1920
Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys
625 630 635 640
gag cgt gca gag att tca atg ctt gaa gga gcg gtt ttg gat att aga 1968
Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg
645 650 655
tac ggt gtt tcg aga att gca tat agt aaa gac ttt gaa act ctc aaa 2016
Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys
660 665 670
gtt gat ttt ctt agc aag cta cct gaa atg ctg aaa atg ttc gaa gat 2064
Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp
675 680 685
cgt tta tgt cat aaa aca tat tta aat ggt gat cat gta acc cat cct 2112
Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro
690 695 700
gac ttc atg ttg tat gac gct ctt gat gtt gtt tta tac atg gac cca 2160
Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro
705 710 715 720
atg tgc ctg gat gcg ttc cca aaa tta gtt tgt ttt aaa aaa cgt att 2208
Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile
725 730 735
gaa gct atc cca caa att gat aag tac ttg aaa tcc agc aag tat ata 2256
Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile
740 745 750
gca tgg cct ttg cag ggc tgg caa gcc acg ttt ggt ggt ggc gac cat 2304
Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His
755 760 765
cct cca aaa tcg gat ctg gtt ccg cgt tag tag 2337
Pro Pro Lys Ser Asp Leu Val Pro Arg
770 775
<210>19
<211>777
<212>PRT
<213>人工序列(Artificial)
<220>
<223>Synthetic Construct
<400>19
Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys
1 5 10 15
Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala
20 25 30
Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr
35 40 45
Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala
50 55 60
Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser
65 70 75 80
Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly
85 90 95
Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr
100 105 110
Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr
115 120 125
Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly
130 135 140
Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu
145 150 155 160
Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu
165 170 175
Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu
180 185 190
Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala
195 200 205
Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly
210 215 220
Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu
225 230 235 240
Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr
245 250 255
Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp
260 265 270
Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly
275 280 285
Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr
290 295 300
Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala
305 310 315 320
Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu
325 330 335
Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr
340 345 350
Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr
355 360 365
Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile
370 375 380
Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp
385 390 395 400
Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val
405 410 415
Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala
420 425 430
Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala
435 440 445
Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile
450 455 460
Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met
465 470 475 480
Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro
485 490 495
Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys
500 505 510
Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala
515 520 525
Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly
530 535 540
Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr
545 550 555 560
Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr
565 570 575
Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp
580 585 590
Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu
595 600 605
Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile
610 615 620
Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys
625 630 635 640
Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg
645 650 655
Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys
660 665 670
Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp
675 680 685
Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro
690 695 700
Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro
705 710 715 720
Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile
725 730 735
Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile
740 745 750
Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His
755 760 765
Pro Pro Lys Ser Asp Leu Val Pro Arg
770 775
<210>20
<211>669
<212>DNA
<213>人(human)
<220>
<221>CDS
<222>(1)..(669)
<400>20
tcc cct ata cta ggt tat tgg aaa att aag ggc ctt gtg caa ccc act 48
Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr
1 5 10 15
cga ctt ctt ttg gaa tat ctt gaa gaa aaa tat gaa gag cat ttg tat 96
Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr
20 25 30
gag cgc gat gaa ggt gat aaa tgg cga aac aaa aag ttt gaa ttg ggt 144
Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly
35 40 45
ttg gag ttt ccc aat ctt cct tat tat att gat ggt gat gtt aaa tta 192
Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu
50 55 60
aca cag tct atg gcc atc ata cgt tat ata gct gac aag cac aac atg 240
Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met
65 70 75 80
ttg ggt ggt tgt cca aaa gag cgt gca gag att tca atg ctt gaa gga 288
Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly
85 90 95
gcg gtt ttg gat att aga tac ggt gtt tcg aga att gca tat agt aaa 336
Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys
100 105 110
gac ttt gaa act ctc aaa gtt gat ttt ctt agc aag cta cct gaa atg 384
Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met
115 120 125
ctg aaa atg ttc gaa gat cgt tta tgt cat aaa aca tat tta aat ggt 432
Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly
130 135 140
gat cat gta acc cat cct gac ttc atg ttg tat gac gct ctt gat gtt 480
Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val
145 150 155 160
gtt tta tac atg gac cca atg tgc ctg gat gcg ttc cca aaa tta gtt 528
Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val
165 170 175
tgt ttt aaa aaa cgt att gaa gct atc cca caa att gat aag tac ttg 576
Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu
180 185 190
aaa tcc agc aag tat ata gca tgg cct ttg cag ggc tgg caa gcc acg 624
Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr
195 200 205
ttt ggt ggt ggc gac cat cct cca aaa tcg gat ctg gtt ccg cgt 669
Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
<210>21
<211>223
<212>PRT
<213>人(human)
<400>21
Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr
1 5 10 15
Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr
20 25 30
Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly
35 40 45
Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu
50 55 60
Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met
65 70 75 80
Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly
85 90 95
Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys
100 105 110
Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met
115 120 125
Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly
130 135 140
Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val
145 150 155 160
Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val
165 170 175
Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu
180 185 190
Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr
195 200 205
Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg
210 215 220
<210>22
<211>60
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P5
<400>22
ctgtacgtaa tggctagatt gaacaacttg gctactcaat tgatgggtag caacaagagc 60
<210>23
<211>45
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P6
<400>23
cgagaattcc ttgtcgtcgt catcgaggtt ctccccgggc tggta 45
<210>24
<211>30
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P7
<400>24
ccggaattct cccctatact aggttattgg 30
<210>25
<211>36
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物P8
<400>25
caacctaggc tactaacgcg gaaccagatc cgattt 36
机译: 分离自d型沙眼衣原体的pctd质粒,其基因和由其编码的蛋白质,重组基因表达的基因作为融合蛋白在keterologen系统中的重组质粒,及其作为疫苗的用途-和/或用于动物刺激的诊断性k
机译: 使用经合成序列优化的CMY基因(牛磺酸金牛座凝乳酶)生产重组凝乳酶,以表达其在毕赤酵母中的表达。
机译: dna构建体,分离的多核苷酸,分离的dna多核苷酸,表达盒,转基因植物,种子,后代植物,宿主细胞,重组pip-72多肽,组合物,融合蛋白,控制害虫种群的方法,抑制生长或杀死植物的方法害虫,在转基因植物中控制昆虫侵染并提供抗性管理的方法,在生物样品中鉴定编码pip-72多肽的核苷酸序列的方法,在样品中鉴定pip-72多肽的方法