首页> 中国专利> 通过翻译暂停序列理性重设计改善蛋白质可溶性表达的方法

通过翻译暂停序列理性重设计改善蛋白质可溶性表达的方法

摘要

本发明公开了一种通过翻译暂停序列理性重设计改善蛋白质可溶性表达的方法。该方法包括如下步骤:根据蛋白质结构,确定翻译暂停位点应存在的位置;将翻译暂停范围外的缓慢翻译密码子突变为氨基酸相同的高频密码子;在翻译暂停范围内按照选择2~6个密码子进行同义突变,产生翻译暂停位点。该方法是在不改变蛋白质氨基酸序列的前提下,重新设计编码蛋白质的核苷酸序列,增强其可溶性表达的效率。适用性广,前景潜力大。

著录项

  • 公开/公告号CN103266105A

    专利类型发明专利

  • 公开/公告日2013-08-28

    原文格式PDF

  • 申请/专利权人 暨南大学;

    申请/专利号CN201310164454.8

  • 发明设计人 张弓;陈伟;熊盛;金静洁;

    申请日2013-05-07

  • 分类号C12N15/10(20060101);C12N15/31(20060101);C12N15/70(20060101);C12R1/01(20060101);

  • 代理机构44245 广州市华学知识产权代理有限公司;

  • 代理人苏运贞;陈燕娴

  • 地址 510632 广东省广州市黄埔大道西601号

  • 入库时间 2024-02-19 19:28:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-01

    专利权的转移 IPC(主分类):C12N15/10 专利号:ZL2013101644548 登记生效日:20220322 变更事项:专利权人 变更前权利人:广州瑞惠生物科技有限公司 变更后权利人:深圳承启生物科技有限公司 变更事项:地址 变更前权利人:510660 广东省广州市天河区中山大道中38号908房 变更后权利人:518000 广东省深圳市龙华区民治街道樟坑社区青创城C栋3A3 变更事项:专利权人 变更前权利人: 变更后权利人:广州启点生物科技有限公司

    专利申请权、专利权的转移

  • 2015-02-11

    授权

    授权

  • 2013-09-25

    实质审查的生效 IPC(主分类):C12N15/10 申请日:20130507

    实质审查的生效

  • 2013-08-28

    公开

    公开

说明书

技术领域

本发明涉及一种蛋白质表达优化方法,特别涉及一种通过翻译暂停序列理 性重设计改善蛋白质可溶性表达的方法。

背景技术

在蛋白质工程中,人们将基因克隆到宿主表达系统中(如细菌或真核细胞 系),诱导使其表达,以生产所需要的蛋白质。然而,异源基因克隆进宿主细胞 内常常不能很好地表达,产量很低或者进入包涵体没有正常功能,其原因在大 多数情况下是蛋白质的折叠出现问题。

解决蛋白质异源表达错误折叠的问题,传统的思路之一是包涵体复性,即 使用强变性剂将包涵体溶解变性,再控制条件除去变性剂,以期使蛋白质在合 适的溶液条件下重新折叠成为可溶性的蛋白。此法对一些细菌内环境不适宜折 叠的蛋白质较为有效,如人成纤维细胞生长因子的原核表达(黄鹏煌等,重组人 成纤维细胞生长因子8b原核表达载体的构建和纯化研究.中国生物工程杂志, 2013.)。然而此法往往产量低(≤0.1mg/mL)、时间长、步骤繁琐,且有许多蛋 白质不适用于此法(Eiberle,M.K.and A.Jungbauer,Technical refolding of proteins: Do we have freedom to operate?Biotechnol J,2010.5(6):p.547-59)。对需要形成二 硫键而折叠的蛋白质,Novagen公司推出的BL21Origami/Origami2系列表达菌 株,通过敲除trxB和gor两条主要还原途径的酶,降低细胞内还原性氛围以利 于直接在细胞内生成二硫键,但此法适用面同样不宽。

第二种传统思路是分子伴侣辅助折叠。分子伴侣可帮助一些蛋白质的翻译 后折叠,因此共表达分子伴侣(如GroEL/ES,DnaK/J,IbpA/B等)可能有助于某 些外源蛋白的表达。此法在一些特定的重组蛋白(尤其是疫苗)的生产上取得 成功(Guzzo,J.,Biotechnical applications of small heat shock proteins from bacteria. Int J Biochem Cell Biol,2012.44(10):p.1698-705.),但此法的适用面同样不广, 因为有研究表明大多数蛋白质并不依赖分子伴侣而折叠(Kerner,M.J.,et al., Proteome-wide analysis of chaperonin-dependent protein folding in Escherichia coli. Cell,2005.122(2):p.209-20)。

另一种观点认为,细菌中各种tRNA含量差别高达10倍以上,会造成翻译 效率低下。因此,Novagen公司开发了BL21Rosetta/Rosetta2表达菌株,Stratagene 公司开发了BL21-CodonPlus系列表达菌株,都添加了若干种大肠杆菌中低丰度 的tRNA以加速翻译。但我们的研究表明,过多的tRNA整体破坏了翻译暂停, 细胞内大量蛋白质不能正确折叠,这些细胞的生长较慢,对恶劣的生长环境(如 高密度生长)适应度较差(Fedyunin,I.,et al.,tRNA concentration fine tunes protein  solubility.FEBS Lett,2012.586(19):p.3336-40.),对外源蛋白表达可能有负面效 应。

较新的观点认为,各种生物中偏好的密码子不同,在宿主细胞中,外源基 因使用的罕见密码子造成了翻译效率降低。基于codon adaptation index和tRNA  adaptation index的研究揭示了这种密码子的偏好性(Sharp,P.M.and W.H.Li,The  codon Adaptation Index--a measure of directional synonymous codon usage bias,and  its potential applications.Nucleic Acids Res,1987.15(3):p.1281-95)。于是人们使 用“密码子优化”(codon optimization)的方法,将目标基因内的罕见密码子替 换为宿主细胞中对应该氨基酸的高频密码子,试图解决翻译效率低的问题。在 一些情况下这种方法有一定提高蛋白质表达量的效果,国内此类工作报道相对 较多,如金黄色葡萄球菌肠毒素(Huang,P.,H.Y.Sun,and S.Q.Chen,密码子优 化提高重组金葡菌肠毒素O在大肠杆菌中的表达水平.浙江大学学报医学版, 2011.40(3):p.297-303.)、甲型流感病毒核蛋白(Huang,B.Y.,et al.,甲型流感病 毒核蛋白在大肠杆菌中的可溶性高效表达与纯化.病毒学报,2011.27(1):p.50-7. 等的优化表达)。但近年来人们发现,在许多情况下,效果并不明显甚至还会有 副作用,优化过的基因表达效果还不如直接克隆(Menzella,H.G.,Comparison of  two codon optimization strategies to enhance recombinant protein production in  Escherichia coli.Microb Cell Fact,2011.10:p.15.)。至今为止许多应用价值很高 的蛋白质尚不能在工程表达系统中高效表达。

例如,蓝藻抗病毒蛋白N(Cyanovirin-N,简称CVN)是一种源于蓝藻的、 具有抗多种病毒活性的蛋白质,大小约11kDa。1997年开始被发现能与HIV的 衣壳糖蛋白gp120结合,使HIV病毒不能与CD4结合,从而发挥其抗HIV的 活性(Boyd M.R.,et al.,Discovery of cyanovirin-N,a novel human  immunodeficiency virus-inactivating protein that binds viral surface envelope  glycoprotein gp120:potential applications to microbicide development.Antimicrob  Agents Chemother,1997.41(7):p.1521-30.)。随后,人们发现CVN不但能抗HIV, 也能抗多种病毒如人类疱疹病毒、麻疹病毒、埃博拉病毒、流感病毒等(Dey B., et al.,Multiple antiviral activities of cyanovirin-N:blocking of human  immunodeficiency virus type1gp120interaction with CD4and coreceptor and inhibition of diverse enveloped viruses.J Virol,2000.74(10):p.4562-9.; Barrientos L.G.,et al.,Cyanovirin-N binds to the viral surface glycoprotein,GP1,2 and inhibits infectivity of Ebola virus.Antiviral Res,2003.58(1):p.47-56.;吴崇超 等,PEG修饰的蓝藻抗病毒蛋白N衍生物的体内外抗流感病毒的活性.中国科技 论文在线,2012.),应用潜力极大。但该蛋白质非常难以异源高效表达(Xiong S., J.Fan,and K.Kitazato,The antiviral protein cyanovirin-N:the current state of its  production and applications.Appl Microbiol Biotechnol,2010.86(3):p.805-12.)。在 大肠杆菌中表达量极低或形成包涵体而无功能(吕锐等,蓝藻抗病毒蛋白N基 因的原核表达及重组蛋白的纯化和复性.医学研究生学报,2007.11:p.4.; Colleluori D.M.,et al.,Expression,purification,and characterization of recombinant  cyanovirin-N for vaginal anti-HIV microbicide development.Protein Expr Purif, 2005.39(2):p.229-36.),虽能一定程度复性但损失大、产量低。将转运信号肽加 在CVN序列的N端,可将CVN转运至周质空间以规避包涵体,是可溶性表达 但产量低,1升高密度培养液中只能获得10mg(Mori T.,et al.,Recombinant  production of cyanovirin-N,a potent human immunodeficiency virus-inactivating  protein derived from a cultured cyanobacterium.Protein Expr Purif,1998.12(2):p. 151-8.)。加入助溶标签如SUMO等可增强其可溶性表达量,但切除助溶标签时 往往不彻底,大大降低药效、增加药用风险(杨辉等,蓝藻抗病毒蛋白-N衍生 物的克隆、发酵与纯化.生物技术通报,2012.2012(5):p.5.)。在植物叶片中可以 做到可溶性表达,但操作繁琐、生长缓慢,且产量也极低(Sexton A.,et al., Transgenic plant production of Cyanovirin-N,an HIV microbicide.FASEB J,2006. 20(2):p.356-8.)。也因此,CVN迟迟无法大规模生产,也就无法进行临床应用。

传统生化理论“安芬森原则”认为,蛋白质的折叠信息由其氨基酸序列在 一定环境下唯一决定(Taniuchi H.,D.R.Davies,and C.B.Anfinsen,A comparison  of the x-ray diffraction patterns of crystals of reconstituted nuclease-T and of native  staphylococcal nuclease.J Biol Chem,1972.247(10):p.3362-4)。但本发明人的研 究指出,这一传统理论有误。不同的DNA虽然可以翻译成同样的氨基酸,蛋白 质生成的速度(翻译速度)却并非恒定,在某些区段上会比较缓慢,这种现象 称为翻译暂停(translational pausing或translational attenuation)翻译暂停位点 与蛋白质折叠高度相关,若翻译暂停位点不正确,该慢的地方快了,或者该快 的地方慢了,都将导致蛋白质错误折叠聚集,无法得到有功能的可溶性蛋白。 也就是说,蛋白质空间构象不仅由氨基酸的序列决定,也由核苷酸序列决定。 (Zhang G.,M.Hubalewska,and Z.Ignatova,Transient ribosomal attenuation  coordinates protein synthesis and co-translational folding.Nat Struct Mol Biol,2009. 16(3):p.274-80.;Zhang G.and Z.Ignatova,Folding at the birth of the nascent  chain:coordinating translation with co-translational folding.Curr Opin Struct Biol, 2011.21(1):p.25-31.)。这一理论适用于蛋白组中绝大部分蛋白质(Zhang,G.and  Z.Ignatova,Generic algorithm to predict the speed of translational elongation: implications for protein biogenesis.PLoS One,2009.4(4):p.e5036.;Fedyunin,I., et al.,tRNA concentration fine tunes protein solubility.FEBS Lett,2012.586(19):p. 3336-40.)。

发明内容

本发明的首要目的在于克服现有蛋白质可溶性表达技术的缺点与不足,提 供一种通过翻译暂停序列理性重设计改善蛋白质可溶性表达的方法。该方法为 采用序列理性重设计的方法,在不改变其氨基酸序列的前提下人工调整其翻译 暂停,进而提高蛋白质的可溶性表达。

本发明的另一目的在于提供一种表达量高和活性强的CVN突变体的编码核 苷酸序列。该CVN突变体的编码核苷酸序列为通过上述方法得到。

本发明的再一目的在于得到得到通过该编码核苷酸序列得到的CVN突变 体。

本发明的目的通过下述技术方案实现:一种通过翻译暂停序列理性重设计 改善蛋白质可溶性表达的方法,包含以下步骤:

(1)根据蛋白质结构,确定翻译暂停位点应存在的位置

①对多结构域蛋白质,翻译暂停位点设计在:A、结构域分隔处至分隔处下 游40个密码子范围内;以及B、蛋白质编码序列最后20个密码子范围内设计一 个翻译暂停位点;

②对单结构域蛋白质,只需在蛋白质编码序列最后20个密码子范围内设计 一个翻译暂停位点;

(2)将翻译暂停范围外的缓慢翻译密码子突变为氨基酸相同的高频密码子

按表1的对应关系,将翻译暂停范围外的缓慢翻译密码子突变为氨基酸相 同的高频密码子,以消除不需要的翻译暂停;以下密码子均以编码区DNA序列 为准:

表1

氨基酸 缓慢翻译密码子 对应快速翻译的密码子 亮氨酸(Leu) TTA、CTA CTG 异亮氨酸(Ile) ATA ATT

丝氨酸(Ser) TCA、TCC TCT 脯氨酸(Pro) CCA、CCC CCG 苏氨酸(Thr) ACA ACG 组氨酸(His) CAT CAC 精氨酸(Arg) CGA、AGG CGT

(3)在翻译暂停范围内按照以下方法选择2~6个密码子进行同义突变, 产生翻译暂停位点

①寻找以下氨基酸,用表2中所列的缓慢翻译的密码子进行编码;同一个 翻译暂停区段范围内若有两个相同的氨基酸,编码时应尽量采用下表中不同的 密码子进行编码;

表2

氨基酸 缓慢翻译的密码子 亮氨酸(Leu) CTA、TTA 异亮氨酸(Ile) ATA 丝氨酸(Ser) TCA、TCC 脯氨酸(Pro) CCA、CCC 苏氨酸(Thr) ACA 组氨酸(His) CAT 精氨酸(Arg) CGA、AGG

不允许两个缓慢翻译的密码子相邻,相邻两个缓慢翻译的密码子之间的间 距不能超过9个密码子;

②对重设计完毕的序列进行翻译暂停的计算,需要在设定的翻译暂停范围 内出现翻译暂停,而在设定的翻译暂停翻译以外区段不出现翻译暂停;

③若计算结果不满足要求,则返回步骤①,对氨基酸编码进行修改,直至 此步计算符合要求,得到能改善蛋白可溶性表达的核苷酸序列;

所述的单结构域蛋白质优选为CVN蛋白;

步骤(3)②优选为将重设计完毕的序列导入RiboTempo软件中 (http://bioinformatics.jnu.edu.cn/software/ribotempo),计算翻译暂停曲线;在设定 的翻译暂停范围内应出现红线在蓝线以下,且红线最低点不应超过下坐标轴文 字;

一种表达量高和活性强的CVN突变体的编码核苷酸序列,通过上述方法得 到,为CVN-M1或CVN-M2:

CVN-M1的序列如下所示:

CTTGGTAAATTCTCCCAGACCTGCTACAACTCCGCTATCCAGGGTTCTG TTCTGACCTCTACCTGCGAACGTACCAACGGTGGTTACAACACCTCCTCTAT CGACCTGAACTCCGTTATCGAAAACGTTGACGGTTCTCTGAAATGGCAGCC GTCTAACTTCATCGAAACCTGCCGTAACACCCAGCTGGCTGGTTCCTCTGAA CTGGCTGCTGAATGCAAAACCCGTGCTCAGCAGTTCGTTTCTACCAAAATC AACCTAGACGACCATATAGCTAACATAGACGGTACACTAAAATACGAA;

CVN-M2的序列如下所示:

CTTGGTAAATTCTCCCAGACCTGCTACAACTCCGCTATCCAGGGTTCT GTTCTGACCTCTACCTGCGAACGTACCAACGGTGGTTACAACACCTCCTCT ATCGACCTGAACTCCGTTATCGAAAACGTTGACGGTTCTCTGAAATGGCAG CCGTCTAACTTCATCGAAACCTGCCGTAACACCCAGCTGGCTGGTTCCTCT GAACTGGCTGCTGAATGCAAAACCCGTGCTCAGCAGTTCGTTTCTACCAA AATCAACCTAGACGACCATATAGCTAACATCGACGGTACCCTGAAATACGA A;

所述的表达量高和活性强的CVN突变体的编码核苷酸序列在制备CVN突 变体中的应用;

一种表达量高和活性强的CVN突变体,通过如下方法制备得到:将上述编 码核苷酸序列克隆到表达载体上,得到重组载体;将重组载体转化到宿主细胞 中进行表达,纯化,得到表达量高和活性强的CVN突变体;

所述的表达载体优选为pET系列表达载体,更优选为pET-28b;

所述的宿主细胞优选为表达重组蛋白大肠杆菌宿主菌,更优选为大肠杆菌 BL21(DE3)。

所述的表达量高和活性强的CVN突变体,更优选通过包含如下步骤的方法 制备得到:

(1)设计如下的引物:

F-sumo:5’-GGAATTCCATATGGGCATGTCGGACTCAGAAGTC-3’;

R-CVN:5’-TTCCGCGGCCGCTATGGCCGACGTCGACTTCGTATTTCAGGGTACCGTC-3’;

F1-mutant:5’-GACGACCACATCGCTAACATAGACGGTACACTAAAATACGAATGATGAGTCGAC-3’;

R1-mutant:5’-GTCGACTCATCATTCGTATTTTAGTGTACCGTCTATGTTAGCGATGTGGTCGTC-3’;

F2-mutant:5’-GTTTCTACCAAAATCAACCTAGACGACCATATAGCTAACATCGACGGTAC-3’;

R2-mutant:5’-GTACCGTCGATGTTAGCTATATGGTCGTCTAGGTTGATTTTGGTAGAAAC-3’;

(2)第一次PCR扩增:以pET-3c-SUMO-CVN质粒为模板,以 F-sumo/R-CVN为引物进行PCR扩增,得到的PCR产物纯化后使用NdeI和SalI 双酶切;将双酶切后的PCR产物与经过NdeI和SalI双酶切的载体pET-28b,连 接;连接产物转化大肠杆菌DH5α感受态细胞,筛选,得到重组载体 pET-28b-CVN;

(3)第二次PCR扩增:以pET-28b-CVN为PCR扩增模板, F1-mutant/R1-mutant为引物进行PCR扩增,得到的PCR产物纯化经DpnI酶切, cycle pure Kit试剂盒纯化的酶切产物直接转化大肠杆菌DH5α感受态细胞,筛 选,得到重组载体pET-28b-CVN-M1;

(4)第三次PCR扩增:以pET-28b-CVN-M1为PCR扩增模板, F2-mutant/R2-mutant为引物进行PCR扩增,得到的PCR产物纯化经DpnI酶切, cycle pure Kit试剂盒纯化的酶切产物直接转化大肠杆菌DH5α感受态细胞,筛 选,得到重组载体pET-28b-CVN-M2;

(5)诱导表达:将重组载体pET-28b-CVN-M1或pET-28b-CVN-M2转入大 肠杆菌BL21(DE3),得到表达菌株;接着使用含有卡那霉素的LB培养基对 该表达菌株于37℃、180~200rpm的条件下进行培养,在OD600=0.8时,加入 IPTG,IPTG的终浓度为1mM,37℃诱导表达4h后,收集菌体;

(6)纯化:将菌体沉淀按体积比1:10比例重新悬浮于NTA-10缓冲液后 对菌体进行破碎,离心,收集上清;上清上样Ni-NTA亲和层析柱中,首先使用 NTA-10缓冲液洗回基线,再用NTA-40缓冲液洗杂蛋白,最后用NTA-200缓 冲液洗脱,得到目的蛋白CVN突变体;其中,NTA-10缓冲液的组成为20mmol/L  Tris-HCl、pH8.0+0.15mol/L NaCl+10mmol/L咪唑,NTA-40缓冲液的组成为 20mmol/L Tris-HCl、pH8.0+0.15mol/L NaCl+40mmol/L咪唑,NTA-200缓冲液 的组成为20mmol/L Tris-HCl、pH8.0+0.15mol/L NaCl+200mmol/L咪唑;

步骤(2)中所述的PCR条件优选为94℃预变性3min;94变性1min、退火 至55℃保持1min、68℃延伸2min,进行28个循环;68℃延伸5min;

步骤(3)和(4)中所述的PCR条件优选为94℃预变性3min;94变性1min、 退火至55℃保持1min、68℃延伸12min,进行18个循环;68℃延伸5min;

步骤(5)中所述的卡那霉素在LB培养基中的终浓度优选为50mg/L;

步骤(6)中所述的离心的条件优选为4℃、25000g、30min。

本发明相对于现有技术具有如下的优点及效果:

(1)本发明提供的方法是在不改变蛋白质氨基酸序列的前提下,重新设计 编码蛋白质的核苷酸序列,增强其可溶性表达的效率。

(2)各种传统方法(包涵体复性、密码子优化、分子伴侣辅助折叠、还原 性氛围、强化tRNA等)适用面窄,而本发明提供的方法适用于所有不依赖分子 伴侣折叠的蛋白质,这类型蛋白质占所有蛋白质的绝大部分,因此该方法适用 面广。

(3)包涵体复性法步骤繁琐,需加入变性剂,再控制条件去除变性剂,所 需条件需经大量试验试误确定,费时费力,产率低;而本发明提供的方法直接 表达出来就是可溶性蛋白,非常便于纯化、提高产率,按照上述方法理性设计 即可得到优化表达的结果,无需大量的试误。

(4)密码子优化和强化tRNA法均消除了蛋白质折叠所必须的翻译暂停, 因此极易导致蛋白质折叠错误而进入包涵体,得不到有活性的蛋白质;而本发 明提供的方法则确保翻译暂停,利于蛋白质的正确折叠而得到可溶性、有功能 的蛋白质。

(5)本发明提供的方法可与分子伴侣辅助折叠法和还原性氛围法联用,并 不冲突,从而扩大本方法的适用范围。

(6)助溶标签法需要表达纯化后切除助溶标签,但助溶标签的切除经常不 彻底,造成产率低、纯度低,导致药效差甚至有副作用;而本发明提供的方法 则完全不需要助溶标签,不更改原蛋白质的氨基酸序列,不会有这个问题。

(7)对已获临床批文的蛋白质药物,本发明提供的方法优化其可溶性表达 效率但完全不改变其氨基酸序列,因而无需重新做药理和毒理临床试验。

附图说明

图1是翻译暂停曲线图;其中,图(a)是CVN-M1的编码核苷酸序列,图 (b)是CVN-M2的编码核苷酸序列,1是蓝线,2是红线。

图2是CVN及其突变体的可溶性表达分析图;其中,图(a)为SDS-PAGE 图,箭头所示即是CVN目的蛋白条带;图(b)是Western blot图;泳道1为蛋 白Marker,单位为KDa;泳道2是未诱导表达的CVN-BL21;泳道3是诱导表 达的CVN-BL21;泳道4是诱导表达的CVN-M1-BL21;泳道5是诱导表达的 CVN-M2-BL21。

图3是CVN及其突变体蛋白纯化后的SDS-PAGE图,箭头所示即是CVN 目的蛋白条带。

图4是CVN及其突变体抗流感病毒A/HK/8/68(H3N2)的活性结果图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方 式不限于此。

本发明实施例涉及的主要材料如下:宿主菌大肠杆菌BL21(DE3) (Merck)、质粒pET-28b(Merck)、pET3c-SUMO-CVN(本实验室构建,已在 专利号为ZL200810198926.0、名称为“重组蓝藻抗病毒蛋白的制备方法及应用” 公开详细制备过程,目前最简单的方法为直接通过测序公司合成SUMO-CVN融 合序列,连入pET3c载体即可得到pET3c-SUMO-CVN);pfu mix酶、限制性内 切酶NdeⅠ、SalI、DpnI、预染蛋白Marker购自Fermentas公司,引物由华大基 因科技有限公司合成;Ni SepharoseTM6Fast Flow购自GE公司,四甲基偶氮 唑盐(MTT)购自美国SIGMA公司。其它试剂均为分析纯试剂。NTA-10缓冲 液(20mmol/L Tris-HCl、pH8.0+0.15mol/L NaCl+10mmol/L咪唑),NTA-40缓 冲液(20mmol/L Tris-HCl、pH8.0+0.15mol/L NaCl+40mmol/L咪唑),NTA-200 缓冲液(20mmol/L Tris-HCl、pH8.0+0.15mol/L NaCl+200mmol/L咪唑)。

实施例1 CVN密码子优化及表达载体构建

利用翻译暂停理论,对编码CVN蛋白的核苷酸序列进行优化,合理设计翻 译暂停位点,利用突变PCR技术对CVN的核苷酸序列进行同义突变。

CVN蛋白的编码核苷酸序列如下:

CTTGGTAAATTCTCCCAGACCTGCTACAACTCCGCTATCCAGGGTTCTG TTCTGACCTCTACCTGCGAACGTACCAACGGTGGTTACAACACCTCCTCTAT CGACCTGAACTCCGTTATCGAAAACGTTGACGGTTCTCTGAAATGGCAGCC GTCTAACTTCATCGAAACCTGCCGTAACACCCAGCTGGCTGGTTCCTCTGAA CTGGCTGCTGAATGCAAAACCCGTGCTCAGCAGTTCGTTTCTACCAAAATC AACCTGGACGACCACATCGCTAACATAGACGGTACACTAAAATACGAA。

(1)通过翻译暂停理论设计编码CVN突变体的核苷酸序列:

1)根据蛋白质结构,确定翻译暂停位点应存在的位置

①对多结构域蛋白质,翻译暂停位点设计在:A、结构域分隔处至分隔处下 游40个密码子范围内;以及B、蛋白质编码序列最后20个密码子范围内设计一 个翻译暂停位点;

②对单结构域蛋白质,只需在蛋白质编码序列最后20个密码子范围内设计 一个翻译暂停位点;

根据CVN的晶体结构,确定其为单结构域蛋白,因此应在其最后20个密 码子范围内设计一个翻译暂停位点。

2)将翻译暂停范围外的缓慢翻译密码子突变为氨基酸相同的高频密码子

按表3的对应关系,将翻译暂停范围外的缓慢翻译密码子突变为氨基酸相 同的高频密码子,以消除不需要的翻译暂停;以下密码子均以编码区DNA序列 为准:

表3

氨基酸 缓慢翻译密码子 对应快速翻译的密码子 亮氨酸(Leu) TTA、CTA CTG 异亮氨酸(Ile) ATA ATT 丝氨酸(Ser) TCA、TCC TCT 脯氨酸(Pro) CCA、CCC CCG 苏氨酸(Thr) ACA ACG 组氨酸(His) CAT CAC 精氨酸(Arg) CGA、AGG CGT

3)在翻译暂停范围内按照以下方法选择2~6个密码子进行同义突变,产 生翻译暂停位点

①寻找以下氨基酸,用表4中所列的缓慢翻译的密码子进行编码;同一个 翻译暂停区段范围内若有两个相同的氨基酸,编码时应尽量采用下表中不同的 密码子进行编码;

表4

氨基酸 缓慢翻译的密码子 亮氨酸(Leu) CTA、TTA 异亮氨酸(Ile) ATA 丝氨酸(Ser) TCA、TCC 脯氨酸(Pro) CCA、CCC 苏氨酸(Thr) ACA 组氨酸(His) CAT 精氨酸(Arg) CGA、AGG

不允许两个缓慢翻译的密码子相邻,相邻两个缓慢翻译的密码子之间的间 距不能超过9个密码子;

②将重设计完毕的序列导入RiboTempo软件中,计算翻译暂停曲线;在设 定的翻译暂停范围内应出现红线在蓝线以下,且红线最低点不应超过下坐标轴 文字;

③若计算结果不满足要求,则返回步骤①,对氨基酸编码进行修改,直至此 步计算符合要求,得到能改善蛋白可溶性表达的核苷酸序列。

设计得到的编码CVN突变体的核苷酸序列如下:

突变体1(CVN-M1)的编码核苷酸序列:

CTTGGTAAATTCTCCCAGACCTGCTACAACTCCGCTATCCAGGGTTCTG TTCTGACCTCTACCTGCGAACGTACCAACGGTGGTTACAACACCTCCTCTAT CGACCTGAACTCCGTTATCGAAAACGTTGACGGTTCTCTGAAATGGCAGCC GTCTAACTTCATCGAAACCTGCCGTAACACCCAGCTGGCTGGTTCCTCTGAA CTGGCTGCTGAATGCAAAACCCGTGCTCAGCAGTTCGTTTCTACCAAAATC AACCTAGACGACCATATAGCTAACATAGACGGTACACTAAAATACGAA。

突变体2(CVN-M2)的编码核苷酸序列:

CTTGGTAAATTCTCCCAGACCTGCTACAACTCCGCTATCCAGGGTTCTG TTCTGACCTCTACCTGCGAACGTACCAACGGTGGTTACAACACCTCCTCTAT CGACCTGAACTCCGTTATCGAAAACGTTGACGGTTCTCTGAAATGGCAGCC GTCTAACTTCATCGAAACCTGCCGTAACACCCAGCTGGCTGGTTCCTCTGAA CTGGCTGCTGAATGCAAAACCCGTGCTCAGCAGTTCGTTTCTACCAAAATC AACCTAGACGACCATATAGCTAACATCGACGGTACCCTGAAATACGAA。

这两种突变体经RiboTempo软件计算得到的翻译暂停曲线分别如图1中(a) 和(b)所示,两个翻译暂停曲线红线在预定的区域(最后20个密码子)都形成 了翻译暂停位点(红线低于蓝线),符合要求。

针对于突变体1(CVN-M1)的编码核苷酸序列,设计的突变PCR引物如下:

F1-mutant:5’-GACGACCACATCGCTAACATAGACGGTACACTAAAATACGAATGATGAGTCGAC-3’;

R1-mutant:5’-GTCGACTCATCATTCGTATTTTAGTGTACCGTCTATGTTAGCGATGTGGTCGTC-3’。

针对于突变体2(CVN-M2)的编码核苷酸序列,设计的突变PCR引物如下:

F2-mutant:5’-GTTTCTACCAAAATCAACCTAGACGACCATATAGCTAACATCGACGGTAC-3’;

R2-mutant:5’-GTACCGTCGATGTTAGCTATATGGTCGTCTAGGTTGATTTTGGTAGAAAC-3’。

(2)构建pET-28b-CVN的表达质粒

以pET-3c-SUMO-CVN质粒为PCR扩增模板,F-sumo/R-CVN为引物进行 PCR扩增,扩增体系为:引物(10μmol/L)各2μL,pfu mix25μL,模板1μL, 灭菌超纯水20μL;扩增条件为:反应混合物94℃预变性3min;94变性1min、 退火至55℃保持1min、68℃延伸2min,进行28个循环;68℃延伸5min。

F-sumo:5’-GGAATTCCATATGGGCATGTCGGACTCAGAAGTC-3’

R-CVN:5’-TTCCGCGGCCGCTATGGCCGACGTCGACTTCGTATTTCAGGGTACCGTC-3’。

将得到的PCR产物使用DNA纯化试剂盒(OMEGA)回收,得到纯化后的 PCR产物和质粒pET-28b分别用NdeI和SalI双酶切(10×Fastdigest buffer,37℃ 水浴30min),酶切产物进行质量体积比1%琼脂糖凝胶电泳,回收酶切产物,用 T4DNA连接酶(按说明书推荐标准体系配制反应体系),16℃连接过夜,把这两 个酶切产物连接起来,构建成重组质粒pET-28b-CVN。重组质粒转化大肠杆菌 DH5α感受态细胞(Merck),涂布于含有50μg/mL卡那霉素的LB平板,37℃培 养过夜,将筛选得到的阳性克隆送华大基因科技股份有限公司测序,得到符合预 期设计的CVN克隆pET-28b-CVN。

(3)表达CVN突变体的重组载体的构建

①目的基因的获得:以pET-28b-CVN为PCR扩增模板,F1-mutant/R1-mutant 为引物进行PCR扩增,扩增体系为:引物各2μL,pfu mix25μL,模板1μL,灭 菌超纯水19μL;扩增条件为:反应混合物94℃预变性3min;94变性1min、退 火至55℃保持1min、68℃延伸12min,进行18个循环;68℃延伸5min。

将得到的PCR产物使用DNA纯化试剂盒(OMEGA)回收,得到纯化后的 PCR产物经DpnI酶切,cycle pure Kit试剂盒(OMEGA)纯化的酶切产物直接转 化大肠杆菌DH5α感受态细胞(Merck),涂布含有50μg/mL卡那霉素的LB平 板,将筛选得到的阳性克隆送华大基因科技股份有限公司测序,得到符合预期设 计的含有编码CVN突变体1核苷酸序列的克隆以pET-28b-CVN-M1。

②以pET-28b-CVN-M1为PCR扩增模板,F2-mutant/R2-mutant为引物进行 PCR扩增,扩增体系和扩增条件同前。最终构建质粒pET-28b-CVN-M2。

实施例2

(1)表达菌株的制备:

①大肠杆菌BL21(DE3)感受态细胞的制备:制备过程详见《分子克隆实 验指南》第三版;[美]J.莎姆布鲁克著,黄培堂译。

②将表达载体pET-28b-CVN、pET-28b-CVN-M1和pET-28b-CVN-M2分别转 化至大肠杆菌BL21(DE3)感受态细胞:转化过程详见《分子克隆实验指南》 第三版;[美]J.莎姆布鲁克著,黄培堂译。

(2)CVN及其突变体诱导表达和可溶性分析

①将步骤(1)得到的表达菌株CVN-BL21、CVN-M1-BL21和CVN-M2-BL21 分别接种到20mL含50μg/mL卡那霉素含量的LB培养基中,37℃、180rpm培 养,当OD600=0.8时,加IPTG,终浓度为1mM,37℃诱导表达4h后,分别测定 OD600,保证CVN及其突变体收菌时的体积×OD600的值是相同的,5000g、4℃离 心10min收集菌体。菌体用20mmol/L Tris-HCl(pH8.0,0.15mol/L NaCl)缓冲 液重悬,高压(1000bar)均质破碎细胞,18000g、4℃离心30min,上清和沉淀 分别留样待后续的SDS-PAGE电泳(5%浓缩胶、12%分离胶)及Western blot分 析。

BCA试剂盒(碧云天生物技术有限公司)测定CVN及其突变体菌体破碎离 心上清中总蛋白含量,保证蛋白上样量相同,western blot(实验步骤见《精编分 子生物学实验指南》第五版;(美)奥斯伯主编,金由辛译)分析上清中CVN蛋 白的含量。结果如图2所示,CVN突变体1和2可溶性表达的量显著高于CVN, 特别是CVN突变体2,尤为显著。

(3)CVN及其突变体摇瓶发酵和纯化

将步骤(1)得到的表达菌株CVN-BL21、CVN-M1-BL21和CVN-M2-BL21 分别接种到1L、卡那霉素含量为50μg/mL的LB培养基中,按前述的表达条件 进行摇瓶发酵并诱导。4℃、6000×g、10min离心收集菌体,然后将菌体沉淀按体 积比1:10比例重新悬浮于NTA-10缓冲液,高压均质(1000bar)破碎细胞。4 ℃、25000×g、30min离心收集上清。

上清上样至柱床体积为20mL的Ni-NTA亲和层析柱中,流速0.6mL/min, NTA-10缓冲液洗回基线,流速为1mL/min,NTA-40缓冲液洗杂蛋白,NTA-200 缓冲液洗脱目的蛋白;纯化后的CVN蛋白经Sephadex G-25分子筛脱咪唑以及3 KDa的超滤管浓缩,SDS-PAGE电泳鉴定纯化的CVN蛋白的纯度。

根据CVN蛋白质结构域和翻译暂停之间的关系,CVN结构域中引入翻译 暂停的CVN突变体,在37℃条件下诱导表达之后从菌体破碎离心上清中可以用 Western blot检测出CVN突变体蛋白(图2b)。未经优化的天然序列CVN由于可 溶性表达的量极低,经纯化获得CVN蛋白的量极低,以至于不能用考马斯亮蓝 染色检测到;而优化过后的CVN突变体虽然没有氨基酸序列变化,却可以纯化 出大量CVN蛋白(图3)。这说明通过在CVN结构域中合理引入翻译暂停位点 来降低CVN的翻译速度,促进CVN的可溶性表达是切实可行的。

实施例3

CVN抗流感病毒A/HK/8/68(H3N2)活性研究

狗肾上皮细胞MDCK细胞(美国ATCC)经质量体积比0.25%的胰酶溶液消 化后,以2.5×105细胞/孔加入96孔细胞培养板中(MEM培养基,含有体积百分 比10%的小牛血清),待细胞长成单层后弃生长液,用维持液(MEM培养基,不 含小牛血清)分别将药物CVN蛋白(实验室保存,可按公开号为CN101638435、 名称为“一种蓝藻病毒蛋白N突变体,其修饰衍生物及应用”公开的步骤进行制 备)及实施例2纯化得到的CVN突变体蛋白稀释成6个系列浓度(100、50、25、 12.5、6.25、3.125μM),每个稀释度设3个复孔,同时设正常细胞对照组,阳性 药物(利巴韦林)对照组,37℃、5%CO2培养箱内培养48h,每天观察细胞的 变化,MTT法测各孔细胞OD值,计算半数中毒浓度TC50。

在无毒浓度范围内(TC50>50μM)将药物稀释成不同浓度,取药物稀释液各 50μL,人流感毒株A/HK/8/68(H3N2)(ATCC公司,Influenza A virus(H3N2), ATCCVR-1679TM)的病毒稀释液(100TCID50)50μL混合后直接加到单层 MDCK细胞上,每个浓度3个复孔,设阳性药物组,病毒对照组,阴性对照组。 置于37℃、5%CO2,培养48h后,加10μL浓度为5mg/mL的MTT溶液,继续 培养4h,小心吸弃上清液,每孔加100μL DMSO避光摇床放置15min,酶标仪 (Bio-Rad550)读取OD值,测量波长490nm,参考波长630nm。

计算各药物浓度下的抑制率%=(OD药物组-OD病毒对照组)/(OD细胞对 照组-OD病毒对照组)。

CVN及其突变体抗流感病毒H3N2活性结果(图4)表明:CVN及其突变体 对H3N2有显著的抑制作用,并且CVN突变体对H3N2的抑制作用优于CVN, 这说明利用利用蛋白质结构域和翻译暂停的关系,在蛋白质结构域中合理引入翻 译暂停,并且利用翻译暂停理论对CVN核苷酸序列进行重新设计和优化,不仅 可以促进CVN的可溶性表达,而且可以得到活性更好的CVN蛋白。

综上所述,本发明构建的2个CVN突变体,在大肠杆菌BL21(DE3)中表 达成功,并且可溶性表达的量显著高于CVN;克服了CVN易形成包涵体,纯化 困难等缺点。CVN及其突变体抗流感病毒H3N2的活性结果表明:CVN突变体 的活性要好于CVN。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施 例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替 代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号