首页> 中国专利> 一种用于CHO细胞表达可溶性重组人透明质酸酶PH20的基因序列

一种用于CHO细胞表达可溶性重组人透明质酸酶PH20的基因序列

摘要

本发明公开了一种用于CHO细胞表达可溶性重组人透明质酸酶PH20的基因序列,该基因序列具有SEQIDNO.2所示的核苷酸序列。在优化基因序列的5’端添加kozak共有序列后,连接到pOptiVEC-TOPO载体上,再稳定转染到遗传工程改造的中国仓鼠卵巢细胞中,从而实现可溶性重组人透明质酸酶PH20在哺乳动物细胞内的高表达。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-08-27

    授权

    授权

  • 2013-07-24

    实质审查的生效 IPC(主分类):C12N15/56 申请日:20130327

    实质审查的生效

  • 2013-06-26

    公开

    公开

说明书

技术领域

本发明属于生物技术领域,具体涉及一种用于中国仓鼠卵巢细胞(CHO细胞)重组表达可溶性透明质酸酶的基因序列和含有该基因的工程细胞株。

背景技术

透明质酸酶是降解透明质酸的酶家族,透明质酸是胞外基质的必需组分以及间质屏障的主要成分。透明质酸酶能使透明质酸产生低分子化作用,从而降低透明质酸的活性和粘度,提高组织中液体渗透能力。

透明质酸酶家族包括细菌透明质酸酶,来自寄生虫和甲壳动物的透明质酸酶和来自哺乳动物的透明质酸酶。而人的基因组中有6个类透明质酸酶基因:HYAL1、HYAL2、HYAL3、HYAL4、HYALP1和PH20/SPAM1。其中,HYAL3、HYAL4呈现出没有或很少的降解透明质酸活性,而HYAL1、HYAL2是酸活性透明质酸酶,在中性pH条件下一般缺乏催化活性,PH20是中性活性酶,在人体的血液或组织液的pH范围内具有催化活性。

透明质酸酶主要用来改善其他注射用药物的渗透和增加其他药物的组织渗透性和促进扩散或分散。最常见的应用是眼科手术和局部麻醉药物的快速渗透(如牙科),小儿静脉点滴中无法找到血管时使用。还可用于治疗肿瘤,与昂贵的抗体配合皮下注射代替静脉点滴,保持胰岛素和其它泵给药的通畅等用途。由于来源于动物组织中提取的透明质酸酶免疫原性较强,不适于运用于人体临床,利用基因工程重组技术表达、生产人透明质酸酶已成为必然的趋势。由于人全长PH20氨基酸序列的 C端含有糖基磷脂酰肌醇(GPI)修饰位点,影响了其向宿主细胞外的可溶性分泌,故构建可溶性PH20分泌表达株时要去掉PH20前体蛋白(precursor)氨基酸序列C端对应的编码序列,而留下PH20 前体蛋白中1-482位氨基酸对应的编码序列。表达的蛋白称为可溶性重组人PH20蛋白(soluble rHuPH20)。如美国FDA批准上市的Hylenex透明质酸酶,即是soluble rHuPH20 。

中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO)是一种来源于中国仓鼠卵巢的纤维母细胞,是哺乳动物表达系统常用的宿主细胞。它具有很多优点:准确的转录后修饰功能,表达的糖基化药物蛋白在分子结构、理化特性和生物学功能方面最接近天然蛋白分子,表达产物细胞外分泌,便于分离纯化,而且由于其属于成纤维细胞,很少分泌内源蛋白,利用外源蛋白的分离纯化。

    我们在研究中发现,用含可溶性rHuPH20天然基因序列的载体转染遗传工程改造的CHO细胞株(具体为DG44细胞株)而构建的工程细胞株表达PH20的水平较低,导致生产成本高昂。我们对天然序列优化后的基因序列能大大提高目的蛋白在CHO细胞株中的表达水平。

发明内容

本发明的目的在于:针对编码可溶性rHuPH20的天然基因低表达的缺陷,通过优化基因序列,实现可溶性rHuPH20在CHO工程细胞株中的高表达。

本发明所采取的技术方案是:

优化的人透明质酸酶PH20的基因序列,其具有SEQ ID NO.2所示的核苷酸序列。

在上述人透明质酸酶PH20优化基因序列5’端添加kozak共有序列,得到其衍生的DNA序列

一种克隆载体,含有上述人透明质酸酶PH20优化基因序列或者由其衍生DNA序列。

一种表达载体,含有上述人透明质酸酶PH20优化基因序列或者由其衍生DNA序列。

所述表达载体的起始载体为哺乳动物细胞表达载体。

一种中国仓鼠卵巢细胞表达株,含有上述的表达载体。

所述的中国仓鼠卵巢细胞表达株为DHFR基因缺陷型。

上述中国仓鼠卵巢细胞表达株在生产可溶性重组人透明质酸酶PH20上的应用。

本发明的有益效果是:本发明经优化后的PH20的基因序列,连接到pOptiVEC-TOPO载体完成质粒构建,稳定转染到遗传工程改造的中国仓鼠卵巢细胞后,与原序列相比能显著提高可溶性重组人透明质酸酶PH20(soluble rHuPH20)的表达水平。

附图说明

图1为本发明优化的可溶性rHuPH20基因序列与天然基因序列编码的氨基酸序列对比分析;

图2为pOptiVEC-TOPO载体结构示意图。

具体实施方式

下面结合实施例对本发明作进一步的说明,但并不局限于此。

由于下面的操作中将涉及透明质酸酶活性的检测和PH20基因拷贝数的定量,所以这里先介绍一下这两种方法的操作。

一、透明质酸酶的活性检测方法(浊度法)

1、浊度法原理: 酸化的透明质酸(HA)溶液能够与血清形成稳定的胶体状溶液,当透明质酸分解后,与血清的混合液将变澄清。由于透明质酸酶具有催化透明质酸分解的作用,故在一定范围内,透明质酸酶活性与反应后的浊度成反比。

2、材料:马血清和HA对照品均来自SIGMA公司。将HA配置成0.5U/mL、1U/mL、2U/mL、4U/mL、6U/mL、8U/mL、10U/mL共7个活性单位对照品;

3、具体检测过程:HA溶液加至96 孔板中, 每孔20 μL,然后加入20 μL对照品或样品液,充分混匀,37 ℃水浴30 min,取出后每孔加160 μL马血清,混匀,室温放置30 min,测A640。以吸光度A为纵坐标,对照品溶液的效价(U)为横坐标,绘制标准曲线。测得的样品吸光度根据标准曲线算出活性。

二、表达株中可溶性rHuPH20基因拷贝数的定量PCR检测方法

1、引物设计及合成

根据天然及优化的人透明质酸酶PH20基因序列分别设计引物F1 /R1、F2 /R2,根据小鼠管家基因β-actin 基因序列设计引物β-actin F/R,见表1。

2、提取CHO DG44基因组DNA和重组质粒 

提取各重组细胞株基因组、CHO DG44基因组DNA和重组质粒,用核酸蛋白分析仪检测提取的DNA质量及浓度。

3、标准品构建 

计算含有1、5、25、125、625个外源基因拷贝数所需表达载体质量,CHO DG44基因组质量取10ng,公式如下:

[拷贝数×含PH2O基因的表达载体大小(N bp)]/ [CHO DG44组DNA单倍体大小(3 ×109 bp)]=含转基因表达载体质量/CHODG44基因组质量

将不同质量的表达载体(代表不同拷贝数)与CHO DG44基因组DNA (10 ng)混合,构建标准品。

4、标准曲线的确定

以PH2O引物F/R扩增转PH20基因片段,以β-actin F/R 扩增管家基因β-actin作为内参标化基因组DNA的量。PH20 F1/R1 引物的扩增产物为445 bp;PH20 F2/R2引物的扩增产物为445 bp;β-actin F/ R 引物的扩增产物200bp。将PH20基因片段检测引物扩增Ct( PH20)减去相应的β-actin 基因的扩增Ct( β-actin) ,得到的△Ct,再对样品的拷贝数的对数值作图得到绝对定量的标准曲线。

5、实时定量PCR反应体系和条件

反应体系为:模板2μL,上游引物(10 pmol·L-1 ) 0.8μL,下游引物( 10 pmol·L-1) 0.8 μL,SYBR Green Real-Time PCR Mix 10μL,双蒸水6.4μL。 

反应条件为:95 ℃ 10 min;95 ℃ 10 s,60 ℃ 20 s,72 ℃ 30 s,32个循环。每个样设置3个平行样,取均值。

6、重组细胞株可溶性rHuPH20基因拷贝数鉴定

提取各重组细胞株基因组,经体积分数为0.8%琼脂糖凝胶电泳和A260/A280紫外检测,显示基因组无蛋白质和RNA污染。分别取10 ng进行实时定量PCR,扩增PH20基因和β-actin基因,并3次独立重复实验,得出各重组细胞株关于PH20基因的△Ct值。拷贝数依标准曲线对应的公式计算得出。

实施例

一、可溶性人透明质酸酶PH20的基因序列的优化

在分析人透明质酸酶PH20天然基因序列(核苷酸序列如SEQ ID NO.1所示)的基础上,消除稀有密码子、去除不稳定基序、去除RNA茎环结构和利用中国仓鼠卵巢细胞的最佳密码子重新设计。优化后的基因序列如SEQ ID NO.2所示。将优化后的基因序列与天然序列进行nblast同源比对,未得出两者有同源性的结果;而用tblastx进行同源性比较,则显示两者编码的氨基酸序列100%同源(见图1)。

为提高该基因序列在真核宿主中的表达效率,在基因序列编码氨基酸位置1(甲硫氨酸)对应的密码子之前添加Kozak共有序列GCCACC。优化后的基因序列由英潍捷基(上海)贸易有限公司公司合成。

二、包含优化基因的高拷贝/高表达细胞株的筛选

1、真核表达载体的构建(PH20-pOptiVEC–TOPO)

用PCR引物F2和R2(见表1)扩增合成的PH20优化基因(在编码区前含kozak序列),扩增的基因片段用T-A克隆法连接到真核表达载体pOptiVEC-TOPO(见图2)中,构建得到重组表达载体PH20-pOptiVEC–TOPO。

2、重组表达载体转染CHO-DG44细胞

PH20-pOptiVEC–TOPO重组载体用电穿孔法转染CHO-DG44细胞。其中,所用的CHO-DG44细胞为DHFR基因缺陷型,不含有二氢叶酸还原酶基因,不能合成核酸,必须在含有次黄嘌呤(H)和胸苷(T)的培养基中生长。

筛选阳性细胞原理为:当转染的目的基因连有dhfr基因时,阳性细胞也就获得了dhfr基因。可以在缺乏HT的培养基中生长。

转染过程如下:

用CD OptiCHO培养基培养扩增CHO DG44细胞,转染前进行细胞计数,确保95%为活细胞。

离心收集6 ×107细胞沉淀,并在0.7mL的2×转染缓冲液(40mM HEPES,pH7.0,274mM NaCl,10Mm KCl,1.4mM Na2HPO4,12mM dextran)中重悬成2×107细胞的密度。其后加入90μL(250 ug)已用ClaI内切酶线性处理的重组质粒,并将细胞/质粒溶液于室温转移到电穿孔小杯中。细胞/质粒的混合物在875V/cm和960uF通电的电容器的条件下进行电穿孔处理。

3、筛选稳定转染的细胞

为了得到高表达透明质酸酶PH20的细胞株,要通过筛选一批稳定转染成功的细胞,即带有目的基因的pOptiVEC – TOPO Vector已经成功插入细胞染色体。过程如下:

在电穿孔后将细胞从小杯中移出并转移到5mL的CD OptiCHO培养基中,并使其在6孔细胞培养平板中,于5% CO2中37℃于加湿的培养箱内无选择的生长2天。2天后取上清并用浊度法检测透明质酸酶含量。收集细胞,计数并用次黄嘌呤(H)、胸苷缺陷(T)的CD OptiCHO 培养基稀释至2×104个活细胞/mL。将细胞悬液按0.1mL/孔转移入至96孔细胞培养板中,添加H、T缺陷培养基至0.2mL。然后在5%CO2、37℃的孵箱中培养3-4天。收集每孔上清用浊度法检测透明质酸酶含量。选表达量最高的5个克隆,用H、T缺陷的培养基进行扩增,收集细胞后用CD OptiCHO 培养基定容至5×105个活细胞/mL,并冻存处理。 

4、用甲氨喋呤(MTX)扩增、筛选高拷贝/高表达单克隆细胞

(1)MTX进行基因扩增

用MTX进行基因扩增的操作如下:

冻存细胞复苏后用CD OptiCHO 培养基进行扩增培养,离心去掉旧培养基,以3×105/mL 细胞密度接种到100-300mL含有50nM MTX的CD OptiCHO培养基中。细胞液转移至0.5-1.0 L的培养瓶中,于5%CO2、37℃的孵箱环境中培养细胞。每3-4天传代细胞到新鲜的培养基中,接种密度为2×105-3×105细胞/mL。当活性细胞数开始增长时,开始传代细胞,接种密度为2×105-3×105细胞/mL。当活细胞数大于90%时,冻存细胞。

(2)有限稀释法筛选细胞克隆

有限稀释法中细胞所用的培养基为完全克隆培养基,来自Invitrogen公司。100mL完全克隆培养基中成分为:86mL CD FortiCHO;3mL 新鲜配制的200mM L-glutamine;10mL conditioned medium;1mL 100× HT 母液。

有限稀释法操作步骤如下:

① 准备若干个50mL的离心管,精确计算细胞密度,取5-10mL 稳定转染的细胞加到离心管1,然后倍比稀释至1000个细胞/mL。

② 预热完全克隆培养基,从稀释管中吸取200μL 细胞悬液(1000细胞/mL)到完全克隆培养基中。来回倒转5-6次,转移到无菌容器。均分为200μL稀释的细胞到96孔板中培养板中。在37℃条件下,培养96孔板10天。10天后用显微镜观察细胞克隆。浊度法检测细胞表达情况,检测到的表达量和拷贝数结果见表2,筛选出5个高表达克隆细胞株。从表2可知,在相似拷贝数的条件下,本发明中优化的PH20基因对应的表达量要显著高于天然PH20基因对应的表达量。

注:1为与天然PH20组相比,表达量差异十分显著(p<0.01)

以上实施例仅为介绍本发明的优选案例,对于本领域技术人员来说,在不背离本发明精神的范围内所进行的任何显而易见的变化和改进,都应被视为本发明的一部分。

<110>  广州白云山拜迪生物医药有限公司

<120>  一种用于CHO细胞表达可溶性重组人透明质酸酶PH20的基因序列

<130> 

<160>  8    

<170>  PatentIn version 3.5

 

<210>  1

<211>  1446

<212>  DNA

<213>  human

<400>  1

atgggagtgc taaaattcaa gcacatcttt ttcagaagct ttgttaaatc aagtggagta       60

tcccagatag ttttcacctt ccttctgatt ccatgttgct tgactctgaa tttcagagca      120

cctcctgtta ttccaaatgt gcctttcctc tgggcctgga atgccccaag tgaattttgt      180

cttggaaaat ttgatgagcc actagatatg agcctcttct ctttcatagg aagcccccga      240

ataaacgcca ccgggcaagg tgttacaata ttttatgttg atagacttgg ctactatcct      300

tacatagatt caatcacagg agtaactgtg aatggaggaa tcccccagaa gatttcctta      360

caagaccatc tggacaaagc taagaaagac attacatttt atatgccagt agacaatttg      420

ggaatggctg ttattgactg ggaagaatgg agacccactt gggcaagaaa ctggaaacct      480

aaagatgttt acaagaatag gtctattgaa ttggttcagc aacaaaatgt acaacttagt      540

ctcacagagg ccactgagaa agcaaaacaa gaatttgaaa aggcagggaa ggatttcctg      600

gtagagacta taaaattggg aaaattactt cggccaaatc acttgtgggg ttattatctt      660

tttccggatt gttacaacca tcactataag aaacccggtt acaatggaag ttgcttcaat      720

gtagaaataa aaagaaatga tgatctcagc tggttgtgga atgaaagcac tgctctttac      780

ccatccattt atttgaacac tcagcagtct cctgtagctg ctacactcta tgtgcgcaat      840

cgagttcggg aagccatcag agtttccaaa atacctgatg caaaaagtcc acttccggtt      900

tttgcatata cccgcatagt ttttactgat caagttttga aattcctttc tcaagatgaa      960

cttgtgtata catttggcga aactgttgct ctgggtgctt ctggaattgt aatatgggga     1020

accctcagta taatgcgaag tatgaaatct tgcttgctcc tagacaatta catggagact     1080

atactgaatc cttacataat caacgtcaca ctagcagcca aaatgtgtag ccaagtgctt     1140

tgccaggagc aaggagtgtg tataaggaaa aactggaatt caagtgacta tcttcacctc     1200

aacccagata attttgctat tcaacttgag aaaggtggaa agttcacagt acgtggaaaa     1260

ccgacacttg aagacctgga gcaattttct gaaaaatttt attgcagctg ttatagcacc     1320

ttgagttgta aggagaaagc tgatgtaaaa gacactgatg ctgttgatgt gtgtattgct     1380

gatggtgtct gtatagatgc ttttctaaaa cctcccatgg agacagaaga acctcaaatt     1440

ttctac                                                                1446

 

 

<210>  2

<211>  1446

<212>  DNA

<213>  人工序列

<400>  2

atgggcgtgc tgaagttcaa gcacatcttc ttccggtcct tcgtgaagtc ctccggcgtg       60

tcccagatcg tgtttacctt cctgctgatc ccctgctgcc tgaccctgaa ctttcgggcc      120

cctcccgtga tccccaacgt gccatttctg tgggcctgga acgccccctc cgagttctgt      180

ctgggcaagt tcgacgagcc cctggatatg tccctgttct ccttcatcgg ctccccccgg      240

atcaatgcta ccggccaggg cgtgaccatc ttctacgtgg accggctggg ctactacccc      300

tacatcgact ccatcaccgg cgtgaccgtg aacggcggca tcccccagaa gatctccctg      360

caggaccacc tggacaaggc caagaaggac atcaccttct acatgcccgt ggacaacctg      420

ggcatggccg tgatcgactg ggaggaatgg cggcctacct gggccagaaa ctggaagccc      480

aaggacgtgt acaagaaccg gtccatcgag ctggtgcagc agcagaacgt gcagctgtct      540

ctgaccgagg ccaccgagaa ggctaagcag gaattcgaga aggccggcaa ggacttcctg      600

gtggaaacca tcaagctggg caagctgctg cggcccaatc acctgtgggg ctactatctg      660

ttccccgact gctacaacca ccactacaag aagcccggct acaacggctc ctgcttcaac      720

gtggaaatca agcggaacga cgacctgtcc tggctgtgga acgagtccac cgccctgtac      780

ccctccatct acctgaacac ccagcagagc cctgtggccg ccacactgta cgtgcggaac      840

agagtgcgcg aggccatcag agtgtccaag atccccgacg ccaagtcccc cctgcctgtg      900

ttcgcctaca cccggatcgt gttcaccgac caggtgctga aattcctgag ccaggatgag      960

ctggtgtata ccttcggcga gacagtggcc ctgggcgcct ctggaatcgt gatctggggc     1020

accctgtcca tcatgcggtc catgaagtcc tgcctgctgc tggacaacta catggaaaca     1080

atcctgaacc cttacatcat caacgtgacc ctggccgcca agatgtgttc tcaggtgctg     1140

tgccaggaac agggcgtgtg catccggaag aactggaact cctccgacta cctgcacctg     1200

aaccccgaca acttcgccat tcagctggaa aagggcggca agttcaccgt gcggggcaag     1260

cccacactgg aagatctgga acagttctcc gagaagttct actgctcctg ctactccacc     1320

ctgagctgca aagaaaaggc cgacgtgaag gacaccgacg ccgtggacgt gtgtatcgcc     1380

gacggcgtgt gtattgacgc cttcctgaag ccccccatgg aaaccgagga acctcagatc     1440

ttctac                                                                1446

 

 

<210>  3

<211>  23

<212>  DNA

<213>  人工序列

<400>  3

ttacaagacc atctggacaa agc                                               23

 

 

<210>  4

<211>  23

<212>  DNA

<213>  人工序列

<400>  4

gagtgttcaa ataaatggat ggg                                               23

 

 

<210>  5

<211>  20

<212>  DNA

<213>  人工序列

<400>  5

gcaggaccac ctggacaagg                                                   20

 

 

<210>  6

<211>  21

<212>  DNA

<213>  人工序列

<400>  6

tgggtgttca ggtagatgga g                                                 21

 

 

<210>  7

<211>  22

<212>  DNA

<213>  人工序列

<400>  7

tacgccaaca cagtgctgtc tg                                                22

 

 

<210>  8

<211>  22

<212>  DNA

<213>  人工序列

<400>  8

ctgcttgctg atccacatct gc                                                22

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号