公开/公告号CN101200718A
专利类型发明专利
公开/公告日2008-06-18
原文格式PDF
申请/专利权人 南京理工大学;
申请/专利号CN200610098297.5
申请日2006-12-11
分类号C12N15/12(20060101);C12N15/67(20060101);C07K14/78(20060101);C12N15/63(20060101);C12N15/69(20060101);
代理机构32203 南京理工大学专利中心;
代理人朱显国
地址 210094 江苏省南京市孝陵卫200号
入库时间 2023-12-17 20:15:19
法律状态公告日
法律状态信息
法律状态
2015-08-05
专利权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20150714 申请日:20061211
专利申请权、专利权的转移
2015-06-17
专利权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20150525 申请日:20061211
专利申请权、专利权的转移
2014-03-12
专利权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20140219 申请日:20061211
专利申请权、专利权的转移
2013-04-17
授权
授权
2013-04-03
专利申请权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20130314 申请日:20061211
专利申请权、专利权的转移
2008-08-13
实质审查的生效
实质审查的生效
2008-06-18
公开
公开
查看全部
一技术领域
本发明属于基因工程技术领域,具体的说涉及一种类人胶原蛋白基因,还涉及该基因的不同重复数的串联基因,以及含有串联基因的重组质粒及重组质粒的制备方法。
二背景技术
胶原蛋白(也称胶原)是动物体中含量最丰富的一类蛋白质家族。胶原蛋白具有很强的生物活性及生物功能,能参与细胞的迁移、分化和繁殖,使结缔组织具有机械强度,同时胶原蛋白还能促进细胞生长,具有止血、生物相容性和生物降解性能。基于这些特性,胶原蛋白在烧伤、创伤、眼角膜疾病、保健、美容、矫形、硬组织修复、创面止血、药物传递、缓释技术等医药卫生领域有着广泛的应用。另外,胶原蛋白也可作为食品添加剂、饲料添加剂、絮凝剂、照相乳胶材料、表面活性剂和固定化酶载体材料等应用于各个工业和实验室领域。
目前,胶原蛋白的生产主要是利用酸、碱法处理动物来源的组织(猪皮、牛皮、驴皮、鱼皮等),从中提取胶原蛋白。但所得到的产品成分复杂,主要应用于饲料添加及微生物发酵培养基。四川铭让生物科技有限公司采用生物酶定向剪切技术,生产的胶原蛋白组成稳定,具有生物活性。但以上这些方法得到的胶原蛋白产品都有一定的病毒隐患(如疯牛病、口蹄疫、猪瘟疫、禽流感等),特别是应用于人体时易引起异体异种的排异反应,从而限制了胶原蛋白在医药方面的应用。
随着DNA重组技术迅速发展,为了能充分利用胶原蛋白的优良特性,科研工作者开始寻求动物本身以外的胶原蛋白来源。有许多学者利用基因工程技术,选用各种宿主细胞(包括:哺乳动物、昆虫、酵母、大肠杆菌、转基因烟草、转基因鼠、转基因蚕细胞等),生产重组人胶原蛋白,产品具有安全性好、重现性好、质量稳定等优点。但是,同样存在着许多不足和困难。如绢丝腺能分泌人胶原蛋白的转基因蚕,生产的人胶原蛋白长度仅有真正的人胶原蛋白全长的1/5,且含量只有1%左右。总体来说,表达量不高、生产周期长和培养难度大、成本高是以高等动植物细胞为宿主时普遍存在的问题,且不能满足产业化、大批量生产的要求。而细菌表达系统普遍存产生的致热原致使表达产物难以应用于临床;表达的蛋白常以包涵体形式表达,致产物纯化困难;原核表达系统的翻译后加工修饰体系不完善,表达产物的生物活性较低等不足。
三发明内容
本发明的目的在于提供一种类人胶原蛋白基因Gel。
本发明的目的还在于提供一种类人胶原蛋白基因进行不同重复数同向串联所获的基因。
本发明的目的还在于提供一种类人胶原蛋白基因不同重复数同向串联基因的重组质粒。
本发明的目的还在于提供一种制备上述的不同重复数同向串联基因重组质粒的方法。
实现本发明目的的技术解决方案:一种类人胶原蛋白基因,其碱基序列如序列表中SEQ ID NO:1所示,即
agaggtccacccggtgagccaggtaacccaggttctccaggaaaccaaggtcaacctggaaacaagggttctcctggaaacccag
gtcaacctggtaacgagggacaaccaggtcaacctggtcaaaacggtcaaccaggtgagcctggatctaacggtcctcaaggttc
ccaaggtaacccaggtaagaacggtcaaccaggttctccaggttcccaaggttctcctggaaaccaaggttctccaggtcaacca
ggtaacccaggtcaacctggagagcaaggtaagccaggtaaccaaggtccagccggtggttaaagaa,
其核酸长度为322bp。
一种含有上述的类人胶原蛋白基因的重组质粒。
一种对上述的类人胶原蛋白基因进行不同重复数同向串联所获的基因。
一种与上述的碱基序列至少有70%同一性的基因。
本发明类人胶原蛋白基因不同重复数同向串联基因,其碱基序列如序列表中SEQID NO:2所示,或其碱基序列如序列表中SEQ ID NO:3所示,或其碱基序列如序列表中SEQ ID NO:4所示,其中SEQ ID NO:4编码的蛋白质的氨基酸序列如序列表中SEQ ID NO:5所示。
一种含有上述的类人胶原蛋白基因不同重复数同向串联基因的重组质粒。
本发明的重组质粒,它是可在宿主中复制和生存的表达质粒。
一种制备上述的不同重复数同向串联基因重组质粒的方法,包括以下步骤:
①选择一对同尾酶,使其位于目的基因单体的两端,即碱基序列如序列表中SEQID NO:1所示的类人胶原蛋白基因的两端;设计包含上述同尾酶识别位点的接头DNA片断;
②将用上述一对同尾酶酶切得到的目的基因单体进行体外连接;
③步骤②得到的连接产物利用接头DNA片断,直接连入已含有目的基因单体的质粒,获得重复数两个或两个以上的重组质粒;
④将步骤③重复数的质粒进行重复数翻倍的连接,获得含有目的基因单体的重复数较高的重组质粒;
⑤将步骤④重复数较高的重组质粒继续进行重复数翻倍的连接,构建含有目的基因单体的重复数更高的重组质粒;
⑥将构建好的适当重复数的串联基因克隆到选定的表达质粒中,获得可以转化宿主细胞用于表达的重组质粒。
本发明与现有技术相比,其显著优点是:(1)设计的类人胶原蛋白基因Gel是全新的序列,且长度上大大少于天然人胶原蛋白基因(数Kbp),实现了在分子水平的操作简单化,更易实现胶原蛋白的基因工程菌发酵生产;(2)该类人胶原蛋白基因Gel同时包含天然人胶原蛋白基因的特征,其表达得对应类人胶原蛋白将具有天然人胶原蛋白的优良特征;(3)在类人胶原蛋白的分子长度方面,通过制备不同重复数同向串联基因重组质粒力求在进一步的酵母表达研究中实现接近较大的分子量的天然人胶原蛋白的类人胶原蛋白的表达生产;(4)该种不同重复数同向串联基因重组质粒的制备方法,仅仅通过简单的体外酶切连接反应和具有成熟技术的原核转化和筛选,实现了任意重复数的目的基因(类人胶原蛋白基因Gel)的串联连接;(5)该法比较现有的许多应用PCR技术实现重复更具有可行性和更易获得成功,避免了达到重复串联基因目的PCR操作中需要的高难度的引物设计和条件探索工作。
四附图说明
图1是本发明重复串联类人胶原蛋白基因重组质粒的酶切电泳图。
图2是本发明重组质粒pPIC9KG6的EcoRI和NotI双酶切电泳图。
五具体实施方式
本发明的类人胶原蛋白基因,其碱基序列如序列表中SEQ ID NO:1所示,即:
agaggtccacccggtgagccaggtaacccaggttctccaggaaaccaaggtcaacctggaaacaagggttctcctggaaacccaggtcaacctggtaacgagggacaaccaggtcaacctggtcaaaacggtcaaccaggtgagcctggatctaacggtcctcaaggttcccaaggtaacccaggtaagaacggtcaaccaggttctccaggttcccaaggttctcctggaaaccaaggttctccaggtcaaccaggtaacccaggtcaacctggagagcaaggtaagccaggtaaccaaggtccagccggtggttaaagaa
其核酸长度为322bp,命名为Gel。
结合图1,本发明含有上述的类人胶原蛋白基因的重组质粒。将类人胶原蛋白基因Gel克隆于质粒pUC57的SmaI位点,得到的重组质粒命名为pUC57Gel。重组质粒pUC57Gel的EcoRI单酶切电泳结果见附图1的泳道2,其中泳道1、5为DNA分子量标准DL15000(购于大连宝生物工程有限公司)。
对碱基序列如序列表中SEQ ID NO:1所示的类人胶原蛋白基因进行两个或两个以上的不同重复数同向串联而获得的基因。例如重复数分别为2,3,6的类人胶原蛋白基因同向串联基因的碱基序列如序列表中SEQ ID NO:2,3,4所示,核酸长度分别为619bp,900bp,2106bp。
本发明还包括碱基序列至少与序列表中SEQ ID NO:1,2,3,4所示的碱基序列有70%同一性的基因。
本发明类人胶原蛋白基因六重复数同向串联基因,其碱基序列如序列表中SEQ IDNO:4所示,它编码的类人胶原蛋白的氨基酸序列如序列表中SEQ ID NO:5所示。该类人胶原蛋白的氨基酸长度为696个氨基酸,分子量约为65Ku,等电点为4.5。
本发明含有类人胶原蛋白基因不同重复数同向串联基因的重组质粒。将类人胶原蛋白基因不同重复数的同向串联基因克隆到各种质粒中可以得到不同的重组质粒,例如pPIC9KG6。
上述的重组质粒可在宿主中复制和生存的表达质粒。例如pUC57Gel,pPIC9KG6等,真核的表达质粒为pPIC9K、pCDNA3.0等,原核的表达质粒为pUC18、pET32等。即将类人胶原蛋白基因Gel,类人胶原蛋白基因的重复数为2,3,4,6等的同向串联基因克隆到真核表达质粒pPIC9K或pCDNA3.0,原核表达质粒为pUC18或pET32后得到的重组质粒。
以下实施例说明不同重复数同向串联基因重组质粒的制备方法,任何欲进行重复同向串联的DNA片段(基因)都可以通过这样的制备方法达到构建含有不同重复数基因、并同向串联的重组质粒。质粒包括任何可以在大肠杆菌、酵母、植物、动物细胞内进行克隆和/或表达的质粒。
该制备方法可以实现任何重复数的基因单体的同向串联,例如以下步骤中涉及和得到的重复数为2,3,4,6的类人胶原蛋白基因的同向串联基因,另外,通过该方法可以制备重复数为5,8,12等的其他重复数的类人胶原蛋白基因的同向串联基因。
1、选择一对同尾酶,使其位于目的基因单体的两端,设计包含上述同尾酶识别位点的接头DNA片断;
首先选择一对同尾酶,使其存在于目的基因单体的两端,即欲重复同向串联的DNA片段的两端。接头的设计应同时考虑目的基因和欲选用的质粒(表达质粒)本身序列的特点,一般接头序列设计为一端具有这样的酶切位点:基因本身不具有该酶切位点而质粒具有该限制性内切酶的单个酶切位点;另一端具有已选用的一对同尾酶中某一个的酶切位点。并且考虑接头序列的长度,使得目的基因匹配所选质粒的开放读码框。并且一个接头可以附加考虑添加标记肽或者蛋白成熟过程中剪切掉的信号肽、前导肽等;另一个接头可以考虑添加终止密码子、标记肽(如GST、His标记)等。
具体来讲,设计的类人胶原蛋白基因单体(Gel)作为目的基因单体,该单体碱基序列见序列表SEQ ID NO:1,由上海捷瑞生物工程有限公司合成,并克隆在质粒pUC57的SmaI位点,得到的重组质粒命名为pUC57Gel,质粒pUC57Gel的EcoRI单酶切电泳结果见附图1的泳道2,其中泳道1,5为DNA分子量标准DL15000(购于宝生物工程有限公司)。选择的一对同尾酶为DraIII和Van91I,位于类人胶原蛋白基因单体(Gel)的两端。设计的接头为A1(由碱基序列如序列表SEQ ID NO:6与SEQ ID NO:7的单链DNA复性而得)和A2(由碱基序列如序列表SEQ ID NO:8与SEQ ID NO:9的单链DNA复性而得)。其中A1含有的酶切位点为EcoRI和DraIII,A2含有的酶切位点为NotI和Van91I。选择的表达质粒为pPIC9K。
2、将用一对同尾酶酶切得到的目的基因单体进行体外连接
将重组质粒pUC57Gel采用CaCl2法转化大肠杆菌DH5α,经过含Amp的LB平板筛选得到含有质粒pUC57Gel的重组大肠杆菌,命名为DH5α/pUC57Gel。液体LB培养基过夜培养DH5α/pUC57Gel,提取质粒,得到大量的pUC57Gel。以一对同尾酶DraIII和Van91I双酶切质粒pUC57Gel,电泳回收约300bp的小片段,获得大量类人胶原蛋白基因单体,将这部分类人胶原蛋白基因单体用T4DNA连接酶进行连接,4℃过夜,得到含有不同重复数胶原蛋白基因单体的连接体,电泳显示重复数集中在2、3,还有大量未参与连接的游离类人胶原蛋白基因单体。
3、步骤2得到的连接产物利用接头,直接连入已含有目的基因单体的质粒,获得重复数较少的重组质粒
将步骤2得到连接产物加入到含有pUC57Gel的EcoRI/DraIII双酶切后电泳回收得到的大片段和EcoRI酶切回收的复性接头A1的连接体系中,4℃过夜连接。连接产物采用CaCl2法转化大肠杆菌Top10F’,经过含Amp的LB平板筛选阳性克隆,经过提取筛选到的阳性克隆的质粒并进行酶切电泳检验含有质粒的长度判断得到的重组大肠杆菌所含有的质粒中包含类人胶原蛋白基因单体的重复数,主要出现包含有2、3、4重复数的重组质粒的大肠杆菌。将含有重复数为3的质粒定名为pUC57A1G3,含有该pUC57A1G3质粒的重组大肠杆菌命名为Top10F’/pUC57A1G3。质粒pUC57A1G3的EcoRI单酶切电泳结果见附图1的泳道3。
4、将重复数较少的质粒进行重复数翻倍的连接,获得含有目的基因的重复数较高的重组质粒
液体LB培养基过夜培养Top10F’/pUC57A1G3,提取质粒,得大量的pUC57A1G3。以限制性内切酶EcoRI和Van91I双酶切质粒pUC57A1G3,电泳回收约900bp的小片段,获得大量类人胶原蛋白基因三联体DNA片段。另外以限制性内切酶EcoRI和DraIII双酶切质粒pUC57A1G3,电泳回收大片段,得到含有3重复类人胶原蛋白基因单体的pUC57A1G3质粒大片段。将上述回收得到的两种片断用T4DNA连接酶连接,4℃过夜,得到的连接产物直接采用CaCl2法转化大肠杆菌Top10F’,经过含Amp的LB平板筛选得到含有pUC57A1G6(含有6个类人胶原蛋白基因单体重复的重组质粒)的重组大肠杆菌,命名为Top10F’/pUC57A1G6。质粒pUC57A1G6的EcoRI单酶切电泳结果见附图1的泳道4。
5、将重复数较高的重组质粒继续进行重复数翻倍的连接,构建含有目的基因的重复数更高的重组质粒
此步骤可以选择不做或者做一次或者做两次以上,得到重复数为12或更多的类人胶原蛋白基因的同向串联基因。具体操作参考步骤4。
6、将构建好的适当重复数的串联基因克隆到选定的表达质粒中,获得可以转化宿主细胞(大肠杆菌、酵母、植物、动物细胞等)用于表达的重组质粒
液体LB培养基过夜培养Top10F’/pUC57A1G6,提取质粒,得到大量的pUC57A1G6。以限制性内切酶EcoRI和Van91I双酶切质粒pUC57A1G6,电泳回收约1800bp的小片段,获得大量类人胶原蛋白基因六联体DNA片段。加入到含有pPIC9K的EcoRI/NotI双酶切后电泳回收得到的大片段和NotI酶切回收的复性接头A2的连接体系中,4℃过夜连接。得到的连接产物直接采用CaCl2法转化大肠杆菌Top10F’,经过含Amp的LB平板筛选得到含有pPIC9KG6(含有6个类人胶原蛋白基因单体重复以及接头A1和A2的重组表达质粒)的重组大肠杆菌,命名为Top10F’/pPIC9KG6。在以液体LB培养基过夜培养Top10F’/pPIC9KG6,提取质粒,即得到大量可用于转化毕赤酵母(Pichia Pastoris)的pPIC9KG6质粒。重组质粒pPIC9KG6的EcoRI与NotI双酶切电泳结果见附图2的泳道2,其中,泳道1为DNA分子量标准DL2000(购于宝生物工程有限公司);泳道3为DNA分子量标准DL15000(购于宝生物工程有限公司)。
本发明所最终获得的表达载体pPIC9KG6,已经完成了类人胶原蛋白基因的构建工作,可以直接用于转化酵母,并且所得到的重组酵母可以用于表达产生类人胶原蛋白。重组酵母所产生的类人胶原蛋白将会是本发明中的六重复串联类人胶原蛋白基因所编码的蛋白质,其氨基酸序列见序列表SEQ ID NO:3。本发明为利用重组生物反应器实现工业化廉价生产优质的类人胶原蛋白提供基因资源。本发明所提供的不同重复数同向串联基因重组质粒的制备方法,可以指导其它类型的基因构建重复同向串联基因重组质粒的工作。
序列表
<110>南京理工大学
<120>类人胶原蛋白基因、其不同重复数的同向串联基因、含有串联基因的重组质粒及制
备方法
<160>9
<170>PatentIn Version3.3
<210>1
<211>322
<212>DNA
<213>人工序列
<220>
<223>类人胶原蛋白基因Gel
<400>1
agaggtccac ccggtgagcc aggtaaccca ggttctccag gaaaccaagg tcaacctgga 60
aacaagggtt ctcctggaaa cccaggtcaa cctggtaacg agggacaacc aggtcaacct 120
ggtcaaaacg gtcaaccagg tgagcctgga tctaacggtc ctcaaggttc ccaaggtaac 180
ccaggtaaga acggtcaacc aggttctcca ggttcccaag gttctcctgg aaaccaaggt 240
tctccaggtc aaccaggtaa cccaggtcaa cctggagagc aaggtaagcc aggtaaccaa 300
ggtccagccg gtggttaaag aa 322
<210>2
<211>619
<212>DNA
<213>人工序列
<220>
<223>类人胶原蛋白基因二重复同向串联基因
<400>2
agaggtccac ccggtgagcc aggtaaccca ggttctccag gaaaccaagg tcaacctgga 60
aacaagggtt ctcctggaaa cccaggtcaa cctggtaacg agggacaacc aggtcaacct 120
ggtcaaaacg gtcaaccagg tgagcctgga tctaacggtc ctcaaggttc ccaaggtaac 180
ccaggtaaga acggtcaacc aggttctcca ggttcccaag gttctcctgg aaaccaaggt 240
tctccaggtc aaccaggtaa cccaggtcaa cctggagagc aaggtaagcc aggtaaccaa 300
ggtccagccg gtgagccagg taacccaggt tctccaggaa accaaggtca acctggaaac 360
aagggttctc ctggaaaccc aggtcaacct ggtaacgagg gacaaccagg tcaacctggt 420
caaaacggtc aaccaggtga gcctggatct aacggtcctc aaggttccca aggtaaccca 480
ggtaagaacg gtcaaccagg ttctccaggt tcccaaggtt ctcctggaaa ccaaggttct 540
ccaggtcaac caggtaaccc aggtcaacct ggagagcaag gtaagccagg taaccaaggt 600
ccagccggtg gttaaagaa 619
<210>3
<211>900
<212>DNA
<213>人工序列
<220>
<223>类人胶原蛋白基因三重复同向串联基因
<400>3
agaggtccac ccggtgagcc aggtaaccca ggttctccag gaaaccaagg tcaacctgga 60
aacaagggtt ctcctggaaa cccaggtcaa cctggtaacg agggacaacc aggtcaacct 120
ggtcaaaacg gtcaaccagg tgagcctgga tctaacggtc ctcaaggttc ccaaggtaac 180
ccaggtaaga acggtcaacc aggttctcca ggttcccaag gttctcctgg aaaccaaggt 240
tctccaggtc aaccaggtaa cccaggtcaa cctggagagc aaggtaagcc aggtaaccaa 300
ggtccagccg gtgagccagg taacccaggt tctccaggaa accaaggtca acctggaaac 360
aagggttctc ctggaaaccc aggtcaacct ggtaacgagg gacaaccagg tcaacctggt 420
caaaacggtc aaccaggtga gcctggatct aacggtcctc aaggttccca aggtaaccca 480
ggtaagaacg gtcaaccagg ttctccaggt tcccaaggtt ctcctggaaa ccaaggttct 540
ccaggtcaac caggtaaccc aggtcaacct ggagagcaag gtaagccagg taaccaaggt 600
ccagccggtg agccaggtaa cccaggttct ccaggaaacc aaggtcaacc tggaaacaag 660
ggttctcctg gaaacccagg tcaacctggt aacgagggac aaccaggtca acctggtcaa 720
aacggtcaac caggtgagcc tggatctaac ggtcctcaag gttcccaagg taacccaggt 780
aagaacggtc aaccaggttc tccaggttcc caaggttctc ctggaaacca aggttctcca 840
ggtcaaccag gtaacccagg tcaacctgga gagcaaggta agccaggtaa ccaaggtcca 900
<210>4
<211>2106
<212>DNA
<213>人工序列
<220>
<223>类人胶原蛋白基因六重复同向串联基因
<220>
<221>CDS
<222>(1)...(2091)
<400>4
atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga aaagagaggc tgaagcttac gtagaattcc tcgagaaaag aggtccaccc 300
ggtgagccag gtaacccagg ttctccagga aaccaaggtc aacctggaaa caagggttct 360
cctggaaacc caggtcaacc tggtaacgag ggacaaccag gtcaacctgg tcaaaacggt 420
caaccaggtg agcctggatc taacggtcct caaggttccc aaggtaaccc aggtaagaac 480
ggtcaaccag gttctccagg ttcccaaggt tctcctggaa accaaggttc tccaggtcaa 540
ccaggtaacc caggtcaacc tggagagcaa ggtaagccag gtaaccaagg tccagccggt 600
gagccaggta acccaggttc tccaggaaac caaggtcaac ctggaaacaa gggttctcct 660
ggaaacccag gtcaacctgg taacgaggga caaccaggtc aacctggtca aaacggtcaa 720
ccaggtgagc ctggatctaa cggtcctcaa ggttcccaag gtaacccagg taagaacggt 780
caaccaggtt ctccaggttc ccaaggttct cctggaaacc aaggttctcc aggtcaacca 840
ggtaacccag gtcaacctgg agagcaaggt aagccaggta accaaggtcc agccggtgag 900
ccaggtaacc caggttctcc aggaaaccaa ggtcaacctg gaaacaaggg ttctcctgga 960
aacccaggtc aacctggtaa cgagggacaa ccaggtcaac ctggtcaaaa cggtcaacca 1020
ggtgagcctg gatctaacgg tcctcaaggt tcccaaggta acccaggtaa gaacggtcaa 1080
ccaggttctc caggttccca aggttctcct ggaaaccaag gttctccagg tcaaccaggt 1140
aacccaggtc aacctggaga gcaaggtaag ccaggtaacc aaggtccagc cggtgagcca 1200
ggtaacccag gttctccagg aaaccaaggt caacctggaa acaagggttc tcctggaaac 1260
ccaggtcaac ctggtaacga gggacaacca ggtcaacctg gtcaaaacgg tcaaccaggt 1320
gagcctggat ctaacggtcc tcaaggttcc caaggtaacc caggtaagaa cggtcaacca 1380
ggttctccag gttcccaagg ttctcctgga aaccaaggtt ctccaggtca accaggtaac 1440
ccaggtcaac ctggagagca aggtaagcca ggtaaccaag gtccagccgg tgagccaggt 1500
aacccaggtt ctccaggaaa ccaaggtcaa cctggaaaca agggttctcc tggaaaccca 1560
ggtcaacctg gtaacgaggg acaaccaggt caacctggtc aaaacggtca accaggtgag 1620
cctggatcta acggtcctca aggttcccaa ggtaacccag gtaagaacgg tcaaccaggt 1680
tctccaggtt cccaaggttc tcctggaaac caaggttctc caggtcaacc aggtaaccca 1740
ggtcaacctg gagagcaagg taagccaggt aaccaaggtc cagccggtga gccaggtaac 1800
ccaggttctc caggaaacca aggtcaacct ggaaacaagg gttctcctgg aaacccaggt 1860
caacctggta acgagggaca accaggtcaa cctggtcaaa acggtcaacc aggtgagcct 1920
ggatctaacg gtcctcaagg ttcccaaggt aacccaggta agaacggtca accaggttct 1980
ccaggttccc aaggttctcc tggaaaccaa ggttctccag gtcaaccagg taacccaggt 2040
caacctggag agcaaggtaa gccaggtaac caaggtccag ccggtggtta agcggccgcg 2100
aattaa 2106
<210>5
<211>696
<212>PRT
<213>人工序列
<220>
<223>重组质粒pPIC9KG6中外源基因对应的类人胶原蛋白
<400>5
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala Tyr Val Glu Phe Leu Glu Lys
85 90 95
Arg Gly Pro Pro Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gln
100 105 110
Gly Gln Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly Gln Pro Gly
115 120 125
Asn Glu Gly Gln Pro Gly Gln Pro Gly Gln Asn Gly Gln Pro Gly Glu
130 135 140
Pro Gly Ser Asn Gly Pro Gln Gly Ser Gln Gly Asn Pro Gly Lys Asn
145 150 155 160
Gly Gln Pro Gly Ser Pro Gly Ser Gln Gly Ser Pro Gly Asn Gln Gly
165 170 175
Ser Pro Gly Gln Pro Gly Asn Pro Gly Gln Pro Gly Glu Gln Gly Lys
180 185 190
Pro Gly Asn Gln Gly Pro Ala Gly Glu Pro Gly Asn Pro Gly Ser Pro
195 200 205
Gly Asn Gln Gly Gln Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly
210 215 220
Gln Pro Gly Asn Glu Gly Gln Pro Gly Gln ProGly Gln Asn Gly Gln
225 230 235 240
Pro Gly Glu Pro Gly Ser Asn Gly Pro Gln Gly Ser Gln Gly Asn Pro
245 250 255
Gly Lys Asn Gly Gln Pro Gly Ser Pro Gly Ser Gln Gly Ser Pro Gly
260 265 270
Asn Gln Gly Ser Pro Gly Gln Pro Gly Asn Pro Gly Gln Pro Gly Glu
275 280 285
Gln Gly Lys Pro Gly Asn Gln Gly Pro Ala Gly Glu Pro Gly Asn Pro
290 295 300
Gly Ser Pro Gly Asn Gln Gly Gln Pro Gly Asn Lys Gly Ser Pro Gly
305 310 315 320
Asn Pro Gly Gln Pro Gly Asn Glu Gly Gln Pro Gly Gln Pro Gly Gln
325 330 335
Asn Gly Gln Pro Gly Glu Pro Gly Ser Asn Gly Pro Gln Gly Ser Gln
340 345 350
Gly Asn Pro Gly Lys Asn Gly Gln Pro Gly Ser Pro Gly Ser Gln Gly
355 360 365
Ser Pro Gly Asn Gln Gly Ser Pro Gly Gln Pro Gly Asn Pro Gly Gln
370 375 380
Pro Gly Glu Gln Gly Lys Pro Gly Asn Gln Gly Pro Ala Gly Glu Pro
385 390 395 400
Gly Asn Pro Gly Ser Pro Gly Asn Gln Gly Gln Pro Gly Asn Lys Gly
405 410 415
Ser Pro Gly Asn Pro Gly Gln Pro Gly Asn Glu Gly Gln Pro Gly Gln
420 425 430
Pro Gly Gln Asn Gly Gln Pro Gly Glu Pro Gly Ser Asn Gly Pro Gln
435 440 445
Gly Ser Gln Gly Asn Pro Gly Lys Asn Gly Gln Pro Gly Ser Pro Gly
450 455 460
Ser Gln Gly Ser Pro Gly Asn Gln Gly Ser Pro Gly Gln Pro Gly Asn
465 470 475 480
Pro Gly Gln Pro Gly Glu Gln Gly Lys Pro Gly Asn Gln Gly Pro Ala
485 490 495
Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gln Gly Gln Pro Gly
500 505 510
Asn Lys Gly Ser Pro Gly Asn Pro Gly Gln Pro Gly Asn Glu Gly Gln
515 520 525
Pro Gly Gln Pro Gly Gln Asn Gly Gln Pro Gly Glu Pro Gly Ser Asn
530 535 540
Gly Pro Gln Gly Ser Gln Gly Asn Pro Gly Lys Asn Gly Gln Pro Gly
545 550 555 560
Ser Pro Gly Ser Gln Gly Ser Pro Gly Asn Gln Gly Ser Pro Gly Gln
565 570 575
Pro Gly Asn Pro Gly Gln Pro Gly Glu Gln Gly Lys Pro Gly Asn Gln
580 585 590
Gly Pro Ala Gly Glu Pro Gly Asn Pro Gly Ser Pro Gly Asn Gln Gly
595 600 605
Gln Pro Gly Asn Lys Gly Ser Pro Gly Asn Pro Gly Gln Pro Gly Asn
610 615 620
Glu Gly Gln Pro Gly Gln Pro Gly Gln Asn Gly Gln Pro Gly Glu Pro
625 630 635 640
Gly Ser Asn Gly Pro Gln Gly Ser Gln Gly Asn Pro Gly Lys Asn Gly
645 650 655
Gln Pro Gly Ser Pro Gly Ser Gln Gly Ser Pro Gly Asn Gln Gly Ser
660 665 670
Pro Gly Gln Pro Gly Asn Pro Gly Gln Pro Gly Glu Gln Gly Lys Pro
675 680 685
Gly Asn Gln Gly Pro Ala Gly Gly
690 695
<210>6
<211>31
<212>DNA
<213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A1-1
<400>6
cgcgaattcc tcgagaaaag aggtccaccc g 31
<210>7
<211>28
<212>DNA
<213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A1-2
<400>7
gtggacctct tttctcgagg aattcgcg 28
<210>8
<211>20
<212>DNA
<213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A2-1
<400>8
gtggttaagc ggccgcatgc 20
<210>9
<211>23
<212>DNA
<213>人工序列
<220>
<223>根据开放读码框和满足同向串联的需要,设计接头序列A2-2
<400>9
gcatgcggcc gcttaaccac cgg 23
机译: 克隆的原人类血清白蛋白基因和人类血清白蛋白基因,包含这些基因的质粒,质粒转化的微生物,以及通过使用所说的微生物生产原人类血清白蛋白
机译: 表达突变的人类胶原蛋白基因的转基因小鼠
机译: 表达人类胶原蛋白基因的转基因小鼠