首页> 中国专利> 利用基因重组蚕生产生理活性蛋白质的方法

利用基因重组蚕生产生理活性蛋白质的方法

摘要

本发明在提供不需要使用重组杆状病毒,而且可以容易进行目的蛋白质的纯化的昆虫用基因工程材料的同时,也提供利用该基因工程材料制造外源蛋白质的制造方法。将与在丝腺中发挥功能的启动子连接的细胞因子基因等外源蛋白质基因导入蚕染色体,得到基因重组蚕。由这样的蚕或其后代的丝腺或蚕茧中可以提取、纯化细胞因子等外源蛋白质。通过将使丝心蛋白H链基因5’末端部分的DNA序列和3’末端部分的DNA与外源蛋白质基因融合的表达用基因[序列]盒导入丝腺细胞等,可以使大量的外源蛋白质产生在丝腺细胞内、丝腺细胞外,甚至蚕丝、蚕茧中。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-04-29

    未缴年费专利权终止 IPC(主分类):C12N15/11 授权公告日:20130605 终止日期:20140306 申请日:20030306

    专利权的终止

  • 2013-06-05

    授权

    授权

  • 2010-08-04

    实质审查的生效 IPC(主分类):C12N15/11 申请日:20030306

    实质审查的生效

  • 2010-05-26

    公开

    公开

说明书

本申请是中国专利申请03805352.7的分案申请,原申请的申请日是2003年3月6日,发明名称是“利用基因重组蚕生产生理活性蛋白质的方法”。

技术领域

本发明涉及利用染色体中整合了细胞因子基因的蚕的重组型细胞因子的制造方法。另外涉及具有在丝腺或茧丝中产生重组型细胞因子的性质的基因重组蚕、以及用于制作该重组蚕的向蚕染色体导入外源基因用的载体。另外还涉及向昆虫细胞导入基因的基因导入载体和利用用该载体导入了基因的昆虫细胞、昆虫组织、昆虫的外源蛋白质的制造方法。另外还涉及含有本发明中得到的重组蚕产生的外源蛋白质的蚕丝。

背景技术

使用基因重组技术进行外源蛋白质的生产可以在各种各样的产业中利用。作为宿主主要可以使用大肠杆菌、酵母、动物细胞、植物细胞、昆虫细胞等。然而,由于所谓可以高效生产外源蛋白质的宿主还没有开发出来,对于每个目的蛋白质都需要构建生产体系,人们当然期盼在各个宿主的外源蛋白质生产技术中的进一步技术革新。

在大肠杆菌等细菌或酵母的体系中,存在着翻译后修饰的问题。有时不能合成充分功能形式的蛋白质。另外,动物细胞大多可以合成具有功能形式的蛋白质,但一般来说使其增殖困难,而且产量低,不经济。

另一方面,在使用昆虫或昆虫细胞的基因重组蛋白质的生产中,酶和具有生理活性的有用蛋白质等可以比较廉价地批量生产,可以得到接近于动物的蛋白质的翻译后修饰,这已为人们所了解。具体来说,通过使整合了外源蛋白质基因的杆状病毒感染昆虫或昆虫细胞的方法,可以比较廉价地批量生产外源蛋白质,已知有作为医药品已成品化的生理活性蛋白质(特开昭61-9288号公报、特开昭61-9297号公报)。

作为具有基因免疫调节作用的生理活性物质,如在医药用途中引人注目的细胞因子类的生产,在特开平3-139276号公报、特开平9-234085号公报中分别给出了将整合了猫干扰素ω基因、狗干扰素γ基因的BmNPV接种到蚕的方法。另外,作为干扰素以外的蛋白质在昆虫中生产的例子,还已知使杆状病毒感染的昆虫细胞进行人胶原的生产方法(特开平8-23979号公报)。

然而,在以往的使用昆虫或昆虫细胞的重组蛋白质的生产技术中,由于在外源基因的导入中使用重组病毒,所以从安全性考虑,有一个课题是必须要使其失活或进行封闭。另外,在将重组病毒向蚕进行接种的方法中,由于重组病毒的接种烦杂,目的外源蛋白质产生在体液中,需要从来自蚕体液的大量的夹杂蛋白质中纯化目的重组蛋白质。因此,存在着难于获得高纯度的重组蛋白质的问题。

另外,近年来尝试了对昆虫染色体进行外源基因的重组,利用多[核壳体]核型多角体病毒的一种苜蓿银纹夜蛾核型多角体病毒(Autographacalifornica nuclear polyhedrosis virus(AcNPV))的DNA,通过同源重组将在丝心蛋白L链基因付加了水母绿色荧光蛋白质基因的融合基因导入蚕染色体上,使其表达的方法已开发(Genes Dev.,13,511-516,1999),利用该技术导入了人胶原基因的蚕及其制造方法也已公布(特开2001-161214号公报)。另外,最近,利用来自于鳞翅目昆虫的转座子piggyBac将外源基因稳定导入到蚕染色体,使外源基因编码的蛋白质表达的方法进行了以水母绿色荧光蛋白质作为模型的研究,也已确认可以通过交配将基因稳定地传给后代(Nature Biotechnology,18,81-84,2000)。

然而,在使用上述的AcNPV向昆虫染色体导入外源蛋白质基因的导入方法中,由于使用重组杆状病毒(AcNPV),重组病毒的失活和封闭的课题依然存在。在使用转座子piggyBac的例子中,绿色荧光蛋白质由于产量不充分、而且在蚕全身产生,为了以高纯度形式回收表达的重组型绿色荧光蛋白质,就需要高度的纯化技术,所以经济上也是个问题。另外,生产的重组型蛋白质的产量还不充分,非常少。

即,在以这样的昆虫细胞作为宿主生产外源蛋白质的生产技术中,存在着需要使重组杆状病毒失活和封闭,使用蚕时等,存在着从存在大量夹杂蛋白的体液中纯化目的蛋白质是困难的、目的蛋白质的表达量少等几个课题。

到目前为止,人们还不知道将细胞因子基因等编码具有生理活性的蛋白质的基因导入蚕染色体,使目的蛋白质表达的例子。另外,也没有从蚕体液以外的部位的丝腺或蚕的分泌物蚕丝回收重组型的细胞因子,确认得到的细胞因子的生理活性的例子。而且,关于可遗传上述性质的蚕也没有先例。另外,也没有通过利用转座子制作的重组蚕使大量重组蛋白质产生在蚕丝中的例子。

发明的公开

利用昆虫的重组型蛋白质的生产技术虽然投入精力进行了研究,但存在着需要对整合了外源蛋白质的重组杆状病毒进行失活或封闭,且重组杆状病毒接种烦杂等课题。另外,在使用重组杆状病毒的蚕中的外源蛋白质的生产中,也存在着由含有大量的杂质的体液提取、纯化目的蛋白质是困难的课题。

虽然也进行了将外源蛋白质基因导入到蚕染色体的重组蛋白质的制造技术的研究,但也存在着目的外源蛋白质的产量低、而且从蚕体液纯化目的蛋白质困难的课题。

本发明鉴于上述状况,作为课题提供不需要使用重组杆状病毒,而且容易进行具有生理活性的目的蛋白质的纯化的昆虫用的基因工程材料,同时也提供利用该基因工程材料的外源蛋白质的制造方法。

本发明人进行了专心研究,结果发现通过利用来自转座子的DNA将具有编码目的蛋白质的基因结合在在蚕丝腺中特异表达的启动子下游的构造的DNA序列导入蚕染色体,目的蛋白质可以以保持生理活性的形式在丝腺或茧丝中生产,并因此完成了本发明。在本发明中,重组蛋白质由于可以从不含有大量杂质的丝腺或蚕丝中回收,具有目的蛋白质纯化容易的优点。另外,由于不使用杆状病毒那样的病毒,不需要使病毒失活,可以简便而且安全地实施重组蛋白质的生产。

另外,本发明人着眼于蚕丝腺特别是后部丝腺大量生产占丝蛋白质的70~80%的丝心蛋白,而且向丝腺细胞外分泌这一点,进行了专心研究,结果发现通过将在丝腺中进行表达的启动子的下游含有丝心蛋白H链基因的第1内含子的5’末端部分的3’末端侧连接外源蛋白质基质的5’末端侧,使得氨基酸读框变成一列的基因[序列]盒导入丝腺细胞,外源蛋白质的产量飞跃提高,另外,发现在丝腺进行表达的启动子调控下,使外源蛋白质基因的3’侧连接丝心蛋白H链基因的3’末端部分,使得氨基酸读框变成一列的融合基因表达时,外源蛋白质可以大量分泌生产在丝腺细胞的外面。另外,将外源蛋白质基因的5’侧含有丝心蛋白H链基因的第1内含子的5’末端部分的DNA序列、3’侧丝心蛋白H链基因的3’末端部分的DNA设计成各个氨基酸读框变成一列,制作基因[序列]盒,当制作将该基因[序列]盒导入染色体的重组蚕时,发现该重组蚕在蚕丝中大量生产目的蛋白质。

本发明人在通过将使丝心蛋白H链基因的5’末端部分的DNA序列和3’末端部分的DNA序列与外源蛋白质融合的表达用基因[序列]盒导入丝腺细胞等,可以成功地使大量的外源蛋白质产生在丝腺细胞内、丝腺细胞外,以及蚕丝中,可以确立不使用重组杆状病毒,通过利用丝腺生产外源蛋白质,容易纯化的外源蛋白质生产技术。

即,本发明涉及一种重组型细胞因子的制造方法,其特征是:制作将细胞因子基因整合到染色体的基因重组蚕,从其丝腺或茧丝中回收细胞因子。另外,涉及整合了细胞因子基因的基因重组蚕、向蚕导入细胞因子基因中使用的基因重组载体。

另外,本发明还涉及通过以下所示的基因[序列]盒、载体等在昆虫中可用于外源蛋白质生产的基因工程材料、转化体、利用转化体的外源蛋白质的制造方法和含有外源蛋白质的蚕丝。

因此,1)、本发明提供外源蛋白质表达用基因[序列]盒,其含有(1)在丝腺中进行表达的启动子,和(2)使连接在上述(1)的下游的丝心蛋白H链基因的5’末端部分与外源蛋白质结构基因的5’侧融合的基因。

2)、本发明还提供外源蛋白质表达用基因[序列]盒,其含有(1)在丝腺中进行表达的启动子,和(2)使丝心蛋白H链基因的3’末端部分与连接在上述(1)的下游的不含有终止密码子的外源蛋白质结构基因的3’侧融合的基因。或一种外源蛋白质表达用基因[序列]盒,其含有(1)在丝腺中进行表达的启动子,和(2)使外源蛋白质结构基因与连接在上述(1)的下游的丝心蛋白H链基因的3’末端部分的3’侧融合的基因。

3)、本发明还提供外源蛋白质表达用基因[序列]盒,其含有(1)在丝腺中进行表达的启动子,和(2)使丝心蛋白H链基因的5’末端部分与连接在上述(1)的下游的不含有终止密码子的外源蛋白质结构基因的5’侧融合,而且使丝心蛋白H链基因的3’末端部分与上述结构基因的3’侧融合的基因。

4)本发明还提供一种昆虫细胞用表达载体,其特征是:含有上述1)至3)中任一项所述的外源蛋白质的表达基因[序列]盒。

5)、本发明还提供一种外源蛋白质的制造方法,其特征是:将上述4)所述的昆虫细胞用载体导入昆虫细胞。

6)、本发明还提供外源蛋白质的制造方法,其特征是:制作将上述1)至3)中任一项所述的外源蛋白质表达用基因[序列]盒整合到染色体的重组蚕,使得到的重组蚕的丝腺或蚕丝生产外源蛋白质后,从其丝腺或蚕丝中回收外源蛋白质。

7)、本发明还提供重组蚕,其染色体中导入了上述1)至3)中任一项所述的外源蛋白质表达用基因[序列]盒,而且具有在丝腺或蚕丝中生产外源蛋白质的能力。

8)、本发明另外还提供含有上述7)所述的蚕产生的外源蛋白质的蚕丝。

附图的简单说明

图1是基因导入载体pigSIB的限制性酶切图谱。

图2是基因导入载体pigFIB的限制性酶切图谱。

图3是带有转座酶的质粒pHA3PIG的限制性酶切图谱。

图4是表示对表1的由阳性蛾区得到的11头蚕(G1)的基因组DNA进行EcoRV,XmnI处理后,以猫干扰素ω基因作为探针进行Southern印迹法解析的结果图。

图5是表示导入了连接在丝心蛋白H链启动子的猫干扰素ω基因的重组蚕的蚕丝提取液的抗病毒活性的图。被染色的泳道的样品具有活性。

图6是表示对表3的由阳性蛾区(来自实验1的3蛾区、来自实验2的2蛾区)得到的蚕丝腺基因组DNA进行EcoRI或BglII处理后,以猫干扰素ω基因作为探针进行Southern印迹法解析的结果图。

图7是通过RT-PCR对基因重组蚕中部丝腺中的猫干扰素mRNA的表达进行检测的图。

图8是表示导入了连接在丝胶蛋白启动子的猫干扰素ω基因的重组蚕的中部丝腺提取液和茧丝提取液的抗病毒活性的图。被染色的泳道的样品具有活性。

图9是表示含有P.IC.A基因[序列]盒的基因导入用构建物的制作手法(前半部分)的图。

图10是表示含有P.IC.A基因[序列]盒的基因导入用构建物的制作手法(后半部分)的图。

图11是表示含有HP.IC.HA基因[序列]盒的基因导入用构建物的制作手法(前半部分)的图。

图12是表示含有HP.IC.HA基因[序列]盒的基因导入用构建物的制作手法(后半部分)的图。

图13是表示含有HUP.IC.HA基因[序列]盒的基因导入用构建物的制作手法(前半部分)的图。

图14是表示含有HUP.IC.HA基因[序列]盒的基因导入用构建物的制作手法(后半部分)的图。

图15是表示含有HP.IC.A基因[序列]盒的基因导入用构建物的制作手法(前半部分)的图。

图16是表示含有HP.IC.A基因[序列]盒的基因导入用构建物的制作手法(后半部分)的图。

图17是通过Western解析对培养蚕丝腺中的β-半乳糖苷酶的表达进行解析的图。表明丝心蛋白H链基因第一外显子、第一内含子、第二外显子区对在细胞内的蛋白质合成或基因表达起着重要的作用。另外也确认了向细胞外的分泌。

图18是通过Western解析对蚕丝腺组织中的重组蛋白质的表达进行解析的图。再次确认丝心蛋白H链基因第一外显子、第一内含子、第二外显子区对在蚕后部丝腺细胞内的重组蛋白质表达的快速上升起着重要的作用。另外表明在丝心蛋白启动子上游区约5.5kbp处存在使蛋白质产量提高的基因区。

图19是通过Western解析对在蚕丝中的重组蛋白质的产生进行解析的图。显然丝心蛋白H链基因的3’末端部分在丝腺细胞内合成的蛋白质向蚕丝的分泌中起着重要的作用。另外,再次确认在丝心蛋白启动子上游区约5.5kbp处存在使蛋白质产量提高的基因区。

发明的实施方式

细胞因子是由各种各样的细胞产生、具有对造血细胞和免疫细胞的免疫调节作用、抗病毒作用、血球细胞增殖作用的蛋白质。其作用是通过形成准确无误的高级结构,与细胞膜上的特异受体结合发挥的。到现在为止,由于其作用的特征,正进行着对以人为首的动物的临床应用。

作为本发明的细胞因子种类并没有特别限定,只要是当在蚕体内进行表达时,保持其生理活性的细胞因子类就可以,作为具有免疫调节作用、抗病毒作用、血球细胞增殖作用等生理活性物质,如在医药、医疗应用中引人注目的蛋白质,可列举例如,人干扰素α、β、γ(J.Interferon Res.5、521-526,1985,Nucleic Acids Res.10,2487-2501,1982)、人白细胞介素12(J.Immunol.146,3074-3081,1991)、人颗粒球菌落刺激因子(Nature,319,415-418,1986)、人红细胞生成素(Nature,313,806-810,1985)、人血小板生成素(Cell.77,1117-1124,1994)、猫干扰素ω(Biosci.Biotech.Biochem.,56,211-214,1992、GenBank数据库登录编号E04599)、猫红细胞生成素(GenBank数据库登录编号FDU00685)、猫粒细胞菌落刺激因子(Gene,274,263-269,2001)、狗干扰素γ(GenBank数据库登录编号S41201)、狗白细胞介素12(特开平10-36397号公报)、狗粒细胞菌落刺激因子(美国专利第5606024号)等。作为细胞因子类最好的是干扰素类或菌落刺激因子类,其中包括干扰素α、β、γ、ω、τ和粒细胞菌落刺激因子、粒细胞·单核细胞菌落刺激因子、单核细胞菌落刺激因子、红细胞生成素、血小板生成素等。而更优选的是猫干扰素ω、猫粒细胞菌落刺激因子、人干扰素β。

猫干扰素ω基因可以通过从例如由E.Coli(pFeIFN1)(微工研条第1633号)提取的质粒切出得到。或者,也可以从将切出的猫干扰素ω基因与蚕的克隆载体(T.Horiuchi等人,Agric.Biol.Chem.,51,1573-1580,1987)连接制作的重组质粒和蚕多[核壳体]核型多角体病毒DNA共转染蚕树立细胞后制作的rBNV100中获得。

猫粒细胞菌落刺激因子基因可通过用LPS刺激来自猫肾脏的培养细胞CRFK后,由该细胞回收mRNA,再将通过逆转录得到的cDNA作为模板,使用参考GenBank数据库登录编号AB042552设定的引物进行PCR得到。

人干扰素β基因可以通过从编码该cDNA的质粒pORF-hIFN-β(Invivogen公司)切出获得。

关于本发明中的向蚕染色体导入基因的基因导入方法,只要是可以通过基因被稳定地整合到染色体、进行表达,通过交配基因也能稳定传递到后代中那样的基因导入方法就可以,可以使用对蚕卵进行微注射的方法、使用基因枪的方法等,但最好是采用将含有转座酶基因的辅助质粒(NatureBiotechnology,18,81-84,2000)和含有目的基因的向蚕染色体导入外源基因用载体同时向蚕卵进行微注射的方法。

目的基因被导入在由被微注射的蚕卵孵化成长的重组蚕中的生殖细胞。这样获得的重组蚕的后代在其染色体上可以稳定保持目的基因。在本发明中得到的基因重组蚕可以与通常的蚕同样的方法进行继代维持。即,在通常条件下对蚕进行催青,将孵化出的蚁蚕收蚁到人工饲料等,通过与通常蚕同样的条件下进行饲养可以饲养到5龄蚕。

在本发明中得到的基因重组蚕可以与通常的蚕同样进行蛹化,做茧。在蛹阶段区别雌雄,出蛾之后使雌雄交尾,第二天进行采卵。卵可以与通常的卵同样进行保存。本发明的基因重组蚕通过这样的反复饲养可以进行传代,而且可以大量增殖。

在本发明中以将细胞因子导入到蚕染色体为目的使用的外源基因导入载体如果能设计成的确可以控制细胞因子的表达,则没有特别限定,通常对于细胞因子基因,具有在上游连接在丝腺特异表达的启动子,而在下游连接任意的多聚A序列的结构,在这些基因序列的外侧有1对来自转座子的DNA序列。另外,在与启动子之间也可以连接来自任意基因的信号序列等,在与多聚A之间也可以连接任意的基因序列。另外也可以连接人工设计、合成的基因序列。另外也可以根据需要,连接用于在细菌宿主中进行复制的序列、抗生素抗性基因、荧光蛋白质基因、LacZ基因等。例如,可以将结合在适当的启动子下游的绿色荧光蛋白质GFP的基因导入到一对来自转座子的DNA序列之间的适当部位。通过这样操作可以容易进行基因重组蚕的筛选。另外,本载体也可以含有pUC9、19等来自大肠杆菌质粒的一部分或全部。

另外,这里使用的启动子没有特别限定,无论是来自哪一种生物的启动子,只要是在蚕细胞内有效发挥功能的启动子都可以,最好是想办法设计的能够在蚕丝腺中特异诱导蛋白质表达的启动子。例如,丝心蛋白H链启动子、丝心蛋白L链启动子、p25启动子、丝胶蛋白启动子等蚕丝腺蛋白质的启动子。

另外,关于除了启动子以外使用的基因序列,可列举信号序列、多聚A序列以及控制其他基因表达的序列等。这些没有特别限定,可以选择适合于目的蛋白质表达的序列。可列举例如,猫干扰素ω等细胞因子的信号序列或多聚A序列等来自目的蛋白质的序列,宿主蚕等昆虫蛋白质的信号序列、多聚A序列。或者,可列举在SV40多聚A或牛生长激素多聚A等一般的蛋白质表达中有实际成效的序列等。通过改变上述的启动子或与其他细胞因子类基因连接的基因序列,可以对其进行表达的部位或表达量进行操作。

在本发明中,所谓「外源蛋白质的表达用基因[序列]盒」指的是在被导入昆虫细胞时为了使该外源蛋白质结构基因编码的蛋白质表达所必需的DNA的序列组件。该外源蛋白质表达[序列]盒含有外源蛋白质结构基因和促进该基因表达的启动子。通常还含有终止子、付加多聚A区、最好是含有启动子、外源蛋白质结构基因、终止子、多聚A付加区全部。另外在与启动子之间也可以含有与外源蛋白质结构基因结合的分泌信号基因。另外也可以连接人工设计、合成的基因序列。

另外,所谓「基因导入用基因[序列]盒」是在两侧含有1对piggyBac转座子的反向重复序列的外源蛋白质的表达用基因[序列]盒,而且是通过piggyBac转座子的作用可以导入到昆虫细胞染色体的DNA盒。

对获得本发明中使用的DNA的方法没有特别限制。可列举根据已知基因信息、使用PCR(聚合酶链反应)法扩增获得必需的基因区的方法、根据已知基因信息以同源性为指标从基因组文库或cDNA文库进行筛选的方法等。在本发明中,这些基因也包括遗传多型性和使用变异剂等人为变异处理出现的变异型。所谓遗传多型性指的是基因上由于自然突变使得基因的碱基序列一部分发生变化引起的现象。

外源蛋白质表达[序列]盒中的启动子没有特别限定,最好是促进外源蛋白质基因表达活性高的启动子。例如,特开平6-261770和特开昭62-285787所述的果蝇热休克蛋白基因的启动子或蚕肌动蛋白基因的启动子(Nature Biotechnology,18,81-84,2000)等,丝心蛋白H链基因(GenBank数据库登录编号V00094的碱基编号255~574)、丝心蛋白L链基因(Gene,100:151-158;GenBank数据库登录编号M76430)、丝胶蛋白基因的启动子(GenBank数据库登录编号AB007831的碱基编号599~1656)等在蚕丝腺细胞中具有高促进活性的启动子是合适的。

所谓「外源蛋白质结构基因」是要使基因表达的宿主细胞没有的基因,就是编码宿主细胞本身不产生的蛋白质的基因,没有特别限定。从产业价值考虑,可列举人和哺乳类产生的蛋白质、例如生长激素、细胞因子、增殖因子和细胞骨架蛋白的基因等。另外,微生物、植物或昆虫等产生的酶或各种蛋白质的基因等也包括在本发明的范围中。

在本发明中的外源蛋白质表达用基因[序列]盒中,丝心蛋白H链的5’末端部分是具有通过启动子使外源蛋白质基因的表达增强作用的DNA序列,是含有丝心蛋白H链基因的第1外显子和第1内含子的全长或其一部分和第2外显子的一部分的DNA序列。通过使外源蛋白质结构基因的5’侧与该第2外显子的3’侧融合使得氨基酸读框变成一列,可以使外源蛋白质的产量提高,如果第2外显子部分过长,由于在目的外源蛋白质的N末端侧付加多余的氨基酸残基,有时会使目的外源蛋白质的结构或活性丧失,所以需要根据目的做成适当的长度。在多数场合下,通过将第2外显子部分做成紧贴在丝心蛋白H链基因的分泌信号基因的后面或数个氨基酸残基之前,可以获得好的结果。另外,由于认为在丝心蛋白H链基因启动子的5’侧上游区,即在约5.5kbp上游区中存在增强启动子活性的区域,所以通过付加该区,可期待目的蛋白质的表达量的增大。

丝心蛋白H链基因的3’末端部分是在使外源蛋白质在蚕丝腺中产生时,具有使外源蛋白质大量分泌到丝腺细胞外的效果的DNA序列。在染色体导入了在3’侧融合了作为向该蚕丝的分泌信号的丝心蛋白H链基因的3’末端部分的外源蛋白质的表达用基因[序列]盒的重组蚕,可以在其蚕丝中产生外源蛋白质。另外,丝心蛋白H链基因的3’末端部分也可以存在于外源蛋白质基因的上游、下游、外源蛋白质基因中的任一处。

在这一部分中,至少存在一个半胱氨酸残基,直接利用丝心蛋白H链基因的3’末端时,半胱氨酸残基应当位于从丝心蛋白H链蛋白质的羧基端开始的第20位处。该半胱氨酸具有通过二硫键与丝心蛋白L链结合的作用。丝心蛋白H链基因的3’末端部分的DNA序列的长度只要不妨碍与丝心蛋白L链形成二硫键,则没有特别限制。丝心蛋白H链由于在由3’末端开始约100个碱基以上的上游连接着DNA的重复序列,所以该上游部分的DNA序列通过限制性内切酶切断或加工成任意的长度是困难的。因此,从基因工程的手法的难易程度考虑,丝心蛋白H链的3’末端部分最好使用丝心蛋白H链基因的重复DNA序列结束后的3’侧的约100个碱基对。另外,如果丝心蛋白H链基因的3’末端部分长,在外源蛋白质的羧基末端或氨基末端就要结合很多来自丝心蛋白H链蛋白质的羧基末端的氨基酸,有时目的外源蛋白质的结构或活性会丧失。因此,由于末端蛋白质不同,丝心蛋白H链基因的3’末端部分的DNA序列有时需要尽可能做短。

对于多聚A区也没有特别限制,可适当使用丝心蛋白H链、丝心蛋白L链、丝胶蛋白等在丝腺中可大量表达的蛋白质基因的多聚A区。

本发明中所谓的载体指的是具有环状DNA结构或线状DNA结构的载体。可适当使用特别是可以在大肠杆菌中复制,而具有环状DNA结构的载体。在这样的载体中从容易进行转化体的挑选的目的出发,也可以整合抗生素抗性基因、来自水母的荧光绿色蛋白质基因等标记基因。

在本发明中使用的所谓昆虫细胞虽然没有特别限定,但优选来自鳞翅目昆虫的,更优选来自家蚕(Bombyx mori)的细胞,进一步优选的是来自蚕丝腺细胞或来自家蚕(Bombyx mori)的卵中含有的细胞。在丝腺细胞中,丝心蛋白质的合成旺盛,而且操作容易的蚕5龄幼虫的后部丝腺细胞是合适的。

对于向昆虫细胞导入外源蛋白质的表达用基因[序列]盒和载体的方法没有特别限制。作为向昆虫培养细胞导入的方法,可以使用磷酸钙法,电穿孔法、利用脂质体的方法、使用基因枪的方法、微注射方法等,在向蚕丝腺细胞的导入中,例如可以通过使用基因枪很简单地将基因导入从蚕5龄幼虫的体内取出的后部丝腺组织中。

利用基因枪向后部丝腺导入基因,例如,可以将含有外源蛋白质的表达用基因[序列]盒的载体进行包被的金粒子用BioRad公司的粒子枪(型号:PDS-1000/He)通过1,100~1,800psi的He气压喷射到固定于琼脂板等的后部丝腺。

向家蚕(Bombyx mori)卵中含有的细胞导入基因时,微注射方法是合适的。其中向卵进行微注射时,不需要直接向卵中的细胞进行微注射,而可以只是通过微注射向卵中导入基因。

通过将本发明的含有「基因导入用基因[序列]盒」的载体微注射到家蚕(Bombyx mori)的卵中,可以获得本发明的「外源蛋白质的表达用基因[序列]盒」被导入到了染色体的重组蚕。例如,根据田村等人的方法(Nature Biotechnology,18,81-84,2000),将含有「基因导入用基因[序列]盒」的载体和在蚕肌动蛋白启动子控制下配置了PiggyBac转座酶基因的质粒同时向家蚕的卵进行微注射,饲养孵化的幼虫,将得到的成虫(GO)在组内进行交配,可以获得次世代(G1)蚕幼虫。重组蚕在该G1世代中出现的频率通常为1~2%。

重组蚕的挑选可以通过从G1世代蚕的组织的一部分取出DNA,通过使用外源蛋白质基因为基础设计的引物进行PCR实施。或者,预先在「基因导入用基因[序列]盒」内导入在蚕细胞中可表达的启动子的下游连接了编码绿色荧光蛋白质的基因,对G1世代蚕、例如1龄幼虫,通过挑选在紫外线下发绿色荧光的个体,可以很容易进行重组蚕的挑选。

另外,目的是要获得「外源蛋白质的表达用基因[序列]盒」被导入到染色体的重组蚕时,在将含有「基因导入用基因[序列]盒」的载体向家蚕(Bombyx mori)的卵进行微注射时,也可以通过同时微注射PiggyBac转座酶蛋白质,与上述同样获得重组蚕。

所谓PiggyBac转座酶是在两端含有13个碱基对的反向序列和内部含有约2.1k碱基对的ORF的DNA的转位因子。在本发明中使用的PiggyBac转座酶没有特别限定,可以使用来自例如Trichoplusia ni cell line TN-368、Autographa californica NPV(AcNPV)、Galleria mellonea NPV(GmMNPV)的PiggyBac转座酶。优选使用带有来自Trichoplusia ni cell line TN-368的PiggyBac的一部分的质粒pHA3PIG和pPIGA3GPP(NatureBiotechnology,18,81-84,2000),可以制备该基因和具有DNA转移活性的PiggyBac转座酶。

作为来自PiggyBac的DNA序列的结构,含有TTAA序列的1对末端反向序列是必需的,是具有在该DNA序列间插入了细胞因子基因等外源基因的结构。为了利用来自转座子的DNA序列将外源基因导入蚕染色体,更优选利用转座酶。例如,通过同时导入可进行来自piggyBac的转座酶表达的DNA,在蚕细胞内转录、翻译的转座酶识别2对末端反向序列后切出他们之间的基因片段,使其转移到蚕染色体,可以使基因导入到蚕染色体的频率显著提高。

本发明中使用的所谓基因重组蚕是染色体中导入了外源蛋白质基因的蚕,是通过常规方法对该蚕染色体DNA进行限制性内切酶处理后,利用常规方法以标记的外源蛋白质基因作为探针,进行Southern印迹法时,给出阳性信号的蚕。导入细胞因子基因的染色体上的基因座位只要是不妨碍蚕的产生、分化、成长的部位则没有特别限制。重组蚕具有在其丝腺细胞、丝腺内腔、以及蚕丝中产生外源蛋白质的能力。另外,重组蚕可以进行正常发育、交配,可以稳定保有导入的外源蛋白质基因,而且可以传递给后代。因此,通过对重组蚕进行继代培养,增加头数,可以很容易使外源蛋白质的产量做成规模。在交配中,通过与野生型的蚕进行交配,也有可能使外源蛋白质的产量提高。此时,需要对导入了目的外源蛋白质基因的蚕进行适当选择的同时,进行继代培养。此时使用来自任意组织的细胞的DNA,通过PCR、Southern印迹法等对重组蚕挑选时使用的标记基因和外源蛋白质基因的存在以及结构进行解析,可以很容易对继承了重组蚕基因的后代进行判别。

导入了本发明的外源蛋白质的表达用基因[序列]盒的昆虫细胞和蚕丝腺通过在分别适于培养的培养液中进行培养,在其培养上清或细胞中可以产生外源蛋白质。例如,导入了本发明的表达用基因[序列]盒的蚕卵巢细胞BmN细胞通过在TC-100培养基(フア-ミンジエン公司生产)于27℃下进行培养,在培养3至4日可以产生目的外源蛋白质。另外,蚕后部丝腺,例如从5龄幼虫无菌条件下摘出后,通过在Grace昆虫培养基中,在25℃下进行培养可以产生外源蛋白质。当在丝腺产生蛋白质时,最好是将培养基中的溶存氧浓度维持在很高,另外最好是将蓄积在培养基中的低分子的抑制蛋白质合成的因子通过例如超滤膜等除去的同时,进行培养,可以进行长时间的进行蛋白质合成。

导入了使本发明的丝心蛋白H链基因的3’末端部分融合的外源蛋白质基因的丝腺可以在培养上清中大量产生目的外源蛋白质。丝腺培养上清中的夹杂蛋白由于几乎只是丝心蛋白,所以,从丝腺培养上清纯化目的蛋白质很容易,结果可以获得高纯度的目的蛋白质。

本发明中得到的重组蚕可以与通常的蚕同样进行饲养,通过在通常条件下进行饲养可以使外源蛋白质产生。可以根据目的外源蛋白质的情况,特别是通过将5龄时期的培养温度、湿度、给饵条件等进行最适化,也可以使外源蛋白质的产量提高。

导入了与本发明的丝心蛋白H链基因的3’末端部分融合的外源蛋白质基因的重组蚕使得在蚕茧中大量生产目的外源蛋白质成为可能。可以很容易从得到的蚕茧中纯化、回收目的外源蛋白质。另外,根据产生的外源蛋白质的功能,可以将得到的含有外源蛋白质的蚕丝以原有形式或以进行部分加工的形式用于各种产业用途中。

通过适当的提取操作可以从在本发明得到的重组蚕的丝腺或茧丝中获得外源蛋白质。对于为了从丝腺或茧丝中提取外源蛋白质使用的溶剂没有特别限制,但多数场合下,优选水溶性溶剂。提取中使用的水溶液为了促进外源蛋白质的提取,可以含有合适的溶质。可列举例如,磷酸等无机酸、醋酸、柠檬酸、苹果酸等有机酸、或食盐、尿素、盐酸胍、氯化钙等盐类、乙醇、甲醇、乙腈、丙酮等极性有机溶剂等。另外,提取溶液的pH也没有特别限定,只要是不使目的外源蛋白质的功能失活的pH,可以使用任意的pH。

用于分离、纯化提取的外源蛋白质的方法没有特别限定,可以使用通常蛋白质的纯化方法。例如,以目的有用蛋白质本来具有的功能作为指标,通过使用硅胶载体、离子交换载体、凝胶过滤载体、鳌合性载体、带有色素载体等的色谱、超滤、凝胶过滤、透析、盐析等脱盐、浓缩的组合可以进行纯化、分离。例如,猫干扰素ω可以在将导入了猫干扰素ω基因的蚕的丝腺或茧丝于20mM磷酸缓冲液(pH7.0)中进行匀浆得到的可能性级分中回收。再通过将得到的提取液吸附于例如Blue sepharose载体,洗净后,用含有盐类的缓冲液进行洗脱,可以使猫干扰素ω的纯度提高。

这样制造的细胞因子类可以与以往的其他制造方法制造的细胞因子同样用于医药和各种测定、诊断用途中。此时,也可以做成加入了各种添加剂的混合物使用。另外,表达细胞因子类的蚕的组织、或茧丝可以直接或进行加工后用于医疗或用作衣料的纤维。另外,表达酶类的重组蚕的组织或蚕丝也可以直接用于酶反应中。

实施例

以下给出实施例,对本发明进行更具体地说明,但本发明并不限定于这些实施例。

参考例

抗病毒活性测定法

干扰素的生理活性作为抗病毒活性利用以下方法进行测定。

作为病毒使用Vesicular Stomatitis Virus(VSV),作为感受性细胞对于猫干扰素ω的情形使用猫Fc9细胞(J.K.Yamamoto等;Vet.Immunol.andImmunopathol.,11,1-19,1986),对于人干扰素β使用人FL细胞,通过CPE法进行测定。即,向铺满96孔微量反应板的于37℃下培养的感受性细胞(上端的一行)加样品稀释液,向下端进行各2倍的阶段稀释。

于37℃下培养20~24小时后,加VSV再于37℃下培养16~20小时。存活下来附着在微量反应板上的感受性细胞用含有20甲醛的龙胆紫染色液进行染色,通过测定570nm的吸光度,将微量反应板上的龙胆紫量与标准比较,求抗病毒活性。作为标准,对于猫干扰素ω使用将インタ一キヤツト(东丽(株)生产)用细胞培养用培养基调整到1000Unit/ml后的溶液,对于人干扰素β使用将Feron[商品名](干扰素β)(东丽(株)生产)用细胞培养用培养基调整到1000Unit/ml后的溶液。另外,样品用细胞培养用培养基稀释15倍后,用于抗病毒活性测定。

实施例1.家蚕(Bombyx mori)基因组DNA的制备

解剖5龄第3日的蚕,取出后部丝腺组织。用1×SSC洗净后,加200μl的DNA提取缓冲液(50mM Tris-HCl pH8.0,1mM EDTA pH8.0,100mMNaCl)。加蛋白酶K(终浓度200μg/ml),用研磨机将组织充分磨碎,再加入350μl DNA提取缓冲液,10%SDS 60μl,混合后,在50℃下保温2小时。加Tris-HCl饱和酚pH8.0500μl,混合10分钟后于10,000rpm、4℃下离心分离5分钟,回收上清。向上清中加入等量的酚/氯仿/异戊醇(25∶24∶1)混合后,进行离心分离。再次加等量的酚/氯仿/异戊醇,离心分离后回收上清,加入等量的氯仿/异戊醇(24∶1)混合后,进行离心分离,再次加入氯仿/异戊醇,离心分离后回收上清。向得到的上清中加1/10量的3M醋酸钠(pH5.2)进行混合,再加2.5倍量的冷乙醇,于-80℃下静置后,于15,000rpm、4℃下离心分离10分钟,使基因组DNA沉淀。用70%乙醇将DNA沉淀洗净后,使其风干。用加有RNase的灭菌水溶解、稀释成100μg/ml,制备基因组DNA溶液。

实施例2.基因的制备

使用的基因可以通过利用已知的序列制作其两端序列的引物,以适当的DNA源作为模板,进行PCR获得。在引物的端侧付加用于下面的基因构建操作的限制性内切酶位点。

猫干扰素ω基因(GenBank数据库登录编号S62636的碱基编号9~593)可以通过以编码猫干扰素ω基因的杆状病毒rBNV100为模板,使用引物3(序列编号3)和引物4(序列编号4)2种引物进行PCR获得。从由例如E.Coli(pFeIFNI(微工研条寄第1633号)提取的质粒切出FeIFN基因,与蚕的克隆载体(T.Horiuchi等人,Agric.Biol.Chem.,51,1573-1580,1987)连接制作的重组质粒,然后将该重组质粒与蚕多[核壳体]核型多角体病毒DNA共转染蚕树立细胞中可制作rBNV100。

丝胶蛋白-1基因的启动子(GenBank数据库登录编号AB007831的碱基编号599~1656)是通过以蚕染色体DNA作为模板,使用引物5(序列编号5)和引物6(序列编号6)两种引物通过PCR获得的。丝心蛋白H链基因的启动子(GenBank数据库登录编号V00094的碱基编号255~574是通过以蚕染色体DNA作为模板,使用引物7(序列编号7)和引物8(序列编号8)两种引物通过PCR获得的。牛生长激素基因多聚A(pcDNA3.1(+)序列编号1011~1253)通过以质粒pcDNA3.1(+)载体(Invitrogen公司生产)为模板,使用引物9(序列编号9)和引物10(序列编号10)两种引物通过PCR获得的。

PCR使用KODplus(东洋纺(株)生产),按照附带的程序进行。即,添加各种试剂,对于各个模板,如为质粒时添加10ng,为染色体DNA时添加100ng,各个引物添加30pmol、附带的10×PCR缓冲液10μl,1mMMgCl2、0.2mM dNTPs、2单位KODplus,总量为100μl。DNA的变性条件为94℃下15秒钟,引物的退火条件为55℃下30秒钟,延伸条件为68℃,30~60秒钟的条件下,使用Perkin-Elmer公司的DNA热循环仪,进行30循环反应。

将这些反应液用1~1.5%琼脂糖凝胶进行电泳,按照常规方法分别提取、制备猫干扰素ω基因中的约580bp、丝胶蛋白-1启动子中的约1kbp、丝心蛋白H链启动子中的约320bp、牛生长激素基因多聚A中约230bp的DNA片段。将这些DNA片段通过多核苷酸激酶(宝酒造(株)生产)进行磷酸化后,使用宝酒造(株)的DNA Ligaton kit Ver.2于16℃下进行过夜反应,与用Hinc II切断后进行了脱磷酸化处理的pUC19载体进行连接。按照常规方法,使用连接的载体转化大肠杆菌,可以通过与上述同样条件对得到菌落进行PCR来确认得到的转化体中插入了PCR片段,通过常规方法制备插入了PCR片段的质粒。通过对这些质粒进行测序,确认得到的片段是各个基因的碱基序列。

实施例3.基因导入用质粒的制作

对于基因导入用质粒可以使用pigA3GFP(Nature Biotechnology18,81-84,2000)。即,从美国专利第6218185号公布的质粒p3E1.2中将编码转座酶的区域除去,向该部分插入了A3启动子(GenBank数据库登录编号U49854的碱基编号1764~2595)和来自pEGFP-N 1载体(Clontech公司生产)的GFP和来自SV40的多聚A付加序列(GenBank数据库登录编号U55762的碱基编号659~2578)的载体是pigA3GFP(NatureBiotechnology 18,81-84,2000)。将猫干扰素ω基因的表达单位插入到位于该A3启动子的上游侧的Xho I部位。作为进行导入的基因的表达单位使用丝胶蛋白-1基因启动子-猫干扰素ω-牛生长激素多聚A付加序列(序列编号1)、或丝心蛋白H链基因启动子-猫干扰素ω-牛生长激素多聚A付加序列(序列编号2)。以下给出具体的方法。

利用预先设定在引物内的限制性内切酶位点从实施例2制备的质粒中切出基因。即,如果是丝胶蛋白-1基因启动子和丝心蛋白H链基因启动子使用EcoRI,Sa1I,如果是猫干扰素ω基因使用Sa1I,XbaI,如果是牛生长激素多聚A使用XbaI,BamHI,切出插入片段,用1~1.5%琼脂糖凝胶进行电泳后,通过常规方法提取、纯化片段。

将丝胶蛋白-1基因启动子片段200ng、猫干扰素ω基因片段100ng、牛生长激素多聚A 50ng进行混合,加等量的宝酒造(株)的DNA Ligatonkit Ver.2于16℃下进行过夜反应。对反应液0.5μl使用引物11(序列编号11)和引物12(序列编号12)在与实施例2同样的条件下,延伸条件2分钟进行PCR。将这些反应液用1%琼脂糖凝胶进行电泳,通过常规方法提取、调制扩增的约1.9kb的DNA片段(SIB片段)。

同样将丝心蛋白H链基因启动子片段70ng、猫干扰素ω基因片段100ng、牛生长激素多聚A 50ng进行混合,加等量的宝酒造(株)的DNALigaton kit Ver.2于16℃下进行过夜反应。对反应液0.5μl使用引物13(序列编号13)和引物12(序列编号12)在与实施例1同样的条件下,延伸条件2分钟进行PCR。将这些反应液用1%琼脂糖凝胶进行电泳,通过常规方法提取、调制扩增的约1.15kb的DNA片段(FIB片段)。

这些片段经XhoI消化后,使用宝酒造(株)的DNA Ligaton kit Ver.2,于16℃下进行过夜反应,与用XhoI切断后进行了脱磷酸化处理的pigA3GFP进行连接。将插入了SIB片段的质粒定为pigSIB(图1),将插入了FIB片段的质粒定为pigFIB(图2),通过氯化铯超离心2次,进行纯化,用于基因导入实验。

实施例4.基因重组蚕的制作(丝心蛋白H链基因启动子)

用0.5mM磷酸缓冲液(pH7.0)、5mM KCl将pigFIB和辅助质粒pHA3PIG(图3、Nature Biotechnology 18,81-84,2000)分别调整到200ng/ml的浓度,将其中的15-20nl微注射入产卵后4小时以内的蚕卵中。

对由这样的卵孵化的幼虫进行饲养,得到的成虫(G0)在组内进行交配得到的次世代(G1),通过对与猫干扰素ω基因同时导入的绿色荧光蛋白质的荧光进行观察,从G1中筛选染色体导入了猫干扰素ω基因的蚕。表1给出了导入基因蚕得到的蛾区的比例。对蚕卵实施2次注射,在第2次由1蛾区得到了基因重组蚕。

表1.基因重组蚕的获得状况(丝心蛋白重链启动子)

图4给出了从该蛾区得到的基因重组蚕的Southern印迹法的结果。Southern印迹法是通过从G1世代的蛾提取染色体DNA,将进行限制性内切酶处理的样品进行电泳后,使用猫干扰素ω特异的核酸探针通过使用Alkphos Direct Labelling and Detection System(Amersham Pharmacia)的化学发光对使DNA转印的膜进行检测。

对G1蛾11头研究结果可以确认10头蚕中导入了猫干扰素ω基因。

实施例5.猫干扰素产生的确认(丝心蛋白H链启动子)

猫干扰素ω由于具有抗病毒活性,由其效价可以知道猫干扰素ω的存在。在将实施例4得到的阳性蛾区的蚕(G1)与野生蚕交配得到的世代(G2)中,摘出确认猫干扰素ω基因导入的蚕的5龄幼虫的中部丝腺和后部丝腺。用20mM磷酸钠缓冲液(pH7.0)对这些丝腺进行匀浆,通过使用猫细胞的抗病毒活性测定系统测定得到的提取液。结果由导入基因蚕的丝腺提取液中对中部丝腺、后部丝腺都检测到抗病毒活性,但从作为对照的野生蚕的丝腺提取液中没有检测到抗病毒活性。图5给出了测定结果。

认为在丝心蛋白H链启动子调控下,猫干扰素ω主要在后部丝腺中被表达,然后与丝心蛋白同样移动到中部、前部丝腺,生理活性的分布也与此一致。另外,从没有导入基因的蚕中完全没有检测到抗病毒活性。由此表明在导入猫干扰素ω基因的蚕中,猫干扰素ω蛋白质是保持着生理活性表达的。

实施例6.猫干扰素的纯化

由实施例5得到的G2世代5龄蚕的后部丝腺的提取液进行猫干扰素的纯化。将提取液1ml通过HiTrap Bluesepharose柱(Amersham pharmacia公司生产),然后用10ml的20mM磷酸钠缓冲液(pH7.0)洗净。然后连续用10ml的20mM磷酸钠缓冲液(pH8.0)-0.5M NaCl,再用10ml的20mM磷酸钠缓冲液(pH8.0)-1M NaCl进行洗脱。分别收集清洗级分、0.5M洗脱级分、以及1M洗脱级分,进行脱盐、浓缩到约1ml。表2给出了提取液和各个纯化级分的抗病毒活性和蛋白质定量。

表2.通过Bluesepharose层析进行的猫干扰素ω的纯化

通过纯化操作,在1M洗脱级分可回收抗病毒活性,即猫干扰素ω,其比活性与提取液相比,约为10倍。

实施例7.基因重组蚕的制作(丝胶蛋白1启动子)

用0.5mM磷酸缓冲液(pH7.0)、5mM KCl将pigSIB和辅助质粒分别调整到200ng/ml的浓度,将其中15-20nl微注射入产卵后4小时以内的蚕卵中。对由这样的卵孵化的幼虫进行饲养,通过对来自得到的成虫(G0)在组内进行交配得到的次世代(G1)的绿色荧光蛋白质的荧光进行观察,研究猫干扰素ω基因向染色体导入的情况。在2次实验中,对1218和1375个卵分别微注射含有与丝胶蛋白启动子连接的猫干扰素ω基因的基因重组载体,分别可以得到各12个蛾区的阳性蛾区(表3)。

表3.基因重组蚕的获得状况(丝胶蛋白启动子)

在得到的阳性蛾区中,从第1次实验的3蛾区、第2次实验的2蛾区分别各挑选1头确认导入了基因的蚕(G1),由其丝腺中提取基因组DNA。然后用EcoRI和Bg1II进行处理后,将猫干扰素ω基因作为探针,进行Southern印迹法解析,结果如图6所示。结果确认所有的蚕的基因组中都导入了猫干扰素ω基因。另外由于检测位置的不同,可知由于蛾区不同,基因向基因组导入的基因导入部位不同。

然后研究猫干扰素ω基因的mRNA表达。任意挑选7头通过Southern印迹法确认猫干扰素ω基因导入的G1世代蚕,提取他们的mRNA,通过RT-PCR研究猫干扰素ω基因mRNA的表达。在mRNA的提取、纯化中使用ISOGEN(ニツポンジ一ン)和Oligotex dT30(ロシユデイアグノステイクス),对于cDNA合成使用Ready-To-Go T-Primed First-Strand Kit(Amersham Pharmacia),按照附带的程序进行。PCR在实施例2的猫干扰素ω基因获得时的条件下进行,结果确认所有蚕都有猫干扰素ω基因的mRNA的表达(图7)。

实施例8.在中部丝腺和茧丝中猫干扰素产生的确认

摘出实施例7得到的基因重组蚕3头、野生蚕1头的中部丝腺,用20mM磷酸钠缓冲液(pH7.0)进行匀浆,离心分离制备提取液。另外就来自基因重组蚕和野生蚕的茧各1个也同样进行提取。对这些提取液进行抗病毒测定,结果由所有的重组蚕的中部丝腺检测到抗病毒活性,而从野生蚕的丝腺中没有检测到。另外从基因重组蚕的茧中也检测到了抗病毒活性(图8)。

由结果可知在基因重组蚕中猫干扰素ω保持着原有生理活性进行表达,即使以丝吐出也残存着其活性。

实施例9.人干扰素β基因导入用质粒的制作

人干扰素β基因导入用质粒的制作通过与实施例2至4所示的猫干扰素ω基因的场合同样的方法进行。

即,以编码人干扰素β基因的质粒pORF-hIFN-β(Invivogen公司)为模板,使用引物14(序列编号14)和引物15(序列编号15)进行PCR,得到人干扰素β基因片段。该片段经限制性内切酶Sa1I和XbaI处理后,构建含有5’末端侧连接丝心蛋白H链基因启动子或丝胶蛋白基因启动子,3’末端侧连接来自牛生长激素基因的多聚A信号的基因表达用序列(丝心蛋白H链基因启动子-人干扰素β基因-牛生长激素基因多聚A信号(FhIB):序列16、丝胶蛋白基因启动子-人干扰素β基因-牛生长激素基因多聚A信号(ShIB):序列17)的质粒。

由这些质粒分别通过XhoI处理切出上述基因表达用序列FhIB和ShIB,与用XhoI切断后进行了脱磷酸化处理的pigA3GFP进行连接。将插入了FhIB片段的质粒定为pigFhIB,将插入了ShIB片段的质粒定为pigShIB,通过氯化铯法超离心2次,进行纯化,用于基因导入实验。

实施例10.人干扰素β基因重组蚕的制作

人干扰素β基因重组蚕的制作通过使用实施例9中制作的基因导入用质粒,与实施例4所示的猫干扰素ω基因重组蚕的制作同样的方法进行。

即,将pigFhIB和pig ShIB分别与辅助质粒pHA3PIG一起微注射到蚕卵中,对得到的成虫进行交配得到的次世代进行筛选。当对各600个卵进行微注射时,由pigFhIB导入蚕中7蛾区,pig ShIB导入蚕中5蛾区得到绿色荧光阳性的蚕,通过PCR确认基因导入染色体。采取这些蚕的丝腺和蚕丝,使用其提取液,测定作为人干扰素β的生理活性的抗病毒活性。测定值用样品中的全蛋白质浓度进行修正后表示。

表4.人干扰素β基因重组蚕组织提取液中的抗病毒活性

检测限界约1000单位/g蛋白质

结果由于由pigFhIB导入蚕的后部丝腺和中部丝腺检测到抗病毒活性,由pigShIB导入蚕的中部丝腺和蚕丝检测到抗病毒活性,可以确认人干扰素β在蚕丝腺组织中产生。

实施例11.猫粒细胞菌落刺激因子基因导入用质粒的制作

猫粒细胞菌落刺激因子基因导入用质粒的制作通过与实施例2至4所示的猫干扰素ω基因的场合同样的方法进行。

猫粒细胞菌落刺激因子基因根据Yamamoto等人的报告(Gene,274,263-269,2001),使用引物18(序列编号18)和引物19(序列编号19)从用10μg/ml的LPS刺激24小时的CRFK细胞得到的cDNA进行PCR,得到猫粒细胞菌落刺激因子基因片段。该片段经限制性内切酶Sa1 I和XbaI处理后,构建含有5’末端侧连接丝心蛋白H链基因启动子或丝胶蛋白基因启动子,3’末端侧连接来自牛生长激素基因的多聚A信号肽的基因表达用序列(丝心蛋白H链基因启动子-猫粒细胞菌落刺激因子基因-牛生长激素基因多聚A信号(FGB):序列20、丝胶蛋白基因启动子-猫粒细胞菌落刺激因子基因-牛生长激素基因多聚A信号(SGB):序列21)的质粒。

由这些质粒分别通过XhoI处理切出上述基因表达用序列FGB和SGB,与用XhoI切后进行脱磷酸化处理的pigA3GFP进行连接。将插入了FGB片段的质粒定为pigFGB,将插入了SGB片段的质粒定为pig SGB,通过氯化铯法超离心2次,进行纯化,用于基因导入实验。

实施例12.猫粒细胞菌落刺激因子基因重组蚕的制作

猫粒细胞菌落刺激因子基因重组蚕的制作通过使用实施例11中制作的基因导入用质粒,与实施例4所示的猫干扰素ω基因重组蚕的制作同样的方法进行。

即,将pigFGB和pig SGB分别与辅助质粒pHA3PIG一起微注射到蚕卵中,对得到的成虫进行交配得到的次世代进行筛选。当对各600个卵进行微注射时,由pigFGB导入蚕中3蛾区,pig SGB导入蚕中7蛾区得到绿色荧光阳性的蚕,通过PCR确认基因导入染色体。采取这些蚕的丝腺和蚕丝,使用其提取液,测定作为猫粒细胞菌落刺激因子的生理活性的NFS-60细胞(ATCC)的增殖促进活性。

增殖促进活性的测定如下那样进行。首先将NFS-60细胞在没有M-CSF存在下铺在96孔板,每孔2×104个,30分钟后加10μl样品,再培养24小时,然后使用Cell Counting Kit-8(Dojindo)测定细胞增殖活性。将表现出增殖最大效果的50%的样品量(ED50)作为1单位/ml,乘以稀释倍数,算出样品中的生理活性。值用样品中的总蛋白质浓度进行修正后表示。

表5.猫粒细胞菌落刺激因子基因重组蚕组织提取液中的增殖促进活性

检测限界约20单位/g蛋白质

结果由于由pigFGB导入蚕的后部丝腺和中部丝腺检测到增殖促进活性,由pigSGB导入蚕的中部丝腺和蚕丝检测到增殖促进活性,可以确认猫粒细胞菌落刺激因子在蚕丝腺组织中产生。

实施例13.基因制备

以下,以猫干扰素ω作为生理活性蛋白质的模型,进行在丝腺组织和蚕丝中的产量提高研究。

使用的基因可以通过利用已知的序列制作其两端序列的引物,以适当的DNA源作为模板,进行PCR获得。在引物的端侧付加用于下面的基因构建操作的限制性内切酶位点。

丝心蛋白H链启动子(GenBank数据库登录编号AF226688的碱基编号62118~62437:以下称为P区)是通过以家蚕(Bombyx mori)genomiDNA作为模板,使用引物25(序列编号25)和引物26(序列编号26)两种引物通过PCR获得的。

丝心蛋白H链的启动子·丝心蛋白H链基因第一外显子·第一内含子区·第二外显子区(GenBank数据库登录编号AF226688的碱基编号62118~63513:以下称为HP区)是通过以家蚕(Bombyx mori)genomiDNA作为模板,使用引物25(序列编号25)和引物31(序列编号31)两种引物通过PCR获得的。

丝心蛋白H链上游启动子·丝心蛋白H链基因第一外显子·第一内含子(GenBank数据库登录编号AF226688的碱基编号57444~62927:以下称为HUP区)是通过以Bombyx mori genomi DNA作为模板,使用引物33(序列编号33)和引物34(序列编号34)两种引物通过PCR获得的。

猫干扰素ω基因(GenBank数据库登录编号S62636的碱基编号9~593:以下称为IC区)可以通过以编码猫干扰素ω基因的杆状病毒rBNV100为模板,使用引物27(序列编号27)和引物28(序列编号28)2种引物进行PCR获得。从由例如E.Coli(pFeIFN1(微工研条寄第1633号)提取的质粒切出猫干扰素ω的基因,与蚕的克隆载体(T.Horiuchi等人,Agric.Biol.Chem.,51,1573-1580,1987)连接制作重组质粒,然后将该重组质粒与蚕多[核壳体]核型多角体病毒DNA共转染蚕树立细胞可制作rBNV100。

丝心蛋白H链多聚A信号区(GenBank数据库登录编号AF226688的碱基编号79201~79995:以下称为A区)是通过以家蚕(Bombyx mori)genomi DNA作为模板,使用引物29(序列编号29)和引物30(序列编号30)两种引物通过PCR获得的。

丝心蛋白H链C末端区基因·丝心蛋白H链多聚A信号区(GenBank数据库登录编号AF226688的碱基编号79099~79995:以下称为HA区)是通过以家蚕(Bombyx mori)genomi DNA作为模板,使用引物32(序列编号32)和引物30(序列编号30)两种引物通过PCR获得的。

β-半乳糖苷酶(β-gal)基因是以pβgal-Basic vector(Clontech公司)为模板,使用引物37(序列编号37)和引物38(序列编号38)两种引物通过PCR获得的。

PCR使用KODplus(东洋纺(株)生产),按照附带的程序进行。即,添加各种试剂,对于各个模板,如为家蚕(Bombyx mori)genomi DNA时添加100ng,为家蚕(Bombyx mori)后部丝腺cDNA和pβgal-Basicvector时添加10ng,各个引物添加50pmol、附带的10×PCR缓冲液10μl,1mM MgCl2、0.2mMdNTPs、2单位KODplus,总量为100μl。DNA的变性条件为94℃下15秒钟,引物的退火条件为55℃下30秒钟,延伸条件为68℃,60~300秒钟的条件下,使用Perkin-Elmer公司的DNA热循环仪,进行30循环反应。

将这些反应液用1%琼脂糖凝胶进行电泳,按照常规方法提取、制备P区中的约0.3kbp、HP区中的约1.4kbp、HUP区中的约5.5kbp、IC区中的约580bp、A区中的约0.8bp、HA区中的约0.9bp、β-gal基因中约3.2kbp的DNA片段。将这些DNA片段通过多核苷酸激酶(宝酒造(株))进行磷酸化后,使用宝酒造(株)的DNA Ligaton kit Ver.2于16℃下进行过夜反应,与用Hinc II切后进行脱磷酸化处理的pUC19载体进行连接。按照常规方法,使用连接的载体转化大肠杆菌,可以通过与上述同样条件对得到菌落进行PCR确认得到的转化体插入了PCR片段,通过常规方法制备插入了PCR片段的质粒。通过对这些质粒进行测序,确认得到的片段是各个基因的碱基序列。

实施例14.β-半乳糖苷酶表达用质粒的制作

将实施例13制备的带有β-gal基因的质粒用Sal I和Hind III切断,然后插入通过Sal I和Hind III从带有丝心蛋白H链启动子的质粒切出的约0.3kbp片段(P区)。再经BamH I切断,插入通过BamH I从带有丝心蛋白H链多聚A信号区的质粒切出的约0.8kbp片段(A区),使用QIAGEN Plasmid Maxi Kit,按照附带的程序对得到的带有β-gal基因的质粒进行纯化。得到的质粒命名为pPga1A,通过PCR和测序确认目的质粒。

同样将实施例13制备的带有β-gal基因的质粒用Sal I和Hind III切断,然后插入通过Sal I和Hind III从带有丝心蛋白H链启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区的质粒切出的约1.4kbp片段(HP区)。再经BamH I切断,插入通过BamH I从带有丝心蛋白H链C末端区·丝心蛋白H链多聚A信号区的质粒切出的约0.9kbp片段(HA区),使用QIAGEN Plasmid Maxi Kit,按照附带的程序对得到的带有β-gal基因的质粒进行纯化。得到的质粒命名为pHPga1HA,通过PCR和测序确认目的质粒。

实施例15.基因导入用质粒的制作

对于基因导入用质粒可以使用pigA3GFP(Nature Biotechnology18,81-84,2000)。即,从美国专利第6218185号公布的质粒p3E1.2中将编码转座酶的区域除去,向该部分插入了A3启动子(GenBank数据库登录编号U49854的碱基编号1764~2595)和来自pEGFP-N 1载体(Clontech公司生产)的GFP和来自SV40的多聚A付加序列(GenBank数据库登录编号U55762的碱基编号659~2578)的载体是pigA3GFP。对处于该A3启动子的上游侧的Xho I部位进行钝端化,插入猫干扰素ω基因表达[序列]盒。本实施例中的基因表达[序列]盒的构成是丝心蛋白H链启动子·猫干扰素ω基因·丝心蛋白H链多聚A信号区(P.IC.A),或丝心蛋白H链启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区·猫干扰素ω基因·丝心蛋白H链C末端区·丝心蛋白H链多聚A信号区(HP.IC.HA),或丝心蛋白H链上游启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区·猫干扰素ω·丝心蛋白H链C末端区·丝心蛋白H链多聚A信号区(HUP.IC.HA),或丝心蛋白H链启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区·猫干扰素ω·丝心蛋白H链多聚A信号区(HP.IC.A)。

以下给出了具体的方法。

P.IC.A构建物的制作通过以下手法进行。将实施例13制备的带有猫干扰素ω(IC区)的质粒用Sal I和Hind III切断,然后插入通过Sal I和Hind III从带有丝心蛋白H链启动子的质粒切出的约0.3kbp片段(P区)。再经BamH I切断,插入通过BamH I从带有丝心蛋白H链多聚A信号区的质粒切出的约0.8kbp片段(A区),将该带有P.IC.A的质粒用Asc I切断,将切出的约1.7kbp片段通过宝酒造(株)T4DNA聚合酶进行钝端化后的片段与用XhoI切断后钝端化、进行了脱磷酸化处理的pigA3GFP连接,制作含有P.IC.A基因[序列]盒的基因导入用构建物。图9和图10给出了构建的手法。

HP.IC.HA构建物的制作通过以下手法进行。将实施例13制备的带有猫干扰素ω(IC区)的质粒用Sal I和Hind III切断,然后插入通过Sal I和Hind III从带有丝心蛋白H链启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区的质粒切出的约1.4kbp片段(HP区)。再经BamHI切断,插入通过BamH I从带有丝心蛋白H链C末端区·丝心蛋白H链多聚A信号区的质粒切出的约0.9kbp片段(HA区)。将带有该HP.IC.HA的质粒用Asc I切断,将切出的约2.9kbp片段通过宝酒造(株)T4DNA聚合酶进行钝端化后的片段与用XhoI切断后钝端化、进行脱磷酸化处理的pigA3GFP连接,制作含有HP.IC.HA基因[序列]盒的基因导入用构建物。图11和图12给出了构建的手法。

HUP.IC.HA构建物的制作通过以下手法进行。通过以HP.IC.HA构建物1ng为模板,使用引物35(序列编号35)和引物36(序列编号36)两种引物进行PCR,获得丝心蛋白H链第一内含子·第二外显子区·猫干扰素ω·丝心蛋白H链C末端区·丝心蛋白H链多聚A信号区约2.1kbp。然后用Xho I和Sph I切断,插入通过Xho I和Sph I从带有丝心蛋白H链上游启动子·丝心蛋白H链基因第一外显子·第一内含子的质粒切出的约5.5kbp片段(HUP区)。将这个带有HUP.IC.HA的质粒用Asc I切断,将切出的约7.6kbp片段通过宝酒造(株)T4DNA聚合酶进行钝端化后的片段与用XhoI切断后钝端化、进行脱磷酸化处理的pigA3GFP连接,制作含有HUP.IC.HA基因[序列]盒的基因导入用构建物。图13和图14给出了构建的手法。

HP.IC.A构建物的制作通过以下手法进行。将实施例13制备的带有猫干扰素ω(IC区)的质粒用Sal I和Hind III切断,然后插入通过Sal I和Hind III从带有丝心蛋白H链启动子·丝心蛋白H链基因第一外显子·第一内含子·第二外显子区的质粒切出的约1.4kbp片段(HP区)。再经BamHI切断,插入通过BamH I从带有丝心蛋白H链多聚A信号区的质粒切出的约0.8kbp片段(A区)。将带有该HP.IC.A的质粒用Asc I切断,将切出的约2.8kbp片段通过宝酒造(株)T4DNA聚合酶进行钝端化后的片段与用XhoI切断后钝端化、进行脱磷酸化处理的pigA3GFP连接,制作含有HP.IC.A基因[序列]盒的基因导入用构建物。图15和图16给出了构建的手法。

用QIAGEN Plasmid Maxi Kit,按照附带的程序对P.IC.A基因导入用构建物、HP.IC.HA基因导入用构建物、HUP.IC.HA基因导入用构建物、HP.IC.A基因导入用构建物进行纯化。

实施例16.在蚕丝腺中的β-半乳糖苷酶的表达

将直径1.6um的金粒子用100%乙醇洗净灭菌,悬浮于灭菌蒸馏水中(60mg/ml)。β-gal基因表达[序列]盒向蚕丝腺中的导入用基因枪进行。即,将金粒子50ul(0.3mg)、实施例14得到的表达用质粒pPga1A或pHPgalHA 10ug和2.5M氯化钙50ul、0.1M精胺20ul依次混合,于室温下放置30分钟后,经离心分离,回收pHgalC包被的金粒子。得到的金粒子用70%乙醇清洗2次后,分散于100%乙醇50ul中。将10ul的金粒子悬浮液加到微载体上,使其干燥。基因枪使用BIO-RAD制PDS-1000/He。将从5龄第3日的蚕幼虫摘出的后部丝腺用PBS轻轻洗2次后,设置在1%琼脂板上,用1,100psi的压力使包被了DNA的金粒子喷射。DNA导入后,将丝腺移至20mlGrace昆虫培养基,于25℃下培养2日。培养后,回收培养上清和丝腺细胞,对β-gal的表达进行了确认。

表达的确认通过Western解析进行。将丝腺细胞于PBS中进行匀浆,提取细胞内含物。将培养上清和细胞提取液都调整到总蛋白质浓度为1.0mg/ml,以他们作为样品进行SDS-PAGE。(印迹)转移到膜上后,使用ECL PlusTM Western blotting Kit(Amersham Pharmacia公司生产),按照附带的程序进行β-gal蛋白质的检测。即,将印迹后的膜于封闭液(5%脱脂乳、0.1%Tween20PBS)中在4℃下封闭过夜。然后将膜用TPBS(0.1%Tween20PBS)清洗2次,用TPBS稀释1000倍的抗β-gal蛋白质抗体(Sigma公司生产)于室温下处理1小时。将膜用TPBS清洗2次,再用TPBS在5分钟内洗3次。然后用TPBS稀释10000倍后,用HRP标记的抗家兔IgG抗体于室温处理1小时后,将膜用TPBS清洗2次,再用TPBS在5分钟内洗3次。然后加ECL PlusTM Western blottingDetection System(Amersham Pharmacia公司生产)的检测试剂(溶液A+溶液B)。对HyperfilmTMECLTM曝光、显影。

由于只在导入pHPgalHA的丝腺细胞和培养上清中检测到β-gal蛋白质,所以表明丝心蛋白H链启动子以外的区域,即丝心蛋白H链基因第一外显子·第一内含子·第二外显子区对于细胞内的蛋白质合成或基因的表达起着重要的作用。另外也确认向细胞外的分泌。图17给出了该结果。

实施例17.基因重组蚕的制作

制备含有实施例15所述的基因导入用质粒和生产piggyBac转座酶蛋白质的DNA(pHA3PIG)各200μg/ml的0.5mM磷酸缓冲液(pH7.0)·5mMKCl溶液,将其中3-20nl微注射入产卵后4小时以内的500个蚕卵中。

对由这样的卵孵化的幼虫进行饲养,得到的成虫(G0)在组内进行交配得到的次世代(G1),通过对水母绿色荧光蛋白质的荧光观察,筛选染色体导入了水母绿色荧光蛋白质基因的蚕。结果得到了通过水母绿色荧光蛋白质的作用发出荧光的基因重组蚕。

实施例18.通过Western解析进行丝腺组织中的重组蛋白质的表达解析

表达的确认通过Western解析进行。回收非转化蚕、转化蚕(HP.IC.A转化蚕、HP.IC.HA转化蚕、HUP.IC.HA转化蚕)的后部丝腺组织,通过Western解析研究组织中的猫干扰素ω的表达。将后部丝腺组织于100mM磷酸钠缓冲液(pH7.0)中匀浆,回收离心分离后的上清,使用ECL PlusTMWestern blotting Kit(Amersham Pharmacia公司生产),按照附带的程序进行猫干扰素的检测。即,将印迹后的膜于封闭液(5%脱脂乳、0.1%Tween20P·BS)中在4℃下封闭过夜。然后将膜用TPBS(0.1%Tween20·PBS)清洗2次,用TPBS稀释1000倍的抗猫干扰素抗体于室温下处理1小时。将膜用TPBS清洗2次,再用TPBS在5分钟内洗3次。然后用TPBS稀释10000倍后,用HRP标记的抗家兔IgG抗体于室温处理1小时后,将膜用TPBS清洗2次,再用TPBS在5分钟内洗3次。之后加ECL PlusTM Western blotting Detection System(AmershamPharmacia公司生产)的检测试剂(溶液A+溶液B)。对HyperfilmTMECLTM曝光、显影。结果非转化蚕和P.IC.A构建物导入转化蚕的后部丝腺组织没有检测到信号,而与此相反,HP.IC.A构建物、HP.IC.HA构建物和HUP.IC.HA构建物导入转化蚕的丝腺组织检测到信号。由本实验的结果再次确认,丝心蛋白H链启动子以外的区域,即丝心蛋白H链基因第一外显子·第一内含子·第二外显子区对于蚕后部丝腺细胞内的蛋白质合成或基因的表达的飞跃上升起着重要的作用。图18给出了该结果。在含有丝心蛋白H链的5’末端启动子区约5.5kbp和猫干扰素基因和丝心蛋白H链的3’末端的HUP.IC.HA基因[序列]盒的转化蚕中的猫干扰素在后部丝腺组织内的蓄积量比含有丝心蛋白H链的5’末端启动子区和猫干扰素基因和丝心蛋白H链的3’末端的HP.IC.HA基因[序列]盒的转化蚕中的猫干扰素在后部丝腺组织内的蓄积量高。可以认为在H链5’末端上游区域存在使蛋白质产量提高的基因区域。

实施例19.通过Western解析进行蚕丝中的重组蛋白质的测定

以下对外源蛋白质即猫干扰素ω向蚕丝的分泌进行研究。

各取10mg量的非转化蚕、转化蚕(HP.IC.A基因导入转化蚕、HP.IC.HA基因导入转化蚕、HUP.IC.HA基因导入转化蚕)的茧,加4ml 60%LiSCN搅拌后,于室温下静置过夜溶解茧。将溶解液用8M尿素·2%SDS·5%2-巯基乙醇稀释10倍后的溶液作为样品,使用ECL PlusTM Westernblotting Kit(Amersham Pharmacia公司生产),按照附带的程序进行猫干扰素的检测,使用分子成像仪(BioRad公司生产)对该结果进行信号强度测定,与浓度已知的猫干扰素的信号强度进行比较,测定蛋白质含量。

本实验结果表明由非转化蚕和HP.IC.A基因导入转化蚕的蚕茧中没有检测到信号,与此相反,由HP.IC.HA基因导入转化蚕和HUP.IC.HA基因导入转化蚕的蚕茧中检测到信号,可以确认猫干扰素蛋白质向蚕丝中分泌。另外其含量,对于HP.IC.HA转化蚕是约0.8~2.0%,对于HUP.IC.HA转化蚕约为1.8~5.4%。该值如果换算为每头蚕的重量是0.4~2mg。

本实验的结果表明丝心蛋白H链基因的3’末端部分对在后部丝腺细胞内合成的蛋白质向蚕丝分泌具有重要的作用。图19给出了该结果。在含有丝心蛋白H链的5’末端启动子区约5.5kbp和猫干扰素基因和丝心蛋白H链的3’末端的HUP.IC.HA基因[序列]盒的转化蚕中的猫干扰素产量比含有丝心蛋白H链的5’末端启动子区和猫干扰素基因和丝心蛋白H链的3’末端的HP.IC.HA基因[序列]盒的转化蚕中的猫干扰素的产量高。可以认为在H链5’末端上游区域存在使蛋白质产量提高的基因区域。

实施例20.通过ELISA法测定蚕丝中的重组蛋白质。

通过ELISA法对蚕丝中的猫干扰素ω进行定量。

各取10μg量的非转化蚕、转化蚕(HP.IC.A基因导入转化蚕、HP.IC.HA基因导入转化蚕、HUP.IC.HA基因导入转化蚕)的茧,加4ml 60%LiSCN搅拌后,于室温下静置过夜溶解茧。然后用PBS稀释8倍或16倍,铺在微量反应板上。用PBS依次稀释浓度已知的猫干扰素作为标准使用。

结果在蚕丝中的猫干扰素ω在HP.IC.A基因导入转化蚕中没有检测到,而在HP.IC.HA基因导入转化蚕中约为1.1~2.2%,在HUP.IC.HA基因导入转化蚕约为1.0~4.9%。

产业上利用的可能性

制作将细胞因子基因与在蚕丝腺中发挥功能的启动子连接的质粒载体,由通过向蚕染色体导入基因得到的基因重组蚕的丝腺或茧丝可以大量回收保持着原来生理活性的细胞因子。另外得到的细胞因子提取液由于夹杂蛋白少,与以往方法比较,纯化容易。

通过将使丝心蛋白H链的5’末端部分的DNA序列和3’末端部分的DNA序列与外源蛋白质融合的表达用基因[序列]盒导入丝腺细胞等,可以使大量的外源蛋白质产生在丝腺细胞内、丝腺细胞外,甚至产生在茧丝中。通过这一新手法不使用重组杆状病毒,利用丝腺使外源蛋白质生产,确立了纯化容易的外源蛋白质生产技术。

序列表

<110>东丽株式会社和独立行政法人农药生物资源研究所

<120>利用基因重组蚕生产生理活性蛋白质的方法

<130>

<160>38

<170>PatentIn版本3.1

<210>1

<211>1910

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(1071)..(1652)

<223>

<220>

<221>sig_peptide

<222>(1071)..(1139)

<223>

<220>

<221>mat_peptide

<222>(1140)..(1652)

<223>

<400>1

ctcgagggtc agaaaccttg ttaaccaata gagccaaata tagttaacac aatagaaatt    60

tatccaaata ttattcgtgt attgtttata gcctttgtca agtcttttac aaggcaagat    120

aataagtaat attccgtgat tggacgtaac atttcccgga agatccttag ccgataagtc    180

gaagagccgc atgtggctag agagacgcgg gtttccgacc actggcttag gcgcttattc    240

cgccataata gatgtacgtg ttcacaatta gcacccgaaa ttcgtaatag ctacgagaag    300

tatcgaatat caaaaatcta tatattaata cgtgaagcaa aaactttgta tcccttttta    360

cgaaaattgc gaggacggag gagtatgaaa tttcccacac ttatagagaa tacagagaag    420

aagtgcacaa tgctaatatt tttttaaaat aatgcataaa agatacttta aatcaataaa    480

gaaaacagca cacacactac ataccatgta tttgacgcac acacgcatgt atactattta    540

ttgtcaaact tttgttcttg acgtctgtgt tcaaactgag aatagattaa atattgtttg    600

tctttattaa tattttttaa tagtgtagtc ttggcgaaat ttgtgattat agaagtataa    660

aatacaatca taatagtgta caaacttaca attcccaatt aattatagtc gaatttcgac    720

tactgcggga cctctagtat taataattct ctttaaaaaa aaacagagca tcaaatactg    780

tcacaaatgt caagcgggtc tcaacgagcc atgaataaat tagaaatcaa ttaataacat    840

aaaataggca aacaaaataa aaccatttac atagagaacg tttgttgaac aaaaacaata    900

acttgtatac attgtttgca caaatgtttg aaccgaaaat ttattactct ctacgtaagc    960

ttgatcaaac ttcgttttcg tataaaacgc gttggcccaa ccactttggc atagtcgtct    1020

tatcatcggg tctctaagga tcaagcgatc caaagaccgc caacgtcgac atg gcg       1076

                                                       Met Ala

                                                         1

ctg ccc tct tcc ttc ttg gtg gcc ctg gtg gcg ctg ggc tgc aac tcc      1124

Leu Pro Ser Ser Phe Leu Val Ala Leu Val Ala Leu Gly Cys Asn Ser

          5                  10                  15

gtc tgc gtg ctg ggc tgt gac ctg cct cag acc cac ggc ctg ctg aac      1172

Val Cys Val Leu Gly Cys Asp Leu Pro Gln Thr His Gly Leu Leu Asn

     20                  25                  30

agg agg gcc ttg acg ctc ctg gga caa atg agg aga ctc cct gcc agc      1220

Arg Arg Ala Leu Thr Leu Leu Gly Gln Met Arg Arg Leu Pro Ala Ser

 35                  40                  45                  50

tcc tgt cag aag gac aga aat gac ttc gcc ttc ccc cag gac gtg ttc      1268

Ser Cys Gln Lys Asp Arg Asn Asp Phe Ala Phe Pro Gln Asp Val Phe

                 55                  60                  65

ggt gga gac cag tcc cac aag gcc caa gcc ctc tcg gtg gtg cac gtg    1316

Gly Gly Asp Gln Ser His Lys Ala Gln Ala Leu Ser Val Val His Val

             70                  75                  80

acg aac cag aag atc ttc cac ttc ttc tgc aca gag gcg tcc tcg tct    1364

Thr Asn Gln Lys Ile Phe His Phe Phe Cys Thr Glu Ala Ser Ser Ser

         85                  90                  95

gct gct tgg aac acc acc ctc ctg gag gaa ttt tgc acg gga ctt gat    1412

Ala Ala Trp Asn Thr Thr Leu Leu Glu Glu Phe Cys Thr Gly Leu Asp

    100                 105                 110

cgg cag ctg acc cgc ctg gaa gcc tgt gtc ctg cag gag gtg gag gag    1460

Arg Gln Leu Thr Arg Leu Glu Ala Cys Val Leu Gln Glu Val Glu Glu

115                 120                 125                 130

gga gag gct ccc ctg acg aac gag gac att cat ccc gag gac tcc atc    1508

Gly Glu Ala Pro Leu Thr Asn Glu Asp Ile His Pro Glu Asp Ser Ile

                135                 140                 145

ctg agg aac tac ttc caa aga ctc tcc ctc tac ctg caa gag aag aaa    1556

Leu Arg Asn Tyr Phe Gln Arg Leu Ser Leu Tyr Leu Gln Glu Lys Lys

            150                 155                 160

tac agc cct tgt gcc tgg gag atc gtc aga gca gaa atc atg aga tcc    1604

Tyr Ser Pro Cys Ala Trp Glu Ile Val Arg Ala Glu Ile Met Arg Ser

        165                 170                 175

ttg tat tat tca tca aca gcc ttg cag aaa aga tta agg agc gag aaa    1652

Leu Tyr Tyr Ser Ser Thr Ala Leu Gln Lys Arg Leu Arg Ser Glu Lys

    180                 185                 190

tga tctagaccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg         1705

ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt  1765

cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg  1825

gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg  1885

atgcggtggg ctctatggcc tcgag                                        1910

<210>2

<211>1172

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(333)...(914)

<223>

<220>

<221>sig_peptide

<222>(333)...(401)

<223>

<220>

<221>mat_peptide

<222>(402)...(914)

<223>

<400>2

ctcgagggga gaaagcatga agtaagttct ttaaatatta caaaaaaatt gaacgatatt    60

ataaaattct ttaaaatatt aaaagtaaga acaataagat caattaaatc ataattaatc    120

acattgttca tgatcacaat ttaatttact tcatacgttg tattgttatg ttaaataaaa    180

agattaattt ctatgtaatt gtatctgtac aatacaatgt gtagatgttt attctatcga    240

aagtaaatac gtcaaaactc gaaaattttc agtataaaaa ggttcaactt tttcaaatca    300

gcatcagttc ggttccaact ctcaaggtcg ac atg gcg ctg ccc tct tcc ttc      353

                                    Met Ala Leu Pro Ser Ser Phe

                                      1               5

ttg gtg gcc ctg gtg gcg ctg ggc tgc aac tcc gtc tgc gtg ctg ggc      401

Leu Val Ala Leu Val Ala Leu Gly Cys Asn Ser Val Cys Val Leu Gly

         10                  15                  20

tgt gac ctg cct cag acc cac ggc ctg ctg aac agg agg gcc ttg acg    449

Cys Asp Leu Pro Gln Thr His Gly Leu Leu Asn Arg Arg Ala Leu Thr

     25                  30                  35

ctc ctg gga caa atg agg aga ctc cct gcc agc tcc tgt cag aag gac    497

Leu Leu Gly Gln Met Arg Arg Leu Pro Ala Ser Ser Cys Gln Lys Asp

 40                  45                  50                  55

aga aat gac ttc gcc ttc ccc cag gac gtg ttc ggt gga gac cag tcc    545

Arg Asn Asp Phe Ala Phe pro Gln Asp Val Phe Gly Gly Asp Gln Ser

                 60                  65                  70

cac aag gcc caa gcc ctc tcg gtg gtg cac gtg acg aac cag aag atc    593

His Lys Ala Gln Ala Leu Ser Val Val His Val Thr Asn Gln Lys Ile

             75                  80                  85

ttc cac ttc ttc tgc aca gag gcg tcc tcg tct gct gct tgg aac acc    641

Phe His Phe Phe Cys Thr Glu Ala Ser Ser Ser Ala Ala Trp Asn Thr

         90                  95                 100

acc ctc ctg gag gaa ttt tgc acg gga ctt gat cgg cag ctg acc cgc    689

Thr Leu Leu Glu Glu Phe Cys Thr Gly Leu Asp Arg Gln Leu Thr Arg

    105                 110                 115

ctg gaa gcc tgt gtc ctg cag gag gtg gag gag gga gag gct ccc ctg    737

Leu Glu Ala Cys Val Leu Gln Glu Val Glu Glu Gly Glu Ala Pro Leu

120                 125                 130                 135

acg aac gag gac att cat ccc gag gac tcc atc ctg agg aac tac ttc    785

Thr Asn Glu Asp Ile His Pro Glu Asp Ser Ile Leu Arg Asn Tyr Phe

                140                 145                 150

caa aga ctc tcc ctc tac ctg caa gag aag aaa tac agc cct tgt gcc    833

Gln Arg Leu Ser Leu Tyr Leu Gln Glu Lys Lys Tyr Ser Pro Cys Ala

            155                 160                 165

tgg gag atc gtc aga gca gaa atc atg aga tcc ttg tat tat tca tca    881

Trp Glu Ile Val Arg Ala Glu Ile Met Arg Ser Leu Tyr Tyr Ser Ser

        170                 175                 180

aca gcc ttg cag aaa aga tta agg agc gag aaa tga tctagaccgc         927

Thr Ala Leu Gln Lys Arg Leu Arg Ser Glu Lys

            185                 190

tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg    987

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt    1047

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc    1107

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggcc    1167

tcgag                                                                1172

<210>3

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>3

acgcgtcgac atgggcgctg ccctcttcct t                                   31

<210>4

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>4

ctagtctaga tcatttctcg ctccttaatc                                     30

<210>5

<211>29

<212>DNA

<223>人工序列

<220>

<223>合成的寡核苷酸

<400>5

ccggaattcg gtcagaaacc ttgttaacc                                      29

<210>6

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>6

acgcgtcgac gttggcggtc tttggatcgc                                     30

<210>7

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>7

ccggaattcg ggagaaagca tgaagtaag                                      29

<210>8

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>8

acgcgtcgac cttgagagtt ggaaccgaac                                      30

<210>9

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>9

ctagtctaga ccgctgatca gcctcgactg                                      30

<210>10

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>10

cgcggatccg ccatagagcc caccgcatcc                                      30

<210>11

<211>34

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>11

gacctcgagg gtcagaaacc ttgttaacca atag                                      34

<210>12

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>12

gacctcgagg ccatagagcc caccgcatcc                                           30

<210>13

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>13

gacctcgagg ggagaaagca tgaagtaag                                            29

<210>14

<211>31

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>14

acgcgtcgac atgaccaaca agtgtctcct c                                      31

<210>15

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>15

ctagtctaga tcagtttcgg aggtaacctg                                        30

<210>16

<211>1151

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(333)...(893)

<223>

<220>

<221>sig_peptide

<222>(333)...(395)

<223>

<220>

<221>mat_peptide

<222>(396)...(893)

<223>

<400>16

ctcgagggga gaaagcatga agtaagttct ttaaatatta caaaaaaatt gaacgatatt  60

ataaaattct ttaaaatatt aaaagtaaga acaataagat caattaaatc ataattaatc  120

acattgttca tgatcacaat ttaatttact tcatacgttg tattgttatg ttaaataaaa  180

agattaattt ctatgtaatt gtatctgtac aatacaatgt gtagatgttt attctatcga  240

aagtaaatac gtcaaaactc gaaaattttc agtataaaaa ggttcaactt tttcaaatca  300

gcatcagttc ggttccaact ctcaaggtcg ac                                332

atg acc aac aag tgt ctc ctc caa att gct ctc ctg ttg tgc ttc tcc    380

Met Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser

  1               5                  10                  15

act aca gct ctt tcc atg agc tac aac ttg ctt gga ttc cta caa aga    428

Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg

             20                  25                  30

agc agc aat ttt cag tgt cag aag ctc ctg tgg caa ttg aat ggg agg    476

Ser Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg

         35                  40                  45

ctt gaa tac tgc ctc aag gac agg atg aac ttt gac atc cct gag gag    524

Leu Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile Pro Glu Glu

     50                  55                  60

att aag cag ctg cag cag ttc cag aag gag gac gcc gca ttg acc atc    572

Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Leu Thr Ile

 65                  70                  75                  80

tat gag atg ctc cag aac atc ttt gct att ttc aga caa gat tca tct    620

Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser

                 85                  90                  95

agc act ggc tgg aat gag act att gtt gag aac ctc ctg gct aat gtc    668

Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val

            100                 105                 110

tat cat cag ata aac cat ctg aag aca gtc ctg gaa gaa aaa ctg gag    716

Tyr His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu

        115                 120                 125

aaa gaa gat ttc acc agg gga aaa ctc atg agc agt ctg cac ctg aaa    764

Lys Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu His Leu Lys

    130                 135                 140

aga tat tat ggg agg att ctg cat tac ctg aag gcc aag gag tac agt    812

Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Tyr Ser

145                 150                 155                 160

cac tgt gcc tgg acc ata gtc aga gtg gaa atc cta agg aac ttt tac    860

His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr

                165                 170                 175

ttc att aac aga ctt aca ggt tac ctc cga aac tga tctagaccgc         906

Phe Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn

            180                 185

tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg  960

ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt  1026

gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc  1086

aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggcc  1146

tcgag                                                              1151

<210>17

<211>1849

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(1071)...(1631)

<223>

<220>

<221>sig_peptide

<222>(1071)...(1133)

<223>

<220>

<221>mat_peptide

<222>(1134)...(1631)

<223>

<400>17

ctcgagggtc agaaaccttg ttaaccaata gagccaaata tagttaacac aatagaaatt    60

tatccaaata ttattcgtgt attgtttata gcctttgtca agtcttttac aaggcaagat    120

aataagtaat attccgtgat tggacgtaac atttcccgga agatccttag ccgataagtc    180

gaagagccgc atgtggctag agagacgcgg gtttccgacc actggcttag gcgcttattc    240

cgccataata gatgtacgtg ttcacaatta gcacccgaaa ttcgtaatag ctacgagaag    300

tatcgaatat caaaaatcta tatattaata cgtgaagcaa aaactttgta tcccttttta    360

cgaaaattgc gaggacggag gagtatgaaa tttcccacac ttatagagaa tacagagaag    420

aagtgcacaa tgctaatatt tttttaaaat aatgcataaa agatacttta aatcaataaa    480

gaaaacagca cacacactac ataccatgta tttgacgcac acacgcatgt atactattta    540

ttgtcaaact tttgttcttg acgtctgtgt tcaaactgag aatagattaa atattgtttg    600

tctttattaa tattttttaa tagtgtagtc ttggcgaaat ttgtgattat agaagtataa    660

aatacaatca taatagtgta caaacttaca attcccaatt aattatagtc gaatttcgac    720

tactgcggga cctctagtat taataattct ctttaaaaaa aaacagagca tcaaatactg    780

tcacaaatgt caagcgggtc tcaacgagcc atgaataaat tagaaatcaa ttaataacat    840

aaaataggca aacaaaataa aaccatttac atagagaacg tttgttgaac aaaaacaata    900

acttgtatac attgtttgca caaatgtttg aaccgaaaat ttattactct ctacgtaagc    960

ttgatcaaac ttcgttttcg tataaaacgc gttggcccaa ccactttggc atagtcgtct  1020

tatcatcggg tctctaagga tcaagcgatc caaagaccgc caacgtcgac             1070

atg acc aac aag tgt ctc ctc caa att gct ctc ctg ttg tgc ttc tcc    1118

Met Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser

  1               5                  10                  15

act aca gct ctt tcc atg agc tac aac ttg ctt gga ttc cta caa aga    1166

Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg

             20                  25                  30

agc agc aat ttt cag tgt cag aag ctc ctg tgg caa ttg aat ggg agg    1214

Ser Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg

         35                  40                  45

ctt gaa tac tgc ctc aag gac agg atg aac ttt gac atc cct gag gag    1262

Leu Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile Pro Glu Glu

     50                  55                  60

att aag cag ctg cag cag ttc cag aag gag gac gcc gca ttg acc atc    1310

Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Leu Thr Ile

 65                  70                  75                  80

tat gag atg ctc cag aac atc ttt gct att ttc aga caa gat tca tct    1358

Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser

                 85                  90                  95

agc act ggc tgg aat gag act att gtt gag aac ctc ctg gct aat gtc    1406

Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val

            100                 105                 110

tat cat cag ata aac cat ctg aag aca gtc ctg gaa gaa aaa ctg gag    1454

Tyr His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu

        115                 120                 125

aaa gaa gat ttc acc agg gga aaa ctc atg agc agt ctg cac ctg aaa    1502

Lys Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu His Leu Lys

    130                 135                 140

aga tat tat ggg agg att ctg cat tac ctg aag gcc aag gag tac agt    1550

Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Tyr Ser

145                 150                 155                 160

cac tgt gcc tgg acc ata gtc aga gtg gaa atc cta agg aac ttt tac    1598

His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr

                165                 170                 175

ttc att aac aga ctt aca ggt tac ctc cga aac tga cagccatctg           1644

Phe Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn

            180                 185

ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt    1704

cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg    1764

gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg    1824

atgcggtggg ctctatggcc tcgag                                          1849

<210>18

<211>28

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>18

acgcgtcgac atgaagctga ccgccctg                                       28

<210>19

<211>28

<212>DNA

<213>人工序列

<220>

<223>合成的寡核苷酸

<400>19

ctagtctaga tcagggcttg gtgaagtg                                       28

<210>20

<211>1175

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(333)...(917)

<223>

<220>

<221>sig_peptide

<222>(333)...(401)

<223>

<220>

<221>mat_peptide

<222>(402)...(917)

<223>

<400>20

ctcgagggga gaaagcatga agtaagttct ttaaatatta caaaaaaatt gaacgatatt    60

ataaaattct ttaaaatatt aaaagtaaga acaataagat caattaaatc ataattaatc    120

acattgttca tgatcacaat ttaatttact tcatacgttg tattgttatg ttaaataaaa    180

agattaattt ctatgtaatt gtatctgtac aatacaatgt gtagatgttt attctatcga    240

aagtaaatac gtcaaaactc gaaaattttc agtataaaaa ggttcaactt tttcaaatca    300

gcatcagttc ggttccaact ctcaaggtcg ac                                  332

atg aag ctg acc gcc ctg cag ctg ctg ctg tgg cac agc gca ctc tgg      380

Met Lys Leu Thr Ala Leu Gln Leu Leu Leu Trp His Ser Ala Leu Trp

  1               5                  10                  15

atg gtg caa gaa gcc acc ccc ttg ggc cct acc agc tcc ctg ccc cag      428

Met Val Gln Glu Ala Thr Pro Leu Gly Pro Thr Ser Ser Leu Pro Gln

             20                  25                  30

agc ttc ctg ctc aag tgc tta gaa caa gtg agg aag gtc cag gct gat    476

Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Val Gln Ala Asp

         35                  40                  45

ggc aca gcg ctg cag gag agg ctg tgc gcc gcc cac aag ctg tgc cac    524

Gly Thr Ala Leu Gln Glu Arg Leu Cys Ala Ala His Lys Leu Cys His

     50                  55                  60

cct gag gag ctg gtg ctg ctt ggg cac gct ctg ggc atc ccc cag gct    572

Pro Glu Glu Leu Val Leu Leu Gly His Ala Leu Gly Ile Pro Gln Ala

 65                  70                  75                  80

ccc ctg agc agc tgc tcc agc cag gcc ctg cag ctg acg ggc tgc ctg    620

Pro Leu Ser Ser Cys Ser Ser Gln Ala Leu Gln Leu Thr Gly Cys Leu

                 85                  90                  95

cgt caa ctc cac agt ggc ctc ttc ctc tac cag ggc ctc ctg cag gcc    668

Arg Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala

            100                 105                 110

ctg gca ggg ata tcc ccc gag tta gcc ccc acc ctg gac atg ctg cag    716

Leu Ala Gly Ile Ser Pro Glu Leu Ala Pro Thr Leu Asp Met Leu Gln

        115                 120                 125

ctg gac atc acc gac ttt gct atc aac atc tgg cag cag atg gaa gac    764

Leu Asp Ile Thr Asp Phe Ala Ile Asn Ile Trp Gln Gln Met Glu Asp

    130                 135                 140

gtg ggg atg gcc cct gca gtg ccg ccc acc cag ggc acc atg cca acc    812

Val Gly Met Ala Pro Ala Val Pro Pro Thr Gln Gly Thr Met Pro Thr

145                 150                 155                 160

ttc acc tcg gcc ttc cag cgc cgg gca gga ggc acc ctg gtt gcc tcc    860

Phe Thr Ser Ala Phe Gln Arg Arg Ala Gly Gly Thr Leu Val Ala Ser

                165                 170                 175

aac ctg cag agc ttc ctg gag gtg gca tac cgt gct ctg cgc cac ttc    908

Asn Leu Gln Ser Phe Leu Glu Val Ala Tyr Arg Ala Leu Arg His Phe

            180                 185                 190

acc aag ccc tga tctagaccgc tgatcagcct cgactgtgcc ttctagttgc        960

Thr Lys Pro

        195

cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc    1020

actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct    1080

attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg    1140

catgctgggg atgcggtggg ctctatggcc tcgag                               1175

<210>21

<211>1873

<212>DNA

<213>人工序列

<220>

<223>人工序列

<220>

<221>CDS

<222>(1071)...(1655)

<223>

<220>

<221>sig_peptide

<222>(1071)...(1139)

<223>

<220>

<221>mat_peptide

<222>(1140)...(1655)

<223>

<400>21

ctcgagggtc agaaaccttg ttaaccaata gagccaaata tagttaacac aatagaaatt    60

tatccaaata ttattcgtgt attgtttata gcctttgtca agtcttttac aaggcaagat    120

aataagtaat attccgtgat tggacgtaac atttcccgga agatccttag ccgataagtc    180

gaagagccgc atgtggctag agagacgcgg gtttccgacc actggcttag gcgcttattc    240

cgccataata gatgtacgtg ttcacaatta gcacccgaaa ttcgtaatag ctacgagaag    300

tatcgaatat caaaaatcta tatattaata cgtgaagcaa aaactttgta tcccttttta    360

cgaaaattgc gaggacggag gagtatgaaa tttcccacac ttatagagaa tacagagaag    420

aagtgcacaa tgctaatatt tttttaaaat aatgcataaa agatacttta aatcaataaa    480

gaaaacagca cacacactac ataccatgta tttgacgcac acacgcatgt atactattta    540

ttgtcaaact tttgttcttg acgtctgtgt tcaaactgag aatagattaa atattgtttg    600

tctttattaa tattttttaa tagtgtagtc ttggcgaaat ttgtgattat agaagtataa    660

aatacaatca taatagtgta caaacttaca attcccaatt aattatagtc gaatttcgac    720

tactgcggga cctctagtat taataattct ctttaaaaaa aaacagagca tcaaatactg    780

tcacaaatgt caagcgggtc tcaacgagcc atgaataaat tagaaatcaa ttaataacat    840

aaaataggca aacaaaataa aaccatttac atagagaacg tttgttgaac aaaaacaata    900

acttgtatac attgtttgca caaatgtttg aaccgaaaat ttattactct ctacgtaagc    960

ttgatcaaac ttcgttttcg tataaaacgc gttggcccaa ccactttggc atagtcgtct    1020

tatcatcggg tctctaagga tcaagcgatc caaagaccgc caacgtcgac               1070

atg aag ctg acc gcc ctg cag ctg ctg ctg tgg cac agc gca ctc tgg      1118

Met Lys Leu Thr Ala Leu Gln Leu Leu Leu Trp His Ser Ala Leu Trp

  1               5                  10                  15

atg gtg caa gaa gcc acc ccc ttg ggc cct acc agc tcc ctg ccc cag      1166

Met Val Gln Glu Ala Thr Pro Leu Gly Pro Thr Ser Ser Leu Pro Gln

             20                  25                  30

agc ttc ctg ctc aag tgc tta gaa caa gtg agg aag gtc cag gct gat      1214

Ser Phe Leu Leu Lys Cys Leu Glu Gln Val Arg Lys Val Gln Ala Asp

         35                  40                  45

ggc aca gcg ctg cag gag agg ctg tgc gcc gcc cac aag ctg tgc cac      1262

Gly Thr Ala Leu Gln Glu Arg Leu Cys Ala Ala His Lys Leu Cys His

     50                  55                  60

cct gag gag ctg gtg ctg ctt ggg cac gct ctg ggc atc ccc cag gct      1310

Pro Glu Glu Leu Val Leu Leu Gly His Ala Leu Gly Ile Pro Gln Ala

 65                  70                  75                  80

ccc ctg agc agc tgc tcc agc cag gcc ctg cag ctg acg ggc tgc ctg      1358

Pro Leu Ser Ser Cys Ser Ser Gln Ala Leu Gln Leu Thr Gly Cys Leu

                 85                  90                  95

cgt caa ctc cac agt ggc ctc ttc ctc tac cag ggc ctc ctg cag gcc    1406

Arg Gln Leu His Ser Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala

            100                 105                 110

ctg gca ggg ata tcc ccc gag tta gcc ccc acc ctg gac atg ctg cag    1454

Leu Ala Gly Ile Ser Pro Glu Leu Ala Pro Thr Leu Asp Met Leu Gln

        115                 120                 125

ctg gac atc acc gac ttt gct atc aac atc tgg cag cag atg gaa gac    1502

Leu Asp Ile Thr Asp Phe Ala Ile Asn Ile Trp Gln Gln Met Glu Asp

    130                 135                 140

gtg ggg atg gcc cct gca gtg ccg ccc acc cag ggc acc atg cca acc    1550

Val Gly Met Ala Pro Ala Val Pro Pro Thr Gln Gly Thr Met Pro Thr

145                 150                 155                 160

ttc acc tcg gcc ttc cag cgc cgg gca gga ggc acc ctg gtt gcc tcc    1598

Phe Thr Ser Ala Phe Gln Arg Arg Ala Gly Gly Thr Leu Val Ala Ser

                165                 170                 175

aac ctg cag agc ttc ctg gag gtg gca tac cgt gct ctg cgc cac ttc    1646

Asn Leu Gln Ser Phe Leu Glu Val Ala Tyr Arg Ala Leu Arg His Phe

            180                 185                 190

acc aag ccc tga cagccatctg ttgtttgccc ctcccccgtg ccttccttga        1698

Thr Lys Pro

        195

ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt  1758

gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg  1818

attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggcc tcgag       1873

<210>22

<211>1396

<212>DNA

<213>家蚕(Bombyx mori)

<400>22

gggagaaagc atgaagtaag ttctttaaat attacaaaaa aattgaacga tattataaaa  60

ttctttaaaa tattaaaagt aagaacaata agatcaatta aatcataatt aatcacattg  120

ttcatgatca caatttaatt tacttcatac gttgtattgt tatgttaaat aaaaagatta  180

atttctatgt aattgtatct gtacaataca atgtgtagat gtttattcta tcgaaagtaa  240

atacgtcaaa actcgaaaat tttcagtata aaaaggttca actttttcaa atcagcatca  300

gttcggttcc aactctcaag atgagagtca aaacctttgt gatcttgtgc tgcgctctgc  360

aggtgagtta attattttac tattatttca gaaggtggcc agacgatatc acgggccacc  420

tgataataag tggtcgccaa aacgcacaga tatcgtaaat tgtgccattt gatttgtcac  480

gcccgggggg gctacggaat aaactacatt tatttattta aaaaatgaac cttagattat  540

gtaacttgtg atttatttgc gtcaaaagta ggcaagatga atctatgtaa atacctgggc  600

agacttgcaa tatcctattt caccggtaaa tcagcattgc aatatgcaat gcatattcaa  660

caatatgtaa aacaattcgt aaagcatcat tagaaaatag acgaaagaaa ttgcataaaa  720

ttataaccgc attattaatt tattatgata tctattaaca attgctattg cctttttttc  780

gcaaattata atcattttca taacctcgag gtagcattct gttacatttt aatacattgg  840

tatgtgatta taacacgagc tgcccactga gtttctcgcc agatcttctc agtgggtcgc  900

gttaccgatc acgtgataga ttctatgaag cactgctctt gttagggcta gtgttagcaa  960

attctttcag gttgagtctg agagctcacc tacccatcgg agcgtagctg gaataggcta  1020

ccagctaata ggtagggaaa acaaagctcg aaacaagctc aagtaataac aacataatgt  1080

gaccataaaa tctcgtggtg tatgagatac aattatgtac tttcccacaa atgtttacat  1140

aattagaatg ttgttcaact tgcctaacgc cccagctaga acattcaatt attactatta  1200

ccactactaa ggcagtatgt cctaactcgt tccagatcag cgctaacttc gattgaatgt  1260

gcgaaattta tagctcaata ttttagcact tatcgtattg atttaagaaa aaattgttaa  1320

cattttgttt cagtatgtcg cttatacaaa tgcaaacatc aatgattttg atgaggacta  1380

ttttgggagt gatgtc                                                  1396

<210>23

<211>6070

<212>DNA

<213>家蚕(Bombyx mori)

<400>23

tcaagacatc cttgattaag gcagctgccg atattgacat ggacctcgtt cgtgctgcga  60

tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa tcacggaggt cattttgaat  120

aaactttagt gtcataagaa tctatgtttt gttaagttca ttttggtata tgaatggtta    180

cataatgaat aaacttgttt caattatttt acattaaaca tgtgacagaa tttatgacct    240

gactaggtag gtacaaacag cctttttgat attagaaaac taagtaaaat agcctacggt    300

cacatctctt tccgtgggtg tcgttaaagg gcgacttaga gaaccaccaa gaacgtagca    360

gaatcctcag agtgtcatac cagcatacag ccatcgctaa ctgctattta ctggtaatag    420

ggcacattgt aatctcactt aaccatactg tcgggccacc atctagccta tttctgccac    480

gaatcaatcg tgagtgatgg acatagagaa actattagtt gagaagaaaa caagagcact    540

aaaggtttga tattgacaaa aatctacttc gccgtcactc cataggttta ttgtctctca    600

ttagtccaga acagcagtta cagacgtaag cttttacgca caaactacag ggttgctctt    660

tattgtatcg aaaatatggg acctgaataa gggcgatttt gacgcgtcct gcccgcccat    720

tcccgatcct acggacagaa tggcaagcag tcgacgtcgc cccaaacacg tcatttcgga    780

tcctcacgat ccactaacgg tgctttaggt acctcaagca ccggtcatcg ttctcgtcgg    840

acccgtcgct tgcgacgaag ggctcgacga gcaaattaac cctcagacac agcccactga    900

gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc cggtggtaga ttctgcgaag    960

cacggctctt gctaggattc gtgttagcaa cgtcgtcagg tttgagcccc gtgagctcac    1200

ttactagtta aggttacgct gaaatagcct ctcaaggctc tcagctaggt aggaaacaaa    1080

aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc ttctgcagcg tactgtcgtg    1140

gcagggcggt accgcaccat ctttttcgac gccaccttgt gatctgaagg cgaagatact    1200

cgaccttaat gattgaggca agagcgtaat acctcgcgct ccctagacga gtagatctcg    1260

tggaagattc ggcacacggc acacaaaaat agcttttgag atagccttca atgtaattat    1320

gtttttatat atatttacta gctgacccgg caaacgttgt gttgccttaa ataagatttc    1380

tagggaaatt ctagtgtaga aaaataacct cattcaacca cataatacct cattataacc    1440

aaaaaaaaat aatatccaaa aaataaaaat ataaaataaa tgtttggggt ggacaaccct    1500

tatcacatag gggtatgaaa attagatagt agccgattct cagacctact gaacatacta    1560

ttgatacaca aataaaacca aaaaaacatg gctgaaaaat gtatagtagg tattgtatta    1620

ttaagtgtat aatctatgat gtatatgagt aagtaagaca ggagaccggc ttcgtcctca    1680

tccgtcataa aaaccgtcat aaaaatcaaa cccgcaaaat tataatttgc gtaattactg    1740

gtggctggtg gtaggacctt cttgtgagtc cgcgcgggta ggtaccacca tctgactatt    1800

ctgccgtgaa gcagtaatgg gtttcggttt gaagggcggg acagccgttg taactatact    1860

tgagacctta gaacttatat ctcaatgtgg gtggcgcatt tttttacggt aggcagcggc    1920

ttggctctgc ccctggcatt gctgaagtcc ataggcgacg gttaccactc accatcaggt    1980

gggccgtatg gccgtctgcc tacaaaatca ataaaaaaaa aataaaaaat ttacgttgta    2040

gatgtctatg ggctccagta accacttaac accaggcggg ctgtgagctc gtccacccat    2100

ctaagcaata aaaataaata aatagatagt tgatcagtag tggaccggcg agggcgggag    2160

atcaaattga atttaaaata aaacataatt aaaggaattt gaaactataa actctgaata    2220

ataatttatc gtactacaat tataatattt gattgccatc ttgcaacctt attgcggatc    2280

tgtgaataga aaaaaaaaaa aaatcgggat ggaaaaatag gggttgatcg tataagagtg    2340

aaaattgaga gtaatatgga atttttttat tttaagtcat gacaaaataa aaataagatc    2400

ttgccaaaaa aatttaagtt tattattaaa ttaagtttaa caaataaaaa attggggttg    2460

atcgcagagg ggtgaaaatt tagggtttta tgtatttttg tatgctgtat cataaaaaaa    2520

taaaaacaaa aaataaaaat agggggatga aaaataaatg ttgttcgatt ctcaaccctg    2580

gccgatatgc acgctaagat tcacaaaaat cggtcgagcc gtttcggagg agttcaatca    2640

cgcaccccgt cacacgagaa ttttatttat tagatttaga agagctgaaa gataaatcga    2700

tatttaattt tgtaagttgt cttgatgata cattttttcg tttgtcattc tttcctgcag    2760

ttagaacata atataaaatg caaatgaaaa atagaaatat aataaataat aataaataaa    2820

taataaatat ttactaacaa tcacgctacg ttaactggtc ccgtgataag ttcgtaaaga    2880

acttgtgtta caggtaccag ataacggata taaatgtaag atttttatta tacacataca    2940

tatatttcat atacattcat aaccctggaa aatacattta tatttatcat acaaatatct    3000

tcccttggcg ggattcgaac ccgcgacccc cttgtgtagt gacaatgtca cttaccacta    3060

caccctctgg cattgctggg cgacggtaac cacccaccat taggtgggcc atatgctcgt    3120

ctgcctacaa gggaaataaa aaaaatatcc taatataaat tgcattaatt tttttaaacc    3180

gactttcaat cacaatgaag acagattctc gtcgaagttt gtttttgaaa ctatatcaat    3240

aacttttcat tatccgttct tcgtcttttg tctttttttc gcaaacaaaa cgaacaaaac    3300

gttctaattc gaaagatgtt ttgtacggaa agtttgaata agtgcttaat tgcaagtaac    3360

gtaacaatgt tttagggttc ggtcctcaat aaattcgacc aataaaccat acaaattctt    3420

taacattttt ttaatcttat actagctgac ccggcagact tcgtggtgcc tcaatcgata    3480

aataaaatac ctatgcttct gtataaaata aacataaaac aaacaaaagg aatccgtccg    3540

acgggagaca catcaaagga aaaacatctt ttttattttt ttacctttta aaccttctct    3600

ggacttccac aaataattta agaccaaaat tagccaaatc ggtctagcat tttcgagttt    3660

tagcgagact aacgaacagc aattcatttt tatatacaca gatttatgtt accggggtct    3720

agtgacctaa acgacttcag ctctaacact aggctaactc aggcttagta gcctggtcct    3780

agtgttagat ttgaagtcgt ctaatgcaaa gattattgga tctgatggat ccgtaaggac    3840

gtgtctagag cgtcgacggt gactagctcc tgcgtgatca ggaaaaatgt ggaaagctta    3900

acgattttgt cacattttac ttatcacaac ttgtttttat aataattcgc ttaaatgagc    3960

agctattact taatctcgta gtggtttttg acaaaatcag cttctttaga actaaaatat    4020

catttttttc gtaatttttt taatgaaaaa tgctctagtg ttataccttt ccaaaatcac    4080

cattaattag gtagtgttta agcttgttgt acaaaactgc cacacgcatt tttttctcca    4140

ctgtaggttg tagttacgcg aaaacaaaat cgttctgtga aaattcaaac aaaaatattt    4200

tttcgtaaaa acacttatca atgagtaaag taacaattca tgaataattt catgtaaaaa    4260

aaaaatacta gaaaaggaat ttttcattac gagatgctta aaaatctgtt tcaaggtaga    4320

gatttttcga tatttcggaa aattttgtaa aactgtaaat ccgtaaaatt ttgctaaaca    4380

tatattgtgt tgttttggta agtattgacc caagctatca cctcctgcag tatgtcgtgc    4440

taattactgg acacattgta taacagttcc actgtattga caataataaa acctcttcat    4500

tgacttgaga atgtctggac agatttggct ttgtattttt gatttacaaa tgtttttttg    4560

gtgatttacc catccaaggc attctccagg atggttgtgg catcacgccg attggcaaac    4620

aaaaactaaa atgaaactaa aaagaaacag tttccgctgt cccgttcctc tagtgggaga    4680

aagcatgaag taagttcttt aaatattaca aaaaaattga acgatattat aaaattcttt    4740

aaaatattaa aagtaagaac aataagatca attaaatcat aattaatcac attgttcatg    4800

atcacaattt aatttacttc atacgttgta ttgttatgtt aaataaaaag attaatttct    4860

atgtaattgt atctgtacaa tacaatgtgt agatgtttat tctatcgaaa gtaaatacgt    4920

caaaactcga aaattttcag tataaaaagg ttcaactttt tcaaatcagc atcagttcgg    4980

ttccaactct caagatgaga gtcaaaacct ttgtgatctt gtgctgcgct ctgcaggtga    5040

gttaattatt ttactattat ttcagaaggt ggccagacga tatcacgggc cacctgataa    5100

taagtggtcg ccaaaacgca cagatatcgt aaattgtgcc atttgatttg tcacgcccgg    5160

gggggctacg gaataaacta catttattta tttaaaaaat gaaccttaga ttatgtaact    5220

tgtgatttat ttgcgtcaaa agtaggcaag atgaatctat gtaaatacct gggcagactt    5280

gcaatatcct atttcaccgg taaatcagca ttgcaatatg caatgcatat tcaacaatat    5340

gtaaaacaat tcgtaaagca tcattagaaa atagacgaaa gaaattgcat aaaattataa    5400

ccgcattatt aatttattat gatatctatt aacaattgct attgcctttt tttcgcaaat    5460

tataatcatt ttcataacct cgaggtagca ttctgttaca ttttaataca ttggtatgtg    5520

attataacac gagctgccca ctgagtttct cgccagatct tctcagtggg tcgcgttacc    5580

gatcacgtga tagattctat gaagcactgc tcttgttagg gctagtgtta gcaaattctt    5640

tcaggttgag tctgagagct cacctaccca tcggagcgta gctggaatag gctaccagct    5700

aataggtagg gaaaacaaag ctcgaaacaa gctcaagtaa taacaacata atgtgaccat    5760

aaaatctcgt ggtgtatgag atacaattat gtactttccc acaaatgttt acataattag    5820

aatgttgttc aacttgccta acgccccagc tagaacattc aattattact attaccacta    5880

ctaaggcagt atgtcctaac tcgttccaga tcagcgctaa cttcgattga atgtgcgaaa    5940

tttatagctc aatattttag cacttatcgt attgatttaa gaaaaaattg ttaacatttt    6000

gtttcagtat gtcgcttata caaatgcaaa catcaatgat tttgatgagg actattttgg    6060

gagtgatgtc                                                           6070

<210>24

<211>99

<212>DNA

<213>家蚕(Bombyx mori)

<400>24

cgcagttacg actattctcg tcgtaacgtc cgcaaaaact gtggaattcc tagaagacaa    60

ctagttgtta aattcagagc actgccttgt gtgaattgc                           99

<210>25

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>25

ggcgcgccgg gagaaagcat gaagtaag                                       28

<210>26

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>26

gtcgaccttg agagttggaa ccgaac                                         26

<210>27

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>27

gtcgacatgg cgctgccctc ttcc                                                24

<210>28

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>28

tgtggatcct ttctcgctcc ttaatc                                              26

<210>29

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>29

ggatcctaat ttttaatata aaataaccct tg                                       32

<210>30

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>30

cttggcgcgc cacgacgtag acgtatagcc atcgg                                        35

<210>31

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>31

cttgtcgacg acatcactcc caaaatagtc c                                            31

<210>32

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>32

gtcggatccc gcagttacga ctattctcgt cgt                                          33

<210>33

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>33

cccaatttgg cgcgcctcaa gacatccttg a                                        31

<210>34

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>34

gaatgctacc tcgaggttat gaaaatg                                             27

<210>35

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>35

aacctcgagg tagcattctg ttac                                                24

<210>36

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>36

ggtaccggcg cgccacgacg tagacg                                            26

<210>37

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>37

gtcgacatgt cgtttacttt gaccaacaag                                        30

<210>38

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>38

ggatcctttt tgacaccaga ccaactggta                                        30

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号