首页> 中国专利> 乙型肝炎病毒B、C基因型前S1区基因串联重组质粒及其构建方法和应用

乙型肝炎病毒B、C基因型前S1区基因串联重组质粒及其构建方法和应用

摘要

本发明涉及一种乙型肝炎病毒B、C基因型前S1区基因串联重组质粒及其构建方法和应用。本发明利用overlapPCR技术构建了HBV前S1抗原B、C基因型抗原串联表达的pcDNA3.1(‑)质粒,该串联重组质粒可以在HEK293细胞中同时重组表达HBV B基因型前S1抗原和HBV C基因型前S1抗原。本发明的重组质粒表达的蛋白可以同时结合针对前S区HBV B基因型和HBV C基因型的抗体,能够高效完成针对HBV B基因型、C基因型抗体的筛选,为同时针对HBV B基因型和C基因型的诊断、治疗型抗体筛选奠定了基础。

著录项

  • 公开/公告号CN112779290A

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 北京安必奇生物科技有限公司;

    申请/专利号CN202110113419.8

  • 申请日2021-01-27

  • 分类号C12N15/85(20060101);C12N15/66(20060101);C12N15/62(20060101);C12N15/10(20060101);C07K19/00(20060101);G01N33/68(20060101);G01N33/569(20060101);G01N33/576(20060101);

  • 代理机构11470 北京精金石知识产权代理有限公司;

  • 代理人尉月丽

  • 地址 100176 北京市通州区经海五路1号院22号楼2层

  • 入库时间 2023-06-19 10:57:17

说明书

技术领域

本发明涉及生物制药和基因工程技术领域,具体涉及乙型肝炎病毒B、C基因型前S1区基因串联重组质粒及其构建方法和应用。

背景技术

乙型肝炎病毒(Hepatitis B,HBV)感染是严重的公共卫生问题,全球约20亿人感染过HBV,有3.5亿人成为了慢性HBV感染者,其中15%-40%的HBV感染者最终发展为肝硬化或肝癌。据统计中国累计有7亿人感染HBV,1.2亿人成为病毒的携带者,每年约有60万人死于HBV感染相关的疾病。HBV感染的临床转归不仅与患者的年龄和免疫力有关,也与病毒株的基因型密切相关,研究HBV基因分型具有重要的临床意义。

HBV属于嗜肝病毒的一种,核酸为部分共价闭合环状双链DNA,基因组长度在3182-3221个核苷酸,含有4个部分重叠的开放读码框:前S/S区、前C/C区、P区和X区。根据HBV全基因序列异质性≥8%的界线,可将其分为A—I九种不同的基因型。S区基因序列可分为前S1区、前S2区和S区,各有起始密码子ATG,编码大、中、小3种包膜蛋白。研究表明,S基因的序列相对其他序列异质性最小,更加保守;从而也可以根据S区基因序列异质性≥4%的标准区分不同的基因型。我国90%以上的慢性乙型病毒性肝炎感染者的HBV基因型为B基因型或C基因型。

S区基因作为HBV感染抗体检测的原料、抗原检测的质控品、治疗性抗体亲和力检测等具有重要的功能,因此HBV的前S蛋白在HBV诊断和治疗药物开发中具有重要的研究和应用价值。现阶段市场上,针对HBV前S蛋白的抗原为HBV B基因型和C基因型分别表达的两个蛋白且主要为原核表达,而国内开发诊断性试剂盒和治疗性生物药均需要针对B基因型和C基因型,因此在试剂盒开发和药物标准品选择方面,需要同时将两个单独的抗原混合使用,进而开发检测试剂盒、筛选药物等。导致检测试剂盒配制麻烦,且分别生产两个抗原的成本也较高,这样既增加了工作量,也提高相关检测的成本。此外,原核表达的抗原蛋白,由于缺乏部分修饰,较难作为标准品进行药物的定量。例如CN106282234B公开了一种携带人C基因型乙型肝炎病毒的表面抗原S基因的重组腺相关病毒载体及其构建方法与应用,是将人C基因型乙型肝炎病毒的表面抗原基因(HBV CS基因)插入已经剔除结构基因并带有启动子的腺相关病毒载体中获得的。该重组腺相关病毒载体可将其携带的HBV CS基因输送入单核细胞树突状细胞系中,被用于刺激免疫系统的效应细胞,从而杀灭被HBV C病毒感染的细胞,可被用于制备抗HBV C病毒感染的药物。但在此专利中,仅能表达单一HBV抗原,无法满足同时表达HBVB、C基因前S1抗原的需求。

由于HBVB基因型S抗原和HBVC基因型S抗原在开发HBV诊断抗原试剂盒质控品和同时针对B、C基因型HBV感染治疗性抗体等方面具有较大的用途,因此,有必要研发一种能同时表达HBVB、C基因前S1抗原的方法或系统。

发明内容

针对现有技术存在的不足,本发明要解决的技术问题是利用重叠延伸PCR技术(genesplicingbyoverlapextension PCR,overlapPCR)构建了HBV前S1抗原B、C基因型抗原串联表达的pcDNA3.1(-)质粒。该串联重组质粒可以在HEK293细胞中同时重组表达HBV B基因型前S1抗原和HBV C基因型前S1抗原,本发明可为开发诊断HBV抗原试剂盒和HBV治疗性抗体筛选试剂盒的研发提供重要的基础。

为解决上述技术问题,本发明提供以下技术方案:

一方面,本发明提供一种乙型肝炎病毒B、C基因型前S1区基因串联重组质粒,是根据人乙型肝炎病毒B基因型的前S1抗原基因和C基因型的前S1抗原基因的核苷酸序列,分别设计HBV B基因型抗原扩增引物、HBV C基因型抗原扩增引物和Overlap引物,并在HBV B基因型抗原扩增引物中插入信号肽、linker连接肽和StrepII-tag,在HBV C基因型抗原扩增引物中插入linker连接肽和6×Histag,在Overlap引物中插入限制性内切酶酶切位点;通过PCR分别扩增出HBV B、C基因型的前S1抗原序列,采用Overlap PCR将两段序列串联合成最佳表达核苷酸序列,如SEQ ID NO:7所示;以pcDNA3.1(-)质粒为载体,在pcDNA3.1(-)的限制性酶切位点NheI和NotI之间插入最佳表达核苷酸序列,构建乙型肝炎病毒B、C基因型前S1区基因串联重组质粒。

其中,所述的信号肽的氨基酸序列为MKWVTFISLLFLFSSAYSKA;所述的linker连接肽的氨基酸序列为GGGGSGGGGSGGGGS。

本发明所述的HBV B、C基因型的前S1抗原序列中含有两个纯化标签strep-II和His,双标签可在两个抗原的N端和C端随机组合,能够实现两次柱纯化提高抗原纯度(优选地,StrepII-tag放在HBV B基因型前S1抗原的C末端,6×Histag放在HBV C基因型前S1抗原的C末端);两个抗原之间具有连接氨基酸序列3X(GGGGS)保证抗原表达时的正确折叠。

优选地,所述的HBV B基因型抗原扩增引物的核苷酸序列如SEQ ID NO:1-2所示,所述的HBV C基因型抗原扩增引物的核苷酸序列如SEQ ID NO:3-4所示,所述的Overlap引物的核苷酸序列如SEQ ID NO:5-6所示。

优选地,所述的重组质粒的转染范围包括但不限于真核细胞系HEK293F。

另一方面,本发明提供了上述乙型肝炎病毒B、C基因型前S1区基因串联重组质粒的构建方法,包括如下步骤:

S1.根据人HBV B基因型前S1抗原基因、人HBV C基因型前S1抗原基因的核苷酸序列,分别设计HBV B基因型抗原扩增引物、HBV C基因型抗原扩增引物和Overlap引物,优化信号肽及linker连接肽序列;

S2.以HBV B、C基因型的基因组为模板,采用HBV B基因型抗原扩增引物、HBV C基因型抗原扩增引物分别进行PCR扩增,得到目的片段并回收;

S3.通过Overlap PCR串联目的片段,采用Overlap引物进行扩增得到最佳表达核苷酸序列,如SEQ ID NO:7所示;

S4.将Overlap PCR纯化产物和pcDNA3.1(-)载体分别利用NheI和NotI进行酶切,回收酶切片段并采用T4连接酶进行连接;将连接产物经转化,筛选阳性克隆并测序鉴定,得到乙型肝炎病毒B、C基因型前S1区基因串联重组质粒。

优选地,所述人HBV B基因型前S1抗原基因的PCR扩增体系包括:2×高保真PCR酶25μL,HBV B基因型抗原扩增引物各2μL,模板DNA 2μL,ddH

优选地,所述人HBV C基因型前S1抗原基因的PCR扩增体系包括:2×高保真PCR酶25μL,HBV C基因型抗原扩增引物各2μL,模板DNA 2μL,ddH

优选地,所述Overlap PCR的反应体系包括:2×高保真PCR酶25μL,Overlap引物各2μL,模板B基因型片段2μL,模板C基因型片段2μL,ddH

优选地,所述Overlap PCR产物的酶切反应体系包括:10×buffer 5μL,NheI1μL,NotI 1μL,Overlap PCR纯化产物20μL,ddH

优选地,所述连接的反应体系包括:5×Ligase Buffer 2μL,pcDNA3.1(-)载体回收酶切片段1.1μL,Overlap PCR纯化产物回收酶切片段1.5μL,T4 Ligase 1μL,ddH

又一方面,本发明还提供了上述的乙型肝炎病毒B、C基因型前S1区基因串联重组质粒在制备HBV前S1抗原检测试剂盒、制剂和/或标准品中的应用。

相对于现有技术,本发明具有以下有益效果:

(1)本发明将HBV B基因型前S1基因序列和HBV C基因型前S1基因序列串联到同一个表达载体中,将该质粒导入到HEK293F细胞中,可在细胞上清中获得分泌表达的B基因型前S1抗原和C基因型前S1抗原串联表达的蛋白。

(2)本发明的重组载体在构建时,设计了含有在天然HSA蛋白的信号肽基础上进行人工改造的信号肽(MKWVTFISLL FLFSSAYSKA),使蛋白能够分泌型高表达,可以利用细胞上清液进行蛋白的纯化;同时设计了双纯化标签,在HBVB基因型前S1抗原C端连接了Strep-IItagWSHPQFEK,在HBVC基因型前S抗原C端连接了6×Histag,为了保持两个抗原的正确折叠,两个抗原之间用3X(GGGGS)连接。

(3)HBV B基因型前S1抗原和C基因型前S1抗原串联表达的蛋白可以同时结合针对前S1区HBV B基因型和HBV C基因型的抗体,能够高效完成针对HBV B基因型、C基因型抗体的筛选,为同时针对HBV B基因型和C基因型诊断、治疗型抗体的筛选奠定了基础。

(4)现在市面上针对HBV前S1抗原检测的试剂盒,多采用HBV感染者的灭活血浆、血清,但由于灭活的HBV感染者血浆、血清仍存在潜在的传染性具有一定风险,而且HBV感染的血浆、血清获得困难,难以标准化,本发明表达的抗原可以应用到现有试剂盒中,替换掉高风险的血浆、血清质控品,而且有利于试剂盒的标准化,同时将大大降低试剂盒的制备成本。

(5)HBV前S区的S1蛋白作为病毒与肝细胞受体相互作用的区域,基于前S区蛋白的治疗性生物类似药物也受到了重视,本发明表达的全长HBV B基因型和C基因型前S1蛋白串联表达抗原,可以作为基于前S区生物类似药的标准品,对前S区片段进行定量。

附图说明

图1为HBV B、C基因型串联前S1抗原质粒构建技术路线。

图2为不同组别质粒表达活性的ELISA检测结果。

图3为B基因型和C基因型HBV前S1基因电泳条带。

图4为B基因型和C基因型Overlap串联片段。

图5为载体与Overlap PCR纯化产物酶切结果。

图6为pcDNA3.1-双标签B+C基因型前S质粒图谱。

图7为纯化后HBVB+C基因型前S1蛋白SDS-PAGE鉴定结果。

具体实施方式

下面结合具体实施例,对本发明作进一步详细的阐述,下述实施例不用于限制本发明,仅用于说明本发明。以下实施例中所使用的实验方法如无特殊说明,实施例中未注明具体条件的实验方法,通常按照常规条件,下述实施例中所使用的材料、试剂等,如无特殊说明,均可从商业途径得到。

1、载体及试剂

表达载体pcDNA3.1(-),购自优宝生物公司。

克隆和表达宿主菌DH5α感受态细胞(货号:TSV-A07),购自擎科生物北京生物技术有限公司。

2×高保真PCR酶(货号:10136ES08),购自翊胜生物。

NheI(货号:FD0973)和NotI(货号:FD0594),购自Thermo。

T4 DNA连接酶(货号:M0202S),购自NEB。

病毒基因组DNA/RNA提取试剂盒(货号:DP315)购自天根生物。

2、主要仪器

ETC811型PCR仪(苏州东胜兴业科学仪器有限公司)、高速离心机(湘仪实验室仪器开发有限公司)、ZHWY-103D恒温培养振荡器(智城分析仪器制造有限公司)、DYY16D电泳仪(北京六一生物技术有限公司)、Bio-Rad凝胶成像分析系统(美国Bio-rad公司)。实施例1相关序列的设计及优化

1、本发明质粒构建的基本技术路线,如图1所示。

2、实施本发明技术路线的第一步,进行相关序列设计组合获取相应的核酸序列。

为获得能够在HEK293细胞中进行分泌型表达的质粒载体,首先选择人血清白蛋白(HSA)的信号肽MKWVTFISLLFLFSSAYS,作为构建抗原序列的信号肽,后续进行优化;为了实现双纯化标签获得用于标准品的制备的高纯度抗原,分别在HBV B基因型前S抗原C端连接了Strep-II tag多肽WSHPQFEK,优化后核酸序列为TGGAGCCATCCTCAGTTCGAAAAA,在HBV C基因型前S抗原C端连接了6XHis tag氨基酸序列HHHHHH,优化后核酸序列为catcatcaccatcaccat;为了保持两个抗原的正确折叠,两个抗原之间用3X(GGGGS)氨基酸序列连接,优化后核酸序列为ggtggaggcggatctggaggtggcggtagcggaggaggaggttca;HBV B基因型和C基因型核酸序列扩增引物设计分别参照已经发表的Genebank序列库中核酸序列,B基因型病毒序列参考AB819611.1,C基因型病毒序列参考AB298720.1。

为了提高HBV前S抗原蛋白的表达量和活性,本发明尝试优化了不同信号肽和两个抗原之间的连接的linker序列。

(1)信号肽的优化选择

表1不同信号肽的氨基酸序列及其对应的核苷酸序列

(2)B基因型和C基因型前S蛋白之间Linker优化

表2不同Linker的氨基酸序列及其对应的核苷酸序列

3、引物设计与合成

(1)HBV B基因型抗原扩增引物

表3含信号肽HBV B基因型正向引物

表4含linker及StrepII-tag的HBV B基因型反向引物

(2)HBV C基因型抗原扩增引物

表5 HBV C基因型正向引物

HBV C-R(6XHis-HBV C基因型反向引物):

(3)Overlap引物设计

由于B基因型和C基因型HBV的起始的N端和C末端的核酸序列相似度较高,当直接用HBV B-F和HBV C-R引物进行扩增时总是非特异性的获得单独B基因型和C基因型的HBV核酸片段,因此本发明选择添加末端的标签重新设计引物进行全序列的扩增。Overlap正向引物核苷酸序列如下。

表6 Overlap正向引物

Overlap-R:

将上述设计好的引物,送擎科生物合成。

4、HBV B基因型和C基因型DNA提取

从HBV B基因型和C基因型感染者的血清中,分别利用天根生物病毒基因组DNA/RNA提取试剂盒(货号:DP315)提取HBV病毒基因组,-20℃保存备用。

5、PCR进行扩增及Overlap序列连接

(1)利用翊胜生物的2×高保真PCR酶使用说明书,以B基因型HBV基因组和C基因型HBV基因组,分别利用HBV B-F/R引物和HBV C-F/R引物扩增获得B基因型和C基因型HBV的前S核酸序列,进行电泳,回收相应的片段。

(2)将电泳回收的B基因型和C基因型HBV前S核酸序列按照高保真酶使用说明书以50μL体系,各加入10ngB基因型和C基因型HBV前S核酸PCR片段作为模板,利用Overlap-F/R引物对进行序列扩增,获得Overlap连接的全长片段。

(3)PCR完毕后对产物片段进行电泳回收。

6、双酶切质粒与PCR片段、T4连接

将回收的Overlap PCR产物和pcDNA3.1(-)载体利用Thermo的NheI和NotI进行酶切,酶切后电泳检测进行目的条带的回收;按照NEBT4连接酶说明进行回收片段的连接。

7、连接产物转化扩增及测序鉴定

将连接产物进行转化感受态DH5α,涂布Amp抗性的LB平板,进行菌落PCR鉴定后,对阳性克隆进行LB摇菌扩增,质粒提取测序鉴定,确保连接的序列片段正确。

8、将获得的阳性质粒转染HEK293F细胞,利用北京金豪制药股份有限公司的乙型肝炎病毒前S抗原检测试剂盒对细胞上清中的B基因型和C基因型前S蛋白的表达量和活性进行综合筛选,确定信号肽与linker序列的最佳组合。不同信号肽序列和Linker组合的构建的质粒组别编号如下表7。

表7不同信号肽序列和Linker组合的构建的质粒组别编号

试验时,准备100mL细胞密度为1×10

试验结果:各组别的OD值测定如图2所示,G16的OD值最高(1.76)。因此,经改造后的HSA KA和3X(GGGGS)linker综合表达量和活性最佳,后续使用G16质粒进行蛋白表达。

9、ELISA结果显示,最佳的ELISA活性组合为:信号肽HSA改造添加KA,使用3X(GGGGS)的质粒组合,将验证最佳信号肽和linker组合的质粒,用HEK293F细胞悬浮表达,利用Ni柱和Strep-Tactin琼脂糖凝胶亲和层析柱进行纯化,SDS-PAGE鉴定蛋白表达。

实施例2乙型肝炎病毒B、C基因型S区基因串联重组质粒的构建

1、引物设计与合成

根据实施例1的优化结果,按照图1的技术路线,设计合成如下6条引物。

(1)HBV B基因型抗原扩增引物

HBV B-F(信号肽+HBV B基因型正向引物,SEQ ID NO:1):

HBV B-R(GGGGS linker+HBV B基因型反向引物,SEQ ID NO:2):

(2)HBV C基因型抗原扩增引物

HBV C-F(linker+HBV C基因型正向引物,SEQ ID NO:3):

HBV C-R(6×His-HBV C基因型反向引物,SEQ ID NO:4):

(3)Overlap引物设计

由于B基因型和C基因型HBV的起始的N端和C末端的核酸序列相似度较高,当直接用HBV B-F和HBV C-R引物进行扩增时总是非特异性的获得单独B基因型和C基因型的HBV核酸片段,因此本发明选择添加末端的标签重新设计引物进行全序列的扩增。序列引物如下。

Overlap-F(SEQ ID NO:5):

Overlap-R(SEQ ID NO:6):

将上述设计好的6条引物,送擎科生物合成。

2、B基因型和C基因型HBV核酸的提取

取经过基因分型试剂盒鉴定为HBV B基因型和C基因型的病毒感染者血清,利用天根生物的病毒核酸提取试剂盒,按照试剂盒的说明书,提取获得HBV B基因型和C基因型的基因组,利用Nandrop300进行OD

3、PCR进行扩增及Overlap序列全长连接

(1)利用翊胜生物的高保真酶使用说明书(2×高保真PCR酶,货号:10136ES08),分别按照如下体系进行B基因型HBV基因组和C基因型HBV前S抗原序列扩增,PCR体系如下表8,每个设置4管进行扩增。

表8 PCR反应体系

扩增时,按照如下程序进行:98℃,2min;98℃,10s,58℃ 20s,72℃ 60s,35cycle,72℃,5min。

(2)将扩增后的PCR片段加入6×Loading buffer后,配制1%的琼脂糖凝胶,进行电泳检测,PCR产物长度约为1200bp,电泳时选择500bp ladder作为分子marker,电泳结果如图3所示。对电泳后的片段进行回收,测定回收产物浓度,调节浓度至5μg/mL。

(3)Overlap PCR进行B基因型和C基因型序列串联,以10ng回收的B基因型和C基因型HBV前S序列混合作为模板,进行序列Overlap扩增,扩增3管,PCR扩增体系如下表9。

表9 PCR反应体系

扩增时,按照如下程序进行:98℃,2min;98℃,10s,58℃ 20s,72℃ 120s,35cycle,72℃,5min。

(4)将扩增后的PCR片段加入6×Loading buffer后,配制1%的琼脂糖凝胶,进行电泳检测,PCR产物长度约为2500bp,电泳时选择500bp ladder作为分子marker,电泳结果如图4,对电泳后的片段进行回收,测定回收产物浓度,并调节产物浓度值100μg/mL。

4、双酶切质粒与PCR片段、T4连接

(1)将回收的Overlap PCR纯化产物和pcDNA3.1(-)载体利用Thermo的NheI和NotI进行酶切,酶切体系如下表10。

表10酶切体系

酶切时,37℃孵育2h。

(2)酶切后进行,将酶切产物进行电泳分离,PCR产物长度约为2500bp,载体酶切片段约5500bp电泳时选择500bp ladder作为分子marker,电泳结果如图5,对电泳后的片段进行回收,并调节产物浓度值100μg/mL。

(3)T4连接酶连接

按照NEBT4连接酶说明,进行回收片段的连接,添加载体和片段的量按照公式【最适载体使用量=[0.02×载体碱基对数]ng(0.03pmol);最适插入片段使用量=[0.06×插入片段碱基对数]ng(0.09pmol)】计算,载体用110ng,插入片段用150ng,连接体系如下表11,16℃过夜。

表11连接体系

5、连接产物转化扩增

将连接产物进行转化感受态DH5α,涂布Amp抗性的LB平板,并选取其中的10个进行菌落PCR鉴定获得阳性克隆9个。

6、阳性菌落LB扩增质粒提取及测序鉴定

选取4个阳性克隆进行,摇菌扩增,提取质粒送擎科生物进行使用CMV启动子和BGH通用引物两端测序直至全序列测通,进行序列比对确保连入的核酸序列正确,连接成功后的质粒图谱,如图6。

7、串联表位蛋白表达及鉴定

(1)质粒转染与表达

对HEK293F细胞进行传代,准备100mLHEK293F细胞,到细胞密度生长到1×10

(2)蛋白纯化与鉴定

将收取的100mL上清液,分别用Ni柱和Strep·Tactin纯化树脂对蛋白进行两步纯化,获得纯度较高的蛋白,并进行Nandrop300的OD

本发明构建的重组质粒中插入的最佳表达核苷酸序列如SEQ ID NO:7所示:

atgaagtgggtaacctttatttcccttctttttctctttagctcggcttattccaaggctatggggacaaatctttctgtccccaatcccctgggattcttccccgatcatcagttggaccctgcattcaaagccaactcagaaaatccagattgggacctcaaccctcacaaggacaactggccggacgcccacaaggtgggagtgggagcattcgggccagggttcacccctccccatgggggactgttggggtggagccctcaggctcagggcatactcacatctgtgccagcagctcctcctcctgcctccaccaatcggcagtcaggaaggcagcctactcccctatctccacctctaagggacactcatcctcaggccatgcagtggaactcaaccactttccaccaaactcttcaagatcccagagtcagggctctgtactttcctgctggtggctccagttcaggaacagtaagccctgctcagaatactgtctctgccatatcgtcaatcttatcgaagactggggaccctgtgccgaacatggagaacatcgcatcaggactcctaggacccctgctcgtgttacaggcggggtttttctcgttgacaaaaatcctcacaataccacagagtctagactcgtggtggacttctctcaattttctaggggaaaaacccgtgtgtcttggccaaaattcgcagtcccaaatctccagtcactcaccaacctgttgtcctccaatttgtcctggttatcgctggatgtgtctgcggcgttttatcatcttcctctgcatcctgctgctatgcctcatcttcttgttggttcttctggactatcaaggtatgttgcccgtttgtcctctaattccaggatcatcaaccaccagcacgggaccctgcaagacctgcacaactcctgctcaaggaacctctatgtttccctcatgttgctgtacaaaacctacggacggaaactgcacttgtattcccatcccatcatcttgggctttcgcaaaatacctatgggagtgggcctcagtccgtttctcttggctcagtttactagtgccatttgttcagtggttcgtagggctttcccccactgtctggctttcagttatatggatgatgtggtattgggggccaagtctgtacaacatcttgagtccctttatgccgctgttaccaattttcttttgtctttgggtatacatttggagccatcctcagttcgaaaaaggtggaggcggatctggaggtggcggtagcggaggaggaggttcaatgggaggttggtcttccaaacctcgacaaggcatggggacgaatctttctgttcccaatcctctgggattctttcccgatcaccagttggaccctgcattcggagccaactcaaacaatccagattgggacttcaaccccaacaaggatcactggccagaggcaaatcaggtaggagcgggagcattcgggccagggttcacccctccacacggcggtcttttggggtggagccctcaggctcagggcacattgacaacagtgccagcagcgcctcctcctgcctccaccaatcggcagtcaggaagacggcctactcccatctctccacctctaagagacagtcatcctcaggccatgcagtggaactccacaacattccaccaagctctgctagatcccagagtgaaaggcctatattttcctgctggtggctccagttccggaacagtaaaccctgttccgactactgcctcacccatatcgtcaatcttctcgaggactggggaccctgcaccgaacatggagaacaccacatcaggattcctaggacccctgctcgtgttacaggcggggtttttcttgttgacaagaatcctcacaataccacagagtctagactcgtggtggacttctctcaattttctagggggagcacccacgtgtcctggccaaaattcgcagtccccaacctccaatcactcaccaacctcttgtcctccaatttgtcctggctatcgctggatgtgtctgcggcgttttatcatattcctcttcatcctgctgctatgcctcatcttcttgttggttcttctggactaccaaggtatgttgcccgtttgtcctctacttccaggaacatcaaccaccagtacgggaccatgcaagacctgcacgattcctgctcaaggaacctctatgtttccctcttgttgctgtacaaaaccttcggacggaaactgcacttgtattcccatcccatcatcctgggctttcgcaagattcctatgggagtgggcctcagtccgtttctcctggctcagtttactagtgccatttgttcagtggttcgtagggctttcccccactgtttggctttcagttatatggatgatgtggtattgggggccaagtctgtacaacatcttgagtccctttttaccgctgttaccaattttcttttgtctttgggtatacattcatcatcaccatcaccat。

所对应的含信号肽的蛋白质氨基酸序列如SEQ ID NO:8所示:

MKWVTFISLLFLFSSAYSKAMGTNLSVPNPLGFFPDHQLDPAFKANSENPDWDLNPHKDNWPDAHKVGVGAFGPGFTPPHGGLLGWSPQAQGILTSVPAAPPPASTNRQSGRQPTPLSPPLRDTHPQAMQWNSTTFHQTLQDPRVRALYFPAGGSSSGTVSPAQNTVSAISSILSKTGDPVPNMENIASGLLGPLLVLQAGFFSLTKILTIPQSLDSWWTSLNFLGEKPVCLGQNSQSQISSHSPTCCPPICPGYRWMCLRRFIIFLCILLLCLIFLLVLLDYQGMLPVCPLIPGSSTTSTGPCKTCTTPAQGTSMFPSCCCTKPTDGNCTCIPIPSSWAFAKYLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFMPLLPIFFCLWVYIWSHPQFEKGGGGSGGGGSGGGGSMGGWSSKPRQGMGTNLSVPNPLGFFPDHQLDPAFGANSNNPDWDFNPNKDHWPEANQVGAGAFGPGFTPPHGGLLGWSPQAQGTLTTVPAAPPPASTNRQSGRRPTPISPPLRDSHPQAMQWNSTTFHQALLDPRVKGLYFPAGGSSSGTVNPVPTTASPISSIFSRTGDPAPNMENTTSGFLGPLLVLQAGFFLLTRILTIPQSLDSWWTSLNFLGGAPTCPGQNSQSPTSNHSPTSCPPICPGYRWMCLRRFIIFLFILLLCLIFLLVLLDYQGMLPVCPLLPGTSTTSTGPCKTCTIPAQGTSMFPSCCCTKPSDGNCTCIPIPSSWAFARFLWEWASVRFSWLSLLVPFVQWFVGLSPTVWLSVIWMMWYWGPSLYNILSPFLPLLPIFFCLWVYIHHHHHH。

最后应当说明的是,以上内容仅用以说明本发明的技术方案,而非对本发明保护范围的限制,本领域的普通技术人员对本发明的技术方案进行的简单修改或者等同替换,均不脱离本发明技术方案的实质和范围。

序列表

<110> 北京安必奇生物科技有限公司

<120> 乙型肝炎病毒B、C基因型前S1区基因串联重组质粒及其构建方法和应用

<160> 8

<170> SIPOSequenceListing 1.0

<210> 1

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaaggct 60

atggggacaa atctttctgt 80

<210> 2

<211> 89

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tgaacctcct cctccgctac cgccacctcc agatccgcct ccaccttttt cgaactgagg 60

atggctccaa atgtataccc aaagacaaa 89

<210> 3

<211> 40

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gtagcggagg aggaggttca atgggaggtt ggtcttccaa 40

<210> 4

<211> 38

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggtgatgg tgatgatgaa tgtataccca aagacaaa 38

<210> 5

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ctagctagca tgaagtgggt aacctttat 29

<210> 6

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atttgcggcc gcatggtgat ggtgatgatg 30

<210> 7

<211> 2514

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaaggct 60

atggggacaa atctttctgt ccccaatccc ctgggattct tccccgatca tcagttggac 120

cctgcattca aagccaactc agaaaatcca gattgggacc tcaaccctca caaggacaac 180

tggccggacg cccacaaggt gggagtggga gcattcgggc cagggttcac ccctccccat 240

gggggactgt tggggtggag ccctcaggct cagggcatac tcacatctgt gccagcagct 300

cctcctcctg cctccaccaa tcggcagtca ggaaggcagc ctactcccct atctccacct 360

ctaagggaca ctcatcctca ggccatgcag tggaactcaa ccactttcca ccaaactctt 420

caagatccca gagtcagggc tctgtacttt cctgctggtg gctccagttc aggaacagta 480

agccctgctc agaatactgt ctctgccata tcgtcaatct tatcgaagac tggggaccct 540

gtgccgaaca tggagaacat cgcatcagga ctcctaggac ccctgctcgt gttacaggcg 600

gggtttttct cgttgacaaa aatcctcaca ataccacaga gtctagactc gtggtggact 660

tctctcaatt ttctagggga aaaacccgtg tgtcttggcc aaaattcgca gtcccaaatc 720

tccagtcact caccaacctg ttgtcctcca atttgtcctg gttatcgctg gatgtgtctg 780

cggcgtttta tcatcttcct ctgcatcctg ctgctatgcc tcatcttctt gttggttctt 840

ctggactatc aaggtatgtt gcccgtttgt cctctaattc caggatcatc aaccaccagc 900

acgggaccct gcaagacctg cacaactcct gctcaaggaa cctctatgtt tccctcatgt 960

tgctgtacaa aacctacgga cggaaactgc acttgtattc ccatcccatc atcttgggct 1020

ttcgcaaaat acctatggga gtgggcctca gtccgtttct cttggctcag tttactagtg 1080

ccatttgttc agtggttcgt agggctttcc cccactgtct ggctttcagt tatatggatg 1140

atgtggtatt gggggccaag tctgtacaac atcttgagtc cctttatgcc gctgttacca 1200

attttctttt gtctttgggt atacatttgg agccatcctc agttcgaaaa aggtggaggc 1260

ggatctggag gtggcggtag cggaggagga ggttcaatgg gaggttggtc ttccaaacct 1320

cgacaaggca tggggacgaa tctttctgtt cccaatcctc tgggattctt tcccgatcac 1380

cagttggacc ctgcattcgg agccaactca aacaatccag attgggactt caaccccaac 1440

aaggatcact ggccagaggc aaatcaggta ggagcgggag cattcgggcc agggttcacc 1500

cctccacacg gcggtctttt ggggtggagc cctcaggctc agggcacatt gacaacagtg 1560

ccagcagcgc ctcctcctgc ctccaccaat cggcagtcag gaagacggcc tactcccatc 1620

tctccacctc taagagacag tcatcctcag gccatgcagt ggaactccac aacattccac 1680

caagctctgc tagatcccag agtgaaaggc ctatattttc ctgctggtgg ctccagttcc 1740

ggaacagtaa accctgttcc gactactgcc tcacccatat cgtcaatctt ctcgaggact 1800

ggggaccctg caccgaacat ggagaacacc acatcaggat tcctaggacc cctgctcgtg 1860

ttacaggcgg ggtttttctt gttgacaaga atcctcacaa taccacagag tctagactcg 1920

tggtggactt ctctcaattt tctaggggga gcacccacgt gtcctggcca aaattcgcag 1980

tccccaacct ccaatcactc accaacctct tgtcctccaa tttgtcctgg ctatcgctgg 2040

atgtgtctgc ggcgttttat catattcctc ttcatcctgc tgctatgcct catcttcttg 2100

ttggttcttc tggactacca aggtatgttg cccgtttgtc ctctacttcc aggaacatca 2160

accaccagta cgggaccatg caagacctgc acgattcctg ctcaaggaac ctctatgttt 2220

ccctcttgtt gctgtacaaa accttcggac ggaaactgca cttgtattcc catcccatca 2280

tcctgggctt tcgcaagatt cctatgggag tgggcctcag tccgtttctc ctggctcagt 2340

ttactagtgc catttgttca gtggttcgta gggctttccc ccactgtttg gctttcagtt 2400

atatggatga tgtggtattg ggggccaagt ctgtacaaca tcttgagtcc ctttttaccg 2460

ctgttaccaa ttttcttttg tctttgggta tacattcatc atcaccatca ccat 2514

<210> 8

<211> 838

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala

1 5 10 15

Tyr Ser Lys Ala Met Gly Thr Asn Leu Ser Val Pro Asn Pro Leu Gly

20 25 30

Phe Phe Pro Asp His Gln Leu Asp Pro Ala Phe Lys Ala Asn Ser Glu

35 40 45

Asn Pro Asp Trp Asp Leu Asn Pro His Lys Asp Asn Trp Pro Asp Ala

50 55 60

His Lys Val Gly Val Gly Ala Phe Gly Pro Gly Phe Thr Pro Pro His

65 70 75 80

Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala Gln Gly Ile Leu Thr Ser

85 90 95

Val Pro Ala Ala Pro Pro Pro Ala Ser Thr Asn Arg Gln Ser Gly Arg

100 105 110

Gln Pro Thr Pro Leu Ser Pro Pro Leu Arg Asp Thr His Pro Gln Ala

115 120 125

Met Gln Trp Asn Ser Thr Thr Phe His Gln Thr Leu Gln Asp Pro Arg

130 135 140

Val Arg Ala Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val

145 150 155 160

Ser Pro Ala Gln Asn Thr Val Ser Ala Ile Ser Ser Ile Leu Ser Lys

165 170 175

Thr Gly Asp Pro Val Pro Asn Met Glu Asn Ile Ala Ser Gly Leu Leu

180 185 190

Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Ser Leu Thr Lys Ile

195 200 205

Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe

210 215 220

Leu Gly Glu Lys Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Gln Ile

225 230 235 240

Ser Ser His Ser Pro Thr Cys Cys Pro Pro Ile Cys Pro Gly Tyr Arg

245 250 255

Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Cys Ile Leu Leu Leu

260 265 270

Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro

275 280 285

Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys

290 295 300

Lys Thr Cys Thr Thr Pro Ala Gln Gly Thr Ser Met Phe Pro Ser Cys

305 310 315 320

Cys Cys Thr Lys Pro Thr Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro

325 330 335

Ser Ser Trp Ala Phe Ala Lys Tyr Leu Trp Glu Trp Ala Ser Val Arg

340 345 350

Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Val Gly

355 360 365

Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp

370 375 380

Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Met Pro Leu Leu Pro

385 390 395 400

Ile Phe Phe Cys Leu Trp Val Tyr Ile Trp Ser His Pro Gln Phe Glu

405 410 415

Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

420 425 430

Met Gly Gly Trp Ser Ser Lys Pro Arg Gln Gly Met Gly Thr Asn Leu

435 440 445

Ser Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro

450 455 460

Ala Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn

465 470 475 480

Lys Asp His Trp Pro Glu Ala Asn Gln Val Gly Ala Gly Ala Phe Gly

485 490 495

Pro Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln

500 505 510

Ala Gln Gly Thr Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser

515 520 525

Thr Asn Arg Gln Ser Gly Arg Arg Pro Thr Pro Ile Ser Pro Pro Leu

530 535 540

Arg Asp Ser His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His

545 550 555 560

Gln Ala Leu Leu Asp Pro Arg Val Lys Gly Leu Tyr Phe Pro Ala Gly

565 570 575

Gly Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro

580 585 590

Ile Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu

595 600 605

Asn Thr Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly

610 615 620

Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser

625 630 635 640

Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ala Pro Thr Cys Pro Gly

645 650 655

Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro

660 665 670

Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile

675 680 685

Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu

690 695 700

Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Leu Pro Gly Thr Ser

705 710 715 720

Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Ile Pro Ala Gln Gly

725 730 735

Thr Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn

740 745 750

Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Arg Phe Leu

755 760 765

Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro

770 775 780

Phe Val Gln Trp Phe Val Gly Leu Ser Pro Thr Val Trp Leu Ser Val

785 790 795 800

Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser

805 810 815

Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val Tyr Ile

820 825 830

His His His His His His

835

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号