首页> 中国专利> 新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用

新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用

摘要

本发明公开了新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用。本发明提供了来自于新疆紫草的糖基转移酶,为SEQ ID No.6所示AeUGT_01、SEQ ID No.7所示AeUGT_02、SEQ ID No.8所示AeUGT_03、SEQ ID No.9所示AeUGT_04或SEQ ID No.10所示AeUGT_05。酶促反应发现AeUGT_01、02和05可在体外催化咖啡酸形成一种单糖基化产物;AeUGT_01、02、03、04及05可催化迷迭香酸生成至少一种单糖基化产物,其中AeUGT_01还可催化生成双糖基化产物。本发明对于生产咖啡酸及迷迭香酸糖基化产物具有重要理论及实际意义。

著录项

  • 公开/公告号CN114058602A

    专利类型发明专利

  • 公开/公告日2022-02-18

    原文格式PDF

  • 申请/专利权人 中国中医科学院中药研究所;

    申请/专利号CN202010764505.0

  • 申请日2020-07-30

  • 分类号C12N9/10(2006.01);C12N15/54(2006.01);C12N15/70(2006.01);C12N1/21(2006.01);C12P19/18(2006.01);C12P19/44(2006.01);C12R1/19(2006.01);

  • 代理机构北京纪凯知识产权代理有限公司 11245;

  • 代理人张立娜

  • 地址 100700 北京市东城区东直门内南小街16号

  • 入库时间 2023-06-19 15:49:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-22

    授权

    发明专利权授予

  • 2022-03-08

    实质审查的生效 IPC(主分类):C12N 9/10 专利申请号:2020107645050 申请日:20200730

    实质审查的生效

说明书

技术领域

本发明涉及药用植物基因工程领域,具体涉及新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用。

背景技术

传统中药材紫草味甘、咸,性寒,归心、肝经,《本草纲目》曰:紫草“治斑疹、痘毒,活血凉血、利大肠”。新疆紫草[Arnebia euchroma(Royle)Johnst.]有效成分含量高,临床疗效好,是紫草的道地药材。咖啡酸及其衍生物是新疆紫草的主要水溶性有效成分。咖啡酸(caffeic acid)是植物中广泛存在的一种重要次级代谢产物。该化合物不仅是苯丙素(phenylpropanoids)类化合物代谢过程的重要中间体,还是木质素生物合成的前体,在植物生命活动中发挥重要功能。此外,该化合物还是一种抗氧化剂并具有作为抗自由基保护剂应用的潜力。紫草中,迷迭香酸(rosmarinic acid)是主要的咖啡酸衍生物之一,具有抗菌、抗炎和抗病毒等多种生物学活性。

尽管咖啡酸具有多种生物学活性,但常温条件下水溶性较差,仅溶于热水或乙醇,限制了该化合物的应用。酚羟基糖基化修饰可以在不影响咖啡酸生物学活性的前提下提高产物水溶性,并提高咖啡酸的稳定性,是解决上述问题的可行手段(NISHIMURA T,KOMETANIT,TAKII H,et al.Glucosylation of caffeic acid with Bacillus subtilis X-23α-amylase and a description of the glucosides[J].J Biosci Bioeng,1995,80(1):18.)。对于迷迭香酸,4,4′-OH双糖基化修饰可以提高其超氧阴离子清除活性(SATAKE T,KAMIYA K,SAIKI Y,et al.Studies on the constituents of fruits of Helicteresisora L.[J].Chem Pharm Bull,1999,47(10):1444.),因此其酚羟基糖基化同样具有潜在应用价值。

发明内容

本发明的目的是提供新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用。

第一方面,本发明要求保护一种蛋白质或成套蛋白质。

本发明所要求保护的蛋白质或成套蛋白质来源于新疆紫草[Arnebia euchroma(Royle)Johnst.]。

所述蛋白质为蛋白AeUGT_01、蛋白AeUGT_02、蛋白AeUGT_03、蛋白AeUGT_04或蛋白AeUGT_05。

所述成套蛋白质由所述蛋白AeUGT_01、所述蛋白AeUGT_02、所述蛋白AeUGT_03、所述蛋白AeUGT_04和所述蛋白AeUGT_05中的全部或任意四项或任意三项或任意两项组成。

所述蛋白AeUGT_01可为如下(A1)-(A4)中任一:

(A1)氨基酸序列如SEQ ID No.6所示的蛋白质;

(A2)将(A1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

(A3)与(A1)或(A2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;

(A4)在(A1)-(A3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。

所述蛋白AeUGT_02可为如下(B1)-(B4)中任一:

(B1)氨基酸序列如SEQ ID No.7所示的蛋白质;

(B2)将(B1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

(B3)与(B1)或(B2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;

(B4)在(A1)-(B3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。

所述蛋白AeUGT_03可为如下(C1)-(C4)中任一:

(C1)氨基酸序列如SEQ ID No.8所示的蛋白质;

(C2)将(C1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

(C3)与(C1)或(C2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;

(C4)在(C1)-(C3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。

所述蛋白AeUGT_04可为如下(D1)-(D4)中任一:

(D1)氨基酸序列如SEQ ID No.9所示的蛋白质;

(D2)将(D1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

(D3)与(D1)或(D2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;

(D4)在(D1)-(D3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。

所述蛋白AeUGT_05可为如下(E1)-(E4)中任一:

(E1)氨基酸序列如SEQ ID No.10所示的蛋白质;

(E2)将(E1)所限定的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

(E3)与(E1)或(E2)所限定的氨基酸序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且具有相同功能的蛋白质;

(E4)在(E1)-(E3)中任一所限定的蛋白质的N端和/或C端连接标签后得到的融合蛋白。

其中,所述一个或几个氨基酸残基的取代和/或缺失和/或添加是指不多于十个氨基酸残基的取代和/或缺失和/或添加。

上述蛋白质中,所述标签是指利用DNA体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述标签可为Flag标签、His标签、MBP标签、HA标签、myc标签、GST标签和/或SUMO标签等。

上述蛋白质中,同源性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。

上述蛋白质中,所述95%以上的同源性可为至少96%、97%、98%的同一性。所述90%以上的同源性可为至少91%、92%、93%、94%的同一性。所述85%以上的同源性可为至少86%、87%、88%、89%的同一性。所述80%以上的同源性可为至少81%、82%、83%、84%的同一性。

第二方面,本发明要求保护一种核酸分子或成套核酸分子。

本发明所要求保护的核酸分子为核酸分子A、核酸分子B、核酸分子C、核酸分子D或核酸分子E。

本发明所要求保护的成套核酸分子由所述核酸分子A、所述核酸分子B、所述核酸分子C、所述核酸分子D和所述核酸分子E中的全部或任意四项或任意三项或任意两项组成。

所述核酸分子A为编码前文所述蛋白AeUGT_01的核酸分子;

所述核酸分子B为编码前文所述蛋白AeUGT_02的核酸分子;

所述核酸分子C为编码前文所述蛋白AeUGT_03的核酸分子;

所述核酸分子D为编码前文所述蛋白AeUGT_04的核酸分子;

所述核酸分子E为编码前文所述蛋白AeUGT_05的核酸分子。

所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如mRNA、hnRNA或tRNA等。

进一步地,所述核酸分子A可为如下(a1)-(a3)中任一:

(a1)核苷酸序列如SEQ ID No.1所示的DNA分子;

(a2)在严格条件下与(a1)限定的DNA分子杂交且编码前文所述蛋白AeUGT_01的DNA分子;

(a3)与(a1)或(a2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白AeUGT_01的DNA分子。

进一步地,所述核酸分子B可为如下(b1)-(b3)中任一:

(b1)核苷酸序列如SEQ ID No.2所示的DNA分子;

(b2)在严格条件下与(b1)限定的DNA分子杂交且编码前文所述蛋白AeUGT_02的DNA分子;

(b3)与(b1)或(b2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白AeUGT_02的DNA分子。

进一步地,所述核酸分子C可为如下(c1)-(c3)中任一:

(c1)核苷酸序列如SEQ ID No.3所示的DNA分子;

(c2)在严格条件下与(c1)限定的DNA分子杂交且编码前文所述蛋白AeUGT_03的DNA分子;

(c3)与(c1)或(c2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白AeUGT_03的DNA分子。

所述核酸分子D可为如下(d1)-(d3)中任一:

(d1)核苷酸序列如SEQ ID No.4所示的DNA分子;

(d2)在严格条件下与(d1)限定的DNA分子杂交且编码前文所述蛋白AeUGT_04的DNA分子;

(d3)与(d1)或(d2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白AeUGT_04的DNA分子。

所述核酸分子E可为如下(e1)-(e3)中任一:

(e1)核苷酸序列如SEQ ID No.1所示的DNA分子;

(e2)在严格条件下与(e1)限定的DNA分子杂交且编码前文所述蛋白AeUGT_05的DNA分子;

(e3)与(e1)或(e2)所限定的DNA序列具有99%以上、95%以上、90%以上、85%以上或者80%以上同源性且编码前文所述蛋白AeUGT_05的DNA分子。

上述核酸分子中,所述严格条件可为如下:50℃,在7%十二烷基硫酸钠(SDS)、0.5M NaPO

上述核酸分子中,同源性是指核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定核苷酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对核苷酸序列的同一性进行计算,然后即可获得同一性的值(%)。

上述核酸分子中,所述95%以上的同源性可为至少96%、97%、98%的同一性。所述90%以上的同源性可为至少91%、92%、93%、94%的同一性。所述85%以上的同源性可为至少86%、87%、88%、89%的同一性。所述80%以上的同源性可为至少81%、82%、83%、84%的同一性。

SEQ ID No.6(AeUGT_01蛋白)由499个氨基酸组成。SEQ ID No.1(AeUGT_01基因)由1500个核苷酸组成,编码SEQ ID No.6所示蛋白质。SEQ ID No.7(AeUGT_02蛋白)由463个氨基酸组成。SEQ ID No.2(AeUGT_02基因)由1392个核苷酸组成,编码SEQ ID No.7所示蛋白质。SEQ ID No.8(AeUGT_03蛋白)由507个氨基酸组成。SEQ ID No.3(AeUGT_03基因)由1524个核苷酸组成,编码SEQ ID No.8所示蛋白质。SEQ ID No.9(AeUGT_04蛋白)由469个氨基酸组成。SEQ ID No.4(AeUGT_04基因)由1410个核苷酸组成,编码SEQ ID No.9所示蛋白质。SEQ ID No.10(AeUGT_05蛋白)由481个氨基酸组成。SEQ ID No.5(AeUGT_05基因)由1446个核苷酸组成,编码SEQ ID No.10所示蛋白质。

第三方面,本发明要求保护如下任一生物材料:

P1、重组载体或成套重组载体;

所述重组载体为重组载体A、重组载体B、重组载体C、重组载体D或重组载体E。

所述成套重组载体由所述重组载体A、所述重组载体B、所述重组载体C、所述重组载体D和所述重组载体E中的全部或任意四项或任意三项或任意两项组成。

所述重组载体A为含有前文所述核酸分子A的重组载体;

所述重组载体B为含有前文所述核酸分子B的重组载体;

所述重组载体C为含有前文所述核酸分子C的重组载体;

所述重组载体D为含有前文所述核酸分子D的重组载体;

所述重组载体E为含有前文所述核酸分子E的重组载体。

P2、表达盒或成套表达盒;

所述表达盒为表达盒A、表达盒B、表达盒C、表达盒D或表达盒E。

所述成套表达盒由所述表达盒A、所述表达盒B、所述表达盒C、所述表达盒D和所述表达盒E中的全部或任意四项或任意三项或任意两项组成。

所述表达盒A为含有前文所述核酸分子A的表达盒;

所述表达盒B为含有前文所述核酸分子B的表达盒;

所述表达盒C为含有前文所述核酸分子C的表达盒;

所述表达盒D为含有前文所述核酸分子D的表达盒;

所述表达盒E为含有前文所述核酸分子E的表达盒。

P3、转基因细胞系或成套转基因细胞系;

所述转基因细胞系为转基因细胞系A、转基因细胞系B、转基因细胞系C、转基因细胞系D或转基因细胞系E。

所述成套转基因细胞系由所述转基因细胞系A、所述转基因细胞系B、所述转基因细胞系C、所述转基因细胞系D和所述转基因细胞系E中的全部或任意四项或任意三项或任意两项组成。

所述转基因细胞系A为含有前文所述核酸分子A的转基因细胞系;

所述转基因细胞系B为含有前文所述核酸分子B的转基因细胞系;

所述转基因细胞系C为含有前文所述核酸分子C的转基因细胞系;

所述转基因细胞系D为含有前文所述核酸分子D的转基因细胞系;

所述转基因细胞系E为含有前文所述核酸分子E的转基因细胞系。

P4、重组菌或成套重组菌;

所述重组菌为重组菌A、重组菌B、重组菌C、重组菌D或重组菌E。

所述成套重组菌由所述重组菌A、所述重组菌B、所述重组菌C、所述重组菌D和所述重组菌E中的全部或任意四项或任意三项或任意两项组成。

所述重组菌A为含有前文所述核酸分子A的重组菌;

所述重组菌B为含有前文所述核酸分子B的重组菌;

所述重组菌C为含有前文所述核酸分子C的重组菌;

所述重组菌D为含有前文所述核酸分子D的重组菌;

所述重组菌E为含有前文所述核酸分子E的重组菌。

所述重组载体可为重组表达载体,也可为重组克隆载体。

所述重组表达载体可用现有的表达载体构建。所述表达载体还可包含外源基因的3’端非翻译区域,即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3’端。使用所述基因构建重组表达载体时,在其转录起始核苷酸前可加上任何一种增强型、组成型、组织特异型或诱导型启动子,它们可单独使用或与其它的启动子结合使用;此外,使用本发明的基因构建重组表达载体时,还可使用增强子,包括翻译增强子或转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。所述翻译控制信号和起始密码子的来源是广泛的,可以是天然的,也可以是合成的。翻译起始区域可以来自转录起始区域或结构基因。

在本发明的一个实施例中,所述重组载体为在pET-28a(+)载体的多克隆位点(如EcoR I和Xho I)间插入所述基因得到的重组质粒。

所述表达盒由能够启动所述基因表达的启动子,所述基因,以及转录终止序列组成。

在本发明的一个实施例中,所述重组菌为含有所述重组载体的大肠杆菌;所述大肠杆菌具体为Transetta(DE3)。

第四方面,本发明要求保护前文所述的蛋白质或成套蛋白质在作为糖基转移酶中的应用。

第五方面,本发明要求保护前文所述的蛋白质或成套蛋白质或前文所述的核酸分子或成套核酸分子或前文所述的生物材料在制备具有糖基转移酶活性的产品中的应用。

在第四和第五方面所述应用中,以咖啡酸或迷迭香酸作为糖基化的受体底物。

所述咖啡酸的结构式如式I所示;所述迷迭香酸的结构式如式II所示。

进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_01时,所述受体底物可为迷迭香酸或咖啡酸。

进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_02时,所述受体底物可为咖啡酸或迷迭香酸;

进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_03时,所述受体底物可为迷迭香酸;

进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_04时,所述受体底物可为迷迭香酸;

进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_05时,所述受体底物可为迷迭香酸或咖啡酸。

更进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_01时,可催化迷迭香酸生成单糖基化产物和双糖基化产物,可催化咖啡酸生成单糖基化产物;

更进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_02时,可催化咖啡酸生成单糖基化产物,可催化迷迭香酸生成单糖基化产物;

更进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_03时,可催化迷迭香酸生成单糖基化产物;

更进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_04时,可催化迷迭香酸生成单糖基化产物;

更进一步地,当所述糖基转移酶为前文所述蛋白AeUGT_05时,可催化迷迭香酸生成单糖基化产物,可催化咖啡酸生成单糖基化产物。

第六方面,本发明要求保护如下任一方法:

方法1:一种制备迷迭香酸单糖基化产物和双糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_01为糖基转移酶,以迷迭香酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法2:一种制备咖啡酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_01为糖基转移酶,以咖啡酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法3:一种制备咖啡酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_02为糖基转移酶,以咖啡酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法4:一种制备迷迭香酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_02为糖基转移酶,以迷迭香酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法5:一种制备迷迭香酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_03为糖基转移酶,以迷迭香酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法6:一种制备迷迭香酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_04为糖基转移酶,以迷迭香酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法7:一种制备迷迭香酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_05为糖基转移酶,以迷迭香酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

方法8:一种制备咖啡酸单糖基化产物的方法,包括如下步骤:以前文所述蛋白AeUGT_05为糖基转移酶,以咖啡酸为糖基化的受体底物,以UDP-葡萄糖作为糖基供体,进行酶促反应。

进一步,所述方法中,所述受体底物和所述供体的摩尔比可为1:2;作为糖基转移酶的所述蛋白质足量。

在所述方法中,进行所述酶促反应的温度为30℃;反应时间为90min。

在本发明中,所述糖基化为酚羟基的糖基化。

实验证明,本发明咖啡酸寡聚体合成调控有关的糖基转移酶AeUGT_01–AeUGT_05具有糖基转移酶的特征结构域,酶促反应分析发现AeUGT_01、AeUGT_02和AeUGT_05可在体外催化咖啡酸形成一种单糖基化产物;AeUGT_01、AeUGT_02、AeUGT_03、AeUGT_04及AeUGT_05可催化迷迭香酸生成至少一种单糖基化产物,其中AeUGT_01还可催化生成双糖基化产物。本发明,对于生产咖啡酸及迷迭香酸糖基化产物具有重要的理论及实际意义。

附图说明

图1为AeUGT_01、AeUGT_02、AeUGT_03及AeUGT_04基因的克隆。1-3为AeUGT_01,4-6为AeUGT_02,7-9为AeUGT_03,10-12为AeUGT_04,M为DNA marker(DL2000)。

图2为AeUGT_05基因的克隆。1-3为AeUGT_05,M为DNA marker(DL2000)。

图3为UPLC/MS检测AeUGT_01–AeUGT_05蛋白粗酶对咖啡酸及迷迭香酸的体外活性。通过比对提取离子色谱图(extracted ion chromatogram,EIC)与样品紫外吸收色谱图确认底物、产物保留时间及产物中糖基个数。底物及糖基化产物提取分子量(m/z)分别如下:咖啡酸,m/z 179;咖啡酸单糖基化产物,m/z 341;迷迭香酸,m/z 359;迷迭香酸单糖基化产物,m/z 521;迷迭香酸双糖基化产物,m/z 683。A1为AeUGT_01对咖啡酸的糖基化反应。A2为AeUGT_02对咖啡酸的糖基化反应。A3为AeUGT_05对咖啡酸的糖基化反应。B1为AeUGT_01对迷迭香酸的糖基化反应。B2为AeUGT_02对迷迭香酸的糖基化反应。B3为AeUGT_05对迷迭香酸的糖基化反应。B4为AeUGT_03对迷迭香酸的糖基化反应。B5为AeUGT_04对迷迭香酸的糖基化反应。C1为咖啡酸(Caffeic acid)和迷迭香酸(Rosmarinic acid)的化学结构。UPLC/MS结果图按从上到下顺序依次为:第一行,酶促反应UPLC检测结果;第二行,酶促反应提取离子色谱图(extracted ion chromatogram,EIC),提取分子量为底物分子量;第三/四行,酶促反应EIC图,提取分子量为单/双糖基化产物分子量。底物及糖基化产物提取分子量(m/z):咖啡酸,m/z179;咖啡酸单糖基化产物,m/z341;迷迭香酸,m/z359迷迭香酸单糖基化产物,m/z521;迷迭香酸双糖基化产物,m/z683。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。

下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

咖啡酸(Caffeic acid):西力生物公司产品,货号:BBP02925。

迷迭香酸(Rosmarinic acid):西力生物公司产品,货号:BBP00081。

尿苷二磷酸-α-D-葡萄糖(UDPG):sigma-aldrich公司产品,货号:670120。

大肠杆菌表达载体pET-28a(+):Novagen

大肠杆菌表达菌株Transetta(DE3)Chemically Competent Cell:全式金,货号:CD801-02。

实施例1、咖啡酸及迷迭香酸糖基转移酶基因的筛选与克隆

一、咖啡酸及迷迭香酸糖基转移酶基因的筛选

候选基因的筛选按照下列程序进行:(1)利用已报道糖基转移酶氨基酸序列对新疆紫草转录组数据库(Genbank SRA档案库,录入编号SRP137782)进行本地Blast检索,结合转录组数据库中各Unigene功能注释初步选定候选基因;(2)选择紫草素匮乏白色悬浮培养细胞系中表达量FPKM值大于1的序列并排除对应氨基酸数量小于300的不完整序列;(3)通过在线比对确认候选基因中包含UDP-葡萄糖基转移酶保守结构域(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)。

二、咖啡酸及迷迭香酸糖基转移酶基因的克隆

1、以TRIzol试剂(Invitrogen)从新疆紫草白色悬浮培养细胞中提取总RNA。用DNase处理后,取总RNA样品进行琼脂糖凝胶电泳,通过比较28S与18S条带之间亮度的差异确定RNA提取质量。使用oligo(dT)引物以PrimerScript第一链cDNA合成试剂盒(TaKaRa)合成第一链cDNA。

2、全长cDNA的克隆和测序

以第一链cDNA为模板,使用

AeUGT_01-F1:5’-ATGGGATCTTTAGGTGAGATT-3’;

AeUGT_01-R1:5’-TTATGAAGACGAGTCGCT-3’。

AeUGT_02-F1:5’-ATGTCTGGTGCTAGTCC-3’;

AeUGT_02-R1:5’-TTATTCACTTATTTCTCTCACAAGT-3’。

AeUGT_03-F1:5’-ATGGAAGCTTTGGGTGA-3’;

AeUGT_03-R1:5’-TTATGAAGACGAGTCGCTTA-3’。

AeUGT_04-F1:5’-ATGGGTGAAGATCAACTACA-3’;

AeUGT_04-R1:5’-TCATCGGTTAAGCTGCC-3’。

AeUGT_05-F1:5’-ATGACAACAATTATGGGACAG-3’;

AeUGT_05-R1:5’-TCAACTAATATTTTTCTTGATATCTTGT-3’。

扩增产物进行琼脂糖凝胶电泳,结果如图1、图2所示,电泳结果表明在约1500bp处出现特异片段,用TIANgel Midi Purification Kit(天根)回收目标片段,连接

测序结果显示:采用引物对AeUGT_01-F1/AeUGT_01-R1扩增得到了含有SEQ IDNo.1所示核苷酸序列的DNA片段,采用引物对AeUGT_02-F1/AeUGT_02-R1扩增得到了含有SEQ ID No.2所示核苷酸序列的DNA片段,采用引物对AeUGT_03-F1/AeUGT_03-R1扩增得到了含有SEQ ID No.3所示核苷酸序列的DNA片段,采用引物对AeUGT_04-F1/AeUGT_04-R1扩增得到了含有SEQ ID No.4所示核苷酸序列的DNA片段,采用引物对AeUGT_05-F1/AeUGT_05-R1扩增得到了含有SEQ ID No.5所示核苷酸序列的DNA片段。将SEQ ID No.1所示基因命名为AeUGT_01基因,SEQ ID No.2所示基因命名为AeUGT_02基因,SEQ ID No.3所示基因命名为AeUGT_03基因,SEQ ID No.4所示基因命名为AeUGT_04基因,SEQ ID No.5所示基因命名为AeUGT_05基因。SEQ ID No.1为完整开放阅读框,编码SEQ ID No.6所示蛋白质(命名为AeUGT_01蛋白);SEQ ID No.2为完整开放阅读框,编码SEQ ID No.7所示蛋白质(命名为AeUGT_02蛋白);SEQ ID No.3为完整开放阅读框,编码SEQ ID No.8所示蛋白质(命名为AeUGT_03蛋白);SEQ ID No.4为完整开放阅读框,编码SEQ ID No.9所示蛋白质(命名为AeUGT_04蛋白);SEQ ID No.5为完整开放阅读框,编码SEQ ID No.10所示蛋白质(命名为AeUGT_05蛋白)。

经上述步骤最终获得含有AeUGT_01基因(SEQ ID No.1)的重组载体pEASY-BluntE1-AeUGT_01,含有AeUGT_02基因(SEQ ID No.2)的重组载体pEASY-Blunt E1-AeUGT_02,含有AeUGT_03基因(SEQ ID No.3)的重组载体pEASY-Blunt E1-AeUGT_03,含有AeUGT_04基因(SEQ ID No.4)的重组载体pEASY-Blunt E1-AeUGT_04,含有AeUGT_05基因(SEQ ID No.5)的重组载体pEASY-Blunt E1-AeUGT_05。

实施例2、咖啡酸及迷迭香酸糖基转移酶基因原核表达及功能分析

1、大肠杆菌表达载体的构建

根据AeUGT_01基因(SEQ ID No.1),AeUGT_02基因(SEQ ID No.2),AeUGT_03基因(SEQ ID No.3),AeUGT_04基因(SEQ ID No.4)及AeUGT_05基因(SEQ ID No.5)的核苷酸序列,分别设计带有EcoR I和Xho I酶切位点的五对引物AeUGT_01-F2/AeUGT_01-R2,AeUGT_02-F2/AeUGT_02-R2,AeUGT_03-F2/AeUGT_03-R2,AeUGT_04-F2/AeUGT_04-R2以及AeUGT_05-F2/AeUGT_05-R2。

AeUGT_01-F2:5’-TCGCGGATCC

AeUGT_01-R2:5’-GGTGGTGGTG

AeUGT_02-F2:5’-TCGCGGATCC

AeUGT_02-R2:5’-GGTGGTGGTG

AeUGT_03-F2:5’-TCGCGGATCC

AeUGT_03-R2:5’-GGTGGTGGTG

AeUGT_04-F2:5’-TCGCGGATCC

AeUGT_04-R2:5’-GGTGGTGGTG

AeUGT_05-F2:5’-TCGCGGATCC

AeUGT_05-R2:5’-GGTGGTGGTG

以实施例1所得重组载体pEASY-Blunt E1-AeUGT_01为模板,以AeUGT_01-F2/AeUGT_01-R2为引物进行PCR扩增,切胶回收后以In-Fusion HD Cloning Kit(Takara)与经过限制性内切酶EcoR I和Xho I双酶切的大肠杆菌表达载体pET-28a(+)的骨架大片段相连,得到重组表达载体pET-28a(+)-AeUGT_01。

以实施例1所得重组载体pEASY-Blunt E1-AeUGT_02为模板,以AeUGT_02-F2/AeUGT_02-R2为引物进行PCR扩增,切胶回收后以In-Fusion HD Cloning Kit(Takara)与经过限制性内切酶EcoR I和Xho I双酶切的大肠杆菌表达载体pET-28a(+)的骨架大片段相连,得到重组表达载体pET-28a(+)-AeUGT_02。

以实施例1所得重组载体pEASY-Blunt E1-AeUGT_03为模板,以AeUGT_03-F2/AeUGT_03-R2为引物进行PCR扩增,切胶回收后以In-Fusion HD Cloning Kit(Takara)与经过限制性内切酶EcoR I和Xho I双酶切的大肠杆菌表达载体pET-28a(+)的骨架大片段相连,得到重组表达载体pET-28a(+)-AeUGT_03。

以实施例1所得重组载体pEASY-Blunt E1-AeUGT_04为模板,以AeUGT_04-F2/AeUGT_04-R2为引物进行PCR扩增,切胶回收后以In-Fusion HD Cloning Kit(Takara)与经过限制性内切酶EcoR I和Xho I双酶切的大肠杆菌表达载体pET-28a(+)的骨架大片段相连,得到重组表达载体pET-28a(+)-AeUGT_04。

以实施例1所得重组载体pEASY-Blunt E1-AeUGT_05为模板,以AeUGT_05-F2/AeUGT_05-R2为引物进行PCR扩增,切胶回收后以In-Fusion HD Cloning Kit(Takara)与经过限制性内切酶EcoR I和Xho I双酶切的大肠杆菌表达载体pET-28a(+)的骨架大片段相连,得到重组表达载体pET-28a(+)-AeUGT_05。

之后将连接反应体系直接转化Trans1-T1 Phage Resistant ChemicallyCompetent Cell(全式金)。

采用引物对T7 promoter primer/T7 terminator primer对重组表达载体pET-28a(+)-AeUGT_01,pET-28a(+)-AeUGT_02,pET-28a(+)-AeUGT_03,pET-28a(+)-AeUGT_04和pET-28a(+)-AeUGT_05进行PCR鉴定。

T7 promoter primer:5’-TAATACGACTCACTATAGGG-3’;

T7 terminator primer:5’-GCTAGTTATTGCTCAGCGG-3’。

PCR扩增阳性结果应为1800bp左右,为外源基因加部分载体片段长度。

PCR检测阳性的重组表达载体pET-28a(+)-AeUGT_01经测序验证后,可知其结构描述为:将SEQ ID No.1所示DNA片段插入到pET-28a(+)载体的酶切位点EcoR I和Xho I之间后得到的重组质粒。PCR检测阳性的重组表达载体pET-28a(+)-AeUGT_02经测序验证后,可知其结构描述为:将SEQ ID No.2所示DNA片段插入到pET-28a(+)载体的酶切位点EcoR I和Xho I之间后得到的重组质粒。PCR检测阳性的重组表达载体pET-28a(+)-AeUGT_03经测序验证后,可知其结构描述为:将SEQ ID No.3所示DNA片段插入到pET-28a(+)载体的酶切位点EcoR I和Xho I之间后得到的重组质粒。PCR检测阳性的重组表达载体pET-28a(+)-AeUGT_04经测序验证后,可知其结构描述为:将SEQ ID No.4所示DNA片段插入到pET-28a(+)载体的酶切位点EcoR I和Xho I之间后得到的重组质粒。PCR检测阳性的重组表达载体pET-28a(+)-AeUGT_05经测序验证后,可知其结构描述为:将SEQ ID No.5所示DNA片段插入到pET-28a(+)载体的酶切位点EcoR I和Xho I之间后得到的重组质粒。

2、诱导表达

将步骤1构建的pET-28a(+)-AeUGT_01,pET-28a(+)-AeUGT_02,pET-28a(+)-AeUGT_03,pET-28a(+)-AeUGT_04和pET-28a(+)-AeUGT_05质粒分别转化表达宿主菌大肠杆菌Transetta(DE3)Chemically Competent Cell(全式金),将重组表达菌株接入含100μg/mL卡那霉素的LB液体培养基中37℃,220转/分钟条件下培养至OD

后续蛋白纯化以1mL镍柱Ni-NTA(GE,USA)进行。上样后以10mL含不同浓度咪唑的缓冲液(20mM磷酸缓冲液,0.5M NaCl,50-200mM咪唑,pH 7.4)梯度洗脱获得。以15mL超滤管(

3、新疆紫草咖啡酸和迷迭香酸糖基转移酶的活性分析

在含有约10μg/mL AeUGT_01蛋白或AeUGT_02蛋白或AeUGT_03蛋白或AeUGT_04蛋白或AeUGT_05蛋白的缓冲体系中加入底物咖啡酸(Caffeic acid)或迷迭香酸(Rosmarinicacid),糖基供体尿苷二磷酸-α-D-葡萄糖(UDPG)进行催化反应,缓冲体系包括50mM的Tric-HCl(pH 7.6)、10%(体积分数)的甘油、200μM底物和400μM糖基供体。催化反应温度30℃,90分钟。加入600μL色谱甲醇终止反应。-30℃冷冻过夜使蛋白充分沉淀,15,000×g离心20min收集上清,以针头式滤器(配备0.2μm PTFE滤膜)(津腾)过滤并进行后续UPLC-MS检测。

UPLC-MS仪器为Waters ACQUITY UPLC H-Class超高效液相色谱系统(沃特世公司,美国)配备Waters Separations Module 2695,Waters 2996Photodiode ArrayDetector检测器,Waters Millennium 32工作站;Waters Q-TOF飞行时间串联质谱仪(沃特世公司,美国)。色谱柱为ACQUITY UPLC HSS T3(2.1×100mm,1.8μm,waters),柱温40℃,进样体积1μL。使用乙腈(A)-0.1%甲酸(B)进行梯度洗脱:0~5min,2%~50%A;5~5.5min,50%~98%A(%表示体积百分含量)。质谱条件:离子化模式为电喷雾(ESI)负离子,毛细管电压2500V,锥孔电压为40V,除溶剂气体为氮气,流速900L/h,除溶剂温度为450℃,离子源温度为100℃,扫描范围为50至1500Da。低能量扫描时碰撞电压为6V,高能量扫描时碰撞电压为25-40V。准确质量数用leucine enkephalin作校正液。LC-MS操作软件为MassLynax4.1。

结果显示:

AeUGT_01催化咖啡酸糖基化反应的效率较低,仅生成单糖基化产物(图3中A1);催化迷迭香酸糖基化效率显著提高,且生成单糖基化及双糖基化两类产物(图3中B1)。

AeUGT_02可催化咖啡酸及迷迭香酸的单糖基化反应,对咖啡酸的转化效率高于迷迭香酸(图3中A2,B2)。

AeUGT_03无法糖基化咖啡酸,仅催化迷迭香酸形成单糖基化产物(图3中B4)。

AeUGT_04可有效催化迷迭香酸生成三种单糖基化产物,对咖啡酸无转化能力(图3中B5)。

AeUGT_05可催化咖啡酸及迷迭香酸的单糖基化反应,对迷迭香酸的转化效率高于咖啡酸(图3中A3,B3)。

由于植物次级代谢产物中迷迭香酸糖基化均发生在酚羟基上,故推测AeUGT_01-AeUGT_05催化迷迭香酸酚羟基糖基化反应。目前已知能催化咖啡酸葡萄糖酯形成的植物糖基转移酶均无法同时催化咖啡酸及其衍生物酚羟基糖基化反应(LIM EK,LI Y,PARR A,etal.Identification of glucosyltransferase genes involved in sinapatemetabolism and lignin synthesis in Arabidopsis[J].J Biol Chem,2001,276(6):4344.)。AeUGT_01、AeUGT_02和AeUGT_05可糖基化迷迭香酸酚羟基,因此上述酶催化咖啡酸形成的也是酚羟基糖基化产物。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

<110> 中国中医科学院中药研究所

<120> 新疆紫草咖啡酸及迷迭香酸糖基转移酶及编码基因与应用

<130> GNCLN201897

<160> 10

<170> PatentIn version 3.5

<210> 1

<211> 1500

<212> DNA

<213> Artificial sequence

<400> 1

atgggatctt taggtgagat tatagtgctt ccattttttg gtcaaggcca tttgaaccca 60

tgtttggaat tgtgcaaaca atttggtgca ctcaatgtta aagccatttt catcataccc 120

tccactttgt catcctctgt atctaatgac catcccttag ttgaggtggt tgagcttccc 180

aactcaccct ctgaatctga atctgaatct gaatctgaat ccaatcctag tcatggaaca 240

ggatcgaatc caccgaggag gaggagtctg gccaatcctc tggctcaggg gattgacagc 300

ttcttgacag aacgatatgg atcgggtcag gttcgaccga tttgtgcagt tgttgatgtc 360

atgatggctt ggagtgtgga tgttttcgct aagttggaga tacccattgc ttcatttttc 420

acttctggag catgtcactc tgctatagag tatgcaaaat ggaaagtaga tgctgattcc 480

atcaaaccag gcgaggttcg gttcttgcct ggtttgccta acaatatgac cttgagttat 540

gcagatgtca acatacatca acgcaagaaa ggaggaaacg tagcagaacc aggatcagca 600

cccgggggtt cggttgaaag caaaccgggt gctggtagaa gaatcccgtg gtgggaaaac 660

gtggagaggt caactgtttt gctgttcaat acttgtgagg atttggaagg gctaataatc 720

aagtatatag ctgatcagac cgggaaaccg gtttatggtg ttgggccttt gttgcctgag 780

caatactgga agtcagctgg ttcacttgtc catgataatg aggctaggtc gaataaggcc 840

accggtatcg cagaagatga agtgatggaa tggttaaagt cgaaagcgga tcagtctgtg 900

atctatatct cattcgggag tgaagttaca ccaacatctg aagaattagg tgaactagca 960

agtgcattgg aggagtcaaa tcaggcattc atatgggtga tccctccagg ttcagggata 1020

tccggacctc ctaggagtat taaaactatg atggggaaag aagaggaggg cggctttgac 1080

ccttatggat tagaggaaaa agttggaaat agggggttga taattaaagg gtgggcaccc 1140

cagttgctaa ttctgagcca tccatcagtg ggaggtttct tatcgcattg tggttggaac 1200

tcgaccgtgg aagcaatagg gaggggtgtg ccaattctgg catggcctat tgggggtgac 1260

cagttcaaca acgctaagct gatagtgaac tatcttggag ttggtcacac gctctataca 1320

agcgaggatc catttgagac gatgaagaag gaacgaatac tgaaagggat taagatgatg 1380

atggatgatc aacaagttca taagaagggg aaggaattgg cacagagatt ccagactggt 1440

tatccttctg tggcttcttt gaaggcgatt gttggtctag taagcgactc gtcttcataa 1500

<210> 2

<211> 1392

<212> DNA

<213> Artificial sequence

<400> 2

atgtctggtg ctagtccaag ctcaaaaaat ggtgtccata ttctcatctt cccctttcca 60

gctcaaggcc acatgctccc acttcttgat ttagcttctc aactagccaa acatggcctt 120

accataacaa ttctagtcac cccaaaaaat cttcctattc tatcaccact tctctcagct 180

caacccacca tcaaacctct aatctttccc tttccacccc acccttcagt tccatctggt 240

gctgaaaatg ttaaggatat tggaaattcc ggaaatgccc ctatcattgc tgcactagcc 300

aaactccatg atgagatagt tgaatggttc aactctcaaa gttgtccacc cattgctctt 360

atctctgact tctttcttgg gtggacccaa gatttggcca acaagattgg tgttccaaga 420

attgtttttt attcatctgg tgcctttttg gcttctgctt ttgattatat ttggaagaat 480

tttgatcttt tgaggtgttt ggatgaaatt gagttttcag attttccaag aaaaccaaga 540

ttcttgaagg aacatctccc ttccgtgttc aggagataca gagactctga tcctgattgg 600

gtgattgtta ggaagagtat ggttgcaaat tcatcaagtt ggggggctgt aatcaacaca 660

tttgatgcca tggaaagtga gttttgtgaa tatttcaaga gattaatggg ccatgaacga 720

gtttattcta ttgggcctgt gaatttactg agtggggcag acagagaagg tgatccaact 780

agtgaagttc taagttggct tgatcaatgt gttaatcgat cagtgttgta tgtgtgcttt 840

ggtagtcaga cagtgttgag ccaggctcaa atcgactctt tgtgtagtgc tcttgatggc 900

agtggagtta aatttgtgtt tgtgacaaag ccgattacgg aacaacagaa aacagagggg 960

tatgggtcgg tccctattga gtttgatacc cgagtcaaca gtcggggctt gattataaga 1020

ggttgggccc cacaagtttc gattctgagc caccgagctg ttggcgggtt tttgagtcat 1080

tgtgggtgga actcggtgtt ggaagcggta gttgggggtg tgatgatatt ggcttggccc 1140

atggaggctg accaatatat caatgcaaga ctattggttg attacatggg cgccgcggta 1200

caagtgtgtg gtgggaggga taccgtgcct aactcgttcg agttggctcg taccattttc 1260

gagtcaatgc aaggagacat cattcaaaag gccaaagcaa atggattgag agatcaagct 1320

cttgaagcaa ttaggagtgg tgggagttca gcaaatgata tggagacact tgtgagagaa 1380

ataagtgaat aa 1392

<210> 3

<211> 1524

<212> DNA

<213> Artificial sequence

<400> 3

atggaagctt tgggtgagat tatagtgctt ccatttttcg gtcaagggca cttaaatcca 60

tgcatggaat tatgcaaaca atttgcaaaa ctaaattata aagccattct catcataccc 120

tccactttgt catcctctgt acctactacc cacaatcctt tggttgaggt ggttgaactt 180

cccaacccat ctccgccaca ggaaaccgct attgtaaccg tggctggatt gaagaatgaa 240

aatggagctg gattataccc atctagagat agcttctcca cccccctggg tcgggcaatt 300

gacaattttt tgtcagagcg atatagaagc tctggtcaga taccactcat ttgtgcagtt 360

gttgatgcca tgatgcgttg gagtgcggat atttttgcta agttgaacgt acccattgct 420

tcatttttca cttccggagc atgccattat gctatagagt atgcaagatg gaaagctgat 480

gttgattcca ttcaaccggg agaggttcgg ttcttgcctg gtttaccaga caatatggcc 540

gtaaactatg cagattttat ccggaacagg cgcattattg gtggaagaga agctactaaa 600

accgatcaac acgaaccggc atcaaccccg ggcgaaagca gacatggtcc acctggtgca 660

tccagaagat taccatggtg ggaagaagaa agatcaactg ttttgctgtt caatacttgt 720

gatgacttgg aagaagtaat aatcaagtgc atagctgatc agaccgggaa accggtttat 780

ggcgttgggc cgttgttgcc ggagcaatac tggaagtcaa ctggttcagt tgtccatgat 840

catgaggttc ggtcgaacaa agccacaagt gttacagaag atgaagtgat gagatggtta 900

agctcaaagc ctgaacagtc ggtcatctat atctcattcg ggagtgaagt ctctccaatg 960

tctgaagaac taggcgagct agcaaacgcc ttggaggagt cgaaccaggc gtttatatgg 1020

gtgatcccac caggctcggg aactcctgga ccgcctagga gcataaaaac tctgatgggg 1080

agggaagatg aggggggatt ttacccttat ggaatggatg aaaaaattgg aaacaggggg 1140

ttgttgatca aagggtgggc acctcagttg ttaattttga gccatccatc agttggaggt 1200

ttcttgtcac attgtggttg gaattcgaca gtggaggcgg tagggagggg tgtaccaatc 1260

ttggcatggc caattggggg tgatcaattc aacaatgcta aactgatagt gaaccatctt 1320

ggggttggtc acacgttata tacgagcgac gattcatttg aaccaatgaa gaaggaacag 1380

ataatgaaag ggattgagat gatgatggct gatcaagaag ttcacaagaa aggtaaggaa 1440

ttggcagcga aattccaggg tggttatcct tctatggctt cgttgaaggc gatcattcat 1500

cgagtaagcg actcgtcttc ataa 1524

<210> 4

<211> 1410

<212> DNA

<213> Artificial sequence

<400> 4

atgggtgaag atcaactaca cataatgttc ttccctttca tggctgctgg ccatatcata 60

cctacactag acatggtcaa gctattttct tcccgtggaa atgtcaaaat cacccttgtc 120

atcacccata gtaattcttc catggttgcc caacaactcg aaaatcaaga aaacatcaac 180

ttcaaacaaa ttgagttccc agatcaagat tctggtctac ctaaagaata tgatactgtt 240

gacaaaatca agggggcacc tgagttgttc cctaagttct tgaaggccct ggaattaatg 300

cagaacccat ttgagaaaat attgcaagaa ttttcccctg attgtcttgt tgcagacatg 360

ttctatccat gggcaacaaa tgctgctgca aagtttgata ttccaaggtt ggtttttcat 420

ggtgtttctt tgtttgctct ctgtggctca gaggttatga gaagagacaa gcctttcaag 480

aacgtttcat cagatacaga acattttgtt attcccaata ttcctcatga aatagtcttc 540

accaggcagc aactttcgga tacagacagg gaggagtttg agacagatat gactagattg 600

atgaggagag tgctggagac agacaagaaa agctatggta ttctcatcaa cagcttttta 660

gagcttgatc cagtctatac cgagtattat aagacggttt tcggaagaag ggcatggaat 720

attggccctc ttctgttatg cagaaggcaa ggaagggaac ttcaatcatc tggcgacgac 780

aacaacgtat gtttgagatg gctggatggg aagaagccaa attcagtaat ctatttgtgt 840

tttgggagtg gctcagtctt cacaacagct cagttgcaag atattgcttt tggtcttgag 900

gctgctggcc aacagttcat ttgggttgtg aggcaagaag ttgatgaaaa ctggttgcct 960

gaaggatttg aggagaaaat attgtctgat aacaggggcc taattataaa gggatgggca 1020

cctcaggtgc ggattcttga acataaagcc gttggagcat tcctgactca ttgtggatgg 1080

aactcgattt tagaagcgat atgtgccggt gtgcctatgg taacatggcc tttatttgca 1140

gagcaatttt acaatgagag gtttgtgaca cgaattttag ggatcggaat tcctgttggt 1200

gcaccaaaat acggtatgat tagcagtggt gtgagcaagg aagccatagc taaggcctta 1260

aaagccataa tggaaggtga gaaagctctt gaagttagaa acaaagcaaa tgaatccaag 1320

aaaatggcat ggaaggctgt tgaaaagggt ggatcatctt acaatgagtt gagtgctttg 1380

ttggaggaaa ttaggcagct taaccgatga 1410

<210> 5

<211> 1446

<212> DNA

<213> Artificial sequence

<400> 5

atgacaacaa ttatgggaca gaaaacacaa cttgtgttca tcccaactcc agcaaggggg 60

catttaatag catcagttga tatggcaaag atgttaatca acagagatgc aaatctttcc 120

attaccatct tgctcatcaa aagaccaaac taccctgctc tagattcctt ccttaattct 180

cttgcaacac tccacatccc ccatctgaat tttgtacaac ttcctagtgc agaacccact 240

gcacccttat ctttcaacat tttcatgtcc aagttggttg acaatcacaa ggaccctgta 300

agagatttcg tgaatggatt cttgaaatca caaggagaaa ccaaacttgc tggatttgtt 360

attgatatgt tttgtacagg gatgattgct gttgctgatg aatttggtct tcccacttat 420

gtattttcta cttcaggaac agctatgctt ggcttgatat ttcatctcca aaatctaagg 480

gatgagttca accaagatat taccaggttt aaggattctg atcaagaagc tgacttgtct 540

gtttcaactt acatcaacaa agttccagca aaggtattgc cttctcctgc tatagacaag 600

gatggctcaa accatttctt gaatcatgca aaaggtatca aaggaaccag gggtatattg 660

gtgaattcat tcttggagtt ggaatctcat gctgtgaaat ctttgtttga agatgataat 720

gttcctccaa tatatccagt agggccgatt cttaatgtcc aggaggaaag tggtggtgat 780

gaaaatgaaa agaataggga gatcttgaaa tggttagatg atcagcctga ttcttctgtt 840

gtgttcttgt gcttcggtac aatagggtgt tttgaagctg agcaggtgaa agaaattgct 900

catgcattgg agggaagtgg gtacaggttt ctttggtcat tgcgacaacc tccaccaaag 960

ggggtgacag ggattccgga agaatacgag aatccccagc aagttttgcc agaaggcttc 1020

cttaaacgga cggcgggtgt cgggaagatc ataggatggg caccacaatt ggcggtgttg 1080

tctcattcgg cggtaggagg tttcgtttct cattgcggtt ggaattcgac gttagaaagt 1140

gtttggtgtg gagtacctat ggctgcatgg cctcagtatg cagagcaaca aatgaatgca 1200

tttcaactag tggaagatct tgaattggct gttgagattc aaatggatta cagaatgggt 1260

agttcaagtt tggtgaaagc tcaagagatt gaaactaaag ttaagcaatt gatggaccca 1320

aattctgaaa tgagattcaa agtcaaagct atgaaggaaa agagcagaat ggccttaatg 1380

gagggtggat catcctacaa cttcctagat ggtttcctac aagatatcaa gaaaaatatt 1440

agttga 1446

<210> 6

<211> 499

<212> PRT

<213> Artificial sequence

<400> 6

Met Gly Ser Leu Gly Glu Ile Ile Val Leu Pro Phe Phe Gly Gln Gly

1 5 10 15

His Leu Asn Pro Cys Leu Glu Leu Cys Lys Gln Phe Gly Ala Leu Asn

20 25 30

Val Lys Ala Ile Phe Ile Ile Pro Ser Thr Leu Ser Ser Ser Val Ser

35 40 45

Asn Asp His Pro Leu Val Glu Val Val Glu Leu Pro Asn Ser Pro Ser

50 55 60

Glu Ser Glu Ser Glu Ser Glu Ser Glu Ser Asn Pro Ser His Gly Thr

65 70 75 80

Gly Ser Asn Pro Pro Arg Arg Arg Ser Leu Ala Asn Pro Leu Ala Gln

85 90 95

Gly Ile Asp Ser Phe Leu Thr Glu Arg Tyr Gly Ser Gly Gln Val Arg

100 105 110

Pro Ile Cys Ala Val Val Asp Val Met Met Ala Trp Ser Val Asp Val

115 120 125

Phe Ala Lys Leu Glu Ile Pro Ile Ala Ser Phe Phe Thr Ser Gly Ala

130 135 140

Cys His Ser Ala Ile Glu Tyr Ala Lys Trp Lys Val Asp Ala Asp Ser

145 150 155 160

Ile Lys Pro Gly Glu Val Arg Phe Leu Pro Gly Leu Pro Asn Asn Met

165 170 175

Thr Leu Ser Tyr Ala Asp Val Asn Ile His Gln Arg Lys Lys Gly Gly

180 185 190

Asn Val Ala Glu Pro Gly Ser Ala Pro Gly Gly Ser Val Glu Ser Lys

195 200 205

Pro Gly Ala Gly Arg Arg Ile Pro Trp Trp Glu Asn Val Glu Arg Ser

210 215 220

Thr Val Leu Leu Phe Asn Thr Cys Glu Asp Leu Glu Gly Leu Ile Ile

225 230 235 240

Lys Tyr Ile Ala Asp Gln Thr Gly Lys Pro Val Tyr Gly Val Gly Pro

245 250 255

Leu Leu Pro Glu Gln Tyr Trp Lys Ser Ala Gly Ser Leu Val His Asp

260 265 270

Asn Glu Ala Arg Ser Asn Lys Ala Thr Gly Ile Ala Glu Asp Glu Val

275 280 285

Met Glu Trp Leu Lys Ser Lys Ala Asp Gln Ser Val Ile Tyr Ile Ser

290 295 300

Phe Gly Ser Glu Val Thr Pro Thr Ser Glu Glu Leu Gly Glu Leu Ala

305 310 315 320

Ser Ala Leu Glu Glu Ser Asn Gln Ala Phe Ile Trp Val Ile Pro Pro

325 330 335

Gly Ser Gly Ile Ser Gly Pro Pro Arg Ser Ile Lys Thr Met Met Gly

340 345 350

Lys Glu Glu Glu Gly Gly Phe Asp Pro Tyr Gly Leu Glu Glu Lys Val

355 360 365

Gly Asn Arg Gly Leu Ile Ile Lys Gly Trp Ala Pro Gln Leu Leu Ile

370 375 380

Leu Ser His Pro Ser Val Gly Gly Phe Leu Ser His Cys Gly Trp Asn

385 390 395 400

Ser Thr Val Glu Ala Ile Gly Arg Gly Val Pro Ile Leu Ala Trp Pro

405 410 415

Ile Gly Gly Asp Gln Phe Asn Asn Ala Lys Leu Ile Val Asn Tyr Leu

420 425 430

Gly Val Gly His Thr Leu Tyr Thr Ser Glu Asp Pro Phe Glu Thr Met

435 440 445

Lys Lys Glu Arg Ile Leu Lys Gly Ile Lys Met Met Met Asp Asp Gln

450 455 460

Gln Val His Lys Lys Gly Lys Glu Leu Ala Gln Arg Phe Gln Thr Gly

465 470 475 480

Tyr Pro Ser Val Ala Ser Leu Lys Ala Ile Val Gly Leu Val Ser Asp

485 490 495

Ser Ser Ser

<210> 7

<211> 463

<212> PRT

<213> Artificial sequence

<400> 7

Met Ser Gly Ala Ser Pro Ser Ser Lys Asn Gly Val His Ile Leu Ile

1 5 10 15

Phe Pro Phe Pro Ala Gln Gly His Met Leu Pro Leu Leu Asp Leu Ala

20 25 30

Ser Gln Leu Ala Lys His Gly Leu Thr Ile Thr Ile Leu Val Thr Pro

35 40 45

Lys Asn Leu Pro Ile Leu Ser Pro Leu Leu Ser Ala Gln Pro Thr Ile

50 55 60

Lys Pro Leu Ile Phe Pro Phe Pro Pro His Pro Ser Val Pro Ser Gly

65 70 75 80

Ala Glu Asn Val Lys Asp Ile Gly Asn Ser Gly Asn Ala Pro Ile Ile

85 90 95

Ala Ala Leu Ala Lys Leu His Asp Glu Ile Val Glu Trp Phe Asn Ser

100 105 110

Gln Ser Cys Pro Pro Ile Ala Leu Ile Ser Asp Phe Phe Leu Gly Trp

115 120 125

Thr Gln Asp Leu Ala Asn Lys Ile Gly Val Pro Arg Ile Val Phe Tyr

130 135 140

Ser Ser Gly Ala Phe Leu Ala Ser Ala Phe Asp Tyr Ile Trp Lys Asn

145 150 155 160

Phe Asp Leu Leu Arg Cys Leu Asp Glu Ile Glu Phe Ser Asp Phe Pro

165 170 175

Arg Lys Pro Arg Phe Leu Lys Glu His Leu Pro Ser Val Phe Arg Arg

180 185 190

Tyr Arg Asp Ser Asp Pro Asp Trp Val Ile Val Arg Lys Ser Met Val

195 200 205

Ala Asn Ser Ser Ser Trp Gly Ala Val Ile Asn Thr Phe Asp Ala Met

210 215 220

Glu Ser Glu Phe Cys Glu Tyr Phe Lys Arg Leu Met Gly His Glu Arg

225 230 235 240

Val Tyr Ser Ile Gly Pro Val Asn Leu Leu Ser Gly Ala Asp Arg Glu

245 250 255

Gly Asp Pro Thr Ser Glu Val Leu Ser Trp Leu Asp Gln Cys Val Asn

260 265 270

Arg Ser Val Leu Tyr Val Cys Phe Gly Ser Gln Thr Val Leu Ser Gln

275 280 285

Ala Gln Ile Asp Ser Leu Cys Ser Ala Leu Asp Gly Ser Gly Val Lys

290 295 300

Phe Val Phe Val Thr Lys Pro Ile Thr Glu Gln Gln Lys Thr Glu Gly

305 310 315 320

Tyr Gly Ser Val Pro Ile Glu Phe Asp Thr Arg Val Asn Ser Arg Gly

325 330 335

Leu Ile Ile Arg Gly Trp Ala Pro Gln Val Ser Ile Leu Ser His Arg

340 345 350

Ala Val Gly Gly Phe Leu Ser His Cys Gly Trp Asn Ser Val Leu Glu

355 360 365

Ala Val Val Gly Gly Val Met Ile Leu Ala Trp Pro Met Glu Ala Asp

370 375 380

Gln Tyr Ile Asn Ala Arg Leu Leu Val Asp Tyr Met Gly Ala Ala Val

385 390 395 400

Gln Val Cys Gly Gly Arg Asp Thr Val Pro Asn Ser Phe Glu Leu Ala

405 410 415

Arg Thr Ile Phe Glu Ser Met Gln Gly Asp Ile Ile Gln Lys Ala Lys

420 425 430

Ala Asn Gly Leu Arg Asp Gln Ala Leu Glu Ala Ile Arg Ser Gly Gly

435 440 445

Ser Ser Ala Asn Asp Met Glu Thr Leu Val Arg Glu Ile Ser Glu

450 455 460

<210> 8

<211> 507

<212> PRT

<213> Artificial sequence

<400> 8

Met Glu Ala Leu Gly Glu Ile Ile Val Leu Pro Phe Phe Gly Gln Gly

1 5 10 15

His Leu Asn Pro Cys Met Glu Leu Cys Lys Gln Phe Ala Lys Leu Asn

20 25 30

Tyr Lys Ala Ile Leu Ile Ile Pro Ser Thr Leu Ser Ser Ser Val Pro

35 40 45

Thr Thr His Asn Pro Leu Val Glu Val Val Glu Leu Pro Asn Pro Ser

50 55 60

Pro Pro Gln Glu Thr Ala Ile Val Thr Val Ala Gly Leu Lys Asn Glu

65 70 75 80

Asn Gly Ala Gly Leu Tyr Pro Ser Arg Asp Ser Phe Ser Thr Pro Leu

85 90 95

Gly Arg Ala Ile Asp Asn Phe Leu Ser Glu Arg Tyr Arg Ser Ser Gly

100 105 110

Gln Ile Pro Leu Ile Cys Ala Val Val Asp Ala Met Met Arg Trp Ser

115 120 125

Ala Asp Ile Phe Ala Lys Leu Asn Val Pro Ile Ala Ser Phe Phe Thr

130 135 140

Ser Gly Ala Cys His Tyr Ala Ile Glu Tyr Ala Arg Trp Lys Ala Asp

145 150 155 160

Val Asp Ser Ile Gln Pro Gly Glu Val Arg Phe Leu Pro Gly Leu Pro

165 170 175

Asp Asn Met Ala Val Asn Tyr Ala Asp Phe Ile Arg Asn Arg Arg Ile

180 185 190

Ile Gly Gly Arg Glu Ala Thr Lys Thr Asp Gln His Glu Pro Ala Ser

195 200 205

Thr Pro Gly Glu Ser Arg His Gly Pro Pro Gly Ala Ser Arg Arg Leu

210 215 220

Pro Trp Trp Glu Glu Glu Arg Ser Thr Val Leu Leu Phe Asn Thr Cys

225 230 235 240

Asp Asp Leu Glu Glu Val Ile Ile Lys Cys Ile Ala Asp Gln Thr Gly

245 250 255

Lys Pro Val Tyr Gly Val Gly Pro Leu Leu Pro Glu Gln Tyr Trp Lys

260 265 270

Ser Thr Gly Ser Val Val His Asp His Glu Val Arg Ser Asn Lys Ala

275 280 285

Thr Ser Val Thr Glu Asp Glu Val Met Arg Trp Leu Ser Ser Lys Pro

290 295 300

Glu Gln Ser Val Ile Tyr Ile Ser Phe Gly Ser Glu Val Ser Pro Met

305 310 315 320

Ser Glu Glu Leu Gly Glu Leu Ala Asn Ala Leu Glu Glu Ser Asn Gln

325 330 335

Ala Phe Ile Trp Val Ile Pro Pro Gly Ser Gly Thr Pro Gly Pro Pro

340 345 350

Arg Ser Ile Lys Thr Leu Met Gly Arg Glu Asp Glu Gly Gly Phe Tyr

355 360 365

Pro Tyr Gly Met Asp Glu Lys Ile Gly Asn Arg Gly Leu Leu Ile Lys

370 375 380

Gly Trp Ala Pro Gln Leu Leu Ile Leu Ser His Pro Ser Val Gly Gly

385 390 395 400

Phe Leu Ser His Cys Gly Trp Asn Ser Thr Val Glu Ala Val Gly Arg

405 410 415

Gly Val Pro Ile Leu Ala Trp Pro Ile Gly Gly Asp Gln Phe Asn Asn

420 425 430

Ala Lys Leu Ile Val Asn His Leu Gly Val Gly His Thr Leu Tyr Thr

435 440 445

Ser Asp Asp Ser Phe Glu Pro Met Lys Lys Glu Gln Ile Met Lys Gly

450 455 460

Ile Glu Met Met Met Ala Asp Gln Glu Val His Lys Lys Gly Lys Glu

465 470 475 480

Leu Ala Ala Lys Phe Gln Gly Gly Tyr Pro Ser Met Ala Ser Leu Lys

485 490 495

Ala Ile Ile His Arg Val Ser Asp Ser Ser Ser

500 505

<210> 9

<211> 469

<212> PRT

<213> Artificial sequence

<400> 9

Met Gly Glu Asp Gln Leu His Ile Met Phe Phe Pro Phe Met Ala Ala

1 5 10 15

Gly His Ile Ile Pro Thr Leu Asp Met Val Lys Leu Phe Ser Ser Arg

20 25 30

Gly Asn Val Lys Ile Thr Leu Val Ile Thr His Ser Asn Ser Ser Met

35 40 45

Val Ala Gln Gln Leu Glu Asn Gln Glu Asn Ile Asn Phe Lys Gln Ile

50 55 60

Glu Phe Pro Asp Gln Asp Ser Gly Leu Pro Lys Glu Tyr Asp Thr Val

65 70 75 80

Asp Lys Ile Lys Gly Ala Pro Glu Leu Phe Pro Lys Phe Leu Lys Ala

85 90 95

Leu Glu Leu Met Gln Asn Pro Phe Glu Lys Ile Leu Gln Glu Phe Ser

100 105 110

Pro Asp Cys Leu Val Ala Asp Met Phe Tyr Pro Trp Ala Thr Asn Ala

115 120 125

Ala Ala Lys Phe Asp Ile Pro Arg Leu Val Phe His Gly Val Ser Leu

130 135 140

Phe Ala Leu Cys Gly Ser Glu Val Met Arg Arg Asp Lys Pro Phe Lys

145 150 155 160

Asn Val Ser Ser Asp Thr Glu His Phe Val Ile Pro Asn Ile Pro His

165 170 175

Glu Ile Val Phe Thr Arg Gln Gln Leu Ser Asp Thr Asp Arg Glu Glu

180 185 190

Phe Glu Thr Asp Met Thr Arg Leu Met Arg Arg Val Leu Glu Thr Asp

195 200 205

Lys Lys Ser Tyr Gly Ile Leu Ile Asn Ser Phe Leu Glu Leu Asp Pro

210 215 220

Val Tyr Thr Glu Tyr Tyr Lys Thr Val Phe Gly Arg Arg Ala Trp Asn

225 230 235 240

Ile Gly Pro Leu Leu Leu Cys Arg Arg Gln Gly Arg Glu Leu Gln Ser

245 250 255

Ser Gly Asp Asp Asn Asn Val Cys Leu Arg Trp Leu Asp Gly Lys Lys

260 265 270

Pro Asn Ser Val Ile Tyr Leu Cys Phe Gly Ser Gly Ser Val Phe Thr

275 280 285

Thr Ala Gln Leu Gln Asp Ile Ala Phe Gly Leu Glu Ala Ala Gly Gln

290 295 300

Gln Phe Ile Trp Val Val Arg Gln Glu Val Asp Glu Asn Trp Leu Pro

305 310 315 320

Glu Gly Phe Glu Glu Lys Ile Leu Ser Asp Asn Arg Gly Leu Ile Ile

325 330 335

Lys Gly Trp Ala Pro Gln Val Arg Ile Leu Glu His Lys Ala Val Gly

340 345 350

Ala Phe Leu Thr His Cys Gly Trp Asn Ser Ile Leu Glu Ala Ile Cys

355 360 365

Ala Gly Val Pro Met Val Thr Trp Pro Leu Phe Ala Glu Gln Phe Tyr

370 375 380

Asn Glu Arg Phe Val Thr Arg Ile Leu Gly Ile Gly Ile Pro Val Gly

385 390 395 400

Ala Pro Lys Tyr Gly Met Ile Ser Ser Gly Val Ser Lys Glu Ala Ile

405 410 415

Ala Lys Ala Leu Lys Ala Ile Met Glu Gly Glu Lys Ala Leu Glu Val

420 425 430

Arg Asn Lys Ala Asn Glu Ser Lys Lys Met Ala Trp Lys Ala Val Glu

435 440 445

Lys Gly Gly Ser Ser Tyr Asn Glu Leu Ser Ala Leu Leu Glu Glu Ile

450 455 460

Arg Gln Leu Asn Arg

465

<210> 10

<211> 481

<212> PRT

<213> Artificial sequence

<400> 10

Met Thr Thr Ile Met Gly Gln Lys Thr Gln Leu Val Phe Ile Pro Thr

1 5 10 15

Pro Ala Arg Gly His Leu Ile Ala Ser Val Asp Met Ala Lys Met Leu

20 25 30

Ile Asn Arg Asp Ala Asn Leu Ser Ile Thr Ile Leu Leu Ile Lys Arg

35 40 45

Pro Asn Tyr Pro Ala Leu Asp Ser Phe Leu Asn Ser Leu Ala Thr Leu

50 55 60

His Ile Pro His Leu Asn Phe Val Gln Leu Pro Ser Ala Glu Pro Thr

65 70 75 80

Ala Pro Leu Ser Phe Asn Ile Phe Met Ser Lys Leu Val Asp Asn His

85 90 95

Lys Asp Pro Val Arg Asp Phe Val Asn Gly Phe Leu Lys Ser Gln Gly

100 105 110

Glu Thr Lys Leu Ala Gly Phe Val Ile Asp Met Phe Cys Thr Gly Met

115 120 125

Ile Ala Val Ala Asp Glu Phe Gly Leu Pro Thr Tyr Val Phe Ser Thr

130 135 140

Ser Gly Thr Ala Met Leu Gly Leu Ile Phe His Leu Gln Asn Leu Arg

145 150 155 160

Asp Glu Phe Asn Gln Asp Ile Thr Arg Phe Lys Asp Ser Asp Gln Glu

165 170 175

Ala Asp Leu Ser Val Ser Thr Tyr Ile Asn Lys Val Pro Ala Lys Val

180 185 190

Leu Pro Ser Pro Ala Ile Asp Lys Asp Gly Ser Asn His Phe Leu Asn

195 200 205

His Ala Lys Gly Ile Lys Gly Thr Arg Gly Ile Leu Val Asn Ser Phe

210 215 220

Leu Glu Leu Glu Ser His Ala Val Lys Ser Leu Phe Glu Asp Asp Asn

225 230 235 240

Val Pro Pro Ile Tyr Pro Val Gly Pro Ile Leu Asn Val Gln Glu Glu

245 250 255

Ser Gly Gly Asp Glu Asn Glu Lys Asn Arg Glu Ile Leu Lys Trp Leu

260 265 270

Asp Asp Gln Pro Asp Ser Ser Val Val Phe Leu Cys Phe Gly Thr Ile

275 280 285

Gly Cys Phe Glu Ala Glu Gln Val Lys Glu Ile Ala His Ala Leu Glu

290 295 300

Gly Ser Gly Tyr Arg Phe Leu Trp Ser Leu Arg Gln Pro Pro Pro Lys

305 310 315 320

Gly Val Thr Gly Ile Pro Glu Glu Tyr Glu Asn Pro Gln Gln Val Leu

325 330 335

Pro Glu Gly Phe Leu Lys Arg Thr Ala Gly Val Gly Lys Ile Ile Gly

340 345 350

Trp Ala Pro Gln Leu Ala Val Leu Ser His Ser Ala Val Gly Gly Phe

355 360 365

Val Ser His Cys Gly Trp Asn Ser Thr Leu Glu Ser Val Trp Cys Gly

370 375 380

Val Pro Met Ala Ala Trp Pro Gln Tyr Ala Glu Gln Gln Met Asn Ala

385 390 395 400

Phe Gln Leu Val Glu Asp Leu Glu Leu Ala Val Glu Ile Gln Met Asp

405 410 415

Tyr Arg Met Gly Ser Ser Ser Leu Val Lys Ala Gln Glu Ile Glu Thr

420 425 430

Lys Val Lys Gln Leu Met Asp Pro Asn Ser Glu Met Arg Phe Lys Val

435 440 445

Lys Ala Met Lys Glu Lys Ser Arg Met Ala Leu Met Glu Gly Gly Ser

450 455 460

Ser Tyr Asn Phe Leu Asp Gly Phe Leu Gln Asp Ile Lys Lys Asn Ile

465 470 475 480

Ser

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号