首页> 中国专利> 药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶蛋白编码序列

药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶蛋白编码序列

摘要

一种药用植物大戟Ep-Hmgr蛋白编码序列,属于基因工程领域。所分离出的DNA分子包括:编码具有药用植物大戟Ep-Hmgr蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列杂交。本发明是一种3-羟基-3-甲基戊二酰辅酶A的还原酶,有助于提高药用植物大戟中次生代谢产物或其前体的含量,对于保护人民的健康生长有所帮助。

著录项

  • 公开/公告号CN1936004A

    专利类型发明专利

  • 公开/公告日2007-03-28

    原文格式PDF

  • 申请/专利权人 徐州师范大学;

    申请/专利号CN200610125796.9

  • 申请日2006-08-28

  • 分类号C12N15/29;C07K14/415;

  • 代理机构徐州市三联专利事务所;

  • 代理人周爱芳

  • 地址 221000 江苏省徐州市铜山新区上海路29号徐州师范大学

  • 入库时间 2023-12-17 18:25:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-10-28

    未缴年费专利权终止 IPC(主分类):C12N15/29 授权公告日:20100908 终止日期:20140828 申请日:20060828

    专利权的终止

  • 2010-09-08

    授权

    授权

  • 2007-05-23

    实质审查的生效

    实质审查的生效

  • 2007-03-28

    公开

    公开

说明书

技术领域

本发明涉及分子生物学、基因工程技术领域。具体地,本发明涉及一种在药用植物大戟中表达的Ep-Hmgr蛋白(药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶蛋白,Euphorbia pekinensis 3-hydroxy-3-methylglutaryl-CoA Reductase,EpHMGR)及其核酸序列。

背景技术

药用植物大戟(Euphorbia pekinensis)又名龙虎草、将军草、九头狮子等,在植物分类学上属大戟科,为多年生草本植物。全株含乳汁。现代医学研究发现,药用植物大戟的根具有多种药理作用,如致泻、利尿、降压等。临床一般用于治疗急、慢性肾炎水肿及晚期血吸虫病腹水或其他肝硬变腹水。研究发现药用植物大戟根含三萜类成分大戟甙、生物碱、大戟色素体A、B、C。另含树胶、树脂等。这些都为次生代谢产物。近代科学研究发现,次生代谢产物是天然活性物质,是解决目前世界面临的西药毒副作用大,癌症、艾滋病等疑难疾病无法医治等难题的一条新途径。

近年来,对许多植物材料的次生代谢的研究证明,HMGR是甲羟戊酸途径中一个关键酶。在甲羟戊酸途径中3-羟基-3-甲基戊二酸单酰CoA(HMGCoA)在HMGR的作用下生成甲羟戊酸(MVA)。由于该反应是一个不可逆过程,因此HMGR被认为是该途径中第一个限速酶。通过提高3-羟基-3-甲基戊二酰辅酶A还原酶的活性或含量,可以间接的提高药用植物大戟中次生代谢产物或其前体的含量。

在对现有文献的分析中,“Plant Cell(植物细胞),1992,4(10):1333-1344”报道了从马铃薯中克隆了3-羟基-3-甲基戊二酰辅酶A还原酶基因,NCBI网站上公布了橡胶树等的3-羟基-3-甲基戊二酰辅酶A还原酶基因的序列。但至今尚未有药用植物大戟Ep-Hmgr蛋白序列及其核酸序列报道。

在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的药用植物大戟Ep-Hmgr蛋白序列及其核酸序列。

发明内容

本发明的目的在于克服现有技术中的不足,提供一种药用植物大戟Ep-Hmgr蛋白编码序列。使其包含所说基因的融合基因构建体,携带该构建体的新的重组表达载体,被所说的表达载体转化植物细胞,以及由转化细胞产生的所说基因的转基因植物及其后代,包括植物种子及植物组织,所获得的转基因植物将具有显著提高的次生代谢产物含量。

本发明是通过以下技术方案实现的,本发明所分离出的DNA分子包括:编码具有药用植物大戟Ep-Hmgr蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55℃条件下与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列杂交。

较佳地,所述的序列编码具有SEQ ID NO.3所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列。

本发明分离出的药用植物大戟Ep-Hmgr蛋白多肽,它包括:具有SEQ ID NO.3氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.3序列的多肽。

在本发明中,“分离的”、“纯化的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组分分开,而且已经与在细胞中伴随其的蛋白质分开。

在本发明中,术语“药用植物大戟Ep-Hmgr蛋白(或多肽)编码序列”指编码具有药用植物大戟Ep-Hmgr蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中第81-1832位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框第81-1832位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中第81-1832位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.3所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.3中从核苷酸第81-1832位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。

该术语还包括能编码具有与天然的药用植物大戟Ep-Hmgr蛋白相同功能的蛋白的SEQ ID NO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。

在本发明中,术语“药用植物大戟Ep-Hmgr蛋白或多肽”指具有药用植物大戟Ep-Hmgr蛋白活性的SEQ ID NO.3序列的多肽。该术语还包括具有与天然药用植物大戟Ep-Hmgr蛋白相同功能的SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括药用植物大戟Ep-Hmgr蛋白的活性片段和活性衍生物。

本发明的药用植物大戟Ep-Hmgr蛋白多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与药用植物大戟Ep-Hmgr蛋白DNA杂交的DNA所编码的蛋白、以及利用药用植物大戟Ep-Hmgr蛋白多肽的血清获得的多肽或蛋白。

在本发明中,“药用植物大戟Ep-Hmgr蛋白保守性变异多肽”指与SEQ ID NO.3的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。

表1

最初的残基代表性的取代优选的取代Ala(A)Val;Leu;IleValArg(R)Lys;Gln;AsnLysAsn(N)Gln;His;Lys;ArgGlnAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAla

His(H)Asn;Gln;Lys;ArgArgIle(I)Leu;Val;Met;Ala;PheLeuLeu(L)Ile;Val;Met;Ala;PheIleLys(K)Arg;Gln;AsnArgMet(M)Leu;Phe;IleLeuPhe(F)Leu;Val;Ile;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;PheTyrTyr(Y)Trp;Phe;Thr;SerPheVal(V)Ile;Leu;Met;Phe;AlaLeu

表2

83%identity in 1198 nt over lap

Query 610 ATGGGACGATTCCTTCGTATTCTCTTGAATCGAAGCTCGGGGACTGTAAGAGAGCGGCTG

669

          |||||| ||| || || |||||||| || ||||||||||||||||| || |||||||||

Sbjct 537 ATGGGAAGATACCCTCCTATTCTCTGGAGTCGAAGCTCGGGGACTGCAAACGAGCGGCTG

596

Query 670 AGATTCGGCGGGAGGCTTTACAGAGGATGACGGGGAGGTCTTTGGAGGGTTTGCCTGTTG

729

           |||||| || |||||||| |||||||||||  |||||||  |||| || ||||| || |

Sbjct 597 CGATTCGACGCGAGGCTTTGCAGAGGATGACAAGGAGGTCGCTGGAAGGCTTGCCAGTAG

656

Query 730 AGGGATTCGATYACGAGTCGATTTTAGGTCAGTGCTGTGAAATGCCGGTTGGATATGTGC

789

          | || |||||| |||||||||||||||| || |||||||||||||| || ||||| ||||

Sbjct 657 AAGGGTTCGATTACGAGTCGATTTTAGGACAATGCTGTGAAATGCCAGTGGGATACGTGC

716

Query 790 AGATTCCGGTTGGAATTGCCGGTCCGTTGCTGCTGGATGGGCGAGAGTACTCTGTTCCGA

849

          |||||||||| || ||||| || |||||| ||||| | || || |||||||||||||| |

Sbjct 717 AGATTCCGGTGGGGATTGCGGGGCCGTTGTTGCTGAACGGCCGGGAGTACTCTGTTCCAA

776

Query 850 TGGCGACTACCGAGGGCTGTTTGGTGGCTAGCACTAACAGAGGGTGTAAGGCGATTCATC

909

          ||||||| || ||||| ||||||||||| |||||||| |||||||||||||| ||| |

Sbjct 777 TGGCGACCACGGAGGGTTGTTTGGTGGCGAGCACTAATAGAGGGTGTAAGGCCATTTACT

836

Query 910 TGTCCGGTGGTGCCGACAGTGTCCTGTTGAAGGATGGCATGACAAGAGCTCCCGTTGTTC

969

          |||| ||||| |||  ||| ||  ||||||||||||||||||||||||| || ||||||

Sbjct 837 TGTCAGGTGGGGCCACCAGCGTTTTGTTGAAGGATGGCATGACAAGAGCGCCTGTTGTTA

896

Query 970 GGTTCACATCGGTGAGGAGGGCTGCTGAATTGAAGTTTTTCTTAGAGAGTCCTGAGAATT

1029

          | ||| | |||| ||  || || || || |||||||| ||||| |||  |||||| ||||

Sbjct 897 GATTCGCGTCGGCGACTAGAGCCGCGGAGTTGAAGTTCTTCTTGGAGGATCCTGACAATT

956

Query 1030 TCGATAGCTTATCCGTCGTTTTCAATAGGTCCAGTGGATTTGCAAAGCTCCTAAACATAC

1089

           | |||| |||  |||| ||||| || | ||| ||| ||||||| | ||||| |  |||

Sbjct 957 TTGATACCTTGGCCGTAGTTTTTAACAAGTCTAGTAGATTTGCGAGGCTCCAAGGCATTA

1016

Query 1090 AATGCACTCTAGCCGGGAGGAATCTATATATGAGATTCACCTGCTTCACTGGTGATGCAA

1149

           ||||| |  | || || | |||||| |||| |||||||| ||||  |||||| |||||||

Sbjct  1017 AATGCTCAATTGCTGGTAAGAATCTTTATATAAGATTCAGCTGCAGCACTGGCGATGCAA

1076

Query 1150 TGGGGATGAACATGGTTTCCAAAGGGGTCCAAAACGTCCTTGAGTTCCTTCAAAGTGATT

1209

           ||||||||||||||||||| |||||||| |||||||| ||||| || |||||||||||||

Sbjct 1077 TGGGGATGAACATGGTTTCTAAAGGGGTTCAAAACGTTCTTGAATTTCTTCAAAGTGATT

1136

Query 1210 TCCCTGACATGGATGTTCTGGGCATCTCAGGAAATTATTGTTCCGACAAAAAGCCAGCCG

1269

           |  |||| ||||||||  | |||||||||||||||| |||||| || || ||||| || |

Sbjct 1137 TTTCTGATATGGATGTCATTGGCATCTCAGGAAATTTTTGTTCGGATAAGAAGCCTGCTG

1196

Query 1270 CAGTGAACTGGATTGAAGGACGAGGCAAATGGGTTGTCTGTGAGGCGATTATCAAGGAAG

1329

           | || || |||||||||||||| |||||||  ||||| |||||||| |||||||||||||

Sbjct 1197 CTGTAAATTGGATTGAAGGACGTGGCAAATCAGTTGTTTGTGAGGCAATTATCAAGGAAG

1256

Query 1330 AGGTGGTGAAGAAGGTGTTGAAGACTAGTGTTGCTGCACTAGTGGAGCTGAACATGGTCA

1389

           |||||||||||||||||||||| || | ||| ||  | ||||||||||| |||||| |||

Sbjct 1257 AGGTGGTGAAGAAGGTGTTGAAAACCAATGTGGCCTCCCTAGTGGAGCTTAACATGCTCA

1316

Query 1390 AGAATCTGGCTGGTTCAGCTGTTGCTGGGTCTCTTGGTGGATTCAATGCACATGCTGCTA

1449

            ||||||| |||||||| |||||||||||  || | |||||||| ||||| ||||| |  |

Sbjct  1317 AGAATCTTGCTGGTTCTGCTGTTGCTGGTGCTTTGGGTGGATTTAATGCCCATGCAGGCA

1376

Query 1450 ACATAGTCTCTGCAGTTTTCATTGCCACTGGCCAGGATCCAGCCCAGAATGTTGAGAGCT

1509

           |||| || |||||| | || ||||||||||||||||||||||| |||||||||||||| |

Sbjct 1377 ACATCGTATCTGCAATCTTTATTGCCACTGGCCAGGATCCAGCACAGAATGTTGAGAGTT

1436

Query 1510 CTCACTGCATGACCATGATGGAAGCTGTCAATGATGGAAAGGATCTCCACATCTCTGTAA

1569

           |||| ||||| |||||||||||||||||||||||||||||||||||||| |||||||| |

Sbjct 1437 CTCATTGCATTACCATGATGGAAGCTGTCAATGATGGAAAGGATCTCCATATCTCTGTGA

1496

Query 1570 CCATGCCCTCGATTGAGGTGGGCACGGTTGGAGGAGGTACTCAGCTAGCATCACAGTCAG

1629

           |||||||||| ||||||||||| || || ||||| || ||||| || ||||| ||||| |

Sbjct 1497 CCATGCCCTCCATTGAGGTGGGTACAGTCGGAGGTGGAACTCAACTTGCATCTCAGTCTG

1556

Query 1630 CTTGCCTGAACTTGCTTGGTGTAAAAGGAGCAAATAAAGAATCACCAGGAGCAAACGCAA

1689

           |||| || || |||||||| || || || ||||| ||||| || |||||| ||||| |||

Sbjct 1557 CTTGTCTCAATTTGCTTGGGGTGAAGGGTGCAAACAAAGAGTCGCCAGGATCAAACTCAA

1616

Query 1690 GGCAACTCGCCACCATAGTAGCTGGTTCAGTTCTTGCTGGAGAACTCTCTCTAATGTCTG

1749

           |||  || ||  |||| ||||||||||||||| | ||||| || |||||  | |||||||

Sbjct 1617 GGCTCCTTGCTGCCATCGTAGCTGGTTCAGTTTTGGCTGGTGAGCTCTCCTTGATGTCTG

1676

Query 1750 CCATTGCAGCAGGGCAACTGGTCAAGAGCCACCTGAAGTACAATAGATCGAGCAAAGA

1807

           |||||||||| ||||| || |||||||| ||| ||||||| ||||||| |||||||||

Sbjct 1677 CCATTGCAGCTGGGCAGCTTGTCAAGAGTCACATGAAGTACAACAGATCCAGCAAAGA

1734

81%identity in 281nt over lap

Query 216 ACCAATGCCGTTTTCTTCACCCTCTTTTTCTCCGTCGCCTATTACCTCCTCCACCGGTGG

275

           ||||| || ||||||||||| || || ||||| || || ||||||||||| |||||||||

Sbjct 137  ACCAACGCGGTTTTCTTCACGCTGTTCTTCTCGGTGGCGTATTACCTCCTTCACCGGTGG

196

Query 276 AGGGACAAGATCCGTAACTCCACTCCTCTCCACGTCGTTACTCTCTCTGAAATCGCCGCC

335

           | ||||||||||| ||||||||||| || ||  ||||||||||||||||||| |  ||

Sbjct 197 CGCGACAAGATCCGCAACTCCACTCCCCTTCATATCGTTACTCTCTCTGAAATTGTTGCT

256

Query 336 ATTGTTTCGCTCATTGCCTCATTCATCTATTTGCTTGGATTCTTCGGGATCGGTTTTGTC

395

          ||||| || ||||||||||| ||||| ||  | || ||||||||||| |||| ||||||

Sbjct 257 ATTGTCTCCCTCATTGCCTCTTTCATTTACCTCCTAGGATTCTTCGGTATCGATTTTGTG

31 6

Query 396 CAGTCTCTCATCGCGCGCCCCTCGCATGACACGTGGGACCTTGACGATGCGGATCGGAGT

455

          |||||  |||| || ||| |||| ||||||  ||||||||| || ||| ||||||  |

Sbjct 317 CAGTCATTCATTGCACGCGCCTCCCATGACGTGTGGGACCTCGAAGATACGGATCCCAAC

376

Query 456 TACCTCATTGATGGAGATCACCGCCTCGTCACTTGCTCTCC 496

          |||||||| |||| ||||||||| ||||| |||||| ||||

Sbjct 377 TACCTCATCGATGAAGATCACCGTCTCGTTACTTGCCCTCC 417

Query:药用植物大戟Ep-Hmgr的核酸序列

Sbjct:帕拉橡胶树Hb-Hmgr的核酸序列(AF429388)

表2为本发明的药用植物大戟Ep-Hmgr与帕拉橡胶树(Para rubber tree)Ps-Hmgr的核苷酸序列的同源比较(GAP)表。

表3

83%identity in 572 aa over lap,90%simi larity in 572 aa over lap

Query 13 LHHQKRISEEVDDHRCLSPPLKASDALPLPLYLTNAVFFTLFFSVAYYLLHRWRDKIRNS

72

        LHH+K  +  V+D    +P  KASDALPLPLYLTNAVFFTLFFSVAYYLLHRWRDKIRNS

Sbjct 7 LHHRKH-ATPVEDRSPTTP--KASDALPLPLYLTNAVFFTLFFSVAYYLLHRWRDKIRNS

63

Query 73 TPLHVVTLSEIAAIVSLIASfiyIIgffgigfVQSLIARPSHDTWDLDDADRSYLIDGDH

132

         TPLH+VTLSEIAIVSLIASFIYLLGFFGI  FVQS IAR SHD WDL+D D +YLID DH

Sbjct 64 TPLHIVTLSEIVAIVSLIASFIYLLGFFGIDFVQSFIARASHDVWDLEDTDPNYLIDEDH

123

Query 133 RLVTCSPAKVAPVNS--PPPAKMSVPEPIVSPLASEEDEEIVKSVVNGTIPSYSLESKLG

190

          RLVTC PA++    +    P K+   EP+++PL SEEDE IV SVV+G IPSYSLESKLG

Sbjct 124 RLVTCPPANISTKTTIIAAPTKLPTSEPLIAPLVSEEDEMIVNSVVDGKIPSYSLESKLG

183

Query 191 DCKRAAEIRREALQRMTGRSLEGLPVEGFDXESILGQCCEMPVGYVQIPVGIAGPLLLDG

250

          DCKRAA IRREALQRMT RSLEGLPVEGFD ESILGQCCEMPVGYVQIPVGIAGPLLL+G

Sbjct 184 DCKRAAAIRREALQRMTRRSLEGLPVEGFDYESILGQCCEMPVGYVQIPVGIAGPLLLNG

243

Query 251 REYSVPMATTEGCLVASTNRGCKAIHLSGGADSVLLKDGMTRAPVVRFTSVRRAAELKFF

310

          REYSVPMATTEGCLVASTNRGCKAI+LSGGA SVLLKDGMTRAPVVRF S  RAAELKFF

Sbjct 244 REYSVPMATTEGCLVASTNRGCKAIYLSGGATSVLLKDGMTRAPVVRFASATRAAELKFF

303

Query 311 LESPENFDSLSVVFNRSSGFAKLLNIQCTLAGRNLYMRFTCFTGDAMGMNMVSKGVQNVL

370

          LE P+NFD+L+VVFN+SS FA+L  I+C++AG+NLY+RF+C TGDAMGMNMVSKGVQNVL

Sbjct 304 LEDPDNFDTLAVVFNKSSRFARLQGIKCSIAGKNLYIRFSCSTGDAMGMNMVSKGVQNVL

363

Query 371 EFLQSDFPDMDVLGISGNYCSDKKPAAVNWIEGRGKWvvceaiikeevvkkvLKTSVAAL

430

          EFLQSDF DMDV+GISGN+CSDKKPAAVNWIEGRGK VVCEAII KEEVVKKVLKT+VA+L

Sbjct 364 EFLQSDFSDMDVIGISGNFCSDKKPAAVNWIEGRGKSVVCEAIIKEEVVKKVLKTNVASL

423

Query 431 VELNMVKNIagsavagsIggFNAHAANIVSAVFIATGQDPAQNVESSHCMTMMEAVNDGK

490

          VELNM+KNLAGSAVAG+LGGFNAHA NIVSA+FIATGQDPAQNVESSHC+TMMEAVNDGK

Sbjct 424 VELNMLKNLAGSAVAGALGGFNAHAGNIVSAIFIATGQDPAQNVESSHCITMMEAVNDGK

483

Query 491 DLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPGANARQLATIVAGSVLAG

550

          DLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPG+N+R LA IVAGSVLAG

Sbjct 484 DLHISVTMPSIEVGTVGGGTQLASQSACLNLLGVKGANKESPGSNSRLLAAIVAGSVLAG

543

Query 551  ELSLMSAIAAGQLVKSHLKYNRSSKDVSSFAS  582

           ELSLMSAIAAGQLVKSH+KYNRSSKD+S AS

Sbjct 544  ELSLMSAIAAGQLVKSHMKYNRSSKDMSKAAS  575

Query:药用植物大戟Ep-Hmgr氨基酸序列

Sbjct:帕拉橡胶树Hb-Hmgr氨基酸序列(AAQ63055.1)

表3为本发明的药用植物大戟Ep-Hmgr蛋白的氨基酸序列与帕拉橡胶树Hb-Hmgr的氨基酸序列的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。

发明还包括药用植物大戟Ep-Hmgr蛋白或多肽的类似物。这些类似物与天然3-羟基-3-甲基戊二酰辅酶A还原酶多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。

修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。

在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的药用植物大戟Ep-Hmgr蛋白多肽时,可以将药用植物大戟Ep-Hmgr蛋白编码序列可操作地连于表达调控序列,从而形成药用植物大戟Ep-Hmgr蛋白表达载体。

如本发明所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。

还可用Northern印迹法技术分析药用植物大戟Ep-Hmgr蛋白基因产物的表达,即分析药用植物大戟Ep-Hmgr蛋白的RNA转录物在细胞中的存在与否和数量。

此外,本发明中可用作探针的核酸分子,该分子通常具有药用植物大戟Ep-Hmgr蛋白核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码药用植物大戟Ep-Hmgr蛋白的核酸分子。

本发明涉及检测样品中是否存在药用植物大戟Ep-Hmgr蛋白核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于药用植物大戟Ep-Hmgr蛋白核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。

此外,根据本发明的药用植物大戟Ep-Hmgr蛋白核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选药用植物大戟Ep-Hmgr蛋白同源基因或同源蛋白。

为了得到与药用植物大戟Ep-Hmgr蛋白基因相关的药用植物大戟cDNAs的点阵,可以用DNA探针筛选药用植物大戟cDNA文库,这些探针是在低严紧条件下,用32P对药用植物大戟Ep-Hmgr蛋白的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自药用植物大戟的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与药用植物大戟Ep-Hmgr蛋白的基因家族的核苷酸序列。

本发明的药用植物大戟Ep-Hmgr蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外,还可通过化学合成将突变引入本发明蛋白序列中。

除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。

利用本发明的药用植物大戟Ep-Hmgr蛋白,通过各种常规筛选方法,可筛选出与药用植物大戟Ep-Hmgr蛋白发生相互作用的物质,或者受体、抑制剂或拮剂等。本发明的药用植物大戟Ep-Hmgr蛋白基因可通过基因工程技术用来提高药用植物大戟中次生代谢产物或其前体的含量,而这些次生代谢产物在临床上具有巨大的应用价值,对保护人民的健康生长有所帮助。因而本发明具有很大的应用前景。

具体实施方式

下面结合实验室具体的试验数据和结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:ColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。

实施例1

药用植物大戟Ep-Hmgr蛋白基因的克隆

1.组织分离(isolation)

药用植物大戟根来源于江苏省药用植物生物技术重点实验室,采取材料后,立即置于液氮中冷冻保存。

2.RNA的分离(RNA isolation)

取部分组织,用研钵研碎,加入盛有裂解液的1.5mL EP管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至1.5mL EP管中,抽提总RNA(TRIzol Reagents,GIBCO BRL,USA)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。

3.基因的全长克隆(Cloning of Full-length cDNA)

根据一些植物Hmgr的氨基酸保守序列,设计兼并引物,利用同源性基因克隆原理,采用Smart-RACE方法(Clonetech试剂盒)进行cDNA全长克隆,分三个阶段进行:

(1)3’-RACE

PCR(UPM+F2)得到EPF2’(1061bp),回收,连接到pGEMT-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsingroup,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知的木本植物如橡胶树(Hevea brasiliensis)等的Hmgr基因的同源性很高,故初步认为它是一个Hmgr基因。

(2)5’-RACE

根据3’RACE结果,设计反向特异引物R2,经PCR(UPM+R2)得到EPR2’(1397bp)(过程同(1))。回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行测序。

(3)将5’RACE测序结果与3’RACE测序结果比序并进行拼接,得到全长片段序列信息,并设计一对特异引物进行PCR扩增Ep-Hmgr编码区(DF1+DR1)得到Ep-Hmgr编码区(1752bp)(过程同(1))。

BLAST的结果证明从药用植物大戟中新得到的基因确为一个植物Hmgr基因。通过组合使用上述3种方法,获得了候选的药用植物大戟EpHMGR的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物EpHMGRF1:5’-CCTCCAACTCATAAACACGCAT-3’(SEQ ID NO.1)为正向引物,寡核苷酸EpHMGRR1:5’-GTTTGTACAACAACATATG-3’(SEQ ID NO.2)为反向引物,以总RNA为模板,进行RT-PCR扩增,EpHMGRF1/EpHMGRR2的PCR条件为94℃5分钟,随之以94℃1分钟、58℃1分钟和72℃2分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为2162bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQID NO.3所示的序列。

实施例2

药用植物大戟Ep-Hmgr蛋白基因的序列信息与同源性分析

本发明新的药用植物大戟Ep-Hmgr蛋白全长cDNA的长度为2200bp,详细序列见SEQ ID NO.3,其中开放读框位于81-1832位核苷酸。根据全长cDNA推导出药用植物大戟Ep-Hmgr蛋白的氨基酸序列,共583个氨基酸残基,分子量62710.33,pI为6.51。详细序列见SEQ ID NO.4。

将药用植物大戟Ep-Hmgr蛋白的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank +EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶基因(AF429388)在核苷酸水平上具有较高的同源性(附表2);在氨基酸水平上,它与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶(GenBank Accession No.AAQ63055.1)有83%的相同性和90%的相似性(见表3)。由此可见,药用植物大戟Ep-Hmgr蛋白与帕拉橡胶树3-羟基-3-甲基戊二酰辅酶A还原酶无论从核酸还是蛋白水平上都存在较高的同源性,故可以认为药用植物大戟Ep-Hmgr蛋白在功能上也相似。

实施例3

药用植物大戟Ep-Hmgr蛋白在大肠杆菌中进行原核表达及提纯

在该实施例中,将全长的药用植物大戟Ep-Hmgr蛋白编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。

将药用植物大戟Ep-Hmgr蛋白多肽以融合蛋白的形式在大肠杆菌中进行原核表达。

原核表达载体的构建,以及转化大肠杆菌

根据药用植物大戟Ep-Hmgr蛋白的氨基酸序列,设计蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将药用植物大戟Ep-Hmgr蛋白基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-3-羟基-3-甲基戊二酰辅酶A还原酶表达载体的工程菌BL21-pET32a(+)-3-羟基-3-甲基戊二酰辅酶A还原酶。

表达Trx-Ep-Hmgr重组蛋白的工程菌的分离鉴定

挑取单菌落的BL21-pET32a(+)-Ep-Hmgr工程菌于3mL含100μg/mL氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/mL氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1mL菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μL,蒸馏水45μL,二巯基乙醇5μL),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-3-Ep-Hmgr融合蛋白的工程菌。

Trx-3-Ep-Hmgr融合蛋白的提取纯化

按上述方法诱导表达Trx-Ep-Hmgr融合表达蛋白的工程菌BL21-pET32a(+)-Ep-Hmgr,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mM CAPS,pH11.0,0.3%N-lauroylsarcosine)来溶解,再用透析缓冲液(200mM Tris-HCl,pH8.5)来透析。然后用组氨酸结合(His·Bind)树脂进行亲和层析,并经洗脱缓冲液(1Mimidazole,500mM NaCl,20mM Tris-HCl pH 7.9)洗脱来收集Trx-Ep-Hmgr融合蛋白。融合蛋白经肠激酶20℃酶切16小时后即可分离获得Ep-Hmgr的表达蛋白。

纯化的3-羟基-3-甲基戊二酰辅酶A还原酶的活力测定

按Thorsness等(Mol.Cell.Biol,1989,9:5702-5712)的方法对表达纯化的3-羟基-3-甲基戊二酰辅酶A还原酶进行酶活力的测定,研究在其作用下3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的能力。反应体系含有0.05M Tris-HCl(pH=7.5),5mM DTT,200mMNADPH,300mM 14C标记的乙酰辅酶A(1mCi/mmol)及20mM磷酸葡萄糖,每毫升9.75mU磷酸葡萄糖脱氢酶用于NADPH的再生,总体积为100uL。反应流程如下:首先加入400mg蛋白质37℃水浴15分钟,使3-羟基-3-甲基戊二酰辅酶A转化成甲羟戊酸。反应终产物和酶作用物在Bio-Rex5柱子上分离,反应终产物可从柱子中水洗下来。用液体闪烁记数器测定14C标记的反应终产物的含量。结果表明,表达的蛋白的确具有催化3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的酶活性。

实施例4

药用植物大戟Ep-Hmgr蛋白在烟草中进行真核细胞表达

将含目的基因(药用植物大戟Ep-Hmgr蛋白基因)的表达载体的构建,根据药用植物大戟Ep-Hmgr蛋白的全长序列(SEQ ID NO.3),设计扩增出完整编码阅读框的引物,并在上游和下游引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将药用植物大戟Ep-Hmgr蛋白基因cDNA克隆至中间载体(如pBluescript),进一步克隆到双元表达载体(如pBI121和pCAMBIA1301),在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌中,利用叶盘法技术转化模式植物烟草。

利用叶盘法转化烟草

1.用无菌牙签挑取YEB选择平板上的阳性菌落,接种于2mL YEB液体(Sm+,Kan+),28℃,200rpm振荡培养24-36小时;

2.室温下4,000g离心10min;

3.弃上清,菌体用1/2MS液体培养基悬浮,稀释到原体积的5-20倍,使菌液的OD600=0.5左右;

4.取生长两周左右的烟草的无菌叶片,去掉其主叶脉,将其剪成约1平方厘米见方的小叶片;

5.将叶片放入制备好的菌液中,浸泡2-5min,在无菌滤纸上吸干菌液;

6.把经侵染的叶片放于MS培养基上,28℃暗培养48小时;

7.将叶片转到愈伤培养基(MS+6-BA 1.0mg/L+NAA0.1mg/L+Kan 50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见愈伤组织的形成;

8.约20天后可见分化芽长出,待芽长大后,切下,置于生根培养基(1/2MS+NAA0.5mg/L+Kan25mg/L)上进行生根培养,2-7天左右生根;

9.等根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。利用Northern blotting检测Ep-Hmgr蛋白在转基因烟草植株中的表达

1.RNA的提取:待转基因烟草叶片长到2-3片叶时抽取烟草叶的RNA。以正常生长的植株作为对照(条件同上),利用TRIzol试剂盒(GIBCO BRL,USA)提取并参考《分子克隆》有关RNA的制备章节(Sambrook等,1989)。

2.RNA的定量:参考《分子克隆》(Sambrook等,1989),分光光度计测OD260;RNA含量计算:1OD260=40μg/mL。

3.总RNA琼脂糖凝胶电泳分离:1)取6mL25×(倍)电泳缓冲液,加入117mL无菌水,混匀。2)称取1.5g琼脂糖,加入到上述溶液中,于微波炉里加热融化,转入55℃水浴中。3)于通风橱中取26.8mL甲醛,加入到55℃的凝胶溶液中,混匀。4)迅速倒入制胶板中,室温水平放置30分钟,待胶凝固。5)将提取的RNA(20μg)溶解于RNA变性溶液中,在65℃下加热10分钟,然后立即放在冰上。6)在样品中加入2uL10×上样缓冲液,混匀。7)在电泳液未盖过胶的条件下点样,5V/cm电压电泳5小时左右。

4.RNA尼龙膜上转移:1)转移之前,将尼龙膜用10×SSC浸泡。2)将湿润的膜准确地盖在膜上,将两张与膜大小相同的滤纸置2×SSC溶液中湿润,盖在膜上,排除气泡。3)滤纸上放一叠与膜大小相同的吸水纸,在吸水纸上放一玻璃板和一重物,水平放置,转移12-20小时。4)转移后,将膜于80℃烘烤2小时。

5.膜上杂交信号的检出:1)将膜浸在5×Dendart’s,0.1%SDS,0.1mg/mL鲑鱼精DNA],65℃下预杂交2小时。2)将用Gene ImagesTM Contents CDP-StarTM labellingmodule标记的探针在沸水中变性5分钟,直接加入1)的杂交液中,于65℃杂交16-24小时。3)取出膜,置于洗膜液I(1×SSC,1%SDS)中,于65℃漂洗3次,每次15分钟。转入洗膜液II(0.1×SSC,1%SDS)中于65℃漂洗3次,每次15分钟。4)用X光片压片60-90分钟,然后显影、定影(方法参照Roche DIG labeled试剂盒说明书)。Northern杂交表明:转基因烟草的Ep-Hmgr转录水平比未转基因的对照材料的表达水平明显高得多。

含药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶基因(Ep-Hmgr)的转基因烟草植株中的Ep-Hmgr蛋白活性测定

1.蛋白的提取:a)取500mg叶片,加入1000uL1×PBS(KH2PO4 0.2 g/L,Na2HPO4 1.15g/L,KCl 0.2 g/L,NaCl 8g/L)于50mL eppondorf管中研磨;b)13000rpm,4℃离心10分钟;c)取上清,备用。注:以上过程于冰上进行。

2.蛋白的定量:参考Bradford法(Bradford,1976)。取2uL蛋白样品,加入1mL Bradford试剂,混匀后,分光光度计测OD595;蛋白含量计算:1OD595=28.57μg。

3.Al-Hmgr蛋白活性测定  参考Thorsness等(Mol.Cell.Biol,1989,9:5702-5712)的方法(详细操作过程同实例3)。结果表明,转基因烟草植株的中的Ep-Hmgr蛋白酶活性比没有转基因的对照明显高得多(P<0.05)。从而再次证明所克隆的药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶基因的确具有催化3-羟基-3-甲基戊二酰辅酶A生成甲羟戊酸的酶活性,将可用于利用转基因技术来提高植物的次生代谢产物的研究和产业化中。

本发明涉及的序列及记号分列如下:

(1)SEQ ID NO.1的信息

(i)序列特征:

(A)长度:20bp

(B)类型:核苷酸

(C)链性:单链

(D)拓扑结构:线性

(ii).分子类型:寡核苷酸

(iii).序列描述:SEQ ID NO.1

CCTCCAACTCATAAACACGCAT

(2)SEQ ID NO.2的信息

(i)序列特征:

(A)长度:19bp

(B)类型:核苷酸

(C)链性:单链

(D)拓扑结构:线性

(ii)分子类型:寡核苷酸

(iii)序列描述:SEQ ID NO.2

GTTTGTACAACAACATATG

(3)SEQ ID NO.3的信息

(i)序列特征:

(A)长度:2200bp

(B)类型:核苷酸

(C)链性:单链

(D)拓扑结构:线性

(ii)分子类型:核苷酸

(iii)序列描述:SEQ ID NO.3

(4)SEQ ID NO.4的信息

(i)序列特征:

(A)长度:583氨基酸

(B)类型:氨基酸

(C)链性:单链

(D)拓扑结构:线性

(ii).分子类型:多肽

(iii).序列描述:SEQ ID NO.4

<110>徐州师范大学

<120>药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶蛋白编码序列

<130>药用植物大戟3-羟基-3-甲基戊二酰辅酶A还原酶蛋白编码序列及应用

<160>2

<170>PatentIn version 3.3

<210>1

<211>2200

<212>DNA

<213>药用植物大戟Euphorbia pekinensis

<220>

<221>CDS

<222>(81)..(1832)

<400>1

acgcggggcc tccaactcat aaacacgcat tcaaacacct cctctactct cttccttcca     60

cctcctcctc ctccaccacc atg gat tcc acc aaa tcg cgg cgg ccg atc cgc    113

                          Met Asp Ser Thr Lys Ser Arg Arg Pro Ile Arg

                            1               5                   10

cac otc cac cac caa aaa cgc atc tcc gaa gag gtt gac gac cac cgc      161

His Leu His His Gln Lys Arg Ile Ser Glu Glu Val Asp Asp His Arg

                 15                  20                  25

tgt ctc tca ccg cct ctc aaa gcc tcc gac gct ctc cct ctc cct ttg      209

Cys Leu Ser Pro Pro Leu Lys Ala Ser Asp Ala Leu Pro Leu Pro Leu

              30                  35                  40

tat cta acc aat gcc gtt ttc ttc acc ctc ttt ttc tcc gtc gcc tat      257

Tyr Leu Thr Asn Ala Val Phe Phe Thr Leu Phe Phe Ser Val Ala Tyr

             45                  50                  55

tac ctc ctc cac cgg tgg agg gac aag atc cgt aac tcc act cct ctc      305

Tyr Leu Leu His Arg Trp Arg Asp Lys Ile Arg Asn Ser Thr Pro Leu

 60                  65                  70                  75

cac gtc gtt act ctc tct gaa atc gcc gcc att gtt  tcg ctc att gcc    353

His Val Val Thr Leu Ser Glu Ile Ala Ala Il e Val Ser Leu Ile Ala

                  80                  85                   90

tca ttc atc tat ttg ctt gga ttc ttc ggg atc ggt ttt gtc cag tct     401

Ser Phe Ile Tyr Leu Leu Gly Phe Phe Gly Ile Gly Phe Val Gln Ser

                 95                 100                 105

ctc atc gcg cgc ccc tcg cat gac acg tgg gac ctt gac gat gcg gat     449

LeuI le Ala Arg Pro Ser His Asp Thr Trp Asp Leu Asp Asp Ala Asp

              110                 115                 120

cgg agt tac ctc att gat gga gat cac cgc ctc gtc act tgc tct ccg     497

Arg Ser Tyr Leu Ile Asp Gly Asp His Arg Leu Val Thr Cys Ser Pro

            125                 130                 135

gcg aag gtt gct ccg gtg aat tct cct cct ccg gcg aaa atg tcc gtt     545

Ala Lys Val Ala Pro Val Asn Ser Pro Pro Pro Ala Lys Met Ser Val

140                 145             150                     155

ccg gaa ccg atc gtt tcg cct cta gcc tcc gag gag gat gag gaa atc     593

Pro Glu Pro Ile Val Ser Pro Leu Ala Ser Glu Glu Asp Glu Glu Ile

                  160                 165                 170

gtc aaa tcg gtt gtc aat ggg acg att cct tcg tat tct ctt gaa tcg     641

Val Lys Ser Val Val Asn Gly Thr Ile Pro Ser Tyr Ser Leu Glu Ser

                175                 180                 185

aag ctc ggg gac tgt aag aga gcg gct gag att cgg cgg gag gct tta    689

Lys Leu Gly Asp Cys Lys Arg Ala Ala Glu Ile Arg Arg Glu Ala Leu

              190                 195                  200

cag agg atg acg ggg agg tct ttg gag ggt ttg cct gtt gag gga ttc    737

Gln Arg Met Thr Gly Arg Ser Leu Glu Gly Leu Pro Val Glu Gly Phe

            205                 210                 215

gat tac gag tcg att tta ggt cag tgc tgt gaa atg ccg gtt gga tat    785

Asp Tyr Glu Ser Ile Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr

220                 225                 230                 235

gtg cag att ccg gtt gga att gcc ggt ccg ttg ctg ctg gat ggg cga    833

Val Gln Ile Pro Val Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Arg

                  240                 245                 250

gag tac tct gtt ccg atg gcg act acc gag ggc tgt ttg gtg gct agc    881

Glu Tyr Ser Val Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser

                255                 260                 265

act aac aga ggg tgt aag gcg att cat ctg tcc ggt ggt gcc gac agt    929

Thr Asn Arg Gly Cys Lys Ala Ile His Leu Ser Gly Gly Ala Asp Ser

            270                   275                280

gtc ctg ttg aag gat ggc atg aca aga gct ccc gtt gtt cgg ttc aca    977

Val Leu Leu Lys Asp Gly Met Thr Arg Ala Pro Val Val Arg Phe Thr

            285                 290                 295

tcg gtg agg agg gct gct gaa ttg aag ttt ttc tta gag agt cct gag    1025

Ser Val Arg Arg Ala Ala Glu Leu Lys Phe Phe Leu Glu Ser Pro Glu

300                 305                 310                 315

aat ttc gat agc tta tcc gtc gtt ttc aat agg tcc agt gga ttt gca    1073

Asn Phe Asp Ser Leu Ser Val Val Phe Asn Arg Ser Ser Gly Phe Ala

                  320                 325                 330

aag ctc cta aac ata caa tgc act cta gcc ggg agg aat cta tat atg    1121

Lys Leu Leu Asn Ile Gln Cys Thr Leu Ala Gly Arg Asn Leu Tyr Met

                335                 340                 345

aga ttc acc tgc ttc act ggt gat gca atg ggg atg aac atg gtt tcc    1169

Arg Phe Thr Cys Phe Thr Gly Asp Ala Met Gly Met Asn Met Val Ser

              350                 355                 360

aaa ggg gtc caa aac gtc ctt gag ttc ctt caa agt gat ttc cct gac    1217

Lys Gly Val Gln Asn Val Leu Glu Phe Leu Gln Ser Asp Phe Pro Asp

            365                 370                 375

atg gat gtt ctg ggc atc tca gga aat tat tgt tcc gac aaa aag cca    1265

Met Asp Val Leu Gly Ile Ser Gly Asn Tyr Cys Ser Asp Lys Lys Pro

380                 385                 390                 395

gcc gca gtg aac tgg att gaa gga cga ggc aaa tgg gtt gtc tgt gag    1313

Ala Ala Val Asn Trp Ile Glu Gly Arg Gly Lys Trp Val Val Cys Glu

                  400                 405                 410    

gcg att atc aag gaa gag gtg gtg aag aag gtg ttg aag act agt gtt    1361

Ala Ile Ile Lys Glu Glu Val Val Lys Lys Val Leu Lys Thr Ser Val

                    415                 420                425

gct gca cta gtg gag ctg aac atg gtc aag aat ctg gct ggttca gct    1409

Ala Ala Leu Val Glu Leu Asn Met Val Lys Asn Leu Ala Gly Ser Ala

              430                 435                 440

gtt gct ggg tct ctt ggt gga ttc aat gca cat gct gct aac ata gtc    1457

Val Ala Gly Ser Leu Gly Gly Phe Asn Ala His Ala Ala Asn Ile Val

            445                 450                 455

tct gca gtt ttc att gcc act ggc cag gat cca gcc cag aat gtt gag    1505

Ser Ala Val Phe Ile Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu

460                 465                 470                 475

agc tct cac tgc atg acc atg atg gaa gct gtc aat gat gga aag gat    1553

Ser Ser His Cys Met Thr Met Met Glu Ala Val Asn Asp Gly Lys Asp

                  480                 485                 490

ctc cac atc tct gta acc atg ccc tcg att gag gtg ggc acg gtt gga    1601

Leu His Ile Ser Val Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly

                495                 500                 505

gga ggt act cag cta gca tca cag tca gct tgc ctg aac ttg ctt ggt    1649

Gly Gly Thr Gln Leu Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly

              510         515                         520

gta aaa gga gca aat aaa gaa tca cca gga gca aac gca agg caa ctc    1697

Val Lys Gly Ala Asn Lys Glu Ser Pro Gly Ala Asn Ala Arg Gln Leu

            525                 530                 535

gcc acc ata gta gct ggt tca gtt ctt gct gga gaa ctc tct cta atg      1745

Ala Thr Ile Val Ala Gly Ser Val Leu Ala Gly Glu Leu Ser Leu Met

540                 545                 550                 555

tct gcc att gca gca ggg caa ctg gtc aag agc cac ctg aag tac aat      1793

Ser Ala Ile Ala Ala Gly Gln Leu Val Lys Ser His Leu Lys Tyr Asn

                  560                 565                 570

aga tcg agc aaa gac gtg tcc agc ttt gca tca tct taa ataaggcggc       1842

Arg Ser Ser Lys Asp Val Ser Ser Phe Ala Ser Ser

                  575                 580

cgagatgact cgtggacaga gacagagaga gagagaaggg gaagaagatg aagaagtctg    1902

agtatgtaca cccatgtgag atttaaatct taaagctttt taaattagct ttaaagctgc    1962

tccaaatcca atcatggaga taaagagaag aattaggtac ataaatttga atctccattt    2022

atgttggtga gagatcacat gtgagcaaaa ggtcacctcc actagcttag taagttgttt    2082

ctggttgtaa tgttattttg tctcctaaaa tttgttaatg tttagttgct ttcctctatt    2142

cttgcaatac atatgttgtt gtacaaacaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa      2200

<210>2

<211>583

<212>PRT

<213>药用植物大戟Euphorbia pekinensis

<400>2

Met Asp Ser Thr Lys Ser Arg Arg Pro Ile Arg His Leu His His Gln

  1               5                  10                  15

Lys Arg Ile Ser Glu Glu Val Asp Asp His Arg Cys Leu Ser Pro Pro

                 20                  25                  30

Leu Lys Ala Ser Asp Ala Leu Pro Leu Pro Leu Tyr Leu Thr Asn Ala

              35                  40                  45

Val Phe Phe Thr Leu Phe Phe Ser Val Ala Tyr Tyr Leu Leu His Arg

             50                  55             60

Trp Arg Asp Lys Ile Arg Asn Ser Thr Pro Leu His Val Val Thr Leu

 65                  70                  75                 80

 Ser Glu Ile Ala Ala Ile Val Ser Leu Ile Ala Ser Phe Ile Tyr Leu

                   85                  90                  95

 Leu Gly Phe Phe Gly Ile Gly Phe Val Gln Ser Leu Ile Ala Arg Pro

                100                  105                110

Ser His Asp Thr Trp Asp Leu Asp Asp Ala Asp Arg Ser Tyr Leu Ile

              115             120                     125

Asp Gly Asp His Arg Leu Val Thr Cys Ser Pro Ala Lys Val Ala Pro

            130                 135                 140

Val Asn Ser Pro Pro Pro Ala Lys Met Ser Val Pro Glu Pro Ile Val

145                 150                 155                 160

Ser Pro Leu Ala Ser Glu Glu Asp Glu Glu Ile Val Lys Ser Val Val

                  165                 170                 175

Asn Gly Thr Ile Pro Ser Tyr Ser Leu Glu Ser Lys Leu Gly Asp Cys

                180                 185                 190

Lys Arg Ala Ala Glu Ile Arg Arg Glu Ala Leu Gln Arg Met Thr Gly

              195                 200                 205

Arg Ser Leu Glu Gly Leu Pro Val Glu Gly Phe Asp Tyr Glu Ser Ile

            210                 215                 220

Leu Gly Gln Cys Cys Glu Met Pro Val Gly Tyr Val Gln Ile Pro Val

225                 230                 235                 240

Gly Ile Ala Gly Pro Leu Leu Leu Asp Gly Arg Glu Tyr Ser Val Pro

                  245                 250                 255

Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Thr Asn Arg Gly Cys

                260                 265                 270

Lys Ala Ile His Leu Ser Gly Gly Ala Asp Ser Val Leu Leu Lys Asp

              275                 280                 285

Gly Met Thr Arg Ala Pro Val Val Arg Phe Thr Ser Val Arg Arg Ala

            290                 295                 300

Ala Glu Leu Lys Phe Phe Leu Glu Ser Pro Glu Asn Phe Asp Ser Leu

305                 310                 315                 320

Ser Val Val Phe Asn Arg Ser Ser Gly Phe Ala Lys Leu Leu Asn Ile

                  325                 330                 335

Gln Cys Thr Leu Ala Gly Arg Asn Leu Tyr Met Arg Phe Thr Cys Phe

                340                 345                 350

Thr Gly Asp Ala Met Gly Met Asn Met Val Ser Lys Gly Val Gln Asn

              355                 360                 365

Val Leu Glu Phe Leu Gln Ser Asp Phe Pro Asp Met Asp Val Leu Gly

            370                 375                 380

Ile Ser Gly Asn Tyr Cys Ser Asp Lys Lys Pro Ala Ala Val Asn Trp

385                 390                 395                 400

Ile Glu Gly Arg Gly Lys Trp Val Val Cys Glu Ala Ile Ile Lys Glu

                  405                 410                 415

Glu Val Val Lys Lys Val Leu Lys Thr Ser Val Ala Ala Leu Val Glu

                420                 425                 430

Leu Asn Met Val Lys Asn Leu Ala Gly Ser Ala Val Ala Gly Ser Leu

              435                 440                445

Gly Gly Phe Asn Ala His Ala Ala Asn Ile Val Ser Ala Val Phe Ile

            450                 455                 460

Ala Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser Ser His Cys Met

465                 470                 475                 480

Thr Met Met Glu Ala Val Asn Asp Gly Lys Asp Leu His Ile Ser Val

                  485                 490                 495

Thr Met Pro Ser Ile Glu Val Gly Thr Val Gly Gly Gly Thr Gln Leu

                500                 505                 510

Ala Ser Gln Ser Ala Cys Leu Asn Leu Leu Gly Val Lys Gly Ala Asn

              515                 520                 525

Lys Glu Ser Pro Gly Ala Asn Ala Arg Gln Leu Ala Thr Ile Val Ala

            530                 535                 540

Gly Ser Val Leu Ala Gly Glu Leu Ser Leu Met Ser Ala Ile Ala Ala

545                 550                 555                 560

Gly Gln Leu Val Lys Ser His Leu Lys Tyr Asn Arg Ser Ser Lys Asp

                565                 570                575

Val Ser Ser Phe Ala Ser Ser

            580

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号