首页> 中国专利> 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法

使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及对位于原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的C‑20位的羟基基团具有糖基化活性的尿苷二磷酸(UDP)‑糖基转移酶蛋白，和使用它来使UDP糖基化的方法。

著录项

公开/公告号CN106459987A

专利类型发明专利
公开/公告日2017-02-22

原文格式PDF
申请/专利权人韩国科学技术院;智能合成生物中心;
展开▼

申请/专利号CN201580023380.3
发明设计人金善昌;崔吉柱;郑硕采;朴明根;金佑炫;林修焕;林完泽;
展开▼

申请日2015-04-30
分类号C12N15/54(20060101);C12P33/16(20060101);C12N9/10(20060101);
代理机构11245 北京纪凯知识产权代理有限公司;
代理人张全信;赵蓉民
地址韩国大田市
入库时间 2023-06-19 01:41:15

法律信息

法律状态公告日

法律状态信息

法律状态
2019-12-03

授权

授权
2017-03-22

实质审查的生效 IPC(主分类):C12N15/54 申请日:20150430

实质审查的生效
2017-02-22

公开

公开

说明书

技术领域

本发明涉及对位于原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的C-20位的羟基基团具有糖基化活性的尿苷二磷酸(UDP)糖基转移酶蛋白，和使用它来使UDP糖基化的方法。

背景技术

人参是广泛用于改善健康的最受欢迎的药用植物之一。人参的根已经在传统医学中作为草药茶被食用，并且目前被用于各种产品，包括糖果、速溶茶和滋补性饮料。人参皂苷是人参中含有的糖基化三萜化合物，可以对健康提供许多积极的作用。特别地，人参皂苷已知具有各种药理学作用，例如增强免疫系统和复苏身体机能，并且已经从人参的根中鉴定了超过40种不同的人参皂苷。然而，难以大规模地生产单独的人参皂苷仍然是研究每种人参皂苷的功效——例如其对特定疾病的治疗效果和所鉴定的人参皂苷的商业用途——的主要障碍。

人参皂苷是糖基化达玛烯型四环三萜，并且基于它们的糖苷配基结构可以分为三个不同的组：原人参二醇(PPD)型人参皂苷、原人参三醇(PPT)型人参皂苷和齐墩果酸型人参皂苷。基于通过糖苷键连接到化学结构中环的C-3、C-6和C-20位置的糖部分(糖苷配基)的位置和数目，这三个组可以进一步分类。PPD和PPT具有不同的羟基化模式。PPD在C-3、C-12和C-20位置具有-OH基团，而PPT在C-3、C-6、C-12和C-20位置具有-OH基团。PPD和PPT可以用葡萄糖或其它糖进行糖基化以转化成各种人参皂苷。糖基化PPD型人参皂苷包括人参皂苷Rb₁、Rd、F2、Rg₃、Rh₂、化合物K(C-K)、Rb₂、Rc、化合物MC(C-MC)、化合物Y(C-Y)等，并且糖基化PPT型人参皂苷包括人参皂苷Rg₁、Rh₁、F1、Rf、Re、Rg₂等。

人参皂苷的生物合成途径仅部分被鉴定。在IPP异构酶(IPI)、GPP合酶(GPS)、FPP合酶(FPS)、鲨烯合酶(SS)和鲨烯环氧酶(SE)的作用下，通过异戊烯基二磷酸和二甲基烯丙基二磷酸(DMADP)的一系列缩合反应合成氧化鲨烯之前，已知人参皂苷与其它三萜部分地共享生物合成途径(Ajikumar等人，Science，330，70-74，2010；Ro等人，Nature，440，940-943，2006；Sun等人，BMC Genomics，11，262，2010)。氧化鲨烯通过达玛烯二醇-II合酶(DS)环化成达玛烯二醇-II，该DS是三萜环化酶。达玛烯二醇-II在C-3和C-20位置具有羟基基团，并通过p450酶原人参二醇合酶(PPDS)将C-12位羟基化被转化为PPD。通过另一种p450蛋白将原人参三醇合酶(PPTS)的C-6位羟基化，PPDS也可以被转化为PPT。PPD可以通过在C-3和/或C-20位的糖基化被转化为各种PPD型人参皂苷，并且PPT可以通过在C-6和/或C-20位的糖基化被转化为各种PPT型人参皂苷。

尿苷二磷酸(UDP)糖基转移酶(UGT)是催化将糖部分从UDP-糖转移到多种多样的代谢物例如激素和次级代谢物的酶。一般来说，UGT在生物合成途径的最后步骤中起作用以便增加代谢物的溶解度、稳定性、储存性、生物活性或生物可用性。如植物代谢物的非凡的多样性所认可的，每个植物基因组具有数百种不同的UGT。例如，拟南芥(Arabidopsisthaliana)植物模型含有107个UGT，这些UGT基于氨基酸序列属于14个不同的组(组A-N)。然而，尽管DS、PPDS和PPTS已被报道为参与人参皂苷生物合成的酶，但是关于UGT是否参与人参皂苷生物合成知之甚少。因此，对于特定人参皂苷的生产，需要鉴定使用人参皂苷作为底物的UGT。

不同的UGT对糖供体和糖受体都表现出底物特异性。例如，UGT78D2将葡萄糖从UDP-葡萄糖转移到黄酮醇(山奈酚或槲皮素)和花青素(矢车菊素)的C-3位，以便分别产生黄酮醇-3-O-葡萄糖苷和花青素-3-O-葡萄糖苷。似乎这种糖基化对于化合物的体内稳定性和储存是必不可少的。另一方面，UGT89C1将鼠李糖从UDP-鼠李糖转移到黄酮醇-3-O-葡萄糖苷的C-7位，以产生黄酮醇-3-O-葡萄糖苷-7-O-鼠李糖苷。由于UGT89C1不利用UDP-葡萄糖和花青素-3-O-葡萄糖苷作为底物，已知UGT78D2对UDP-糖和其它受体表现出不同的特异性。如所描述的，因为不同的UGT可以具有不同的底物特异性和区域选择性，所以有必要研究单个UGT的底物特异性和区域选择性。

发明内容

技术问题

本发明的发明人已经进行了大量的努力来开发具有底物特异性和区域选择性的新的UDP糖基转移酶，该UDP糖基转移酶可以被用于特定人参皂苷的生物合成。因此，他们已经鉴定了来自高丽参的新型糖基转移酶(PgUGT71A1)，并且发现PgUGT71A1可以将PPD型人参皂苷PPD、Rh₂和Rg₃分别转化为人参皂苷C-K、F2和Rd，并且可以将PPT转化为F1。由于该蛋白质对PPD和PPT型人参皂苷的C-20位的羟基基团具有糖基化活性，本发明的发明人已经证实其可用于生产特定的糖基化人参皂苷，并且已经完成了本发明。

技术方案

本发明的目的是提供制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的方法，该方法包括将UDP糖基转移酶蛋白、引入了包含编码该蛋白的多核苷酸的载体或其片段并表现出该蛋白的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物处理为在C-20位具有羟基基团的PPD或PPT型人参皂苷。

本发明的另一个目的是提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的组合物，其包含选自下组的一种或多种作为活性组分，该组由以下各项组成：尿苷二磷酸(UDP)糖基转移酶蛋白——其对在C-20位具有羟基基团的PPD或PPT型人参皂苷的C-20位的羟基基团具有糖基化活性、引入了包含编码该蛋白的多核苷酸的载体或其片段的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。

本发明的又另一个目的是提供由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶蛋白，其对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性。

本发明的又另一个目的是提供编码该蛋白质的多核苷酸、含有该多核苷酸的表达载体、含有该表达载体或其片段的转化细胞、和含有该转化细胞的生物体。

本发明的又另一个目的是提供表达载体，该表达载体含有分别编码DS、tHMGR、PPDS和AtCPR蛋白的UDP糖基转移酶蛋白的多核苷酸；用于生产C-K的转化细胞，该转化细胞含有该表达载体或其片段；和含有该转化细胞的生物体。

本发明的又另一个目的是提供表达载体，该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、和PPTS蛋白的UDP糖基转移酶蛋白的多核苷酸；用于生产F1的转化细胞，该转化细胞含有该表达载体或其片段；和含有该转化细胞的生物体。

本发明的又另一个目的是提供表达载体，该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、和PgUGT74A1蛋白的UDP糖基转移酶蛋白的多核苷酸；用于生产F2的转化细胞，该转化细胞含有该表达载体或其片段；和含有该转化细胞的生物体。

本发明的又另一个目的是提供表达载体，该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、PgUGT74A1、和PgUGT94B1蛋白的UDP糖基转移酶蛋白的多核苷酸；用于生产Rd的转化细胞，该转化细胞含有该表达载体或其片段；和含有该转化细胞的生物体。

有益效果

由于本发明的UDP糖基转移酶是具有将糖选择性地转移到PPD或PPT型人参皂苷C-20位羟基基团的活性的蛋白质，它可以有效地用于大规模生产在C-20位具有糖的人参皂苷，例如C-K、F2、Rd和F1。

另外，在本发明中，表达载体和包含该表达载体的转化细胞可以通过在C-20位具有糖的人参皂苷C-K(新合成量：4.5mg/L)、F1、F2、或Rd的从头合成有效地用于特定人参皂苷的大规模生产。

附图说明

图1显示了PPD和PPT型人参皂苷的化学结构。

图2显示UDP糖基转移酶PgUGT71A1具有将UDP葡萄糖连接至PPD型和PPT型人参皂苷的C-20位的羟基基团的糖基化活性。特别地，显示了通过薄层层析法(TLC；上图)和高效液相色谱法(HPLC；下图)分析由PgUGT71A1将PPD转化为化合物K(C-K)、将Rg₃转化为Rd、将Rh₂转化为F₂、和将PPT转化为F1的结果。

图3显示了经由实时PCR证明本发明的PgUGT71A1在用茉莉酮酸甲酯(MeJA)处理的人参的叶和根中表达增加的结果。

图4显示了通过NGS证明本发明的PgUGT71A1在用茉莉酮酸甲酯(MeJA)处理的人参的叶和根中表达增加的结果。

图5显示了制备的称为pRS306-MET3p-ERG7-CYC1ter的平台质粒(A)，以及使用ERG7敲减-F和ERG7敲减-B引物对从URA3区到CYC1终止子的表达盒的PCR扩增结果(B)。

图6显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1的pRS423-C-K的酿酒酵母(S.cerevisiae)MET3p-ERG7中C-K的生物合成途径。

图7显示了证明在11.97min处形成新的峰的HPLC和LC-MS/MS分析的结果，在HPLC中在含有PgUGT71A1的酵母中生产的物质C-K的保留时间(A)和通过LC-MS/MS分析的由酵母生产的C-K的保留时间(B)等于11.97min。

图8显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1和PgPPTS的pRS423-F1的酿酒酵母MET3p-ERG7中人参皂苷F1的生物合成途径。

图9显示了证明在6.01min处形成新的峰的HPLC和LC-MS/MS分析的结果，在HPLC中在含有PgUGT71A1和PgPPTS的酵母中生产的物质F1的保留时间(A)和通过LC-MS/MS分析的由酵母生产的F1的保留时间(B)等于6.01min。

图10显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1和PgUGT71A1的pRS423-F2的酿酒酵母MET3p-ERG7中人参皂苷F2的生物合成途径。

图11显示了证明在7.81min处形成新的峰的HPLC和LC-MS/MS分析的结果，在HPLC中在含有PgUGT74A1和PgUGT71A1的酵母中生产的物质F2的保留时间(A)和通过LC-MS/MS分析的由酵母生产的F2的保留时间(B)等于7.81min。

图12显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423-Rd的酿酒酵母MET3p-ERG7中人参皂苷Rd的生物合成途径。

图13显示了证明在5.88min处形成新的峰的HPLC和LC-MS/MS分析的结果，在HPLC中在含有PgUGT74A1、PgUGT94B1和PgUGT71A1的酵母中生产的物质Rd的保留时间(A)和通过LC-MS/MS分析的由酵母生产的Rd的保留时间(B)等于7.81min。

具体实施方式

在一个方面，本发明提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的方法，该方法包括将UDP糖基转移酶蛋白、引入了包含编码该蛋白的多核苷酸的载体或其片段并表现出该蛋白的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物处理为在C-20位具有羟基基团的PPD或PPT型人参皂苷。

在本发明中，术语“尿苷二磷酸(UDP)糖基转移酶”是指具有将单糖部分从糖基供体转移到糖基受体的活性的酶，特别是利用UDP-糖作为糖基供体的酶。在本发明中，术语UDP糖基转移酶可以与‘UGT’互换地使用。由于对人参皂苷UDP糖基转移酶知之甚少，并且由于具有UDP糖基转移酶活性的不同酶具有不同的底物特异性和区域选择性，需要确定该酶是否是特异地作用于作为人参皂素的特定人参皂苷的UDP糖基转移酶。

本发明的发明人首次鉴定了来源于人参(Panax ginseng C.A.Meyer)的新的UDP糖基转移酶，其能够选择性地将糖部分转移至PPD型人参皂苷或PPT型人参皂苷的C-20位的羟基(-OH)基团。本发明的发明人鉴定的UDP糖基转移酶具有选择性地将UDP-葡萄糖的糖部分转移到PPD型人参皂苷或PPT型人参皂苷的C-20位羟基基团的活性。因此，本发明中鉴定的UDP糖基转移酶可以将PPD型人参皂苷PPD、Rh₂和Rg₃分别转化为人参皂苷C-K、F2和Rd，并且还可以通过将糖部分转移到C-20位的羟基基团而将PPT转化为F1。具有这种活性的人参皂苷UDP糖基转移酶从未被发现，并且已经由本发明的发明人首先鉴定。

本发明中鉴定的UDP糖基转移酶是来源于高丽参(Panax ginseng C.A.Meyer)的UDP糖基转移酶，并且可以由SEQ ID NO:1的氨基酸序列来限定。在本发明的示例性实施方式中，由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶被命名为‘PgUGT71A1’。

本发明的UDP糖基转移酶不仅是指具有SEQ ID NO:1的氨基酸序列的蛋白质，而且是指含有与SEQ ID NO:1的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、最优选地99％或更高相似性的氨基酸序列并且能够基本上不受限制地将糖转移到PPD或PPT型人参皂苷的C-20位羟基基团的蛋白质。此外，如果具有序列相似性的蛋白质具有与UDP糖基转移酶基本上相同或相当的生物活性，那么具有一部分缺失、修饰、取代或添加的序列的蛋白质变体被包括在本发明的范围内。

术语“相似性”意在表示与野生型蛋白质的氨基酸序列或编码该野生型蛋白的核苷酸序列的相似性程度，并且该氨基酸序列或核苷酸序列包括与本发明的氨基酸序列或核苷酸序列具有上述百分比或更高的相似性的序列。相似性的比较可以用肉眼或使用商业上容易获得的比较程序进行。

由于本发明的UDP糖基转移酶具有将糖选择性地转移到PPD或PPT型人参皂苷的C-20位，特别是具有羟基基团的C-20位的活性，因此它可被用来从在C-20位具有羟基基团的PPD或PPT型人参皂苷制备糖基化人参皂苷。

在本发明中，术语“PPD型人参皂苷”是指达玛烷型皂素，其为在C-3、C-12和C-20位具有-OH基团的PPD或具有糖基化PPD的-OH基团的人参皂苷。可以通过本发明的糖基转移酶糖基化的PPD型人参皂苷的实例包括在C-20位具有羟基基团的PPD、Rg₃、Rh₂等。然而，可以包括但不限于可以通过本发明的UDP糖基转移酶糖基化的任何PPD型人参皂苷。

在本发明中，术语“PPT型人参皂苷”是指达玛烷型皂素，其为在C-3、C-6、C-12和C-20位具有-OH基团的PPT或具有糖基化PPT的-OH基团的人参皂苷。可以通过本发明的糖基转移酶糖基化的PPT型人参皂苷的实例包括在C-20位具有羟基基团并且在C-6位没有糖的PPT。然而，包括但不限于可以通过本发明的UDP糖基转移酶糖基化的任何PPT型人参皂苷。

PPD型或PPT型人参皂苷可以是分离和纯化的人参皂苷，或包含在人参或红参的粉末或提取物中的人参皂苷。换言之，含有皂素的人参或红参的粉末或提取物可以直接用作人参皂苷以执行本发明的方法。可替代地，可以使用化学合成的人参皂苷。各种类型的已知的人参可以用于本发明中。实例包括高丽参(Panax ginseng)、西洋参(P.quinquefolius)、三七(P.notoginseng)、竹节参(P.japonicus)、三叶人参(P.trifolium)、喜马拉雅人参(P.pseudoginseng)和越南人参(P.vietnamensis)，但不限于此。PPD型或PPT型人参皂苷的化学结构如图1所示。

在本发明中，术语“糖基化人参皂苷”是指具有与构成人参皂苷的非糖成分(糖苷配基)的羟基基团相连的单糖或多糖的人参皂苷。出于本发明的目的，糖基化人参皂苷包括但不限于任何糖基化人参皂苷，只要它是通过本发明的UDP糖基转移酶将糖——优选是葡萄糖——转移到PPD或PPT型人参皂苷的C-20位而糖基化的人参皂苷。实例包括由本发明的糖基转移酶分别从PPD、Rh₂、Rg₃或F1糖基化的化合物K(C-K)、F2、Rd或PPT，但不限于此。

为了通过转化在C-20位具有羟基基团的PPD或PPT型人参皂苷来制备糖基化人参皂苷，可以使用包含具有编码UDP糖基转移酶的多核苷酸的表达载体或其片段并且表现出UDP糖基转移酶活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。

编码UDP糖基转移酶蛋白的多核苷酸优选地可以是由SEQ ID NO:2的核苷酸序列所限定的多核苷酸。除了具有SEQ ID NO:2的核苷酸序列的多核苷酸之外，包括但不限于与SEQ ID NO:2的核苷酸序列具有为70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、最优选地98％或更高的序列相似性，并且能够基本上编码具有PgUGT71A1蛋白活性的蛋白质。

含有本发明的多核苷酸的表达载体是指含有可操作地连接以表达插入的核酸的基本调节元件的核酸构建体，作为能够在合适的宿主细胞中表达靶蛋白的表达载体。可以通过将制备的重组载体转化或转染到宿主细胞中获得所需的靶蛋白。

含有本发明提供的多核苷酸的表达载体包括大肠杆菌(E.coli)来源的质粒(pYG601BR322、pBR325、pUC118、和pUC119)、枯草芽孢杆菌(Bacillus subtilis)来源的质粒(pUB110和pTP5)、酵母来源的质粒(YEp13、YEp24、和YCp50)以及可用于农杆菌介导的转化的Ti质粒，但不特别限于此。噬菌体DNA的具体实例包括λ噬菌体(Charon 4A、Charon21A、EMBL3、EMBL4、λgt10、λgt11和λZAP)。另外，可以使用动物病毒，例如逆转录病毒、腺病毒或痘苗病毒，昆虫病毒，例如杆状病毒、双链植物病毒——如CaMV、单链病毒或衍生自双粒病毒的病毒载体。

此外，可以使用转录激活蛋白(如B42)连接的融合质粒(如，pJG4-5)作为本发明的载体。另外，为了更容易地纯化本发明中获得的靶蛋白，如有需要，质粒载体可以进一步包括其它序列。例如，融合质粒可以含有标签，例如，GST、GFP、His标签、Myc标签等，但不限于此。在本发明的示例性实施方式中，可以使用作为GST基因融合载体的pGEX4T-1载体可以用来构建包含编码UDP糖基转移酶蛋白的多核苷酸的表达载体。

另外，由含有融合序列的载体表达的融合蛋白可以通过亲和层析法纯化。例如，当融合谷胱甘肽S转移酶时，可以使用作为酶底物的谷胱甘肽。并且，当融合六聚组氨酸时，可以通过使用Ni-NTA His-结合树脂柱(Novagen公司，美国)容易地回收靶蛋白。

为了将本发明的多核苷酸插入载体中，可以使用适当的限制性内切酶切割纯化的DNA，然后插入合适的载体DNA的限制性位点或克隆位点。

编码本发明蛋白质的UDP糖基转移酶的多核苷酸可以可操作地连接于载体。除了本发明的启动子和核酸外，本发明的载体还可以进一步包括顺式元件，例如，增强子、剪接信号、多聚A添加信号、选择标记、核糖体结合序列(SD序列)等。作为选择标记的实例，可以使用氯霉素抗性基因、二氢叶酸还原酶、新霉素抗性基因等。然而，待可操作地连接的另外的元件不限于这些实例。在本发明中，术语“转化”是指将DNA引入宿主细胞，使得DNA可以作为额外的染色体元件或通过染色体整合来复制。换言之，转化是指通过将外来DNA引入细胞中来人为改变基因的现象。

含有编码本发明的UDP糖基转移酶的多核苷酸的表达载体或表达载体的片段可以通过转化引入宿主细胞。如本文中所使用，表达载体的片段是指包含编码UDP糖基转移酶蛋白的多核苷酸的部分，使得UDP糖基转移酶蛋白的活性可以被赋予宿主细胞的表达载体的片段。例如，可以是在农杆菌介导的转化中转移到宿主细胞中的Ti质粒的T-DNA，但不限于此。

本发明的转化可以通过任何转化方法进行，并且可以根据本技术领域中通常使用的方法容易地进行。一般而言，转化方法的实例包括CaCl₂沉淀、哈纳汉(Hanahan)方法——使用二甲亚砜(DMSO)作为还原材料的改进的CaCl₂方法、电穿孔、磷酸钙沉淀、原生质体融合、使用碳化硅纤维搅拌、农杆菌介导的转化、PEG介导的转化、以及硫酸葡聚糖、脂质体和干燥/抑制介导的转化等。然而，用于转化含有编码本发明的UDP糖基转移酶的多核苷酸的载体的方法不限于上述实例，并且可以使用但不限于本领域中通常使用的转化或转染方法。

在本发明中，宿主细胞没有特别限制，只要它能够表达本发明的多核苷酸。可用于本发明的宿主的具体实例包括属于埃希氏杆菌属的细菌例如大肠杆菌、属于芽孢杆菌属的细菌例如枯草芽孢杆菌、属于假单胞菌属的细菌例如恶臭假单胞菌、酵母例如酿酒酵母或粟酒裂殖酵母、动物细胞、植物细胞和昆虫细胞。可用于本发明的大肠杆菌菌株的具体实例包括CL41(DE3)、BL21或HB101，且可用于本发明的枯草芽孢杆菌的具体实例包括WB700或LKS87。

可以含有引入了编码本发明的多核苷酸的表达载体或其片段的转化细胞的生物体可以是例如烟草、拟南芥、马铃薯、人参、芝麻、圆佛手柑、雏菊等，但不具体地限于此。

任何启动子都可以用作本发明的启动子，只要其能够在宿主细胞中表达本发明的核酸。例如，可以使用大肠杆菌或噬菌体来源的启动子，例如，trp启动子、lac启动子、PL启动子或PR启动子，大肠杆菌感染的噬菌体来源的启动子，例如，T7启动子、CaMV35S启动子、MAS启动子或组蛋白启动子。而且，可以使用人工修饰的启动子，例如，tac启动子。

通过转化将含有编码本发明的UDP糖基转移酶蛋白的多核苷酸的表达载体引入的转化株针对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性，特别是将PPD转化为C-K、将Rh₂转化为F2、将Rg₃转化为Rd、或将PPT转化为F1的糖基化活性，但不限于此。

在本发明中，术语“转化细胞的培养物”是指通过根据已知的培养微生物的方法培养转化细胞而获得的产物。术语培养物以广义概念使用，包括含有转化细胞的培养物和通过例如离心从含有转化细胞的培养物中除去转化细胞而获得的培养物。

由于培养物含有本发明的UDP糖基转移酶蛋白，因此它具有将PPD或PPT型人参皂苷转化为糖基化人参皂苷的活性。例如，它可以将PPD转化为C-K、将Rh₂转化为F2、将Rg₃转化为Rd、并将PPT转化为F1。

由于本发明的UDP糖基转移酶蛋白、引入了含有编码该蛋白质的多核苷酸的表达载体或该表达载体的片段并表现出该蛋白质的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物可用于将在C-20位具有羟基基团的PPD或PPT型人参皂苷转变成糖基化人参皂苷，根据本发明的方法可有效地用于需要C-20位糖基化的人参皂苷的领域，特别是需要例如人参皂苷C-K、F2、Rd、F1等人参皂苷的领域。

本发明的发明人已经鉴定了新的UDP糖基转移酶，其具有将UDP-葡萄糖的葡萄糖部分选择性地转移到PPD或PPT型人参皂苷的C-20位羟基基团的活性，并且具有来自高丽参(Panax ginseng C.A.Meyer)的SEQ ID NO:1的氨基酸序列以及将它命名为PgUGT71A1(实例1)。为了研究PgUGT71A1蛋白质的酶活性，将为在C-20位具有羟基基团的代表性PPD或PPT型人参皂苷的PPD、Rg₃、Rh₂和PPT与本公开的PgUGT71A1反应，并确定了它们的转化活性。因此，本发明的PgUGT71A1将PPD转化为C-K、将Rg₃转化为Rd、将Rh₂转化为F2、将PPT转化为F1，表明它具有将葡萄糖部分转化到PPD和PPT型人参皂苷的C-20位羟基基团的活性(图2)。另外，据发现该蛋白质的表达被茉莉酮酸甲酯(MeJA)增强，该MeJA已知在人参的叶和根中表达并且增强人参的生物合成基因的表达(图3和图4)。这些结果表明，本发明的PgUGT71A1涉及人参皂苷的生物合成，特别是C-K、Rd、F2、F1等的生物合成，并且该蛋白可通过在C-20位的糖基化用于生物转化C-K、Rd、F2、F1等的过程。

在另一个方面，本发明提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的组合物，其包含选自下组的一种或多种作为活性组分，该组由以下各项组成：尿苷二磷酸(UDP)糖基转移酶蛋白——其对在C-20位具有羟基基团的PPD或PPT型人参皂苷的C-20位的羟基基团具有糖基化活性、被引入包含编码该蛋白的多核苷酸的载体或其片段的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。

该UDP糖基转移酶蛋白、该转化细胞、该生物体、该PPD型或PPT型人参皂苷和该糖基化人参皂苷与上述相同。

在另一个方面，本发明提供由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶蛋白，其对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性。

该UDP糖基转移酶蛋白和该SEQ ID NO：1的氨基酸序列与上述相同。

该蛋白质可以是将PD转化为C-K、将Rh₂转化为F2、将Rg₃转化为Rd、将PPT转化为F1的蛋白质。

在另一个方面，本发明提供了表达载体和用于生产C-K的转化细胞，该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外，进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)蛋白的多核苷酸，该转化细胞包括该表达载体或其片段。

该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。

作为三萜环化酶的达玛烯二醇-II合酶(DS)是指将氧化鲨烯环化成达玛烯二醇-II的酶。该DS可以由SEQ ID NO:29中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该DS变体含有与SEQ ID NO:29的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该DS基本上相同或相当的生物活性。

编码DS蛋白的多核苷酸可以优选是由针对大肠杆菌的密码子使用优化的SEQ IDNO:30或SEQ ID NO:31中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与SEQ ID NO:30或SEQ ID NO:31的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该DS蛋白基本上相同的生物活性的蛋白质。

截短的HMG-CoA还原酶(tHMGR)是控制Z10或胆固醇的体内合成的重要酶，并且是指在胆固醇合成过程中将HMG-CoA转化为甲羟戊酸的酶。该tHMGR可以由SEQ ID NO:32中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该tHMGR变体含有与SEQ ID NO:32的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该tHMGR基本上相同或相当的生物活性。

编码该tHMGR蛋白的多核苷酸可以优选是由SEQ ID NO:33中所述的氨基酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与SEQ ID NO:33的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该tHMGR蛋白基本上相同的生物活性的蛋白质。

原人参二醇合酶(PPDS)是通过羟基化将达玛烯二醇-II的C-12位转化为PPD的p450酶。该PPDS可以由SEQ ID NO:34中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该PPDS变体含有与SEQ ID NO:34的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该PPDS基本上相同或相当的生物活性。

编码该PPDS蛋白的多核苷酸可以优选是由SEQ ID NO:35中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与SEQ ID NO:35的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该PPDS蛋白基本上相同的生物活性的蛋白质。

拟南芥细胞色素p450还原酶(AtCPR)可以用作与细胞色素p450还原酶具有相同的含义。该AtCPR可以由SEQ ID NO:36中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该AtCPR变体含有与SEQ ID NO:36的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该AtCPR基本上相同或相当的生物活性。

编码该AtCPR蛋白的多核苷酸可以优选是由针对大肠杆菌的密码子使用优化的SEQ ID NO:37或SEQ ID NO:38中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与SEQ ID NO:37或SEQ ID NO:38的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该AtCPR蛋白基本上相同的生物活性的蛋白质。

在本发明的示例性实施方式中，经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT71A1的pRS423C-K引入酿酒酵母MET3p-ERG7中来构建具有C-K的C-K生物合成途径的酿酒酵母C-K菌株(图6)，并且该酿酒酵母C-K菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用MtOH提取并使用Sep-PAK来纯化。通过HPLC和LC-MS/MS分析纯化的人参皂苷。因此，携带PgUGT71A1的酵母在11.97min产生新的峰，在HPLC中C-K的保留时间等于11.97min(图7(A))，而通过MRM检测在LC-MS/MS中观察到产物的保留时间为11.46min，转换(transition)为645.4→23.2(图7(B))。这些结果表明，PgUGT71A1能够通过酵母发酵从头生产人参皂苷(4.5mg/L)。

因此，本发明可以提供表达载体和用于生产C-K的转化细胞，该表达载体进一步包括分别编码DS、tHMGR、PPDS、和AtCPR蛋白的UDP糖基转移酶蛋白的多核苷酸，该转化细胞含有该表达载体或其片段。

该转化细胞可以是酵母，但不限于此。

在另一个方面，本发明提供了表达载体和用于生产F1的转化细胞，该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外，进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和原人参三醇合酶(PPTS)蛋白的多核苷酸，该转化细胞包括该表达载体或其片段。

该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)与上述相同。

该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。

原人参三醇合酶(PPTS)是通过羟基化将PPDS的C-6位转化为PPT的另一种p450蛋白。该PPTS可以由SEQ ID NO:39中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该PPTS变体含有与SEQ ID NO:39的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该PPTS基本上相同或相当的生物活性。

编码该PPTS蛋白的多核苷酸可以优选是由针对酵母的密码子使用优化的SEQ IDNO:40或SEQ ID NO:41中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与SEQ ID NO:40或SEQ ID NO:41的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该PPTS蛋白基本上相同的生物活性的蛋白质。

在本发明的示例性实施方式中，经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT71A1和PgPPTS的pRS423F1引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷F1的生物合成途径的酿酒酵母F1菌株(图8)，并且该酿酒酵母F1菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外，酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，通过MtOH再萃取人参皂苷F1，并通过HPLC和LC-MS/MS分析萃取的人参皂苷。因此，携带PgUGT71A1和PgPPTS的酵母在6.01min产生新的峰，在HPLC中F1的保留时间等于6.01min(图9(A))，而通过MRM检测在LC-MS/MS中观察到产物的保留时间为6.13min，转换为661.5→203(图9(B))。这些结果表明，PgUGT71A1和PgPPTS能够通过酵母发酵从头生产人参皂苷F1。

因此，本发明可以提供表达载体和用于生产F1的转化细胞，该表达载体进一步包括分别编码DS、tHMGR、PPDS、AtCPR、和PPTS蛋白的UDP糖基转移酶蛋白的多核苷酸，该转化细胞含有该表达载体或其片段。

该转化细胞可以是酵母，但不限于此。

在另一个方面，本发明提供了表达载体和用于生产F2的转化细胞，该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外，进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和人参UDP糖基转移酶74A1(PgUGT74A1)蛋白的多核苷酸，该转化细胞包括该表达载体或其片段。

该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)与上述相同。

该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。

人参UDP糖基转移酶74A1(PgUGT74A1)是特异性作用于PPD和C-K——它们是PPD型人参皂苷——以引起C-3位的O-糖基化，从而将PPD和C-K分别转化为Rh₂和F2的UDP糖基转移酶。该PgUGT74A1可以由韩国专利号10-1479615中所描述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该PgUGT74A1变体含有与韩国专利号10-1479615中所描述的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该PgUGT74A1基本上相同或相当的生物活性。

编码该PgUGT74A1蛋白的多核苷酸可以优选地由韩国专利号10-1479615中所描述的核苷酸序列来限定，并且本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与韩国专利号10-1479615中所描述的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该PgUGT74A1蛋白基本上相同的生物活性的蛋白质。

在本发明的示例性实施方式中，经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT74A1和PgUGT71A1的pRS423F2引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷F2的生物合成途径的酿酒酵母F2菌株(图10)，并且该酿酒酵母F2菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外，酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，通过MtOH再提取人参皂苷F2，并通过HPLC和LC-MS/MS分析提取的人参皂苷。因此，携带PgUGT74A1和PgUGT71A1的酵母在7.81min产生新的峰，在HPLC中F2的保留时间等于7.81min(图11(A))，而通过MRM检测在LC-MS/MS中观察到产物的保留时间为7.35min，转换为807.5→627.5(图11(B))。这些结果表明，PgUGT74A1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷F2。

因此，本发明可以提供表达载体和用于生产F2的转化细胞，该表达载体进一步包括分别编码DS、tHMGR、PPDS、AtCPR、和PgUGT74A1蛋白的UDP糖基转移酶蛋白的多核苷酸，该转化细胞含有该表达载体或其片段。

该转化细胞可以是酵母，但不限于此。

在另一个方面，本发明提供了表达载体和用于生产Rd的转化细胞，该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外，进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、人参UDP糖基转移酶74A1(PgUGT74A1)和人参UDP糖基转移酶94B1(PgUGT94B1)蛋白的多核苷酸，该转化细胞包括该表达载体或其片段。

该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和人参UDP糖基转移酶74A1(PgUGT74A1)与上述相同。

该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。

人参UDP糖基转移酶94B1(PgUGT94B1)是特异性作用于Rh₂和F2——它们是PPD型人参皂苷——以引起C-3位的O葡萄糖苷的β-1,2糖基化，从而将作为人参皂苷的Rh₂和F2分别转化为Rg₃和Rd的UDP糖基转移酶。该PgUGT94B1可以由韩国专利号10-1479608中的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体，只要该PgUGT94B1变体含有与韩国专利号10-1479608中所描述的氨基酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高、以及最优选地99％或更高的相似性的氨基酸序列，并且具有与该PgUGT94B1基本上相同或相当的生物活性。

编码该PgUGT94B1蛋白的多核苷酸可以优选是由韩国专利号10-1479608中所描述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体，只要该变体含有与韩国专利号10-1479608中所描述的核苷酸序列具有70％或更高、优选地80％或更高、更优选地90％或更高、甚至更优选地95％或更高、甚至更加优选地98％或更高的相似性的核苷酸序列，该核苷酸序列编码具有与该PgUGT94B1蛋白基本上相同的生物活性的蛋白质。

在本发明的示例性实施方式中，经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423Rd引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷Rd的生物合成途径的酿酒酵母Rd菌株(图12)，并且该酿酒酵母Rd菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外，酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，通过MtOH再提取人参皂苷Rd，并通过HPLC和LC-MS/MS分析提取的人参皂苷。因此，携带PgUGT74A1、PgUGT94B1、和PgUGT71A1的酵母在5.88min产生新的峰，在HPLC中Rd的保留时间等于5.88min(图13(A))，而通过MRM检测在LC-MS/MS中观察到产物的保留时间为5.93min，转换为969.5→789.5(图13(B))。这些结果表明，PgUGT74A1、PgUGT94B1、和PgUGT71A1能够通过酵母发酵从头生产人参皂苷Rd。

实施例

本发明通过实施例来详细描述。然而，以下实施例仅用于说明的目的，并且本发明的范围不受这些实施例的限制。

实施例1：人参UDP糖基转移酶PgUGT71A1的克隆和纯化

使用PgUGT71A1-F(5'-AGGCAGGATCCATGAAGTCAGAATTGATATTCTTGCCCGCCCCGGC-3'；SEQ ID NO:17)和PgUGT71A1-R(5'-AGGCATCTCGAGTCACATAATTTTCTCAAATAGTTTGGCCAATGAAT-3'；SEQ ID NO:18)引物和聚合酶，从人参cDNA通过PCR扩增基因，并且基因的末端用限制性内切酶BamHI和XhoI进行消化。然后，将基因克隆到pGEX-4T1载体中以构建表达载体，将该表达载体转化到大肠杆菌BL21(DE3)-RIL菌株中以获得表达PgUGT71A1的菌株。

用IPTG诱导菌株表达蛋白质后，使用琼脂糖-4B树脂纯化产生的蛋白质以获得PgUGT71A1酶。

实施例2：体外酶测定

在含有纯化的PgUGT71A1(30μg)、人参皂苷化合物(5mM)和UDP-葡萄糖(50mM)的反应缓冲液(10mM PBS缓冲液，pH 7)中进行糖基转移酶测定。对于这项测定，使4种不同类型的人参皂苷，即原人参二醇(PPD)、原人参三醇(PPT)、Rh₂和Rg₃与本公开的酶进行反应。人参皂苷的结构显示于图1中。

将反应混合物在35℃下孵育12小时，并且通过薄层层析法(TLC)或高效液相色谱法(HPLC)分析所得产物。

使用流动相(丙酮:甲醇:DDW＝65:35:10vol/vol)和60F254硅胶板(默克公司(Merck)，德国)进行TLC分析。通过喷射10％(vol/vol)硫酸(H2SO4)并在110℃加热5分钟来检测在TLC板上的分离的产物。

使用ODS(2)C18柱(菲罗门公司(Phenomenex)，美国)进行HPLC分析。水和乙腈的梯度应用条件如下：流速＝1mL/min，0分钟，68％水和32％乙腈；8分钟，35％水和65％乙腈；12分钟，0％水和100％乙腈；20分钟，0％水和100％乙腈；20.1分钟，68％水和32％乙腈；以及28分钟，68％水和32％乙腈。

通过使用UV检测器(Agilent，USA)在203nm的波长下监测来检测人参皂苷。

实施例3：RNA分离和实时PCR分析

使用光谱植物总RNA试剂盒(Spectrum Plant Total RNA kit)(西格玛-奥德里奇公司(Sigma-Aldrich))从15个月龄的人参的叶或根分离总RNA。每天将200μM茉莉酸甲酯(MeJA)喷射到人参叶上，共持续5天，并且在第6天收集样品。将1μg的总RNA用于cDNA合成。

使用表1中列出的引物组通过定量RT-PCR检测不同基因的表达水平，并且将结果标准化至微管蛋白的表达水平。

表1

[表1]

实施例4：NGS分析

从已经用MeJA处理和未用MeJA处理的人参的叶和根提取RNA，并且使用TruSeqRNA文库试剂盒从1μg的总RNA构建cDNA文库。在聚A选择的RNA提取、RNA片段化和随机六聚体引发的逆转录之后，使用亿明达(Illumina)HiSeq 2000进行100nt配对的末端测序。

使用Trinity程序(2011年11月26日版本)对所得的序列从头进行转录组装配。使用Blast(版本2.2.25+)分析所产生的重叠群(转录物)。使用了GO数据库(于2012年4月20日发布)和NCBI的NR数据库(下载日期：2012年05月07日)。为了确定组装的重叠群(转录物)的表达水平，使用Bowtie(版本0.12.8)作为作图程序。使用RSEM算法用由Trinity组释放的程序，将表达水平表示为每百万个片段中外显子每千碱基的片段(FPKM)。

实施例5：人参皂苷在酵母中的生产

实施例5-1：ERG7下调表达盒的构建

为了构建ERG7下调菌株(酿酒酵母MET3p-ERG7)，构建了ERG7下调表达盒。对于携带MET3启动子、ERG7基因、和CYC1终止子的ERG7下调表达盒，使用pRS306质粒作为平台。为了抑制ERG7基因，选择了能够通过供应甲硫氨酸抑制转录水平的MET3启动子(MET3p)。使用引物组MET3p的pRS306-F(SacI)和MET3p的pRS306-B(XbaI)(表2)通过PCR扩增从酿酒酵母CEN.PK 2-1D的基因组DNA扩增MET3p。

表2

[表2]

使用引物组ERG7的pRS306-F(SpeI)和ERG7的pRS306-B(XhoI)(表3)通过PCR扩增从酿酒酵母CEN.PK 2-1D的基因组DNA扩增ERG7。

表3

[表3]

使用引物组CYC1终止子pRS306-F(XhoI)和CYC1终止子pRS306-B(KpnI)(表4)通过PCR扩增从pRS424-GPD质粒扩增CYC1终止子。

表4

[表4]

将每个片段插入到pRS306载体中，从而构建平台质粒称为pRS3063p-MET3p-ERG7-CYC1ter(图5(A))。

使用pRS3063p-MET3p-ERG7-CYC1ter质粒作为模板，经由PCR构建ERG7下调表达盒。ERG7下调表达盒包括URA3基因和MET3p-ERG6-CYC1ter作为标记物。使用包含同源臂的ERG7敲减-F和ERG7敲减-B引物(表5)通过PCR扩增从URA3区到CYC1终止子的表达盒(图5(B))。

表5

[表5]

实施例5-2：酿酒酵母MET3p-ERG7菌株的构建和ERG7下调的确认

通过醋酸锂法(通过醋酸锂、单链载体DNA、聚乙二醇法转化酵母)将构建的ERG7下调表达盒整合到酿酒酵母CEN.PK 2-1D基因组中。在SD-Leu-Trp-His平板上选择转化株。将所选的转化株在5ml YPD培养基中孵育用于基因组DNA分离，用ERG7敲减确认-F和ERG7敲减确认-B引物(表6)通过PCR扩增确认表达盒整合。替换后，在5-FOA(5-氟乳清酸)平板上选择酵母以回收URA3标记，并且将所得酵母用于进一步分析。

表6

[表6]

为了确认2,3-氧化鲨烯的积累，进行烧瓶培养并通过HPLC分析代谢物。通过将1mL在15％(v/v)甘油中的冷冻细胞接种到含有50mL SD-TRP-LEU-HIS-URA培养基的250mL烧瓶中来制备用于烧瓶培养的种子培养物。对于烧瓶培养，种子培养物在30℃下生长2天，OD600为4～7。将20mL种子培养物接种到2L烧瓶中的1L分批培养基(2％v/v)中。收获培养的细胞，并用20mL的20％KOH/50％EtOH水溶液回流1小时。在用相同体积的己烷萃取后，蒸发萃取物并使用1.5mL丙酮再萃取。通过HPLC分析萃取物。使用ODS(2)C18柱(菲罗门公司(Phenomenex)，加利福利亚州，美国)以1mL/min的流速使用100％乙腈作为等度方法进行HPLC分析。使用UV-检测器(安捷伦科技公司(Agilent Technologies)，加利福利亚州，美国)在203nm的波长下监测代谢物(鲨烯、2,3-氧化鲨烯)。

实施例5-3：人参皂苷在酿酒酵母中的从头合成

通过在生物反应器中培养含有人参皂苷生物合成基因的酿酒酵母来检测人参皂苷的从头合成。由范豪克(van Hoek)等人描述的含有甲硫氨酸的组合培养基用于发酵(范豪克(van Hoek)、de Hulster等人，2000；勒尼汉(Lenihan)、鹤田(Tsuruta)等人，2008；韦斯特福尔(Westfall)、皮泰拉(Pitera)等人，2012)。分批培养基含有20g/L葡萄糖、15g/L(NH₄)₂SO₄、8g/L>2PO₄、0.72g/L>4·7H₂O、6.15g/L>4·7H₂O、12mL/L的维生素溶液、0.3g/L甲硫氨酸和10mL/L微量金属溶液。用于培养基的微量金属溶液含有15g/L EDTA、10.2g/L>4·7H₂O、0.50g/L>2·4H₂O、0.5g/L无水CuSO₄、0.86g/L>2·6H₂O、0.56g/L>2MoO₄·2H₂O、3.84g/L>2·2H₂O和5.12g/L>4·7H₂O。维生素溶液含有0.05g/L生物素、1g/L泛酸钙、1g/L烟酸、25g/L肌醇、1g/L盐酸硫胺素、1g/L盐酸吡哆醇、和0.2g/L>4OH(<pH>

对于从头合成的人参皂苷的分析，通过离心(10min，2898x g)收获50ml细胞，重悬于20mL DDW中，并通过超声(Vibra-cell仪器；声能学与材料学公司(Sonics&Materials)，康乃狄克州，美国)破碎。代谢物用50％甲醇(v/v)提取，在SEP-PAK 18柱上纯化，并通过HPLC和LC-MS/MS分析。

实施例5-4：人参皂苷的HPLC分析和LC-ESI-MS/MS分析

使用ODS(2)C18柱(菲罗门公司(Phenomenex)，加利福利亚州，美国)以1mL/min的流速如下进行HPLC分析：0分钟，68％水和32％乙腈；8分钟，35％水和65％乙腈；12分钟，0％水和100％乙腈；20分钟，0％水和100％乙腈；20.1分钟，68％水和32％乙腈；和28分钟，68％水和32％乙腈。使用UV-检测器(安捷伦科技公司(Agilent Technologies)，加利福利亚州，美国)在203nm的波长下监测人参皂苷。

使用HPLC-MS/MS系统进行每种人参皂苷的鉴定，该HPLC-MS/MS系统由HPLC系统(HP1100；安捷伦科技公司(Agilent Technologies))、配备有自动进样器的三重四极串联质谱仪(API-2000；应用生物系统公司(Applied Biosystems)，加利福利亚州，美国)、加热电喷雾离子源(H-ESI)、三级四极杆质量分析器和用于数据采集的Analyst 1.4软件组成。反相柱(福尔蒂斯(Fortis)H2o C18，2.1×100mm，3mm孔径；福尔蒂斯技术有限公司(FortisTechnologies Ltd.)，英国)用于样品分离。用于色谱分离的流动相由0.01％醋酸水溶液(A)和0.01％醋酸乙腈溶液(B)组成。具有250μL/min恒定流速的梯度洗脱程序如下：0分钟，68％A和32％B；3分钟，45％A和55％B；8分钟，40％A和60％B；13分钟，20％A和80％B；18分钟，0％A和100％B；22分钟，0％A和100％B；22.1分钟，68％A和32％B；30分钟，68％A和32％B。柱温设定为25℃。为了检测人参皂苷化合物(PPD、Rh₂、Rg₃、C-K、F2、和Rd)，使用多反应监测(MRM)方法。转换分别设置为：对于PPD，m/z>2，m/z>3，m/z>

测试实施例1：对于PgUGT71A1的PPD型和PPT型人参皂苷的C-20位羟基基团的特异性糖基转移酶活性

如下研究实施例1中鉴定的PgUGT71A1的底物特异性和区域选择性。

首先，在UDP-葡萄糖存在下，将实施例1的重组PgUGT——PgUGT71A1——与9种不同类型的人参皂苷(PPD、Rh₂、Rg₃、C-K、F2、Rd、PPT、F1、和Rh₁)一起孵育。通过薄层层析法(TLC)确认对于PPD、Rh₂、Rg₃和PPT发生的反应。

为了再次确认结果，将4种不同类型的人参皂苷(PPD、PPT、Rh₂、和Rg₃)与PgUGT71A1一起孵育，并且通过TLC分析由重组PgUGT71A1转化的产物。结果显示于图2的上图。通过比较迁移斑点与用作标准样品的PPD、PPT、Rh₂、Rg₃、C-K、F2、Rd、和F1的位置来确认结果。

因此，确认了PgUGT71A1将PPD转化为化合物K(C-K)、将Rg₃转化为Rd、将Rh₂转化为F2、和将PPT转化为F1(图2，上图)。

通过HPLC进一步确认了结果，如图2的下图所示。

如在TLC分析结果中，确认了PgUGT71A1将PPD转化为C-K、将Rg₃转化为Rd、将Rh₂转化为F2、和将PPT转化为F1(图2，下图)。

总之，上述结果表明，PgUGT71A1是具有将UDP-葡萄糖转移到PPD型和PPT型人参皂苷——特别是在C-6位没有糖的PPD型人参皂苷和PPT型人参皂苷——的C-20位的羟基基团的酶。

测试实施例2：通过茉莉酸甲酯(MeJA)增强PgUGT71A1表达

研究了本发明的PgUGT71A1是否主要在传统上用于医药目的的人参根中表达。而且，与3种不同的人参皂苷生物合成基因达玛烯二醇-II合酶(PgDS)、原人参二醇合酶(PgPPDS)和原人参三醇合酶(PgPPTS)一起检测了本发明的PgUGT71A1的器官特异性表达模式。

已知茉莉酸甲酯(MeJA)增强在毛状根培养物中人参的生物合成基因的表达。基于这一事实，检测了PgUGT71A1——即本发明的UDP糖基转移酶——的表达是否可以通过MeJA增加。为此，使用了在生长室中在LD条件下生长的15个月龄的人参。每天将MeJA喷洒在人参叶上，共持续5天，并在第6天收集样品以便分析人参皂苷生物合成基因的表达水平。

因此，所有人参皂苷生物合成基因都在人参的叶和根中表达，并且本发明的PgUGT71A1的表达通过MeJA处理显著增强(图3和图4)。

总之，上述结果表明，本发明的PgUGT71A1是参与人参生物合成的蛋白质。此外，由于MeJA增强本发明的糖基转移酶PgUGT71A1的表达，可以看出，MeJA可以用于增强PgUGT71A1的表达。

测试实施例3：PgUGT71A1使C-K能够在酵母中进行从头合成

为了生产化合物K(C-K)，将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1的pRS423-C-K引入酿酒酵母MET3p-ERG7，构建了具有C-K的生物合成途径的酿酒酵母C-K菌株(图6)。

为了确定人参皂苷C-K是否可以在酵母中从头产生，酿酒酵母C-K菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用MtOH提取并使用Sep-PAK来纯化。通过HPLC和LC-MS/MS分析纯化的人参皂苷。携带PgUGT71A1的酵母在11.97min产生新的峰，其与HPLC中的C-K的保留时间相同(图7(A))。使用645.4→23.2的转换，通过MRM检测的LC-MS/MS中观察到产物的保留时间为11.46min，其与C-K相同(图7(B))。这些结果表明，PgUGT71A1能够通过酵母发酵从头生产人参皂苷(4.5mg/L)。

测试实施例4：PgUGT71A1和PgPPTS使人参皂苷F1能够在酵母中从头合成

为了生产人参皂苷F1，将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1和PgPPTS的pRS423-F1引入酿酒酵母MET3p-ERG7，构建了具有人参皂苷F1的生物合成途径的酿酒酵母F1菌株(图8)。

为了确定人参皂苷F1是否可以在酵母中从头产生，酿酒酵母F1菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，使用MtOH再次萃取人参皂苷F1。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT71A1和PgPPTS的酵母在6.01min产生新的峰，其与HPLC中的人参皂苷F1的保留时间相同(图9(A))。使用661.5→203的转换，通过MRM检测的LC-MS/MS中观察到产物的保留时间为6.13min，其与人参皂苷F1相同(图9(B))。这些结果表明，PgUGT71A1和PgPPTS能够通过酵母发酵从头生产人参皂苷。

测试实施例5：PgUGT74A1和PgUGT71A1使人参皂苷F2能够在酵母中从头合成

为了生产人参皂苷F2，将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1和PgUGT71A1的pRS423-F2引入酿酒酵母MET3p-ERG7，构建了具有人参皂苷F2的生物合成途径的酿酒酵母F2菌株(图10)。

为了确定人参皂苷F2是否可以在酵母中从头产生，酿酒酵母F2菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，使用MtOH再次萃取人参皂苷F2。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT74A1和PgUGT71A1的酵母在7.81min产生新的峰，其与HPLC中的人参皂苷F2的保留时间相同(图11(A))。使用807.5→627.5的转换，通过MRM检测的LC-MS/MS中观察到产物的保留时间为7.35min，其与人参皂苷F2相同(图11(B))。这些结果表明，PgUGT74A1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷。

测试实施例6：PgUGT74A1、PgUGT94B1和PgUGT71A1使人参皂苷Rd能够从头合成

为了生产人参皂苷Rd，将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423-Rd引入酿酒酵母MET3p-ERG7，构建了具有人参皂苷Rd的生物合成途径的酿酒酵母Rd菌株(图12)。

为了确定人参皂苷Rd是否可以在酵母中从头产生，酿酒酵母Rd菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取，然后蒸发BtOH。最后，使用MtOH再次萃取人参皂苷Rd。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT74A1、PgUGT94B1和PgUGT71A1的酵母在5.88min产生新的峰，其与HPLC中的人参皂苷Rd的保留时间相同(图13(A))。使用969.5→789.5的转换，通过MRM检测的LC-MS/MS中观察到产物的保留时间为5.93min，其与人参皂苷Rd相同(图13(B))。这些结果表明，PgUGT74A1、PgUGT94B1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷。

对于本发明所属领域的普通技术人员而言将显而易见的是，在不脱离本公开的范围和精神的情况下可以进行各种修改和改变。因此，应当理解的是，上述示例性实施例不是限制性的，而在所有方面是说明性的。本发明的范围由所附权利要求而不是说明书所限定，因此落入权利要求的界限和范围内或者这样的界限和范围的等同物内的所有改变和修改因此旨在被权利要求书包括在内。

<110> 韩国科学技术院

智能合成生物中心

<120> 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法

<130> OPA15038-CN

<150> KR10-2014-0052728

<151> 2014-04-30

<160> 41

<170> KopatentIn 2.0

<210> 1

<211> 475

<212> PRT

<213> 人参

<400> 1

Met Lys Ser Glu Leu Ile Phe Leu Pro Ala Pro Ala Ile Gly His Leu

1 5 1015

Val Gly Met Val Glu Met Ala Lys Leu Phe Ile Ser Arg His Glu Asn

202530

Leu Ser Val Thr Val Leu Ile Ala Lys Phe Tyr Met Asp Thr Gly Val

354045

Asp Asn Tyr Asn Lys Ser Leu Leu Thr Asn Pro Thr Pro Arg Leu Thr

505560

Ile Val Asn Leu Pro Glu Thr Asp Pro Gln Asn Tyr Met Leu Lys Pro

65707580

Arg His Ala Ile Phe Pro Ser Val Ile Glu Thr Gln Lys Thr His Val

859095

Arg Asp Ile Ile Ser Gly Met Thr Gln Ser Glu Ser Thr Arg Val Val

100 105 110

Gly Leu Leu Ala Asp Leu Leu Phe Ile Asn Ile Met Asp Ile Ala Asn

115 120 125

Glu Phe Asn Val Pro Thr Tyr Val Tyr Ser Pro Ala Gly Ala Gly His

130 135 140

Leu Gly Leu Ala Phe His Leu Gln Thr Leu Asn Asp Lys Lys Gln Asp

145 150 155 160

Val Thr Glu Phe Arg Asn Ser Asp Thr Glu Leu Leu Val Pro Ser Phe

165 170 175

Ala Asn Pro Val Pro Ala Glu Val Leu Pro Ser Met Tyr Val Asp Lys

180 185 190

Glu Gly Gly Tyr Asp Tyr Leu Phe Ser Leu Phe Arg Arg Cys Arg Glu

195200205

Ser Lys Ala Ile Ile Ile Asn Thr Phe Glu Glu Leu Glu Pro Tyr Ala

210 215 220

Ile Asn Ser Leu Arg Met Asp Ser Met Ile Pro Pro Ile Tyr Pro Val

225 230 235 240

Gly Pro Ile Leu Asn Leu Asn Gly Asp Gly Gln Asn Ser Asp Glu Ala

245 250 255

Ala Val Ile Leu Gly Trp Leu Asp Asp Gln Pro Pro Ser Ser Val Val

260 265 270

Phe Leu Cys Phe Gly Ser Tyr Gly Thr Phe Gln Glu Asn Gln Val Lys

275 280 285

Glu Ile Ala Met Gly Leu Glu Arg Ser Gly His Arg Phe Leu Trp Ser

290 295 300

Leu Arg Pro Ser Ile Pro Lys Gly Glu Thr Lys Leu Gln Leu Lys Tyr

305 310 315 320

Ser Asn Leu Glu Glu Ile Leu Pro Val Gly Phe Leu Asp Arg Thr Ser

325 330 335

Cys Val Gly Lys Val Ile Gly Trp Ala Pro Gln Val Ala Val Leu Gly

340 345 350

His Glu Ala Val Gly Gly Phe Leu Ser His Cys Gly Trp Asn Ser Thr

355 360 365

Leu Glu Ser Val Trp Cys Gly Val Pro Val Ala Thr Trp Pro Met Tyr

370 375 380

Gly Glu Gln Gln Leu Asn Ala Phe Glu Met Val Lys Glu Leu Gly Ile

385 390 395 400

Ala Val Glu Ile Glu Val Asp Tyr Lys Asn Glu Tyr Phe Asn Met Asn

405 410 415

Asn Asp Phe Ile Val Arg Ala Glu Glu Ile Glu Thr Lys Ile Lys Lys

420 425 430

Leu Met Met Asp Glu Lys Asn Ser Glu Ile Arg Lys Lys Val Lys Glu

435 440 445

Met Lys Glu Lys Ser Arg Leu Ala Met Ser Glu Asn Gly Ser Ser Tyr

450 455 460

Asn Ser Leu Ala Lys Leu Phe Glu Lys Ile Met

465 470 475

<210> 2

<211> 1428

<212> DNA

<213> 人参

<400> 2

atgaagtcag aattgatatt cttgcccgcc ccggccatcg gacacctcgt gggaatggtg 60

gagatggcta aactcttcat cagtcgacat gaaaacctct cggtcaccgt cctcatcgcg 120

aaattctaca tggatacggg ggtagacaac tacaataaat cactcttaac aaaccctacc 180

ccgcgtctca caattgtaaa tctcccggaa accgaccccc aaaactatat gctcaaacca 240

cgccatgcca tctttcctag cgtcatcgag actcagaaga cacacgtgcg agacataata 300

tcaggcatga ctcagtccga gtcgactcgg gtcgttggtt tgctggctga ccttttgttc 360

atcaacatta tggacattgc caatgagttc aatgttccaa cttatgtata ctcccctgcc 420

ggagccggtc atcttggcct cgcgttccat ctccagacac tcaacgacaa aaagcaagat 480

gtgaccgagt tcaggaactc ggacactgag ttattggtac cgagttttgc aaacccggtt 540

cccgccgagg tcttgccgtc gatgtatgtg gataaagaag gtgggtatga ttatttgttt 600

tcattgttcc ggaggtgcag agagtcaaag gcaattatta ttaacacgtt tgaggagctg 660

gaaccctatg cgatcaattc cctccggatg gatagtatga tccctccgat ctacccggtg 720

ggacccatac taaatctcaa cggtgatggc caaaactccg atgaggctgc tgtgatcctt 780

ggttggttag atgatcaacc accttcatct gtggtgtttt tgtgctttgg tagctatgga 840

acctttcaag aaaaccaggt gaaggagatt gcaatgggtc tagagcgcag tgggcatcgc 900

ttcttgtggt ccttgcgtcc gtctatccct aaaggcgaga caaagcttca gcttaaatac 960

tcaaatttgg aagaaattct cccagtcgga ttcttggaca ggacatcatg cgtcggaaaa 1020

gttattggat gggccccgca agtggcggtg ctcggacacg aggcagtcgg agggttcctg 1080

tctcattgtg gttggaattc gacattagag agtgtgtggt gtggcgtgcc cgtcgcaaca 1140

tggccaatgt acggcgagca acaactcaat gcttttgaga tggttaagga gttaggtatt 1200

gcggtggaaa ttgaggtgga ctataagaat gaatatttta acatgaataa tgattttatt 1260

gttagggcag aagaaatcga gacgaaaata aagaagttga tgatggatga aaagaatagt 1320

gaaataagga agaaggtaaa ggaaatgaaa gaaaagagta ggcttgcaat gtctgagaat 1380

ggatcatctt ataattcatt ggccaaacta tttgagaaaa ttatgtga1428

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgDS启动子

<400> 3

aaatgaagaa ggtggttggg 20

<210> 4

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgDS启动子

<400> 4

ctctatgcag aggtgtcgga 20

<210> 5

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> PgPPDS启动子

<400> 5

gggaggattt gaggaagatg aag 23

<210> 6

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> PgPPDS启动子

<400> 6

cagatgcatc ttccatccct ttgg 24

<210> 7

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> PgPPTS启动子

<400> 7

gagattagta cctccttctc aagg 24

<210> 8

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> PgPPTS启动子

<400> 8

gaatggcata ggtccatctc cttc 24

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgUGT74A1启动子

<400> 9

tatcgaaccc gaacgtacaa 20

<210> 10

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgUGT74A1启动子

<400> 10

gtcgagttcc aaccacaatg 20

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgUGT94B1启动子

<400> 11

gacagaggat tggttgtgga 20

<210> 12

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgUGT94B1启动子

<400> 12

tcaaaggctg atcaagatgc 20

<210> 13

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> PgUGT71A1启动子

<400> 13

cctccggatg gatagtatga tcc 23

<210> 14

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> PgUGT71A1启动子

<400> 14

cattgcaatc tccttcacct gg 22

<210> 15

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgTubulin启动子

<400> 15

gaaggctttc ttgcattggt 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> PgTubulin启动子

<400> 16

cccagatcgt cttcttctcc 20

<210> 17

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> PgUGT71A1-F (用于克隆)

<400> 17

aggcaggatc catgaagtca gaattgatat tcttgcccgc cccggc 46

<210> 18

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> PgUGT71A1-R (用于克隆)

<400> 18

aggcatctcg agtcacataa ttttctcaaa tagtttggcc aatgaat 47

<210> 19

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 启动子 MET3p_pRS306-F

<400> 19

aggcatgagc tctttagtac taacagagac ttttgtcaca actacatata agtgtacaaa 60

ta 62

<210> 20

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 启动子 MET3p_pRS306-B

<400> 20

aggcattcta gatgttaatt atactttatt cttgttatta ttatactttc ttagttcctt 60

tt 62

<210> 21

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 启动子 ERG7_pRS306-F

<400> 21

aggcatacta gtatgacaga attttattct gacacaatcg gtct 44

<210> 22

<211> 44

<212> DNA

<213> 启动子 ERG7_pRS306-B

<400> 22

aggcatctcg agttaaagcg tatgtgtttc atatgccctg ctgt 44

<210> 23

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 启动子 CYC1ter_pRS306-F

<400> 23

aggcatctcg agtcatgtaa ttagttatgt cacgcttaca ttcacgccct c 51

<210> 24

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 启动子 CYC1ter_pRS306-B

<400> 24

aggcatggta ccggccgcaa attaaagcct tcgagcgtcc caaaacc 47

<210> 25

<211> 85

<212> DNA

<213> 启动子 ERG7 敲减-F

<400> 25

gcccaataac cttaccaata atcgtcgccc acaaagaaag tacaaaacag tcagagcaga 60

ttgtactgag agtgcaccac gcttt 85

<210> 26

<211> 85

<212> DNA

<213> 启动子 ERG7 敲减-B

<400> 26

tgcactagtt tctaattgtt gcagcctcta acaacactta taaataaaac tcggaattaa 60

ccctcactaa agggaacaaa agctg 85

<210> 27

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 启动子 ERG7 敲减确认-F

<400> 27

gcccaataac cttaccaata atcgtcgccc acaaagaaag tacaaaacag 50

<210> 28

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 启动子 ERG7 敲减确认-B

<400> 28

tgcactagtt tctaattgtt gcagcctcta acaacactta taaataaaac 50

<210> 29

<211> 769

<212> PRT

<213> 人参达玛烯二醇-合酶

<400> 29

Met Trp Lys Gln Lys Gly Ala Gln Gly Asn Asp Pro Tyr Leu Tyr Ser

1 5 1015

Thr Asn Asn Phe Val Gly Arg Gln Tyr Trp Glu Phe Gln Pro Asp Ala

202530

Gly Thr Pro Glu Glu Arg Glu Glu Val Glu Lys Ala Arg Lys Asp Tyr

354045

Val Asn Asn Lys Lys Leu His Gly Ile His Pro Cys Ser Asp Met Leu

505560

Met Arg Arg Gln Leu Ile Lys Glu Ser Gly Ile Asp Leu Leu Ser Ile

65707580

Pro Pro Leu Arg Leu Asp Glu Asn Glu Gln Val Asn Tyr Asp Ala Val

859095

Thr Thr Ala Val Lys Lys Ala Leu Arg Leu Asn Arg Ala Ile Gln Ala

100 105 110

His Asp Gly His Trp Pro Ala Glu Asn Ala Gly Ser Leu Leu Tyr Thr

115 120 125

Pro Pro Leu Ile Ile Ala Leu Tyr Ile Ser Gly Thr Ile Asp Thr Ile

130 135 140

Leu Thr Lys Gln His Lys Lys Glu Leu Ile Arg Phe Val Tyr Asn His

145 150 155 160

Gln Asn Glu Asp Gly Gly Trp Gly Ser Tyr Ile Glu Gly His Ser Thr

165 170 175

Met Ile Gly Ser Val Leu Ser Tyr Val Met Leu Arg Leu Leu Gly Glu

180 185 190

Gly Leu Ala Glu Ser Asp Asp Gly Asn Gly Ala Val Glu Arg Gly Arg

195 200 205

Lys Trp Ile Leu Asp His Gly Gly Ala Ala Gly Ile Pro Ser Trp Gly

210 215 220

Lys Thr Tyr Leu Ala Val Leu Gly Val Tyr Glu Trp Glu Gly Cys Asn

225 230 235 240

Pro Leu Pro Pro Glu Phe Trp Leu Phe Pro Ser Ser Phe Pro Phe His

245 250 255

Pro Ala Lys Met Trp Ile Tyr Cys Arg Cys Thr Tyr Met Pro Met Ser

260 265 270

Tyr Leu Tyr Gly Lys Arg Tyr His Gly Pro Ile Thr Asp Leu Val Leu

275 280 285

Ser Leu Arg Gln Glu Ile Tyr Asn Ile Pro Tyr Glu Gln Ile Lys Trp

290 295 300

Asn Gln Gln Arg His Asn Cys Cys Lys Glu Asp Leu Tyr Tyr Pro His

305 310 315 320

Thr Leu Val Gln Asp Leu Val Trp Asp Gly Leu His Tyr Phe Ser Glu

325 330 335

Pro Phe Leu Lys Arg Trp Pro Phe Asn Lys Leu Arg Lys Arg Gly Leu

340 345 350

Lys Arg Val Val Glu Leu Met Arg Tyr Gly Ala Thr Glu Thr Arg Phe

355 360 365

Ile Thr Thr Gly Asn Gly Glu Lys Ala Leu Gln Ile Met Ser Trp Trp

370 375 380

Ala Glu Asp Pro Asn Gly Asp Glu Phe Lys His His Leu Ala Arg Ile

385 390 395 400

Pro Asp Phe Leu Trp Ile Ala Glu Asp Gly Met Thr Val Gln Ser Phe

405 410 415

Gly Ser Gln Leu Trp Asp Cys Ile Leu Ala Thr Gln Ala Ile Ile Ala

420 425 430

Thr Asn Met Val Glu Glu Tyr Gly Asp Ser Leu Lys Lys Ala His Phe

435 440 445

Phe Ile Lys Glu Ser Gln Ile Lys Glu Asn Pro Arg Gly Asp Phe Leu

450 455 460

Lys Met Cys Arg Gln Phe Thr Lys Gly Ala Trp Thr Phe Ser Asp Gln

465 470 475 480

Asp His Gly Cys Val Val Ser Asp Cys Thr Ala Glu Ala Leu Lys Cys

485 490 495

Leu Leu Leu Leu Ser Gln Met Pro Gln Asp Ile Val Gly Glu Lys Pro

500 505 510

Glu Val Glu Arg Leu Tyr Glu Ala Val Asn Val Leu Leu Tyr Leu Gln

515 520 525

Ser Arg Val Ser Gly Gly Phe Ala Val Trp Glu Pro Pro Val Pro Lys

530 535 540

Pro Tyr Leu Glu Met Leu Asn Pro Ser Glu Ile Phe Ala Asp Ile Val

545 550 555 560

Val Glu Arg Glu His Ile Glu Cys Thr Ala Ser Val Ile Lys Gly Leu

565 570 575

Met Ala Phe Lys Cys Leu His Pro Gly His Arg Gln Lys Glu Ile Glu

580 585 590

Asp Ser Val Ala Lys Ala Ile Arg Tyr Leu Glu Arg Asn Gln Met Pro

595 600 605

Asp Gly Ser Trp Tyr Gly Phe Trp Gly Ile Cys Phe Leu Tyr Gly Thr

610 615 620

Phe Phe Thr Leu Ser Gly Phe Ala Ser Ala Gly Arg Thr Tyr Asp Asn

625 630 635 640

Ser Glu Ala Val Arg Lys Gly Val Lys Phe Phe Leu Ser Thr Gln Asn

645 650 655

Glu Glu Gly Gly Trp Gly Glu Ser Leu Glu Ser Cys Pro Ser Glu Lys

660 665 670

Phe Thr Pro Leu Lys Gly Asn Arg Thr Asn Leu Val Gln Thr Ser Trp

675 680 685

Ala Met Leu Gly Leu Met Phe Gly Gly Gln Ala Glu Arg Asp Pro Thr

690 695 700

Pro Leu His Arg Ala Ala Lys Leu Leu Ile Asn Ala Gln Met Asp Asn

705 710 715 720

Gly Asp Phe Pro Gln Gln Glu Ile Thr Gly Val Tyr Cys Lys Asn Ser

725 730 735

Met Leu His Tyr Ala Glu Tyr Arg Asn Ile Phe Pro Leu Trp Ala Leu

740 745 750

Gly Glu Tyr Arg Lys Arg Val Trp Leu Pro Lys His Gln Gln Leu Lys

755 760 765

Ile

<210> 30

<211> 2310

<212> DNA

<213> 人参达玛烯二醇-合酶

<400> 30

atgtggaagc tgaaggttgc tcaaggaaat gatccatatt tgtatagcac taacaacttt 60

gttggcagac aatattggga gtttcagccc gatgctggta ctccagaaga gagggaagag 120

gttgaaaaag cacgcaagga ttatgtaaac aataagaagc tacatggaat tcatccatgc 180

agtgatatgc tgatgcgcag gcagcttatt aaagaaagtg gaatcgatct cctaagcata 240

ccgccggtga gattagatga aaacgaacaa gtgaactacg atgcagttac aaccgctgtg 300

aagaaagctc ttcgattgaa ccgggcaatt caagcacacg atggtcactg gccagctgaa 360

aatgcaggct ctttacttta tacacctccc cttatcattg ccctatatat cagcggaacg 420

attgacacta ttctgacaaa acaacacaag aaggaactga ttcgcttcgt ttacaaccat 480

caaaatgagg atggtggatg gggatcctat attgaggggc acagcacgat gattgggtca 540

gtacttagct acgtgatgtt acgtttgcta ggagaaggat tagctgaatc tgatgatgga 600

aatggtgcag ttgagagagg ccggaagtgg atacttgatc atggaggtgc agccagcata 660

ccctcttggg gaaagactta tctagcggtg cttggagtat atgagtggga agggtgcaac 720

ccgctgcccc cagaattctg gcttttccct tcaagttttc cttttcatcc agcaaaaatg 780

tggatctact gccggtgcac ttacatgcca atgtcgtatt tgtatgggaa gagatatcat 840

ggaccaataa ccgatcttgt tttatctttg aggcaagaaa tttacaacat tccttatgag 900

cagataaagt ggaatcaaca gcgccataac tgttgcaagg aggatctcta ctaccctcat 960

acccttgtac aagacctggt ttgggatggt cttcactact ttagtgaacc attcctcaaa 1020

cgttggccct tcaacaaact gcgaaaaaga ggtctaaaaa gagttgttga actaatgcgc 1080

tatggtgcca ccgagaccag attcataacc acaggaaatg gggaaaaagc tttacaaata 1140

atgagttggt gggcagaaga tcccaatggt gatgagttta aacatcacct tgctagaatt 1200

cctgatttct tatggattgc tgaggatgga atgacagtac agagttttgg tagtcaacta 1260

tgggactgta ttcttgctac tcaagcaatt atcgccacca atatggttga agaatacgga 1320

gattctctta agaaggcgca tttcttcatc aaagaatcgc agataaaaga aaatccaaga 1380

ggagacttcc taaaaatgtg tcgacagttt accaaaggtg cgtggacttt ctctgatcaa 1440

gatcatggtt gcgttgtctc ggactgcaca gctgaagcac taaagtgcct actgttactt 1500

tcacaaatgc cacaggatat tgtcggagaa aaacctgagg ttgagcgatt atatgaggct 1560

gtgaatgttc ttctctattt gcagagtcgt gtaagtggtg gtttcgcagt ttgggagcct 1620

ccagttccaa aaccatattt ggagatgttg aatccttcag aaatttttgc agacattgtt 1680

gttgagagag agcacattga atgcactgca tctgtaatca aaggtctgat ggcatttaaa 1740

tgcttgcatc ctgggcatcg tcagaaagag atagaggatt ctgtggcgaa agccatccga 1800

tatcttgaaa gaaaccaaat gcctgatggt tcatggtatg gcttttgggg aatttgtttc 1860

ctctatggga cattttttac cctatcaggg tttgcttctg ctgggaggac ttatgacaac 1920

agtgaagcag ttcgtaaggg tgttaaattt ttcctttcaa cacaaaatga agaaggtggt 1980

tggggggaga gtcttgaatc atgcccaagc gaaaaattta caccactcaa gggaaacaga 2040

acaaatctag tacaaacatc atgggctatg ttaggtctta tgtttggtgg acaggccgag 2100

agagatccga cacctctgca tagagcagca aagttgttga tcaatgcgca aatggacaat 2160

ggagatttcc ctcaacagga aattactgga gtatactgta aaaatagtat gttacattat 2220

gcggagtaca gaaatatatt tcctctttgg gcactcggag aatatcggaa acgtgtttgg 2280

ttgcctaagc accagcagct caaaatttaa2310

<210> 31

<211> 2310

<212> DNA

<213> 人参达玛烯二醇-合酶_大肠杆菌密码子优化

<400> 31

atgtggaaac agaagggtgc ccaaggaaat gacccatatc tgtatagcac gaacaacttt 60

gttggcagac aatattggga gttccagccc gacgccggta ctccggaaga acgggaagag 120

gttgaaaaag cgcgcaagga ttatgtaaac aataaaaagt tacatggcat tcatccatgc 180

agtgatatgc tgatgcgcag gcagttaatt aaagaatccg gaatcgattt actaagcata 240

ccgccgctga gattagatga aaacgagcag gtgaactacg acgcagtaac aaccgctgtg 300

aagaaagctc ttcgattgaa ccgggctatt caggcacacg atggtcactg gccggctgaa 360

aatgcaggct ctttattata tacacctccc cttatcattg ccctgtatat cagcggcacg 420

attgacacta ttctgacaaa acaacacaag aaggaactga ttcgcttcgt ttacaatcat 480

cagaatgagg atggtggatg ggggagctat attgaggggc acagcacgat gattgggtca 540

gtacttagct acgtgatgtt acgcttgcta ggagaaggct tagccgaatc tgatgatgga 600

aatggcgctg tcgaacgcgg ccggaaatgg atactggatc atgggggtgc agccggcata 660

ccctcctggg gaaagactta tctagcggtg ttgggagtct atgaatggga aggctgcaac 720

ccgctgcccc cagagttttg gctgtttcct tcaagttttc cttttcatcc agcaaaaatg 780

tggatctact gtcggtgtac gtacatgcca atgtcgtatc tgtatggcaa gagatatcat 840

ggaccaataa ccgatcttgt attatctttg cgccaagaga tttacaatat cccttatgaa 900

cagataaagt ggaaccagca gcgccataac tgttgcaaag aagatctcta ctatcctcat 960

acccttgtac aggatctggt ttgggatggt ctccactact tttccgagcc gttcctcaag 1020

cgttggccct tcaacaaact gcgcaagaga ggtctaaaaa gagttgttga actgatgcgc 1080

tacggtgcta ccgagaccag attcataacc acaggcaatg gggaaaaagc tctgcaaata 1140

atgagctggt gggcggaaga tcccaatggt gacgaattta aacaccacct cgccagaatc 1200

cctgattttc tatggatcgc tgaggacgga atgacagtac agagttttgg cagtcaacta 1260

tgggattgta ttcttgctac tcaagcaatt attgccacca atatggttga agaatacgga 1320

gattctctta agaaagccca cttcttcatc aaagaatcgc agatcaaaga aaatccacgt 1380

ggagacttcc tgaaaatgtg ccgacagttt accaaaggcg cgtggacttt ctccgatcaa 1440

gaccatggtt gtgttgtctc ggactgcacg gctgaagcgc taaagtgtct actgttactt 1500

tcgcaaatgc cacaggatat cgtcggggaa aaacctgagg ttgagcgatt atatgaggcc 1560

gtgaatgttc tactctattt gcagagtcgt gtgagtggtg gtttcgcagt gtgggagcct 1620

ccagtcccaa agccatattt ggagatgctg aatccgtcag aaatttttgc agacattgtt 1680

gttgagagag agcatattga atgcactgca tctgtaatca aaggtctgat ggcgtttaag 1740

tgcctgcatc ctgggcatcg tcagaaagag atagaggatt ctgtggcgaa agccatccgt 1800

taccttgaaa gaaaccagat gcctgatggt tcatggtatg gcttttgggg catttgtttc 1860

ctctatggga cattttttac cctatctggg tttgcatctg ctggacggac ttatgacaac 1920

agtgaagccg ttcgtaaagg tgttaaattt tttctttcaa cgcagaatga ggagggtggt 1980

tggggggagt ccctggaatc atgcccgagc gaaaaattta caccgctcaa ggggaaccgc 2040

accaacctag tgcaaacatc atgggcgatg ttgggtctta tgtttggcgg tcaggccgag 2100

agagatccga caccgctgca tagagcagcg aagttgttga ttaacgcgca aatggataat 2160

ggggatttcc ctcaacagga aattacgggc gtgtactgta aaaatagtat gttacattat 2220

gcggagtata gaaatatctt tccgttatgg gcactgggcg aataccggaa acgtgtttgg 2280

ttgccgaagc accagcagct gaaaatttaa2310

<210> 32

<211> 525

<212> PRT

<213> 截短的HMG-CoA还原酶

<400> 32

Met Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe Thr Ala

1 5 1015

Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr Val Ile

202530

Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser Ser Ser

354045

Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile Glu Ser

505560

Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu Leu Ser

65707580

Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala Leu Val

859095

Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu Gly Asp

100 105 110

Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile Leu Ala

115 120 125

Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn Tyr Asp

130 135 140

Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met

145 150 155 160

Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly Thr Ser

165 170 175

Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Ala

180 185 190

Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr Thr Val

195 200 205

Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe Pro Thr

210 215 220

Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu Glu Gly

225 230 235 240

Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg

245 250 255

Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe Met Arg

260 265 270

Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys

275 280 285

Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly Trp Glu

290 295 300

Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp Lys Lys

305 310 315 320

Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Ala

325 330 335

Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys Ser Asp

340 345 350

Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val Gly Ser

355 360 365

Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn Leu

370 375 380

Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln Asn Val

385 390 395 400

Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly Asp Leu

405 410 415

Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile Gly Gly

420 425 430

Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu Gly Val

435 440 445

Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln Leu Ala

450 455 460

Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala

465 470 475 480

Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His Asn Arg

485 490 495

Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr Asp Ile

500 505 510

Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser

515 520 525

<210> 33

<211> 1578

<212> DNA

<213> 截短的HMG-CoA还原酶

<400> 33

atggaccaat tggtgaaaac tgaagtcacc aagaagtctt ttactgctcc tgtacaaaag 60

gcttctacac cagttttaac caataaaaca gtcatttctg gatcgaaagt caaaagttta 120

tcatctgcgc aatcgagctc atcaggacct tcatcatcta gtgaggaaga tgattcccgc 180

gatattgaaa gcttggataa gaaaatacgt cctttagaag aattagaagc attattaagt 240

agtggaaata caaaacaatt gaagaacaaa gaggtcgctg ccttggttat tcacggtaag 300

ttacctttgt acgctttgga gaaaaaatta ggtgatacta cgagagcggt tgcggtacgt 360

aggaaggctc tttcaatttt ggcagaagct cctgtattag catctgatcg tttaccatat 420

aaaaattatg actacgaccg cgtatttggc gcttgttgtg aaaatgttat aggttacatg 480

cctttgcccg ttggtgttat aggccccttg gttatcgatg gtacatctta tcatatacca 540

atggcaacta cagagggttg tttggtagct tctgccatgc gtggctgtaa ggcaatcaat 600

gctggcggtg gtgcaacaac tgttttaact aaggatggta tgacaagagg cccagtagtc 660

cgtttcccaa ctttgaaaag atctggtgcc tgtaagatat ggttagactc agaagaggga 720

caaaacgcaa ttaaaaaagc ttttaactct acatcaagat ttgcacgtct gcaacatatt 780

caaacttgtc tagcaggaga tttactcttc atgagattta gaacaactac tggtgacgca 840

atgggtatga atatgatttc taagggtgtc gaatactcat taaagcaaat ggtagaagag 900

tatggctggg aagatatgga ggttgtctcc gtttctggta actactgtac cgacaaaaaa 960

ccagctgcca tcaactggat cgaaggtcgt ggtaagagtg tcgtcgcaga agctactatt 1020

cctggtgatg ttgtcagaaa agtgttaaaa agtgatgttt ccgcattggt tgagttgaac 1080

attgctaaga atttggttgg atctgcaatg gctgggtctg ttggtggatt taacgcacat 1140

gcagctaatt tagtgacagc tgttttcttg gcattaggac aagatcctgc acaaaatgtc 1200

gaaagttcca actgtataac attgatgaaa gaagtggacg gtgatttgag aatttccgta 1260

tccatgccat ccatcgaagt aggtaccatc ggtggtggta ctgttctaga accacaaggt 1320

gccatgttgg acttattagg tgtaagaggc ccacatgcta ccgctcctgg taccaacgca 1380

cgtcaattag caagaatagt tgcctgtgcc gtcttggcag gtgaattatc cttatgtgct 1440

gccctagcag ccggccattt ggttcaaagt catatgaccc acaacaggaa acctgctgaa 1500

ccaacaaaac ctaacaattt ggacgccact gatataaatc gtttgaaaga tgggtccgtc 1560

acctgcatta aatcctaa 1578

<210> 34

<211> 482

<212> PRT

<213> 人参原人参二醇合酶

<400> 34

Met Val Leu Phe Phe Ser Leu Ser Leu Leu Leu Leu Pro Leu Leu Leu

1 5 1015

Leu Phe Ala Tyr Phe Ser Tyr Thr Lys Arg Ile Pro Gln Lys Glu Asn

202530

Asp Ser Lys Ala Pro Leu Pro Pro Gly Gln Thr Gly Trp Pro Leu Ile

354045

Gly Glu Thr Leu Asn Tyr Leu Ser Cys Val Lys Ser Gly Val Ser Glu

505560

Asn Phe Val Lys Tyr Arg Lys Glu Lys Tyr Ser Pro Lys Val Phe Arg

65707580

Thr Ser Leu Leu Gly Glu Pro Met Ala Ile Leu Cys Gly Pro Glu Gly

859095

Asn Lys Phe Leu Tyr Ser Thr Glu Lys Lys Leu Val Gln Val Trp Phe

100105 110

Pro Ser Ser Val Glu Lys Met Phe Pro Arg Ser His Gly Glu Ser Asn

115 120 125

Ala Asp Asn Phe Ser Lys Val Arg Gly Lys Met Met Phe Leu Leu Lys

130 135 140

Val Asp Gly Met Lys Lys Tyr Val Gly Leu Met Asp Arg Val Met Lys

145 150 155 160

Gln Phe Leu Glu Thr Asp Trp Asn Arg Gln Gln Gln Ile Asn Val His

165 170 175

Asn Thr Val Lys Lys Tyr Thr Val Thr Met Ser Cys Arg Val Phe Met

180 185 190

Ser Ile Asp Asp Glu Glu Gln Val Thr Arg Leu Gly Ser Ser Ile Gln

195 200 205

Asn Ile Glu Ala Gly Leu Leu Ala Val Pro Ile Asn Ile Pro Gly Thr

210 215 220

Ala Met Asn Arg Ala Ile Lys Thr Val Lys Leu Leu Thr Arg Glu Val

225 230 235 240

Glu Ala Val Ile Lys Gln Arg Lys Val Asp Leu Leu Glu Asn Lys Gln

245 250 255

Ala Ser Gln Pro Gln Asp Leu Leu Ser His Leu Leu Leu Thr Ala Asn

260 265 270

Gln Asp Gly Gln Phe Leu Ser Glu Ser Asp Ile Ala Ser His Leu Ile

275 280 285

Gly Leu Met Gln Gly Gly Tyr Thr Thr Leu Asn Gly Thr Ile Thr Phe

290 295 300

Val Leu Asn Tyr Leu Ala Glu Phe Pro Asp Val Tyr Asn Gln Val Leu

305 310 315 320

Lys Glu Gln Val Glu Ile Ala Asn Ser Lys His Pro Lys Glu Leu Leu

325 330 335

Asn Trp Glu Asp Leu Arg Lys Met Lys Tyr Ser Trp Asn Val Ala Gln

340 345 350

Glu Val Leu Arg Ile Ile Pro Pro Gly Val Gly Thr Phe Arg Glu Ala

355 360 365

Ile Thr Asp Phe Thr Tyr Ala Gly Tyr Leu Ile Pro Lys Gly Trp Lys

370 375 380

Met His Leu Ile Pro His Asp Thr His Lys Asn Pro Thr Tyr Phe Pro

385 390 395 400

Ser Pro Glu Lys Phe Asp Pro Thr Arg Phe Glu Gly Asn Gly Pro Ala

405 410 415

Pro Tyr Thr Phe Thr Pro Phe Gly Gly Gly Pro Arg Met Cys Pro Gly

420 425 430

Ile Glu Tyr Ala Arg Leu Val Ile Leu Ile Phe Met His Asn Val Val

435 440 445

Thr Asn Phe Arg Trp Glu Lys Leu Ile Pro Asn Glu Lys Ile Leu Thr

450 455 460

Asp Pro Ile Pro Arg Phe Ala His Gly Leu Pro Ile His Leu His Pro

465 470 475 480

His Asn

<210> 35

<211> 1449

<212> DNA

<213> 人参原人参二醇合酶

<400> 35

atggtgttgt ttttctccct atctcttctt ctccttcccc tattattatt gtttgcctat 60

ttttcttata caaaacgcat cccccagaaa gaaaatgatt caaaagctcc cctcccccca 120

ggtcaaacag gttggccttt gataggcgaa actcttaatt atttatcttg tgtcaaaagt 180

ggggtttctg aaaattttgt gaaatatagg aaggaaaagt attcccccaa agttttcagg 240

acatcacttt taggagaacc gatggcaatc ttgtgtgggc cggagggcaa caaattcctc 300

tactcaacgg aaaaaaagct agtccaagtt tggttcccga gcagtgttga aaagatgttc 360

cccagatctc atggcgaatc caacgcagac aacttctcca aagtacgcgg caaaatgatg 420

tttctactca aggtggacgg gatgaaaaaa tatgttggcc taatggacag ggtgatgaaa 480

cagtttttag agacagattg gaatcgccaa caacagatca acgttcataa cacggttaag 540

aaatacacgg tcacgatgtc gtgtcgggtg tttatgagta tcgatgatga agagcaagtt 600

acaagacttg gcagctcaat tcagaacata gaggccggac tccttgccgt gcctataaat 660

ataccgggga ctgctatgaa tcgtgccatt aagaccgtaa agttgctaac tagagaggtt 720

gaggcggtga ttaagcaaag aaaagtggat cttttggaga ataagcaagc gtcccaaccg 780

caagatttat tgtcacactt gctacttacg gccaatcagg atggccaatt tttgagcgaa 840

tcggatattg ctagccactt gataggcttg atgcaaggtg gctataccac cttaaatggt 900

acaatcacct tcgttctcaa ctatcttgca gagtttcctg atgtctacaa tcaagtcctt 960

aaagagcaag tggaaatagc aaactcaaaa cacccaaaag agttgcttaa ttgggaggat 1020

ttgaggaaga tgaagtattc gtggaatgtt gctcaagagg tattgagaat aataccacca 1080

ggagttggaa cattcagaga agctattacc gatttcacct atgctggata tttaattcca 1140

aagggatgga agatgcatct gattccacat gacacgcaca agaacccaac atattttcca 1200

agtccagaaa aattcgatcc aaccaggttt gaaggaaatg gtccggctcc atatacattt 1260

actcctttcg gaggaggacc tcgaatgtgt ccgggaattg agtatgcacg tctagtaata 1320

ctcattttta tgcacaatgt ggttacaaac ttcagatggg agaagctcat ccctaatgaa 1380

aaaattctca ccgatcccat tccaagattt gcgcatggac ttcccattca tctacatccc 1440

cacaattaa 1449

<210> 36

<211> 712

<212> PRT

<213> 拟南芥细胞色素p450还原酶

<400> 36

Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala

1 5 1015

Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala

202530

Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu

354045

Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile

505560

Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser

65707580

Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu

859095

Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln

100 105 110

Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys

115 120 125

Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr

130 135 140

Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val

145 150 155 160

Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn

165 170 175

Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu

180 185 190

Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln

195 200 205

Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val

210 215 220

Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp

225 230 235 240

Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro

245 250 255

Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr

260 265 270

Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser

275 280 285

Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr

290 295 300

Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys

305 310 315 320

Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu

325 330 335

Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val

340 345 350

Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg

355 360 365

Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys

370 375 380

Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro

385 390 395 400

Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser

405 410 415

Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro

420 425 430

Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val

435 440 445

Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu

450 455 460

Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe

465 470 475 480

Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser

485 490 495

Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val

500 505 510

Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr

515 520 525

Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser

530 535 540

Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser

545 550 555 560

Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe

565 570 575

Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu

580 585 590

Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp

595 600 605

Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu

610 615 620

Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr

625 630 635 640

Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile

645 650 655

Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala

660 665 670

Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser

675 680 685

Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser

690 695 700

Gly Arg Tyr Leu Arg Asp Val Trp

705 710

<210> 37

<211> 2139

<212> DNA

<213> 拟南芥细胞色素p450还原酶

<400> 37

atgtcctctt cttcttcttc gtcaacctcc atgatcgatc tcatggcagc aatcatcaaa 60

ggagagcctg taattgtctc cgacccagct aatgcctccg cttacgagtc cgtagctgct 120

gaattatcct ctatgcttat agagaatcgt caattcgcca tgattgttac cacttccatt 180

gctgttctta ttggttgcat cgttatgctc gtttggagga gatccggttc tgggaattca 240

aaacgtgtcg agcctcttaa gcctttggtt attaagcctc gtgaggaaga gattgatgat 300

gggcgtaaga aagttaccat ctttttcggt acacaaactg gtactgctga aggttttgca 360

aaggctttag gagaagaagc taaagcaaga tatgaaaaga ccagattcaa aatcgttgat 420

ttggatgatt acgcggctga tgatgatgag tatgaggaga aattgaagaa agaggatgtg 480

gctttcttct tcttagccac atatggagat ggtgagccta ccgacaatgc agcgagattc 540

tacaaatggt tcaccgaggg gaatgacaga ggagaatggc ttaagaactt gaagtatgga 600

gtgtttggat taggaaacag acaatatgag cattttaata aggttgccaa agttgtagat 660

gacattcttg tcgaacaagg tgcacagcgt cttgtacaag ttggtcttgg agatgatgac 720

cagtgtattg aagatgactt taccgcttgg cgagaagcat tgtggcccga gcttgataca 780

atactgaggg aagaagggga tacagctgtt gccacaccat acactgcagc tgtgttagaa 840

tacagagttt ctattcacga ctctgaagat gccaaattca atgatataaa catggcaaat 900

gggaatggtt acactgtgtt tgatgctcaa catccttaca aagcaaatgt cgctgttaaa 960

agggagcttc atactcccga gtctgatcgt tcttgtatcc atttggaatt tgacattgct 1020

ggaagtggac ttacgtatga aactggagat catgttggtg tactttgtga taacttaagt 1080

gaaactgtag atgaagctct tagattgctg gatatgtcac ctgatactta tttctcactt 1140

cacgctgaaa aagaagacgg cacaccaatc agcagctcac tgcctcctcc cttcccacct 1200

tgcaacttga gaacagcgct tacacgatat gcatgtcttt tgagttctcc aaagaagtct 1260

gctttagttg cgttggctgc tcatgcatct gatcctaccg aagcagaacg attaaaacac 1320

cttgcttcac ctgctggaaa ggttgatgaa tattcaaagt gggtagtaga gagtcaaaga 1380

agtctacttg aggtgatggc cgagtttcct tcagccaagc caccacttgg tgtcttcttc 1440

gctggagttg ctccaaggtt gcagcctagg ttctattcga tatcatcatc gcccaagatt 1500

gctgaaacta gaattcacgt cacatgtgca ctggtttatg agaaaatgcc aactggcagg 1560

attcataagg gagtgtgttc cacttggatg aagaatgctg tgccttacga gaagagtgaa 1620

aactgttcct cggcgccgat atttgttagg caatccaact tcaagcttcc ttctgattct 1680

aaggtaccga tcatcatgat cggtccaggg actggattag ctccattcag aggattcctt 1740

caggaaagac tagcgttggt agaatctggt gttgaacttg ggccatcagt tttgttcttt 1800

ggatgcagaa accgtagaat ggatttcatc tacgaggaag agctccagcg atttgttgag 1860

agtggtgctc tcgcagagct aagtgtcgcc ttctctcgtg aaggacccac caaagaatac 1920

gtacagcaca agatgatgga caaggcttct gatatctgga atatgatctc tcaaggagct 1980

tatttatatg tttgtggtga cgccaaaggc atggcaagag atgttcacag atctctccac 2040

acaatagctc aagaacaggg gtcaatggat tcaactaaag cagagggctt cgtgaagaat 2100

ctgcaaacga gtggaagata tcttagagat gtatggtaa2139

<210> 38

<211> 2139

<212> DNA

<213> 拟南芥细胞色素p450还原酶_大肠杆菌密码子优化

<400> 38

atgtcctctt cttcttcttc gtcaaccagc atgattgatc tcatggcagc aatcatcaaa 60

ggggaacctg taattgtcag cgacccagct aatgcctccg cttatgagtc cgtagctgcg 120

gaactgtcca gtatgcttat agagaatcgt caattcgcca tgattgttac cacttccatt 180

gctgttctta ttggttgcat cgtgatgctc gtttggcgga gatccggttc tggaaatagt 240

aaacgtgtcg agcctcttaa gcctttggtg attaaacctc gtgaggaaga gattgatgat 300

ggtcgtaaga aagttaccat ctttttcggt acacagacgg ggacggcgga aggttttgca 360

aaggctttag gtgaggaagc taaagcacgt tatgaaaaga ccagatttaa gatcgtagat 420

ttagatgatt acgcggcgga tgatgacgag tatgaggaaa aacttaaaaa agaagatgtg 480

gcttttttct tcttagccac atacggggac ggtgagccca ccgacaatgc agcacggttc 540

tacaaatggt tcacggaggg gaatgacaga ggagaatggc ttaagaactt gaagtatggt 600

gtgtttggat taggaaaccg ccagtatgag cattttaata aggttgccaa agtcgtagat 660

gacattcttg tagaacaagg tgcacagcgt cttgtacagg tgggtcttgg agatgacgat 720

cagtgtattg aggatgactt taccgcgtgg cgtgaggcat tgtggcccga acttgataca 780

atcctgaggg aagaaggcga cacggcggtc gccacaccat ataccgcagc ggtgctggaa 840

taccgagttt ctattcacga cagcgaagac gccaaattca atgatataaa catggcaaat 900

gggaacggtt acactgtgtt tgatgctcaa catccttata aagcaaatgt cgctgtgaaa 960

cgcgaacttc atactcccga gtctgatcgt tcttgcatcc atttggagtt tgacattgct 1020

ggcagtgggc ttacgtatga aactggagat catgttgggg tactctgtga taacttaagt 1080

gaaaccgtgg atgaagctct tcgcttgctg gatatgtcac ctgacactta cttctcactc 1140

cacgctgaga aagaagacgg cacaccaatc agcagctcac tgcctcctcc cttccctcct 1200

tgcaacctca gaaccgcgct tacacgatat gcatgtcttt tgagttctcc taaaaaatct 1260

gctttagttg cgttggccgc tcatgcatct gatcctaccg aagcagaacg attaaagcac 1320

cttgcttcac ctgctggcaa ggttgacgaa tattcaaagt gggtagttga aagtcaaaga 1380

agtctacttg aagtgatggc cgaatttcct tcagccaagc caccgctggg tgtcttcttc 1440

gctggagttg cgccaaggtt gcagcctcgg ttctattcga tatcatcatc gcccaagatt 1500

gccgaaaccc ggattcacgt cacatgtgca ctggtttatg aaaaaatgcc aacgggcagg 1560

attcacaagg gtgtgtgttc cacgtggatg aagaatgcgg tgccttacga gaagagtgaa 1620

aactgctcct cggcgccgat atttgttcgc cagtcgaact tcaaattgcc gtctgattct 1680

aaagtaccga taatcatgat cggtccaggc actggcttag ctccgtttag aggattttta 1740

caggaaagac tagccttggt ggaatctggc gttgagcttg gcccatcagt tttgtttttt 1800

ggatgcagaa accgtagaat ggatttcatc tacgaggaag agttacagcg ttttgtcgag 1860

agtggtgctc tggctgagct aagcgtcgcc ttctctcgtg aaggcccgac caaagaatac 1920

gtacagcaca agatgatgga caaggcctct gatatctgga atatgatcag ccagggtgcc 1980

tatttatatg tttgtggtga cgcgaaaggc atggcaagag atgttcatcg gtctctccac 2040

acaatagctc aagaacaggg ctcaatggat tcgactaaag cagaggggtt cgtgaagaat 2100

ctgcaaacga gtgggagata tcttagagac gtgtggtaa2139

<210> 39

<211> 469

<212> PRT

<213> 人参原人参三醇合酶

<400> 39

Met Asp Leu Phe Ile Ser Ser Gln Leu Leu Leu Leu Leu Val Phe Cys

1 5 1015

Leu Phe Leu Phe Trp Asn Phe Lys Pro Ser Ser Gln Asn Lys Leu Pro

2025 30

Pro Gly Lys Thr Gly Trp Pro Ile Ile Gly Glu Thr Leu Glu Phe Ile

354045

Ser Cys Gly Gln Lys Gly Asn Pro Glu Lys Phe Val Thr Gln Arg Met

505560

Asn Lys Tyr Ser Pro Asp Val Phe Thr Thr Ser Leu Ala Gly Glu Lys

65707580

Met Val Val Phe Cys Gly Ala Ser Gly Asn Lys Phe Ile Phe Ser Asn

859095

Glu Asn Lys Leu Val Val Ser Trp Trp Pro Pro Ala Ile Ser Lys Ile

100 105 110

Leu Thr Ala Thr Ile Pro Ser Val Glu Lys Ser Lys Ala Leu Arg Ser

115 120 125

Leu Ile Val Glu Phe Leu Lys Pro Glu Ala Leu His Lys Phe Ile Ser

130 135 140

Val Met Asp Arg Thr Thr Arg Gln His Phe Glu Asp Lys Trp Asn Gly

145 150 155 160

Ser Thr Glu Val Lys Ala Phe Ala Met Ser Glu Ser Leu Thr Phe Glu

165 170 175

Leu Ala Cys Trp Leu Leu Phe Ser Ile Asn Asp Pro Val Gln Val Gln

180 185 190

Lys Leu Ser His Leu Phe Glu Lys Val Lys Ala Gly Leu Leu Ser Leu

195 200 205

Pro Leu Asn Phe Pro Gly Thr Ala Phe Asn Arg Gly Ile Lys Ala Ala

210 215 220

Asn Leu Ile Arg Lys Glu Leu Ser Val Val Ile Lys Gln Arg Arg Ser

225 230 235 240

Asp Lys Leu Gln Thr Arg Lys Asp Leu Leu Ser His Val Met Leu Ser

245 250 255

Asn Gly Glu Gly Glu Lys Phe Phe Ser Glu Met Asp Ile Ala Asp Val

260 265 270

Val Leu Asn Leu Leu Ile Ala Ser His Asp Thr Thr Ser Ser Ala Met

275 280 285

Gly Ser Val Val Tyr Phe Leu Ala Asp His Pro His Ile Tyr Ala Lys

290 295 300

Val Leu Thr Glu Gln Met Glu Ile Ala Lys Ser Lys Gly Ala Glu Glu

305 310 315 320

Leu Leu Ser Trp Glu Asp Ile Lys Arg Met Lys Tyr Ser Arg Asn Val

325 330 335

Ile Asn Glu Ala Met Arg Leu Val Pro Pro Ser Gln Gly Gly Phe Lys

340 345 350

Val Val Thr Ser Lys Phe Ser Tyr Ala Asn Phe Ile Ile Pro Lys Gly

355 360 365

Trp Lys Ile Phe Trp Ser Val Tyr Ser Thr His Lys Asp Pro Lys Tyr

370 375 380

Phe Lys Asn Pro Glu Glu Phe Asp Pro Ser Arg Phe Glu Gly Asp Gly

385 390 395 400

Pro Met Pro Phe Thr Phe Ile Pro Phe Gly Gly Gly Pro Arg Met Cys

405 410 415

Pro Gly Ser Glu Phe Ala Arg Leu Glu Val Leu Ile Phe Met His His

420 425 430

Leu Val Thr Asn Phe Lys Trp Glu Lys Val Phe Pro Asn Glu Lys Ile

435 440 445

Ile Tyr Thr Pro Phe Pro Phe Pro Glu Asn Gly Leu Pro Ile Arg Leu

450 455 460

Ser Pro Cys Thr Leu

465

<210> 40

<211> 1410

<212> DNA

<213> 人参原人参三醇合酶

<400> 40

atggatctct ttatctcatc tcaactactt cttctactag tcttttgctt attcctcttt 60

tggaatttca aaccaagtag ccaaaacaaa ctgcctccgg gcaaaacagg atggcccata 120

attggagaaa cactagaatt catctcctgt ggccaaaaag gcaaccctga aaagttcgta 180

acacaaagaa tgaacaaata ctcccctgat gtcttcacaa catccttagc aggcgagaaa 240

atggtagttt tctgcggtgc ctcggggaac aaattcattt tctccaacga aaacaagctt 300

gttgtgtcct ggtggccccc tgccatatcc aaaatcctaa ctgcaacaat accttcggta 360

gagaaaagca aagccttgcg gagtctaatt gttgaattct taaaacccga agcgctccac 420

aagtttattt ctgtcatgga tcggacaacg aggcagcact ttgaagacaa atggaacggg 480

agtacagaag tgaaagcttt cgctatgtca gagtcgctga cttttgagtt ggcctgttgg 540

ctgctcttta gcataaatga tccggtgcag gtgcagaagc tttctcatct ttttgagaag 600

gttaaagcgg gattattgtc tttaccttta aattttccgg gcacggcttt taaccgtggg 660

atcaaggccg ccaatcttat tagaaaagag ctttcggtgg tgataaaaca gaggagaagt 720

gataaattac agactcgaaa ggatcttttg tcccacgtta tgctttccaa tggcgagggc 780

gagaaatttt tcagcgaaat ggatattgcg gacgttgttc ttaatttact gattgctagc 840

catgatacca ctagcagtgc catgggctct gtggtctact ttcttgcaga tcatcctcac 900

atctatgcta aagttctcac agaacaaatg gagatcgcaa agtcgaaagg ggcagaagaa 960

cttttgagct gggaggacat aaagaggatg aagtattccc gcaatgttat aaatgaagct 1020

atgagattag tacctccttc tcaaggaggt tttaaagtag ttacaagtaa attcagttac 1080

gcaaacttca tcattcccaa aggatggaag atcttttgga gcgtatactc gacacataaa 1140

gatcccaaat actttaaaaa tccagaggag tttgatcctt caagatttga aggagatgga 1200

cctatgccat tcacatttat accatttgga ggaggaccaa ggatgtgccc tgggagtgag 1260

tttgctcgtc tggaggtact aatattcatg caccatttgg ttaccaattt taagtgggag 1320

aaggtgtttc ccaatgaaaa gattatttat actccatttc ccttcccgga gaatggtctt 1380

cctattcgtc tatcaccttg tacgctttaa1410

<210> 41

<211> 1410

<212> DNA

<213> 人参原人参三醇合酶_酵母密码子优化

<400> 41

atggacctct ttatctcttc tcaactactt cttttgttgg tcttttgctt gttcctattc 60

tggaacttca aaccatcaag ccaaaataaa ttacctccgg gcaaaaccgg atggccaata 120

attggagaaa ccctagaatt tatctcatgt ggccaaaaag ggaaccccga aaagttcgta 180

actcaaagaa tgaacaaata ttcacctgat gtctttacaa catccttagc aggtgagaag 240

atggtagttt tctgtggtgc ctcgggtaac aagtttattt tctccaacga aaacaaactt 300

gttgtgtcct ggtggccccc tgccatctcc aaaattctaa ctgcaacaat accttcggtc 360

gagaaatcca aggccttgcg tagtctgata gttgaatttt taaaacccga ggcgctccat 420

aagtttattt ctgttatgga tagaactacg aggcaacatt ttgaagacaa atggaacgga 480

agtacagagg ttaaggcttt cgctatgtca gaatcgctga cttttgagtt ggcctgttgg 540

ctattattca gcataaatga cccggtacag gtgcagaagt tgtctcattt atttgaaaag 600

gttaaagcgg gattattgtc tttacctctt aattttccag gtacggcttt caaccgtggg 660

atcaaggctg caaatcttat tagaaaagaa ctttcggtgg tgataaaaca aagaagaagt 720

gataaattac agactcgaaa ggatcttttg tcccacgtca tgctttctaa cggtgaaggc 780

gaaaagtttt tcagtgaaat ggatattgcg gacgttgttc ttaatttact cattgcttct 840

catgatacca cttctagtgc catgggctct gtggtctact ttcttgcaga tcatcctcac 900

atttatgcta aagttttaac ggaacaaatg gagatcgcaa agtcaaaggg ggcagaagaa 960

cttttgagct gggaggacat aaagaggatg aagtattccc gcaatgttat aaatgaagct 1020

atgagattag tacctccatc tcaaggaggt tttaaagttg tgacaagtaa attcagttat 1080

gctaatttca tcattcccaa aggttggaaa atcttttgga gcgtatactc tacccataaa 1140

gatccaaaat actttaaaaa tccagaagaa tttgatcctt caagatttga aggagatgga 1200

ccaatgccat ttacatttat accatttggt ggcggaccaa ggatgtgccc tggctcagag 1260

tttgctagac tggaggtact aattttcatg caccatttgg ttaccaattt taagtgggaa 1320

aaagtcttcc caaatgaaaa gattatctat actccattcc ccttcccgga gaatggtctt 1380

cctattagac tatcaccttg tactttataa1410

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法 [P] . 中国专利： CN106459987B . 2019.12.03
2. 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法 [P] . 中国专利： CN106459987A . 2017-02-22
3. A novel method for glycosylation of ginsenoside using a glycosyltransferase derived from panax ginseng [P] . 韩国专利： KR101788608B1 . 2017-10-24

机译：一种使用人参衍生的糖基转移酶进行人参皂苷糖基化的新方法
4. A NOVEL METHOD FOR GLYCOSYLATION OF GINSENOSIDE USING A GLYCOSYLTRANSFERASE DERIVED FROM PANAX GINSENG [P] . 欧洲知识产权局专利： EP3137612A4 . 2018-01-24

机译：利用人参中的糖基转移酶进行人参皂苷糖基化的新方法
5. A NOVEL METHOD FOR GLYCOSYLATION OF GINSENOSIDE USING A GLYCOSYLTRANSFERASE DERIVED FROM PANAX GINSENG [P] . 美国专利： US2017121750A1 . 2017-05-04

机译：利用人参中的糖基转移酶进行人参皂苷糖基化的新方法