法律状态公告日
法律状态信息
法律状态
2019-12-03
授权
授权
2017-03-22
实质审查的生效 IPC(主分类):C12N15/54 申请日:20150430
实质审查的生效
2017-02-22
公开
公开
技术领域
本发明涉及对位于原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的C-20位的羟基基团具有糖基化活性的尿苷二磷酸(UDP)糖基转移酶蛋白,和使用它来使UDP糖基化的方法。
背景技术
人参是广泛用于改善健康的最受欢迎的药用植物之一。人参的根已经在传统医学中作为草药茶被食用,并且目前被用于各种产品,包括糖果、速溶茶和滋补性饮料。人参皂苷是人参中含有的糖基化三萜化合物,可以对健康提供许多积极的作用。特别地,人参皂苷已知具有各种药理学作用,例如增强免疫系统和复苏身体机能,并且已经从人参的根中鉴定了超过40种不同的人参皂苷。然而,难以大规模地生产单独的人参皂苷仍然是研究每种人参皂苷的功效——例如其对特定疾病的治疗效果和所鉴定的人参皂苷的商业用途——的主要障碍。
人参皂苷是糖基化达玛烯型四环三萜,并且基于它们的糖苷配基结构可以分为三个不同的组:原人参二醇(PPD)型人参皂苷、原人参三醇(PPT)型人参皂苷和齐墩果酸型人参皂苷。基于通过糖苷键连接到化学结构中环的C-3、C-6和C-20位置的糖部分(糖苷配基)的位置和数目,这三个组可以进一步分类。PPD和PPT具有不同的羟基化模式。PPD在C-3、C-12和C-20位置具有-OH基团,而PPT在C-3、C-6、C-12和C-20位置具有-OH基团。PPD和PPT可以用葡萄糖或其它糖进行糖基化以转化成各种人参皂苷。糖基化PPD型人参皂苷包括人参皂苷Rb1、Rd、F2、Rg3、Rh2、化合物K(C-K)、Rb2、Rc、化合物MC(C-MC)、化合物Y(C-Y)等,并且糖基化PPT型人参皂苷包括人参皂苷Rg1、Rh1、F1、Rf、Re、Rg2等。
人参皂苷的生物合成途径仅部分被鉴定。在IPP异构酶(IPI)、GPP合酶(GPS)、FPP合酶(FPS)、鲨烯合酶(SS)和鲨烯环氧酶(SE)的作用下,通过异戊烯基二磷酸和二甲基烯丙基二磷酸(DMADP)的一系列缩合反应合成氧化鲨烯之前,已知人参皂苷与其它三萜部分地共享生物合成途径(Ajikumar等人,Science,330,70-74,2010;Ro等人,Nature,440,940-943,2006;Sun等人,BMC Genomics,11,262,2010)。氧化鲨烯通过达玛烯二醇-II合酶(DS)环化成达玛烯二醇-II,该DS是三萜环化酶。达玛烯二醇-II在C-3和C-20位置具有羟基基团,并通过p450酶原人参二醇合酶(PPDS)将C-12位羟基化被转化为PPD。通过另一种p450蛋白将原人参三醇合酶(PPTS)的C-6位羟基化,PPDS也可以被转化为PPT。PPD可以通过在C-3和/或C-20位的糖基化被转化为各种PPD型人参皂苷,并且PPT可以通过在C-6和/或C-20位的糖基化被转化为各种PPT型人参皂苷。
尿苷二磷酸(UDP)糖基转移酶(UGT)是催化将糖部分从UDP-糖转移到多种多样的代谢物例如激素和次级代谢物的酶。一般来说,UGT在生物合成途径的最后步骤中起作用以便增加代谢物的溶解度、稳定性、储存性、生物活性或生物可用性。如植物代谢物的非凡的多样性所认可的,每个植物基因组具有数百种不同的UGT。例如,拟南芥(Arabidopsisthaliana)植物模型含有107个UGT,这些UGT基于氨基酸序列属于14个不同的组(组A-N)。然而,尽管DS、PPDS和PPTS已被报道为参与人参皂苷生物合成的酶,但是关于UGT是否参与人参皂苷生物合成知之甚少。因此,对于特定人参皂苷的生产,需要鉴定使用人参皂苷作为底物的UGT。
不同的UGT对糖供体和糖受体都表现出底物特异性。例如,UGT78D2将葡萄糖从UDP-葡萄糖转移到黄酮醇(山奈酚或槲皮素)和花青素(矢车菊素)的C-3位,以便分别产生黄酮醇-3-O-葡萄糖苷和花青素-3-O-葡萄糖苷。似乎这种糖基化对于化合物的体内稳定性和储存是必不可少的。另一方面,UGT89C1将鼠李糖从UDP-鼠李糖转移到黄酮醇-3-O-葡萄糖苷的C-7位,以产生黄酮醇-3-O-葡萄糖苷-7-O-鼠李糖苷。由于UGT89C1不利用UDP-葡萄糖和花青素-3-O-葡萄糖苷作为底物,已知UGT78D2对UDP-糖和其它受体表现出不同的特异性。如所描述的,因为不同的UGT可以具有不同的底物特异性和区域选择性,所以有必要研究单个UGT的底物特异性和区域选择性。
发明内容
技术问题
本发明的发明人已经进行了大量的努力来开发具有底物特异性和区域选择性的新的UDP糖基转移酶,该UDP糖基转移酶可以被用于特定人参皂苷的生物合成。因此,他们已经鉴定了来自高丽参的新型糖基转移酶(PgUGT71A1),并且发现PgUGT71A1可以将PPD型人参皂苷PPD、Rh2和Rg3分别转化为人参皂苷C-K、F2和Rd,并且可以将PPT转化为F1。由于该蛋白质对PPD和PPT型人参皂苷的C-20位的羟基基团具有糖基化活性,本发明的发明人已经证实其可用于生产特定的糖基化人参皂苷,并且已经完成了本发明。
技术方案
本发明的目的是提供制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的方法,该方法包括将UDP糖基转移酶蛋白、引入了包含编码该蛋白的多核苷酸的载体或其片段并表现出该蛋白的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物处理为在C-20位具有羟基基团的PPD或PPT型人参皂苷。
本发明的另一个目的是提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的组合物,其包含选自下组的一种或多种作为活性组分,该组由以下各项组成:尿苷二磷酸(UDP)糖基转移酶蛋白——其对在C-20位具有羟基基团的PPD或PPT型人参皂苷的C-20位的羟基基团具有糖基化活性、引入了包含编码该蛋白的多核苷酸的载体或其片段的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。
本发明的又另一个目的是提供由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶蛋白,其对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性。
本发明的又另一个目的是提供编码该蛋白质的多核苷酸、含有该多核苷酸的表达载体、含有该表达载体或其片段的转化细胞、和含有该转化细胞的生物体。
本发明的又另一个目的是提供表达载体,该表达载体含有分别编码DS、tHMGR、PPDS和AtCPR蛋白的UDP糖基转移酶蛋白的多核苷酸;用于生产C-K的转化细胞,该转化细胞含有该表达载体或其片段;和含有该转化细胞的生物体。
本发明的又另一个目的是提供表达载体,该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、和PPTS蛋白的UDP糖基转移酶蛋白的多核苷酸;用于生产F1的转化细胞,该转化细胞含有该表达载体或其片段;和含有该转化细胞的生物体。
本发明的又另一个目的是提供表达载体,该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、和PgUGT74A1蛋白的UDP糖基转移酶蛋白的多核苷酸;用于生产F2的转化细胞,该转化细胞含有该表达载体或其片段;和含有该转化细胞的生物体。
本发明的又另一个目的是提供表达载体,该表达载体含有分别编码DS、tHMGR、PPDS、AtCPR、PgUGT74A1、和PgUGT94B1蛋白的UDP糖基转移酶蛋白的多核苷酸;用于生产Rd的转化细胞,该转化细胞含有该表达载体或其片段;和含有该转化细胞的生物体。
有益效果
由于本发明的UDP糖基转移酶是具有将糖选择性地转移到PPD或PPT型人参皂苷C-20位羟基基团的活性的蛋白质,它可以有效地用于大规模生产在C-20位具有糖的人参皂苷,例如C-K、F2、Rd和F1。
另外,在本发明中,表达载体和包含该表达载体的转化细胞可以通过在C-20位具有糖的人参皂苷C-K(新合成量:4.5mg/L)、F1、F2、或Rd的从头合成有效地用于特定人参皂苷的大规模生产。
附图说明
图1显示了PPD和PPT型人参皂苷的化学结构。
图2显示UDP糖基转移酶PgUGT71A1具有将UDP葡萄糖连接至PPD型和PPT型人参皂苷的C-20位的羟基基团的糖基化活性。特别地,显示了通过薄层层析法(TLC;上图)和高效液相色谱法(HPLC;下图)分析由PgUGT71A1将PPD转化为化合物K(C-K)、将Rg3转化为Rd、将Rh2转化为F2、和将PPT转化为F1的结果。
图3显示了经由实时PCR证明本发明的PgUGT71A1在用茉莉酮酸甲酯(MeJA)处理的人参的叶和根中表达增加的结果。
图4显示了通过NGS证明本发明的PgUGT71A1在用茉莉酮酸甲酯(MeJA)处理的人参的叶和根中表达增加的结果。
图5显示了制备的称为pRS306-MET3p-ERG7-CYC1ter的平台质粒(A),以及使用ERG7敲减-F和ERG7敲减-B引物对从URA3区到CYC1终止子的表达盒的PCR扩增结果(B)。
图6显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1的pRS423-C-K的酿酒酵母(S.cerevisiae)MET3p-ERG7中C-K的生物合成途径。
图7显示了证明在11.97min处形成新的峰的HPLC和LC-MS/MS分析的结果,在HPLC中在含有PgUGT71A1的酵母中生产的物质C-K的保留时间(A)和通过LC-MS/MS分析的由酵母生产的C-K的保留时间(B)等于11.97min。
图8显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1和PgPPTS的pRS423-F1的酿酒酵母MET3p-ERG7中人参皂苷F1的生物合成途径。
图9显示了证明在6.01min处形成新的峰的HPLC和LC-MS/MS分析的结果,在HPLC中在含有PgUGT71A1和PgPPTS的酵母中生产的物质F1的保留时间(A)和通过LC-MS/MS分析的由酵母生产的F1的保留时间(B)等于6.01min。
图10显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1和PgUGT71A1的pRS423-F2的酿酒酵母MET3p-ERG7中人参皂苷F2的生物合成途径。
图11显示了证明在7.81min处形成新的峰的HPLC和LC-MS/MS分析的结果,在HPLC中在含有PgUGT74A1和PgUGT71A1的酵母中生产的物质F2的保留时间(A)和通过LC-MS/MS分析的由酵母生产的F2的保留时间(B)等于7.81min。
图12显示了引入含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423-Rd的酿酒酵母MET3p-ERG7中人参皂苷Rd的生物合成途径。
图13显示了证明在5.88min处形成新的峰的HPLC和LC-MS/MS分析的结果,在HPLC中在含有PgUGT74A1、PgUGT94B1和PgUGT71A1的酵母中生产的物质Rd的保留时间(A)和通过LC-MS/MS分析的由酵母生产的Rd的保留时间(B)等于7.81min。
具体实施方式
在一个方面,本发明提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的方法,该方法包括将UDP糖基转移酶蛋白、引入了包含编码该蛋白的多核苷酸的载体或其片段并表现出该蛋白的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物处理为在C-20位具有羟基基团的PPD或PPT型人参皂苷。
在本发明中,术语“尿苷二磷酸(UDP)糖基转移酶”是指具有将单糖部分从糖基供体转移到糖基受体的活性的酶,特别是利用UDP-糖作为糖基供体的酶。在本发明中,术语UDP糖基转移酶可以与‘UGT’互换地使用。由于对人参皂苷UDP糖基转移酶知之甚少,并且由于具有UDP糖基转移酶活性的不同酶具有不同的底物特异性和区域选择性,需要确定该酶是否是特异地作用于作为人参皂素的特定人参皂苷的UDP糖基转移酶。
本发明的发明人首次鉴定了来源于人参(Panax ginseng C.A.Meyer)的新的UDP糖基转移酶,其能够选择性地将糖部分转移至PPD型人参皂苷或PPT型人参皂苷的C-20位的羟基(-OH)基团。本发明的发明人鉴定的UDP糖基转移酶具有选择性地将UDP-葡萄糖的糖部分转移到PPD型人参皂苷或PPT型人参皂苷的C-20位羟基基团的活性。因此,本发明中鉴定的UDP糖基转移酶可以将PPD型人参皂苷PPD、Rh2和Rg3分别转化为人参皂苷C-K、F2和Rd,并且还可以通过将糖部分转移到C-20位的羟基基团而将PPT转化为F1。具有这种活性的人参皂苷UDP糖基转移酶从未被发现,并且已经由本发明的发明人首先鉴定。
本发明中鉴定的UDP糖基转移酶是来源于高丽参(Panax ginseng C.A.Meyer)的UDP糖基转移酶,并且可以由SEQ ID NO:1的氨基酸序列来限定。在本发明的示例性实施方式中,由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶被命名为‘PgUGT71A1’。
本发明的UDP糖基转移酶不仅是指具有SEQ ID NO:1的氨基酸序列的蛋白质,而且是指含有与SEQ ID NO:1的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、最优选地99%或更高相似性的氨基酸序列并且能够基本上不受限制地将糖转移到PPD或PPT型人参皂苷的C-20位羟基基团的蛋白质。此外,如果具有序列相似性的蛋白质具有与UDP糖基转移酶基本上相同或相当的生物活性,那么具有一部分缺失、修饰、取代或添加的序列的蛋白质变体被包括在本发明的范围内。
术语“相似性”意在表示与野生型蛋白质的氨基酸序列或编码该野生型蛋白的核苷酸序列的相似性程度,并且该氨基酸序列或核苷酸序列包括与本发明的氨基酸序列或核苷酸序列具有上述百分比或更高的相似性的序列。相似性的比较可以用肉眼或使用商业上容易获得的比较程序进行。
由于本发明的UDP糖基转移酶具有将糖选择性地转移到PPD或PPT型人参皂苷的C-20位,特别是具有羟基基团的C-20位的活性,因此它可被用来从在C-20位具有羟基基团的PPD或PPT型人参皂苷制备糖基化人参皂苷。
在本发明中,术语“PPD型人参皂苷”是指达玛烷型皂素,其为在C-3、C-12和C-20位具有-OH基团的PPD或具有糖基化PPD的-OH基团的人参皂苷。可以通过本发明的糖基转移酶糖基化的PPD型人参皂苷的实例包括在C-20位具有羟基基团的PPD、Rg3、Rh2等。然而,可以包括但不限于可以通过本发明的UDP糖基转移酶糖基化的任何PPD型人参皂苷。
在本发明中,术语“PPT型人参皂苷”是指达玛烷型皂素,其为在C-3、C-6、C-12和C-20位具有-OH基团的PPT或具有糖基化PPT的-OH基团的人参皂苷。可以通过本发明的糖基转移酶糖基化的PPT型人参皂苷的实例包括在C-20位具有羟基基团并且在C-6位没有糖的PPT。然而,包括但不限于可以通过本发明的UDP糖基转移酶糖基化的任何PPT型人参皂苷。
PPD型或PPT型人参皂苷可以是分离和纯化的人参皂苷,或包含在人参或红参的粉末或提取物中的人参皂苷。换言之,含有皂素的人参或红参的粉末或提取物可以直接用作人参皂苷以执行本发明的方法。可替代地,可以使用化学合成的人参皂苷。各种类型的已知的人参可以用于本发明中。实例包括高丽参(Panax ginseng)、西洋参(P.quinquefolius)、三七(P.notoginseng)、竹节参(P.japonicus)、三叶人参(P.trifolium)、喜马拉雅人参(P.pseudoginseng)和越南人参(P.vietnamensis),但不限于此。PPD型或PPT型人参皂苷的化学结构如图1所示。
在本发明中,术语“糖基化人参皂苷”是指具有与构成人参皂苷的非糖成分(糖苷配基)的羟基基团相连的单糖或多糖的人参皂苷。出于本发明的目的,糖基化人参皂苷包括但不限于任何糖基化人参皂苷,只要它是通过本发明的UDP糖基转移酶将糖——优选是葡萄糖——转移到PPD或PPT型人参皂苷的C-20位而糖基化的人参皂苷。实例包括由本发明的糖基转移酶分别从PPD、Rh2、Rg3或F1糖基化的化合物K(C-K)、F2、Rd或PPT,但不限于此。
为了通过转化在C-20位具有羟基基团的PPD或PPT型人参皂苷来制备糖基化人参皂苷,可以使用包含具有编码UDP糖基转移酶的多核苷酸的表达载体或其片段并且表现出UDP糖基转移酶活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。
编码UDP糖基转移酶蛋白的多核苷酸优选地可以是由SEQ ID NO:2的核苷酸序列所限定的多核苷酸。除了具有SEQ ID NO:2的核苷酸序列的多核苷酸之外,包括但不限于与SEQ ID NO:2的核苷酸序列具有为70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、最优选地98%或更高的序列相似性,并且能够基本上编码具有PgUGT71A1蛋白活性的蛋白质。
含有本发明的多核苷酸的表达载体是指含有可操作地连接以表达插入的核酸的基本调节元件的核酸构建体,作为能够在合适的宿主细胞中表达靶蛋白的表达载体。可以通过将制备的重组载体转化或转染到宿主细胞中获得所需的靶蛋白。
含有本发明提供的多核苷酸的表达载体包括大肠杆菌(E.coli)来源的质粒(pYG601BR322、pBR325、pUC118、和pUC119)、枯草芽孢杆菌(Bacillus subtilis)来源的质粒(pUB110和pTP5)、酵母来源的质粒(YEp13、YEp24、和YCp50)以及可用于农杆菌介导的转化的Ti质粒,但不特别限于此。噬菌体DNA的具体实例包括λ噬菌体(Charon 4A、Charon21A、EMBL3、EMBL4、λgt10、λgt11和λZAP)。另外,可以使用动物病毒,例如逆转录病毒、腺病毒或痘苗病毒,昆虫病毒,例如杆状病毒、双链植物病毒——如CaMV、单链病毒或衍生自双粒病毒的病毒载体。
此外,可以使用转录激活蛋白(如B42)连接的融合质粒(如,pJG4-5)作为本发明的载体。另外,为了更容易地纯化本发明中获得的靶蛋白,如有需要,质粒载体可以进一步包括其它序列。例如,融合质粒可以含有标签,例如,GST、GFP、His标签、Myc标签等,但不限于此。在本发明的示例性实施方式中,可以使用作为GST基因融合载体的pGEX4T-1载体可以用来构建包含编码UDP糖基转移酶蛋白的多核苷酸的表达载体。
另外,由含有融合序列的载体表达的融合蛋白可以通过亲和层析法纯化。例如,当融合谷胱甘肽S转移酶时,可以使用作为酶底物的谷胱甘肽。并且,当融合六聚组氨酸时,可以通过使用Ni-NTA His-结合树脂柱(Novagen公司,美国)容易地回收靶蛋白。
为了将本发明的多核苷酸插入载体中,可以使用适当的限制性内切酶切割纯化的DNA,然后插入合适的载体DNA的限制性位点或克隆位点。
编码本发明蛋白质的UDP糖基转移酶的多核苷酸可以可操作地连接于载体。除了本发明的启动子和核酸外,本发明的载体还可以进一步包括顺式元件,例如,增强子、剪接信号、多聚A添加信号、选择标记、核糖体结合序列(SD序列)等。作为选择标记的实例,可以使用氯霉素抗性基因、二氢叶酸还原酶、新霉素抗性基因等。然而,待可操作地连接的另外的元件不限于这些实例。在本发明中,术语“转化”是指将DNA引入宿主细胞,使得DNA可以作为额外的染色体元件或通过染色体整合来复制。换言之,转化是指通过将外来DNA引入细胞中来人为改变基因的现象。
含有编码本发明的UDP糖基转移酶的多核苷酸的表达载体或表达载体的片段可以通过转化引入宿主细胞。如本文中所使用,表达载体的片段是指包含编码UDP糖基转移酶蛋白的多核苷酸的部分,使得UDP糖基转移酶蛋白的活性可以被赋予宿主细胞的表达载体的片段。例如,可以是在农杆菌介导的转化中转移到宿主细胞中的Ti质粒的T-DNA,但不限于此。
本发明的转化可以通过任何转化方法进行,并且可以根据本技术领域中通常使用的方法容易地进行。一般而言,转化方法的实例包括CaCl2沉淀、哈纳汉(Hanahan)方法——使用二甲亚砜(DMSO)作为还原材料的改进的CaCl2方法、电穿孔、磷酸钙沉淀、原生质体融合、使用碳化硅纤维搅拌、农杆菌介导的转化、PEG介导的转化、以及硫酸葡聚糖、脂质体和干燥/抑制介导的转化等。然而,用于转化含有编码本发明的UDP糖基转移酶的多核苷酸的载体的方法不限于上述实例,并且可以使用但不限于本领域中通常使用的转化或转染方法。
在本发明中,宿主细胞没有特别限制,只要它能够表达本发明的多核苷酸。可用于本发明的宿主的具体实例包括属于埃希氏杆菌属的细菌例如大肠杆菌、属于芽孢杆菌属的细菌例如枯草芽孢杆菌、属于假单胞菌属的细菌例如恶臭假单胞菌、酵母例如酿酒酵母或粟酒裂殖酵母、动物细胞、植物细胞和昆虫细胞。可用于本发明的大肠杆菌菌株的具体实例包括CL41(DE3)、BL21或HB101,且可用于本发明的枯草芽孢杆菌的具体实例包括WB700或LKS87。
可以含有引入了编码本发明的多核苷酸的表达载体或其片段的转化细胞的生物体可以是例如烟草、拟南芥、马铃薯、人参、芝麻、圆佛手柑、雏菊等,但不具体地限于此。
任何启动子都可以用作本发明的启动子,只要其能够在宿主细胞中表达本发明的核酸。例如,可以使用大肠杆菌或噬菌体来源的启动子,例如,trp启动子、lac启动子、PL启动子或PR启动子,大肠杆菌感染的噬菌体来源的启动子,例如,T7启动子、CaMV35S启动子、MAS启动子或组蛋白启动子。而且,可以使用人工修饰的启动子,例如,tac启动子。
通过转化将含有编码本发明的UDP糖基转移酶蛋白的多核苷酸的表达载体引入的转化株针对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性,特别是将PPD转化为C-K、将Rh2转化为F2、将Rg3转化为Rd、或将PPT转化为F1的糖基化活性,但不限于此。
在本发明中,术语“转化细胞的培养物”是指通过根据已知的培养微生物的方法培养转化细胞而获得的产物。术语培养物以广义概念使用,包括含有转化细胞的培养物和通过例如离心从含有转化细胞的培养物中除去转化细胞而获得的培养物。
由于培养物含有本发明的UDP糖基转移酶蛋白,因此它具有将PPD或PPT型人参皂苷转化为糖基化人参皂苷的活性。例如,它可以将PPD转化为C-K、将Rh2转化为F2、将Rg3转化为Rd、并将PPT转化为F1。
由于本发明的UDP糖基转移酶蛋白、引入了含有编码该蛋白质的多核苷酸的表达载体或该表达载体的片段并表现出该蛋白质的活性的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物可用于将在C-20位具有羟基基团的PPD或PPT型人参皂苷转变成糖基化人参皂苷,根据本发明的方法可有效地用于需要C-20位糖基化的人参皂苷的领域,特别是需要例如人参皂苷C-K、F2、Rd、F1等人参皂苷的领域。
本发明的发明人已经鉴定了新的UDP糖基转移酶,其具有将UDP-葡萄糖的葡萄糖部分选择性地转移到PPD或PPT型人参皂苷的C-20位羟基基团的活性,并且具有来自高丽参(Panax ginseng C.A.Meyer)的SEQ ID NO:1的氨基酸序列以及将它命名为PgUGT71A1(实例1)。为了研究PgUGT71A1蛋白质的酶活性,将为在C-20位具有羟基基团的代表性PPD或PPT型人参皂苷的PPD、Rg3、Rh2和PPT与本公开的PgUGT71A1反应,并确定了它们的转化活性。因此,本发明的PgUGT71A1将PPD转化为C-K、将Rg3转化为Rd、将Rh2转化为F2、将PPT转化为F1,表明它具有将葡萄糖部分转化到PPD和PPT型人参皂苷的C-20位羟基基团的活性(图2)。另外,据发现该蛋白质的表达被茉莉酮酸甲酯(MeJA)增强,该MeJA已知在人参的叶和根中表达并且增强人参的生物合成基因的表达(图3和图4)。这些结果表明,本发明的PgUGT71A1涉及人参皂苷的生物合成,特别是C-K、Rd、F2、F1等的生物合成,并且该蛋白可通过在C-20位的糖基化用于生物转化C-K、Rd、F2、F1等的过程。
在另一个方面,本发明提供用于制备在C-20位的羟基基团被糖基化的原人参二醇(PPD)或原人参三醇(PPT)型人参皂苷的组合物,其包含选自下组的一种或多种作为活性组分,该组由以下各项组成:尿苷二磷酸(UDP)糖基转移酶蛋白——其对在C-20位具有羟基基团的PPD或PPT型人参皂苷的C-20位的羟基基团具有糖基化活性、被引入包含编码该蛋白的多核苷酸的载体或其片段的转化细胞、含有该转化细胞的生物体、或该转化细胞的培养物。
该UDP糖基转移酶蛋白、该转化细胞、该生物体、该PPD型或PPT型人参皂苷和该糖基化人参皂苷与上述相同。
在另一个方面,本发明提供由SEQ ID NO:1的氨基酸序列所限定的UDP糖基转移酶蛋白,其对PPD或PPT型人参皂苷的C-20位羟基基团具有选择性糖基化活性。
该UDP糖基转移酶蛋白和该SEQ ID NO:1的氨基酸序列与上述相同。
该蛋白质可以是将PD转化为C-K、将Rh2转化为F2、将Rg3转化为Rd、将PPT转化为F1的蛋白质。
在另一个方面,本发明提供了表达载体和用于生产C-K的转化细胞,该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外,进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)蛋白的多核苷酸,该转化细胞包括该表达载体或其片段。
该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。
作为三萜环化酶的达玛烯二醇-II合酶(DS)是指将氧化鲨烯环化成达玛烯二醇-II的酶。该DS可以由SEQ ID NO:29中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该DS变体含有与SEQ ID NO:29的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该DS基本上相同或相当的生物活性。
编码DS蛋白的多核苷酸可以优选是由针对大肠杆菌的密码子使用优化的SEQ IDNO:30或SEQ ID NO:31中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与SEQ ID NO:30或SEQ ID NO:31的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该DS蛋白基本上相同的生物活性的蛋白质。
截短的HMG-CoA还原酶(tHMGR)是控制Z10或胆固醇的体内合成的重要酶,并且是指在胆固醇合成过程中将HMG-CoA转化为甲羟戊酸的酶。该tHMGR可以由SEQ ID NO:32中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该tHMGR变体含有与SEQ ID NO:32的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该tHMGR基本上相同或相当的生物活性。
编码该tHMGR蛋白的多核苷酸可以优选是由SEQ ID NO:33中所述的氨基酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与SEQ ID NO:33的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该tHMGR蛋白基本上相同的生物活性的蛋白质。
原人参二醇合酶(PPDS)是通过羟基化将达玛烯二醇-II的C-12位转化为PPD的p450酶。该PPDS可以由SEQ ID NO:34中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该PPDS变体含有与SEQ ID NO:34的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该PPDS基本上相同或相当的生物活性。
编码该PPDS蛋白的多核苷酸可以优选是由SEQ ID NO:35中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与SEQ ID NO:35的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该PPDS蛋白基本上相同的生物活性的蛋白质。
拟南芥细胞色素p450还原酶(AtCPR)可以用作与细胞色素p450还原酶具有相同的含义。该AtCPR可以由SEQ ID NO:36中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该AtCPR变体含有与SEQ ID NO:36的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该AtCPR基本上相同或相当的生物活性。
编码该AtCPR蛋白的多核苷酸可以优选是由针对大肠杆菌的密码子使用优化的SEQ ID NO:37或SEQ ID NO:38中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与SEQ ID NO:37或SEQ ID NO:38的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该AtCPR蛋白基本上相同的生物活性的蛋白质。
在本发明的示例性实施方式中,经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT71A1的pRS423C-K引入酿酒酵母MET3p-ERG7中来构建具有C-K的C-K生物合成途径的酿酒酵母C-K菌株(图6),并且该酿酒酵母C-K菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用MtOH提取并使用Sep-PAK来纯化。通过HPLC和LC-MS/MS分析纯化的人参皂苷。因此,携带PgUGT71A1的酵母在11.97min产生新的峰,在HPLC中C-K的保留时间等于11.97min(图7(A)),而通过MRM检测在LC-MS/MS中观察到产物的保留时间为11.46min,转换(transition)为645.4→23.2(图7(B))。这些结果表明,PgUGT71A1能够通过酵母发酵从头生产人参皂苷(4.5mg/L)。
因此,本发明可以提供表达载体和用于生产C-K的转化细胞,该表达载体进一步包括分别编码DS、tHMGR、PPDS、和AtCPR蛋白的UDP糖基转移酶蛋白的多核苷酸,该转化细胞含有该表达载体或其片段。
该转化细胞可以是酵母,但不限于此。
在另一个方面,本发明提供了表达载体和用于生产F1的转化细胞,该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外,进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和原人参三醇合酶(PPTS)蛋白的多核苷酸,该转化细胞包括该表达载体或其片段。
该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)与上述相同。
该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。
原人参三醇合酶(PPTS)是通过羟基化将PPDS的C-6位转化为PPT的另一种p450蛋白。该PPTS可以由SEQ ID NO:39中所述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该PPTS变体含有与SEQ ID NO:39的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该PPTS基本上相同或相当的生物活性。
编码该PPTS蛋白的多核苷酸可以优选是由针对酵母的密码子使用优化的SEQ IDNO:40或SEQ ID NO:41中所述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与SEQ ID NO:40或SEQ ID NO:41的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该PPTS蛋白基本上相同的生物活性的蛋白质。
在本发明的示例性实施方式中,经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT71A1和PgPPTS的pRS423F1引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷F1的生物合成途径的酿酒酵母F1菌株(图8),并且该酿酒酵母F1菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外,酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,通过MtOH再萃取人参皂苷F1,并通过HPLC和LC-MS/MS分析萃取的人参皂苷。因此,携带PgUGT71A1和PgPPTS的酵母在6.01min产生新的峰,在HPLC中F1的保留时间等于6.01min(图9(A)),而通过MRM检测在LC-MS/MS中观察到产物的保留时间为6.13min,转换为661.5→203(图9(B))。这些结果表明,PgUGT71A1和PgPPTS能够通过酵母发酵从头生产人参皂苷F1。
因此,本发明可以提供表达载体和用于生产F1的转化细胞,该表达载体进一步包括分别编码DS、tHMGR、PPDS、AtCPR、和PPTS蛋白的UDP糖基转移酶蛋白的多核苷酸,该转化细胞含有该表达载体或其片段。
该转化细胞可以是酵母,但不限于此。
在另一个方面,本发明提供了表达载体和用于生产F2的转化细胞,该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外,进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和人参UDP糖基转移酶74A1(PgUGT74A1)蛋白的多核苷酸,该转化细胞包括该表达载体或其片段。
该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)和拟南芥细胞色素p450还原酶(AtCPR)与上述相同。
该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。
人参UDP糖基转移酶74A1(PgUGT74A1)是特异性作用于PPD和C-K——它们是PPD型人参皂苷——以引起C-3位的O-糖基化,从而将PPD和C-K分别转化为Rh2和F2的UDP糖基转移酶。该PgUGT74A1可以由韩国专利号10-1479615中所描述的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该PgUGT74A1变体含有与韩国专利号10-1479615中所描述的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该PgUGT74A1基本上相同或相当的生物活性。
编码该PgUGT74A1蛋白的多核苷酸可以优选地由韩国专利号10-1479615中所描述的核苷酸序列来限定,并且本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与韩国专利号10-1479615中所描述的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该PgUGT74A1蛋白基本上相同的生物活性的蛋白质。
在本发明的示例性实施方式中,经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT74A1和PgUGT71A1的pRS423F2引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷F2的生物合成途径的酿酒酵母F2菌株(图10),并且该酿酒酵母F2菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外,酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,通过MtOH再提取人参皂苷F2,并通过HPLC和LC-MS/MS分析提取的人参皂苷。因此,携带PgUGT74A1和PgUGT71A1的酵母在7.81min产生新的峰,在HPLC中F2的保留时间等于7.81min(图11(A)),而通过MRM检测在LC-MS/MS中观察到产物的保留时间为7.35min,转换为807.5→627.5(图11(B))。这些结果表明,PgUGT74A1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷F2。
因此,本发明可以提供表达载体和用于生产F2的转化细胞,该表达载体进一步包括分别编码DS、tHMGR、PPDS、AtCPR、和PgUGT74A1蛋白的UDP糖基转移酶蛋白的多核苷酸,该转化细胞含有该表达载体或其片段。
该转化细胞可以是酵母,但不限于此。
在另一个方面,本发明提供了表达载体和用于生产Rd的转化细胞,该表达载体除了包含编码UDP糖基转移酶蛋白的多核苷酸之外,进一步包括分别编码达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、人参UDP糖基转移酶74A1(PgUGT74A1)和人参UDP糖基转移酶94B1(PgUGT94B1)蛋白的多核苷酸,该转化细胞包括该表达载体或其片段。
该达玛烯二醇-II合酶(DS)、截短的HMG-CoA还原酶(tHMGR)、原人参二醇合酶(PPDS)、拟南芥细胞色素p450还原酶(AtCPR)、和人参UDP糖基转移酶74A1(PgUGT74A1)与上述相同。
该UDP糖基转移酶蛋白、该表达载体和该转化细胞与上述相同。
人参UDP糖基转移酶94B1(PgUGT94B1)是特异性作用于Rh2和F2——它们是PPD型人参皂苷——以引起C-3位的O葡萄糖苷的β-1,2糖基化,从而将作为人参皂苷的Rh2和F2分别转化为Rg3和Rd的UDP糖基转移酶。该PgUGT94B1可以由韩国专利号10-1479608中的氨基酸序列来限定。本发明的范围可以包括但不限于在其中具有它们的氨基酸序列的部分缺失、修饰、取代或添加的任何蛋白质变体,只要该PgUGT94B1变体含有与韩国专利号10-1479608中所描述的氨基酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高、以及最优选地99%或更高的相似性的氨基酸序列,并且具有与该PgUGT94B1基本上相同或相当的生物活性。
编码该PgUGT94B1蛋白的多核苷酸可以优选是由韩国专利号10-1479608中所描述的核苷酸序列所限定的多核苷酸。本发明的范围可以包括但不限于在其中具有它们的核苷酸序列的部分缺失、修饰、取代或添加的任何多核苷酸变体,只要该变体含有与韩国专利号10-1479608中所描述的核苷酸序列具有70%或更高、优选地80%或更高、更优选地90%或更高、甚至更优选地95%或更高、甚至更加优选地98%或更高的相似性的核苷酸序列,该核苷酸序列编码具有与该PgUGT94B1蛋白基本上相同的生物活性的蛋白质。
在本发明的示例性实施方式中,经由醋酸锂方法同时将含有PPDS和AtCPR的pRS424DS、pRS426tHMG1、pRS425PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423Rd引入酿酒酵母MET3p-ERG7中来构建具有人参皂苷Rd的生物合成途径的酿酒酵母Rd菌株(图12),并且该酿酒酵母Rd菌株在甲硫氨酸存在下经由补料分批发酵培养10d(OD 600≈80)。另外,酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,通过MtOH再提取人参皂苷Rd,并通过HPLC和LC-MS/MS分析提取的人参皂苷。因此,携带PgUGT74A1、PgUGT94B1、和PgUGT71A1的酵母在5.88min产生新的峰,在HPLC中Rd的保留时间等于5.88min(图13(A)),而通过MRM检测在LC-MS/MS中观察到产物的保留时间为5.93min,转换为969.5→789.5(图13(B))。这些结果表明,PgUGT74A1、PgUGT94B1、和PgUGT71A1能够通过酵母发酵从头生产人参皂苷Rd。
实施例
本发明通过实施例来详细描述。然而,以下实施例仅用于说明的目的,并且本发明的范围不受这些实施例的限制。
实施例1:人参UDP糖基转移酶PgUGT71A1的克隆和纯化
使用PgUGT71A1-F(5'-AGGCAGGATCCATGAAGTCAGAATTGATATTCTTGCCCGCCCCGGC-3';SEQ ID NO:17)和PgUGT71A1-R(5'-AGGCATCTCGAGTCACATAATTTTCTCAAATAGTTTGGCCAATGAAT-3';SEQ ID NO:18)引物和聚合酶,从人参cDNA通过PCR扩增基因,并且基因的末端用限制性内切酶BamHI和XhoI进行消化。然后,将基因克隆到pGEX-4T1载体中以构建表达载体,将该表达载体转化到大肠杆菌BL21(DE3)-RIL菌株中以获得表达PgUGT71A1的菌株。
用IPTG诱导菌株表达蛋白质后,使用琼脂糖-4B树脂纯化产生的蛋白质以获得PgUGT71A1酶。
实施例2:体外酶测定
在含有纯化的PgUGT71A1(30μg)、人参皂苷化合物(5mM)和UDP-葡萄糖(50mM)的反应缓冲液(10mM PBS缓冲液,pH 7)中进行糖基转移酶测定。对于这项测定,使4种不同类型的人参皂苷,即原人参二醇(PPD)、原人参三醇(PPT)、Rh2和Rg3与本公开的酶进行反应。人参皂苷的结构显示于图1中。
将反应混合物在35℃下孵育12小时,并且通过薄层层析法(TLC)或高效液相色谱法(HPLC)分析所得产物。
使用流动相(丙酮:甲醇:DDW=65:35:10vol/vol)和60F254硅胶板(默克公司(Merck),德国)进行TLC分析。通过喷射10%(vol/vol)硫酸(H2SO4)并在110℃加热5分钟来检测在TLC板上的分离的产物。
使用ODS(2)C18柱(菲罗门公司(Phenomenex),美国)进行HPLC分析。水和乙腈的梯度应用条件如下:流速=1mL/min,0分钟,68%水和32%乙腈;8分钟,35%水和65%乙腈;12分钟,0%水和100%乙腈;20分钟,0%水和100%乙腈;20.1分钟,68%水和32%乙腈;以及28分钟,68%水和32%乙腈。
通过使用UV检测器(Agilent,USA)在203nm的波长下监测来检测人参皂苷。
实施例3:RNA分离和实时PCR分析
使用光谱植物总RNA试剂盒(Spectrum Plant Total RNA kit)(西格玛-奥德里奇公司(Sigma-Aldrich))从15个月龄的人参的叶或根分离总RNA。每天将200μM茉莉酸甲酯(MeJA)喷射到人参叶上,共持续5天,并且在第6天收集样品。将1μg的总RNA用于cDNA合成。
使用表1中列出的引物组通过定量RT-PCR检测不同基因的表达水平,并且将结果标准化至微管蛋白的表达水平。
表1
[表1]
实施例4:NGS分析
从已经用MeJA处理和未用MeJA处理的人参的叶和根提取RNA,并且使用TruSeqRNA文库试剂盒从1μg的总RNA构建cDNA文库。在聚A选择的RNA提取、RNA片段化和随机六聚体引发的逆转录之后,使用亿明达(Illumina)HiSeq 2000进行100nt配对的末端测序。
使用Trinity程序(2011年11月26日版本)对所得的序列从头进行转录组装配。使用Blast(版本2.2.25+)分析所产生的重叠群(转录物)。使用了GO数据库(于2012年4月20日发布)和NCBI的NR数据库(下载日期:2012年05月07日)。为了确定组装的重叠群(转录物)的表达水平,使用Bowtie(版本0.12.8)作为作图程序。使用RSEM算法用由Trinity组释放的程序,将表达水平表示为每百万个片段中外显子每千碱基的片段(FPKM)。
实施例5:人参皂苷在酵母中的生产
实施例5-1:ERG7下调表达盒的构建
为了构建ERG7下调菌株(酿酒酵母MET3p-ERG7),构建了ERG7下调表达盒。对于携带MET3启动子、ERG7基因、和CYC1终止子的ERG7下调表达盒,使用pRS306质粒作为平台。为了抑制ERG7基因,选择了能够通过供应甲硫氨酸抑制转录水平的MET3启动子(MET3p)。使用引物组MET3p的pRS306-F(SacI)和MET3p的pRS306-B(XbaI)(表2)通过PCR扩增从酿酒酵母CEN.PK 2-1D的基因组DNA扩增MET3p。
表2
[表2]
使用引物组ERG7的pRS306-F(SpeI)和ERG7的pRS306-B(XhoI)(表3)通过PCR扩增从酿酒酵母CEN.PK 2-1D的基因组DNA扩增ERG7。
表3
[表3]
使用引物组CYC1终止子pRS306-F(XhoI)和CYC1终止子pRS306-B(KpnI)(表4)通过PCR扩增从pRS424-GPD质粒扩增CYC1终止子。
表4
[表4]
将每个片段插入到pRS306载体中,从而构建平台质粒称为pRS3063p-MET3p-ERG7-CYC1ter(图5(A))。
使用pRS3063p-MET3p-ERG7-CYC1ter质粒作为模板,经由PCR构建ERG7下调表达盒。ERG7下调表达盒包括URA3基因和MET3p-ERG6-CYC1ter作为标记物。使用包含同源臂的ERG7敲减-F和ERG7敲减-B引物(表5)通过PCR扩增从URA3区到CYC1终止子的表达盒(图5(B))。
表5
[表5]
实施例5-2:酿酒酵母MET3p-ERG7菌株的构建和ERG7下调的确认
通过醋酸锂法(通过醋酸锂、单链载体DNA、聚乙二醇法转化酵母)将构建的ERG7下调表达盒整合到酿酒酵母CEN.PK 2-1D基因组中。在SD-Leu-Trp-His平板上选择转化株。将所选的转化株在5ml YPD培养基中孵育用于基因组DNA分离,用ERG7敲减确认-F和ERG7敲减确认-B引物(表6)通过PCR扩增确认表达盒整合。替换后,在5-FOA(5-氟乳清酸)平板上选择酵母以回收URA3标记,并且将所得酵母用于进一步分析。
表6
[表6]
为了确认2,3-氧化鲨烯的积累,进行烧瓶培养并通过HPLC分析代谢物。通过将1mL在15%(v/v)甘油中的冷冻细胞接种到含有50mL SD-TRP-LEU-HIS-URA培养基的250mL烧瓶中来制备用于烧瓶培养的种子培养物。对于烧瓶培养,种子培养物在30℃下生长2天,OD600为4~7。将20mL种子培养物接种到2L烧瓶中的1L分批培养基(2%v/v)中。收获培养的细胞,并用20mL的20%KOH/50%EtOH水溶液回流1小时。在用相同体积的己烷萃取后,蒸发萃取物并使用1.5mL丙酮再萃取。通过HPLC分析萃取物。使用ODS(2)C18柱(菲罗门公司(Phenomenex),加利福利亚州,美国)以1mL/min的流速使用100%乙腈作为等度方法进行HPLC分析。使用UV-检测器(安捷伦科技公司(Agilent Technologies),加利福利亚州,美国)在203nm的波长下监测代谢物(鲨烯、2,3-氧化鲨烯)。
实施例5-3:人参皂苷在酿酒酵母中的从头合成
通过在生物反应器中培养含有人参皂苷生物合成基因的酿酒酵母来检测人参皂苷的从头合成。由范豪克(van Hoek)等人描述的含有甲硫氨酸的组合培养基用于发酵(范豪克(van Hoek)、de Hulster等人,2000;勒尼汉(Lenihan)、鹤田(Tsuruta)等人,2008;韦斯特福尔(Westfall)、皮泰拉(Pitera)等人,2012)。分批培养基含有20g/L葡萄糖、15g/L(NH4)2SO4、8g/L>2PO4、0.72g/L>4·7H2O、6.15g/L>4·7H2O、12mL/L的维生素溶液、0.3g/L甲硫氨酸和10mL/L微量金属溶液。用于培养基的微量金属溶液含有15g/L EDTA、10.2g/L>4·7H2O、0.50g/L>2·4H2O、0.5g/L无水CuSO4、0.86g/L>2·6H2O、0.56g/L>2MoO4·2H2O、3.84g/L>2·2H2O和5.12g/L>4·7H2O。维生素溶液含有0.05g/L生物素、1g/L泛酸钙、1g/L烟酸、25g/L肌醇、1g/L盐酸硫胺素、1g/L盐酸吡哆醇、和0.2g/L>4OH(<pH>
对于从头合成的人参皂苷的分析,通过离心(10min,2898x g)收获50ml细胞,重悬于20mL DDW中,并通过超声(Vibra-cell仪器;声能学与材料学公司(Sonics&Materials),康乃狄克州,美国)破碎。代谢物用50%甲醇(v/v)提取,在SEP-PAK 18柱上纯化,并通过HPLC和LC-MS/MS分析。
实施例5-4:人参皂苷的HPLC分析和LC-ESI-MS/MS分析
使用ODS(2)C18柱(菲罗门公司(Phenomenex),加利福利亚州,美国)以1mL/min的流速如下进行HPLC分析:0分钟,68%水和32%乙腈;8分钟,35%水和65%乙腈;12分钟,0%水和100%乙腈;20分钟,0%水和100%乙腈;20.1分钟,68%水和32%乙腈;和28分钟,68%水和32%乙腈。使用UV-检测器(安捷伦科技公司(Agilent Technologies),加利福利亚州,美国)在203nm的波长下监测人参皂苷。
使用HPLC-MS/MS系统进行每种人参皂苷的鉴定,该HPLC-MS/MS系统由HPLC系统(HP1100;安捷伦科技公司(Agilent Technologies))、配备有自动进样器的三重四极串联质谱仪(API-2000;应用生物系统公司(Applied Biosystems),加利福利亚州,美国)、加热电喷雾离子源(H-ESI)、三级四极杆质量分析器和用于数据采集的Analyst 1.4软件组成。反相柱(福尔蒂斯(Fortis)H2o C18,2.1×100mm,3mm孔径;福尔蒂斯技术有限公司(FortisTechnologies Ltd.),英国)用于样品分离。用于色谱分离的流动相由0.01%醋酸水溶液(A)和0.01%醋酸乙腈溶液(B)组成。具有250μL/min恒定流速的梯度洗脱程序如下:0分钟,68%A和32%B;3分钟,45%A和55%B;8分钟,40%A和60%B;13分钟,20%A和80%B;18分钟,0%A和100%B;22分钟,0%A和100%B;22.1分钟,68%A和32%B;30分钟,68%A和32%B。柱温设定为25℃。为了检测人参皂苷化合物(PPD、Rh2、Rg3、C-K、F2、和Rd),使用多反应监测(MRM)方法。转换分别设置为:对于PPD,m/z>2,m/z>3,m/z>
测试实施例1:对于PgUGT71A1的PPD型和PPT型人参皂苷的C-20位羟基基团的特异性糖基转移酶活性
如下研究实施例1中鉴定的PgUGT71A1的底物特异性和区域选择性。
首先,在UDP-葡萄糖存在下,将实施例1的重组PgUGT——PgUGT71A1——与9种不同类型的人参皂苷(PPD、Rh2、Rg3、C-K、F2、Rd、PPT、F1、和Rh1)一起孵育。通过薄层层析法(TLC)确认对于PPD、Rh2、Rg3和PPT发生的反应。
为了再次确认结果,将4种不同类型的人参皂苷(PPD、PPT、Rh2、和Rg3)与PgUGT71A1一起孵育,并且通过TLC分析由重组PgUGT71A1转化的产物。结果显示于图2的上图。通过比较迁移斑点与用作标准样品的PPD、PPT、Rh2、Rg3、C-K、F2、Rd、和F1的位置来确认结果。
因此,确认了PgUGT71A1将PPD转化为化合物K(C-K)、将Rg3转化为Rd、将Rh2转化为F2、和将PPT转化为F1(图2,上图)。
通过HPLC进一步确认了结果,如图2的下图所示。
如在TLC分析结果中,确认了PgUGT71A1将PPD转化为C-K、将Rg3转化为Rd、将Rh2转化为F2、和将PPT转化为F1(图2,下图)。
总之,上述结果表明,PgUGT71A1是具有将UDP-葡萄糖转移到PPD型和PPT型人参皂苷——特别是在C-6位没有糖的PPD型人参皂苷和PPT型人参皂苷——的C-20位的羟基基团的酶。
测试实施例2:通过茉莉酸甲酯(MeJA)增强PgUGT71A1表达
研究了本发明的PgUGT71A1是否主要在传统上用于医药目的的人参根中表达。而且,与3种不同的人参皂苷生物合成基因达玛烯二醇-II合酶(PgDS)、原人参二醇合酶(PgPPDS)和原人参三醇合酶(PgPPTS)一起检测了本发明的PgUGT71A1的器官特异性表达模式。
已知茉莉酸甲酯(MeJA)增强在毛状根培养物中人参的生物合成基因的表达。基于这一事实,检测了PgUGT71A1——即本发明的UDP糖基转移酶——的表达是否可以通过MeJA增加。为此,使用了在生长室中在LD条件下生长的15个月龄的人参。每天将MeJA喷洒在人参叶上,共持续5天,并在第6天收集样品以便分析人参皂苷生物合成基因的表达水平。
因此,所有人参皂苷生物合成基因都在人参的叶和根中表达,并且本发明的PgUGT71A1的表达通过MeJA处理显著增强(图3和图4)。
总之,上述结果表明,本发明的PgUGT71A1是参与人参生物合成的蛋白质。此外,由于MeJA增强本发明的糖基转移酶PgUGT71A1的表达,可以看出,MeJA可以用于增强PgUGT71A1的表达。
测试实施例3:PgUGT71A1使C-K能够在酵母中进行从头合成
为了生产化合物K(C-K),将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1的pRS423-C-K引入酿酒酵母MET3p-ERG7,构建了具有C-K的生物合成途径的酿酒酵母C-K菌株(图6)。
为了确定人参皂苷C-K是否可以在酵母中从头产生,酿酒酵母C-K菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用MtOH提取并使用Sep-PAK来纯化。通过HPLC和LC-MS/MS分析纯化的人参皂苷。携带PgUGT71A1的酵母在11.97min产生新的峰,其与HPLC中的C-K的保留时间相同(图7(A))。使用645.4→23.2的转换,通过MRM检测的LC-MS/MS中观察到产物的保留时间为11.46min,其与C-K相同(图7(B))。这些结果表明,PgUGT71A1能够通过酵母发酵从头生产人参皂苷(4.5mg/L)。
测试实施例4:PgUGT71A1和PgPPTS使人参皂苷F1能够在酵母中从头合成
为了生产人参皂苷F1,将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT71A1和PgPPTS的pRS423-F1引入酿酒酵母MET3p-ERG7,构建了具有人参皂苷F1的生物合成途径的酿酒酵母F1菌株(图8)。
为了确定人参皂苷F1是否可以在酵母中从头产生,酿酒酵母F1菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,使用MtOH再次萃取人参皂苷F1。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT71A1和PgPPTS的酵母在6.01min产生新的峰,其与HPLC中的人参皂苷F1的保留时间相同(图9(A))。使用661.5→203的转换,通过MRM检测的LC-MS/MS中观察到产物的保留时间为6.13min,其与人参皂苷F1相同(图9(B))。这些结果表明,PgUGT71A1和PgPPTS能够通过酵母发酵从头生产人参皂苷。
测试实施例5:PgUGT74A1和PgUGT71A1使人参皂苷F2能够在酵母中从头合成
为了生产人参皂苷F2,将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1和PgUGT71A1的pRS423-F2引入酿酒酵母MET3p-ERG7,构建了具有人参皂苷F2的生物合成途径的酿酒酵母F2菌株(图10)。
为了确定人参皂苷F2是否可以在酵母中从头产生,酿酒酵母F2菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,使用MtOH再次萃取人参皂苷F2。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT74A1和PgUGT71A1的酵母在7.81min产生新的峰,其与HPLC中的人参皂苷F2的保留时间相同(图11(A))。使用807.5→627.5的转换,通过MRM检测的LC-MS/MS中观察到产物的保留时间为7.35min,其与人参皂苷F2相同(图11(B))。这些结果表明,PgUGT74A1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷。
测试实施例6:PgUGT74A1、PgUGT94B1和PgUGT71A1使人参皂苷Rd能够从头合成
为了生产人参皂苷Rd,将含有PPDS和AtCPR的pRS424-DS、pRS426-tHMG1、pRS425-PPD、和含有PgUGT74A1、PgUGT94B1和PgUGT71A1的pRS423-Rd引入酿酒酵母MET3p-ERG7,构建了具有人参皂苷Rd的生物合成途径的酿酒酵母Rd菌株(图12)。
为了确定人参皂苷Rd是否可以在酵母中从头产生,酿酒酵母Rd菌株在甲硫氨酸存在下通过补料分批发酵生长10d(OD 600≈80)。酵母细胞通过离心来收获并通过超声处理来破碎。人参皂苷使用BtOH来萃取,然后蒸发BtOH。最后,使用MtOH再次萃取人参皂苷Rd。通过HPLC和LC-MS/MS分析萃取的人参皂苷。携带PgUGT74A1、PgUGT94B1和PgUGT71A1的酵母在5.88min产生新的峰,其与HPLC中的人参皂苷Rd的保留时间相同(图13(A))。使用969.5→789.5的转换,通过MRM检测的LC-MS/MS中观察到产物的保留时间为5.93min,其与人参皂苷Rd相同(图13(B))。这些结果表明,PgUGT74A1、PgUGT94B1和PgUGT71A1能够通过酵母发酵从头生产人参皂苷。
对于本发明所属领域的普通技术人员而言将显而易见的是,在不脱离本公开的范围和精神的情况下可以进行各种修改和改变。因此,应当理解的是,上述示例性实施例不是限制性的,而在所有方面是说明性的。本发明的范围由所附权利要求而不是说明书所限定,因此落入权利要求的界限和范围内或者这样的界限和范围的等同物内的所有改变和修改因此旨在被权利要求书包括在内。
<110> 韩国科学技术院
智能合成生物中心
<120> 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法
<130> OPA15038-CN
<150> KR10-2014-0052728
<151> 2014-04-30
<160> 41
<170> KopatentIn 2.0
<210> 1
<211> 475
<212> PRT
<213> 人参
<400> 1
Met Lys Ser Glu Leu Ile Phe Leu Pro Ala Pro Ala Ile Gly His Leu
1 5 1015
Val Gly Met Val Glu Met Ala Lys Leu Phe Ile Ser Arg His Glu Asn
202530
Leu Ser Val Thr Val Leu Ile Ala Lys Phe Tyr Met Asp Thr Gly Val
354045
Asp Asn Tyr Asn Lys Ser Leu Leu Thr Asn Pro Thr Pro Arg Leu Thr
505560
Ile Val Asn Leu Pro Glu Thr Asp Pro Gln Asn Tyr Met Leu Lys Pro
65707580
Arg His Ala Ile Phe Pro Ser Val Ile Glu Thr Gln Lys Thr His Val
859095
Arg Asp Ile Ile Ser Gly Met Thr Gln Ser Glu Ser Thr Arg Val Val
100 105 110
Gly Leu Leu Ala Asp Leu Leu Phe Ile Asn Ile Met Asp Ile Ala Asn
115 120 125
Glu Phe Asn Val Pro Thr Tyr Val Tyr Ser Pro Ala Gly Ala Gly His
130 135 140
Leu Gly Leu Ala Phe His Leu Gln Thr Leu Asn Asp Lys Lys Gln Asp
145 150 155 160
Val Thr Glu Phe Arg Asn Ser Asp Thr Glu Leu Leu Val Pro Ser Phe
165 170 175
Ala Asn Pro Val Pro Ala Glu Val Leu Pro Ser Met Tyr Val Asp Lys
180 185 190
Glu Gly Gly Tyr Asp Tyr Leu Phe Ser Leu Phe Arg Arg Cys Arg Glu
195200205
Ser Lys Ala Ile Ile Ile Asn Thr Phe Glu Glu Leu Glu Pro Tyr Ala
210 215 220
Ile Asn Ser Leu Arg Met Asp Ser Met Ile Pro Pro Ile Tyr Pro Val
225 230 235 240
Gly Pro Ile Leu Asn Leu Asn Gly Asp Gly Gln Asn Ser Asp Glu Ala
245 250 255
Ala Val Ile Leu Gly Trp Leu Asp Asp Gln Pro Pro Ser Ser Val Val
260 265 270
Phe Leu Cys Phe Gly Ser Tyr Gly Thr Phe Gln Glu Asn Gln Val Lys
275 280 285
Glu Ile Ala Met Gly Leu Glu Arg Ser Gly His Arg Phe Leu Trp Ser
290 295 300
Leu Arg Pro Ser Ile Pro Lys Gly Glu Thr Lys Leu Gln Leu Lys Tyr
305 310 315 320
Ser Asn Leu Glu Glu Ile Leu Pro Val Gly Phe Leu Asp Arg Thr Ser
325 330 335
Cys Val Gly Lys Val Ile Gly Trp Ala Pro Gln Val Ala Val Leu Gly
340 345 350
His Glu Ala Val Gly Gly Phe Leu Ser His Cys Gly Trp Asn Ser Thr
355 360 365
Leu Glu Ser Val Trp Cys Gly Val Pro Val Ala Thr Trp Pro Met Tyr
370 375 380
Gly Glu Gln Gln Leu Asn Ala Phe Glu Met Val Lys Glu Leu Gly Ile
385 390 395 400
Ala Val Glu Ile Glu Val Asp Tyr Lys Asn Glu Tyr Phe Asn Met Asn
405 410 415
Asn Asp Phe Ile Val Arg Ala Glu Glu Ile Glu Thr Lys Ile Lys Lys
420 425 430
Leu Met Met Asp Glu Lys Asn Ser Glu Ile Arg Lys Lys Val Lys Glu
435 440 445
Met Lys Glu Lys Ser Arg Leu Ala Met Ser Glu Asn Gly Ser Ser Tyr
450 455 460
Asn Ser Leu Ala Lys Leu Phe Glu Lys Ile Met
465 470 475
<210> 2
<211> 1428
<212> DNA
<213> 人参
<400> 2
atgaagtcag aattgatatt cttgcccgcc ccggccatcg gacacctcgt gggaatggtg 60
gagatggcta aactcttcat cagtcgacat gaaaacctct cggtcaccgt cctcatcgcg 120
aaattctaca tggatacggg ggtagacaac tacaataaat cactcttaac aaaccctacc 180
ccgcgtctca caattgtaaa tctcccggaa accgaccccc aaaactatat gctcaaacca 240
cgccatgcca tctttcctag cgtcatcgag actcagaaga cacacgtgcg agacataata 300
tcaggcatga ctcagtccga gtcgactcgg gtcgttggtt tgctggctga ccttttgttc 360
atcaacatta tggacattgc caatgagttc aatgttccaa cttatgtata ctcccctgcc 420
ggagccggtc atcttggcct cgcgttccat ctccagacac tcaacgacaa aaagcaagat 480
gtgaccgagt tcaggaactc ggacactgag ttattggtac cgagttttgc aaacccggtt 540
cccgccgagg tcttgccgtc gatgtatgtg gataaagaag gtgggtatga ttatttgttt 600
tcattgttcc ggaggtgcag agagtcaaag gcaattatta ttaacacgtt tgaggagctg 660
gaaccctatg cgatcaattc cctccggatg gatagtatga tccctccgat ctacccggtg 720
ggacccatac taaatctcaa cggtgatggc caaaactccg atgaggctgc tgtgatcctt 780
ggttggttag atgatcaacc accttcatct gtggtgtttt tgtgctttgg tagctatgga 840
acctttcaag aaaaccaggt gaaggagatt gcaatgggtc tagagcgcag tgggcatcgc 900
ttcttgtggt ccttgcgtcc gtctatccct aaaggcgaga caaagcttca gcttaaatac 960
tcaaatttgg aagaaattct cccagtcgga ttcttggaca ggacatcatg cgtcggaaaa 1020
gttattggat gggccccgca agtggcggtg ctcggacacg aggcagtcgg agggttcctg 1080
tctcattgtg gttggaattc gacattagag agtgtgtggt gtggcgtgcc cgtcgcaaca 1140
tggccaatgt acggcgagca acaactcaat gcttttgaga tggttaagga gttaggtatt 1200
gcggtggaaa ttgaggtgga ctataagaat gaatatttta acatgaataa tgattttatt 1260
gttagggcag aagaaatcga gacgaaaata aagaagttga tgatggatga aaagaatagt 1320
gaaataagga agaaggtaaa ggaaatgaaa gaaaagagta ggcttgcaat gtctgagaat 1380
ggatcatctt ataattcatt ggccaaacta tttgagaaaa ttatgtga1428
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgDS启动子
<400> 3
aaatgaagaa ggtggttggg 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgDS启动子
<400> 4
ctctatgcag aggtgtcgga 20
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PgPPDS启动子
<400> 5
gggaggattt gaggaagatg aag 23
<210> 6
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> PgPPDS启动子
<400> 6
cagatgcatc ttccatccct ttgg 24
<210> 7
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> PgPPTS启动子
<400> 7
gagattagta cctccttctc aagg 24
<210> 8
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> PgPPTS启动子
<400> 8
gaatggcata ggtccatctc cttc 24
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgUGT74A1启动子
<400> 9
tatcgaaccc gaacgtacaa 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgUGT74A1启动子
<400> 10
gtcgagttcc aaccacaatg 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgUGT94B1启动子
<400> 11
gacagaggat tggttgtgga 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgUGT94B1启动子
<400> 12
tcaaaggctg atcaagatgc 20
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> PgUGT71A1启动子
<400> 13
cctccggatg gatagtatga tcc 23
<210> 14
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> PgUGT71A1启动子
<400> 14
cattgcaatc tccttcacct gg 22
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgTubulin启动子
<400> 15
gaaggctttc ttgcattggt 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PgTubulin启动子
<400> 16
cccagatcgt cttcttctcc 20
<210> 17
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> PgUGT71A1-F (用于克隆)
<400> 17
aggcaggatc catgaagtca gaattgatat tcttgcccgc cccggc 46
<210> 18
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> PgUGT71A1-R (用于克隆)
<400> 18
aggcatctcg agtcacataa ttttctcaaa tagtttggcc aatgaat 47
<210> 19
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 启动子 MET3p_pRS306-F
<400> 19
aggcatgagc tctttagtac taacagagac ttttgtcaca actacatata agtgtacaaa 60
ta 62
<210> 20
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 启动子 MET3p_pRS306-B
<400> 20
aggcattcta gatgttaatt atactttatt cttgttatta ttatactttc ttagttcctt 60
tt 62
<210> 21
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 启动子 ERG7_pRS306-F
<400> 21
aggcatacta gtatgacaga attttattct gacacaatcg gtct 44
<210> 22
<211> 44
<212> DNA
<213> 启动子 ERG7_pRS306-B
<400> 22
aggcatctcg agttaaagcg tatgtgtttc atatgccctg ctgt 44
<210> 23
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 启动子 CYC1ter_pRS306-F
<400> 23
aggcatctcg agtcatgtaa ttagttatgt cacgcttaca ttcacgccct c 51
<210> 24
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 启动子 CYC1ter_pRS306-B
<400> 24
aggcatggta ccggccgcaa attaaagcct tcgagcgtcc caaaacc 47
<210> 25
<211> 85
<212> DNA
<213> 启动子 ERG7 敲减-F
<400> 25
gcccaataac cttaccaata atcgtcgccc acaaagaaag tacaaaacag tcagagcaga 60
ttgtactgag agtgcaccac gcttt 85
<210> 26
<211> 85
<212> DNA
<213> 启动子 ERG7 敲减-B
<400> 26
tgcactagtt tctaattgtt gcagcctcta acaacactta taaataaaac tcggaattaa 60
ccctcactaa agggaacaaa agctg 85
<210> 27
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 启动子 ERG7 敲减确认-F
<400> 27
gcccaataac cttaccaata atcgtcgccc acaaagaaag tacaaaacag 50
<210> 28
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 启动子 ERG7 敲减确认-B
<400> 28
tgcactagtt tctaattgtt gcagcctcta acaacactta taaataaaac 50
<210> 29
<211> 769
<212> PRT
<213> 人参达玛烯二醇-合酶
<400> 29
Met Trp Lys Gln Lys Gly Ala Gln Gly Asn Asp Pro Tyr Leu Tyr Ser
1 5 1015
Thr Asn Asn Phe Val Gly Arg Gln Tyr Trp Glu Phe Gln Pro Asp Ala
202530
Gly Thr Pro Glu Glu Arg Glu Glu Val Glu Lys Ala Arg Lys Asp Tyr
354045
Val Asn Asn Lys Lys Leu His Gly Ile His Pro Cys Ser Asp Met Leu
505560
Met Arg Arg Gln Leu Ile Lys Glu Ser Gly Ile Asp Leu Leu Ser Ile
65707580
Pro Pro Leu Arg Leu Asp Glu Asn Glu Gln Val Asn Tyr Asp Ala Val
859095
Thr Thr Ala Val Lys Lys Ala Leu Arg Leu Asn Arg Ala Ile Gln Ala
100 105 110
His Asp Gly His Trp Pro Ala Glu Asn Ala Gly Ser Leu Leu Tyr Thr
115 120 125
Pro Pro Leu Ile Ile Ala Leu Tyr Ile Ser Gly Thr Ile Asp Thr Ile
130 135 140
Leu Thr Lys Gln His Lys Lys Glu Leu Ile Arg Phe Val Tyr Asn His
145 150 155 160
Gln Asn Glu Asp Gly Gly Trp Gly Ser Tyr Ile Glu Gly His Ser Thr
165 170 175
Met Ile Gly Ser Val Leu Ser Tyr Val Met Leu Arg Leu Leu Gly Glu
180 185 190
Gly Leu Ala Glu Ser Asp Asp Gly Asn Gly Ala Val Glu Arg Gly Arg
195 200 205
Lys Trp Ile Leu Asp His Gly Gly Ala Ala Gly Ile Pro Ser Trp Gly
210 215 220
Lys Thr Tyr Leu Ala Val Leu Gly Val Tyr Glu Trp Glu Gly Cys Asn
225 230 235 240
Pro Leu Pro Pro Glu Phe Trp Leu Phe Pro Ser Ser Phe Pro Phe His
245 250 255
Pro Ala Lys Met Trp Ile Tyr Cys Arg Cys Thr Tyr Met Pro Met Ser
260 265 270
Tyr Leu Tyr Gly Lys Arg Tyr His Gly Pro Ile Thr Asp Leu Val Leu
275 280 285
Ser Leu Arg Gln Glu Ile Tyr Asn Ile Pro Tyr Glu Gln Ile Lys Trp
290 295 300
Asn Gln Gln Arg His Asn Cys Cys Lys Glu Asp Leu Tyr Tyr Pro His
305 310 315 320
Thr Leu Val Gln Asp Leu Val Trp Asp Gly Leu His Tyr Phe Ser Glu
325 330 335
Pro Phe Leu Lys Arg Trp Pro Phe Asn Lys Leu Arg Lys Arg Gly Leu
340 345 350
Lys Arg Val Val Glu Leu Met Arg Tyr Gly Ala Thr Glu Thr Arg Phe
355 360 365
Ile Thr Thr Gly Asn Gly Glu Lys Ala Leu Gln Ile Met Ser Trp Trp
370 375 380
Ala Glu Asp Pro Asn Gly Asp Glu Phe Lys His His Leu Ala Arg Ile
385 390 395 400
Pro Asp Phe Leu Trp Ile Ala Glu Asp Gly Met Thr Val Gln Ser Phe
405 410 415
Gly Ser Gln Leu Trp Asp Cys Ile Leu Ala Thr Gln Ala Ile Ile Ala
420 425 430
Thr Asn Met Val Glu Glu Tyr Gly Asp Ser Leu Lys Lys Ala His Phe
435 440 445
Phe Ile Lys Glu Ser Gln Ile Lys Glu Asn Pro Arg Gly Asp Phe Leu
450 455 460
Lys Met Cys Arg Gln Phe Thr Lys Gly Ala Trp Thr Phe Ser Asp Gln
465 470 475 480
Asp His Gly Cys Val Val Ser Asp Cys Thr Ala Glu Ala Leu Lys Cys
485 490 495
Leu Leu Leu Leu Ser Gln Met Pro Gln Asp Ile Val Gly Glu Lys Pro
500 505 510
Glu Val Glu Arg Leu Tyr Glu Ala Val Asn Val Leu Leu Tyr Leu Gln
515 520 525
Ser Arg Val Ser Gly Gly Phe Ala Val Trp Glu Pro Pro Val Pro Lys
530 535 540
Pro Tyr Leu Glu Met Leu Asn Pro Ser Glu Ile Phe Ala Asp Ile Val
545 550 555 560
Val Glu Arg Glu His Ile Glu Cys Thr Ala Ser Val Ile Lys Gly Leu
565 570 575
Met Ala Phe Lys Cys Leu His Pro Gly His Arg Gln Lys Glu Ile Glu
580 585 590
Asp Ser Val Ala Lys Ala Ile Arg Tyr Leu Glu Arg Asn Gln Met Pro
595 600 605
Asp Gly Ser Trp Tyr Gly Phe Trp Gly Ile Cys Phe Leu Tyr Gly Thr
610 615 620
Phe Phe Thr Leu Ser Gly Phe Ala Ser Ala Gly Arg Thr Tyr Asp Asn
625 630 635 640
Ser Glu Ala Val Arg Lys Gly Val Lys Phe Phe Leu Ser Thr Gln Asn
645 650 655
Glu Glu Gly Gly Trp Gly Glu Ser Leu Glu Ser Cys Pro Ser Glu Lys
660 665 670
Phe Thr Pro Leu Lys Gly Asn Arg Thr Asn Leu Val Gln Thr Ser Trp
675 680 685
Ala Met Leu Gly Leu Met Phe Gly Gly Gln Ala Glu Arg Asp Pro Thr
690 695 700
Pro Leu His Arg Ala Ala Lys Leu Leu Ile Asn Ala Gln Met Asp Asn
705 710 715 720
Gly Asp Phe Pro Gln Gln Glu Ile Thr Gly Val Tyr Cys Lys Asn Ser
725 730 735
Met Leu His Tyr Ala Glu Tyr Arg Asn Ile Phe Pro Leu Trp Ala Leu
740 745 750
Gly Glu Tyr Arg Lys Arg Val Trp Leu Pro Lys His Gln Gln Leu Lys
755 760 765
Ile
<210> 30
<211> 2310
<212> DNA
<213> 人参达玛烯二醇-合酶
<400> 30
atgtggaagc tgaaggttgc tcaaggaaat gatccatatt tgtatagcac taacaacttt 60
gttggcagac aatattggga gtttcagccc gatgctggta ctccagaaga gagggaagag 120
gttgaaaaag cacgcaagga ttatgtaaac aataagaagc tacatggaat tcatccatgc 180
agtgatatgc tgatgcgcag gcagcttatt aaagaaagtg gaatcgatct cctaagcata 240
ccgccggtga gattagatga aaacgaacaa gtgaactacg atgcagttac aaccgctgtg 300
aagaaagctc ttcgattgaa ccgggcaatt caagcacacg atggtcactg gccagctgaa 360
aatgcaggct ctttacttta tacacctccc cttatcattg ccctatatat cagcggaacg 420
attgacacta ttctgacaaa acaacacaag aaggaactga ttcgcttcgt ttacaaccat 480
caaaatgagg atggtggatg gggatcctat attgaggggc acagcacgat gattgggtca 540
gtacttagct acgtgatgtt acgtttgcta ggagaaggat tagctgaatc tgatgatgga 600
aatggtgcag ttgagagagg ccggaagtgg atacttgatc atggaggtgc agccagcata 660
ccctcttggg gaaagactta tctagcggtg cttggagtat atgagtggga agggtgcaac 720
ccgctgcccc cagaattctg gcttttccct tcaagttttc cttttcatcc agcaaaaatg 780
tggatctact gccggtgcac ttacatgcca atgtcgtatt tgtatgggaa gagatatcat 840
ggaccaataa ccgatcttgt tttatctttg aggcaagaaa tttacaacat tccttatgag 900
cagataaagt ggaatcaaca gcgccataac tgttgcaagg aggatctcta ctaccctcat 960
acccttgtac aagacctggt ttgggatggt cttcactact ttagtgaacc attcctcaaa 1020
cgttggccct tcaacaaact gcgaaaaaga ggtctaaaaa gagttgttga actaatgcgc 1080
tatggtgcca ccgagaccag attcataacc acaggaaatg gggaaaaagc tttacaaata 1140
atgagttggt gggcagaaga tcccaatggt gatgagttta aacatcacct tgctagaatt 1200
cctgatttct tatggattgc tgaggatgga atgacagtac agagttttgg tagtcaacta 1260
tgggactgta ttcttgctac tcaagcaatt atcgccacca atatggttga agaatacgga 1320
gattctctta agaaggcgca tttcttcatc aaagaatcgc agataaaaga aaatccaaga 1380
ggagacttcc taaaaatgtg tcgacagttt accaaaggtg cgtggacttt ctctgatcaa 1440
gatcatggtt gcgttgtctc ggactgcaca gctgaagcac taaagtgcct actgttactt 1500
tcacaaatgc cacaggatat tgtcggagaa aaacctgagg ttgagcgatt atatgaggct 1560
gtgaatgttc ttctctattt gcagagtcgt gtaagtggtg gtttcgcagt ttgggagcct 1620
ccagttccaa aaccatattt ggagatgttg aatccttcag aaatttttgc agacattgtt 1680
gttgagagag agcacattga atgcactgca tctgtaatca aaggtctgat ggcatttaaa 1740
tgcttgcatc ctgggcatcg tcagaaagag atagaggatt ctgtggcgaa agccatccga 1800
tatcttgaaa gaaaccaaat gcctgatggt tcatggtatg gcttttgggg aatttgtttc 1860
ctctatggga cattttttac cctatcaggg tttgcttctg ctgggaggac ttatgacaac 1920
agtgaagcag ttcgtaaggg tgttaaattt ttcctttcaa cacaaaatga agaaggtggt 1980
tggggggaga gtcttgaatc atgcccaagc gaaaaattta caccactcaa gggaaacaga 2040
acaaatctag tacaaacatc atgggctatg ttaggtctta tgtttggtgg acaggccgag 2100
agagatccga cacctctgca tagagcagca aagttgttga tcaatgcgca aatggacaat 2160
ggagatttcc ctcaacagga aattactgga gtatactgta aaaatagtat gttacattat 2220
gcggagtaca gaaatatatt tcctctttgg gcactcggag aatatcggaa acgtgtttgg 2280
ttgcctaagc accagcagct caaaatttaa2310
<210> 31
<211> 2310
<212> DNA
<213> 人参达玛烯二醇-合酶_大肠杆菌密码子优化
<400> 31
atgtggaaac agaagggtgc ccaaggaaat gacccatatc tgtatagcac gaacaacttt 60
gttggcagac aatattggga gttccagccc gacgccggta ctccggaaga acgggaagag 120
gttgaaaaag cgcgcaagga ttatgtaaac aataaaaagt tacatggcat tcatccatgc 180
agtgatatgc tgatgcgcag gcagttaatt aaagaatccg gaatcgattt actaagcata 240
ccgccgctga gattagatga aaacgagcag gtgaactacg acgcagtaac aaccgctgtg 300
aagaaagctc ttcgattgaa ccgggctatt caggcacacg atggtcactg gccggctgaa 360
aatgcaggct ctttattata tacacctccc cttatcattg ccctgtatat cagcggcacg 420
attgacacta ttctgacaaa acaacacaag aaggaactga ttcgcttcgt ttacaatcat 480
cagaatgagg atggtggatg ggggagctat attgaggggc acagcacgat gattgggtca 540
gtacttagct acgtgatgtt acgcttgcta ggagaaggct tagccgaatc tgatgatgga 600
aatggcgctg tcgaacgcgg ccggaaatgg atactggatc atgggggtgc agccggcata 660
ccctcctggg gaaagactta tctagcggtg ttgggagtct atgaatggga aggctgcaac 720
ccgctgcccc cagagttttg gctgtttcct tcaagttttc cttttcatcc agcaaaaatg 780
tggatctact gtcggtgtac gtacatgcca atgtcgtatc tgtatggcaa gagatatcat 840
ggaccaataa ccgatcttgt attatctttg cgccaagaga tttacaatat cccttatgaa 900
cagataaagt ggaaccagca gcgccataac tgttgcaaag aagatctcta ctatcctcat 960
acccttgtac aggatctggt ttgggatggt ctccactact tttccgagcc gttcctcaag 1020
cgttggccct tcaacaaact gcgcaagaga ggtctaaaaa gagttgttga actgatgcgc 1080
tacggtgcta ccgagaccag attcataacc acaggcaatg gggaaaaagc tctgcaaata 1140
atgagctggt gggcggaaga tcccaatggt gacgaattta aacaccacct cgccagaatc 1200
cctgattttc tatggatcgc tgaggacgga atgacagtac agagttttgg cagtcaacta 1260
tgggattgta ttcttgctac tcaagcaatt attgccacca atatggttga agaatacgga 1320
gattctctta agaaagccca cttcttcatc aaagaatcgc agatcaaaga aaatccacgt 1380
ggagacttcc tgaaaatgtg ccgacagttt accaaaggcg cgtggacttt ctccgatcaa 1440
gaccatggtt gtgttgtctc ggactgcacg gctgaagcgc taaagtgtct actgttactt 1500
tcgcaaatgc cacaggatat cgtcggggaa aaacctgagg ttgagcgatt atatgaggcc 1560
gtgaatgttc tactctattt gcagagtcgt gtgagtggtg gtttcgcagt gtgggagcct 1620
ccagtcccaa agccatattt ggagatgctg aatccgtcag aaatttttgc agacattgtt 1680
gttgagagag agcatattga atgcactgca tctgtaatca aaggtctgat ggcgtttaag 1740
tgcctgcatc ctgggcatcg tcagaaagag atagaggatt ctgtggcgaa agccatccgt 1800
taccttgaaa gaaaccagat gcctgatggt tcatggtatg gcttttgggg catttgtttc 1860
ctctatggga cattttttac cctatctggg tttgcatctg ctggacggac ttatgacaac 1920
agtgaagccg ttcgtaaagg tgttaaattt tttctttcaa cgcagaatga ggagggtggt 1980
tggggggagt ccctggaatc atgcccgagc gaaaaattta caccgctcaa ggggaaccgc 2040
accaacctag tgcaaacatc atgggcgatg ttgggtctta tgtttggcgg tcaggccgag 2100
agagatccga caccgctgca tagagcagcg aagttgttga ttaacgcgca aatggataat 2160
ggggatttcc ctcaacagga aattacgggc gtgtactgta aaaatagtat gttacattat 2220
gcggagtata gaaatatctt tccgttatgg gcactgggcg aataccggaa acgtgtttgg 2280
ttgccgaagc accagcagct gaaaatttaa2310
<210> 32
<211> 525
<212> PRT
<213> 截短的HMG-CoA还原酶
<400> 32
Met Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe Thr Ala
1 5 1015
Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr Val Ile
202530
Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser Ser Ser
354045
Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile Glu Ser
505560
Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu Leu Ser
65707580
Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala Leu Val
859095
Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu Gly Asp
100 105 110
Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile Leu Ala
115 120 125
Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn Tyr Asp
130 135 140
Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met
145 150 155 160
Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly Thr Ser
165 170 175
Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Ala
180 185 190
Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr Thr Val
195 200 205
Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe Pro Thr
210 215 220
Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu Glu Gly
225 230 235 240
Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg
245 250 255
Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe Met Arg
260 265 270
Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys
275 280 285
Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly Trp Glu
290 295 300
Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp Lys Lys
305 310 315 320
Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Ala
325 330 335
Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys Ser Asp
340 345 350
Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val Gly Ser
355 360 365
Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn Leu
370 375 380
Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln Asn Val
385 390 395 400
Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly Asp Leu
405 410 415
Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile Gly Gly
420 425 430
Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu Gly Val
435 440 445
Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln Leu Ala
450 455 460
Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala
465 470 475 480
Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His Asn Arg
485 490 495
Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr Asp Ile
500 505 510
Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser
515 520 525
<210> 33
<211> 1578
<212> DNA
<213> 截短的HMG-CoA还原酶
<400> 33
atggaccaat tggtgaaaac tgaagtcacc aagaagtctt ttactgctcc tgtacaaaag 60
gcttctacac cagttttaac caataaaaca gtcatttctg gatcgaaagt caaaagttta 120
tcatctgcgc aatcgagctc atcaggacct tcatcatcta gtgaggaaga tgattcccgc 180
gatattgaaa gcttggataa gaaaatacgt cctttagaag aattagaagc attattaagt 240
agtggaaata caaaacaatt gaagaacaaa gaggtcgctg ccttggttat tcacggtaag 300
ttacctttgt acgctttgga gaaaaaatta ggtgatacta cgagagcggt tgcggtacgt 360
aggaaggctc tttcaatttt ggcagaagct cctgtattag catctgatcg tttaccatat 420
aaaaattatg actacgaccg cgtatttggc gcttgttgtg aaaatgttat aggttacatg 480
cctttgcccg ttggtgttat aggccccttg gttatcgatg gtacatctta tcatatacca 540
atggcaacta cagagggttg tttggtagct tctgccatgc gtggctgtaa ggcaatcaat 600
gctggcggtg gtgcaacaac tgttttaact aaggatggta tgacaagagg cccagtagtc 660
cgtttcccaa ctttgaaaag atctggtgcc tgtaagatat ggttagactc agaagaggga 720
caaaacgcaa ttaaaaaagc ttttaactct acatcaagat ttgcacgtct gcaacatatt 780
caaacttgtc tagcaggaga tttactcttc atgagattta gaacaactac tggtgacgca 840
atgggtatga atatgatttc taagggtgtc gaatactcat taaagcaaat ggtagaagag 900
tatggctggg aagatatgga ggttgtctcc gtttctggta actactgtac cgacaaaaaa 960
ccagctgcca tcaactggat cgaaggtcgt ggtaagagtg tcgtcgcaga agctactatt 1020
cctggtgatg ttgtcagaaa agtgttaaaa agtgatgttt ccgcattggt tgagttgaac 1080
attgctaaga atttggttgg atctgcaatg gctgggtctg ttggtggatt taacgcacat 1140
gcagctaatt tagtgacagc tgttttcttg gcattaggac aagatcctgc acaaaatgtc 1200
gaaagttcca actgtataac attgatgaaa gaagtggacg gtgatttgag aatttccgta 1260
tccatgccat ccatcgaagt aggtaccatc ggtggtggta ctgttctaga accacaaggt 1320
gccatgttgg acttattagg tgtaagaggc ccacatgcta ccgctcctgg taccaacgca 1380
cgtcaattag caagaatagt tgcctgtgcc gtcttggcag gtgaattatc cttatgtgct 1440
gccctagcag ccggccattt ggttcaaagt catatgaccc acaacaggaa acctgctgaa 1500
ccaacaaaac ctaacaattt ggacgccact gatataaatc gtttgaaaga tgggtccgtc 1560
acctgcatta aatcctaa 1578
<210> 34
<211> 482
<212> PRT
<213> 人参原人参二醇合酶
<400> 34
Met Val Leu Phe Phe Ser Leu Ser Leu Leu Leu Leu Pro Leu Leu Leu
1 5 1015
Leu Phe Ala Tyr Phe Ser Tyr Thr Lys Arg Ile Pro Gln Lys Glu Asn
202530
Asp Ser Lys Ala Pro Leu Pro Pro Gly Gln Thr Gly Trp Pro Leu Ile
354045
Gly Glu Thr Leu Asn Tyr Leu Ser Cys Val Lys Ser Gly Val Ser Glu
505560
Asn Phe Val Lys Tyr Arg Lys Glu Lys Tyr Ser Pro Lys Val Phe Arg
65707580
Thr Ser Leu Leu Gly Glu Pro Met Ala Ile Leu Cys Gly Pro Glu Gly
859095
Asn Lys Phe Leu Tyr Ser Thr Glu Lys Lys Leu Val Gln Val Trp Phe
100105 110
Pro Ser Ser Val Glu Lys Met Phe Pro Arg Ser His Gly Glu Ser Asn
115 120 125
Ala Asp Asn Phe Ser Lys Val Arg Gly Lys Met Met Phe Leu Leu Lys
130 135 140
Val Asp Gly Met Lys Lys Tyr Val Gly Leu Met Asp Arg Val Met Lys
145 150 155 160
Gln Phe Leu Glu Thr Asp Trp Asn Arg Gln Gln Gln Ile Asn Val His
165 170 175
Asn Thr Val Lys Lys Tyr Thr Val Thr Met Ser Cys Arg Val Phe Met
180 185 190
Ser Ile Asp Asp Glu Glu Gln Val Thr Arg Leu Gly Ser Ser Ile Gln
195 200 205
Asn Ile Glu Ala Gly Leu Leu Ala Val Pro Ile Asn Ile Pro Gly Thr
210 215 220
Ala Met Asn Arg Ala Ile Lys Thr Val Lys Leu Leu Thr Arg Glu Val
225 230 235 240
Glu Ala Val Ile Lys Gln Arg Lys Val Asp Leu Leu Glu Asn Lys Gln
245 250 255
Ala Ser Gln Pro Gln Asp Leu Leu Ser His Leu Leu Leu Thr Ala Asn
260 265 270
Gln Asp Gly Gln Phe Leu Ser Glu Ser Asp Ile Ala Ser His Leu Ile
275 280 285
Gly Leu Met Gln Gly Gly Tyr Thr Thr Leu Asn Gly Thr Ile Thr Phe
290 295 300
Val Leu Asn Tyr Leu Ala Glu Phe Pro Asp Val Tyr Asn Gln Val Leu
305 310 315 320
Lys Glu Gln Val Glu Ile Ala Asn Ser Lys His Pro Lys Glu Leu Leu
325 330 335
Asn Trp Glu Asp Leu Arg Lys Met Lys Tyr Ser Trp Asn Val Ala Gln
340 345 350
Glu Val Leu Arg Ile Ile Pro Pro Gly Val Gly Thr Phe Arg Glu Ala
355 360 365
Ile Thr Asp Phe Thr Tyr Ala Gly Tyr Leu Ile Pro Lys Gly Trp Lys
370 375 380
Met His Leu Ile Pro His Asp Thr His Lys Asn Pro Thr Tyr Phe Pro
385 390 395 400
Ser Pro Glu Lys Phe Asp Pro Thr Arg Phe Glu Gly Asn Gly Pro Ala
405 410 415
Pro Tyr Thr Phe Thr Pro Phe Gly Gly Gly Pro Arg Met Cys Pro Gly
420 425 430
Ile Glu Tyr Ala Arg Leu Val Ile Leu Ile Phe Met His Asn Val Val
435 440 445
Thr Asn Phe Arg Trp Glu Lys Leu Ile Pro Asn Glu Lys Ile Leu Thr
450 455 460
Asp Pro Ile Pro Arg Phe Ala His Gly Leu Pro Ile His Leu His Pro
465 470 475 480
His Asn
<210> 35
<211> 1449
<212> DNA
<213> 人参原人参二醇合酶
<400> 35
atggtgttgt ttttctccct atctcttctt ctccttcccc tattattatt gtttgcctat 60
ttttcttata caaaacgcat cccccagaaa gaaaatgatt caaaagctcc cctcccccca 120
ggtcaaacag gttggccttt gataggcgaa actcttaatt atttatcttg tgtcaaaagt 180
ggggtttctg aaaattttgt gaaatatagg aaggaaaagt attcccccaa agttttcagg 240
acatcacttt taggagaacc gatggcaatc ttgtgtgggc cggagggcaa caaattcctc 300
tactcaacgg aaaaaaagct agtccaagtt tggttcccga gcagtgttga aaagatgttc 360
cccagatctc atggcgaatc caacgcagac aacttctcca aagtacgcgg caaaatgatg 420
tttctactca aggtggacgg gatgaaaaaa tatgttggcc taatggacag ggtgatgaaa 480
cagtttttag agacagattg gaatcgccaa caacagatca acgttcataa cacggttaag 540
aaatacacgg tcacgatgtc gtgtcgggtg tttatgagta tcgatgatga agagcaagtt 600
acaagacttg gcagctcaat tcagaacata gaggccggac tccttgccgt gcctataaat 660
ataccgggga ctgctatgaa tcgtgccatt aagaccgtaa agttgctaac tagagaggtt 720
gaggcggtga ttaagcaaag aaaagtggat cttttggaga ataagcaagc gtcccaaccg 780
caagatttat tgtcacactt gctacttacg gccaatcagg atggccaatt tttgagcgaa 840
tcggatattg ctagccactt gataggcttg atgcaaggtg gctataccac cttaaatggt 900
acaatcacct tcgttctcaa ctatcttgca gagtttcctg atgtctacaa tcaagtcctt 960
aaagagcaag tggaaatagc aaactcaaaa cacccaaaag agttgcttaa ttgggaggat 1020
ttgaggaaga tgaagtattc gtggaatgtt gctcaagagg tattgagaat aataccacca 1080
ggagttggaa cattcagaga agctattacc gatttcacct atgctggata tttaattcca 1140
aagggatgga agatgcatct gattccacat gacacgcaca agaacccaac atattttcca 1200
agtccagaaa aattcgatcc aaccaggttt gaaggaaatg gtccggctcc atatacattt 1260
actcctttcg gaggaggacc tcgaatgtgt ccgggaattg agtatgcacg tctagtaata 1320
ctcattttta tgcacaatgt ggttacaaac ttcagatggg agaagctcat ccctaatgaa 1380
aaaattctca ccgatcccat tccaagattt gcgcatggac ttcccattca tctacatccc 1440
cacaattaa 1449
<210> 36
<211> 712
<212> PRT
<213> 拟南芥细胞色素p450还原酶
<400> 36
Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala
1 5 1015
Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala
202530
Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu
354045
Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile
505560
Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser
65707580
Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu
859095
Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val
145 150 155 160
Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu
180 185 190
Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val
210 215 220
Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro
245 250 255
Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr
260 265 270
Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser
275 280 285
Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr
290 295 300
Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys
305 310 315 320
Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu
325 330 335
Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val
340 345 350
Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg
355 360 365
Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys
370 375 380
Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro
385 390 395 400
Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser
405 410 415
Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro
420 425 430
Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val
435 440 445
Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu
450 455 460
Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe
465 470 475 480
Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser
485 490 495
Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val
500 505 510
Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr
515 520 525
Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser
530 535 540
Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser
545 550 555 560
Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe
565 570 575
Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu
580 585 590
Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp
595 600 605
Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu
610 615 620
Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr
625 630 635 640
Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile
645 650 655
Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala
660 665 670
Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser
675 680 685
Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser
690 695 700
Gly Arg Tyr Leu Arg Asp Val Trp
705 710
<210> 37
<211> 2139
<212> DNA
<213> 拟南芥细胞色素p450还原酶
<400> 37
atgtcctctt cttcttcttc gtcaacctcc atgatcgatc tcatggcagc aatcatcaaa 60
ggagagcctg taattgtctc cgacccagct aatgcctccg cttacgagtc cgtagctgct 120
gaattatcct ctatgcttat agagaatcgt caattcgcca tgattgttac cacttccatt 180
gctgttctta ttggttgcat cgttatgctc gtttggagga gatccggttc tgggaattca 240
aaacgtgtcg agcctcttaa gcctttggtt attaagcctc gtgaggaaga gattgatgat 300
gggcgtaaga aagttaccat ctttttcggt acacaaactg gtactgctga aggttttgca 360
aaggctttag gagaagaagc taaagcaaga tatgaaaaga ccagattcaa aatcgttgat 420
ttggatgatt acgcggctga tgatgatgag tatgaggaga aattgaagaa agaggatgtg 480
gctttcttct tcttagccac atatggagat ggtgagccta ccgacaatgc agcgagattc 540
tacaaatggt tcaccgaggg gaatgacaga ggagaatggc ttaagaactt gaagtatgga 600
gtgtttggat taggaaacag acaatatgag cattttaata aggttgccaa agttgtagat 660
gacattcttg tcgaacaagg tgcacagcgt cttgtacaag ttggtcttgg agatgatgac 720
cagtgtattg aagatgactt taccgcttgg cgagaagcat tgtggcccga gcttgataca 780
atactgaggg aagaagggga tacagctgtt gccacaccat acactgcagc tgtgttagaa 840
tacagagttt ctattcacga ctctgaagat gccaaattca atgatataaa catggcaaat 900
gggaatggtt acactgtgtt tgatgctcaa catccttaca aagcaaatgt cgctgttaaa 960
agggagcttc atactcccga gtctgatcgt tcttgtatcc atttggaatt tgacattgct 1020
ggaagtggac ttacgtatga aactggagat catgttggtg tactttgtga taacttaagt 1080
gaaactgtag atgaagctct tagattgctg gatatgtcac ctgatactta tttctcactt 1140
cacgctgaaa aagaagacgg cacaccaatc agcagctcac tgcctcctcc cttcccacct 1200
tgcaacttga gaacagcgct tacacgatat gcatgtcttt tgagttctcc aaagaagtct 1260
gctttagttg cgttggctgc tcatgcatct gatcctaccg aagcagaacg attaaaacac 1320
cttgcttcac ctgctggaaa ggttgatgaa tattcaaagt gggtagtaga gagtcaaaga 1380
agtctacttg aggtgatggc cgagtttcct tcagccaagc caccacttgg tgtcttcttc 1440
gctggagttg ctccaaggtt gcagcctagg ttctattcga tatcatcatc gcccaagatt 1500
gctgaaacta gaattcacgt cacatgtgca ctggtttatg agaaaatgcc aactggcagg 1560
attcataagg gagtgtgttc cacttggatg aagaatgctg tgccttacga gaagagtgaa 1620
aactgttcct cggcgccgat atttgttagg caatccaact tcaagcttcc ttctgattct 1680
aaggtaccga tcatcatgat cggtccaggg actggattag ctccattcag aggattcctt 1740
caggaaagac tagcgttggt agaatctggt gttgaacttg ggccatcagt tttgttcttt 1800
ggatgcagaa accgtagaat ggatttcatc tacgaggaag agctccagcg atttgttgag 1860
agtggtgctc tcgcagagct aagtgtcgcc ttctctcgtg aaggacccac caaagaatac 1920
gtacagcaca agatgatgga caaggcttct gatatctgga atatgatctc tcaaggagct 1980
tatttatatg tttgtggtga cgccaaaggc atggcaagag atgttcacag atctctccac 2040
acaatagctc aagaacaggg gtcaatggat tcaactaaag cagagggctt cgtgaagaat 2100
ctgcaaacga gtggaagata tcttagagat gtatggtaa2139
<210> 38
<211> 2139
<212> DNA
<213> 拟南芥细胞色素p450还原酶_大肠杆菌密码子优化
<400> 38
atgtcctctt cttcttcttc gtcaaccagc atgattgatc tcatggcagc aatcatcaaa 60
ggggaacctg taattgtcag cgacccagct aatgcctccg cttatgagtc cgtagctgcg 120
gaactgtcca gtatgcttat agagaatcgt caattcgcca tgattgttac cacttccatt 180
gctgttctta ttggttgcat cgtgatgctc gtttggcgga gatccggttc tggaaatagt 240
aaacgtgtcg agcctcttaa gcctttggtg attaaacctc gtgaggaaga gattgatgat 300
ggtcgtaaga aagttaccat ctttttcggt acacagacgg ggacggcgga aggttttgca 360
aaggctttag gtgaggaagc taaagcacgt tatgaaaaga ccagatttaa gatcgtagat 420
ttagatgatt acgcggcgga tgatgacgag tatgaggaaa aacttaaaaa agaagatgtg 480
gcttttttct tcttagccac atacggggac ggtgagccca ccgacaatgc agcacggttc 540
tacaaatggt tcacggaggg gaatgacaga ggagaatggc ttaagaactt gaagtatggt 600
gtgtttggat taggaaaccg ccagtatgag cattttaata aggttgccaa agtcgtagat 660
gacattcttg tagaacaagg tgcacagcgt cttgtacagg tgggtcttgg agatgacgat 720
cagtgtattg aggatgactt taccgcgtgg cgtgaggcat tgtggcccga acttgataca 780
atcctgaggg aagaaggcga cacggcggtc gccacaccat ataccgcagc ggtgctggaa 840
taccgagttt ctattcacga cagcgaagac gccaaattca atgatataaa catggcaaat 900
gggaacggtt acactgtgtt tgatgctcaa catccttata aagcaaatgt cgctgtgaaa 960
cgcgaacttc atactcccga gtctgatcgt tcttgcatcc atttggagtt tgacattgct 1020
ggcagtgggc ttacgtatga aactggagat catgttgggg tactctgtga taacttaagt 1080
gaaaccgtgg atgaagctct tcgcttgctg gatatgtcac ctgacactta cttctcactc 1140
cacgctgaga aagaagacgg cacaccaatc agcagctcac tgcctcctcc cttccctcct 1200
tgcaacctca gaaccgcgct tacacgatat gcatgtcttt tgagttctcc taaaaaatct 1260
gctttagttg cgttggccgc tcatgcatct gatcctaccg aagcagaacg attaaagcac 1320
cttgcttcac ctgctggcaa ggttgacgaa tattcaaagt gggtagttga aagtcaaaga 1380
agtctacttg aagtgatggc cgaatttcct tcagccaagc caccgctggg tgtcttcttc 1440
gctggagttg cgccaaggtt gcagcctcgg ttctattcga tatcatcatc gcccaagatt 1500
gccgaaaccc ggattcacgt cacatgtgca ctggtttatg aaaaaatgcc aacgggcagg 1560
attcacaagg gtgtgtgttc cacgtggatg aagaatgcgg tgccttacga gaagagtgaa 1620
aactgctcct cggcgccgat atttgttcgc cagtcgaact tcaaattgcc gtctgattct 1680
aaagtaccga taatcatgat cggtccaggc actggcttag ctccgtttag aggattttta 1740
caggaaagac tagccttggt ggaatctggc gttgagcttg gcccatcagt tttgtttttt 1800
ggatgcagaa accgtagaat ggatttcatc tacgaggaag agttacagcg ttttgtcgag 1860
agtggtgctc tggctgagct aagcgtcgcc ttctctcgtg aaggcccgac caaagaatac 1920
gtacagcaca agatgatgga caaggcctct gatatctgga atatgatcag ccagggtgcc 1980
tatttatatg tttgtggtga cgcgaaaggc atggcaagag atgttcatcg gtctctccac 2040
acaatagctc aagaacaggg ctcaatggat tcgactaaag cagaggggtt cgtgaagaat 2100
ctgcaaacga gtgggagata tcttagagac gtgtggtaa2139
<210> 39
<211> 469
<212> PRT
<213> 人参原人参三醇合酶
<400> 39
Met Asp Leu Phe Ile Ser Ser Gln Leu Leu Leu Leu Leu Val Phe Cys
1 5 1015
Leu Phe Leu Phe Trp Asn Phe Lys Pro Ser Ser Gln Asn Lys Leu Pro
2025 30
Pro Gly Lys Thr Gly Trp Pro Ile Ile Gly Glu Thr Leu Glu Phe Ile
354045
Ser Cys Gly Gln Lys Gly Asn Pro Glu Lys Phe Val Thr Gln Arg Met
505560
Asn Lys Tyr Ser Pro Asp Val Phe Thr Thr Ser Leu Ala Gly Glu Lys
65707580
Met Val Val Phe Cys Gly Ala Ser Gly Asn Lys Phe Ile Phe Ser Asn
859095
Glu Asn Lys Leu Val Val Ser Trp Trp Pro Pro Ala Ile Ser Lys Ile
100 105 110
Leu Thr Ala Thr Ile Pro Ser Val Glu Lys Ser Lys Ala Leu Arg Ser
115 120 125
Leu Ile Val Glu Phe Leu Lys Pro Glu Ala Leu His Lys Phe Ile Ser
130 135 140
Val Met Asp Arg Thr Thr Arg Gln His Phe Glu Asp Lys Trp Asn Gly
145 150 155 160
Ser Thr Glu Val Lys Ala Phe Ala Met Ser Glu Ser Leu Thr Phe Glu
165 170 175
Leu Ala Cys Trp Leu Leu Phe Ser Ile Asn Asp Pro Val Gln Val Gln
180 185 190
Lys Leu Ser His Leu Phe Glu Lys Val Lys Ala Gly Leu Leu Ser Leu
195 200 205
Pro Leu Asn Phe Pro Gly Thr Ala Phe Asn Arg Gly Ile Lys Ala Ala
210 215 220
Asn Leu Ile Arg Lys Glu Leu Ser Val Val Ile Lys Gln Arg Arg Ser
225 230 235 240
Asp Lys Leu Gln Thr Arg Lys Asp Leu Leu Ser His Val Met Leu Ser
245 250 255
Asn Gly Glu Gly Glu Lys Phe Phe Ser Glu Met Asp Ile Ala Asp Val
260 265 270
Val Leu Asn Leu Leu Ile Ala Ser His Asp Thr Thr Ser Ser Ala Met
275 280 285
Gly Ser Val Val Tyr Phe Leu Ala Asp His Pro His Ile Tyr Ala Lys
290 295 300
Val Leu Thr Glu Gln Met Glu Ile Ala Lys Ser Lys Gly Ala Glu Glu
305 310 315 320
Leu Leu Ser Trp Glu Asp Ile Lys Arg Met Lys Tyr Ser Arg Asn Val
325 330 335
Ile Asn Glu Ala Met Arg Leu Val Pro Pro Ser Gln Gly Gly Phe Lys
340 345 350
Val Val Thr Ser Lys Phe Ser Tyr Ala Asn Phe Ile Ile Pro Lys Gly
355 360 365
Trp Lys Ile Phe Trp Ser Val Tyr Ser Thr His Lys Asp Pro Lys Tyr
370 375 380
Phe Lys Asn Pro Glu Glu Phe Asp Pro Ser Arg Phe Glu Gly Asp Gly
385 390 395 400
Pro Met Pro Phe Thr Phe Ile Pro Phe Gly Gly Gly Pro Arg Met Cys
405 410 415
Pro Gly Ser Glu Phe Ala Arg Leu Glu Val Leu Ile Phe Met His His
420 425 430
Leu Val Thr Asn Phe Lys Trp Glu Lys Val Phe Pro Asn Glu Lys Ile
435 440 445
Ile Tyr Thr Pro Phe Pro Phe Pro Glu Asn Gly Leu Pro Ile Arg Leu
450 455 460
Ser Pro Cys Thr Leu
465
<210> 40
<211> 1410
<212> DNA
<213> 人参原人参三醇合酶
<400> 40
atggatctct ttatctcatc tcaactactt cttctactag tcttttgctt attcctcttt 60
tggaatttca aaccaagtag ccaaaacaaa ctgcctccgg gcaaaacagg atggcccata 120
attggagaaa cactagaatt catctcctgt ggccaaaaag gcaaccctga aaagttcgta 180
acacaaagaa tgaacaaata ctcccctgat gtcttcacaa catccttagc aggcgagaaa 240
atggtagttt tctgcggtgc ctcggggaac aaattcattt tctccaacga aaacaagctt 300
gttgtgtcct ggtggccccc tgccatatcc aaaatcctaa ctgcaacaat accttcggta 360
gagaaaagca aagccttgcg gagtctaatt gttgaattct taaaacccga agcgctccac 420
aagtttattt ctgtcatgga tcggacaacg aggcagcact ttgaagacaa atggaacggg 480
agtacagaag tgaaagcttt cgctatgtca gagtcgctga cttttgagtt ggcctgttgg 540
ctgctcttta gcataaatga tccggtgcag gtgcagaagc tttctcatct ttttgagaag 600
gttaaagcgg gattattgtc tttaccttta aattttccgg gcacggcttt taaccgtggg 660
atcaaggccg ccaatcttat tagaaaagag ctttcggtgg tgataaaaca gaggagaagt 720
gataaattac agactcgaaa ggatcttttg tcccacgtta tgctttccaa tggcgagggc 780
gagaaatttt tcagcgaaat ggatattgcg gacgttgttc ttaatttact gattgctagc 840
catgatacca ctagcagtgc catgggctct gtggtctact ttcttgcaga tcatcctcac 900
atctatgcta aagttctcac agaacaaatg gagatcgcaa agtcgaaagg ggcagaagaa 960
cttttgagct gggaggacat aaagaggatg aagtattccc gcaatgttat aaatgaagct 1020
atgagattag tacctccttc tcaaggaggt tttaaagtag ttacaagtaa attcagttac 1080
gcaaacttca tcattcccaa aggatggaag atcttttgga gcgtatactc gacacataaa 1140
gatcccaaat actttaaaaa tccagaggag tttgatcctt caagatttga aggagatgga 1200
cctatgccat tcacatttat accatttgga ggaggaccaa ggatgtgccc tgggagtgag 1260
tttgctcgtc tggaggtact aatattcatg caccatttgg ttaccaattt taagtgggag 1320
aaggtgtttc ccaatgaaaa gattatttat actccatttc ccttcccgga gaatggtctt 1380
cctattcgtc tatcaccttg tacgctttaa1410
<210> 41
<211> 1410
<212> DNA
<213> 人参原人参三醇合酶_酵母密码子优化
<400> 41
atggacctct ttatctcttc tcaactactt cttttgttgg tcttttgctt gttcctattc 60
tggaacttca aaccatcaag ccaaaataaa ttacctccgg gcaaaaccgg atggccaata 120
attggagaaa ccctagaatt tatctcatgt ggccaaaaag ggaaccccga aaagttcgta 180
actcaaagaa tgaacaaata ttcacctgat gtctttacaa catccttagc aggtgagaag 240
atggtagttt tctgtggtgc ctcgggtaac aagtttattt tctccaacga aaacaaactt 300
gttgtgtcct ggtggccccc tgccatctcc aaaattctaa ctgcaacaat accttcggtc 360
gagaaatcca aggccttgcg tagtctgata gttgaatttt taaaacccga ggcgctccat 420
aagtttattt ctgttatgga tagaactacg aggcaacatt ttgaagacaa atggaacgga 480
agtacagagg ttaaggcttt cgctatgtca gaatcgctga cttttgagtt ggcctgttgg 540
ctattattca gcataaatga cccggtacag gtgcagaagt tgtctcattt atttgaaaag 600
gttaaagcgg gattattgtc tttacctctt aattttccag gtacggcttt caaccgtggg 660
atcaaggctg caaatcttat tagaaaagaa ctttcggtgg tgataaaaca aagaagaagt 720
gataaattac agactcgaaa ggatcttttg tcccacgtca tgctttctaa cggtgaaggc 780
gaaaagtttt tcagtgaaat ggatattgcg gacgttgttc ttaatttact cattgcttct 840
catgatacca cttctagtgc catgggctct gtggtctact ttcttgcaga tcatcctcac 900
atttatgcta aagttttaac ggaacaaatg gagatcgcaa agtcaaaggg ggcagaagaa 960
cttttgagct gggaggacat aaagaggatg aagtattccc gcaatgttat aaatgaagct 1020
atgagattag tacctccatc tcaaggaggt tttaaagttg tgacaagtaa attcagttat 1080
gctaatttca tcattcccaa aggttggaaa atcttttgga gcgtatactc tacccataaa 1140
gatccaaaat actttaaaaa tccagaagaa tttgatcctt caagatttga aggagatgga 1200
ccaatgccat ttacatttat accatttggt ggcggaccaa ggatgtgccc tggctcagag 1260
tttgctagac tggaggtact aattttcatg caccatttgg ttaccaattt taagtgggaa 1320
aaagtcttcc caaatgaaaa gattatctat actccattcc ccttcccgga gaatggtctt 1380
cctattagac tatcaccttg tactttataa1410
机译: 一种使用人参衍生的糖基转移酶进行人参皂苷糖基化的新方法
机译: 利用人参中的糖基转移酶进行人参皂苷糖基化的新方法
机译: 利用人参中的糖基转移酶进行人参皂苷糖基化的新方法