首页> 中国专利> 一种通过对核酸酶系统敲除以调控体外生物合成活性的方法

一种通过对核酸酶系统敲除以调控体外生物合成活性的方法

摘要

本发明提供了一种通过对核酸酶系统敲除以调控体外生物合成活性的方法,具体地,从很多种核酸酶中筛出5种核酸酶,其中对其中一种核酸酶(如EXN53)进行下调或敲除处理,发现可以提高核酸的稳定性,并显著提高体外蛋白质合成体系产生蛋白质的效率。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-13

    专利权人的姓名或者名称、地址的变更 IPC(主分类):C12N15/81 变更前: 变更后: 申请日:20171124

    专利权人的姓名或者名称、地址的变更

  • 2019-06-14

    授权

    授权

  • 2019-01-01

    实质审查的生效 IPC(主分类):C12N15/81 申请日:20171124

    实质审查的生效

  • 2018-12-07

    公开

    公开

说明书

技术领域

本发明涉及生物技术领域,具体地,涉及一种通过对核酸酶系统敲除以调控体外生物合成活性的方法。

背景技术

蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序列和结构不同,决定了其功能的不同。在细胞内,蛋白可以作为酶类催化各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态,储存能量,运输分子,并使生物体运动。在生物医学领域,蛋白质抗体作为靶向药物,是治疗癌症等疾病的重要手段[1-2]。

在细胞中,蛋白质翻译的调节在应对营养缺失等外界压力,细胞发育与分化等很多过程中发挥重要作用。蛋白质翻译的四个过程包括翻译起始、翻译延伸、翻译终止和核糖体再循环,其中翻译起始是受调控最多的一个过程[3]。在翻译起始阶段,核糖体小亚基(40S)结合(tRNA)iMet,并在翻译起始因子的作用下识别mRNA>

体外生物合成系统 (in vitro biosynthesis system)是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,通过加入外源编码的核酸DNA、RNA、底物和能量源,完成特定化学分子或生物大分子(DNA, RNA, 蛋白质)的体外高效合成。常见的体外生物合成系统是体外蛋白质合成系统 (in vitro protein synthesis system),通过外源mRNA或者DNA模板、利用细胞裂解物,完成外源重组蛋白的快速高效翻译[5]。

商业上常见的体外蛋白质合成系统是体外转录-翻译偶联的体系 (in vitrotranscription-translation system,简称IVTT), 通过DNA模板、经RNA聚合酶转录出mRNA中间体,再利用氨基酸和ATP等组分,完成外源蛋白的一步高效翻译。目前,常见的商业化体外蛋白表达系统包括大肠杆菌系统(Escherichia>extract,ECE)、兔网织红细胞(Rabbit reticuLocyte lysate,RRL)、麦胚(Wheat germ extract, WGE)、昆虫(Insectcell extract, ICE)和人源系统。

核酸 mRNA 和 DNA蛋白质体外合成系统中的编码底物,它们的稳定性影响着蛋白质的得率。核酸酶是在核酸分解的第一步中,水解核苷酸之间的磷酸二酯键的一种蛋白质。有些核酸酶只能作用于RNA,称为核糖核酸酶(RNase),有些核酸酶只能作用于DNA,称为脱氧核糖核酸酶(DNase)。根据核酸酶作用的位置不同,又可将核酸酶分为核酸外切酶(exonuclease)和核酸内切酶(endonuclease)。细胞内绝大多数RNA的降解主要通过定位于细胞质的5′ to 3′核酸外切酶和定位于细胞核的5′ to 3′核酸外切酶,或者通过定位于细胞质和细胞核的,具有3′ to 5′核酸外切酶和核酸内切酶活性的蛋白亚基复合体exosome的作用而降解。

CRISPR/Cas (Clustered ReguLatory Interspaced Short PalindromicRepeats/CRISPR associated)是广泛存在于细菌和古细菌中的一种生物防御系统。其中经过改造的Ⅱ型系统,CRISPR/Cas9,成为现在广泛使用的基因组改造工具。在guide RNA(gRNA)的介导下,Cas9蛋白识别基因组上protospacer adjacent motif (PAM)及其上游20bp序列,并在PAM上游3 bp位置产生双链切口。在同时提供供体DNA(donor DNA) 的情况下,被CRISPR/Cas9双链切开的基因可以HDR的方式重组入新的序列,以达到基因改造的目的。在酿酒酵母(Saccharomyces.cerevisiae)中,利用CRISPR/Cas9系统进行基因组改造的实例很多,包括基因点突变、基因敲除和基因插入。

目前的体外合成系统中可能留存一些核酸酶,这些核酸酶会通过降解体外合成系统中的mRNA 和 DNA,从而影响体外合成系统中核酸的稳定性。

因此,本领域迫切需要开放一种通过稳定核酸实现外源蛋白稳定表达的方法。

发明内容

本发明的目的在于提供一种通过稳定核酸实现外源蛋白稳定表达的方法。

本发明第一方面提供了一种体外的无细胞的蛋白合成体系,所述无细胞的蛋白合成体系包括:

(a) 酵母细胞提取物;

(b) 聚乙二醇;

(c) 任选的外源蔗糖;和

(d) 任选的溶剂,所述溶剂为水或水性溶剂,

其中,所述酵母细胞提取物中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%。

在另一优选例中,所述酵母细胞提取物中的EXN53的含量为0。

在另一优选例中,所述EXN53来源于选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母,较佳地,来源于克鲁维酵母。

在另一优选例中,所述克鲁维酵母包括马克斯克鲁维酵母、和/或乳酸克鲁维酵母。

在另一优选例中,所述EXN53的核苷酸序列如SEQ ID NO.:1所示。

在另一优选例中,所述EXN53的蛋白序列如SEQ ID NO.:6所示。

在另一优选例中,所述无细胞的蛋白合成体系还包括选自下组的一种或多种组分:

(e1) 用于合成RNA的底物;

(e2) 用于合成蛋白的底物;

(e3) 镁离子;

(e4) 钾离子;

(e5) 缓冲剂;

(e6) RNA聚合酶;

(e7) 能量再生系统。

在另一优选例中,所述无细胞的蛋白合成体系还包括选自下组的一种或多种组分:

(e8) 血红素;

(e9) 亚精胺。

在另一优选例中,所述酵母细胞选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为马克斯克鲁维酵母、和/或乳酸克鲁维酵母。

在另一优选例中,所述的酵母细胞提取物为对酵母细胞的水性提取物。

在另一优选例中,所述酵母细胞提取物不含酵母内源性的长链核酸分子。

在另一优选例中,所述的酵母细胞提取物是用包括以下步骤的方法制备:

(i)提供酵母细胞;

(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;

(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;和

(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。

在另一优选例中,所述的固液分离包括离心。

在另一优选例中,在液态下进行离心。

在另一优选例中,所述离心条件为5000-100000×g,较佳地,8000-30000×g。

在另一优选例中,所述离心时间为0.5-2h,较佳地,20min-50min。

在另一优选例中,所述离心在1-10℃下进行,较佳地,在2-6℃下进行。

在另一优选例中,所述的洗涤处理采用洗涤液在pH为7-8(较佳地,7.4)下进行处理。

在另一优选例中,所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。

在另一优选例中,所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。

在另一优选例中,所述的合成RNA的底物包括:核苷单磷酸、核苷三磷酸、或其组合。

在另一优选例中,所述的合成蛋白的底物包括:1-20种天然氨基酸、以及非天然氨基酸。

在另一优选例中,所述镁离子来源于镁离子源,所述镁离子源选自下组:醋酸镁、谷氨酸镁、或其组合。

在另一优选例中,所述钾离子来源于钾离子源,所述钾离子源选自下组:醋酸钾、谷氨酸钾、或其组合。

在另一优选例中,所述能量再生系统选自下组:磷酸肌酸/磷酸肌酸酶系统、糖酵解途径及其中间产物能量系统、或其组合。

在另一优选例中,所述无细胞的蛋白合成体系还包括(f1) 人工合成的tRNA。

在另一优选例中,所述缓冲剂选自下组:4-羟乙基哌嗪乙磺酸、三羟甲基氨基甲烷、或其组合。

在另一优选例中,所述无细胞的蛋白合成体系还包括(g1) 外源的用于指导蛋白质合成的DNA分子。

在另一优选例中,所述的DNA分子为线性的。

在另一优选例中,所述的DNA分子为环状的。

在另一优选例中,所述的DNA分子含有编码外源蛋白的序列。

在另一优选例中,所述的编码外源蛋白的序列包括基因组序列、cDNA序列。

在另一优选例中,所述的编码外源蛋白的序列还含有启动子序列、5'非翻译序列、3'非翻译序列。

在另一优选例中,所述无细胞的蛋白合成体系包括选自下组的成分:4-羟乙基哌嗪乙磺酸、醋酸钾、醋酸镁、核苷三磷酸、氨基酸、磷酸肌酸,二硫苏糖醇(DTT)、磷酸肌酸激酶、RNA聚合酶、或其组合。

在另一优选例中,所述聚乙二醇选自下组:PEG3000、PEG8000、PEG6000、PEG3350、或其组合。

在另一优选例中,所述聚乙二醇包括分子量(Da)为200-10000的聚乙二醇,较佳地,分子量为3000-10000的聚乙二醇。

在另一优选例中,所述蛋白合成体系中,组分(a)的浓度(v/v)为20%-70%,较佳地,30-60%,更佳地,40%-50%,以所述蛋白合成体系的总体积计。

在另一优选例中,所述蛋白合成体系中,组分(b)的浓度(w/v,例如g/mL)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%。

在另一优选例中,所述蛋白合成体系中,组分(c)的浓度为0.2-4%,较佳地,0.5-4%,更佳地,0.5-1%,以所述蛋白合成体系的总体积计。

在另一优选例中,所述核苷三磷酸选自下组:腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸、尿嘧啶核苷三磷酸、或其组合。

在另一优选例中,所述蛋白合成体系中,组分(e1)的浓度为0.1-5 mM,较佳地,0.5-3 mM,更佳地,1-1.5 mM。

在另一优选例中,所述氨基酸为选自下组:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、或其组合。

在另一优选例中,所述氨基酸包括D型氨基酸和/或L型氨基酸。

在另一优选例中,所述蛋白合成体系中,所述组分(e2)的浓度为0.01-0.48 mM,较佳地,0.04-0.24 mM,更佳地,0.04- 0.2 mM,最佳地,0.08 mM。

在另一优选例中,所述蛋白合成体系中,所述组分(e3)的浓度为1-10 mM,较佳地,1-5 mM,更佳地,2-4 mM。

在另一优选例中,所述蛋白合成体系中,所述组分(e4)的浓度为30-210 mM,较佳地,30-150 mM,更佳地,30-60 mM。

在另一优选例中,所述蛋白合成体系中,所述组分(e6)的浓度为0. 01-0.3 mg/mL,较佳地,0.02-0.1 mg/mL,更佳地,0.027-0.054 mg/mL。

在另一优选例中,所述蛋白合成体系中,4-羟乙基哌嗪乙磺酸的浓度为5-50 mM,较佳地,10-50 mM,较佳地,15-30 mM,更佳地,20-25 mM。

在另一优选例中,所述蛋白合成体系中,所述醋酸钾的浓度为20-210 mM,较佳地,30-210 mM,较佳地,30-150 mM,更佳地,30-60 mM。

在另一优选例中,所述蛋白合成体系中,所述醋酸镁的浓度为1-10 mM,较佳地,1-5 mM,更佳地,2-4 mM。

在另一优选例中,所述蛋白合成体系中,所述磷酸肌酸的浓度为10-50 mM,较佳地,20-30 mM,更佳地,25 mM。

在另一优选例中,所述蛋白合成体系中,所述血红素的浓度为0.01-0.1 mM,较佳地,0.02-0.08 mM,更佳地,0.03-0.05 mM,最佳地,0.04 mM。

在另一优选例中,所述蛋白合成体系中,所述亚精胺的浓度为0.05-1 mM,较佳地,0.1-0.8 mM,更佳地,更佳地,0.2-0.5 mM,更佳地,0.3-0.4 mM,最佳地,0.4 mM。

在另一优选例中,所述蛋白合成体系中,所述二硫苏糖醇(DTT)的浓度为0.2-15mM,较佳地,0.2-7 mM,更佳地,1-2 mM。

在另一优选例中,所述蛋白合成体系中,所述磷酸肌酸激酶的浓度为0.1-1 mg/mL,较佳地,0.2-0.5 mg/mL,更佳地,0.27 mg/mL。

在另一优选例中,所述蛋白合成体系中,所述T7 RNA聚合酶的浓度为0. 01-0.3mg/mL,较佳地,0.02-0.1 mg/mL,更佳地,0.027-0.054 mg/mL。

在另一优选例中,所述的无细胞体外合成体系具有以下性能:

在合成体系里,蛋白合成总量达到3ug蛋白/mL体系。

在另一优选例中,所述的无细胞的蛋白合成体系的组成包括:

一般范围优选范围4-羟乙基哌嗪乙磺酸,5-40 mM;10-30 mM(较佳地,20-30 mM);醋酸镁,1-10 mM;2-5 mM;醋酸钾,20-150 mM;30-75 mM;DTT,0.5-5 mM;1-2 mM;磷酸肌酸,15-50 mM;20-30 mM;磷酸肌酸激酶,0.1-0.5 mg/mL;0.2-0.3 mg/mL;4种核糖核苷酸,各0.5-5 mM;各1.0-2.0 mM;DNA 模板,2-50 ng/uL;5-25 ng/uL;RNA聚合酶,0.01-0.3mg/mL;0.02-0.10 mg/mL;PEG,0.5-5%( w/v)1-3%( w/v)。

在另一优选例中,所述无细胞的蛋白合成体系的组成还包括:

亚精胺,0.2-0.4 mM0.3-0.4 mM;血红素,0.01-0.04 mM0.03-0.04 mM。

在另一优选例中,所述的PEG选自PEG3350、PEG3000、和/或PEG8000。

在另一优选例中,所述RNA聚合酶为T7 RNA聚合酶。

本发明第二方面提供了一种酵母细胞提取物,所述酵母细胞提取物中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%。

本发明第三方面提供了一种本发明第一方面所述的体外的无细胞的蛋白合成体系的生产方法,包括步骤:

将(a) 酵母细胞提取物与 (b) 聚乙二醇;(c) 任选的外源蔗糖;和(d) 任选的溶剂混合,从而获得本发明第一方面所述的体外的无细胞的蛋白合成体系,其中,所述溶剂为水或水性溶剂,所述酵母细胞提取物中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%。

在另一优选例中,所述蛋白合成体系中,组分(a)的浓度(v/v)为20%-70%,较佳地,30-60%,更佳地,40%-50%,以所述蛋白合成体系的总体积计。

在另一优选例中,所述蛋白合成体系中,组分(b)的浓度(w/v,例如g/mL)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%。

本发明第四方面提供了一种体外合成蛋白的方法,包括步骤:

(i) 提供本发明第一方面所述的体外的无细胞的蛋白合成体系,并加入外源的用于指导蛋白质合成的DNA分子,其中;所述蛋白合成体系中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%;

(ii) 在适合的条件下,孵育步骤(i)的蛋白合成体系一段时间T1,从而合成由所述外源DNA编码的蛋白质。

在另一优选例中,所述的方法还包括:(iii) 任选地从所述蛋白合成体系中,分离或检测所述的由外源DNA编码的蛋白质。

在另一优选例中,所述外源DNA来自原核生物、真核生物。

在另一优选例中,所述外源DNA来自动物、植物、病原体。

在另一优选例中,所述外源DNA来自哺乳动物,较佳地灵长动物,啮齿动物,包括人、小鼠、大鼠。

在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。

在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。

在另一优选例中,所述步骤(ii)中,反应温度为20-37 ℃,较佳地,20-25 ℃。

在另一优选例中,所述步骤(ii)中,反应时间为1-6 h,较佳地,2-4 h。

本发明第五方面提供了一种工程菌株,所述菌株为克鲁维酵母菌株,并且所述菌株中的EXN53基因(核酸酶基因)的表达或活性被降低。

在另一优选例中,所述“降低”指EXN53基因的表达量≤10%,较佳地,≤5%,更佳地,≤2%。

在另一优选例中,所述“降低”是指将EXN53基因的表达或活性降低满足以下条件:

A1/A0的比值≤30%,较佳地≤10%,更佳地≤5%,更佳地,≤2%,最佳地为0-2%;

其中,A1为EXN53基因的表达或活性;A0为野生型EXN53基因的表达或活性。

在另一优选例中,所述菌株中的EXN53基因(核酸酶基因)的表达或活性被降低通过选自下组的方式实现:基因突变、基因敲除、基因中断、RNA干扰技术、Crispr技术、或其组合。

本发明第六方面提供了一种本发明第五方面所述的工程菌株的用途,用于提高体外蛋白合成效率。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

图1显示了通过降低体外生物合成体系中的核酸酶来提高核酸的稳定性,并利用对K.>基因组中核酸酶基因进行分析和特异性改造的设计路线图。(A)>野生型细胞。(B)K.>核酸酶改造后的细胞。(C)收集改造核酸酶后的K.> 细胞lysate. (D) 利用改造特定基因后的酵母菌株制备成酵母细胞溶液,具有更稳定的核酸特性,制备出增强的体外生物合成体系。

图2显示了K.>基因组中全部61种核酸酶基因的分布和功能分析图。A-F为K.>六条染色体,位于A染色体的核酸酶有:KlSEN54KlDNA2KlTRM2KlFCF1KlDOM34KlRAD2KlRNH70KlDIS3KlNPP1;位于B染色体的核酸酶有:KlOGG1;位于C染色体的核酸酶有:KlPOL2KlRAD50KlYSH1KlRCL1KlNGL2KlMRE11KlPOP3KlMKT1KlAPN1KlRPP1KlPOP2;位于D染色体的核酸酶有:KlNUC1KlRPP6KlDBR1KlRPS3KlRPM2KlSUV3KlRAD1KlIRE1KlPOP1;位于E染色体的核酸酶有:KlPOL3KlDXO1KlMUS81KlPAN3KlAPN2KlRAI1KlEXO1KlREX4KlPAN2KlLCL3;位于F染色体的核酸酶有:KlRAD17KlPOP4KlPOP5KlRAD27KlRNH201KlVMA1KlRAT1KlNGL1KlREX2KlPOL31KlCCR4KlTRZ1KlSEN2KlREX3KlSWT1KLEXN53KlRNT1KlSEN15KlNTG1KlNOB1KlDDP1

图3显示了K.>基因组中5种核酸酶基因改造的序列和CRISPR系统设计图。供体donor DNA两个同源臂homologous arm 1和homologous arm 2分别为待敲除核酸酶基因的ORF上、下游1000bp左右的基因序列,构建两个向导gRNA,同时识别待敲除核酸酶基因ORF的5′和3′端的PAM序列,引导 Cas9核酸酶 对 DNA定点切割,出现DSB(double strandbreak)后发生同源重组,从而实现基因敲除。

图4显示了K.>基因组中5种核酸酶蛋白结构域示意图。

图5显示了KLEXN53蛋白与Saccharomyces>中同源蛋白ScEXN53(KEGGNo.: YGL173C),与Schizosaccharomyces>中同源蛋白SpEXO2(KEGG No.:SPAC17A5.14),与Homo>中同源蛋白HsEXN53(KEGG No.: 54464)部分氨基酸序列比对图,活性位点用#标记。

图6显示了KlDIS3蛋白与Saccharomyces>中同源蛋白ScDIS3(KEGGNo.: YOL021C),与Schizosaccharomyces>中同源蛋白SpDIS3(KEGG No.:SPBC26H8.10),与Homo>中同源蛋白HsDIS3(KEGG No.: 22894)部分氨基酸序列比对图,活性位点用#标记。

图7显示了KlRAT1蛋白与Saccharomyces>中同源蛋白ScRAT1(KEGG No.:YOR048C),与Schizosaccharomyces>中同源蛋白SpRAT1(KEGG No.: SPAC26A3.12c),与Homo>中同源蛋白HsRAT1(KEGG No.:22803)部分氨基酸序列比对图,活性位点用#标记。

图8显示了KlRRP6蛋白与Saccharomyces>中同源蛋白ScRRP6(KEGGNo.: YOR001W),与Schizosaccharomyces>中同源蛋白SpRRP6(KEGG No.:SPAC1F3.01),与Homo>中同源蛋白HsRRP6(KEGG No.: 5394)部分氨基酸序列比对图,活性位点用#标记。

图9显示了KlNGL2蛋白与Saccharomyces>中同源蛋白ScNGL3(KEGGNo.: YML118W),与Schizosaccharomyces>中同源蛋白SpNGL2(KEGG No.:SPBC9B6.11c ),与Homo>中同源蛋白HsANGEL2(KEGG No.: 90806)氨基酸序列比对图。

图10显示了pHoCas9_SE_Kana_tRNA_ScRNR2_KlEXN53-1&2质粒图谱。KLEXN53的gRNA1和gRNA2分别为KLEXN53基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,PMZ374-cas9是优化后的cas9,质粒带有kana筛选标记。

图11显示了KLEXN53-DD1-pMD18质粒图谱。homologous arm 1和homologous arm2分别为KLEXN53基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。

图12显示了pHoCas9_SE_Kana_tRNA_ScRNR2_KlDIS3-1&2质粒图谱。KlDis3的gRNA1和gRNA2分别为KlDis3基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,PMZ374-cas9是优化后的cas9,质粒带有kana筛选标记。

图13显示了KlDIS3-DD1-pMD18质粒图谱。homologous arm 1和homologous arm 2分别为KlDis3基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。

图14显示了pHoCas9_SE_Kana_tRNA_ScRNR2_KlRat1-1&2质粒图谱。KlRat1的gRNA1和gRNA2分别为KlRat1基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,PMZ374-cas9是优化后的cas9,质粒带有kana筛选标记。

图15显示了KlRat1-DD1-pMD18质粒图谱。homologous arm 1和homologous arm 2分别为KlRat1基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。

图16显示了pHoCas9_SE_Kana_tRNA_ScRNR2_KlRrp6-1&2质粒图谱。KlRrp6的gRNA1和gRNA2分别为KlRrp6基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,PMZ374-cas9是优化后的cas9,质粒带有kana筛选标记。

图17显示了KlRrp6-DD1-pMD18质粒图谱。homologous arm 1和homologous arm 2分别为KlRrp6基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。

图18显示了pHoCas9_SE_kana_tRNA_ScRNR2_KlNGL2-1&2质粒图谱。KlNGL3的gRNA1和gRNA2分别为KlNGL3基因ORF的5′和3′端两个gRNA,带有tRNA-Tyr启动子和SNR52终止子,PMZ374-cas9是优化后的cas9,质粒带有kana筛选标记。

图19显示了Kl NGL2-DD1-pMD18质粒图谱。homologous arm 1和homologous arm2分别为KlNGL3基因的ORF上、下游1000bp左右的基因序列,质粒带有Amp筛选标记。

图20显示了改造菌株体外翻译活性测定数据图。利用萤火虫荧光蛋白(Fluc)的荧光强度指示体外生物合成系统的重组蛋白的合成能力。其中wt代表野生型克鲁维酵母,ΔKLEXN53EXN53代表KLEXN53EXN53基因敲除的克鲁维酵母菌株。

具体实施方式

经过广泛而深入的研究,通过大量筛选和摸索,从很多种核酸酶中筛出5种核酸酶,其中对其中一种核酸酶(如EXN53)进行下调或敲除处理,意外的发现居然可以提高核酸的稳定性,并显著提高体外蛋白质合成体系产生蛋白质的效率。具体地,下调或敲除EXN53后,Δklexn53酵母菌株在IVTT中荧光素酶活性是野生型的≥2倍。在此基础上,本发明人完成了本发明。

酵母体外蛋白质合成体系

酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。其中酿酒酵母(Saccharomyces>)和毕氏酵母(Pichia>)是表达复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。

克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces>)和乳酸克鲁维酵母(Kluyveromyces>) 是工业上广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的能力等。

在本发明中,酵母体外蛋白质合成体系不受特别限制,一种优选的酵母体外蛋白质合成体系为克鲁维酵母表达系统(更佳地,乳酸克鲁维酵母表达系统)。

在本发明中,所述酵母体外蛋白质合成体系包括:

(a) 酵母细胞提取物;

(b) 聚乙二醇;

(c) 任选的外源蔗糖;和

(d) 任选的溶剂,所述溶剂为水或水性溶剂,其中,所述酵母细胞提取物中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%。

在一优选实施方式中,所述EXN53来源于选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母,较佳地,来源于克鲁维酵母(如马克斯克鲁维酵母、乳酸克鲁维酵母)。

在一优选实施方式中,所述EXN53的蛋白序列如SEQ ID NO.:6所示,所述EXN53的核苷酸序列如SEQ ID NO.:1所示。

在一特别优选的实施方式中,本发明提供的体外蛋白合成体系包括:酵母细胞提取物,4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,腺嘌呤核苷三磷酸(ATP),鸟嘌呤核苷三磷酸(GTP),胞嘧啶核苷三磷酸(CTP),胸腺嘧啶核苷三磷酸(TTP),氨基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光素,萤光素酶DNA,RNA聚合酶。

在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典型的RNA聚合酶为T7 RNA聚合酶。

在本发明中,所述酵母细胞提取物在体外蛋白合成体系中的比例不受特别限制,通常所述酵母细胞提取物在体外蛋白质合成蛋白合成体系中所占体系为20-70%,较佳地,30-60%,更佳地,40-50%。

在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取物包括用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的起始因子和延伸因子以及终止释放因子。此外,酵母提取物中还含有一些源自酵母细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。

在本发明中,所述的酵母细胞提取物所含蛋白含量为20-100 mg/mL, 较佳为50-100 mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。

在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备方法包括以下步骤:

(i)提供酵母细胞;

(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;

(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;

(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。

在本发明中,所述的固液分离方式不受特别限制,一种优选的方式为离心。

在一优选实施方式中,所述离心在液态下进行。

在本发明中,所述离心条件不受特别限制,一种优选的离心条件为5000-100000×g,较佳地,8000-30000×g。

在本发明中,所述离心时间不受特别限制,一种优选的离心时间为0.5 min-2 h,较佳地,20 min-50 min。

在本发明中,所述离心的温度不受特别限制,优选的,所述离心在1-10 ℃下进行,较佳地,在2-6 ℃下进行。

在本发明中,所述的洗涤处理方式不受特别限制,一种优选的洗涤处理方式为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制,典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组合。

在本发明中,所述破细胞处理的方式不受特别限制,一种优选的所述的破细胞处理包括高压破碎、冻融(如液氮低温)破碎。

所述体外蛋白质合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5 mM,较佳地为1.0-2.0 mM。

所述体外蛋白质合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于) 20种天然氨基酸:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5 mM,较佳地0.02-0.2 mM,如0.05、0.06、0.07、0.08 mM。

在优选例中,所述体外蛋白质合成体系还含有聚乙二醇或其类似物。聚乙二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度 (w/v)为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述蛋白合成体系的总重量计。代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、1500、2000、4000、6000、8000、10000等)。

在优选例中,所述体外蛋白质合成体系还含有蔗糖。蔗糖的浓度没有特别限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%,以所述蛋白合成体系的总重量计。

一种特别优选的体外蛋白质合成体系,除了酵母提取物之外,还含有以下组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150 mM醋酸钾,1.0-5.0 mM醋酸镁,1.5-4 mM核苷三磷酸混合物,0.08-0.24 mM的氨基酸混合物,25 mM磷酸肌酸,1.7 mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶, 1%-4%聚乙二醇,0.5%-2%蔗糖,8-20ng/µl萤火虫荧光素酶的DNA,0.027-0.054 mg/mL T7 RNA聚合酶。

外源蛋白的编码序列(外源DNA)

如本文所用,术语“外源蛋白的编码序列”与“外源DNA”可互换使用,均指外源的用于指导蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状的。所述的DNA分子含有编码外源蛋白的序列。如非另行说明,本发明所有的%均为基于质量的百分比浓度(wt%)。

在本发明中,所述的编码外源蛋白的序列的例子包括(但并不限于):基因组序列、cDNA序列。所述的编码外源蛋白的序列还含有启动子序列、5’非翻译序列、3’非翻译序列。

在本发明中,所述外源DNA的选择没有特别限制,通常,外源DNA选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。

外源DNA还可以选自下组:编码α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素α A、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶的外源DNA、或其组合。

在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP, eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶(β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶 (Lysine-tRNA synthetase)、人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶 (Glyceraldehyde-3-phosphate dehydrogenase)、鼠过氧化氢酶 (Catalase)、或其组合。

体外高通量蛋白合成方法(提高蛋白质体外翻译效率方法)

本发明提供了一种体外高通量蛋白合成方法,包括步骤:

(i) 提供本发明第一方面所述的体外的无细胞的蛋白合成体系,并加入外源的用于指导蛋白质合成的DNA分子,其中;所述蛋白合成体系中的EXN53蛋白的含量≤10%,较佳地,≤5%,更佳地,≤2%;

(ii) 在适合的条件下,孵育步骤(i)的蛋白合成体系一段时间T1,从而合成由所述外源DNA编码的蛋白质。

在一优选实施方式中,本发明提供了一种对酵母基因组中核酸酶基因进行敲除从而提高蛋白质体外翻译效率的设计和方法,包括下述步骤:

(1) 增强体外生物合成活性的设计、分析方法如下:

A、体外生物合成系统中各组分对活性的影响分析;

B、K.>基因组中核酸酶基因的功能和分布分析;

C、K.>基因组中选定核酸酶基因的改造设计;

(2) 靶向敲除基因克隆载体的构建,构建方法如下:

A、针对特定基因的序列,设计引导核酸内切酶切割的sgRNA序列;

B、将上述sgRNA序列重组至含有核酸内切酶的载体中,得到sgRNA和核酸内切酶共表达的第一载体;

(3) 构建敲除特定基因的供体DNA,构建方法如下:

A、从基因数据库中下载特定基因核苷酸序列,利用基因上下游序列各1000bp构建第二载体;

B、用引物M13F和M13R对第二载体进行扩增,获得的PCR产物进行乙醇沉淀浓缩,最终获得供体DNA;

(4) 将第一载体和供体DNA同时转化到酵母感受态细胞中;

筛选出单克隆细胞进行扩大培养,抽提酵母基因组,设计引物对敲除位点进行扩增,扩增的PCR产物经测序验证后即可获得敲除特定基因的菌株;

(5) 无细胞体外蛋白质合成体系

利用敲除特定基因后的酵母菌株制备成酵母细胞溶液,加入到蛋白体外翻译体系中,20-30 oC的环境中,静置反应2-6>

本发明的主要优点包括:

(1) 本发明首次设计了通过降低体系中的核酸酶来提高核酸的稳定性,并对K.>lactis基因组中核酸酶基因进行系统分析和特异性改造,从而提供了一种通用的用于调控体外生物合成活性的技术路线和方法。

(2) 本发明对大量的核酸酶筛选,首次从很多种核酸酶中筛出5种核酸酶,其中对其中一种核酸酶(如EXN53)进行下调或敲除处理,意外的发现居然可以提高核酸的稳定性,并显著提高体外蛋白质合成体系产生蛋白质的效率。具体地,下调或敲除EXN53后,Δklexn53酵母菌株在IVTT中荧光素酶活性是野生型的≥2倍(如2.46倍)。

(3) 本发明首次发现一种能显著提高体外蛋白质合成活性的K.>菌株。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人, 分子克隆:实验室手册(New York: Cold Spring Harbor LaboratoryPress, 1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。

如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。

实施例1 通过降低体外生物体系中的核酸酶来提高核酸的稳定性,并对K.>基因组中核酸酶基因进行分析和特异性改造

1. 通过K.>基因组改造以调控体外生物合成活性的的设计原理

1.1体外生物合成体系分析

1.1.1不同体外生物合成体系中的组成分析

体外生物合成系统通过对不同种类的细胞(包括微生物、动物和植物)进行破碎,提取细胞裂解物,从而用于外源蛋白的翻译。体外生物合成系统为了实现转录、翻译、蛋白折叠和能量代谢等功能,细胞裂解物中必须包含能量再生和蛋白质合成方面的元件,包括核糖体、氨酰-tRNA合成酶、翻译起始和延伸因子、核糖体释放因子、核苷酸循环酶、代谢酶、分子伴侣和折叠酶等。需要外源加入的物质包括氨基酸、核苷酸、DNA模板、能量底物、辅助因子和盐分子等。系统中不同组分的稳定性对反应延续时间及最终蛋白产量有重要影响,某些底物的消耗殆尽(例如ATP和半胱氨酸等)是反应终止的重要原因。

1.1.2体外生物合成体系中的组分对合成产物的影响分析模型;

在体外翻译系统中,能量代谢底物(磷酸肌酸等)、参与mRNA合成的底物(NTP等)、参与蛋白质合成的底物(氨基酸等)以及磷酸盐浓度和pH值等组分,随着反应的进行,量值会产生变化,最终导致反应终止。通过不同技术手段,补充相应组分(NTP和氨基酸等)或稳定相应条件(pH值和磷酸盐浓度等),均能有效延长体外翻译系统的反应时间,从而提高蛋白产量。

1.1.3体外蛋白质合成体系中的核酸和核酸酶对蛋白质合成的影响分析;

作为蛋白质翻译的重要底物,DNA模板及其转录生成的mRNA的稳定性,对体外翻译系统反应持续时间及产量有重要影响。细胞经过破碎,收取细胞裂解液并用于构建体外翻译体系,其中除了含有蛋白质合成所必需的各种组分外,也包含核酸酶、蛋白酶等不利于反应进行的组分。在由经过纯化的各种组分组成的系统当中,由于不含有抑制因子,蛋白质翻译的效率显著提升。

同时,通过不同的技术手段(包括核酸酶基因敲除和加入稳定因子等)能有效提高体外翻译系统中核酸的稳定性,进而提高蛋白质的翻译效率。通过降低体外生物合成体系中的核酸酶来提高核酸的稳定性,并利用对K.>基因组中核酸酶基因进行分析和特异性改造的设计路线图(如图1所示)。

1.2 K.>基因组中核酸酶基因分析

1.2.1K.>基因组中核酸酶基因的分类和分布;

核酸酶(也称为核聚合酶或多核苷酸酶)是核酸分解的第一步中能够水解核苷酸之间的磷酸二酯键的酶。根据核酸酶作用的位置不同,可将核酸酶分为核酸外切酶(exonuclease)和核酸内切酶(endonuclease)。 核酸外切酶从3′端开始逐个水解核苷酸,称为3′ to 5′外切酶,核酸外切酶从5′端开始逐个水解核苷酸,称为5′ to 3′外切酶,核酸内切酶催化水解多核苷酸内部的磷酸二酯键。核酸酶又分为脱氧核糖核酸酶(DNase)和核糖核酸酶(RNase), 前者对DNA起作用,后者对RNA起作用。 根据核酸酶的作用方向又将核酸外切酶分为5′ to 3′核酸外切酶和3′ to 5′核酸外切酶。

通过数据库基因功能比对分析,K.>中共含有61个核酸酶,分布在K.>lactisA-F六条染色体上(图2),其中位于A染色体的核酸酶有:KlSEN54KlDNA2KlTRM2KlFCF1KlDOM34KlRAD2KlRNH70KlDIS3KlNPP1KlSEN54在KEGG数据库中的编码为:KlLA0A00803g,KlDNA2在KEGG数据库中的编码为:KlLA0A05324g,KlTRM2在KEGG数据库中的编码为:KlLA0A05665g,KlFCF1在KEGG数据库中的编码为:KlLA0A07018g,KlDOM34在KEGG数据库中的编码为:KlLA0A08646g,KlRAD2在KEGG数据库中的编码为:KlLA0A09427g,KlRNH70在KEGG数据库中的编码为:KlLA0A10065g,KlDIS3在KEGG数据库中的编码为:KlLA0A10835g,KlNPP1在KEGG数据库中的编码为:KlLA0A11374g。

位于B染色体的核酸酶有:KlOGG1KlOGG1在KEGG数据库中的编码为:KlLA0B05159g。

位于C染色体的核酸酶有:KlPOL2KlRAD50KlYSH1KlRCL1KlNGL2KlMRE11KlPOP3KlMKT1KlAPN1KlRPP1KlPOP2KlPOL2在KEGG数据库中的编码为:KlLA0C02585g,KlRAD50在KEGG数据库中的编码为:KlLA0C02915g,KlYSH1在KEGG数据库中的编码为:KlLA0C04598g,KlRCL1在KEGG数据库中的编码为:KlLA0C05984g,KlNGL2在KEGG数据库中的编码为:KlLA0C06248g,KlMRE11在KEGG数据库中的编码为:KlLA0C06930g,KlPOP3在KEGG数据库中的编码为:KlLA0C12199g,KlMKT1在KEGG数据库中的编码为:KlLA0C13926g,KlAPN1在KEGG数据库中的编码为:KlLA0C14256g,KlRPP1在KEGG数据库中的编码为:KlLA0C14718g,>在KEGG数据库中的编码为:KlLA0C18821g。

位于D染色体的核酸酶有:KlNUC1KlRPP6KlDBR1KlRPS3KlRPM2KlSUV3KlRAD1KlIRE1KlPOP1KlNUC1在KEGG数据库中的编码为:KlLA0D00440g,KlRPP6在KEGG数据库中的编码为:KlLA0D01309g,KlDBR1在KEGG数据库中的编码为:KlLA0D04466g,KlRPS3在KEGG数据库中的编码为:KlLA0D08305g,KlRPM2在KEGG数据库中的编码为:KlLA0D10483g,KlSUV3在KEGG数据库中的编码为:KlLA0D12034g,KlRAD1在KEGG数据库中的编码为:KlLA0D12210g,KlIRE1在KEGG数据库中的编码为:KlLA0D12210g,KlPOP1在KEGG数据库中的编码为:KlLA0D19448g。

位于E染色体的核酸酶有:KlPOL3KlDXO1KlMUS81KlPAN3KlAPN2KlRAI1KlEXO1KlREX4KlPAN2KlLCL3KlPOL3在KEGG数据库中的编码为:KlLA0E01607g,KlDXO1在KEGG数据库中的编码为:KlLA0E02245g,KlMUS81在KEGG数据库中的编码为:KlLA0E03015g,KlPAN3在KEGG数据库中的编码为:KlLA0E08097g,KlAPN2在KEGG数据库中的编码为:KlLA0E18877g,KlRAI1在KEGG数据库中的编码为:KlLA0E12893g,KlEXO1在KEGG数据库中的编码为:KlLA0E16743g,KlREX4在KEGG数据库中的编码为:KlLA0E17865g,KlPAN2在KEGG数据库中的编码为:KlLA0E18877g,KlLCL3在KEGG数据库中的编码为:KlLA0E19163g。

位于F染色体的核酸酶有:KlRAD17KlPOP4KlPOP5KlRAD27KlRNH201KlVMA1KlRAT1KlNGL1KlREX2KlTRL1KlPOL31KlCCR4KlTRZ1KlSEN2KlREX3KlSWT1KLEXN53KlRNT1KlSEN15KlNTG1KlNOB1KlDDP1KlRAD17在KEGG数据库中的编码为:KlLA0F00330g,KlPOP4在KEGG数据库中的编码为:KlLA0F02211g,KlPOP5在KEGG数据库中的编码为:KlLA0F02453g,KlRAD27在KEGG数据库中的编码为:KlLA0F02992g,KlRNH201在KEGG数据库中的编码为:KlLA0F04774g,KlVMA1在KEGG数据库中的编码为:KlLA0F05401g,KlRAT1在KEGG数据库中的编码为:KlLA0F07469g,KlNGL1在KEGG数据库中的编码为:KlLA0F07733g,KlREX2在KEGG数据库中的编码为:KlLA0F08998g,>在KEGG数据库中的编码为:KlLA0F14949g,>在KEGG数据库中的编码为:KlLA0F15884g,KlTRZ1在KEGG数据库中的编码为:KlLA0F16665g,KlSEN2在KEGG数据库中的编码为:KlLA0F19866g,KlREX3在KEGG数据库中的编码为:KlLA0F19910g,KlSWT1在KEGG数据库中的编码为:KlLA0F20361g,KLEXN53在KEGG数据库中的编码为:KlLA0F22385g,KlRNT1在KEGG数据库中的编码为:KlLA0F24816g,KlSEN15在KEGG数据库中的编码为:KlLA0F26334g,KlNTG1在KEGG数据库中的编码为:KlLA0F07711g,KlNOB1在KEGG数据库中的编码为:KlLA0F16280g,KlDDP1在KEGG数据库中的编码为:KlLA0F20273g.

按照功能分类,可将K.>核酸酶分为两类,其中DNA酶共有18个,RNA酶共有41个,无功能分类的2个见表1。其中在DNA酶中具有3′ to 5′功能的是KlAPN1,5′ to 3′功能的是KlRAD27,KlEXO1;在RNA酶中具有3′ to 5′功能的是KlRNH70,KlDIS3,KlNGL2,KlRPP6,5′to 3′功能的是KlDXO1,KlRAT1,KLEXN53。

表1

1.2.2K.>基因组中与体外蛋白质合成相关的核酸酶基因的选取分析;

核酸 RNA 和 DNA蛋白质体外合成系统中的编码底物,它们的稳定性影响着蛋白质的得率。在真核生物翻译过程中,RNA的5′ 端会瞬时完成帽子结构的加工,而RNA的5′ 帽子结构对于RNA的稳定性和翻译的效率起着举足轻重的作用。

在真核生物中,存在依赖去腺苷化和非依赖腺苷化的RNA降解机制,在依赖去腺苷化RNA降解机制中可以通过招募去帽复合物去除RNA的5′ 端成熟帽子结构或者非成熟的帽子结构,RNA同时也在核酸酶的作用下发生5′ to 3′的降解。在非依赖腺苷化的mRNA降解机制中,在内切核酸酶的作用下,核酸分子从中间产生断链,核酸外切酶从3′ to 5′降解RNA。

K.>的体外蛋白质合成体系中,采用外源线性或环状DNA作为模板,转录出带有polyA 3′ 端尾巴的mRNA, 取决于启动子(promotor)和 RNA转录酶的不同,可能带有或不带有5′ 端成熟帽子结构。因此,DNase酶、RNase酶、核酸外切酶、核酸内切酶 均会对体外蛋白质合成体系中模板的稳定性产生影响,改造这些酶对于提高体外生物合成活性均有可能有提升作用。

这其中,由于mRNA的特殊不稳定性和体内RNase酶的高活性,mRNA的寿命是制约体外蛋白质合成的主要瓶颈。 因此,通过改造以减少体内RNase酶是首选的改造方案。当然,本专利仍然适用于其他核酸酶的设计改造以提高体外蛋白质合成活性。

1.2.3K.>基因组中核酸酶基因EXN53,Rat1,Rrp6,Dis3,NGL2的特异性改造设计;

K.>内5′ to 3′核酸外切酶包括EXN53和Rat1,其中EXN53定位在细胞质内,Rat1定位在细胞核内。在依赖去腺苷化RNA降解机制中也可以经过脱腺苷化后通过定位于细胞质和细胞核的,具有3′ to 5′核酸外切酶和核酸内切酶活性的蛋白亚基复合体exosome的作用而降解。K.>内3′ to 5′核酸外切酶包括Rrp6,Dis3(又称Rrp44)和NGL2等,其中Rrp6和Dis3都是核酸外切酶和核酸内切酶活性的蛋白亚基复合体exosome的组成部分。Rrp6是一种3′ to 5′核酸外切酶,是RNase D家族的成员,定位于细胞核内,是细胞核内exosome关键的催化亚基,负责细胞内各种RNA的加工,降解和质量控制。 Dis3(又称Rrp44)是exosome关键的催化亚基,是高度保守的RNaseII/RNB家族成员,定位于细胞核和细胞质内,具有3′ to 5′核酸外切酶和核酸内切酶活性,负责细胞核和细胞质内的RNA代谢和各类RNA的加工,NGL2是一种特异性识别Poly A的酶,这种酶从3′到5′的方向水解RNA。

基于以上分析,本发明选取EXN53Rat1Rrp6Dis3NGL2共5个基因进行改造,方法包括但不限于基因敲除或者基因突变。通过降低体外生物合成体系中的核酸酶来提高核酸的稳定性,并利用对K.>基因组中核酸酶基因进行分析和特异性的改造设计,并调控体外蛋白质合成活性的设计和技术细节。

1.3>K.>基因组中靶向基因改造的方法分析

1.3.1K.>基因组改造的方法和选取分析;

本发明通过CRISPR-Cas9基因编辑技术对K.>基因组进行改造。CRISPR是现在应用广泛的基因编辑技术,具有结构简单,操作方便,编辑效率高,不需要引入抗生素,可实现对靶基因多个位点同时敲除等优点,在酵母中已经形成了比较成熟的转化体系。

针对K.>基因组的CRISPR/Cas9的技术设计;

本发明使用的CRISPR体系,是针对K.>菌株经过优化的体系,对Cas9蛋白编码序列、gRNA启动子、供体DNA同源臂长度及酵母感受态制备和转化等参数和条件进行了优化,实现了在K.>酵母菌株中的高效编辑。

针对K.>基因组的K.>核酸酶基因EXN53,>Rat1Rrp6Dis3NGL3敲除的CRISPR/Cas9设计;

在本专利中,供体DNA两个同源臂分别为待敲除核酸酶基因的ORF上下游1000bp左右的基因序列,构建两个gRNA,同时识别待敲除核酸酶基因ORF的5′和3′端的PAM序列,引导Cas9核酸酶 对 DNA定点切割,出现DSB(double strand break)后发生同源重组,从而实现核酸酶基因敲除。例如EXN53,>Rat1Rrp6Dis3,>这5个基因的敲除是利用在起始密码子和终止密码子附近各设计一个gRNA进行敲除。K.>基因组中5种核酸酶基因改造的CRISPR系统设计如图3所示。

实施例2 通过CRISPR/Cas9靶向敲除EXN53基因

2.1>KLEXN53序列检索及CRISPR>

2.1.1靶向敲除基因克隆载体质粒的构建:

在KEGG数据库中以EXN53基因进行BLAST比对分析,确定乳酸克鲁维酵母中EXN53基因序列(SEQ>S. cerevisiae>酵母中EXN53基因序列同源性>S. pombe>酵母中EXN53基因序列同源性47.38%蛋白序列同源性38.29%,与H.sapiens酵母中EXN53基因序列同源性>KLEXN53(位于染色体F的2091235...2095596位)。

KLEXN53基因起始密码子和终止密码子搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly>KLEXN53>KLEXN53>

质粒构建及转化方法如下:使用引物pCas9-KLEXN53-F1:AGAGTTCGACAATTTGTACTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC

(SEQ ID NO.:7)和pCas9-KLEXN53-R1:GCTCTAAAACAGTACAAATTGTCGAACTCTAAAGTCCCATTCGCCACCCG(SEQ ID NO.:8), pCas9- KLEXN53-F2:CGTCGTGGCCGTAGTAATCGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC(SEQ ID NO.:9)和pCas9- KLEXN53-R2:GCTCTAAAACCGATTACTACGGCCACGACGAAAGTCCCATTCGCCACCCG(SEQ ID NO.:10),均以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µL Dpn I,2 µL 10 ×digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-1和pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-2。以pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ>oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KLEXN53-1&2(如图10所示)。

供体 DNA质粒构建及扩增

为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。

以乳酸克鲁维酵母基因组DNA为模板,以引物KLEXN53-F1:GTACCCGGGGATCCTCTAGAGATCCAGTTGCAGAGCCTCCGAA(SEQ ID NO.:15)和KLEXN53-R1:CATGCCTGCAGGTCGACGATGCGAAACCTTAGCTCTTTATCGAAC(SEQ ID NO.:16)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:17)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ ID NO.:18)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KLEXN53->

以KLEXN53- pMD18质粒为模板,以引物KLEXN53-F2:ATGTTGGTTTGAATGGACTATTAACAGTAAATATTATATCACTTC(SEQ ID NO.:19)

和KLEXN53-R2:GAAGTGATATAATATTTACTGTTAATAGTCCATTCAAACCAACATTTATTTTAGTTAAGCCACAAACCGTAATTAATTGAACAC(SEQ ID NO.:20)进行PCR扩增;构建KLEXN53-DD-pMD18(如图11所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 ×digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。

乳酸克鲁维酵母转化及阳性鉴定

2.3.1将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8h。20 oC条件下3000>oC保存。

1.3.2将感受态细胞置于37 oC融化15-30>

1.3.3在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200µg / mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KLEXN53-CICF1:TTTGCTGGTTGCCCGTATTCCC(SEQ ID NO.:21),KLEXN53-CICR1:TAATAGCACAGGGAATGCACCTT(SEQ ID NO.:22),对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株。

实施例3 通过CRISPR/Cas9靶向敲除DIS3基因

3.1>序列检索及CRISPR>

3.1.1靶向敲除基因克隆载体质粒的构建:

在KEGG数据库中以DIS3基因进行BLAST比对分析,确定乳酸克鲁维酵母中DIS3基因序列(SEQ>S. cerevisiae>酵母中DIS3基因序列同源性>S. pombe>酵母中DIS3基因序列同源性56.86%,蛋白序列同源性51.82%,与H.sapiens酵母中DIS3基因序列同源性>KlDIS3(位于染色体A的938712..941738位置)。

KlDIS3基因起始密码子和终止密码子附近搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly>KlDIS3>KlDIS3>

质粒构建及转化方法如下:使用引物pCas9-KlDIS3-F1:ATGGGACTTTTTCAGCAGCTAAGAAGGAAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQID NO.:25)和pCas9-KlDIS3-R1:AGCTCTAAAACCTTCCTTCTTAGCTGCTGAAAAAGTCCCATTCGCCACCCG(SEQ ID NO.:26), pCas9-KlDIS3-F2:ATGGGACTTTAGAGGTCAGTGTCTTTGATAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQ ID NO.:27)和pCas9-KlDIS3-R2:AGCTCTAAAACTATCAAAGACACTGACCTCTAAAGTCCCATTCGCCACCCG(SEQ ID NO.:28),均以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µL Dpn I,2 µL10 ×digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlDIS3-1和pHoCas9_SE_Kana_tRNA_ScRNR2_KlDIS3-2。以pHoCas9_SE_Kana_tRNA_ScRNR2_KlDIS3-1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ>oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlDIS-1&2(如图12所示)。

供体 DNA质粒构建及扩增

为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。

以乳酸克鲁维酵母基因组DNA为模板,以引物KlDIS3-F1:CCCGGGGATCCTCTAGAGATGCTGCTAGGTGACAGAAGGTTGTCC(SEQ ID NO.:33)和KlDIS3-R1:CATGCCTGCAGGTCGACGATCCAAAGAAGAACGTCGTAAGACCGC(SEQ ID NO.:34)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:35)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ IDNO.:36)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL10 ×digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KlDIS3->

以KlDIS3- pMD18质粒为模板,以引物KlDIS3-F2:CTCTTCTGTTTAGCACCCGGTTATAGCTTAATTTATTAATTATGTACATTATATAAAAACTATTGTC(SEQ ID NO.:37)和KlDIS3-R2:AAGCTATAACCGGGTGCTAAACAGAAGAGTATGACGTTTTATACTTCTCCAG(SEQ ID NO.:38)进行PCR扩增;构建KlDIS3-DD-pMD18(如图13所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I, 2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。

乳酸克鲁维酵母转化及阳性鉴定

3.3.1将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8h。20 oC条件下3000>oC保存。

3.3.2将感受态细胞置于37 oC融化15-30>

3.3.3在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200µg / mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KlDIS3-CICF1:CACCAACAACAGGAAATCTCATG(SEQ ID NO.:39),KlDIS3-CICR1:CAGTACAGAAGCTCAGCAAC AACC(SEQ ID NO.:40),对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株。

实施例4 通过CRISPR/Cas9靶向敲除Rat1基因

4.1>序列检索及CRISPR>

4.1.1靶向敲除基因克隆载体质粒的构建:

在KEGG数据库中以Rat1基因进行BLAST比对分析,确定乳酸克鲁维酵母中Rat1基因序列(SEQ>S. cerevisiae>酵母中Rat1基因序列同源性>S. pombe>酵母中Rat1基因序列同源性50.53%,蛋白序列同源性39.73%,与H.sapiens酵母中Rat1基因序列同源性>KlRat1(位于染色体F:703955..706933位置)。

在Rat1基因起始密码子和终止密码子附近搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly>KlRat1>KlRat1>

质粒构建及转化方法如下:使用引物pCas9-KlRat1-F1:ATGGGACTTTGTAAGGCCAGGTACTCACAAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQ ID NO.:43)和pCas9-KlRat1-R1:AGCTCTAAAACTTGTGAGTACCTGGCCTTACAAAGTCCCATTCGCCACCCG(SEQ ID NO.:44),pCas9-KlRat1-F2:ATGGGACTTTCTCGCAACAGAGACAGCCACGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQ ID NO.:45)和pCas9-KlRat1-R2:AGCTCTAAAACGTGGCTGTCTCTGTTGCGAGAAAGTCCCATTCGCCACCCG(SEQ ID NO.:46),均以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µL Dpn I,2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlRat1-1和pHoCas9_SE_Kana_tRNA_ScRNR2_KlRat1-2。以pHoCas9_SE_Kana_tRNA_ScRNR2_KlRat1-1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ>oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlRat1-1&2(如图14所示)。

供体 DNA质粒构建及扩增

为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。

以乳酸克鲁维酵母基因组DNA为模板,以引物KlRat1-F1:CCCGGGGATCCTCTAGAGATGCTGCATGGTCACAGGAGATGC(SEQ ID NO.:51)和KlRat1-R1:CATGCCTGCAGGTCGACGATGGTACGTGAGGCGACAATATGGTCC(SEQ ID NO.:52)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:53)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ ID NO.:54)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL10 × digestionbuffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KlRat1->

以KlRat1-pMD18质粒为模板,以引物KlRat1-F2:CCAGGTACTCACATGAACTGTGGACAATTTTATACCCGTTTATATCAGCAC(SEQ ID NO.:55)和KlRat1-R2:TGTCCACAGTTCATGTGAGTACCTGGCCTTACTTCTCGC(SEQ ID NO.:56)进行PCR扩增;构建KlRat1-DD-pMD18(如图15所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。

乳酸克鲁维酵母转化及阳性鉴定

4.3.1将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8h。20 oC条件下3000>oC保存。

4.3.2将感受态细胞置于37 oC融化15-30>

4.3.3在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200µg / mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KlRat1-CICF1:TAAGACAGGTACCCTCACGACG(SEQ ID NO.:57),KlRat1-CICR1:CTTGGAAGTGGATACATTTCTAGAGG(SEQ ID NO.:58),对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株。

实施例5 通过CRISPR/Cas9靶向敲除Rrp6基因

5.1靶向敲除基因克隆载体质粒的构建:

5.1.1KlRrp6序列检索及CRISPR>

在KEGG数据库中以Rrp6基因进行BLAST比对分析,确定乳酸克鲁维酵母中Rrp6基因序列(SEQ>S.>cerevisiae>酵母中Rrp6基因序列同源性>S. pombe>酵母中Rrp6基因序列同源性>H.sapiens酵母中Rrp6基因序列同源性>KlRrp6(位于染色体D的114713..116947位置)。

在Rrp6基因起始密码子和终止密码子附近搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly>KlRrp6>gRNA-1序列为CACCATGTCTTCAGAGGATA,KlRrp6g>

质粒构建及转化方法如下:使用引物pCas9-KlRrp6-F1:ATGGGACTTTCACCATGTCTTCAGAGGATAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQ ID NO.:59)和pCas9-KlRrp6-R1:AGCTCTAAAACTATCCTCTGAAGACATGGTGAAAGTCCCATTCGCCACCCG(SEQ ID NO.:60),pCas9-KlRrp6-F2:ATGGGACTTTCCGACATGTTCAACAGAGTAGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCC(SEQ ID NO.:61)和pCas9-Kl Rrp6-R2:AGCTCTAAAACTACTCTGTTGAACATGTCGGAAAGTCCCATTCGCCACCCG(SEQ ID NO.:62),均以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µL Dpn I,2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlRrp6-1和pHoCas9_SE_Kana_tRNA_ScRNR2_KlRrp6-2。以pHoCas9_SE_Kana_tRNA_ScRNR2_KlRrp6-1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ>oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlRrp6-1&2(如图16所示)。

供体 DNA质粒构建及扩增

为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。

以乳酸克鲁维酵母基因组DNA为模板,以引物KlRrp6-F1:CCCGGGGATCCTCTAGAGATGCGATAGCTTTAATCTGAGTGAACACCG(SEQ ID NO.:67)和KlRrp6-R1:CATGCCTGCAGGTCGACGATGGGTACTCGTTGATAACATGATGCGTAG(SEQ ID NO.:68)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ ID NO.:69)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ ID NO.:70)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KlRrp6->

以KlRrp6-pMD18质粒为模板,以引物KlRrp6-F2:CTGACTCTAATCCACCAGCATCTTGAGCAGCTCTAATGGTATAAATATCG(SEQ ID NO.:71)和KlRrp6-R2:GCTCAAGATGCTGGTGGATTAGAGTCAGCTGGTAGTCTAC(SEQ ID NO.:72)进行PCR扩增;构建KlRrp6-DD-pMD18(如图17所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。

乳酸克鲁维酵母转化及阳性鉴定

5.3.1将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8h。20 oC条件下3000>oC保存。

5.3.2将感受态细胞置于37 oC融化15-30>

5.3.3在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200µg / mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KlRrp6-CICF1:TGGAGGCGTACAATGCAGTG(SEQ ID NO.:73),KlRrp6-CICR1:TGAACCCTCTTCCATGTCTC ATC(SEQ ID NO.:74),对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株。

实施例6 通过CRISPR/Cas9靶向敲除NGL2基因

6.1>序列检索及CRISPR>

6.1.1靶向敲除基因克隆载体质粒的构建:

在KEGG数据库中以NGL3基因进行BLAST比对分析,确定乳酸克鲁维酵母中NGL基因序列(SEQ>S. cerevisiae>酵母中NGL3基因序列同源性>S. pombe>酵母中NGL2基因序列同源性45.42%,蛋白序列同源性29.07%,与H.sapiens酵母中NGL3基因序列同源性>KlNGL2(位于染色体C的552493…554043位置)。

KlNGL2基因起始密码子和终止密码子附近搜索PAM序列(NGG),并确定gRNA序列。gRNA选择的原则为:GC含量适中,本发明的标准为GC含量为40%-60%;避免poly>KlNGL2>KlNGL2>

质粒构建及转化方法如下:使用引物pCas9-KlNGL2-F1:TATCCAGACACCAAAGTCAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTC(SEQ ID NO.:77)和pCas9-Kl NGL3-R1:GCTCTAAAACCTGACTTTGGTGTCTGGATAAAAGTCCCATTCGCCACCCG(SEQ ID NO.:78),pCas9-KlNGL2-F2:TTGTGCATGATTGTTAAACTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGT(SEQ IDNO.:79)和pCas9-Kl NGL2-R2 CGGGTGGCGAATGGGACTTTTTGTGCATGATTGTTAAACTGTTTTAGAGC(SEQ ID NO.:80):以pCAS质粒为模板,进行PCR扩增。分别将扩增产物17 µL混合,加入1 µLDpn I,2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlNGL2-1和pHoCas9_SE_Kana_tRNA_ScRNR2_KlNGL3-2。以pHoCas9_SE_Kana_tRNA_ScRNR2_KlNGL2-1为模板,使用引物pCas9-F1:TAGGTCTAGAGATCTGTTTAGCTTGCCTCG(SEQ>oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,分别命名为pHoCas9_SE_Kana_tRNA_ScRNR2_KlNGL3-1&2(如图18所示)。

供体 DNA质粒构建及扩增

为了便于线性供体DNA的保存及扩增,本发明首先将供体DNA插入到pMD18质粒中,然后通过PCR扩增得到线性供体DNA序列。

以乳酸克鲁维酵母基因组DNA为模板,以引物KlNGL2-F1:GAGCTCGGTACCCGGGGATCCTCTAGAGATCGAATACGTGAAACAGCCTAGGAA(SEQ ID NO.:85)和KlNGL2-R1:GCCAAGCTTGCATGCCTGCAGGTCGACGATCACGGCCCTAGTACTAATCCCAT(SEQ ID NO.:86)进行PCR扩增;以pMD18质粒为模板,以引物pMD18-F:ATCGTCGACCTGCAGGCATG(SEQ IDNO.:87)和pMD18-R:ATCTCTAGAGGATCCCCGGG(SEQ ID NO.:88)进行PCR扩增。将两次扩增产物各8.5 µL混合,加入1 µL Dpn I,2 µL 10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存,命名为KlNGL2->

以KlNGL3- pMD18质粒为模板,以引物KlNGL2-F2:GAAGTAATAATTTGAGCCAATATATTCATAAACTGTTTAACTATGGACTACACTACAG(SEQ ID NO.:89)和KlNGL2-R2:CCATAGTTAAACAGTTTATGAATATATTGGCTCAAATTATTACTTCTACTTTGCAGTG(SEQ ID NO.:90)进行PCR扩增;构建KlNGL2-DD-pMD18(如图19所示)。具体步骤为:两种PCR产物各8.5 µL混合,加入1 µL Dpn I,2 µL10 × digestion buffer,37 oC温浴3>oC热激45>oC振荡培养1>oC倒置培养至单克隆长出。挑取5个单克隆在LB液体培养基中振荡培养,PCR检测阳性并测序确认后,提取质粒保存。

乳酸克鲁维酵母转化及阳性鉴定

6.3.1将乳酸克鲁维酵母菌液在YPD固体培养基上划线并挑取单克隆,于25 mL 2×YPD液体培养基中振荡培养过夜,取2 mL菌液于50 mL液体2×YPD培养基中继续振荡培养2-8h。20 oC条件下3000>oC保存。

6.3.2将感受态细胞置于37 oC融化15-30>

6.3.3在乳酸克鲁维酵母转化后的平板上挑取10-20个单克隆,置于1 mL YPD(200µg / mL G418)液体培养基中振荡培养过夜,以菌液为模板,以CRISPR Insertion Check引物KlNGL2-CICF1:ATATTGTCTAGCAGCTCATCGCGTA(SEQ ID NO.:91),KlNGL2-CICR1:AAGCAGATTTATGCACGAATTGCC(SEQ ID NO.:92),对样品进行PCR检测。PCR结果阳性并经测序鉴定的菌株,确定为阳性菌株。

实施例7 无细胞体外蛋白质合成体系的制备和蛋白合成效率的测定

实验方法:

i.体外蛋白质合成体系的储存液配制:1MpH为7.4的4-羟乙基哌嗪乙磺酸,5 M醋酸钾,250 mM醋酸镁,25 mM 4四种核苷三磷酸的混合物,包括腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸,1mM 2二十种氨基酸的混合物:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸,20种氨基酸的浓度均为1.0 mM,1M磷酸肌酸,1M二硫苏糖醇,6.48 mg/mL磷酸肌酸激酶,1.7mg/mL T7RNA聚合酶20%-50% 聚乙二醇(polyethylene glycol, PEG)3350或者(polyethyleneglycol,PEG)8000, 20%-40% 蔗糖;

ii.体外蛋白质合成反应体系:终浓度为22 mM pH为7.4的4-羟乙基哌嗪乙磺酸,30-150 mM醋酸钾,1.0-5.0 mM醋酸镁,1.5 mM-4 mM核苷三磷酸混合物(腺嘌呤核苷三磷酸、鸟嘌呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸),0.08-0.24 mM的氨基酸混合物(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸和组氨酸),25 mM磷酸肌酸,1.7 mM二硫苏糖醇,0.27 mg/mL磷酸肌酸激酶,8-20 ng/µL萤火虫荧光素酶DNA,0.027-0.054 mg/mL T7 RNA 聚合酶,1%-4%的聚乙二醇,最后加入50%体积的酵母细胞提取物;

iii.体外蛋白质合成反应:将上述的反应体系放置在20-30 ℃的环境中,静置反应2-6h;

iv.萤光素酶活性测定:反应结束后,在96孔白板或384孔白板中加入等体积的底物荧光素(luciferine),立即放置于Envision 2120多功能酶标仪(Perkin Elmer), 读数,检测萤火虫荧光素酶活性,相对光单位值(RLU)作为活性单位,如图20所示。

实验结果:

本发明实施例

7的结果表明:在所有核酸酶敲除突变株中,Δ>菌株能够显著增强酵母体外蛋白质合成体系产生蛋白质的效率(表2),从图20中也可以看出野生型在IVTT中荧光素酶活性数值为:2.90×108,Δklexn53酵母菌株在IVTT中荧光素酶活性数值为:7.16×108,其活性是野生型的2.46倍。

表2

在IVTT中荧光素酶活性(RLU)与野生型的活性比值(Δ>菌株的RLU/野生型菌株的RLU)Δ>菌株7.16×1082.46倍Δklngl2菌株5.83×1082.03 倍

参考文献:

1.Ayyar, B.V., S. Arora, and R. O'Kennedy, Coming-of-Age of Antibodies inCancer Therapeutics. Trends Pharmacol Sci, 2016. 37(12): p. 1009-1028.

2.Scott, A.M., J.D. Wolchok, and L.J., Antibody therapy of cancer. NatureReviews Cancer, 2012. 12(4): p. 278.

3.Sonenberg, N. and A.G. Hinnebusch, ReguLation of translation initiationin eukaryotes: mechanisms and biological targets. Cell, 2009. 136(4): p. 731-45.

4.M., D.J.R.G., Nucleic Acid. Encyclopedia of Cell Biology, Elsevier,2015.

5.Chong, S., Overview of Cell-Free Protein Synthesis: Historic Landmarks,Commercial Systems, and Expanding Applications. 2014: John Wiley & Sons, Inc.16.30.1-16.30.11.

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 康码(上海)生物科技有限公司

<120> 一种通过对核酸酶系统敲除以调控体外生物合成活性的方法

<130> P2017-2229

<141> 2017-11-24

<160> 92

<170> SIPOSequenceListing 1.0

<210> 1

<211> 4362

<212> DNA

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 1

atgggtattc caaaattctt tcatttcatc tctgagagat ggcctcaaat ttctcaattg 60

atcgatggat cacagattcc agagttcgac aatttgtact tggatatgaa ttctattttg 120

cataattgta cgcatggtga tggtagcgag gtgaattcaa gactatcaga ggaagaagtt 180

tattccaaaa ttttcagtta tattgatcat cttttccata ctattaaacc aaaacagaca 240

ttttatatgg caatcgatgg tgtggcccca agagcaaaga tgaaccaaca aagagctcgt 300

agattcagaa ctgccatgga tgccgaaaag gctttgcaga aggccattga aaatggtgac 360

gagttgccta agggagagcc atttgattcc aacgctatta ccccaggaac agaatttatg 420

gcaaaattaa ccgagaattt gaaatatttc atccatgaca agatcaccaa cgataccaga 480

tggcagaacg tgaaggttat tttctccggg catgaggttc ctggtgaagg tgaacataag 540

atcatggatt acatcagagc aattagagca caagaggatt acaatccaaa tacaagacat 600

tgtatctacg ggttagatgc tgatttgatc atcctaggtt tatccaccca tgatcaccac 660

ttttgtttat taagagaaga agttactttt ggtaaacgtt cgtcttctgt gaaaactcta 720

gaaacacaga acttcttctt gttgcatttg tctatcttga gagaatattt ggcattagag 780

ttcgaagaaa taacagattc tgtgcagttt gaatacgact ttgaaagagt attagatgat 840

ttcatctttg tattatttac catcggtaat gatttcttac caaatttgcc cgatttgcat 900

ttgaaaaaag gtgcattccc tgtgctatta caaactttta aagaagctct ccaacatatg 960

gatggttaca ttaatgaaca aggtaagata aatttggcaa gattttccat ttggttgaag 1020

tacttgtccg attttgaata ccttaacttt gagaagaaag atattgacgt tgaatggttc 1080

aatcaacaac ttgaaaatat ttccttggaa ggtgagcgta aacgtactag gatgggtaaa 1140

aagttgttga tgaaacaaca aaagaaattg attggcgccg taaaaccatg gttattgaaa 1200

accgttcaac ggaaggtcac ttctgaatta caggatgccg atttcgaaat tttccctctt 1260

gaggataaag aattggttcg ggccaacctg gatttcttga aggaattcgc atttgatttg 1320

ggtttaattc ttgctcattc taaatcaaaa gatttgtact acttcaagtt ggatttagac 1380

tccatcaatg tgcaagaaac agatgaagag catgaagccc gtattcacga aacaagacgt 1440

tctattaaga aatatgaaca aggtattatt attgcatctg aagaagaatt agaagaagag 1500

cgtgaaattt atagcgagag attcgttgag tggaaagatc aatactataa agataaatta 1560

gatttttcca tcaatgatac tgatagtcta aaagaaatga cagaaaacta tgtcggaggt 1620

ttacaatggg ttttatacta ctattatcgt ggatgtccat cttggtcctg gtattacaga 1680

tatcattacg ctcctcgtat atcagatgtg atcaaaggta tagatcagaa catagaattt 1740

cacaagggac agcctttcaa gcccttccaa caattgatgg ccgtcttgcc tgagagatca 1800

aagaatttga ttccagttgt gtacagacca ctcatgtatg atgaacactc tcctatcttg 1860

gacttctatc ctaacgaagt agagttggat ctaaatggca aaacagcaga ctgggaagct 1920

gtcgtcaaaa tttcattcgt ggatcaaaag cgtttagtag aagcaatggc tccttatgat 1980

gctaagcttt ctccggatga aaagaaaaga aattcgttcg gaactgatct gattttcata 2040

ttcaatcctc aggtagacac agtttacaaa acaccactag cggggttgtt taatgatatt 2100

gaacacaatc attgtatcga aagggaattc attccagaat cgatggaaaa cgttaagttc 2160

ttatttggtt tgccaaaggg cgctaaactc ggagctagct ctttggccgg tttcccatcc 2220

ctaaagacac taccactaac tgcagagctt gcttataatt cttctgttgt cttcaatttc 2280

ccttctaaac aacaatctat ggtgttgcat attcaggacc tttacaagga aaatggcatc 2340

tctctgtcag atctagcaaa aagacatatg ggtaagattg tttattcaag atggccgttt 2400

ctaagagaat ctaaactttt gtcgttgatt acagaggaaa ctgtgtatga aggagttaag 2460

tcaggcaaat taacaaaggt cattgaaaga aagcctcagg attttgaaag gaaagaattt 2520

agagagttga agatgactct caaatcgaat tatcaaagga caaaggccat tcttttggat 2580

gacatttctg ctttggctaa agtggttcca gtaaatggat tggtgagaaa ctctgatggt 2640

tcctattcta agtctttcaa tgaaactatc gaatactatc ctttacaatt aatcgtagag 2700

gacgtaaaaa ataaggacga aagatatatt gaaaaagagc cgttaccaat taataaagaa 2760

tttccaaaag gttcaaaagt tgtgttttta ggtgattatg cgtatggtgg ggaggcgacc 2820

gttgatggtt ataatagtga gactagatta aaacttacag tcaaaaaggg ttctctcaga 2880

gcagagccta acatcggaaa agttagagcg aaattggatt ctcaagcctt gagattctac 2940

ccaacacaag tgttttcaaa aatagctcgt gtccaccctc tcttcttgtc aaaaattact 3000

tcaagatatt tggtcaatga ttctaaaaag aaaagccata acgtcggttt gatgatcaaa 3060

ttcaaagcaa gaaatcaaaa agttctcggt tatgccagat gcagctcaaa caaatgggaa 3120

tactctgacg tcgctcttgg tttgttagag cagttcagat ctacattccc tgagttcttt 3180

gcgaaacttt ctaactcgaa ggaacaagca attccatcga tcactgatct cttccctaac 3240

aaatctagcg cggaagctga ttccattttg aaaacagtgg ctgattggct ctcagaagca 3300

agaaaaccat tcgtggtggt gtctttggaa agtgattcgc taaccaaggc ttcgatggca 3360

gctgttgaat ctgaaatcat aaaatacgtt tctttaccag attcaagcga gcagaagaaa 3420

ttagctaagg tcccacgtga ggcaatctta aatgcggaat cgtcatatgt tctattgcgc 3480

tcccaaaggt tccacttagg tgatagggta atgtacattc aagattcagg caaggttcca 3540

cttcacagca aaggtactgt cgttggctac acttcaattg gcaagaacgt ctcaatccaa 3600

gttctatttg acaatgaaat aattgcagga aacaactttg gtggtaggtt gcagaccaga 3660

cgtggtttgg gattggactc ttccttctta ttaaacttgt ctgatagaca attggtatat 3720

cattcaaagg catcgaagag tgctgataag aaaccaaaag cagttcctaa tgataagcaa 3780

gtcgccctcg caaaaaagaa gagagtggag gaactcaaaa aaaagcaagc ccatgagttg 3840

ttaaatcata tcaagaagga taacgcggaa tcaaataccg aatctggatc cgctccgcaa 3900

atagcagtta acactttaaa tccttcggct gctaacaacg tgttcaatgc cgtcttgaac 3960

caaatcaaac caggttctca acagcaaatt caaccacctc cagcaaattc tctgccttac 4020

aatttcactg ttcccccaca tatggttcct ggtggtattc ctcatcctct tatgatgcag 4080

ccgcctttca ttccgaataa tgagcatatt gcttatgcag ctcctcctca gtcacaacct 4140

gtacaaaatc caccattaga taaagaggca tccaggaatc ttaagaatct cctaattaga 4200

gatgagaatg gacgtacagc aaatgtggag aataaagact cagatgatac aaagagatct 4260

tctcattctc gtggcggtcg tcgtggccgt agtaatcgtg gtcgtggtgc ctccgggagg 4320

ggtggtcatt tcaaaaattc tcctaaaaaa actgaaacct ga 4362

<210> 2

<211> 3027

<212> DNA

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 2

atggctactg ttcagcagct aagaaggaag cggatcagtg acggtctcac tgtgacgcaa 60

aaggttttcg ttcgttccag aaacggtagt gcccagaagg tggttcggga gcattatttg 120

agaaaagata tcccatgtct ttctaggatc tgtgacattt gtcctaacat tattgtgcct 180

aatgcagctg gagaattacc gaagtttgtt ctttctgaaa ccccacaaga gttacaaggg 240

ttggggaaac attacgttgt cgttgatgcc aatatcatta tacaatctat tgacttgtta 300

gagaacccaa attgtttctt tgacgttatt gtgcctcaga ttgttttgga tgaagtaaga 360

aataaatctt atccaattta cacaagaatt agagctcttt gtagagatag cgaggatgat 420

gtgaagagat ttgttgtttt ccataacgag ttctctgaat acacttttat tgatagaacc 480

gggaacgaat ctatcaacga tagaaacgat agggcgatca ggaaaactgt ggaatggtac 540

actaatcatt tgaagggtaa gggtattaat atcgtttttg ttaccaacga tcgtctaaac 600

agacaagcag ccttaaagga tagtttggtg gcgaaatcgt tggccgaata tgtggatatg 660

ctaccaaata gtgaggaaat aaaggatttg atccctaact tggctccaat atcaggtatg 720

tccagcaaga tgttggaaga tgatccagaa ggtcatggcg ctgctaaggc agagttctct 780

ttcccagaat attattctac atcgagaatt atgggtgggt tgaaaaatgg ttctttgtac 840

cagggttcca ttcaaatctc ggagtataat ttcttggagg gtactgtgtc gttacctact 900

tttaagaaac ctgttctagt gttaggacaa aagaatttga atagagcgtt caacggagat 960

cttgttgtag tggagcttct tccccaatct gaatggaagg ctccatctac agtgacaatg 1020

gactctgaac acttcaacgt caatgataat cccgacaatg atggtgaaga tgatgaagga 1080

gaaccatcag gtgtactaga tgactctggt gctattatgt ctgataaaga ccgtagacta 1140

ttagctcaat ctgccatcct agctcaaaag tcaaacaaag ttcagccaac agccagggtt 1200

gttgggatta caagaagatc atggaggcag tatgtcggtc aaattacccc aacctctgtg 1260

gatcctcaaa gcagtggtac tcaaaatgtc tttgtaattt taatggataa atgtttacca 1320

aagattagaa ttcggactag acttgccaaa caactactga acaaaagaat tgtcatttca 1380

gttgattgct ggccagagaa ctatagatac ccgttgggcc atttcgtaag agatttaggt 1440

gatatcgagt ctgcacaagc agaaactgaa gcactattat tagaacatga cgttgaatac 1500

aggccattct caaagaaagt tttggattgt ttaccaaagg aaggtcacga ttggaaagca 1560

ccagaagacc tcaccgatcc agaagcaatc agaaatgacc cgttattacc aagcagaaag 1620

gacttcagag ataaattgat ttgtagtatt gatcctccag gatgtgtcga tattgacgat 1680

gccttgcacg caaagcaact tccaaatggt aactgggaag ttggtgtcca tattgctgac 1740

gttactcatt tcgttaaacc gggtaccgca ttagacgcag aaggtgcctc aagaggtact 1800

tctgtctact tagtcgataa acgtatcgat atgttaccta tgctattagg tactgacctc 1860

tgttcattga agccctatgt tgatagattt gcattttccg ttgtatggga gcttgataac 1920

gatgctaaca ttgttggtgt tgatttcaca aaatcggtta ttagatccag agaagcattt 1980

tcttacgaaa aagctcaaaa ccgtatcgat gatgaaactg ctaaagatga gttgacactt 2040

ggaatgaggg ctcttttgca actttccaag aaactgaaac aaaagaggtt ggacgcaggt 2100

gcgctaaatt tggcttcccc tgaagttaaa gttcatatgg atagtgaaac ctctgatcca 2160

aacgaagttg aaatcaagaa acttcttgac accaactctt tggttgaaga attcatgttg 2220

ttagctaaca tttctgttgc tagaaagatt tacgaagcat tccctcaaac tgctatgttg 2280

agaaggcatg cagcacctcc atccactaac tttgaactgt tgaacgaaat gcttcaagtc 2340

agaaagggca tgtctatttc tcttgaatcg tcaaaggcat tggcggactc tttggacaga 2400

tgtgaagatc caaatgattc ttatcttaac actttgatcc gtatcatgtc tactcgttgt 2460

atgatggccg cgcaatactt ccatgcagga gcattctcct acgcagattt ccgtcattat 2520

ggtttagctg tcgatatcta cacgcacttc acgtctccaa ttagacgtta ctgtgatgtc 2580

gtagctcaca gacaactagc aggtgcaatt ggctatgagg ccctagatct ttcccataga 2640

gataaacaaa aaatggagat gatttgtaga aatattaaca agaaacatag aaatgcccaa 2700

tttgccggta gagcaagtat agaatattat gttggccagg tgatgagaaa taacgaatca 2760

acggagacgg gttatgtcat caaagttttc aacaatggta tcgccgtatt agtacccaaa 2820

ttcggtgtag aagggttgat cagattagaa aacttgactg aaaatccaca aagcgcagaa 2880

ttcattgaag atcaatttag cttgagattt gttgataaaa acggtgtttc gaaagaggtc 2940

agtgtctttg ataaggtaga agttcaactc aaatctgttc tcgatcctgc taccagtaaa 3000

cgtaaggcac aattattatt gaaatga 3027

<210> 3

<211> 2979

<212> DNA

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 3

atgggtgttc cgtccttttt tcgttggttg tctaggaaat atcctaaaat catttctcct 60

gtgttggaag aatatccagt tatcgaagat ggtgttcaac taccgcttga ttactcttcg 120

gccaatccca atggtgagtt ggataacctt tatctcgata tgaatggtat tgttcaccct 180

tgttcacatc cggagaataa gccaccacct gaaacagagg atgaaatgct tcttgctgtg 240

tttgagtaca caaatcgcgt tttgaatatg gccagaccaa gaaaagtctt gatgatagcg 300

gttgatggtg ttgcaccaag agcgaagatg aatcaacaga gagcacgtag gtttcgtagt 360

gcaagggatg caaaactcca aaatgaagcc agagagcaag tattacgaga aagagaggac 420

tatggtgaga cgattgatga aaatgtcaaa agtaaaaaga catgggattc aaacgcaatt 480

actccaggta ccccatttat ggataaacta gctacagctt taagatattg gacaagtttc 540

aagttagcaa ctgatcccgg gtggaaaaat ttacaaatta ttataagtga cgctactgtt 600

ccaggtgaag gtgaacataa aataatgaat ttcattagat ctcaaagagc agacactcaa 660

tataatccaa atacaacaca ttgtatatat gggttagatg cagatttgat ctttttggga 720

ctagcaaccc acgaacctca tttcaaaata ttaagagagg atgtgttcgc caataacaac 780

tataaaaaac caaagcctca agatatgata aatttatctg aagaagagaa acaacagctt 840

attcaacaag attcagaaaa gccattctta tggctccata tcagcgtttt aagagaatat 900

ctttcagcag aattagcgat tccacattta tcgttccagt ttgattttga acgagcaatc 960

gacgattggg ttttcatgtg tttcttctgt ggtaatgatt tcctaccgca tttaccttgt 1020

cttgatgtga gagagaatag cattgacatt ttggtggata tatggaagac tgtgttgccc 1080

aaaacaaaaa cctacctaac atgtgatggt acactcaatt tggaacctgt agaagcttta 1140

cttgaacaat taggagaccg tgaaacagat cttttcaaaa agaaatacat tcaggaagtt 1200

cgtaagcaag aggctcatga taggcgaaag aaattgaaaa gtaaccccaa tgtttcccag 1260

ggcaaggtcg acagaaattt tatgattccg ttggagaata tgccggtcta tgatgttgat 1320

ggcaacgccg ctgaaggctc tttgaatttg tctaataagg atttcgctaa tatgcgtaaa 1380

gaaattaatt tggcgaatga aggtgatggc gaagcagcta aagctttgaa actaaaaagt 1440

gagaagaata gcggtgtggt cgagttttca tcggaagaat tgaaaaatag cgtgcaactg 1500

tcgaagactg cgaactacga tgctgctacc agcttacagg agaaacttat tgctaagaag 1560

atggcaatga gagatgagga aaatgcagaa gaattgtcgt tgaaacggaa aagtgaagat 1620

gttgactctg ctgaaaagga aacatccaat gaacctgagg atgatgaggc cgattatgat 1680

gaagacgaag gctctactgt tccaccagcg gtcatccaca ccggtattgt aaaatcaggg 1740

ttcattgaca ccgatgagtc ggttagactt tacgaacctg gatatcatga tcgttactat 1800

caacataaat tccatgttcc agcaaaagat attccagctc tgcaaaagga tgtgattagg 1860

tgctatgtgg aaggtatttc atgggtttta ttatattatt atcagggatg tgcgtcttgg 1920

acttggtact atccatacca ttatgctcct tttgctcagg atttcaagaa tataaaaaat 1980

ctagatattc actttgatct tggtgaacca ttcttaccat acgaacagtt aatgagtgtt 2040

ttaccagcag catcaggcca cgcactaccc gaaatattca gaccattaat gtcagatcca 2100

aactctgaga ttatagattt ctatcctgaa gaattcccag tggatatgaa tggtaaaaag 2160

atggcttggc agggtattgc actattgcca tttatagatg aaacacgttt actgaaaaca 2220

gttcgagaac aatattctaa gctttctgat tcagaaaagg caagaaatgt taggaagaag 2280

gatgcacttt tgatcagcaa caagaatgtg aattacgacc tgtttatgaa gaatttatat 2340

ggagaaaacc ccgttaacgt gatagagttt agacatttca aatctggttt aagtggattc 2400

gtaacacaag ctgaagaagg gtttgaacta aactccaagc tgatatgtcc tattaatggg 2460

ggtggtttgc cagatttgag tacaaattta ttcctaaaac tttcgtatac gcagcctgtg 2520

gttgcgggta gatgtaaatc gttagtattg aacggatata tcccacctca accaatgctt 2580

accccacagg accgagactg tatcatttat aaatacagta accgttggaa tccttccatg 2640

atgaaataca acattgtgcc tgttggccca tcggggatta cccaatatca gcccagggtt 2700

ggaggttaca gaagtttctt cttccataaa gaacagacag cttatgctca acaaccgcaa 2760

caaaatagag agtatatgca ctcgcaacag agacagccac agggcagcag atatcaacag 2820

tctaggtata ataatggaaa ctacaataat agtaacaacg gttattctga taataataat 2880

ggtaataccg gcaaatacaa ccgtcattat aacaacagta gaggtaatag caatcgatac 2940

tcgaatagta acgatagaag aagggaattc agaagatga 2979

<210> 4

<211> 2235

<212> DNA

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 4

atgtcttcag aggataagga tacgttactt tccagtttgg ttcaaactgt gagatcatcg 60

agtgcattgg ctgcacagga tatcgatttc tacaaaagtt tagattccaa cattaatgca 120

tcattagaag acacttctac gaacatttta tcgttaatca acgacttgct tttgtctatt 180

gatcccaata atgatgtaat tcagcaaggg aaagacagtt ttgtggattc ttggaaatcc 240

ataagtaata ttatggataa tttatttgaa aagtctgatc atgcacttga caacattaga 300

gccggaaatg gtggaaacgc tggaggtcca tcacttaagt atctaaatga tgatgatcgt 360

tcgaacaata aaccatccaa gaggattgaa aaacctcaac taagttttaa aactcctgta 420

gataacacag aacttcatcc tttcaagcca ttattggaat acaaacccca tagtttacaa 480

ccgttcgaaa tttcattgaa gatggtccca gaagaggaat ccatcccgtc ccattaccca 540

catccatacg aatatgagat cgaccaccaa aaatacaatg actccattct tgttgcaaca 600

gaaccgatcc catcaaagga ctgggatgaa actgaagcaa tttgggttga caccgttgaa 660

ggccttaaca aaatgaaaga tgaattaagt aaagccacag aattagcaat cgatttagaa 720

catcatgatt ataggtctta ctatggtata gtttgtttga tgcaaattag tgaccgggag 780

catgattgga ttgtagatac tattgcattg agagaggaac tttacatatt gaatgatatc 840

tttaccgacc ctaatgttac taaagttctg cacggtgcat tcatggatat catatggctt 900

caacgtgatt taggcttata tattgttggc ctttttgata cttatcatgc ctccaggatg 960

ttaggttttc caaaacacag tctggcctat cttctcgaaa gatttgctaa tttcaagact 1020

tcaaaaaaat atcaactggc agactggaga atcagaccgt tgaccaagcc tatgcttgca 1080

tatgcaagag ctgatacgca ttttctccta aatattttcg ataaattaag gaactctcta 1140

ctggaacaga ataagatgtc cgatgttttg catgaatcga gaaaagtggc taaaagaaga 1200

tttgaatata gtagtttcag accaaaggtt ccgtcttcag cagtgttttc acctattgaa 1260

aaggatgaac cttggaagaa tattatgttt cagtacaata ttccggcttc aaaggaatta 1320

cttctccgta gactttatga atggagagat acaatcgcca ggagggatga tgaatctcct 1380

cgttacgtga tgccaaacca actacttgta tcgttggtgg ctggtgcacc aaccgaaccc 1440

attaacgtat tgtctgtcag ctcatacgtt tcagagcatt taagaacaaa ttcgaaggtc 1500

attgcaaact tgatcaaaag aactttagag gatctcaaag gaaattccaa ctcttctgcg 1560

atcccacttt tggaatcggc cgaaagtaac ggcaccgatc tggccaatat aataacaacg 1620

tcccaaatta aatccattca gaatatattt cattcacttg cttcggaaat aaactctcaa 1680

aagctgaata acgaacaaaa ttcagagaaa tctgtcctat tcaatggtat ttcaaacttg 1740

gatgtgaata ctgccgtcag atatacacca aagacgagaa cgctcattcc acaacatgaa 1800

ttattaaagc gtcagcatga aataacaagg acgttagaac aagaatacac tgaccgacaa 1860

gctcagagta ttgtgctacc gtcaaatgag gatgaagctc ctacgcaagt atctaacgat 1920

gaaaacagaa atgaagtcat cacgtctgat ccttctcagg aagagattga agagaacaag 1980

gatgaagtaa ttacgttgcg caaaagacaa tctcaatcta acaacaaacg aaagactatc 2040

agtccacctg caagtcatga gattatggat tatgctgctg gctccgacct attgaactca 2100

acaaagaata atacaaactc acagaagcat aaaaaaagaa gattcgatcc ttactctgtt 2160

gaacatgtcg gtccacagcc tatcaagaaa aaatcaaaac ctgccaaggg taagaacgtc 2220

tcattcaaaa gatag 2235

<210> 5

<211> 1551

<212> DNA

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 5

atggctggta gtacgcaaga caccggcgtc aaagacgttc caaaagagct tgtggaacaa 60

gcaaaaaagc tatcgattac tgatgggatg gaccagttga aggtagaagg taagaataaa 120

gtaaaggaca agaaaagtaa gaaaaaaggc aaggccttga atgagatcac tccagagtat 180

atcgctgaga tgcgagctaa gagagaagct gcgaaaatag caaaaaaaga ggctcttatt 240

gctcaaggta tagatccaaa attgcccgca gaccttagat ttatcaaaag gccgatgtta 300

gctgttcctc gagattcatc aggccaatcg acgagagagg tatgtccaat cagtataatg 360

acgtataatt gtcttgccca agctttgatt agaagaacac tgtttcctac gagcggaaat 420

gctgttaaat ggtttaaaag atctcaagtt ttactcaatg aattcaaata ttacaatgtt 480

gacgtactgt gtttgcaaga aattgacacg gttcaataca agtctttctg gaaaatggag 540

ttcacaaaac taggttacat gtgtcaattc cattttaatc ctaccaaaaa ccacggagta 600

ttaattgctt ggaaagaaga tctatttgat atgacagata agatgttaat tgactacgac 660

aaagaaacaa caggtgccat tgaaccaaga acaactacca aaaatgttgg catgttgctt 720

tctttgaagt ttaaaaagaa agtgctagaa aaatatccag acaccaaagt cagtggtata 780

attattggta ccacacattt gttttggcat ccatttggca catatgaacg gacaagacaa 840

tgctatattg tactaaaaaa agtaaaagaa ttccagaatc gaatcaacgt tcttcaaaac 900

gaaaaagacg gtgataattc acattggcca gcatttttct gtggcgattt caattctcag 960

ccgtttgatg ccccatattt gtccatcaca tcaaaaccag tggaatatac cggaagggct 1020

aaaacagtta tagagtgcag cacttcattt accttctcta aactaagaga tggggatgaa 1080

ggagaaggag aagaaggcgg caacattgaa aaatttggta aaggtcaacc tgagaccccc 1140

gtgccagaat ctttttccgg caacgaagag caaaagcagt tatgtgagaa catgaaaacc 1200

cttcataatg acattgacat gcgcgctata tccttgtatt caattgctta ctcgaaagtt 1260

catcctgaaa actcaggatt ggacaacaag cgtaatgaac ctgaaatatc taattgggca 1320

catgcatgga gaggtttgtt agactacttg tattatgtta catcatggga tggatgcgat 1380

tgtactaaga tagatgagct atcaacattt gagcaaaatt atggagttca agttcttgag 1440

cttctaagaa tacctcccgc caaggaaatg acagagcatg gacaacctca tgaaggtgaa 1500

tatcctagtg atcatttgtg catgattgtt aaactgggaa tcataatgta a 1551

<210> 6

<211> 513

<212> PRT

<213> 乳酸克鲁维酵母(Kluyveromyces lactis)

<400> 6

Met Gly Ile Pro Lys Phe Phe His Phe Ile Ser Glu Arg Trp Pro Gln

1 5 1015

Ile Ser Gln Leu Ile Asp Gly Ser Gln Ile Pro Glu Phe Asp Asn Leu

202530

Tyr Leu Asp Met Asn Ser Ile Leu His Asn Cys Thr His Gly Asp Gly

354045

Ser Glu Val Asn Ser Arg Leu Ser Glu Glu Glu Val Tyr Ser Lys Ile

505560

Phe Ser Tyr Ile Asp His Leu Phe His Thr Ile Lys Pro Lys Gln Thr

65707580

Phe Tyr Met Ala Ile Asp Gly Val Ala Pro Arg Ala Lys Met Asn Gln

859095

Gln Arg Ala Arg Arg Phe Arg Thr Ala Met Asp Ala Glu Lys Ala Leu

100 105 110

Gln Lys Ala Ile Glu Asn Gly Asp Glu Leu Pro Lys Gly Glu Pro Phe

115 120 125

Asp Ser Asn Ala Ile Thr Pro Gly Thr Glu Phe Met Ala Lys Leu Thr

130 135 140

Glu Asn Leu Lys Tyr Phe Ile His Asp Lys Ile Thr Asn Asp Thr Arg

145 150 155 160

Trp Gln Asn Val Lys Val Ile Phe Ser Gly His Glu Val Pro Gly Glu

165 170 175

Gly Glu His Lys Ile Met Asp Tyr Ile Arg Ala Ile Arg Ala Gln Glu

180 185 190

Asp Tyr Asn Pro Asn Thr Arg His Cys Ile Tyr Gly Leu Asp Ala Asp

195 200 205

Leu Ile Ile Leu Gly Leu Ser Thr His Asp His His Phe Cys Leu Leu

210 215 220

Arg Glu Glu Val Thr Phe Gly Lys Arg Ser Ser Ser Val Lys Thr Leu

225 230 235 240

Glu Thr Gln Asn Phe Phe Leu Leu His Leu Ser Ile Leu Arg Glu Tyr

245 250 255

Leu Ala Leu Glu Phe Glu Glu Ile Thr Asp Ser Val Gln Phe Glu Tyr

260 265 270

Asp Phe Glu Arg Val Leu Asp Asp Phe Ile Phe Val Leu Phe Thr Ile

275 280 285

Gly Asn Asp Phe Leu Pro Asn Leu Pro Asp Leu His Leu Lys Lys Gly

290 295 300

Ala Phe Pro Val Leu Leu Gln Thr Phe Lys Glu Ala Leu Gln His Met

305 310 315 320

Asp Gly Tyr Ile Asn Glu Gln Gly Lys Ile Asn Leu Ala Arg Phe Ser

325 330 335

Ile Trp Leu Lys Tyr Leu Ser Asp Phe Glu Tyr Leu Asn Phe Glu Lys

340 345 350

Lys Asp Ile Asp Val Glu Trp Phe Asn Gln Gln Leu Glu Asn Ile Ser

355 360 365

Leu Glu Gly Glu Arg Lys Arg Thr Arg Met Gly Lys Lys Leu Leu Met

370 375 380

Lys Gln Gln Lys Lys Leu Ile Gly Ala Val Lys Pro Trp Leu Leu Lys

385 390 395 400

Thr Val Gln Arg Lys Val Thr Ser Glu Leu Gln Asp Ala Asp Phe Glu

405 410 415

Ile Phe Pro Leu Glu Asp Lys Glu Leu Val Arg Ala Asn Leu Asp Phe

420 425 430

Leu Lys Glu Phe Ala Phe Asp Leu Gly Leu Ile Leu Ala His Ser Lys

435 440 445

Ser Lys Asp Leu Tyr Tyr Phe Lys Leu Asp Leu Asp Ser Ile Asn Val

450 455 460

Gln Glu Thr Asp Glu Glu His Glu Ala Arg Ile His Glu Thr Arg Arg

465 470 475 480

Ser Ile Lys Lys Tyr Glu Gln Gly Ile Ile Ile Ala Ser Glu Glu Glu

485 490 495

Leu Glu Glu Glu Arg Glu Ile Tyr Ser Glu Arg Phe Val Glu Trp Lys

500 505 510

Asp

<210> 7

<211> 60

<212> DNA

<213> 人工序列(artificial sequence)

<400> 7

agagttcgac aatttgtact gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

<210> 8

<211> 50

<212> DNA

<213> 人工序列(artificial sequence)

<400> 8

gctctaaaac agtacaaatt gtcgaactct aaagtcccat tcgccacccg 50

<210> 9

<211> 60

<212> DNA

<213> 人工序列(artificial sequence)

<400> 9

cgtcgtggcc gtagtaatcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

<210> 10

<211> 50

<212> DNA

<213> 人工序列(artificial sequence)

<400> 10

gctctaaaac cgattactac ggccacgacg aaagtcccat tcgccacccg 50

<210> 11

<211> 30

<212> DNA

<213> 人工序列(artificial sequence)

<400> 11

taggtctaga gatctgttta gcttgcctcg 30

<210> 12

<211> 27

<212> DNA

<213> 人工序列(artificial sequence)

<400> 12

tatccactag acagaagttt gcgttcc 27

<210> 13

<211> 80

<212> DNA

<213> 人工序列(artificial sequence)

<400> 13

tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60

caacaattaa atactctcgg 80

<210> 14

<211> 57

<212> DNA

<213> 人工序列(artificial sequence)

<400> 14

cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57

<210> 15

<211> 43

<212> DNA

<213> 人工序列(artificial sequence)

<400> 15

gtacccgggg atcctctaga gatccagttg cagagcctcc gaa 43

<210> 16

<211> 45

<212> DNA

<213> 人工序列(artificial sequence)

<400> 16

catgcctgca ggtcgacgat gcgaaacctt agctctttat cgaac 45

<210> 17

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 17

atcgtcgacc tgcaggcatg 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 18

atctctagag gatccccggg 20

<210> 19

<211> 45

<212> DNA

<213> 人工序列(artificial sequence)

<400> 19

atgttggttt gaatggacta ttaacagtaa atattatatc acttc 45

<210> 20

<211> 84

<212> DNA

<213> 人工序列(artificial sequence)

<400> 20

gaagtgatat aatatttact gttaatagtc cattcaaacc aacatttatt ttagttaagc 60

cacaaaccgt aattaattga acac 84

<210> 21

<211> 22

<212> DNA

<213> 人工序列(artificial sequence)

<400> 21

tttgctggtt gcccgtattc cc 22

<210> 22

<211> 23

<212> DNA

<213> 人工序列(artificial sequence)

<400> 22

taatagcaca gggaatgcac ctt 23

<210> 23

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 23

ttcagcagct aagaaggaag 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 24

agaggtcagt gtctttgata 20

<210> 25

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 25

atgggacttt ttcagcagct aagaaggaag gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 26

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 26

agctctaaaa ccttccttct tagctgctga aaaagtccca ttcgccaccc g 51

<210> 27

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 27

atgggacttt agaggtcagt gtctttgata gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 28

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 28

agctctaaaa ctatcaaaga cactgacctc taaagtccca ttcgccaccc g 51

<210> 29

<211> 30

<212> DNA

<213> 人工序列(artificial sequence)

<400> 29

taggtctaga gatctgttta gcttgcctcg 30

<210> 30

<211> 27

<212> DNA

<213> 人工序列(artificial sequence)

<400> 30

tatccactag acagaagttt gcgttcc 27

<210> 31

<211> 80

<212> DNA

<213> 人工序列(artificial sequence)

<400> 31

tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60

caacaattaa atactctcgg 80

<210> 32

<211> 57

<212> DNA

<213> 人工序列(artificial sequence)

<400> 32

cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57

<210> 33

<211> 45

<212> DNA

<213> 人工序列(artificial sequence)

<400> 33

cccggggatc ctctagagat gctgctaggt gacagaaggt tgtcc 45

<210> 34

<211> 45

<212> DNA

<213> 人工序列(artificial sequence)

<400> 34

catgcctgca ggtcgacgat ccaaagaaga acgtcgtaag accgc 45

<210> 35

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 35

atcgtcgacc tgcaggcatg 20

<210> 36

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 36

atctctagag gatccccggg 20

<210> 37

<211> 67

<212> DNA

<213> 人工序列(artificial sequence)

<400> 37

ctcttctgtt tagcacccgg ttatagctta atttattaat tatgtacatt atataaaaac 60

tattgtc 67

<210> 38

<211> 52

<212> DNA

<213> 人工序列(artificial sequence)

<400> 38

aagctataac cgggtgctaa acagaagagt atgacgtttt atacttctcc ag 52

<210> 39

<211> 23

<212> DNA

<213> 人工序列(artificial sequence)

<400> 39

caccaacaac aggaaatctc atg 23

<210> 40

<211> 24

<212> DNA

<213> 人工序列(artificial sequence)

<400> 40

cagtacagaa gctcagcaac aacc 24

<210> 41

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 41

gtaaggccag gtactcacaa 20

<210> 42

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 42

ctcgcaacag agacagccac 20

<210> 43

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 43

atgggacttt gtaaggccag gtactcacaa gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 44

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 44

agctctaaaa cttgtgagta cctggcctta caaagtccca ttcgccaccc g 51

<210> 45

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 45

atgggacttt ctcgcaacag agacagccac gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 46

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 46

agctctaaaa cgtggctgtc tctgttgcga gaaagtccca ttcgccaccc g 51

<210> 47

<211> 30

<212> DNA

<213> 人工序列(artificial sequence)

<400> 47

taggtctaga gatctgttta gcttgcctcg 30

<210> 48

<211> 27

<212> DNA

<213> 人工序列(artificial sequence)

<400> 48

tatccactag acagaagttt gcgttcc 27

<210> 49

<211> 80

<212> DNA

<213> 人工序列(artificial sequence)

<400> 49

tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60

caacaattaa atactctcgg 80

<210> 50

<211> 57

<212> DNA

<213> 人工序列(artificial sequence)

<400> 50

cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57

<210> 51

<211> 42

<212> DNA

<213> 人工序列(artificial sequence)

<400> 51

cccggggatc ctctagagat gctgcatggt cacaggagat gc 42

<210> 52

<211> 45

<212> DNA

<213> 人工序列(artificial sequence)

<400> 52

catgcctgca ggtcgacgat ggtacgtgag gcgacaatat ggtcc 45

<210> 53

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 53

atcgtcgacc tgcaggcatg 20

<210> 54

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 54

atctctagag gatccccggg 20

<210> 55

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 55

ccaggtactc acatgaactg tggacaattt tatacccgtt tatatcagca c 51

<210> 56

<211> 39

<212> DNA

<213> 人工序列(artificial sequence)

<400> 56

tgtccacagt tcatgtgagt acctggcctt acttctcgc 39

<210> 57

<211> 22

<212> DNA

<213> 人工序列(artificial sequence)

<400> 57

taagacaggt accctcacga cg 22

<210> 58

<211> 26

<212> DNA

<213> 人工序列(artificial sequence)

<400> 58

cttggaagtg gatacatttc tagagg 26

<210> 59

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 59

atgggacttt caccatgtct tcagaggata gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 60

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 60

agctctaaaa ctatcctctg aagacatggt gaaagtccca ttcgccaccc g 51

<210> 61

<211> 71

<212> DNA

<213> 人工序列(artificial sequence)

<400> 61

atgggacttt ccgacatgtt caacagagta gttttagagc tagaaatagc aagttaaaat 60

aaggctagtc c 71

<210> 62

<211> 51

<212> DNA

<213> 人工序列(artificial sequence)

<400> 62

agctctaaaa ctactctgtt gaacatgtcg gaaagtccca ttcgccaccc g 51

<210> 63

<211> 30

<212> DNA

<213> 人工序列(artificial sequence)

<400> 63

taggtctaga gatctgttta gcttgcctcg 30

<210> 64

<211> 27

<212> DNA

<213> 人工序列(artificial sequence)

<400> 64

tatccactag acagaagttt gcgttcc 27

<210> 65

<211> 80

<212> DNA

<213> 人工序列(artificial sequence)

<400> 65

tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60

caacaattaa atactctcgg 80

<210> 66

<211> 57

<212> DNA

<213> 人工序列(artificial sequence)

<400> 66

cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57

<210> 67

<211> 48

<212> DNA

<213> 人工序列(artificial sequence)

<400> 67

cccggggatc ctctagagat gcgatagctt taatctgagt gaacaccg 48

<210> 68

<211> 48

<212> DNA

<213> 人工序列(artificial sequence)

<400> 68

catgcctgca ggtcgacgat gggtactcgt tgataacatg atgcgtag 48

<210> 69

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 69

atcgtcgacc tgcaggcatg 20

<210> 70

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 70

atctctagag gatccccggg 20

<210> 71

<211> 50

<212> DNA

<213> 人工序列(artificial sequence)

<400> 71

ctgactctaa tccaccagca tcttgagcag ctctaatggt ataaatatcg 50

<210> 72

<211> 40

<212> DNA

<213> 人工序列(artificial sequence)

<400> 72

gctcaagatg ctggtggatt agagtcagct ggtagtctac 40

<210> 73

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 73

tggaggcgta caatgcagtg 20

<210> 74

<211> 23

<212> DNA

<213> 人工序列(artificial sequence)

<400> 74

tgaaccctct tccatgtctc atc 23

<210> 75

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 75

gctggtagta cgcaagacac 20

<210> 76

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 76

ttgtgcatga ttgttaaact 20

<210> 77

<211> 60

<212> DNA

<213> 人工序列(artificial sequence)

<400> 77

tatccagaca ccaaagtcag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

<210> 78

<211> 50

<212> DNA

<213> 人工序列(artificial sequence)

<400> 78

gctctaaaac ctgactttgg tgtctggata aaagtcccat tcgccacccg 50

<210> 79

<211> 59

<212> DNA

<213> 人工序列(artificial sequence)

<400> 79

ttgtgcatga ttgttaaact gttttagagc tagaaatagc aagttaaaat aaggctagt 59

<210> 80

<211> 50

<212> DNA

<213> 人工序列(artificial sequence)

<400> 80

cgggtggcga atgggacttt ttgtgcatga ttgttaaact gttttagagc 50

<210> 81

<211> 30

<212> DNA

<213> 人工序列(artificial sequence)

<400> 81

taggtctaga gatctgttta gcttgcctcg 30

<210> 82

<211> 27

<212> DNA

<213> 人工序列(artificial sequence)

<400> 82

tatccactag acagaagttt gcgttcc 27

<210> 83

<211> 80

<212> DNA

<213> 人工序列(artificial sequence)

<400> 83

tatggaacgc aaacttctgt ctagtggata gtatatgtgt tatgtagtat actctttctt 60

caacaattaa atactctcgg 80

<210> 84

<211> 57

<212> DNA

<213> 人工序列(artificial sequence)

<400> 84

cgaggcaagc taaacagatc tctagaccta tatccactag acagaagttt gcgttcc 57

<210> 85

<211> 54

<212> DNA

<213> 人工序列(artificial sequence)

<400> 85

gagctcggta cccggggatc ctctagagat cgaatacgtg aaacagccta ggaa 54

<210> 86

<211> 53

<212> DNA

<213> 人工序列(artificial sequence)

<400> 86

gccaagcttg catgcctgca ggtcgacgat cacggcccta gtactaatcc cat 53

<210> 87

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 87

atcgtcgacc tgcaggcatg 20

<210> 88

<211> 20

<212> DNA

<213> 人工序列(artificial sequence)

<400> 88

atctctagag gatccccggg 20

<210> 89

<211> 58

<212> DNA

<213> 人工序列(artificial sequence)

<400> 89

gaagtaataa tttgagccaa tatattcata aactgtttaa ctatggacta cactacag 58

<210> 90

<211> 58

<212> DNA

<213> 人工序列(artificial sequence)

<400> 90

ccatagttaa acagtttatg aatatattgg ctcaaattat tacttctact ttgcagtg 58

<210> 91

<211> 25

<212> DNA

<213> 人工序列(artificial sequence)

<400> 91

atattgtcta gcagctcatc gcgta 25

<210> 92

<211> 24

<212> DNA

<213> 人工序列(artificial sequence)

<400> 92

aagcagattt atgcacgaat tgcc 24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号