首页> 中国专利> 用于从纤维素生物质产生可溶性糖的重组β-葡糖苷酶变体

用于从纤维素生物质产生可溶性糖的重组β-葡糖苷酶变体

摘要

本发明涉及真菌C1菌株β-葡糖苷酶的变体形式的重组表达。本发明还涉及从生物质中产生可发酵的糖和通过使用表达β-葡糖苷酶变体的基因修饰的生物体发酵糖来产生生物燃料。本发明提供了通过使纤维二糖与重组β-葡糖苷酶变体蛋白诸如由重组宿主细胞分泌到培养基中的变体蛋白接触来从纤维二糖产生可发酵的糖诸如葡萄糖的方法。本发明的方法还可用于将生物质基质转化成可发酵的糖,且最终转化成乙醇或其他生物燃料。

著录项

  • 公开/公告号CN102740868A

    专利类型发明专利

  • 公开/公告日2012-10-17

    原文格式PDF

  • 申请/专利权人 科德克希思公司;

    申请/专利号CN201080061944.X

  • 发明设计人 杨劼;张希云;阿提拉·安朵;

    申请日2010-11-24

  • 分类号A61K36/00(20060101);

  • 代理机构11262 北京安信方达知识产权代理有限公司;

  • 代理人申基成;郑霞

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 06:57:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-12

    未缴年费专利权终止 IPC(主分类):C07K14/37 授权公告日:20160120 终止日期:20181124 申请日:20101124

    专利权的终止

  • 2016-01-20

    授权

    授权

  • 2012-12-12

    实质审查的生效 IPC(主分类):A61K36/00 申请日:20101124

    实质审查的生效

  • 2012-10-17

    公开

    公开

说明书

相关申请的交叉引用

本申请要求2009年11月25日提交的美国临时申请61/264,608和2010年6月16日提交的美国临时申请第61/355,511号的权益,为所有目的将上述每一篇通过引用整体并入本文。

发明领域

本发明涉及重组β-葡糖苷酶变体的表达及其在从纤维素生物质产生可溶性糖中的用途。

发明背景

纤维素生物质是用于产生可溶性糖的重要的可再生资源。这些糖类可在包括发酵的多种代谢过程中用作反应物,以产生生物燃料、化合物以及其他有商业价值的产物。虽然将单糖诸如葡萄糖发酵成乙醇相对直接,但将纤维素生物质有效转化成可溶性糖是有挑战的(参见,例如,Ladisch等人,1983,Enzyme Microb.Technol.5:82)。纤维素可以用化学方法、机械方法、酶方法或用其他方法进行预处理以提高纤维素对水解的敏感性。这种预处理之后可以是使用打破纤维素的β-1-4糖苷键的酶进行的纤维素到纤维二糖、纤维寡糖、葡萄糖和其他糖类以及糖聚合物的酶促转化。这些酶总称为“纤维素酶”。

纤维素酶被分为三个亚类的酶:1,4-β-D-葡聚糖葡聚糖水解酶(“内切葡聚糖酶”或“EG”);1,4-β-D-葡聚糖纤维二糖水解酶(“外切葡聚糖酶”、“纤维二糖水解酶”或“CBH”);和β-D-葡糖苷-葡糖水解酶(“β-葡糖苷酶”、“纤维二糖酶”或“BGL”)。内切葡聚糖酶断裂内部键并破坏纤维素的晶体结构,暴露个别的纤维素多糖链(“葡聚糖”)。纤维二糖水解酶逐步缩短葡聚糖分子,主要释放纤维二糖单元(葡萄糖的水溶性β-1,4-连接的二聚体)以及葡萄糖、纤维三糖和纤维四糖。β-葡糖苷酶将纤维二糖分裂为葡萄糖单体。

用于加工纤维素生物质的具有改进特性的纤维素酶将降低成本并提高生物燃料和其他有商业价值的化合物的生产效率。

发明概述

一方面,本发明提供了包括如下氨基酸序列的分离或重组的β-葡糖苷酶变体:所述氨基酸序列与SEQ ID NO:2的残基20-870(野生型C1 β-葡糖苷酶)至少约60%相同,有时至少约65%相同且通常至少约70%相同,或由在严格条件下与SEQ ID NO:1或SEQ ID NO:1的精确互补序列(exactcomplement)杂交的核酸编码,并且具有至少一种相对于SEQ ID NO:2的本文所述的氨基酸残基取代,其中该变体具有比野生型蛋白更大的β-葡糖苷酶活性和/或比野生型蛋白更热稳定。还提供了编码所述β-葡糖苷酶变体的多核苷酸、包含所述多核苷酸的表达载体、以及用所述表达载体转化的宿主细胞。

本发明还提供了通过将用编码β-葡糖苷酶变体的多核苷酸转化的宿主细胞在适于表达所述β-葡糖苷酶的条件下培养来产生β-葡糖苷酶变体的方法。在一些实施方案中,从培养基或从转化和培养的细胞回收β-葡糖苷酶多肽。

本发明还提供包含分离或重组的C1 β-葡糖苷酶变体的酶组合物。任选地所述酶组合物还包括至少一种另外的纤维素酶。

在相关的和/或其他的方面,本发明提供了通过使β-葡糖苷酶变体与生物质基质(biomass substrate)在适于产生可发酵的糖的条件下接触来将该生物质基质如纤维二糖转化成可发酵的糖的方法。在一个实施方案中,生物质基质被保持在包含表达β-葡糖苷酶变体的细胞的培养基中。在一个实施方案中,表达β-葡糖苷酶变体的重组宿主细胞还表达至少一种其他重组纤维素酶和/或其他酶。在使生物质基质与β-葡糖苷酶多肽变体接触之前,任选地对该生物质基质进行预处理。

附图简述

图1.(A)在C1菌株中产生的改进的C1 Bgl1变体的热稳定性;通过在pH5,50℃持续20分钟的pNPG测定确定在pH 5,65℃孵育6小时后的残余酶活性。N=6-8;误差棒代表±1标准差。(B)在C1菌株中产生的改进的C1 Bgl1变体的热稳定性;通过在pH 5,50℃持续20分钟的pNPG测定确定在pH 5,65℃孵育24小时后的残余酶活性。N=6-30;误差棒代表±1标准差。(C)在酵母与C1宿主之间的C1 Bgl1热稳定性相关性。

图2.(A)将改进的C1 Bgl1变体481、269和3的热稳定性与天然C1 Bgl1酶的热稳定性进行比较。使用pNPG做底物在pH 5,50℃持续20分钟测量在pH 4.5,65℃孵育24小时后的残余酶活性。N=6-16;误差棒代表±1标准差。(B)改进的C1 Bgl1变体664的热稳定性与变体481的热稳定性进行比较。使用pNPG做底物在pH 5,50℃持续20分钟测量在pH 4,65℃孵育4小时后的残余酶活性。N=6-24;误差棒代表±1标准差。

图3.(A)将改进的C1 Bgl1变体3、481、664、916、885和871的热稳定性与天然C1 Bgl1酶的热稳定性进行比较。使用pNPG做底物在pH 5,50℃持续20分钟测量在pH 4.5,65℃孵育72小时后的残余酶活性。N=6-10;误差棒代表±1标准差。

图4.在纤维二糖测定中将天然C1 Bgl1的比活性与变体871的比活性进行比较。测定条件:pH 4.5-5,温度55℃-75℃;8g/L纤维二糖,18小时反应。将反应中的蛋白质浓度标准化。N+2;误差棒代表±1标准差。

图5.图5显示天然(野生型)C1 Bgl1氨基酸序列(SEQ ID NO:2)与变体3(SEQ ID NO:5)、269(SEQ ID NO:7)、481(SEQ ID NO:9)、647(SEQID NO:15)、664(SEQ ID NO:13)、871(SEQ ID NO:17)、885(SEQ ID NO:19)和916(SEQ ID NO:21)的氨基酸序列的比对。

发明详述

I.定义

提供以下定义来帮助读者。除非另外定义,否则领域内的所有术语均旨在具有分子生物学领域和微生物学领域的技术人员所通常理解的含义。在一些情况下,具有通常理解含义的术语为了清晰和/或为了现成参考而在此定义,并且在此包含此类定义不应一定被认作代表与相关领域一般理解的术语定义相比有实质差异。

术语“纤维素酶”是指能够将纤维素(β-1,4-葡聚糖或β-D-葡糖苷键)水解成较短寡糖、纤维二糖和/或葡萄糖的一类酶。

术语“β-葡糖苷酶”和“纤维二糖酶”被互换使用并且是指催化糖二聚体包括但不限于纤维二糖的水解同时释放对应的糖单体的β-D-葡糖苷葡糖水解酶。在一个实施方案中,β-葡糖苷酶是催化纤维二糖水解为葡萄糖的分类为E.C.3.2.1.21的β-葡糖苷酶葡糖水解酶。一些β-葡糖苷酶还具有水解β-D-半乳糖苷、β-L-阿拉伯糖苷和/或β-D-岩藻糖苷的能力,并且另外一些β-葡糖苷酶可作用于α-1,4-底物如淀粉。β-葡糖苷酶活性可通过本领域熟知的方法来测量,包括本文以下描述的测定法。

术语“β-葡糖苷酶多肽”是指具有β-葡糖苷酶活性的多肽。

术语“β-葡糖苷酶多核苷酸”是指编码具有β-葡糖苷酶活性的多肽的多核苷酸。

“纤维素水解活性”包括外切葡聚糖酶活性(CBH)、内切葡聚糖酶(EG)活性和/或β-葡糖苷酶活性。

术语“外切葡聚糖酶”、“外切纤维二糖水解酶”、或“CBH”是指分类为E.C.3.2.1.91的一组纤维素酶。这些酶从纤维素的还原性末端或非还原性末端水解纤维二糖。

术语“内切葡聚糖酶”或“EG”是指分类为E.C.3.2.1.4的一组纤维素酶。这些酶水解纤维素内部的β-1,4糖苷键。

如本文所用,术语“分离的”是指从与之通常缔合的组分(其他蛋白、核酸、细胞等等)中部分地或完全地分开的核酸、多核苷酸、多肽、蛋白或其他组分。

术语“野生型”当应用于多肽(蛋白)时表示由自然存在的微生物诸如细菌或丝状真菌表达的多肽(蛋白)。当应用于微生物时,术语“野生型”是指天然的非重组微生物。关于C1 β-葡糖苷酶,野生型Bgl1是指具有SEQ IDNO:2的残基20-870的序列的蛋白的成熟(分泌)形式。

如本文所用的“变体”表示包括相对于野生型C1 β-葡糖苷酶(Bgl1)或野生型多核苷酸的一个或多个修饰(诸如在多肽或多核苷酸中的一个或多个特定的氨基酸残基或者一个或多个特定的核苷酸或密码子的取代、插入、缺失和/或截短)的β-葡糖苷酶多肽或编码β-葡糖苷酶的多核苷酸。

“参考β-葡糖苷酶序列”是指用作序列比较的基础的限定序列,诸如SEQID NO:2。参考β-葡糖苷酶序列可以是较大序列的子集(subset)。一般地说,参考序列为多肽的至少25个氨基酸残基长度、至少50个残基长度、至少100个残基长度、至少150个残基长度、至少200个残基长度、至少300个残基长度、至少350个残基长度、至少500个残基长度、至少600个残基长度、至少700个残基长度、或多肽的全长。

核酸(诸如多核苷酸)、多肽或细胞当是人工的或工程改造的,或衍生自或包含人工的或工程改造的蛋白或核酸时,它们是“重组的”。例如,多核苷酸被插入到载体中或任何其他异源位置(例如,重组生物的基因组中)以使其不与自然界发现的正常情况下在该多核苷酸两侧的核苷酸序列相缔合,这样的多核苷酸是重组多核苷酸。从重组多核苷酸体外或体内表达的蛋白是重组多肽的实例。同样,不在自然界出现的多核苷酸序列例如自然存在的基因的变体是重组的。

“改进的特性”是指与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)相比展示任何特性上的改进的β-葡糖苷酶多肽。改进的特性可包括增加的蛋白表达、热活性、热稳定性、pH活性、pH稳定性、产物特异性、提高的比活性、底物特异性、对底物或终产物抑制的提高的抗性、改变的pH/温度曲线和化学稳定性。

具有“改进的β-葡糖苷酶活性”的变体,当该术语在本文使用时,表示显示在指定的时间在指定的反应条件下发生的底物水解的量相对于参考序列增加的变体。可使用本领域已知的多种方法测量β-葡糖苷酶活性,诸如本文以下所述的纤维二糖测定法。为了比较两个重组表达的蛋白的β-葡糖苷酶活性,可比较比活性(每摩尔酶的活性或每克酶的活性)。可选地,可在相同条件下培养表达和分泌重组蛋白的细胞并且可比较每体积培养基的β-葡糖苷酶活性。

如本文所用的术语“改进的热稳定性”表示相对于野生型酶展示“残余活性”的增加的变体酶。通过将酶(变体或参考,例如,野生型)暴露于提高的温度持续一段时间的应激条件并然后在参考(例如野生型)酶正常具有活性的条件下确定β-葡糖苷酶活性,来确定残余活性。暴露于应激条件下的酶的β-葡糖苷酶活性(“a”)与其中酶没有被暴露于应激条件的对照的β-葡糖苷酶活性(“b”)比较,且残余活性等于比值a/b。具有增加的热稳定性的变体将具有比参考(例如野生型)酶更大的残余活性。在下文实施例中提供了用于确定热稳定性的示例性条件。在一个实施方案中,酶被暴露于65℃、pH 5的应激条件6小时,并且在50℃,pH 5测定1.5小时。

术语“同一性百分比(percent identity)”、“%同一性”、“同一百分比(percentidentical)”和“%同一”在本文被互换使用是指通过ClustalW分析(可从European Bioinformatics Institute,Cambridge,UK获得的W 1.8版)获得的氨基酸序列同一性百分比:计算比对中相同匹配的数目并用此相同匹配的数目除以参考序列的长度,并且使用以下缺省ClustalW参数以达到缓慢的/准确的逐对最佳比对-空位开放罚分(Gap Open Penalty):10;空位延伸罚分(GapExtension Penalty):0.10;蛋白权重矩阵(Protein weight matrix):Gonnet系列;DNA权重矩阵:IUB;Toggle Slow/Fast逐对比对=SLOW或FULL比对。

两条序列当以下时候是“最佳比对的”:为相似性评分使用限定的氨基酸取代矩阵(例如,BLOSUM62)、空位存在罚分和空位延伸罚分对这两条序列进行比对以达到该序列对可能的最高分数。氨基酸取代矩阵及其在定量两条序列之间的相似性上的应用是本领域熟知的。参见,例如,Dayhoff等人(1978),″A model of evolutionary change in proteins″;″Atlas of Protein Sequence andStructure,″第5卷,增刊3(编辑M.O.Dayhoff),pp.345-352,Natl.Biomed.Res.Round.,Washington,D.C.;以及Henikoff等人(1992)Proc.Natl.Acad.Sci.USA,89:10915-10919,二者均通过引用并入本文。BLOSUM62矩阵在序列比对方案诸如Gapped BLAST 2.0中通常用作缺省评分取代矩阵(default scoringsubstitution matrix)。空位存在罚分用于在比对序列之一引入单个氨基酸空位,而空位延伸罚分用于被插入到已开放的空位中的每个另外的氨基酸空位置。通过比对开始和结束所在的每条序列的氨基酸位置以及任选地通过在一条或两条序列中插入一个空位或多个空位以达到最高可能评分,来限定比对。尽管最佳比对和评分可手动完成,但通过使用计算机执行的比对算法例如描述于Altschul,等人(1997)Nucleic Acids Res.,25:3389-3402(通过引用并入本文)的gapped BLAST 2.0促进该过程,并且该算法在美国国立生物技术中心(National Center for Biotechnology Information)网站为公众可用。可使用容易获得的程序诸如由上文Altschul,等人(1997)描述的PSI-BLAST,准备最佳比对和多重比对。一个有用的比对工具是“T-Coffee”(Notredame等人,2000,J.Mol.Bio.302:205-17)。可使用缺省参数执行T-Coffee比对(T-CoffeeTechnical Documentation,8.01版,2009年7月,WorldWideWeb.tcoffee.org)。

“对应于”、“参考”或“相对于”在对给定的氨基酸序列或多核苷酸序列编号的背景下使用时,是指在给定的氨基酸序列或多核苷酸序列与参考序列比较时对指定的参考序列的残基的编号。

氨基酸或核苷酸碱基的“位置”由根据其相对于N末端(或5’-端)的位置顺序地辨别每个氨基酸(或核苷酸碱基)的编号表示。由于在确定最佳比对时必须被考虑的缺失、插入、截短、融合等,一般来说通过简单地从N末端计数而确定的测试序列中的氨基酸残基编号不一定与其在参考序列中的对应位置的编号相同。例如,在变体具有相对于比对的参考序列的缺失的情况下,在变体中将不存在对应于参考序列中该缺失位点处的位置的氨基酸。在比对的参考序列中存在插入的情况下,该插入将不会对应于参考序列中编号的氨基酸位置。在截短或融合的情况下,在参考序列或比对序列中可存在不对应于对应序列中的任何氨基酸的氨基酸串(stretches of amino acids)。

当核酸缔合形成双链结构(通常在溶液中)时,它们“杂交”。核酸杂交是由于各种被很好表征的物理-化学力,诸如氢键键合、溶剂排斥(solventexclusion)、碱基堆积等。如本文所用,在核酸杂交实验诸如Southern杂交或Northern杂交的背景下术语“严格的杂交洗涤条件”是序列依赖性的,并且在不同环境参数下是不同的。对核酸杂交的广泛指导见Tijssen,1993,″Laboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes,″第I部分,第2章(Elsevier,New York),其通过引用并入本文。对于至少100个核苷酸长度的多核苷酸而言,对低严格条件到极高严格条件限定如下:在标准的DNA印迹程序后,在42℃在5×SSPE,0.3%SDS,200μg/ml剪切和变性的鲑鱼精DNA,以及对于低严格性的25%甲酰胺,对于中等和中-高严格性的35%甲酰胺,或对于高严格性和极高严格性的50%甲酰胺中预杂交和杂交。对于至少100个核苷酸长度的多核苷酸,使用2×SSC,0.2%SDS至少在50℃(低严格性)、至少在55℃(中等严格性)、至少在60℃(中-高严格性)、至少在65℃(高严格性)以及至少在70℃(极高严格性)将载体材料最终洗涤三次,每次15分钟。

术语“培养(culturing)”或“培养(cultivation)”是指在液体或固体培养基中在适合的条件下使微生物细胞的群体生长。

术语“接触”是指将相应的酶放置在与相应的底物足够靠近的位置以使酶能够将底物转化成产物。例如,将包含酶的溶液与相应的底物组合将实现接触。此类接触还包括在包含酶底物的介质中孵育分泌酶的细胞。

如本文所用,提及细胞“代谢”可溶性糖或其他底物产生终产物,表示该糖充当细胞中代谢反应的碳源和/或能量源。通常细胞是微生物细胞,诸如真菌细胞或细菌细胞。

如本文所用,关于细胞使用的术语“转化的”或“转化”表示细胞具有整合入其基因组或作为经过多代被维持的游离型质粒的非天然核酸序列。

术语“引入”在将核酸序列插入细胞中的背景下表示被转染、转导或转化(统称为“转化”)或以其他方式并入到细胞的基因组中或作为附加体被保持在细胞内。

术语“可操作地连接”在本文是指如下配置:在该配置中控制序列被适当安放在相对于DNA序列的编码序列的位置以使得该控制序列影响多肽的表达。

当用于本文时,术语“编码序列”旨在覆盖直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开放阅读框确定,开放阅读框通常以ATG起始密码子开始。编码序列通常包括DNA、cDNA和/或重组核苷酸序列。

启动子序列、信号肽、或其他序列当可操作地连接于在自然界与该启动子、信号肽或其他序列不相关的核酸或蛋白序列时,它们是“异源的”。

如本文所用,术语“表达”包括多肽的产生所涉及的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰和分泌。

术语“表达载体”在本文是指包括编码本发明的多肽的区段并且可操作地连接于提供其转录的另外区段的线型或环状的DNA分子。

β-葡糖苷酶变体多肽在其具有β-葡糖苷酶活性时是“酶活性的(enzymatically active)”。

术语“前蛋白(pre-protein)”是指包括附加的氨基末端信号肽(或前导序列)区域的蛋白。在分泌之前信号肽酶将信号肽从前蛋白上切割以产生“成熟的”或“分泌的”蛋白。

如本文所用,“起始密码子”是编码蛋白的第一个氨基酸残基(甲硫氨酸)的ATG密码子。

在序列同一性的上下文中,除非另外说明,否则本说明书中提及“至少x%序列同一性”意指“x%序列同一性”以及其中%序列同一性由每个整数从(x+1)%到99%同一性限定的可选实施方案,就如同每个可选实施方案被明确列出。例如,提及“对SEQ ID NO:2的至少70%序列同一性”或“对SEQ ID NO:2的氨基酸残基20-870的至少70%序列同一性”是指对氨基酸SEQ ID NO:2或SEQ ID NO:2的残基20-870具有至少71%序列同一性、至少72%同一性、至少73%同一性、至少74%同一性、至少75%同一性、至少76%同一性、至少77%同一性、至少78%同一性、至少79%同一性、至少80%同一性、至少81%同一性、至少82%同一性、至少83%同一性、至少84%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、或至少99%同一性的可选实施方案。对于延伸SEQ ID NO:2的残基20-870的整个851个氨基酸长度的比对来说,在变体序列与SEQ IDNO:2之间可存在至少596个相同残基(identity),有时至少604、至少613、至少622、至少630、至少638、至少647、至少655、至少664、至少672、至少681、至少723、至少766、或至少808个相同残基(identity)。

如本文所用,“C1”是指由Garg,A.,1966,“An addition to the genusChrysosporium Corda”Mycopathologia 30:3-4描述的真菌菌株。“Chrysosporium lucknowense”包括描述于美国专利第6,015,707号、5,811,381号和6,573,086号;美国专利公布第2007/0238155号、US 2008/0194005、US2009/0099079;国际专利公布第WO 2008/073914号和WO 98/15633号的菌株,并且包括但不限于Chrysosporium lucknowense Garg 27K、VKM-F 3500D(登录号VKM F-3500-D)、C1菌株UV13-6(登录号VKM F-3632 D)、C1菌株NG7C-19(登录号VKM F-3633D)和C1菌株UV18-25(VKM F-3631 D),其全部被保藏在俄罗斯科学院全俄微生物菌种保藏中心(VKM),BakhurhinaSt.8,Moscow,Russia,113184,以及其任何衍生菌株(derivative)。尽管最初被描述为Chrysosporium lucknowense,目前可认为C1是嗜热毁丝霉(Myceliophthora thermophilia)的菌株。示例性C1衍生菌株包括其中一个或多个内源基因或序列被缺失或修饰和/或一个或多个外源基因或序列被引入的修饰的生物体。衍生菌株包括UV18#100fΔalp1、UV18#100fΔpyr5 Δalp1、UV18#100.f Δalp1 Δpep4 Δalp2、UV18#100.f Δpyr5 Δalp1 Δpep4 Δalp2和UV18#100.f Δpyr4 Δpyr5 ΔaIp 1 Δpep4 Δalp2,如在通过引用并入本文的WO2008073914中所描述的。

以下命名法可用于描述多肽或多核苷酸序列中相对于参考序列的取代:“R-#-V”,其中#是指在参考序列中的位置,R是指在参考序列中该位置处的氨基酸(或碱基),并且V是指在变体序列中该对应位置处的氨基酸(或碱基)。例如,对于参考SEQ ID NO:2而描述的变体多肽而言,“D369L”表示在该变体多肽中,在该参考序列第369位的天冬氨酸被亮氨酸取代,其中通过该变体序列与SEQ ID NO:2的最佳比对确定氨基酸位置。类似地,“S182L/W”描述了两种变体:其中在第182位的丝氨酸被亮氨酸取代的变体,和其中在第182位的丝氨酸被色氨酸取代的变体。

以下约定用来描述Bgl1变体中的氨基酸位置。相对于参考序列SEQ IDNO:2对氨基酸位置进行编号,SEQ ID NO:2是野生型C1 Bgl1前蛋白(包括信号肽)的序列。确定序列同一性的程度(例如,“至少70%同一性”)或描述缺失(例如,在蛋白c末端的残基的缺失)的比对是相对于野生型Bgl1蛋白的分泌形式,即SEQ ID NO:2的残基20-870。核苷酸碱基取代相对于SEQID NO:1而编号。信号肽(SEQ ID NO:2的残基1-19)中的取代是指Bgl1前蛋白的序列。

II.引言

真菌C1产生多种纤维素酶和其他协同作用来催化纤维素的解晶和水解产生可溶性糖的酶。C1由Garg,1966,“An addition to the genus Chrysosporiumcorda”Mycopathologia 30:3-4描述。还参见美国专利第6,015,707号和6,573,086号,为所有目的将其通过引用并入本文。

C1基因组已被至少部分测序,如美国专利公布US 2007/0238155、US2008/0194005和US 2009/0099079所示,为所有目的将其通过引用并入本文。C1 β-葡糖苷酶1(bgl1)基因及编码蛋白(Bgl1)的序列作为SEQ ID NO:1和SEQ ID NO:2在本文给出(还参见共同未决的申请第61/247,379号和PCT/US 10/50982,其通过引用并入本文)。注意这些序列与专利公布US2007/0238155的Bgl1序列不同。

本文描述的C1 β-葡糖苷酶变体对于从纤维素生物质产生可溶性糖是极其有用的。在一方面,本发明涉及通过使包含纤维二糖的组合物与重组表达的C1 β-葡糖苷酶变体在其中该纤维二糖被酶促转化为葡萄糖的条件下接触来产生葡萄糖的方法。在一方面,可将表达β-葡糖苷酶变体的重组宿主细胞与纤维二糖在其中β-葡糖苷酶被细胞表达(和在某些实施方案中被分泌)的条件下组合。可选地,可将纯化的或部分纯化的重组β-葡糖苷酶蛋白与纤维二糖接触。在本发明的一个方面,接触包括在包含从纤维素原料产生的纤维二糖的培养基中培养重组宿主细胞。例如,本文描述的C1 β-葡糖苷酶变体显示与其他纤维素酶联合的在糖化反应中的益处,所述其他纤维素酶诸如里氏木霉(T.reesei)纤维素酶(例如,里氏木霉CBH1、CBH2和/或EG1或其变体,和/或里氏木霉培养液)和C1纤维素酶(参见美国专利第6,015,707号、5,811,381号和6,573,086号;美国专利公布第2007/0238155号、US2008/0194005号、US 2009/0099079号;国际专利公布第WO 2008/073914号和WO 98/15633号,其全部通过引用并入本文)。

在以下章节中描述了本发明的各方面。

III.在本发明的方法中使用的β-葡糖苷酶蛋白的特性

在一方面,本发明提供了通过将包含包含编码C1 Bgl1变体的核酸序列的载体或游离型质粒或具有整合到其基因组中的编码C1 Bgl1变体的核酸序列的宿主细胞培养在其中β-葡糖苷酶蛋白或其酶活性的片段被表达的条件下来表达β-葡糖苷酶蛋白的方法。一般来说表达的蛋白包含在分泌酶时被细胞除去的信号肽。在一个实施方案中,编码C1 Bgl1变体的序列的转录受可操作地连接的异源启动子控制。

β-葡糖苷酶多肽变体

本发明提供了作为C1 β-葡糖苷酶(Bgl1)变体的新颖的酶。本发明的β-葡糖苷酶多肽变体是尤其在与商业糖化工艺相关的条件下显示β-葡糖苷酶活性、通常是比野生型C1 β-葡糖苷酶(SEQ ID NO:2的残基20-870)更大的β-葡糖苷酶活性的Bgl1的变体。还包括在与商业糖化工艺相关的条件下显示更大的稳定性(例如,相对于野生型β-葡糖苷酶增加的热稳定性)的β-葡糖苷酶多肽变体。

本发明提供了具有比野生型(WT)C1 Bgl1蛋白更大的活性和/或热稳定性并具有见于本文所述的增加的活性和/或增加的热稳定性变体的取代中的至少一种的Bgl1变体。如以下更详细讨论的,制备了编码野生型(WT)C1 Bgl1蛋白(SEQ ID NO:2)的多核苷酸。如下文实施例1所述将该多核苷酸插入到表达载体中,通过诱变和定向进化制备了编码变体Bgl1蛋白的多核苷酸的文库,并且评价了个体Bgl1变体的特性(例如,β-葡糖苷酶活性和热稳定性)(见表2-7和实施例2-9,下文)。在具有比野生型更大的活性和/或比野生型更大的热稳定性的变体中鉴定了许多氨基酸取代和取代组合。参见表2。选择具有增加的活性和热稳定性的变体并使其经历进一步的诱变和筛选。参见表3。选择来自这轮诱变和筛选的变体并使其经历进一步的诱变和筛选。参见表4。选择来自这又一轮筛选的变体并使其经历另外的诱变和筛选。参见表5。选择来自这轮筛选的两个变体并使其经历进一步的诱变和筛选。参见表6和表7。

更具体地说,本发明提供了具有比野生型C1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,且其包括与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:K57;A88;I106;N112;Q119;T120;A123;R132;Y135;A136;A141;K142;L149;G158;P161;P172;T177;I179;G180;M181;S182;E183;K186;A197;G202;Y219;N220;S222;T224;I229;M234;F242;A243;V246;Q258;D274;V286;Q291;Q313;V318;A343;T354;T357;D358;E360;D369;P374;I375;A378;Q381;E385;S388;V390;A394;N398;E402;K406;I428;S434;N437;E449;Q474;A475;T482;S489;Y491;K530;N536;T540;T565;V674;R682;I867;E868;P870(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。“取代”在该背景下表示该变体蛋白中的残基不同于所显示的残基。例如,“A88”表示在第88位包含除了丙氨酸以外的氨基酸(即,另外19种自然存在的氨基酸之一)的变体。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

本发明另外提供了具有比(WT)C1 Bgl1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体包括与野生型C1(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列;在位置Q291、D369和E402的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:I106、A109、Q119、T120、R132、Y135、M181、Q215、A243、V246、Q258、A265、D274、N278、Q313、F314、G332、T357、D358、P374、E385、S434、N437、A475、S489、Y491、E493、K495、K497、S501、A503E、N504、A505、N521、K530、N536、T540、D566、T591、A601、K610、T611、R612、S614、L620、G628、T635、V638、V648、D650、S652、N670、R672、V674、S676、T685、T687、A689、Q690、T699、D703、K708、Y715、A732、E742、L757、V775、T777和D781(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

本发明另外提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体包括与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列;在位置Q258、Q291、Q313、D369、E402、S434、A475、K495和G628的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:A4、A15、E21、S22、K24、V25、H26、Q27、P29、L30、N45、D47、Q55、S58、A79、Q85、I106、A109、Q119、Y135、A136、P161、V175、G180、G202、G216、I221、L237、D244、V253、V260、L275、D311、F314、A343、D358、E360、Q381、E385、A394、A404、A405、K421、I428、P436、N437、M454、D470、R476、A477、Q479、T482、Y491、E493、E494、T496、S501、A505、N536、V559、V562、N588、S604、R612、G616、A617、G626、N627、F634、D646、D650、S652、R672、V673、T685、T687、A689、Q690、K708、Y715、Q716、A732、A748、D751、L757K、S764、R769、V775、T777、T783、T785、S787、S799、P806、K807、R817、E819、E822、T823、V840、V846、I847、S848、Y850、K866、和P870(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

本发明另外提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体包括与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列;在位置Q258、Q291、Q313、D369、E402、S434、A475、K495、G628、A689和Y715的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:C8、L9、K24、V25、D47、S58、A79、Q85、I106、A109、A136、V175、L237、A243、V253、V260、D274、L275、F314、A343、Q381、E385、P436、N437、Q474、R476、A505、S550、N588、S604、G616、G626、D650、D651、S652、V674、T687、Q690、D709、E710、A732、D733、Y736N、L757、S764、T777、T783、T785、K807、M816、D844、V846、L869和P870(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

本发明另外提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体包括与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列;在位置D47、Q258、Q291、Q313、A343、D369、E402、S434、A475、K495、G628、T687、A689和Y715的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:A79、Q85、V260、L275、F314、D395、P439、A505、D646、T693、N723、A730、A732、S764、R769、T827和Y855(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

本发明另外提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体包括与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列;在位置I106、Q258、V260、Q291W、Q313、F314、D369、E402、S434、K495、G628、A689、Y715和A732的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:A109、A343、A475、A505、A689、A79、C8、D47、L275、N315、Q85、T591和T687(其中通过与SEQID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是作为该野生型残基的保守性替代物(substitute)的残基。如以下所讨论的,在该背景下,残基的保守性替代物是在表1中鉴定的同一组中的另一个残基。

表1

在一些实施方案中,变体蛋白中的氨基酸既不是野生型残基也不是为如以下的对所限定的那样通常与该野生型残基交换的残基的残基:Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

如表2中概括的,在某些实施方案中,本发明提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性,与野生型C1 β-葡糖苷酶(Bgl1)(SEQID NO:2的残基20-870)至少约70%相同并且具有选自以下组成的组的至少一个氨基酸残基取代:K57R;A88S;I106V;N112V;Q119E/L;T120M/Y/V/H;A123N;R132K/G/W;Y135I/Q/M;A136E;A141F;K142R;L149Q/M;G158D;P161S;P172A;T177I;I179M;G180E;M181Y;S182L/W;E183G/M/Q/K;K186R;A197V;G202M/V;Y219V;N220Y/S/L;S222Q/E;T224N;I229M;M234E/I;F242L;A243V;V246L;Q258N;D274Y/N;V286I;Q291W/A/F;Q313M;V318E;A343V/T;T354Q;T357L/P;D358K/N;E360R/A/D;P374Y;I375V;A378K/T;Q381V/D/I/L;D369Q/L/Y/C/A/I/P/E/K/R/F/M/H/V;E385L;S388W/C;V390I;A394G/V/L/P/Q;N398G;E402N;K406D;I428V;S434P;N437F/Y/D/L/W;E449Q;Q474I;A475F/Y/H/W/C;T482A;S489L;Y491H/F;K530M/G;N536K;T540K;T565A/G/P;V674I;R682W;I867M;E868R;P870S(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、30、35、40、45、50、55、60、65、70、75或更多个位置处的取代的任何组合。

如表3中概括的,在某些实施方案中,本发明提供了包括具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该变体与野生型C1(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同;具有取代Q291W、D369H/L/R/Y和E402N;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:A109S、A243V、A265S、A475C/F/L/W、A503E、A505C、A601T、A689I、A732G/M、D274Y、D358E/K/N、D566G、D650F/V、D703K、D781N、E385L、E493A/V/Y、E742G、F314L/V、G332D、G628L/V/W、I106V、K495F/H/I/N/Q/V、K497R、K530C/D/E/I/M/N/V、K610S、K708F、L620M、L757K、M181Y、N278Y、N437D/F/I/K/L/V/W/Y、N504Y、N521C、N536K、N670D、P374Y、Q119E、Q215E/M、Q258H/N、Q313M、Q690A/K/R、R132H、R612H/P、R672A/D/F/G/I/S/T/V、S434P、S489I/L/N/T、S501H/N/R、S614A/C/D/H/L/R/V/Y、S652D、S676C、S764F、T120H/Y、T357A、T540K、T591A/C/R、T611A/H/Q、T635A/I/V、T685V、T687C/F/K/L/M/W/Y、T699L、T777N、T779S、V246I、V638E/R/S、V648W、V674M、V775C、Y135Q、Y491F/H/L和Y715P(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、30、35、40、45、50、55、60、65或70或更多个位置处的取代的任何组合。

如表4中概括的,在某些实施方案中,本发明提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性,与野生型C1β-葡糖苷酶(Bgl1)(SEQID NO:2的残基20-870)至少约70%相同,具有取代Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N和G628W;并且具有选自以下组成的组的至少一个取代:A4V、A15V、A109S/T、A136L、A343C、A394G、A404S、A405T、A477G、A505C、A617V、A689I、A732G/M/S、A748T、A79E/G/M、D244H、D311N、D358K、D470N、D47I、D646N、D650F/N/Y、D751N、E21Q/R、E360D、E385L、E493A/V/Y、E494K、E819A/L/V、E822A/G/K/M、F314L/V、F634A、G180E、G202M、G216L、G616D、G626D、H26R、I106V、I221V、I428V、I847T、K24G/L/T、K421R、K708F、K807R、K866I/Q、L237Y、L275Y、L30K、L757K、M454E、N437W、N45H、N536K、N588F、N627H、P161S、P29M/Q/R、P436E/Q、P806L、P870S、Q119E、Q27H/R、Q381V、Q479R、Q55R、Q690A/H/K、Q716R、Q85N、R476Q、R612H、R672G、R769H、R817P、S22L/R、S501C/R、S58G、S604I、S652D、S764F、S787G、S799N、S848N、T482A、T496A、T685V、T687C/K/M、T777N、T783H/Q、T785L、T823K、V175A、V253F、V25A/G/R、V260G/L、V559T、V562C/L、V673A、V775C、V840I、V846F、Y135M/Q、Y491F、Y715P和Y850H/Q(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,该Bgl1多肽在位置A475不具有取代。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、30、35、40、45、50、55、60、65、70、75、80或更多个位置处的取代的任何组合。

如表5中概括的,在某些实施方案中,本发明提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性,与野生型C1β-葡糖苷酶(Bgl1)(SEQID NO:2的残基20-870)至少约70%相同,具有取代Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N、G628W、A689I和Y715P;并且具有选自以下组成的组的至少一个取代:C8A、L9F、K24G/T、V25A、D47I/N、S58G、A79E/G/M、Q85H/N、I106V、A109S/T、A136L、V175A、L237Y、A243G、V253F、V260G、D274Y、L275F/Y、F314L/V、A343C/G、Q381V、E385L、P436Q、N437D/K、Q474I/L、R476G、A505C、S550C、N588F、S604A/C/I/V、G616D、G626D、D650N/Y、D651E、S652D、V674I、T687C/K/W、Q690H/K、D709E、E710G、A732G/M/V、D733G、Y736N、L757I/K、S764F、T777N、T783A、T785L、K807R、M816L、D844G、V846F/L/Q、L869R和P870S(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,该Bgl1多肽变体在位置A475不具有取代。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、25、30、35、40、45、50或更多个位置处的取代的任何组合。

如表6中概括的,在某些实施方案中,本发明提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性,与野生型C1 β-葡糖苷酶(Bgl1)(SEQID NO:2的残基20-870)至少约70%相同,具有取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、A475L、K495N、G628W、T687K、A689I、Y715P;并且具有选自以下组成的组的至少一个取代:A79E/G/M、Q85N、V260G、L275Y、F314L/V、D395N、P439S、A505C、D646N、T693A/E、N723G、A730S、A732G/M/V、S764Y、R769H、T827I和Y855(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,该Bgl1变体多肽具有代替T687K的取代T687K或T687W。在一些实施方案中,该Bgl变体多肽在位置A475不具有取代。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14或15或更多个位置处的取代的任何组合。

如表7中概括的,在某些实施方案中,本发明提供了包括如下氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体:该氨基酸序列具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性,与野生型C1 β-葡糖苷酶(Bgl1)(SEQID NO:2的残基20-870)至少约70%相同,具有取代I106V、Q258N、V260G、Q291W、Q313M、F314L/V、D369R、E402N、S434P、K495N、G628W、A689I、Y715P和A732G;并且具有选自以下组成的组的至少一个取代:A109S/T、A343C/G、A475L、A505C、A79E/G/M、C8G、D47I、L275F/Y、N315D、Q85H/N和T591I、T687C/K/W(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。在一些实施方案中,该Bgl1蛋白另外具有取代F314V。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11或12或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ IDNO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽具有选自以下组成的组的至少一个氨基酸残基取代:K57;A88;I106;N112;Q119;T120;A123;R132;Y135;A136;A141;K142;L149;G158;P161;P172;T177;I179;G180;M181;S182;E183;K186;A197;G202;Y219;N220;S222;T224;I229;M234;F242;A243;V246;Q258;D274;V286I;Q291;Q313;V318;A343;T354;T357;D358;E360;P374;I375;A378;Q381;D369;E385L;S388;V390I;A394;N398;E402;K406;I428;S434;N437;E449Q;Q474I;A475;T482;S489;Y491;K530;N536;T540;T565;V674;R682;I867;E868;P870(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ IDNO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体;其中该编码多肽在位置Q291、D369和E402中的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:I106、A109、Q119、T120、R132、Y135、M181、Q215、A243、V246、Q258、A265、D274、N278、Q313、F314、G332、T357、D358、P374、E385、S434、N437、A475、S489、Y491、E493、K495、K497、S501、A503E、N504、A505、N521、K530、N536、T540、D566、T591、A601、K610、T611、R612、S614、L620、G628、T635、V638、V648、D650、S652、N670、R672、V674、S676、T685、T687、A689、Q690、T699、D703、K708、Y715、A732、E742、L757、V775、T777和D781(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多个位置处的取代的任何组合。

本发明还提供了具有比WT C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ ID NO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体;其中该编码多肽在位置Q258、Q291、Q313、D369、E402、S434、A475、K495和G628中的每一个具有取代;以及在选自以下组成的组的位置处具有至少一个氨基酸残基取代:A4、A15、E21、S22、K24、V25、H26、Q27、P29、L30、N45、D47、Q55、S58、A79、Q85、I106、A109、Q119、Y135、A136、P161、V175、G180、G202、G216、I221、L237、D244、V253、V260、L275、D311、F314、A343、D358、E360、Q381、E385、A394、A404、A405、K421、I428、P436、N437、M454、D470、R476、A477、Q479、T482、Y491、E493、E494、T496、S501、A505、N536、V559、V562、N588、S604、R612、G616、A617、G626、N627、F634、D646、D650、S652、R672、V673、T685、T687、A689、Q690、K708、Y715、Q716、A732、A748、D751、L757K、S764、R769、V775、T777、T783、T785、S787、S799、P806、K807、R817、E819、E822、T823、V840、V846、I847、S848、Y850、K866和P870(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ IDNO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽具有选自以下组成的组的至少一个氨基酸残基取代:K57R;A88S;I106V;N112V;Q119E/L;T120M/Y/V/H;A123N;R132K/G/W;Y135I/Q/M;A136E;A141F;K142R;L149Q/M;G158D;P161S;P172A;T177I;I179M;G180E;M181Y;S182L/W;E183G/M/Q/K;K186R;A197V;G202M/V;Y219V;N220Y/S/L;S222Q/E;T224N;I229M;M234E/I;F242L;A243V;V246L;Q258N;D274Y/N;V286I;Q291W/A/F;Q313M;V318E;A343V/T;T354Q;T357L/P;D358K/N;E360R/A/D;P374Y;I375V;A378K/T;Q381V/D/I/L;D369Q/L/Y/C/A/I/P/E/K/R/F/M/H/V;E385L;S388W/C;V390I;A394G/V/L/P/Q;N398G;E402N;K406D;I428V;S434P;N437F/Y/D/L/W;E449Q;Q474I;A475F/Y/H/W/C;T482A;S489L;Y491H/F;K530M/G;N536K;T540K;T565A/G/P;V674I;R682W;I867M;E868R;P870S(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ IDNO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽具有取代Q291W、D369H/L/R/Y和E402N;且具有选自以下组成的组的至少一个氨基酸残基取代:A109S、A243V、A265S、A475C/F/L/W、A503E、A505C、A601T、A689I、A732G/M、D274Y、D358E/K/N、D369H/L/R/Y、D566G、D650F/V、D703K、D781N、E385L、E402N、E493A/V/Y、E742G、F314V、G332D、G628L/V/W、I106V、K495F/H/I/N/Q/V、K497R、K530C/D/E/I/M/N/V、K610S、K708F、L620M、L757K、M181Y、N278Y、N437D/F/I/K/L/V/W/Y、N504Y、N521C、N536K、N670D、P374Y、Q119E、Q215E/M、Q258H/N、Q291W、Q313M、Q690A/K/R、R132H、R612H/P、R672A/D/F/G/I/S/T/V、S434P、S489I/L/N/T、S501H/N/R、S614A/C/D/H/L/R/V/Y、S652D、S676C、S764F、T120H/Y、T357A、T540K、T591A/C/R、T611A/H/Q、T635A/I/V、T685V、T687C/F/K/L/M/W/Y、T699L、T777N、T779S、V246I、V638E/R/S、V648W、V674M、V775C、Y135Q、Y491F/H/L和Y715P(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个位置处的取代的任何组合。

本发明还提供了具有比野生型C1 Bgl1蛋白更大的活性和/或热稳定性且具有由在严格条件下与SEQ ID NO:1的互补序列杂交(例如,在与SEQ IDNO:1精确互补的核酸的基本整个长度内)的核酸编码的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中该编码多肽在位置Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N和G628W处具有取代;且具有选自以下组成的组的至少一个取代:A4V、A15V、A109S/T、A136L、A343C、A394G、A404S、A405T、A477G、A505C、A617V、A689I、A732G/M/S、A748T、A79E/G/M、D244H、D311N、D358K、D470N、D47I、D646N、D650F/N/Y、D751N、E21Q/R、E360D、E385L、E493A/V/Y、E494K、E819A/L/V、E822A/G/K/M、F314L/V、F634A、G180E、G202M、G216L、G616D、G626D、H26R、I106V、I221V、I428V、I847T、K24G/L/T、K421R、K708F、K807R、K866I/Q、L237Y、L275Y、L30K、L757K、M454E、N437W、N45H、N536K、N588F、N627H、P161S、P29M/Q/R、P436E/Q、P806L、P870S、Q119E、Q27H/R、Q381V、Q479R、Q55R、Q690A/H/K、Q716R、Q85N、R476Q、R612H、R672G、R769H、R817P、S22L/R、S501C/R、S58G、S604I、S652D、S764F、S787G、S799N、S848N、T482A、T496A、T685V、T687C/K/M、T777N、T783H/Q、T785L、T823K、V175A、V253F、V25A/G/R、V260G/L、V559T、V562C/L、V673A、V775C、V840I、V846F、Y135M/Q、Y491F、Y715P、Y850H/Q(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。以上列出的取代的有益组合包括在以上鉴定的位置中的任何2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个位置处的取代的任何组合。在某些实施方案中,该C1 Bgl1蛋白具有取代Q258N、Q291W、Q313M、D369L、E402N、S434P、A475L、K495N和G628W。

应理解本发明的Bgl1变体可包括除以上列出的氨基酸取代以外的另外的氨基酸取代(例如,另外的保守性取代)并且与野生型C1 Bgl1蛋白相比可小于全长。因而,本发明的Bgl1变体可包括相对于SEQ ID NO:2的残基20-870的插入或缺失(例如,在氨基端和/或羧基端截短)。C1 Bgl1蛋白的野生型分泌形式为约851个氨基酸长度;本发明的变体可比野生型更长或更短。为了举例说明且非限制,在一些实施方案中,变体可比野生型长度长或短达10%、有时达5%、有时达4%、有时达3%、有时达2%、有时达1%。

根据在以下文献中描述的方法进行变体的序列-活性分析,以鉴定具有可能对活性的最显著影响的取代:WO 03/075129、2003年3月3日提交的USSN10/379,378;R.Fox等人,2003,″Optimizing the search algorithm for proteinengineering by directed evolution,″Protein Eng.16(8):589-597以及R.Fox等人,2005,″Directed molecular evolution by machine learning and the influence ofnonlinear interactions,″J.Theor.Biol.234(2):187-199,其全部通过引用并入本文。

本发明的某些β-葡糖苷酶变体具有包括选自以下组成的组的至少一个氨基酸残基取代的氨基酸序列:Q119E;R132H;Y135Q;G180E;G202M/V;Q258N;D274Y;Q291W/A/F;D358K/N;D369L/Y/V/A/H/R/F/E/M/I/K/C/P/Q;P374Y;E385L;A394L;E402N;S434P;N437F/D/L/W/Y;Q474I;A475F/Y/H/C/W;T482A;S489L;K530M;N536K;T540K,预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q291W+D369L+E402N(如见于变体3)或取代Q291W+D369H/L/R/Y+E402N的氨基酸序列。在一些实施方案中,序列包括选自以下组成的组的至少一个氨基酸残基取代:Q258N/H、D358K/N、I106V、E385L、D274Y、K495H/I/N/Q、Q119E、Y135Q、G628W、R132H、N437I、S501R、P374Y、N437V、S614A、Q313M、L369H、S434P、N437W/D和Y491F。在一些实施方案中,至少一个取代的氨基酸残基是Q258N。在一些实施方案中,至少一个取代的氨基酸残基是D358K或Q258H。在一些实施方案中,至少一个取代的氨基酸残基是I106V、E385L、D274Y或K495H。在一些实施方案中,至少一个取代的氨基酸残基是K495I/N、Q119E、Y135Q或D358N。在一些实施方案中,至少一个取代的氨基酸残基是G628W、R132H、K495Q、N437I、S501R或P374Y。在一些实施方案中,至少一个取代的氨基酸残基是N437V、S614A、Q313M、L369H、S434P、N437W/D或Y491F。预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N和G628W(如见于变体269)和选自由Y715P、S764F、E385D/L、A732G/M、A689I、A109T、T687M/C/K、L757K、Q381V/D、A109S、T777N、I106V、T823K、Q716R、V846F、T685V、T687K、D650Y、F314V/L、S652D和I428V组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是Y715P。在一些实施方案中,至少一个取代的氨基酸残基是S764F、E385L、A732G、A689I、或A109T、或E285D。在一些实施方案中,至少一个取代的氨基酸残基是T687M、A732M或L757K。在一些实施方案中,至少一个取代的氨基酸残基是Q381V、A109S、T777N、I106V、T823K、T687C或Q716R。在一些实施方案中,至少一个取代的氨基酸残基是V846F、T685V、T687K、D650Y、F314V/L、S652D、Q381D或I428V。预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N、G628W、A689I和Y715P(如见于变体481);或取代258N、Q291W、Q313M、D369R、E402N、S434P、K495N、G628W、A689I和Y715P;以及选自由A79E/M/G、Q85N、I106V、A109S/T、V260G、F314L/V、A343C/G、A505C、T687K/W/C和A732G/M/V组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是T687W。在一些实施方案中,至少一个取代的氨基酸残基是T687C或T687W、V260G、A343C、A732G或A109T。在一些实施方案中,至少一个取代的氨基酸残基是F314V/L、A732M/V、A109S或A343G。在一些实施方案中,至少一个取代的氨基酸残基是A79E、A505C、I106V或A79M/G。预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、A475L、S434P、K495N、G628W、T687K、A689I及Y715P(如见于变体647)或取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、A475L、K495N、G628W、T687W、A689I、及Y715P;或取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、K495N、G628W、T687K/W/C、A689I及Y715P;以及选自由A79G/E/M、Q85N、V260G、L275Y、和F314L/V、以及A732G/M组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是A79E、A79M、A79G、A732G、V260G或F314L。在一些实施方案中,至少一个取代的氨基酸残基是Q85N、F314V或A732M。预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代I106V、Q258N、V260G、Q291W、Q313M、F314L/V、D369R、E402N、S434P、K495N、G628W、A689I、Y715P和A732G(如见于变体664)以及选自由D47I、A79G/E/M、A109T、A505C、A343C/G、T687W/C/K、N315D和L275F组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是A79E或A79G。在一些实施方案中,至少一个取代的氨基酸是A109T、A79M、A505C或A343C。在一些实施方案中,至少一个取代的氨基酸是T687W、T687C、D47I、T687K、N315D或A343G。预测这些取代是增加β-葡糖苷酶活性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括选自以下组成的组的至少一个氨基酸残基取代的氨基酸序列:I106V;A123N;G180E;M181Y;M234E;Q258N;Q291W/F/A;T357L/P;D358K;E360D;D369L/V/C/Y/R/K/M/A/H/E/F/Q/P/I;P374Y;E385L;A394G;N437D/L;T482A;S489L;K530M;N536K;T540K,预测这些取代是增加热稳定性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q291W、D369H/L/R/Y和E402N;以及选自由Q313M、Q258N/H、N536K、Q119E、S489I/N/L/T、T120Y、K495N/V/I/H/Q、I106V、T120H、N437I/D/W/F/K/L/V/Y、E385L、M181Y、D274Y、S434P、S501R、T591C、Y135Q、Y491H/F、T540K、N521C、T591R、G628W和A475L组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是Q313M或Q258N。在一些实施方案中,至少一个取代的氨基酸残基是N437I、K495N、Q258H或N536K。在一些实施方案中,至少一个取代的氨基酸残基是Q119E、S489I、T120Y、K495V、S489L、I106V、T120H或N437D。在一些实施方案中,至少一个取代的氨基酸残基是N437W、K495I、N437F、E385L、K495H、N437K、N437L、S489T、M181Y、D274Y、S434P或N437V。在一些实施方案中,至少一个取代的氨基酸残基是S501R、T591C、Y135q、Y491H、R491F、T540K、N521C、T591R、K495K、G628W、N437Y、S489N或A475L。预测这些取代是增加热稳定性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q258N、Q291W、Q313M、D369R、Q381V、E385L、E402N、S434P、A475L、K495N和G628W;以及选自由S764F、Y715P、E385L/D、A732G/M、A109T/S、T687M/C/K、T777N、I106V、L475A、F314V、D650Y、L757K、Q716R、T685V或F314L组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是S764F或Y715P。在一些实施方案中,至少一个取代的氨基酸残基是E385L或A732G。在一些实施方案中,至少一个取代的氨基酸残基是A109T或T687M。在一些实施方案中,至少一个取代的氨基酸残基是T777N、I106V、!732M、T687C、T687K、E385D、L475A或A109S。在一些实施方案中,至少一个取代的氨基酸残基是P720P、F314V、D650Y、L757K、Q716R、T685V或F314L。预测这些取代是增加热稳定性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N、G628W、A689I和715P(如见于变体481);以及选自由D47I、A79E、Q85N、I106V、A109S/T、V260G、L275Y、F314L/V、A505C、T687W/C/K和A732G/M/V组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是T687K/W/C。在一些实施方案中,至少一个取代的氨基酸残基是I106V、V260G、F314V、A732G、A109T、F314L、A732M、Q85N或A109S。在一些实施方案中,至少一个取代的氨基酸是F314、A732V、A505C、D47I、L275Y或A79E。预测这些取代是增加热稳定性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、A475L、K495N、G628W、T687K/W、A689I和Y715P(如见于变体647);或取代D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、K495N、G628W、T687K/W、A689I和Y715P;以及选自由A79E/G/M、Q85N、V260G、L275Y、F314V/L、D395N和A732G组成的组的至少一个氨基酸残基取代的氨基酸序列,预测这些取代是增加热稳定性的高度有益的取代。在一些实施方案中,至少一个取代的氨基酸残基是A79M、F314V或A79G。在一些实施方案中,至少一个取代的氨基酸残基是A79E、F314L、V260G、A85N、D395N或A732G。

本发明的某些β-葡糖苷酶变体具有包括取代I106V、Q258N、V260G、Q291W、Q313M、F314L/V、D369R、E402N、S434P、K495N、G628W、A689I、Y715P和A732G(如见于变体664)以及选自由A109S/T、A79G/E/M、D47I、Q85N/H、L314V和T591I组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,至少一个取代的氨基酸残基是A109S、A79G、A109T或A79E。在一些实施方案中,至少一个取代的氨基酸残基是D47I、A79M、A85N或A85H。预测这些取代是增加热稳定性的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有在选自以下组成的组的位置处包括至少一个氨基酸残基取代的氨基酸序列:G180E;Q258N;Q291W/A/F;D358K;D369L/Y/V/A/H/R/F/E/M/I/K/C/P/Q;P374Y;E385L;N437D/L;T482A;S489L;K530M;N536K;和T540K,预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括Q291W、D369H/L/R/Y和E402N;以及选自以下组成的组的至少一个氨基酸残基取代的氨基酸序列:Q258N/H、I106V、E385L、D274Y、K495H/I/N/Q、Q119E、Y135Q、G628W、N437I/V/W/D、S501R、Q313M、S434P和Y491F,预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有如下氨基酸序列:所述氨基酸序列包括Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N和G628W;或Q258N、Q291W、Q313M、D369R、E402N、S434P、K495N和G628W;以及选自由S764F、Y715P、E385L/D、A732G/M、A109T/S、T687M/C/K、T777N、I106V、F314V、D650Y、L757K、Q716R、T685V和F314L组成的组的至少一个氨基酸残基取代。预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括Q258N、Q291W、Q313M、D369R、E402N、S434P、A475L、K495N、G628W、A689I和715P(如见于变体481);以及选自由A79E、Q85N、T687K/W/C、I106V、A109T/S、V260G、F314V/L、A505C和A732G/M/V组成的组的至少一个氨基酸残基取代的氨基酸序列。预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、A475L、K495N、G628W、T687K/W、A689I和Y715P(如见于变体647);或D47I、Q258N、Q291W、Q313M、A343C、D369R、E402N、S434P、K495N、G628W、T687K/W、A689I和Y715P;以及选自由A79E/G/M、Q85N、V260G、F314V/L、A732G和L275Y组成的组的至少一个氨基酸残基取代的氨基酸序列。在一些实施方案中,取代的氨基酸残基是A79E、A79M、A79G、Q85N、V260G、F314V、F314L或A732G。预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

本发明的某些β-葡糖苷酶变体具有包括取代I106V、Q258N、V260G、Q291W、Q313M、F314L/V、D369R、E402N、S434P、K495N、G628W、A689I、Y715P和A732G(如见于变体664)以及选自由D47I、A79E/M/G和A109T组成的组的至少一个氨基酸残基取代的氨基酸序列,预测这些取代是增加热稳定性和β-葡糖苷酶活性两者的高度有益的取代。

值得注意地,许多具有优异活性和/或热稳定性的变体包括在位置369处的取代,其中14个不同的可选(即,非天冬氨酸)残基出现在有益变体中。预测在位置369处的取代增加活性和/或热稳定性。因而,在一方面,本发明提供了包含与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中在位置369处的氨基酸不是天冬氨酸。在一些实施方案中,在位置369处的氨基酸选自由Q、L、Y、C、A、I、P、E、K、R、F、M、H和V组成的组。在一些实施方案中,在位置369处的氨基酸是L(亮氨酸),其表现为对β-葡糖苷酶和热稳定性特别有益。

许多具有优异活性和/或热稳定性的变体包括在位置291处的取代。预测在位置291处的取代增加活性和/或热稳定性。因而,在一方面,本发明提供了包含与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中在位置291处的氨基酸不是谷氨酰胺。在一些实施方案中,在位置291处的氨基酸是W、A或F。在一些实施方案中,在位置369处的氨基酸是W(色氨酸),其表现为对β-葡糖苷酶和热稳定性特别有益。

许多具有优异活性和/或热稳定性的变体包括在位置402处的取代。预测在位置402处的取代增加活性和/或热稳定性。因而,在一方面,本发明提供了包含与野生型C1 β-葡糖苷酶(Bgl1)(SEQ ID NO:2的残基20-870)至少约70%相同的氨基酸序列的分离的和/或重组的β-葡糖苷酶多肽变体,其中在位置402处的氨基酸不是谷氨酸。在一些实施方案中,该氨基酸既不是谷氨酸也不是天冬氨酸。在一些实施方案中,该氨基酸不是谷氨酸、天冬氨酸或脯氨酸。在一些实施方案中,在位置402处的氨基酸是天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸。在一些实施方案中,在位置402处的氨基酸是天冬酰胺或谷氨酰胺。在一些实施方案中,在位置402处的氨基酸是N(天冬酰胺),其表现为对β-葡糖苷酶和热稳定性特别有益。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:M181Y+Q291W+E402N+S434P;R132K+L149M+Q313M+D369L+E385L+N437D;Q291W+D369L+E402N;Y135I+Q258N+Q474I;M181Y+Q291W+E360D+D369V+P374Y+T482A;Q258N+N437F+S489L+Y491H;Q119E+Q258N+T357L+Q474I+S489L;Q258N+D369R+S489L+Y491H;N220Y+Q258N+T357L+D369R+Q474I+Y491F;M234E+V246L+D358K+D369L+N398G+K530M;Y135Q+I229M+F242L+D369L+K530M;D369Q+P374Y+E402N+T540K;Y135Q+P172A+I179M+I229M+Q291A+D358K+D369L+N398G;R132K+D369L+E385L;Y135M+I179M+Q291A+D358K+D369L;Q291W+P374Y+E402N+S434P;Q119E+N220Y+Q258N+T357L+S489L;I179M+Q291A+D358K+D369L+I375V+S388W;Q291W+D369C;R132K+T354Q+D369L+N437L;Q291A+D369L+N398G+K530M;Q119E+Q258N+D274Y+S489L;Q119E+N220Y+Q258N+Q474I+S489L;M181Y+D369L;T120M+S222E+Q313M+T354Q+D369L+E385L;A4G+Q258N+D274Y+T357L+N437W+Q474I+Y491H;R132G+D369L+N437D;S182L+Q313M+D369L+E385L;R132G+D369L+E385L;N112V+D358K+D369L+S388W+K530M;I106V+G180E+D369L+Q381V;I179M+Q291A+D369L;I179M+D358K+D369L+S388W;M234E+Q291A+D369L+N398G;I179M+Q291A+D358K+D369L+Q381I;Y135Q+N220L+Q291A+D369L+N398G;Y135I+D369L;S182L+D369L+E385L+N437L;T120Y+R132K+D369L+N437D;M234E+D369L+S388W+N398G+K530M;Y135M+I179M+D369L+V390I+K530M;L149Q+A197V+Q313M+D369L;T120M+R132K+D369L+N437L;T120M+R132W+L149M+Q313M+T354Q+D369L+E385L+N437D;A4G+Y135I+N220Y+Q258N+T357P+N437Y;D358K+D369L+S388W;Q258N+D274Y+N437F;D369L+S434P+T540K;G158D+I179M+Q291A+D358K+D369L+I375V+N398G+K530M;Y135I+D274Y+D369R;Q258N+D369L+Q474I+S489L+Y491F;R132W+S182W+D369L+E385L;S182L+T354Q+D369L+E385L;S222Q+T354Q+D369L+E385L+N437D+T565G;Y135M+P161S+Q291A+A343T+D369L+I375V+K406D;Q291W+D369C+T540K;D369L+P374Y+E402N;Y135I+A343V+D369F+S489L;M234E+D358K+D369L+S388W;T120M+L149Q+D369L+E385L;Q313M+D369L+E385L;T120Y+D369L+E385L;D369L+N437D+T565A;N112V+Q291A+D369L+I375V;R132W+L149Q+Q313M+T354Q+D369L;Y135M+D369L+I375V+N398G;D369L+E385L;T120M+S182L+Q313M+T354Q+D369L+E385L;T177I+Q291W+P374Y+T482A;Q258N+N437F;T120V+R132W+D369L+T565G;N112V+Q291A+D358N+D369E+S388C+K406D;Q291A+D358K+D369L+S388W+K406D;I106V+E360R+D369L+Q381V;M234E+Q291A+D369L+S388W+N398G;L149M+Q313M+D369L;M234I+Q291W+E360D+D369V+T482A;T120V+T354Q+D369L+E385L+T565P;M234I+Q291W+E360D+S434P;D369Y+I867M+E868R;R132W+S182L+Q313M+D369L;M234I+Q291W+P374Y+T482A;Y219V+M234I+D369C+P374Y+S434P;S182L+Q313M+D369L+E385L+N437L;M234E+D358K+D369L+S388W+K530M;R132G+S222E+D369L+E385L;R132K+L149M+S 182L+D369L+N437L;T120H+Q313M+D369L;R132W+D369L;D369L+P374Y;N112V+N220L+Q291A+D369L+S388W+N398G;Q291A+D369L+I375V+K530G;R132K+L149M+S182L+T354Q+D369L+N437D+T565G;T120H+S222E+Q313M+D369L+N437D+T565G;A123N+Q291W+T482A+T540K;S222E+Q313M+T354Q+D369L+E385L;R132W+D369L+T565G;G202M+E360A+D369I+A394L;R132G+S222Q+Q313M+D369L;R132W+L149M+D369L;L149M+Q313M+T354Q+D369L;Q119L+G202M+D369L;M181Y+M234I+D369C;I179M+N220L+Q291A+D369L+I375V;S222E+Q313M+D369L+E385L+N437L;I179M+M234E+D358K+D369L+S388W+N398G;A123N+Y219V+Q291W+E360D+P374Y+S434P;D369L+E402N;D369L;Y219V+M234I+Q291W+T482A;Q291W+E360D+S434P;D369L+S434P;G180E+E360R+D369L;A123N+M181Y+Q291W+D369K+S434P+T540K;Q119E+T357L+D369M+S489L;Q119E+D369F+Y491H;Q119L+D369L;Q119E+N220Y+V286I+S489L;Q291A+D369L+Q381I;A475F;D369L+N536K;Q119E+Y135I+D369H;Q258N+S489L;Q119E+Y135I+N437Y;Q119E+Y135I+N437F+Y491F;Q119L+D369L+A394V;E183G+E360A+D369L+I428V;D369L+E449Q+N536K;Q119L+G202M+E360A+A475F;I106V+D369L;Y135I+D369M;M234I+D369C+S434P;D369L+A475Y;Q119E+Y135I+S489L;D369Y+N536K;E360R+D369L;G202V+A475H;D369L+Q381V+N536K;N220Y+Q258N+S489L+Y491F;Q258N+T357L+D369M;I179M+Q291A+D369L+Q381L+S388W+N398G;D369Y+A394G+N536K;Q291W+E360D+D369V+P374Y;T120M+L149Q+T354Q+D369L+E385L;S489L+Y491H;N220S+Q291F+D369L;D369C+S434P+T540K;V318E+D369L+I428V;E183M+G202M+E360A+D369L+A378K+A394V;A394G+N536K;Q291W+T540K;N220L+Q291A+D369L+Q381L+S388W+K530M;T120V+R132W+E385L+N437D;Q119L+E360A+D369L+A378K;D369A+N536K;G202V+D369L+A475H;Q381V+A475Y+N536K;S434P;I106V+G180E+D369Y+A394G;G180E+Q381V+A475H;Q119E+N220Y+Q474I;I106V+D369Q;A475Y+N536K;K142R+Y219V+Q291W+S434P+V674I;L149Q+S182L+Q313M+D369L+N437L;N112V+I179M+M234E+D369L+N398G;E360A+D369L+A378K;E360R+D369Y+N536K;E360R+D369A+Q381V+N536K;D369L+Q381D;N437F+S489L;E183M+G202M+V318E+D369I+A394L+I428V;E360D+D369L+E402N+S434P;Q119L+A141F+G202M+A394L+I428V+A475F;T357L+D369R+S489L+Y491H;Y135I+Q258N+T357L;K142R+Q291W+E360D+D369C+E402N;E183M+A243V+D369L+A378K+A475F;R132K+L149M+E385L;D369Y;M234I+E402N+S434P;N437Y;Q119E+N437F;N536K;Q119L+E183Q+G202M+D369P;N112V+I179M+Q291A+D358K+K406D;A123N+Q291W+T540K;D369I+A394L+I428V;A88S+N536K;Q119E+Y135I+N437F;A141F+G202M+E360A+D369P+A378K;A123N+T482A;Q313M+N437D;E360R+D369Y;E183M+G202M+A475F;Q 119L+E360A+A394V+A475F;D369L+A378K;E360R+D369L+A394G;M181Y+D369E+S434P;D369I;N112V+Y135Q+I375V+K406D+K530M+P870S;Q119E+Y135I+N220Y+Q258N;D369P+A394V+I428V;V318E+D369L;K186R+N536K;Q119L+D369L+A378K;M234I+D369K+S434P;N112V+I179M+N220L+Q291A+Q381I+S388W+N398G;E402N+S434P;Q119L+A141F+G202M+A394Q;Q313M+T354Q+N437D;N112V+M234E+D369L+I375V+K406D;Q119E+A136E+N220Y;Q381D+A394G+N536K;Q119L+E183G+D369Q+A378T+V390I;Y135I+T357L+Q474I+S489L+Y491F;D369E+A394P+I428V;N112V+Q291A+Q381I+N398G;E360R+N536K;E360D+D369C;R132W+S 182L+E385L;I179M+Q291A+D358K+N398G+K530G;N220Y+Q258N+T357L;T224N+D274Y+T357L+N437F;N437D;M234I+E360D+T482A;A141F+G202M+D274N+V318E+E360A+I428V;D369Q;N112V+N220L+D358K+D369L+I375V+Q381I+N398G;Y135I+D369F;A243V+V318E+E360A+A475W;N220L+D369L+Q381L+S388W+N398G+K530G;S489L;K142R+Y219V;Y135I+N220Y+Y491F;S182W+T354Q+E385L;I179M+D358K+S388W;L149M+Q313M+T565P;R132G+E385L;V318E;Q119L+E183K;R132W+E385L;E183G+V318E+E360A+A394Q+A475C;E183M+G202M+E360A;A394G;D369P;Y135M+Q291A+S388W+N398G;Y219V+D369C;A394V+I428V;Q119L;Y135I;E360R+D369Q+Q381D+N536K;N220L+M234E+Q291A+I375V+K530M;Q119L+G202M+E360A;N220Y+Q258N+D369R;M181Y+M234I+Q291W+E402N;A394V;T120M+L149Q+Q313M;Q119L+V318E+I428V;E360R+Q381V;K57R+G202M+E360A+A394V;I179M+D358K+I375V+Q381L;E360A;I179M+R682W;E360A+I428V;和D369K+P374Y(其中通过与SEQ IDNO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:I106V+Q258N+Q291W+D369L+E402N+S434P;I106V+Y135Q+Q258N+Q291W+Q313M+D369H+E402N+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;I106V+Q258N+Q291W+Q313M+D369H+E402N+S434P+A475C+K495I+T540K+G628W;I106V+Q258N+Q291W+D369R+E402N+S434P+K495H+G628L;D274Y+Q291W+D358K+D369L+E385L+E402N+N437I+S489N;Q258N+Q291W+Q313M+D369H+E402N+S434P+T540K;I106V+Q258N+Q291W+D369L+E402N+S434P+A475F+K495H+G628V;Q258N+Q291W+Q313M+D369L+E402N+S434P+A475C+K495I+G628W;I106V+Y135Q+M181Y+Q258N+Q291W+Q313M+D369L+E402N+S434P+K495N;Y135Q+Q258N+Q291W+D369L+E402N+K495N;Q119E+D274Y+Q291W+D358K+D369L+E385L+E402N+N437V+S489N+S614A;Y135Q+Q258N+Q291W+Q313M+D369L+E402N+S434P+A475F+K495N+G628V;R132H+Q258N+Q291W+D369Y+E402N+K495Q;Y135Q+Q258N+Q291W+D369L+E402N+S434P+A475F+K495H;Y135Q+Q258N+Q291W+D369R+E402N+S434P+K495I+G628V;I106V+M181Y+Q258N+Q291W+D369L+E402N;I106V+Q258N+Q291W+D369H+E402N+S434P+A475F+K495F+G628V;Q258N+Q291W+Q313M+D369L+E402N+S434P+G628V;Q258N+Q291W+D369L+E402N+A475F+K495I;Q119E+D274Y+Q291W+D369L+E385L+E402N+N437I;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L;Q258N+Q291W+D369Y+E402N+S434P+K495H+G628W;D274Y+Q291W+D369L+E385L+E402N+N437I+S489N+K530C;I106V+Y135Q+Q258N+Q291W+Q313M+D369Y+E402N+S434P+A475F+K495H+T540K;Q119E+Q291W+D358K+D369L+E385L+E402N;I106V+M181Y+Q258N+Q291W+Q313M+D369H+E402N+S434P+A475L+K495Q+G628V;Q119E+D274Y+Q291W+D358N+D369L+E385L+E402N+N437D;Q258N+Q291W+D369R+E402N+S434P+G628V;Q258N+Q291W+Q313M+D369H+E402N+S434P+G628L;Q258N+Q291W+D369L+E402N;D274Y+Q291W+D358K+D369L+E385L+E402N+N437F+S614D;Q119E+D274Y+Q291W+D358N+D369L+E385L+E402N+N437L+K530V;Q119E+D274Y+Q291W+D358N+D369L+E385L+E402N+N437V+S489L+K530N;Q258N+Q291W+D369L+E402N+S434P+A475F+K495F+T540K;M181Y+Q291W+Q313M+D369Y+E402N;A243V+D274Y+Q291W+D358K+D369L+E402N+N437I+K530C;Q119E+D274Y+Q291W+D358E+D369L+E385L+E402N+N437V+K530V+S614A;Q291W+D358K+D369L+E385L+E402N+N437W+K530C+S614A;Q119E+D274Y+Q291W+D369L+E385L+E402N+N437W;D274Y+Q291W+D358N+D369L+E385L+E402N+N437I+K530N+S614V;M181Y+Q258N+Q291W+Q313M+D369L+E402N+S434P;A109T+Q291W+D369L+E402N;Q119E+Q291W+D369L+E385L+E402N+N437Y+S489I+K530N;Q119E+D274Y+Q291W+D358N+D369L+E402N+N437D;D274Y+Q291W+D358K+D369L+E385L+E402N+N437W+K530V+S614D;Q258N+Q291W+D369R+E402N+A475W+K495H+G628V;A109S+Q291W+D369L+E402N;Q119E+D274Y+Q291W+D358E+D369L+E385L+E402N+N437L+S614A;Q291W+D369L+E402N+E493Y+N504Y+T611A;Q119E+D274Y+Q291W+D358K+D369L+E402N+S614V;D274Y+Q291W+D358E+D369L+E385L+E402N+N437L+K530N+S614A;Q258H+Q291W+Q313M+D369R+E402N+A475F+K495N+G628L;Q258N+Q291W+Q313M+D369Y+E402N+A475W+K495V+T540K+G628W;D274Y+Q291W+D358N+D369L+E385L+E402N+N437W+S614V;I106V+Y135Q+Q291W+Q313M+D369L+E402N+A475L+K495Q;Q258N+Q291W+D369R+E402N+S434P+A475F+G628V;Q119E+D274Y+Q291W+D369L+E385L+E402N+N437V;D274Y+Q291W+D358K+D369L+E385L+E402N+N437Y+S489L+K530V;Q119E+D274Y+Q291W+D358N+D369L+E402N;Q291W+D369L+E402N+K495V+S501R+A503E+K530N+T611H;Q119E+D274Y+Q291W+D358N+D369L+E385L+E402N+N437V+S489I+K530C;Q119E+Q291W+D358K+D369L+E402N+N437L+S489N;D274Y+Q291W+D369L+E385L+E402N+N437W+K530C+S614D;Q258N+Q291W+D369R+E402N+A475F+K495N+T540K+G628V;Q291W+D369L+E402N+E493V+N504Y;Q291W+D358E+D369L+E385*+E402N+S489T;Q258N+Q291W+Q313M+D369R+E402N+A475L+K495V+A601T+G628W;D274Y+Q291W+D358N+D369L+E385L+E402N+S489N+S614C;D274Y+Q291W+D358K+D369L+E402N+N437V+S489L+K530C+S614A;Q119E+D274Y+Q291W+D358E+D369L+E402N+N437D;Q119E+D274Y+Q291W+D358N+D369L+E402N+N437L+S614R;D274Y+Q291W+D358N+D369L+E402N+N437Y+K530V;D274Y+Q291W+D358E+D369L+E402N+N437Y+S489N+K530N+S614V+D781N;Q258H+Q291W+D369*+E402N+S434P+T540K+G628L;Q119E+Q291W+D358E+D369L+E385L+E402N+N437L+S489N+K530V;Q258N+Q291W+D369L+E402N+G628V;Q291W+D358K+D369L+E385L+E402N+S489I+K530N;Q119E+Q291W+D369L+E385L+E402N+S489N+K530V+S614A;I106V+Y135Q+Q291W+D369L+E402N+S434P+A475F+K495H+G628L;Q119E+Q291W+D358K+D369L+E402N+N437V+K497R+S614A;Q119E+D274Y+Q291W+D358E+D369L+E385L+E402N+N437L;D274Y+Q291W+D358K+D369L+E402N+N437L+S489I+K530V+S614A;I106V+Q291W+Q313M+D369L+E402N+S434P+A475W+K495N+G628W;Q291W+D369L+E402N+A505C+L620M+T635I;Q291W+D369L+E402N+E493A+N504Y+A505C+L620M+T635A;D274Y+Q291W+D358N+D369L+E402N+S489N+K530C+S614A;D274Y+Q291W+D358K+D369L+E385L+E402N+N437W+K530D;Q291W+D369L+E402N+S489N+K495H+S501R+K530N;D274Y+Q291W+D358E+D369L+E385L+E402N+N437D+K530C+S614H;Q119E+Q291W+D358E+D369L+E385L+E402N+N437W+S489N+K530E+S614A;Q291W+D369L+E402N+E493Y+N504Y+N521C+T591A+R612P+L620M+T635I;Q291W+D358K+D369L+E385L+E402N+N437I+K530M+S614L;Q291W+D369L+E402N+R672I;D274Y+Q291W+D358E+D369L+E385L+E402N+N437L+S489L;A265S+Q291W+D369L+E402N;Q215M+Q291W+D369L+E402N;Q291W+D369L+E402N+E493V+N504Y+N521C+T591A+L620M+T635I;Q119E+D274Y+Q291W+D369L+E385L+E402N+N437L+S489N+K530M+S614D;Q119E+Q291W+D369L+E385L+E402N;Q291W+D369L+E402N+E493A+N504Y+D566G+R612P+L620M+T635A;Q119E+D274Y+Q291W+D369L+E385L+E402N+S614Y;I106V+Y135Q+M181Y+Q258N+Q291W+D369L+E402N;Q119E+Q291W+D358E+D369L+E385L+E402N+N437W+K530V;Q215E+Q291W+D369L+E402N;Q291W+D369L+E402N+N504Y+N521C+T591A+R612H+L620M+T635I;Q119E+D274Y+Q291W+D358K+D369L+E402N+N437Y+K530I;Q258H+Q291W+D369L+E402N+K495N;Q291W+D358N+D369L+E385L+E402N+N437D+S489N+K530I;Q291W+D369L+P374Y+E402N+Y491L+S501R;Q258N+Q291W+Q313M+G332D+D369H+E402N+S434P;Q291W+D358N+D369L+E385L+E402N+N437F+S489L+K530V;Q291W+D369L+E402N+R672S;Q291W+D369L+E402N+T687M;Q291W+F314V+D369L+E402N;Q258N+Q291W+T357A+D369H+E402N+S434P+K495F;Q291W+D369L+P374Y+E402N+Y491F+S501R+N521C;Q291W+D369L+E402N+Q690K;Q291W+D358E+D369L+E385L+E402N+N437F+K530V+S614A;Q291W+D369L+E402N+R672A;Q291W+D369L+E402N+R672T;Q291W+D369L+E402N+D703K;D274Y+Q291W+D369L+E402N;Q291W+D369L+E402N+R672F;Q291W+D369L+E402N+R672D;Q291W+D369L+E402N+Y491F+S501R+N536K+D566G;Q291W+D369L+E402N+A732G;Q291W+D369L+E402N+E493Y+N504Y+N521C+T591C+R612P+L620M;I106V+Y135Q+Q291W+D369L+E402N+A475F+G628W;Q291W+D369L+E402N+R672G;Q291W+D369L+E402N+T777N;Q291W+Q313M+D369L+E402N+T540K;Q291W+D369L+E402N+K708F;Q291W+D369L+P374Y+E402N+S501H;Q291W+D369L+E402N+Y715P;Q291W+D369L+E402N+A732M;Q291W+D369L+E402N+E493A+N504Y+N521C+D566G+R612P+L620M;Q291W+D369L+E402N+Q690R;D274Y+Q291W+D369L+E385L+E402N+N437V+K530I+S614D;Q291W+D369L+E402N+L757K;Q291W+D369L+E402N+T687Y;Q291W+D369L+E402N+Y491H+S501R+N521C+T591A;Q291W+D369L+E402N+V775C;Q291W+D369L+E402N+R672V;Q291W+D369L+E402N+N670D;Q291W+D369L+E402N+T779S;Q291W+D369L+E402N+V638R;Q291W+D369L+E402N+T687F;Q291W+D369L+E402N+T687L;Q291W+D369L+E402N+K610S;Q291W+D369L+E402N+Y491L+S501R+N521C;D274Y+Q291W+D358E+D369L+E402N+K530V+S614V;I106V+M181Y+Q258N+Q291W+D369R+E402N+S434P+A475W+K495V+T540K+G628V;Q291W+D369L+E402N+N536K;Q291W+D369L+E402N+E493V+N504Y+R612P+L620M;Q291W+D369L+E402N+S676C;Q291W+D369L+E402N+T540K+G628W;Q291W+D369L+E385L+E402N+N437D+S489L+K530C+S614D;Q119E+D274Y+Q291W+D358N+D369L+E402N+N437F+S489N+S614L;Q291W+D369L+E402N+S434P+A475W+K495V;Q291W+D369L+E402N+A689I;Q291W+D369L+E402N+E493A+N504Y+N521C+D566G+R612H+L620M;Q291W+D369L+E402N+V638S;Q291W+D369L+E402N+V648W;Q291W+D369L+E402N+D650V;Q291W+D369L+E402N+V674M;Q291W+D369L+E402N+V638E;I106V+Q291W+D369L+E402N;Y135Q+Q291W+D369L+E402N;Q291W+D369L+E402N+S764F;Q291W+D369L+E402N+E493A+N504Y+A505C+N521C+T591A+R612P;Q291W+D369L+E402N+S489N+K495Q+S501R+K530N+T611Q;Q291W+D369L+E402N+T685V;I106V+Q291W+D369L+E402N+S434P+A475C+K495N+T540K;Q119E+Q291W+D358N+D369L+E402N+N437D+K530N+S614V;Q291W+D369L+E402N+T687K;Q291W+D369L+E402N+S652D;Q291W+D369R+E402N+A475F+K495Q+T540K+G628L;Y135Q+Q291W+D369L+E402N+G628V;Q291W+D369L+E402N+E493Y+A505C+N521C+T591A+L620M;Q291W+D369L+E402N+T687W;Q291W+D369L+E402N+D650F;Q291W+D369L+E402N+T687C;Q291W+D369L+E402N+S434P+K495N+G628V;Q291W+D369L+E402N+S501N;D274Y+Q291W+D369L+E402N+N437K+S489I+K530V+S614L;Q291W+D369L+E402N+T699L;Q119E+V246I+Q291W+D358E+D369L+E402N+S614L;Q291W+D369L+E402N+N504Y+N521C+D566G+L620M+T635A;Q291W+D369L+E402N+E493Y+N504Y+D566G+T591A+R612P+L620M;Q291W+D369L+E402N+N536K+T591A;Q291W+D369L+E402N+Q690A;Q291W+D358K+D369L+E402N+N437L+S489I+K530D;Q119E+D274Y+Q291W+D358E+D369L+E385L+E402N+N437V+S489N+K530M+S614H;Q291W+D369L+P374Y+E402N+Y491L;Q291W+D369L+E402N+S501R;Q291W+D369L+E402N+Y491L+N521C+N536K;Q291W+D369L+E402N+E493Y+N504Y+N521C+T591C+R612P+L620M+T635V;Q119E+Q291W+D358N+D369L+E385L+E402N+N437I+S489I+S614L;T120Y+Q291W+D369L+E402N+S501R+N521C+D566G;Q291W+D369L+E402N+Y491L+N521C;Q291W+D369L+E402N+Y491L+S501N+D566G+T591A;D274Y+N278Y+Q291W+D358E+D369L+E402N+N437Y+S489L+K530E;I106V+Q291W+D369L+E402N+S434P+A475W+K495F+T540K+G628V;Q119E+Q291W+D358N+D369L+E402N+N437Y+E742G;Y135Q+Q291W+D369Y+E402N+A475F+K495F;T120H+Q291W+D369L+E402N+Y491H+S501H+T591C;Q119E+Q291W+D358N+D369L+E402N+N437F+S489N+K530E+S614L;Q119E+D274Y+Q291W+D358N+D369L+E402N+N437I+S489N+K530V+S614Y;T120Y+Q291W+D369L+E402N+N521C+N536K;Q291W+D369L+E402N+Y491F+S501N+N521C+N536K+T591R;Q291W+D369L+E402N+S501N+N521C+D566G+T591R;Q291W+D369L+E402N+Y491L+S501R+N536K+D566G+T591R;和D274Y+Q291W+D358E+D369L+E402N+N437Y+S489N+K530I+S614L;(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与WT C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y715P+T823K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T685V+Y715P;I106V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S764F;A109T+Q258N+Q291W+Q313M+D369R+E402N+I428V+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+Y491F+K495N+G628W+Y715P;Q258N+Q291W+Q313M+D369R+Q381V+E402N+S434P+A475L+K495N+S501R+G628W+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S764F;Q258N+Q291W+Q313M+D369R+E385L+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N627H+G628W+A732G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T685V+Y715P+T777N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650Y+Q716R+L757K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+V562L+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+S764F;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y715P+E819V;A109T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S652D+V846F;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Q690K;D47I+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W;E21Q+V175A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+E360D+D369R+E402N+S434P+A475L+K495N+G628W+L757K;Q258N+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+S604I+N627H+G628W+A732G;A109T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+V775C;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S764F;P29Q+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;A136L+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S764F+P870S;Q258N+Q291W+Q313M+D369R+E385L+E402N+S434P+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687M;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N588F+G628W;Q258N+Q291W+Q313M+D358K+D369R+E402N+S434P+A475L+K495N+G628W;Y135M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T785L;A79G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;A109T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S848N;I106V+Q258N+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A732G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+L757K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N627H+G628W+T687M+E822K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G616D+G628W;A79M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;I106V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+A617V+G628W;Q258N+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G626D+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687C;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;A109S+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N536K+G628W;S58G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;E21Q+Q258N+Q291W+Q313M+D369R+Q381V+E402N+S434P+A475L+K495N+G628W;Q258N+L275Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W;E21R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;V25A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;H26R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;L30K+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;N45H+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+E493V+K495N+G628W;P29R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;P29M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A732S+A748T+V840I;Q55R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;K24G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;G180E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+Q479R+K495N+S501R+G628W+Y715P+E819L;A79E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+R672G;Q258N+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+A505C+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687K;Q27R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;V253F+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;S22L+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Q690H;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S799N;Q258N+Q291W+Q313M+F314V+E360D+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+E822M;K24T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S787G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+R612H+G628W+L757K+S787G;S22L+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+Q479R+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687K+E822M;Q258N+Q291W+Q313M+D369R+E402N+S434P+M454E+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+V562C+G628W;S22R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;V25G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T685V;Q258N+Q291W+Q313M+D369R+E402N+A404S+S434P+A475L+K495N+G628W;G216L+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;V25R+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;V25G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q27H+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;K24L+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650F+L757K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+T482A+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A617V+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S501C+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+K495N+N536K+G628W+R817P;G180E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+R476Q+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T777N;Q119E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;A109S+Q258N+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+S848N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y850H;Q258N+Q291W+Q313M+D369R+E402N+S434P+P436E+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+R769H+E819A;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+T496A+G628W;Q258N+V260L+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;D244H+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+E819V;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S652D;Q258N+Q291W+D311N+Q313M+D369R+E402N+S434P+A475L+K495N+R612H+G628W+A689I+K866I;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T783H;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T823K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650N+S787G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+K708F;Q258N+Q291W+Q313M+E360D+D369R+E402N+S434P+A475L+K495N+G628W+S652D;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+E822G;L237Y+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+E494K+K495N+G628W;Q258N+Q291W+Q313M+E360D+D369R+E402N+S434P+D470N+A475L+K495N+G628W+L757K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S764F;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650F;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S848N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+T496A+N536K+G628W;Q258N+Q291W+Q313M+D369R+E402N+K421R+S434P+A475L+K495N+G628W+T777N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N627H+G628W+E822M;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+F634A;A4V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+N437W+A475L+K495N+G628W;Y135Q+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Y135Q+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+V673A+T685V;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+L757K+P806L;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+V559T+G628W;Y135M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+V775C;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N627H+G628W;Q258N+Q291W+Q313M+D369R+E402N+A405T+S434P+A475L+K495N+G628W;I221V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S501R+G628W+T685V;Q258N+Q291W+Q313M+D369R+A394G+E402N+S434P+A475L+K495N+G628W+L757K;P161S+Q258N+Q291W+Q313M+D358K+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G616D+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+K807R;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A732M;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+E822G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+E493V+K495N+G628W+S652D;A15V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+K866Q;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+E493A+K495N+G628W+S652D+Q690A;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+E819L;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+E819V;G180E+Q258N+Q291W+Q313M+D369R+E385L+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D751N;G202M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N627H+G628W+T687K+E822A;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+K866I;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T783Q;Q258N+Q291W+Q313M+D369L+E402N+S434P+A475L+K495N+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+E493Y+K495N+A505C+G628W;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+T482A+K495N+G628W+D646N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+A477G+K495N+G628W+S764F+S848N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+I847T;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T685V+Y850Q;Y135M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S501R+G628W+T685V+T777N;和Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+Y850Q;(其中通过与SEQ IDNO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与WT C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;A109S+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P+S764F;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P;D47I+A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;D47I+A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;D47I+A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;D47I+A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P;D47I+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+A109S+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P+A732G;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P+A732G;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P+A732M;A109T+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343G+D369R+E402N+S434P+Q474L+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;D47I+A109T+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;D47I+A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;A109T+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G+P870S;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732M;Q258N+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732V;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+I106V+Q258N+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+S652D+A689I+Y715P+A732G;D47I+I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+S652D+A689I+Y715P+A732G;D47I+I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+S652D+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;C8A+L9F+D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G+D844G;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;D47N+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732G;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+I106V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P+A732M;A109T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732M;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P;D47I+I106V+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P;D47I+A109T+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;A109T+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+S652D+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P;L237Y+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+L757K;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604C+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+R476G+K495N+N588F+G628W+D651E+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G628W+A689I+Y715P+L757K;I106V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+A732M;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+K495N+G628W+S652D+A689I+Y715P+A732G;A109T+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+Y736N;Q258N+Q291W+Q313M+F314L+D369R+E402N+S434P+A475L+K495N+G628W+S652D+A689I+Y715P+A732G;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G616D+G628W+D650Y+A689I+Y715P+L757K;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;V253F+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Q690K+D709E+E710G+Y715P;Q85N+V175A+Q258N+L275Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Q690K+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G616D+G628W+A689I+Y715P+L757K;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Q690H+Y715P+M816L;V25A+Q85N+Q258N+L275Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G616D+G628W+A689I+Y715P+V846F;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+V846Q;A79E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G626D+G628W+A689I+Y715P;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;A79E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P;Q258N+Q291W+Q313M+F314L+D369R+Q381V+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G628W+A689I+Y715P+L757K+V846Q;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G628W+D650N+A689I+Y715P;D47I+I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S550C+G628W+S652D+A689I+Y715P+A732G;A109S+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604A+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+V846Q;D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;A109T+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+N588F+G628W+A689I+Y715P+A732M;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G616D+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G616D+G628W+D650N+A689I+Y715P;A79E+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+V674I+A689I+Y715P;V25A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+L757K;V25A+Q85H+Q258N+L275F+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650N+A689I+Y715P+L757I;K24T+A79E+A136L+Q258N+D274Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;K24G+A79E+Q258N+D274Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P;Q85N+V175A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+D650N+A689I+Y715P;V25A+Q85N+Q258N+L275Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+L757K;A79M+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+P436Q+A475L+K495N+G628W+A689I+Y715P+;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q85N+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;I106V+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604A+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+Q474I+A475L+K495N+G628W+A689I+Y715P+S764F;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;D47I+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N588F+G628W+A689I+Y715P;S58G+Q258N+Q291W+Q313M+D369R+Q381V+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V253F+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+T785L+M816L;A243G+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+S764F;I106V+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+N588F+G628W+S652D+A689I+Y715P+D733G;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+V846L;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604A+G628W+A689I+Y715P;A79G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+T777N;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;V25A+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P;K24T+A79E+Q258N+D274Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P+T777N;D47I+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+S604V+G628W+T687C+A689I+Y715P+S764F+L869R;Q258N+D274Y+Q291W+Q313M+D369R+E385L+E402N+S434P+A475L+K495N+G626D+G628W+A689I+Y715P+T777N;S58G+Q258N+Q291W+Q313M+D369R+Q381V+E402N+S434P+N437D+A475L+K495N+G628W+A689I+Q690H+D709E+E710G+Y715P;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+Q474I+A475L+K495N+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+N437K+A475L+K495N+G628W+A689I+Y715P+T785L;A109S+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604I+G628W+A689I+Y715P;Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604V+G628W+A689I+Y715P+K807R;Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+S604V+G628W+A689I+Y715P;Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+L757K;D47I+Q258N+Q291W+Q313M+D369R+E402N+S434P+K495N+N588F+G628W+S652D+A689I+Y715P;A79M+A136L+Q258N+D274Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P+T783A;D47I+A109T+Q258N+V260G+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+S604V+G628W+A689I+Y715P+S764F;S58G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+T785L;K24G+A136L+Q258N+D274Y+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+A505C+G628W+A689I+Y715P+T777N;S58G+Q258N+Q291W+Q313M+D369R+Q381V+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+T785L;和S58G+Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P+T785L+M816L;(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与WT C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:D47I+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+A79G+Q85N+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732M;D47I+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P+A732G;D47I+A79E+Q85N+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687W+A689I+Y715P;D47I+A79E+Q85N+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+A79G+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687C+A689I+Y715P+S764Y+R769H;D47I+A79G+Q85N+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+A79M+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687K+A689I+Y715P;D47I+A79M+Q85N+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687C+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+A505C+G628W+T687C+A689I+Y715P+A732G;D47I+A79M+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+Q258N+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+A79E+Q85N+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+A505C+G628W+T687W+A689I+Y715P+A732V;D47I+A79M+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+K495N+A505C+G628W+T687K+A689I+Y715P+A732M;D47I+Q85N+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P;D47I+A79G+Q258N+V260G+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732M;D47I+A79G+Q85N+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+A79G+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P+A732G;D47I+A79G+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732M;D47I+Q85N+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P;D47I+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+A79M+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+K495N+G628W+T687W+A689I+Y715P;D47I+A79G+Q85N+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687K+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P+A732G;D47I+A79G+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q85N+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P+A732G;D47I+A79G+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687C+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687K+A689I+Y715P+A732G;D47I+Q258N+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687W+A689I+Y715P+A732G;D47I+A79G+Q85N+Q258N+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P;D47I+A79M+Q85N+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+Q85N+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q85N+Q258N+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687C+A689I+Y715P;D47I+A79G+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q85N+Q258N+V260G+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+A79G+Q258N+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q258N+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P;D47I+Q258N+V260G+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+D646N+T687K+A689I+Y715P+A732G;D47I+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687K+A689I+Y715P+A732V;D47I+A79G+Q85N+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+P439S+A475L+K495N+G628W+T687K+A689I+Y715P;D47I+Q85N+Q258N+Q291W+Q313M+F314V+A343C+D369R+D395N+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P+A732V;D47I+A79G+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687C+A689I+T693A+Y715P+T827I;D47I+Q85N+Q258N+V260G+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687K+A689I+Y715P+A732V;和D47I+A79G+Q258N+L275Y+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+A505C+G628W+T687K+A689I+T693E+N723G+A730S+Y855;(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与WT C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下组成的组的取代组合:I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;A79M+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79G+Q85N+I106V+A109T+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79E+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79G+Q85N+I106V+A109T+Q258N+V260G+L275F+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+A505C+G628W+T687C+A689I+Y715P+A732G;D47I+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+N315D+D369R+E402N+S434P+K495N+A505C+G628W+T687W+A689I+Y715P+A732G;D47I+Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79E+Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79G+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687W+A689I+Y715P+A732G;D47I+A79G+Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79M+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79G+Q85N+I 106V+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;A79M+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79M+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;A79M+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79G+Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79E+Q85H+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79G+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79G+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;C8G+D47I+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79E+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79G+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79G+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+T591I+G628W+A689I+Y715P+A732G;Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79M+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+A505C+G628W+T687K+A689I+Y715P+A732G;Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+A343G+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109S+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+I106V+Q258N+V260G+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;I106V+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109S+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687C+A689I+Y715P+A732G;D47I+A79M+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79G+Q85N+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G;D47I+A79E+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+T687W+A689I+Y715P+A732G;I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+Q85N+I106V+A109T+Q258N+V260G+Q291W+Q313M+F314V+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;Q85N+I106V+A109S+Q258N+V260G+L275Y+Q291W+Q313M+F314V+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;D47I+A79M+I106V+A109S+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;A79M+Q85N+I106V+Q258N+V260G+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G;和A79M+Q85N+I106V+Q258N+V260G+L275Y+Q291W+Q313M+F314L+A343C+D369R+E402N+S434P+K495N+A505C+G628W+A689I+Y715P+A732G(其中通过与SEQ ID NO:2最佳比对来确定氨基酸位置)。

在一些实施方案中,变体包括选自以上示例(表2、3、4、5、6、7)的那些取代组合的取代组合并且还包括如下取代:所述取代(a)不减少变体的活性或热稳定性,和(b)在以下组成的组中的任何另外的残基处不包括取代:K57;A88;I106;N112;Q119;T120;A123;R132;Y135;A136;A141;K142;L149;G158;P161;P172;T177;I179;G180;M181;S182;E183;K186;A197;G202;Y219;N220;S222;T224;I229;M234;F242;A243;V246;Q258;D274;V286;Q291;Q313;V318;A343;T354;T357;D358;E360;D369;P374;I375;A378;Q381;E385;S388;V390;A394;N398;E402;K406;I428;S434;N437;E449;Q474;A475;T482;S489;Y491;K530;N536;T540;T565;V674;R682;I867;E868;和P870。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少6.0至6.9倍的活性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少5.0至5.9倍的活性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少4.0至4.9倍的活性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少3.0至3.9倍的活性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少2.0至2.9倍的热稳定性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少1.1至1.9倍的热稳定性改进,如表2中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少6.0至6.9倍的活性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少5.0至5.9倍的活性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少4.0至4.9倍的活性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少3.0至3.9倍的活性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少2.0至2.9倍的活性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少1.1至1.9倍的活性改进,如表3中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少4.0至4.9倍的活性改进,如表4中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少3.0至3.9倍的活性改进,如表4中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少2.0至2.9倍的活性改进,如表4中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少1.1至1.9倍的活性改进,如表4中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少4.0至4.9倍的活性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少3.0至3.9倍的活性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少2.0至2.9倍的活性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少1.1至1.9倍的活性改进,如表5中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少4.0至4.9倍的活性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少3.0至3.9倍的活性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少2.0至2.9倍的活性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少1.1至1.9倍的活性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少0.6至1.0倍的活性改进,如表6中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体664至少3.0至3.9倍的活性改进,如表7中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体664至少2.0至2.9倍的活性改进,如表7中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少4.0至4.9倍的热稳定性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少3.0至3.9倍的热稳定性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少2.0至2.9倍的热稳定性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1至少1.1至1.9倍的热稳定性改进,如表2中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少3.0至3.9倍的热稳定性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少2.0至2.9倍的热稳定性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3至少1.1至1.9倍的热稳定性改进,如表3中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少2.0至2.0倍的热稳定性改进,如表4中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269至少1.1至1.9倍的热稳定性改进,如表4中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少4.0至4.9倍的热稳定性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少2.0至2.9倍的热稳定性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少1.1至1.9倍的热稳定性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481至少0.6至1.0倍的热稳定性改进,如表5中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少2.0至2.9倍的热稳定性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少1.1至1.9倍的热稳定性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少0.6至1.0倍的热稳定性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647至少0.2至0.5倍的热稳定性改进,如表6中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体664至少1.1至1.9倍的热稳定性改进,如表7中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体664至少0.6至1.0倍的热稳定性改进,如表7中所鉴定的。

在一些实施方案中,本发明的分离的和/或重组的β-葡糖苷酶多肽变体与野生型C1 Bgl1(SEQ ID NO:2的残基20-870)至少约70%相同并且包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于天然C1 Bgl1的任何的活性和/或热稳定性改进,如表2中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体3的任何的活性和/或热稳定性改进,如表3中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体269的任何的活性和/或热稳定性改进,如表4中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体481的任何的活性和/或热稳定性改进,如表5中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体647的任何的活性和/或热稳定性改进,如表6中所鉴定的。在一些实施方案中,变体包括选自以下取代组合组成的组的取代组合:所述取代组合显示相比于变体664的任何的活性和/或热稳定性改进,如表7中所鉴定的。

如上所述,本发明包括的β-葡糖苷酶多肽具有对SEQ ID NO:2的残基20-870的至少约70%序列同一性。在一些实施方案中,本发明包括的β-葡糖苷酶多肽包括具有与SEQ ID NO:2的残基20-870至少约71%相同、至少约72%相同、至少约73%相同、至少约73%相同、至少约74%相同、至少约75%相同、至少约76%相同、至少约77%相同、至少约78%相同、至少约79%相同、至少约80%相同、至少约81%相同、至少约82%相同、至少约83%相同、至少约84%相同、至少约85%相同、至少约86%相同、至少约87%相同、至少约88%相同、至少约89%相同、至少约90%相同、至少约91%相同、至少约92%相同、至少约93%相同、至少约94%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同或至少约99%相同的氨基酸序列的β-葡糖苷酶多肽。本文每次提及“70%”应理解成还可选地包括以上更高值中的任何一个。

如上所述,本发明的Bgl1变体可包括除以上列出的取代之外的另外的氨基酸取代,包括,例如具有在氨基酸序列中作出的一个或多个另外的保守性取代的变体。保守性取代的实例是在下组内的取代:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸、脯氨酸、半胱氨酸和甲硫氨酸)。一般不改变比活性(specific activity)的氨基酸取代是本领域已知的并且被例如H.Neurath和R.L.Hill,1979,在″The Proteins,″Academic Press,New York中描述,将其通过引用并入本文。最常出现的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly,以及这些对颠倒过来。

本发明的β-葡糖苷酶多肽变体的保守取代的变异包括用同一保守取代组的保守选择的氨基酸取代小百分比、通常少于5%、更通常少于2%、并且通常少于1%的多肽序列的氨基酸。不改变编码的β-葡糖苷酶活性的序列的添加,诸如非功能性或非编码序列的添加被认为是β-葡糖苷酶多核苷酸的保守变异。

本发明还提供了具有β-葡糖苷酶活性和本文描述的至少一种取代的本文描述的β-葡糖苷酶多肽变体的酶活性片段。基于现有研究,相信C1 Bgl1容忍截短(即,保留活性)。已观察到在N末端25个氨基酸位置中的每个位置具有与野生型不同的序列的C1 Bgl1变体保留β-葡糖苷酶活性(未显示)。类似地,在伊拉克固氮螺菌(Azospirillum irakense)β-葡糖苷酶(CelA)中容忍羧基末端处16个氨基酸残基的截短。参见USSN 61/218,020,其通过引用并入本文。据此,本发明还提供了具有如下氨基酸序列的分离的或重组的β-葡糖苷酶多肽变体:所述氨基酸序列具有相对于SEQ ID NO:2的从羧基(C-)末端、氨基(N-)末端、或二者的1至50个氨基酸残基的缺失(即,从N末端或C末端中任一个或二者的1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个氨基酸残基的缺失)。在某些实施方案中,缺失是从N末端的1至15个氨基酸残基和/或从C末端的1至40个氨基酸残基。这些β-葡糖苷酶片段在本文还分别称为N末端截短的和C末端截短的β-葡糖苷酶多肽变体。在一些实施方案中,缺失可以是从C末端、N末端或这两个末端的1至30个、或1至20个、或1至10个残基、或1至5个残基。

表2

表2,热活性(Thermoactivity)条件:pH 5,65℃持续21小时。热稳定性条件:在pH5,65℃孵育6小时后确定酶残余活性。

1氨基酸改变是相对于SEQ ID NO:2标示的。

2核苷酸改变是相对于SEQ ID NO:1标示的。

3如下表示改进倍数:

*=相比于天然C1 Bgl1(SEQ ID NO:2)的0.3到0.5倍改进

**=相比于天然C1 Bgl1(SEQ ID NO:2)的0.6到1倍改进

+=相比于天然C1 Bgl1(SEQ ID NO:2)的1.1到1.9倍改进

++=相比于天然C1 Bgl1(SEQ ID NO:2)的2.0到2.9倍改进

+++=相比于天然C1 Bgl1(SEQ ID NO:2)的3.0到3.9倍改进

++++=相比于天然C1 Bgl1(SEQ ID NO:2)的4.0到4.9倍改进

+++++=相比于天然C1 Bgl1(SEQ ID NO:2)的5.0到5.9倍改进

++++++=相比于天然C1 Bgl1(SEQ ID NO:2)的6.0到6.9倍改进

表3

表3:热活性条件:pH 5,70℃持续21小时。热稳定性条件:在pH 5,65℃孵育16-48小时后确定酶残余活性。

1氨基酸改变是相对于SEQ ID NO:2标示的;主链序列包含取代Q291W+D369L+E402N。

2核苷酸改变是相对于SEQ ID NO:1标示的。

3如下表示改进倍数:

*=相比于变体3(SEQ ID NO:5)的0.3到0.5倍改进

**=相比于变体3(SEQ ID NO:5)的0.6到1倍改进

+=相比于变体3(SEQ ID NO:5)的1.1到1.9倍改进

++=相比于变体3(SEQ ID NO:5)的2.0到2.9倍改进

+++=相比于变体3(SEQ ID NO:5)的3.0到3.9倍改进

++++=相比于变体3(SEQ ID NO:5)的4.0到4.9倍改进

+++++=相比于变体3(SEQ ID NO:5)的5.0到5.9倍改进

++++++=相比于变体3(SEQ ID NO:5)的6.0到6.9倍改进

表4

表4:热活性条件:pH 4.5,70℃持续21小时。热稳定性条件:在pH 4.5,70℃孵育2小时后确定酶残余活性。

1氨基酸改变是相对于SEQ ID NO:2标示的;主链序列包含取代Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W

2核苷酸改变是相对于SEQ ID NO:1标示的。

3相对于变体269(SEQ ID NO:7)的改进倍数

*=0.2到0.5倍改进   ++=2.0到2.9倍改进

**=0.6到1.0倍改进  +++=3.0到3.9倍改进

+=1.1到1.9倍改进   ++++=4.0到4.9倍改进

表5

表5:热活性条件:pH 4.2,70℃持续21小时。热稳定性条件:在pH 4.5,70℃孵育3小时后确定酶残余活性。

1氨基酸改变是相对于SEQ ID NO:2标示的;主链序列包含取代Q258N+Q291W+Q313M+D369R+E402N+S434P+A475L+K495N+G628W+A689I+Y715P。

2核苷酸改变是相对于SEQ ID NO:1标示的。

3相对于变体481(SEQ ID NO:9)的改进倍数:

*=0.2到0.5倍改进

**=0.6到1.0倍改进

+=1.1到1.9倍改进

++=2.0到2.9倍改进

+++=3.0到3.9倍改进

++++=4.0到4.9倍改进

表6

表6:热活性条件:pH 4,70℃持续21小时。热稳定性条件:在pH 4.5,70℃孵育24小时后确定酶残余活性。氨基酸改变和沉默的核苷酸改变是相对于野生型序列标示的。

1氨基酸改变是相对于SEQ ID NO:2标示的;主链序列包含取代D47I+Q258N+Q291W+Q313M+A343C+D369R+E402N+S434P+A475L+K495N+G628W+T687K+A689I+Y715P。

2核苷酸改变是相对于SEQ ID NO:1标示的。

3相对于变体647(SEQ ID NO:15)的改进倍数:

*=0.2到0.5倍改进

**=0.6到1.0倍改进

+=1.1到1.9倍改进

++=2.0到2.9倍改进

+++=3.0到3.9倍改进

++++=4.0到4.9倍改进

表7

表7:热活性条件:pH4,70℃持续21小时。热稳定性条件:在pH4.5,70℃孵育24小时后确定酶残余活性。

1氨基酸改变是相对于SEQ ID NO:2标示的;主链序列包含取代I106V+Q258N+V260G+Q291W+Q313M+F314L+D369R+E402N+S434P+K495N+G628W+A689I+Y715P+A732G。

2核苷酸改变是相对于SEQ ID NO:1标示的。

3相对于变体664(SEQ ID NO:13)的改进倍数

*=0.2到0.5倍改进

**=0.6到1.0倍改进

+=1.1到1.9倍改进

++=2.0到2.9倍改进

+++=3.0到3.9倍改进

表8举例说明相比于野生型酶具有增加的热活性和/或热稳定性的C1Bgl变体的示例性特性。

表8

例如,在一些实施方案中,变体具有相比于野生型Bgl1至少5倍大的热活性和/或至少2倍大的热稳定性。例如且不限于,变体3具有这些特性。例如,在另一实施方案中,变体具有相比于变体481 Bgl1至少4倍大的热活性和/或至少4倍大的热稳定性。例如且不限于,变体647具有这些特性。

本文没有具体描述的β-葡糖苷酶变体的氨基酸序列可使用本领域普通技术人员熟知的方法容易地产生并鉴定。与SEQ ID NO:2的残基20-870具有至少70%序列同一性和本文公开的一个或多个取代的一些本发明的β-葡糖苷酶变体还具有除本文具体公开的那些以外的一个或多个取代、缺失或插入。此类取代、缺失或插入对β-葡糖苷酶活性和热稳定性的作用(如果有的话)可使用本领域已知和本文描述的测定(参见,例如下文的实施例3和实施例5)来确定。为了举例说明,表2中的变体编号1具有以下相对于SEQ ID NO:2的残基20-870的取代:M181Y+Q291W+E402N+S434P。为了确定另外的取代(例如,第20位的异亮氨酸被亮氨酸替代)的作用,表达了变体(在该实例中,I20L+M181Y+Q291W+E402N+S434P)并将其特性与亲本(在该实例中,M181Y+Q291W+E402N+S434P)进行比较。

而且,可从亲本序列(例如,诸如本文示例的一种或多种变体)产生β-葡糖苷酶多肽变体(以及编码该变体的多核苷酸)的文库并使用描述在例如实施例5中的高通量筛选来筛选β-葡糖苷酶活性的存在。可将本领域已知的诱变和定向进化方法容易地应用于编码本文示例的β-葡糖苷酶变体的多核苷酸来产生变体文库,所述变体文库可使用本文描述的方法来表达、筛选和测定。诱变和定向进化方法是本领域熟知的。参见,例如Ling,等人,1999,″Approaches to DNA mutagenesis:an overview,″Anal.Biochem.,254(2):157-78;Dale,等人,1996,″Oligonucleotide-directed randommutagenesis using the phosphorothioate method,″Methods Mol.Biol.,57:369-74;Smith,1985,″In vitro mutagenesis,″Ann.Rev.Genet.,19:423-462;Botstein,等人,1985,″Strategies and applications of in vitro mutagenesis,″Science,229:1193-1201;Carter,1986,″Site-directed mutagenesis,″Biochem.J.,237:1-7;Kramer,等人,1984,″Point Mismatch Repair,″Cell,38:879-887;Wells,等人,1985,″Cassette mutagenesis:an efficient method for generationof multiple mutations at defined sites,″Gene,34:315-323;Minshull,等人,1999,″Protein evolution by molecular breeding,″Current Opinion in ChemicalBiology,3:284-290;Christians,等人,1999,″Directed evolution of thymidinekinase for AZT phosphorylation using DNA family shuffling,″NatureBiotechnology,17:259-264;Crameri,等人,1998,″DNA shuffling of a familyof genes from diverse species accelerates directed evolution,″Nature,391:288-291;Crameri,等人,1997,″Molecular evolution of an arsenatedetoxification pathway by DNA shuffling,″Nature_Biotechnology,15:436-438;Zhang,等人,1997″Directed evolution of an effective fucosidasefrom a galactosidase by DNA shuffling and screening,″Proceedings of theNational Academy of Sciences,U.S.A.,94:45-4-4509;Crameri,等人,1996,″Improved green fluorescent protein by molecular evolution using DNAshuffling,″Nature Biotechnology,14:315-319;Stemmer,1994,″Rapidevolution of a protein in vitro by DNA shuffling,″Nature,370:389-391;Stemmer,1994,″DNA shuffling by random fragmentation and reassembly:Invitro recombination for molecular evolution,″Proceedings of the NationalAcademy of Sciences,U.S.A.,91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;和WO 01/75767,其全部通过引用并入本文。

在产生在除上文描述的那些以外的位置包括取代、插入或缺失的变体时,普通熟练的实践者将认识到β-葡糖苷酶蛋白的某些区域对取代(尤其是非保守性取代)的耐受性比其他区域更小。因而,在一些实施方案中,Bgl1变体蛋白保留来自亲本的保守性残基和功能结构域。

β-葡糖苷酶活性和热稳定性测定

β-葡糖苷酶活性可通过实施例3和实施例5中描述的方法以及本领域已知的任何其他方法来确定。β-葡糖苷酶活性可例如使用对硝基苯基-β-D-吡喃葡萄糖苷(pNPG)测定或使用纤维二糖测定来确定。

例如,可使用基于pNPG(对硝基苯基-β-D-吡喃葡萄糖苷)的比色测定来测量β-葡糖苷酶活性。一种此类测定描述在下文实施例3中。在另一个示例性pNPG测定中,在100μL的总体积中,将20μL包含β-葡糖苷酶的澄清培养基上清添加到pH 5的50mM磷酸钠缓冲液中的4mM pNPG(Sigma-Aldrich,Inc.St.Louis,MO)溶液中。反应在pH 5、50℃下孵育1.5小时。用100μL pH 11的1M碳酸钠溶液猝灭反应混合物。在405nm测量溶液的吸光度来确定pNPG向对硝基苯酚的转化。在405nm测量对硝基苯酚(ε=17,700M-1 cm-1)的释放来计算β-葡糖苷酶活性。在高通量筛选条件(pH 7,50℃)下观察可检测的β-葡糖苷酶活性。参见,Breves等人,1997,Appl.Environmental Microbiol.63:3902,其通过引用并入本文。

可选地,可使用其中纤维二糖作为底物的测定来确定β-葡糖苷酶活性。一种适合的测定描述在下文实施例3中。另一种适合的测定如下进行:在100μL的总体积中,将25μL包含β-葡糖苷酶的澄清培养基上清添加到在100mM磷酸钠缓冲液(pH 6-7)或乙酸钠缓冲液(pH 5-5.5)中的10g/L纤维二糖(Fluka目录号22150,Sigma-Aldrich,Inc.,St.Louis,MO)中。反应在45-70℃下孵育适当时间(取决于酶浓度,25分钟至过夜)同时摇动。可使用用于测量葡萄糖的领域已知的多种方法的任一种来确定葡萄糖产生。在一种方法中,使用酶促葡萄糖测定法(K-GLUC,Megazyme,Ireland)确定葡萄糖产生。10μl的每个反应被添加到190μl GOPOD试剂(作为K-GLUC测定试剂盒的一部分提供)中。反应在45℃孵育20分钟并且在510nm测量溶液的吸光度。GOPOD试剂包含50mM磷酸钾缓冲液pH 7.4,0.011M对羟基苯甲酸、0.008%w/v叠氮化钠、葡萄糖氧化酶(>12,000U/L)、过氧化物酶(>650U/L)和80mg/L 4-氨基安替比林。试剂中的葡萄糖氧化酶与样品中存在的任何葡萄糖反应并产生过氧化氢,过氧化氢随后与4-氨基安替比林反应产生醌亚胺染料,醌亚胺染料的数量与存在的葡萄糖的量成比例并且可用分光光度法在510nm测量。

信号肽

一般而言,β-葡糖苷酶多肽自其被表达的宿主细胞(例如,酵母或真菌细胞)分泌,并且作为包括信号肽(即,连接于多肽的氨基末端并引导编码多肽进入细胞分泌途径的氨基酸序列)的前蛋白表达。在一个实施方案中,信号肽是具有作为SEQ ID NO:2的残基1-19给出的序列的内源性C1 β-葡糖苷酶信号肽。在其他实施方案中,使用来自其他C1分泌的蛋白的信号肽。

还可使用其他信号肽,取决于宿主细胞和其他因素。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从米曲霉(Aspergillus oryzae)TAKA淀粉酶、黑曲霉(Aspergillus niger)中性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶、柔毛腐质霉(Humicola lanuginosa)脂肪酶以及里氏木霉纤维二糖水解酶II(TrCBH2)获得的信号肽编码区。

用于细菌宿主细胞的有效的信号肽编码区是从芽孢杆菌(Bacillus)NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)α-淀粉酶、地衣芽孢杆菌(Bacillus licheniformis)枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌(Bacillus subtilis)prsA的基因中获得的信号肽编码区。由Simonen和Palva,1993,Microbiol Rev 57:109-137(通过引用并入本文)描述了其他的信号肽。

用于酵母宿主细胞的有用的信号肽还包括来自酿酒酵母(Saccharomyces cerevisiae)α-因子、酿酒酵母SUC2转化酶(参见,Taussig和Carlson,1983,Nucleic Acids Res 11:1943-54;SwissProt登录号P00724)、以及其他的基因的那些。参见,例如,Romanos等人,1992,Yeast 8:423-488。这些信号肽和其他信号肽的变体是适合的。

融合多肽和另外的序列元件

在一些实施方案中,本发明的β-葡糖苷酶多肽变体包括不改变β-葡糖苷酶的编码活性的另外的序列。例如,β-葡糖苷酶可与表位标签或与在β-葡糖苷酶纯化中有用的其他序列连接。

本发明还提供了β-葡糖苷酶变体融合多肽,其中该融合多肽包括编码本发明的β-葡糖苷酶多肽变体或其片段的氨基酸序列,该氨基酸序列通过β-葡糖苷酶多肽变体的N末端或C末端与编码至少第二(另一个)多肽的氨基酸序列直接或间接地连接。β-葡糖苷酶变体融合多肽还可包括编码第三、第四、第五或另外的多肽的氨基酸序列。通常,每个另外的多肽具有生物学活性,或可选地,为具有生物学活性的多肽的一部分,其中该部分具有改进融合多肽从期望的表达宿主表达和/或分泌的作用。这些序列可被直接或间接地融合到β-葡糖苷酶多肽变体或其片段的N末端或C末端,或可选地融合到具有生物学活性的另外的多肽的N末端或C末端。

通常,另外的多肽编码酶或其活性片段,和/或改进融合多肽从期望的表达宿主表达和/或分泌的多肽。更通常地,另外的多肽编码纤维素酶(例如,具有不同于融合多肽中的β-葡糖苷酶多肽变体的氨基酸序列的β-葡糖苷酶(例如,野生型β-葡糖苷酶或其变体,包括不同的金黄色嗜热子囊菌(T.aurantiacus)β-葡糖苷酶多肽变体),或表现CBH或EG活性的多肽),和/或改进从期望的宿主细胞表达和分泌的多肽,诸如,例如,从期望的表达宿主正常表达和分泌的多肽,如从丝状真菌正常表达的分泌多肽。这些包括来自黑曲霉、黑曲霉泡盛变种(A.niger var.awamori)和米曲霉的葡萄糖淀粉酶、α-淀粉酶和天冬氨酰蛋白酶,来自木霉属(Trichoderma)的纤维二糖水解酶I、纤维二糖水解酶II、内切葡聚糖酶I和内切葡聚糖酶III,以及来自链孢霉属(Neurospora)和腐质霉属(Humicola)物种的葡萄糖淀粉酶。参见WO 98/31821,其通过引用并入本文。

融合多肽的多肽组分可彼此经接头(linker)间接连接。适合在本发明的实践中使用的接头被描述在通过引用并入本文的WO 2007/075899中。示例性接头包括1个至约40个氨基酸残基长度的肽接头,包括约1个至约20个氨基酸残基长度的那些以及约1个至约10个氨基酸残基长度的那些。在一些实施方案中,接头可由单一氨基酸残基组成,诸如,例如,Gly、Ser、Ala或Thr残基,或其组合,特别是Gly和Ser。本发明的实践中采用的接头可以是可切割的。适合的可切割的接头可包括切割位点,诸如蛋白酶识别位点。示例性蛋白酶识别位点是本领域熟知的并且包括例如Lys-Arg(例如,KEX2蛋白酶识别位点,其可被天然曲霉属KEX2样蛋白酶切割)、Lys和Arg(胰蛋白酶识别位点)。参见,例如WO 2007/075899,其通过引用并入本文。

IV.β-葡糖苷酶多核苷酸和表达系统

本发明提供了编码本发明的C1 β-葡糖苷酶变体的多核苷酸序列。C1基因组序列和cDNA序列被描述在上文第II章节。

在一个实施方案中,为了本文描述的β-葡糖苷酶变体的表达,可使用野生型C1 β-葡糖苷酶cDNA序列(SEQ ID NO:1)或其包括开放阅读框的部分(根据需要,具有在对应于取代(相对于野生型序列突变的残基)的密码子处的改变)。此外,可并入表2、表3、表4、表5、表6或表7中显示的“沉默的”核苷酸改变中的一个或多个。

本领域技术人员将理解由于遗传密码的简并性,存在众多编码本发明的β-葡糖苷酶多肽的核苷酸序列。表9提供了每个氨基酸的标准三联体遗传密码。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU均编码氨基酸精氨酸。因而,在密码子指定精氨酸的本发明核酸中的每个位置,该密码子可被改变为以上所述的对应密码子中的任何一个而不改变所编码的多肽。应理解RNA序列中的U对应于DNA序列中的T。本发明考虑并提供可通过选择基于可能的密码子选择的组合而做出的编码本发明多肽的核酸序列的每种和每个可能的变化。

还可以使用高密码子使用偏倚性密码子(在蛋白编码区中以高于编码同一氨基酸的其他密码子的频率被使用的密码子)来设计DNA序列。可以根据在单基因、一组具有共同功能或起源的基因、高表达基因中的密码子使用,在整个生物体的聚集蛋白编码区中的密码子频率,在相关生物体中的聚集蛋白编码区中的密码子频率或它们的组合来确定偏好的密码子。频率随基因表达水平而提高的密码子通常是用于表达的最佳密码子。特别是,DNA序列可被优化以用于在特定宿主生物中表达。为宽范围生物体提供偏好性信息的参考文献是容易获得的。参见,例如Henaut和Danchin的″Escherichia Salmonella,″Neidhardt,等人编,ASM Pres,Washington D.C.(1996),pp.2047-2066,其通过引用并入本文。为了举例说明,但非为了限制,SEQ ID NO:3显示了被设计具有用于在酿酒酵母中表达的密码子偏倚性的C1 Bgl1编码多核苷酸序列。

表9:遗传密码

已知用于确定具体生物体中的密码子频率(例如,密码子使用,相关的同义密码子使用)和密码子偏好的多种方法,包括多变量分析,例如使用聚类分析或对应性分析,以及在基因中使用的密码子的有效数目(参见GCG CodonPreference,Genetics Computer Group Wisconsin Package;CodonW,John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics 14:372-73;Stenico等人,1994,Nucleic Acids Res.222437-46;Wright,F.,1990,Gene 87:23-29;Wada等人,1992,Nucleic Acids Res.20:2111-2118;Nakamura等人,2000,Nucl.Acids Res.28:292;Henaut和Danchin,″Escherichia coli and Salmonella,″1996,Neidhardt,等人编,ASMPress,Washington D.C.,p.2047-2066,其均通过引用并入本文)。用于获得密码子使用的数据源可能依赖于任何可用的能够编码蛋白的核苷酸序列。这些数据集包括实际已知编码表达的蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达序列标签(EST)、或基因组序列的预测编码区(参见,例如Mount,D.,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari等人,1997,Comput.Appl.Biosci.,13:263-270,其全部通过引用并入本文)。

为了β-葡糖苷酶变体在C1或嗜热毁丝霉宿主中的表达,可使用野生型C1β-葡糖苷酶cDNA序列(SEQ ID NO:1)或其包括开放阅读框的部分(根据需要,具有在对应于取代(相对于野生型序列突变的残基)的密码子处的改变)。另外,可并入表2中所示的“沉默的”核苷酸改变中的一个或多个。这些改变可以多种方式影响β-葡糖苷酶活性。例如,不希望受特定机制束缚,沉默的突变可增加编码变体蛋白的mRNA的稳定性。

表达载体

本发明利用包含编码如以上所述的β-葡糖苷酶的序列的重组构建体。在特别的方面,本发明提供了包括与异源启动子可操作地连接的β-葡糖苷酶多核苷酸的表达载体。本发明的表达载体可用于转化适当宿主细胞以允许宿主表达β-葡糖苷酶蛋白。用于在真菌和其他生物体中重组表达蛋白的方法是本领域熟知的,并且许多表达载体是可用的或可使用常规方法来构建。参见,例如,Tkacz和Lange,2004,ADVANCES IN FUNGAL BIOTECHNOLOGYFOR INDUSTRY,AGRICULTURE,AND MEDICINE,KLUWER ACADEMIC/PLENUMPUBLISHERS.New York;Zhu等人,2009,Construction of two Gateway vectorsfor gene expression in fungi Plasmid 6:128-33;Kavanagh,K.2005,FUNGI:BIOLOGY AND APPLICATIONS Wiley,其全部通过引用并入本文。

本发明的核酸构建体包括本发明的核酸序列被插入其中的载体诸如质粒、黏粒、噬菌体、病毒、细菌人工染色体(BAC)、酵母人工染色体(YAC)等等。本发明的多核苷酸可被并入适于表达多肽的各种表达载体中的任何一种。适合的载体包括染色体、非染色体和合成的DNA序列,例如,SV40的衍生物;细菌质粒;噬菌体DNA;杆状病毒;酵母质粒;从质粒和噬菌体DNA的组合衍生的载体;病毒DNA诸如,牛痘苗、腺病毒、鸡痘病毒、伪狂犬病毒、腺病毒、腺相关病毒、逆转录病毒及许多其他病毒。可使用将遗传物质转导到细胞中并且,如果复制是令人期望的,在相关宿主中可复制和可维持的任何载体。

在该实施方案的一个方面,构建体还包括与蛋白编码序列可操作地连接的调节序列,包括例如,启动子。大量的适合的载体和启动子是本领域技术人员已知的。

启动子/基因构建体

如以上所讨论的,为了在特定宿主中获得高表达水平,在异源启动子的控制下表达C1 β-葡糖苷酶通常是有用的。通常可使用常规方法将启动子序列与C1 β-葡糖苷酶编码序列的5’区域可操作地连接。

用于表达β-葡糖苷酶多核苷酸的有用的启动子的实例包括来自真菌的启动子。例如,可使用驱动C1中除β-葡糖苷酶1基因以外的基因的表达的启动子序列。例如,可使用来自编码纤维二糖水解酶的基因的真菌启动子。

其他可用于指导本发明的核苷酸构建体在丝状真菌宿主细胞中转录的适合启动子的实例是从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、以及尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO96/00787,其通过引用并入本文)的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),启动子诸如cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy和glaA(Nunberg等人,1984,Mol.Cell Biol.,4:2306-2315,Boel等人,1984,EMBO J.3:1581-85和EPA 137280;其全部通过引用并入本文),及其突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子可以来自酿酒酵母烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸酯激酶的基因。用于酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast 8:423-488描述,其通过引用并入本文。可使用与真菌中几丁质酶的产生有关的启动子。参见,例如,Blaiseau和Lafay,1992,Gene120243-248(丝状真菌白色扁丝霉(Aphanocladium album));Limon等人,1995,Curr.Genet,28:478-83(哈茨木霉(Trichoderma harzianum)),二者均通过引用并入本文。

已知在原核细胞或真核细胞或其病毒中控制基因表达且可用在本发明的一些实施方案中的启动子包括SV40启动子、大肠杆菌lac或trp启动子、噬菌体λPL启动子、tac启动子、T7启动子等。在细菌宿主细胞中,适合的启动子包括从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、枯草芽孢杆菌xylA和xylB基因,和原核β-内酰胺酶基因获得的启动子。

可使用在适合的宿主细胞中驱动表达的任何其他的启动子序列。适合的启动子序列可使用熟知方法来鉴定。在一种方法中,推定的启动子序列与编码报道蛋白的序列5’连接,将该构建体转染到宿主细胞(例如,C1细胞)中并测量报道基因的表达水平。可通过测量例如报道基因序列的mRNA水平、报道蛋白的酶活性、或产生的报道蛋白的量来确定报道基因的表达。例如,可通过使用绿色荧光蛋白作为编码序列(Henriksen等人,1999,Microbiology 145:729-34,通过引用并入本文)或lacZ报道基因(Punt等人,1997,Gene,197:189-93,通过引用并入本文)来确定启动子活性。可使用借助定向进化法从自然存在的启动子序列获取功能启动子。参见,例如,Wright等人,2005,Human Gene Therapy,16:881-892,通过引用并入本文。

表达载体任选地包含用于翻译起始的核糖体结合位点和转录终止子诸如PinII。载体还任选地包括用于扩大表达的适当的序列,例如,增强子。

此外,本发明的表达载体任选地包含一个或多个选择性标记基因来提供用于选择转化的宿主细胞的表型性状。适合的标记基因包括编码抗微生物抗性,诸如氨苄西林(ampR)、卡那霉素、氯霉素或四环素抗性的那些。另外的实例包括抗微生物的链霉素或壮观霉素(例如,aada基因)、编码链霉素抗性的链霉素磷酸转移酶(spt)基因、编码卡那霉素或遗传霉素抗性的新霉素磷酸转移酶(nptII)基因、编码潮霉素抗性的潮霉素磷酸转移酶(hpt)基因。另外的选择性标记基因包括用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,以及在大肠杆菌中的四环素或氨苄西林抗性。

β-葡糖苷酶多核苷酸的合成和操作

可使用本领域熟知的方法制备编码β-葡糖苷酶的多核苷酸。通常,高达大约40个碱基的寡核苷酸被单独地合成,然后连接(例如,通过酶连接或化学连接方法或聚合酶介导的方法)形成基本上任何期望的连续序列。例如,可以使用例如由Beaucage等人,1981,Tetrahedron Letters,22:1859-69所描述的经典亚磷酰胺方法或由Matthes等人,1984,EMBO J.3:801-05所描述的方法(二者通过引用并入本文)通过化学合成来制备本发明的多核苷酸。这些方法通常在自动化合成方法中实践。根据亚磷酰胺方法,例如在自动化DNA合成器中合成寡核苷酸,纯化,退火,连接并克隆在适当载体中。

另外,基本上任何核酸都可以从各种商业来源中的任何一种定制,诸如The Midland Certified Reagent Company(Midland,TX),The GreatAmerican Gene Company(Ramona,CA),ExpressGen Inc.(Chicago,IL),Operon Technologies Inc.(Alameda,CA)以及许多其他来源。

还可以通过技术文献中描述的熟知技术合成多核苷酸。参见,例如,Carruthers,等人,1982,Cold Spring Harbor Symp.Quant.Biol.,47:411-18和Adams等人,1983,J.Am.Chem.Soc.105:661,二者通过引用并入本文。然后可通过合成互补链并且在适当条件下使链退火在一起,或者使用DNA聚合酶与适当引物序列添加互补链来获得双链DNA片段。

描述本文可用的分子生物学技术(包括使用载体、启动子、足以通过体外扩增方法(包括聚合酶链式反应(PCR)和连接酶链式反应(LCR))以及许多其他的相关方法指导技术人员的方案)的一般教科书包括Berger和Kimmel,Guide to Molecular Cloning Techniques,Methods in Enzymology152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人,Molecular Cloning-A Laboratory Manual(第2版),1-3卷,Cold SpringHarbor Laboratory,Cold Spring Harbor,New York,1989(“Sambrook”)和Current Protocols in Molecular Biology,F.M.Ausubel等人,编,CurrentProtocols,Greene Publishing Associates,Inc.与John Wiley & Sons,Inc.,之间的合资企业(2009增刊)(“Ausubel”),其全部通过引用并入本文。参考Berger、Sambrook和Ausubel,以及Mullis等人,(1987)美国专利第4,683,202号;PCR Protocols A Guide to Methods and Applications(Innis等人编)Academic Press Inc.San Diego,CA(1990)(Innis);Arnheim & Levinson(1990年10月1日)C&EN 36-47;The Journal Of NIH Research(1991)3,81-94;(Kwoh等人(1989)Proc.Natl.Acad.Sci.USA 86,1173;Guatelli等人(1990)Proc.Natl.Acad.Sci.USA 87,1874;Lomell等人(1989)J.Clin.Chem 35,1826;Landegren等人,(1988)Science 241,1077-1080;Van Brunt(1990)Biotechnology 8,291-294;Wu和Wallace,(1989)Gene 4,560;Barringer等人(1990)Gene 89,117,以及Sooknanan和Malek(1995)Biotechnology 13:563-564,其全部通过引用并入本文。用于克隆体外扩增的核酸的方法被描述在Wallace等人,美国专利第5,426,039号中,其通过引用并入本文。

表达宿主

本发明还提供了用编码β-葡糖苷酶的表达载体或DNA构建体转化的工程化(重组)的宿主细胞。任选地,细胞中β-葡糖苷酶的表达在异源启动子的控制之下。本发明的宿主细胞可用于产生β-葡糖苷酶多肽。因而,本发明涉及包含被本文以上描述的本发明的任何β-葡糖苷酶多核苷酸的宿主细胞。如本文所用,遗传修饰的或重组的宿主细胞包括含编码本发明的重组多肽的β-葡糖苷酶多核苷酸的所述宿主细胞的后代。通常,遗传修饰的或重组的宿主细胞是微生物。在一些实施方案中,遗传修饰的或重组的宿主细胞是原核细胞。在一些实施方案中,遗传修饰的或重组的宿主细胞是真核细胞。一般,真核宿主细胞是非人类细胞。适合的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实例中,可修饰宿主细胞以增加蛋白表达、分泌或稳定性,或赋予其他期望的特征。已被突变或选择具有低蛋白酶活性的细胞(例如真菌)对于表达是特别有用的。例如,可使用C.lucknowense的蛋白酶缺陷菌株(例如,其中碱性蛋白酶基因座已被缺失或破坏)。在一些实施方案中,可修饰宿主细胞例如真菌来表达重组纤维素酶。

适合的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、不完全菌(Deuteromycota)、接合菌门(Zygomycota)和半知菌(Fungi imperfecti)。在一些实施方案中,真菌宿主细胞是酵母细胞和丝状真菌细胞。本发明的丝状真菌宿主细胞包括真菌亚门(Eumycotina)和卵菌门(Oomycota)的所有丝状形式。(参见,例如,Hawksworth等人,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中,其通过引用并入本文)。丝状真菌的特征为营养菌丝和由几丁质、纤维素及其他复杂多糖组成的细胞壁。本发明的丝状真菌宿主细胞与酵母在形态学上是不同的。

在一些实施方案中,丝状真菌宿主细胞可以是但不限于以下属的物种的细胞:绵霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothia)、镰孢菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、链孢霉属、青霉属(Penicillium)、Podospora、射脉革菌属(Phlebia)、Piromyces、梨孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、节格孢属(Scytalidium)、侧孢霉属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属、轮枝孢属(Verticillium)、小包脚菇属(Volvariella),或其无性型或有性型,以及同义词或分类学等同物。

在本发明的一些实施方案中,丝状真菌宿主细胞是曲霉属物种、拟蜡菌属物种、金孢属物种、棒囊壳菌属物种、镰孢菌属物种、腐质霉属物种、链孢霉属物种、青霉属物种、弯颈霉属物种、栓菌属物种或木霉属物种。

在本发明的一些实施方案中,丝状真菌宿主细胞是金孢属的物种,例如,C.lucknowense、嗜角蛋白金孢(C.keratinophilum)、热带金孢(C.tropicum)、粪状金孢(C.merdarium)、C.inops、C.pannicola和C.zonatum。在本发明的一些实施方案中,丝状真菌宿主细胞是木霉属的物种,例如,长枝木霉(T.longibrachiatum)、绿色木霉(T.viride)(例如,ATCC 32098和32086),或里氏木霉,红褐肉座菌(Hypocrea jecorina)的无性型(NRRL15709、ATTC 13631、56764、56765、56466、56767和RL-P37及其衍生物-见Sheir-Neiss等人,1984,Appl.Microbiol.Biotechnology,20:46-53,其通过引用并入本文),康氏木霉(T.koningii)和哈茨木霉。另外,术语“木霉属”是指之前分类为木霉属以及目前分类为木霉属的任何真菌菌株。

在本发明的一些实施方案中,丝状真菌宿主细胞是曲霉属的物种,例如,泡盛曲霉、烟曲霉(A.fumigatus)、日本曲霉(A.japonicus)、构巢曲霉、黑曲霉、棘孢曲霉(A.aculeatus)、臭曲霉(A.foetidus)、米曲霉、酱油曲霉(A.sojae)、和A.kawachi。(参考Kelly和Hynes,1985,EMBOJ.4,475479;NRRL 3112、ATCC 11490、22342、44733和14331;Yelton等人,1984,Proc.Natl.Acad.Sci.USA,81,1470-1474;Tilburn等人,1982,Gene 26,205-221;和Johnston等人,1985,EMBO J.4,1307-1311,其全部通过引用并入本文)。

在本发明的一些实施方案中,丝状真菌宿主细胞是镰孢菌属的物种,例如,F.bactridioides、F.cerealis、克鲁克威尔镰孢(F.crookwellense)、大刀镰孢(F.culmorum)、禾谷镰孢(F.graminearum)、禾赤镰孢(F.graminum)、尖镰孢、粉红镰孢(F.roseum)和F.venenatum。

在本发明的一些实施方案中,丝状真菌宿主细胞是毁丝霉属的物种,例如嗜热毁丝霉。

在本发明的一些实施方案中,丝状真菌宿主细胞是链孢霉属的物种,例如N.crassa。参考Case M.E.等人,1979,Proc.Natl.Acad.Sci.USA,76,5259-5263;USP 4,486,553;以及Kinsey,J.A.和J.A.Rambosek,1984,Molecular and Cellular Biology 4,117-122,其全部通过引用并入本文。在本发明的一些实施方案中,丝状真菌宿主细胞是腐质霉属的物种,例如,特异腐质霉、灰腐质霉(H.grisea)和柔毛腐质霉。在本发明的一些实施方案中,丝状真菌宿主细胞是毛霉属的物种,例如,米黑毛霉(M.miehei)和卷枝毛霉(M.circinelloides)。在本发明的一些实施方案中,丝状真菌宿主细胞是根霉属的物种,例如,米根霉(R.oryzae)和雪白根霉(R.niveus)。在本发明的一些实施方案中,丝状真菌宿主细胞是青霉属的物种,例如,产紫青霉(P.purpurogenum)、产黄青霉(P.chrysogenum)和疣孢青霉(P.verruculosum)。在本发明的一些实施方案中,丝状真菌宿主细胞是梭孢壳属的物种,例如,太瑞斯梭孢壳霉(T.terrestris)。在本发明的一些实施方案中,丝状真菌宿主细胞是弯颈霉属的物种,例如,膨大弯颈霉(T.inflatum)和T.geodes。在本发明的一些实施方案中,丝状真菌宿主细胞是栓菌属的物种,例如,长绒毛栓菌(T.villosa)和变色栓菌(T.versicolor)。

在本发明中,酵母宿主细胞可以是但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyce)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和耶氏酵母属(Yarrowia)的物种的细胞。在本发明的一些实施方案中,酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、奇异酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomycespombe)、巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichiafinlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia kodamae、膜醭毕赤酵母(Pichia membranaefaciens)、Pichia opuntiae、耐热毕赤酵母(Pichia thermotolerans)、柳毕赤酵母(Pichia salictaria)、Pichiaquercuum、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色假丝酵母(Candida albicans)和解脂耶氏酵母(Yarrowia lipolytica)。

在本发明的一些实施方案中,宿主细胞是藻类诸如衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.reinhardtii))和席藻属(Phormidium)(席藻属物种(P.sp.)ATCC29409)。

在其他实施方案中,宿主细胞是原核细胞。适合的原核细胞包括革兰氏阳性、革兰氏阴性和革兰氏染色不定(Gram-variable)的细菌细胞。宿主细胞可以是但不限于土壤杆菌属(Agrobacterium)、脂环酸杆菌属(Alicyclobacillus)、鱼腥蓝细菌属(Anabaena)、组囊蓝细菌属(Anacystis)、不动杆菌属(Acinetobacter)、热酸菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、巴克纳氏菌属(Buchnera)、Campestris、弯曲菌属(Camplyobacter)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭杆菌属(Fusobacterium)、Faecalibacterium、弗朗西丝氏菌属(Francisella)、黄杆菌属(Flavobacterium)、土芽孢杆菌属(Geobacillus)、嗜血菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中慢生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、分枝杆菌属(Mycobacterium)、奈瑟氏球菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、Synecoccus、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、弗朗西丝氏菌属(Francisella)、Temecula、嗜热聚球蓝细菌属(Thermosynechococcus)、热球菌属(Thermococcus)、尿枝原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)的物种。

在一些实施方案中,宿主细胞是土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、巴克纳氏菌属、土芽孢杆菌属、弯曲菌属、梭菌属、棒杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门氏菌属、链球菌属、链霉菌属和发酵单胞菌属的物种。

在又其他实施方案中,细菌宿主菌株是对人非致病的。在一些实施方案中,细菌宿主菌株是工业菌株。众多细菌工业菌株是已知的和在本发明中适合的。

在本发明的一些实施方案中,细菌宿主细胞是土壤杆菌属的物种,例如,放射形土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)和钩子土壤杆菌(A.rubi)。在本发明的一些实施方案中,细菌宿主细胞是节杆菌属的物种,例如,金黄节杆菌(A.aurescens)、柠檬节杆菌(A.citreus)、球形节杆菌(A.globformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、原玻璃蝇短杆菌(A.protophonniae)、玫瑰色石蜡节杆菌(A.roseoparqffinus)、硫磺节杆菌(A.sulfureus)和产脲节杆菌(A.ureafaciens)。在本发明的一些实施方案中,细菌宿主细胞是芽孢杆菌属的物种,例如,苏云金芽孢杆菌(B.thuringiensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌、耐盐嗜碱芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌。在特定实施方案中,宿主细胞将是工业芽孢杆菌菌株,包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌。芽孢杆菌属宿主细胞的一些实施方案包括枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌和解淀粉芽孢杆菌。在一些实施方案中,细菌宿主细胞是梭菌属的物种,例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌(C.tetani)E88、象牙海岸梭菌(C.lituseburense)、糖丁酸梭菌(C.saccharobutylicum)、产气荚膜梭菌(C.perfringens)、热纤梭菌(C.thermocellum)和拜氏梭菌(C.beijerinckii)。在一些实施方案中,细菌宿主细胞是棒杆菌属的物种,例如,谷氨酸棒杆菌(C.glutamicum)和嗜乙酰乙酸棒杆菌(C.acetoacidophilum)。在一些实施方案中,细菌宿主细胞是埃希氏菌属的物种,例如大肠杆菌。在一些实施方案中,细菌宿主细胞是欧文氏菌属的物种,例如,噬夏孢欧文氏菌(E.uredovora)、胡萝卜软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、点状欧文氏菌(E.punctata)和土欧文氏菌(E.terreus)。在一些实施方案中,细菌宿主细胞是泛菌属的物种,例如柠檬泛菌(P.citrea)和成团泛菌(P.agglomerans)。在一些实施方案中,细菌宿主细胞是假单胞菌属的物种,例如,恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii和假单胞菌属物种D-01 10。在一些实施方案中,细菌宿主细胞是链球菌属的物种,例如,似马链球菌(S.equisimiles)、酿脓链球菌(S.pyogenes)和乳房链球菌(S.uberis)。在一些实施方案中,细菌宿主细胞是链霉菌属的物种,例如,产二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌、生金色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)和浅青紫链霉菌(S.lividans)。在一些实施方案中,细菌宿主细胞是发酵单胞菌属的物种,例如,运动发酵单胞菌(Z.mobilis)和解脂发酵单胞菌(Z.lipolytica)。

可在本发明的实践中使用的菌株(包括原核和真核菌株)对于公众来说是容易从许多培养物保藏中心获得,诸如美国模式培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSM)、皇家荷兰生物科技研究所培养物保藏中心(Centraalbureau VoorSchimmelcultures,CBS)和美国北部区域研究中心农业研究服务专利培养物保藏中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center,NRRL)。

宿主细胞可被遗传修饰以具有改进蛋白分泌、蛋白稳定性或其他蛋白表达和/或分泌所期望的特性的特征。例如,Alp1功能的敲除得到蛋白酶缺陷的细胞。pyr5功能的敲除得到具有嘧啶缺陷表型的细胞。在特定实施方案中,宿主细胞被修饰以缺失内源性纤维素酶蛋白编码序列或以其他方式消除一种或多种内源性纤维素酶的表达。在一个实施方案中,一种或多种内源性纤维素酶的表达被抑制以增加感兴趣的纤维素酶的产量。可通过基因工程技术或使用经典微生物学技术诸如化学诱变或紫外线诱变以及随后的选择来实现遗传修饰。可使用重组修饰和经典选择技术的组合来产生感兴趣的生物体。使用重组技术,以导致生物体或培养物内β-葡糖苷酶产量增加的方式将核酸分子引入、缺失、抑制或修饰。例如,Alp1功能的敲除得到蛋白酶缺陷的细胞。pyr5功能的敲除得到具有嘧啶缺陷表型的细胞。在一个基因工程方法中,可使用同源重组通过体内特异性靶向基因抑制编码蛋白的表达来引导靶基因修饰。在可选方法中,可使用siRNA、反义或核酶技术来抑制基因表达。

转化和培养

将载体或DNA构建体引入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染、电穿孔或其他常见技术实现(参见Davis等人,1986,BasicMethods in Molecular Biology,其通过引用并入本文)。

可将工程化宿主细胞培养在改良为适合激活启动子、选择转化子或扩增β-葡糖苷酶多核苷酸的常规营养培养基中。培养条件诸如温度、pH等是之前被选择用于表达的宿主细胞所用的培养条件,并且将对本领域技术人员是明显的。如所指出的,许多参考文献对于许多细胞的培养和产生是可用的,所述细胞包括细菌、植物、动物(尤其是哺乳动物)和古细菌来源的细胞。参见,例如,Sambrook,Ausubel,和Berger(均在上文),以及Freshney(1994)Culture of Animal Cells,a Manual of Basic Technique,第三版,Wiley-Liss,New York以及其中引用的参考文献;Doyle和Griffiths(1997)Mammalian Cell Culture:Essential Techniques John Wiley and Sons,NY;Humason(1979)Animal Tissue Techniques,第四版W.H.Freeman andCompany;和Ricciardelli,等人,(1989)In Vitro Cell Dev.Biol.25:1016-1024,其全部通过引用并入本文。对于植物细胞培养和再生,Payne等人(1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley &Sons,Inc.New York,NY;Gamborg和Phillips(编)(1995)Plant Cell,Tissueand Organ Culture;Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York);Jones,编(1984)Plant GeneTransfer and Expression Protocols,Humana Press,Totowa,New Jersey和Plant Molecular Biology(1993)R.R.D.Croy,编Bios Scientific Publishers,Oxford,U.K.ISBN 0 12 198370 6,其全部通过引用并入本文。细胞培养基一般在Atlas和Parks(编)The Handbook of Microbiological Media(1993)CRC Press,Boca Raton,FL中列出,其通过引用并入本文。另外的细胞培养信息见于可用的商业文献,诸如来自Sigma-Aldrich,Inc(St Louis,MO)的Life Science Research Cell Culture Catalogue(1998)(“Sigma-LSRCCC”)和例如同样来自Sigma-Aldrich,Inc(St Louis,MO)的The Plant CultureCatalogue及增刊(1997)(“Sigma-PCCS”),其全部通过引用并入本文。

在一些实施方案中,表达本发明的β-葡糖苷酶多肽的细胞生长在分批发酵或连续发酵条件下。经典的分批发酵是封闭系统,其中培养基的组成在发酵开始时设定并且在发酵期间不经历人为改变。分批系统的变化是分批补料发酵(fed-batch fermentation),其也在本发明中具有用途。在该变化中,基质随着发酵进行被增量加入。当分解代谢物阻遏(cataboliterepression)可能抑制细胞的代谢时和在期望培养基中具有有限量的基质的情况下,分批补料系统是有用的。分批发酵和分批补料发酵在本领域中是常见的和熟知的。连续发酵是开放系统,其中确定成分的发酵培养基被连续添加到生物反应器并且等量的条件培养基被同时移出用于加工。连续发酵一般保持培养物在恒定的高密度,其中细胞主要处于对数期生长。连续发酵系统努力保持稳定态生长条件。用于调整营养和生长因子用于连续发酵过程的方法以及使产物形成速率最大化的技术是工业微生物学领域熟知的。

无细胞的转录/翻译系统也可以被采用以使用本发明的多核苷酸产生β-葡糖苷酶多肽。几种此类系统是市售的。体外转录和翻译方案的一般指导见于Tymms(1995)In vitro Transcription and Translation Protocols:Methods in Molecular Biology,第37卷,Garland Publishing,NY,其通过引用并入本文。

V.β-葡糖苷酶多肽的产生和回收

本发明还涉及制备具有β-葡糖苷酶活性的多肽的方法,该方法包括:提供用本发明的任何一种描述的β-葡糖苷酶多核苷酸转化的宿主细胞;在宿主细胞表达编码的β-葡糖苷酶多肽的条件下将该转化的宿主细胞培养在培养基中;和任选地回收或分离表达的β-葡糖苷酶多肽,或回收或分离含表达的β-葡糖苷酶多肽的培养基。该方法还提供在表达编码的β-葡糖苷酶多肽后任选地裂解转化的宿主细胞,和任选地从细胞裂解物中回收或分离表达的β-葡糖苷酶多肽。本发明还提供了制备β-葡糖苷酶多肽的方法,所述方法包括在适于产生β-葡糖苷酶多肽的条件下培养用β-葡糖苷酶多核苷酸转化的宿主细胞并且回收β-葡糖苷酶多肽。

通常,使用本领域熟知的蛋白回收技术包括本文描述的那些技术,从宿主细胞培养基、宿主细胞或二者中回收或分离β-葡糖苷酶多肽。通常通过离心收集细胞,通过物理或化学手段破坏细胞,且保留所得粗提取物用于进一步纯化。在蛋白表达中采用的微生物细胞可通过任何便利的方法破坏,包括冻-融循环、超声处理、机械破坏或使用细胞裂解剂,或本领域技术人员熟知的其他方法。

所得多肽可被回收/分离并任选地通过许多本领域已知方法中的任一种被纯化。例如,可通过常规程序将多肽从营养培养基中分离,所述常规程序包括但不限于离心、过滤、提取、喷雾干燥、蒸发、色谱(例如,离子交换色谱、亲和色谱、疏水相互作用色谱、色谱聚焦和尺寸排阻色谱)或沉淀。蛋白重折叠步骤可根据期望使用,以完成成熟蛋白的构型。最后,在最后的纯化步骤中可利用高效液相色谱(HPLC)。BGL1的纯化被描述于Parry等人,2001,Biochem.J.353:117,和Hong等人,2007,Appl.Microbiol.Biotechnol.73:1331,均通过引用并入本文。除了上文指出的参考文献以外,各种纯化方法是本领域已知的,包括例如,以下列出的那些:Sandana(1997)Bioseparation of Proteins,Academic Press,Inc.;Bollag等人(1996)Protein Methods,第二版,Wiley-Liss,NY;Walker(1996)The ProteinProtocols Handbook Humana Press,NJ;Harris和Angal(1990)ProteinPurification Applications:A Practical Approach,IRL Press at Oxford,Oxford,England;Harris和Angal Protein Purification Methods:A Practical Approach,IRL Press at Oxford,Oxford,England;Scopes(1993)Protein Purification:Principles and Practice第三版,Springer Verlag,NY;Janson和Ryden(1998)Protein Purification:Principles,High Resolution Methods and Applications,第二版,Wiley-VCH,NY;和Walker(1998)Protein Protocols on CD-ROM,Humana Press,NJ,其全部通过引用并入本文。

可使用免疫学方法来纯化β-葡糖苷酶多肽。在一种方法中,使用常规方法针对β-葡糖苷酶多肽(例如针对包含SEQ ID NO:2的多肽或其免疫原性片段)产生的抗体被固定在珠上,在β-葡糖苷酶被结合的条件下与细胞培养基混合,并沉淀。在相关方法中,使用免疫色谱。

如所指出的,在一些实施方案中,β-葡糖苷酶作为包含非酶部分的融合蛋白表达。在一些实施方案中,β-葡糖苷酶序列与促进纯化的结构域(purification facilitating domain)融合。如本文所用,术语“促进纯化的结构域”是指介导与之融合的多肽的纯化的结构域。适合的纯化结构域包括金属螯合肽,允许在固定化金属上纯化的组氨酸-色氨酸模块,结合谷胱甘肽的序列(例如GST),血凝素(HA)标签(对应于从流感血凝素蛋白获取的表位;Wilson等人,1984,Cell 37:767),麦芽糖结合蛋白序列,在FLAGS延伸/亲和纯化系统(Immunex Corp,Seattle,WA)中利用的FLAG表位,以及类似的纯化结构域。在纯化结构域和HHDH多肽之间包含蛋白酶可切割的多肽接头序列可用于促进纯化。被考虑在本文所述的组合物和方法中使用的一种表达载体提供包含由肠激酶切割位点分隔的融合于聚组氨酸区域的本发明多肽的融合蛋白的表达。组氨酸残基促进在IMIAC(固定化金属离子亲和色谱,如Porath等人,1992,Protein Expression andPurification 3:263-281所述)上纯化,而肠激酶切割位点提供将HHDH多肽与融合蛋白分离的手段。pGEX载体(Promega;Madison,Wis.)也可用于表达作为与谷胱甘肽S转移酶(GST)的融合多肽的外源多肽。一般地说,此类融合蛋白是可溶的,并且通过吸附于配体-琼脂糖珠(例如,在GST-融合物情况下的谷胱甘肽-琼脂糖),接着在游离配体的存在下洗脱,可容易地从裂解细胞中纯化。

VI.使用β-葡糖苷酶多肽和表达β-葡糖苷酶多肽的细胞的方法

如上文所述,本发明的β-葡糖苷酶多肽能够用于催化糖二聚体的水解同时释放相应的糖单体,例如,纤维二糖的转化同时释放葡萄糖。因而,本发明提供了通过以下方式产生葡萄糖的方法:(a)提供纤维二糖;和(b)使纤维二糖与本发明的β-葡糖苷酶多肽在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。β-葡糖苷酶多肽可在此类方法中以分离形式或作为组合物的一部分被利用,诸如本文描述的那些中的任何一种。β-葡糖苷酶多肽还可在细胞培养基或在细胞裂解物中提供。例如,在通过培养用本发明的β-葡糖苷酶多核苷酸或载体转化的宿主细胞产生β-葡糖苷酶多肽以后,β-葡糖苷酶不必从培养基(即,如果β-葡糖苷酶被分泌到培养基中的话)或细胞裂解物(即,如果β-葡糖苷酶没有被分泌到培养基中的话)中分离,或不必以纯化形式用于使用β-葡糖苷酶多肽的另外的方法。包含本发明的β-葡糖苷酶多肽的任何组合物、细胞培养基或细胞裂解物可适于在利用β-葡糖苷酶的方法中使用。因此,本发明还提供了通过以下方式产生葡萄糖的方法:(a)提供纤维二糖;和(b)使纤维二糖与包含本发明的β-葡糖苷酶多肽的培养基或细胞裂解物或组合物在足以形成将纤维二糖转化为葡萄糖的反应混合物的条件下接触。

本发明还提供了可用于将纤维二糖酶促转化为葡萄糖的组合物。例如,可将本发明的一种或多种β-葡糖苷酶多肽与另一种酶和/或改变块体材料处理特性或β-葡糖苷酶另外的加工性的剂(例如,助流剂、水、缓冲剂、表面活性剂等)或改进纤维二糖向葡萄糖的转化的效率的剂组合,如本文以下更详细描述的。其他的酶可以是不同的β-葡糖苷酶或另一种纤维素酶。

酶混合物

在另一个方面,本发明提供了包含如本文所述的C1 Bgl1多肽变体的酶混合物。酶混合物可以是无细胞的,或在可选的实施方案中,可以不与分泌酶混合物组分的宿主细胞分离。无细胞的酶混合物通常包括已经与任何细胞分离的酶。无细胞的酶混合物可通过本领域已知的多种方法学的任何一种来制备,诸如过滤或离心方法。在某些实施方案中,酶混合物可以是例如部分无细胞的、基本上无细胞的或整体上无细胞的。

C1 Bgl1变体和酶混合物中存在的任何另外的酶可从单个基因修饰的真菌细胞中分泌或被组合发酵(combined fermentation)或分步发酵(separate fermentation)的不同微生物分泌。类似地,C1 Bgl1变体和酶混合物中存在的任何另外的酶可从不同生物体的不同菌株中个体地表达或以亚组表达,并且将酶在体外组合来制备酶混合物。还考虑C1 Bgl1变体和酶混合物中的任何另外的酶可从单一生物体的不同菌株中个体地表达或以亚组表达,并且将酶组合来制备酶混合物。在一些实施方案中,所有的酶从单一宿主生物体中表达,如基因修饰的真菌细胞。

在一些实施方案中,酶混合物包括选自CBH、EG和BG纤维素酶的其他类型的纤维素酶。在一些实施方案中,纤维二糖水解酶是里氏木霉纤维二糖水解酶II。在一些实施方案中,内切葡聚糖酶包括从除虫链霉菌内切葡聚糖酶的催化结构域获取的催化结构域。参见,共同未决的申请第12/751,985号,其通过引用并入本文。在一些实施方案中,至少一种纤维素酶是解纤维热酸菌(Acidothermus cellulolyticus)、褐色嗜热裂孢菌(Thermobifida fusca)、灰腐质霉或金孢属的纤维素酶。纤维素酶混合物的纤维素酶一起作用导致解晶并水解来自生物质基质的纤维素以产生可溶性糖,诸如但不限于葡萄糖(参见Brigham等人,1995,于Handbook onBioethanol(C.Wyman编)pp 119-141,Taylor和Francis,Washington DC,其通过引用并入本文)。

用于有效酶促水解纤维素的纤维素酶混合物是已知的(参见,例如,Viikari等人,2007,“Thermostable enzymes in lignocellulose hydrolysis”AdvBiochem Eng Biotechnol 108:121-45,和Iogen Energy Corp.的美国专利公布US 2009/0061484;US 2008/0057541;和US 2009/0209009),为所有目的每一篇均通过引用并入本文。在一些实施方案中,将纯化的自然存在的或重组的酶的混合物与纤维素原料或纤维素水解的产物组合。可选地或另外地,可将各自产生一种或多种自然存在或重组的纤维素酶的一个或多个细胞群体与纤维素原料或纤维素水解产物组合。

本发明的β-葡糖苷酶多肽变体还可以存在于具有除降解纤维素、半纤维素、果胶和/或木质纤维素的纤维素酶之外的酶的混合物中。

如本文所用的“半纤维素酶”是指能够催化将半纤维素水解成小的多糖诸如寡糖或单体糖的多肽。半纤维素包括木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖。半纤维素酶包括,例如,以下:内切木聚糖酶、β-木糖苷酶、α-L-阿拉伯呋喃糖苷酶、α-D-葡糖苷酸酶、阿魏酰酯酶、香豆酰酯酶、α-半乳糖苷酶、β-半乳糖苷酶、β-甘露聚糖酶和β-甘露糖苷酶。酶混合物可因此包括本发明的β-糖苷酶变体以及一种或多种半纤维素酶。

内切木聚糖酶(EC 3.2.1.8)催化木聚糖中的1,4-β-D-木糖苷键的内切水解(endohydrolysis)。这种酶还可以被称为内切-1,4-β-木聚糖酶或1,4-β-D-木聚糖木聚糖水解酶。替代物是EC 3.2.1.136,葡糖醛酸阿拉伯木聚糖内切木聚糖酶,是能够水解葡糖醛酸阿拉伯木聚糖中的1,4木糖苷键的酶。

β-木糖苷酶(EC 3.2.1.37)催化1,4-β-D-木聚糖的水解以从非还原性末端除去逐个的D-木糖残基。这种酶还可以被称为木聚糖1,4-β-木糖苷酶、1,4-β-D-木聚糖木水解酶(1,4-β-D-xylan xylohydrolase)、外切1,4-β-木糖苷酶或木二糖酶(xylobiase)。

α-L-阿拉伯呋喃糖苷酶(EC 3.2.1.55)催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶作用于α-L-阿拉伯呋喃糖苷、包含(1,3)-键和/或(1,5)-键的α-L-阿拉伯聚糖(alpha-L-arabinan)、阿拉伯木聚糖和阿拉伯半乳聚糖。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶和α-L-阿拉伯聚糖酶。

α-葡糖醛酸酶(EC 3.2.1.139)催化α-D-葡糖醛酸苷水解为D-葡糖醛酸和醇。

乙酰基木聚糖酯酶(EC 3.1.1.72)催化乙酰基从聚合的木聚糖、乙酰化的木糖、乙酰化的葡萄糖、α-萘基乙酸酯和对硝基苯基乙酸酯水解。

阿魏酰酯酶(EC 3.1.1.73)具有催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基从酯化的糖(其通常是“自然”底物中的阿拉伯糖)水解以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)的4-羟基-3-甲氧基肉桂酰-糖水解酶活性(EC3.1.1.73)。阿魏酰酯酶还被称为阿魏酸酯酶、羟基肉桂酰酯酶、FAE-III、肉桂酰酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。

香豆酰酯酶(EC 3.1.1.73)催化如下形式的反应:香豆酰-糖+H(2)O=香豆酸+糖。糖可以是例如寡糖或多糖。这种酶还可以被称为反式-4-香豆酰酯酶、反式-对-香豆酰酯酶、对-香豆酰酯酶或对-香豆酸酯酶。该酶还落在EC 3.1.1.73之内,所以还可以被称为阿魏酰酯酶。

α-半乳糖苷酶(EC 3.2.1.22)催化α-D-半乳糖苷中的末端非还原性α-D-半乳糖残基的水解,所述α-D-半乳糖苷包括半乳糖寡糖、半乳糖甘露聚糖、半乳聚糖和阿拉伯半乳聚糖。这种酶还可以被称为蜜二糖酶。

β-半乳糖苷酶(EC 3.2.1.23)催化β-D-半乳糖苷中的末端非还原性β-D-半乳糖残基的水解。此类多肽还可能能够水解α-L-阿拉伯糖苷。这种酶还可以被称为外切-(1->4)-β-D-半乳聚糖酶或乳糖酶。

β-甘露聚糖酶(EC 3.2.1.78)催化甘露聚糖、半乳糖甘露聚糖和葡甘露聚糖中的1,4-β-D-甘露糖苷键的随机水解。这种酶还可以被称为甘露聚糖内切-1,4-β-甘露糖苷酶或内切-1,4-甘露聚糖酶。

β-甘露糖苷酶(EC 3.2.1.25)催化β-D-甘露糖苷中的末端非还原性β-D-甘露糖残基的水解。这种酶还可以被称为甘露聚糖酶(mannanase)或甘露聚糖酶(mannase)。

在包含本发明的β-葡糖苷酶变体的酶混合物中还可以包括一种或多种降解果胶的酶。果胶酶催化果胶水解成较小的单元,诸如寡糖或单体糖。酶混合物可包括任何果胶酶,例如内切-聚半乳糖醛酸酶、果胶甲基酯酶、内切-半乳聚糖酶、果胶乙酰基酯酶、内切-果胶裂解酶、果胶酸裂解酶、α鼠李糖苷酶、外切-半乳糖醛酸酶、外切-聚半乳糖醛酸裂解酶、鼠李聚糖半乳糖醛酸(rhamnogalacturonan)水解酶、鼠李聚糖半乳糖醛酸裂解酶、鼠李聚糖半乳糖醛酸乙酰基酯酶、鼠李聚糖半乳糖醛酸半乳糖醛酸水解酶或木半乳糖醛酸酶(xylogalacturonase)。

内切-聚半乳糖醛酸酶(EC 3.2.1.15)催化果胶酸和其他半乳糖醛酸聚糖(galacturonan)中的1,4-α-D-半乳糖苷醛酸键(1,4-α-D-galactosiduroniclinkage)的随机水解。这种酶还可以被称为聚半乳糖醛酸酶果胶解聚酶、果胶酶(pectinase)、内切聚半乳糖醛酸酶、果胶酶(pectolase)、果胶水解酶、果胶聚半乳糖醛酸酶、聚-α-1,4-半乳糖醛酸苷聚糖水解酶、内切半乳糖醛酸酶;内切-D-半乳糖醛酸酶或聚(1,4-α-D-半乳糖醛酸苷)聚糖水解酶。

果胶甲基酯酶(EC 3.1.1.11)催化如下反应:果胶+n H2O=n甲醇+果胶酸。这种酶还可以称为果胶酯酶、脱甲氧基果胶酶(pectindemethoxylase)、果胶甲氧基酶、果胶甲基酯酶、果胶酶、果胶酯酶(pectinoesterase)或果胶甲酯水解酶(pectin pectylhydrolase)。

内切半乳聚糖酶(EC 3.2.1.89)催化阿拉伯半乳聚糖中的1,4-β-D-半乳糖苷键的内切水解(endohydrolysis)。该酶还可以称为阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶、内切-1,4-β-半乳聚糖酶、半乳聚糖酶、阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4-β-D-半乳聚糖水解酶。

果胶乙酰基酯酶催化果胶GaIUA残基的羟基处的乙酰基的脱乙酰基作用。

内切-果胶裂解酶(EC 4.2.2.10)催化(1→4)-α-D-半乳糖醛酸聚糖甲基酯的消除性切割以给予在非还原性末端具有4-脱氧-6-O-甲基-α-D-半乳-4-烯醛酸糖基(4-deoxy-6-O-methyl-α-D-galact-4-enuronosyl)基团的寡糖。该酶还可以称为果胶裂解酶、果胶反式-消除酶(pectin trans-eliminase);内切-果胶裂解酶、聚甲基半乳糖醛酸反式消除酶、果胶甲基反式消除酶、果胶裂解酶(pectolyase)、PL、PNL或PMGL或(1→4)-6-O-甲基-α-D-半乳糖醛酸聚糖裂解酶。

果胶酸裂解酶(EC 4.2.2.2)催化(1→4)-α-D-半乳糖醛酸聚糖的消除性切割以给予在非还原性末端具有4-脱氧-α-D-半乳-4-烯醛酸糖基(4-deoxy-α-D-galact-4-enuronosyl)基团的寡糖。该酶还可以称为聚半乳糖醛酸反式消除酶(polygalacturonic transeliminase)、果胶酸反式消除酶、聚半乳糖醛酸裂解酶、内切果胶甲基反式消除酶、果胶酸反式消除酶、内切半乳糖醛酸反式消除酶、果胶酸裂解酶、果胶裂解酶、α-1,4-D-内切聚半乳糖醛酸裂解酶、PGA裂解酶、PPase-N、内切-α-1,4-聚半乳糖醛酸裂解酶、聚半乳糖醛酸裂解酶、果胶反式消除酶、聚半乳糖醛酸反式消除酶或(1→4)-α-D-半乳糖醛酸聚糖裂解酶。

α鼠李糖苷酶(EC 3.2.1.40)催化α-L-鼠李糖苷或可选的鼠李聚糖半乳糖醛酸中的末端非还原性α-L-鼠李糖残基的水解。这种酶还可以称为α-L-鼠李糖苷酶T、α-L-鼠李糖苷酶N或α-L-鼠李糖苷鼠李糖水解酶。

外切-半乳糖醛酸酶(EC 3.2.1.82)从非还原性末端水解果胶酸,释放二半乳糖醛酸(digalacturonate)。该酶还可以称为外切-聚-α-半乳糖醛酸苷酶、外切聚半乳糖苷酶或外切聚半乳糖醛酸苷酶。

外切-半乳糖醛酸酶(EC 3.2.1.67)催化如下类型的反应:(1,4-α-D-半乳糖醛酸苷)n+H2O=(1,4-α-D-半乳糖醛酸苷)n-1+D-半乳糖醛酸。该酶还可以称为半乳糖醛酸聚糖1,4-α-半乳糖醛酸苷酶(galacturan1,4-α-galacturonidase)、外切聚半乳糖醛酸酶、聚(半乳糖醛酸)水解酶、外切-D-半乳糖醛酸酶、外切-D-半乳糖醛酸酶、外切聚-D-半乳糖醛酸酶或聚(1,4-α-D-半乳糖醛酸苷)半乳糖醛酸水解酶。

外切聚半乳糖醛酸裂解酶(EC 4.2.2.9)催化4-(4-脱氧-α-D-半乳-4-烯醛酸糖基)-D-半乳糖醛酸从果胶酸(即去酯化的果胶)的还原性末端的消除性切割。这种酶还可以称为果胶酸二糖裂解酶、果胶酸外切裂解酶、外切果胶酸反式消除酶、外切果胶酸裂解酶、外切聚半乳糖醛酸-反式-消除酶、PATE、外切-PATE、外切-PGL或(1→4)-α-D-半乳糖醛酸聚糖还原性末端二糖裂解酶。

鼠李聚糖半乳糖醛酸在由二糖[(1,2-α-L-鼠李糖酰-(1,4)-α-半乳糖基醛酸]组成的严格交替的鼠李聚糖半乳糖醛酸结构中以内切方式水解半乳糖基醛酸与吡喃鼠李糖基之间的键。

鼠李聚糖半乳糖醛酸裂解酶在鼠李聚糖半乳糖醛酸中借助β-消除以内切方式切割α-L-Rhap-(1→4)-α-D-GalpA键。

鼠李聚糖半乳糖醛酸乙酰基酯酶催化鼠李聚糖半乳糖醛酸中鼠李糖和半乳糖醛酸残基的交替主链的脱乙酰基作用。

鼠李聚糖半乳糖醛酸半乳糖醛酸水解酶以外切方式水解来自严格交替的鼠李聚糖半乳糖醛酸结构的非还原性末端的半乳糖醛酸。这种酶还可以称为木半乳糖醛酸聚糖(xylogalacturonan)水解酶。

内切-阿拉伯聚糖酶(EC 3.2.1.99)催化1,5-阿拉伯聚糖中的1,5-α-阿拉伯呋喃糖苷键的内切水解。该酶还可以称为内切-阿拉伯酶、阿拉伯聚糖内切1,5-α-L-阿拉伯糖苷酶、内切-1,5-α-L-阿拉伯聚糖酶(endo-1,5-α-L-arabinanase)、内切-α-1,5-L-阿拉伯聚糖酶(endo-α-1,5-L-arabinase);内切-阿拉伯聚糖酶或1,5-α-L-阿拉伯聚糖1,5-α-L-阿拉伯糖水解酶。

在包含本发明的β-葡糖苷酶变体的酶混合物中还可以包括一种或多种参与木质素降解的酶。酶促木质素解聚可由通常协同起作用的木质素过氧化物酶、锰过氧化物酶、虫漆酶和纤维二糖脱氢酶(CDH)完成。这些胞外酶常常被称为木质素改性酶(lignin-modifying enzyme)或LME。这些酶中的三种包括两种糖基化的含血红素的过氧化物酶:木质素过氧化物酶(LIP);Mn依赖性过氧化物酶(MNP);以及含铜的酚氧化酶:虫漆酶(LCC)。

虫漆酶.虫漆酶是在许多植物、真菌和微生物中发现的含铜的氧化酶。虫漆酶对酚类和类似分子具有酶活性并且进行一个电子的氧化。虫漆酶可以是聚合的并且酶活性形式可以是二聚体或三聚体。

Mn依赖性过氧化物酶.Mn依赖性过氧化物酶(MnP)的酶活性依赖于Mn2+。不受理论束缚,已表明这种酶的主要作用是将Mn2+氧化成Mn3+(Glenn等人(1986)Arch.Biochem.Biophys.251:688-696)。随后,酚类底物被产生的Mn3+氧化。

木质素过氧化物酶.木质素过氧化物酶是催化体外的聚合木质素的稀溶液的氧化解聚作用的胞外血红素。一些LiP的底物,最值得注意的是3,4-二甲氧基苄醇(veratryl alcohol,VA),是显示充当氧化还原介质(mediator)的活性氧化还原化合物。VA是与LiP同时被黄孢原毛平革菌(P.chrysosporium)的木质素分解培养物产生的次生代谢产物,且不受理论限制,已提出VA作为体内木质素的LiP催化氧化中的生理学氧化还原介质起作用(Harvey,等人(1986)FEBS Lett.195,242-246)。

包含本发明的β-葡糖苷酶变体的酶混合物还可以包括如下至少一种:参与纤维素降解的蛋白酶或脂肪酶。

“蛋白酶”包括水解肽键的酶(肽酶)以及水解肽与其他部分诸如糖之间的键的酶(糖肽酶)。许多蛋白酶被表征在EC 3.4之下并且适于在本发明中使用。一些特定类型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶、木瓜蛋白酶)和丝氨酸蛋白酶(包括糜蛋白酶、羧肽酶和金属内切肽酶)。

“脂肪酶”包括水解脂质、脂肪酸和酰基甘油酯(包括磷酸甘油酯、脂蛋白、二酰基甘油等)的酶。在植物中,脂质被用作限制水分损失和病原体感染的结构组分。这些脂质包括从脂肪酸获取的蜡以及角质和木栓质。

包括本发明的β-葡糖苷酶变体的酶混合物还可以包括至少一种扩展蛋白(expansin)或扩展蛋白样蛋白,诸如纤维膨胀因子(swollenin)(参见Salheimo等人,Eur.J.Biohem.269,4202-4211,2002)或纤维膨胀因子样蛋白。

扩展蛋白与植物细胞生长过程中细胞壁结构的松弛有关。已提出扩展蛋白破坏纤维素与其他细胞壁多糖之间的氢键而没有水解活性。以这种方法,认为它们允许纤维素纤维的滑动和细胞壁的扩展。纤维膨胀因子是一种扩展蛋白样蛋白,包括N端碳水化合物结合模块家族1结构域(CBD)和C端扩展蛋白样结构域。为了本发明的目的,扩展蛋白样蛋白或纤维膨胀因子样蛋白可包括此类结构域中的一个或两个和/或可破坏细胞壁的结构(诸如破坏纤维素结构),任选地不产生可检测的量的还原糖。

包括本发明的β-葡糖苷酶变体的酶混合物还可以包括以下至少一种:纤维素整合蛋白(cellulose integrating protein)、支架蛋白或支架蛋白样蛋白的多肽产物,例如分别来自热纤梭菌或解纤维梭菌(Clostridiumcellulolyticum)的CipA或CipC。支架蛋白和纤维素整合蛋白是可将分解纤维素的亚基组织成多酶复合体的多功能整合亚基。这是通过两个互补类别的结构域即支架蛋白上的粘附结构域(cohesion domain)和每个酶单位上的锚定结构域(dockerin domain)的相互作用而完成的。支架蛋白亚基还具有介导纤维素体(cellulosome)附在其底物上的纤维素结合模块。支架蛋白或纤维素整合蛋白为本发明的目的可包括此类结构域中的一种或两种。

包括本发明的β-葡糖苷酶变体的酶混合物还可以包括至少一种纤维素诱导蛋白或纤维素调节蛋白,例如,由来自里氏木霉的cip1或cip2基因或类似基因所编码的蛋白(参见Foreman等人,J.Biol.Chem.278(34),31988-31997,2003)。

包括本发明的β-葡糖苷酶变体的酶混合物可以包括上述多肽类别中的每一种的一员,一个多肽类别中的若干成员,或这些多肽类别的任何组合。

β-葡糖苷酶组合物的其他组分

本发明的β-葡糖苷酶多肽可与其他任选成分诸如缓冲剂、表面活性剂和/或精练剂组合使用。缓冲剂可与本发明的β-葡糖苷酶多肽(任选地与其他纤维素酶组合,包括另一种β-葡糖苷酶)一起使用以保持采用β-葡糖苷酶的溶液中期望的pH。采用的缓冲剂的精确浓度将取决于技术人员可确定的若干因素。适合的缓冲剂是本领域熟知的。表面活性剂可进一步与本发明的纤维素酶组合使用。适合的表面活性剂包括与β-葡糖苷酶以及任选地与使用的任何其他纤维素酶相容的任何表面活性剂。示例性表面活性剂包括阴离子型表面活性剂、非离子型表面活性剂和两性表面活性剂。

适合的阴离子型表面活性剂包括但不限于直链或支链的烷基苯磺酸盐;具有直链或支链的烷基或烯基的烷基或烯基醚硫酸盐;烷基或烯基硫酸盐;烯基磺酸盐;烷基磺酸盐等等。适合的阴离子型表面活性剂的反离子包括例如,碱金属离子,诸如钠和钾;碱土金属离子,诸如,钙和镁;铵离子;和具有1到3个碳数目2或3的链烷醇基团的链烷醇胺。适于在本发明的实践中使用的两性表面活性剂包括例如季铵盐磺酸盐、甜菜碱型两性表面活性剂等等。适合的非离子型表面活性剂一般包括聚氧化烯醚以及高级脂肪酸烷醇酰胺或其烯化氧加合物,脂肪酸甘油单酯等等。还可以采用本领域已知的表面活性剂的混合物。

从纤维素生物质产生可溶性糖

本发明的β-葡糖苷酶多肽以及包含此类β-葡糖苷酶多肽的任何组合物、培养基或细胞裂解物可用于从生物质产生作为化学原料或发酵原料的单糖、二糖、或单糖或二糖的寡聚物。如本文所用,术语“生物质”是指包含多糖基质(诸如,例如,纤维素、淀粉等等)的活的或死的生物材料。因此,本发明提供了用于将生物质基质转化为可发酵的糖的方法,所述方法包括使包含根据本发明的β-葡糖苷酶多肽的培养基或细胞裂解物与生物质基质在适于产生可发酵的糖的条件下接触。本发明还提供了通过以下方式将生物质基质转化为可溶性(或“可发酵的”)糖的方法:(a)预处理纤维素基质以提高其对水解的敏感性;(b)将步骤(a)的预处理的纤维素基质与包含本发明的β-葡糖苷酶多肽(和任选的其他纤维素酶)的组合物、培养基或细胞裂解物在适于产生可发酵的糖的条件下接触。

在一些实施方案中,生物质包括纤维素基质,其包括纤维素、半纤维素、木质纤维素。纤维素基质包括但不限于,包括但不限于木材、木浆、纸浆、玉米秸秆、玉米纤维、稻、纸和浆加工废物(paper and pulp processingwaste)、木本植物或草本植物、水果或蔬菜浆(fruit or vegetable pulp)、酒糟(distillers grain)、草、稻壳、麦秸、棉花、大麻、亚麻、剑麻、玉米芯、甘蔗渣、柳枝稷及其混合物。任选地可使用本领域已知的方法诸如化学、物理和生物学预处理(例如,蒸汽爆破、制浆、研磨、酸水解、溶剂暴露等等及其组合)对生物质进行预处理以提高纤维素对水解的敏感性。在一些实施方案中,生物质包括表达降解木质素和纤维素的木质素酶和/或纤维素酶的转基因植物。参见,例如US 20080104724,其通过引用并入本文。

在一些实施方案中,β-葡糖苷酶多肽、包含β-葡糖苷酶多肽的组合物、细胞培养基和细胞裂解物可与生物质或预处理的生物质在以下范围内的温度反应:约25℃至约100℃、约30℃至约90℃、约30℃至约80℃、约40℃至约80℃以及约35℃至约75℃。而且,生物质可与β-葡糖苷酶多肽和包含β-葡糖苷酶多肽的组合物、细胞培养基和细胞裂解物在约25℃、在约30℃、在约35℃、在约40℃、在约45℃、在约50℃、在约55℃、在约60℃、在约65℃、在约70℃、在约75℃、在约80℃、在约85℃、在约90℃、在约95℃和在约100℃的温度反应。除了以上所述的温度以外,适于采用本发明的β-葡糖苷酶多肽(任选地在组合物、细胞培养基或细胞裂解物中)将生物质基质转化为可发酵的糖的条件包括在以下范围内的pH进行该过程:约pH 3.0至约8.5、约pH 3.5至约8.5、约pH 4.0至约7.5、约pH 4.0至约7.0、以及约pH 4.0至约6.5。本领域技术人员将理解,用于将具体生物质基质转化为可发酵的糖的反应时间可改变,但最佳反应时间可容易地确定。示例性反应时间可以在以下范围内:约1至约240小时、约5至约180小时、以及约10至约150小时。例如,孵育时间可以是至少1小时、至少5小时、至少10小时、至少15小时、至少25小时、至少50小时、至少100小时、至少180小时等等。

β-葡糖苷酶与生物质基质或预处理的生物质基质在这些条件下的反应可导致大量可溶性糖从基质中释放。例如,与野生型C1释放的糖相比,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或更多的可溶性糖可以是可用的。在一些实施方案中,制得的可用的可溶性糖的量可以是相比于相同条件下野生型C1制得的可用的量的至少2倍、至少3倍、至少4倍、或至少5倍大。在一些实施方案中,可溶性糖包括葡萄糖。

由本发明的方法产生的可溶性糖可用于产生醇(诸如,例如,乙醇、丁醇等等)。本发明因此提供了产生醇的方法,其中该方法包括:(a)提供使用本发明的β-葡糖苷酶多肽在上文所述的方法中产生的可发酵的糖;(b)使该可发酵的糖与发酵微生物接触以产生醇或其他代谢产物;和(c)回收该醇或其他代谢产物。

在一些实施方案中,本发明的β-葡糖苷酶多肽或包含β-葡糖苷酶多肽的组合物、细胞培养基或细胞裂解物可用于在存在发酵微生物诸如酵母(例如酵母属,诸如,例如酿酒酵母、毕赤酵母属等等)或其他本领域熟知的C5或C6发酵微生物(例如,发酵单胞菌属、大肠杆菌)来催化生物质基质水解成可发酵的糖,以产生终产物诸如乙醇。在一个实例中,使用同步糖化和发酵(SSF)工艺,其中通过发酵工艺从系统中除去可发酵的糖(例如,葡萄糖和/或木糖)。

通过利用本发明的β-葡糖苷酶多肽产生的可溶性糖也可以用于产生其他终产物,诸如,例如,丙酮,氨基酸(例如,甘氨酸、赖氨酸等等),有机酸(例如,乳酸等等),甘油,二醇(例如,1,3丙二醇、丁二醇等等),和动物饲料。

本领域技术人员将容易地理解本发明的β-葡糖苷酶多肽组合物也可以以水溶液或固体浓缩物的形式应用。当采用水溶液时,β-葡糖苷酶溶液可被容易地稀释以允许准确浓度。浓缩物可以是本领域公认的任何形式,包括例如,液体、乳液、悬浮液、凝胶、糊、颗粒、粉末、附聚物、固体圆盘(solid disk),以及本领域熟知的其他形式。取决于组合物的预定用途,根据需要其他的材料也可以与本发明的β-葡糖苷酶组合物一起使用或被包括在本发明的β-葡糖苷酶组合物中,其他的材料包括石头、浮石、填充剂、溶剂、酶激活物以及抗再沉积剂。

除了用于转化纤维素生物质以外,β-葡糖苷酶多肽及其组合物还可以在食品和饮料工业例如在有效释放单萜烯醇的制酒工艺(参见例如,Yanai和Sato(1999)Am.J.Enol.Eitic.,50:231-235,其通过引用并入本文)和用于制备富含糖基异黄酮的豆腐的工艺(参见例如,Mase等人,(2004)J.Appl.Glycosci.,51:211-216,其通过引用并入本文)中使用。本发明的β-葡糖苷酶多肽还可以在改进清洁性能的去污剂组合物中采用(参见例如,USP7,244,605;US 5,648,263和WO 2004/048592,其均通过引用并入本文)。

结合以下非限制性实例可更好地理解本发明的前述方面和其他方面。

VII:实施例

实施例1:野生型C1 β-葡糖苷酶1(C1 Bgl1)基因获取和表达载体的构建

合成野生型C1 bgl1 cDNA并验证DNA序列。使用Pml1克隆位点将该基因克隆到酿酒酵母/C1穿梭载体pYTDX20中。信号肽和基因处于几丁质酶启动子(Pchi)的控制下。载体包含酿酒酵母的REP2、rep1和蛋白D(部分的)复制起点以及URA3抗性标记。将所得质粒(pYTDX20-C1 bgl1)转化到酿酒酵母INVSC1菌株中,并且使转化的宿主细胞生长在HTP中以产生C1 Bgl1蛋白。验证来自转化体的C1 bgl1序列。野生型C1 bgl1 cDNA序列的蛋白编码部分作为SEQ ID NO:1提供,并且所编码的多肽作为SEQID NO:2提供。SEQ ID NO:2的前19个残基用粗体显示且构成信号肽。

实施例2:摇瓶程序

将包含具有C1 bgl1 cDNA基因的质粒的酿酒酵母的单菌落接种到包含6%葡萄糖的1mL合成的确定成分的-尿嘧啶(SD-ura)培养液(2g/L有/无酵母氮源(yeast nitrogen base)的尿嘧啶合成缺陷型培养基(syntheticDrop-out minus uracil)(来自United States Biological,Swampscott,MA)、5g/L硫酸铵、0.1g/L氯化钙、2mg/L肌醇、0.5g/L硫酸镁、1g/L磷酸二氢钾(KH2PO4)、0.1g/L氯化钠)中。使细胞在250rpm摇动下在30℃培养箱中生长24小时。然后将500μL过夜培养物稀释到250mL带挡板的无菌摇瓶中的含2%葡萄糖的50mL SD-ura培养基中并且在37℃孵育48小时。通过离心(4000rpm,15min,4℃)沉淀(pellete)细胞。收集包含分泌的C1 Bgl1酶的澄清培养基上清液并将其储存在-20℃直至使用。

实施例3:确定β-葡糖苷酶活性的测定

可通过对硝基苯基-β-D-葡萄糖苷(pNPG)测定或纤维二糖测定来确定β-葡糖苷酶活性。

基于pNPG(对硝基苯基-β-D-葡萄糖苷)的比色测定法用于测量β-葡糖苷酶活性。在150μL的总体积中,将75μL包含C1 Bgl1酶的澄清培养基上清液添加至75μL在300mM乙酸钠的pH 5缓冲液中的3mM pNPG(Sigma-Aldrich,Inc.,St.Louis,MO)溶液。反应在pH 5、50℃下孵育1.5小时。反应后,75μL的反应混合物用75μL的1M碳酸钠pH 11溶液猝灭。在405nm测量溶液的吸光度来确定pNPG向对硝基苯基的转化。以分光光度法在405nm测量对硝基苯酚产物的量以计算β-葡糖苷酶活性,如Breves,等人(1997),Appl.Environmental Microbiol.63:3902-3910所述。在高通量筛选条件下(pH 5,65℃)观察可检测的β-葡糖苷酶活性。

还使用纤维二糖测定来确定β-葡糖苷酶活性,纤维二糖测定使用纤维二糖(Sigma-Aldrich,Inc.,St.Louis,MO)作为底物。在150μL的总体积中,将75μL包含C1 Bgl1酶的澄清培养基上清液添加至75μL在300mM乙酸钠缓冲液(pH 5)中的6.6g/L纤维二糖。反应在摇动下在65℃孵育21小时。使用酶促葡萄糖测定试剂盒(K-GLUC,Megazyme,Bray,Co.Wicklow,Ireland)确定葡萄糖产生。在200μL的总体积中,将15μL的C1 Bgl1反应混合物添加至185μL的葡萄糖测定试剂(GOPOD试剂,作为K-GLUC测定试剂盒的一部分供应)。反应在50℃孵育30分钟并且在510nm测量溶液的吸光度。GOPOD试剂中的葡萄糖氧化酶与葡萄糖反应并产生过氧化氢,过氧化氢随后与试剂中的4-氨基安替比林反应产生醌亚胺染料。用分光光度法在510nm测量醌亚胺染料的量以计算β-葡糖苷酶活性。还使用配有HPX-87H离子排阻柱(300mm×7.8mm)的AgilentHPLC 1200在80℃以1.0mL/min的流速用水作为洗脱液测量纤维二糖到葡萄糖的转化。纤维二糖和葡萄糖的保留时间分别是4.7和5.8分钟。在高通量筛选条件下(pH 5,65℃)观察可检测的β-葡糖苷酶活性。

实施例4:最佳C1 Bgl1活性的评估

使用纤维二糖(3.3g/L)作为底物在不同的温度(50℃、60℃和65℃和pH(3.5-7.5)下研究天然C1 Bgl1的活性概况。实验程序和分析程序如实施例3中所述。C1 Bgl1在pH 5和50℃显示最佳活性,并且在高通量筛选条件下(pH 5和65℃)观察可检测的β-葡糖苷酶活性(最佳活性的20%)。

实施例5:鉴定改进的C1 Bgl1变体的高通量测定

将包含C1 bgl1变体基因的质粒文库转化到酿酒酵母INVSC1菌株中并在包含2%葡萄糖的SD-ura琼脂平板上铺板。在30℃孵育至少48小时后,使用Q-bot机器菌落采集器(Q-botrobotic colony picker)(GenetixUSA,Inc.,Beaverton,OR)挑取菌落到包含200μL SD-ura培养基和6%葡萄糖的96孔浅孔微量滴定板中。使细胞在250rpm摇动下和85%湿度下在30℃生长24小时。然后将20μL这种过夜培养物转移到包含380μLSD-ura培养基和2%葡萄糖的96孔微量滴定板(深孔)中,如实施例2中所述。将板在250rpm摇动和85%湿度下在37℃孵育48小时。将深板在4000rpm离心15分钟,并且将包含分泌的C1 Bgl1酶的澄清培养基上清液用于高通量pNPG或纤维二糖测定。

使用热活性和热稳定性测定两者以高通量筛选C1 Bgl1文库。在热活性测定中,用基于纤维二糖的高通量测定(底物:纤维二糖;pH:5.0;温度:65℃;时间:21小时)筛选C1 Bgl1变体。随后对从热活性测定鉴定的活性C1 Bgl1变体进行热稳定性测定。在该热稳定性测定中,将包含C1Bgl1酶变体的HTP培养基上清液样品在pH 5、65℃下预孵育0小时或6小时。如实施例3中所述使用pNPG作为底物在pH 5、50℃下1.5小时测量热挑战(thermal challenge)后的残余酶活性。

热活性测定

热活性筛选是基于纤维二糖的高通量测定(HTA)。在浅的96孔微量滴定板中,将75μL包含C1 Bgl1酶变体的培养基上清液添加至75μL在300mM乙酸钠pH 5.0缓冲液中的6.6g/L纤维二糖。在用铝/聚丙烯分层热封带(laminate heat seal tape)(Velocity 11(Menlo Park,CA),目录号06643-001)密封后,板在65℃下摇动高达21小时。将板以4000rpm离心5分钟。在浅孔透明的微量滴定板中,15μL的反应混合物用每孔185μL的GOPOD试剂溶液猝灭。将溶液轻柔地混合3次并在510nm测量吸光度以鉴定热活性改进的C1 Bgl1变体。

热稳定性测定

热稳定性筛选是基于pNPG的高通量测定。在浅的96孔微量滴定板中,将180μL包含活性C1 Bgl1酶变体的培养基上清液与30μL的1M乙酸钠pH 5.0缓冲液混合。从总的210μL酶溶液中,转移120μL的酶溶液到96孔PCR板中进行热挑战处理,并将浅的96孔板中留下的90μL酶溶液用作未受挑战的C1 Bgl1酶样品。在用铝/聚丙烯分层热封带(Velocity 11(Menlo Park,CA),目录号06643-001)密封后,将PCR板在热循环仪(MJ Research,Waltham,MA)中以65℃加热6小时。在热挑战后,将90μL的受挑战的酶溶液转移到96孔浅板中。为了启动pNPG反应,在浅的96孔板中,将90μL未受挑战或受挑战的酶溶液与在10μL的150mM乙酸钠pH 5缓冲液中的15mM pNPG(Sigma-Aldrich,Inc.,St.Louis,MO)溶液混合。反应在pH 5、50℃下孵育1.5小时。反应后,将100μL的1M碳酸钠pH 11溶液添加至反应混合物以猝灭反应。在405nm测量溶液的吸光度来确定pNPG向对硝基苯基的转化。使用下式计算残余活性:

%残余活性=100×(受挑战的样品的吸光度/未受挑战的样品的吸光度)。

将C1 Bgl1变体的残余活性与天然酶的残余活性进行比较以鉴定热稳定性改进的变体。

实施例6:工程化C1 Bgl1变体的改进的β-葡糖苷酶活性和稳定性

如实施例5中所述从多个C1 Bgl1变体文库的高通量筛选鉴定改进的C1 Bgl1变体。选择相比于野生型C1 Bgl1显示改进的活性和稳定性的变体参考序列作为参考蛋白(如表2和表3所示的变体3),并且产生另外的C1 Bgl1变体和如表3的说明所示评估以鉴定相对于变体3参考序列具有改进的稳定性和活性的变体。然后选择来自这一轮的改进的变体之一作为参考蛋白(如表3和表4所示的变体269),并产生另外的C1 Bgl1变体和如表4的说明所述评估以鉴定相对于变体269具有改进的稳定性和活性的变体。从这一轮选择变体(如表4和表5所示的变体481)作为参考蛋白,并产生另外的C1 Bgl1变体和如表5的说明所述评估以鉴定相对于变体481具有改进的稳定性和活性的变体。然后选择两个变体(如表5和表6所示的变体647;和如表5和表7所示的变体664)。每个变体用作参考蛋白进行分别几轮筛选。产生另外的C1 Bgl1变体和如表6的说明所述评估以鉴定相对于变体647具有改进的稳定性和活性的变体。还产生C1 Bgl1变体和如表7的说明所述评估以鉴定相对于变体664具有改进的稳定性和活性的变体。

表2、3、4、5、6和7概括了本发明所包括的某些C1 Bgl1变体的热活性和热稳定性的改进。

实施例7:在C1宿主中产生改进的β-葡糖苷酶变体

使用两步发酵法(从孢子(spore)开始的接种和主发酵)在C1中表达C1 bgl1变体基因。将包含C1 bgl1变体基因的6个质粒转化到C1菌株中并铺板到包含具有22.93%蔗糖的M3-01培养基的琼脂平板上(M3-01培养基的成分:6.0g/L硝酸钠、0.52g/L氯化钾、1.52g/L磷酸二氢钾(KH2PO4)、0.24g/L硫酸镁、1.6mg/L五水硫酸铜(II)(CuSO45H2O)、5mg/L七水硫酸亚铁(FeSO47H2O)、22mg/L七水硫酸锌(ZnSO47H2O)、5mg/L四水氯化锰(II)(MnCl24H2O)、1.8mg/L七水硫酸钴(II)(CoSO47H2O)、1.5mg/L二水钼酸钠(Na2MoO42H2O)、11mg/L硼酸、50mg/L EDTA、10.0g/L葡萄糖、1.0g/L CAS氨基酸(Tritium MicrobiologieB.V.,The Netherlands)、16g/L琼脂、除菌后的1ml/L 1000×Pen/Strep(1000×Pen/Strep:通过过滤除菌的溶于100ml H2O中的2g青霉素G和5g链霉素)。培养基的pH用10M KOH调整到6.5并将其在121℃高压灭菌25分钟。将平板在35℃孵育5天。使用从琼脂平板收集的孢子接种500mL Erlenmeyer烧瓶中的灭菌的100mL F1-01接种培养基以达到5*104-105孢子/mL的起始孢子数(F1-01接种培养基的成分:0.50g/L磷酸氢二钾(K2HPO4)、0.05g/L氯化钾、0.007g/L七水硫酸亚铁(FeSO47H2O)、1.00g/L酵母提取物(仅KAT)、10g/L Pharmamedia(Traders Protein,Lubbock,TX,USA)、10g/L一水D(+)乳糖、10g/L灭菌后的葡萄糖、除菌后的1ml/L 1000×Pen/Strep(1000×Pen/Strep:通过过滤除菌的溶于100ml H2O中的2g青霉素G和5g链霉素)。培养基的pH用10M NaOH调整到7.0并将其在121℃高压灭菌25分钟(灭菌后的培养基的pH是6.5)。为了制备接种培养物,将烧瓶以250rpm摇动和25mm的位移在35℃、85%湿度下孵育3天。用750μL获得的接种培养物接种100mL Erlenmeyer烧瓶中的灭菌的15mL F1-01主发酵培养基(F1-01主发酵培养基的成分:0.66g/L磷酸氢二钾(K2HPO4)、0.24g/L磷酸二氢钾(KH2PO4)、8.00g/L硫酸铵、12.00g/L无水柠檬酸三钠、0.15g/L酵母提取物(仅KAT)、0.09g/L七水硫酸镁、0.80g/L二水氯化钙、24.80g/L Pharmamedia(Traders Protein,Lubbock,TX,USA)、26.40g/L一水D(+)乳糖、64.80g/L纤维素(AlphaCelBH200A))。将培养基在121℃高压灭菌25分钟。通过以300rpm摇动和25mm的位移在35℃、85%湿度下孵育6天进行主发酵。在完成主发酵后,通过离心(4500rpm,15min,4℃)沉淀细胞。收集包含分泌的C1 Bgl1酶的澄清培养基上清液并将其储存在-20℃直至使用。

实施例8:在C1宿主中产生的β-葡糖苷酶变体的改进的热稳定性

对C1宿主中产生的八种C1 Bgl1变体(3、8、70、109、143、194、269和270)和天然酶进行表征以确定其在高温(65℃)下的稳定性。将包含多种C1 Bgl1变体酶的样品在pH 5、65℃下预孵育0、6或24小时。使用pNPG作为底物在pH 5、50℃下20分钟测量热挑战后的残余酶活性。八种变体中最好的变体显示相比于天然酶高达34倍的稳定性改进(图1A和图1B)。从酵母和从C1产生的天然酶与八种C1 Bgl1变体的稳定性概况比较显示在这两种宿主之间良好的相关性(图1C)。

实施例9:C1 Bgl1变体的热稳定性

将改进的C1 Bgl1变体3、269和481的热稳定性与天然C1 Bgl1酶的热稳定性进行比较。使用pNPG做底物在pH 5,50℃持续20分钟测量在pH 4.5,65℃孵育24小时后的残余酶活性。图2A显示变体481在热挑战后具有最大的活性增加。

将改进的C1 Bgl1变体664的热稳定性与变体481的热稳定性进行比较。使用pNPG做底物在pH 5,50℃持续20分钟测量在pH 4,65℃孵育4小时后的残余酶活性。图2B显示变体664在热挑战后相对于变体481具有改进的酶活性。

将改进的C1 Bgl1变体3、481、664、916、885和871的热稳定性与天然酶进行比较(图3)。使用pNPG测定在pH 5,50℃持续20分钟测量在pH 4.5,65℃的72小时孵育后的残余酶活性。结果显示变体664、916、885和871保留实质性活性。

使用纤维二糖测定(pH 4.5或pH 5,55℃-75℃;8g/L纤维二糖,18小时反应)将变体871的比活性与天然即野生型酶进行比较。图4显示变体871在该测定中比天然酶产生更多的葡萄糖。

图5显示变体871、916、885、664、647、481、269和3与天然C1 Bgl1氨基酸序列的比对。

尽管已参考本发明的具体实施方案对本发明进行了描述,但本领域技术人员应理解可以做出各种改变并且可以替换等同物而不背离本发明的范围。另外,可以做出许多改变以适应具体情况、材料、物质组成、工艺、一个或多个工艺步骤,以达到由本发明所提供的益处而不背离本发明的范围。所有这些改变旨在处于本文所附权利要求的范围之内。

本文引用的所有出版物和专利文件均通过引用并入本文,如同每篇此类出版物或文件被具体地和单独地指出通过引用并入本文。出版物和专利文件的引用并非旨在指示任何此类文件是相关现有技术,并且其不构成对任何此类文件的内容或日期的任何承认。

SEQ ID NO:1野生型C1 bgl1 cDNA序列

SEQ ID NO:2:野生型C1 Bgl1多肽序列;用粗体表示信号肽

SEQ ID NO:3:使用具有用于在酿酒酵母中表达的密码子偏倚性的编码野生型Chrysosporium lucknowenseβ-葡糖苷酶1蛋白的多核苷酸序列。由SEQ IDNO:3编码的蛋白是SEQ ID NO:22。

SEQ ID NO:4 C1变体3cDNA序列

SEQ ID NO:5 C1变体3多肽序列

SEQ ID NO:6 C1变体269cDNA序列

SEQ ID NO:7 C1变体269多肽序列

SEQ ID NO:8 C1变体481cDNA序列

SEQ ID NO:9 C1变体481多肽序列

SEQ ID NO:10 C1变体482cDNA序列

SEQ ID NO:11 C1变体482多肽序列

SEQ ID NO:12 C1变体664cDNA序列

SEQ ID NO:13 C1变体664多肽序列

SEQ ID NO:14 C1变体647cDNA序列

SEQ ID NO:15 C1变体647多肽序列

SEQ ID NO:16 C1变体871cDNA序列

SEQ ID NO:17 C1变体871多肽序列

SEQ ID NO:18 C1变体885cDNA序列

SEQ ID NO:19 C1变体885多肽序列

SEQ ID NO:20 C1变体916cDNA序列

SEQ ID NO:21 C1变体916多肽序列

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号