首页> 中国专利> 来自Penicillium chrysogenum的脯氨酸特异性蛋白酶

来自Penicillium chrysogenum的脯氨酸特异性蛋白酶

摘要

本发明提供了具有脯氨酸特异性蛋白酶活性的多肽,所述多肽包含SEQ ID NO:3中示出的氨基酸序列,或SEQ ID NO:1和/或SEQ ID NO:2的核苷酸序列编码的氨基酸序列,或它们的变体或它们中任一的片段。本发明还涉及在工业工艺中使用所述多肽的方法。本发明还包括用适用于生产这些蛋白质的根据本发明的多核苷酸转化的细胞。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-19

    未缴年费专利权终止 IPC(主分类):C12N9/58 授权公告日:20140212 终止日期:20170528 申请日:20090528

    专利权的终止

  • 2014-02-12

    授权

    授权

  • 2011-07-20

    实质审查的生效 IPC(主分类):C12N9/58 申请日:20090528

    实质审查的生效

  • 2011-05-04

    公开

    公开

说明书

发明领域

本发明涉及脯氨酸特异性蛋白酶。本发明还涉及其中使用脯氨酸特异性蛋白酶的方法,以及脯氨酸特异性蛋白酶的用途。

发明背景

脯氨酸特异性蛋白酶是能够在蛋白质或肽链中含有脯氨酰残基的地方切割蛋白质或肽的酶。

脯氨酸特异性蛋白酶已被提出用于大量应用,例如最小化蛋白质水解产物制剂中异味的可能性,降低这类水解产物的抗原性和预防或减少饮料中的浑浊。

人们期望:在食物或饮料应用中使用的酶具有合适的酸性pH最适度,并且优选地在使用它们来生产的最终制剂中不是活性的。因此,期望地,用于食物或饮料中的酶可被容易地失活。

发明内容

本发明涉及具有脯氨酸特异性蛋白酶活性的多肽,所述多肽包含SEQID NO:3中示出的氨基酸序列,或SEQ ID NO:1和/或SEQ ID NO:2的核苷酸序列所编码的氨基酸序列,或它们的变体或它们中任一的片段。

本发明的脯氨酸特异性酶是具有从约pH 4到约pH 5的pH最适度并且可容易被失活的脯氨酸特异性酶。因此,其可尤其适用于食物或饮料应用。

本发明的多肽可与SEQ ID NO:3中示出的序列具有至少约60%的序列同一性。本发明的多肽长度可至少为约150个氨基酸。具有脯氨酸特异性蛋白酶活性的多肽可包含根据前述权利要求中任一项所述的多肽的功能结构域。

本发明还涉及下述多核苷酸,所述多核苷酸包含:

(a)如SEQ ID NO:2中示出的核苷酸序列或SEQ ID NO:1的编码序列;

(b)与是SEQ ID NO:1或SEQ ID NO:2的反向互补链的多核苷酸选择性杂交的核苷酸序列;

(c)与SEQ ID NO:1或SEQ ID NO:2的核苷酸序列具有至少约50%序列同一性的核苷酸序列;

(d)如(a)、(b)或(c)中定义的核苷酸序列的具有至少100个核苷酸的片段;

(e)由于遗传密码子而与(a)、(b)、(c)或(d)任一中定义的序列简并的序列;或

(f)是(a)、(b)、(c)、(d)或(e)中定义的核苷酸序列的反向互补链的核苷酸序列。

本发明还提供了:

-包含本发明的多核苷酸序列的载体;

-包含本发明的多肽、多核苷酸或载体的细胞;

-用于制备具有脯氨酸特异性蛋白酶活性的多肽的方法,所述方法包括在允许表达所述多肽的条件下培养本发明的细胞,以及任选地,回收所表达的多肽;

-能够通过此类方法获得的多肽;

-组合物,其包含:(i)本发明的多肽;以及任选地,(ii)与(i)中的多肽不同的蛋白酶;

-用于制备蛋白质水解产物的方法,所述方法包括将蛋白质底物与本发明组合物的多肽接触;

-本发明的多肽或组合物在制备蛋白质水解产物中的用途;

-能够通过上文给出的方法获得的蛋白质水解产物;

-包含此类蛋白质水解产物的食物或饲料制品或饮料;

-用于制备食物或饲料制品或饮料的方法,所述方法包括在所述食物制品、饲料制品或饮料的制备期间加入本发明的多肽或组合物;

-能够通过此类方法获得的食物或饲料制品或饮料;

-本发明的多肽或组合物在制备食物或饲料制品或饮料中的用途;

-能够通过此类方法或用途获得的食物或饲料制品或饮料;和

-用于治疗或预防精神病症(psychiatric disorder)或乳糜泻相关病症(celiac disease linked disorder)的本发明的多肽。

附图概述

图1示出了用于克隆脯氨酸特异性蛋白酶ZFX的策略。

图2示出了来自Penicillium chrysogenum CBS 455.95的染色体DNA片段的序列,其含有编码脯氨酸特异性蛋白酶ZFX的基因(SEQ ID NO:1)。编码序列(SEQ ID NO:2)被突出显示,并且示出了蛋白质序列(SEQ ID NO:3)。

图3展示了经分离的脯氨酸特异性蛋白酶ZFX的温度最适度。

序列表简述

SEQ ID NO:1示出了来自Penicillium chrysogenum CBS 455.95的染色体DNA片段的核苷酸序列,其含有编码脯氨酸特异性蛋白酶ZFX的基因。

SEQ ID NO:2示出了脯氨酸特异性蛋白酶ZFX的核苷酸编码序列。

SEQ ID NO:3示出了脯氨酸特异性蛋白酶ZFX的氨基酸序列。

SEQ ID NO:4示出了含有24个核苷酸的ZFX编码序列的正向PCR引物(ZFX-dir),所述引物从ATG起始密码子开始,接着是包含PacI限制性位点的23个核苷酸的序列。

SEQ ID NO:5示出了反向引物(ZFX-rev),所述引物含有与ZFX编码序列下游区域的反向链互补的核苷酸,接着是AscI限制性位点。

发明详述

本发明涉及在真菌Penicillium chrysogenum中鉴定的新颖的脯氨酸特异性蛋白酶。这是令人惊讶的,因为WO02/45524中显示,来自A.niger的编码脯氨酸特异性蛋白酶的cDNA片段不与从Penicillium chrysogenum分离的基因组DNA杂交(见WO 02/45524的实施例11和表6)。

本文所述的新颖的酶具有酸性pH最适度并可通过例如加热步骤(如标准巴氏灭菌工艺)基本失活,或优选完全失活。因此,所述酶适用于食物应用,所述食物应用典型地是酸性环境并且高度期望最终(食物)制品基本上没有残余的酶活性。

本发明还满足了可以被大量生产的脯氨酸特异性蛋白酶的要求。优选地,此类脯氨酸特异性蛋白酶由宿主细胞分泌。主动分泌对于经济上可行的生产工艺而言是至关重要的,因为这使得能够以基本纯净的形式回收酶而不经历繁冗的纯化过程。食品级真菌宿主如Aspergillus对这类积极分泌的脯氨酸特异性蛋白酶的过表达产生食品级的酶和具有成本效益的生产过程,因此是优选的。本发明公开了通过食品级生产宿主Aspergillus niger大量生产脯氨酸特异性蛋白酶的方法。

从经济学角度来看,对以大量并以相对纯净的形式生产脯氨酸特异性蛋白酶的经改进的手段存在明确的需要。我们在本文中展示,进行这种手段的一种优选方式是使用重组DNA技术过量生产这样的脯氨酸特异性蛋白酶。进行这种手段的一种尤其优选的方式是源于真菌的脯氨酸特异性蛋白酶的过量生产,进行这种手段的一种最优选的方式是源于Penicillium的脯氨酸特异性蛋白酶的过量生产。为了能够实现后一生产途径,源于Penicillium的脯氨酸特异性蛋白酶的独特序列信息是必需的。更优选地,必须能够获得编码基因的整个核苷酸序列。

一旦能够大量并以相对纯净的形式产生新颖的酶,则能够以食品级和经济的方式制备具有经改进的结构、感官和/或免疫特性的食品(如面包、意大利面或面条)或蛋白质水解产物。酶也可能被用作防腐剂。另外,酶可以在饮料制备中使用,尤其在预防或减少饮料中浑浊的方法中使用。

在本文中,脯氨酸特异性蛋白酶活性被定义为切割蛋白质和/或肽中涉及脯氨酸残基的肽键的蛋白酶活性。就本发明的目的而言,蛋白质通常可以被认为包含多于约30个氨基酸。就本发明的目的而言,肽通常可以被认为包含约30个或更少的氨基酸。

因此,本文中的脯氨酸特异性蛋白酶可具有脯氨酸特异性内切蛋白酶活性和/或脯氨酸特异性寡肽酶活性(EC 3.4.21.26)。优选地,本发明的脯氨酸特异性蛋白酶(如脯氨酸特异性内切蛋白酶和/或脯氨酸特异性寡肽酶)是在蛋白质或肽含有脯氨酸残基的位置处水解蛋白质和/或肽的蛋白酶。

在本发明中,优选地,脯氨酸特异性蛋白酶是在脯氨酸残基的羧基端水解肽键的蛋白酶。然而,在脯氨酰残基NH2-端切割的脯氨酰特异性蛋白酶例如描述于Nature of 15 January 1998,Vol.391,p.301-304的出版物中。

在本文上下文中,术语脯氨酰特异性内切蛋白酶、脯氨酸特异性内切蛋白酶、脯氨酸特异性内切肽酶、脯氨酸特异性寡肽酶、脯氨酰特异性寡肽酶、脯氨酰寡肽酶、具有脯氨酰特异性活性的蛋白质/肽或类似的表述可交换使用。

本发明提供了编码脯氨酸特异性蛋白酶(下文称作“ZFX”)的多核苷酸,所述蛋白酶具有根据SEQ ID NO:3的氨基酸序列或其变体序列(例如作为SEQ ID NO:3氨基酸序列的功能等同物的序列)或作为这些任一片段的序列。氨基酸序列还示于图2中。

编码ZFX脯氨酸特异性蛋白酶的基因序列通过对Penicilliumchrysogenum的基因组测序来测定。本发明提供了下述多核苷酸序列,所述多核苷酸序列包含编码ZFX脯氨酸特异性蛋白酶的基因及其编码序列。因此,本发明涉及经分离的多核苷酸,所述多核苷酸包含根据SEQ ID NO:1或2的核苷酸序列及其变体如功能性等同物。所述核苷酸序列还公开于图2中。

具体地,本发明涉及经分离的多核苷酸,所述多核苷酸能够例如在严格条件下、优选地在高度严格条件下,与下述多核苷酸的反向互补链杂交,所述多核苷酸包含SEQ ID NO:1的编码序列或SEQ ID NO:2中公开的序列。

有利地,根据本发明的这类多核苷酸(及其编码的多肽)得自和/或可得自真菌,尤其来自Ascomycota门的真菌,如来自Pezizomycotina亚门,例如来自Eurotiomycetes纲,如来自Eurotiales目,尤其来自Trichocomaceae科,如来自Penicillium属,优选地来自Penicilliumchrysogenum种。

更特定地,本发明涉及下述多核苷酸,所述多核苷酸包含根据SEQID NO:1的编码序列或SEQ ID NO:2中公开的序列的核苷酸序列,或基本由所述核苷酸序列组成。

本发明还涉及包含下述序列或基本由其组成的经分离的多核苷酸,所述序列编码根据SEQ ID NO:3的多肽或其变体(如其功能等同物)或任一片段的至少一个功能性结构域。

本文使用的术语“基因”和“重组基因”指可从染色体DNA中分离的、包含编码蛋白质(例如根据本发明的Penicillium chrysogenum脯氨酸特异性蛋白酶)的开放读码框的核酸分子。

基因可包含编码序列、非编码序列、内含子和/或调节序列。此外,术语“基因”可表示本文定义的经分离的核酸分子。

可以使用标准的分子生物学技术和本文提供的序列信息,来分离本发明的核酸分子(如下述核酸分子,所述核酸分子具有SEQ ID NO:1的编码序列或SEQ ID NO:2中公开的序列的核苷酸序列或其任一功能性等同物)。例如,使用SEQ ID NO:1或2的所有或部分核酸序列作为杂交探针,能够使用标准杂交和克隆技术(例如描述于Sambrook,J.,Fritsh,E.F.,and Maniatis,T.Molecular Cloning:A Laboratory Manual.2nd,ed.,ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989中)分离根据本发明的核酸分子。

另外,可以使用合成的寡核苷酸引物通过聚合酶链式反应(PCR),来分离包含SEQ ID NO:1或2所有或部分的核酸分子,所述引物以SEQ IDNO:1或2中含有的序列信息为基础设计。

可以使用cDNA、mRNA或者基因组DNA作为模板,并使用适当的寡核苷酸引物根据标准的PCR扩增技术,来扩增本发明的核酸。这样扩增的核酸可以被克隆进适当的载体中并通过DNA序列分析被表征。在本文中描述了SEQ ID NO:1的片段的分离和克隆。使用SEQ ID NOs:4和5中公开的寡核苷酸引物,通过PCR扩增所述片段。

另外,可以通过标准的合成技术(例如使用自动化DNA合成仪)制备下述寡核苷酸,所述寡核苷酸对应于本发明的核苷酸序列或能够与本发明的核苷酸序列杂交。

在一个优选的实施方案中,本发明的经分离的核酸分子包含下述核苷酸序列,所述核苷酸序列是SEQ ID NO:1的编码序列或是SEQ ID NO:2中公开的序列。SEQ ID NO:2的序列对应于Penicillium chrysogenum脯氨酸特异性蛋白酶cDNA的编码区。该cDNA包含编码根据SEQ ID NO:3的Penicillium chrysogenum脯氨酸特异性蛋白酶多肽的序列。

在另一优选的实施方案中,本发明的经分离的核酸分子包含下述核酸分子,所述核酸分子是SEQ ID NO:1或2中所示核苷酸序列或这些核苷酸序列变体(如功能等同物)的反向互补链。

与另一核苷酸序列互补的核酸分子是与所述另一核苷酸序列足够互补,从而其能够与所述另一核苷酸序列杂交形成稳定双链体的核酸分子。

本发明的一个方面涉及经分离的核酸分子,所述核酸分子编码本发明的多肽或其变体如功能等同物(例如生物活性片段或结构域),以及足够用作杂交探针(以鉴定编码本发明多肽的核酸分子)的核酸分子,和适合用作PCR引物(用于扩增或突变核酸分子)的这类核酸分子的片段。

生物活性片段或结构域的一个例子是至少能够从(合成)底物上切割可检测基团的片段或结构域,所述(合成)底物在(合成)底物羧基端包含“与检测手段偶联的脯氨酸”,并且其中所述检测手段通过能够被蛋白酶切割的化学键与脯氨酸的羧基侧偶联。实验部分提供了合适的(合成)底物的例子。检测手段的一个例子是产色基团或产荧光基团。

根据本发明的多核苷酸可以是“经分离的”。在本发明的上下文中,“经分离的多核苷酸”或“经分离的核酸”是与来源生物的天然存在的基因组中紧邻的两条编码序列(一个在5’端,一个在3’端)均不紧邻的DNA或RNA。因此,在一个实施方案中,经分离的核酸包含与编码序列紧邻的部分或所有5’非编码(例如启动子)序列。该术语因此包括例如被整合进载体、整合进自主复制的制粒或病毒、或整合进原核生物或真核生物的基因组DNA中的重组DNA,或作为不依赖于其它序列的独立分子(例如通过PCR或限制性内切酶处理产生的cDNA或基因组DNA片段)存在的重组DNA。其还包括编码下述额外多肽的杂交基因的一部分的重组DNA,所述额外多肽基本不含细胞材料、病毒材料或培养基(通过重组DNA技术生产时)或化学前体或其它化学品(化学合成时)。另外,“经分离的核酸片段”是天然不作为片段存在并且在天然状态下不被发现的核酸片段。

本文使用的术语“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)和使用核苷酸类似物产生的DNA或RNA类似物。也就是说,本发明的多核苷酸可包含DNA和/或RNA。根据本发明的多核苷酸因此可以是DNA序列或RNA序列。核酸分子可以是单链的或双链的,但是优选是双链DNA。可以使用合成的或经修饰的核苷酸来合成核酸,所述合成或经修饰的核苷酸包括肽核酸、寡核苷酸类似物或衍生物(例如肌苷、甲基膦酸酯或或硫代膦酸核苷酸,并在分子的3’和/或5’端处添加吖啶或多聚赖氨酸)来合成核酸。这类核苷酸和寡核苷酸可被用于例如制备核酸,所述核酸具有改变的碱基配对能力或提高的核酸酶抗性。就本发明的目的而言,应当理解本文所述的多核苷酸可通过本领域可获得的任何方法修饰。

本发明的另一实施方案提供了经分离的核酸分子,所述核酸分子与ZFX核酸分子(例如ZFX核酸分子的编码链)是反义的。还包括在本发明范围内的是本文所述核酸分子的互补链。

本文提供的序列信息不应当被狭义地理解为需要包括被错误鉴定的碱基。本文公开的特定序列可被容易地用于从丝状真菌、尤其是从Penicillium chrysogenum中分离完整基因,所述完整基因可随后被容易地进行序列分析,从而鉴定测序错误。

除非另有说明,通过对本文的DNA分子测序确定的所有核苷酸序列均使用自动DNA测序仪测定,由本文测定的DNA分子编码的多肽的所有氨基酸序列是通过翻译如上测定的DNA序列来预测的。因此,如本领域所已知的,对通过该自动化途径测定的任何DNA序列而言,本文测定的任何核苷酸序列可含有一些错误。通过自动化测定的核苷酸序列与被测序的DNA分子的实际核苷酸序列典型地至少约90%同一,更典型地至少约95%到至少约99.9%同一。

可以通过其它途径(包括本领域公知的手动DNA测序法)更精确地测定实际序列。又如本领域所已知的,与实际序列相比,被测定的核苷酸序列中的单个插入或删除会引起核苷酸序列翻译中的移码(frame shift),从而由被测定的核苷酸序列编码的预测氨基酸序列会与由被测定的核苷酸序列实际编码的氨基酸序列完全不同(从该插入或删除的位点开始)。

本领域技术人员能够鉴定这类被错误鉴定的碱基,并知道如何纠正这类错误。

根据本发明的核酸分子可仅包含根据SEQ ID NO:1所示核酸的部分或片段,例如可以用作探针或引物的片段或编码ZFX蛋白质的部分的片段。

通过ZFX基因和cDNA的克隆测定的核苷酸序列允许生产探针和引物,所述探针和引物被设计为用于鉴定和/或克隆其它ZFX家族成员以及来自其它物种的ZFX同源物。

探针/引物典型地包含基本上被纯化的寡核苷酸,所述寡核苷酸典型地包含下述核苷酸序列的区域,所述核苷酸序列区域优选地在高度严格的条件下与SEQ ID NO:1或2中所示核苷酸序列(或其功能等同物或其任何反向互补链)的至少约12到15个、优选约18到20个、优选约22到25个、更优选约30、35、40、45、50、55、60、65或75个或更多个连续的核苷酸杂交。

基于ZFX核苷酸序列的探针可以被用于检测转录本或基因组ZFX序列,所述转录本或基因组ZFX序列编码例如其它生物中的相同或同源的蛋白质。在优选的实施方案中,探针还包含与之结合的标签基团,例如所述标签基团可以是放射性同位素、荧光化合物、酶,或酶辅因子。这类探针也可以被用作诊断测试试剂盒的部分,所述试剂盒用于鉴定表达ZFX蛋白质的细胞。

术语“同源性”、“序列同一性”等等在本文可互换使用。就本发明的目的而言,在本文中定义为了测定两条氨基酸序列或两条核酸序列共享的序列同一性程度,就最适比较的目的排列所述序列(例如为了与第二氨基酸或核酸序列最适比对,可以向第一氨基酸或核酸序列的序列中引入缺口)。这类排列可以在被比较的序列的全长上进行。或者,排列可在更短的长度上进行,例如在约20个、约50个、约100或更多个核酸/碱基或氨基酸上进行。

然后比较相应的氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一条序列中的一个位置被与第二序列中相应位置上相同的氨基酸残基或核苷酸占据时,则所述分子在该位置上是同一的。两条序列之间共享的同一性程度典型地以两条序列之间的同一性百分比来表述,并且是所述序列共享的相同位置数的函数(即%同一性=相同位置数/位置总数(即重叠位置)x100)。两条序列可以在其整个长度上比较。

技术人员应当明白下述事实:可获得若干种不同的计算机程序以测定两条序列之间的同源性。例如,可以使用数学算法完成两个序列之间的序列比较和同一性百分比测定。

可以使用例如E.Meyers and W.Miller的算法(CABIOS,4:11-17(1989)),使用PAM120权重残表、12的缺口长度罚分和4的缺口罚分测定两条氨基酸或核苷酸序列的同一性百分比,所述算法已被整合进ALIGN程序(2.0版)中(可使用Genestream服务器IGH Montpellier France的序列数据得自ALIGN Query:http://vega.igh.cnrs.fr/bin/align-guess.cgi)。

本发明的核酸和蛋白质序列还可以被用作“查询序列”,针对公开数据库进行搜索,以例如鉴定其它家族成员或相关序列。这类搜索可以使用Altschul,et al.(1990)J.MoI.Biol.215:403-10的BLASTN、BLASTP和BLASTX程序(2.0版)进行。可以使用BLASTN程序在核苷酸数据库中进行BLAST核苷酸搜索,以获得与本发明的ZFX核酸分子同源的核苷酸序列。可以用BLASTX程序在蛋白质数据库中对经翻译的核苷酸序列进行BLAST搜索,以获得与经翻译的本发明ZFX基因同源的氨基酸序列。或者,为了与蛋白质数据库进行蛋白质序列比较,可以使用BLASTP程序,其中矩阵Blosum 62,预期的阈值=10,字长=3,缺口存在成本11,缺口延伸成本1。使用BLAST程序时,可以使用各个程序(例如BLASTX、BLASTP和BLASTN)的默认参数。公共数据库中同源性搜索的所有相关信息见http://www.ncbi.nlm.nih.gov/上的National Center for BiotechnologyInformation主页。

BLASTP和BLASTN算法可以被用于计算序列同一性或排列序列(例如基于它们的默认设置来例如鉴定等同物或相应的序列)。

公众可通过National Center for Biotechnology Information(http://www.ncbi.nlm.nih.gov/)获得用于进行BLAST分析的软件。所述算法涉及通过在查询序列中鉴定长度为W的短词来首先鉴定高评分序列对(HSP),所述短词与数据库序列中相同长度的词比对时匹配或者满足一些正值阈值分数T。T被称作相邻词评分阈值(neighborhood word scorethreshold)。这些初始的相邻词击中发挥种子的作用来起始搜索,寻找含有它们的HSP。所述词击中沿各条序列在两个方向上延伸,直至能够提高累积的比对评分。在以下情况下停止各个方向上词击中的延伸:累积比对评分比其达到的最大值降低X量;由于一个或多个负评分残基比对的累积,累积评分达到零或以下;或达到任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。来自DNA-DNA比较的BLASTN程序使用11的词长(W)、10的预期(E)和两条链的比较作为默认值。用于蛋白质-蛋白质比对的BLASTP程序使用3的词长(W)、BLOSUM62评分矩阵、11的缺口存在罚分和1的缺口延伸罚分以及10的预期(E)作为默认值。

BLAST算法进行两条序列之间相似性的统计学分析。BLAST算法提供的一种相似性度量是最小和概率(P(N)),所述最小和概率提供了两条核苷酸或氨基酸序列之间随机发生匹配的概率的指征。例如,当一条序列与另一序列比较的最小和概率小于约1,优选地小于约0.1,更优选地小于约0.01,最优选地小于约0.001时,所述一条序列被认为与所述另一序列相似。

另外,肽基序可以被用于鉴定编码含有该肽基序的蛋白质的基因。除一个肽基序以外,两个或更多肽基序的组合也可以被用于鉴定编码含有所述肽基序的蛋白质的基因。当编码特定脯氨酸特异性蛋白酶的一个或若干个肽基序被鉴定时,可能使用一个或若干个这些肽基序的组合来鉴定编码编码脯氨酸特异性蛋白酶的基因。脯氨酸特异性蛋白酶被用作如何鉴定这类基因的一个例子,但是所述方法是普遍适用的。肽基序可被用于使用程序如Patscan(http://www-unix.mcs.anl.gov/compbio/PatScan/HTML/)在经翻译的来自DNA数据库的DNA序列或来自蛋白质序列数据库的蛋白质序列中进行搜索。氨基酸序列必须以网站上描述的特定格式输入。可以进行的另一方法是使用基序的序列,使用程序如http://myhits.isb-sib.ch/cgi-bin/在经翻译的来自DNA数据库的DNA序列或来自蛋白质序列数据库的蛋白质序列中进行搜索。对于该程序而言,以所谓的Prosite格式在搜索栏中输入所述基序,并针对蛋白质序列或经翻译的DNA序列中所述基序的存在搜索数据库。所述方法可被用于鉴定编码有用的脯氨酸特异性蛋白酶的真菌基因。随后可使用本领域技术人员已知的程序,将使用这些方法之一鉴定的基因翻译成蛋白质序列,并且在它们的氨基端检查信号序列的存在。为了检测信号序列,可以使用程序如SignalP(http://www.cbs.dtu.dk/services/SignalP/)。下述蛋白质序列的寻找为这类酶的工业化生产提供了巨大的益处,所述蛋白质序列既含有共有序列又含有预测的信号序列。

使用肽基序鉴定脯氨酸特异性蛋白酶基因的另一种可能性是:用要鉴定其中脯氨酸特异性蛋白酶基因的生物的优选的密码子选择,以基序的氨基酸序列成为核苷酸序列的回译(back-translation)为基础,设计寡核苷酸引物,并使用该寡核苷酸与基因文库杂交,或者在PCR引物中与反转录的mRNA库杂交。使用肽序列基序,还可能在基因序列未知时分离编码脯氨酸特异性蛋白酶的基因。在文献中已描述了设计可用于该目的的简并寡核苷酸引物的方法(Sambrook et al.(1989)Molecular cloning:a laboratorymanual.Cold Spring Harbor Laboratory Press)。还描述了使用简并寡核苷酸作为探针或引物,从生物中分离基因的方法。

编码肽基序的寡核苷酸适用于分离编码脯氨酸特异性蛋白酶特性的基因。可通过在核苷酸未知的位置上引入肌苷(I)碱基,来降低这类寡核苷酸的简并性。另外,胞嘧啶(C)和胸腺嘧啶(T)碱基二者均有可能的位置可被尿嘧啶(U)代替,腺嘌呤(A)和鸟嘌呤(G)二者均有可能的位置上仅可引入鸟嘌呤,从而降低简并性并且仅小量影响寡核苷酸引物的特异性。另外,为了在已知其中密码子偏好的生物中筛选编码脯氨酸特异性蛋白酶的基因的存在,可通过在寡核苷酸的设计中考虑密码子偏好来进一步降低寡核苷酸的简并性。本领域技术人员会知道如何实现。另外,可独立地合成没有简并性的寡核苷酸引物的所有可能组合,并在个别的筛选实验中使用。

首先,在通用载体中从感兴趣的物种构建基因组、cDNA或EST文库。用于文库构建的合适方法描述于文献中(Sambrook et al.(1989)Molecular cloning:a laboratory manual.Cold Spring Harbor LaboratoryPress)。其次,在对从文库中分离的DNA进行的PCR反应中,与一种通用的寡核苷酸一起使用上述简并寡核苷酸,所述通用的寡核苷酸在载体中重组DNA插入物的边界处引起反应。在文献中已描述了只能获得单个简并寡核苷酸引物时用于分离目的基因的有用策略(例如Minambres et al.(2000)Biochem.Biophys.Res.Commun.272,477-479;PCR technology(1989)Ed.H.A.Erlich pp.99-104,Stockton Press)。第三,对PCR扩增的片段随后进行标记,并用作通过常规手段筛选文库的探针。然后可将全长基因亚克隆进适用于在目的生产宿主生物中过表达脯氨酸特异性蛋白酶的表达载体中。

在一种不同的途径中,当不能从下述物种中获得文库时,可用不同的简并引物或用使用单个简并引物的3’-RACE通过PCR扩增基因的部分,所述物种是筛选是否存在编码脯氨酸特异性蛋白酶的基因的物种。为此,RNA从感兴趣的物种中分离,并用于使用单个简并引物作为基因特异引物的3’-RACE反应中。先前已描述了使用一种简并的寡核苷酸和一种通用引物,通过3’-RACE对未知cDNA部分的扩增(WO99/38956)。

使用仅来自小肽的信息分离全长基因的传统方法是将经标记的简并寡核苷酸与复制了文库的滤纸杂交。文献中已详尽地描述了使用简并寡核苷酸筛选基因文库的方法,和计算或测定这些寡核苷酸的最适杂交条件的方法(Sambrook et al.(1989))。上述寡核苷酸可被用于该方法中,从不同物种中分离编码脯氨酸特异性蛋白酶的基因。

在对该方法的一种变更中,可首先构建部分基因文库。为此,将DNA分级,之后通过与上述经标记的寡核苷酸杂交,检测含有编码脯氨酸特异性蛋白酶的基因的DNA片段。这些片段被分离,并用于构建富含编码脯氨酸特异性蛋白酶的基因的部分基因文库中。随后可通过常规手段筛选该文库。对这种方法而言,首先用限制性酶消化基因组DNA,之后通过凝胶电泳分离,同时cDNA可被直接分级。

分离编码脯氨酸特异性蛋白酶的基因的一种不同的方法是使用针对任何共有序列的肽获得的抗体。抗体可以是单克隆或多克隆的。文献中已详尽地描述了对小肽特异的抗体的生产方法(Harlow,E and Lane,D(1988)Antibodies;a laboratory manual,ISBN 0-87969-314.-2)。

可通过将cDNA或基因组DNA克隆进下述载体中构建表达文库,所述载体适合在便利的宿主例如E.coli或酵母中表达插入物。表达载体可基于噬菌体λ或不基于噬菌体λ。已公开了通过表达文库生产的抗原的免疫检测,和纯化表达抗原的特异克隆的方法。使用对任何共有基序的肽特异的抗体,可能使用该方法分离编码含有该基序的脯氨酸特异性蛋白酶的基因。

实际上,考虑到本发明中所述信息时,许多不同的方法可被用于分离编码脯氨酸特异性蛋白酶的基因。使用肽基序序列信息优于现有技术方法的优点是能够快速并相对容易地鉴定编码活性脯氨酸特异性蛋白酶的新颖基因。序列信息的使用表明新颖的脯氨酸特异性蛋白酶在食品工业应用中的价值,而不需要在直接应用实验中对所有可能进行费时的测试。

本文使用术语“选择性杂交”和类似的术语旨在描述用于杂交和洗涤的下述条件,典型地,在所述条件下彼此至少约60%、至少约70%、至少约80%、更优选地至少约85%、进一步更优选地至少约90%、最优选地至少95%、更优选地至少约98%或更优选地至少约95%、更优选地至少约98%或更优选地至少约99%同源的核苷酸序列典型地保持为彼此杂交。也就是说,这类杂交序列可共享至少约50%、至少约60%、至少约70%、至少约80%、更优选地至少约85%、进一步更优选地至少约90%、更优选地至少95%、更优选地至少98%或更优选地至少约99%的序列同一性。

因此,能够与SEQ ID NO:1和/或SEQ ID NO:2的序列的反向互补链选择性杂交的核苷酸序列包括在本发明内,并且通常会与SEQ ID NO:1和/或SEQ ID NO:2的编码序列在至少60、优选地至少100、更优选地至少200个连续的核苷酸上或最优选地在SEQ ID NO:1和/或SEQ ID NO:2的全长上具有至少50%或60%、至少70%、至少80%、至少90%、至少95%、至少98%或至少99%的序列同一性。

类似地,编码活性脯氨酸特异性蛋白酶并且能够与SEQ ID NO:1和/或SEQ ID NO:2的DNA编码序列互补链的片段选择性杂交的核苷酸也包括在本发明内。上述同一性程度和最小尺寸的任何组合可被用于定义本发明的多核苷酸,优选更严格的组合(即在更长长度上更高的同一性)。因此,在60个、优选地在100个核苷酸上至少80%或90%相同的多核苷酸形成了本发明的一个方面,在200个核苷酸上至少90%相同的多核苷酸也形成了本发明的一个方面。

这类杂交条件的一个优选的非限制性例子是:于约45℃下在6X氯化钠/柠檬酸钠(SSC)中杂交,然后于50℃、优选55℃、优选60℃和进一步更优选65℃下,在1X SSC、0.1%SDS中洗涤一次或多次。

高度严格条件包括例如于68℃下在5x SSC/5x Denhardt′s溶液/1.0%SDS中杂交并于室温下在0.2x SSC/0.1%SDS中洗涤。或者,洗涤可以在42℃进行。

技术人员应当知道对于严格和高度严格的杂交条件而言应用何种条件。涉及这类条件的其它指示在该领域能够容易地获得,例如在Sambrooket al.,1989,Molecular Cloning,A Laboratory Manual,Cold Spring HarborPress,N.Y.;和Ausubel et al.(eds.),1995,Current Protocols in MolecularBiology,(John Wiley & Sons,N.Y.)中。

当然,仅与多聚A序列(例如mRNA的3’末端多聚(A))或互补的T(或U)残基段杂交的多核苷酸不应被包括于与本发明的核酸部分特异杂交的本发明多核苷酸中,因为这类多核苷酸会与含有多聚(A)段或其互补体的任何核酸分子(例如尤其是任何双链cDNA克隆)杂交。

可以以一种典型的途径,来筛选从其它生物(例如丝状真菌,尤其是来自Trichomaceae科、例如来自Aspergillus或Penicillium属的微生物)构建的cDNA文库。

例如,可以通过Northern印迹针对同源的ZFX多核苷酸筛选Penicillium菌株。检测到与根据本发明的多核苷酸同源的转录物后,可以利用本领域技术人员公知的标准技术从分离自适当菌株的RNA构建cDNA文库。或者,可以使用能够与根据本发明的ZFX多核苷酸杂交的探针来筛选总基因组DNA文库。

可以例如通过进行PCR分离同源的基因序列,所述PCR使用以本文所述核苷酸序列为基础设计的两个简并寡核苷酸引物池。

用于反应的模板可以是通过反转录mRNA获得的cDNA,所述mRNA从已知或怀疑表达本发明多核苷酸的菌株中制备。可以对PCR产物进行亚克隆和测序,以确保被扩增的序列代表了新ZFX核酸序列的序列或其功能等同物。

然后可以通过多种已知方法,使用PCR片段来分离全长cDNA克隆。例如,被扩增的片段可以被标记,并用于筛选噬菌体或粘粒cDNA文库。或者,被标记的片段可以被用于筛选基因组文库。

也可以用PCR技术来从其它生物中分离全长cDNA序列。例如,可以根据标准步骤从合适的细胞或组织来源中分离RNA。可以使用特异于被扩增片段最5’端的寡核苷酸引物,引导第一链合成,针对RNA进行反转录反应。

然后可以使用标准的末端转移酶反应将得到的RNA/DNA杂交体“加尾”(例如用鸟嘌呤),可以用RNase H消化所述杂交体,然后(例如用多聚-C引物)引物起始第二链合成。因此,被扩增片段上游的cDNA序列可以容易地被分离。有用的克隆策略的综述,参阅例如上文Sambrook etal.;和上文的Ausubel et al.。

本发明的另一方面涉及包含编码ZFX蛋白质或其功能性等同物的本发明多核苷酸的载体,包括克隆和表达载体,还涉及在例如本发明多肽发生表达的条件下,在合适的宿主细胞中培养、转化或转染这类载体的方法。本文使用的术语“载体”指能够转运与之连接的另一核酸的核酸分子。

本发明的多核苷酸可以被掺入重组的可复制载体中,例如克隆或表达载体中。载体可被用于在相容的宿主细胞中复制核酸。因此在另一实施方案中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在使得所述载体复制的条件下培养所述宿主细胞。载体可以从宿主细胞中被回收。合适的宿主细胞在下文讨论。

其中插入本发明表达盒或多核苷酸的载体可以是能够便利地进行重组DNA操作的任何载体,并且所述载体的选择通常应取决于要引入它的宿主细胞。

根据本发明的载体可以是自主复制载体,即显示为染色体外实体的载体,其复制不依赖于染色体复制,例如质粒。或者载体可以是被引入宿主细胞中后被整合进宿主细胞基因组中,并与整合了它的染色体一起复制的载体。

一种类型的载体是“质粒”,质粒是指其中可以连接其它DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中其它DNA区段可以被连接进病毒基因组中。某些载体在它们被引入的宿主细胞中能够自主复制(例如具有细菌复制起点的细菌载体和附加体哺乳动物载体)。其它载体(例如非附加体哺乳动物载体)在引入宿主细胞时被整合进宿主细胞的基因组中,从而随宿主细胞的基因组一起被复制。另外,某些载体能够指导与它们可操作地连接的基因的表达。这类载体在本文中被称作“表达载体”。一般而言,重组DNA技术中使用的表达载体通常是以质粒的形式存在的。术语“质粒”和“载体”在本文中可互换使用,因为质粒是最常用的载体形式。然而,本发明旨在包括这类表达载体的起等同作用的其它形式,如粘粒、病毒载体(例如复制缺陷反转录病毒、腺病毒和腺伴随病毒)和噬菌体载体。

根据本发明的载体可以体外使用,例如用于生产RNA或用于转染或转化宿主细胞。

本发明的载体可包含两种或更多,例如三种、四种或五种本发明的多核苷酸,例如用于过表达。

本发明的重组表达载体以适合核酸在宿主细胞中表达的形式包含本发明的核酸,这意味着重组表达载体含有一个或多个与待表达的核酸序列可操作地连接的调节序列,以要用于表达的宿主细胞为基础选择所述调节序列。

在重组表达载体中,“可操作地连接”旨在表示感兴趣的核苷酸序列与调节序列以允许核苷酸序列表达(例如在体外转录/翻译体系中或当载体被引入宿主细胞中时在宿主细胞中)的方式连接,即术语“可操作地连接”是指一种连接,其中所述组分处于允许它们以其预期方式发挥功能的关系中。与编码序列“可操作地连接”的调节序列如启动子、增强子或其它表达调节信号以下述方式放置:在与所述控制序列相容的条件下实现所述编码序列的表达;或者所述调节序列被布置为使得它们与其预期目的一致地发挥功能,例如转录在启动子处开始并通过编码多肽的DNA序列继续。

本发明因此提供了一种载体,所述载体可以是表达载体,例如其中多核苷酸序列与调节序列可操作地连接,以允许所述多核苷酸序列在细胞(例如丝状真菌细胞)中表达。

术语“调节序列”旨在包括启动子、增强子和其它表达控制元件(例如多腺苷酸化信号)。这类调节序列描述于例如Goeddel;Gene ExpressionTechnology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)中。

术语调节序列包括在许多类型的宿主细胞中指导核苷酸序列组成型表达的那些序列和仅在某种宿主细胞中指导核苷酸序列表达的那些(例如组织特异调节序列)。

针对指定宿主细胞的载体或表达构建体因此可包含以下元件,所述元件以相对于编码第一发明的多肽的序列的编码链从5’-端到3’-端的连续顺序彼此可操作地连接:(i)能够在给定的宿主细胞中指导编码多肽的核苷酸序列转录的启动子序列;(2)任选地,能够指导多肽从给定的宿主细胞分泌进培养基中的信号序列;(3)本发明的DNA序列,其编码成熟和优选地活性形式的、具有脯氨酸特异性蛋白酶活性的多肽;和优选地还有(4)能够终止编码多肽的核苷酸序列下游转录的转录终止区(终止子)。

根据本发明的核苷酸序列的下游可以是含有一个或多个转录终止位点(例如终止子)的3’非翻译区。终止子的起点较不关键。终止子可以例如对编码多肽的DNA序列而言是天然的。然而,优选地在酵母宿主细胞中使用酵母终止子并在丝状真菌宿主细胞中使用丝状真菌终止子。更优选地,终止子对宿主细胞(其中要表达编码多肽的核苷酸序列)而言是内源的。在被转录的区域中,可存在用于翻译的核糖体结合位点。构建体所表达的成熟转录本的编码部分应当包括位于要翻译的多肽起点处的翻译起始AUG和适当地位于结尾处的终止密码子。

增强的本发明多核苷酸的表达也可以通过对异源调节区(例如启动子、分泌前导肽和/或终止子区)的选择来实现,所述异源调节区可发挥以下作用:提高表达宿主对感兴趣的蛋白质的表达水平和需要时的分泌水平,和/或提供本发明多肽表达的诱导型控制。

本发明因此还提供了载体,所述载体可以是表达载体,例如其中多核苷酸序列与允许所述多核苷酸序列在细胞(例如丝状真菌细胞)中表达的调节序列可操作地连接。

本领域技术人员应当知道:对表达载体的设计可以以下述因素为基础,如待转化的宿主细胞的选择、期望的蛋白质表达水平等。本发明的表达载体可以被引入宿主细胞中,从而生产由本文所述的核酸编码的蛋白质或肽(例如ZFX蛋白质。ZFX蛋白质的突变体形式,其片段、变体或功能等同物,融合蛋白等)。

启动子/增强子和其它表达调节信号可以被选择为与用于设计表达载体的相应宿主细胞相容。例如可以使用原核启动子,尤其是适用于E.coli菌株的启动子。在哺乳动物细胞中进行本发明多肽的表达时,可以使用哺乳动物启动子。也可以使用组织特异性启动子例如肝细胞特异性启动子。也可以使用病毒启动子,例如Moloney鼠白血病病毒长末端重复(MMLVLTR)、劳斯肉瘤病毒(RSV)LTR启动子、SV40启动子、人巨细胞病毒(CMV)IE启动子、单纯疱疹病毒启动子或腺病毒启动子。

合适的酵母启动子包括S.cerevisiae GAL4和ADH启动子和S.pombenmt1和adh启动子。哺乳动物启动子包括可相应重金属如镉而被诱导的金属硫蛋白启动子。也可使用病毒启动子如SV40大T抗原启动子或腺病毒启动子。所有这些启动子是本领域可容易获得的。

可以使用哺乳动物启动子如β-肌动蛋白启动子。组织特异性启动子,尤其是内皮或神经元细胞特异性启动子(例如DDAHI和DDAHII启动子)是特别优选的。也可以使用病毒启动子,例如Moloney鼠白血病病毒长末端重复(MMLV LTR)、劳斯肉瘤病毒(RSV)LTR启动子、SV40启动子、人巨细胞病毒(CMV)IE启动子、腺病毒、HSV启动子(如HSV IE启动子)或HPV启动子,尤其是HPV上游调节区(URR)。病毒启动子是本领域可容易获得的。

本发明的重组表达载体可以被设计,用于在原核细胞或真核细胞中表达根据蛋白质。例如,ZFX可以在细菌细胞如E.coli、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、真菌细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,Gene Expression Technology:Methods in Enzymology185,Academic Press,San Diego,CA(1990)中进一步讨论。或者,可以例如使用T7启动子调节序列和T7聚合酶体外转录和翻译重组表达载体。

对大部分丝状真菌和酵母而言,载体或表达构建体优选地被整合进宿主细胞的基因组中,从而获得稳定的转化体。然而,对某些酵母和真菌而言还可获得合适的附加体载体,可以向其中并入表达构建体进行稳定和高水平的表达,其例子包括分别衍生自Saccharomyces和Kluyveromyces的2μ、CEN和pKD1质粒的载体,或含有AMA序列(例如来自Aspergillus的AMA1)的载体。将表达构建体整合进宿主细胞基因组中的情况下,所述构建体被整合进基因组中随机基因座处,或者使用同源重组整合进预定的目标基因座处,在这种情况下目标基因座优选地包含高度表达的基因。高度表达的基因是例如在被诱导的条件下其mRNA可占总细胞mRNA的至少0.01%(w/w)的基因,或者是其基因产物可占总细胞蛋白质的至少0.2%(w/w)的基因,或者在分泌型基因产物的情况下,其基因产物可分泌至至少0.05g/l水平的基因。

因此,可用于本发明的表达载体包括来自染色体、附加体和病毒的载体,例如来自细菌质粒、噬菌体、酵母附加体、酵母染色体元件、病毒(如杆状病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反转录病毒)的载体和来自其组合的病毒,如来自质粒和噬菌体遗传元件的病毒(如粘粒和噬菌粒)。

核苷酸插入物应与合适的启动子可操作地连接。除了对编码本发明多肽的基因是天然的启动子以外,可以使用其它启动子来指导本发明多肽的表达。启动子可针对其在期望的表达宿主中指导本发明多肽表达的效率来选择。可用于本发明中的启动子的例子包括噬菌体冲L启动子,E.colilac、trp和tac启动子,SV40早期和晚期启动子和反转录病毒LTR的启动子,但不限于这些。其它合适的启动子是技术人员应当知道的。在一个特定的实施方案中,能够在真菌或酵母中指导脯氨酸特异性蛋白酶高水平表达的启动子是优选的。这类启动子是本领域已知的。

可以使用能够在本发明的宿主细胞中指导转录的多种启动子。优选地,启动子序列衍生自高表达的基因。优选的高表达基因(启动子优选地从其中衍生和/或其包含在用于整合表达构建体的优选的预定目标基因座中)的例子包括但不限于编码糖解酶如丙糖磷酸异构酶(TPI)、甘油醛-磷酸脱氢酶(GAPDH)、磷酸甘油酸激酶(PGK)、丙酮酸激酶(PYK或PKI)、醇脱氢酶(ADH)的基因,以及编码淀粉酶、葡萄糖淀粉酶、蛋白酶、木聚糖酶、纤维二糖水解酶、β-半乳糖苷酶、醇(甲醇)氧化酶、延伸因子和核糖体蛋白的基因。合适的高表达基因的特定例子包括例如来自Kluyveromyces sp.的LAC4基因、分别来自Hansenula和Pichia的甲醇氧化酶基因(AOX和MOX)、来自A.niger和A.awamori的葡萄糖淀粉酶(glaA)基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因和T.reesei纤维二糖水解酶基因。

优选地用于真菌表达宿主中的强组成型和/或诱导型启动子的例子是可得自以下真菌基因的启动子:木聚糖酶(xlnA)、植酸酶、ATP-合成酶、亚基9(oliC)、丙糖磷酸异构酶(tpi)、醇脱氢酶(AdhA)、a-淀粉酶(amy)、淀粉葡萄糖苷酶(glaA基因的AG-形式)、乙酰胺酶(amdS)和甘油醛-3-磷酸脱氢酶(gpd)启动子。

强酵母启动子的例子是可得自醇脱氢酶、乳糖酶、3-磷酸甘油酸酯激酶和丙糖磷酸异构酶基因的启动子。

强细菌启动子的例子是α-淀粉酶和启动子以及来自细胞外蛋白酶基因的启动子。

适用于植物细胞的启动子包括胭脂碱合酶(nos)、章鱼碱合酶(ocs)、甘露碱合酶(mas)、核酮糖小亚基(核酮糖二膦酸羧化酶-加氧酶ssu)、组蛋白、水稻肌动蛋白、菜豆蛋白、花椰菜花叶病毒(CMV)35S和19S和环病毒启动子。

所有上述启动子是本领域可容易获得的。

载体可还包括得到RNA的多核苷酸侧翼的序列,所侧翼的序列包含与真核基因组序列或病毒基因组序列同源的序列。这会允许将本发明的多核苷酸引入宿主细胞的基因组中。具体地,包含侧翼为真菌序列的表达盒的质粒载体可被用于制备适用于将本发明的多核苷酸递送至真菌细胞的载体。使用这些真菌载体的转化技术是本领域技术人员已知的。

载体可含有以反义方向为导向的发明的多核苷酸,以提供反义RNA的生产。载体可含有以反义方向为导向的本发明的多核苷酸,以提供反义RNA的生产。这可被用于在期望时减少多肽的表达水平。

可以通过常规的转化或转染技术将载体DNA引入原核或真核细胞中。本文使用的术语“转化”和“转染”旨在表示用于向宿主细胞中引入外源核酸(例如DNA)的多种本领域公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖-介导的转染、转导、感染、脂质转染、阳离子脂质介导的转染或电穿孔。用于转化或转染宿主细胞的合适方法可见于Sambrook,et al.(Molecular Cloning:A Laboratory Manual,2nd,ed.ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989),Davis et al.,Basic Methods in Molecular Biology(1986)和其它实验室手册中。

对于哺乳动物细胞的稳定转染而言,已知取决于使用的表达载体和转染技术,只有非常小的细胞级分可以将外源DNA整合进它们的基因组中。为了鉴定并选择这些整合体,通常将编码可选择标记(例如抗性或抗生素)的基因与感兴趣的基因一起引入宿主细胞中。优选的可选择标记包括但不限于赋予药物抗性或补足宿主细胞缺陷的可选择标记。它们包括例如可用于转化大部分丝状真菌和酵母的通用标记基因,如乙酰胺酶基因或cDNA(来自A.nidulans、A.oryzae或A.niger的amdS、niaD、向facA基因或cDNA),或提供抗生素抗性如G418、潮霉素、博来霉素、卡那霉素、甲氨喋呤、腐草霉素或苯菌灵抗性(benA)的基因。或者,可以使用特异性选择标记,如需要相应突变体宿主菌株的营养缺陷型标记,例如URA3(来自S.cerevisiae或来自其它酵母的类似基因)、pyrG或pyrA(来自A.nidulans或A.niger)、argB(来自A.nidulans或A.niger)或trpC。在一个优选的实施方案中,在引入表达构建体后从经转化的宿主细胞中缺失选择标记,从而获得能够生产下述多肽的经转化的宿主细胞,所述多肽不含选择标记基因。

其它标记包括ATP合成酶、亚基9(oliC)、乳清苷-5′-磷酸脱羧酶(pvrA)、细菌G418抗性基因(这也可在酵母中使用,但是不能在真菌中使用)、氨苄西林抗性基因(E.coli)、新霉素抗性基因(Bacillus)和编码β-葡糖醛酸糖苷酶(GUS)的E.coli uidA基因。载体可以体外使用,例如用于生产RNA或用于转染或转化宿主细胞。

蛋白质在原核生物中的表达常在E.coli中用下述载体完成,所述载体含有指导融合蛋白或非融合蛋白表达的组成型或诱导型启动子。融合载体对其中编码的蛋白质、例如对重组蛋白的氨基端添加大量氨基酸。这类融合载体典型地具有三个目的:1)提高重组蛋白的表达;2)提高重组蛋白的溶解度;3)通过在亲和层析中发挥配体作用来帮助纯化重组蛋白。通常在融合表达载体中,在融合片段和重组蛋白的接合处引入蛋白水解切割位点,使得能够在融合蛋白的纯化后将重组蛋白与融合片段分开。

如所指出的,表达载体优选地含有可选择标记。这类标记包括用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,和用于在E.coli和其它细菌中培养的四环素或氨苄西林抗性。合适的宿主的代表性例子包括细菌细胞,如E.coli、Streptomyces、Salmonella typhimurium和某些Bacillus的物种;真菌细胞,如Aspergillus的物种,例如A.niger、A.oryzae和A.nidulans,如酵母如Kluyveromyces,例如K.lactis和/或Puchia,例如P.pastoris;昆虫细胞如Drosophila S2和Spodoptera Sf9;动物细胞如CHO,COS和Bowes melanoma;和植物细胞。用于上述宿主细胞的适当培养基和条件是本领域已知的。

优选用于细菌的载体例如公开于WO-A1-2004/074468中,所述文献通过引用并入本文。其它合适的载体应是技术人员容易知道的。

适用于本发明的已知细菌启动子包括WO-A1-2004/074468中公开的启动子,所述文献通过引用并入本文。

可以通过向载体中插入增强子序列,来提高高等真核生物对编码本发明多肽的DNA的转录。增强子是DNA的顺式作用元件,通常约10到300bp,其作用于提高启动子在给定的宿主细胞类型中的转录活性。增强子的例子包括SV40增强子(其位于复制起点下游的bp 100到270)、巨细胞病毒早期启动子增强子、复制起点下游的多瘤增强子和腺病毒增强子。

为了将翻译的蛋白质分泌进入内质网腔中、进入壁膜间隙中或进入细胞外环境中,可以向被表达的多肽中整合进适当的分泌信号。所述信号对多肽可以是同源的或它们可以是异源信号。

ZFX多肽可以以经修饰的方式(例如作为融合蛋白)被生产,并可不仅含有分泌信号而且含有额外的异源功能区。因此,例如额外氨基酸区(尤其是带电荷的氨基酸)可被添加至多肽的N端,以促进纯化期间或随后的操作和储存期间在宿主细胞中的稳定性和持久性。还可向多肽添加肽基元,以便于纯化。

本发明提供了经分离的多肽,所述多肽具有根据SEQ ID NO:3的氨基酸序列,和能够通过在合适的宿主中表达SEQ ID NO:1或2的多核苷酸获得的氨基酸序列。包含上述多肽的功能性等同物的肽或多肽也包括在本发明内。上述多肽集体包含在术语“本发明的多肽”中。

术语“肽”和“寡肽”被认为是同义的(如其通常被认为的那样),且当上下文需要表示通过肽键偶合的至少两个氨基酸链时,每个术语可以互换使用。词语“多肽”在本文中使用表示含有多于七个氨基酸残基的链。所有的寡肽和多肽式或序列在本文中从左到右和从氨基端到羧基端的方向书写。本文使用的单字母氨基酸代码是本领域普遍已知的,并可见于Sambrook,et al.(Molecular Cloning:A Laboratory Manual,2nd,ed.ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989)。

“分离的”多肽或蛋白质表示被从其天然环境中取出的多肽或蛋白质。例如,就本发明的目的而言,在宿主细胞中表达的重组产生的多肽和蛋白质被认为是分离的,与通过任何合适的技术已基本纯化的天然或重组多肽一样,所述合适的技术例如Smith and Johnson,Gene 67:31-40(1988)中公开的单步骤纯化方法。

根据本发明的ZFX脯氨酸特异性蛋白酶可以通过本领域已知的方法从重组细胞培养物中回收和纯化。最优选地,使用高效液相色谱(“HPLC”)进行纯化。

本发明的多肽包括天然纯化的产物、化学合成步骤的产物,和通过重组技术从原核或真核宿主生产的产物,所述宿主包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞。取决于重组生产步骤中使用的宿主,可以将本发明的多肽糖基化或不糖基化。另外,本发明的多肽也可以包含最初被修饰的残基(在一些情况下由宿主介导的过程产生)。

本发明还包括根据本发明的多肽的生物活性片段。

本发明的多肽的生物活性片段包括包含下述氨基酸序列的多肽,所述氨基酸序列与ZFX蛋白的氨基酸序列(例如SEQ ID NO:3的氨基酸序列)足够相同或来自后者,所述片段包含比全长蛋白质更少的氨基酸但是显示相应的全长蛋白质的至少一种生物活性。典型地,生物活性片段包含具有ZFX蛋白的至少一种活性的结构域或基序。本发明的蛋白质的生物活性片段可以是长度为例如10、25、50、100或更多个氨基酸的多肽。另外,其它生物活性部分(其中蛋白质的其它区域被缺失)可以通过重组技术被制备,并针对本发明多肽的天然形式的一种或多种生物活性做出评价。

本发明还包括编码ZFX蛋白的上述生物活性片段的核酸片段。

本发明的蛋白质或其功能等同物,例如其生物活性部分,可以与非ZFX多肽(例如异源氨基酸序列)可操作地连接,形成融合蛋白。“非ZFX多肽”是指具有下述氨基酸序列的多肽,所述氨基酸序列对应于与ZFX蛋白不大量同源的蛋白质。这类“非ZFX多肽”可衍生自相同或不同的生物。在ZFX融合蛋白中,ZFX多肽可对应于ZFX蛋白质的全部或其生物活性片段。在一个优选的实施方案中,ZFX融合蛋白包含ZFX蛋白的至少两个生物活性部分。在融合蛋白中,术语“可操作地连接”旨在表示ZFX多肽和非ZFX多肽彼此按照读码框融合。非ZFX多肽可以与ZFX多肽的N-端或C-端融合。

例如,在一个实施方案中,融合蛋白是其中ZFX序列与GST序列C-端融合的GST-ZFX融合蛋白。这类融合蛋白可有助于重组的ZFX的纯化。在另一实施方案中,融合蛋白是其N-端含有异源信号序列的ZFX蛋白。在某些宿主细胞(例如哺乳动物和酵母宿主细胞)中,可以通过使用异源信号序列提高ZFX的表达和/或分泌。

在另一个例子中,可以使用杆状病毒包膜蛋白的gp67分泌序列作为异源信号序列(Current Protocolsin Molecular Biology,Ausubel et al.,eds.,John Wiley & Sons,1992)。真核异源信号序列的其它例子包括蜂毒肽和人胎盘碱性磷酸酶的分泌序列(Stratagene;La Jolla,California)。还在另一例子中,有用的原核异源信号序列包括phoA分泌信号(Sambrook等,上文)和A蛋白分泌信号(Pharmacia Biotech;Piscataway,New Jersey)。

可以使用信号序列来协助本发明蛋白质或多肽的分泌和分离。信号序列的典型特征是疏水氨基酸核,其通常在分泌期间的一个或多个切割事件中从成熟蛋白质上被切割。这类信号肽含有加工位点,所述加工位点允许在经过分泌通路时从成熟蛋白质上切下信号序列。信号序列指导蛋自质如从转化了表达载体的真核宿主中分泌,并且随后或同时切割信号序列。然后可以通过已知方法,从细胞外介质中容易地纯化蛋白质。或者,可以使用简化纯化的序列(如具有GST结构域),将信号序列与感兴趣的蛋白质连接。因此,例如编码多肽的序列可以与简化融合多肽纯化的标记序列(如编码肽的序列)融合。在本发明这一方面的某些优选的实施方案中,标记序列是六-组氨酸肽,如pQE载体(Qiagen,Inc.)中提供的标签,以及其它,其中许多可商业获得。例如如Gentz et al,Proc.Natl.Acad.Sci.USA86:821-824(1989)中所述,六-组氨酸提供了融合蛋白的便利纯化。HA标签是可用于纯化的另一种肽,其对应于衍生自流感血凝素蛋白的表位,由例如Wilson et al.,Cell 37:767(1984)描述。

分泌的酶,例如SEQ ID NO:3的氨基酸序列,通常被合成为包括前-序列(pre-sequence)或信号序列和/或原-序列(pro-sequence)。这些序列通常在分泌过程期间或之后从蛋白质上被去除。因此,成熟的分泌的蛋白质通常不再含有这些前序列和原序列。缺乏可能的前序列或原序列的可能的SEQ ID NO:3版本是本发明的一部分。SEQ ID NO:3的氨基酸序列中可能的加工位点位于第20位氨基酸的羧基端。根据本发明的成熟的酶在这种情况下会从第21位氨基酸开始。由于其它加工而来自SEQ ID NO:3的氨基酸序列的所有其它修饰是被允许的,只要它们不破坏所述酶的活性即可。

优选地,通过标准重组DNA技术生产本发明的ZFX融合蛋白。例如,根据常规技术将编码不同多肽序列的DNA片段按照读码框连接在一起,所述常规技术例如通过使用平末端或交错末端(stagger-endedtermini)用于连接、使用限制性酶消化来提供适当的末端、适当时填平粘末端、使用碱性磷酸酶处理来避免不想要的接合,和酶促连接。在另一实施方案中,可以通过常规技术(包括自动化DNA合成仪)合成融合基因。或者,可以使用锚定引物进行基因片段的PCR扩增,所述锚定引物在两条相邻的基因片段之间产生互补性悬突,所述相邻基因片段可随后退火并被再扩增产生嵌合基因序列(参阅例如Current Protocols in MolecularBiology,eds.Ausubel et al.John Wiley & Sons:1992)。另外,可以商业获得已经编码融合片段(例如GST多肽)的许多表达载体。ZFX-编码核酸可以被克隆进这样的表达载体中,从而使融合片段与ZFX蛋白按照读码框连接。

术语“变体”、“功能等同物”和“功能变体”在本文可互换使用。ZFX多核苷酸的变体/功能等同物是编码下述多肽的经分离的核酸片段,所述多肽显示本文定义的ZFX Penicillium chrysogenum脯氨酸特异性蛋白酶的具体功能。根据本发明的ZFX多肽的功能等同物是显示本文定义的Penicillium chrysogenum脯氨酸特异性蛋白酶的至少一种功能的多肽。因此,功能性等同物也包括生物活性片段。

本发明的多肽因此可包含SEQ ID NO:3中公开的氨基酸序列或其基本同源的序列,或具有脯氨酸特异性蛋白酶活性的任一序列的片段。通常,SEQ ID NO:3中所示天然存在的氨基酸序列是优选的。

本发明的多肽可包含SEQ ID NO:3的多肽的天然存在的变体或其物种同源物。

变体是例如在真菌、细菌、酵母或植物细胞中天然存在的多肽,所述变体具有脯氨酸特异性蛋白酶活性和与SEQ ID NO:3的蛋白质基本相似的序列。术语“变体”是指与SEQ ID NO:3的脯氨酸特异性蛋白酶具有相同的关键特征或基本生物功能的多肽,并且包括等位基因变体。优选地,变体多肽至少具有与SEQ ID NO:3的多肽相同的脯氨酸特异性蛋白酶水平。变体包括与SEQ ID NO:3来自相同菌株或者来自相同属或种的不同菌株的等位基因变体。

类似地,本发明蛋白质的物种同源物是具有类似序列的等同蛋白质,所述等同蛋白质是脯氨酸特异性蛋白酶并且在另一物种中天然存在。

可以使用本文所述的步骤并对合适的细胞来源(例如细菌、酵母、真菌或植物细胞)进行这类步骤来分离变体和物种同源物。还可能使用本发明的探针对由酵母、细菌、真菌或植物细胞制成的DNA进行探针标记,从而获得表达SEQ ID NO:3多肽的变体或物种同源物的克隆。可用于分离已知基因的变体和物种同源物的方法详尽描述于文献中,并且是本领域技术人员已知的。这些基因可以通过常规技术改造来产生本发明的多肽,所述本发明的多肽之后可通过本身已知的重组或合成技术来生产。

功能蛋白质或多肽等同物可含有SEQ ID NO:3的仅一个或多个氨基酸的保守取代或非必需氨基酸的取代、插入或删除。因此,非必需氨基酸是SEQ ID NO:3中能够被改变而基本不改变生物功能的残基。

也就是说,SEQ ID NO:3多肽及其变体和物种同源物的序列也可以被修饰,来提供本发明的多肽。可以制造氨基酸取代,例如从1、2或3个到10、20或30个取代。也可以制造相同数量的缺失和插入。典型地可在对多肽功能而言关键性的区域外制造这些改变,使得经修饰的多肽保留其脯氨酸特异性蛋白酶活性。

术语“保守取代”旨在表示下述取代:其中氨基酸残基被具有相似侧链的氨基酸残基取代。这些家族是本领域已知的,并包括具有碱性侧链(例如赖氨酸、精氨酸和组氨酸)、酸性侧链(天冬氨酸、谷氨酸)、不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

本发明的多肽包括上述全长多肽及其变体的片段,包括SEQ ID NO:3中公开的序列的片段。这类片段典型地会保留脯氨酸特异性蛋白酶的活性。片段长度可至少为50、100或200个氨基酸,或者可以比SEQ ID NO:3中所述全长序列短这些数量个氨基酸。

需要时,本发明的多肽可以通过合成手段生产,尽管通常会如上所述重组制造。例如可以通过添加帮助其鉴定或纯化的组氨酸残基或T7标签,或通过添加促进其被细胞分泌的信号序列,来修饰合成和重组的多肽。

因此,变体序列可包含来自于除分离出SEQ ID NO:3多肽的菌株之外的Penicillium菌株的变体序列。可以通过如上文所述寻找脯氨酸特异性蛋白酶活性和克隆与测序,从其它Penicilliurn菌株中鉴定变体。变体可包括蛋白质序列中单个氨基酸或多组氨基酸的缺失、修饰或添加,只要肽保持SEQ ID NO:3的脯氨酸特异性蛋白酶的基本生物功能即可。

可以制造例如从1、2个或从3个到10、20或30个取代的氨基酸取代。经修饰的多肽通常会保留作为脯氨酸特异性蛋白酶的活性。可以制造保守的氨基酸取代,这类取代是本领域公知的。

更短或更长的多肽序列在本发明的范围内。例如,长度至少为50个氨基酸或多达100、150、200、300、400、500、600、700或800个氨基酸的肽被认为落入本发明的范围内,只要其显示SEQ ID NO:3的脯氨酸特异性蛋白酶的基本生物功能即可。具体但非唯一地,本发明的这一方面包括其中蛋白质是完整蛋白质序列一个片段的情况。

就本发明而言,优选感兴趣的蛋白质已被积极地分泌进培养基中。分泌型蛋白质通常最初作为前-蛋白质被合成,随后前-序列(信号序列)在分泌过程中被去除。分泌过程在原核生物和真核生物中基本类似:被积极分泌的前-蛋白质穿过膜,信号序列被特定的信号肽酶去除,成熟的蛋白质被(再)折叠。对信号序列而言一般结构可以被识别。用于分泌的信号序列位于前-蛋白质的氨基端,并且长度一般为15-35个氨基酸。氨基端优选地含有带正电的氨基酸,并且优选地不含酸性氨基酸。认为带正电的区域与膜磷脂带负电的头部基团相互作用。该区域接着是疏水的跨膜核心区。所述区域长度一般为10-20个氨基酸,并且主要由疏水氨基酸组成。带电的氨基酸通常不存在于这一区域中。跨膜区接着是信号肽酶的识别位点。识别位点由对小-X-小具有偏好的氨基酸组成。小氨基酸可以是丙氨酸、甘氨酸、丝氨酸或半胱氨酸。X可以是任何氨基酸。

典型地,功能核酸等同物可含有沉默突变或不改变所编码的多肽生物功能的突变。因此,本发明提供了编码下述ZFX蛋白质的核酸分子,所述蛋白质含有对于具体生物活性并非必需的氨基酸残基改变。这类ZFX蛋白质在氨基酸序列上与SEQ ID NO:3差异,但仍保留至少一种生物活性。在一个实施方案中,经分离的核酸分子包含编码蛋白质的核苷酸序列,其中所述蛋白质含有与SEQ ID NO:3所示氨基酸序列至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更同源的基本同源的氨基酸序列。

例如,涉及如何制造表型沉默氨基酸取代的指南在Bowie,J.U.et al.,Science 247:1306-1310(1990)中和其中引用的参考文献中提供。如作者所述,这些研究揭示了蛋白质对氨基酸取代是惊人地耐受的。作者还指出何种改变很可能在蛋白质的某位置上是允许的。

可以如下文所述来制造编码与分别根据SEQ ID NO:3的蛋白质同源的ZFX蛋白质的经分离的核酸分子:向根据SEQ ID NO:1或2的编码核苷酸序列中引入一个或多个核苷酸取代、添加或删除,使得一个或多个氨基酸取代、删除或插入被引入所编码的蛋白质中。这类突变可以通过标准技术引入,如定点诱变和PCR-介导的诱变。

术语“功能等同物”还包括Penicillium chrysogenum脯氨酸特异性蛋白酶蛋白质的直向同源物。Penicillium chrysogenum ZFX蛋白质的直向同源物是能够从其它菌株或物种中分离并具有相似或相同生物活性的蛋白质。这类直向同源物可容易地被鉴定,因为含有与SEQ ID NO:3基本同源的氨基酸序列。

本文定义术语“基本同源”是指含有与第二氨基酸或核苷酸序列足够或最少的同一或等同(例如具有相似侧链)的氨基酸或核苷酸的第一氨基酸或核苷酸序列,使得所述第一和第二氨基酸或核苷酸序列具有共同的结构域。例如,含有下述共有结构域的氨基酸或核苷酸序列在本文中被定义为足够同一,所述共有结构域具有约60%、优选65%、更优选70%、进一步更优选75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性或更多。

此外,编码其它ZFX家族成员的核酸(其因而具有与SEQ ID NO:1或2不同的核苷酸序列)也在本发明的范围内。另外,编码来自不同物种的ZFX蛋白质的核酸(其能够具有与SEQ ID NO:1或2不同的核苷酸序列)在本发明的范围内。

可以根据它们与本文公开的ZFX核酸的同源性,使用本文公开的cDNA或其合适的片段作为杂交探针,根据标准的杂交技术,优选地在高度严格的杂交条件下,来分离对应于本发明的ZFX多核苷酸的变体(例如天然等位基因变体)或同源物的核酸分子。

除了ZFX序列的天然存在的等位基因变体外,技术人员知道,可以通过突变向SEQ ID NO:1或SEQ ID NO:2的核苷酸序列中引入改变,从而导致ZFX蛋白质的氨基酸序列中的改变,而不显著改变ZFX蛋白质的功能。

在本发明的另一方面,提供了经改进的ZFX蛋白质。经改进的ZFX蛋白质是其中至少一种生物活性被改进的蛋白质。这类蛋白质可以如下获得:沿全部或部分ZFX编码序列随机地引入突变,重组表达得到的突变体并针对生物活性进行筛选。例如,本领域提供了用于测量脯氨酸特异性蛋白酶的酶活性的标准实验,因而经改进的蛋白质可以容易地被选择。

在一个优选的实施方案中,ZFX蛋白质具有根据SEQ ID NO:3的氨基酸序列。在另一实施方案中,ZFX多肽与根据SEQ ID NO:3的氨基酸序列基本同源,并典型地保留根据SEQ ID NO:3的多肽的至少一种生物活性,但是由于如上所述的天然变异或诱变而在氨基酸序列上有差异。

在又一个优选的实施方案中,ZFX蛋白质具有由下述经分离的核酸片段编码的氨基酸序列,所述经分离的核酸片段能够与根据SEQ ID NO:1或2的核酸优选地在高度严格的杂交条件下杂交。

因此,ZFX蛋白质优选地是包含下述氨基酸序列的蛋白质,所述氨基酸序列与SEQ ID NO:3所示氨基酸序列至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多同源(即共享序列同一性)。典型地,这样的蛋白质保留根据SEQ ID NO:3的多肽的例如与脯氨酸特异性蛋白酶活性相关的至少一种功能活性。

也可以如下文所述来鉴定根据本发明的蛋白质的功能等同物:例如,针对脯氨酸特异性蛋白酶活性,筛选本发明蛋白质的突变体(例如截短突变体)的组合文库。在一个实施方案中,通过核酸水平上的组合诱变产生有斑文库(variegated library)。可以通过例如将合成的寡核苷酸混合物酶连接为基因序列来产生变体的有斑文库,从而可能的蛋白质序列的简并集合(degenerate set)可作为个体多肽表达,或者作为一组更大的融合蛋白表达(例如用于噬菌体展示)。存在可用于从简并寡核苷酸生产本发明多肽的可能变体文库的多种方法。用于合成简并寡核苷酸的方法是本领域已知的(见例如Narang(1983)Tetrahedron 39:3;ltakura et al.(1984)Annu.Rev.Biochem.53:323;ltakura et al.(1984)Science 198:1056;Ike et al.(1983)Nucleic Acid Res.11:477)。

另外,本发明多肽的编码序列的片段文库可以被用于产生有斑的多肽群,用于筛选随后的变体选择。例如,可以如下产生编码序列片段的文库:在每个分子仅发生约一次切割的条件下用核酸酶处理感兴趣的编码序列的双链PCR片段,变性双链DNA,将DNA复性形成双链DNA(其可包含来自被不同切割的产物的有义/反义对),通过用S1核酸酶处理从再形成的双链体上去除单链部分,并将得到的片段文库连接进表达载体中。通过该方法,可以得到下述表达文库,所述表达文库编码感兴趣的蛋白质的不同大小的N-末端和内部片段。

本领域已知有若干种技术可用于筛选组合文库(其通过截短的点突变制造)的基因产物,和用于筛选cDNA文库以获得具有选定特性的基因产物。用于筛选大基因文库的、适用于高通量分析的、最广泛使用的技术典型地包括:将基因文库克隆进可复制的表达载体中,用得到的载体文库转化合适的细胞,和在下述条件下表达组合基因,所述条件下想要的活性的检测简化编码基因(其产物被检测)的载体的分离。循环总体诱变(Recursive ensemble mutagenesis,REM),一种增强文库中功能突变体频率的技术,可以与筛选实验组合使用以鉴定本发明蛋白质的变体(Arkinand Yourvan(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815;Delgrave et al.(1993)Protein Engineering 6(3):327-331)。

应当理解,技术人员可使用常规技术制造不影响本发明多核苷酸编码的多肽序列的核苷酸取代,以反映要表达本发明多肽的任何具体宿主生物的密码子选择。

可以通过核苷酸取代,例如从1、2或3个到10、25、50、100或更多个取代,来修饰SEQ ID NO:1和/或SEQ ID NO:2的编码序列。SEQ IDNO:1和/或SEQ ID NO:2的多核苷酸可替代性或额外地通过一个或多个插入和/或缺失和/或任一端或两端的延长来修饰。经修饰的多核苷酸一般编码具有脯氨酸特异性蛋白酶活性的多肽。可以制造简并取代和/或可以制造当被修饰的序列被翻译时会导致保守氨基酸取代的取代,例如如下文针对多肽所讨论的。

本发明提供的序列也可以被用作构建“第二代”酶的起始材料。“第二代”脯氨酸特异性蛋白酶是通过诱变技术(例如定点诱变或基因改组技术)改变的脯氨酸特异性蛋白酶,所述酶具有与野生型脯氨酸特异性蛋白酶或重组脯氨酸特异性蛋白酶(如本发明所生产的脯氨酸特异性蛋白酶)不同的特性。例如,它们的温度或pH最适度、比活性、底物亲和力或热稳定性可以被改变,使其更好地适用于具体的工艺。

对本发明的脯氨酸特异性蛋白酶的活性而言必需的,并因此优选地进行取代的氨基酸可以根据本领域已知的步骤如定点诱变或丙氨酸扫描诱变来鉴定。在后一技术中,在分子中的每个残基处引入突变,并测试得到的突变体分子的生物活性(例如脯氨酸特异性蛋白酶活性),以鉴定对分子的活性而言关键性的氨基酸残基。也可以通过晶体结构分析来测定酶-底物相互作用的位点,所述晶体结构分析通过例如核磁共振、晶体学或光亲和标记的技术来测定。

基因改组技术提供了在多核苷酸序列中引入突变的随机方式。表达后将具有最佳特性的隔离群再分离、组合并再次改组,以提高遗传多样性。通过将该步骤重复多次,可以分离编码被大幅改进的蛋白质的基因。优选地,基因改组步骤由编码具有相似功能的蛋白质的基因家族开始。本发明提供的多核苷酸序列家族可充分适用于基因改组,来改进分泌型脯氨酸特异性蛋白酶的特性。

或者可以使用经典的随机诱变技术和选择(例如用NTG处理诱变或UV诱变)来改进蛋白质的特性。诱变可对经分离的DNA直接进行,或者对用感兴趣的DNA转化的细胞进行。或者,可以通过本领域技术人员已知的大量技术,在经分离的DNA中引入突变。这些方法的例子是易错PCR、在修复缺陷型宿主细胞中扩增质粒DNA等等。

除了SEQ ID NO:1或2中所示的ZFX基因序列外,本领域技术人员应当知道给定的种群中可存在DNA序列多态,所述多态导致ZFX蛋白质氨基酸序列中的改变。这类遗传多态性可存在于来自不同种群的细胞中或由于天然等位基因变异而存在于一个种群中。等位基因变体也可包括功能等同物。

根据本发明的多核苷酸的片段也可包括不编码功能多肽的多核苷酸。这类多核苷酸可作为PCR反应的探针或引物作用。

根据本发明的核酸无论是编码功能多肽还是无功能的多肽,均可被用作杂交探针或聚合酶链式反应(PCR)引物。不编码具有ZFX活性的多肽的本发明核酸分子的用途尤其包括:(1)从cDNA文库分离编码ZFX蛋白质的基因或其等位基因变体,所述cDNA文库例如来自除Penicilliumchrysogenum之外的其它生物;(2)与中期染色体涂片原位杂交(例如FISH)以提供ZFX基因的精确染色体定位,如Verma et al.,HumanChromosomes:a Manual of Basic Techniques,Pergamon Press,New York(1988)所述;(3)Northern印迹分析,用于检测ZFX mRNA在特定组织中的表达;和4)能够被用作诊断工具来分析给定的生物(例如组织)样品中核酸存在的探针和引物,所述核酸能与ZFX探针杂交。

本发明还包括获得ZFX基因功能等同物的方法。这类方法需要获得被标记的含有被分离的核酸的探针,所述被分离的核酸编码根据SEQ ID NO:3的蛋白质序列或其任何变体的全部或部分;在允许探针与文库中的核酸片段杂交从而形成核酸双链体的条件下,用被标记的探针筛选核酸片段文库,和从任何被标记的双链体中的核酸片段制备全长的基因序列,以获得与ZFX基因相关的基因。

在一个实施方案中,本发明的ZFX核酸与SEQ ID NO:1或SEQ IDNO:2中所示的核酸序列或其任一的互补体至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更加同源。

在另一实施方案中,本发明包括细胞,例如含有本发明所包括的核酸的经转化的宿主细胞或重组的宿主细胞。“经转化的细胞”或“重组细胞”是其中(或其祖先中)已经借助于重组DNA技术引入了本发明核酸的细胞。原核和真核细胞均包括在内,例如细菌、真菌、酵母等等,特别优选的是来自丝状真菌(尤其是Aspergillus niger)的细胞。

因此,本发明提供了包含本发明多肽、多核苷酸或载体的宿主细胞。所述多核苷酸对宿主细胞的基因组可以是异源的。通常涉及宿主细胞的术语“异源的”表示多核苷酸不天然存在于宿主细胞的基因组中,或者多肽不由所述细胞天然地生产。

可选用调控插入序列表达并以特异的、期望的方式加工基因产物的宿主细胞。蛋白质产物的这类修饰(例如糖基化)和加工(例如切割)可促进蛋白质发挥最佳功能。

多种宿主细胞具有用于翻译前加工和修饰蛋白质和基因产物的特性和特异机制。可选用分子生物学和/或微生物学领域技术人员熟悉的适当细胞系或宿主系统,以确保对所表达的外源蛋白质的想要的和正确的修饰与加工。为此,可以使用具有下述细胞机制的真核宿主细胞,所述细胞机制用于适当地加工原始转录本、糖基化和磷酸化基因产物。这类宿主细胞是本领域公知的。

如果需要的话,可以在根据本发明的多肽的制备中使用上述细胞。这样的方法典型地包含在提供编码多肽的编码序列(的载体)表达的条件下培养宿主细胞(例如用上述表达载体转化或转染的),并任选地回收被表达的多肽。

可以将本发明的多核苷酸并入重组可复制载体例如表达载体中。可以使用载体在相容的宿主细胞中复制核酸。

因此在又一个实施方案中,本发明提供了如下制造本发明多核苷酸的方法:将本发明的多核苷酸引入可复制载体中,将所述载体引入相容的宿主细胞中,并在使得所述载体复制的条件下培养所述宿主细胞。可以从所述宿主细胞中回收载体。

合适的宿主细胞包括细菌如E.coli,酵母,哺乳动物细胞系和其它真核细胞系,例如昆虫细胞如Sf9细胞和(例如丝状)真菌细胞。

优选地,多肽作为分泌型蛋白质被生产,在这种情况下,表达构建体中编码多肽成熟形式的核苷酸序列与编码信号序列的核苷酸序列可操作地连接。优选地,信号序列对编码多肽的核苷酸序列而言是天然的(同源的)。或者,信号序列对编码多肽的核苷酸序列而言是外来的(异源的),在这种情况下信号序列优选地对其中表达本发明核苷酸序列的宿主细胞而言是内源的。对酵母宿主细胞而言合适的信号序列的例子是衍生自酵母a-因子基因的信号序列。类似地,对丝状真菌宿主细胞而言合适的信号序列是例如衍生自丝状真菌淀粉葡萄糖苷酶(AG)基因例如A.niger glaA基因的信号序列。这可与淀粉糖苷酶(也称作(葡糖)淀粉酶)启动子自身组合使用,以及与其它启动子组合使用。在本发明上下文中也可以使用杂种信号序列。

优选的异源分泌前导序列是来自于真菌淀粉葡萄糖苷酶(AG)基因(glaA-例如来自Aspergillus的18和24个氨基酸版本)、α-因子基因(酵母,例如Saccharomyces和Kluyveromyces)或α-淀粉酶基因(Bacillus)的分泌前导序列。

可如上文所述将载体转化或转染进合适的宿主细胞中,以提供本发明多肽的表达。该方法可包括在提供编码本发明多肽的编码序列的载体表达的条件下,培养宿主细胞,并任选地回收被表达的多肽,所述宿主细胞用如上所述的载体如表达载体转化。

本发明包括能够通过这样的方法获得或通过这样的方法获得的多肽。

在一个优选的实施方案中,本发明的多肽产自真菌,更优选地产自Aspergillus,最优选地产自Aspergillus niger。

本发明因此提供了用本发明多核苷酸或载体转化或转染或包含本发明多核苷酸或载体的宿主细胞。优选地,所述多核苷酸在用于复制和表达多核苷酸的载体中载有。应选择与所述载体相容的细胞,并且其可以是原核(例如细菌)、真菌、酵母或植物细胞。

合适的宿主细胞优选地是原核微生物如细菌,或更优选地是真核生物,例如真菌,如酵母或丝状真菌,或植物细胞。通常,酵母细胞是超过真菌细胞优选的,因为它们更易于操作。然而,一些蛋白质在酵母中分泌较差,或者在一些情况下不被正确加工(例如酵母中的超糖基化)。在这些情况下,应当选择真菌宿主生物。

宿主细胞可过表达多肽,并且用于进行过表达的技术是公知的。宿主细胞因此可具有两个或更多拷贝的编码多核苷酸(因此载体可相应地具有两个或更多拷贝)。

来自Bacillus属的细菌非常适合作为异源宿主,因为它们能够将蛋白质分泌进培养基中。适合作为宿主的其它细菌是来自Streptomyces和Pseudomonas属的细菌。用于表达编码多肽的DNA序列的一种优选的酵母宿主细胞是Saccharomyces、Kluyveromyces、Hansenula、Pichia、Yarrowia和Schizosaccharomyces的属。

更优选地,酵母宿主细胞选自由Saccharomyces cerevisiae、Kluyveromyces lactis(也已知为Kluyveromycesmarxianus var.lactis)、Hansenulapolymorpha、Pichia pastoris、Yarrowia lipolytica和Schizosaccharomyces pombe物种组成的组。

然而,最优选的是(例如丝状)真菌宿主细胞。优选的丝状真菌宿主细胞选自由Aspergillus、Trichodernza、Fusarium、Disporotrichum、Penicillium、Acremonium、Neurospora、Thermoascus、Myceliophtora、Sporotrichum、Thielavia和Talaromyces属组成的组。

更优选地,丝状真菌宿主细胞是Aspergillus oryzae、Aspergillussojae、Aspergillus nidulans的种,或来自Aspergillus niger组的种。这些包括但不限于Aspergillus niger、Aspergillusawamori、Aspergillustubingensis、Aspergillus aculeatus、Aspergillus foetidus、Aspergillusnidulans、Aspergillus japonicus、Aspergillus oryzae和Aspergillus ficuum,还由Trichoderma reesei、Fusarium graminearum、Penicilliumchrysogenum、Acremonium alabamense、Neurospora crassa、Myceliophtorathernaophilurri、Sporotrichum cellulophilum、Disporotrichumdimorphosporum和Thielavia terrestris的种组成。

本发明范围内优选的表达宿主的例子是真菌如Aspergillus物种(尤其是EP-A-184,438和EP-A-284,603中描述的物种)和Trichoderma物种;细菌如Bacillus物种(尤其是EP-A-134,048和EP-A-253,455中描述的物种),特别是Bacillus subtilis、Bacillus licheniformis、Bacillusamyloliquefaciens、Pseudomonas物种;和酵母如Kluyveromyces物种(尤其是EP-A-096,430中描述的物种如Kluyveromyces lactis,和EP-A-301,670中描述的物种)和Saccharomyces物种如Saccharomyces cerevisiae。

本发明包括通过编码多肽的DNA序列的重组表达来生产本发明多肽的方法。就这一目的而言,本发明的DNA序列可用于基因扩增和/或改变表达信号如启动子、分泌信号序列,从而允许合适同源或异源宿主细胞中多肽的经济生产。同源宿主细胞是下述宿主细胞,其与DNA序列衍生自的物种是相同物种或是相同物种内的变体。通常涉及宿主细胞的术语“异源的”表示多核苷酸不天然存在于宿主细胞的基因组中,或多肽不天然地由所述细胞生产。

因此,本发明提供了使用重组DNA技术,通过Penicillium编码的酶的过量生产,大量并以相对纯净的形式生产新鉴定的分泌型脯氨酸特异性蛋白酶的经改进的手段。这样做的一个优选的方式是在食品级宿主微生物中过量生产这样的分泌型脯氨酸特异性蛋白酶。公知的食品级微生物包括Aspergilli,Trichoderma,Streptomyces,Bacilli和酵母如Saccharomyces和Kluyveromyces。这样做的一种进一步更优选的方式是在食品级真菌如Aspergillus中过量生产分泌型的源于Penicillium的脯氨酸特异性蛋白酶。最优选的是在食品级真菌中过量生产脯氨酸特异性蛋白酶,其中已针对使用的食品级表达宿主优化了脯氨酸特异性蛋白酶编码基因的密码子选择。一般,为了能够进行后一优化途径,需要分泌型脯氨酸特异性蛋白酶的特有序列信息。更优选地,必须能够获得脯氨酸特异性蛋白酶编码基因的完整核苷酸序列。一旦编码分泌型脯氨酸特异性蛋白酶的基因被转化进优选的宿主中,则可以使用所选择的菌株进行发酵,并从发酵液中分离分泌的脯氨酸特异性蛋白酶蛋白质。

根据本发明的宿主细胞包括植物细胞,因此本发明扩展至含有一个或多个本发明细胞的转基因生物,如植物及其部分。所述细胞可异源表达本发明的多肽,或可异源地含有一个或多个本发明的多核苷酸。转基因(或经遗传修饰的)植物可因此在其基因组中(例如稳定地)插入了编码一个或多个本发明多肽的序列。可以使用已知技术,例如使用来自Agrobacterium tumefaciens的Ti或Ri质粒,进行植物细胞的转化。质粒(或载体)可因此含有感染植物必需的序列,并且可以使用Ti和/或Ri质粒的衍生物。

或者,可进行植物部分例如叶、根或茎的直接感染。在该技术中,例如如下对要被感染的植物造成创伤:用刀片切割植物、或用针穿刺植物或用磨蚀剂摩擦植物。然后用Agrobacterium接种伤口。然后可在合适的培养基上培养植物或植物部分,并允许其发育成为成熟的植物。可通过已知技术实现经转化的细胞成为经遗传修饰的植物的再生,例如通过使用抗生素选择经转化的枝条,并将枝条接种在含有适当营养素、植物激素等等的培养基上来实现。

本发明因此还包括被修饰为表达脯氨酸特异性蛋白酶或其变体的细胞。这类细胞包括经瞬时修饰的,或优选地经稳定修饰的高级真核细胞系,例如哺乳动物细胞或昆虫细胞,低级真核细胞,例如酵母和丝状真菌细胞,或原核细胞例如细菌细胞。

本发明还涉及用于生产亲本细胞的突变细胞的方法,所述方法包括破坏或缺失编码多肽或其控制序列的内源氨基酸序列,这导致突变细胞生产比亲本细胞更少的多肽。

可通过修饰或失活细胞中脯氨酸特异性蛋白酶表达必需的核酸序列,便利地完成具有降低的脯氨酸特异性蛋白酶活性的菌株的构建。要被修饰或失活的核酸序列可以例如是编码显示脯氨酸特异性蛋白酶活性必需的多肽或其部分的核酸序列,或所述核酸序列可具有从核酸序列的编码序列表达多肽所需的调节功能。这类调节或控制序列的一个例子可以是启动子序列或其功能部分,即足以影响多肽表达的部分。用于可能的修饰的其它控制序列包括但不限于,前导序列、多聚腺苷酸化序列、原肽序列、信号序列和终止序列。

可如下文所述来进行核酸序列的修饰或失活:对细胞进行诱变,并选择其中脯氨酸特异性蛋白酶生产能力被降低或消除的细胞。可例如通过使用合适的物理或化学诱变剂,使用合适的寡核苷酸,或对DNA序列进行PCR诱变,进行特异或随机的诱变。另外,可通过使用这些诱变剂的任何组合进行诱变。

适用于该目的的物理或化学诱变剂的例子包括紫外(UV)辐射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(NTG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。

使用这类试剂时,典型地如下进行诱变:在合适的条件下,存在选择的诱变剂时,孵育要被诱变的细胞,并选择显示降低的赖氨酰氧化酶活性或不表达脯氨酸特异性蛋白酶活性的细胞。

可通过在编码多肽的核酸序列或其转录或翻译所需的调节元件中引入、取代或去除一个或多个核苷酸,完成本发明多肽生产的修饰或失活。例如,可插入或去除核苷酸,从而导致终止密码子的引入、起始密码子的去除,或开放读码框的改变。可通过定点诱变或PCR诱变,根据本领域已知的方法完成这类修饰或失活。

尽管修饰通常体内进行,即直接在表达待修饰的核酸序列的细胞上进行,但是优选如下文所例证的体外进行所述修饰。

失活或降低选择的宿主细胞对脯氨酸特异性蛋白酶的生产的一种便利方式的例子基于基因置换(gene replacement)或基因中断(gene interruption)的技术。例如,在基因中断方法中,体外诱变对应于感兴趣的内源基因或基因片段的核酸序列,生产缺陷的核酸序列,所述缺陷的核酸序列随后被转化进宿主细胞中,产生缺陷基因。通过同源重组,缺陷核酸序列代替内源基因或基因片段。优选地,缺陷基因或基因片段还编码下述标记物,所述标记物可被用于选择其中编码多肽的基因被修饰或破坏的转化体。

或者,可使用与多肽编码序列互补的核苷酸序列,通过确立的反义技术,实现编码本发明多肽的核酸序列的修饰或失活。更特定地,可通过引入与编码多肽的核酸序列互补的核苷酸序列,降低或消除多肽的生产。反义多核苷酸随后会典型地在细胞中被转录,并且能够与编码脯氨酸特异性蛋白酶的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,细胞中生产的脯氨酸特异性蛋白酶的量会被降低或消除。

优选地,根据本发明的方法被修饰的细胞是微生物来源,例如是适用于生产预期蛋白质产物的真菌菌株,所述预期的蛋白质产物与细胞同源或异源。

本发明还涉及亲本细胞的突变细胞,所述突变细胞包含编码多肽或其控制序列的内源核酸序列的断裂或缺失,这导致突变细胞生产比亲本细胞更少的多肽。

藉此得到的多肽缺陷的突变细胞尤其适合用作表达同源和/或异源多肽的宿主细胞。因此,本发明还涉及用于生产同源或异源多肽的方法,包括(a)在有助于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。在本发明上下文中,术语“异源多肽”在本文中定义为对宿主细胞而言不是固有的多肽,其中进行修饰改变其天然序列的天然蛋白质,或由于通过重组DNA技术操作宿主细胞而在数量上改变其表达的天然蛋白质。

还在又一方面,本发明提供了通过发酵下述细胞生产基本不含脯氨酸特异性蛋白酶活性的蛋白质产物的方法,所述细胞产生本发明的脯氨酸特异性蛋白酶多肽以及感兴趣的蛋白质产物。所述方法包括在发酵期间或发酵完成后向发酵液中添加有效量的能够抑制脯氨酸特异性蛋白酶活性的试剂,从发酵液中回收感兴趣的产物,并任选地对回收的产物进行进一步纯化。或者,培养后可对得到的培养液进行pH或温度处理,从而大量降低脯氨酸特异性蛋白酶活性,并允许从培养液中回收产物。可对从培养液中回收的蛋白质制剂进行组合的pH或温度处理。

在真核多肽的生产中,尤其是在真菌蛋白质例如酶的生产中,对用于生产基本不含脯氨酸特异性蛋白酶的产物的上述方法尤其感兴趣。脯氨酸特异性蛋白酶缺陷型细胞也可被用于表达食品工业或制药学感兴趣的异源蛋白质。

根据本发明,可通过在常规的营养发酵培养基中培养微生物表达宿主实现本发明多肽的生产,所述微生物表达宿主已用一个或多个本发明的多核苷酸转化。

可使用本领域已知的步骤培养根据本发明的重组宿主细胞。对启动子和宿主细胞的每种组合而言,可以获得有助于编码多肽的DNA序列表达的培养条件。达到期望的细胞密度或多肽滴度后,停止培养并使用已知的步骤回收多肽。

发酵培养基可含有已知的培养基,所述培养基含有碳源(例如葡萄糖、麦芽糖、糖蜜等等)、氮源(例如硫酸铵、硝酸铵、氯化铵等等)、有机氮源(例如酵母提取物、麦芽提取物、蛋白胨等等)和无机氮源(例如磷酸镁、磷酸钾、磷酸锌、磷酸铁等等)。任选地可以包括诱导剂(例如纤维素、果胶、麦芽糖、麦芽糖糊精或聚木糖半乳糖醛酸(xylogalacturonan))。

对合适培养基的选择可基于表达宿主的选择和/或基于表达构建体的调节需求来进行。这类培养基是本领域技术人员已知的。需要时,培养基可含有额外的组分,所述额外的组分对经转化的表达宿主的偏好优于其它可能的污染微生物。

发酵可在0.5-30天的周期上进行。发酵可以是分批、连续或补料分批的过程,在0℃和45℃之间范围内的合适温度下,和例如在从约2到约10的pH下。优选的发酵条件是从约20℃到约37℃之间范围内的温度和/或从约3到约9之间的pH。适当的条件通常基于表达宿主的选择和要表达的蛋白质来选择。

发酵后,如果必须的话,可通过离心或过滤从发酵液中去除细胞。发酵停止或去除细胞后,可随后回收本发明的多肽,并且需要时通过常规手段纯化和分离。

具有脯氨酸特异性蛋白酶活性的本发明的多肽可以是经分离的形式。如本文所定义的,经分离的多肽可以是内源(经典地)生产的或重组的多肽,其基本不含其它非脯氨酸特异性蛋白酶的多肽,并且通过SDS-PAGE测定为典型地至少约20%纯净,优选地至少约40%纯净,更优选地至少约60%纯净,进一步更优选地至少约80%纯净,仍然更优选地约90%纯净,最优选地约95%纯净、约98%纯净或约99%纯净。

可以通过过滤然后浓缩(例如超滤)或本领域已知的用于从粗制溶液中获得纯净蛋白质的任何其它技术分离多肽。得到的制剂可以被喷雾干燥或者作为液体制剂保持。应当理解,多肽可以与不影响多肽预期目的的运载体或稀释剂混合,进而这种形式的多肽仍然会被认为是经分离的。制剂中通常会包含多肽,其中按蛋白质重量计多于20%,例如多于30%、40%、50%、80%、90%、95%或99%是本发明的多肽。

本发明的多肽可以下述形式提供,所述形式使得它们处于其天然细胞环境外。因此,它们可以是如上所述基本经分离或纯化的,或者处于它们天然不存在于其中的细胞中,例如其它真菌物种、动物、植物或细菌细胞中。

优选地,本发明的多肽可得自具有下述基因的微生物,所述基因编码具有脯氨酸特异性蛋白酶活性的酶。更优选地,本发明的多肽由微生物分泌。进一步更优选地,所述微生物是真菌,最好是丝状真菌。因此优选的供体微生物是Penicillium属例如Penicillium chrysogenum种的那些。

本发明提供了具有下述氨基酸序列的经分离的多肽,所述氨基酸序列与SEQ ID NO:3的多肽(即所述多肽)具有至少约60%、例如至少约70%、例如至少约80%、优选地至少约85%、更优选地至少约90%、进一步更优选地至少约95%、仍然更优选地至少约98%、最优选地至少约99%的氨基酸序列同一性程度,并且具有脯氨酸特异性蛋白酶活性。

优选地,根据本发明的经分离或纯化的多肽优选地具有每克蛋白质材料至少10个单位的脯氨酸特异性蛋白酶活性。这些单位应当如方法部分中所述,使用合成肽Z-Gly-Pro-pNA在37℃和pH 5下测量。

典型地,本发明的多肽也会在温度最适度和/或热稳定性方面具有与SEQ ID NO:3的多肽相似或经改进的特性。因此,所述多肽可具有约60℃或更少、约50℃或更少、约40℃或更少、约37℃或更少或更低的温度最适度。

可能通过将所述多肽加热至约60℃,保持约10分钟到约30分钟,例如从约15到约25分钟,如约20分钟,使本发明的多肽失活。这样的失活可以使用巴氏消毒过程进行。在本发明的上下文中,失活表示在热失活过程后不存在或基本上不存在可检测的残余酶活性。

因此,其中使用本发明多肽的任何本文所述方法可包括使多肽失活的步骤。这样的步骤可以是如上文所述的热活化步骤。这样的步骤的结果可以是没有或基本没有可检测的多肽残余酶活性。

可化学修饰,例如翻译后修饰本发明的多肽。例如,它们可以被糖基化(一次或多次),或包含经修饰的氨基酸残基。也可以通过添加帮助纯化组氨酸残基,或通过添加促进从细胞中分泌的信号序列,来修饰本发明的多肽。多肽可具有氨基端或羧基端延伸,例如氨基酸甲硫氨酸残基,至多约20-25个残基的小连接子肽,或简化纯化的小延伸,例如多聚组氨酸束、抗原表位或结合结构域。

本发明的多肽可用揭示性标签标记。揭示性标签可以是允许多肽被检测的任何合适标签。合适的标签包括放射性同位素例如125I、35S,酶,抗体,多核苷酸或连接子例如生物素。

多肽可被修饰为包含非天然存在的氨基酸或提高多肽的稳定性。当通过合成手段生产蛋白质或多肽时,可在生产期间引入这类氨基酸。蛋白质或肽也可以在合成或重组生产后被修饰。

也可以使用D-氨基酸生产本发明的多肽。在这类情况下,氨基酸应当以C到N的方向以反转顺序连接。这在生产这类蛋白质或肽的领域中是常规的。

大量侧链修饰是本领域已知的,并可对本发明的蛋白质或肽的侧链进行所述侧链修饰。这类修饰包括例如通过与醛反应然后用NaBH4还原的还原性烷基化修饰氨基酸,使用乙亚氨酸乙酯(methylacetimidate)的amidination或使用乙酸酐的酰化。

本发明的多肽可以在需要脯氨酸特异性蛋白酶酶活性的任何方法或应用中使用。

本发明因此提供了包含本发明多肽的组合物。这样的组合物可在本发明的方法或用途中使用。

根据本发明的方法或用途中可需要辅助的酶活性,例如额外的蛋白酶活性。因此,本发明提供了包含以下的组合物:(i)根据本发明的多肽;(ii)提供与(i)中多肽不同的活性的多肽,例如与(i)中多肽不同的蛋白酶。

例如,可以使用另外的不同的脯氨酸特异性蛋白酶。这类酶的例子广泛存在于动物和植物中,并且已在微生物中报道:例如,在Aspergillus(EP 0522428)、Flavobacterium(EP 0967285)和Aeromonas(J.Biochem.113,790-796)、Xanthomonas和Bacteroides物种中已鉴定了脯氨酸特异性蛋白酶。

或者,可以使用额外的蛋白酶。优选地,这类额外的蛋白酶具有酸性pH最适度。这类酶的例子公开于WO 03/102195以及本文中。

因此,本发明提供了用于制备蛋白质水解产物的方法,所述方法包括将蛋白质底物与根据本发明的多肽或组合物接触。因此,本发明还提供了本发明的多肽或组合物在制备蛋白质水解产物中的用途。本发明还涉及能够通过这类方法或用途获得或者通过它们获得的蛋白质水解产物。

这类方法可用于从具有常见氨基酸组成的蛋白质底物产生无苦味的水解产物。这类常见的氨基酸组成可在某些食物应用中提供巨大的益处。例子是存在高水平疏水氨基酸残基的酪蛋白或小麦谷蛋白或玉米蛋白质分离物。使用本发明的方法可以使无苦味水解产物能够用于婴儿和临床营养品、治疗性膳食以及消费者膳食和运动营养品中。

本发明的一个实施方案提供了包含经分离、纯化的脯氨酸特异性蛋白酶(即本发明的多肽)的酶混合物,用于高产率生产具有非常低苦味和低变应原特性的蛋白质水解产物,而不伴随着生产高水平的游离氨基酸。所述酶混合物适用于制备多种蛋白质级分的水解产物。具体地,可以将蛋白质底物如奶蛋白质与经分离、纯化的脯氨酸特异性蛋白酶和枯草杆菌蛋白酶孵育,来生产富含具有羧基端脯氨酸的肽片段的蛋白质水解产物。术语“富含”旨在表示酶促切割过程的水解产物中至少8%的肽片段具有羧基端脯氨酸残基。

通过水解蛋白质获得的蛋白质水解产物可包含下述肽,其中带有羧基端脯氨酸的肽的摩尔级分(%)至少是用于生产所述水解产物的蛋白质底物中脯氨酸摩尔级分(%)的两倍。

水解产物中肽的平均长度通常是3到9个氨基酸。

使用本发明多肽制备的优选的水解产物是:包含下述肽的乳清蛋白水解产物,其中带有羧基端脯氨酸的肽的摩尔级分至少为8%、优选地至少为15%、更优选地为30%到70%,包含下述肽的酪蛋白水解产物,其中带有羧基端脯氨酸的肽的摩尔级分至少为25%、优选地为从30%到70%,和包含下述肽的大豆水解产物,其中带有羧基端的肽的摩尔级分为至少20%优选地从30%到70%。

对于上文所述的水解产物而言,肽或肽片段表示分子量从400Dalton到2000Dalton的肽。这些肽可使用本领域技术人员已知的方法(例如使用LC/MC)来分析。

通常,在本发明的蛋白质水解产物的生产中,蛋白质底物被大量水解,有利地被水解至少50%。优选地,至少10%的蛋白质底物被转化成分子量从400Dalton到2000Dalton的肽。更优选地20%到90%、进一步更优选地30%到80%的蛋白质底物被转化成这类肽。

在本发明的另一个实施方案中,蛋白质底物可与包含经分离、纯化的脯氨酸特异性蛋白酶、丝氨酸蛋白酶或金属蛋白酶和羧肽酶的酶混合物一起孵育,来生产富含具有羧基端脯氨酸的肽片段的蛋白质水解产物。

本发明的酶混合物尤其适用于生产旨在对运动饮品和基于果汁的饮料进行调味和养分强化的蛋白质水解产物,因为得到的经水解的肽混合物组合了非常低的苦味谱和在这类饮料主要是酸性的条件下极佳的溶解度。本发明的酶混合物的特征是其含有至少一种蛋白酶,例如丝氨酸蛋白酶或金属内切蛋白酶,与脯氨酸特异性蛋白酶组合来提供初级水解产物。更特定地,本发明涉及经分离、纯化的脯氨酸特异性蛋白酶(即本发明的多肽)和丝氨酸蛋白酶或金属蛋白酶的酶混合物,所述酶混合物能够生产包含下述肽片段的蛋白质水解产物,其中至少8%、优选地至少15%、更优选地从30%到70%的所述肽片段具有羧基端脯氨酸。

用于通过本发明的酶混合物水解的底物包括全奶、脱脂奶、酸性酪蛋白、粗制凝乳酶酪蛋白、酸性乳清蛋白制品或乳酪乳清蛋白制品。非常令人惊讶的是,来自Aspergillus的脯氨酸特异性蛋白酶不仅在脯氨酸残基的羧基端侧切割,而且在羟基脯氨酸残基的羧基端侧切割,这使得其它基于胶原蛋白的动物蛋白质如明胶以及含有骨或鱼骨的残余肉成为所述酶的感兴趣的底物。另外,植物底物如小麦谷蛋白、经研磨的大麦和从中获得的蛋白质级分例如大豆、水稻或玉米是合适的底物。根据本发明生产的奶蛋白质水解产物可以经过或不经额外的过滤或纯化步骤后在多种特色食物(speciality food)中使用,例如用于婴儿营养品的低变应原水解产物,用于肠内和饮食营养品的基本水解产物,以及用于多种形式健康食物的蛋白质浓缩产物。因此,本发明的蛋白质水解产物可以被用于生产具有低变应原性的食品如婴儿配方。另外,根据本发明的酶制剂可被用于减少通过至少一种蛋白质水解产物调味的食物中的苦味,甚至在蛋白质水解产物大量存在时。例如,食物可包含5%和10%(w/v)之间的蛋白质水解产物,并且其苦味仍被本发明的酶制剂降低。

因此,本发明提供了包含本文所述的蛋白质水解产物的食物或饲料制品或饮料。

本发明的多肽提供了具有酸性pH最适度的经分离、纯化的脯氨酸特异性蛋白酶,所述蛋白酶单独提供,或者在包含用于制备用于多种食物应用的蛋白质水解产物的一种或多种其它酶的组合物中提供。

这样的经分离、纯化的脯氨酸特异性蛋白酶可优选地具有每克蛋白质材料至少10个单位的脯氨酸特异性蛋白酶活性。当脯氨酸特异性蛋白酶的pH最适度低于pH 6时,例如在Aspergillus niger脯氨酸特异性内切蛋白酶的情况下,这些单位应当使用合成肽Z-Gly-Pro-pNA在37℃和pH 5下测量,或者如材料和方法章节中所述,所述单位可以在pH=7时测量。

单独的或酶组合物中的经分离、纯化的酶克服了本领域先前已知的酶混合物的大量缺点。最重要的是,本发明的多肽是生产下述水解产物的关键,所述水解产物组合了低变应原潜能、高产率和低苦味谱。另外,用经分离、纯化的脯氨酸特异性蛋白酶或包含该脯氨酸特异性蛋白酶的酶混合物生产的水解产物是酸稳定的,并且含有非常低水平的游离氨基酸,从而在加热步骤如喷雾干燥或产物灭菌期间产生最小的异味。根据本发明的水解产物会含有每克干粉少于900微摩尔的游离氨基酸,优选地每克干粉少于300微摩尔的游离氨基酸,更优选地每克干粉少于150微摩尔的游离氨基酸,和进一步更优选地每克干粉少于50微摩尔的游离氨基酸。

根据本发明的酶混合物的特征是其包含与经分离、纯化的脯氨酸特异性蛋白酶组合的另一内切蛋白酶如丝氨酸蛋白酶或金属内切蛋白酶,所述蛋白酶一起发挥作用,提供初级蛋白质水解产物。

丝氨酸蛋白酶代表了公知的一类碱性内切蛋白酶,其最重要的一些代表如枯草杆菌蛋白酶(E.C.3.4.21.62)和胰凝乳蛋白酶(E.C.3.4.21.1)优先在疏水氨基酸如Tyr、Trp、Phe和Leu的羧基端侧切割肽链。本发明的酶混合物可含有胰凝乳蛋白酶和/或枯草杆菌蛋白酶。枯草杆菌蛋白酶由Bacillus的物种生产,具有尤其宽的底物特异性和宽的碱性pH最适度。所述酶在50℃和60℃之间具有最适活性。所述酶可以作为常规商业产品便宜地获得,并且可用于例如多种奶水解产物的生产中。胰凝乳蛋白酶可得自动物胰,比枯草杆菌蛋白酶具有在稍微更大的碱性pH值下略微更窄的底物特异性,并且在50℃具有最适活性。

金属内切蛋白酶的种类广泛分布于细菌、真菌和更高级的生物中。它们可以被划分成中性和酸性的金属蛋白酶。在这两个亚类中,只有中性蛋白酶展示想要的切割偏好,即在疏水氨基酸残基如Phe和Leu的羧基端侧切割肽链。中性金属蛋白酶范畴公知的代表是芽孢菌蛋白酶(bacillolysin)(E.C.3.4.24.28)和嗜热菌蛋白酶(thermolysin)(E.C.3.4.24.27),这些任一或二者可存在于本发明的酶混合物中。这两种酶均得自Bacillus物种,并且在中性或弱碱性条件下展示最大活性。这些中性金属内切蛋白酶的较不公知的代表得自Aspergillus物种。在脯氨酸特异性蛋白酶不由于去苦味效应被使用,而是被用于帮助富含脯氨酸的蛋白质序列水解的情况下,与酸性金属蛋白酶如例如deuterolysine(EC 3.4.24.39)组合可以是有利的。

除这类水解产物的制备以外,还考虑了利用脯氨酸特异性蛋白酶自身的苦味减少作用的应用。例如,在涉及发酵步骤的蛋白质食物制品如在乳酪或酸奶中掺入内切肽酶来阻抑可在熟化时发展的苦味。另外,在需要用蛋白酶处理的蛋白质食物制品如经酶改性的乳酪的生产或用于调味工业的蛋白质水解产物的生产中,掺入根据本发明的酶会帮助阻抑苦味。

因此,本发明提供了用于制备食物或饲料制品或饮料的方法,所述方法包括在所述食物制品、饲料制品或饮料的制备期间掺入本发明的多肽或组合物。本发明还提供了本发明的多肽或组合物在制备食物或饲料制品或饮料中的用途。本发明还提供了能够通过上述方法或用途获得的食物或饲料制品或饮料。

权利要求的多肽和组合物例如在食物或饮料中的应用不限于期望阻抑苦味的情况。

例如,本发明的多肽可与食物蛋白质接触来降低其变应原性。若干食物蛋白质含有高度变应原性的亚级分,如含有具有脯氨酸富集肽序列的谷醇溶蛋白的小麦谷蛋白。也可以对这些蛋白质施加新颖的酶,来减轻它们的抗原性。

因此,本发明提供了用于制备食物或饲料制品或饮料的方法,所述方法包括在所述食物制品、饲料制品或饮料的制备期间掺入本发明的多肽或组合物,其中得到的食物或饲料制品基本不包含乳糜泻相关表位。

另外,本发明提供了用于治疗或预防精神病症或乳糜泻相关病症的本发明多肽。

已知富含脯氨酸的膳食蛋白质如牛奶中的酪蛋白和谷物中的谷蛋白在人胃肠道中抵抗蛋白质水解降解。因此,富含脯氨酸的肽可以累积并且在特定个体群中导致不想要的效应。这些效应中的一些归因于富含脯氨酸的肽作为结合外周组织和中枢神经系统中受体的阿片样物质(opioid)发挥作用。例如,自闭症和精神分裂症患者所显示的综合征已与富含脯氨酸的膳食蛋白质的消耗相关联。其它效应是对富含脯氨酸的肽不耐受的结果。例如特定的富含脯氨酸的序列负责观察到的谷蛋白在乳糜泻中的毒性。乳糜泻是广泛流行的小肠自身免疫病,其只能通过终生无谷蛋白的膳食来治疗。乳糜泻偶然也伴随着精神病和神经学症状,证实富含脯氨酸的肽被扰乱的代谢可具有深远的后果。

WO 2005/027953中详细描述了脯氨酸特异性蛋白酶的下述用途:在消耗之前从食物中去除有毒的富含脯氨酸的肽,或用于经口供应校正性的酶来补偿不足的肠消化过程,所述文献通过引用并入本文。

本发明的多肽因此可被用于例如在低于5.5的pH下水解富含脯氨酸的肽,所述富含脯氨酸的肽与以下相关:包括孤独症、精神分裂症、ADHD、双相型情感障碍(bipolar mood disorder)和抑郁症的精神病症和与乳糜泻相关的病症如自身免疫病症、特别是1型糖尿病、疱疹样皮炎、自身免疫甲状腺炎、胶原病、自身免疫性脱发和自身免疫性肝炎和IBS。因此,本发明提供了用于治疗或预防神经病症或乳糜泻相关病症的根据本发明的多肽。

有利地,由本发明多肽编码的酶被用于生产乳糜泻相关表位、优选地谷蛋白表位、最优选地小麦或大麦表位被减少、例如基本不含有这些表位的食物,例如啤酒或面包。

将本发明多肽掺入任何种类的面团中可以是期望的,因为观察到这延迟了由此获得的产物如面包的变味。

本发明的脯氨酸特异性蛋白酶可在用于生产富含脯氨酸的肽的方法中使用。这类富含脯氨酸的肽是多种食物或营养制品的想要的添加剂,因为它们涉及厌食作用,涉及溶纤维蛋白效应和抗血栓和抗高血压效应,涉及胃粘膜的保护以及预防风湿性关节炎。

另一应用是在动物饲料中添加本发明的多肽来增强蛋白质利用。例如,本发明多肽的添加可被用于改进饲料蛋白质中存在的难以消化的富含脯氨酸的序列的可消化性,以及改进可便宜获得的含有高水平多酚的植物蛋白质的转化率。

另外,本发明提供了本发明的多肽在制备饮料、例如在啤酒酿造中的用途。例如,大麦蛋白质富含富含脯氨酸的序列,并且它们非麦芽(non-malted)形式的谷物蛋白质极难被降解成创建合适的可发酵麦芽汁(wort)所需的游离氨基酸。因此,将本发明多肽掺入糖化过程(mashingprocess)中可被用于刺激经研磨但是非麦芽的大麦中释放氨基酸,从而获得更醇厚的麦芽汁。可以通过类似的方式改进从麦芽浆(mash)到啤酒的发酵,所述麦芽浆含有高比例的其它便宜并可在本地获得的谷物,例如高粱。

本发明还提供了在饮料中预防或减少浑浊的方法。这样的方法包括对饮料添加本发明的多肽,或者在所述饮料的制备期间掺入本发明的多肽,从而预防或减少所述饮料中的浑浊。本文中术语“饮料”包括处于其制备的任何阶段的任何饮料。因此,饮料不仅是可即刻消耗的饮料,而且是用于制备饮料的任何组合物。例如,啤酒制备中使用的麦芽汁也被本文使用的术语“饮料”包括在内。另外,在饮料制备期间向不是液体或不完全是液体的组合物中添加本发明的多肽旨在落入根据本发明的方法的范围内。在啤酒酿造开始时添加至麦芽浆的本发明的多肽是这样的组合物的一个例子。脯氨酸特异性蛋白酶在减少或预防啤酒中浑浊中的用途详细描述于WO 02/46381和WO 2007/101888中。

在本文中,词语肽和蛋白质可互换使用。在本文上下文中,词语“浑浊”、“雾浊(cloudiness)”和“混浊(turbidity)”也可以互换使用。为了定量饮料中的浑浊量,通常使用浊度计。在浊度计中测量相对于入射光束的方向以预先描述的角度散射的光的量。浊度测量非常适用于测量由于蛋白质-多酚相互作用的结果而形成的浑浊。可以在添加了本发明多肽的饮料中进行浊度测量的方式详细描述于WO 2007/101888中。在减少或预防浑浊的方法中使用脯氨酸特异性蛋白酶时,显示优选地可使用25度的散射角进行浑浊测量。

多酚被定义为具有下述化学结构的化合物,所述结构含有被至少一个羟基取代的至少两个芳香族环,或含有被至少两个羟基取代的至少一个芳香族环。多酚的例子是单宁和黄酮,这包括例如儿茶素、黄酮醇和花色苷。

根据本发明的方法可有利地应用于啤酒、葡萄酒和果汁。其也可以被有利地应用于除啤酒和葡萄酒以外的含醇饮料。

本文使用的术语“啤酒”旨在至少覆盖由以下制备而来的啤酒:由非麦芽谷物制备的麦芽浆,以及由麦芽谷物制备的麦芽浆,和由麦芽和非麦芽谷物的混合物制备的所有麦芽浆。术语“啤酒”还覆盖用佐剂制备的啤酒,和具有所有可能的醇成分的啤酒。

果汁可以是得自例如红色浆果(red berries)、草莓、苹果、梨、马铃薯、柑橘水果、蔬菜等等的汁液。

在根据本发明的方法中添加至饮料的本发明多肽的量可在广阔的范围内变化。在根据本发明的方法的一个优选的实施方案中,添加了饮料中每克蛋白质至少150个毫单位的脯氨酸特异性蛋白酶活性,其中所述活性通过使用Z-Gly-Pro-pNA作为底物的活性测量来测定。更优选地,对饮料添加至少500毫单位的脯氨酸特异性蛋白酶,最优选地,添加至少1个单位的脯氨酸特异性蛋白酶。

不能限定要添加的本发明多肽的最大量。最大量例如取决于期望的浑浊减少或预防量,饮料的组成,饮料的pH和蛋白酶具有其最大活性的pH。

本发明的多肽可以在饮料制备期间的不同阶段添加。在啤酒的制备过程期间,本发明的多肽可以被有利地添加至麦芽浆中。本发明的多肽可以在形成浑浊之前被添加至经发酵的啤酒中。然而,还可能本发明的多肽在浑浊已形成后被添加至经发酵的啤酒。本发明的多肽可有利地在啤酒制备的过程中被添加至糖化或成熟步骤。

在葡萄酒的制备期间,本发明的多肽可优选地被添加至经发酵的葡萄酒。在用于生产葡萄酒的过程中,所述多肽可有利地在醇发酵后或苹果乳酸发酵后被添加。

在用于制备果汁的过程中,本发明的多肽可优选地在浸软或脱果胶期间添加。

因为浑浊形成常常发生在酸性饮料例如啤酒、葡萄酒和果汁中,所以优选地使用在低于7的pH值下具有脯氨酰特异性活性的本发明的多肽。最优选地,在根据本发明的方法中,使用在低于7的pH值下具有最大脯氨酰特异性活性的脯氨酰特异性蛋白酶。

如对酶活性而言典型的,脯氨酰特异性蛋白酶的活性取决于pH。在根据本发明的方法的一个优选的实施方案中,对饮料添加下述蛋白酶,所述蛋白酶在对应于要添加所述蛋白酶的饮料的pH的pH下具有最大的脯氨酰特异性活性。优选的饮料是含有蛋白质的饮料。在另一个优选的实施方案中,饮料含有蛋白质和多酚。优选的饮料是具有低于7的pH值的饮料。

脯氨酸特异性蛋白酶可包含每克蛋白质至少约5个单位、优选地约10个单位/g、更优选地约25个单位/g、进一步更优选地约50个单位/g的要使用的酶。

根据本发明的一个实施方案,本发明多肽的使用可允许(与其中不使用脯氨酸特异性蛋白酶的方法相比)减少饮料例如啤酒的稳定化所需要的时间。例如,稳定化时间段可以被缩短至少于约7天。优选地少于6、5、4或3天。更优选地,缩短至少于2天或1天。

最优选地,稳定化时间段可以被缩短至下述程度,所述程度使得在生产规模下,稳定化的持续时间被减少至等于将来自成熟阶段的啤酒冷却至预期温度、例如对于啤酒的过滤和/或包装而言预期温度所需的时间段。该时间段按照惯例被称作冷却时间段。将稳定化时间段缩短至将啤酒冷却至预期温度所需的时间是高度有利的,因为此时稳定化阶段的持续时间仅取决于可获得的冷却能力。

来自成熟阶段的啤酒传统上被冷却至从约-2℃到高达并包括约0℃的温度。然而,根据本发明的脯氨酸特异性蛋白酶的使用允许稳定化阶段不仅被缩短,而且也在比常规使用的更高的温度下进行。传统上存在在更高温度下进行的稳定化过程,但是这些过程耗时更多,例如6周和更多。因此,在本发明的另一个实施方案中,对优选地冷却至最多约2℃、更优选地最多约3℃、4℃、5℃或6℃或甚至更优选地冷却至最多约7℃或约8℃和最优选地冷却至用于包装即用于装瓶或装桶的预期温度的啤酒,进行稳定化时间段,典型地可以是如上文定义的被缩短的稳定化时间段。

用于包装的预期温度在各个工艺之间可有所不同,但是优选地在至多并且包括8℃、优选地7℃左右的温度下进行,从而在啤酒中获得预期水平的溶解的二氧化碳。在啤酒仅被冷却至包装所需温度的工艺中,与本领域已知的工艺相比需要显著更少的能量。

在根据本发明的一个优选的实施方案中,稳定化阶段可以被减少至将啤酒从成熟阶段结束时的温度冷却至包装预期温度所需的时间段,从而省略了常规的冷稳定化时间段。

因此,根据本发明,啤酒可以被冷却至最多约2℃、更优选地最多约3℃、4℃、5℃或6℃,进一步更优选地冷却至最多约7℃或8℃,和最优选地冷却至用于包装的预期温度。然后可以直接包装啤酒,即在本实施方案中,在已经被冷却的温度下不将啤酒保持任何时间段。

在本发明中,需要时可以进行其它加工步骤来实现额外的澄清和/或稳定化。事实上,如果使用对应于将啤酒冷却至包装预期温度所需的时间段的缩短的稳定化阶段,则可能期望用例如PVPP和/或硅胶处理啤酒。这可帮助确保延长的保质期稳定性。

本说明书中提到的所有出版物和专利申请通过引用并入本文,程度等于每份个体的出版物或专利申请被明确和个别地指出通过引用并入本文。

以下实施例阐述本发明:

实施例

材料和方法

产色肽:所有合成的肽由Pepscan Presto(Almere,荷兰)提供。

用于测定脯氨酰特异性蛋白酶活性的分光光度计方法:底物溶液是在含有40%二噁烷的0.1M柠檬酸/0.2M磷酸二钠缓冲液(pH 5.0)中制备的N-苄氧羰基-甘氨酸-脯氨酸-对-硝基苯胺(Z-Gly-Pro-pNA;分子量426.43;Bachem)的2mM溶液。向1mL缓冲液(pH 5.0)中添加250μl底物溶液,之后添加100μl酶溶液(更大或更小体积量的酶溶液应当由缓冲溶液补偿)。将反映混合物在37℃下孵育,并通过测量410nm处的吸光度提高监测pNA的释放。

活性定义:1个单位的脯氨酸特异性蛋白酶是在所述反应条件下1分钟内从Z-Gly-Pro-pNA中释放1μmol pNA的酶活性。为了计算浓度,使用8,800M-1的摩尔消光系数(E)。

SDS-PAGE:用于SDS-PAGE和染色的所有材料均购自Invitrogen(Carlsbad,CA,US)。根据制造商的说明书,使用SDS缓冲液制备样品,并根据制造商的说明书使用MES-SDS缓冲体系在12%Bis-Tris凝胶上分离样品。使用Simply Blue Safe Stain(Collodial Coomassie G250)进行染色。

实施例1

脯氨酸特异性蛋白酶基因ZFX的克隆和表达

在30℃下在PDB(马铃薯葡萄糖发酵液,Difco)中将Penicilliumchrysogenum菌株CBS 455.95培养3天,并使用制造商的说明书,使用Q-Biogene试剂盒(产品目录号6540-600;Omnilabo International BV,Breda,荷兰)从菌丝体中分离染色体DNA。使用该染色体DNA,使用PCR扩增脯氨酸特异性蛋白酶基因的编码序列。

为了从Penicillium chrysogenum菌株CBS 455.95的染色体DNA中特定地扩增脯氨酸特异性蛋白酶基因ZFX,设计了两条PCR引物。引物序列部分得自存在于Penicillium chrysogenum CBS 455.95的基因组DNA中并且展示于SEQ ID NO:1中的序列。我们发现该序列与Aspergillus niger的脯氨酸特异性蛋白酶基因序列具有<50%的同一性。我们在本文中首次描述了分泌型Penicillium脯氨酸特异性蛋白酶的有效表达和表征。完整的脯氨酸特异性蛋白酶蛋白质的蛋白质序列,包括可能的前-序列和原-序列,展示于SEQ ID NO:3中。

ZFX-dir 5′-CACTTAATTAACTCATAGGCATCATGCATTTCTCAACTGTGGTTAAG(SEQ ID NO:4)

ZFX-rev 5′-TTAGGCGCGCCTCGCAAGCTGATACGAAAGGG(SEQ ID NO:5)

第一条、正向PCR引物(ZFX-dir)含有24个核苷酸的ZJW编码序列,所述编码序列在ATG起始密码子处开始,接着是包含PacI限制性位点的23个核苷酸序列(SEQ ID NO:4)。第二条、反向引物(ZFX-rev)含有ZFX编码序列下游区域反向互补链的核苷酸,接着是AscI限制性位点(SEQ ID NO:5)。通过使用这些引物,我们能够用来自Penicilliumchrysogenum菌株CBS 455.95的染色体DNA作为模板,扩增1.9kb大小的片段。将由此获得的1.9kb达标的片段分离,用PacI和AscI消化并纯化。将包含ZFX编码序列的PacI/AscI片段与来自表达载体pGBFIN-5(WO 99/32617)的PacI/AscI phyA片段互换。得到的质粒是称作pGBFINZFX的ZFX表达载体(见图1),其中ZFX基因与Aspergillusniger的glaA启动子功能性偶联。通过用NotI消化线性化表达载体pGBFINZFX,所述NotI从表达载体中去除所有源于E.coli的序列。使用苯酚∶氯仿∶异戊醇(24∶23∶1)萃取并用乙醇沉淀来纯化经消化的DNA。使用这些载体转化Aspergillus niger CBS513.88。Aspergillus niger转化步骤详尽描述于WO 98/46772中。还描述了如何在含有乙酰胺作为唯一氮源的选择性培养基琼脂平板上选择转化体,和选择靶向的多拷贝整合体。优选地,选择含有多拷贝表达盒的A.niger转化体来进一步生产样品材料。对pGBFINZFX表达载体而言,纯化了30个A.niger转化体;首先在选择性培养基平板上涂布个体转化体,然后在PDA(马铃薯葡萄糖琼脂:PDB+1.5%琼脂)平板上涂布单个菌落。在30℃下生长1周后收集个体转化体的孢子。将孢子冷藏保存,并用于液体培养基的接种。

A.niger转化体菌株被用于通过在摇瓶培养物中培养菌株来生产样品材料。培养A.niger菌株并由培养液中分离菌丝体的一种有用的方法描述于WO 98/46772中。培养基在CSM-MES(每升培养基150g麦芽糖、60gSoytone(Difco)、15g(NH4)2SO4、1g NaH2PO4·H2O、1g MgSO4·7H2O、1gL-精氨酸、80mg Tween-80、20g MES pH6.2)中。在发酵的第4-8天从一式两份的培养中采取5ml样品,将样品在Hereaus labofuge RF中于5000rpm下离心10分钟,并将上清液储存于-20℃直至进一步分析。

用SDS-PAGE分析时显示,含有pGBFINZFX载体的转化体令人惊讶地有效分泌表观分子量约为65kDa的蛋白质。因为这与从ZFX的蛋白质序列预测的分子量几乎相同,我们推测由Aspergillus niger分泌Penicilliumchrysogenum脯氨酸特异性蛋白酶ZFX时,去除信号序列后几乎不发生糖基化。

当发酵和下游加工等比例扩大时,所选择的菌株可以被用于更大量Penicillium脯氨酸特异性蛋白酶的分离和纯化。所述酶继而可被用于进一步分析,和用于不同的工业应用。

实施例2

基因ZFX编码的酶是脯氨酸特异性蛋白酶

回收所选择的A.niger转化体的发酵液,之后过滤样品,然后使用0.22微米Millipore滤器无菌过滤。然后使用Pellicon超滤单元(Millipore,Bedford,MA,USA)浓缩澄清的液体。为了纯化基因ZFX编码的酶活性,随后使用Q-sepharose FF XK(GE Healthcare Bio-Sciences,Diegem,比利时)对经浓缩的液体进行阴离子交换色谱。为此,用20mM柠檬酸钠,pH 6.4平衡经浓缩的液体,并应用于在相同缓冲液中平衡的柱上。使用应用缓冲液中从0到1mol/l NaCl的线性梯度,在20倍柱体积中进行柱洗脱。对洗脱的积分进行SDS-PAGE并染色(见材料和方法部分)。将显示对应于约65kDa分子量的蛋白质条带的这些积分合并、透析,并再次进行相同的色谱和合并步骤。通过SDS-PAGE和染色判断,得到的制剂仅含有单一的蛋白质条带。

为了证实经纯化的蛋白质的蛋白水解活性,使用式Z-Ala-Ala-X-pNA(Z:苄氧羰基;pNA:对硝基苯胺;X:所有20种氨基酸残基之任何)的整组合成的产色肽进行孵育。将个体底物首先溶于DMSO中,然后在0.1mol/l乙酸钠pH 4.0或0.1mol/l tris-HCl缓冲液pH 7.0中稀释至约3毫摩尔/l的期望浓度。添加酶后,使用以Magellan软件(Tecan,Salzburg,Vienna)运行的Tecan Genios MTP读数器,在微量滴定板(MTP)中进行活性测定。

根据获得的结果,仅肽Z-Ala-Ala-Pro-pNA被有效切割,证实在A.niger中过表达的源于Penicillium的ZFX酶的确是脯氨酸特异性蛋白酶。使用溶于柠檬酸钠-MES、MES-NaOH和Tris-HCl缓冲液中的肽Z-Ala-Ala-Pro-pNA对酶进行的额外表征揭示,在37℃下孵育60分钟后,最适蛋白质水解活性在pH 4.5左右展开。

实施例3

脯氨酸特异性蛋白酶ZFX具有37℃左右的温度最适度

为了测试来自Penicillium的脯氨酸特异性蛋白酶的温度最适度,将如实施例2中所述经色谱纯化的过表达的ZFX酶再次与肽Z-Ala-Ala-Pro-pNA孵育。将含有440微升0.1mol/l柠檬酸钠、pH 5.0,50微升浓度15毫摩尔/l的产色肽和10微升经纯化的酶溶液的反映混合物在不同的温度下孵育70分钟。然后通过添加0.5ml 2%(w/w)Tris溶液终止反映,并测量405nm处的光密度,以定量这些情况下累积的酶活性。获得的结果(见图3)清楚地证明蛋白质水解活性在37℃左右的温度最适度。

实施例4

巴氏消毒后ZFX被完全失活

来自A.niger的脯氨酸特异性蛋白酶的工业应用之一是其在啤酒中预防冷冻浑浊形成的用途。在该应用中,啤酒的巴氏消毒期间酶活性不应丧失。考虑到ZFX酶相对低的温度最适度,我们测试了ZFX酶是否能够在典型的啤酒巴氏消毒条件下存活。

所述测试使用“重建的”啤酒来代替啤酒。这是因为我们观察到啤酒中存在的颜色模糊了Pro-pNA肽键成功切割导致的颜色改变。因此,将ZFX酶以工业相关的剂量溶于含5%乙醇的50毫摩尔/l乙酸钠pH 4.5缓冲液中。对所述溶液进行60℃下20分钟的常见啤酒巴氏消毒处理后,将液体冷却至37℃。然后添加Z-Ala-Ala-Pro-pNA肽至3毫摩尔/l的终浓度,以检测任何残余的脯氨酸特异性蛋白质水解活性。甚至在延长的孵育时间后也未能记录OD 405的提高,证明源于Penicillium的ZFX酶被所应用的巴氏消毒处理完全失活。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号