首页> 中国专利> 具有经修饰的前原区域的蛋白酶

具有经修饰的前原区域的蛋白酶

摘要

本发明涉及编码经修饰的蛋白酶的经修饰的多核苷酸,本发明还涉及用于改变蛋白酶在微生物中的生产的方法。特别地,该经修饰的多核苷酸包含一个或多个突变,编码经修饰的蛋白酶,所述经修饰的蛋白酶具有增强该活性酶生产的前原区域修饰。本发明还涉及用于改变蛋白酶在微生物,例如芽孢杆菌属物种,中的生产的方法。

著录项

  • 公开/公告号CN102575242A

    专利类型发明专利

  • 公开/公告日2012-07-11

    原文格式PDF

  • 申请/专利权人 丹尼斯科美国公司;

    申请/专利号CN201080043790.1

  • 发明设计人 A·比萨奇科;B·F·施密特;

    申请日2010-04-15

  • 分类号C12N9/54(20060101);C12N15/57(20060101);C07H21/04(20060101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人黄革生;林柏楠

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 06:00:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-04

    未缴年费专利权终止 IPC(主分类):C12N9/54 授权公告日:20150325 终止日期:20170415 申请日:20100415

    专利权的终止

  • 2015-03-25

    授权

    授权

  • 2012-09-05

    实质审查的生效 IPC(主分类):C12N9/54 申请日:20100415

    实质审查的生效

  • 2012-07-11

    公开

    公开

说明书

技术领域

本发明涉及编码经修饰的蛋白酶的经修饰的多核苷酸,本发明还涉及 用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核苷酸包 含一个或多个突变,编码具有改变的前原(pre-pro)区域的经修饰的蛋白酶, 所述修饰的前原区域增强该活性酶的生产。本发明还涉及用于改变蛋白酶 在微生物(例如芽孢杆菌属(Bacillus)物种)中的生产的方法。

背景技术

细菌来源的蛋白酶是重要的工业酶,其占所有酶销售量的大多数,在 多种工业(包括洗涤剂、肉嫩化、干酪制造、脱毛、烘焙、酿造、助消化剂 的生产、以及从摄影胶片回收银)中被广泛应用。这些酶作为洗涤剂添加剂 的应用促进了它们的商业发展,并导致对这些酶的基础研究的大幅扩增 (Germano等,Enzyme Microb.Technol.32:246-251[2003])。除了作为洗 涤剂和食品添加剂,蛋白酶(例如,碱性蛋白酶)在其它工业领域(例如皮革、 纺织、有机合成、以及废水处理)中也具有广泛的应用((Kalisz,Adv. Biochem.Eng.Biotechnol.,36:1-65[1988])和(Kumar和Takagi,Biotechnol. Adv.,17:561-594[1999]))。

随着对这些工业酶的高要求,具有新颖特性的碱性蛋白酶持续成为研 究兴趣的重点,从而导致了具有改良的催化效率和对温度、氧化剂及变化 的使用条件具有更佳稳定性的新蛋白酶制剂。然而,酶生产和下游加工的 总成本仍然是酶工业中任何技术成功应用所面临的主要障碍。为了解决这 个问题,研究人员和工艺工程师采用了几种方法,相对于碱性蛋白酶的工 业需求,增加碱性蛋白酶的产量。

尽管采用了多种方法(包括筛选高产菌种、克隆和过表达蛋白酶、改进 补料分批发酵和恒化器发酵、以及优化发酵技术)来增加蛋白酶的产量,但 仍然需要额外的手段来提高蛋白酶的生产。

发明概述

本发明提供经修饰的多核苷酸,其编码经修饰的蛋白酶;本发明还提 供用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核苷酸 包含一个或多个突变,编码前原(pre-pro)区域具有修饰的经修饰的蛋白酶, 所述前原区域的修饰增强该活性酶的生产。本发明还涉及用于改变蛋白酶 在微生物(例如芽孢杆菌属物种)中的生产的方法。

在一个实施方案中,本发明提供了编码经修饰的全长蛋白酶的分离的 修饰多核苷酸,其中该分离的经修饰的多核苷酸包含编码该全长蛋白酶的 前原区域的第一多核苷酸,该第一多核苷酸有效地连接到编码该全长蛋白 酶的成熟区域的第二多核苷酸上,其中第一多核苷酸编码SEQ ID NO:7的 前原区域,并进一步被突变而包含至少一个增强该蛋白酶在宿主细胞中的 生产的突变。优选地,宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽 孢杆菌(Bacillus subtilis)宿主细胞。在一些实施方案中,经修饰的全长蛋白 酶为丝氨酸蛋白酶,其源自野生型的或变体的亲本丝氨酸蛋白酶,例如枯 草芽孢杆菌(Bacillus subtilis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、 短小芽孢杆菌(Bacillus pumilis)或地衣芽孢杆菌(Bacillus licheniformis)的 丝氨酸蛋白酶。

在另一个实施方案中,本发明提供了分离的、经修饰的多核苷酸,所 述多核苷酸编码经修饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸 包括第一多核苷酸,所述第一多核苷酸编码该全长蛋白酶的前原区域,并 有效地连接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区 域,其中第一多核苷酸编码SEQ ID NO:7的前原区域,并进一步被突变以 包含至少一个增强宿主细胞的蛋白酶生产的突变,第二多核苷酸编码与 SEQ ID NO:9的成熟蛋白酶至少约65%相同的蛋白酶。优选地,第二多核 苷酸编码SEQ ID NO:9的成熟蛋白酶。在一些实施方案中,经修饰的全长 蛋白酶为丝氨酸蛋白酶,其源自野生型的或变体的亲本丝氨酸蛋白酶,例 如枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨 酸蛋白酶。优选地,宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢 杆菌宿主细胞。

本发明也提供了分离的、经修饰的多核苷酸,所述多核苷酸编码经修 饰的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸, 所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核 苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸 编码SEQ ID NO:7的前原区域,并进一步被突变以包含至少一个增强宿主 细胞的蛋白酶生产的突变。在一些实施方案中,第一多核苷酸的至少一个 突变编码在选自位置2,3,6,7,8,10,11,12,13,14,15,16,17,19,20,21,22, 23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,45,46,47,48, 49,50,51,52,53,54,55,57,58,59,61,62,63,64,66,67,68,69,70,72,74, 75,76,77,78,80,82,83,84,87,88,89,90,91,93,96,100和102的一个或多 个位置的至少一个氨基酸取代,其中的位置通过与SEQ ID NO:7所示FNA 蛋白酶的前原多肽的氨基酸序列对应而进行编号。在其它实施方案中,该 至少一个突变编码至少一个取代,选自:X2F,N,P和Y;X3A,M,P和R; X6K和M;X7E;I8W;X10A,C,G,M和T;X11A,F和T;X12C,P,T; X13C,G和S;X14F;X15G,M,T和V;X16V;X17S;X19P和S;X20V; X21S;X22E;X23F,Q和W;X24G,T和V;X25A,D和W;X26C和H; X27A,F,H,P,T,V和Y;X28V;X29E,I,R,S和T;X30C;X31H,K,N,S, V和W;X32C,F,M,N,P,S和V;X33E,F,M,P和S;X34D,H,P和V; X35C,Q和S;X36C,D,L,N,S,W和Y;X37C,G,K和Q;X38F,Q,S和 W;X39A,C,G,I,L,M,P,S,T和V;X45G和S;X46S;X47E和F;X48G,I, T,W和Y;X49A,C,E和I;X50D和Y;X51A和H;X52A,H,I和M;X53D, E,M,Q和T;X54F,G,H,I和S;X55D;X57E,N和R;X58A,C,E,F,G,K, R,S,T,W;X59E;X61A,F,I和R;X62A,F,G,H,N,S,T和V;X63A,C,E, F,G,N,Q,R和T;G64D,M,Q和S;X66E;X67G和L;X68C,D和R; X69Y;X70E,G,K,L,M,P,S和V;X72D和N;X74C和Y;X75G;X76V; X77E,V和Y;X78M,Q和V;X80D,L和N;X82C,D,P,Q,S和T;X83G 和N;X84M;X87R;X88A,D,G,T和V;X89V;X90D和Q;X91A;X92E 和S;X93G,N和S;X96G,N和T;X100Q;以及X102T,其中的位置通过 与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编 号。在其它一些实施方案中,该至少一个突变编码至少一个取代,选自: R2F,N,P和Y;S3A,M,P和R;L6K和M;W7E;I8W;L10A,C,G,M和 T;L11A,F和T;F12C,P,T;A13C,G和S;L14F;A15G,M,T和V;L16V; I17S;T19P和S;M20V;A21S;F22E;G23F,Q和W;S24G,T和V;T25A, D和W;S26C和H;S27A,F,H,P,T,V和Y;A28V;Q29E,I,R,S和T; A30C;A31H,K,N,S,V和W;G32C,F,M,N,P,S和T;K33E,F,M,P和 S;S34D,H,P和V;N35C,Q和S;G36C,D,L,N,S,W和Y;E37C,G,K 和Q;K38F,Q,S和W;K39A,C,G,I,L,M,P,S,T和V;K45G和S;Q46S; T47E和F;M48G,I,T,W和Y;S49A,C,E和I;T50D和Y;M51A和H; S52A,H,I和M;A53D,E,M,Q和T;A54F,G,H,I和S;K55D;K57E,N 和R;D58A,C,E,F,G,K,R,S,T,W;V59E;S61A,F,I和R;E62A,F,G, H,N,S,T和V;K63A,C,E,F,G,N,Q,R和T;64D,M,Q和S;K66E; V67G和L;Q68C,D和R;K69Y;Q70E,G,K,L,M,P,S和V;K72D和 N;V74C和Y;D75G;A76V;A77E,V和Y;S78M,Q和V;T80D,L和N; N82C,D,P,Q,S和T;E83G和N;K84M;K87R;E88A,D,G,T和V;L89V; K90D和Q;K91A;D92E和S;P93G,N和S;A96G,N和T;E100Q;以及 H102T,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的 氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞,例如 枯草芽孢杆菌(Bacillus subtilis)宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋 白酶,其源自野生型的或变体的亲本丝氨酸蛋白酶。在一些实施方案中, 野生型的或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、 短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二 多核苷酸编码与SEQ ID NO:9的蛋白酶至少约65%相同的蛋白酶。优选 地,第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少一个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码突变组合, 所述突变组合编码选自以下的取代组合:X49A-X24T,X49A-X72D, X49A-X78M,X49A-X78V,X49A-X93S,X49C-X24T,X49C-X72D, X49C-X78M,X49C-X78V,X49C-X91A,X49C-X93S,X91A-x24T, X91A-X49A,X91A-X52H,X91A-X72D,X91A-X78M,X91A-X78V, X93S-X24T,X93S-X49C,X93S-X52H,X93S-X72D,X93S-X78M和 X93S-X78V,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多 肽的氨基酸序列对应而进行编号。在其它实施方案中,至少一个突变为突 变组合,所述突变组合编码选自以下的取代组合:S49A-S24T,S49A-K72D, S49A-S78M,S49A-S78V,S49A-P93S,S49C-S24T,S49C-K72D, S49C-S78M,S49C-S78V,S49C-K91A,S49C-P93S,K91A-S24T, K91A-S49A,K91A-S52H,K91A-K72D,K91A-S78M,K91A-S78V, P93S-S24T,P93S-S49C,P93S-S52H,P93S-K72D,P93S-S78M  和 P93S-S78V,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多 肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物种宿主细胞, 例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶,其源 自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变体 的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或 地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多核苷酸编码与 SEQ ID NO:9的蛋白酶至少约65%相同的蛋白酶。优选地,第二多核苷酸 编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少一个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码选自以下的 至少一个缺失:p.X18_X19del,p.X22_23del,pX37del,pX49del,p.X47del, pX55del和p.X57del,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶 的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该至少一 个突变编码选自以下的至少一个缺失:p.I18_T19del,p.F22_G23del, p.E37del,p.T47del,p.S49del,p.K55del和p.K57del,其中的位置通过与 SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。 宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修 饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白 酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆 菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在 一些实施方案中,第二多核苷酸编码与SEQ ID NO:9的蛋白酶至少约65% 相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少一个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少一个突变编码选自以下的 至少一个插入:p.X2_X3insT,p.X30_X31insA,p.X19_X20insAT, p.X21_X22insS,p.X32_X33insG,p.X36_X37insG和p.X58_X59insA,其中 的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对 应而进行编号。在一些实施方案中,该至少一个突变编码选自以下的至少 一个插入:p.R2_S3insT,p.A30_A31insA,p.T19_M20insAT,p.A21_F22insS, p.G32_K33insG,p.G36_E37insG和p.D58_V59insA,其中的位置通过与 SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。 宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修 饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白 酶。在一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆 菌、解淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在 一些实施方案中,第二多核苷酸编码与SEQ ID NO:9的蛋白酶至少约65% 相同的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少2个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的 至少一个取代和至少一个缺失:X46H-p.X47del,X49A-p.X22_X23del, X49C-p.X22_X23del,X48I-p.X49del,X17W-p.X18_X19del, X78M-p.X22_X23del,X78V-p.X22_X23del,X78V-p.X57del, X91A-p.X22_X23del,X91A-X48I-pX49del,X91A-p.X57del, X93S-p.X22_X23del和X93S-X48I-p.X49del,其中的位置通过与SEQ ID  NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些 实施方案中,该至少一个取代和至少一个缺失选自:Q46H-p.T47del, S49A-p.F22_G23del,S49C-p.F22_G23del,M48I-p.S49del, I17W-p.I18_T19del,S78M-p.F22_G23del,S78V-p.F22_G23del, K91A-p.F22_G23del,K91A-M48I-pS49del,K91A-p.K57del, P93S-p.F22_G23del和P93S-M48I-p.S49del,其中的位置通过与SEQ ID  NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细 胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全 长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在 一些实施方案中,野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解 淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实 施方案中,第二多核苷酸编码与SEQ ID NO:9的蛋白酶至少约65%相同 的蛋白酶。优选地,第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少2个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的 至少一个取代和至少一个插入:X49A-p.X2_X3insT,X49A-p32X_X33insG, X49A-p.X19_X20insAT,X49C-p.X19_X20insAT,X49C-p.X32_X33insG, X52H--p.X19_X20insAT,X72D-p.X19_X20insAT,X78M-p.X19_X20insAT, X78V-p.X19_X20insAT,X91A-p.X19_X20insAT,X91A-p.X32_X33insG, X93S-p.X19_X20insAT和X93S-p.X32_X33insG,其中的位置通过与SEQ  ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一 些实施方案中,该至少一个取代和至少一个插入选自:S49A-p.R2 S3insT, S49A-p32G_K33insG,S49A-p.T19_M20insAT,S49C-p.T19_M20insAT, S49C-p.G32_K33insG,S49C-p.T19_M20insAT,S52H--p.T19_M20insAT, K72D-p.T19_M20insAT,S78M-p.T19_M20insAT,S78V-p.T19_M20insAT, K91A-p.T19_M20insAT,K91A-p.G32_K33insG,P93S-p.T19_M20insAT 和P93S-p.G32_K33insG,其中的位置通过与SEQ ID NO:7所示FNA蛋 白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆菌属物 种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸 蛋白酶,其源自野生型或变体的亲本丝氨酸蛋白酶。在一些实施方案中, 野生型或变体的亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短 小芽孢杆菌或地衣芽孢杆菌的丝氨酸蛋白酶。在一些实施方案中,第二多 核苷酸编码与SEQ ID NO:9的蛋白酶至少约65%相同的蛋白酶。优选地, 第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少2个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少2个突变编码选自以下的 至少一个缺失和至少一个插入:p.X57del-p.X19_X20insAT和 p.X22_X23del-p.X2_X3insT,其中的位置通过与SEQ ID NO:7所示FNA 蛋白酶的前原多肽的氨基酸序列对应而进行编号。在一些实施方案中,该 至少一个缺失和至少一个插入选自:pK57del-p.T19_M20insAT和 p.F22_G23del-p.R2_S3insT。优选地,第一多核苷酸编码SEQ ID NO:7的 前原区域,并被突变以包含至少2个增强宿主细胞的蛋白酶生产的突变。 宿主细胞为芽孢杆菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修 饰的全长蛋白酶为丝氨酸蛋白酶,其源自野生型或变体亲本丝氨酸蛋白酶。 在一些实施方案中,野生型或变体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解 淀粉芽孢杆菌、短小芽孢杆菌或地衣芽孢杆菌丝氨酸蛋白酶。在一些实施 方案中,第二多核苷酸编码与SEQ ID NO:9的蛋白酶至少约65%相同的 蛋白酶。优选地,第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

本发明也提供分离的、经修饰的多核苷酸,所述多核苷酸编码经修饰 的全长蛋白酶,其中该分离的、经修饰的多核苷酸包括第一多核苷酸,所 述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连接到第二多核苷 酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中第一多核苷酸编 码SEQ ID NO:7的前原区域,并进一步被突变以包含至少3个增强宿主细 胞的蛋白酶生产的突变。第一多核苷酸的该至少3个突变编码相应于 p.X49del-p.X19_X20insAT-X48I的至少一个缺失、至少一个插入和至少一 个取代,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的 氨基酸序列对应而进行编号。在一些实施方案中,编码至少一个缺失、至 少一个插入和至少一个取代的至少3个突变相应于 p.S49del-p.T19_M20insAT-M48I,其中的位置通过与SEQ ID NO:7所示 FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。宿主细胞为芽孢杆 菌属物种宿主细胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为 丝氨酸蛋白酶,其源自野生型或变体亲本丝氨酸蛋白酶。在一些实施方案 中,野生型或变体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、 短小芽孢杆菌或地衣芽孢杆菌丝氨酸蛋白酶。在一些实施方案中,第二多 核苷酸编码与SEQ ID NO:9的蛋白酶至少约65%相同的蛋白酶。优选地, 第二多核苷酸编码SEQ ID NO:9的成熟蛋白酶。

在另一个实施方案中,本发明提供了由以上所描述的任一经修饰的全 长多核苷酸编码的多肽。

在另一个实施方案中,本发明提供了表达载体,所述表达载体包含以 上所描述的任一分离的、经修饰的多核苷酸。在一些实施方案中,表达载 体还包含AprE启动子,例如SEQ ID NO:333或SEQ ID NO:445。

在另一个实施方案中,本发明提供了芽孢杆菌属物种宿主细胞,例如 枯草芽孢杆菌宿主细胞,所述宿主细胞包含本发明的表达载体,并能够表 达以上所提供的任一经修饰的多核苷酸。优选地,表达载体稳定地整合到 宿主的基因组中。在一些实施方案中,本发明的宿主细胞为芽孢杆菌属物 种宿主细胞。在一些实施方案中,芽孢杆菌属物种宿主细胞选自枯草芽孢 杆菌(B.subtilis)、地衣芽孢杆菌(B.licheniformis)、迟缓芽孢杆菌(B.lentus)、 短芽胞杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽 孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳氏芽 孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B. megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、 灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。在一些实施 方案中,芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。

在另一个实施方案中,本发明提供了用于在芽孢杆菌属物种宿主细胞 中生产成熟蛋白酶的方法,所述方法包括(a)提供包含编码经修饰的全长蛋 白酶的分离的、经修饰的多核苷酸的表达载体,其中所述多核苷酸包括第 一多核苷酸,所述第一多核苷酸编码全长蛋白酶的前原区域,并有效地连 接到第二多核苷酸,所述第二多核苷酸编码全长蛋白酶的成熟区域,其中 第一多核苷酸编码SEQ ID NO:7的前原区域,并进一步被突变以包含至少 一个增强宿主细胞的成熟蛋白酶生产的突变,其中该至少一个突变选自: X2F,N,P和Y;X3A,M,P和R;X6K和M;X7E;I8W;X10A,C,G,M和 T;X11A,F和T;X12C,P,T;X13C,G和S;X14F;X15G,M,T和V;X16V; X17S;X19P和S;X20V;X21S;X22E;X23F,Q和W;X24G,T和V;X25A, D和W;X26C和H;X27A,F,H,P,T,V和Y;X28V;X29E,I,R,S和T; X30C;X31H,K,N,S,V和W;X32C,F,M,N,P,S和V;X33E,F,M,P和 S;X34D,H,P和V;X35C,Q和S;X36C,D,L,N,S,W和Y;X37C,G,K 和Q;X38F,Q,S和W;X39A,C,G,I,L,M,P,S,T和V;X45G和S;X46S; X47E和F;X48G,I,T,W和Y;X49A,C,E和I;X50D和Y;X51A和H; X52A,H,I和M;X53D,E,M,Q和T;X54F,G,H,I和S;X55D;X57E,N 和R;X58A,C,E,F,G,K,R,S,T,W;X59E;X61A,F,I和R;X62A,F,G, H,N,S,T和V;X63A,C,E,F,G,N,Q,R和T;G64D,M,Q和S;X66E; X67G和L;X68C,D和R;X69Y;X70E,G,K,L,M,P,S和V;X72D和N; X74C和Y;X75G;X76V;X77E,V和Y;X78M,Q和V;X80D,L和N; X82C,D,P,Q,S和T;X83G和N;X84M;X87R;X88A,D,G,T和V;X89V; X90D和Q;X91A;X92E和S;X93G,N和S;X96G,N和T;X100Q;X102T; X49A-X24T,X49A-X72D,X49A-X78M,X49A-X78V,X49A-X93S, X49C-X24T,X49C-X72D,X49C-X78M,X49C-X78V,X49C-X91A, X49C-X93S,X91A-x24T,X91A-X49A,X91A-X52H,X91A-X72D, X91A-X78M,X91A-X78V,X93S-X24T,X93S-X49C,X93S-X52H, X93S-X72D,X93S-X78M,X93S-X78V,p.X18_X19del,p.X22_23del, pX37del,pX49del,p.X47del,pX55del,p.X57del,p.X2_X3insT, p.X30_X31insA,p.X19_X20insAT,p.X21_X22insS,p.X32_X33insG, p.X36_X37insG,p.X58_X59insA,X46H-p.X47del,X49A-p.X22_X23del, X49C-p.X22_X23del,X48I-p.X49del,X17W-p.X18_X19del, X78M-p.X22_X23del,X78V-p.X22_X23del,X78V-p.X57del, X91A-p.X22_X23del,X91A-X48I-pX49del,X91A-p.X57del, X93S-p.X22_X23del,X93S-X48I-p.X49del,X49A-p.X2_X3insT, X49A-p32X_X33insG,X49A-p.X19_X20insAT,X49C-p.X19_X20insAT, X49C-p.X32_X33insG,X52H--p.X19_X20insAT,X72D-p.X19_X20insAT, X78M-p.X19_X20insAT,X78V-p.X19_X20insAT,X91A-p.X19_X20insAT, X91A-p.X32_X33insG,X93S-p.X19_X20insAT,X93S-p.X32_X33insG, p.X57del-p.X19_X20insAT,p.X22_X23del-p.X2_X3insT, p.X49del-p.X19_X20insAT-X48I,以及p.X49del-p.X19_X20insAT-X48I, 其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序 列对应而进行编号;(b)以表达载体转化宿主细胞;以及(c)在允许成熟蛋白 酶生产的合适条件下培养转化了的宿主细胞。在一些实施方案中,所述方 法还包括回收成熟蛋白酶。在一些实施方案中,蛋白酶为丝氨酸蛋白酶。 在一些实施方案中,芽孢杆菌属物种宿主细胞为枯草芽孢杆菌宿主细胞。 在一些实施方案中,经修饰的多核苷酸编码全长蛋白酶,所述全长蛋白酶 包含与SEQ ID NO:9至少约65%相同的成熟区域。优选地,第二多核苷 酸编码SEQ ID NO:9的成熟蛋白酶。宿主细胞为芽孢杆菌属物种宿主细 胞,例如枯草芽孢杆菌宿主细胞。经修饰的全长蛋白酶为丝氨酸蛋白酶, 其源自野生型或变体亲本丝氨酸蛋白酶。在一些实施方案中,野生型或变 体亲本丝氨酸蛋白酶为枯草芽孢杆菌、解淀粉芽孢杆菌、短小芽孢杆菌或 地衣芽孢杆菌丝氨酸蛋白酶。

在另一个实施方案中,本发明提供了用于在芽孢杆菌属物种宿主细胞 中生产成熟蛋白酶的方法,所述方法包括(a)提供表达载体,所述表达载体 包含SEQ ID NO:7所示的第一多核苷酸,此第一多核苷酸有效地连接到第 二多核苷酸,所述第二多核苷酸编码SEQ ID NO:9的前原区域,其中第 一多核苷酸被突变以编码至少一个增强细胞中该成熟蛋白酶生产的突变, 其中该至少一个突变选自:R2F,N,P和Y;S3A,M,P和R;L6K和M;W7E; I8W;L10A,C,G,M和T;L11A,F和T;F12C,P,T;A13C,G和S;L14F; A15G,M,T和V;L16V;I17S;T19P和S;M20V;A21S;F22E;G23F,Q和 W;S24G,T和V;T25A,D和W;S26C和H;S27A,F,H,P,T,V和Y; A28V;Q29E,I,R,S和T;A30C;A31H,K,N,S,V和W;G32C,F,M,N,P, S和T;K33E,F,M,P和S;S34D,H,P和V;N35C,Q和S;G36C,D,L,N, S,W和Y;E37C,G,K和Q;K38F,Q,S和W;K39A,C,G,I,L,M,P,S,T 和V;K45G和S;Q46S;T47E和F;M48G,I,T,W和Y;S49A,C,E和I; T50D和Y;M51A和H;S52A,H,I和M;A53D,E,M,Q和T;A54F,G,H, I和S;K55D;K57E,N和R;D58A,C,E,F,G,K,R,S,T,W;V59E;S61A, F,I和R;E62A,F,G,H,N,S,T和V;K63A,C,E,F,G,N,Q,R和T;64D, M,Q和S;K66E;V67G和L;Q68C,D和R;K69Y;Q70E,G,K,L,M,P,S 和V;K72D和N;V74C和Y;D75G;A76V;A77E,V和Y;S78M,Q和V; T80D,L和N;N82C,D,P,Q,S和T;E83G和N;K84M;K87R;E88A,D,G, T和V;L89V;K90D和Q;K91A;D92E和S;P93G,N和S;A96G,N和T; E100Q;H102T,S49A-S24T,S49A-K72D,S49A-S78M,S49A-S78V, S49A-P93S,S49C-S24T,S49C-K72D,S49C-S78M,S49C-S78V, S49C-K91A,S49C-P93S,K91A-S24T,K91A-S49A,K91A-S52H, K91A-K72D,K91A-S78M,K91A-S78V,P93S-S24T,P93S-S49C, P93S-S52H,P93S-K72D,P93S-S78M,P93S-S78V,p.I18_T19del, p.F22_G23del,p.E37del,p.T47del,p.S49del,p.K55del,p.K57del, p.R2_S3insT,p.A30_A31insA,p.T19_M20insAT,p.A21_F22insS, p.G32_K33insG,p.G36_E37insG,p.D58_V59insA,Q46H-p.T47del, S49A-p.F22_G23del,S49C-p.F22_G23del,M48I-p.S49del, I17W-p.I18_T19del,S78M-p.F22_G23del,S78V-p.F22_G23del, K91A-p.F22_G23del,K91A-M48I-pS49del,K91A-p.K57del, P93S-p.F22_G23del,P93S-M48I-p.S49del,S49A-p.R2_S3insT, S49A-p32G_K33insG,S49A-p.T19_M20insAT,S49C-p.T19_M20insAT, S49C-p.G32_K33insG,S49C-p.T19_M20insAT,S52H-p.T19_M20insAT, K72D-p.T19_M20insAT,S78M-p.T19_M20insAT,S78V-p.T19_M20insAT, K91A-p.T19_M20insAT,K91A-p.G32_K33insG,P93S-p.T19_M20insAT, P93S-p.G32_K33insG,pK57del-p.T19_M20insAT, p.F22_G23del-p.R2_S3insT,以及p.S49del-p.T19_M20insAT-M48I;(b)以 表达载体转化芽孢杆菌属物种宿主细胞;以及(c)在允许成熟蛋白酶生产的 合适条件下培养转化了的宿主细胞。在一些实施方案中,所述方法另外还 包括回收成熟蛋白酶。在一些实施方案中,蛋白酶为丝氨酸蛋白酶,并且 其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序 列对应而进行编号。在一些实施方案中,芽孢杆菌属物种宿主细胞为枯草 芽孢杆菌宿主细胞。在一些实施方案中,该至少一个突变增加该成熟蛋白 酶的生产。

附图简述

图1提供了SEQ ID NO:1的全长FNA蛋白酶的氨基酸序列。氨基酸 1-107(SEQ ID NO:7)和氨基酸108-382(SEQ ID NO:9)分别对应于 FNA(SEQ ID NO:1)的前原多肽和成熟部分。

图2显示了FNA的未经修饰的前原区域(SEQ ID NO:7)与来自各种芽 孢杆菌属物种的蛋白酶的未经修饰的前原区域的氨基酸序列比对。

图3显示了FNA的成熟区域(SEQ ID NO:9)与来自各种芽孢杆菌属物 种的蛋白酶的成熟区域的氨基酸序列比对。

图4显示了示意图,说明用于产生符合读框的缺失和插入的方法。文 库质量:33%没有插入或缺失;33%具有插入和33%具有缺失;没有移码 突变。

图5显示了质粒pAC-FNAare的示意图,所述质粒用于在枯草芽孢杆 菌(B.subtilis)中表达FNA蛋白酶。质粒的元件如下:pUB110=来自质粒 pUB110的DNA片段[McKenzie T.,Hoshino T.,Tanaka T.,Sueoka  N.(1986)pUB110的核苷酸序列:与复制及其调节相关的一些Salient特征. Plasmid 15:93-103],pBR322=来自质粒pBR322的DNA片段[Bolivar F, Rodriguez RL,Greene PJ,Betlach MC,Heyneker HL,Boyer HW.(1977). 新克隆载体的构建和表征.II.多用途克隆系统.Gene 2:95-113],pC194= 来自质粒pC194的DNA片段[Horinouchi S.,Weisblum B.(1982)pC194, 一种规定可诱导的氯霉素抗性的质粒,的核苷酸序列和功能图谱.J. Bacteriol 150:815-825]。

图6显示了用于在枯草芽孢杆菌中表达FNA蛋白酶的整合型载体 pJH-FNA(Ferrari等,J.Bacteriol.154:1513-1515[1983])的示意图。

图7显示了柱形图,描述了相对于相同成熟FNA从未经修饰的全长 FNA前体蛋白质(未经修饰的;SEQ ID NO:1)的加工生产,从经修饰的全长 FNA蛋白质加工的成熟FNA(SEQ ID NO:9)的百分比相对活性,其中经修 饰的全长FNA蛋白质具有包含氨基酸取代P93S和缺失p.F22_G23del的 突变了的前原多肽(克隆684)。

发明描述

本发明提供了经修饰的多核苷酸,其编码经修饰的蛋白酶;本发明还 提供了用于改变蛋白酶在微生物中的生产的方法。特别地,经修饰的多核 苷酸包含一个或多个突变,编码经修饰的蛋白酶,所述经修饰的蛋白酶具 有增强该活性酶生产的前原区域修饰。本发明还涉及用于改变在微生物(例 如芽孢杆菌属物种)中的蛋白酶生产的方法。

除非在本文中另有指明,本文所使用的所有技术和科学术语都具有本 发明所属领域的普通技术人员通常理解的含义(例如,Singleton和 Sainsbury,微生物学和分子生物学词典(Dictionary of Microbiology and  Molecular Biology),第二版,John Wiley and Sons,NY[1994];以及Hale 和Markham,Harper Collins生物学词典(The Harper Collins Dictionary of  Biology),Harper Perennial,NY[1991])。本文描述了优选的方法和材料, 但是与本文描述的方法和材料相似或等同的任何方法和材料都可用于本发 明的实施。因此,下文即将定义的术语通过说明书整体而进行更为充分的 描述。此外,如本文中使用的,除非上下文另有清楚指示,否则单数″a″, ″an″和″the″包括复数指代。数值范围包括界定该范围的数字。除非另有 指明,分别地,核酸是按照5′至3′的方向从左到右书写的;氨基酸序列是 按照氨基到羧基的方向从左到右书写的。应当理解,本发明并不限于所描 述的特定的方法、方案和试剂,这些方法、方案和试剂可以根据本领域技 术人员使用它们的背景而变化。

在整个说明书中给出的每一个最大数值界限均旨在包括每一个较小的 数值界限,如同在本文中明确书写了该较小的数值界限。在整个本说明书 中给出的每一个最小数值界限均包括每一个较大的数值界限,如同在本文 中明确书写了该较大的数值界限。在整个说明书中给出的每一个数值范围 均包括落入该较宽数值范围以内的每一个较窄的数值范围,如同在本文中 明确书写了所有该较窄的数值范围。

本文中(包括上文和下文中)所提到的所有专利、专利申请、文献和出 版物都通过引用明确并入本文。

此外,本文提供的标题并非是对本发明的各个方面或实施方案的限制, 本发明的各个方面或实施方案可以通过参照说明书整体而得出。因此,下 文即将定义的术语应通过参考说明书整体而更完整地定义。但是,为了便 于理解本发明,对多个术语定义如下。

定义

如本文中使用的,术语“分离的”和“纯化的”指核酸或氨基酸(或其它组 分)从至少一种天然与其相关的组分中分离出。

本文中术语“经修饰的多核苷酸”指已经经过改变而包含至少一个突变 以编码“经修饰的”蛋白质的多核苷酸序列。

如本文中使用的,术语“蛋白酶”和“蛋白水解活性”指显示出能够水解 肽或具有肽键的底物的能力的蛋白质或肽。已有很多公知的方法用于测定 蛋白质水解活性(Kalisz,″Microbial Proteinases″,于Fiechter(ed.), Advances in Biochemical Engineering/Biotechnology,[1988])。例如,可以 通过分析所产生的蛋白酶水解商业底物之能力的比较试验来确定蛋白水解 活性。可用于此类蛋白酶或蛋白水解活性分析中的示例性底物包括但不限 于:二甲基酪蛋白(Sigma C-9801)、牛胶原蛋白(Sigma C-9879)、牛弹性蛋 白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用这些底物进行 的比色测定法在是本领域公知的(见例如,WO 99/34011和美国专利号 6,376,450,它们都通过引用并入本文)。AAPF检验(见例如,Del Mar等, Anal.Biochem.,99:316-320[1979])也可用于确定成熟蛋白酶的产生。该检 验测量酶水解可溶性合成底物(琥珀酰丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对 硝基苯胺(sAAPF-pNA))时释放对硝基苯胺的速率。在分光光度计上于410 nm测量从水解反应产生黄色的速率,其与活性酶浓度成比例。特别地, 本文中术语“蛋白酶”指“丝氨酸蛋白酶”。

如本文中使用的,术语“枯草杆菌蛋白酶”和“丝氨酸蛋白酶”可互换使 用,指MEROPS-肽酶数据库中描述的S8丝氨酸蛋白酶家族的任何成员 (Rawlings等,MEROPS:the peptidase database,Nucleic Acids Res,34 Database issue,D270-272,2006,于网站merops.sanger.ac.uk/cgi-bin /merops.cgi?id=s08;action=.)。以下信息得自截止于2008年11月6日的 MEROPS-肽酶数据库“肽酶S8家族包含丝氨酸内肽酶和丝氨酸蛋白酶 及其同源物”(Biochem J,290:205-218,1993)。S8家族,也被称为枯草杆菌 蛋白酶家族,是第二大的丝氨酸肽酶家族,其可被分为2个亚家族,枯草 杆菌蛋白酶(S08.001)为S8A亚家族的典型例子,kexin(S08.070)为S8B 亚家族的典型例子。三肽基肽酶II(TPP-II;S08.090)以前被认为是第三亚 家族的典型例子,但已经被确定是错误分类。S8家族的成员在序列中具有 按Asp,His和Ser的顺序的催化三联体,该顺序与S1,S9和S10家族的不 同。在S8A亚家族中,活性位点残基时常位于基序Asp-Thr/Ser-Gly(其与 AA族(clan)中天冬氨酸内肽酶家族的序列基序类似),His-Gly-Thr-His和 Gly-Thr-Ser-Met-Ala-Xaa-Pro中。在S8B亚家族中,催化残基时常位于 基序Asp-Asp-Gly,His-Gly-Thr-Arg和Gly-Thr-Ser-Ala/Val-Ala/Ser-Pro 中。S8家族的大多数成员是内肽酶,其在中性-弱碱性pH值条件下具有活 性。该家族中许多肽酶是热稳定的。酪蛋白常被用作蛋白质底物,典型的 合成底物为suc-AAPF。该家族的大多数成员为非特异性肽酶,其偏好在 疏水残基后进行切割。然而,S8B亚家族的成员,例如kexin(S08.070)和 furin(S08.071),在双碱性氨基酸后进行切割。S8家族的大多数成员受一般 丝氨酸肽酶抑制剂(例如DFP和PMSF)的抑制。因为该家族的许多成员和 钙结合以保持稳定性,故以EDTA和EGTA可以看到抑制,EDTA和EGTA 常被认为是金属肽酶的特异性抑制剂。蛋白抑制剂包括火鸡卵类粘蛋白第 三结构域(I01.003),链霉菌属(Streptomyces)枯草杆菌蛋白酶抑制剂 (I16.003),I13家族的成员例如eglin C(I13.001)和大麦抑制剂 CI-1A(I13.005),其中的许多抑制剂也抑制胰凝乳蛋白酶(S01.001),枯草杆 菌蛋白酶前肽自身具有抑制性,来自酵母属的同源蛋白酶B抑制剂抑制 cerevisin(S08.052)。现已确定了S8家族几个成员的三级结构。典型的S8 蛋白结构由三层(7股β折叠夹在两层螺旋之间)组成。枯草杆菌蛋白酶 (S08.001)是SB族(SB)的典型结构。尽管结构不同,枯草杆菌蛋白酶和胰凝 乳蛋白酶(S01.001)的活性位点可以重叠,这说明该相似性是趋同进化而不 是趋异进化的结果。

本文中的术语“前体蛋白酶”和“亲本蛋白酶”指未经修饰的全长蛋白 酶,其包含全长野生型或变体亲本蛋白酶的前原区域和成熟区域。前体蛋 白酶可以源自天然存在的(即野生型)蛋白酶,或源自变体蛋白酶。野生型 或变体前体蛋白酶的前原区域被修饰,以产生经修饰的蛋白酶。在本文上 下文中,“经修饰的”和“前体”蛋白酶都是包含信号肽、原(pro)区域和成熟 区域的全长蛋白酶。编码经修饰的序列的多核苷酸被称为“经修饰的多核苷 酸”,编码前体蛋白酶的多核苷酸被称为“前体多核苷酸”。“前体多肽”和“前 体多核苷酸”可分别与称谓“未经修饰的前体多肽”或“未经修饰的前体多核 苷酸”互换。

本文中“天然存在的”或“野生型”指蛋白酶或编码所述蛋白酶的多核苷 酸,其中所述蛋白酶具有与天然存在的氨基酸序列相同的未经修饰的氨基 酸序列。天然存在的酶包括天然酶,即在特定微生物中天然表达或存在的 那些酶。野生型序列或天然存在的序列是变体所源自的序列。野生型序列 可编码同源或异源蛋白质。

如本文中使用的,“变体”指通过在C-末端和N-末端中任一或两者添 加一个或多个氨基酸、在氨基酸序列的一个或多个不同位点取代一个或多 个氨基酸、在蛋白质的任一末端或两个末端或在氨基酸序列中的一个或多 个位点缺失一个或多个氨基酸、和/或在氨基酸序列中的一个或多个位点插 入一个或多个氨基酸,而与其相应野生型蛋白质不同的蛋白质。在本发明 上下文中,通过解淀粉芽孢杆菌(B.amyloliquefaciens)蛋白酶FNA(SEQ ID  NO:9)来示例变体蛋白质,它是天然存在的蛋白质BPN’的变体,其与BPN’ 的不同在于在成熟区域的单个氨基酸取代Y217L。变体蛋白酶包括天然存 在的同源物。例如,SEQ ID NO:9的成熟蛋白酶的变体包括图3所示的同 源物。

术语“源自”和“得自”不仅指由所述及生物的菌株产生的或可产生的蛋 白酶,也指由分离自该菌株的DNA序列编码并在含有该DNA序列的宿主 生物中生产的蛋白酶。此外,该术语还指由合成的和/或cDNA来源的DNA 序列编码并具有所述及蛋白酶的标识特征的蛋白酶。作为例示,“来自芽孢 杆菌的蛋白酶”指由芽孢杆菌天然产生的具有蛋白水解活性的那些酶,也指 丝氨酸蛋白酶,如由芽孢杆菌源产生的、通过使用遗传工程技术而从转化 了编码所述丝氨酸蛋白酶的核酸的非芽孢杆菌生物产生的那些丝氨酸蛋白 酶。

“经修饰的全长蛋白酶”或“经修饰的蛋白酶”可互换使用,指包含源自 亲本蛋白酶的成熟区域和前原区域的全长蛋白酶,其中前原区域被突变以 包含至少一个突变。在一些实施方案中,前原区域和成熟区域源自相同的 亲本蛋白酶。在其它实施方案中,前原区域和成熟区域源自不同的亲本蛋 白酶。经修饰的蛋白酶包含经修饰以包含至少一个突变的前原区域,它由 经修饰的多核苷酸编码。经修饰的蛋白酶的氨基酸序列可以被认为是通过 在前体氨基酸序列的前原区域中进行一个或多个氨基酸的取代、缺失或插 入而自所述前体蛋白酶氨基酸序列“产生的”。在一些实施方案中,前体蛋 白酶的前原区域的一个或多个氨基酸被取代,以产生经修饰的全长蛋白酶。 该修饰是对编码“前体”或“亲本”蛋白酶的氨基酸序列的“前体”或“亲 本”DNA序列的修饰,而非对前体蛋白酶本身进行的操作。

本文中使用的术语“增强”是指突变对成熟蛋白酶的生产的影响,其中 来自经修饰的前体的成熟蛋白酶的产量大于相同的成熟蛋白酶自未经修饰 的前体加工时的产量。

术语“全长蛋白质”在本文中指基因的初级基因产物,其包含信号肽、 原序列和成熟序列。例如,SEQ ID NO:1的全长蛋白酶包含信号肽(前区 (pre region))(VRSKKLWISL LFALALIFTM AFGSTSSAQA;SEQ ID  NO:3,由例如SEQ ID NO:4的前(pre)多核苷酸编码),原区(pro region) (AGKSNGEKKY IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ  FKYVDAASAT LNEKAVKELK KDPSVAYVEE DHVAHAY;SEQ ID  NO:5,由例如前多核苷酸 GCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACGATGA GCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGCGGGAAAGTGCAAAAGCAATTCAAATAT GTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGAATTGAAAAAAGACCCGAGCGT CGCTTACGTTGAAGAAGATCACGTAGCACACGCGTAC:SEQ ID NO:6编码), 和成熟区域(SEQ ID NO:9)。

术语“信号序列”、“信号肽”或“前区”指可参与蛋白质的成熟或前体形 式分泌的任何核苷酸和/或氨基酸序列。信号序列的该定义是功能性定义, 其意欲包括由蛋白质基因N-末端部分编码的、参与实现蛋白质分泌的所有 那些氨基酸序列。例如,本发明的蛋白酶的前肽可以至少包括与SEQ ID  NO:1的1-30位残基相同的氨基酸序列。

术语“原序列”或“原区”是信号序列和成熟蛋白酶之间的氨基酸序列, 其对于蛋白酶的分泌/生产来说是必要的。将原序列切割掉将产生成熟活性 蛋白酶。例如,本发明的蛋白酶的原区可以至少包括与SEQ ID NO:1的 31-107位残基相同的氨基酸序列。

术语“前原区域”或“前原多肽”在本文中指蛋白酶的N-末端区域,其包 括全长蛋白酶的前区和原区。例如,一个前原区域如SEQ ID NO:7所示, 其包括SEQ ID NO:5的原区和SEQ ID NO:3的信号肽(前区)。

术语“成熟形式”或“成熟区域”指蛋白质的最终功能性部分。例如,本 发明的蛋白酶的成熟形式可以包括与SEQ ID NO:1的108-382位残基相 同的氨基酸序列。在本上下文中,“成熟形式”“加工自”全长蛋白酶,其中 对全长蛋白酶的加工包括除去信号肽和除去原区。

如本文中使用的,“同源蛋白”指细胞中天然的或天然存在的蛋白质或 多肽。类似地,“同源多核苷酸”指细胞中天然的或天然存在的多核苷酸。

如本文中使用的,术语“异源蛋白”指不在宿主细胞中天然存在的蛋白 质或多肽。类似地,“异源多核苷酸”指不在宿主细胞中天然存在的多核苷 酸。异源多肽和/或异源多核苷酸包括嵌合多肽和/或多核苷酸。

如本文中使用的,“取代的”和“取代”指对亲本序列中的氨基酸残基或 核酸碱基的替换。在一些实施方案中,取代包括对天然存在的残基或碱基 的替换。在本文中,经修饰的蛋白酶涵盖在前体蛋白酶的前原区域的任何 一个氨基酸残基位上19种天然存在的氨基酸的任何一种的取代。在一些实 施方案中,对两个或更多个氨基酸进行取代,以产生包含氨基酸取代组合 的经修饰的蛋白酶。在一些实施方案中,取代的组合用发生取代的氨基酸 位置来表示。例如,以X49A-X93S表示的组合意思是:亲本蛋白质中第 49位无论是何种氨基酸(X)都用丙氨酸(A)取代,以及亲本蛋白质中第93 位无论是何种氨基酸(X)都用丝氨酸(S)取代。氨基酸的位置按对应于全长 亲本蛋白质中的编号位置给出。

如本文中使用的,“缺失”指遗传物质的丢失,其中部分DNA序列失 去。尽管可以缺失任何数量的核苷酸,但缺失的核苷酸数目不被3整除将 导致移码突变,造成缺失之后的所有密码子在翻译中被错误地阅读,从而 产生严重改变的和可能无功能的蛋白质。缺失可以在末端,即对染色体末 端发生的缺失;或者缺失可以是中间缺失,即从基因内部发生的缺失。在 本文中,缺失以被缺失的氨基酸(一个或多个)和该氨基酸(一个或多个) 的位置表示。例如,p.I18del表示第18位的异亮氨酸(I)被缺失; p.I18_T19del表示第18位的异亮氨酸(I)和第19位的苏氨酸(T)都被缺失。

可以单独地或与一个或多个取代和/或插入组合地,实施一个或多个氨 基酸的缺失。

如本文中使用的,“插入”指向DNA中添加数量为3的倍数的核苷酸, 以在编码的蛋白质中编码添加的一个或多个氨基酸。在本文中,插入以插 入的氨基酸(一个或多个)和该氨基酸(一个或多个)的位置表示。例如, pR2_S3insT表示在第2位精氨酸(R)和第3位丝氨酸(S)之间插入苏氨酸 (T)。可以单独地或与一个或多个取代和/或缺失组合地进行一个或多个氨 基酸的插入。

在提到蛋白酶时,术语“生产/产生”包括对全长蛋白酶的两个加工步 骤,包括:1.除去信号肤,这己知在蛋白质分泌期间发生,和2.除去原 区,这产生酶的活性成熟形式,并且已知在成熟过程中发生(Wang等, Biochemistry 37:3165-3171(1998);Power等,Proc Natl Acad Sci USA 83:3096-3100(1986))。

如本文中使用的,“与......对应”和“对应于”指,蛋白质或肽中位于所 编号位置上的残基与参考蛋白质或肽中的编号残基等价。

在提到成熟蛋白酶时,术语“经加工的”指全长蛋白质(例如蛋白酶)经 历以成为活性成熟酶的成熟过程。在本文中,术语“增强的生产”指从经修 饰的全长蛋白酶加工的成熟蛋白酶的生产水平高于同样的成熟蛋白酶从未 经修饰的全长蛋白酶加工时的生产水平。

当提到酶时,“活性”意指“催化活性”,其包括对酶活性的任何可接受 的度量,例如活性速率,活性量,或比活性。催化活性指催化特定化学反 应,例如水解特定化学键,的能力。如技术人员将理解的,酶的催化活性 只是加快没有酶存在时慢的化学反应的速率。因为酶仅充当催化剂,其本 身既不由反应产生,也不被反应消耗。技术人员也将理解,不是所有的多 肽都具有催化活性。“比活性”是每单位总蛋白或酶的酶活性的量度。因此, 比活性可以用酶的单位重量(例如,每克或每毫克)或单位体积(例如,每毫 升)来表示。此外,例如在活性标准已知或可得以用于进行比较的情况下, 比活性可以包括对酶纯度的度量,或可以提供对纯度的指示。活性量反映 了由表达所测定酶的宿主细胞产生的酶量。

术语“相对活性”或“产量比”在本文中可互换使用,其指从经修饰的蛋 白酶加工得到的成熟蛋白酶的酶活性与从未经修饰的蛋白酶加工得到的成 熟蛋白酶的酶活性的比率。产量比通过用从经修饰的前体加工得到的蛋白 酶的活性值除以从未经修饰的前体加工得到的同样蛋白酶的活性值来确 定。相对活性是以百分比表示的产量比。

如本文中使用的,术语“表达”指基于基因的核酸序列产生多肽的过程。 此过程包括转录和翻译。

当用来指蛋白质时,术语“嵌合”或“融合”在本文中指通过连接两个或 更多个原先编码分开的蛋白质的多核苷酸而产生的蛋白质。该融合多核苷 酸的翻译导致单个嵌合多肽,其具有源自于每个原先蛋白质的功能特性。 重组融合蛋白质通过重组DNA技术来人工产生。“嵌合多肽”或“嵌合体” 意指包含源自一个以上多肽的序列的蛋白质。经修饰的蛋白酶在如下意义 上可以是嵌合的,即,其包含源自一个蛋白酶的部分、区域或结构域,其 中该部分、区域或结构域融合到源自一个或多个其它蛋白酶的一个或多个 部分、区域或结构域上。例如,嵌合蛋白酶可以包含一个成熟蛋白酶的序 列,其中该序列与另一个蛋白酶的前原肽的序列连接。技术人员将理解的 是,嵌合多肽和蛋白酶不必由蛋白质序列的实际融合构成,而是,具有相 应编码序列的多核苷酸也可以用来表达嵌合多肽或蛋白酶。

术语“百分比(%)同一性”定义为候选序列中与前体序列(即,亲本序列) 的氨基酸/核苷酸残基相同的氨基酸/核苷酸残基的百分比。%氨基酸序列同 一性数值通过用匹配的相同残基的数目除以比对区域中“较长”序列的残基 的总数来确定。当相对于参考序列,目标序列中氨基酸被取代、缺失或插 入时,氨基酸序列可以是相似的而不是“相同的”。对于蛋白质,百分比序 列同一性优选在就翻译后修饰而言状态相似的序列之间进行测定。典型地, 将目标蛋白酶的“成熟序列”(即,加工以除去信号序列和原区后剩下的序列) 和参考蛋白质的成熟序列进行比较。在其它情况下,可以将目标多肽序列 的前体序列和参考序列的前体进行比较。

如本文中使用的,术语“启动子”指具有指导下游基因转录的作用的核 酸序列。在一些实施方案中,启动子适合于其中将要表达靶基因的宿主细 胞。启动子,与其它转录和翻译调控核酸序列(也称为“控制序列”)一起, 是表达给定基因所必需的。通常,转录和翻译调控序列包括但不限于启动 子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列、 以及增强子或激活物序列。

当核酸或多肽被置于与另一核酸或多肽序列发生功能性关系的位置 时,其为“有效连接的”。例如,当启动子或增强子影响编码序列的转录时, 启动子或增强子与编码序列是有效连接的;当核糖体结合位点被放置在促 进翻译的位置上时,它是与编码序列有效连接的;或者,当经修饰的前原 区域能够使全长蛋白酶加工以产生酶的成熟活性形式时,它是与蛋白酶的 成熟区域有效连接的。通常,“有效连接”意指连接的DNA或多肽序列是 毗邻的。

“宿主细胞”指可作为包含本发明DNA的表达载体的宿主的合适细胞。 合适的宿主细胞可以是天然存在的或野生型宿主细胞,或者其可以是经改 造了的宿主细胞。在一个实施方案中,宿主细胞是革兰氏阳性微生物。在 一些实施方案中,该术语指芽胞杆菌属细胞。

如本文中使用的,“芽孢杆菌属物种”包括本领域技术人员已知的“芽孢 杆菌”属中的所有种,其包括但不限于枯草芽孢杆菌(B.subtilis)、地衣芽孢 杆菌(B.licheniformis)、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、 短小芽胞杆菌(B.pumilis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜 碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌(B.amyloliquefaciens)、克劳 氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B. megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、 灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应当认识到, 芽孢杆菌属继续经历分类学重组织。因此,该属旨在包括已经被重新分类 的物种,包括但不限于生物例如嗜热脂肪芽孢杆菌(其现在被称为 “Geobacillus stearothermophilus”)。在氧存在时产生抗性内生孢子被认为 是芽孢杆菌属的定义特征,但该特征也适用于近来命名的脂环酸芽孢杆菌 属(Alicyclobacillus)、双芽孢杆菌属(Amphibacillus)、解硫胺素芽孢杆菌属 (Aneurinibacillus)、厌氧芽孢杆菌属(Anoxybacillus)、短小芽孢杆菌属 (Brevibacillus)、线芽孢杆菌属(Filobacillus)、薄壁芽孢杆菌属 (Gracilibacillus)、喜盐芽孢杆菌属(Halobacillus)、类芽孢杆菌属 (Paenibacillus)、盐芽孢杆菌属(Salibacillus)、嗜热芽孢杆菌属 (Thermobacillus)、解脲芽胞杆菌属(Ureibacillus)和枝芽孢杆菌属 (Virgibacillus)。

术语“多核苷酸”和“核酸”在本文中可互换使用,指任何长度的核苷酸 聚合形式。这些术语包括但不限于,单链DNA、双链DNA、基因组DNA、 cDNA或包含嘌呤和嘧啶碱基或其它天然的、经化学修饰的、经生化修饰 的、非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的非限制性例子包 括基因、基因片段、染色体片段、ESTs、外显子、内含子、mRNA、tRNA、 rRNA、核糖体、cDNA、重组多核苷酸、分支的多核苷酸、质粒、载体、 任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。

如本文中使用的,术语“DNA构建体”和“转化DNA”可互换使用,表 示用于将序列引入宿主细胞或生物中的DNA。DNA构建体可以通过PCR 或本领域技术人员已知的任何其它合适技术,在体外产生。在一些实施方 案中,DNA构建体包含目的序列(例如,经修饰的序列)。在一些实施方案 中,所述序列与另外的元件,例如控制元件(例如启动子等)有效连接。DNA 构建体可以进一步包含选择标记。在一些实施方案中,DNA构建体包含 与宿主细胞染色体同源的序列。在其它实施方案中,DNA构建体包含非同 源序列。一旦DNA构建体被体外装配,其可用于诱变宿主细胞染色体的 区域(即,用异源序列替换内源序列)。

如本文中使用的,术语“表达盒”指通过重组或合成产生的核酸构建体, 其具有允许特定核酸在靶细胞中转录的一系列指定的核酸元件。重组表达 盒可以被整合进载体,例如质粒、染色体、线粒体DNA、质体DNA、病 毒或核酸片段中。典型地,表达载体的重组表达盒部分包括例如待转录的 核酸序列和启动子。在一些实施方案中,表达载体具有将异源DNA片段 整合在宿主细胞中和表达的能力。许多原核和真核表达载体可以商业获取。 对合适表达载体的选择为本领域技术人员所知。在本文中,术语“表达盒” 与“DNA构建体”以及它们的语法等同表述可以互换使用。对合适表达载体 的选择为本领域技术人员所知。

如本文中使用的,术语“异源DNA序列”指不在宿主细胞中天然存在 的DNA序列。在一些实施方案中,异源DNA序列为嵌合的DNA序列, 其由不同基因的部分(包括调控序列)组成。

如本文中使用的,术语“载体”指设计来向一种或多种细胞类型中引入 核酸的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体和质粒。 在一些实施方案中,多核苷酸构建体包含编码全长蛋白酶(例如,经修饰的 蛋白酶或未经修饰的前体蛋白酶)的DNA序列。如本文中使用的,术语“质 粒”指用作克隆载体的环状双链(ds)DNA构建体,其在一些真核生物或原 核生物中形成染色体外自主复制遗传元件,或整合到宿主染色体中。

如本文中使用的,在向细胞中引入核酸序列的上下文中,术语“引入” 指适用于将核酸序列转入细胞的任何方法。用于引入的此类方法包括但不 限于原生质体融合、转染、转化、接合和转导(见例如,Ferrari等, “Genetics”,于Hardwood等(eds.),Bacillus,Plenum Publishing Corp.,页 57-72,[1989])。

如本文中使用的,术语“经转化的”和“稳定转化的”指具有非天然(异源) 多核苷酸序列的细胞,所述非天然(异源)多核苷酸序列整合进了所述细胞 的基因组中,或为保持至少两代的游离型质粒形式。

如本文中使用的,术语“表达”指基于基因的核酸序列产生多肽的过程。 该过程包括转录和翻译。

经修饰的蛋白酶

本发明提供了用于在细菌宿主细胞中生产成熟蛋白酶的方法和组合 物。特别地,本发明提供了用于增强细菌细胞中成熟丝氨酸蛋白酶生产的 组合物和方法。本发明的组合物包括:编码经修饰的蛋白酶(其在前原区域 具有至少一个突变)的经修饰的多核苷酸,由经修饰的多核苷酸编码的经修 饰的丝氨酸蛋白酶,包含编码经修饰的丝氨酸蛋白酶的经修饰的多核苷酸 的表达盒、DNA构建体、载体,以及转化了本发明载体的细菌宿主细胞。 本发明的方法包括用于增强细菌宿主细胞中成熟蛋白酶生产的方法。所产 生的蛋白酶可以用于工业生产酶,适用于各种工业,包括但不限于清洁、 动物饲料和纺织品加工工业。

在一些实施方案中,本发明提供了编码经修饰的全长蛋白酶的经修饰 的全长多核苷酸,其通过在源自编码动物、植物或微生物来源的野生型或 变体全长前体蛋白酶的多核苷酸的前原多核苷酸中,引入至少一个突变而 产生。在一些实施方案中,前体蛋白酶是细菌来源的。在一些实施方案中, 前体蛋白酶为包含催化活性氨基酸的枯草杆菌蛋白酶类型的蛋白酶 (subtilases,subtilopeptidases,EC 3.4.21.62),也被称为丝氨酸蛋白酶。在一 些实施方案中,前体蛋白酶为芽孢杆菌属物种的蛋白酶。优选地,前体蛋 白酶为源自枯草芽孢杆菌、解淀粉芽孢杆菌、地衣芽孢杆菌和短小芽孢杆 菌的丝氨酸蛋白酶。

前体蛋白酶的例子包括枯草杆菌蛋白酶BPN′(SEQ ID NO:67),其源 自解淀粉芽孢杆菌,已知于Vasantha等(1984),J.Bacteriol.,Volume 159, pp.811-819,和J.A.Wells等(1983),Nucleic Acids Research,Volume 11, pp.7911-7925;枯草杆菌蛋白酶Carlsberg,描述于E.L.Smith等(1968),J. Biol.Chem.,Volume 243,pp.2184-2191,和Jacobs等(1985),Nucl.Acids  Res.,Volume 13,pp.8913-8926,其由地衣芽孢杆菌天然形成;蛋白酶 PB92,其由嗜碱芽孢杆菌Bacillus nov.spec.92天然产生;以及AprE,其 由枯草芽孢杆菌天然产生。在一些实施方案中,前体蛋白酶为FNA(SEQ ID  NO:1),它是天然存在的BPN’的变体,其因在成熟区域的第217位具有单 个氨基酸的取代而不同于BPN’,其中BPN’的第217位的Tyr(Y)被替换为 Leu(L),即FNA的成熟区域的第217位氨基酸为L(SEQ ID NO:9)。在一 些实施方案中,前体蛋白酶包含和SEQ ID NO:7至少约30%相同的前原 区域(VRSKKLWISL LFALALIFTM AFGSTSSAQA AGKSNGEKKY  IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ FKYVDAASAT  LNEKAVKELK KDPSVAYVEE DHVAHAY;SEQ ID NO:7),所述前原区 域与SEQ ID NO:9的成熟区域有效连接 (AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETNPFQDNNSHGT HVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAA LKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMA PGVSIQSTLPGNKYGALNGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLI NVQAAAQ;SEQ ID NO:9).

在其它实施方案中,前体蛋白酶包含和SEQ ID NO:7至少约30%相 同的前原区域,所述前原区域与和SEQ ID NO:9至少约65%相同的成熟 区域有效连接。在其它实施方案中,前体蛋白酶包含SEQ ID NO:7的前原 区域,所述前原区域和与SEQ ID NO:9至少约65%相同的成熟区域有效 连接。和SEQ ID NO:7的前原区域至少约30%相同的丝氨酸蛋白酶的前 原区域的例子包括SEQ ID NOS:11-66,其显示在图2中。和SEQ ID NO:9 至少约65%相同的成熟区域的例子包括SEQ ID NOS:67-122,其显示在图 3中。

多核苷酸序列共有的百分比同一性通过如下方式确定:利用本领域已 知的方法,比对序列以直接比较分子之间的序列信息,并确定同一性。适 用于确定序列相似性的一个算法例子是BLAST算法,其被描述于Altschul 等,J.Mol.Biol.,215:403-410(1990)中。用于进行BLAST分析的软件可以 通过美国国家生物技术信息中心(National Center for Biotechnology  Information)公开获取。该算法包括:首先通过在查询序列中鉴定出长度为 W的短字,所述短字与数据库序列中同样长度的字比对时匹配或满足一定 的正值阈值分数T,以鉴定高得分序列对(HSPs)。以这些初始相邻字命中 物作为起点,寻找含有它们的较长的HSPs。只要累积比对分数可以增加, 就让字命中物沿着被比较的两条序列之每条向两个方向延伸。当累积比对 分数从获得的最大值降低了数量X;累积分数趋于零或更低;或者到达了 任一序列的末端时,字命中物的延伸停止。BLAST算法参数W、T和X 决定了比对的灵敏性和速度。作为默认设置,BLAST程序采用字长(W) 为11、BLOSUM62打分矩阵(见Henikoff和Henikoff,Proc.Natl.Acad.Sci. USA 89:10915(1989))、比对(B)为50、期望值(E)为10、M′5、N′-4和两 链比较。

然后,BLAST算法进行两条序列间相似性的统计学分析(见例如, Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787[1993])。 BLAST算法提供的一种相似性量度是最小和概率(P(N)),这指示了两条核 苷酸或氨基酸序列间偶然发生匹配的概率。例如,如果在测试核酸与丝氨 酸蛋白酶核酸的比较中最小和概率小于约0.1,更优选小于约0.01,最优 选小于约0.001,则该核酸就被认为与本发明的丝氨酸蛋白酶核酸相似。当 测试核酸编码丝氨酸蛋白酶多肽时,如果比较产生了小于约0.5,更优选小 于约0.2的最小和概率,则认为所述测试核酸与指定的丝氨酸蛋白酶核酸 相似。

按照如下方式,使用BLAST程序,获得了各种丝氨酸蛋白酶的前原 区域(图2)和成熟区域(图3)的氨基酸序列与FNA的前原区域和成熟区域的 比对。使用FNA的前原区域或成熟蛋白质区域搜索NCBI非冗余蛋白质数 据库(2009年2月9日版)。使用命令行BLAST程序(2.2.17版),其中除了 -v 5000和-b 5000以外,采用默认参数。仅选择具有期望的最终百分比同 一性的序列。使用clustalw(1.83版)程序,采用默认参数进行比对。使用 MUSCLE(3.51版)程序,采用默认参数,对比对进行5次精化。在比对中, 仅选择对应于FNA的成熟区域或前原区域的区域。根据与FNA的百分比 同一性,按递减的顺序,将比对中的序列进行排序。百分比同一性通过用 所述及的两条序列间对齐的相同残基的数量除以在比对中比对的残基数量 来计算。

在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前 体多核苷酸包含与编码SEQ ID NO:9所示成熟区域的多核苷酸有效连接 的、编码前原区域的前原多核苷酸,其中该前原区域与SEQ ID NO:1(FNA) 的前体蛋白酶的前原区域(SEQ ID NO:7)的氨基酸序列具有至少约30%、 至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至 少约60%、至少约65%的氨基酸序列同一性,优选至少约70%的氨基酸 序列同一性、更优选至少约75%的氨基酸序列同一性、更优选至少约80% 的氨基酸序列同一性、更优选至少约85%的氨基酸序列同一性、甚至更优 选至少约90%的氨基酸序列同一性、更优选至少约92%的氨基酸序列同一 性、再更优选至少约95%的氨基酸序列同一性、更优选至少约97%的氨基 酸序列同一性、更优选至少约98%的氨基酸序列同一性、以及最优选至少 约99%的氨基酸序列同一性。优选地,经修饰的多核苷酸从前体多核苷酸 产生,所述前体多核苷酸包含与编码SEQ ID NO:9所示成熟区域的多核苷 酸有效连接的、编码SEQ ID NO:7的前原区域的前原多核苷酸。在其它实 施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前体多核苷酸编 码SEQ ID NOS:11-66之任一的前原区域,所述前原区域与编码SEQ ID  NO:9中所示的成熟区域的多核苷酸有效连接。编码SEQ ID NO:9的成熟 蛋白酶的多核苷酸的一个例子是SEQ ID NO:10的多核苷酸 (GCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACA CTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAG GTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACG GAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCC AAGCGCATCACTTTACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATC ATTAACGGAATCGAGTGGGCGATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGAC CTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTT GCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATAC CCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAG GACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATAC GGCGCGTTGAACGGTACATCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTT CTAAGCACCCGAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTT GGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAA;SEQ ID  NO:10).

如以上所描述,前原区域多核苷酸被进一步修饰以在所编码的多肽的 前原区域中引入至少一个突变,以使得该蛋白酶的成熟形式的生产水平, 与从未经修饰的多核苷酸加工时相同成熟蛋白酶的生产水平相比较,得到 增强。经修饰的前原多核苷酸与成熟多核苷酸有效连接,以编码本发明的 经修饰的蛋白酶。

在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前 体多核苷酸包含与编码蛋白酶的成熟区域的多核苷酸有效连接的、编码前 原区域的前原多核苷酸,其中所述前原区域与SEQ ID NO:1的前体蛋白酶 的前原区域(SEQ ID NO:7)的氨基酸序列具有至少约30%、至少约35%、 至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至 少约65%的氨基酸序列同一性,优选至少约70%的氨基酸序列同一性、 更优选至少约75%的氨基酸序列同一性、更优选至少约80%的氨基酸序 列同一性、更优选至少约85%的氨基酸序列同一性、更优选至少约90%的 氨基酸序列同一性、更优选至少约92%的氨基酸序列同一性、更优选至少 约95%的氨基酸序列同一性、更优选至少约97%的氨基酸序列同一性、更 优选至少约98%的氨基酸序列同一性、以及最优选至少约99%的氨基酸序 列同一性,其中所述成熟区域和SEQ ID NO:1的前体蛋白酶的成熟区域 (SEQ ID NO:9)的氨基酸序列具有至少约65%的氨基酸序列同一性,优选 至少约70%的氨基酸序列同一性、更优选至少约75%的氨基酸序列同一 性、更优选至少约80%的氨基酸序列同一性、更优选至少约85%的氨基酸 序列同一性、更优选至少约90%的氨基酸序列同一性、更优选至少约92% 的氨基酸序列同一性、更优选至少约95%的氨基酸序列同一性、更优选至 少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸序列同一性、 以及最优选至少约99%的氨基酸序列同一性。

在一些实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前 体多核苷酸编码与蛋白酶的成熟区域有效连接的SEQ ID NO:1的蛋白酶 的前原区域(SEQ ID NO:7),其中所述成熟区域和SEQ ID NO:1的前体蛋 白酶的成熟形式(SEQ ID NO:9)的氨基酸序列具有至少约65%的氨基酸序 列同一性,优选至少约70%的氨基酸序列同一性、更优选至少约75%的 氨基酸序列同一性、更优选至少约80%的氨基酸序列同一性、更优选至少 约85%的氨基酸序列同一性、更优选至少90%的氨基酸序列同一性、更优 选至少约92%的氨基酸序列同一性、更优选至少约95%的氨基酸序列同一 性、更优选至少约97%的氨基酸序列同一性、更优选至少约98%的氨基酸 序列同一性、以及最优选至少约99%的氨基酸序列同一性。

在其它实施方案中,经修饰的多核苷酸从前体多核苷酸产生,所述前 体多核苷酸编码SEQ ID NO:1的蛋白酶的前原区域(SEQ ID NO:7),所述 前原区域与SEQ ID NO:1的蛋白酶的成熟区域(SEQ ID NO:9)有效连接, 即,前体多核苷酸编码SEQ ID NO:1的蛋白酶。如以上所描述,前原区域 多核苷酸被修饰以引入至少一个突变,该突变使该蛋白酶的成熟形式的生 产水平,与从未经修饰的多核苷酸加工时相同成熟蛋白酶的生产水平相比, 得到增强。

前体多核苷酸被突变以产生本发明的经修饰的多核苷酸。在一些实施 方案中,编码前原区域的前体多核苷酸序列的部分被突变,以在选自位置 1-107的至少一个氨基酸位置上编码至少一个突变,其中的位置通过与SEQ  ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。因 此,在一些实施方案中,本发明的经修饰的全长多核苷酸在选自位置1,2,3, 4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26, 27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47, 48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68, 69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,85,86,87,88, 89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106和 107的至少一个氨基酸位置上包含至少一个突变,其中的位置通过与SEQ  ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。

在其它实施方案中,经修饰的全长多核苷酸在氨基酸位置2,3,6,7,8, 10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,26,27,28,29,30,31, 32,33,34,35,36,37,38,39,45,46,47,48,49,50,51,52,53,54,55,57,58, 59,61,62,63,64,66,67,68,69,70,72,74,75,76,77,78,80,82,83,84,87, 88,89,90,91,93,96,100和102上包含至少一个突变,其中的位置通过与 SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,该至少一个突变为取代,选自以下取代:

X2F,N,P,和Y;X3A,M,P,和R;X6K,和M;X7E;18W;X10A,C,G,M,和T; X11A,F,和T;X12C,P,T;X13C,G,和S;X14F;X15G,M,T,和V;X16V;X17S;X19P,和S; X20V;X21S;X22E;X23F,Q,和W;X24G,T和V;X25A,D,和W;X26C,和H;X27A,F,H,P, T,V,和Y;X28V;X29E,I,R,S,和T;X30C;X31H,K,N,S,V,和W;X32C,F,M,N,P,S,和V; X33E,F,M,P,和S;X34D,H,P,和V;X35C,Q,和S;X36C,D,L,N,S,W,和Y;X37C,G,K, 和Q;X38F,Q,S,和W;X39A,C,G,I,L,M,P,S,T,和V;X45G和S;X46S;X47E和F; X48G,I,T,W,和Y;X49A,C,E和I;X50D,和Y;X51A和H;X52A,H,I,和M;X53D,E,M,Q, 和T;X54F,G,H,I,和S;X55D;X57E,N,和R;X58A,C,E,F,G,K,R,S,T,W;X59E;X61A,F, I,和R;X62A,F,G,H,N,S,T和V;X63A,C,E,F,G,N,Q,R,和T;G64D,M,Q,和S;X66E; X67G和L;X68C,D,和R;X69Y;X70E,G,K,L,M,P,S,和V;X72D和N;X74C和Y;X75G; X76V;X77E,V,和Y;X78M,Q和V;X80D,L,和N;X82C,D,P,Q,S,和T;X83G,和N; X84M;X87R;X88A,D,G,T,和V;X89V;X90D和Q;X91A;X92E和S;X93G,N,和S;X96G, N,和T;X100Q;和X102T,

其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应 而进行编号。在其它实施方案中,至少一个突变为取代组合,选自:X49A-X24T, X49A-X72D,X49A-X78M,X49A-X78V,X49A-X93S,X49C-X24T,X49C-X72D,X49C-X78M,X49C- X78V,X49C-X91A,X49C-X93S,X91A-x24T,X91A-X49A,X91A-X52H,X91A-X72D,X91A-X78M, X91A-X78V,X93S-X24T,X93S-X49C,X93S-X52H,X93S-X72D,X93S-X78M,和X93S-X78V, 其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序 列对应而进行编号。

在一些实施方案中,至少一个突变编码至少一个缺失,选自: p.X18_X19del,p.X22_23del,pX37del,pX49del,p.X47del,pX55del和 p.X57del,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽 的氨基酸序列对应而进行编号。

在一些实施方案中,至少一个突变编码至少一个插入,选自: p.X2_X3insT,p.X30_X31insA,p.X19_X20insAT,p.X21_X22insS, p.X32_X33insG,p.X36_X37insG和p.X58_X59insA,其中的位置通过与 SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。 在一些实施方案中,至少一个突变编码至少一个取代和至少一个缺失,选 自:X46H-p.X47del、X49A-p.X22_X23del、x49C-p.X22_X23del、X48I- p.X49del、X17W-p.X18_X19del、X78M-p.X22_X23del、X78V -p.X22_X23del、X78V-p.X57del、X91A-p.X22_X23del、X91A-X48I- pX49del、X91A-p.X57del、X93S-p.X22_X23del、和X93S-X48I-p.X49del, 其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序 列对应而进行编号。

在一些实施方案中,至少一个突变编码至少一个取代和至少一个插入, 选自:X49A-p.X2_X3insT,X49A-p32X_X33insG,X49A-p.X19_X20insAT, X49C-p.X19_X20insAT,X49C-p.X32_X33insG,X52H--p.X19_X20insAT, X72D-p.X19_X20insAT,X78M-p.X19_X20insAT,X78V-p.X19_X20insAT, X91A-p.X19_X20insAT,X91A-p.X32_X33insG,X93S-p.X19_X20insAT 和X93S-p.X32_X33insG,其中的位置通过与SEQ ID NO:7所示FNA蛋 白酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,至少一个突变为编码至少一个缺失和至少一个插 入的至少2个突变,选自:p.X57del-p.X19_X20insAT和p.X 22_X23del-p.X2_X3insT,其中的位置通过与SEQ ID NO:7所示FNA蛋白 酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,至少一个突变为相应于 p.S49del-p.T19_M20insAT-M48I的编码至少一个缺失、一个插入和一个取 代的至少3个突变,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的 前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,前体多核苷酸编码SEQ ID NO:1的全长FNA蛋 白酶。在一些实施方案中,编码SEQ ID NO:1的全长FNA蛋白酶的前体 多核苷酸是SEQ ID NO:2的多核苷酸。经修饰的全长多核苷酸通过在前体 多核苷酸(SEQ ID NO:2)的前原区域(SEQ ID NO:4)中引入至少一个突变, 从SEQ ID NO:2的前体多核苷酸产生。在一些实施方案中,至少一个突变 是至少一个取代,选自:R2F,N,P和Y;S3A,M,P和R;L6K和M;W7E; I8W;L10A,C,G,M和T;L11A,F和T;F12C,P,T;A13C,G和S;L14F; A15G,M,T和V;L16V;I17S;T19P和S;M20V;A21S;F22E;G23F,Q和 W;S24G,T和V;T25A,D和W;S26C和H;S27A,F,H,P,T,V和Y; A28V;Q29E,I,R,S和T;A30C;A31H,K,N,S,V和W;G32C,F,M,N,P, S和T;K33E,F,M,P和S;S34D,H,P和V;N35C,Q和S;G36C,D,L,N, S,W和Y;E37C,G,K和Q;K38F,Q,S和W;K39A,C,G,I,L,M,P,S,T 和V;K45G和S;Q46S;T47E和F;M48G,I,T,W和Y;S49A,C,E和I; T50D和Y;M51A和H;S52A,H,I和M;A53D,E,M,Q和T;A54F,G,H, I和S;K55D;K57E,N和R;D58A,C,E,F,G,K,R,S,T,W;V59E;S61A, F,I和R;E62A,F,G,H,N,S,T和V;K63A,C,E,F,G,N,Q,R和T;64D, M,Q和S;K66E;V67G和L;Q68C,D和R;K69Y;Q70E,G,K,L,M,P,S 和V;K72D和N;V74C和Y;D75G;A76V;A77E,V和Y;S78M,Q和V; T80D,L和N;N82C,D,P,Q,S和T;E83G和N;K84M;K87R;E88A,D,G, T和V;L89V;K90D和Q;K91A;D92E和S;P93G,N和S;A96G,N和T; E100Q;以及H102T,其中的位置通过与SEQ ID NO:7所示FNA蛋白酶 的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的取代组 合的至少一个突变组合:S49A-S24T,S49A-K72D,S49A-S78M,S49A-S78V, S49A-P93S,S49C-S24T,S49C-K72D,S49C-S78M,S49C-S78V, S49C-K91A,S49C-P93S,K91A-S24T,K91A-S49A,K91A-S52H, K91A-K72D,K91A-S78M,K91A-S78V,P93S-S24T,P93S-S49C, P93S-S52H,P93S-K72D,P93S-S78M和P93S-S78V,其中的位置通过与 SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的至少一 个缺失的至少一个突变:p.I18_T19del,p.F22_G23del,p.E37del,p.T47del 466,p.S49del,p.K55del和p.K57del,其中的位置通过与SEQ ID NO:7所 示FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码选自以下的至少一 个插入的至少一个突变:p.R2_S3insT,p.A30_A31insA,p.T19_M20insAT, p.A21_F22insS,p.G32_K33insG,p.G36_E37insG和p.D58_V59insA,其中 的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列对 应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个取代和至 少一个缺失的至少2个突变,选自:Q46H-p.T47del,S49A-p.F22_G23del, S49C-p.F22_G23del,M48I-p.S49del,I17W-p.I18_T19del,S78M -p.F22_G23del,S78V-p.F22_G23del,K91A-p.F22_G23del,K91A-M48I -pS49del,K91A-p.K57del,P93S-p.F22_G23del和P93S-M48I-p.S49del,其 中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序列 对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个取代和至 少一个插入的至少2个突变,选自:S49A-p.R2_S3insT, S49A-p32G_K33insG,S49A-p.T19_M20insAT,S49C-p.T19_M20insAT, S49C-p.G32_K33insG,S49C-p.T19_M20insAT,S52H--p.T19_M20insAT, K72D-p.T19_M20insAT,S78M-p.T19_M20insAT,S78V-p.T19_M20insAT, K91A-p.T19_M20insAT,K91A-p.G32_K33insG,P93S-p.T19_M20insAT 和P93S-p.G32_K33insG,其中的位置通过与SEQ ID NO:7所示FNA蛋 白酶的前原多肽的氨基酸序列对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码缺失和插入的至少2 个突变,选自:pK57del-p.T19_M20insAT和p.F22_G23del-p.R2_S3insT, 其中的位置通过与SEQ ID NO:7所示FNA蛋白酶的前原多肽的氨基酸序 列对应而进行编号。

在一些实施方案中,前体FNA多核苷酸被突变以编码经修饰的全长 FNA,所述经修饰的全长FNA在其前原区域包含编码至少一个缺失、一 个插入和一个取代的至少3个突变,其对应于 p.S49del-p.T19_M20insAT-M48I,其中的位置通过与SEQ ID NO:7所示 FNA蛋白酶的前原多肽的氨基酸序列对应而进行编号。

本发明前体蛋白酶前原区域的修饰包括至少一个取代、至少一个缺失 或至少一个插入。在一些实施方案中,前原区域的修饰包括突变的组合。 例如,前原区域的修饰包括至少一个取代和至少一个缺失的组合。在其它 实施方案中,前原区域的修饰包括至少一个取代和至少一个插入的组合。 在其它实施方案中,前原区域的修饰包括至少一个缺失和至少一个插入的 组合。在其它实施方案中,前原区域的修饰包括至少一个取代、至少一个 缺失和至少一个插入的组合。

本领域已知若干方法适于产生本发明的经修饰的多核苷酸序列,其包 括但不限于位点饱和诱变、扫描诱变、插入诱变、缺失诱变、随机诱变、 位点定向诱变和定向进化以及多种其它重组方法。常用的方法包括DNA 改组(Stemmer WP,Proc Natl Acad Sci U S A.25;91(22):10747-51[1994]), 基于基因的非同源重组的方法,例如ITCHY(Ostermeier等,Bioorg Med  Chem.7(10):2139-44[1999])、SCRACHY(Lutz等,Proc Natl Acad Sci U S  A.98(20):11248-53[2001])、SHIPREC(Sieber等,Nat Biotechnol. 19(5):456-60[2001])和NRR(Bittker等,Nat Biotechnol.20(10):1024-9 [2001];Bittker等,Proc Natl Acad Sci U S A.101(18):7011-6[2004]),以及 依赖于使用寡核苷酸插入随机和靶向的突变、缺失和/或插入的方法(Ness 等,Nat Biotechnol.20(12):1251-5[2002];Coco等,Nat Biotechnol. 20(12):1246-50[2002];Zha等,Chembiochem.3;4(1):34-9[2003];Glaser 等,J Immunol.149(12):3903-13[1992];Sondek和Shortle,Proc Natl Acad  Sci U S A 89(8):3581-5[1992];等,Nucleic Acids Res.32(20):e158 [2004];Osuna等,Nucleic Acids Res.32(17):e136[2004];Gaytán等,Nucleic Acids Res.29(3):E9[2001];以及Gaytán等,Nucleic Acids Res.30(16):e84 [2002])。

在一些实施方案中,将全长亲本多核苷酸连接到合适的表达质粒上, 可以使用以下诱变方法以利于本发明经修饰的蛋白酶的构建,但也可以使 用其它方法。所述诱变方法基于Pisarchik等(Protein engineering,Design  and Selection20:257-265[2007])的描述,具有额外的优点,即本文中使用 的限制性内切酶在其识别序列外进行切割,这使得可以对几乎任何核苷酸 序列进行消化并防止限制性内切位点疤痕的形成。首先,如本文中所描述, 获得天然存在的、编码全长蛋白酶的基因,并对其全部或部分进行测序。 随后,对前原序列进行扫描,以确定期望在编码的前原区域中进行一个或 多个氨基酸的突变(缺失、插入、取代,或它们的组合)的点。可以按照公 知的方法,通过引物延伸,进行基因突变,以便改变基因的序列以使其符 合期望序列。以PCR扩增期望的突变位点(一个或多个)的左边和右边片段, 使其包含Eam1104I限制性位点。以Eam1104I消化左边和右边片段,以 产生多个具有互补的3碱基突出端的片段,然后将这些片段混合并连接, 以产生包含一个或多个突变的经修饰的前原序列的文库。该方法图示于图 2。该方法避免了移码突变的发生。此外,该方法简化了诱变过程,因为可 以合成所有的寡核苷酸以具有相同的限制性位点,而不需要如一些其他方 法所必须的那样利用合成接头来产生限制性位点。

如上所示,在一些实施方案中,本发明提供了包含上述多核苷酸的载 体。在一些实施方案中,载体为表达载体,其中编码本发明的经修饰的蛋 白酶的经修饰的多核苷酸序列与基因高效表达所需的额外片段有效连接 (例如,启动子有效连接到该目的基因)。在一些实施方案中,提供的这些 必需元件是基因自身的同源启动子(如果其能被识别的话,即,被宿主转 录)、和外源的或由蛋白酶基因的内源终止子区域提供的转录终止子。在一 些实施方案中,也包括选择基因,例如抗生素抗性基因,所述抗生素抗性 基因使得可以通过在含杀微生物剂的培养基中生长来持续培养维持被质粒 感染了的宿主细胞。

在一些实施方案中,表达载体源自质粒或病毒DNA,或者,在可选择 的实施方案中,表达载体包含两者的元件。示例性载体包括但不限于pXX, pC194,pJH101,pE194,pHP13(Harwood和Cutting(编辑),MolecularBiological Methods for Bacillus,John Wiley&Sons,[1990],详见第3章; 适用于枯草芽孢杆菌的复制型质粒包括第92页所列的那些;Perego, M.(1993),用于在枯草芽孢杆菌中进行遗传操作的整合型载体,p.615-624; A.L.Sonenshein,J.A.Hoch,和R.Losick(ed.),枯草芽孢杆菌以及其它革 兰氏阳性细菌:生物化学、生理学和分子遗传学,American Society for  Microbiology,Washington,D.C.)。

为了在细胞中表达和生产目的蛋白质(例如,蛋白酶),将包含至少一 个拷贝(优选包含多个拷贝)的编码经修饰蛋白酶的多核苷酸的至少一个表 达载体,在合适蛋白酶表达的条件下转化到细胞中。在一些特定实施方案 中,编码蛋白酶的序列(以及载体中所包含的其它序列)被整合进宿主细胞 的基因组中,而在其它实施方案中,质粒在细胞中作为染色体外自主元件 维持。由此,本发明既提供染色体外元件,也提供整合进宿主细胞基因组 中的进入序列(incoming sequence)。

在一些实施方案中,可以用复制型载体构建包含本文中所描述的多核 苷酸的载体(例如,pAC-FNA;见图5)。本文中所描述的每一个载体均旨 在用于本发明。在一些实施方案中,构建体存在于整合型载体上(例如, pJH-FNA;图6),该载体使得经修饰的多核苷酸可以整合到细菌染色体中 并任选地扩增。整合位点的例子包括但不限于aprE,amyE,veg或pps区域。 事实上,可以考虑的是,在本发明中也可以使用本领域技术人员所知的其 它位点。在一些实施方案中,启动子是所选择的前体蛋白酶的野生型启动 子。在一些其它实施方案中,启动子是与前体蛋白酶异源的,但其在宿主 细胞中是起作用的。特别地,用于细菌宿主细胞的合适启动子的例子包括 但不限于pSPAC、pAprE、pAmyE、pVeg、pHpaII启动子,嗜热脂肪芽 孢杆菌产麦芽糖淀粉酶基因、解淀粉芽孢杆菌(BAN)淀粉酶基因、枯草芽 孢杆菌碱性蛋白酶基因、克劳氏芽孢杆菌碱性蛋白酶基因、短小芽孢杆菌 木糖苷酶基因、苏云金芽孢杆菌cryIIIA基因、以及地衣芽孢杆菌α-淀粉 酶基因的启动子。在一些实施方案中,启动子具有SEQ ID NO:333中所示 的序列。在其它实施方案中,启动子具有SEQ ID NO:445中所示的序列。 另外的启动子包括但不限于A4启动子,以及λ噬菌体PR或PL启动子和 大肠杆菌lac、trp或tac启动子。

可以在任何合适的革兰氏阳性微生物宿主细胞(包括细菌和真菌)中生 产前体和经修饰的蛋白酶。例如,在一些实施方案中,在真菌和/或细菌来 源的宿主细胞中生产经修饰的蛋白酶。在一些实施方案中,宿主细胞是芽 孢杆菌属物种、链霉菌属物种、埃希氏杆菌属物种(Escherichia sp.)或曲霉 属物种(Aspergillus sp.)。在一些实施方案中,经修饰的蛋白酶由芽孢杆菌 属物种宿主细胞生产。可以用于生产本发明经修饰的蛋白质的芽孢杆菌属 物种宿主细胞的例子包括但不限于地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽 孢杆菌、解淀粉芽孢杆菌、迟缓芽孢杆菌、短芽胞杆菌、嗜热脂肪芽孢杆 菌、嗜碱芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌、苏云 金芽孢杆菌、克劳氏芽孢杆菌、巨大芽孢杆菌以及芽孢杆菌属中其它微生 物。在一些实施方案中,使用芽孢杆菌宿主细胞。美国专利5,264,366和 4,760,025(RE 34,606)中描述了各种可以用于本发明的芽孢杆菌宿主菌株, 但在本发明中也可以使用其它合适的菌株。

几种工业菌株也可以用于本发明,包括非重组(即,野生型)芽孢杆菌 属物种菌株、以及天然存在的菌株的变体和/或重组菌株。在一些实施方案 中,宿主菌株是重组菌株,其中编码目的多肽的多核苷酸已经被引入到该 宿主中。在一些实施方案中,宿主菌株是枯草芽孢杆菌宿主菌株,特别是 重组枯草芽孢杆菌宿主菌株。现已知许多枯草芽孢杆菌菌株,其包括但不 限于1A6(ATCC 39085),168(1A01),SB19,W23,Ts85,B637,PB1753至 PB1758,PB3360,JH642,1A243(ATCC 39,087),ATCC 21332,ATCC 6051, MI113,DE100(ATCC 39,094),GX4931,PBT 110和PEP 211菌株(见例如, Hoch等,Genetics,73:215-228[1973])(也见美国专利号4,450,235;美国专 利号4,302,544;和EP 0134048;每一项均就其全部内容通过引用并入本 文)。使用枯草芽孢杆菌作为表达宿主在本领域中公知(见例如,Palva等, Gene 19:81-87[1982];Fahnestock和Fischer,J.Bacteriol.,165:796-804 [1986];以及Wang等,Gene 69:39-47[1988])。

在一些实施方案中,芽孢杆菌宿主是在基因degU,degS,degR和degQ 之至少一个中包含突变或缺失的芽孢杆菌属物种。优选地,突变在degU 基因中,更优选地,突变是degU(Hy)32(见例如,Msadek等,J.Bacteriol., 172:824-834[1990];和Olmos等,Mol.Gen.Genet.,253:562-567[1997])。 优选的宿主菌株是携带degU32(Hy)突变的枯草芽孢杆菌。在另外一些的实 施方案中,芽孢杆菌宿主包含在scoC4(见例如,Caldwell等,J.Bacteriol., 183:7329-7340[2001])、spoIIE(见,Arigoni等,Mol.Microbiol., 31:1407-1415[1999])、和/或oppA或opp操纵子的其它基因(见例如,Perego 等,Mol.Microbiol.,5:173-185[1991])中的突变或缺失。事实上,可以考虑, 将与oppA基因中突变导致相同表型的opp操纵子中的任何突变,用于本 发明的改变的芽孢杆菌菌株的一些实施方案中。在一些实施方案中,这些 突变单独存在,而在其它一些实施方案中,存在突变的组合。在一些实施 方案中,可用于生产本发明的经修饰蛋白酶的改变了的芽孢杆菌是已经在 一种或多种上述基因中包括突变的芽孢杆菌宿主菌株。此外,可以使用包 含内源蛋白酶基因的突变和/或缺失的芽孢杆菌属物种宿主细胞。在一些实 施方案中,芽孢杆菌宿主细胞包括aprE和nprE基因的缺失。在其它实施 方案中,芽孢杆菌属物种宿主细胞包含5个蛋白酶基因的缺失 (US20050202535),而在其它实施方案中,芽孢杆菌属物种宿主细胞包含9 个蛋白酶基因的缺失(US20050202535)。

可以使用本领域已知的任何合适方法,以编码本发明的经修饰的蛋白 酶的经修饰的多核苷酸来转化宿主细胞。无论是将经修饰的多核苷酸整合 到载体中还是在没有质粒DNA存在的情况下使用,所述经修饰的核苷酸 均可以被引入到微生物中,在一些实施方案中,优选大肠杆菌细胞或感受 态芽孢杆菌细胞。涉及质粒构建体和质粒向大肠杆菌中的转化的、用于将 DNA引入芽孢杆菌细胞中的方法是公知的。在一些实施方案中,随后从 大肠杆菌中分离质粒,并将其转化到芽孢杆菌中。但是,使用居间微生物 例如大肠杆菌并不是必须的,在一些实施方案中,DNA构建体或载体被 直接引入到芽孢杆菌宿主中。

本领域技术人员熟知用于将多核苷酸序列引入到芽孢杆菌细胞中的合 适方法(见例如,Ferrari等,“Genetics,”于Harwood等(ed.),Bacillus, Plenum Publishing Corp.[1989],57-72页中;Saunders等,J.Bacteriol., 157:718-726[1984];Hoch等,J.Bacteriol.,93:1925-1937[1967];Mann等, Current Microbiol.,13:131-135[1986];Holubova,Folia Microbiol.,30:97 [1985];Chang等,Mol.Gen.Genet.,168:11-115[1979];Vorobjeva等, FEMS Microbiol.Lett.,7:261-263[1980];Smith等,Appl.Env.Microbiol., 51:634[1986];Fisher等,Arch.Microbiol.,139:213-217[1981];以及 McDonald,J.Gen.Microbiol.,130:203[1984])。事实上,诸如转化,包括原 生质体转化和congression、转导和原生质体融合等方法是已知的并适用于 本发明。可以使用转化的方法,将本发明提供的DNA构建体引入到宿主 细胞中。本领域中已知用于转化芽孢杆菌的方法包括质粒标记挽救转化等 方法,其涉及由携带有部分同源的居民质粒的感受态细胞摄入供体质粒 (Contente等,Plasmid 2:555-571[1979];Haima等,Mol.Gen.Genet., 223:185-191[1990];Weinrauch等,J.Bacteriol.,154:1077-1087[1983]; 以及Weinrauch等,J.Bacteriol.,169:1205-1211[1987])。在该方法中,进 入供体质粒在模拟染色体转化的过程中与居民“辅助”质粒的同源区域重 组。

除了通常使用的方法之外,在一些实施方案中,可以直接转化宿主细 胞(即,在引入到宿主细胞之前,不用居间细胞来扩增或加工DNA构建体)。 将DNA构建体引入宿主细胞包括本领域已知用来将DNA引入宿主细胞 而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯 化钙沉淀、电穿孔、裸DNA、脂质体等。在另一些实施方案中,将DNA 构建体与质粒共转化,而不插入到质粒中。在另外一些实施方案中,通过 本领域已知的方法,将选择性标记从经改变的芽孢杆菌菌株中除去(见, Stahl等,J.Bacteriol.,158:411-418[1984];和Palmeros等,Gene 247:255 -264[2000])。

在一些实施方案中,在常规营养培养基中培养本发明的经转化了的细 胞。合适的具体培养条件,例如温度、pH等,为本领域技术人员熟知。此 外,一些培养条件可以自科学文献例如Hopwood(2000)PracticalStreptomyces Genetics,John Innes Foundation,Norwich UK;Hardwood等 (1990)Molecular Biological Methods for Bacillus,John Wiley,以及自美国 典型培养物保藏中心(American Type Culture Collection,ATCC)找到。

在一些实施方案中,在允许表达和生产本发明蛋白酶的条件下,于合 适的营养培养基中培养转化了编码经修饰蛋白酶的多核苷酸序列的宿主细 胞,之后从培养物中回收所得到的蛋白酶。用于培养细胞的培养基包括适 于宿主细胞生长的任何常规培养基,例如基本培养基或含有合适补充物的 复杂培养基。合适的培养基可从商业供应者获得,或者可以按照公开的配 方(例如,在American Type Culture Collection的目录中)来制备。在一些 实施方案中,通过常规方法从细胞培养基中回收细胞生产的蛋白酶,所述 方法包括但不限于通过离心或过滤从培养基中分离宿主细胞、通过盐(例 如,硫酸铵)来沉淀上清液或滤液的蛋白质性组分、层析纯化(例如,离子 交换、凝胶过滤、亲和层析等)。因此,适于回收本发明蛋白酶的任何方法 都可用于本发明。事实上,本发明不受任何特定纯化方法的限制。

包含本发明的经修饰蛋白酶的重组宿主细胞生产的蛋白质可以被分泌 到培养基中。在一些实施方案中,其它重组构建体将该异源或同源多核苷 酸序列连接至编码蛋白酶多肽结构域的核苷酸序列,以方便可溶蛋白的纯 化(Kroll DJ等(1993)DNA Cell Biol 12:441-53)。此类协助纯化的结构域包 括但不限于金属螯合肽,例如,允许在固定化的金属上进行纯化的组氨酸- 色氨酸模块(Porath J(1992)Protein Expr Purif3:263-281)、允许在固定化的 免疫球蛋白上进行纯化的A蛋白结构域、以及用于FLAGS延伸/亲和纯化 系统的结构域(Immunex Corp,Seattle WA)。将可切割的接头序列,例如 因子XA或肠激酶(Invitrogen,San Diego CA)纳入纯化结构域和异源蛋白 之间也可用于促进纯化。

如上所述,本发明提供了编码经修饰的全长蛋白酶的经修饰的全长多 核苷酸,所述经修饰的全长蛋白酶被芽孢杆菌宿主细胞加工以产生成熟形 式,该生产水平高于由在相同条件下生长的芽孢杆菌宿主细胞从未经修饰 的全长酶加工相同成熟蛋白酶时的生产水平。该生产水平可以通过所分泌 的酶的活性水平确定。

生产增强的一种量度可以以相对活性来测量,这可表示为:从经修饰 的蛋白酶加工的成熟形式的酶促活性值与从未经修饰的前体蛋白酶加工的 成熟形式的酶促活性值的比值百分数。等于或高于100%的相对活性表 明,从经修饰的前体加工时蛋白酶成熟形式的生产水平等于或高于从未经 修饰的前体加工时同样的成熟蛋白酶的生产水平。由此,在一些实施方案 中,与从未经修饰的前体蛋白酶加工的蛋白酶成熟形式的相应生产相比, 从经修饰的蛋白酶加工的成熟蛋白酶的相对活性是至少约100%、至少约 110%、至少约120%、至少约130%、至少约140%、至少约150%、至少 约160%、至少约170%、至少约180%、至少约190%、至少约200%、 至少约225%、至少约250%、至少约275%、至少约300%、至少约325%、 至少约350%、至少约375%、至少约400%、至少约425%、至少约450%、 至少约475%、至少约500%、至少约525%、至少约550%、至少约575%、 至少约600%、至少约625%、至少约650%、至少约675%、至少约700%、 至少约725%、至少约750%、至少约800%、至少约825%、至少约850%、 至少约875%、至少约850%、至少约875%、至少约900%、以及高达至 少约1000%或更高。可选地,相对活性可表示为产量比,其通过用从经 修饰的前体加工的蛋白酶的活性值除以从未经修饰的前体加工的相同蛋白 酶的活性值来测量。由此,在一些实施方案中,从经修饰的前体加工的成 熟蛋白酶的产量比为至少约1、至少约1.1、至少约1.2、至少约1.3、至少 约1.4、至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至 少约2、至少约2.25、至少约2.5、至少约2.75、至少约3、至少约3.25、 至少约3.5、至少约3.75、至少约4.0、至少约4.25、至少约4.5、至少约 4.75、至少约5、至少约5.25、至少约5.5、至少约5.75、至少约6、至少 约6.25、至少约6.5、至少约6.75、至少约7、至少约7.25、至少约7.5、 至少约8、至少约8.25、至少约8.5、至少约8.75、至少约9、以及高达至 少约10。

本领域技术人员已知用于检测和测量蛋白酶活性的多种测定法。特别 是,可获得用于测量蛋白酶活性的如下测定法,所述测定法基于酸可溶性 肽从酪蛋白或血红蛋白的释放,该释放可以使用Folin方法通过280nm 处吸光度或比色法来进行测量(见例如,Bergmeyer等,“Methods of  Enzymatic Analysis”vol.5,Peptidases,Proteinases and their Inhibitors, Verlag Chemie,Weinheim[1984])。一些其它测定法涉及生色底物的溶解 (见例如,Ward,“Proteinases,”in Fogarty(ed.).,Microbial Enzymes andBiotechnology,Applied Science,London,[1983],pp 251-317)。其它示例性 测定法包括但不限于琥珀酰-Ala-Ala-Pro-Phe-对硝基酰苯胺测定法 (SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐测定法(TNBS测定法)。本领域技 术人员已知的许多其它参考文献提供了合适的方法(见例如,Wells等, Nucleic Acids Res.11:7911-7925[1983];Christianson等,Anal.Biochem., 223:119-129[1994];和Hsia等,Anal Biochem.,242:221-227[1999])。这并 不意味着本发明受限于任何特定的测定方法。

用于测定宿主细胞中成熟蛋白酶生产水平的其它手段包括但不限于使 用对该蛋白质特异的多克隆或单克隆抗体的方法。例子包括但不限于酶联 免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激 活细胞分选(FACS)。这些以及其它一些测定法在本领域公知(见例如, Maddox等,J.Exp.Med.,158:1211[1983])。

本文提到的所有出版物和专利都通过引用并入本文。对本领域技术人 员将是显而易见的,可以对所描述的本发明方法和系统进行多种修改和变 动而不偏离本发明的范围和宗旨。虽然已经参照具体实施方案对本发明进 行了描述,但应理解的是,本发明不应被不恰当地限定于这些特定的实施 方案。事实上,所描述的本发明实施方式的各种对本领域和/或相关领域技 术人员显而易见的变型形式都旨在落入本发明的范围内。

实验

提供下述实施例来展示和进一步阐述本发明的某些实施方案和方面, 它们不应被解释为限制本发明的范围。

在下文的实验公开内容中,应用了下述缩写:ppm(每百万分之);M(摩 尔每升);mM(毫摩尔每升);μM(微摩尔每升);nM(纳摩尔每升);mol(摩 尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);gm(克);mg(毫克); μg(微克);pg(皮克);L(升);ml和mL(毫升);μl和μL(微升);cm(厘米); mm(毫米);μm(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒); min(s)(分钟/分钟);h(s)和hr(s)(小时/小时);℃(摄氏度);QS(足够量);ND(未 进行);NA(不适用);rpm(每分钟转数);w/v(质量体积比);v/v(体积体积 比);g(重力);OD(光密度);aa(氨基酸);bp(碱基对);kb(千碱基对);kD(千 道尔顿);suc-AAPF-pNA(琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨 酰基-对硝基苯胺);FNA(BPN’的变体);BPN’(解淀粉芽孢杆菌的枯草杆菌 蛋白酶);DMSO(二甲基亚砜);cDNA(拷贝或互补DNA);DNA(脱氧核糖 核酸);ssDNA(单链DNA);dsDNA(双链DNA);dNTP(三磷酸脱氧核糖核 苷酸);DTT(1,4-二巯基-DL-苏糖醇);H2O(水);dH2O(去离子水);HCl(盐 酸);MgCl2(氯化镁);MOPS(3-[N-吗啉代]-丙烷磺酸);NaCl(氯化纳); PAGE(聚丙烯酰胺凝胶电泳);PBS(磷酸缓冲盐溶液:[150mM NaCl,10 mM磷酸钠缓冲液,pH 7.2]);PEG(聚乙二醇);PCR(聚合酶链式反应); PMSF(苯基甲基磺酰氟);RNA(核糖核酸);SDS(十二烷基硫酸纳);Tris(三 (羟甲基)氨基甲烷);SOC(2%细菌用胰蛋白胨,0.5%细菌用酵母提取物, 10mM NaCl,2.5mM KCl);Terrific Broth(TB:12g/l细菌用胰蛋白胨, 24g/l甘油,2.31g/l KH2PO4,和12.54g/l K2HPO4);OD280(280nm处 的光密度);OD600(600nm处的光密度);A405(405nm处的吸光度); Vmax(酶催化反应的最大初速度);HEPES(N-[2-羟乙基]哌嗪-N-[2-乙磺 酸]);Tris-HCl(三[羟甲基]氨基甲烷盐酸盐);TCA(三氯乙酸);HPLC(高 压液相色谱);RP-HPLC(反相高压液相色谱);TLC(薄层色谱);EDTA(乙 二胺四乙酸);EtOH(乙醇);SDS(十二烷基硫酸纳);Tris(三(羟甲基)氨基 甲烷);TAED(N,N,N’N’-四乙酰基乙二胺)。

实施例1

靶向ISD(插入取代缺失)文库的构建

用于构建经修饰的FNA多核苷酸文库的方法(ISD方法)显示于图2 中。使用在正向和反向上均匀地覆盖编码392个氨基酸的全长蛋白质(SEQ  ID NO:1)的前原区域(SEQ ID NO:7)的FNA基因序列的两套寡核苷酸,扩 增编码FNA的前原区域的FNA基因部分的左边和右边片段。两种PCR 反应(左边和右边片段)包含5’正向或3’反向基因序列侧翼寡核苷酸,每一 寡核苷酸与相应的相对引物寡核苷酸组合。使用包含EcoRI位点的单一正 向引物(P3233,TTATTGTCTCATGAGCGGATAC;SEQ ID NO:123)和各 含Eam104I位点的反向引物P3301r-P3404r(SEQ ID NOS:124-227;表1) 扩增左边片段。使用包含MluI限制性位点的单条反向引物(P3237, TGTCGATAACCGCTACTTTAAC;SEQ ID NO:228)和各含Eam104I限 制性位点的正向引物P3301f-P3401f(SEQ ID NOS:229-332;表2)扩增右边 片段。

表1、用于扩增左边片段的反向引物序列

表2、用于扩增右边片段的正向引物序列

每个扩增反应包含每个寡核苷酸各30pmol和100ng的pAC-FNa10 模板。使用Vent DNA聚合酶(New England Biolabs)进行扩增。PCR混合 物(20μl)先于95℃加热2.5分钟,然后于94℃变性15秒、55℃退火15 秒和72℃延伸40秒进行30个循环。扩增后,凝胶纯化RCR反应产生的 左边和右边片段,将其混合(每个片段200ng),以Eam104I消化,以T4DNA 连接酶进行连接和用侧翼引物(P3233和P3237)进行扩增。以EcoRI和MluI 消化所得到的片段,并将其克隆到pAC-FNA10质粒中的EcoRI/MluI位点 中(图5)。该pAC-FNA10已经经改造而在FNA的前原区域和成熟区域之 间包含MluI限制性酶切位点。由aprE短启动子驱动自pAC-FNA10质粒 转录编码前体和经修饰蛋白酶的DNA,所述aprE短启动子的序列为: GAATTCATCTCAAAAAAATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATA GTCTTTTAAGTAAGTCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGA(SEQ ID NO:333).

由此,包含在该载体中的表达盒(1307bp)具有如下所示的多核苷酸序列(SEQ  ID NO:334):

GAATTCATCTCAAAAAAATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATAGTCTTTTAAGTAAGTCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGAGTGAGAAGCAAAAAAT TGTGGATCAGTTTGCTGTTTGCTTTAGCGTTAATCTTTACGATGGCGTTCGGCAGCACATCCAGC GCGCAGGCGGCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGGGTTTAAACAGACAATGA GCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGCGGGAAAGTGCAAAAGCA ATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGAATTGAAAAAAGA CCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACACGCGTACGCGCAGTCCGTGCCTTAC GGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGT AGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAGGTAGCAGGCGGAGCCAGC ATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACGGAACTCACGTTGCCGGCAC AGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTTTACGCTG TAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGC GATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAA AAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAG GCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATACCCTTCTGTCATTGCAGTAGG CGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGGACCTGAGCTTGATGTCATG GCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGCGCGTTGAACGGTACAT CAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCCGAACTGGAC AAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGATTCTTTCTACTATGG AAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAAACTCGAGATAAAAAACCGGCCTTGGCC CCGCCGGTTTTTTATTATTTTTCTTCCTCCGGATCC(SEQ ID NO:334).

该表达盒包含AprE启动子(加下划线的)、FNA的PRE、PRO和成熟 区域、以及转录终止子。

使用滚环扩增(rolling circle amplification),按照生产商推荐的方法 (Epicentre Biotech),扩增连接混合物。

将103个包含编码具有经突变的前原区域的FNA蛋白酶的DNA序 列的文库转化到感受态枯草芽孢杆菌菌株(基因型:ΔaprE,ΔnprE,spoIIE, amyE::xylRPxylAcomK-phleo)中,在1ml的Luria Broth(LB)中于37℃ 恢复1小时。通过诱导在木糖诱导型启动子控制下的comK基因来制备细 菌感受态(见例如,Hahn等,Mol Microbiol,21:763-775,1996)。将制备物 铺于包含1.6%的脱脂乳和5mg/l的氯霉素的LB琼脂平板上,将平板于 37℃过夜培养。

自该103个文库的每个文库,挑取产生最大晕圈的1000个克隆,在 16ml管内的3ml包含终浓度5mg/L氯霉素的LB中孵育各单克隆,进行 预培养,然后于37℃在250rpm转速下振荡培养4h。将1毫升预培养 细胞加到250ml摇瓶中,瓶中包含25ml改良FNII培养基(7g/L Cargill Soy  Flour#4,0.275mM MgSO4,220mg/L K2HPO4,21.32g/L Na2HPO4 7H2O, 6.1g/L NaH2PO4.H2O,3.6g/L尿素,0.5ml/L Mazu,35g/L Maltrin M150 和23.1g/L葡萄糖-H2O)。将摇瓶于37℃在250rpm转速下振荡培养。 每12小时取一份培养物等分试样(200ul),在台式离心机中于8000rpm转 速下离心2分钟,将上清于-20℃冷冻。使用以下描述的96孔板检测法, 对每个分离物进行AAPF活性筛选。

96孔微量滴定板中的AAPF蛋白酶检测

使用96孔板检测法,进一步对产生最大晕圈的克隆进行AAPF活性 的筛选。挑取经选择的菌落,将各单菌落于96孔平底微量滴定板(MTP) 中于150ul含终浓度5mg/L氯霉素的LB中进行预培养,于37℃在250 rpm转速下振荡培养。将140ul的Grant’s II培养基(10g/L soytone,75g/L 葡萄糖,3.6g/L尿素,83.72g/L MOPS,7.17g/L tricine,3mM K2HPO4, 0.276mM K2SO4,0.528mM MgCl2,2.9g/L NaCl,1.47mg/L二水合柠檬酸 三钠,0.4mg/L FeSO4.7H2O,mg/L,0.1mg/L MnSO4.H2O,0.1mg/L ZnSO4.H2O,0.05mg/L CuCl2.2H2O,0.1mg/L CoCl2.6H2O,0.1mg/L Na2MoO4.2H2O)加到新96孔MTP的每个孔室中。然后将来自第一个MTP 的每个预培养物各10ul加到第二个MTP的含有Grant’s II培养基的对 应孔室中。将培养物在保湿箱中于37℃在220rpm转速下培养40小时。 在培养后,在100ul的Tris稀释缓冲液中将培养物稀释10至100倍,按 以下方法测量AAPF活性。

样品的AAPF活性按N-琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙 氨酰-对硝基苯胺(suc-AAPF-pNA)的水解速率来进行测量。所使用的试剂 溶液为:100mM Tris/HCl,pH 8.6,包含0.005%-80;Tris稀 释缓冲液;以及160mM的于DMSO中的suc-AAPF-pNA(suc-AAPF-pNA 储备液)(Sigma:S-7388)。将1ml suc-AAPF-pNA储备液加到100ml Tris/ HCl缓冲液,充分混匀至少10秒钟,以制备suc-AAPF-pNA工作液。通 过将10μl经稀释的培养物加到每个孔室,随后立即加入190μl 1mg/ml 的suc-AAPF-pNA工作液来进行检测。将溶液混合5秒钟,于25℃在 MTP读板器中以动态模式(5分钟内20次读取)读取410nm处吸光度的变 化。蛋白酶活性表示为AU(活性=ΔOD·min-1ml-1)。按任何一个试验样品 的AAPF转化速率除以对照样品(野生型pAC-FNA10)的AAPF转化速率 的比率来计算相对产量。

从ISD文库筛选中鉴定到的具有最高AAPF活性的克隆的AAPF活性 结果列于表3中。第1001号和第515号克隆包含2个突变:一个缺失和一 个取代。该缺失是有意地引入到前原序列中的,而该取代可能是由DNA 聚合酶的误读错误所引起。

表3、从经修饰的全长FNA(在前原区域包含至少一个突变)加工的成熟 FNA(SEQ ID NO:9)的生产与从未经修饰的全长FNA加工的成熟FNA的 生产比较

实施例2

通过ISD产生包含突变组合的突变前原多肽

为了确定在前原FNA序列中组合至少2个突变的效果,按以下方法 产生表3中所列突变的组合。

以包含表3中突变的pAC-FNA10质粒DNA作为模板,进行延伸 PCR,以添加同样选自表3中所描述突变的另一个突变。两个PCR反应(左 边和右边片段)包含5’正向或3’反向基因序列侧翼寡核苷酸,每一寡核苷 酸各与对应的相对引物寡核苷酸组合。使用单一正向引物(P3234, ACCCAACTGATCTTCAGCATC;SEQ ID NO:411)和用于表4中所示特 定突变的反向引物来扩增左边片段。使用单一反向引物(P3242, ACCGTCAGCACCGAGAACTT;SEQ ID NO:412)和用于表4中所示特定 突变的正向引物来扩增右边片段。将两个扩增片段(左边和右边)混合在一 起后以包含EcoRI位点的正向引物(P3201, ATAGGAATTCATCTCAAAAAAATG;SEQ ID NO:413)和包含MluI限 制性位点的反向引物(P3237,TGTCGATAACCGCTACTTTAAC;SEQ ID  NO:414)来进行扩增。

表4、用于扩增左边和右边片段的正向和反向引物序列

按实施例1中的描述进行扩增、连接和转化。使用实施例1中描述的 96孔板检测法,对每个突变组合的3个克隆进行AAPF活性筛选。与从野 生型全长FNA加工的FNA的生产相比较,从在前原多肽中包含突变组合 的全长FNA蛋白质加工的FNA(SEQ ID NO:9)的相对生产的结果显示于表 5-10中。

表5、在FNA的前原区域中组合S49C取代和第二突变对成熟蛋白质生产 的影响

表6、在FNA的前原区域中K91C取代组合第二突变对成熟蛋白质生产的影响

表7、在FNA的前原区域中S49A取代组合第二突变对成熟蛋白质生产的影响

表8.在FNA前原区域中p.T19_M20insAT插入组合第二突变对成熟蛋白质生 产的影响

表9、在FNA前原区域中p.F22_G23del缺失组合第二突变对成熟蛋白质生产的 影响

表10、在FNA前原区域中P93S取代组合第二突变对成熟蛋白质生产的影 响

数据显示,大多数组合导致相对AAPF活性高于由单突变获得的相对 活性,即,大多数突变组合对AAPF活性具有协同效应。

与表达野生型前原-FNA的枯草芽孢杆菌细胞相比,表达包含具有突 变组合的前原多肽的全长FNA的所有枯草芽孢杆菌细胞都具有更高的成 熟FNA生产水平。

与表达包含具有单突变的前原多肽的全长FNA的克隆相比,大多数表 达包含具有突变组合的前原多肽的全长FNA的枯草芽孢杆菌克隆具有更 高的成熟FNA生产水平。

实施例3

构建位点评价文库(SELs),以在包含FNA前原区域的前103个氨基酸 位置的每一个位置上产生位置文库。进行全长FNA蛋白酶的前原序列的位 点饱和诱变,以鉴别增加细菌宿主细胞的FNA生产的氨基酸取代。

SEL文库构建

利用DNA 2.0(Menlo Park,CA),使用专利DNA 2.0技术诀窍和/或知 识产权下的基因优化、基因合成和文库构建技术平台,产生前原-FNA SEL。 将包含全长FNA多核苷酸 (GTGAGAAGCAAAAAATTGTGGATCAGTTTGCTGTTTGCTTTAGCGTTAATCTTTACGATGGCGTT CGGCAGCACATCCAGCGCGCAGGCGGCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGG GTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGC GGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGT AAAAGAATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACACGCGTAC GCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACA CTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAG GTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACG GAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCC AAGCGCATCACTTTACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATC ATTAACGGAATCGAGTGGGCGATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGAC CTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTCGTT GCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGTAAATAC CCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAG GACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATAC GGCGCGTTGAACGGTACATCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTT CTAAGCACCCGAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTT GGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGCGGCAGCTCAGTAA;

SEQ ID NO:2)的pAC-FNA10质粒递送到DNA 2.0以产生SEL。要求 DNA 2.0在FNA前原区域(图1)的107个氨基酸的每一个氨基酸上产生位 置文库。对于在图1中编号显示的该107个位点的每一个位点,DNA 2.0 在每个位置上提供了不少于15个的取代变体。这些基因构建体以96孔板 的形式获得,每个96孔板包含4个单独的位置文库。这些文库由转化的枯 草芽孢杆菌宿主细胞(基因型:ΔaprE,ΔnprE,ΔspoIIE, amyE::xylRPxylAcomK-phleo)组成,所述宿主细胞已经转化了编码FNA变 体序列的表达质粒。这些细胞以接种在96孔板中的甘油储备物形式接收, 对编码每个变体的多核苷酸进行测序,按以上描述测量所编码的变体蛋白 质的活性。按实施例1中的描述培养各单克隆,以得到不同的FNA蛋白质 变体用于功能表征。在表11中报告了FNA生产,报告为:从包含在给定 位置上突变的前原多肽的全长FNA蛋白质加工的FNA产量与从野生型全 长FNA加工的FNA产量的比率。

实施例4

从稳定整合了编码经修饰蛋白酶的构建体的枯草芽孢杆菌生产蛋白酶

使用pJH整合型载体(Ferrari等,J.Bacteriol.154:1513-1515[1983]), 证实了在载体整合至枯草芽孢杆菌染色体中后,枯草芽孢杆菌中从复制型 载体pAC-FNA10表达的蛋白酶的生产增强。

为了进行载体整合,通过延伸PCR,将AprE启动子的上游区域添加 到存在于pAC-FNA10中的短启动子上。为此目的,扩增了两个片段,其 中一个使用pJH-FNA质粒(图6)作为模板,另一个使用在FNA的前原区 域包含所选突变的pAC-FNA10质粒作为模板。第一个片段包含AprE启 动子丢失的上游区域,其使用引物P3249和P3439(表12)从pJH-FNA质 粒扩增。第二个片段跨短aprE启动子、经修饰的前原和成熟FNA区域、 以及转录终止子,其使用具有所选修饰的前原区的pAC-FNA10作为模板, 以引物P3438和P3435(表12)进行扩增。这两个片段包含重叠部分,使得 可以通过将两个片段混合在一起、并以包含EcoRI和BamHI限制性酶切 位点的侧翼引物(P3255和P3246;表12)进行扩增,而重新构建全长aprE 启动子(带有FNA和终止子)。将所获得的包含全长aprE启动子、经修饰 的前原区域、成熟的FNA区域和转录终止子的片段,以EcoRI和BamHI 进行消化,并与以相同限制性酶消化的pJH-FNA载体进行连接。类似地, 构建包含全长aprE启动子、编码未经修饰的亲本前原区域和成熟FNA区 域的未经修饰序列、和转录终止子的对照片段(SEQ ID NO:452)。将包含 编码对照未经修饰的蛋白酶或经修饰的蛋白酶的DNA的pJH-FNA构建体 转化到枯草芽孢杆菌菌株(基因型ΔaprE,ΔnprE,spoIIE, amyE::xylRPxylAcomK-phleo)中,并按实施例1中的描述进行培养。按实 施例1中的描述,测定并定量自经修饰的全长FNA加工生产的成熟FNA 蛋白酶的AAPF活性,并将其生产与自未经修饰的全长FNA加工的成熟 FNA的生产进行比较。

长aprE启动子的序列如SEQ ID NO:445所示:

AATTCTCCATTTTCTTCTGCTATCAAAATAACAGACTCGTGATTTTCCAAACGAGCTTTCAAAA AAGCCTCTGCCCCTTGCAAATCGGATGCCTGTCTATAAAATTCCCGATATTGGTTAAACAGC GGCGCAATGGCGGCCGCATCTGATGTCTTTGCTTGGCGAATGTTCATCTTATTTCTTCCTCC CTCTCAATAATTTTTTCATTCTATCCCTTTTCTGTAAAGTTTATTTTTCAGAATACTTTTATCATC ATGCTTTGAAAAAATATCACGATAATATCCATTGTTCTCACGGAAGCACACGCAGGTCATTTG AACGAATTTTTTCGACAGGAATTTGCCGGGACTCAGGAGCATTTAACCTAAAAAAGCATGAC ATTTCAGCATAATGAACATTTACTCATGTCTATTTTCGTTCTTTTCTGTATGAAAATAGTTATTT CGAGTCTCTACGGAAATAGCGAGAGATGATATACCTAAATAGAGATAAAATCATCTCAAAAAA ATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATAGTCTTTTAAGTAAG TCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGA(SEQ ID NO:445)

表12、用于产生稳定整合的构建体的引物

pJH-FNA载体中包含未经修饰的亲本FAN多核苷酸的表达盒的核苷 酸序列如SEQ ID NO:452所示:

AATTCTCCATTTTCTTCTGCTATCAAAATAACAGACTCGTGATTTTCCAAACGAGCTTTCAAAAAAGCCTCTGCCCCTTGCAAATCGGATGCCTGTCTATAAAATTCCCGATATTGGTTAAACAGCGGCGCAATGGCGGCCGCATCTGATGTCTTTGCTTGGCGAATGTTCATCTTATTTCTTCCTCCCTCTCAATAATTTTTTCATTCTATCCCTTTTCTGTAAAGTTTATTTTTCAGAATACTTTTATCATCATGCTTTGAAAAAATATCACGATAATATCCATTGTTCTCACGGAAGCACACGCAGGTCATTTGAACGAATTTTTTCGACAGGAATTTGCCGGGACTCAGGAGCATTTAACCTAAAAAAGCATGACATTTCAGCATAATGAACATTTACTCATGTCTATTTTCGTTCTTTTCTGTATGAAAATAGTTATTTCGAGTCTCTACGGAAATAGCGAGAGATGATATACCTAAATAGAGATAAAATCATCTCAAAAAAATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATAGTCTTTTAAGTAAGTCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGAGTGAGAAGCAAAAAATTGTGGATCAGT TTGCTGTTTGCTTTAGCGTTAATCTTTACGATGGCGTTCGGCAGCACATCCTCTGCCCAGGC GGCAGGGAAATCAAACGGGGAAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACG ATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAAAAAGGCGGGAAAGTGCAAAAGCAATT CAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGAATTGAAAAAAGA CCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACATGCGTACGCGCAGTCCGTGCCT TACGGCGTATCACAAATTAAAGCCCCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGT TAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCATCCTGATTTAAAGGTAGCAGGCG GAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACGGAACTCAC GTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCG CATCACTTTACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATT AACGGAATCGAGTGGGCGATCGCAAACAATATGGACGTTATTAACATGAGCCTCGGCGGAC CTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAGCCGTTGCATCCGGCGTCGTAGTC GTTGCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTACCCTGGT AAATACCCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTC AAGCGTAGGACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCT GGAAACAAATACGGCGCGTTGAACGGTACATCAATGGCATCTCCGCACGTTGCCGGAGCGG CTGCTTTGATTCTTTCTAAGCACCCGAACTGGACAAACACTCAAGTCCGCAGCAGTTTAGAA AACACCACTACAAAACTTGGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGTACAGGC GGCAGCTCAGTAAAACATAAAAAACCGGCCTTGGCCCCGCCGGTTTTTTATTATTTTTCTTCC TCCGCATGTTCAATCCGCTCCATAATCGACGGATGGCTCCCTCTGAAAATTTTAACGAGAAA CGGCGGGTTGACCCGGCTCAGTCCCGTAACGGCCAAGTCCTGAAACGTCTCAATCGCCGCT TCCCGGTTTCCGGTCAGCTCAATGCCGTAACGGTCGGCGGCGTTTTCCTGATACCGGGAGA CGGCATTCGTAATCGGATCC(SEQ ID NO:452).

该表达盒包含长AprE启动子序列(加下划线,SEQ ID NO:445),FNA 的前原区域(SEQ ID NO:7)和成熟区域(SEQ ID NO:9),以及转录终止子。

图7显示了,与自未经修饰的全长FAN加工生产的FNA产量相比较, 自突变体之一(克隆684;表9)加工的FNA产量的结果。这些数据证实了, 与自未经修饰的前原区域的生产相比较,自包含经修饰的前原区域的整合 型构建体的编码蛋白酶生产得到了增强。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号