公开/公告号CN112512544A
专利类型发明专利
公开/公告日2021-03-16
原文格式PDF
申请/专利权人 华盛顿大学;
申请/专利号CN201980048359.7
申请日2019-07-19
分类号A61K38/00(20060101);C07K14/00(20060101);
代理机构11410 北京市中伦律师事务所;
代理人杨黎峰;王奕勋
地址 美国华盛顿
入库时间 2023-06-19 10:14:56
在先提交申请的交叉引用
本申请要求2018年7月19日提交的美国临时专利申请序列号62/700681、2018年12月27日提交的美国临时专利申请序列号62/785537和2019年1月4日提交的美国临时专利申请序列号62/788398的优先权,每个所述临时专利申请通过引用以其整体并入本文。
经EFS-Web电子递交的序列表的引用
与本申请一起提交的ASCII文本文件(名称:18-1054-PCT_Sequence-Listing_ST25.txt;大小:32,278kb;以及创建日期:2019年7月19日)的电子递交序列表的内容通过引用整体并入本文。
背景技术
基于蛋白质折叠成其最低自由能状态的原理,在稳定蛋白质结构的全新设计方面已经取得了相当大的进展。这些努力集中在最大化所需折叠结构与所有其他结构之间的自由能间隙。设计可以转换构象的蛋白质更具挑战性,因为相对于未折叠状态,多个状态必须具有足够低的自由能来填充,并且状态之间的自由能差异必须足够小,以使状态占用率可以通过外部输入来切换。在外部输入的存在下转换构象状态的蛋白质系统的全新设计尚未实现。
发明内容
在第一方面,公开了非天然存在的多肽,其包含:
(a)螺旋束,包含2至7个α-螺旋;和
(b)连接每个α螺旋的氨基酸接头。
在一个实施方式中,每个螺旋的长度独立地为18-60、18-55、18-50、18-45、22-60、22-55、22-50、22-45、25-60、25-55、25-50、25-45、28-60、28-55、28-50、28-45、32-60、32-55、32-50、32-45、35-60、35-55、35-50、35-45、38-60、38-55、38-50、38-45、40-60、40-58、40-55、40-50或40-45个氨基酸。在另一个实施方式中,每个氨基酸接头的长度独立地为3-10、4-10、5-10、6-10、7-10、8-10、9-10、2-9、3-9、4-9、5-9、6-9、7-9、8-9、2-8、3-8、4-8、5-8、6-8、7-8、2-7、3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、或者2、3、4、5、6、7、8、9或10个氨基酸,该长度不包括可能与接头融合的任何其他功能序列。在另一个实施方式中,所述多肽在至少一个α螺旋中包含一种或多种生物活性肽,其中所述一种或多种生物活性肽能够选择性地结合到限定靶标,其中该一种或多种生物活性肽可包含选自由SEQ ID NO:60、62-64、66、27052-27093和27118-27119组成的非限制性组中的一种或多种生物活性肽。
在另一方面,本公开提供了非天然存在的多肽,其包括沿着其长度与本文公开的或者选自由SEQ ID NO:1-49、51-52、54-59、61、65、67-14317、27094-27117、27120-27125、27278至27321组成的组中的笼多肽,以及表2、表3和/或表4中列出的笼多肽的氨基酸序列具有至少40%序列同一性的多肽,其中所述多肽的N-末端和/或C-末端60个氨基酸是任选的,其中所述序列同一性要求不包括任选的氨基酸残基。在一方面,本公开提供了非天然存在的多肽,其包括沿着其长度与表2、表3和/或表4中列出的笼多肽的氨基酸序列具有至少40%序列同一性(不包括任选的氨基酸残基)的多肽。在这些方面各自的一个实施方式中,所述多肽包含氨基酸序列,其氨基酸序列沿着其长度与选自由SEQ ID NO:1-91、SEQ IDNO:1-49、51-52、54-59、61、65、67-14317、27094-27117、27120-27125、27278至27321组成的组中的氨基酸序列,以及表2、表3和/或表4中列出的笼多肽的氨基酸序列具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的氨基酸残基)。
在本公开的任一方面的一个实施方式中,非天然存在的多肽进一步包含在多肽的闩锁区域内或替代所述闩锁区域的一种或多种生物活性肽,其中所述一种或多种生物活性肽可以包括选自由SEQ ID NO:60、62-64、66、27052-27093和27118-27119组成的非限制性组的一种或多种生物活性肽。
另一方面,提供了非天然存在的多肽,其包括沿其长度与本文公开的钥匙多肽或选自由SEQ ID NO:14318-26601、26602-27015和27016-27051组成的组的钥匙多肽,以及表中列出的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的氨基酸残基)的多肽。在一个实施方式中,所述多肽包含氨基酸序列,其氨基酸序列沿着其长度与选自由表2、表3和/或表4中列出的钥匙多肽组成的组的钥匙蛋白质的氨基酸序列具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的氨基酸残基)。
在另一个实施方式中,本公开提供了融合蛋白,其包含与本公开的任何实施方式或实施方式组合的钥匙多肽融合的本公开的任何实施方式或实施方式组合的笼多肽。
在其他方面,本公开提供了编码本公开的任何实施方式或实施方式组合的融合蛋白的笼多肽、钥匙多肽的核酸;包含可操作地连接到启动子的核酸的表达载体,和/或包含所述核酸和/或表达载体的宿主细胞。在一个实施方式中,将核酸或表达载体整合到宿主细胞染色体中。在另一个实施方式中,核酸或表达载体是游离的。在另一个实施方式中,宿主细胞包括:
(a)可操作地连接到第一启动子的编码本公开的任何实施方式或实施方式组合的笼多肽的第一核酸;和
(b)可操作地连接到第二启动子的编码本公开的任何实施方式或实施方式组合的钥匙多肽的第二核酸,其中第二核酸编码能够结合到由第一核酸编码的笼多肽的结构区域的钥匙多肽,并且其中钥匙多肽与笼多肽的结构区域的结合诱导笼多肽的构象变化。
在本公开的宿主细胞的另一个实施方式中,第一核酸包括编码多种不同笼多肽的多种第一核酸。在一个实施方式中,第二核酸包括编码多种不同钥匙多肽的多种第二核酸,其中所述多种不同钥匙多肽包括能够结合所述多种不同笼多肽的仅子集并诱导该子集中的构象变化的一种或多种钥匙多肽。在另一个实施方式中,第二核酸编码能够结合每种不同笼多肽并诱导每种不同笼多肽中的构象变化的单个钥匙多肽。
在另一个实施方式中,宿主细胞可以包括:
(a)可操作地连接到第一启动子的编码根据本公开的任何实施方式或实施方式组合的融合蛋白的第一核酸;和
(b)可操作地连接到第二启动子的编码根据本公开的任何实施方式或实施方式组合的融合蛋白的第二核酸,其中:
(i)由第一核酸编码的笼多肽被由第二核酸编码的钥匙多肽激活;
(ii)由第一核酸编码的笼多肽未被由第一核酸编码的钥匙多肽激活;
(iii)由第二核酸编码的笼多肽被由第一核酸编码的钥匙多肽激活;并且
(iv)由第二核酸编码的笼多肽未被由第二核酸编码的钥匙多肽激活。
在另一方面,本公开提供了试剂盒,其包含:
(a)根据本公开的任何实施方式或实施方式组合的一种或多种笼多肽;
(b)根据本公开的任何实施方式或实施方式组合的一种或多种钥匙多肽;和
(c)任选地,根据本公开的任何实施方式或实施方式组合的一种或多种融合蛋白。
在一个方面,本公开提供了试剂盒,其包含:
(a)编码根据本公开的任何实施方式或实施方式组合的一个或多个笼多肽的第一核酸;
(b)编码根据本公开的任何实施方式或实施方式组合的一种或多种钥匙多肽的第二核酸;和
(c)任选地,编码根据本公开的任何实施方式或实施方式组合的一种或多种融合蛋白的第三核酸。
在各种实施方式中,第一核酸、第二核酸和/或第三核酸包含表达载体。
在另一方面,本公开提供了LOCKR开关,其包含:
(a)包含结构区域和进一步含有一种或多种生物活性肽的闩锁区域的笼多肽,其中所述结构区域与所述闩锁区域相互作用以防止所述一种或多种生物活性肽的活性;
(b)任选的钥匙多肽,其结合到笼结构区域,从而置换闩锁区域并激活所述一种或多种生物活性肽;和
(c)任选地,当一种或多种生物活性肽被激活时结合到所述一种或多种生物活性肽的一种或多种效应多肽。
在一个实施方式中,存在效应多肽,并且其中效应多肽包括选择性结合到生物活性肽的效应多肽,包括但不限于Bcl2、GFP1-10和蛋白酶。
在各种实施方式中,根据本公开的任何实施方式或实施方式组合的宿主细胞、试剂盒或LOCKR包括一种或多种笼多肽和一种或多种钥匙多肽,所述一种或多种笼多肽和一种或多种钥匙多肽的氨基酸序列沿着其长度分别与表1、表2、表3和/或表4的同一行中的笼多肽和钥匙多肽,或者分别与表2、表3和/或表4的同一行中的笼多肽和钥匙多肽具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的残基)。在其他实施方式中,所述一种或多种生物活性肽可以包括选自由SEQ ID NO:60、62-64、66、27052-27093和27118-27119组成的非限制性组中的一种或多种生物活性肽。
在其他实施方式中,根据本公开的任何实施方式或实施方式组合的宿主细胞、试剂盒或LOCKR包括:
(a)一种或多种笼多肽,所述一种或多种笼多肽包括沿着其长度与选自由SEQ IDNO:1-49、51-52、54-59、61、65、67-14317、27094-27117、27120-27125、27278至27321组成的组中的笼多肽,以及表2、表3和/或表4中列出的笼多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的氨基酸残基)的一种或多种笼多肽,其中所述多肽的N-末端和/或C-末端60个氨基酸是任选的;以及
(b)一种或多种钥匙多肽,所述一种或多种钥匙多肽选自由以下组成的组中的一种或多种多肽:沿着其长度与选自由SEQ ID NO:14318-26601、26602-27015和27016-27051组成的组中的钥匙多肽,以及表2、表3和/或表4中列出的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(不包括任选的氨基酸残基)的多肽。
在另一方面,本公开提供了本文公开的多肽、融合蛋白、核酸、表达载体、宿主细胞、试剂盒和/或LOCKR开关的用途,用于将生物活性肽隔离在笼多肽中,将它们保持在非活性(“关闭”)状态,直到与钥匙多肽组合以诱导激活(“开启”)生物活性肽的构象变化。
附图说明
图1A-1E.LOCKR开关系统的设计。图1A示出了描述我们的设计目标的热力学模型。笼中的结构区域和闩锁区域形成开关,其在打开和关闭状态下具有一定的平衡。钥匙可以结合所述笼以促进打开状态,从而允许靶标结合到闩锁。图1B示出了来自(a)中的模型的两个K
图2A-2D.BimLOCKR的设计和活动。图2A。通过次优的Bim-笼相互作用(左,显示为改变的疏水性堆积和掩埋的氢键)并通过暴露接口末端处的疏水残基(右)作为托底来调整闩锁-笼接口的自由能。B)引入托底允许经由生物层干涉法激活250nM BimLOCKR,并添加5μM钥匙(“开”杆)。C)生物层干涉法显示,用250nM BimLOCKR与Bcl2的钥匙依赖性结合。从0-500s缔合,然后从500-1700s解离。D)每个点都是拟合I中的数据并提取平衡时的响应的结果。曲线用较短的钥匙显示相似的数据,表明能够调整LOCKR的K
图3,正交BimLOCKR的设计和验证。A)左:卡通表示的LOCKR。具有叠加的三个不同闩锁的笼和由标记物标记的氢键网络。右:正交LOCKR接口上的氢键网络b)BimLOCKR响应于其在Octet上的同源钥匙而结合到Bcl2。一次重复c)每个开关(250nM)和钥匙(5μM)对在500秒后对Octet的响应。两次重复的平均值。
图4.实验确定的非对称LOCKR开关设计的x射线晶体结构。(A)设计1-fix-short-BIM-t0的晶体结构,其中含有编码的BIM肽。(B)设计1fix-short-noBim(AYYA)-t0的晶体结构在(左)骨架、(中间)氢键网络和(右)疏水性堆积方面与设计模型非常一致;示出了将对Bim和Gfp11进行编码的闩锁区域;电子密度图示出了网络和疏水截面(中间和右)。
图5.在没有钥匙的情况下,可以防止分拆式GFP11与GFP1-10互补的LOCKR开关。示出了具有链11的GFP(pdb 2y0g)的晶体结构。B.其中GFP11稳定为螺旋的原型开关的晶体结构(网格是电子密度)。C.计算设计模型以
图6.来自图4的设计的GFP11-LOCKR开关,调整为共定位依赖性。(A)
测试系统的示意图,其中共定位依赖性由连接的Spycatcher
图7.笼式内含肽LOCKR开关。当与融合到sfGFP和VMAn内含肽的设计的钥匙混合时,带有编码VMAc内含肽的笼组件的设计的LOCKR开关显示成功激活。SDS-PAGE显示成功的VMAc-VMAn反应,其条带对应于预期的剪接蛋白产物的正确分子量。
图8.多序列比对(MSA),其将原始LOCKR_a笼支架设计与其非对称(1fix-short–noBim(AYYA)-t0)和正交(LOCKRb-f)设计对应物进行比较。在整个MSA中,仅150个(40.8%)位点相同,其中成对同一性%为69.4%。闩锁区域(此MSA中在标记为311的位置处开始的C-末端区域)具有非常小的序列同一性/相似性。(从上到下,SEQ ID NO:17、39、7、8、9、10、11)
图9.1fix-short-noBim(AYYA)-t0(图4B)的晶体结构(白色)在用于制备LOCKRa(图1)的基础支架5L6HC3_1
图10:GFP板测定法,用于发现LOCKR的突变。经由6x-His标签将不同的推定LOCKR构建体粘附到Ni涂覆的96孔板,施加钥匙-GFP,并过量洗涤。所得的荧光代表结合到LOCKR构建体的钥匙-GFP。将截短用作阳性对照,因为钥匙结合到开放接口。单体作为阴性对照,因为其不结合钥匙。误差条代表三次重复的标准偏差。
图11:正交LOCKR GFP测定。A)在五个重新设计的LOCKR构造(b至f)中,闩锁从6x-His标记的笼被截短。对应的钥匙被GFP标记。通过笼的Ni下拉并测量所得的GFP荧光来测量钥匙-笼结合。误差条是三次重复的标准偏差。B)对每个结合来自(a)的钥匙的完整LOCKR构建体给予九个残基托底,并在GFP下拉测定中测试其与所有四个功能钥匙(a至d)的结合。误差条是五次重复的标准偏差。钥匙a被怀疑是混杂的结合,但不是激活的,因为从同三聚体伪对称产生LOCKR。考虑到来自(a)和图3b的结果,LOCKRb显示未结合到其自身钥匙,这归因于闩锁强度。
图12:设计的Mad1-SID LOCKR开关,用于钥匙依赖性转录抑制。(a)Mad1-SID结构域(白色)与mSin3A转录阻遏物的PAH2结构域(黑色)之间相互作用的晶体结构(PDB ID:1E91)。Mad1-SID结构域的锁定应能够实现转录阻遏物mSin3A的钥匙依赖性募集,从而实现精确的表观遗传调控。(b)设计的Mad1-LOCKR开关,其笼组件在不同位置(深灰色)编码Mad1-SID序列。(c)SDS-PAGE凝胶,其显示成功纯化的1fix_302_Mad1(1)、1fix_309_Mad1(2)和MBP_Mad1(3)。(d)Mad1-LOCKR开关与纯化mSin3A-PAH2结构域的钥匙激活结合的生物层干涉分析。MBP-Mad1是mSin3a-PAH2结合的阳性对照。1fix_309_Mad1(309)在与设计的钥匙
图13.笼式STREPII标签LOCKR开关;新2plus1和3plus1 LOCKR开关的演示。(A)设计2+1(左)和3+1(中间)LOCKR开关设计为编码STREPII序列WSHPQFEK(SEQ ID NO:63)。(B-D)证明STREPII-LOCKR设计的功能的生物层干涉法(Octet)数据:将抗链霉亲和素抗体固定在抗小鼠FC尖端上,以评估STREPII标签的结合:(B)设计的蛋白质显示出比阳性对照更少的结合,表明STREPII已按预期被至少部分地隔离。(C)通过3plus1_key_3激活设计STREPII-3plus1_Lock_3:曲线为250nM笼,无钥匙,相比之下,在范围从121nM至6000nM的增加浓度的钥匙存在下,为250nM笼。(D)在370nM、1111nM和3333nM的钥匙存在下的250nMSTREPII-3plus1_Lock_3;没有钥匙的250nM笼为250nM,并且其他图为相同浓度(370nM、1111nM和3333nM)但没有笼时的钥匙。在所有Octet图中,左半部分是缔合(结合)步骤,并且右半部分是解离步骤。
图14. 3plus1 LOCKR开关响应于钥匙的表达激活GFP荧光。设计了LOCKR开关,其中将3plus1笼用于隔离处于非活性构象的GFP的链11(GFP11),从而防止了分拆式GFP(由GFP1-10和GFP11构成)的重构,从而产生了荧光。制备了表达质粒以诱导表达笼(p15a复制起点、壮观霉素抗性、控制GFP1-10和LOCKR笼式GFP11表达的阿拉伯糖诱导型启动子)和钥匙(colE1复制起点、卡那霉素抗性和IPTG诱导型启动子)。根据制造商的方案,使用单独的笼质粒或使用笼和钥匙质粒两者转化化学活性大肠杆菌Stellar细胞(Takarabio)。将这些转化在补充有壮观霉素(单独的笼)或壮观霉素+卡那霉素(笼和钥匙)的液体LB培养基中于37℃下过夜生长。将所得培养物以1/100稀释到新鲜的LB培养基中,所述LB培养基补充有适当的抗生素和单独的阿拉伯糖(诱导笼和GFP1-10的表达)或阿拉伯糖和IPTG两者(诱导笼、GFP1-10和钥匙的表达),然后使其在37℃下生长16小时。将200uL每种表达培养物在200uLPBS中洗涤一次,重悬于200uL PBS中,并转移到黑壁96孔板。在Biotek Synergy H1MF读板仪上评估GFP荧光(激发/发射479/520nM)。单独的笼的荧光极少,这证实了在没有钥匙的情况下,LOCKR蛋白阻止了分拆式GFP的激活。钥匙表达的诱导导致SEQ ID NO 27192、27198、27194、27202、27206和27210的荧光大大增加。这些结果证明3plus1 LOCKR体系结构能够控制生物活性肽GFP11的功能。
具体实施方式
引用的所有参考文献均通过引用整体并入本文。在本申请中,除非另有说明,否则所使用的技术可以在诸如以下的几个熟知参考文献的任一个中找到:Molecular Cloning:A Laboratory Manual(Sambrook等人,1989,Cold Spring Harbor Laboratory Press)、Gene Expression Technology(Methods in Enzymology,第185卷,由D.Goeddel编辑,1991.Academic出版社,San Diego,CA)、“Guide to Protein Purification”in Methodsin Enzymology(M.P.Deutshcer编辑,(1990)Academic Press,Inc.);PCR Protocols:AGuide to Methods and Applications(Innis等人1990.Academic出版社,San Diego,CA)、Culture of Animal Cells:A Manual of Basic Technique,第2版(R.I.Freshney.1987.Liss,Inc.New York,NY)、Gene Transfer and ExpressionProtocols,第109-128页,E.J.Murray编辑,The Humana出版社Inc.,Clifton,N.J.)和theAmbion 1998Catalog(Ambion,Austin,TX)。
除非上下文另有明确规定,否则如本文所用,单数形式“一个”、“一种”和“所述”包括复数指示物。如本文所用,“和”与“或”可互换使用,除非另外明确说明。
如本文所用,氨基酸残基缩写如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C);谷氨酸(Glu;E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G);组氨酸(His;H)、异亮氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、蛋氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val;V)。
除非上下文另有明确规定,否则本公开任何方面的所有实施方式均可以组合使用。
除非上下文清楚地另外要求,否则在整个说明书和权利要求中,词语“包括”、“包含”等应在包含性的意义上解释,而不是在排他性或穷举的意义上;也就是说,在“包含但不限于”的意义上解释。使用单数或复数的词语也分别包括复数和单数。另外,词语“本文”、“以上”和“以下”和类似含义的词语在本申请中使用时应是指整个本申请而非本申请的任何特定部分。
本公开的实施方式的描述并非旨在穷举或将本公开限制为所公开的精确形式。虽然本文出于说明性目的描述了本公开的具体实施方式和实施例,但是如相关领域的技术人员将认识到的,在本公开的范围内可以进行各种等同性修改。
在第一方面,本公开提供了非天然存在的多肽,其包含:
(a)包含2至7个α-螺旋的螺旋束;和
(b)连接每个α螺旋的氨基酸接头。
本公开的该第一方面的非天然存在的多肽可以例如用作本文详细公开的新型蛋白质开关的“笼”多肽组件(其在这里也可以称为“锁”)。蛋白质开关可以例如用于隔离笼多肽中的生物活性肽,保持它们处于非活性(“关闭”)状态,直到与本文公开的新型蛋白质开关的第二种组件(“钥匙”多肽)组合;钥匙多肽诱导激活(“开启”)生物活性肽的构象变化(参见图1A)。本文所述的多肽包括首个全新设计的多肽,其可以响应于蛋白质结合而经历构象转换。此外,还没有已知的天然蛋白质能够像本文公开的多肽那样以模块化、可调的方式进行转换。
所述多肽是“非天然存在的”,因为在任何天然存在的多肽中都找不到所述完整的多肽。应理解,所述多肽的组件可以是天然存在的,包括但不限于可以包括在一些实施方式中的生物活性肽。
笼多肽包含螺旋束,所述螺旋束包含2至7个α-螺旋。在各种实施方式中,螺旋束包含3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、2、3、4、5、6或7个α螺旋。
本公开的螺旋束笼多肽的设计可以通过任何合适的方式进行。在一个非限制性实施方式中,可以基于盘绕线圈的Crick表达,使用Rosetta
每个α螺旋可以具有任何合适的长度和适合于预期用途的氨基酸组成。在一个实施方式中,每个螺旋的长度独立地为38至58个氨基酸。在各种实施方式中,每个螺旋的长度独立地为18-60、18-55、18-50、18-45、22-60、22-55、22-50、22-45、25-60、25-55、25-50、25-45、28-60、28-55、28-50、28-45、32-60、32-55、32-50、32-45、35-60、35-55、35-50、35-45、38-60、38-55、38-50、38-45、40-60、40-58、40-55、40-50或40-45个氨基酸。
连接每个α螺旋的氨基酸接头可以具有任何合适的长度或适合于预期用途的氨基酸组成。在一个非限制性实施方式中,每个氨基酸接头的长度独立地为2至10个氨基酸,其中不包括可与所述接头融合的任何其他功能序列。在各种非限制性实施方式中,每个氨基酸接头的长度独立地为3-10、4-10、5-10、6-10、7-10、8-10、9-10、2-9、3-9、4-9、5-9、6-9、7-9、8-9、2-8、3-8、4-8、5-8、6-8、7-8、2-7、3-7、4-7、5-7、6-7、2-6、3-6、4-6、5-6、2-5、3-5、4-5、2-4、3-4、2-3、2、3、4、5、6、7、8、9或10个氨基酸。在所有实施方式中,接头可以是结构化的或柔性的(例如聚-GS)。这些接头可以编码其他功能序列,包括但不限于蛋白酶切割位点或分裂内含肽系统的一半(参见以下序列)。
该第一方面的多肽包括被称为“闩锁区域”的区域,用于插入生物活性肽。因此,笼多肽包含闩锁区域和结构区域(即:笼多肽的不是闩锁区域的其余部分)。当闩锁区域被修饰以包括一种或多种生物活性肽时,笼多肽的结构区域与闩锁区域相互作用以防止生物活性肽的活性。在被钥匙多肽激活后,闩锁区域与其与结构区域的相互作用解离,以暴露出生物活性肽,从而使肽发挥功能。
如本文所用,“生物活性肽”是具有任何长度或氨基酸组成的任何肽,其能够选择性地结合到限定的靶标(即:能够结合到“效应”多肽)。此类生物活性肽可以包括
处于非活性构象的所有三种类型的二级结构的肽:α螺旋、β链和环。此方面的多肽可以用于控制大范围功能肽的活性。使用严格的诱导型控制来利用这些生物学功能的能力可用于例如工程化细胞(功能的诱导型激活、工程化复杂的逻辑行为和电路等)、开发传感器、开发基于诱导型蛋白质的治疗剂以及创造新的生物材料。
闩锁区域可以存在于笼多肽的任一末端附近。在一个实施方式中,将闩锁区域放置在C-末端螺旋处,以便定位生物活性肽用于最大程度地掩埋需要隔离的功能残基,以将生物活性肽保持在非活性状态,同时掩埋疏水性残基并促进极性残基的溶剂暴露/补偿性氢键。在各种实施方式中,闩锁区域可以在N-末端或C-末端部分处包含笼多肽中的单个α螺旋的一部分或全部。在各种其他实施方式中,闩锁区域可以包含笼多肽中的第一、第二、第三、第四、第五、第六或第七个α螺旋的一部分或全部。在其他实施方式中,闩锁区域可以包含笼多肽中的两个或更多个不同α螺旋的全部或部分;例如,一个α螺旋的C-末端部分和下一个α螺旋的N-末端部分,所有两个连续的α螺旋等。
在另一个实施方式中,该第一方面的多肽在闩锁区域内包含一种或多种生物活性肽。在此实施方式中,生物活性肽可以替代闩锁区域中的一个或多个氨基酸,或者可以被添加到闩锁区域中,而不从闩锁区域去除任何氨基酸残基。在各种非限制性实施方式中,生物活性肽可以包含SEQ ID NO:60、62-64、66、27052-27093和27118-27119的以下各项(括号中的所有序列均是任选的)中的一种或多种或其变体:
·GFP11荧光肽和GFP1-10结合肽:RDHMVLHEYVNAAGIT(SEQ ID NO:27052)
·BIM结合肽和BCL-2的凋亡肽:IxxxLRxIGDxFxxxY(SEQ ID NO:50),其中x是任何氨基酸;在一个实施方式中,所述肽是EIWIAQELRRIGDEFNAYYA(SEQ ID NO:60)
·结合BCL-2的设计肽:KMAQELIDKVRAASLQINGDAFYAILRAL(SEQ ID NO:62)
·streptactin的StreptagII结合肽或抗体:(N)WSHPQFEK(SEQ ID NO:63)
·TEV蛋白酶切割位点:ENLYFQ(G)-X(SEQ ID NO:64),其中(G)也可以是S,最后一位,-X可以是除脯氨酸之外的任何东西
·凝血酶蛋白酶切割位点:LVPRGS(SEQ ID NO:66)
·组织蛋白酶切割位点:RLVGFE(SEQ ID NO:27053)
·spycatcher的Spytag共价交联肽:AHIVMVDAYK(PTK)(SEQ ID NO:27054)
·将蛋白质靶向细胞核的NLS肽:AAAKRARTS(SEQ ID NO:27055)
·将蛋白质从细胞核中排除的NES1肽:LALKLAGLDIN(SEQ ID NO:27056)
·将蛋白质从细胞核中排除的NES2肽:ELAEKLAGLDIN(SEQ ID NO:27057)
·将蛋白质从细胞核中排除的NES3肽:ELAEKLRAGLDLN(SEQ ID NO:27058)
·募集DNA甲基化酶的EZH2结合肽:TMFSSNRQKILERTETLNQEWKQRRIQ(SEQ ID NO:27059)
·募集p53的MDM2结合肽:ETFSDLWKLL(SEQ ID NO:27060)
·CP5结合肽:GELDELVYLLDGPGYDPIHSDVVTRGGSHLFNF(SEQ ID NO:27061)
·用于转录激活的9aaTAD1:TMDDVYNYLFDD(SEQ ID NO:27062)
·用于转录激活的9aaTAD2:LLTGLFVQYLFDD(SEQ ID NO:27063)
·用于转录激活的9aaTAD3:DDAVVESFFSS(SEQ ID NO:27064)
·用于转录激活的9aaTAD4:GDFLSDLFD(SEQ ID NO:27065)
·用于转录激活的9aaTAD5:GDVLSDLVD(SEQ ID NO:27066)
·Mad1-SID-表观遗传修饰:NIQMLLEAADYLE(SEQ ID NO:27067)
·Mad1-SID(3A突变体)-表观遗传修饰:NIAMLLAAAAYLE(SEQ ID NO:27068)
·来自ZBP1的RHIM结构域1:IQIG(SEQ ID NO:27069)
·来自ZBP1的RHIM结构域2:VQLG(SEQ ID NO:27070)
·nanoBit拆分荧光素酶:VSGWRLFKKIS(SEQ ID NO:27071)
·CC-A:GLEQEIAALEKENAALEWEIAALEQGG(SEQ ID NO:27072)
·CC-B:GLKQKIAALKYKNAALKKKIAALKQGG(SEQ ID NO:27073)
·GCN4:RMKQLEDKVEELLSKNYHLENEVARLKKLVGER(SEQ ID NO:27074)
·CC-Di:GEIAALKQEIAALKKENAALKWEIAALKQG(SEQ ID NO:27075)
·破坏膜/穿透细胞的肽:
·用于膜破坏的GALA:WEAALAEALAEALAEHLAEALAEALEALAA(SEQ ID NO:27076)
·Aurein 1.2:GLFDIIKKIAESF(SEQ ID NO:27077)
·Magainin-1:GIGKFLHSAGKFGKAFVGEIMKS(SEQ ID NO:27078)
·Magainin-2:GIGKFLHSAKKFGKAFVGEIMNS(SEQ ID NO:27079)
·蜂毒溶血肽:GIGAVLKVLTTGLPALISWIKRKRQQ(SEQ ID NO:27080)
·Mastoparan X:INWKGIAAMAKKLL(SEQ ID NO:27081)
·杀菌肽A:KWKLFKKIEKVGQNIRDGIIKAGPAVAVVGQATQIAK(SEQ ID NO:27082)
·杀菌肽P1:SWLSKTAKKLENSAKKRISEGIAIAIQGGPR(SEQ ID NO:27083)
·Citropin 1.1:GLFDVIKKVASVIGGL(SEQ ID NO:27084)
·Temporin-1Lb:NFLGTLINLAKKIL(SEQ ID NO:27085)
·HPV33 L2肽:SYFILRRRRKRFPYFFTDVRVAA(SEQ ID NO:27086)
·腺病毒pVI膜融合结构域:AFSWGSLWSGIKNFGSTVKNY(SEQ ID NO:27087)
·来自兽棚病毒的γ-1肽:ASMWERVKSIIKSSLAAASNI(SEQ ID NO:27088)
·脊髓灰质炎病毒2B成孔肽:VTSTITEKLLKNLIKIISSLVIITRNYEDTTTVLATLALLGCDASPWQWL(SEQ ID NO:27089)
·鼻病毒成孔肽:IAQNPVENYIDEVLNEVLVVPNIN(SEQ ID NO:27090)
·流感HA2成孔肽:FLGIAEAIDIGNGWEGMEFG(SEQ ID NO:27091)
·流感HA2衍生物:GLFGAIAGFIENGWEGMIDG(SEQ ID NO:27092)
·HA衍生的INF6:GLFGAIAGFIENGWEGMIDGWYG。(SEQ ID NO:27093)
·KRAB结构域-表观遗传修饰:(SEQ ID NO:27118)MDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLV
·最小Krab结构域(KOX1 11-55)-表观遗传修饰:(SEQ ID NO:27119)RTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGY
在一个实施方式中,可以通过以下来调整由钥匙多肽激活的动态范围:截短闩锁区域长度使其短于结构区域中的α-螺旋,同时减弱笼多肽-latch区域的相互作用,并在笼多肽上打开暴露区域,钥匙多肽可以结合到所述区域以作为“托底”(图2)。类似地,还可以通过在闩锁中设计减弱笼多肽-latch区域相互作用的突变,以类似的方式来调整由钥匙多肽激活的动态范围(图1-2和10)。在其他实施方式中,闩锁区域可以是一个或多个螺旋,其总长度在18-150个氨基酸之间、18-100个氨基酸之间、18-58个氨基酸之间或这些范围所涵盖的任何范围。在其他实施方式中,闩锁区域可以由螺旋二级结构、β链二级结构、环二级结构或其组合组成。
在第二方面,本公开提供了非天然存在的多肽,其包括沿着其长度与本文公开的笼多肽(诸如SEQ ID NO:1-49、51-52、54-59、61、65、67-91、92-2033(在2018年7月19日提交的美国临时申请序列号62/700681和/或2018年12月27日提交的美国临时申请序列号62/785537中作为附录1递交)、SEQ ID NO:2034-14317(在2018年7月19日提交的美国临时申请序列号62/700681和/或2018年12月27日提交的美国临时申请序列号62/785537中作为附录2递交)、27094-27117、27120-27125、27278至27321,以及表2(具有SEQ ID NO:27126和27276之间的偶数个SEQ ID NO的多肽)、表3和/或表4中列出的笼多肽)的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽,不包括任选的氨基酸残基,并且任选地不包括闩锁区域中的氨基酸残基。在每个实施方式中,每个笼多肽的N-末端和/或C-末端60个氨基酸可以是任选的,因为末端60个氨基酸残基可以包含可以诸如通过替代全部或部分具有生物活性肽的闩锁而被修饰的闩锁区域。在一个实施方式中,N-末端60个氨基酸残基是任选的;在另一个实施方式中,C-末端60个氨基酸残基是任选的;在另一个实施方式中,N-末端60个氨基酸残基和C-末端60个氨基酸残基中的每一个均是任选的。在一个实施方式中,在确定序列同一性百分比中不包括这些任选的N-末端和/或C-末端60个残基。在另一个实施方式中,可以在确定序列同一性百分比中包括任选的残基。
如本文所公开的,将被本公开的多肽隔离的生物活性肽位于闩锁区域内。闩锁区域在每个笼多肽的序列中用括号表示。可以将生物活性肽添加到闩锁区域而不去除闩锁区域的任何残基,或者可以替代笼支架闩锁区域中的一个或多个(1、2、3、4、5、6、7、8、9、10或更多个)氨基酸残基以产生最终多肽。因此,当包含生物活性肽时,闩锁区域可以被显著修饰。在一个实施方式中,在确定序列同一性百分比中不包括任选的残基。在另一个实施方式中,可以在确定序列同一性百分比中包括闩锁区域残基。在另一个实施方式中,可以在确定序列同一性百分比中不包括任选的残基和闩锁残基中的每一个。
在此第二方面的一个实施方式中,所述多肽是根据第一方面的任何实施方式或实施方式组合的多肽,并且还沿着其长度与本文公开的所示参考笼多肽的氨基酸序列具有所需的40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在另一个实施方式中,多肽进一步包含在(或替代)笼多肽的闩锁区域内的生物活性肽。
笼多肽可以是笼支架多肽(即:没有生物活性肽),例如,参见SEQ ID NO:1-17、2034-14317,以及表2、表3和/或表4中列出的某些笼多肽,或者可以进一步在笼支架多肽的闩锁区域中包括隔离生物活性肽(作为与笼支架多肽的融合体存在),如本文中更详细描述的(例如参见SEQ ID NO:18-49、51-52、54-59、61、65、67-2033、27094-27117、27120-27125,以及表2、3和/或4中列出的某些笼多肽)。在一个具体实施方式中,笼多肽沿着其长度与表2、表3和/或表4中笼多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在另一个具体实施方式中,笼多肽沿着其长度与表3中笼多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在另一个具体实施方式中,笼多肽沿着其长度与表4中笼多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在这些实施方式各自的一个实施方式中,在确定序列同一性百分比中不包括任选的N-末端和/或C-末端60个残基。在另一个实施方式中,可以在确定序列同一性百分比中包括任选的残基。
如以下实施例中所公开的,已经鉴定了本公开的示例性笼和钥匙多肽并进行了突变分析。此外,从相同的示例性笼和钥匙多肽开始的不同设计产生不同的氨基酸序列,同时保持了相同的预期功能。在各种实施方式中,给定的氨基酸可以被具有相似生理化学特征的残基替代,例如用一个脂肪族残基取代另一个(诸如Ile、Val、Leu或Ala彼此间的取代),或用一个极性残基取代另一个(诸如在Lys与Arg之间;Glu与Asp之间;或Gln与Asn之间)。其他此类保守取代(例如具有相似疏水性特征的整个区域的取代)是已知的。可以在本文所述的任一种测定中测试包含保守氨基酸取代的多肽,以确认保留所需活性。氨基酸可根据其侧链特性的相似性进行分组(A.L.Lehninger,Biochemistry,第二版,第73-75页,WorthPublishers,纽约(1975)):(1)非极性:Ala(A)、Val(V)、Leu(L)、Ile(I)、Pro(P)、Phe(F)、Trp(W)、Met(M);(2)不带电荷的极性:Gly(G)、Ser(S)、Thr(T)、Cys(C)、Tyr(Y)、Asn(N)、Gln(Q);(3)酸性:Asp(D)、Glu(E);(4)碱性:Lys(K)、Arg(R)、His(H)。可替代地,可以基于共同的侧链特性将天然存在的残基分组:(1)疏水性:正亮氨酸、Met、Ala、Val、Leu、Ile;(2)中性亲水性:Cys、Ser、Thr、Asn、Gln;(3)酸性:Asp、Glu;(4)碱性:His、Lys、Arg;(5)影响链取向的残基:Gly、Pro;(6)芳香族:Trp、Tyr、Phe。非保守取代将需要将这些类别之一的成员交换为另一类别。特定的保守取代包括例如:Ala变为Gly或变为Ser;Arg变为Lys;Asn变为Gln或变为His;Asp变为Glu;Cys变为Ser;Gln变为Asn;Glu变为Asp;Gly变为Ala或变为Pro;His变为Asn或变为Gln;Ile变为Leu或变为Val;Leu变为Ile或变为Val;Lys变为Arg、变为Gln或变为Glu;Met变为Leu、变为Tyr或变为Ile;Phe变为Met、变为Leu或变为Tyr;Ser变为Thr;Thr变为Ser;Trp变为Tyr;Tyr变为Trp;和/或Phe变为Val、变为Ile或变为Leu。
示例性笼多肽(也见SEQ ID NO:92-14317、27094-27117、27120-27125、27728-27321,以及表2、表3和/或表4中列出的笼多肽):
1)示例性参考笼多肽;由括号[]表示的闩锁区域
·6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本
·融合的功能结构域(DARPin、分裂内含肽的组分和荧光蛋白)是粗体文本
·功能肽是斜体带下划线的文本
·已突变为任何氨基酸以调整响应性的示例性位置是带下划线的加粗文本。这些位置是示例性的,而不是能够调整响应性的残基的详尽列表。
·括号中包含了可以被去除以调整响应性的C-末端序列。从C-末端开始,并去除其中的连续残基,可以去除括号中一(1)至所有残基的范围。
·括号中的所有序列均是任选的
>SB76L(SEQ ID NO:1)
>SB76L_17(SEQ ID NO:2)
(
>SB76L_18(SEQ ID NO:3)
(
>LOCKR_extend5(SEQ ID NO:4)
(
>LOCKR_extend9(SEQ ID NO:5)
(
>LOCKR_extend18(SEQ ID NO:6)
(
>LOCKRb(SEQ ID NO:7)
(
>LOCKRc(SEQ ID NO:8)
(
>LOCKRd(SEQ ID NO:9)
(
>LOCKRe(SEQ ID NO:10)
(
>LOCKRf(SEQ ID NO:11)
(
>miniLOCKRa_1(SEQ ID NO:12)
(
>miniLOCKRa_2(SEQ ID NO:13)
(
>miniLOCKRc_1(SEQ ID NO:14)
(
>miniLOCKRc_2(SEQ ID NO:15)
(
>1fix-short-noBim-t0(SEQ ID NO:16)
(
>1fix-short-noBim(AYYA)-t0(SEQ ID NO:17)
(
“(3)具有编码到闩锁中的生物活性肽的功能性LOCKR笼式设计”,
>aBcl2LOCKR(SEQ ID NO:18)
>pBimLOCKR(SEQ ID NO:19)
>BimLOCKR_extend5(SEQ ID NO:20)
>BimLOCKR_extend9(SEQ ID NO:21)
(
>BimLOCKR_extend18(SEQ ID NO:22)
>BimLOCKRb(SEQ ID NO:23)
>BimLOCKRc(SEQ ID NO:24)
>BimLOCKRd(SEQ ID NO:25)
>StrepLOCKRa_300(SEQ ID NO:26)
>strepLOCKRa_306(SEQ ID NO:27)
>strepLOCKRa_309(SEQ ID NO:28)
>strepLOCKRa_312(SEQ ID NO:29)
>strepLOCKRa_313(SEQ ID NO:30)
>strepLOCKRa_317(SEQ ID NO:31)
>strepLOCKRa_320(SEQ ID NO:32)
>strepLOCKRa_323(SEQ ID NO:33)
>strepLOCKRa_329(SEQ ID NO:34)
>SB13_LOCKR(SEQ ID NO:35)
>ZCX12_LOCKR(SEQ ID NO:36)
>SB13_LOCKR_extend18(SEQ ID NO:37)
>ZCX12_LOCKR_extend18(SEQ ID NO:38)
>fretLOCKRa(SEQ ID NO:39)
>fretLOCKRb(SEQ ID NO:40)
>fretLOCKRc(SEQ ID NO:41)
>fretLOCKRd(SEQ ID NO:42)
>tevLOCKR(SEQ ID NO:43)
>spyLOCKR(SEQ ID NO:44)
>1_nesLOCKR(SEQ ID NO:45)
>2_nesLOCKR(SEQ ID NO:46)
>3_nesLOCKR(SEQ ID NO:47)
>nlsLOCKR(SEQ ID NO:48)
>ezh2LOCKR(SEQ ID NO:49)
>1fix_VMAc_C_BIMlatcht9(SEQ ID NO:51)
>sfGFP_VMAn_1fix_BIM_t0_latch(SEQ ID NO:52)
编码Bim和GFP11的非对称功能笼(即:生物活性肽)
(6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本)
(共定位结构域是粗体文本)
(功能肽是斜体带下划线的文本)
(可以突变为任何氨基酸以调整响应性的位置是带下划线的加粗文本)
(可以被去除以调整响应性的C-末端序列是斜体文本)
(括号中的所有序列均是任选的)
>1fix-long-BIM-t0(SEQ ID NO:54)
>1fix-long-GFP-t0(SEQ ID NO:55)
>1fix-short-BIM-t0(SEQ ID NO:56)
>1fix-short-GFP-t0(SEQ ID NO:57)
>Spycatcher-1fix-long-GFP-t0(SEQ ID NO:58)
>Spycatcher-1fix-short-GFP-t0(SEQ ID NO:59)
>1fix-latch_Mad1SID_t0_1(SEQ ID NO:61)
>1fix-latch_Mad1SID_T0_2(SEQ ID NO:65)
>1fix-short-Bim-t0-relooped(SEQ ID NO:67)
>1fix-short-spytag-t0_2(SEQ ID NO:68)
>1fix-short-spytag-t0_8(SEQ ID NO:69)
>1fix-short-TEV-t0_1(SEQ ID NO:70)
>1fix-short-TEV-t0_6(SEQ ID NO:71)
>1fix-short-nanoBit-t0_1(SEQ ID NO:72)
>1fix-short-nanoBit-t0_3(SEQ ID NO:73)
>1fix-short-RHIM-t0_8(SEQ ID NO:74)
>1fix-short-RHIM-t0_19(SEQ ID NO:75)
>1fix-short-RHIM-t0_22(SEQ ID NO:76)
>1fix-short-gcn4-t0_4(SEQ ID NO:77)
(
>1fix-short-ccDi-t0_6(SEQ ID NO:78)
>1fix-short-cc-a-t0_6(SEQ ID NO:79)
>1fix-short-cc-b-t0_6(SEQ ID NO:80)
STREPII-LOCKR功能笼:
>STREPII-2plus1_LOCK_1(SEQ ID NO:81)
>STREPII-2plus1_LOCK_2(SEQ ID NO:82)
>STREPII-2plus1_LOCK_3(SEQ ID NO:83)
>STREPII-2plus1_LOCK_4C(SEQ ID NO:84)
>STREPII-2plus1_LOCK_4N(SEQ ID NO:85)
>STREPII-3plus1_LOCK_1(SEQ ID NO:86)
>STREPII-3plus1_LOCK_2(SEQ ID NO:87)
>STREPII-3plus1_LOCK_3(SEQ ID NO:88)
>STREPII-3plus1_LOCK_4(SEQ ID NO:89)
>STREPII-3plus1_LOCK_3-relooped(SEQ ID NO:90)
>STREPII-2plus1_LOCK_3-relooped(SEQ ID NO:91)
>BimLOCKR_a_short_Nterm(SEQ ID NO:27094)
>BimLOCKR_g(SEQ ID NO:27095)
>reloop_strepLOCKRh(SEQ ID NO:27096)
>reloop_strepLOCKRi(SEQ ID NO:27097)
>spyLOCKRa_2(SEQ ID NO:27098)
>spyLOCKRa_8(SEQ ID NO:27099)
>tevLOCKRa_1(SEQ ID NO:27100)
>tevLOCKRa_6(SEQ ID NO:27101)
>lucLOCKRa_1(SEQ ID NO:27102)
>lucLOCKRa_3(SEQ ID NO:27103)
>rhimLOCKRa_8(SEQ ID NO:27104)
>rhimLOCKRa_19(SEQ ID NO:27105)
>rhimLOCKRa_22(SEQ ID NO:27106)
>gcn4LOCKRa_4(SEQ ID NO:27107)
>cc-DiLOCKRa_6(SEQ ID NO:27108)
>cc-aLOCKRa_6(SEQ ID NO:27109)
>cc-bLOCKRa_6(SEQ ID NO:27110)
>tev-spyLOCKRa_short_40(SEQ ID NO:27111)
>tev-spyLOCKRa_short_57(SEQ ID NO:27112)
>tev-spyLOCKRa_short_63(SEQ ID NO:27113)
>tev-spyLOCKRa_29(SEQ ID NO:27114)
>tev-spyLOCKRa_32(SEQ ID NO:27115)
>Bim-fretLOCKRa_short(SEQ ID NO:27116)
>fretLOCKRa_short(SEQ ID NO:27117)
E18_KRAB_full(SEQ ID NO:27120)
E18_KRAB_N13t(SEQ ID NO:27121)
E18_KRAB_C9t(SEQ ID NO:27122)
E18_KRAB_Cterm1(SEQ ID NO:27123)
E18_KRAB_Cterm2(SEQ ID NO:27124)
E18_KRAB_Cterm3(SEQ ID NO:27125)
>3plus1_cage_Nterm_GFP11_668(SEQ ID NO:27278)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRDHMVLHEYVNAAGITLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIEANERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_cage_Cterm_GFP11_668(SEQ ID NO:27279)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADADHMVLHEYVNAAGITIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_cage_Cterm_GFP11_668(SEQ ID NO:27280)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADARDHMVLHEYVNAAGITRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_cage_Cterm_GFP11_668(SEQ ID NO:27281)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRETRGADALSRDHMVLHEYVNAAGITLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_cage_Cterm_GFP11_668(SEQ ID NO:27282)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSLDAKELLKTLEDLLREVLEVARRVVETLKELNRRVLEVVREDIERNERLLRRVLDTLRRGGVDERRIKDLERLIRESLKKAEEVLREAAEKSREIVDEIREVLKRADEALKRIIKKIRDHMVLHEYVNAAGITLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_cage_Nterm_GFP11_669(SEQ ID NO:27283)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRDHMVLHEYVNAAGITRLKEVLDRSGLDIDTIIKEVEDLLKTVLDRLRELLDKIARLTKEAIEVVREIIERIVRHAERVKDELRKGGADKRKLDRVDRLIKENTRHLKEILDRIEDLVRRSEKKLRDIIREVRRLIEELRKKAEEIKKDPDERLVKTLIEDVERVIKRILELITRVAEDNERVLERIIRELTDNLERHLKIVREIVK
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27284)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIERDHMVLHEYVNAAGITISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Cterm_GFP11_670(SEQ ID NO:27285)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEARDHMVLHEYVNAAGITRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Cterm_GFP11_670(SEQ ID NO:27286)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDERDHMVLHEYVNAAGITIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Cterm_GFP11_670(SEQ ID NO:27287)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGRDHMVLHEYVNAAGITRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27288)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIRDHMVLHEYVNAAGITEISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Cterm_GFP11_670(SEQ ID NO:27289)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTRDHMVLHEYVNAAGITRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27290)
SEKEDLARKLRKLVEELTREYEELVKKLERLIERDHMVLHEYVNAAGITLREISEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27291)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKRDHMVLHEYVNAAGITSEEVRKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27292)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESRDHMVLHEYVNAAGITKLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Nterm_GFP11_670(SEQ ID NO:27293)
SEKEDLARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRDHMVLHEYVNAAGITLGTDERVLKRLLERLRRIIEEDHELNTELLKRLLDLLKEILDTSRELLKRLLDILRKGVRDEEVLRDLERTLREVLEENERAIEEAERVLRKVLEDSERAVRDARRVLAEVDKSPTGDEALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_cage_Cterm_GFP11_671(SEQ ID NO:27294)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRAVKKLDRDHMVLHEYVNAAGITNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_cage_Cterm_GFP11_671(SEQ ID NO:27295)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRARDHMVLHEYVNAAGITDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_cage_Cterm_GFP11_671(SEQ ID NO:27296)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLDSRRDHMVLHEYVNAAGITEDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_cage_Cterm_GFP11_671(SEQ ID NO:27297)
SEEEDLLERVKRVLDELIEIVDRNHELNRRVVETSAALVERLLEEVERALETLEREIPGSSLLDKAIKDLRDVLRRVKEKVKRSIEELKEVLEESRRVLEEVVRKLREVIDRVRRLVEKGVDLRDLIRELKRVLEEAVKLIERLVRLNTRAAEKDNESLRELVRAIKEALKRAVDAVRKGGLRDHMVLHEYVNAAGITKKLEDVVRRNEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_cage_Cterm_GFP11_672(SEQ ID NO:27298)
DETEEVIKKIAKLIDELIETLKKIVEDSAKLIKELIDLLEEIIKRSADLIRELEKVSKRGDRDRLKKLIDRMRRETERALEELRRVIEELKEATERALKTIEDLIREIEEAIRRELGDEDLAREILEVIRRILELLREDMELNLRALEEILRLLEEVIKLNKDAIDEILELLKRDHMVLHEYVNAAGITESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_cage_Cterm_GFP11_672(SEQ ID NO:27299)
DETEEVIKKIAKLIDELIETLKKIVEDSAKLIKELIDLLEEIIKRSADLIRELEKVSKRGDRDRLKKLIDRMRRETERALEELRRVIEELKEATERALKTIEDLIREIEEAIRRELGDEDLAREILEVIRRILELLREDMELNLRALEEILRLLEEVIKLNKDAIDEILELLKGRDHMVLHEYVNAAGITSKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27300)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLARDHMVLHEYVNAAGITEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27301)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRRDHMVLHEYVNAAGITGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Cterm_GFP11_67>3(SEQ ID NO:27302)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEARDHMVLHEYVNAAGITRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27303)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERARDHMVLHEYVNAAGITELREKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27304)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDHMVLHEYVNAAGITKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27305)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLRDHMVLHEYVNAAGITEKGVPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_67>3(SEQ ID NO:27306)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLRDHMVLHEYVNAAGITPEELIKVLEEVAKTSIDLNKEVIDVIRRVIEESLELNKRVLDVLRRVLDIAARKGRDKKAIRDVVREAARVIKEVIDEDEKVNRDLKRVIERVIDDDRKALERLRKAVEEVASRGDDEAAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_cage_Nterm_GFP11_674(SEQ ID NO:27307)
SEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKRDHMVLHEYVNAAGITKEILDVIREHVRTNKEILDRVLEVVEEHLRRNKEILDKLLDDIRKVVEDAKRILGIGDDETLRRAVRRILEELRKLVEDIRKKVKDSLETLERALEEAEERIRRSLEDLKRVLKEAKDKTKDKDRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_cage_Cterm_GFP11_674(SEQ ID NO:27308)
SEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGVPKEILDVIREHVRTNKEILDRVLEVVEEHLRRNKEILDKLLDDIRKVVEDAKRILGIGDDETLRRAVRRILEELRKLVEDIRKKVKDSLETLERALEEAEERIRRSLEDLKRVLKEAKDKTKDKDRDHMVLHEYVNAAGITKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_cage_Nterm_GFP11_675(SEQ ID NO:27309)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELRDHMVLHEYVNAAGITPEELLRVIAKVLETNKRILDDLLRVVKKHVDLNKEILDRILEMIKEIVERVKRVLGDGDEKTLRDKIRDIIRRLEDAAREAEERVRRSLEELKKAVEKIRKKIEDSLRELEEALKRVRDKEEDDKRLEDISRLVKRLLDESRRVLRELEETIRKRAEESKRVLEEVKRLVEKLIRELRKEAE
>3plus1_cage_Nterm_GFP11_676(SEQ ID NO:27310)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKRDHMVLHEYVNAAGITDRVLDEVKRIGDVETVLRLAIEAVRRALEIVRKVTEDLIRVVRKLLEIVDAVNKRVKKAVEDVLKLLRDTLKGSKDVERVLDEARRLLEKLHRDSRRILKRIAELLDELKELSERILERIKRLLEEVERRGSDDERLLEELIEELKDLIRRHIELLRRLIERLKELLKKHIEDLRRLLEEIEKLLEEARK
>3plus1_cage_Nterm_GFP11_677(SEQ ID NO:27311)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRDHMVLHEYVNAAGITSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGEISEDDLKRVVDEVEKKLRELKRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_cage_Cterm_GFP11_677(SEQ ID NO:27312)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEELSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGEISEDDRDHMVLHEYVNAAGITRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_cage_Cterm_GFP11_677(SEQ ID NO:27313)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEELSKGDDEETARRIVTKIRKELEDVLDEVRRIVKEILDRDRRVAEDLKRVVDENLEKLKKVLDELDKKLGDRRLVEILRDIVRLLIEINERALRELLKLHEEHTRIVAELLRELERVVEELRRLVELIARGERDHMVLHEYVNAAGITLRELKRRYKEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_cage_Nterm_GFP11_678(SEQ ID NO:27314)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRDHMVLHEYVNAAGITLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Cterm_GFP11_678(SEQ ID NO:27315)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELRDHMVLHEYVNAAGITLRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Nterm_GFP11_678(SEQ ID NO:27316)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDRDHMVLHEYVNAAGITRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Cterm_GFP11_678(SEQ ID NO:27317)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGRDHMVLHEYVNAAGITVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Nterm_GFP11_678(SEQ ID NO:27318)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKRDHMVLHEYVNAAGITLRRGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Nterm_GFP11_678(SEQ ID NO:27319)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRDHMVLHEYVNAAGITGGIREELLKRIADVIRDIMRLLKELHDHTAEVIKTIKKLLKELHDINKEIIERLKRLKDGNVPKEELLKRVEELVRTSARLTTEVLKTVEKLIRDDKRLSEEILKRVKELIEELKRGVDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_cage_Cterm_GFP11_679(SEQ ID NO:27320)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILARKVGDTEIAERLRDTIARVVDEIAKLLEEHEKRSRELLEEIRKLLEDILRRSERAVEEIRELLKKGVSTKDVLRIIEEILREHLELLERVVRRIEEILRELLKTIEEIVKRIKEILEELKEVLKRGRVKDDEVERDHMVLHEYVNAAGITYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_cage_Nterm_GFP11_679(SEQ ID NO:27321)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVRDHMVLHEYVNAAGITEILARKVGDTEIAERLRDTIARVVDEIAKLLEEHEKRSRELLEEIRKLLEDILRRSERAVEEIRELLKKGVSTKDVLRIIEEILREHLELLERVVRRIEEILRELLKTIEEIVKRIKEILEELKEVLKRGRVKDDEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
在第四方面,本公开提供了非天然存在的多肽,其包括沿着其长度与本文公开的钥匙多肽,或者选自由SEQ ID NO:14318-26601(在2018年7月19日提交的美国临时申请序列号62/700681和/或2018年12月27日提交的美国临时申请序列号62/785537中作为附录3递交)、26602-27015(在2018年7月19日提交的美国临时申请序列号62/700681和/或2018年12月27日提交的美国临时申请序列号62/785537中作为3plus1_GFP11_key_Cterm_1”号1-67和97-117、3plus1_GFP11_key_Nterm_1”号68-96和118-140、2plus1_GFP11_key_Cterm_”号1-173以及GFP11_key_Nterm_”号174-274递交)、27016-27050、27322至27358组成的组,以及表2(具有SEQ ID NO:27127和27277之间的奇数SEQ ID NO的多肽)、表3和/或表4中钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽(不包括任选的氨基酸残基)。
如本文所公开的,此方面的多肽可以例如用作与笼多肽结合的钥匙多肽,以通过诱导构象变化的竞争性分子间结合来置换闩锁,从而暴露编码的生物活性肽或结构域,并且因此激活系统(参见例如图1)。
如本公开所指出的,钥匙多肽可以包括任选的残基;这些残基在括号中提供,并且在一个实施方式中不包括在确定序列同一性百分比中。在另一个实施方式中,可以在确定序列同一性百分比中包括任选的残基。
在另一个实施方式中,非天然存在的多肽包括沿着其长度与选自由SEQ ID NO:26602-27050和27322至27358组成的组的钥匙多肽的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的多肽,如下详述。
·钥匙序列是普通文本
·6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本
·以粗体、斜体显示的序列是MBP_key生物素化所必需的任选残基
·括号中的所有序列均是任选的
·可以去除非任选钥匙序列中N或C末端的任何数量的连续氨基酸,以调整响应性
>SB76_C-helix(SEQ ID NO:27016)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKIS
>SB76_C-helix-biotin(SEQ ID NO:27017)
DEARKAIARVKRESKRIVEDAERLIREAAAASEKISGSGK-Biotin
>p5_MBP(SEQ ID NO:27018)
>p9_MBP(SEQ ID NO:27019)
>p18_MBP(SEQ ID NO:27020)
>MBP_p18(aka.p76)(SEQ ID NO:27021)
>key_b(SEQ ID NO:27022)
(M)NKEEIEKLAKEAREKLKKAEKEHKEIHDKLRKKNKKAREDLKKKADELRETNKRVN(
>key_c(SEQ ID NO:27023)
(M)SSEKVRRELKESLKENHKQNQKLLKDHKRAQEKLNRELEELKKKHKKTLDDIRRES(
>key_d(SEQ ID NO:27024)
(M)DTVKRILEELRRRFEKLAKDLDDIARKLLEDHKKHNKELKDKQRKIKKEADDAARS(
>key_e(SEQ ID NO:27025)
(M)DDVERRLRKANKESKKEAEELTEEAKKANEKTKEDSKELTKENRKTNKTIKDEARS(
>key_f(SEQ ID NO:27026)
(M)DDEERRSEKTVQDAKREIKKVEDDLQRLNEEQKKKVKKQEDENQKTLKKHKDDARS(
钥匙序列是普通文本
(6His-MBP-TEV、6His-TEV和柔性接头序列是带下划线的文本)
(共定位结构域是粗体文本)
(可以突变为任何氨基酸以调整响应性的位置是带下划线的加粗文本。这些是示例性的,但并不详尽。)
(可以去除非任选钥匙序列中N或C末端的任何数量的连续氨基酸,以调整响应性)
(括号中的所有序列均是任选的)
>p76-long(SEQ ID NO:27027)
>p76-short(SEQ ID NO:27028)
>k76-long(SEQ ID NO:27029)
>k76-short(SEQ ID NO:27030)
>p76_GLISE(SEQ ID NO:27031)
(
>p76_GSSEKIS(SEQ ID NO:27032)
(
>p76_R26G(SEQ ID NO:27033)
(
>p76-short_E19G(SEQ ID NO:27034)
(
>p76-short_GLISE_E01_EGFR(SEQ ID NO:27035)
(
>p76-short_AE_EGFR(SEQ ID NO:27036)
(
>p76-short_AAE_EGFR(SEQ ID NO:27037)
(
>p76-short_EE_EGFR(SEQ ID NO:27038)
(
>p76-spytag(SEQ ID NO:27039)
>p76-short-spytag(SEQ ID NO:27040)
>sfGFP_VMAn_p18(SEQ ID NO:27041)
>p18_VMAc_mCherry(SEQ ID NO:27042)
(用于2plus1和3plus1 STREPII-LOCKR功能笼设计的同源钥匙):
>2plus1_key_100000.fasta alt_STREP_2plus1_1(SEQ ID NO:27043)
DKVRKVAEVAEKVLRDIDKLDRESKEAFRRTNGEISKLDEDTRRVAERVKKAIEDLAK
>2plus1_key_2(SEQ ID NO:27044)
SEVDEIIADNERALDEVRREVEEIDKENAERLKEWVEEAREILDRLAKALEEIR
>2plus1_key_3(SEQ ID NO:27045)
PEEALSKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_key_4(SEQ ID NO:27046)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>3plus1_key_1(SEQ ID NO:27047)
SRLVKKLDEIVKEVAKKLEDVVRANEELWRKLVELNKESVARLREAVERVARDLEETAR
>3plus1_key_2(SEQ ID NO:27048)
SDEERLEKVVKDVIEKVRRILEKWKKDIDKVVKELRRILEEWEKIIREVLDKVR
>3plus1_key_3(SEQ ID NO:27049)
DKDAVIKVIEKLIRANAAVWDALLKINEDLVRVNKTVWKELLRVNEKLARDLERVVK
>3plus1_key_4(SEQ ID NO:27050)
SLVDELRKSLERNVRVSEEVARRLKEALKRWVDVVRKVVEDLIRLNEDVVRVVEK
SEQ ID NO:26602-27015:
>3plus1_GFP11_key_Cterm_1(SEQ ID NO:26602)
SGSKEVLDILERAVEVVRRVIKALKEVLERHVDATREVIERVKRVNKRLLEAVREVVT
>3plus1_GFP11_key_Cterm_2(SEQ ID NO:26603)
GVPEEIDRELKRVVEELRRLHEEIKERLDDVARRSEEELRRIIKKLKEVVKEIRKKLK
>3plus1_GFP11_key_Cterm_3(SEQ ID NO:26604)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_4(SEQ ID NO:26605)
DEDLLEKIKRVIREHIKALEKLARDLKEILRRHIEALKELARDLAEVIRKLLEDVKR
>3plus1_GFP11_key_Cterm_5(SEQ ID NO:26606)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_6(SEQ ID NO:26607)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_key_Cterm_7(SEQ ID NO:26608)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_8(SEQ ID NO:26609)
SGSKEVLDILERAVEVVRRVIKALKEVLERHVDATREVIERVKRVNKRLLEAVREVVT
>3plus1_GFP11_key_Cterm_9(SEQ ID NO:26610)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_10(SEQ ID NO:26611)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_key_Cterm_11(SEQ ID NO:26612)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_key_Cterm_12(SEQ ID NO:26613)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_key_Cterm_13(SEQ ID NO:26614)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_key_Cterm_14(SEQ ID NO:26615)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_key_Cterm_15(SEQ ID NO:26616)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_16(SEQ ID NO:26617)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_17(SEQ ID NO:26618)
ELAREVERVIKELLDKSKEILERIERAIDELLKVSEEILKLSEDASEELLKILREFAK
>3plus1_GFP11_key_Cterm_18(SEQ ID NO:26619)
DVKDIIRTILEVARDLLRLLEEDSRTNSEVVKRLLDLLREDSKANSEVVKRLLDVLRE
>3plus1_GFP11_key_Cterm_19(SEQ ID NO:26620)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_20(SEQ ID NO:26621)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_21(SEQ ID NO:26622)
RLIEEVVRLLRENLDVVRRILEALAKLIKELLEALEEVLRRNKELIRELLRVLDEALK
>3plus1_GFP11_key_Cterm_22(SEQ ID NO:26623)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_key_Cterm_23(SEQ ID NO:26624)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_24(SEQ ID NO:26625)
DEDLLEKIKRVIREHIKALEKLARDLKEILRRHIEALKELARDLAEVIRKLLEDVKR
>3plus1_GFP11_key_Cterm_25(SEQ ID NO:26626)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_26(SEQ ID NO:26627)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_27(SEQ ID NO:26628)
RLARLLKALADKLIRVLEEILKINEELNRKIIKFARENLERNRRVNKKVIEVLREAAR
>3plus1_GFP11_key_Cterm_28(SEQ ID NO:26628)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_29(SEQ ID NO:26630)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_30(SEQ ID NO:26631)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_31(SEQ ID NO:26632)
DIVRAMEEVIRRLIEILRRDVELNLDVAKKLLELLKEDSKLNLDVARELLELLDR
>3plus1_GFP11_key_Cterm_32(SEQ ID NO:26633)
RKIAKIIEELKRLLEDLARDTRRVIEEAKRLLKEWRDRNKEVADTLKKLLEDLIRKIR
>3plus1_GFP11_key_Cterm_33(SEQ ID NO:26634)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_34(SEQ ID NO:26635)
DLLRKLEEELRRIKEKLRKALEELEREHRELEKELDKLHDESRKEHERIEEELRR
>3plus1_GFP11_key_Cterm_35(SEQ ID NO:26636)
RKIAKIIEELKRLLEDLARDTRRVIEEAKRLLKEWRDRNKEVADTLKKLLEDLIRKIR
>3plus1_GFP11_key_Cterm_36(SEQ ID NO:26637)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_37(SEQ ID NO:26638)
TVRRLREALKKLEDDLRKIERDAEREYKKLKDELEELTERYRREIRKLKEELKADRK
>3plus1_GFP11_key_Cterm_38(SEQ ID NO:26639)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_39(SEQ ID NO:26640)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_40(SEQ ID NO:26641)
DLEDILRKNLDRLRKLLERLREILRENLEALKKTLKRLEDVVREILEDLKRERK
>3plus1_GFP11_key_Cterm_41(SEQ ID NO:26642)
DLERLRRKVEELEDRLRRLLEKLARDSAELMRELERILDRYARESEELDRRLAE
>3plus1_GFP11_key_Cterm_42(SEQ ID NO:26643)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_43(SEQ ID NO:26644)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_44(SEQ ID NO:26645)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_45(SEQ ID NO:26646)
DKAVEELEKALEEIKRRLKEVIDRYEDELRKLRKEYKEKIDKYERKLEEIERRERT
>3plus1_GFP11_key_Cterm_46(SEQ ID NO:26647)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_47(SEQ ID NO:26648)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_48(SEQ ID NO:26649)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_49(SEQ ID NO:26650)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_50(SEQ ID NO:26651)
EVKRRLEEKERRIRTRYEELRRRLRKRVKDYEDKLREIEKKVRRDAERIEEELERAKK
>3plus1_GFP11_key_Cterm_51(SEQ ID NO:26652)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_52(SEQ ID NO:26653)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_key_Cterm_53(SEQ ID NO:26654)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_key_Cterm_54(SEQ ID NO:26655)
DKAVEELEKALEEIKRRLKEVIDRYEDELRKLRKEYKEKIDKYERKLEEIERRERT
>3plus1_GFP11_key_Cterm_55(SEQ ID NO:26656)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_key_Cterm_56(SEQ ID NO:26657)
ELVRIAIEVLKRLLEIIEELVRLNNEILERLLKIVRELHKDNIKILEDLLRIIEEVLR
>3plus1_GFP11_key_Cterm_57(SEQ ID NO:26658)
DEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_GFP11_key_Cterm_58(SEQ ID NO:26659)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_59(SEQ ID NO:26660)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_60(SEQ ID NO:26661)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_61(SEQ ID NO:26662)
TLREVVRKVLEEAKRLLDELEEVHKRVKKELEDIIEENRRVVKRVRDELREIKRELDE
>3plus1_GFP11_key_Cterm_62(SEQ ID NO:26663)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_63(SEQ ID NO:26664)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Cterm_64(SEQ ID NO:26665)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_65(SEQ ID NO:26666)
DEAERRRRELKDKLDRLREEHEEVKRRLEEELTRLRETHKKIEKELREALKRVRDRST
>3plus1_GFP11_key_Cterm_66(SEQ ID NO:26667)
KIAEEIERELEELRRMIKRLHEDLERKLKESEDELREIEARLEEKIRRLEEKLERKRR
>3plus1_GFP11_key_Cterm_67(SEQ ID NO:26668)
DVKRALEELVSRLRKLLEDVKKASEDIVREVERIVRELAKRSDEILKKLEDIVEKLRE
>3plus1_GFP11_key_Nterm_68(SEQ ID NO:26669)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_key_Nterm_69(SEQ ID NO:26670)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_key_Nterm_70(SEQ ID NO:26671)
DKDKRLEELLKRLKELNDKTFEELERILEELKRANEASLREAERILEELRARIEGGNL
>3plus1_GFP11_key_Nterm_71(SEQ ID NO:26672)
SEAEDLEELIKELAELLKDVIRKLEKINRRLVKILEDIIRRLKEISKEAEEELRKGTV
>3plus1_GFP11_key_Nterm_72(SEQ ID NO:26673)
SDKEEIKRRVEKTARDLETEHDKIKKRLEDTVRDIKRELDELLEKYERVLRKIEKTLR
>3plus1_GFP11_key_Nterm_73(SEQ ID NO:26674)
SEAEKIREALETNLRLLEELIKRLKEILDTHNELLRRVIETLERLLKELLELLEEGGL
>3plus1_GFP11_key_Nterm_74(SEQ ID NO:26675)
SEAEKIREALETNLRLLEELIKRLKEILDTHNELLRRVIETLERLLKELLELLEEGGL
>3plus1_GFP11_key_Nterm_75(SEQ ID NO:26676)
SKEERLREVAEKHKKDLEDIVKRVDEAAKETARRLEEILKRLEEVLKKILDDLEKGPD
>3plus1_GFP11_key_Nterm_76(SEQ ID NO:26677)
SLEEITKRLLELVEENLARHEEILRELLELAKRLAKEDRDILEEVLKLIEELLKLLED
>3plus1_GFP11_key_Nterm_77(SEQ ID NO:26678)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Nterm_78(SEQ ID NO:26679)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Nterm_79(SEQ ID NO:26680)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Nterm_80(SEQ ID NO:26681)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_key_Nterm_81(SEQ ID NO:26682)
DAEEVVKRLADVLRENDETIRKVVEDLVRIAEENDRLWKKLVEDIAEILRRIVELLRR
>3plus1_GFP11_key_Nterm_82(SEQ ID NO:26683)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Nterm_83(SEQ ID NO:26684)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_key_Nterm_84(SEQ ID NO:26685)
SKEEEVEKVLRKWEEILRRLIEENKRANDKIRREYEELVKEIRRVLEEIKEVAERLGV
>3plus1_GFP11_key_Nterm_85(SEQ ID NO:26686)
DREKSVRDIEEDLKRVLDKLRRRVETSKEELKKVLKADKENADELEKTLRDVVRELDR
>3plus1_GFP11_key_Nterm_86(SEQ ID NO:26687)
SDKEEIKRRVEKTARDLETEHDKIKKRLEDTVRDIKRELDELLEKYERVLRKIEKTLR
>3plus1_GFP11_key_Nterm_87(SEQ ID NO:26688)
STREKAKKVLDTLRADNEDMKRVVEKILRALKRTNERAEKLAREITEEIKRILKEVGV
>3plus1_GFP11_key_Nterm_88(SEQ ID NO:26689)
SKDEELARLLEELVERWRKIVEDLERDHRRLVKEIRELVERIRKKLEELVDRIRKNGI
>3plus1_GFP11_key_Nterm_89(SEQ ID NO:26690)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_key_Nterm_90(SEQ ID NO:26691)
SKDEELARLLEELVERWRKIVEDLERDHRRLVKEIRELVERIRKKLEELVDRIRKNGI
>3plus1_GFP11_key_Nterm_91(SEQ ID NO:26692)
KEIEETLKELEDLNREMVETNRRVLEETRRLNKETVDRVKATLDELAKMLKKLVDDVR
>3plus1_GFP11_key_Nterm_92(SEQ ID NO:26693)
SEAERLADEVRKAVKKSEEDNETLVREVEKAVRELKKNNKTWVDEVRKLMKRLVDLLR
>3plus1_GFP11_key_Nterm_93(SEQ ID NO:26694)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Nterm_94(SEQ ID NO:26695)
DKAEVLREALKLLKDLLEELIKIHEESLKRILDLIDTLVKVHEDALRALKELLERSGL
>3plus1_GFP11_key_Nterm_95(SEQ ID NO:26696)
SKEEEVEKVLRKWEEILRRLIEENKRANDKIRREYEELVKEIRRVLEEIKEVAERLGV
>3plus1_GFP11_key_Nterm_96(SEQ ID NO:26697)
SKEETLKRLLDELEKRNRETVERLERLLKELEDRNRASLEELEAVLEELERKIEESGL
>3plus1_GFP11_key_Cterm_97(SEQ ID NO:26698)
SERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_GFP11_key_Cterm_98(SEQ ID NO:26699)
SERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_GFP11_key_Cterm_99(SEQ ID NO:26700)
DERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_GFP11_key_Cterm_100(SEQ ID NO:26701)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_key_Cterm_101(SEQ ID NO:26702)
DERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_GFP11_key_Cterm_102(SEQ ID NO:26703)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_key_Cterm_103(SEQ ID NO:26704)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_key_Cterm_104(SEQ ID NO:26705)
AAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_GFP11_key_Cterm_105(SEQ ID NO:26706)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_key_Cterm_106(SEQ ID NO:26707)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_GFP11_key_Cterm_107(SEQ ID NO:26708)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_key_Cterm_108(SEQ ID NO:26709)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_key_Cterm_109(SEQ ID NO:26710)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
3plus1_GFP11_key_Cterm_110(SEQ ID NO:26711)
DRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_GFP11_key_Cterm_111(SEQ ID NO:26712)
DALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_GFP11_key_Cterm_112(SEQ ID NO:26713)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_key_Cterm_113(SEQ ID NO:26714)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_key_Cterm_114(SEQ ID NO:26715)
SEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_GFP11_key_Cterm_115(SEQ ID NO:26716)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_GFP11_key_Cterm_116(SEQ ID NO:26717)
DEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_GFP11_key_Cterm_117(SEQ ID NO:26718)
SEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_GFP11_key_Nterm_118(SEQ ID NO:26719)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSL
>3plus1_GFP11_key_Nterm_119(SEQ ID NO:26720)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_120(SEQ ID NO:26721)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKVLKEAEEMHKEVLKELDRVLDEVKR
>3plus1_GFP11_key_Nterm_121(SEQ ID NO:26722)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_key_Nterm_122(SEQ ID NO:26723)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRKELREIEERVRDVVRRLKEVLD
>3plus1_GFP11_key_Nterm_123(SEQ ID NO:26724)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_124(SEQ ID NO:26725)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_125(SEQ ID NO:26726)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_126(SEQ ID NO:26727)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_key_Nterm_127(SEQ ID NO:26728)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_128(SEQ ID NO:26729)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_key_Nterm_129(SEQ ID NO:26730)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_130(SEQ ID NO:26731)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILA
>3plus1_GFP11_key_Nterm_131(SEQ ID NO:26732)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_132(SEQ ID NO:26733)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_GFP11_key_Nterm_133(SEQ ID NO:26734)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_134(SEQ ID NO:26735)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_135(SEQ ID NO:26736)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_136(SEQ ID NO:26737)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELKREHDKLLKEVKDSGV
>3plus1_GFP11_key_Nterm_137(SEQ ID NO:26738)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_GFP11_key_Nterm_138(SEQ ID NO:26739)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_GFP11_key_Nterm_139(SEQ ID NO:26740)
KEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGV
>3plus1_GFP11_key_Nterm_140(SEQ ID NO:26741)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEE
>2plus1_GFP11_key_Cterm_1(SEQ ID NO:26742)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_2(SEQ ID NO:26743)
SEDSVERIARELERNLDDLARVLKESEDDLAEILRRLKEVLEESERDLERVEREVRK
>2plus1_GFP11_key_Cterm_3(SEQ ID NO:26744)
SKELLEKAKAVVDEIKRLAEESLKRLEDLSRDHKRRAKELNDEIAKVVDELAKRAT
>2plus1_GFP11_key_Cterm_4(SEQ ID NO:26745)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_5(SEQ ID NO:26746)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_6(SEQ ID NO:26747)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_key_Cterm_7(SEQ ID NO:26748)
DAETLLRELEKLSRDNKELLKKIEKEIRDLIKEDKERNIELSERLRKLVEELKKKAT
>2plus1_GFP11_key_Cterm_8(SEQ ID NO:26749)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_9(SEQ ID NO:26750)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_key_Cterm_10(SEQ ID NO:26751)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_11(SEQ ID NO:26752)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_12(SEQ ID NO:26753)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_13(SEQ ID NO:26754)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_14(SEQ ID NO:26755)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_15(SEQ ID NO:26756)
DAETVLRSAEDIVAKNRKLAEEVLRRVKKIVEENRKIASEVLDDVRKLVEDVLARAS
>2plus1_GFP11_key_Cterm_16(SEQ ID NO:26757)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_17(SEQ ID NO:26758)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_18(SEQ ID NO:26759)
DEEKLKDLIRKLRDILRRAAEAHKKLIDDARESLERAKREHEKLIDRLKKILEELER
>2plus1_GFP11_key_Cterm_19(SEQ ID NO:26760)
DIKTLLDRVRKLAEEDAERLDRLRRESEELNERVRRVDKKLLEEIRRKAKKVEDDTR
>2plus1_GFP11_key_Cterm_20(SEQ ID NO:26761)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_key_Cterm_21(SEQ ID NO:26762)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_22(SEQ ID NO:26763)
DAETVLRSAEDIVAKNRKLAEEVLRRVKKIVEENRKIASEVLDDVRKLVEDVLARAS
>2plus1_GFP11_key_Cterm_23(SEQ ID NO:26764)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_24(SEQ ID NO:26765)
SKELLEKAKAVVDEIKRLAEESLKRLEDLSRDHKRRAKELNDEIAKVVDELAKRAT
>2plus1_GFP11_key_Cterm_25(SEQ ID NO:26766)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_26(SEQ ID NO:26767)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_27(SEQ ID NO:26768)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_key_Cterm_28(SEQ ID NO:26769)
DKDSARELERIVKENAELAERVFREVEKIVRENTKLAEDSVRELKRLVEELKKRAK
>2plus1_GFP11_key_Cterm_29(SEQ ID NO:26770)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_30(SEQ ID NO:26771)
DEEKLKDLIRKLRDILRRAAEAHKKLIDDARESLERAKREHEKLIDRLKKILEELER
>2plus1_GFP11_key_Cterm_31(SEQ ID NO:26772)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_32(SEQ ID NO:26773)
DEEVLRTLEEIIRRLTKELEDVLREYERELRRLEEENKRVIDKTEEEIRRLADRLRR
>2plus1_GFP11_key_Cterm_33(SEQ ID NO:26774)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_34(SEQ ID NO:26775)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_35(SEQ ID NO:26776)
LPEEVLRELEELLKESEERIKRIEEEIKKIIDKSREDIKRVLEEIERLNAKAADDLRK
>2plus1_GFP11_key_Cterm_36(SEQ ID NO:26777)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_37(SEQ ID NO:26778)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_38(SEQ ID NO:26779)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_key_Cterm_39(SEQ ID NO:26780)
DEEVLRTLEEIIRRLTKELEDVLREYERELRRLEEENKRVIDKTEEEIRRLADRLRR
>2plus1_GFP11_key_Cterm_40(SEQ ID NO:26781)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_41(SEQ ID NO:26782)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_42(SEQ ID NO:26783)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_43(SEQ ID NO:26784)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_44(SEQ ID NO:26785)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_45(SEQ ID NO:26786)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_46(SEQ ID NO:26787)
TLRELARSIRKLSAENKERLKELLRELKKLSDENKERIKKLLSDAEKIIEDVARRAK
>2plus1_GFP11_key_Cterm_47(SEQ ID NO:26788)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_48(SEQ ID NO:26789)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_49(SEQ ID NO:26790)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>2plus1_GFP11_key_Cterm_50(SEQ ID NO:26791)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_51(SEQ ID NO:26792)
TVKRLLDELRELLERLKRTIEELLKRNRDLLADAEEKARRLLEENRKLLKAARDTAT
>2plus1_GFP11_key_Cterm_52(SEQ ID NO:26793)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_53(SEQ ID NO:26794)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_54(SEQ ID NO:26795)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_55(SEQ ID NO:26796)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_key_Cterm_56(SEQ ID NO:26797)
EAAREIIKRLREVNKRTKEKLDELIKHSEEVLERVKRLIDELRKHSEEVLEDLRRRAK
>2plus1_GFP11_key_Cterm_57(SEQ ID NO:26798)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_58(SEQ ID NO:26799)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_59(SEQ ID NO:26800)
SKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_GFP11_key_Cterm_60(SEQ ID NO:26801)
DERVREELKKLLTRVEEEHRKVLETDKKILKEAHKESKEVNDRDRELLERLEESVR
>2plus1_GFP11_key_Cterm_61(SEQ ID NO:26802)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_key_Cterm_62(SEQ ID NO:26803)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_63(SEQ ID NO:26804)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_64(SEQ ID NO:26805)
EREEELKEVADRVKEKLDRLNRENEKSSEELKRELDKINDENRETSERLKREIDETTR
>2plus1_GFP11_key_Cterm_65(SEQ ID NO:26806)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_66(SEQ ID NO:26807)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_67(SEQ ID NO:26808)
TKDLLDENSKRSNEISREVKKDLERTVRENKKIVDEVAKALEDTVDKNRRIVEEVTT
>2plus1_GFP11_key_Cterm_68(SEQ ID NO:26809)
DEVVKRVRDLLDTVRRRNEKVNEDVKRMNDKLRRDNEDVIRRVEKLLRELEEKRRT
>2plus1_GFP11_key_Cterm_69(SEQ ID NO:26810)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_70(SEQ ID NO:26811)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_71(SEQ ID NO:26812)
SEELSAEVKKLLDEVRKALARHKDENDKLLKEIEDSLRRHKEENDRLLEKLKESTR
>2plus1_GFP11_key_Cterm_72(SEQ ID NO:26813)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_key_Cterm_73(SEQ ID NO:26814)
DADDVLARVEELAKRAHDENERLIREVEELVRAHNKRNKELVDEVKRLVEKVIEEER
>2plus1_GFP11_key_Cterm_74(SEQ ID NO:26815)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_75(SEQ ID NO:26816)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_76(SEQ ID NO:26817)
SKEKIDRIIRELERILEEAKKKHEDVLRRLEDSLRRVAELLKAALDRLREIVDRLRR
>2plus1_GFP11_key_Cterm_77(SEQ ID NO:26818)
SEELREELKKLERKIEKVAKEIHDHDKEVTERLEDLLRRITEHARKSDREIEETAR
>2plus1_GFP11_key_Cterm_78(SEQ ID NO:26819)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_79(SEQ ID NO:26820)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_key_Cterm_80(SEQ ID NO:26821)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_81(SEQ ID NO:26822)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_82(SEQ ID NO:26823)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_key_Cterm_83(SEQ ID NO:26824)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_84(SEQ ID NO:26825)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_85(SEQ ID NO:26826)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_86(SEQ ID NO:26827)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_87(SEQ ID NO:26828)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_88(SEQ ID NO:26829)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_key_Cterm_89(SEQ ID NO:26830)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_90(SEQ ID NO:26831)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_91(SEQ ID NO:26832)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_92(SEQ ID NO:26833)
LPEEVLRELEELLKESEERIKRIEEEIKKIIDKSREDIKRVLEEIERLNAKAADDLRK
>2plus1_GFP11_key_Cterm_93(SEQ ID NO:26834)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_94(SEQ ID NO:26835)
DEEVLKKLAEIVRRVKEENRKVNEEVEKRLRELEEENKKVIEDLKSTVEELVERLR
>2plus1_GFP11_key_Cterm_95(SEQ ID NO:26836)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_key_Cterm_96(SEQ ID NO:26837)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_key_Cterm_97(SEQ ID NO:26838)
DIVRKIERIVETIEREVRESVKKVEEIARDIRRKVDESVKNVEKLLRDVDKKARDRKK
>2plus1_GFP11_key_Cterm_98(SEQ ID NO:26839)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_key_Cterm_99(SEQ ID NO:26840)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_100(SEQ ID NO:26841)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_key_Cterm_101(SEQ ID NO:26842)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_key_Cterm_102(SEQ ID NO:26843)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_key_Cterm_103(SEQ ID NO:26844)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_104(SEQ ID NO:26845)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_105(SEQ ID NO:26846)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_key_Cterm_106(SEQ ID NO:26847)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_107(SEQ ID NO:26848)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_108(SEQ ID NO:26849)
EAVRRLKEILERLKEEVRRSLEELRKEVERLKKEVEDSLRELKKSLEEWVKSLEEATR
>2plus1_GFP11_key_Cterm_109(SEQ ID NO:26850)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_110(SEQ ID NO:26851)
DATRVIEEAKRILDEARKLNEETIRRSEELVRRIERVIEEIIKRSEKLLEDVARESK
>2plus1_GFP11_key_Cterm_111(SEQ ID NO:26852)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_112(SEQ ID NO:26853)
EKLKELRDVIAEVAKRIDELDEYTRESIRRAKKEIERLNRETKKVIEEVVKRIEEERK
>2plus1_GFP11_key_Cterm_113(SEQ ID NO:26854)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_114(SEQ ID NO:26855)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_115(SEQ ID NO:26856)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_key_Cterm_116(SEQ ID NO:26857)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_117(SEQ ID NO:26858)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_118(SEQ ID NO:26859)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_119(SEQ ID NO:26860)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_120(SEQ ID NO:26861)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_key_Cterm_121(SEQ ID NO:26862)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_122(SEQ ID NO:26863)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_123(SEQ ID NO:26864)
SKAIKDVRDIVKKVKDELKEWRDRNKELVDRLSEELKEWLKDVERVLKELTDKDR
>2plus1_GFP11_key_Cterm_124(SEQ ID NO:26865)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_125(SEQ ID NO:26866)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_key_Cterm_126(SEQ ID NO:26867)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_127(SEQ ID NO:26868)
DKLLKEARDLIREIEKRLEELLKRVEKLTEDAKRDLERSNREHKELADRIKETAR
>2plus1_GFP11_key_Cterm_128(SEQ ID NO:26869)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_129(SEQ ID NO:26870)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_key_Cterm_130(SEQ ID NO:26871)
DRIEEELKRLIDTLREKNREVEKRARDSNRDLKRTNDEIAKEVRELIKKLREDLK
>2plus1_GFP11_key_Cterm_131(SEQ ID NO:26872)
DERILRELEERVKELEKEAREILKRSEDETDKLREKAERILEDLERANRRTMDEARR
>2plus1_GFP11_key_Cterm_132(SEQ ID NO:26873)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_key_Cterm_133(SEQ ID NO:26874)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_134(SEQ ID NO:26875)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_135(SEQ ID NO:26876)
DIERILRELEAVLKKLTDESERLNREVERVSRDTKKKSKELNEELKAVLDEVKRKAD
>2plus1_GFP11_key_Cterm_136(SEQ ID NO:26877)
DEVVERAERISEENKRRVEDVARKSKELVEDVRRHSEEVVRRVEELVKEVEERVR
>2plus1_GFP11_key_Cterm_137(SEQ ID NO:26878)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_138(SEQ ID NO:26879)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_139(SEQ ID NO:26880)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_key_Cterm_140(SEQ ID NO:26881)
DRRIEKVLKEIEEKIREVIKEWERVHREVEELLKRLIDENRKVLDEIRKLLEEKSK
>2plus1_GFP11_key_Cterm_141(SEQ ID NO:26882)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_key_Cterm_142(SEQ ID NO:26883)
DAETIERVVRELLEENKEVLRKTEEAVKRSTETNKRLLEASKEVADRLRERIKEAAK
>2plus1_GFP11_key_Cterm_143(SEQ ID NO:26884)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_144(SEQ ID NO:26885)
ELLRRIKKLLDEIKKAIEDSSREIKRLLEESERVMKRSSEDIKRTLDDTRRVVEEVRR
>2plus1_GFP11_key_Cterm_145(SEQ ID NO:26886)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_146(SEQ ID NO:26887)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_147(SEQ ID NO:26888)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_148(SEQ ID NO:26889)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_key_Cterm_149(SEQ ID NO:26890)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_150(SEQ ID NO:26891)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_key_Cterm_151(SEQ ID NO:26892)
DIDKLLKELRDLVEKIKKDLKELLERYEEIVRRIKELLKDLNREAEEVVRRLKEELR
>2plus1_GFP11_key_Cterm_152(SEQ ID NO:26893)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_153(SEQ ID NO:26894)
DEIKRIVDEVRERLKRIVDENAKIVEDARRALEKIVKENEEILRRLKKELRELRK
>2plus1_GFP11_key_Cterm_154(SEQ ID NO:26895)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_key_Cterm_155(SEQ ID NO:26896)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_156(SEQ ID NO:26897)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_157(SEQ ID NO:26898)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_key_Cterm_158(SEQ ID NO:26899)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_159(SEQ ID NO:26900)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_key_Cterm_160(SEQ ID NO:26901)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_161(SEQ ID NO:26902)
DLKRVEERAREVSRRNEESMRRVKEDADRVSEANKEVLDRVREEVKRLIEEVRETLR
>2plus1_GFP11_key_Cterm_162(SEQ ID NO:26903)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_163(SEQ ID NO:26904)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_key_Cterm_164(SEQ ID NO:26905)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_165(SEQ ID NO:26906)
EAKKKLDEVLERAKRTIDRLLETSDRSLEKVEADLRRLNEELDRSLERAERTIRELAK
>2plus1_GFP11_key_Cterm_166(SEQ ID NO:26907)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_167(SEQ ID NO:26908)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_168(SEQ ID NO:26909)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_169(SEQ ID NO:26910)
DEVTKVKKVADDVLAEIKKLDDETRRVIEDTNKKIADLDKATRDVVRKVLEEVKKLEK
>2plus1_GFP11_key_Cterm_170(SEQ ID NO:26911)
DKVERVVREVEKLHEEDRKRLEESTRSVRKLLEELKRELEKSTRSVKALVDELRERVR
>2plus1_GFP11_key_Cterm_171(SEQ ID NO:26912)
TAERARETLKRLLDENRDRSKKVKEEIRRILEDLTRTTERVKREIAKLLKELEDTAR
>2plus1_GFP11_key_Cterm_172(SEQ ID NO:26913)
DKARKVAEVAEKVLRDIDKLDRESKEAFRATNEEIAKLDEDTARVAERVKKAIEDLAK
>2plus1_GFP11_key_Cterm_173(SEQ ID NO:26914)
RLVREVEDLVRRLVRRSEKSNEEVKRTVEELVRRMEESNDRVRDLVRRLVEELKRAVD
>2plus1_GFP11_key_Nterm_174(SEQ ID NO:26915)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_175(SEQ ID NO:26916)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_176(SEQ ID NO:26917)
SVDEVLKEIEDALRRLKEEVERVLKENEDELRRLEEEVRRVLKEDEELLESLKRGVGE
>2plus1_GFP11_key_Nterm_177(SEQ ID NO:26918)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_key_Nterm_178(SEQ ID NO:26919)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_179(SEQ ID NO:26920)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_180(SEQ ID NO:26921)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_181(SEQ ID NO:26922)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_key_Nterm_182(SEQ ID NO:26923)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_183(SEQ ID NO:26924)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_184(SEQ ID NO:26925)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_key_Nterm_185(SEQ ID NO:26926)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_186(SEQ ID NO:26927)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_key_Nterm_187(SEQ ID NO:26928)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_key_Nterm_188(SEQ ID NO:26929)
SEVEELIKRLAKVLKELVDKVRKVIEDTKELLERLKRRSEDHIRKLREVLKEAKDQPI
>2plus1_GFP11_key_Nterm_189(SEQ ID NO:26930)
SELEEIEKKVRELTKRHRELVERVRKTVKELIETNRRLLETLTERIKRVLEEVRDLER
>2plus1_GFP11_key_Nterm_190(SEQ ID NO:26931)
SSEERLRAVIEDLKRLAEESRKRHKELIDELAKAVERIERRHKKLLDEIKAVVDDIRR
>2plus1_GFP11_key_Nterm_191(SEQ ID NO:26932)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_192(SEQ ID NO:26933)
STAETVAEEVERVLKHSDDLIKEVEDVNRRVEEEIKRVIRELEEENERLVAEVRKGVK
>2plus1_GFP11_key_Nterm_193(SEQ ID NO:26934)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_key_Nterm_194(SEQ ID NO:26935)
SEIDEVLTRLRKISKDLNETSDRVNERARKIIDDIKKESKRVNDEAREIVERLKREID
>2plus1_GFP11_key_Nterm_195(SEQ ID NO:26936)
SEDEDLDRVAEKLAREHKKSVEEIKRVLKSADEESKKLVRDTERVIEEIKREVEEARR
>2plus1_GFP11_key_Nterm_196(SEQ ID NO:26937)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_key_Nterm_197(SEQ ID NO:26938)
SAADEVVERMKELVATVKRENDEVVKELKKLVKELEDDNRRVVEESKKSVEDLARRVG
>2plus1_GFP11_key_Nterm_198(SEQ ID NO:26939)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_199(SEQ ID NO:26940)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_key_Nterm_200(SEQ ID NO:26941)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_201(SEQ ID NO:26942)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_202(SEQ ID NO:26943)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_203(SEQ ID NO:26944)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_204(SEQ ID NO:26945)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_key_Nterm_205(SEQ ID NO:26946)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_206(SEQ ID NO:26947)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_207(SEQ ID NO:26948)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_key_Nterm_208(SEQ ID NO:26949)
DEVRELLERNRRLLEEIKKTVKDLIRANEELLKRIEDDAKRLIDRNEELLDELEKGLS
>2plus1_GFP11_key_Nterm_209(SEQ ID NO:26950)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_210(SEQ ID NO:26951)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_211(SEQ ID NO:26952)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_key_Nterm_212(SEQ ID NO:26953)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_213(SEQ ID NO:26954)
SKEDRLREELKKLLARLAEEIERLKRALEESNKDLKRTIDASEKHLRDVNEDVKRGGV
>2plus1_GFP11_key_Nterm_214(SEQ ID NO:26955)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_215(SEQ ID NO:26956)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_216(SEQ ID NO:26957)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_key_Nterm_217(SEQ ID NO:26958)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_218(SEQ ID NO:26959)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_key_Nterm_219(SEQ ID NO:26960)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_key_Nterm_220(SEQ ID NO:26961)
SELEEVLRRIEALVRKAHKENEDVLREIERLVRTAHRLNKKVDDDSAKIAEDLKRGGR
>2plus1_GFP11_key_Nterm_221(SEQ ID NO:26962)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_222(SEQ ID NO:26963)
SESDDVIRKLRELLEELRTHVEKSIRDLRKILEDSTRHAKRSIEELERLLEEVRKKPG
>2plus1_GFP11_key_Nterm_223(SEQ ID NO:26964)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_224(SEQ ID NO:26965)
DEVRELLERNRRLLEEIKKTVKDLIRANEELLKRIEDDAKRLIDRNEELLDELEKGLS
>2plus1_GFP11_key_Nterm_225(SEQ ID NO:26966)
STEEVLDEIRKLHKTLTEDIKRVLREIEELHRRTIEENKEVLDKIAEDYKRVIDDVRT
>2plus1_GFP11_key_Nterm_226(SEQ ID NO:26967)
SEIEKILKEIEDLARRDEEVSKKIVEDIRRLAKEVEDTSRDIVRKIEELAKRVLDRLR
>2plus1_GFP11_key_Nterm_227(SEQ ID NO:26968)
SEAERLEARARELLRANEELMDDLRAKAEELLKRNDRLVKEIEKKVREVLAAIEELKR
>2plus1_GFP11_key_Nterm_228(SEQ ID NO:26969)
DDLERAREEVADLIRKHEEKTRRILEESRRLNERHRELSARILDEIRKLAERIEELIK
>2plus1_GFP11_key_Nterm_229(SEQ ID NO:26970)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_key_Nterm_230(SEQ ID NO:26971)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_231(SEQ ID NO:26972)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_232(SEQ ID NO:26973)
STAETVEKKVEEVIRENEKSMRESEEKVDRSTKRIEDVLRRLEETIRKTSDDIAKGVK
>2plus1_GFP11_key_Nterm_233(SEQ ID NO:26974)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_234(SEQ ID NO:26975)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_235(SEQ ID NO:26976)
REVEEMIKELEELLKDLKEKNERASKRNRELVRRLEEENKRVIEELKKLVKELEDLVR
>2plus1_GFP11_key_Nterm_236(SEQ ID NO:26977)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_237(SEQ ID NO:26978)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_key_Nterm_238(SEQ ID NO:26979)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_key_Nterm_239(SEQ ID NO:26980)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_key_Nterm_240(SEQ ID NO:26981)
DEVEKVLEEIKRALDDLRKKVEESKREIKEALKAVEKHTRDSDTANKRTLAEIERGVK
>2plus1_GFP11_key_Nterm_241(SEQ ID NO:26982)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_242(SEQ ID NO:26983)
KEVEDAVKELEDLLRANEDKTRSIVEDMRASNKDLEDHSRASEEEVRKLLDDLRRAGV
>2plus1_GFP11_key_Nterm_243(SEQ ID NO:26984)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_244(SEQ ID NO:26985)
STAETVAEEVERVLKHSDDLIKEVEDVNRRVEEEIKRVIRELEEENERLVAEVRKGVK
>2plus1_GFP11_key_Nterm_245(SEQ ID NO:26986)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_246(SEQ ID NO:26987)
SEVDEIIKELERLLAEIARENERIIRESRKLADEVRKRNEDAIRKLEELVARLADAVR
>2plus1_GFP11_key_Nterm_247(SEQ ID NO:26988)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_248(SEQ ID NO:26989)
SKLEEVEKAVRKVIEDSRRVNEEVNRRSEEVVRELEKVHREVNDASRRVVEKARRVLK
>2plus1_GFP11_key_Nterm_249(SEQ ID NO:26990)
SAEEVKEELKRIATKLKEEIKENIRRLEESVEKIAKELAENIKRLEDILRDVKRGLRD
>2plus1_GFP11_key_Nterm_250(SEQ ID NO:26991)
SDVDRVLEEIRKLLEDLKRHSEKVSEENEDLLRANTELNKRVSEDNERLLEELKRLRE
>2plus1_GFP11_key_Nterm_251(SEQ ID NO:26992)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_key_Nterm_252(SEQ ID NO:26993)
SSVEELLERLRRISEENKRRIEKLLREVEKVLRELKDRHRKLLKRVEEIIRKVKEEIK
>2plus1_GFP11_key_Nterm_253(SEQ ID NO:26994)
DREREVKKRLDEVRERIERLLRRVEEESRRVAEEIRRLIEEVRRRNKKVTEEIRELLK
>2plus1_GFP11_key_Nterm_254(SEQ ID NO:26995)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_255(SEQ ID NO:26996)
SEIEKILKEIEDLARRDEEVSKKIVEDIRRLAKEVEDTSRDIVRKIEELAKRVLDRLR
>2plus1_GFP11_key_Nterm_256(SEQ ID NO:26997)
SEAEKAKETIDRLADRVRKLLEEIKRSLDDSRRKSKETVEENEKTLDRMRKEVDAAKR
>2plus1_GFP11_key_Nterm_257(SEQ ID NO:26998)
SEVEELIKRLAKVLKELVDKVRKVIEDTKELLERLKRRSEDHIRKLREVLKEAKDQPI
>2plus1_GFP11_key_Nterm_258(SEQ ID NO:26999)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_259(SEQ ID NO:27000)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_260(SEQ ID NO:27001)
STAETVEKKVEEVIRENEKSMRESEEKVDRSTKRIEDVLRRLEETIRKTSDDIAKGVK
>2plus1_GFP11_key_Nterm_261(SEQ ID NO:27002)
SRVEEIIEDLRRLLEEIRKENEDSIRRSKELLDRVKEINDTIIAELERLLKDIEKEVR
>2plus1_GFP11_key_Nterm_262(SEQ ID NO:27003)
REVEEMIKELEELLKDLKEKNERASKRNRELVRRLEEENKRVIEELKKLVKELEDLVR
>2plus1_GFP11_key_Nterm_263(SEQ ID NO:27004)
DAVEEAEKLIRKVIADSEKLLRDLADLNAKSIRRSEKLVEDDRRANEDVIRKLEELRR
>2plus1_GFP11_key_Nterm_264(SEQ ID NO:27004)
SEVDDVLRRLEELIKTLEDINAKSLEDIKKLIDDLAKILEDALRKHEKLIRELREAKK
>2plus1_GFP11_key_Nterm_265(SEQ ID NO:27006)
SEIERVKKRLEELLAEVEESTRRLEERLKRLLEEAKRSSEEVEKELRRLLEAVRRGLS
>2plus1_GFP11_key_Nterm_266(SEQ ID NO:27007)
SDVDRVLEEIRKLLEDLKRHSEKVSEENEDLLRANTELNKRVSEDNERLLEELKRLRE
>2plus1_GFP11_key_Nterm_267(SEQ ID NO:27008)
DEVEDVLRKIEKILDDHRKRIEKNSRDMARIIDEHRRKVEENSREMKKLVDDLKKAVD
>2plus1_GFP11_key_Nterm_268(SEQ ID NO:27009)
SESDEVIRDLARLLDELARHVDDSVRRMDEVVKRSTREADELAKRLDELVKEVEKKPG
>2plus1_GFP11_key_Nterm_269(SEQ ID NO:27010)
SRAETVLKEVTDKIKKLADSSDELLRRNKENIDELKKSSEELLRRLTKAIEEIEKGSV
>2plus1_GFP11_key_Nterm_270(SEQ ID NO:27011)
DEEEDLERAIKKLLDENRELLKRIAEELRRLLEELRRLTEESADRLRRLLKELKDRGV
>2plus1_GFP11_key_Nterm_271(SEQ ID NO:27012)
DEIRKVVKEITDLLKASNDKNRKVVEEIRDLLRKSKKLADELVERLRALVEDLRRRID
>2plus1_GFP11_key_Nterm_272(SEQ ID NO:27013)
DAVEEAEKLIRKVIADSEKLLRDLADLNAKSIRRSEKLVEDDRRANEDVIRKLEELRR
>2plus1_GFP11_key_Nterm_273(SEQ ID NO:27014)
SEDEDLDRVAEKLAREHKKSVEEIKRVLKSADEESKKLVRDTERVIEEIKREVEEARR
>2plus1_GFP11_key_Nterm_274(SEQ ID NO:27015)
SKEDRLREELKKLLARLAEEIERLKRALEESNKDLKRTIDASEKHLRDVNEDVKRGGV
>3plus1_key_668_Nterm(SEQ ID NO:27322)
DEAKELLDEIRKAVKESEDRLEKLLRDYEKELRRLEKELRDLKRRIEEKLEELRRGSL
>3plus1_key_668_Cterm(SEQ ID NO:27323)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_key_668_Cterm(SEQ ID NO:27324)
SEKEKLLKESEEEVRRLRRTLEELLRKYREVLERLRKELREIEERVRDVVRRLKEVLD
>3plus1_key_668_Cterm(SEQ ID NO:27325)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_key_668_Cterm(SEQ ID NO:27326)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_key_669_Nterm(SEQ ID NO:27327)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_key_670_Nterm(SEQ ID NO:27328)
SDERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_key_670_Cterm(SEQ ID NO:27329)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_key_670_Cterm(SEQ ID NO:27330)
AAKRLVEELLKAVTDLSRKNKRILEELLKAIETLSDENKKILTEILDALRRLVEKIEK
>3plus1_key_670_Cterm(SEQ ID NO:27331)
KEREEVKEKLDRLLEEVEKTVRELKREHDELLKEVEKLVRDLKKEHDELLKKVKDDGV
>3plus1_key_670_Nterm(SEQ ID NO:27332)
DRLDKVEELVKKLLEDTKRTVDRVRELVRKILKKSRETLEELERLIEKILRELEKDAR
>3plus1_key_670_Cterm(SEQ ID NO:27333)
SERETVKRRLEELLKEVKRTLDKLKEEHDRLLEDVRRVVEELKREHDKLLKEVKDSGV
>3plus1_key_670_Nterm(SEQ ID NO:27334)
SEDEIIKKIIEDLRRVLKEVEEIHKEVEERLDKVLKEAEEMHKEVLKELDRVLDEVKR
>3plus1_key_670_Nterm(SEQ ID NO:27335)
SREEVLRELEEVIEDNRRLLEELIEKSKKVLDESLKLIDELLRRLEEVLERVLRLLEE
>3plus1_key_670_Nterm(SEQ ID NO:27336)
ISEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_key_670_Nterm(SEQ ID NO:27337)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_key_671_Cterm(SEQ ID NO:27338)
VDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_key_671_Cterm(SEQ ID NO:27339)
VKDDEVEREIRRVKEDLDRILEEYRRLLEEIKRKLEEILRRVEELHRRLRRKLEEIDR
>3plus1_key_671_Cterm(SEQ ID NO:27340)
SRVEELKKLIEDILRISREVVERIKRVAEDIHRINRRVLDDLRKLIEDILRTVEEILA
>3plus1_key_671_Cterm(SEQ ID NO:27341)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_key_672_Cterm(SEQ ID NO:27342)
RGADALSRLLEELLRVVDDLIRVLKELIDKSRKVIEELLELLKRINEENLKVLAEIIK
>3plus1_key_67>3_Nterm(SEQ ID NO:27343)
EALRKLVELLVEVLRRLIRVNRELVKLLREVLERLLRILRESVKKLKRLIEKVIKDAT
>3plus1_key_67>3_Cterm(SEQ ID NO:27344)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_key_67>3_Nterm(SEQ ID NO:27345)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_key_674_Nterm(SEQ ID NO:27346)
SEKEDAARKLRKLVEELTREYEELVKKLERLIEEIEKVSEESVRKLEKLLAEISEEVR
>3plus1_key_674_Cterm(SEQ ID NO:27347)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_key_675_Nterm(SEQ ID NO:27348)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_key_676_Nterm(SEQ ID NO:27349)
RAVKKLDEIVKEVAKKLEDVVRANEELWRALVELNKESVRRLREIVERVARDLEETAR
>3plus1_key_677_Nterm(SEQ ID NO:27350)
SDERRIAERIRELLRESKKLVRDVVEEAKRLLKENRDSTRKIIEDIRRLLRKIEDSTR
>3plus1_key_677_Cterm(SEQ ID NO:27351)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_key_678_Nterm(SEQ ID NO:27352)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_key_678_Cterm(SEQ ID NO:27353)
SKEETLRKEAEDLLRRLEELTRRLEKKARELLERAKKLSRDLAEELKRLLKELREKGV
>3plus1_key_678_Cterm(SEQ ID NO:27354)
ISEDDLKRVVDEVEKKLRELKRRYAEALERIKEKIKELKDRYERAVREVVAELRKTTK
>3plus1_key_678_Nterm(SEQ ID NO:27355)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_key_678_Nterm(SEQ ID NO:27356)
VDSERVKEILERILRVVEEAVRLNEESLRRILDVVRKAVKLDRESLKKILDVVEEAVR
>3plus1_key_679_Cterm(SEQ ID NO:27357)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
>3plus1_key_679_Nterm(SEQ ID NO:27358)
SKAEEIAEKLDRLLEENRRALEEITTRLDDLLRRNKDALRKVMEKLKRLLDDLRRGGI
在一个具体实施方式中,钥匙多肽沿着其长度与表2(具有SEQ ID NO:27127和27277之间的奇数个SEQ ID NO的多肽)、表3和/或表4中钥匙多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在另一个具体实施方式中,钥匙多肽沿着其长度与表3中的钥匙多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在另一个具体实施方式中,钥匙多肽沿着其长度与表4中的钥匙多肽的氨基酸序列共享40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。在上述各项的一个实施方式中,可以在没有任选的N-末端和C-末端60个氨基酸的情况下确定鉴定百分比;在另一个实施方式中,可以用任选的N-和C-末端60个氨基酸确定鉴定百分比。
本公开的多肽(即:笼多肽和钥匙多肽)可以在多肽的N-末端、C-末端、内部或其组合处包括另外的残基;这些另外的残基不包括在确定本发明多肽相对于参考多肽的同一性百分比中。此类残基可以是适用于预期用途的任何残基,包括但不限于标签。如本文所用,“标签”包括一般的可检测部分(即:荧光蛋白、抗体表位标签等)、治疗剂、纯化标签(His标签等)、接头、适用于纯化目的的配体、驱动多肽定位的配体、为多肽增加功能的肽结构域等。本文提供了实例。
在一个实施方式中,所述多肽是融合蛋白,其包含与本文公开的钥匙多肽融合的本文公开的笼多肽。在一个实施方式中,所述融合蛋白包含与钥匙多肽融合的笼多肽,其中所述笼多肽未被所述钥匙多肽激活。如本文所指出的,正交LOCKR设计(参见图3)用小写字母下标表示:LOCKR
在本文公开的融合蛋白的一个实施方式中,融合蛋白的笼多肽和钥匙多肽组件包含至少一种笼多肽和至少一种钥匙多肽,其氨基酸序列沿着其长度分别与表1、表2、表3和/或表4的不同行中的笼多肽和钥匙多肽具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性(即:表第1行第1列中的每种笼多肽可以与第1行第2列中的任何钥匙多肽融合,依此类推)。
表1
正如在整个本申请中所使用的那样,术语“多肽”以其最广泛的含义用于指亚单位氨基酸序列。本发明的多肽可以包含L-氨基酸+甘氨酸、D-氨基酸+甘氨酸(其在体内对L-氨基酸特异性蛋白酶具有抗性)或D-和L-氨基酸+甘氨酸的组合。本文所述的多肽可以化学合成或重组表达。所述多肽可以连接到其他化合物,以诸如通过聚乙二醇化、糖基化、磷酸化、糖基化促进体内半衰期的增加,或者可以作为Fc融合或去免疫化变体产生。如本领域技术人员所理解的,这种连接可以是共价或非共价的。
在第五方面,本公开提供了编码本文公开的各方面的任何实施方式或实施方式组合的多肽的核酸。核酸序列可以包含为基因组或cDNA形式的单链或双链RNA或DNA、或DNA-RNA杂合体,各自均可以包括化学或生物化学修饰的、非天然的或衍生的核苷酸碱基。此类核酸序列可以包含用于促进编码的多肽的表达和/或纯化的附加序列,包括但不限于polyA序列、修饰的Kozak序列以及编码表位标签、输出信号和分泌信号、核定位信号和质膜定位信号的序列。基于本文的教导,对于本领域技术人员而言清楚的是,何种核酸序列将编码本公开的多肽。
在第六方面,本公开提供了表达载体,其包含可操作地连接到合适的控制序列的本公开任何方面的核酸。“表达载体”包括将核酸编码区域或基因可操作地连接到能够实现基因产物表达的任何控制序列的载体。可操作地连接到本公开的核酸序列的“控制序列”是能够影响核酸分子的表达的核酸序列。控制序列不必与核酸序列邻接,只要所述控制序列起作用以引导所述核酸序列的表达即可。因此,例如,在启动子序列与核酸序列之间可以存在中间的未翻译但被转录的序列,并且仍然可以认为所述启动子序列“可操作地连接”至所述编码序列。其他此类控制序列包括但不限于聚腺苷酸化信号、终止信号和核糖体结合位点。此类表达载体可以是任何类型,包括但不限于质粒和基于病毒的表达载体。用于驱动所公开的核酸序列在哺乳动物系统中表达的控制序列可以是组成型的(由多种启动子中的任一种驱动,所述启动子包括但不限于CMV、SV40、RSV、肌动蛋白、EF)或诱导型的(由许多诱导型启动子中的任一种驱动,所述诱导型启动子包括但不限于四环素、蜕皮激素、类固醇响应性)。表达载体必须可作为附加体或通过整合到宿主染色体DNA中在宿主生物体中复制。在各种实施方式中,表达载体可以包括质粒、基于病毒的载体或任何其他合适的表达载体。
在第七方面,本公开提供了宿主细胞,其包含本文公开的核酸或表达载体(即:游离的或染色体整合的),其中所述宿主细胞可以是原核的或真核的。可以使用包括但不限于细菌转化、磷酸钙共沉淀、电穿孔或脂质体介导的、DEAE葡聚糖介导的、聚阳离子介导的或病毒介导的转染的技术,将细胞瞬时或稳定地工程化以掺入本公开的表达载体。在一个实施方式中,重组宿主细胞包含:
(a)可操作地连接到第一启动子的编码本公开第一至三方面的笼多肽的任何实施方式或实施方式组合的多肽的第一核酸;和
(b)编码本公开第四方面的钥匙多肽的任何实施方式或实施方式组合的多肽的第二核酸,其中所述钥匙多肽能够结合到所述笼多肽的结构区域以诱导所述笼多肽的构象变化,其中所述第二核酸可操作地连接到所述第二启动子。
重组宿主细胞可以包含编码核酸的单个笼多肽和编码核酸的单个钥匙多肽,或者可以包含多个(即:2、3、4、5、6、7、8、9、10或更多个)第一和第二核酸—在一个这样的实施方式中,每个第二核酸可以编码能够结合到结构区域并诱导由所述多个第一核酸编码的不同笼多肽的构象变化的钥匙多肽。在另一个实施方式中,每个第二核酸可以编码能够结合到结构区域并诱导由所述多种第一核酸编码的多于一种笼多肽的构象变化的钥匙多肽。
因此,在一个实施方式中,第一核酸包括编码多种不同笼多肽的多种第一核酸。在一个这样的实施方式中,第二核酸包括编码多种不同钥匙多肽的多种第二核酸,其中所述多种不同钥匙多肽包括能够结合所述多种不同笼多肽的仅子集并诱导该子集中的构象变化的一种或多种钥匙多肽。在另一个这样的实施方式中,第二核酸编码能够结合每种不同笼多肽并诱导其中的构象变化的单个钥匙多肽。
在另一个实施方式中,宿主细胞包含编码能够表达本文公开的融合蛋白的表达载体的核酸和/或所述表达载体,其中宿主细胞包含:
(a)连接到第一启动子的编码第一融合蛋白(即:与钥匙多肽融合的笼多肽)的第一核酸;和
(b)可操作地连接到第二启动子的编码第二融合蛋白的第二核酸,其中:
(i)由第一核酸编码的笼多肽被由第二核酸编码的钥匙多肽激活;
(ii)由第一核酸编码的笼多肽未被由第一核酸编码的钥匙多肽激活;
(iii)由第二核酸编码的笼多肽被由第一核酸编码的钥匙多肽激活;并且
(iv)由第二核酸编码的笼多肽未被由第二核酸编码的钥匙多肽激活。
在所有这些实施方式中,第一和/或第二核酸可以例如是表达载体的形式。在其他实施方式中,第一和/或第二核酸可以是整合到宿主细胞基因组中的核酸形式。
产生根据本公开的多肽的方法是本公开的另外部分。在一个实施方式中,所述方法包括以下步骤:(a)在有利于多肽表达的条件下培养根据本公开这一方面的宿主,以及(b)任选地,回收表达的多肽。表达的多肽可以从无细胞提取物中回收,或者从培养基中回收。在另一个实施方式中,所述方法包括化学合成所述多肽。
在第八方面,本公开提供了试剂盒。在一个实施方式中,所述试剂盒包括:
(a)本公开第一至三方面的任何实施方式或实施方式组合的一种或多种多肽(即:笼多肽);
(b)本公开第四方面的任何实施方式或实施方式组合的一种或多种多肽(即:钥匙多肽);和
(c)任选地,本文公开的任何实施方式的一种或多种融合蛋白。
在另一个实施方式中,所述试剂盒包括:
(a)编码本公开第一至三方面的任何实施方式或实施方式组合的笼多肽的第一核酸;
(b)编码本公开第四方面的任何实施方式或实施方式组合的钥匙多肽的第二核酸;和
(c)任选地,编码本文公开的任何实施方式的融合蛋白的第三核酸。
在另一个实施方式中,所述试剂盒包括:
(a)第一表达载体,其包含编码本公开第一至三方面的任何实施方式或实施方式组合的笼多肽的第一核酸,其中所述第一核酸可操作地连接到第一启动子;和
(b)第二表达载体,其包含编码本公开第四方面的任何实施方式或实施方式组合的钥匙多肽的第二核酸,其中所述第二核酸可操作地连接到第二启动子。
在每个试剂盒实施方式中,第一核酸、第二核酸、第一表达载体和/或第二表达载体可以包含编码能够表达笼或钥匙多肽的表达载体的单个核酸或所述表达载体,或者可以包含多个(即:2、3、4、5、6、7、8、9、10或更多个)第一核酸、第二核酸、第一表达载体和/或第二表达载体。在各种这样的实施方式中,每个第二核酸可以编码,或者每个第二表达载体可以能够表达钥匙多肽,所述钥匙多肽能够结合到结构区域并诱导由所述多个第一核酸编码的不同笼多肽的构象变化,或者能够由所述多个第一表达载体表达。在其他实施方式中,每个第二核酸可以编码,或者每个第二表达载体可以能够表达钥匙多肽,所述钥匙多肽能够结合到结构区域并诱导由所述多个第一核酸编码的多于一种笼多肽的构象变化,或者能够由所述多个第一表达载体表达。
在一个实施方式中,可操作地连接到编码笼多肽的核酸的启动子(第一启动子)不同于可操作地连接到编码钥匙多肽的核酸的启动子(第二启动子),从而允许通过控制钥匙多肽的表达来可调节控制笼多肽和任何功能多肽结构域。在其他实施方式中,可操作地连接到编码笼多肽的核酸的启动子(第一启动子)与可操作地连接到编码钥匙多肽的核酸的启动子(第二启动子)相同。在其他实施方式中,第一启动子和/或第二启动子可以是诱导型启动子。
在第九方面,本公开提供了LOCKR开关,其包含:
(a)包含构型结构域和进一步含有一种或多种生物活性肽的闩锁结构域的笼多肽,其中所述构型结构域与所述闩锁结构域相互作用以防止所述一种或多种生物活性肽的活性;
(b)任选的钥匙多肽,其结合到笼构型结构域,从而置换闩锁结构域并激活所述一种或多种生物活性肽;和
(c)任选地,当所述一种或多种生物活性肽被激活时结合到所述一种或多种生物活性肽的一种或多种效应多肽。
以上讨论了笼多肽及其结构区域和闩锁区域,生物活性肽、效应多肽和钥匙多肽也是如此。本文公开的笼多肽、生物活性肽和钥匙多肽的任何实施方式均可以用于本公开的LOCKR开关和试剂盒中。例如,在一个实施方式中,笼多肽包含:
(a)包含2至7个α-螺旋的螺旋束;和
(b)连接每个α螺旋的氨基酸接头;
在一个实施方式中,存在钥匙多肽,并且可以包含本文公开的任何实施方式或实施方式组合的钥匙多肽。
在另一个实施方式中,存在效应多肽,并且包含选择性结合到生物活性肽的多肽。取决于目的生物活性肽,可以使用任何合适的效应多肽。在各种非限制性实施方式中,效应肽可以包括Bcl2、GFP1-10、蛋白酶等。
本公开还提供了包含本文所述的笼多肽和钥匙多肽的LOCKR开关。在一些方面,LOCKR开关包含:(a)包含结构区域和进一步包含一种或多种生物活性肽的闩锁区域的笼多肽,和(b)结合到笼结构区域的钥匙多肽。在一些方面,LOCKR开关包含:(a)包含结构区域的笼多肽和进一步包含一种或多种生物活性肽的闩锁区域,和(b)结合到笼结构区域的钥匙多肽,其中闩锁区域中的所述一种或多种生物活性肽与一种或多种效应多肽结合或相互作用。在其他方面,LOCKR开关包含:(a)包含结构区域和进一步包含一种或多种生物活性肽的闩锁区域的笼多肽,其中所述结构区域与所述闩锁区域相互作用以防止所述一种或多种生物活性肽的活性;(b)钥匙多肽,其结合到笼结构区域,从而置换闩锁区域并激活所述一种或多种生物活性肽。在一些其他方面,LOCKR进一步包含一种或多种效应多肽,当所述一种或多种生物活性肽被激活时,所述一种或多种效应多肽结合到所述一种或多种生物活性肽。
在一些方面,闩锁区域和钥匙多肽两者均可以结合到对应笼多肽中的结构区域或与其相互作用。笼多肽中的闩锁区域与结构区域之间的相互作用可以是分子内相互作用,而钥匙多肽与对应笼多肽的结构区域之间的相互作用可以是分子间相互作用。然而,在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力高于钥匙多肽对笼多肽的结构区域的亲和力。
在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约16倍、至少约17倍、至少约18倍、至少约19倍、至少约20倍、至少约21倍、至少约22倍、至少约23倍、至少约24倍、至少约25倍、至少约26倍、至少约27倍、至少约28倍、至少约29倍或至少约30倍。在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约1.1倍、至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.1倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约2.6倍、至少约2.7倍、至少约2.8倍、至少约2.9倍或至少约3.0倍。在一些方面,在不存在效应多肽的情况下,闩锁区域对笼多肽的结构区域的亲和力比钥匙多肽对笼多肽的结构区域的亲和力高至少约30倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍、至少约100倍、至少约110倍、至少约120倍、至少约130倍、至少约140倍、至少约150倍、至少约160倍、至少约170倍、至少约180倍、至少约190倍、至少约200倍、至少约210倍、至少约220倍、至少约230倍、至少约240倍、至少约250倍、至少约260倍、至少约270倍、至少约280倍、至少约290倍、至少约300倍,例如约30倍至约300倍、例如约100倍至约300倍、约50倍至约100倍。
在其他实施方式中,分子内闩锁-笼亲和力高于分子间钥匙-笼亲和力,并且在效应蛋白的存在下,分子间钥匙-笼亲和力高于分子内闩锁-笼亲和力。因此,生物活性肽的功能取决于笼、钥匙和效应蛋白的存在。
在某些实施方式中,在不存在效应蛋白的情况下,分子间钥匙-笼相互作用可以胜过闩锁-笼相互作用。在不存在钥匙的情况下,闩锁-笼亲和力高于闩锁-效应蛋白亲和力(经由生物活性肽与效应蛋白的结合),并且在存在钥匙的情况下,闩锁-效应蛋白亲和力(经由生物活性肽与效应蛋白的结合)高于闩锁-笼亲和力。因此,生物活性肽的功能取决于笼、钥匙和效应蛋白的存在。
如本文所公开的,通过使用笼多肽在闩锁区域中隔离生物活性肽,可以将笼多肽与钥匙多肽一起使用,在所述区域中使生物活性肽保持在非活性状态,直到钥匙多肽通过诱导构象变化的竞争性分子间结合置换闩锁,从而暴露编码的生物活性肽或结构域并激活系统(参见图1)。笼和钥匙多肽的组合使用在本文中在以下的实施例中更详细地描述了,并被称为LOCKR开关。LOCKR代表闩锁正交笼-钥匙蛋白;每个LOCKR设计均由笼多肽和钥匙多肽组成,它们是两条独立的多肽链。正交LOCKR设计(参见图3)用小写字母下标表示:LOCKR
在另一实施方式中,笼的命名法由1fix-short和1fix-latch标识,表明如上文定义的笼
在本公开的第八和第九方面的一个实施方式中,所述一种或多种笼多肽和所述一种或多种钥匙多肽包括表1、2、3和/或4的同一行中的至少一种笼多肽和至少一种钥匙多肽。如本领域技术人员基于本文的教导将理解的,此类试剂盒可以包括多个(即:2、3、4、5、6、7、8、9、10、20、50、100或更多个)笼和钥匙多肽对,其可以一起用作LOCKR开关。
在本文公开的试剂盒或开关的一个实施方式中,所述一种或多种笼多肽和所述一种或多种钥匙多肽包括至少一种笼多肽和至少一种钥匙多肽,其氨基酸序列沿着其长度分别与表1、表2、表3和/或表4的同一行中的笼多肽和钥匙多肽具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在第十方面,本公开提供了本文公开的多肽、试剂盒和/或LOCKR开关的用途,用于将生物活性肽隔离在笼多肽中,将它们保持在非活性(“关闭”)状态,直到与钥匙多肽组合以诱导激活(“开启”)生物活性肽的构象变化。示例性的此类用途和方法的细节在全文中被公开。
在本文公开的试剂盒或开关的一个实施方式中,所述一种或多种笼多肽和所述一种或多种钥匙多肽包括至少一种笼多肽和至少一种钥匙多肽,其氨基酸序列沿着其长度分别与表1、表2、表3和/或表4的同一行中的笼多肽和钥匙多肽具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在本公开的第八和第九方面的另一个实施方式中,所述一种或多种笼多肽和所述一种或多种钥匙多肽包括在本文使用的命名惯例中由识别号匹配的至少一种笼多肽和至少一种钥匙多肽。如以上所指出的,正交LOCKR设计(参见图3)用小写字母下标表示:LOCKR
在一些实施方式中,笼和钥匙多肽名称包括前缀2plus1或3plus1定义了螺旋体系结构,其中第一个数字定义了结构区域中的螺旋数目,第二个数字定义了闩锁区域中的螺旋数目。Nterm或Cterm后缀定义试剂盒的笼组件上的闩锁分别包含N或C末端,如括号[]所示。Nterm与Cterm以及数字后缀对应于激活它的钥匙上的相同后缀。例如,笼2plus1_cage_Cterm_2406(SEQ ID NO:27126)由2plus2_key_Cterm_2406(SEQ ID NO:27127)激活。
实施例
概述:
我们已经开发了一种通用方法来设计新型蛋白质开关,其可以隔离生物活性肽和/或结合结构域,使它们保持非活性(“关闭”)状态,直到与第二种称为钥匙的设计的多肽组合,从而诱导激活(“开启”)所述生物活性肽或结合结构域的构象变化。
定义LOCKR开关的命名和结构特征:
·LOCKR代表闩锁正交笼-钥匙蛋白;每个LOCKR设计均由笼蛋白和钥匙蛋白质组成,它们是两条独立的多肽链。
·笼(Cage)在笼支架表示为闩锁(Latch)的区域中编码隔离的生物活性肽或结合结构域。一般策略是优化编码的肽或结合结构域的位置,用于最大程度地掩埋需要隔离的功能残基,同时优化掩埋疏水性残基,并用于极性残基的溶剂暴露/补偿性氢键。
·所述钥匙(Key)通过诱导构象变化的竞争性分子间结合置换闩锁(Latch),从而暴露编码的生物活性肽或结构域并激活系统(图1)。
·正交LOCKR设计(图3)用小写字母下标表示:LOCKR
·前缀表示由LOCKR开关编码和控制的官能团。例如,BimLOCKR是指编码Bim肽的设计的开关,而GFP11-LOCKR是指编码GFP11(GFP的第11链)的设计的开关。
·托底:可以通过以下来调整由钥匙激活LOCKR的动态范围:截短闩锁长度,同时减弱笼-闩锁相互作用,并在笼上打开暴露区域,钥匙可以结合到所述区域以作为“托底”(图2。还可以通过在闩锁中设计减弱笼-闩锁相互作用的突变,以类似的方式来调整LOCKR(图1-2、图10)。托底的长度作为设计名称的后缀被包括:例如,“-t0”意指无托底,而“-t9”意指9个残基的托底(即闩锁被9个残基截短)。
·如果术语“锁”是指单条多肽链(而不是指LOCKR首字母缩略词),则假定与“笼”同义。
这些设计包括首个全新设计的蛋白质,其可以响应于蛋白质结合而经历构象转换。它们是模块化的,因为它们可以编码处于非活性构象的所有三种类型的二级结构的生物活性肽:α螺旋、β链、环,并且是可调整的,因为它们的响应性可以通过改变长度(笼支架和/或闩锁托底的长度)和/或使笼-闩锁接口中的残基突变来在较大的动态范围内进行调整。设计的LOCKR开关可以用于控制大范围功能肽的活性。使用严格的诱导型控制来利用这些生物学功能的能力可用于例如工程化细胞(功能的诱导型激活、工程化复杂的逻辑行为和电路)、开发传感器、开发基于诱导型蛋白质的治疗剂以及创造新的生物材料。
我们开始设计全新的可转换蛋白质系统,遵循以下一般考虑。首先,在由相同位点而不是远端位点(如在变构生物系统中常见的那样)处的分子间与分子内相互作用之间的竞争所支配的系统中,添加开关触发输入后实现最大动态范围所需的自由能调整更为直接。其次,具有可用于竞争性相互作用的扩展结合表面的稳定蛋白质框架比仅在结合时才变得有序的框架具有优势,因为前者的可编程性更高,并且不太可能参与非靶标相互作用。这些特征由图1a中描绘的抽象系统描述,所述系统经历了结合不胜任状态与结合胜任状态之间的热力学驱动的切换。除非被与笼(蓝绿色)的分子内相互作用阻断,闩锁(蓝色)含有可以结合靶标(黄色)的肽序列(橙色);结合更紧密的钥匙(品红色)胜过闩锁,从而允许肽结合靶标。这种系统的行为由单个子反应的结合平衡常数支配(图1a):K
LOCKR设计策略
为了设计这样的可切换系统,我们选择了能够在宽动态范围内调整笼-闩锁和笼-钥匙相互作用的亲和力的结构特征。α螺旋比β链具有优势,因为螺旋间接口受侧链-侧链相互作用的支配,与β折叠所需的协作骨架氢键相比,所述侧链-侧链相互作用更容易调整。为了更好地控制笼-闩锁和笼-钥匙相互作用的相对亲和力,我们选择设计含有掩埋氢键网络的接口:如Watson Crick碱基配对所示,可以用氢键供体和受体位置的相对较小变化获得相当大的特异性
当在大肠杆菌中重组表达时,五个螺旋(笼)和六个螺旋(笼加闩锁)设计是可溶的,并且通过具有多角度光散射的尺寸排阻色谱法,纯化的蛋白质大部分为单体,并且非常耐热,在95℃和5M盐酸胍下保持折叠(图1d)。小角度X射线散射(SAXS)光谱与设计模型和先前的原始三聚体非常一致(图1e),表明结构没有被环改变。在下拉测定法中,五螺旋框架而不是六螺旋框架结合了融合到GFP的第六个螺旋(图1f);后一种结果是预期的,因为如果接口相同,则分子内相互作用K
控制Bim-Bcl2结合,并调整激活的动态范围:
为了将功能安装到LOCKR中,我们选择凋亡中心的Bim-Bcl2相互作用作为模型系统,试图将Bim锁定,使得与Bcl2的结合仅在存在钥匙的情况下发生。我们设计了在闩锁上设计两种可能的Bim相关序列的构建体:一种设计的Bcl2结合肽(aBcl2LOCKR)或仅对Bcl2结合至关重要的Bim残基(pBimLOCKR)。每个对Bcl2具有不同的亲和力,这使我们可以在最初的一系设计中采样一系列K
我们假设可以通过扩展笼上呈现的接口区域来改进系统:扩展闩锁可以增加对笼的亲和力(减小K
由于相互作用能与相互作用残基的总表面积大致成正比,因此通过改变钥匙的长度来调整K
接下来,我们旨在设计一系列正交LOCKR系统,其目的是工程化能够在异质混合物中被选择性激活的多种开关。特异性是为在笼-钥匙接口处使用不同的氢键网络而设计的。从原始扩展的LOCKR
非对称LOCKR开关
原始LOCKR开关设计(图1-2)是从全新设计的对称同型三聚体5L6HC3_1(其含有6个螺旋)开始构建的
gfpLOCKR(GFP11-LOCKR)
使用非对称设计作为起点,我们成功地将GFP的第11链编码到设计的LOCKR开关中(图5)。常见的分拆式GFP由两部分组成:链1-10和链11;当混合时,1-10与11组合,以产生荧光。在这里,我们证明了第11链在不存在钥匙的情况下被隔离,无法与GFP-1-10组合,但在存在GFP-1-10的情况下与钥匙混合时容易地产生荧光(图5)。我们通过实验确定了设计的蛋白质的x射线晶体结构,这表明GFP-11在结构上被编码为α螺旋,其构象与计算设计模型几乎相同(图5);此结果突出了LOCKR系统的功能和模块化,表明我们可以编码具有非螺旋二级结构倾向的生物活性肽。
针对共定位依赖性进行调整
图1-2显示可以预测性地调整LOCKR激活的动态范围,这表明仅当笼和钥匙共同定位时,才可以对系统进行调制以做出响应,这对于多种功能将是有利的。使用来自图4的GFP11-LOCKR,我们证明了的确是这种情况,并且可以使用Spycatcher
笼式内含肽LOCKR开关
当与融合到sfGFP和VMAn内含肽的设计的钥匙混合时,带有编码VMAc内含肽的笼组件的设计的LOCKR开关显示成功激活(图7)。SDS-PAGE显示成功的VMAc-VMAn反应,其条带对应于预期的剪接蛋白产物的正确分子量(图7)。
LOCKR开关的大规模高通量设计
原始LOCKR开关设计(图1-2)是从全新设计的对称同型三聚体5L6HC3_1(其含有6个螺旋)开始构建的
这些2plus1和3plus1 LOCKR开关的有效负载比原始设计更小(有利于电池工程化工作),并且由于缺乏对称性,可能表现良好且不容易聚集。(计算设计和实验测试的详细信息,参见方法部分)。
strepLOCKR(STREPII-LOCKR)
我们使用来自大规模高通量设计的新2+1和3+1LOCKR支架,设计并测试了编码和控制STREPII序列(N)WSHPQFEK(SEQ ID NO:63)的新LOCKR支架(详细信息,参见方法部分)。与阳性对照(图13B)相比,所述设计(图13A)隔离了STREPII标签,并且可以在存在钥匙(图13C-D)的情况下被激活,如通过生物层干涉法(Octet)数据所确定。
图12中的数据证明了mSin3A转录阻遏物的PAH2结构域的锁定。详细信息,参见图例。
图14中的数据表明3plus1 LOCKR开关响应于钥匙的表达激活GFP荧光。
详细信息,参见图例
讨论
在这里,我们通过锁定可以被钥匙诱导激活的蛋白质-蛋白质相互作用,展示了LOCKR平台的能力。我们显示了体外数据,其锁定Bim肽结合其家族成员、GFP链11完成截短的1-10构建体,以及抗StrepTag
LOCKR为蛋白质带来了DNA转换技术的模块化,但具有能够控制和偶联可以由蛋白质和生物活性肽(比核酸更多样和更广泛)执行的广泛生化功能的优势。
方法
PCR诱变和等温组装
所有诱变引物均购自Integrated DNA Technologies(IDT)。设计诱变引物,使其在位点的任一侧上退火>18bp,以诱变引物中编码的所需突变。将PCR用于在突变位点的上游和下游产生与所需pET载体重叠>20bp的片段。将所得扩增子等温组装到用XhoI和NdeI限制性消化的pET21b、pET28b或pET29b中,并转化到化学活性大肠杆菌XL1-Blue细胞中。用Sanger测序对单克隆菌落进行测序。经序列验证的质粒使用Qiagen miniprep试剂盒纯化,并转化到化学活性大肠杆菌BL21(DE3)Star、BL21(DE3)Star-pLysS细胞(Invitrogen)或Lemo21(DE3)细胞(NEB)中进行蛋白表达。
合成基因构建
合成基因购自Genscript Inc.(美国新泽西州皮斯卡塔韦(Piscataway,NJ,USA)),并在pET 28b+、pET21b+或pET29b+大肠杆菌表达载体中递送,插入每个载体的NdeI和XhoI位点处。对于pET28b+构建体,将合成的DNA克隆在具有N-末端六组氨酸标签和凝血酶裂解位点的框架中,并在C-末端处添加终止密码子。对于pET21b+构建体,在C-末端添加终止密码子,使得所述蛋白质表达时没有六组氨酸标签。对于pET29b+构建体,将合成的DNA克隆在具有C-末端六组氨酸标签的框架中。将质粒转化到化学活性大肠杆菌BL21(DE3)Star、BL21(DE3)Star-pLysS细胞(Invitrogen)或Lemo21(DE3)细胞(NEB)中进行蛋白表达。
细菌蛋白的表达与纯化
在50μg/mL羧苄青霉素(pET21b+)或30μg/mL(对于LB)至60μg/mL(对于TBII)卡那霉素(pET28b+和pET29b+)的存在下,将起始培养物在溶源性肉汤(LB)或Terrific
尺寸排阻色谱法,多角度光散射(SEC-MALS)
SEC-MALS实验使用了与miniDAWN
圆二色性(CD)测量
使用AVIV模型420 CD光谱仪测量了CD波长扫描(260至195nM)和温度熔融(25至95℃)。温度熔融监测222nM处的吸收信号,并且以4℃/min的加热速率进行。蛋白质样品在0.1cm比色皿中的PBS pH 7.4中为0.3mg/mL。氯化胍(GdmCl)滴定在同一光谱仪上用自动滴定仪在pH 7.4的PBS中于25℃下进行,在222nM处用0.03mg/mL的蛋白质样品在带有搅拌棒的1cm比色皿中进行监测。每次滴定由至少40个均匀分布的浓度点组成,其中每一步混合时间为一分钟。滴定剂溶液由PBS+GdmCl中相同浓度的蛋白质组成。GdmCl浓度由折射率确定。
小角度X射线散射(SAXS)
经由凝胶过滤将样品交换到SAXS缓冲液(20mM Tris、150mM NaCl、2%甘油,pH8.0室温)中。散射测量是在先进光源的SIBYLS
GFP下拉测定
按照上述方案,从pET28b+表达了His标记的LOCKR,而将钥匙表达融合到pET21b+中没有His标签的超折叠GFP(sfGFP)。将his标记的LOCKR纯化至完全,并透析到TBS(20mMTris、150mM NaCl,pH 8.0室温)中;钥匙-GFP仍为此测定的裂解物。将>1uM的100μL LOCKR施加到96孔黑色
生物层干涉法(BLI)
BLI测量是在带有链霉亲和素(SA)涂层生物传感器的
热力学LOCKR模型
图1a中的热力学模型说明了五个平衡区的三个自由参数。这定义了三个方程,它们将平衡状态下所有物种(打开或关闭的开关、钥匙、靶标、开关-钥匙、开关-靶标和开关-钥匙-靶标)的浓度联系起来。
K
K
K
每种组件(开关、钥匙和靶标)的总量也是恒定的,并且限制了处于平衡状态的每种物种的值。这将以下方程引入模型。
[开关]
[钥匙]
[靶标]
将这六个方程送入sympy.nsolve()中,以找到给定六个常数(三个平衡常数、三个总浓度)的溶液。从此溶液提取馏分结合,并绘制相应的图。
使用Rosetta将功能序列移植到LOCKR上
通过将生物活性序列移植到闩锁上来制备功能性LOCKR的模型,其使用Rosetta
正交LOCKR的Rosetta设计
使用具有计分功能β_nov16的Rosetta,将LOCKR
基于缺乏不满意的掩埋氢键残基、丙氨酸残基的计数作为堆积质量的代表,以及序列不相似性作为寻找极性/疏水模式不相似到足以正交的度量,选择候选正交LOCKR设计。使用BuriedUnsatHbonds过滤器过滤掉不满意的氢键原子,根据过滤器的度量,不允许出现不满意的极性原子。通过对接口处的丙氨酸残基进行计数来确定堆积质量,因为高丙氨酸计数意味着残基的交叉性较差。在整个三个螺旋接口中最多允许15个丙氨酸残基。如seq_alignment.py所示,使用来自BioPython的Bio.pairwise2包通过比对序列,用BLOSUM62对每个设计的闩锁的成对序列差异进行评分。通过大的开放和延伸罚分而不允许在序列内产生间隙进行比对,这类似于两个螺旋的结构比对,以基于疏水性极性图案找到最相似的叠加。从最大得分中减去每个得分,以将得分转换为距离度量;最多样化的序列具有最低的BLOSUM62得分,可转换为最大距离。然后使用HeirClust_fromRMSD.py对所述序列进行聚类,并以170为截止值进行聚类,从而得到13个聚类。通过最大化选择的13个中心之间的距离来选择每个聚类的中心。然后在PyMol
非对称LOCKR开关
使用带有HBNet的Rosetta
X射线晶体学
蛋白质样品的结晶
将纯化的蛋白质样品在20mM Tris pH 8.0和100mM NaCl中浓缩至12-50mg/ml。利用以下结晶筛,用带有主动湿度室的5位甲板蚊式晶体(ttplabtech)筛选样品:JCSG+(Qiagen)、JCSG Core I-IV(Qiagen)、PEG/Ion(Hampton Research)和Morpheus(MolecularDimensions)。发现了不同设计的结晶的最佳条件如下:
·
·
·
X射线数据收集和结构确定
将设计的蛋白质的晶体环化,并放入相应的储库溶液中,如果所述储库溶液不含有冷冻保护剂,则含有20%(v/v)甘油,并在液氮中速冻。X射线数据集是在LawrenceBerkeley国家实验室的先进光源下用光束线8.2.1和8.2.2收集的。使用XDS
gfpLOCKR:(GFP11-LOCKR)开关设计与表征
使用非对称LOCKR
与gfpLOCKR(GFP11-LOCKR)的体外共定位依赖性切换
经由软盘接头用与其N-末端融合的SpyCatcher
笼式内含肽LOCKR开关
VMA内含肽序列被设计为编码到LOCKR
LOCKR开关的大规模高通量设计
从头开始设计成千上万种新LOCKR开关支架的计算流程如下:使用Crick螺旋参数对3-螺旋束(由于2-螺旋支架加上1-螺旋闩锁,表示为2plus1或2+1)和4-螺旋束(由于3-螺旋加上1-螺旋闩锁,表示为3plus1或3+1)的骨架进行了详尽的采样;采样的参数包括z偏移(-1.51、0和1.51)、0与100之间每10度的螺旋相位,以及每个螺旋距中心超螺旋轴(z轴)的超螺旋半径范围为5-10埃;基于原始LOCKR设计的成功,我们专注于具有直螺旋和无超螺旋(超螺旋扭曲固定为0.0)的设计。每个产生的螺旋的长度为58个残基;将Rosetta环闭合方法用于添加将所有螺旋连接成单个多肽链(笼支架)的环。使用HBNet、MC-HBNet和RosettaDesign
strepLOCKR(STREPII-LOCKR)计算设计:
使用来自大型高通量LOCKR设计集的2plus1和3plus1开关设计了编码STREPII标签(N)WSHPQFEK(SEQ ID NO:63)的LOCKR开关。此序列难以编码,因为Pro(其使α螺旋扭结)和Trp和His(如果被掩埋,则必须有可能参与氢键)。为了解决这些问题,没有对所有螺旋残基进行采样,而是挖掘了大型设计集,以找到已经包含预组织成所述设计的氢键网络的Trp(W)、His(H)的LOCKR支架。还考虑了具有预先组织的Phe(F)的设计。
strepLOCKR(STREPII-LOCKR)实验测试:
使用生物层干涉法(
在Octet测定缓冲液中,以5ug/mL的浓度使用THE
上文尚未描述的从细菌制备物纯化蛋白质:
在50μg/ml羧苄青霉素(pET21-NESG)或50μg/ml卡那霉素(pET-28b+)的存在下,使起始培养物在37℃下在Luria-Bertani(LB)培养基中生长过夜,或在Terrific肉汤中生长8小时。将起始培养物用于接种500mL LB(用0.2mM IPTG在约0.6-0.9的OD600下诱导)或含有抗生素的Studier自诱导培养基。使培养物在18℃下表达过夜(许多设计后来也在37℃下表达4小时,但收率没有明显差异)。通过在4℃下以5000rcf离心15分钟来收获细胞,并将其重悬于裂解缓冲液(20mM Tris、300mM NaCl、20mM咪唑,pH 8.0室温)中,然后在溶菌酶、DNAse和不含EDTA的鸡尾酒蛋白酶抑制剂(Roche)或1mM PMSF存在下通过微流化裂解。通过在4℃下以18000rpm离心至少30分钟来清除裂解物,并将其应用于在裂解缓冲液中预先平衡的Ni-NTA(Qiagen)柱。用5个柱体积(CV)的洗涤缓冲液(20mM Tris、300mM NaCl、40mM咪唑,pH8.0室温),随后是3-5CV高盐洗涤缓冲液(20mM Tris、1M NaCl、40mM咪唑,pH 8.0室温),并然后是5CV洗涤缓冲液洗涤所述柱三次。室温下用pH 8.0的20mM Tris、300mM NaCl、250mM咪唑洗脱蛋白质。由于设计的蛋白质均不含半胱氨酸,因此未添加还原剂。
参考文献
1.Huang,P.-S.,Boyken,S.E.&Baker,D.The coming of age of de novoprotein design.Nature 537,320–327(2016).
2.Joh,N.H.等人,De novo design of a transmembrane Zn
3.Davey,J.A.,Damry,A.M.,Goto,N.K.&Chica,R.A.Rational design ofproteins that exchange on functional timescales.Nat.Chem.Biol.13,1280–1285(2017).
4.Huang,P.-S.等人,High thermodynamic stability of parametricallydesigned helical bundles.Science 346,481–485(2014).
5.Boyken,S.E.等人,De novo design of protein homo-oligomers withmodular hydrogen-bond network-mediated specificity.Science 352,680–687(2016).
6.Berger,S.等人,Computationally designed high specificity inhibitorsdelineate the roles of BCL2 family proteins in cancer.Elife 5,1422(2016).
7.Leaver-Fay,A.等人,ROSETTA3:an object-oriented software suite forthe simulation and design of macromolecules.Meth Enzymol 487,545–574(2011).
8.Kuhlman,B.&Baker,D.Native protein sequences are close to optimalfor their structures.Proc Natl Acad Sci USA 97,10383–10388(2000).
9.Crick,F.H.C.The packing of[alpha]-helices:simple coiled-coils.ActaCryst(1953).Q6,689-697[doi:10.1107/S0365110X53001964]6,1–9(1953).
10.Glantz,S.T.等人,Functional and topological diversity of LOV domainphotoreceptors.Proc Natl Acad Sci USA 113,E1442–51(2016).
11.Dueber,J.E.,Mirsky,E.A.&Lim,W.A.Engineering synthetic signalingproteins with ultrasensitive input/output control.25,660–662(2007).
12.Dueber,J.E.,Yeh,B.J.,Chak,K.&Lim,W.A.Reprogramming control of anallosteric signaling switch through modular recombination.Science 301,1904–1908(2003).
13.Huang,P.-S.等人,RosettaRemodel:A Generalized Framework forFlexible Backbone Protein Design.PLoS ONE 6,e24109(2011).
14.Schneidman-Duhovny,D.,Hammel,M.&Sali,A.FoXS:a web server for rapidcomputation and fitting of SAXS profiles.Nucleic Acids Res 38,W540–4(2010).
15.Maguire,J.B.,Boyken,S.E.,Baker,D.&Kuhlman,B.Rapid Sampling ofHydrogen Bond Networks for Computational Protein Design.J.Chem.Theory Comput14,2751–2760(2018).
机译: 蛋白质开关的DE Novo设计,可调谐控制蛋白质降解
机译: 从头开始设计可调节控制蛋白质降解的蛋白质开关
机译: DE Novo设计蛋白质开关