首页> 中国专利> 设计的锚蛋白重复蛋白的改进的N-端加帽模块

设计的锚蛋白重复蛋白的改进的N-端加帽模块

摘要

著录项

  • 公开/公告号CN103403024A

    专利类型发明专利

  • 公开/公告日2013-11-20

    原文格式PDF

  • 申请/专利权人 分子组合公司;

    申请/专利号CN201180066084.3

  • 发明设计人 H.K.宾茨;

    申请日2011-11-25

  • 分类号C07K14/47;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人梁谋

  • 地址 瑞士施利伦

  • 入库时间 2024-02-19 21:23:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-11

    授权

    授权

  • 2013-12-18

    实质审查的生效 IPC(主分类):C07K14/47 申请日:20111125

    实质审查的生效

  • 2013-11-20

    公开

    公开

说明书

技术领域

本发明涉及设计的锚蛋白重复蛋白(DARPin)的改进的N-端加帽模块,其会赋予DARPin改进的热稳定性,还涉及编码这类蛋白的核酸、包含这类蛋白的药物组合物、和这类蛋白在疾病治疗中的用途。?

背景技术

除了抗体以外,新颖的结合蛋白或结合域也可以用于特异性地结合靶分子(例如Binz, H.K., Amstutz, P.和Plückthun, A., Nat. Biotechnol. 23, 1257-1268, 2005)。一类这样的新颖的结合蛋白或结合域是基于设计的重复蛋白或设计的重复结构域(WO 2002/020565; Binz, H.K., Amstutz, P., Kohl, A., Stumpp, M.T., Briand, C., Forrer, P., Grütter, M.G., 和Plückthun, A., Nat. Biotechnol. 22, 575-582, 2004; Stumpp, M.T., Binz, H.K和Amstutz, P., Drug Discov. Today 13, 695-701, 2008)。WO 2002/020565描述了如何构建重复蛋白的大文库和它们的一般用途。这些设计的重复结构域控制重复蛋白的模块性质,并具有N-端和C-端加帽模块,以通过屏蔽所述结构域的疏水核心来防止设计的重复结构域发生聚集(Forrer, P., Stumpp, M.T., Binz, H.K.和Plückthun, A., FEBS letters 539, 2-6, 2003)。这些加帽模块是基于天然的鸟嘌呤-腺嘌呤-结合蛋白(GA-结合蛋白)的加帽重复序列。经显示,通过改进从GA-结合蛋白衍生出的C-端加帽重复序列,可以进一步增加这些设计的锚蛋白重复结构域的热稳定性和热力学稳定性(Interlandi, G., Wetzel, S.K, Settanni, G., Plückthun, A.和Caflisch, A., J. Mol. Biol. 375, 837-854, 2008; Kramer, M.A, Wetzel, S.K., Plückthun, A., Mittl, P.R.E,和Grütter, M.G., J. Mol. Biol. 404, 381-391, 2010)。所述作者将共8个突变引入了该加帽模块,并通过添加3个独特氨基酸来延长了它的C-端螺旋。尽管如此,这些修饰在C-端加帽模块中的引入,导致设计的携带该突变的C-端加帽模块的重复结构域的不希望的二聚化趋势。因而,需要制备通过改进设计的锚蛋白重复结构域的C-或N-端加帽模块或C-或N-端加帽重复序列来进一步优化的重复蛋白。

总之,需要用于治疗癌症和其它病理学状况的、具有改进的稳定性的靶标特异性的锚蛋白重复蛋白。

本发明要解决的技术问题是,鉴定新颖的用于癌症和其它病理学状况的改善治疗的、具有改进的稳定性的锚蛋白重复蛋白。通过提供在权利要求书中表征的实施方案,实现了该技术问题的解决方案。?

发明内容

本发明涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含具有下述氨基酸序列的N-端加帽模块:

GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO:14) 或者

GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO:15),其中

在SEQ ID NO:14或SEQ ID NO:15的24位处的氨基酸残基L任选地被V、I或A替换;

SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被任意氨基酸替换;且

其中SEQ ID NO:14或SEQ ID NO:15的在1位处的G和/或在2位处的S任选地缺失。

具体地,本发明涉及这样的结合蛋白,其中所述N-端加帽模块包含下述序列:

GSX1LX2KKLLE AARAGQDDEV X3X4LX5X6X7GADV NA (SEQ ID NO:5),其中

SEQ ID NO:5的在1位处的G和/或在2位处的S任选地缺失;

X1代表氨基酸残基G、A或D;

X2代表氨基酸残基G或D;

X3代表氨基酸残基R或E;

X4代表氨基酸残基I、E或V;

X5代表氨基酸残基L、V、I或A;

X6代表氨基酸残基A、K或E;和

X7代表选自下述的氨基酸残基:A、H、Y、K和R。

在另一个实施方案中,本发明涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含N-端加帽模块,所述N-端加帽模块的氨基酸序列与下述序列具有至少70% 氨基酸序列同一性:

GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO:14) 或者

GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO:15),并且前提条件是,在所述N-端加帽模块的氨基酸序列的24位处的氨基酸残基是L、V、I或A;

和这样的N-端加帽分子,其中在1位和/或2位的氨基酸缺失。

与差别仅在于N-端加帽模块的相同结合蛋白相比,例如与具有现有技术的N-端加帽模块的结合蛋白相比,这类结合蛋白表现出改进的热稳定性,所述现有技术的N-端加帽模块是例如具有在24位处为氨基酸M (蛋氨酸)的氨基酸序列的N-端加帽模块,例如其中在24位处的L被M替换的SEQ ID NO:14或SEQ ID NO:15。

本发明另外涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含具有下述氨基酸序列的C-端加帽模块:

X1DKX2GKTX3X4DX5X6X7DX8GX9EDX10AEX11LQKAA (SEQ ID NO:6)。

本发明另外涉及编码本发明的结合蛋白的核酸分子,以及包含上述结合蛋白或核酸分子的药物组合物。

本发明另外涉及使用本发明的结合蛋白治疗病理学状况的方法。?

附图说明

图1. DARPin#17和DARPin#18的热稳定性

显示了DARPin#17和DARPin#18的热变性迹线。通过存在于pH 7.4的PBS中的染料SYPRO Orange的荧光强度的增加,跟踪热变性。据估测,DARPin#17和DARPin#18的Tm值分别为64.5℃和71.0℃。F,相对荧光单位(RFU),在515-535 nm激发,在560-580 nm检测;T,按℃计的温度;DARPin的定义参见下文。

图2. DARPin#19和DARPin#20的热稳定性

显示了DARPin#19和DARPin#20的热变性迹线。通过在pH 7.4的PBS中在222 nm的CD信号,跟踪热变性。据估测,DARPin#19和DARPin#20的Tm值分别为72.3℃和74.8℃。FU,解折叠的级分;T,按℃计的温度;DARPin的定义参见下文。

图3. DARPin#21和DARPin#23的热稳定性

显示了DARPin#21和DARPin#23的热变性迹线。通过在pH 7.4的PBS中在222 nm的CD信号,跟踪热变性。据估测,DARPin#21和DARPin#23的Tm值分别为56.5℃和63.5℃。FU,解折叠的级分;T,按℃计的温度;DARPin的定义参见下文。

图4. DARPin#24和DARPin#26的热稳定性

显示了DARPin#24和DARPin#26的热变性迹线。通过在pH 7.4的PBS中在222 nm的CD信号,跟踪热变性。据估测,DARPin#24和DARPin#26的Tm值分别为83℃和89℃。RE,标准化为在20℃测得的信号的在222 nm的相对CD信号;T,按℃计的温度;DARPin的定义参见下文。?

具体实施方式

术语“蛋白”指多肽,其中多肽的至少部分具有或者能够在其多肽链内和/或之间通过形成二级、三级或四级结构获得限定的三维排列。如果蛋白包含两条或更多条多肽,则每条多肽链可非共价连接或者例如通过两条多肽之间的二硫键共价连接。各自具有或者能够通过形成二级或三级结构获得限定的三维排列的蛋白部分,称为“蛋白结构域”。此类蛋白结构域为本领域技术人员熟知。

在重组蛋白、重组蛋白结构域、重组结合蛋白等中使用的术语“重组”意指,所述多肽通过使用相关领域技术人员熟知的重组DNA技术制备。例如,可将编码多肽的重组DNA分子(如通过基因合成制备)克隆入细菌表达质粒(例如pQE30,Qiagen)、酵母表达质粒或哺乳动物表达质粒内。当例如将这样构建的重组细菌表达质粒插入适当的细菌(例如大肠杆菌(Escherichia coli))时,该细菌可产生由这种重组DNA编码的多肽。相应产生的多肽称为重组多肽。

在本发明范围内,术语“多肽”是指由经肽键连接的多个(即两个或更多个)氨基酸的一条或多条链组成的分子。优选地,多肽由超过八个经肽键连接的氨基酸组成。

术语“多肽标签”指连接于多肽/蛋白的氨基酸序列,其中所述氨基酸序列可用于纯化、检测或靶向所述多肽/蛋白,或者其中所述氨基酸序列改善多肽/蛋白的物理化学表现,或者其中所述氨基酸序列具备效应子功能。结合蛋白的个别多肽标签、部分和/或结构域相互之间可直接或经多肽接头连接。这些多肽标签在本领域众所周知,本领域技术人员完全可获得。多肽标签的实例是允许检测所述多肽/蛋白的小的多肽序列,例如His (例如SEQ ID NO:16的His-标签)、myc、FLAG或者Strep-标签或部分诸如酶(例如酶如碱性磷酸酶),或者可用于靶向(诸如免疫球蛋白或其片段)和/或作为效应分子的部分。

术语“多肽接头”指氨基酸序列,它能够连接例如两个蛋白结构域,多肽标签和蛋白结构域,蛋白结构域和非多肽部分诸如聚乙二醇,或两个序列标签。相关领域技术人员已知此类另外的结构域、标签、非多肽部分和接头。在专利申请WO 2002/020565的说明书中提供实例的列表。此类接头的具体实例是各种长度的甘氨酸-丝氨酸-接头和脯氨酸-苏氨酸-接头;优选所述接头具有2至24个氨基酸的长度;更优选所述接头具有2至16个氨基酸的长度。

术语“结合蛋白”指包含一个或多个结合域、一个或多个生物活性化合物和一个或多个聚合物部分的蛋白,如下文进一步解释。优选所述结合蛋白包含至多四个结合域。更优选所述结合蛋白包含至多两个结合域。最优选所述结合蛋白只包含一个结合域。而且,任何此类结合蛋白可包含非结合域的另外的蛋白结构域、多聚化部分、多肽标签、多肽接头和/或单个Cys残基。多聚化部分的实例是免疫球蛋白重链恒定区(其配对以提供功能性免疫球蛋白Fc域),和亮氨酸拉链或者包含在两条此类多肽之间形成分子间二硫键的游离巯基的多肽。单个Cys残基可用于使其它部分与多肽缀合,例如通过使用本领域技术人员熟知的马来酰亚胺化学。优选地,所述结合蛋白是重组结合蛋白。也优选地,结合蛋白的结合域具有不同的靶标特异性。

术语“结合域”意指具有如下文限定的预定性质的锚蛋白重复结构域。此类结合域可通过合理的,或者最通常是组合的蛋白工程技术本领域已知的技术获得(Binz等,2005,在上述引文中)。例如,具有预定性质的结合域可通过包含以下步骤的方法获得:(a)提供重复结构域的不同集合;和(b)筛选所述不同集合和/或从所述不同集合选择以获得至少一种具有所述预定性质的重复结构域。不同的重复结构域集合可根据所用筛选和/或选择系统通过几种方法提供,并可包括使用本领域技术人员熟知的方法,诸如噬菌体展示或核糖体展示。优选地,所述结合域是重组结合域。

术语“预定性质”指诸如结合靶标、阻断靶标、激活靶标介导的反应、酶活性和相关其它性质等性质。根据期望的性质类型,普通技术人员将能够鉴定用于进行筛选和/或选择具有期望性质的结合域的格式和必需步骤。优选所述预定性质是结合靶标。

一种优选的结合蛋白包含至少一个重复结构域。

术语“对靶标具有结合特异性”、“特异性地结合靶标”或“靶标特异性”等是指,结合蛋白或结合域在PBS中与靶标结合的解离常数低于与诸如大肠杆菌麦芽糖结合蛋白(MBP)等无关蛋白结合的解离常数。优选地,在PBS中对靶标的解离常数比对MBP的相应解离常数低至少10倍、更优选102倍、甚至更优选103倍或最优选104倍。

用于确定蛋白-蛋白相互作用的解离常数的方法,诸如基于表面等离子体共振(SPR)的技术(例如SPR平衡分析)或等温滴定量热法(ITC),是本领域技术人员熟知的。如果在不同条件(例如,盐浓度、pH)下测量,测得的特定蛋白-蛋白相互作用的Kd值可以变化。因而,优选地用标准化的蛋白溶液和标准化的缓冲液(诸如PBS),进行Kd值的测量。

术语“靶标”指个别分子诸如核酸分子、多肽或蛋白、碳水化合物,或者任何其它天然存在的分子,包括此类个别分子的任何部分,或者两个或更多个此类分子的复合物。靶标可以是整个细胞或组织样品,或者可以是任何非天然的分子或部分。优选靶标是天然存在或非天然的多肽或者含有化学修饰的多肽,例如通过天然或非天然的磷酸化、乙酰化或甲基化修饰。

下文关于重复蛋白的定义基于专利申请WO 2002/020565。专利申请WO 2002/020565进一步含有重复蛋白特征、技术和应用的一般描述。

术语“重复蛋白”指包含一个或多个重复结构域的蛋白。优选每个所述重复蛋白包含至多四个重复结构域。更优选每个所述重复蛋白包含至多两个重复结构域。最优选每个重复蛋白只包含一个重复结构域。而且,所述重复蛋白可包含另外的非重复蛋白结构域、多肽标签和/或多肽接头。

术语“重复结构域”指包含两个或更多个连续重复单元(模块)作为结构单元的蛋白结构域,其中所述结构单元具有相同的折叠,并紧密堆叠以产生例如具有接合疏水核心的超螺旋结构。优选地,重复结构域另外包含N-端和/或C-端加帽单元(或模块)。甚至更优选地,所述N-端和/或C-端加帽单元(或模块)是加帽重复序列。

术语“设计的重复蛋白”和“设计的重复结构域”分别指通过专利申请WO 2002/020565中解释的发明程序获得的重复蛋白或重复结构域。设计的重复蛋白和设计的重复结构域是合成的,并非出于天然。它们分别是通过对应设计的核酸的表达所得的人造蛋白或结构域。优选表达是在真核或原核细胞诸如细菌细胞中进行,或者通过使用无细胞体外表达系统进行。因此,设计的锚蛋白重复蛋白(即DARPin) 与包含至少一个锚蛋白重复结构域的本发明的结合蛋白对应。

术语“结构单元”指局部有序的多肽部分,其通过沿多肽链相互靠近的两个或更多个二级结构区段之间的三维相互作用形成。此类结构单元表现结构基序。术语“结构基序”指存在于至少一个结构单元中的二级结构元件的三维排列。本领域技术人员熟知结构基序。单独的结构单元不能获得限定的三维排列;但是,它们的连续排列,例如作为重复结构域的重复模块,导致相邻单元的相互稳定,产生超螺旋结构。

术语“重复单元”指包含一种或多种天然存在的重复蛋白的重复序列基序的氨基酸序列,其中所述“重复单元”以多个拷贝出现,且其表现确定蛋白折叠的所有所述基序共同的限定的折叠拓扑学。这样的重复单元对应于:Forrer等人(2003, 在上述引文中)所述的重复蛋白的“重复结构单元(重复序列)”,或Binz等人(2004, 在上述引文中)所述的重复蛋白的“连续同源结构单元(重复序列)”。此类重复单元包含框架残基和相互作用残基。此类重复单元的实例是犰狳重复单元、富亮氨酸重复单元、锚蛋白重复单元、三十四肽重复单元、HEAT重复单元和富亮氨酸变体重复单元。含有两个或更多个此类重复单元的天然存在的蛋白称为“天然存在的重复蛋白”。重复蛋白的各重复单元的氨基酸序列相互之间比较时可具有显著数量的突变、取代、添加和/或缺失,但仍然基本保留重复单元的一般模式或基序。

术语“锚蛋白重复单元”是指这样的重复单元,它是例如Forrer等人(2003, 在上述引文中)所述的锚蛋白重复序列。锚蛋白重复序列是本领域技术人员熟知的。

术语“框架残基”是指重复单元的氨基酸残基,或重复模块的相应氨基酸残基,其参予折叠拓扑学,即其参予所述重复单元(或模块)的折叠或其参予与相邻单元(或模块)的相互作用。这类参予可以是与重复单元(或模块)中的其它残基的相互作用,或对α-螺旋或β-折叠中存在的多肽主链构象或形成线型多肽或环的氨基酸段的影响。

术语“靶标相互作用残基”是指重复单元的氨基酸残基,或重复模块的相应氨基酸残基,其参予与靶物质的相互作用。这类参予可以是与靶物质的直接相互作用,或对其它直接相互作用残基的影响,例如通过稳定重复单元(或模块)的多肽构象以允许或增强直接相互作用残基与所述靶标的相互作用。这类框架和靶标相互作用残基可以通过以下方法鉴定:对通过物理化学方法(诸如X-射线晶体学、NMR和/或CD光谱法)获得的结构数据进行分析,或与结构生物学和/或生物信息学领域的技术人员公知的已知的和相关的结构信息进行比较。

优选地,用于推断重复序列基序的重复单元是同源重复单元,其中所述重复单元包括相同的结构基序,并且其中所述重复单元的超过70%的框架残基是彼此同源的。优选地,所述重复单元的超过80%的框架残基是同源的。最优选地,所述重复单元的超过90%的框架残基是同源的。用于确定多肽之间同源性百分比的计算机程序(诸如Fasta、Blast或Gap)是本领域技术人员已知的。进一步优选地,用于推断重复序列基序的重复单元是从靶标上选择的重复结构域获得、并具有相同靶标特异性的同源重复单元。

术语“重复序列基序”是指从一个或多个重复单元或重复模块推断得出的氨基酸序列。优选地,所述重复单元或重复模块来自于对相同靶标具有结合特异性的重复结构域。这类重复序列基序包括框架残基位置和靶标相互作用残基位置。所述框架残基位置对应于重复单元(或模块)的框架残基的位置。同样,所述靶标相互作用残基位置对应于重复单元(或模块)的靶标相互作用残基的位置。重复序列基序包括固定位置和随机化位置。术语“固定位置”是指这样的重复序列基序中的氨基酸位置,其中所述位置被设置为特定氨基酸。最常见的是,这类固定位置对应于框架残基的位置和/或对某靶标特异性的靶标相互作用残基的位置。术语“随机化位置”表示这样的重复序列基序中的氨基酸位置,其中在所述氨基酸位置允许两个或更多个氨基酸,例如,其中允许常见的二十种天然存在的氨基酸的任意一种,或其中允许二十种天然存在氨基酸的大部分,诸如除了半胱氨酸以外的氨基酸,或除了甘氨酸、半胱氨酸和脯氨酸以外的氨基酸。最常见的是,这类随机化位置对应靶标相互作用残基的位置。但是,框架残基的一些位置也可以是随机化的。

术语“折叠拓扑学”指所述重复单元或重复模块的三级结构。折叠拓扑学取决于形成α-螺旋或β-折叠的至少部分的氨基酸段,或者形成线型多肽或环,或者α-螺旋、β-折叠和/或线型多肽/环的任何组合的氨基酸段。

术语“连续”指这样的排列,其中重复单元或重复模块串联排列。在设计的重复蛋白中,有至少2个,通常为约2至6个,特别是至少约6个,经常是20个或更多个重复单元(或模块)。在大多数情况下,重复结构域的重复单元(或模块) 将表现高度的序列同一性(在对应位置的相同氨基酸残基)或序列相似性(氨基酸残基不同,但具有相似的物理化学性质),以及一些氨基酸残基可能是非常保守的关键残基。但是,在重复结构域的不同重复单元(或模块)之间因氨基酸插入和/或缺失和/或取代所致的高度序列变异性将是可能的,只要维持重复单元(或模块)的共同折叠拓扑学。

本领域技术人员熟知通过物理化学方式诸如X-射线晶体学、NMR或CD光谱学直接确定重复蛋白的折叠拓扑学方法。在生物信息学领域充分建立了且本领域技术人员熟知鉴定和确定重复单元或重复序列基序或者鉴定包含此类重复单元或基序的相关蛋白家族的方法,诸如同源性检索(BLAST等)。精化初始重复序列基序的步骤可包含迭代过程。

术语“重复模块”指设计的重复结构域的重复氨基酸序列,它们最初来自天然存在重复蛋白的重复单元。包含在重复结构域中的各重复模块来自天然存在重复蛋白家族或亚家族(如犰狳重复蛋白或锚蛋白重复蛋白的家族)的一种或多种重复单元。

“重复模块”可包含具有存在于对应重复模块的所有拷贝中的氨基酸残基的位置(“固定位置”)和具有不同或“随机化”氨基酸残基的位置(“随机化位置”)。

术语“加帽模块”指与重复结构域的N-端或C-端重复模块融合的多肽,其中所述加帽模块与所述重复模块形成紧密的三级相互作用(即三级结构相互作用),从而提供帽,其将所述重复模块的疏水核心在不与连续重复模块接触的侧部与溶剂隔开。所述N-端和/或C-端加帽模块可以是,或者可来自,存在于天然存在的重复蛋白中邻近重复单元的加帽单元或其它结构单元。术语“加帽单元”指天然存在的折叠多肽,其中所述多肽限定在N-端或C-端与重复单元融合的特定结构单元,其中所述多肽与所述重复单元形成紧密的三级结构相互作用,从而提供帽,其将所述重复单元的疏水核心在一侧与溶剂隔开。优选地,加帽模块或加帽单元是加帽重复序列。术语“加帽重复序列”表示这样的加帽模块或加帽单元:其具有与所述邻近重复单元(或模块)类似或相同的折叠、和/或与所述邻近重复单元(或模块)的序列相似性。加帽模块和加帽重复序列参见:WO 2002/020565,和Interlandi等人, 2008 (在上述引文中)。例如,WO 2002/020565描述了具有下述氨基酸序列的N-端加帽模块(即加帽重复序列):

GSDLGKKLLEAARAGQDDEVRILMANGADVNA (SEQ ID NO:1),和

具有下述氨基酸序列的C-端加帽模块(即加帽重复序列)

QDKFGKTAFDISIDNGNEDLAEILQKLN (SEQ ID NO:2)。

等人, 2008 (在上述引文中) 描述了具有下述氨基酸序列的C-端加帽模块:QDKFGKTPFDLAIREGHEDIAEVLQKAA (SEQ ID NO:3)和QDKFGKTPFDLAIDNGNEDIAEVLQKAA (SEQ ID NO:4)。

例如,SEQ ID NO:17的N-端加帽模块由1-32位的氨基酸编码,SEQ ID NO:17的C-端加帽模块由99-126位的氨基酸编码。

本发明涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含具有下述氨基酸序列的N-端加帽模块:

GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO:14) 或者

GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO:15),其中

在SEQ ID NO:14或SEQ ID NO:15的24位处的氨基酸残基L任选地被V、I或A替换;

SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被任意氨基酸替换;且

其中SEQ ID NO:14或SEQ ID NO:15的在1位处的G和/或在2位处的S任选地缺失。

已经发现,在N-端加帽模块中的24位应当不是蛋氨酸(M)。在序列SEQ ID NO:14和SEQ ID NO:15中,24位是亮氨酸(L)。在该位的氨基酸同样可以是V、I或A。在24位优选L,或被A替换。在24位最优选L。

在24位的蛋氨酸的替换原理可以应用于多种其它的N-端加帽模块。作为其后果,本发明的主题也包括所有这样的N-端加帽模块:其与氨基酸序列SEQ ID NO:14和SEQ ID NO:15的差别在于除了24位以外的其它位置处的最多9个氨基酸替换。更优选地,这类N-端加帽模块的差别在于替换了8个氨基酸,更优选7个氨基酸,更优选6个氨基酸,更优选5个氨基酸,甚至更优选4个氨基酸,更优选3个氨基酸,更优选2个氨基酸,和最优选1个氨基酸。

氨基酸替换可以是被20种最常见的天然存在的氨基酸中的任一种替换,优选地被选自下述的氨基酸替换:A、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W和Y;更优选地被选自下述的氨基酸替换:A、D、E、H、I、K、L、Q、R、S、T、V和Y。也优选地,氨基酸被同源氨基酸替换;即氨基酸被含有具有类似生物物理性质的侧链的氨基酸替换。例如,带负电荷的氨基酸D可以被带负电荷的氨基酸E替换,或者疏水氨基酸诸如L可以被A、I或V替换。同源氨基酸对氨基酸的替换是本领域技术人员熟知的。

可以从N-端加帽模块除去SEQ ID NO:14或SEQ ID NO:15的在1位处的氨基酸G和/或在2位处的氨基酸S,而对性质没有任何明显影响。这2个氨基酸充当将锚蛋白重复结构域与其它氨基酸和蛋白相连的接头。本发明也包括这样的N-端加帽模块,其中在1位处的G和/或在2位处的S被除去。应当理解,本文定义的“24位”应当相应地改写,分别成为23位(如果1个氨基酸缺失)或22位(如果2个氨基酸缺失)。

与具有相同氨基酸序列(包括N-端加帽模块)、但是它的N-端加帽模块中与SEQ ID NO:14或SEQ ID NO:15的24位相对应的氨基酸残基是M(替代L、V、I或A)的锚蛋白重复结构域相比,在N-端加帽模块的24位处的蛋氨酸的替换会赋予锚蛋白重复结构域更高的热稳定性,即在PBS中更高的Tm值。在实施例中描述并在附图中显示了这样的锚蛋白重复结构域和结合蛋白对的实例(在24位为M,相对于在24位为L、V、I或A)和它们的Tm值。优选的是这样的N-端加帽模块,其中在24位处的M被另一个氨基酸替换会导致携带这类N-端加帽模块的锚蛋白重复结构域的Tm增加了至少1℃、优选至少2℃、更优选至少3℃、或最优选至少4℃。

用基于荧光的热稳定性测定(Niesen, F.H., Nature Protocols 2(9): 2212-2221, 2007),可以分析蛋白特别是锚蛋白重复结构域的热稳定性。由此,通过对蛋白的疏水部分(其随着蛋白解折叠而暴露)具有亲和力的染料的荧光的增加,测量蛋白解折叠时的温度。在由此得到的荧光转变中点(从较低荧光强度至较高荧光强度)处的温度则对应于分析的蛋白的中点变性温度(Tm)。可替换地,可以通过CD光谱法分析蛋白的热稳定性;即通过本领域技术人员熟知的技术跟踪它在222 nm的圆二色性(CD) 信号,从而测量它的热变性。

在一个实施方案中,当SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被其它氨基酸替换时,优选地,在SEQ ID NO:14或SEQ ID NO:15的26位处的氨基酸残基A被H、Y、K或R替换。但是,更优选地,在26位处的氨基酸残基A未被替换。

在另一个实施方案中,当SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被其它氨基酸替换时,优选地,在SEQ ID NO:14或SEQ ID NO:15的21位处的氨基酸残基R被E替换。但是,更优选地,在26位处的氨基酸残基R未被替换。

在另一个实施方案中,当SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被其它氨基酸替换时,优选地,在SEQ ID NO:14的22位处的氨基酸残基I或在SEQ ID NO:15的22位处的氨基酸残基E被V替换。但是,更优选地,分别在22位处的氨基酸残基I或E未被替换;参见例如图2所示的化合物对。

在另一个实施方案中,当SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被其它氨基酸替换时,优选地,在SEQ ID NO:14或SEQ ID NO:15的25位处的氨基酸残基K被A或E替换。但是,更优选地,在25位处的氨基酸残基K未被替换,或被A替换,如图1所示的化合物对所示的。

在另一个实施方案中,当SEQ ID NO:14或SEQ ID NO:15的最多9个在除了24位以外的其它位置处的氨基酸任选地被其它氨基酸替换时,优选地,在SEQ ID NO:14的21-26位处的氨基酸残基RILLKA或在SEQ ID NO:15的21-26位处的氨基酸残基RELLKA未被替换。

另一种优选的N-端加帽模块包含下述序列基序

GSX1LX2KKLLE AARAGQDDEV X3X4LX5X6X7GADV NA (SEQ ID NO:5),其中

SEQ ID NO:5的在1位处的G和/或在2位处的S任选地缺失;

X1代表氨基酸残基G、A或D;优选地,A或D;

X2代表氨基酸残基G或D;

X3代表氨基酸残基R或E;

X4代表氨基酸残基I、E或V;优选地,I或E;

X5代表氨基酸残基L、V、I或A;优选地,L或A;

X6代表氨基酸残基A、K或E;优选地,A或K;和

X7代表选自下述的氨基酸残基:A、H、Y、K和R;优选地A或H。

在另一个实施方案中,所述N-端加帽模块包含下述序列:

X1LX2KKLLEAARAGQDDEVRILX3AX4GADVNA (SEQ ID NO:13)

其中X1代表氨基酸残基G、A或D;

其中X2代表氨基酸残基G或D;

其中X3代表氨基酸残基L、V、I或A;优选地L;且

其中X4代表氨基酸残基A、H、Y、K、R或N;优选地,A或N。

最优选的是这样的结合蛋白,其包含至少一个锚蛋白重复结构域,其中所述锚蛋白重复结构域包含具有下述氨基酸序列的N-端加帽模块:

GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO:14) 或者

GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO:15),其中

SEQ ID NO:14和SEQ ID NO:15的在1位处的G和/或在2位处的S任选地缺失。

在另一个实施方案中,本发明涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含N-端加帽模块,所述N-端加帽模块的氨基酸序列与下述序列具有至少70% 氨基酸序列同一性:

GSDLGKKLLE AARAGQDDEV RILLKAGADV NA (SEQ ID NO:14) 或者

GSDLGKKLLE AARAGQDDEV RELLKAGADV NA (SEQ ID NO:15),并且前提条件是,在所述N-端加帽模块的氨基酸序列的24位处的氨基酸残基是L、V、I或A;

和这样的N-端加帽分子,其中在1位和/或2位的氨基酸缺失。

优选地,对应的N-端加帽模块的氨基酸序列与SEQ ID NO:14或SEQ ID NO:15具有至少75% 氨基酸序列同一性、更优选80% 氨基酸序列同一性、甚至更优选85% 氨基酸序列同一性、更优选90% 氨基酸序列同一性和最优选95% 氨基酸序列同一性,总是在下述条件下:所述N-端加帽模块的氨基酸序列中的在24位的氨基酸残基是L、V、I或A,更优选L或A,最优选L。

在具体实施方案中,所述N-端加帽模块与SEQ ID NO:14或SEQ ID NO:15具有指定的氨基酸序列同一性百分比,和在26位处的氨基酸残基A、H、Y、K或R和/或在21位处的氨基酸残基R或E,总是在下述条件下:所述N-端加帽模块的氨基酸序列中的在24位的氨基酸残基是L、V、I或A。

进一步优选的是,任意这样的包含N-端加帽重复序列的N-端加帽模块,其中所述加帽重复序列中的一个或多个氨基酸残基被特定氨基酸残基替换,所述特定氨基酸残基在比对相应加帽单元或重复单元时存在于对应位置处。

本发明的结合蛋白包含至少一个锚蛋白重复结构域,其中所述锚蛋白重复结构域包含如本文定义的N-端加帽模块,所述锚蛋白重复结构域可以另外含有下述优选的C-端加帽模块之一。一种优选的C-端加帽模块包含下述序列基序

X1DKX2GKTX3X4D X5X6X7DX8GX9EDX10 AEX11LQKAA (SEQ ID NO:6),其中

X1代表氨基酸残基Q或K;

X2代表氨基酸残基A、S或F;优选地,S或F;

X3代表氨基酸残基A或P;

X4代表氨基酸残基A或F;

X5代表氨基酸残基I或L;

X6代表氨基酸残基S或A;

X7代表氨基酸残基I或A;

X8代表氨基酸残基A、E或N;优选地,A或N;

X9代表氨基酸残基N或H;

X10代表氨基酸残基L或I;

X11代表氨基酸残基I或V;且

其中如果X4代表F、且X7代表I、且X8代表N或E,那么X2不代表F。

另一种优选的C-端加帽模块包含下述序列基序

X1DKX2GKTX3AD X4X5X6DX7GX8EDX9 AEX10LQKAA (SEQ ID NO:7),其中

X1代表氨基酸残基Q或K;

X2代表氨基酸残基A、S或F;优选地,S或F;

X3代表氨基酸残基A或P;

X4代表氨基酸残基I或L;

X5代表氨基酸残基S或A;

X6代表氨基酸残基I或A;

X7代表氨基酸残基A、E或N;优选地,A或N;

X8代表氨基酸残基N或H;

X9代表氨基酸残基L或I;和

X10代表氨基酸残基I或V。

另一种优选的C-端加帽模块包含下述序列基序

X1DKX2GKTX3AD X4X5ADX6GX7EDX8 AEX9LQKAA (SEQ ID NO:8),其中

X1代表氨基酸残基Q或K;

X2代表氨基酸残基A、S或F;优选地,S或F;

X3代表氨基酸残基A或P;

X4代表氨基酸残基I或L;

X5代表氨基酸残基S或A;

X6代表氨基酸残基A、E或N;优选地,A或N;

X7代表氨基酸残基N或H;

X8代表氨基酸残基L或I;和

X9代表氨基酸残基I或V。

优选地,这样的包含SEQ ID NO:6、7或8的序列基序的C-端加帽模块在与所述序列基序的3位相对应的位置处具有氨基酸残基A、I或K;优选,I或K。

也优选地,这样的包含SEQ ID NO:6、7或8的序列基序的C-端加帽模块在与所述序列基序的14位相对应的位置处具有氨基酸残基R或D。

一种优选的C-端加帽模块是具有下述氨基酸序列的C-端加帽模块:QDKSGKTPADLAADAGHEDIAEVLQKAA (SEQ ID NO:9)。

本发明另外涉及包含至少一个锚蛋白重复结构域的结合蛋白,其中所述锚蛋白重复结构域包含具有下述氨基酸序列的C-端加帽模块:如上文定义的SEQ ID NO:6、7或8。

可以如下遗传地构建本发明的锚蛋白重复结构域:借助于基因合成,装配N-端加帽模块(即SEQ ID NO:14的N-端加帽重复序列),继之以一个或多个重复模块(即包含SEQ ID NO:17的33-98位氨基酸残基的重复模块)和C-端加帽模块(即SEQ ID NO:9的C-端加帽重复序列)。然后可以如上所述在大肠杆菌中表达遗传地装配的重复结构域基因。

进一步优选的是,具有不含氨基酸C、M或N的氨基酸序列的结合蛋白、重复结构域、N-端加帽模块或C-端加帽模块。

进一步优选的是,具有不含氨基酸N和随后的G的氨基酸序列的结合蛋白、重复结构域、N-端加帽模块或C-端加帽模块。

进一步优选非天然存在的加帽模块、重复模块、结合蛋白或结合域。

术语“非天然存在的”意指合成的或不来自天然,更具体来讲,术语意指用人手制造。术语“非天然存在的结合蛋白”或“非天然存在的结合域”意指所述结合蛋白或所述结合域是合成的(即通过化学合成用氨基酸制备)或重组的且不来自天然。“非天然存在的结合蛋白”或“非天然存在的结合域”分别是通过对应设计的核酸表达获得的人造蛋白或结结构域。优选表达在真核或细菌细胞中进行,或者通过使用无细胞体外表达系统进行。而且,术语意指所述结合蛋白或所述结合域的序列不作为非人造序列条目存在于序列数据库,例如GenBank、EMBL-Bank或Swiss-Prot中。本领域技术人员熟知这些数据库及其它相似的序列数据库。

术语“PBS”意指含有137 mM NaCl、10 mM磷酸盐和2.7 mM KCl且具有pH 7.4的磷酸盐缓冲水溶液。

在一个具体实施方案中,本发明涉及包含锚蛋白重复结构域且包含生物活性化合物的结合蛋白,所述锚蛋白重复结构域包含根据本发明的N-端加帽模块。

术语“生物活性化合物”表示,当施用给具有疾病的哺乳动物时,会改变所述疾病的化合物。生物活性化合物可以具有拮抗或激动性质,且可以是蛋白性生物活性化合物或非蛋白性生物活性化合物。

通过用标准DNA克隆技术制备基因融合多肽,可将这样的蛋白性生物活性化合物共价连接至例如本发明的锚蛋白重复结构域,接着进行标准表达和纯化。

通过化学方法,例如,经由马来酰亚胺接头与半胱氨酸巯基偶联,其中半胱氨酸经由肽接头与本文所述的结合域的N-或C-端偶联,可以将这样的非蛋白性生物活性化合物共价连接至例如本发明的锚蛋白重复结构域。

蛋白性生物活性化合物的实例是,具有独特靶标特异性的结合域(例如通过结合生长因子来中和它)、细胞因子(例如白介素)、生长因子(例如人生长激素)、抗体及其片段、激素(例如GLP-1)和任何可能的蛋白性药物。

非蛋白性生物活性化合物的实例是,毒素(例如得自免疫原(ImmunoGen)的DM1)、靶向GPCRs的小分子、抗生素和任何可能的非蛋白性药物。

另一个优选的实施方案是这样的重组结合蛋白,其包含结合域,其中所述结合域是锚蛋白重复结构域或设计的锚蛋白重复结构域。这类锚蛋白重复结构域可以包含1个、2个、3个或更多个内部重复模块,所述重复模块将参与结合靶标。这类锚蛋白重复结构域包含本发明定义的N-端加帽模块、2-4个内部重复模块和C-端加帽模块。优选地,所述结合域是锚蛋白重复结构域或设计的锚蛋白重复结构域。

优选的是,如上定义的结合蛋白,其中所述锚蛋白重复结构域或所述设计的锚蛋白重复结构域包含具有下述锚蛋白重复序列基序的重复模块:

X1DX2X3GX4TPLHLAAX5X6GHLEIVEVLLKX7GADVNA (SEQ ID NO:10)

其中X1、X2、X3、X4、X5、X6和X7、彼此独立地代表选自下述的氨基酸残基:A、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W和Y;优选地,

X1代表选自下述的氨基酸残基:A、D、M、F、S、I、T、N、Y和K;更优选K和A;和

X7代表选自下述的氨基酸残基:S、A、Y、H和N;更优选Y或H。

在其它实施方案中,本文描述的任意结合蛋白或结构域可以与一个或多个额外部分共价结合,所述额外部分包括、例如,结合不同靶标以产生双特异性结合剂的部分、生物活性化合物、标记部分(例如荧光标记诸如荧光素,或放射性示踪剂)、促进蛋白纯化的部分(例如小肽标签,诸如His-或strep-标签)、提供改善的治疗效果的效应物功能的部分(例如提供抗体依赖性细胞介导的细胞毒性的抗体Fc部分,毒性蛋白部分诸如铜绿假单胞菌(Pseudomonas aeruginosa)外毒素A (ETA)或小分子毒性剂诸如美登木素生物碱或DNA烷化剂)或提供改善的药代动力学的部分。可以根据感知的治疗需要评估改善的药代动力学。经常希望增加生物利用度和/或增加给药之间的时间,其可能通过增加给药后血清中的蛋白维持可用的时间实现。在一些情况下,希望改善蛋白血清浓度随时间的连续性(例如,减少在施用后不久的浓度和下次施用前不久的浓度之间的蛋白血清浓度差异)。

在另一个实施方案中,本发明涉及编码特定结合蛋白、特定锚蛋白重复结构域和特定N-端加帽模块的核酸分子。此外,还涉及包含所述核酸分子的载体。

此外,涉及药物组合物,其包含一种或更多种上述的包含锚蛋白重复结构域的结合蛋白、或编码特定结合蛋白的核酸分子、以及任选的药学上可接受的载体和/或稀释剂。药学上可接受的载体和/或稀释剂是本领域技术人员已知的,将在下文更详细的解释。更进一步,涉及包括一种或更多种上述结合蛋白(尤其是包含锚蛋白重复结构域的结合蛋白)的诊断组合物。

药物组合物包含如上所述的结合蛋白和药学上可接受的载体、赋形剂或稳定剂例如如在Remington's Pharmaceutical Sciences第16版, Osol, A. 编[1980]中所述。技术人员已知的合适载体、赋形剂或稳定剂是盐水、林格氏溶液、葡萄糖(dextrose)溶液、汉克氏(Hank's)溶液、非挥发油、油酸乙酯、5%葡萄糖盐水、提高等渗性和化学稳定性的物质、缓冲剂和防腐剂。其它合适载体包括本身不引起产生对接受组合物的个体有害的抗体的任何载体,诸如蛋白、多糖、聚乳酸、聚乙醇酸、聚合氨基酸和氨基酸共聚物。药物组合物还可以是组合制剂,其包含另外的活性剂,诸如抗癌剂或抗血管生成剂。

将用于体内给药的制剂必须消毒或无菌。这通过过滤用无菌过滤膜容易完成。

药物组合物可通过技术人员知识范围内的任何合适方法给药。优选的给药途径是胃肠外。在胃肠外给药中,将本发明的药物配制成与如上文限定的与药学上可接受的赋形剂组合的单位剂量可注射形式,诸如溶液剂、混悬剂或乳剂。给药的剂量和方式将取决于将治疗的个体和具体疾病。一般而言,施用药物组合物,使得以1 μg/kg至20 mg/kg、更优选10 μg/kg至5 mg/kg、最优选0.1至2 mg/kg的剂量施用本发明的结合蛋白。优选其以推注剂量(bolus dose)给药。也可使用连续输注,包括经渗透性微型泵连续皮下递送。如果这样的话,可将药物组合物以5至20 μg/kg/分钟、更优选7至15 μg/kg/分钟的剂量输注。

此外,考虑将任一种上述药物组合物用于病症的治疗。本发明另外提供了治疗方法。所述方法包括:给有此需要的患者施用治疗有效量的本发明的结合蛋白。

此外,考虑到治疗哺乳动物(包括人类)的病理学状况的方法,所述方法包括:给有此需要的患者施用有效量的上述药物组合物。

根据本发明的结合蛋白可通过几种方法获得和/或进一步进化,诸如在噬菌体(WO 1990/002809、WO 2007/006665)或细菌细胞(WO 1993/010214)表面上展示、核糖体展示(WO 1998/048008)、质粒展示(WO 1993/008278)、或者通过使用共价的RNA-重复蛋白杂合构建体(WO 2000/032823),或者例如通过蛋白互补测定(WO 1998/341120)进行的细胞内表达和选择/筛选。本领域技术人员已知此类方法。

用于选择/筛选根据本发明的结合蛋白的锚蛋白重复蛋白文库,可根据本领域技术人员已知的方案获得(WO 2002/020565, Binz, H.K., 等人, J. Mol. Biol., 332, 489-503, 2003,和Binz等人, 2004, 在上述引文中)。使用标准重组DNA技术(例如WO 2002/020565, Binz等人, 2003, 在上述引文中和Binz等人, 2004, 在上述引文中),可以从本发明的重复模块和适当的加帽模块或加帽重复序列模块地(modularly)装配本发明的重复结构域(Forrer, P., 等人, FEBS letters 539, 2-6, 2003)。

本发明不限于在实施例描述的特定实施方案。按照下文描述的概要可使用和处理其它来源。

实施例

下文公开的所有起始原料和试剂已为本领域技术人员所知,且可商购得到或者可用众所周知的技术制备。

材料

化学品购自Fluka (瑞士)。寡核苷酸来自Microsynth (瑞士)。除非另外说明,DNA聚合酶、限制酶和缓冲剂来自New England Biolabs (美国)或Fermentas (立陶宛)。克隆和蛋白制备株是大肠杆菌XL1-blue (Stratagene, 美国)或BL21 (Novagen, 美国)。

分子生物学

除非另外说明,根据所述方案(Sambrook J., Fritsch E.F. 和Maniatis T., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory 1989, New York),执行方法。

在实施例中使用的DARPin

DARPin #17 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:17);

DARPin #18 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:18);

DARPin #19 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:19);

DARPin #20 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:20);

DARPin #21 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:21);

DARPin #22 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:22);

DARPin #23 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:23);

DARPin #24 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:24);

DARPin #25 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:25);

DARPin #26 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:26);

DARPin #27 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:27);

DARPin #28 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:28);

DARPin #29 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:29);

DARPin #30 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:30);

DARPin #31 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:31);

DARPin #32 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:32)。

设计的锚蛋白重复蛋白库

描述了N2C和N3C设计的锚蛋白重复蛋白文库(WO 2002/020565; Binz等人. 2003, 在上述引文中; Binz等人. 2004, 在上述引文中)。在N2C和N3C中的数字描述了存在于N-端和C-端加帽模块之间的随机化重复模块的数目。用于定义重复单元和模块内的位置的命名法是基于:Binz等人. 2004, 在上述引文中,修改是,将锚蛋白重复模块和锚蛋白重复单元的边缘移动一个氨基酸位置。例如,Binz等人. 2004 (在上述引文中) 的锚蛋白重复模块的1位对应于本公开内容的锚蛋白重复模块的2位,因此,Binz等人. 2004(在上述引文中)的锚蛋白重复模块的33位对应于本公开内容的下一锚蛋白重复模块的1位。

所有DNA序列都通过测序确认,所有所述蛋白的计算分子量都通过质谱确认。

实施例1: DARPin的构建、表达和纯化

可以如下制备具有确定的氨基酸序列的DARPin:基因合成对应的逆向翻译的核酸序列,将其亚克隆进表达系统(例如大肠杆菌表达系统)的适当表达载体中,表达和纯化所述蛋白。本领域技术人员已知这样的方法。

加帽模块/重复序列的替换

通过组合本领域技术人员已知的技术(诸如氨基酸序列比对、诱变和基因合成),可以用本发明的N-或C-端加帽重复序列替换锚蛋白重复结构域的N-或C-端加帽重复序列。

例如,可以如下用SEQ ID NO:14的N-端加帽重复序列替换SEQ ID NO:17的N-端加帽重复序列:(i) 通过与SEQ ID NO:14进行序列比对,确定SEQ ID NO:17的N-端加帽重复序列(即序列位置1-32),(ii) 用SEQ ID NO:14的序列替换确定的SEQ ID NO:17的C-端加帽重复序列的序列,得到SEQ ID NO:18,(iii) 制备编码重复结构域的基因,所述重复结构域编码替换的C-端加帽重复序列(即SEQ ID NO:18),(iv) 在大肠杆菌的细胞质中表达修饰的重复结构域,和(v) 通过标准方式纯化修饰的重复结构域。

作为另一个实施例,可以如下用SEQ ID NO:9的C-端加帽重复序列替换SEQ ID NO:17的C-端加帽重复序列:(i) 通过与SEQ ID NO:9进行序列比对,确定SEQ ID NO:17的C-端加帽重复序列(即序列位置99-126),(ii) 用SEQ ID NO:9的序列替换确定的SEQ ID NO:17的C-端加帽重复序列的序列,(iii) 制备编码重复结构域的基因,所述重复结构域编码替换的C-端加帽模块,(iv) 在大肠杆菌的细胞质中表达修饰的重复结构域,和(v) 通过标准方式纯化修饰的重复结构域。

的高水平和可溶性表达

大肠杆菌BL21或XL1-Blue细胞中表达DARPin,并用标准方案利用其His-标签纯化。用25 ml静止过夜的培养物(LB,1% 葡萄糖,100 mg/l的氨苄西林;37℃) 接种1 l培养物(相同培养基)。在600 nm吸光度为约1时,用0.5 mM IPTG诱导培养物,并在37℃温育4小时。将培养物离心,使所得沉淀再悬浮于40 ml TBS500 (50 mM Tris–HCl, 500 mM NaCl, pH 8)中,并超声处理。将裂解物再次离心,将甘油(10% (v/v)终浓度)和咪唑(20 mM终浓度)加入所得上清液中。根据生产商的说明书(QIAgen, 德国),用Ni-次氮基三乙酸柱(2.5 ml柱体积)纯化蛋白。可替换地,根据本领域技术人员已知的标准树脂和方案,通过阴离子交换色谱法和随后的尺寸排阻色谱法,纯化不含6xHis-标签的DARPin或锚蛋白重复结构域。从1升大肠杆菌培养物中可纯化至多200 mg高度可溶性DARPin,根据SDS-15% PAGE估计的纯度> 95%。这样纯化的DARPin用于进一步表征。

实施例2: 具有改进的N-端加帽模块的DARPin的更高热稳定性

用基于荧光的热稳定性测定(Niesen, F.H., Nature Protocols 2(9): 2212-2221, 2007),分析了纯化的DARPin (根据实施例1)的热稳定性。由此,通过对蛋白的疏水部分(其随着蛋白解折叠而暴露)具有亲和力的染料(例如SYPRO Orange; Invitrogen, 目录号S6650) 的荧光的增加,测量蛋白(即这样的DARPin)解折叠时的温度。在由此得到的荧光转变中点(从较低荧光强度至较高荧光强度)处的温度则对应于分析的蛋白的中点变性温度(Tm)。可替换地,通过CD光谱测定法分析这样的纯化的DARPin的热稳定性;即通过本领域技术人员熟知的技术跟踪它在222 nm的圆二色性(CD) 信号,从而测量它的热变性。

基于荧光的热稳定性测定

使用实时PCR仪器(即与CFX96光学系统(BioRad)相组合的C1000热循环仪(BioRad)),使用SYPRO Orange作为荧光染料,测量了DARPin的热变性。在含有1x SYPRO Orange (从5’000x SYPRO Orange储备溶液稀释, Invitrogen)的pH 7.4的PBS或pH 5.8的MES缓冲液(250 mM (2-N-吗啉代)乙磺酸pH 5.5、150 mM NaCl以1:4 (v/v)与pH 7.4的PBS混合,并将pH调至5.8)中,制备了50μM浓度的DARPin,并将50μl这样的蛋白溶液或仅缓冲液加入白色96-孔PCR板(Bio-Rad)中。用Microseal 'B' Adhesive Seals (Bio-Rad)密封所述板,并在实时PCR仪器中以0.5℃的增量从20℃加热至95℃,包括在每个温度增量以后的25秒保温步骤,在DARPin的热变性之后,测量样品在每个温度增量处的相对荧光单位。使用实时PCR仪器的通道2(即在515-535 nm激发和在560-580 nm检测),测量板孔中的相对荧光单位,并减去用仅缓冲液得到的对应值。从由此得到的热变性转变中点,可以确定分析的DARPin的Tm值。

基于CD光谱法的热稳定性测定

在Jasco J-715仪器(Jasco, 日本)中在222 nm记录DARPin的CD信号,同时使用每分钟1℃或2℃的温度增量,将浓度为0.02 mM的蛋白(在pH 7.4的PBS中)缓慢地从20℃加热至95℃。这是跟踪DARPin的变性的有效方式,因为DARPin主要由α螺旋组成,所述α螺旋在解折叠后在222 nm处表现出它们的CD信号的强烈变化。观察到的DARPin的这样测量的CD信号迹线的转变中点对应于它的Tm值。

在附图和表1中显示了DARPin在pH7.4的PBS中的热变性结果,所述热变性通过SYPRO Orange的荧光强度增加来跟踪,或者通过CD光谱法来跟踪。

使用基于荧光的热稳定性测定,将DARPin #17的热稳定性与DARPin #18的热稳定性进行了对比(表1, 图1)。除了它们的重复结构域的N-端加帽模块中的单个氨基酸以外,这2种DARPin具有相同的氨基酸序列。DARPin #18的重复结构域包含如本文所述的改进的N-端加帽模块,但是DARPin #17不含;即DARPin#18的N-端加帽模块含有在它的N-端加帽模块的24位处的亮氨酸(L)残基,而DARPin#17含有在该位置处的蛋氨酸(M)。令人惊奇地,这种单个氨基酸变化会导致约6.5℃的Tm值增加。

使用基于荧光的和基于CD的热稳定性测定,将DARPin #19的热稳定性与DARPin #20的热稳定性进行了对比(表1, 图2)。除了它们的重复结构域的N-端加帽模块中的单个氨基酸以外,这2种DARPin具有相同的氨基酸序列。DARPin #20的重复结构域包含如本文所述的改进的N-端加帽模块,但是DARPin #19不含;即DARPin#20的N-端加帽模块含有在它的N-端加帽模块的24位处的L残基,而DARPin#19含有在该位置处的M。令人惊奇地,这种单个氨基酸变化会导致约2.5℃的Tm值增加。因而,通过应用本发明的改进的N-端加帽模块,可以进一步增加已经非常稳定的DARPin的热稳定性。

使用基于CD的热稳定性测定,将DARPin #21的热稳定性与DARPin#22和DARPin#23的热稳定性进行了对比(表1, 图3)。除了它们的重复结构域的N-端加帽模块中的2个或3个氨基酸以外,这3种DARPin具有相同的氨基酸序列。DARPin #22和DARPin#23的重复结构域包含如本文所述的改进的N-端加帽模块,但是DARPin #21不含;即DARPin#22和DARPin#23的N-端加帽模块含有在它的24位处的L残基(而DARPin#21含有在该位置处的M)和在26位处的A残基(而DARPin#21含有在该位置处的N);另外,DARPin#23的N-端加帽模块含有在25位处的K残基(而DARPin#21和DARPin#22含有在该位置处的A)。因而,DARPin#23包含如本文所述的改进的N-端加帽模块,所述N-端加帽模块包含21-26位的氨基酸序列RILLKA (SEQ ID NO:11)。令人惊奇地,DARPin#22和DARPin#23的N-端加帽模块中的这些小变化会导致Tm值与DARPin#21相比分别增加约8.5℃或7℃。此外,DARPin#22和DARPin#23具有几乎相同的热稳定性,尽管它们的氨基酸序列差别在于它们的重复结构域的N-端加帽模块中的单个氨基酸;即DARPin#22的N-端加帽模块含有在它的N-端加帽模块的25位处的A残基,而DARPin#23含有在该位置处的K。因而,这样的N-端加帽模块中的在25位处的单个氨基酸的这种变化似乎会被较好地耐受,且对热稳定性没有影响。

使用基于荧光的和基于CD的热稳定性测定,将DARPin#24的热稳定性与DARPin#25和DARPin#26的热稳定性进行了对比(表1, 图4)。除了它们的重复结构域的N-端加帽模块中的3个或4个氨基酸以外,这3种DARPin具有相同的氨基酸序列。DARPin #25和DARPin#26的重复结构域包含如本文所述的改进的N-端加帽模块,但是DARPin #24不含;即DARPin#25和DARPin#26的N-端加帽模块含有在24位处的L残基(而DARPin#24含有在该位置处的M),含有在25位处的K残基(而DARPin#24含有在该位置处的A)和在26位处的A残基(而DARPin#24含有在该位置处的N);另外,DARPin#26的N-端加帽模块含有在22位处的E残基(而DARPin#24和DARPin#25含有在该位置处的I)。因而,DARPin#25和DARPin#26包含如本文所述的改进的N-端加帽模块,所述N-端加帽模块分别包含21-26位的氨基酸序列RILLKA (SEQ ID NO:11)和RELLKA (SEQ ID NO:12)。令人惊奇地,DARPin#25和DARPin#26的N-端加帽模块中的这些小变化会导致Tm值与DARPin#24相比分别增加约5℃或6℃。此外,DARPin#25和DARPin#26具有几乎相同的热稳定性,尽管它们的氨基酸序列差别在于它们的重复结构域的N-端加帽模块中的单个氨基酸;即DARPin#25的N-端加帽模块含有在它的N-端加帽模块的22位处的I残基,而DARPin#26含有在该位置处的E。因而,这样的N-端加帽模块中的在22位处的单个氨基酸的这种变化似乎会被较好地耐受,且对热稳定性没有显著影响。

总之,通过如本文所述的其N-端加帽模块的氨基酸序列的小变化,可以显著提高各种DARPin的热稳定性。?

1用基于荧光的测定在pH 7.4的PBS中测得的Tm值

2用基于CD的测定在pH 7.4的PBS中测得的Tm值

3因为没有达到转变后基线,仅仅估测的Tm值

n.d.: 未测定。

实施例3:具有改进的C-端加帽模块的DARPin的更高热稳定性

如在实施例2中所述,用基于荧光的热稳定性测定,或通过CD光谱法,分析了DARPin的热稳定性。

使用基于荧光的热稳定性测定,将DARPin #27 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:27)的热稳定性与DARPin #28 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:28) 的热稳定性进行了对比。除了它们的重复结构域的C-端加帽模块以外,这2种DARPin具有相同的氨基酸序列。DARPin #28的重复结构域包含如本文所述的改进的C-端加帽模块,但是DARPin #27不含。DARPin #27和DARPin #28在pH 7.4的PBS中测得的Tm值分别为约63℃和约73℃。DARPin #27和DARPin #28在pH 5.8的MES缓冲液中测得的Tm值分别为约54.5℃和约66℃。

使用基于荧光的热稳定性测定,将DARPin #29 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:29)的热稳定性与DARPin #30 (具有与它的N-端融合的His-标签(SEQ ID NO:16)的SEQ ID NO:30)的热稳定性进行了对比。除了它们的重复结构域的C-端加帽模块以外,这2种DARPin具有相同的氨基酸序列。DARPin #30的重复结构域包含如本文所述的改进的C-端加帽模块,但是DARPin #29不包含。DARPin #29和DARPin #30在pH 5.8的MES缓冲液中测得的的Tm值分别为约51℃和约55℃。

使用CD光谱法,将DARPin #31 (SEQ ID NO:31)的热稳定性与DARPin #32 (SEQ ID NO:32)的热稳定性进行了对比。除了它们的重复结构域的C-端加帽模块以外,这2种DARPin具有相同的氨基酸序列。DARPin #32的重复结构域包含如本文所述的改进的C-端加帽模块,但是DARPin #31不包含。DARPin #31和DARPin #32在pH 7.4的PBS中测得的Tm值分别为约59.5℃和约73℃。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号