首页> 中国专利> 作为亲和配体的掺入有免疫球蛋白片段的蜘蛛丝融合蛋白结构

作为亲和配体的掺入有免疫球蛋白片段的蜘蛛丝融合蛋白结构

摘要

一种包括部分B和CT,及任选地REP的重组融合蛋白,其中B包括至少一个免疫球蛋白片段,其提供与有机靶选择性相互作用的能力;CT是从70至120个氨基酸残基的部分,并衍生自蜘蛛丝蛋白的C端片段;及REP是从70至300个氨基酸残基的部分,并衍生自蜘蛛丝蛋白的重复片段。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-04-05

    授权

    授权

  • 2015-04-22

    实质审查的生效 IPC(主分类):B01D15/38 申请日:20130502

    实质审查的生效

  • 2015-03-25

    公开

    公开

说明书

发明的技术领域

本发明涉及重组融合蛋白的领域,且更具体地涉及包括衍生自蜘蛛丝 蛋白(拖丝蛋白)的部分的新颖融合蛋白。本发明提供了用于提供为包括重 组融合蛋白的聚合物的蛋白结构的方法,所述重组融合蛋白包括衍生自拖 丝蛋白的部分。还提供了用于结合有机靶的新颖蛋白结构。

发明背景

在应用蛋白化学中,一个常见的问题是如何向相关的活性位点配制或 呈现生物活性肽或蛋白,所述活性位点通常是有机靶,诸如核酸、蛋白、 蛋白复合体、蛋白和/或脂质和/或碳水化合物和/或核酸的复合体。最简单 的解决方案是仅仅提供生物活性肽或蛋白的水溶液。然而,许多应用的确 要求一些进一步的手段来实现期望的目标。例如,可将肽/蛋白缔合于脂质 混合物或化学地固定于支持结构。

用于固定于支持结构的肽/蛋白的应用包括制备和分析性分离程序诸 如生物工艺、层析法、细胞捕获和培养、主动过滤器(active filters)和诊 断学。基于胞外基质蛋白例如胶原的结构公开在EP 704532和EP 985732 中。

还已经建议在支持结构中使用蜘蛛丝蛋白。蜘蛛丝是天然的高性能聚 合物,由于强度和弹性的组合而获得了非同寻常的韧性和延伸性。蜘蛛具 有多达七个不同的腺,这些腺产生具有不同机械性质和功能的多种丝类 型。由大壶状腺产生的拖丝(dragline silk)是最坚韧的纤维。它由两种主要 的多肽组成,大多被称为大壶状腺拖丝蛋白(spidroin)(MaSp)1和2,但 在例如,在十字园蛛(Araneus diadematus)中被称为ADF-3和ADF-4。这些 蛋白质具有200-720kDa范围内的分子量。蜘蛛拖丝蛋白质或MaSp具有 分成三部分的组成:无重复的N-端结构域、由许多重复的聚Ala/Gly区段 构成的中心重复区域和无重复的C-端结构域。通常认为重复区域在丝纤维 中形成分子间接触,但不太清楚末端结构域的准确功能。还认为与纤维形 成相联系地,重复区域经历从无规卷曲和α-螺旋构象到β-折叠结构的结构 转化。拖丝蛋白的C端区域在蜘蛛种类和丝类型之间通常是保守的。

WO 07/078239和Stark,M.等人,Biomacromolecules 8:1695-1701,(2007) 公开了由具有高的Ala和Gly含量的重复片段和蛋白质的C端片段组成的 微型蜘蛛丝蛋白,以及包含蜘蛛丝蛋白的可溶性融合蛋白。在蜘蛛丝蛋白 从其融合配体释放后,自然地获得蜘蛛丝蛋白的纤维。

Rising,A.等人,CMLS 68(2):169-184(2010)综述了在产生蜘蛛丝蛋白 方面的进展。

US 2009/0263430公开了酶β-半乳糖苷酶与微型蜘蛛丝蛋白的膜的化 学偶联。然而,化学偶联可能要求对蛋白稳定性和/或功能不利的条件。包 含衍生自蜘蛛丝蛋白的重复区的区段的多个重复的蛋白已经被设计以包 括RGD细胞结合区段(Bini,E等人,Biomacromolecules 7:3139-3145(2006)) 和/或R5肽(Wong Po Foo,C等人,Proc Natl Acad Sci 103(25):9428-9433 (2006))或参与矿化作用(mineralization)的其它蛋白区段(Huang,J等人, Biomaterials 28:2358-2367(2007);WO 2006/076711)。在这些现有技术文献 中,通过在变性的有机溶剂六氟异丙醇(HFIP)中增溶融合蛋白和干燥来形 成膜。

US 2005/261479A1公开了用于纯化由重复片段和亲和性标签组成的 重组丝蛋白的方法,包括从复杂混合物中磁亲和性分离单独的丝蛋白,而 不形成丝蛋白纤维或其它聚合物结构。

已知的支持结构和相关的技术在以下方面具有某些缺陷,例如经济 性、效率、稳定性、再生能力、生物活性和生物相容性。

发明概要

本发明的一个目的是提供能够与有机靶选择性相互作用的新颖的重 组融合蛋白。

本发明的一个目的是提供能够与有机靶选择性相互作用的新颖蛋白 结构。

本发明的另一个目的是提供能够与有机靶选择性相互作用的蛋白结 构,其中所述结构的形成不使用可能对蛋白的二级结构或活性具有不可预 测的作用和/或保持在蛋白结构中的强溶剂。

本发明的一个目的是提供能够与有机靶选择性相互作用的稳定蛋白 结构,该蛋白结构在使用后可容易地再生,例如通过化学处理再生。

本发明的另一个目的是提供生物相容的并适于细胞培养和作为植入 物的稳定蛋白结构。

本发明的又另一个目的是提供具有高密度的能够与有机靶选择性相 互作用的均匀间隔的官能团的蛋白结构。

本发明的另一个目的是提供在+4℃或在室温储存数月后保持其选择 性结合能力的蛋白结构。

本发明的又一个目的是提供可高压灭菌,即,在灭菌热处理后保持其 选择性结合能力的蛋白结构。

本发明的另一个目的是提供在蛋白微阵列诊断中有用的蛋白结构。

为了这些和其它目的,将从以下公开内容明显的是,根据第一方面, 本发明提供融合蛋白和由包含该融合蛋白作为重复结构单元的聚合物组 成的蛋白结构,如权利要求书中所列出的。

根据一个相关的方面,本发明提供编码融合蛋白的分离的核酸和产生 融合蛋白的方法,如权利要求书中所列出的。

根据另一个方面,本发明提供用于提供蛋白结构的方法,如权利要求 书中所列出的。

根据另一个方面,本发明提供亲和性介质,如权利要求书中所列出的。

根据一个方面,本发明提供细胞支架材料,如权利要求书中所列出的。 根据一个相关的方面,本发明还提供根据权利要求书的细胞和细胞支架材 料的组合。

根据一个方面,本发明提供蛋白结构和融合蛋白的新颖用途,如权利 要求书中所列出的。

根据另一个方面,本发明提供用于从样品分离有机靶的方法,如权利 要求书中所列出的。

根据另一个方面,本发明提供用于固定和任选地培养细胞的方法,如 权利要求书中所列出的。

附图简述

图1显示拖丝蛋白C端结构域的序列比对。

图2显示拖丝蛋白N端结构域的序列比对。

图3显示Alexa647标记的抗原结合根据本发明的融合蛋白。

图4显示生物素化的抗原结合根据本发明的融合蛋白,以Alexa647 标记的链霉亲和素检测。

图5显示在泡沫格式中丝融合的抗体片段的显微照片。

图6显示纯的和丝融合的抗体片段的抗原结合分析。

所附序列的列表

SEQ ID NO

1 4Rep

2 4RepCT

3 NT4Rep

4 NT4Rep

5 NT4RepCTHis

6 NT

7 CT

8 共有NT序列

9 共有CT序列

10 来自Euprosthenops australis MaSp1的重复序列

11 共有G区段序列1

12 共有G区段序列2

13 共有G区段序列3

14 CT Euprosthenops sp MaSp1

15 CT Euprosthenops australis MaSp1

16 CT三带金蛛(Argiope trifasciata)MaSp1

17 CT泉字云斑蛛(Cyrtophora moluccensis)Sp1

18 CT几何寇蛛(Latrodectus geometricus)MaSp1

19 CT黑寡妇蜘蛛(Latrodectus hesperus)MaSp1

20 CT赫氏粒突蛛(Macrothele holsti)Sp1

21 CT络新妇蛛(Nephila clavipes)MaSp1

22 CT斑络新妇(Nephila pilipes)MaSp1

23 CT马达加斯加金色球蜘蛛(Nephila madagascanensis)MaSp1

24 CT带状褪金色圆网蜘蛛(Nephila senegalensis)MaSp1

25 CT变异涡蛛(Octonoba varians)Sp1

26 CT中华缕网蛛(Psechrus sinensis)Sp1

27 CT长爪绿色荧光蜘蛛(Tetragnatha kauaiensis)MaSp1

28 CT多色肖蛸(Tetragnatha versicolor)MaSp1

29 CT巨头地衣圆蛛(Araneus bicentenarius)Sp2

30 CT悦目金蛛(Argiope amoena)MaSp2

31 CT阿吉普奥兰提亚金蛛(Argiope aurantia)MaSp2

32 CT三带金蛛MaSp2

33 CT多型棘腹蛛(Gasteracantha mammosa)MaSp2

34 CT几何寇蛛MaSp2

35 CT黑寡妇蜘蛛MaSp2

36 CT络新妇蛛MaSp2

37 CT马达加斯加金色球蜘蛛MaSp2

38 CT带状褪金色圆网蜘蛛MaSp2

39 CT褐灰色捕鱼蜘蛛(Dolomedes tenebrosus)Fb1

40 CT褐灰色捕鱼蜘蛛Fb2

41 CT十字园蛛ADF-1

42 CT十字园蛛ADF-2

43 CT十字园蛛ADF-3

44 CT十字园蛛ADF-4

45 NT Euprosthenops australis MaSp1

46 NT几何寇蛛MaSp1

47 NT黑寡妇蜘蛛MaSp1

48 NT络新妇蛛MaSp1

49 NT三带金蛛MaSp2

50 NT几何寇蛛MaSp2

51 NT黑寡妇蜘蛛MaSp2

52 NT Nephila inaurata madagascanensis MaSp2

53 NT络新妇蛛MaSp2

54 NT横纹金蛛(Argiope bruennichi)圆柱状拖丝蛋白1

55 NT Nephila clavata圆柱状拖丝蛋白1

56 NT黑寡妇蜘蛛管状拖丝蛋白

57 NT络新妇蛛鞭毛状丝蛋白

58 NT Nephila inaurata madagascanensis鞭毛状丝蛋白

59 His6ScFvRep4CT(DNA)

60 His6Rep4CTScFv(DNA)

61 His6ScFvRep4CT

62 His6Rep4CTScFv

63 His6ScFvCT

64 His6CTScFv

65 His6ScFvNT-CT

66 His6NT-CTScFv

67 His6ScFvNTRep4CT

68 His6NTRep4CTScFv

69 His6ScFvNTNT-CT

70 His6NTNT-CTScFv

71 His6-scFv1-NTCT(DNA)

72 His6-scFv1-NTCT

73 His6-scFv1-CT(DNA)

74 His6-scFv1-CT

发明详述

本发明总体是基于如下洞见:能够与有机靶选择性相互作用的固体蛋 白结构可制备为以重组融合蛋白作为重复结构单元的聚合物形式。融合蛋 白包括能与有机靶(抗原/表位)选择性相互作用的至少一种免疫球蛋白 (Ig)片段,和对应于蜘蛛丝蛋白的至少C端片段的部分。意外地,衍生 自蜘蛛丝蛋白的部分可被诱导以在结构上重排并因而形成聚合、固体结 构,而包括免疫球蛋白片段的部分,包括例如互补位,不在结构上重排, 但保持其期望的结构和功能,即,与该有机靶选择性相互作用的能力。可 获得蛋白结构而无化学偶联步骤或变性方法步骤,这使得程序容易并改进 获得具有保持其部分的功能性的融合蛋白的机会,尤其是当功能依赖于部 分的二级结构时。这些融合蛋白聚合物的形成可被紧密地控制,且这一洞 见已被开发为进一步的新颖蛋白结构、产生该蛋白结构的方法、和该蛋白 结构在多种应用和方法中的用途。

因此,根据本发明的融合蛋白具备期望的选择性相互作用活性和蛋白 结构中在生理条件下采用的内部的固体支持活性二者。当拖丝蛋白部分在 结构上重排以形成聚合、固体结构时,融合蛋白的结合活性被保持,而包 括免疫球蛋白片段的部分与拖丝蛋白部分共价连接,一定是被认为令人惊 讶的。事实上,提供选择性相互作用活性的部分当被整合在根据本发明的 融合蛋白结构中时,可增加其热和/或化学稳定性和/或结合活性。该蛋白 结构还提供对有机靶的选择性相互作用活性的高和可预测的密度。具有选 择性相互作用活性的有价值的蛋白部分的丢失被减到最小,因为所有表达 的蛋白部分与固体支持物缔合。

从根据本发明的融合蛋白形成的聚合物是固体结构,由于其物理特征 而是有用的,尤其是高强度、弹性和轻的重量的有用的组合。特别有用的 特征是,融合蛋白的拖丝蛋白衍生部分是生化牢固的,适于用例如酸、碱 或离液剂再生,并适于加热灭菌,例如在120℃高压灭菌20min。该聚合 物还因为其支持细胞粘附和生长的能力而是有用的。衍生自拖丝的性质在 开发为了医学或技术目的的新材料方面是有吸引力的。尤其是,根据本发 明的蛋白结构可用在制备和分析性分离程序中,诸如层析法、细胞捕获、 筛选和培养、主动过滤器(active filters)和诊断学。

通过一个优选的实施例,根据本发明的蛋白结构还可用于在蛋白微阵 列诊断中固定抗体片段。从本公开内容了解的许多优点中,可以预见的是, 根据本发明的蛋白结构提供了增强的灵敏度。现今许多疾病很难诊断并选 择正确的治疗。在多路分子诊断领域,人们可以证明随着时间从DNA到 mRNA和现在到蛋白的趋势。由于蛋白的信息量比核酸丰富得多,基于蛋 白模式更精确的诊断的可能是解决更困难的诊断疾病状态,以及个体化药 物需要的关键。此外,这些诊断应该更能反映通过原始DNA提供的静态 视图难以做到的,患者状况的疾病和健康的时空变化。

通过对患者样品(如血清)的蛋白含量变化进行彻底的调查,在分子 水平上与疾病相关的变化的理解将有助于阐明疾病生物学的潜在机理。疾 病相关的分子特征的调查可以作为改进诊断、预后和患者分类的基础。它 还可能是选择适合特定的治疗的患者,及监测治疗干预的作用的有用的工 具。特定的蛋白结构域,诸如工程化抗体片段,如单链可变片段(ScFv), 是用于分析样品中特定蛋白含量的无价的工具。最具挑战性的任务之一是 以其三维结构、功能性和结合位点被保持且可接触这样的方式将抗体片段 固定在表面上。许多重要的疾病标志物是蛋白,其在容易获得的样品如血 清中丰度低。为了实现高度精确的分子特征描绘,因此人们需增强当前的 常规技术的灵敏度。我们在此描述了将抗体片段固定在由重组蜘蛛丝制备 的蛋白为基础的环境上的新策略。这种温和的固定化技术有助于保持抗体 片段稳定及阻碍变性,且从而增强对患者样品中特定蛋白的灵敏度。

蜘蛛丝具有非常引人注目的物理和生理特征。重组微型蜘蛛丝蛋白 Rep4CT可以在大肠杆菌(Escherichia coli)中制备并在非变性条件下纯化。 纯的Rep4CT可进一步加工成各种固体结构,或格式,诸如纤维、透明膜 和三维多孔泡沫。其它蛋白结构域可以与CT或Rep4CT融合而产生,且然 后加工成以特定的蛋白功能功能化的固体格式。以这种方式,抗体片段可 以共价连接至CT或Rep4CT,且然后加工成为以抗原结合的功能功能化的 小、但强的斑点。这些丝固定的抗体片段也可以布点在微阵列芯片表面上, 并用于在身体样品如血清中检测疾病分子。

使用这种策略,抗体片段被包含在以蛋白为基础的环境中,且抗体片 段的主要部分将在其活性形式中。新的策略可以与传统的在表面上直接干 燥抗体片段相比,其中片段的更大的比例将随机地定向和变性,且因此, 不能结合抗原。此外,当与蜘蛛丝连接时,抗体片段将与抗原结合位点被 定向朝着溶液中的分子。由于灵敏度与活性抗体片段的数目关联,可用的 和活性抗体片段的比例越高,灵敏度越高。

根据本发明的蛋白结构还可用在医疗装置中,诸如植入物和医学产 品,诸如伤口闭合系统、创可贴、缝线、伤口敷料、和用于细胞固定、细 胞培养、组织工程和引导细胞再生的支架。

本发明提供能够与有机靶选择性相互作用的重组融合蛋白,该融合蛋 白包括部分B和CT、和任选的REP和/或NT。本发明还提供能够与有机 靶选择性相互作用的蛋白结构,其中所述蛋白结构是包括根据本发明的重 组融合蛋白、和任选地由根据本发明的重组融合蛋白组成的聚合物,即, 包括部分B和CT、和任选的NT,和任选地由部分B和CT、和任选的 REP和/或NT组成。

尽管在实施例中融合蛋白的CT、REP和NT部分不得已地涉及具体 蛋白,例如衍生自来自Euprosthenops australis的大拖丝蛋白1(MaSp1)的 蛋白,为了产生根据本发明的融合蛋白结构的目的,考虑本公开内容可适 用于任何结构上相似的部分。而且,尽管在实施例中提供融合蛋白的选择 性相互作用活性的B部分不得已地涉及具体蛋白部分,例如衍生自免疫球 蛋白的部分,为了产生根据本发明的融合蛋白结构的目的,考虑本公开内 容可适用于能够与有机靶选择性相互作用的任何结构上和/或功能上相似 的B部分。

根据本发明的具体融合蛋白以式BX-CT-BZ、Bx-REP-By-CT-Bz和 Bx-CT-By-REP-Bz定义,其中x、y和z是从0至5的整数;且x+y+z≥1, 任选地在融合蛋白的任一端或融合蛋白中任何两个蛋白部分之间还包含 一个NT部分。如果x+y+z>1,即,如果存在两个或更多个B部分,它们 可以是相同或不同的。两个或更多个B部分可具有与相同有机靶或与不同 有机靶选择性相互作用的能力。优选地,两个或更多个B部分是大致上相 同的,各具有与相同有机靶选择性相互作用的能力。可替代地,优选两个 或更多个B部分是不相同的,且它们一起提供与有机靶选择性相互作用的 能力。

在根据本发明的优选融合蛋白中,x、y和z是0至2、优选地0至1 的整数。在根据本发明的某些优选融合蛋白中,y=0。在根据本发明的更 优选的具体融合蛋白中,y=0且x或z是0,即,融合蛋白以式BX-CT、 CT-BZ、BX-REP-CT、BX-CT-REP、REP-CT-Bz和CT-REP-BZ定义,其 中x和z是从1至5的整数。在根据本发明的优选融合蛋白中,y=0,x和 z是从0至1的整数;且x+z=1。如此,根据本发明的某些优选融合蛋白 以式B-CT、CT-B、B-REP-CT、B-CT-REP、REP-CT-B和CT-REP-B定 义。在根据本发明的优选融合蛋白中,任选的REP部分不存在。在缺乏 REP部分的融合蛋白中,B部分对其它分子相比对其抗原靶的非特异性结 合的降低已有利地观察到。从缺乏REP部分的融合蛋白自发形成固体结 构特别令人惊讶。在另一个根据本发明的优选融合蛋白中,任选的NT部 分不存在。

术语“融合蛋白”此处指通过由重组核酸,即通过组合正常情况下不会 一起出现的两个或更多个核酸序列而人工创造的DNA或RNA表达而制备 的蛋白质(遗传工程)。根据本发明的融合蛋白是重组蛋白,且因此其不同 于天然存在的蛋白质。特别地,因为野生型拖丝蛋白不是由以上列出的重 组核酸表达的,所以其不是根据本发明的融合蛋白。组合的核酸序列编码 具有特定功能特性的不同蛋白质、部分蛋白质或多肽。所得的融合蛋白或 重组融合蛋白是具有衍生自原始蛋白质、部分蛋白质或多肽中的每一种的 功能特性的单一蛋白质。而且,根据本发明的融合蛋白和相应的基因是嵌 合的,即,该蛋白/基因部分衍生自至少两种不同的物种。CT部分,以及 任选的REP和NT部分均衍生自蜘蛛丝蛋白。为了避免疑问,根据本发明 的B部分是非拖丝蛋白的蛋白或多肽,即,其不是衍生自蜘蛛丝蛋白。具 体地,根据本发明的B部分不是衍生自蜘蛛丝蛋白的C端、重复或N端 片段。

融合蛋白通常由从170至2000个氨基酸残基、诸如从170至1000个 氨基酸残基、诸如从170至600个氨基酸残基、优选地从170至500个氨 基酸残基、诸如从170至400个氨基酸残基组成。小的尺寸是有利的,因 为包含蜘蛛丝蛋白片段的较长蛋白可能形成无定形的聚集物,这需要使用 强力的溶剂来增溶和聚合。重组融合蛋白可包含多于2000个残基,尤其 是在蜘蛛丝蛋白包含多于一个B部分和/或当其包含NT部分,例如1-2个 NT部分的情形时。

术语"拖丝蛋白(spidroin)"和"蜘蛛丝蛋白(spider silk protein)"遍及 本说明书可互换地使用,并涵盖所有已知的蜘蛛丝蛋白,包括大壶状腺蜘 蛛丝蛋白,其通常缩写为"MaSp",或在十字园蛛的情形缩写为"ADF"。这 些大壶状腺蜘蛛丝蛋白一般为两种类型,1和2。这些术语还包括与已知 蜘蛛丝蛋白具有高程度的同一性和/或相似性的非天然蛋白。

所以,术语"非拖丝蛋白"意指不是衍生自蜘蛛丝蛋白的蛋白,即,与 蜘蛛丝蛋白具有低(或无)程度的同一性和/或相似性。

根据本发明的蛋白结构能够与有机靶选择性相互作用。这一能力存在 于根据本发明的融合蛋白中,更具体地存在于融合蛋白的B部分中。CT 部分、以及任选的REP和NT部分,与有机分子的任何相互作用不被术语 "能够与有机靶选择性相互作用"涵盖。为了避免疑问,术语"能够与有机靶 选择性相互作用"不涵盖根据本发明的融合蛋白的依赖于包括CT部分、以 及任选的REP和NT部分的相互作用的二聚、寡聚或聚合。

术语"有机靶"涵盖含碳原子的所有化学分子,例外是通常本领域技术 人员认为是无机分子的那些,例如碳酸盐、碳的简单氧化物、氰化物、金 刚石和石墨。为了避免疑问,无机分子、盐和离子,诸如硅石和氯化钙, 不是有机的。有机靶可以是包含有机分子或由有机分子组成的复合体,例 如,细胞表面上的受体复合体。有机靶可以是一种或更多种有机分子类型 的单体、二聚体、寡聚体或聚合物,可以由共价键或其它类型的缔合保持 在一起。当然,它还可以简单地是单个有机分子。根据本发明的优选的有 机靶包括但不限于,核酸、蛋白和多肽、脂质和碳水化合物、以及其组合。 根据本发明的另外的优选的有机靶包括但不限于,免疫球蛋白、包括免疫 球蛋白或其衍生物的分子、白蛋白、包括白蛋白或其衍生物的分子、生物 素、包括生物素或其衍生物或类似物的分子、及生物疾病标志物,例如来 自血液、血清、尿、唾液或来自身体组织的其它样品。

在本发明的上下文中,配体例如根据本发明的融合蛋白的B部分与其 靶的"特异"或"选择性"相互作用是指,该相互作用使得特异性与非特异性、 或选择性或非选择性的相互作用之间的差别变得有意义。两种蛋白之间的 相互作用有时以解离常数测量。解离常数描述两种分子之间的结合强度(或 亲和性)。通常抗体与其抗原(表位)之间的解离常数是从10-7至10-11M。 然而,高特异性不必要求高亲和性。对其对应物具有低亲和性(在摩尔范围 中)的分子已经显示为与具有高的多的亲和性的分子同样特异性。在本发明 的情形中,特异或选择性相互作用是指在指定条件下,在天然存在的或经 加工的生物或生化流体的样品中其它蛋白的存在下,特定方法可用于确定 特定蛋白、靶蛋白或其片段的存在和/或量的程度。换言之,特异性或选择 性是区分相关蛋白的能力。特异和选择性在本说明书中有时可互换地使 用。

根据本发明的融合蛋白还可包含一个或更多个接头肽。接头肽可布置 在融合蛋白的任何部分之间,例如,两个B部分之间、B和CT部分之间、 CT和REP部分之间、和B和REP部分之间,或可布置在融合蛋白的任 一末端。如果B部分包含两个或更多个Ig片段,接头肽还可布置在两个 Ig片段之间。如果融合蛋白包含两个或更多个B部分,接头肽还可布置在 两个B部分之间。接头可在融合蛋白的功能单元之间提供间隔区,而且还 可构成用于鉴定和纯化该融合蛋白的工具,例如,His和/或Trx标签。如 果融合蛋白包含用于鉴定和纯化融合蛋白的两个或更多个接头肽,优选它 们被间隔序列隔开,例如His6-间隔区-His6-。接头还可构成将融合蛋白导 向膜和/或致使融合蛋白从宿主细胞分泌到周围介质中的信号肽,例如信号 识别颗粒。融合蛋白还可在其氨基酸序列中包括允许裂解并去除接头和/ 或其它相关部分,通常是一个或更多个B部分的裂解位点。多种裂解位点 是本领域技术人员已知的,例如,针对化学剂的裂解位点,例如Met残基 之后的CNBr裂解位点和Asn-Gly残基之间的羟胺裂解位点,针对蛋白酶 例如凝血酶或蛋白酶3C的裂解位点,和自我剪接序列,例如内蛋白(intein) 自我剪接序列。

CT和B彼此直接或间接连接。直接连接指部分之间的直接共价结合 而无间插序列例如接头。间接连接也是指部分通过共价键连接,但是存在 间插序列,例如接头和/或一个或更多个另外的部分,例如REP和/或NT 部分。

一个或更多个B部分可布置在融合蛋白的内部或任何一端,即,布置 在C端或布置在N端。优选一个或更多个B部分布置在融合蛋白的N末 端。如果融合蛋白包含用于鉴定和纯化融合蛋白的一个或更多个接头肽, 例如,His或Trx标签,优选地其被布置在融合蛋白的N末端。

优选的融合蛋白具有布置在N端的B部分通过1-30个氨基酸残基, 经由例如1-10个氨基酸残基的接头肽偶联到布置在C端的REP和CT部 分的形式。接头肽可包含裂解位点。任选地,融合蛋白具有可包含纯化标 签例如His标签和裂解位点的N端或C端接头肽。

另一种优选的融合蛋白具有布置在N端的B部分直接偶联到布置在C 端的REP和CT部分的形式。任选地,融合蛋白具有可包含纯化标签例如 His标签和裂解位点的N端或C端接头肽。

根据本发明的蛋白结构是包含根据本发明的重组融合蛋白作为重复 结构单元的聚合物,这是意指,其包含有序的多个根据本发明的融合蛋白, 通常远多于100个融合蛋白单元、例如,1000个融合蛋白单元或更多。任 选地,聚合物可包含无B部分的互补蛋白、优选地衍生自蜘蛛丝的蛋白作 为另外的重复结构单元。如果融合蛋白的B部分是大和/或庞大的,这可以 是有益的。这些互补蛋白通常包括,REP部分和CT部分,及任选地NT 部分,例如1-2个NT部分。根据本发明的优选的互补蛋白可具有本文列 出的结构的任一种,并缺失B部分。优选地,互补融合蛋白与缺失B部分 的融合蛋白基本上相同。然而优选地,根据本发明的蛋白结构是由根据本 发明的重组融合蛋白作为重复结构单元组成的聚合物,即,根据本发明的 蛋白结构是根据本发明的重组融合蛋白的聚合物。

聚合物中融合单元的量值意指该蛋白结构获得显著的尺寸。在优选的 实施方案中,蛋白结构在至少两个维度上具有至少0.1μm的尺寸。因此, 本文使用的术语"蛋白结构"涉及具有至少0.1μm的厚度的融合蛋白聚合 物,优选地人眼可见的宏观聚合物,即,具有至少1μm的厚度。术语"蛋 白结构"不涵盖无结构的聚集物或沉淀物。尽管融合蛋白的单体是水溶性 的,应理解的是,根据本发明的蛋白结构是固体结构,即,不溶于水。该 蛋白结构是包含根据本发明的重组融合蛋白作为重复结构单元单体的聚 合物。

优选地,根据本发明的蛋白结构是以选自由纤维(fiber)、膜(film)、 泡沫(foam)、网状物(net)、网(mesh)、球(sphere)和胶囊(capsule) 组成的组的物理形态。

优选地,根据本发明的蛋白结构是厚度为至少1nm例如至少0.1μm、 优选地至少1μm的纤维或膜。优选地,纤维或膜具有范围在1nm-400μm, 例如1-400μm、且优选地60-120μm中的厚度。优选地,纤维具有范围在 0.5-300cm、优选地1-100cm中的长度。其它优选的范围是0.5-30cm和 1-20cm。纤维具有在物理操作期间保持完整的能力,即,可用于旋转、编 织、扭转、钩编和类似程序。膜是有利的,因为其是一致的并粘附于固体 结构,例如,微量滴定板中的塑料制品。膜的这一特征有助于洗涤和再生 程序,对于分离目的是非常有用的。

还优选地,根据本发明的蛋白结构具有高于1MPa、优选地高于2 MPa、更优选地10MPa或更高的抗张强度。优选地根据本发明的蛋白结 构具有高于100MPa、更优选地200MPa或更高的抗张强度。

CT部分是包含70至120个氨基酸残基的蛋白片段,并衍生自蜘蛛丝 蛋白的C端片段。表述"衍生自"意指在根据本发明的CT部分的上下文中, 它与蜘蛛丝蛋白的C端氨基酸序列具有高度的相似性。如图1中所示,该 氨基酸序列在各个物种和蜘蛛丝蛋白,包括MaSp1和MaSp2之间相当保 守。以SEQ ID NO:9提供了MaSp1和MaSp2的C端区域的共有序列。在 图1中,比对了以GenBank登记条目(如果可用)表示的下列MaSp蛋白质 (SEQ ID NO:14-44):

表1–拖丝蛋白CT部分

哪种特定的CT部分存在于根据本发明的蜘蛛丝蛋白中不是关键的, 只要该CT部分没有完全缺失。因此,根据本发明的CT部分可选自图1 和表1(SEQ ID NO:14-44)中示出的氨基酸序列或具有高度相似性的序 列中的任何一种。多种多样的C端序列可用在根据本发明的蜘蛛丝蛋白中。

根据本发明的CT部分的序列与基于图1(SEQ ID NO:14-44)的氨基 酸序列的共有氨基酸序列SEQ ID NO:9具有至少50%的同一性,优选地至 少60%,更优选地至少65%的同一性,或甚至至少70%的同一性。

如下计算遍及本说明书和所附权利要求书使用的术语“%同一性”。使 用CLUSTAL W算法(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.,Nucleic  Acids Research,22:4673-4680(1994))比对查询序列与靶序列。在对应所比 对的序列中的最短序列的窗口上进行对比。对比每个位置的氨基酸残基, 并将在靶序列中具有相同对应物的查询序列中的位置的百分比报告为%同 一性。

如对“%同一性”所描述的计算遍及本说明书和所附权利要求书使用的 术语“%相似性”,但以下除外:疏水残基Ala、Val、Phe、Pro、Leu、Ile、 Trp、Met和Cys是相似的;碱性残基Lys、Arg和His是相似的;酸性残 基Glu和Asp是相似的;且亲水性的、不带电荷的残基Gln、Asn、Ser、 Thr和Tyr是相似的。在该上下文中剩余的天然氨基酸Gly不与任何其它 氨基酸相似。

遍及本说明书,根据本发明的替代实施方案满足相应百分比的相似 性,而不是指定百分比的同一性。其它替代实施方案满足指定百分比的同 一性以及另一个较高百分比的相似性,选自对于每个序列的优选百分比的 同一性的组。例如,某序列可以与另一序列70%相似;或其可以与另一序 列70%相同;或其可以与另一序列70%相同且90%相似。

根据本发明的代表性的CT部分是Euprosthenops australis序列SEQ ID  NO:7。因此,根据本发明的一个优选方面,CT部分与SEQ ID NO:7或图 1和表1(SEQ ID NO:14-44)中的任何单独的氨基酸序列具有至少80%、 优选地至少90%、例如至少95%的同一性。在本发明的优选方面中,CT 部分与SEQ ID NO:7或图1和表1中的任何单独的氨基酸序列相同。

CT部分通常由70至120个氨基酸残基组成。优选CT部分包含至少 70、或多于80、优选地多于90个氨基酸残基。还优选CT部分包含至多 120、或少于110个氨基酸残基。典型的CT部分包含约100个氨基酸残基。

任选的REP部分是包含70至300个氨基酸残基的蛋白片段,并衍生 自蜘蛛丝蛋白的重复片段。这意味着REP部分具有在富含丙氨酸的区段 和富含甘氨酸的区段之间交替的重复性特征。如以下将更详细地解释的, REP部分通常包含多于70,例如多于140且少于300,优选地少于240, 例如少于200个氨基酸残基,且自身可分成几个L(接头)区段、A(富含丙 氨酸)区段和G(富含甘氨酸)区段。通常,所述接头区段是任选的,位于 REP部分末端,而剩余的区段依次是富含丙氨酸和富含甘氨酸的。因此, REP部分通常可具有以下结构中的任何一种,其中n是整数:

L(AG)nL,诸如LA1G1A2G2A3G3A4G4A5G5L;

L(AG)nAL,诸如LA1G1A2G2A3G3A4G4A5G5A6L;

L(GA)nL,诸如LG1A1G2A2G3A3G4A4G5A5L;或

L(GA)nGL,诸如LG1A1G2A2G3A3G4A4G5A5G6L。

其遵循:富含丙氨酸或富含甘氨酸的区段是否与N端或C端接头区段 相邻不是关键的。优选n是从2至10,优选地从2至8,优选地从4至8, 更优选地从4至6的整数,即n=4、n=5或n=6。

在优选的实施方案中,根据本发明的REP部分的丙氨酸含量高于 20%,优选地高于25%,更优选地高于30%且低于50%,优选地低于40%, 更优选地低于35%。这是有利的,因为设想较高的丙氨酸含量提供较硬和 /或较强和/或较不可延伸的结构。

在某些实施方案中,REP部分不含脯氨酸残基,即REP部分中不存 在脯氨酸残基。

现在转向构成根据本发明的REP部分的区段,应强调的是每个区段 是单独的,即,特定REP部分的任何两个A区段、任何两个G区段或任 何两个L区段可以是相同的或可以是不相同的。因此,每种类型的区段在 特定REP部分内是相同的不是本发明的一般特征。而是,以下公开内容 为技术人员提供了如何设计单独的区段并将其聚集成REP部分的指南, 该REP部分从而被认为是来源于蜘蛛丝蛋白的重复片段,且构成根据本 发明的功能性融合蛋白的一部分。

每个单独的A区段是具有8至18个氨基酸残基的氨基酸序列。优选 每个单独的A区段由13至15个氨基酸残基组成。大多数或多于两个的A 区段包含13至15个氨基酸残基,且少数例如一或两个A区段包含8至18 个氨基酸残基,例如8-12或16-18个氨基酸残基也是可能的。这些氨基酸 残基中的绝大多数是丙氨酸残基。更特别地,这些氨基酸残基中的从0至 3个不是丙氨酸残基,且剩余的氨基酸残基是丙氨酸残基。因此,每个单 独的A区段中的所有氨基酸残基毫无例外地或除了一、二或三个氨基酸残 基可以是任何氨基酸以外,都是丙氨酸残基。优选的,取代丙氨酸的氨基 酸是天然氨基酸,优选地单独选自丝氨酸、谷氨酸、半胱氨酸和甘氨酸的 组,更优选地是丝氨酸。当然,A区段中的一个或更多个是全丙氨酸区段, 而剩余的A区段包含1-3个非丙氨酸的残基,例如丝氨酸、谷氨酸、半胱 氨酸或甘氨酸是可能的。

在优选的实施方案中,每个A区段包含13-15个氨基酸残基,包括 10-15个丙氨酸残基和0-3个上述非丙氨酸的残基。在更优选的实施方案 中,每个A区段包含13-15个氨基酸残基,包括12-15个丙氨酸残基和0-1 个上述非丙氨酸的残基。

优选每个单独的A区段与选自SEQ ID NO:10的氨基酸残基7-19、 43-56、71-83、107-120、135-147、171-183、198-211、235-248、266-279、 294-306、330-342、357-370、394-406、421-434、458-470、489-502、517-529、 553-566、581-594、618-630、648-661、676-688、712-725、740-752、776-789、 804-816、840-853、868-880、904-917、932-945、969-981、999-1013、1028-1042 和1060-1073的组的氨基酸序列具有至少80%,优选地至少90%,更优选 地95%,最优选地100%的同一性。该组的每个序列对应于Euprosthenops  australis MaSp1蛋白质的天然存在的序列的区段,该天然存在的序列经过 克隆相应的cDNA而推断得来,参见WO 2007/078239。可选择地,每个 单独的A区段与选自SEQ ID NO:3的氨基酸残基143-152、174-186、 204-218、233-247和265-278的组的氨基酸序列具有至少80%,优选地至 少90%,更优选地95%,最优选地100%的同一性。该组的每个序列对应 于表达的、非天然蜘蛛丝蛋白的区段,所述蛋白具有在合适的条件下形成 丝结构的能力。因此,在根据本发明的某些实施方案中,每个单独的A区 段与选自上述氨基酸区段的氨基酸序列相同。不期望被任何具体的理论束 缚,设想根据本发明的A区段形成螺旋结构或β折叠。

此外,已从实验数据推断出,每个单独的G区段是从12至30个氨基 酸残基的氨基酸序列。优选每个单独的G区段由14至23个氨基酸残基组 成。每个G区段的至少40%的氨基酸残基是甘氨酸残基。通常,每个单独 的G区段的甘氨酸含量在40-60%的范围内。

优选的每个单独的G区段与选自SEQ ID NO:10的氨基酸残基20-42、 57-70、84-106、121-134、148-170、184-197、212-234、249-265、280-293、 307-329、343-356、371-393、407-420、435-457、471-488、503-516、530-552、 567-580、595-617、631-647、662-675、689-711、726-739、753-775、790-803、 817-839、854-867、881-903、918-931、946-968、982-998、1014-1027、 1043-1059和1074-1092的组的氨基酸序列具有至少80%,优选地至少90%, 更优选地95%,最优选地100%的同一性。该组的每个序列对应于 Euprosthenops australis MaSp1蛋白质的天然存在的序列的区段,该天然存 在的序列经过克隆相应的cDNA而推断得来,参见WO 2007/078239。可 选择地,每个单独的G区段与选自SEQ ID NO:3的氨基酸残基153-173、 187-203、219-232、248-264和279-296的组的氨基酸序列具有至少80%, 优选地至少90%,更优选地95%,最优选地100%的同一性。该组的每个 序列对应于表达的、非天然蜘蛛丝蛋白的区段,所述蛋白具有在合适的条 件下形成丝结构的能力。因此,在根据本发明的某些实施方案中,每个单 独的G区段可与选自上述氨基酸区段的氨基酸序列相同。

在某些实施方案中,根据本发明的每个G区段的前两个氨基酸残基不 是-Gln-Gln-。

根据本发明G区段存在三种亚型。该分类是基于对Euprosthenops  australis MaSp1蛋白质序列的仔细分析(WO 2007/078239),并已在构建新 颖、非天然蜘蛛丝蛋白中使用并验证了该信息。

根据本发明的G区段的第一种亚型由单字母氨基酸共有序列 GQG(G/S)QGG(Q/Y)GG(L/Q)GQGGYGQGAGSS(SEQ ID NO:11)代表。该 第一种且通常是最长的G区段亚型通常包含23个氨基酸残基,但是可包 含少至17个氨基酸残基,且缺少带电荷的残基或包含一个带电荷的残基。 因此,优选的该第一种G区段亚型包含17-23个氨基酸残基,但设想其可 包含少至12个或多至30个氨基酸残基。不期望被任何具体的理论束缚, 设想该亚型形成卷曲结构或31-螺旋结构。该第一种亚型的代表性G区段 是SEQ ID NO:10的氨基酸残基20-42、84-106、148-170、212-234、307-329、 371-393、435-457、530-552、595-617、689-711、753-775、817-839、881-903、 946-968、1043-1059和1074-1092。在某些实施方案中,根据本发明的第 一种亚型的每个G区段的前两个氨基酸残基不是-Gln-Gln-。

根据本发明的G区段的第二种亚型由单字母氨基酸共有序列 GQGGQGQG(G/R)Y GQG(A/S)G(S/G)S(SEQ ID NO:12)代表。该第二种 通常是中间尺寸的G区段亚型通常包含17个氨基酸残基且缺少带电荷的 残基或包含一个带电荷的残基。优选的该第二种G区段亚型包含14-20个 氨基酸残基,但设想其可包含少至12个或多至30个氨基酸残基。不期望 被任何具体的理论束缚,设想该亚型形成卷曲结构。第二种亚型的代表性 G区段是SEQ ID NO:10的氨基酸残基249-265、471-488、631-647和 982-998;及SEQ ID NO:3的氨基酸残基187-203。

根据本发明的G区段的第三种亚型由单字母氨基酸共有序列 G(R/Q)GQG(G/R)YGQG(A/S/V)GGN(SEQ ID NO:13)代表。该第三种G 区段亚型通常包含14个氨基酸残基,且通常是根据本发明的G区段亚型 中最短的。优选的该第三种G区段亚型包含12-17个氨基酸残基,但设想 其可包含少至12个或多至23个氨基酸残基。不期望被任何具体的理论束 缚,设想该亚型形成转角结构。该第三种亚型的代表性G区段是SEQ ID  NO:10的氨基酸残基57-70、121-134、184-197、280-293、343-356、407-420、 503-516、567-580、662-675、726-739、790-803、854-867、918-931、1014-1027; 及SEQ ID NO:3的氨基酸残基219-232。

因此,在优选的实施方案中,每个单独的G区段与选自SEQ ID NO:11、 SEQ ID NO:12和SEQ ID NO:13的氨基酸序列具有至少80%,优选地90%, 更优选95%的同一性。

在REP部分的A和G区段的交替序列的优选实施方案中,每隔一个 G区段为第一种亚型,而剩余的G区段为第三种亚型,例如...A1GA2GA3GA4GA5G...。在REP部分的另一个优选实施方案中,第二种亚型 的一个G区段通过插入而中断G区段的规律性,例如...A1GA2GA3GA4GA5G...。

每个单独的L区段代表可包含0至20个氨基酸残基,例如从0至10 个氨基酸残基的任选的接头氨基酸序列。虽然该区段是任选的且对于蜘蛛 丝蛋白不是功能上关键的,但是其存在仍允许根据本发明的完全功能性的 蜘蛛丝融合蛋白形成蛋白结构。在从Euprosthenops australis的MaSp1蛋 白质推断的氨基酸序列的重复部分(SEQ ID NO:10)中也存在接头氨基酸序 列。特别地,接头区段的氨基酸序列可能与所描述的A或G区段的任何 一种相似,但是通常不足以满足本文对其定义的标准。

代表性L区段是SEQ ID NO:10的氨基酸残基1-6和1093-1110;及SEQ  ID NO:3的氨基酸残基138-142,但是本领域技术人员将易于认识到存在这 些区段的许多合适的替代氨基酸序列。在根据本发明的REP部分的一个 实施方案中,L区段中的一个包含0个氨基酸,即缺少L区段中的一个。 在根据本发明的REP部分的另一个实施方案中,两个L区段都包含0个 氨基酸,即两个L区段均缺少。因此,根据本发明的REP部分的这些实 施方案可示意性地表示如下:(AG)nL、(AG)nAL、(GA)nL、(GA)nGL; L(AG)n、L(AG)nA、L(GA)n、L(GA)nG;和(AG)n、(AG)nA、(GA)n、(GA)nG。 这些REP部分中的任何一种适合与以下定义的任何CT部分一起使用。

任选的NT部分是包含100至160个氨基酸残基的蛋白片段,并衍生 自蜘蛛丝蛋白的N端片段。表述"衍生自"意指在根据本发明的NT部分的 上下文中,它与蜘蛛丝蛋白的N端氨基酸序列具有高度的相似性。如图2 中所示,该氨基酸序列在各个物种和蜘蛛丝蛋白,包括MaSp1和MaSp2 之间相当保守。在图2中,比对了以GenBank登记条目(如果可用)表示的 以下拖丝蛋白NT部分(SEQ ID NO:45-58):

表2–拖丝蛋白NT部分

对每个序列显示仅对应N端部分的部分,省略了信号肽。Nc flag和 NIm flag根据Rising A.等人.Biomacromolecules 7,3120-3124(2006)翻译和 编辑。

哪种特定的NT部分存在于根据本发明的蜘蛛丝蛋白中不是关键的。 因此,根据本发明的NT部分可选自图2和表2(SEQ ID NO:45-58)中示 出的氨基酸序列或具有高度相似性的序列中的任何一种。多种多样的N端 序列可用在根据本发明的蜘蛛丝蛋白中。基于图2的同源序列,以下序列 构成共有NT氨基酸序列:

QANTPWSSPNLADAFINSF(M/L)SA(A/I)SSSGAFSADQLDDMSTIG(D/N/Q)T LMSAMD(N/S/K)MGRSG(K/R)STKSKLQALNMAFASSMAEIAAAESGG(G/Q) SVGVKTNAISDALSSAFYQTTGSVNPQFV(N/S)EIRSLI(G/N)M(f/L)(A/S)QAS ANEV(SEQ ID NO:8).

根据本发明的NT部分的序列与共有氨基酸序列SEQ ID NO:8(其基于 图2的氨基酸序列)具有至少50%的同一性、优选至少60%的同一性。在 优选的实施方案中,根据本发明的NT部分的序列与共有氨基酸序列SEQ  ID NO:8具有至少65%的同一性、优选至少70%的同一性。在优选的实施 方案中,根据本发明的NT部分进一步地与共有氨基酸序列SEQ ID NO:8 具有70%、优选80%的相似性。

根据本发明的代表性的NT部分是Euprosthenops australis序列SEQ ID  NO:6。根据本发明的优选实施方案,NT部分与SEQ ID NO:6或图2(SEQ  ID NO:45-48)中的任何单独的氨基酸序列具有至少80%同一性。在本发明 的优选实施方案中,NT部分与SEQ ID NO:6或图2中的任何单独的氨基 酸序列具有至少90%、诸如至少95%的同一性。在本发明的优选实施方案 中,NT部分与SEQ ID NO:6或图2(SEQ ID NO:45-48)中的任何单独的 氨基酸序列,特别是与Ea MaSp1(SEQ ID NO:45)相同。

NT部分包含100至160个氨基酸残基。优选NT部分包含至少100、 或多于110、优选地多于120个氨基酸残基。还优选NT部分包含至多160、 或少于140个氨基酸残基。典型的NT部分包含大约130-140个氨基酸残 基。

B部分是包含多于15个氨基酸残基,诸如15-22个氨基酸残基的蛋白 或多肽片段。B部分优选地包含多于30个氨基酸残基,诸如多于50个氨 基酸残基、诸如多于100个氨基酸残基。B部分优选地包含少于1000个氨 基酸残基,诸如少于400个氨基酸残基、更优选地少于300个氨基酸残基。 其能够与有机靶选择性相互作用,且融合蛋白中是B部分提供与有机靶选 择性相互作用的能力。

B部分是非拖丝蛋白部分。这是意指,其不是衍生自蜘蛛丝蛋白,即, 其与蜘蛛丝蛋白具有低(或无)程度的同一性和/或相似性。根据本发明的B 部分的序列优选地与本文公开的拖丝蛋白氨基酸序列的任一种、具体地与 SEQ ID NO:6-10的任一种具有少于30%同一性、诸如少于20%同一性、 优选地少于10%同一性。

选择B部分被认为是在本领域普通技术人员能力范围内的。然而,以 下为了示例起见,提供了可证明用作B部分的亲和配体的实例、以及用于 检测和/或定量的形式和条件的实例。

选择亲和配体所需的生物分子多样性可通过组合改造多个可能的支 架分子之一来产生,然后利用适当的选择平台选择特异性和/或选择性亲和 配体。可用于针对有机靶产生亲和配体的此类结构的非限制性实例是免疫 球蛋白和免疫球蛋白的片段。

上述实例包括展现用于产生新的结合特异性的单个随机化环的支架 蛋白,具有其中从蛋白表面突出的侧链被随机化以产生新的结合特异性的 刚性二级结构的蛋白支架,和展现用于产生新的结合特异性的非连续高变 性环区的支架。对于从上述支架结构的任一种的变体池选择期望的亲和配 体,大量选择平台可用于分离针对所选靶蛋白的特定新配体。筛选平台包 括但不限于,噬菌体展示(Smith GP(1985)Science 228:1315-1317)、核糖体 展示(Hanes J和Pltickthun A(1997) Proc.Natl.Acad.Sci.U.S.A.94:4937-4942)、酵母双杂交系统(Fields S和Song 0 (1989)Nature 340:245-246)、酵母展示(Gai SA和Wittrup KD(2007)Curr  Opin Struct Biol 17:467-473)、mRNA展示(Roberts RW和Szostak JW(1997) Proc.Natl.Acad.Sci.U.S.A.94:12297-12302)、细菌展示(Daugherty PS(2007) Curr Opin Struct Biol 17:474-480,Kronqvist N等人.(2008)Protein Eng Des  Sel 1-9,Harvey BR等人,(2004)PNAS 101(25):913-9198)、微珠展示(Nord  O等人.(2003)J Biotechnol 106:1-13,WO01/05808)、SELEX(配体指数富 集的系统进化(System Evolution of Ligands by Exponential Enrichment)) (Tuerk C和Gold L(1990)Science 249:505-510)和蛋白片段互补检验(PCA) (Remy I和Michnick SW(1999)Proc.Natl.Acad.Sci.U.S.A.96:5394-5399)。

优选的B部分的组是免疫球蛋白片段和包含免疫球蛋白片段或其衍生 物的分子。优选的是,B部分的每个免疫球蛋白片段选自免疫球蛋白可变 区。更优选的是,B部分包括至少一个重链可变区(VH)和至少一个轻链 可变区(VL)。

特别优选的B部分的组是免疫球蛋白的重链(VH)和轻链(VL)的可 变区的单链可变片段(scFv),任选地与短接头肽连接。接头肽通常包含如 10-25个氨基酸残基,且富含甘氨酸、丝氨酸或苏氨酸。根据本发明的单 链可变片段缺乏在完整的抗体分子中发现的恒定Fc区域。优选的根据本 发明的单链可变片段因此表征为,它们不与蛋白G结合,但结合来自大消 化链球菌(Peptostreptococcus magnus)的蛋白L,因为蛋白L与κ轻链的 可变区相互作用。

B部分的一个优选的组是来自免疫球蛋白的抗原结合的片段(Fab片 段),即抗体上结合抗原的区。它包括每个重链和轻链一个恒定结构域和 一个可变结构域。两个可变结构域结合其特异的抗原上的表位。特异的变 体包括F(ab')2片段,即其Fc片段已被如通过胃蛋白酶裂解去除的免疫球 蛋白单体。

B部分的另一个优选组是结构域抗体(dAb)或单结构域抗体(sdAB), 也被称为纳米抗体(Nanobodies),天然存在于来自骆驼的免疫球蛋白重链 中。dAb/sdAB是最小的已知的抗体的抗原结合片段,从11kDa至15kDa 的范围。dAb/sdAB是免疫球蛋白的重链(VH)和/或轻链(VL)的牢固可 变区。它们在微生物细胞培养中高表达,表现出良好的生物物理特性,包 括溶解性和温度稳定性,并能很好的适应通过如噬菌体展示的体外选择系 统的选择和亲和性成熟。它们也对创造具有长期的血清半衰期或其它药理 活性的药物有用。

根据本发明的具体融合蛋白和蛋白结构在实施例中提供。这些优选的 融合蛋白形成由SEQ ID NO 61-70、72、和74组成的组。另外优选的融合 蛋白与这些序列的任一种具有至少80%、优选地至少90%、更优选地至少 95%的同一性。

本发明还提供编码根据本发明的融合蛋白的分离的核酸。具体地,具 体的核酸在实施例和所附的序列表中提供,例如SEQ ID NO:59-60、71和 73。另外优选的核酸编码与SEQ ID NO 61-70、72和74的任一种具有至少 80%、优选地至少90%、更优选地至少95%的同一性的融合蛋白。

根据本发明的核酸可用于产生根据本发明的融合蛋白。本发明提供了 制备融合蛋白的方法。第一步骤包括在合适的宿主中表达根据本发明的融 合蛋白。合适的宿主是本领域技术人员熟知的且包括,例如细菌和真核细 胞,例如酵母、昆虫细胞系和哺乳动物细胞系。通常,该步骤包括在大肠 杆菌中表达编码该融合蛋白的核酸分子。

方法的第二步骤包括获得包含该融合蛋白的混合物。混合物可例如通 过裂解或机械破坏宿主细胞获得。如果宿主细胞分泌融合蛋白,还可通过 收集细胞培养基获得混合物。可使用标准方法分离由此获得的蛋白质。如 需要的话,该混合物可进行离心,并收集合适的部分(沉淀或上清液)。包 含融合蛋白的混合物还可进行凝胶过滤、层析例如阴离子交换层析、透析、 相分离或过滤以导致分离。任选地,脂多糖和其它热原在该阶段被有效地 去除。如需要的话,可在该步骤中通过裂解去除接头肽。

根据本发明的蛋白结构、或格式在适当的条件下从根据本发明的融合 蛋白自发地组装,并且组装为聚合物由剪切力和/或两个不同相之间的界面 的存在而促进,所述界面例如,固相与液相之间、气相与液相之间、或在 疏水/亲水界面,例如,矿物油-水界面。所得的界面的存在刺激在界面或 在界面周围区域中聚合,该区域延伸进入液体介质,从而所述聚合在所述 界面或在所述界面区域中开始。通过修改组装期间的条件,可产生多种蛋 白结构。例如,如果允许组装在从一侧向一侧轻微摆动的容器中发生,则 在空气-水界面形成纤维。如果允许混合物静置,则在空气-水界面形成膜。 如果蒸发混合物,则在容器底部形成膜。如果向含水混合物的顶部加入油, 则在油-水界面形成膜,无论允许静置或摆动。如果混合物起泡沫,例如, 通过鼓入空气或甩动,如果允许干燥,则泡沫是稳定的并固化。

如此,本发明提供用于提供展示对有机靶的结合活性的蛋白结构的方 法。在第一方法步骤中,提供了根据本发明的重组融合蛋白。融合蛋白可 例如,通过在适当的宿主中从根据本发明的核酸表达来提供。在第二方法 步骤中,对融合蛋白进行实现形成包含重组融合蛋白的聚合物的条件。注 意,尽管自发地组装的蛋白结构可在六氟异丙醇中溶解,溶解的融合蛋白 随后不能够自发地再次组装为例如,纤维。

蛋白结构可用作固定有机靶的亲和性介质的部分,其中B部分能够与 该有机靶选择性相互作用。样品,例如,生物样品可施加到能够结合该生 物样品中存在的有机靶的根据本发明的融合蛋白或蛋白结构,然后融合蛋 白或蛋白结构可用于从样品分离有机靶。可对已经从受治疗者取出的生物 样品,诸如血液、血清或血浆进行有机靶的检测、分离和/或定量。

如此,本发明提供从样品分离有机靶的方法。提供了包含有机靶的样 品,例如,生物样品,诸如血液、血清或血浆。生物样品可以是较早获得 的样品。如果在方法中使用较早获得的样品,方法的步骤都不是对人类或 动物体进行的。

提供了根据本发明的亲和性介质,其包含根据本发明的融合蛋白或蛋 白结构。在某些实施方案中,亲和性介质由根据本发明的融合蛋白或蛋白 结构组成。亲和性介质能够借助根据本发明的融合蛋白中的B部分与有机 靶选择性相互作用。在实现亲和性介质与有机靶之间结合的适当条件下将 亲和性介质与样品接触。在保持亲和性介质与有机靶之间选择性结合的适 当条件下除去未结合的样品。这一方法导致有机靶被固定于根据本发明的 亲和性介质,具体地被固定于融合蛋白。

在根据本发明的优选的方法中,当亲和性介质与样品接触以实现亲和 性介质与有机靶之间的结合时,亲和性介质中的融合蛋白作为根据本发明 的蛋白结构存在。根据本发明的蛋白结构是有利的,因为其粘附于固体支 持物,例如,微量滴定板中的塑料制品。蛋白结构的这一特征有助于洗涤 和再生程序,对于分离目的是非常有用的。

已经令人惊讶地观察到,当作为根据本发明的蛋白结构中的根据本发 明的融合蛋白的部分时,B部分的碱稳定性可甚至被增强。这一特征对于 洗涤和再生目的可以是非常有用的,例如,允许高浓度的NaOH,诸如0.1 M、0.5M、1M或甚至高于1M,例如,2M,和/或允许高浓度的脲,例 如,6-8M。化学稳定性还可用于允许为了与有机分子的选择性相互作用或 亲和纯化而反复周期地使用B部分。此外,已有利地显示,根据本发明的 融合蛋白是热稳定的。这允许加热灭菌并保持固体蛋白格式/结构以及结合 能力。

根据本发明的融合蛋白的另一优点是,所得的蛋白结构具有高密度的 B部分。预计这一高密度提供高结合能力。总之,融合蛋白的这些特征对 于多种B部分是非常有吸引力的,具有良好的生产经济。这些特征在以传 统凝胶珠亲和柱以外的形式也是有用的,例如,以滤器样的形式。

固定的有机靶能够与第二有机靶选择性相互作用。然后该方法还包括 在实现第一和第二有机靶之间的结合的适当条件下,将所述亲和性介质和 固定的有机靶与第二有机靶接触的步骤,第二有机靶能够与第一有机靶选 择性相互作用。

固定的有机靶是可检测和/或可定量的。有机靶的检测和/或定量可以 以本领域技术人员已知用于检测和/或定量结合试剂的任何方式、以基于多 种生物或非生物相互作用的检验实现。有机靶本身可以用多种标志物标 记,或可转而由第二、标记的亲和配体检测以允许检测、可视化和/或定量。 这可使用许多标记的任何一种或更多种实现,所述标记可与有机靶或任何 第二亲和配体轭合,使用本领域技术人员已知的许多技术的任何一种或更 多种实现,如此不牵涉任何过度的实验。可与有机靶和/或第二亲和配体轭 合的标记的非限制性实例包括,荧光染料或金属(例如,荧光素、罗丹明、 藻红蛋白、荧光胺)、发色染料(例如,视紫质)、化学发光化合物(例如,鲁 米那、咪唑)和生物发光蛋白(例如,萤光素、萤光素酶)、半抗原(例如,生 物素)。多种其它可用的荧光团和发色团描述在Stryer L(1968)Science 162:526-533,Brand L和Gohlke JR(1972)Annu.Rev.Biochem.41:843-868。 有机靶和/或第二亲和配体还可用酶(例如,辣根过氧化物酶、碱性磷酸酶、 β-内酰胺酶)、放射性同位素(例如,3H、14C、32P、35S或125I)和颗粒(例如, 金)标记。在本公开内容的上下文中,"颗粒"是指适于标记分子的颗粒,诸 如金属颗粒。另外,亲和配体还可用荧光半导体纳米晶体(量子点)标记。 量子点具有极佳的量子产量,比有机荧光团更耐光,因此更容易检测(Chan 等人.(2002)Curr Opi Biotech.13:40-46)。不同类型的标记可使用多种化学反 应轭合于有机靶或第二亲和配体,例如,胺反应或硫醇反应。然而,可使 用胺和硫醇以外的其它反应基团,例如,醛、羧酸和谷氨酰胺。

如果检测和/或定量包括暴露于第二有机靶或第二亲和配体,再次用缓 冲液洗涤亲和性介质以除去未结合的第二亲和配体。举例来说,第二亲和 配体可以是抗体或其片段或衍生物。之后,可以用常规方法检测和/或定量 有机靶。对第二亲和配体的结合特征可以变化,但本领域技术人员将能够 通过常规实验确定对每种确定有效和最佳的检验条件。

标记的分子的检测、定位和/或定量可包括可视化技术,诸如光显微术 或免疫荧光显微术。其它方法可包括经由流式细胞术或发光测定法检测。 标记可视化的方法可包括但不限于,荧光测定、发光测定和/或酶促技术。 荧光通过如下检测和/或定量:将荧光标记暴露于特定波长的光,之后检测 和/或定量特定波长区域中的发射光。发光标记的分子的存在可由在化学反 应期间发生的发光检测和/或定量。酶反应的检测是由于化学反应导致的样 品的色移。本领域技术人员知晓,为了适当的检测和/或定量,可修改多种 不同的实验方案。

用于检测和/或定量有机靶的一种可得的方法是通过将其或第二亲和 配体与酶连接,随后可在酶免疫测定(诸如EIA或ELISA)中检测和/或定量 该酶。此类技术是充分建立的,其实现对本领域技术人员不产生任何过度 的困难。在此类方法中,将生物样品与结合有机靶的根据本发明的蛋白结 构接触,然后用酶促标记的第二亲和配体检测和/或定量。之后,在适当的 缓冲液中,将适当的底物与酶促标记反应产生化学部分,例如使用分光光 度计、荧光计、光度计或通过可见手段检测和/或定量。

有机靶或第二亲和配体可用放射性同位素标记以使得能够检测和/或 定量。本公开内容中适当的放射性标记的非限制性实例是3H、14C、32P、 35S或125I。标记的亲和配体的比活性依赖于放射性标记的半衰期、同位素 纯度,和标记如何被掺入亲和配体。亲和配体优选地使用公知技术标记 (Wensel TG和Meares CF(1983)于:Radioimmunoimaging and  Radioimmunotherapy(Burchiel SW和Rhodes BA编著)Elsevier,New York, pp 185-196中)。如此放射性标记的亲和配体可用于通过检测放射性显现有 机靶。放射性核素扫描可用以下进行,例如,γ射线照相机、磁共振光谱 学、发射断层照相术、γ射线/β射线计数器、闪烁计数器和放射照相术。

如此,可向蛋白结构施加样品以检测、分离和/或定量有机靶。这一程 序使得能够不仅检测有机靶,而且另外可显示其分布和相对水平。任选地, 可从亲和性介质释放有机靶并收集。如此,用途可包括在其上已经固定有 机靶的亲和性介质上亲和纯化。蛋白结构可例如布置在柱中或多孔板(诸如 96孔板)中、或在磁珠、琼脂糖珠或sepharose珠上。另外,用途可包括蛋 白结构在可溶基质上的用途,例如使用葡聚糖基质,或在表面等离子共振 仪器诸如BiacoreTM仪器中的用途,其中分析可例如包括监测对固定的有机 靶或多种可能的亲和配体的亲和性。

根据本发明的蛋白结构可被洗涤并用多种清洁剂,包括酸、碱和离液 剂再生。尤其有用的清洁剂包括NaOH,诸如0.1、0.5或1M NaOH,和 脲,诸如6-8M脲。由于根据本发明的蛋白结构令人惊讶地耐受化学处理 和/或灭菌性热处理,包括使用蛋白结构的根据本发明的方法可包括再生蛋 白结构的最终步骤。方法优选地包括通过化学处理和/或灭菌性热处理再生 亲和性介质的最终步骤。优选地,化学处理包括用NaOH,诸如0.1、0.5 或1M NaOH、和/或脲,诸如6-8M脲处理。

根据本发明的融合蛋白还可被允许在溶液中结合有机靶,即,在允许 融合蛋白聚合并形成蛋白结构诸如膜、泡沫或纤维之前。拖丝蛋白衍生部 分(例如,CT)本身和掺入B部分的相应的融合蛋白二者聚合为固体结构, 即使在污染蛋白存在时,而没有明显地将污染物掺入材料中,且功能(B) 部分保留其预期的结合特征。因此,预计B部分的结合特征可用于从周围 溶液捕获化合物或细胞,并将捕获的化合物或细胞掺入根据本发明的蛋白 结构之中或之上。

如此,在根据本发明的另一优选的方法中,当将亲和性介质与样品接 触以实现亲和性介质与有机靶之间的结合时,亲和性介质中的融合蛋白在 溶液中存在。然后允许融合蛋白结合有机靶的复合体形成根据本发明的融 合蛋白结构。

当目的是从溶液"捞出"特定分子或细胞时,这一方法可以是尤其有用 的,例如,在分泌了靶蛋白时从大规模真核细胞生产系统的培养基获得靶 分子。由于由拖丝蛋白衍生部分结合靶分子和形成固体结构可以在生理条 件发生且由于拖丝蛋白衍生部分是细胞相容的,该方法可重复地应用于进 行中的生产过程。

根据本发明的蛋白结构还可用于细胞的分离、固定和/或培养。在这方 面尤其有用的蛋白结构是膜、纤维或泡沫。膜是有利的,因为其粘附于固 体结构,例如,微量滴定板中的塑料制品。膜的这一特征有助于洗涤和再 生程序,对于选择性检测和分离目的是非常有用的。

如此,本发明提供用于培养具有存在于细胞表面的有机靶的细胞的细 胞支架材料。细胞支架材料包括根据本发明的蛋白结构。在某些实施方案 中,细胞支架材料由根据本发明的蛋白结构构成。

本发明人已经发现,包括包含根据本发明的融合蛋白、和任选地由根 据本发明的融合蛋白构成的聚合物的细胞支架材料提供在多种不同情况 中培养细胞、优选地真核细胞的有益环境。此外,该环境使得能够建立以 其他方式建立非常困难、非常昂贵或甚至不可能在实验室中培养的细胞培 养物,并且用于建立对组织工程和/或移植有用的包含细胞的材料。

本发明还提供细胞、优选地真核细胞与根据本发明的细胞支架材料的 组合。根据本发明的该组合可以各种不同的形式呈现,并被调整为适合特 定情况的需要。应设想,例如,本发明的组合作为用于替代受损或患病组 织中的细胞的含细胞植入物可以是有用的。

细胞支架材料可用于直接或间接地捕获细胞。在直接捕获中,B部分 能够与存在于细胞表面上的有机靶选择性相互作用。可选地,B部分能够 与中间有机靶(intermediate organic target)选择性相互作用并结合,且中 间有机靶能够与存在于细胞表面上的有机靶选择性相互作用。如此,在间 接捕获中,细胞支架材料还包含中间有机靶,且B部分能够与所述中间有 机靶选择性相互作用并结合。反过来,中间有机靶能够与存在于细胞表面 上的有机靶选择性相互作用。

在本文公开的细胞支架材料的一个实施方案中,所述融合蛋白还包含 寡肽细胞结合基序。结合某些情况中某些细胞的培养,已发现寡肽细胞结 合基序的存在提高或维持细胞存活,且认为将该基序作为蜘蛛丝蛋白的一 部分纳入到细胞支架材料中提供另外的益处。细胞结合基序是通过至少一 个肽键偶联到融合蛋白的剩余部分的寡肽。例如,其可被偶联到融合蛋白 的剩余部分的N端或C端,或蜘蛛丝蛋白的剩余部分的氨基酸序列内的任 何位置。关于寡肽细胞结合基序的选择,技术人员知晓几种替代方案。可 由技术人员使用标准的基因工程或化学偶联技术容易地实现寡肽细胞结 合基序与蜘蛛丝蛋白的剩余部分的偶联。因此,在某些实施方案中,细胞 结合基序通过基因工程引入,即,在编码融合蛋白和细胞结合基序的核酸 之间形成部分基因融合。作为这些实施方案的一个额外的有益特征,细胞 结合基序将与组成细胞支架材料的聚合物中的融合蛋白单体以1:1的比例 存在。

用于本文描述的方法或组合中的细胞支架材料中的聚合物可采取多 种物理形态,且特定物理形态的使用可在不同的具体情况中提供另外的优 点。例如,在这些方法或组合的实施方案中,所述细胞支架材料处于选自 由膜、泡沫、胶囊、纤维和纤维网(fiber-mesh)组成的组的物理形态。

因此,本发明提供用于固定细胞的方法。提供包含目标细胞的样品例 如,生物样品,诸如血液。生物样品可以是较早获得的样品。如果在方法 中使用较早获得的样品,方法的步骤都不是对人类或动物体进行的。

在允许细胞支架材料与存在于目标细胞表面上的有机靶之间选择性 相互作用的适当条件下,将样品施加于根据本发明的细胞支架材料。允许 细胞通过细胞表面上的有机靶与所述细胞支架材料之间的结合固定于所 述细胞支架材料。在适当条件下去除未结合的样品以维持细胞支架材料与 有机靶之间的选择性结合。这一方法产生展示被固定于细胞支架材料、具 体地固定于根据本发明的蛋白结构的有机靶的细胞。

如上所述,细胞支架材料可用于直接或间接地捕获细胞。在直接捕获 中,B部分能够与存在于细胞表面上的有机靶选择性相互作用。可选地, B部分能够与中间有机靶选择性相互作用并结合,且中间有机靶能够与存 在于细胞表面上的有机靶选择性相互作用。如此,在间接捕获中,细胞支 架材料还包含中间有机靶,且B部分能够与所述中间有机靶选择性相互作 用并结合。反过来,中间有机靶能够与存在于细胞表面上的有机靶选择性 相互作用。

无论捕获方法,可通过裂解融合蛋白以从细胞支架材料释放参与细胞 捕获的部分,从融合蛋白释放捕获的细胞。如上所述,融合蛋白可在其氨 基酸序列中包括允许裂解并去除相关部分,通常是B部分或细胞结合基序 的裂解位点。多种裂解位点是本领域技术人员已知的,例如,针对化学剂 的裂解位点,例如Met残基之后的CNBr裂解位点和Asn-Gly残基之间的 羟胺裂解位点,针对蛋白酶例如凝血酶或蛋白酶3C的裂解位点,和自我 剪接序列,例如内蛋白(intein)自我剪接序列。

本发明还提供用于培养细胞的方法。使用上文公开的方法将目标细胞 固定于细胞支架材料。在适于细胞培养的条件下保持细胞支架材料与固定 的细胞的组合。

在本发明的上下文中,术语细胞的“培养”、“细胞培养”等应被广义地 理解,使得它们包括例如细胞分裂和/或增殖的情况,细胞被保持在保留了 该细胞类型当存在于其天然环境时所显示出的至少一种功能特征的分化 状态的情况以及干细胞被保持在未分化状态的情况。

以下将通过下列非限制性实例进一步说明本发明。

实施例

实施例1-ScFv-Rep4CT融合蛋白的克隆、表达和纤维形成

为了证明融合蛋白的概念,与单链可变片段(ScFv)(B部分)融合产 生了Rep4CT蛋白(具有4个内部重复的REP部分和CT部分)。ScFv由 经由柔性的多肽接头遗传上连接在一起的VH和VL构成。这是具有完整 的抗原结合能力的最小的(27kDa)实体。目的是研究是否可能从ScFv与 Rep4CT融合组成的融合蛋白产生结构,诸如纤维、膜和薄膜,并仍保持 ScFv的抗原结合能力、以及Rep4CT的结构形成特征。为了如此,克隆了 由ScFv N端地和一个C端地融合于Rep4CT组成的一种融合蛋白。

克隆

构建了编码His6ScFvRep4CT和His6Rep4CTScFv的融合蛋白(SEQ ID  NO:61-62)的基因(SEQ ID NO:59-60)。将载体转化到化学感受态的大肠 杆菌(E.coli)BL21(DE3)细胞中,允许该细胞在补充有卡那霉素(70μg/ml) 的琼脂板上生长。之后挑取菌落,PCR筛选正确的插入物,且随后还测序 证实了DNA序列。

产生

将具备pT7His6ScFvRep4CT或pT7His6ScFvRep4CT载体的大肠杆菌 BL21(DE3)细胞在30℃在补充有卡那霉素(70μg/ml)的Luria-Bertani培养 基(共6升)中生长至OD600值为1-1.5,随后用300μΜIPTG(异丙基β-D-1- 硫代吡喃半乳糖苷)诱导表达,且在20℃另外培养大约2h。然后,通过在 4700rpm离心20min来收获细胞,且将所得的细胞团溶解在20mM Tris (pH 8.0)中。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,从而在15000rpm离心30min后回收细胞溶解产物。然后,将 回收的细胞溶解产物分开并上样到共四种Chelating Sepharose Fast Flow  Zn2+柱,经由His6标签保持蛋白结合于柱基质。洗涤后,用20mM Tris/300 mM咪唑(pH 8.0)洗脱结合的蛋白。然后,将合并的洗脱液在5升的20mM  Tris(pH 8.0)中透析过夜,浓缩至1mg/ml,并最终使得形成纤维或膜。

虽然Rep4CT已与另一个蛋白,即27kDa ScFv融合,可以获得 His6ScFvRep4CT以及His6Rep4CTScFv的宏观纤维的事实表明尽管与ScFv 融合,Rep4CT仍然保留其纤维形成特征。

与ScFv结合的分析

两种不同的方法被用于检测抗原结合单独的ScFv或与Rep4CT融合的 ScFv:A)直接加入Alexa647标记的抗原,洗涤,且随后荧光测量。B)加入 生物素化的血清样品,洗涤,加入Alexa647标记的链霉亲和素,洗涤,且 随后荧光测量。

结果

ScFvRep4CT和Rep4CTScFv两者可以被表达、纯化并组装成膜或纤维。 在膜上进行所有以下实验。使用直接添加Alex647标记的抗原分析抗原结 合表明,相比单独ScFv,ScFv4repCT和4RepCTScFv两者给出了强度更 大的斑点,且因此结合更多的抗原(图3A)。在不同的检测强度测量斑点 的强度,并绘制于图3B中。

图3显示了Alexa647标记的抗原的结合的分析:

A)具有结合的抗原的斑点的荧光图。斑点越白,抗原越多。

B)使用不同的检测强度,对斑点强度的测量。

来自血清样品的生物素化的抗原和随后的链霉亲和素结合的分析表 明,相比单独ScFv,ScFvRep4CT和Rep4CTScFv两者给出了强度更大的 斑点,且因此结合更多的抗原(图4)。然而,仅Rep4CT时还可以观察到 对斑点的非特异性结合,虽然相比ScFvRep4CT和Rep4CTScFv给出了低 得多的信号。这可能是由于非特异性结合到血清中别的东西(例如白蛋白) 或链霉亲和素。

图4显示了以Alexa647标记的链霉亲和素检测的生物素化的抗原的结 合的分析:A)具有结合的抗原和链霉亲和的斑点素的荧光图。斑点越白, 抗原越多。B)使用不同的检测强度,对斑点强度的测量。

结论

与单独的ScFv相比,来自与Rep4CT蛋白融合的ScFv点的膜结合>10 倍以上的纯抗原。然而,如果生物素化的血清样品用荧光团标记的链霉亲 和素分析,也有一些非特异性结合(约5倍以下)至不包含ScFv的Rep4CT 膜。

实施例2-ScFv-CT融合蛋白的克隆、表达和纤维形成

为了证明融合蛋白概念,产生了与单链可变片段(ScFv)(B部分)融 合的CT蛋白(CT部分)。目的是研究是否可能从由ScFv与CT融合组成的 融合蛋白产生结构,诸如纤维、膜和薄膜,并仍保持ScFv的抗原结合能 力、以及CT的结构形成特征。为了如此,克隆了由ScFv N端地和一个C 端地融合于CT组成的一种融合蛋白。

克隆

构建了编码His6ScFvCT和His6CTScFv融合蛋白(SEQ ID NO:63-64) 的基因。将载体转化到化学感受态的大肠杆菌BL21(DE3)细胞中,允许该 细胞在补充有卡那霉素(70μg/ml)的琼脂板上生长。之后挑取菌落,并PCR 筛选正确的插入物,且随后还测序以证实DNA序列。

产生

将具备pT7His6ScFvCT或pT7His6ScFvCT载体的大肠杆菌BL21(DE3) 细胞在30℃在补充有卡那霉素(70μg/ml)的Luria-Bertani培养基(共6升)中 生长至OD600值为1-1.5,随后用300μΜIPTG诱导表达,且在20℃另外 培养大约2h。然后,通过在4700rpm离心20min来收获细胞,且将所得 的细胞团溶解在20mM Tris(pH 8.0)中。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,从而在15000rpm离心30min后回收细胞溶解产物。然后,将 回收的细胞溶解产物分开并上样到共四种Chelating Sepharose Fast Flow  Zn2+柱,经由His6标签保持蛋白结合于柱基质。洗涤后,用20mM Tris/300 mM咪唑(pH 8.0)洗脱结合的蛋白。然后,将合并的洗脱液在5升的20mM  Tris(pH 8.0)中透析过夜,浓缩至1mg/ml,并最终使得形成纤维或膜。

与ScFv结合的分析

两种不同的方法被用于检测抗原结合单独的ScFv或与CT融合的 ScFv:A)直接加入Alexa647标记的抗原,洗涤,且随后荧光测量。B)加 入生物素化的血清样品,洗涤,加入Alexa647标记的链霉亲和素,洗涤, 且随后荧光测量。

实施例3-ScFv-NTCT融合蛋白的克隆、表达和纤维形成

为了证明融合蛋白概念,产生了与单链可变片段(ScFv)(B部分)融 合的NT-CT蛋白(NT和CT部分)。目的是研究是否可能从由ScFv与NT-CT 融合组成的融合蛋白产生结构,诸如纤维、膜和薄膜,并仍保持ScFv的 抗原结合能力、以及NT-CT的结构形成特征。为了如此,克隆了由ScFv N 端地和一个C端地融合于NTCT组成的一种融合蛋白。

克隆

构建了编码His6ScFvNT-CT和His6NT-CTScFv融合蛋白(SEQ ID  NO:65-66)的基因。将载体转化到化学感受态的大肠杆菌BL21(DE3)细胞 中,允许该细胞在补充有卡那霉素(70μg/ml)的琼脂板上生长。之后挑取菌 落,并PCR筛选正确的插入物,且随后还测序以证实DNA序列。

产生

将具备pT7His6ScFvNT-CT或pT7His6ScFvNT-CT载体的大肠杆菌 BL21(DE3)细胞在30℃在补充有卡那霉素(70μg/ml)的Luria-Bertani培养 基(共6升)中生长至OD600值为1-1.5,随后用300μΜIPTG诱导表达,且 在20℃另外培养大约2h。然后,通过在4700rpm离心20min来收获细胞, 且将所得的细胞团溶解在20mM Tris(pH 8.0)中。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,从而在15000rpm离心30min后回收细胞溶解产物。然后,将 回收的细胞溶解产物分开并上样到共四种Chelating Sepharose Fast Flow  Zn2+柱,经由His6标签保持蛋白结合于柱基质。洗涤后,用20mM Tris/300 mM咪唑(pH 8.0)洗脱结合的蛋白。然后,将合并的洗脱液在5升的20mM  Tris(pH 8.0)中透析过夜,浓缩至1mg/ml,并最终使得形成纤维或膜。

与ScFv结合的分析

两种不同的方法被用于检测抗原结合单独的ScFv或与NTCT融合的 ScFv:A)直接加入Alexa647标记的抗原,洗涤,且随后荧光测量。B)加 入生物素化的血清样品,洗涤,加入Alexa647标记的链霉亲和素,洗涤, 且随后荧光测量。

实施例4-ScFv-NTRep4CT融合蛋白的克隆、表达和纤维形成

为了证明融合蛋白的概念,与单链可变片段(ScFv)(B部分)融合产 生了NTRep4CT蛋白(NT、具有4个内部重复的REP部分和CT部分)。 目的是研究是否可能从ScFv与NT-CT融合组成的融合蛋白产生结构,诸 如纤维、膜和薄膜,并仍保持ScFv的抗原结合能力、以及NTRep4CT的 结构形成特征。为了如此,克隆了由ScFv N端地和一个C端地融合于 NTRep4CT组成的一种融合蛋白。

克隆

构建了编码His6ScFvNTRep4CT和His6NTRep4CTScFv的融合蛋白 (SEQ ID NO:67-68)的基因。将载体转化到化学感受态的大肠杆菌BL21 (DE3)细胞中,允许该细胞在补充有卡那霉素(70μg/ml)的琼脂板上生长。 之后挑取菌落,PCR筛选正确的插入物,且随后还测序证实了DNA序列。

产生

将具备pT7His6ScFvNTRep4CT或pT7His6ScFvNTRep4CT载体的大肠 杆菌BL21(DE3)细胞在30℃在补充有卡那霉素(70μg/ml)的Luria-Bertani 培养基(共6升)中生长至OD600值为1-1.5,随后用300μΜIPTG诱导表达, 且在20℃另外培养大约2h。然后,通过在4700rpm离心20min来收获细 胞,且将所得的细胞团溶解在20mM Tris(pH 8.0)中。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,从而在15000rpm离心30min后回收细胞溶解产物。然后,将 回收的细胞溶解产物分开并上样到共四种Chelating Sepharose Fast Flow  Zn2+柱,经由His6标签保持蛋白结合于柱基质。洗涤后,用20mM Tris/300 mM咪唑(pH 8.0)洗脱结合的蛋白。然后,将合并的洗脱液在5升的20mM  Tris(pH 8.0)中透析过夜,浓缩至1mg/ml,并最终使得形成纤维或膜。

与ScFv结合的分析

两种不同的方法被用于检测抗原结合单独的ScFv或与NTRep4CT融 合的ScFv:A)直接加入Alexa647标记的抗原,洗涤,且随后荧光测量。B) 加入生物素化的血清样品,洗涤,加入Alexa647标记的链霉亲和素,洗涤, 且随后荧光测量。

实施例5-ScFv-NTNTCT融合蛋白的克隆、表达和纤维形成

为了证明融合蛋白概念,产生了与单链可变片段(ScFv)(B部分)融 合的NTNT-CT蛋白(2个NT和1个CT部分)。目的是研究是否可能从由 ScFv与NT-CT融合组成的融合蛋白产生结构,诸如纤维、膜和薄膜,并 仍保持ScFv的抗原结合能力、以及NT-CT的结构形成特征。为了如此, 克隆了由ScFv N端地和一个C端地融合于NTNTCT组成的一种融合蛋白。

克隆

构建了编码His6ScFvNTNT-CT和His6NTNT-CTScFv融合蛋白(SEQ  ID NO:69-70)的基因。将载体转化到化学感受态的大肠杆菌BL21(DE3) 细胞中,允许该细胞在补充有卡那霉素(70μg/ml)的琼脂板上生长。之后挑 取菌落,并PCR筛选正确的插入物,且随后还测序以证实DNA序列。

产生

将具备pT7His6ScFvNTNT-CT或pT7His6ScFvNTNT-CT载体的大肠杆 菌BL21(DE3)细胞在30℃在补充有卡那霉素(70μg/ml)的Luria-Bertani培 养基(共6升)中生长至OD600值为1-1.5,随后用300μΜIPTG(异丙基β-D-1- 硫代吡喃半乳糖苷)诱导表达,且在20℃另外培养大约2h。然后,通过在 4700rpm离心20min来收获细胞,且将所得的细胞团溶解在20mM Tris (pH 8.0)中。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,从而在15000rpm离心30min后回收细胞溶解产物。然后,将 回收的细胞溶解产物分开并上样到共四种Chelating Sepharose Fast Flow  Zn2+柱,经由His6标签保持蛋白结合于柱基质。洗涤后,用20mM Tris/300 mM咪唑(pH 8.0)洗脱结合的蛋白。然后,将合并的洗脱液在5升的20mM  Tris(pH 8.0)中透析过夜,浓缩至1mg/ml,并最终使得形成纤维或膜。

与ScFv结合的分析

两种不同的方法被用于检测抗原结合单独的ScFv或与NTNT-CT融合 的ScFv:A)直接加入Alexa647标记的抗原,洗涤,且随后荧光测量。B) 加入生物素化的血清样品,洗涤,加入Alexa647标记的链霉亲和素,洗涤, 且随后荧光测量。

实施例6-scFv1-NTCT和scFv1-CT融合蛋白的结构的克隆、表达和形

生产了与命名为单链可变片段1(scFv1)的工程化抗体片段融合的 NTCT和CT。scFv1是27-kDa的单价、工程化的抗体片段,其识别特异 于自身免疫疾病,全身性红斑狼疮(SLE)的抗原。我们的目的是研究从 由分别融合至NTCT(表示为His6-scFv1-NTCT,SEQ ID NO:72)和CT(表 示为His6-scFv1-CT,SEQ ID NO:74)的scFv1蛋白组成的融合蛋白,是否 有可能产生如纤维和膜的结构,并仍保持scFv1结构域的抗原检测能力, 以及NTCT和CT的结构形成特征。为了如此,克隆了由scFv1结构域N 端地融合于NTCT和CT组成的两种融合蛋白。

克隆

如下构建了编码His6-scFv1-CT融合蛋白(SEQ ID NO:74)的基因(SEQ  ID NO:73)。设计引物,以从含有这种scFv1序列的载体产生结构域scFv1 的PCR片段。此外,引物包含用于限制性内切酶NdeI和EcoRI的识别位 点。然后将得到的PCR产物以及靶载体(表示为pAff8His6TrxHis6CT,包 含卡那霉素抗性基因)用限制性内切酶NdeI和EcoRI处理。在限制性裂解 靶载体后,His6TrxHis6部分被切掉。裂解的PCR片段和靶载体在T4DNA 连接酶的辅助下被连接在一起,随后将得到的正确连接的载体 (pT7His6-scFv1-CT)转化到化学感受态的大肠杆菌BL21(DE3)细胞中,允 许该细胞在补充有卡那霉素(50μg/ml)的琼脂板上生长。之后挑取菌落,并 筛选正确的插入物,且随后还测序证实了进入靶载体的插入的scFv1的 DNA序列。

以对His6-scFv1-CT描述的相同的方式进行了编码His6-scFv1-NTCT 融合蛋白(SEQ ID NO:72)的基因(SEQ ID NO:71)的克隆,但用于NTCT 扩增的引物包含用于限制性内切酶EcoRI和HindIII的位点,且靶载体在 此表示为pT7His6ScFv1-RepCT,其中以EcoRI和HindIII处理后,RepCT 部分被切掉。正确连接的载体被表示为pT7His6scFv1-NTCT。

产生

将具备pT7His6-scFv1-CT载体的大肠杆菌BL21(DE3)细胞在30℃在 补充有卡那霉素(50μg/ml)的Luria-Bertani培养基(共3升)中生长至OD600值为1-1.5,随后用300μΜIPTG诱导pT7His6-scFv1-CT表达,且在14℃ 另外培养大约17h。然后,通过在4700rpm离心20min来收获细胞,且 将所得的细胞团溶解在20mM Tris(pH 8.0)中。

如对pT7His6-scFv1-CT描述的相同的方式进行pT7His6-scFv1-NTCT 的生产,除了在其生产中使用的培养基的总体积(6升)。

纯化

对20mM Tris(pH 8.0)中溶解的细胞团补充溶菌酶和DNA酶I以裂解 细菌细胞,随后添加终浓度分别为200mM和10mM的NaCl和咪唑。离 心30min(15000rpm)后回收细胞溶解产物。然后,将回收的细胞溶解产 物上样到Chelating Sepharose Fast Flow Zn2+柱,经由His6标签保持 His6-scFv1-CT(SEQ ID NO:74)蛋白结合于柱基质。洗涤后,用20mM  Tris/200mM咪唑(pH 8.0)/300mM NaCl洗脱结合的蛋白。按照A280测量, 洗脱液包含0.93mg的His6-scFv1-CT蛋白。然后,将洗脱的蛋白对3升 20mM Tris(pH 8.0)透析过夜,且其后浓缩到0.87mg/ml,产生最终数量为 0.348mg的His6-scFv1-CT(SEQ ID NO:74)融合蛋白。

对His6-scFv1-NTCT(SEQ ID NO:72)进行相同的纯化过程,其洗脱 液含有4.86mg的融合蛋白。蛋白浓缩至2.14mg/ml后,获得了最终数量 为2.57mg的His6-scFv1-NTCT。

膜、泡沫和纤维形成

将来自每膜1μl的5μM可溶融合蛋白的His6-scFv1-CT的膜布点到微 阵列载玻片(plastic MaxiSorp,Nunc)上。然后使膜在气候控制室固化过 夜。进行相同的步骤,用于以1μl的5μM蛋白溶液浇铸His6-scFv1-NTCT 的膜。

从0.49mg/ml可溶融合蛋白制备His6-scFv1-NTCT的纤维(数据未显 示),并分别从30μl的0.22和0.38mg/ml的可溶融合蛋白制备 His6-scFv1-NTCT和His6-scFv1-CT两者的泡沫(图5a和5b)。虽然NTCT 或CT已被融合至另一个蛋白,即263个氨基酸长的scFv1结构域,但可 分别获得His6-scFv1-NTCT和His6-scFv1-CT的宏观纤维和泡沫的事实,表 明尽管被融合到scFv1结构域,NTCT和CT仍保留其结构形成特征。

分析

通过将1μl 5μM蛋白质溶液添加到干净和黑色的聚合物Maxisorp微 阵列载玻片(NUNC,25x76mm)上,将纯抗体(scFvl,对照)和丝融合 抗体(scFv1-NTCT)手动地布点在微阵列格式中,在布点膜中分别得到 135pmole纯抗体(scFv1)和274pmole丝融合抗体(scFv1-NTCT)。将蛋 白布点在膜的格式中后,将膜在气候受控室中干燥过夜。然后通过应用200 μl样品缓冲液(在PBS中的1%(w/v)无脂奶粉和1%(v/v)吐温20) 90min封闭阵列,且然后通过应用200-300μl洗涤缓冲液(在PBS中0.05% (v/v)吐温20)洗涤三次。所有温育在室温下以温和搅拌进行。接着,应 用100-200μl稀释于样品缓冲液的生物素化的抗原样品(10nM)并温育1 h。然后通过应用200-300μl洗涤缓冲液洗涤阵列三次,及为了检测结合的 抗原,将100-200μl Alexa-647标记的链霉亲和素(1μg/ml)稀释于样品缓 冲液中,应用于阵列上并温育1h。最后,以200-300μl洗涤缓冲液将阵列 洗涤三次,并在氮气流中干燥。然后使用共焦微阵列荧光扫描仪(ScanArray  Express,Perkin-Elmer Life&Analytical Sciences)扫描阵列。使用ScanArray  Express软件V2.0(Perkin-Elmer Life&Analytical Sciences)以定量每个斑点 的强度。对于分析His6-scFv1-CT融合蛋白,进行相同的分析程序。

为了检测可以是潜在的生物标志物的低丰度血清蛋白,将scFv1N端 地融合到NTCT或CT,分别得到His6-scFv1-NTCT和His6-scFv1-CT。将 纯抗体(对照)和丝融合抗体片段布点到微阵列载玻片上,且使用生物素 化的抗原样品分析其抗原结合能力。然后使用Alexa-647标记的链霉亲和 素检测结合的抗原。图6显示了纯的(对照)和丝融合抗体片段的抗原结 合分析。在5090检测强度测量斑点的强度。分析表明,相比单独scFv1 对照,丝融合抗体片段(His6-scFv1-NTCT)的抗原识别增加了25倍,且 没有观察到His6-scFv1-NTCT与其它抗原交叉反应的迹象。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号