首页> 中国专利> β螺线管蛋白和其在纺织品生产中的应用

β螺线管蛋白和其在纺织品生产中的应用

摘要

本发明提供了具有如高拉伸强度等有利性质并且可以通过重组生物技术手段生产的合成纤维。本发明还提供了组装所述纤维的组成组分,连同由所述合成纤维形成的织物。还包含包括本发明的纤维和织物的物品。

著录项

  • 公开/公告号CN112512600A

    专利类型发明专利

  • 公开/公告日2021-03-16

    原文格式PDF

  • 申请/专利权人 帝国学院创新有限公司;

    申请/专利号CN201980019095.2

  • 申请日2019-03-14

  • 分类号A61L26/00(20060101);

  • 代理机构72003 隆天知识产权代理有限公司;

  • 代理人付文川;吴小瑛

  • 地址 英国伦敦

  • 入库时间 2023-06-19 10:14:56

说明书

技术领域

本发明涉及合成纤维领域。

背景技术

如芳族聚酰胺等高性能合成纤维通常具有高拉伸强度(2-6GPa)和刚度(50-300GPa)但延展性低,通常在失效前长度延伸小于5%。这些合成纤维广泛用于各种应用,作为单向丝束、织造物、毛毡和针织物,或作为织物或作为复合材料。所述合成纤维吸收冲击能量的能力(包含作为柔性纺织品)使得其在保护应用中具有吸引力。然而,其低透气性和低导热性使其穿着起来不舒适,同时其在水、热和光的存在下降解的倾向降低了使用寿命,特别是在洗涤之后。

相比之下,基于纤维素的天然纤维和基于蛋白质的天然纤维由于其高吸水性和透气性而通常紧挨着皮肤穿着是舒适的,但通常具有比合成纤维更低的拉伸性能。天然丝纤维可以组合高拉伸强度和舒适度两者,但是这些基于蛋白质的材料难以在重组表达系统中以高分子量生产,并且难以概括天然纺丝机制。聚合物的分子量和纺丝工艺两者对于实现高性能纤维至关重要。

高分子量刚性聚合物通常具有低溶解度和高粘度。然而,向列相中的液晶聚合物(例如,芳族聚酰胺)表现为非牛顿流体,并且在剪切应变下粘度降低,并且固有地有更大的倾向进行对齐,从而有助于纺丝工艺。聚合物在纤维中的排序是其机械性质的重要决定因素。出于这些原因,如芳族聚酰胺和其它液晶聚合物等高性能合成纤维是从向列相中的原液溶液(dope solution)纺丝的(尽管通常是从如超强酸等挑战性溶剂纺丝的)。类似地,据认为,天然丝是从向列相中的高度浓缩的水性原液溶液纺丝的,所述天然丝已经由节肢动物的丝腺产生。

自然界中的许多材料(包含骨、珍珠母和丝绸)使用隐藏长度和牺牲键(sacrificial bond)的原理,以通过提供用于能量耗散的机制来同时提高韧性和刚度(Fantner等人,DOI:10.1529/biophysj.105.069344)。在本发明中,呈现了用于设计同时表现出液晶行为并结合高度隐藏长度的人工蛋白质的通用方法。然后示出了,这些蛋白质然后可以从高度浓缩的原液溶液纺丝成连续纤维。

本发明的纤维可以通过重组蛋白质表达技术来生产,从而避免了与这种有益纤维的生产相关的许多问题。

尽管合成纺织品取得了进步,但仍然需要可持续和商业上可行的纤维生产,所述纤维将天然纤维(可透气的和吸水性的)的期望性质与合成纤维的高性能方面相组合。本发明通过完全合成设计的蛋白质的生产和随后的纺丝来解决此目标。

发明内容

本发明人已经设计了具有高度隐藏长度的合成杆状蛋白质结构域,其在足够的浓度下形成液晶态。本发明人随后已经开发了完全合成的高分子量蛋白质,所述高分子量蛋白质可以从高度浓度的向列相水性原液溶液纺丝成坚韧的连续纤维,但是可以使用例如微生物重组表达系统以可持续的方式制造。此方法提供了改进的性能、安全供应以及开发新功能的机会(如自我报告、生物感测、催化或生物活性以及签名管理)。由于这些纤维是由蛋白质纺丝而成的,因此预期其保持天然丝的期望特性,包含透气性、可染性、可洗性、高卷曲性以及一定程度的阻燃性(无滴落/熔解以及高氮含量)。相关要求已经刺激了合成人工蜘蛛丝的许多商业活动(例如,博尔特纺线有限公司(Bolt Threads)https://boltthreads.com/和斯柏博公司(Spiber)https://www.spiber.jp/en/)。然而认为,通过逐步脱离直接仿生方法,本文所公开的合成方法允许改进的可加工性、为特定应用设计和定制的优异纤维的制备,而不是限于天然生物功能。

本发明人已经开发了一种根本上不同的方法来从重组蛋白质中产生一类新的基于人工肽的纤维。代替再使用取自蜘蛛或其它物种的天然序列,已经设计了具有全新结构基序的完全人工肽序列,所述结构基序使隐藏长度最大化并优化所得聚合物中的牺牲键的数量。在其它上下文中,自然界经常利用这种一般分子机制来生产具有非凡韧性的材料。在此,隐藏长度概念已经被应用于集中于生产具有最大韧性的纤维,而无需解决蜘蛛或其它节肢动物物种的多种需求。

具体实施方式

本发明是如权利要求中所阐述的。

本发明人令人惊讶地发现,合成的β螺线管结构域的多连体可以纺丝成具有如上所述的有用性质的新颖纤维。在一个实施例中,所述多连体可以由微生物,例如由大肠杆菌(E.coli)产生,这解决了现有技术纤维的许多问题,例如依赖于节肢动物来产生其的纤维。

因此,在一方面,本发明提供了一种由β螺线管结构域构成的多连体,其中所述多连体包括至少两个β螺线管结构域,

其中所述至少两个β螺线管结构域通过连接子连接,并且

其中所述至少两个β螺线管结构域中的每个β螺线管结构域包括氨基酸序列,所述氨基酸序列包括共有基序的至少4个单元。

在多连体中级联的β螺线管结构域也是本发明的主题,并且下文描述了对本发明的多连体和本发明的β螺线管结构域两者的偏好。

技术人员将理解术语“β螺线管结构域”的含义,参见例如Kajava和Steven2006《蛋白质化学进展(Adv Protein Chem)》,73:55-96,β滚环、β螺旋和其它β螺线管蛋白质。本文所描述的β螺线管结构域由共有基序的至少4个适当的单元的存在来限定。

螺线管蛋白质域是高度模块化的。所述螺线管蛋白质域由几乎相同的折叠的链组成,所述折叠通常简称为“重复序列(repeat)”并且在本文中为了清楚起见被称为“共有基序的单元”,因为严格地“重复序列”不必属于相同序列。“重复序列”或“共有基序的单元”可以是相同的或几乎相同的。

螺线管结构域的类型的实例包含线性(开放)螺线管和圆形螺线管或闭合螺线管。认为在优选的实施例中,所述螺线管结构域是形成杆状结构的线性螺线管。

根据本发明的β螺线管结构域由共有基序的至少4个单元的存在来限定。由此包含每个单元符合特定共有基序的含义,但是至少四个单元中的每个单元可以具有不同的序列。技术人员将理解术语“共有基序”的含义,以及所述单元中的每个单元可以如何符合共有序列但仍彼此不同。技术人员还将理解哪些共有基序适用于本发明并且可以用于产生β螺线管结构域。

在一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域,或所述至少两个β螺线管结构域中的两个β螺线管结构域,或所有β螺线管结构域包括以下共有序列中的任何一个或多个。在优选的实施例中,单个β螺线管结构域内的每个单元符合相同的共有序列(不一定包括如上文所讨论的相同的实际序列)。优选地,本发明的多连体中的每个β螺线管结构域内的每个单元符合相同的共有序列。然而,设想了不同的β螺线管结构域的多连体并将其包含在本发明中,例如多连体可以包括符合下文SEQ ID NO:82的β螺线管和符合下文SEQ ID NO:87的β螺线管结构域。下文提供了适当的共有序列的实例:

i)AX

其中X

X

X

任选地

其中X

X

X

ii)AX

其中X

X

X

任选地

其中X

X

X

iii)A(N/D)L*X[SEQ ID NO:151]

其中*是极性残基(C、R、H、K、D、E、S、T、N、Q),并且X是任何残基;

iv)(S/G/T/A)X(A/V/G)X(G/A)XX[SEQ ID NO:152]

其中X是任何残基;

v)(S/G/T/A)X(A/V/G)X(G/A)XX(S/G/T/A)*(A/V/G)*(G/A)XX[SEQ ID NO:153]

其中*是疏水残基,并且其中X是任何残基;

vi)SXAXGXXS*A*GXX[SEQ ID NO:154]

其中*是疏水残基,并且其中X是任何残基;

vii)NXAXGXXST(I/V)(G/A)GGXX[SEQ ID NO:155]

其中X是任何残基;

viii)NXAXGXXSTIGGGXX[SEQ ID NO:156]

其中X是任何残基;

ix)GXQX(V/I/L)XXGGXAXXTX(V/I/L)XXG[SEQ ID NO:157]

其中X是任何残基。

认为包括符合(i)、(ii)和(iii)的共有序列的单元或由其组成的β螺线管结构域将产生具有正方形或近似正方形横截面的β螺线管结构域;包括符合(iv)、(v)、(vi)、(vii)和(viii)的共有序列的单元或由其组成的β螺线管结构域将产生椭圆形或近似椭圆形横截面;并且包括符合(ix)的共有序列的单元或由其组成的β螺线管结构域将产生三角形或近似三角形横截面。

还认为(i)、(ii)或(iii)的一个共有序列单元表示正方形横截面的四个侧面中的一个侧面;(iv)的一个共有序列单元表示β螺线管螺旋的半圈;(v)的一个共有序列单元表示β螺线管螺旋的一圈;(vi)的一个共有序列单元表示β螺线管螺旋的一圈;(vii)的一个共有序列单元表示β螺线管螺旋的一圈;并且(viii)的一个共有序列单元表示β螺线管螺旋的一圈。

应当理解,本发明的β螺线管结构域的单元的共有序列不限于上文所讨论的共有序列,而是可以使用任何其它合适的β螺线管共有序列。

认为有益的(尽管不一定是必需的)是,所述至少两个β螺线管结构域具有允许一定程度的镶嵌或有效填充的横截面,因为如果螺线管结构域被紧密填充,则认为最终由多连体产生的纤维具有有利的性质。因此,在一个实施例中,一个或多个β螺线管结构域的单元的共有序列被选择成使得形成可镶嵌的横截面,例如所述横截面包含正方形横截面、矩形横截面、平行四边形横截面、六边形横截面、三角形横截面或其它可镶嵌的横截面。因此,上文所讨论的产生正方形横截面或矩形横截面或三角形横截面的共有序列被认为是特别有利的。圆形(rounded)(圆形(circular)或椭圆形)横截面仍可以高效率地填充在一起,尤其是具有合适的侧向功能性,并且还被认为是用于β螺线管结构域横截面的合适形状。

在一个实施例中,具有不规则横截面或至少不允许镶嵌或有效填充的横截面的β螺线管结构域被认为较不有利或不适用于本发明。

在优选的实施例中,所述至少两个β螺线管结构域呈杆状的。技术人员将理解杆状的含义,即具有沿一条轴线比在横轴上更长的形状,并且其中β螺线管结构域的横截面的形状和尺寸沿β螺线管结构域的长度不显著变化,例如在横截面具有三角形形状的情况下,β螺线管结构域的三维形状可以被认为是棱柱形的。如本文所讨论的,优选的是β螺线管结构域内的单元符合相同的共有序列。然而,多连体可以包括符合不同的共有基序的β螺线管结构域,并且因此可以包括具有不同形状横截面的β螺线管结构域,例如多连体可以包括具有正方形形状的横截面和/或椭圆形形状的横截面和/或三角形形状的横截面的β螺线管结构域。

例如,在β螺线管结构域的情况下,β螺线管结构域具有由单元序列的规则绕组形成的纵轴和垂直于所述纵轴延伸的横轴。在一个实施例中,所述至少两个β螺线管结构域之一的纵向长度与横向长度的比率(即纵横比)为至少2:1,例如至少3:1,例如至少4:1,例如至少5:1,例如至少6:1,例如至少7:1,例如至少8:1,例如至少9:1,例如10:1。在另外的实施例中,所述至少两个β螺线管结构域中的两个β螺线管结构域具有纵轴和横轴,并且纵向长度与横向长度的比率为至少2:1,例如至少3:1,例如至少4:1,例如至少5:1,例如至少6:1,例如至少7:1,例如至少8:1,例如至少9:1,例如10:1。在又另一个实施例中,多连体中的所有β螺线管结构域,例如在多连体包括多于2个β螺线管结构域的情况下具有纵轴和横轴,并且纵向长度与横向长度的比率为至少2:1,例如至少3:1,例如至少4:1,例如至少5:1,例如至少6:1,例如至少7:1,例如至少8:1,例如至少9:1,例如10:1。

在一个实施例中,优选的是,一个或两个或所有β螺线管结构域的纵横比为10:1或更小。

如上文所指示的,多连体可以包括任何数量的β螺线管结构域,条件是所述多连体根据定义包括至少两个β螺线管结构域。

例如,根据本发明的多连体可以包括至少三个β螺线管结构域,例如至少四个β螺线管结构域,例如至少5个β螺线管结构域,例如至少6个β螺线管结构域,例如至少7个β螺线管结构域,例如至少8个β螺线管结构域,例如至少9个β螺线管结构域,例如至少10个β螺线管结构域,例如至少11个β螺线管结构域,例如至少12个β螺线管结构域,例如至少13个β螺线管结构域,例如至少14个β螺线管结构域,例如至少15个β螺线管结构域,例如至少16个β螺线管结构域,例如至少17个β螺线管结构域,例如至少18个β螺线管结构域,例如至少19个β螺线管结构域,例如至少20个β螺线管结构域,例如至少21个β螺线管结构域,例如至少22个β螺线管结构域,例如至少23个β螺线管结构域,例如至少24个β螺线管结构域,例如至少25个β螺线管结构域,例如至少26个β螺线管结构域,例如至少27个β螺线管结构域,例如至少28个β螺线管结构域,例如至少29个β螺线管结构域,例如至少30个β螺线管结构域,例如至少35个β螺线管结构域,例如至少40个β螺线管结构域,例如至少45个β螺线管结构域,例如至少50个β螺线管结构域,例如至少55个β螺线管结构域,例如至少60个β螺线管结构域,例如至少65个β螺线管结构域,例如至少70个β螺线管结构域,例如至少75个β螺线管结构域,例如至少80个β螺线管结构域,例如至少85个β螺线管结构域,例如至少90个β螺线管结构域,例如至少95个β螺线管结构域,例如至少100个β螺线管结构域。

如上文所讨论的,优选的是,β螺线管结构域具有特定的纵横比。因此,在一个实施例中,多连体包括至少两个β螺线管结构域,例如至少三个β螺线管结构域,例如至少四个β螺线管结构域,例如至少5个β螺线管结构域,例如至少6个β螺线管结构域,例如至少7个β螺线管结构域,例如至少8个β螺线管结构域,例如至少9个β螺线管结构域,例如至少10个β螺线管结构域,例如至少11个β螺线管结构域,例如至少12个β螺线管结构域,例如至少13个β螺线管结构域,例如至少14个β螺线管结构域,例如至少15个β螺线管结构域,例如至少16个β螺线管结构域,例如至少17个β螺线管结构域,例如至少18个β螺线管结构域,例如至少19个β螺线管结构域,例如至少20个β螺线管结构域,例如至少21个β螺线管结构域,例如至少22个β螺线管结构域,例如至少23个β螺线管结构域,例如至少24个β螺线管结构域,例如至少25个β螺线管结构域,例如至少26个β螺线管结构域,例如至少27个β螺线管结构域,例如至少28个β螺线管结构域,例如至少29个β螺线管结构域,例如至少30个β螺线管结构域,例如至少35个β螺线管结构域,例如至少40个β螺线管结构域,例如至少45个β螺线管结构域,例如至少50个β螺线管结构域,例如至少55个β螺线管结构域,例如至少60个β螺线管结构域,例如至少65个β螺线管结构域,例如至少70个β螺线管结构域,例如至少75个β螺线管结构域,例如至少80个β螺线管结构域,例如至少85个β螺线管结构域,例如至少90个β螺线管结构域,例如至少95个β螺线管结构域,例如至少100个β螺线管结构域,

并且其中所述β螺线管结构域中的至少一个β螺线管结构域,例如至少两个β螺线管结构域,例如至少三个β螺线管结构域,例如至少四个β螺线管结构域,例如至少5个β螺线管结构域,例如至少6个β螺线管结构域,例如至少7个β螺线管结构域,例如至少8个β螺线管结构域,例如至少9个β螺线管结构域,例如至少10个β螺线管结构域,例如至少11个β螺线管结构域,例如至少12个β螺线管结构域,例如至少13个β螺线管结构域,例如至少14个β螺线管结构域,例如至少15个β螺线管结构域,例如至少16个β螺线管结构域,例如至少17个β螺线管结构域,例如至少18个β螺线管结构域,例如至少19个β螺线管结构域,例如至少20个β螺线管结构域,例如至少21个β螺线管结构域,例如至少22个β螺线管结构域,例如至少23个β螺线管结构域,例如至少24个β螺线管结构域,例如至少25个β螺线管结构域,例如至少26个β螺线管结构域,例如至少27个β螺线管结构域,例如至少28个β螺线管结构域,例如至少29个β螺线管结构域,例如至少30个β螺线管结构域,例如至少35个β螺线管结构域,例如至少40个β螺线管结构域,例如至少45个β螺线管结构域,例如至少50个β螺线管结构域,例如至少55个β螺线管结构域,例如至少60个β螺线管结构域,例如至少65个β螺线管结构域,例如至少70个β螺线管结构域,例如至少75个β螺线管结构域,例如至少80个β螺线管结构域,例如至少85个β螺线管结构域,例如至少90个β螺线管结构域,例如至少95个β螺线管结构域,例如至少100个β螺线管结构域的纵横比为至少2:1,例如至少3:1,例如至少4:1,例如至少5:1,例如至少6:1,例如至少7:1,例如至少8:1,例如至少9:1,例如10:1。在另外的实施例中,所述至少两个β螺线管结构域中的两个β螺线管结构域具有纵轴和横轴,并且纵向长度与横向长度的比率为至少2:1,例如至少3:1,例如至少4:1,例如至少5:1,例如至少6:1,例如至少7:1,例如至少8:1,例如至少9:1,例如10:1。

技术人员将清楚的是,多连体的纵横比将高于单个β螺线管结构域的纵横比,并且通常被认为是所述单个β螺线管结构域的纵横比的总和(尽管用于连接β螺线管结构域的连接子的长度也将影响多连体的纵横比)。例如,预期各自具有10:1纵横比的由两个β螺线管结构域构成的多连体将产生具有约20:1纵横比的多连体。因此,在一个实施例中,多连体的纵横比可以介于约4:1到1000:1之间。在一个实施例中,多连体的纵横比可以为至少4:1,例如至少6:1,例如至少8:1,例如至少10:1,例如至少10:1,例如至少50:1,例如至少100:1,例如至少200:1,例如至少300:1,例如至少400:1,例如至少500:1,例如至少600:1,例如至少700:1,例如至少800:1,例如至少900:1,例如至少1000:1。

为了实现多连体中的所述β螺线管结构域中的一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域的期望纵横比,共有基序的单元的数量可以变化。认为随着β螺线管结构域中的共有序列的单元的数量增加,纵横比越高。例如,具有较低数量的共有基序的单元的β螺线管可以具有例如1:1或1:2的纵横比,而具有较高数量的共有基序序列单元的β螺线管结构域的纵横比可以为9:1或10:1。这全部处于技术人员的知识范围内,并且技术人员将能够容易地确定共有基序的单元的合适数量以产生期望纵横比。

因此,在一个实施例中,所述至少两个β螺线管结构域中的至少一个β螺线管结构域包括所述共有基序的4个到3000个单元,任选地所述共有基序的5个到2800个,任选地6个到2600个,任选地7个到2400个,任选地8个到2200个,任选地9个到2000个,任选地10个到1800个,任选地11个到1600个,任选地12个到1400个,任选地13个到1200个,任选地14个到1000个,任选地15个到800个,任选地16个到600个,任选地17个到500个,任选地18个到400个,任选地19个到300个,任选地21个到200个,任选地22个到150个,任选地23个到100个,任选地24个到90个,任选地25个到85个,任选地26个到80个,任选地27个到75个,任选地28个到70个,任选地29个到65个,任选地30个到60个,任选地35个到55个,任选地40个到50个,任选地45个单元。

在另一个实施例中,所述β螺线管结构域中的至少两个β螺线管结构域包括所述共有基序的4个到3000个单元,任选地所述共有基序的5个到2800个,任选地6个到2600个,任选地7个到2400个,任选地8个到2200个,任选地9个到2000个,任选地10个到1800个,任选地11个到1600个,任选地12个到1400个,任选地13个到1200个,任选地14个到1000个,任选地15个到800个,任选地16个到600个,任选地17个到500个,任选地18个到400个,任选地19个到300个,任选地21个到200个,任选地22个到150个,任选地23个到100个,任选地24个到90个,任选地25个到85个,任选地26个到80个,任选地27个到75个,任选地28个到70个,任选地29个到65个,任选地30个到60个,任选地35个到55个,任选地40个到50个,任选地45个单元;和/或

在另一个实施例中,所述β螺线管结构域中的任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的4个到3000个单元,任选地所述共有基序的5个到2800个,任选地6个到2600个,任选地7个到2400个,任选地8个到2200个,任选地9个到2000个,任选地10个到1800个,任选地11个到1600个,任选地12个到1400个,任选地13个到1200个,任选地14个到1000个,任选地15个到800个,任选地16个到600个,任选地17个到500个,任选地18个到400个,任选地19个到300个,任选地21个到200个,任选地22个到150个,任选地23个到100个,任选地24个到90个,任选地25个到85个,任选地26个到80个,任选地27个到75个,任选地28个到70个,任选地29个到65个,任选地30个到60个,任选地35个到55个,任选地40个到50个,任选地45个单元,

例如,多连体可以包括至少两个β螺线管结构域,例如至少三个β螺线管结构域,例如至少四个β螺线管结构域,例如至少5个β螺线管结构域,例如至少6个β螺线管结构域,例如至少7个β螺线管结构域,例如至少8个β螺线管结构域,例如至少9个β螺线管结构域,例如至少10个β螺线管结构域,例如至少11个β螺线管结构域,例如至少12个β螺线管结构域,例如至少13个β螺线管结构域,例如至少14个β螺线管结构域,例如至少15个β螺线管结构域,例如至少16个β螺线管结构域,例如至少17个β螺线管结构域,例如至少18个β螺线管结构域,例如至少19个β螺线管结构域,例如至少20个β螺线管结构域,例如至少21个β螺线管结构域,例如至少22个β螺线管结构域,例如至少23个β螺线管结构域,例如至少24个β螺线管结构域,例如至少25个β螺线管结构域,例如至少26个β螺线管结构域,例如至少27个β螺线管结构域,例如至少28个β螺线管结构域,例如至少29个β螺线管结构域,例如至少30个β螺线管结构域,例如至少35个β螺线管结构域,例如至少40个β螺线管结构域,例如至少45个β螺线管结构域,例如至少50个β螺线管结构域,例如至少55个β螺线管结构域,例如至少60个β螺线管结构域,例如至少65个β螺线管结构域,例如至少70个β螺线管结构域,例如至少75个β螺线管结构域,例如至少80个β螺线管结构域,例如至少85个β螺线管结构域,例如至少90个β螺线管结构域,例如至少95个β螺线管结构域,例如至少100个β螺线管结构域,并且所述多连体中的任何一个或多个或所有β螺线管结构域可以包括所述共有基序的4个到3000个单元,任选地所述共有基序的5个到2800个,任选地6个到2600个,任选地7个到2400个,任选地8个到2200个,任选地9个到2000个,任选地10个到1800个,任选地11个到1600个,任选地12个到1400个,任选地13个到1200个,任选地14个到1000个,任选地15个到800个,任选地16个到600个,任选地17个和500个,任选地18个到400个,任选地19个到300个,任选地21个到200个,任选地22个到150个,任选地23个到100个,任选地24个到90个,任选地25个到85个,任选地26个到80个,任选地27个到75个,任选地28个到70个,任选地29个到65个,任选地30个到60个,任选地35个到55个,任选地40个到50个,任选地45个单元。

在另一个实施例中,所述至少两个β螺线管结构域中的至少一个β螺线管结构域包括所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元,任选地至少200个单元。

在另一个实施例中,所述β螺线管结构域中的至少两个β螺线管结构域包括所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元,任选地至少200个单元。

在又另一个实施例中,如上文所讨论的,所述β螺线管结构域中的任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元,任选地至少200个单元。

在另一个实施例中,多连体可以包括至少一个β螺线管结构域,所述至少一个β螺线管结构域包括所述共有基序的少于3000个单元,任选地所述共有基序的少于2000个单元,任选地少于1000个单元,任选地少于500个单元,任选地少于400个单元,任选地少于300个单元,任选地少于200个单元,任选地少于100个单元,任选地少于90个单元,任选地少于80个单元,任选地少于70个单元,任选地少于60个单元,任选地少于50个单元,任选地少于40个单元,任选地少于30个单元,任选地少于29个单元,任选地少于28个单元,任选地少于27个单元,任选地少于26个单元,任选地少于25个单元,任选地少于24个单元,任选地少于23个单元,任选地少于22个单元,任选地少于21个单元,任选地少于20个单元,任选地少于19个单元,任选地少于18个单元,任选地少于17个单元,任选地少于16个单元,任选地少于15个单元,任选地少于14个单元,任选地少于13个单元,任选地少于12个单元,任选地少于11个单元,任选地少于10个单元,任选地少于9个单元,任选地少于8个单元,任选地少于7个单元,任选地6个单元。

在另一个实施例中,多连体中的所述至少两个β螺线管结构域包括所述共有基序的少于3000个单元,任选地所述共有基序的少于2000个单元,任选地少于1000个单元,任选地少于500个单元,任选地少于400个单元,任选地少于300个单元,任选地少于200个单元,任选地少于100个单元,任选地少于90个单元,任选地少于80个单元,任选地少于70个单元,任选地少于60个单元,任选地少于50个单元,任选地少于40个单元,任选地少于30个单元,任选地少于29个单元,任选地少于28个单元,任选地少于27个单元,任选地少于26个单元,任选地少于25个单元,任选地少于24个单元,任选地少于23个单元,任选地少于22个单元,任选地少于21个单元,任选地少于20个单元,任选地少于19个单元,任选地少于18个单元,任选地少于17个单元,任选地少于16个单元,任选地少于15个单元,任选地少于14个单元,任选地少于13个单元,任选地少于12个单元,任选地少于11个单元,任选地少于10个单元,任选地少于9个单元,任选地少于8个单元,任选地少于7个单元,任选地6个单元;和/或

在又另一个实施例中,多连体中的所述β螺线管结构域中的任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的少于3000个单元,任选地所述共有基序的少于2000个单元,任选地少于1000个单元,任选地少于500个单元,任选地少于400个单元,任选地少于300个单元,任选地少于200个单元,任选地少于100个单元,任选地少于90个单元,任选地少于80个单元,任选地少于70个单元,任选地少于60个单元,任选地少于50个单元,任选地少于40个单元,任选地少于30个单元,任选地少于29个单元,任选地少于28个单元,任选地少于27个单元,任选地少于26个单元,任选地少于25个单元,任选地少于24个单元,任选地少于23个单元,任选地少于22个单元,任选地少于21个单元,任选地少于20个单元,任选地少于19个单元,任选地少于18个单元,任选地少于17个单元,任选地少于16个单元,任选地少于15个单元,任选地少于14个单元,任选地少于13个单元,任选地少于12个单元,任选地少于11个单元,任选地少于10个单元,任选地少于9个单元,任选地少于8个单元,任选地少于7个单元,任选地6个单元。

应当理解,共有基序的单元可以连续(即,串联)布置,其中所述共有基序的单元中的一个或多个单元紧跟第一共有基序。然而,共有基序的单元还可以包括单元之间的另外的序列。优选地,所述共有基序的单元连续布置。因此,在一个实施例中,多连体包括任何以下布置:

所述β螺线管结构域中的一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的4个到3000个单元,任选地所述共有基序的5个到2800个,任选地6个到2600个,任选地7个到2400个,任选地8个到2200个,任选地9个到2000个,任选地10个到1800个,任选地11个到1600个,任选地12个到1400个,任选地13个到1200个,任选地14个到1000个,任选地15个到800个,任选地16个到600个,任选地17个到500个,任选地18个到400个,任选地19个到300个,任选地21个到200个,任选地22个到150个,任选地23个到100个,任选地24个到90个,任选地25个到85个,任选地26个到80个,任选地27个到75个,任选地28个到70个,任选地29个到65个,任选地30个到60个,任选地35个到55个,任选地40个到50个,任选地45个单元,

其中所述共有基序的单元连续布置;或

所述β螺线管结构域中的一个β螺线管结构域、两个β螺线管结构域或任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的至少4个单元,例如所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元,任选地至少200个单元,其中所述共有基序的单元中的每个单元连续布置;或

所述β螺线管结构域中的一个β螺线管结构域、两个β螺线管结构域或任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的少于3000个单元,任选地所述共有基序的少于2000个单元,任选地少于1000个单元,任选地少于500个单元,任选地少于400个单元,任选地少于300个单元,任选地少于200个单元,任选地少于100个单元,任选地少于90个单元,任选地少于80个单元,任选地少于70个单元,任选地少于60个单元,任选地少于50个单元,任选地少于40个单元,任选地少于30个单元,任选地少于29个单元,任选地少于28个单元,任选地少于27个单元,任选地少于26个单元,任选地少于25个单元,任选地少于24个单元,任选地少于23个单元,任选地少于22个单元,任选地少于21个单元,任选地少于20个单元,任选地少于19个单元,任选地少于18个单元,任选地少于17个单元,任选地少于16个单元,任选地少于15个单元,任选地少于14个单元,任选地少于13个单元,任选地少于12个单元,任选地少于11个单元,任选地少于10个单元,任选地少于9个单元,任选地少于8个单元,任选地少于7个单元,任选地6个单元,

其中所述共有基序的单元连续布置。

在一个实施例中,所述β螺线管结构域中的一个β螺线管结构域或两个β螺线管结构域或所有β螺线管结构域的长度在长度上介于约5埃与4000埃之间,例如介于约10埃与3000埃之间,例如介于约15埃与2000埃之间,例如介于约20埃与1000埃之间,例如介于约25埃与500埃之间,例如介于约30埃与250埃之间,例如介于35埃与200埃之间,例如介于40埃与100埃之间,例如介于45埃与75埃之间,例如为约50埃。优选地,所述β螺线管结构域中的一个β螺线管结构域或两个β螺线管结构域或所有β螺线管结构域长度介于约35埃与200埃之间。

应当理解,所述β螺线管结构域中的两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域可以包括一些区段,其中所述共有基序的单元彼此直接跟随,即其中所述单元连续布置,但是在这些区段中的每个区段之间可以存在另外的插入序列。

在一个优选的实施例中,多连体中的所述β螺线管结构域中的所述至少两个β螺线管结构域或任何数量的β螺线管结构域或所有β螺线管结构域包括共有基序的相同数量的单元。在另一个实施例中,并非所有β螺线管结构域都具有共有基序的相同数量的单元。

如上文所讨论的,在β螺线管结构域内,共有基序的单元可以符合不同的共有基序。然而,优选的是,给定β螺线管结构域内的共有基序是相同的。在这种实施例中,符合共有基序的所述单元中的每个单元的序列也可以是相同的,例如β螺线管结构域可以包括串联阵列或具有相同序列。在优选的实施例中,尽管符合相同共有基序的实际序列是不同的。

因此,在一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域包括所述共有基序的至少两个相同的单元或序列,例如所述共有基序的至少3个单元,例如所述共有基序的至少4个单元,例如所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元可以是相同的。在另一个实施例中,符合共有基序的所有单元或序列在给定β螺线管结构域内是相同的。

如上文所讨论的,在另一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域可以包括所述共有基序的至少两个不相同的单元或序列,例如所述共有基序的至少两个不相同的单元或序列,例如所述共有基序的至少3个单元,例如所述共有基序的至少4个单元,例如所述共有基序的至少5个单元,任选地所述共有基序的至少6个单元,任选地至少7个单元,任选地至少8个单元,任选地至少9个单元,任选地至少10个单元,任选地至少11个单元,任选地至少12个单元,任选地至少13个单元,任选地至少14个单元,任选地至少15个单元,任选地至少16个单元,任选地至少17个单元,任选地至少18个单元,任选地至少19个单元,任选地至少20个单元,任选地至少21个单元,任选地至少24个单元,任选地至少25个单元,任选地至少26个单元,任选地至少27个单元,任选地至少28个单元,任选地至少29个单元,任选地至少30个单元,任选地至少40个单元,任选地至少50个单元,任选地至少60个单元,任选地至少70个单元,任选地至少80个单元,任选地至少90个单元,任选地至少100个单元可以是不相同的。

不相同包含彼此不相同的含义。例如,在上文实施例中,所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域可以包括至少两个不同的单元序列,例如至少3个不同的单元序列,例如至少4个不同的单元序列,例如至少5个不同的单元序列,任选地至少6个不同的单元序列,任选地至少7个不同的单元序列,任选地至少8个不同的单元序列,任选地至少9个不同的单元序列,任选地至少10个不同的单元序列,任选地至少11个不同的单元序列,任选地至少12个不同的单元序列,任选地至少13个不同的单元序列,任选地至少14个不同的单元序列,任选地至少15个不同的单元序列,任选地至少16个不同的单元序列,任选地至少17个不同的单元序列,任选地至少18个不同的单元序列,任选地至少19个不同的单元序列,任选地至少20个不同的单元序列,任选地至少21个不同的单元序列,任选地至少24个不同的单元序列,任选地至少25个不同的单元序列,任选地至少26个不同的单元序列,任选地至少27个不同的单元序列,任选地至少28个不同的单元序列,任选地至少29个不同的单元序列,任选地至少30个不同的单元序列,任选地至少40个不同的单元序列,任选地至少50个不同的单元序列,任选地至少60个不同的单元序列,任选地至少70个不同的单元序列,任选地至少80个不同的单元序列,任选地至少90个不同的单元序列,任选地至少100个不同的单元序列。

在一个实施例中,符合共有序列的单元的所有序列彼此不同,即在给定β螺线管结构域内不存在符合共有序列的单元的相同序列。

在一个实施例中,多连体的β螺线管结构域可以包括符合不同共有序列的单元。因此,在一个实施例中,所述β螺线管结构域中的至少两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域具有不同的氨基酸序列。如上文所讨论的,优选地,β螺线管结构域包括符合相同共有序列的单元。在这种实施例中,β螺线管结构域中的所述至少两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域的氨基酸序列仍可以是不同的。在又另一个实施例中,β螺线管结构域中的所述至少两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域的氨基酸序列可以是相同的。

从上文将清楚的是,在相同的多连体内,多连体内的螺线管结构域可以具有的彼此不同的序列。所述螺线管结构域的序列可以是不同的一个原因可以是促进编码多连体的核酸片段的合成。

例如,构建体>SynRFR24.nnum35.nc.ll.x4.K129S[氨基酸序列][SEQ ID NO:161]包括3个相同序列的β螺线管结构域,前面是包括稍微不同序列(K到S突变)的初始β螺线管结构域,所述稍微不同序列被认为易于DNA合成并且由以下构成:TAG序列:MGSSHHHHHHSSGLVPRGS[SEQ ID NO:33];NCAP序列:RMRRDEILEEYRRGRRNFQHINLQEIELTN[SEQID NO:2];UNITSn序列:aelagadlananlhranlenanlanakleeanleeanlagadlrnanlqranlaradlagadltganlaeadlrearlqsanlenadltnadltgadlegarlhganleganltnanlrkanlenadlrnadltg—4个螺线管结构域序列中的第1螺线管结构域序列[SEQ ID NO:169];然后是UNITSn序列aelagadlananlhranlenanlanakleeanleeanlagadlrnanlqranlaradlagadltganlaeadlrearlqkanlenadltnadltgadlegarlhganleganltnanlrkanlenadlrnadltg—4个螺线管结构域序列中的第2、第3和第4螺线管结构域序列[SEQ ID NO:23];CCAP序列:ARTTGARLDDADLRGATVDPVLWRTASLRGAKMEEEQRREYERARG[SEQ ID NO:3];尾部序列:QEDKG[SEQ ID NO:141];和连接子序列GGGSAAAAAAGGGS[SEQ ID NO:168]。

与多连体中的其余3个螺线管结构域相比,第一个螺线管结构域中的K到S突变被认为使得序列能够通过作为商业DNA合成公司的定制的未克隆的线性dsDNA片段的DNA合成的序列复杂性筛选标准。

当表示为单体时,如果β螺线管结构域能够形成溶致液晶中间相,则认为是优选的。技术人员将理解,根据对液晶相的理论理解(例如,根据翁萨格硬棒模型(Onsager'shard rod model)),预期不同的蛋白质将导致不同的相行为。形成溶致液晶中间相的能力与β螺线管结构域的尺寸和与β螺线管结构域相关的电荷两者有关,并且需要各向异性的结构;“棒状”域特别适合于形成向列液晶,尽管可能出现其它更有序的系统,如近晶相(smectics)或柱状相。对本文所讨论的β螺线管结构域的偏好被认为产生β螺线管结构域,当表示为单体时,所述β螺线管结构域能够在溶液中形成溶致液晶中间相。各种测试(如实例中所描述的测试)对于技术人员来说是可获得的,以确定当表示为单体时,特定β螺线管结构域是否能够形成溶致液晶中间相。例如,偏振光学显微术(polarised opticalmicroscopy)的使用可以用于确定特定螺线管结构域或多连体是否能够形成溶致液晶中间相。

对于关于包含芳族聚酰胺纺丝的聚合物中液晶相的讨论,一本经典教科书是“液晶聚合物(Liquid Crystalline Polymers),CUP,2006,A.M.Donald,A.H.Windle,S.Hanna”。

介晶小分子或胶体通常被认为是刚性的,并由特性纵横比(物种的轴向长度相对于其旋转平均直径)来限定。在聚合物中,链主链是半柔性的,并且由以持久长度为特性的刚性来限定。纵横比和持久长度是确定各向同性-向列相转变的浓度的相关参数(例如,参见:《物理化学杂志(The Journal of Chemical Physics)》,106,9858(1997))。认为低值可能不形成中间相。较高的值降低了临界浓度,但也增加了不想要的胶凝化或玻璃化转变的可能性。这都是技术人员已知的,并且技术人员能够为相关参数中的每个相关参数(例如,电荷和纵横比)选择适当的值。

还优选的是,多连体以及β螺线管单体或除了β螺线管单体之外能够形成溶致液晶中间相。偏好如上文所讨论。因此,在一个实施例中,多连体能够形成溶致液晶中间相。

β螺线管结构域的合适序列的实例包含SEQ ID NO:1和8-28,但是如上文所讨论的,任何β螺线管结构域序列都被认为可用于本发明,特别是符合本文所讨论的共有序列的序列,例如SEQ ID NO:147-157的序列。

因此,在一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域的序列包括SEQ ID NO:1和8-28中的任一个序列。如所讨论的,在一个实施例中,多连体中的所述β螺线管结构域中的每个β螺线管结构域包括相同的序列,而在另一个实施例中,多连体包括包含不同序列的β螺线管结构域。

还应当理解,本发明的β螺线管和多连体可以容许本文所公开的序列中的一定程度的变异。因此,一个实施例提供了根据本发明的多连体,其中所述β螺线管结构域中的至少一个β螺线管结构域、所述至少两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域与SEQ ID NO:1和8-28的序列中的任一个序列具有至少75%同源性,任选地至少80%同源性,任选地至少85%同源性,任选地至少90%同源性,任选地至少95%同源性,任选地至少96%同源性,任选地至少97%同源性,任选地至少98%同源性,任选地至少99%同源性,任选地至少100%同源性,优选地同时仍符合所需的共有序列。另一个实施例提供了根据本发明的多连体,其中所述β螺线管结构域中的至少一个β螺线管结构域、所述至少两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域与SEQ ID NO:1和8-28的序列中的任一个序列具有至少75%序列同一性,任选地至少80%序列同一性,任选地至少85%序列同一性,任选地至少90%序列同一性,任选地至少95%序列同一性,任选地至少96%序列同一性,任选地至少97%序列同一性,任选地至少98%序列同一性,任选地至少99%序列同一性,任选地至少100%序列同一性,优选地同时仍符合所需的共有序列。

在优选的实施例中,多连体中的所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域在所述β螺线管结构域的第一端或第二端或所述第一端和所述第二端两者处包括加帽序列。将显而易见的是,β螺线管结构域可以根本不包括任何加帽序列,并且所述加帽序列或加帽结构的存在不被认为对本发明是必不可少的。然而,在N端或C端,优选地在N端和C端两者处加帽序列的存在是优选的实施例。

因此,在一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域在每个β螺线管结构域中的第一端或第二端或在所述第一端和所述第二端两者处包括加帽序列,或者所述β螺线管结构域中的两个β螺线管结构域或任何数量的β螺线管结构域或所有β螺线管结构域在每个β螺线管结构域的第一端或第二端处,或在所述第一端和所述第二端两者处包括加帽序列。

加帽序列被认为防止β螺线管结构域端对端连接和聚集。因此,在一个实施例中,如本文描述的一个或多个β螺线管结构域包括防止β螺线管结构域端对端连接和聚集的一个或两个加帽序列。技术人员能够设计这种加帽序列,并且存在能够实现这一点的多种不同方式。例如,可以使用类似于β螺线管结构域的单元的共有序列的端重复序列(terminalrepeat),但是其中通常将被掩埋的暴露于溶剂的残基改为突变成极性或带电荷残基,这被认为有助于屏蔽疏水内芯。技术人员将显而易见的另一种方法是通过添加脯氨酸残基或形成β凸起来破坏端重复序列的正常氢键主链模式。又另一种方法是设计β螺线管的序列,使得多肽链的一部分折叠并覆盖端。例如,本文所公开的加帽序列形成覆盖β螺旋的端的α螺旋。这种加帽序列可以在自然界中发现或通过例如使用计算蛋白质设计方法重新设计天然序列来从头设计。

在另一实施例中,加帽序列含有α螺旋。

合适的加帽序列的实例是符合SEQ ID NO:82和83中提供的共有序列的序列:

[SEQ ID NO:82]

xMxxxxILxxYxxGxxxFxxIxLxx(I/A)xLxx

其中x是任何残基;

[SEQ ID NO:83]

Ax(T/L/F)xxAx(L/F)xxAx(L/F)xxAxVxPVLWxxAxLxGAx(M/V)xxxxxxx(Y/F)xxAxx

其中x是任何残基。

认为SEQ ID NO:82的序列适合于对β螺线管结构域的N端进行加帽,而认为SEQ IDNO:83的序列适合于对β螺线管结构域的C端进行加帽。

另外的序列由SEQ ID NO:2、3、84-104和105-125提供,其中SEQ ID NO:2和84-104适合于对β螺线管结构域的N端进行加帽,而SEQ ID NO:3和105-125适合于对β螺线管结构域的C端进行加帽。

通常认为由于β螺线管结构域的手性,适合于对N端进行加帽的加帽序列通常不适合于对C端进行加帽,并且反之亦然。然而,存在一些被认为适合于在β螺线管结构域的任一端进行加帽的加帽结构。这种加帽序列包含基于β螺线管结构域的单元基序序列的变异的加帽序列,并且所述加帽序列例如包括亲水残基代替疏水残基。

在一个实施例中,β螺线管结构域仅包括N端加帽序列,其中所述序列符合SEQ IDNO:82中所示出的共有序列和/或选自SEQ ID NO:2和84-104中的任一个序列。

在另一个实施例中,β螺线管结构域仅包括C端帽,任选地其中所述C端加帽序列符合SEQ ID NO:83中所示出的共有序列和/或选自SEQ ID NO:3和105-125中的任一个序列。

在另一个实施例中,β螺线管结构域包括N端帽和C端帽两者,例如如上文所定义的。

在一个实施例中,N端加帽序列和C端加帽序列彼此相同。在另一个实施例中,N端加帽序列和C端加帽序列彼此不同。

应当理解,SEQ ID NO:2、3、84-104和105-125的加帽序列中的一些变异是允许的,并且预期会产生功能性加帽序列。因此,在一个实施例中,在给定β螺线管结构域上的加帽序列中的一个加帽序列或两个加帽序列包括与SEQ ID NO:2、3、84-104和105-125中的任一个序列具有至少80%同源性,任选地至少85%同源性,任选地至少90%同源性,任选地至少95%同源性,任选地至少96%同源性,任选地至少97%同源性,任选地至少98%同源性,任选地至少99%同源性,任选地至少100%同源性的序列。在另一个实施例中,在给定β螺线管结构域上的加帽序列中的一个加帽序列或两个加帽序列包括与SEQ ID NO:2、3、84-104和105-125中的任一个序列具有至少80%序列同一性,任选地至少85%序列同一性,任选地至少90%序列同一性,任选地至少95%序列同一性,任选地至少96%序列同一性,任选地至少97%序列同一性,任选地至少98%序列同一性,任选地至少99%序列同一性,任选地至少100%序列同一性的序列。

认为加帽结构或加帽序列还可以包括如本文所描述的一个或多个共有基序的序列,或与符合β螺线管结构域的共有基序的序列非常类似的序列。认为包含这种序列,加帽结构是优选的,所述序列可以是或可以不是相同的,并且所述序列可以严格符合或可以不严格符合共有序列,尽管不是必需的,因为所述加帽结构或加帽序列充当β螺线管的端与任何其它非共有基序加帽序列之间的界面区域,如以稳定的方式抵靠β螺线管的端填充的加帽α螺旋(参见例如SEQ ID NO:2、3、84-104和105-125,其是α螺旋加帽序列/结构)。

然而,应当理解,多连体的β螺线管的加帽序列不限于本文所描述的那些序列,因为预期宽范围的加帽序列是合适的。技术人员将能够容易地通过评估所提出的帽例如是否防止β螺线管结构域端对端地连接和聚集来确定加帽序列是否是合适的。

本发明的所述至少两个β螺线管结构域通过连接子,优选地柔性连接子连接在一起。连接子通常被本领域中的连接子用于例如连接蛋白质域,例如当用GFP标记蛋白质时。连接子的存在允许连接的组分中的每个连接的组分在某种程度上彼此独立地起作用,同时在空间上受到限制并保持连通性。认为连接子在实现有效机械性质所需的多连体的高分子量(大量重复序列)中是很重要的。认为多连体的端充当最终纤维中的缺陷,并降低负荷承载能力。通过使用连接子来增加多连体的分子量使被认为限制纤维纺丝的溶解度和凝胶化/沉淀的任何下降最小化。

在一个实施例中,柔性连接子也由氨基酸形成。在此有利的实施例中,可以将所述至少两个β螺线管结构域转录为单一RNA转录物并翻译成单一多肽。然而,连接如本发明的β螺线管结构域等蛋白质域的其它手段是已知的并且包含在本发明中。

技术人员将理解和理解合适的连接子的特征。合适的连接子的实例被认为是聚甘氨酸连接子、聚丙氨酸连接子、富含甘氨酸的连接子、富含丙氨酸的连接子、富含甘氨酸和丙氨酸的连接子以及富含甘氨酸/丙氨酸/丝氨酸的连接子。合适的连接子的实例在SEQ IDNO:34-GGGS和SEQ ID NO:168-GGGSAAAAAAGGGS中描述。

所要求保护的多连体的有利性质被认为至少部分地驻留在隐藏长度的存在下。隐藏长度的概念将由例如如蚕丝等天然纤维领域为技术人员所熟知,(Fantner等人,DOI:10.1529/biophysj.105.069344)。基本上隐藏长度是由高度的卷曲(即,在当前情况下,β螺线管结构域的卷曲)引起的,使得当向线圈施加纵向力时(即,当平行于β螺线管结构域的组织纤维施加力时),线圈延伸,使得完全延伸的链为原始链的很多倍。在本发明中,额外的长度以规则的方式卷曲,以在纵向方向上施加的限定的力下展开。当施加力时,牺牲键(例如在共有序列单元的残基的多肽主链之间形成的氢键)断裂,而共价键(例如,在单个氨基酸残基的C端与N端之间形成的肽键)不断裂。

特定β螺线管结构域所具有的隐藏长度的程度是β螺线管结构的结构的性质,这是用于β螺线管结构域的单元的共有序列和实际氨基酸序列的设计的结果。

因此,在一个实施例中,认为多连体中的所述β螺线管结构域中的至少一个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域包括隐藏长度。

因此,包括隐藏长度的β螺线管被认为具有第一紧凑构象和第二延伸构象,并且能够在施加纵向力时或从第一构象移动到第二构象。因此,一个实施例提供了本发明的多连体,其中当平行于多连体的纵轴施加限定的力时,多连体中的所述β螺线管结构域中的所述至少两个β螺线管结构域、两个β螺线管结构域、任何数量的β螺线管结构域或所有β螺线管结构域中的至少一个β螺线管结构域在第一构象与第二构象之间移动。

当β螺线管延伸时,认为其吸收能量(参见图1,来自REF:Fantner等人,DOI:10.1529/biophysj.105.069344),少量能量由使牺牲键断裂而产生,并且然后大多数通过充当熵弹簧(entropic spring)。技术人员将理解,更多的卷曲结构具有更多可能的状态(构象),并且因此具有更高的熵。完全延伸的结构具有非常少的状态(构象),并且因此具有更低的熵。

然后在一个实施例中,多连体包括β螺线管结构域中的至少一个β螺线管结构域或至少两个β螺线管结构域或任何数量的β螺线管结构域,所述β螺线管结构域包括第一构象和第二构象,其中所述β螺线管结构域的所述第二构象相对于所述β螺线管结构域的所述第一构象延伸,任选地其中所述β螺线管结构域的所述第二构象的长度为所述β螺线管结构域的所述第一构象的长度的至少1.5倍,任选地为所述β螺线管结构域的所述第一构象的所述长度的至少2倍,任选地至少3倍,任选地至少4倍,任选地至少5倍,任选地至少10倍,任选地至少20倍,任选地至少30倍,任选地至少40倍,任选地至少50倍,任选地至少100倍。

由于隐藏长度被认为是β螺线管结构域的卷曲性质的结果,所以在一个实施例中,所述β螺线管结构域中的至少一个β螺线管结构域的第一构象包括高度的卷曲。

认为通过形成如本文所描述的β螺线管的多连体来增加β螺线管的分子量,改善了β螺线管结构域的可纺性。因此,在一个实施例中,本发明的多连体的分子量为至少30kDa,任选地至少40kDa,任选地至少50kDa,任选地至少60kDa,任选地至少70kDa,任选地至少80kDa,任选地至少90kDa,任选地至少100kDa,任选地至少120kDa,任选地至少150kDa,任选地至少200kDa,任选地至少250kDa,任选地至少300kDa,任选地至少350kDa,任选地至少400kDa,任选地至少450kDa,任选地至少500kDa,任选地至少600kDa,任选地至少650kDa,任选地至少700kDa,任选地至少800kDa,任选地至少900kDa,任选地至少1000kDa;任选地介于30kDa与1000kDa之间。

如果多连体在高浓度下是可溶的,则也被认为是有利的。这再次被认为导致可纺性增加。因此,在一个实施例中,所述多连体在高浓度下是可溶的,任选地在至少20mg/ml,任选地至少30mg/ml,任选地至少40mg/ml,任选地至少50mg/ml,任选地至少60mg/ml,任选地至少70mg/ml,任选地至少80mg/ml,任选地至少90mg/ml,任选地至少100mg/ml,任选地至少120mg/ml,任选地至少130mg/ml,任选地至少150mg/ml,任选地至少170mg/ml,任选地至少190mg/ml,任选地至少200mg/ml,任选地至少250mg/ml,任选地至少300mg/ml,任选地至少350mg/ml,任选地至少400mg/ml的浓度下是可溶的。

在另一实施例中,本发明的多连体可溶于选自由以下组成的组的溶剂中的至少任一种溶剂中:

a)选自由以下中的任何一种或多种组成的组的缓冲液:MES、Bis-tris甲烷、ADA、ACES、Bis-tris丙烷、PIPES、MOPSO、氯化氯胺(Cholamine chloride)、MOPS、BES、TES、HEPES、DIPSO、MOBS、乙酰氨基甘氨酸(Acetamidoglycine)、TAPSO、TEA、POPSO、HEPPSO、EPS、HEPPS、Tricine、Tris、甘氨酰胺、双甘氨肽、HEPBS、Bicine、TAPS、AMPB、CHES、AMP、AMPSOCAPSO、CAPS、CABS、Bicine、柠檬酸钠缓冲液、碳酸氢钠缓冲液、磷酸盐缓冲液、硼酸盐缓冲液,

任选地其中所述缓冲液包括一种或多种盐,任选地氯化钠和/或氯化钾,

任选地其中所述缓冲液的pH范围为3到10,任选地pH为7;

b)有机溶剂,任选地HFIP。

因此,在一个实施例中,所述多连体在高浓度下可溶于(任选地在至少20mg/ml,任选地至少30mg/ml,任选地至少40mg/ml,任选地至少50mg/ml,任选地至少60mg/ml,任选地至少70mg/ml,任选地至少80mg/ml,任选地至少90mg/ml,任选地至少100mg/ml,任选地至少120mg/ml,任选地至少130mg/ml,任选地至少150mg/ml,任选地至少170mg/ml,任选地至少190mg/ml,任选地至少200mg/ml,任选地至少250mg/ml,任选地至少300mg/ml,任选地至少350mg/ml,任选地至少400mg/ml的浓度下可溶于)以下中的任何一种或多种中:

a)选自由以下中的任何一种或多种组成的组的缓冲液:MES、Bis-tris甲烷、ADA、Bis-tris丙烷、PIPES、ACES、MOPSO、氯化氯胺、MOPS、BES、TES、HEPES、DIPSO、MOBS、乙酰氨基甘氨酸、TAPSO、TEA、POPSO、HEPPSO、EPS、HEPPS、Tricine、Tris、甘氨酰胺、双甘氨肽、HEPBS、Bicine、TAPS、AMPB、CHES、AMP、AMPSO CAPSO、CAPS、CABS、Bicine、柠檬酸钠缓冲液、碳酸氢钠缓冲液、磷酸盐缓冲液、硼酸盐缓冲液,

任选地其中所述缓冲液包括一种或多种盐,任选地氯化钠和/或氯化钾,

任选地其中所述缓冲液的pH范围为3到10,任选地pH为7;

b)有机溶剂,任选地HFIP。

为了将多连体纺丝成纤维,通常将溶解于如上文所描述的特定溶剂等特定溶剂中的多连体纺丝成反溶剂或凝结溶液,其中多连体不那么可溶并且因此将会沉淀。凝结纺丝是本领域的标准,并且简而言之涉及将纺丝溶液(原液)通过一到许多个(数千个)孔的纺丝板以限定单个股,然后将所述单个股固结、卷绕和处理(拉伸、退火、干燥、涂覆)以优化性能。技术人员将理解如何选择合适的凝结溶剂。例如,在将多连体溶解于水溶液中的情况下,凝结溶剂可以是乙醇。因此,在另一实施例中,根据本发明的多连体在高盐浓度下(例如,在高浓度的硫酸铵或来自已知为“盐析”蛋白质的霍夫梅斯特序列(Hofmeisterseries)的其它盐中)不溶于水溶液。另外一种方法可以是使用pH变化来使蛋白质凝结,例如已知蛋白质在蛋白质具有中性净电荷的等电点(pI)下是最不可溶的。另外一种方法可以是使用含有二价或三价阳离子的盐(例如,氯化钙)在水溶液中诱导蛋白质凝结。非水性凝结剂可以包含乙醇、甲醇、丙酮、丙醇、二乙醚或DMSO。另一种方法可以是含有上述方法的混合物的凝结溶液。技术人员将理解,如本发明的多连体和螺线管结构域等蛋白质可以通过各种因素变性,包含一些溶剂。认为重要的是多连体在纺丝之后保持其结构,尽管有可能容许一定程度的变性并且仍导致将多连体纺丝成纤维的能力。因此,技术人员将理解,原液溶剂和凝结溶剂应该被选择以使蛋白质变性最小化并在纺丝之前和之后两者使多连体的结构特征的保留最大化。可以通过包含所得纤维的X射线衍射研究的各种方法确认所期望的有序螺线管后纺丝的保留,如在实例中所示出的。

技术人员将理解,也可以通过不需要凝结溶液的蒸发(干法纺丝)、静电纺丝、溶液吹塑纺丝、离心力纺丝等来制备小直径长丝。

如上文所讨论的,β螺线管结构域以及因此多连体的净电荷被认为是β螺线管结构域或多连体形成溶致液晶中间相的能力的重要因素。增加表面电荷(即,高正电荷或高负电荷两者)提供了库仑排斥(Coulombic repulsion),所述库仑排斥有助于使多肽溶解在适用于凝结纺丝的方便的极性溶剂中。然后,根据翁萨格的排除体积理论(以及随后的延伸),溶解的(半)刚性β螺线管结构域或多连体能够形成旋转有序的液晶相。较高的表面电荷增加了杆状β螺线管或多连体的有效直径,从而调节介晶的纵横比和体积级分,并因此调节作为浓度的函数的相图。因此,浓度和纵横比的组合被认为在形成中间相中是重要的,所有这些对于技术人员而言都是显而易见的。大体积的柔性表面基团也可以通过空间稳定来增强溶解度。

因此认为通过控制β螺线管和多连体的表面化学性质,也可以控制纤维中的溶解度和侧向相互作用。

因此,在一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,本发明的多连体中的所述至少两个β螺线管结构域中的至少一个β螺线管结构域具有高净电荷,任选地具有至少+3电荷单位,任选地至少+5电荷单位,任选地至少+7电荷单位,任选地至少+10电荷单位,任选地至少+15电荷单位,任选地至少+20电荷单位,任选地至少+25电荷单位,任选地至少+30电荷单位,任选地至少+35电荷单位,任选地至少+40电荷单位,任选地至少+45电荷单位,任选地至少+50电荷单位,任选地至少+55电荷单位,任选地至少+60电荷单位,任选地至少+65电荷单位,任选地至少+70电荷单位,任选地至少+75电荷单位,任选地至少+80电荷单位,任选地至少+85电荷单位,任选地至少+90电荷单位,任选地至少+95电荷单位,任选地至少+100电荷单位的净电荷。

如将对于技术人员而言显而易见的是,本文提及的电荷单位是基本电荷单位(e),所述基本电荷单位是由单个

在另一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述至少两个β螺线管结构域中的两个β螺线管结构域具有高净电荷,任选地具有至少+3电荷单位,任选地至少+5电荷单位,任选地至少+7电荷单位,任选地至少+10电荷单位,任选地至少+15电荷单位,任选地至少+20电荷单位,任选地至少+25电荷单位,任选地至少+30电荷单位,任选地至少+35电荷单位,任选地至少+40电荷单位,任选地至少+45电荷单位,任选地至少+50电荷单位,任选地至少+55电荷单位,任选地至少+60电荷单位,任选地至少+65电荷单位,任选地至少+70电荷单位,任选地至少+75电荷单位,任选地至少+80电荷单位,任选地至少+85电荷单位,任选地至少+90电荷单位,任选地至少+95电荷单位,任选地至少+100电荷单位的净电荷。

在又另一实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述β螺线管结构域中的任何数量的β螺线管结构域或所有β螺线管结构域具有高净电荷,任选地具有至少+3电荷单位,任选地至少+5电荷单位,任选地至少+7电荷单位,任选地至少+10电荷单位,任选地至少+15电荷单位,任选地至少+20电荷单位,任选地至少+25电荷单位,任选地至少+30电荷单位,任选地至少+35电荷单位,任选地至少+40电荷单位,任选地至少+45电荷单位,任选地至少+50电荷单位,任选地至少+55电荷单位,任选地至少+60电荷单位,任选地至少+65电荷单位,任选地至少+70电荷单位,任选地至少+75电荷单位,任选地至少+80电荷单位,任选地至少+85电荷单位,任选地至少+90电荷单位,任选地至少+95电荷单位,任选地至少+100电荷单位的净电荷。

如上文所讨论的,β螺线管结构域还可以具有高负电荷。在多连体的一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述至少两个β螺线管结构域中的至少一个β螺线管结构域具有高净负电荷,任选地具有小于-3电荷单位,任选地小于-5电荷单位,任选地小于-7电荷单位,任选地小于-10电荷单位,任选地小于-15电荷单位,任选地小于-20电荷单位,任选地小于-25电荷单位,任选地小于-30电荷单位,任选地小于-35电荷单位,任选地小于-40电荷单位,任选地小于-45电荷单位,任选地小于-50电荷单位,任选地小于-55电荷单位,任选地小于-60电荷单位,任选地小于-65电荷单位,任选地小于-70电荷单位,任选地小于-75电荷单位,任选地小于-80电荷单位,任选地小于-85电荷单位,任选地小于-90电荷单位,任选地小于-95电荷单位,任选地小于-100电荷单位的净电荷。

在另一实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述至少两个β螺线管结构域中的两个β螺线管结构域具有高净负电荷,任选地具有小于-3电荷单位,任选地小于-5电荷单位,任选地小于-7电荷单位,任选地小于-10电荷单位,任选地小于-15电荷单位,任选地小于-20电荷单位,任选地小于-25电荷单位,任选地小于-30电荷单位,任选地小于-35电荷单位,任选地小于-40电荷单位,任选地小于-45电荷单位,任选地小于-50电荷单位,任选地小于-55电荷单位,任选地小于-60电荷单位,任选地小于-65电荷单位,任选地小于-70电荷单位,任选地小于-75电荷单位,任选地小于-80电荷单位,任选地小于-85电荷单位,任选地小于-90电荷单位,任选地小于-95电荷单位,任选地小于-100电荷单位的净电荷。

在又另一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述两个β螺线管结构域中的任何数量的β螺线管结构域或所有β螺线管结构域具有高净负电荷,任选地具有小于-3电荷单位,任选地小于-5电荷单位,任选地小于-7电荷单位,任选地小于-10电荷单位,任选地小于-15电荷单位,任选地小于-20电荷单位,任选地小于-25电荷单位,任选地小于-30电荷单位,任选地小于-35电荷单位,任选地小于-40电荷单位,任选地小于-45电荷单位,任选地小于-50电荷单位,任选地小于-55电荷单位,任选地小于-60电荷单位,任选地小于-65电荷单位,任选地小于-70电荷单位,任选地小于-75电荷单位,任选地小于-80电荷单位,任选地小于-85电荷单位,任选地小于-90电荷单位,任选地小于-95电荷单位,任选地小于-100电荷单位的净电荷。

上述实施例是指单个β螺线管结构域的净电荷。如果螺线管结构域具有高电荷,则因此多连体也将具有高电荷,所述电荷取决于单个β螺线管结构域的电荷和螺线管结构域的数量两者。因此,在一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述多连体具有高净电荷,任选地具有至少+3电荷单位,任选地至少+5电荷单位,任选地至少+7电荷单位,任选地至少+10电荷单位,任选地至少+15电荷单位,任选地至少+20电荷单位,任选地至少+25电荷单位,任选地至少+30电荷单位,任选地至少+35电荷单位,任选地至少+40电荷单位,任选地至少+45电荷单位,任选地至少+50电荷单位,任选地至少+55电荷单位,任选地至少+60电荷单位,任选地至少+65电荷单位,任选地至少+70电荷单位,任选地至少+75电荷单位,任选地至少+80电荷单位,任选地至少+85电荷单位,任选地至少+90电荷单位,任选地至少+95电荷单位,任选地至少+100电荷单位,任选地至少+200电荷单位,任选地至少+300电荷单位,任选地至少+400电荷单位,任选地至少+500电荷单位,任选地至少+600电荷单位,任选地至少+700电荷单位,任选地至少+800电荷单位,任选地至少+900电荷单位,任选地至少+1000电荷单位,任选地至少+2000电荷单位,任选地至少+3000电荷单位,任选地至少+4000电荷单位,任选地至少+5000电荷单位,任选地至少+6000电荷单位,任选地至少+7000电荷单位,任选地至少+8000电荷单位,任选地至少+9000电荷单位,任选地至少+10000电荷单位的净电荷。

在另一个实施例中,任选地在pH范围为3到10时,任选地在pH为7时,所述多连体具有高净负电荷,任选地具有小于-3电荷单位,任选地小于-5电荷单位,任选地小于-7电荷单位,任选地小于-10电荷单位,任选地小于-15电荷单位,任选地小于-20电荷单位,任选地小于-25电荷单位,任选地小于-30电荷单位,任选地小于-35电荷单位,任选地小于-40电荷单位,任选地小于-45电荷单位,任选地小于-50电荷单位,任选地小于-55电荷单位,任选地小于-60电荷单位,任选地小于-65电荷单位,任选地小于-70电荷单位,任选地小于-75电荷单位,任选地小于-80电荷单位,任选地小于-85电荷单位,任选地小于-90电荷单位,任选地小于-95电荷单位,任选地小于-100电荷单位,任选地小于-200电荷单位,任选地小于-300电荷单位,任选地小于-400电荷单位,任选地小于-500电荷单位,任选地小于-600电荷单位,任选地小于-700电荷单位,任选地小于-800电荷单位,任选地小于-900电荷单位,任选地小于-1000电荷单位,任选地小于-2000电荷单位,任选地小于-3000电荷单位,任选地小于-4000电荷单位,任选地小于-5000电荷单位,任选地小于-6000电荷单位,任选地小于-7000电荷单位,任选地小于-8000电荷单位,任选地小于-9000电荷单位,任选地小于-10000电荷单位的净电荷。

本发明的一个优点是可以通过生物技术手段,例如通过例如涉及微生物的使用的蛋白质表达系统来产生β螺线管结构域和多连体。这解决了例如依赖于使用节肢动物进行生产的现有技术的纤维的至少一个问题。因此,在一个实施例中,本发明的多连体能够由细胞或无细胞转录和翻译系统表达。

在这种实施例中,细胞可以是任何细胞,例如通常用于商业蛋白质表达系统或特别适合于表达本发明的多连体的细胞。所述细胞可以是原核细胞,任选地细菌细胞,任选地大肠杆菌(E.coli)细胞、枯草芽孢杆菌(Bacillus subtilis)细胞、巨大芽孢杆菌(Bacillus megaterium)细胞、需钠弧菌(Vibrio natriegens)细胞或荧光假单胞菌(Pseudomonas fluorescens)细胞。

所述细胞还可以是真核细胞,任选地酵母细胞,任选地毕赤酵母(Pichiapastoris)或酿酒酵母(Saccharomyces cerevisiae);或昆虫细胞,任选地感染杆状病毒的昆虫细胞;或哺乳动物细胞,任选地感染杆状病毒的哺乳动物细胞、HEK293细胞、HeLa细胞或CHO细胞。合适的表达系统对于技术人员将是已知的,并且没有理由假设任何系统不适合与本发明一起使用。

本发明的β螺线管结构域和多连体也可以通过无细胞表达系统表达,例如通过使用大肠杆菌裂解物或兔网织红细胞裂解物。

在一个实施例中,本发明的多连体包括根据SEQ ID NO:29-32和158-162的序列中的一个或多个序列或由其组成;或包括与SEQ ID NO:29-32和158-162中的任何一个或多个序列具有至少80%同源性,任选地至少85%同源性,任选地至少90%同源性,任选地至少95%同源性,任选地至少96%同源性,任选地至少97%同源性,任选地至少98%同源性,任选地至少99%同源性,任选地100%同源性的序列或由其组成。在另一个实施例中,本发明的多连体包括根据SEQ ID NO:29-32和158-162的序列中的一个或多个序列或由其组成;或包括与SEQ ID NO:29-32和158-162中的任何一个或多个序列具有至少80%序列同一性,任选地至少85%序列同一性,任选地至少90%序列同一性,任选地至少95%序列同一性,任选地至少96%序列同一性,任选地至少97%序列同一性,任选地至少98%序列同一性,任选地至少99%序列同一性,任选地100%序列同一性的序列或由其组成。

如从本文的公开内容中显而易见的和如在开头所讨论的,以及提供如上文所讨论的由β螺线管结构域构成的多连体,本发明还提供了β螺线管结构域本身。因此,本发明的第二方面提供了一种β螺线管结构域,其包括氨基酸序列,所述氨基酸序列包括共有基序的至少4个单元。对β螺线管结构域的特征的偏如上文在本发明的多连体的上下文中所讨论。

例如,本发明的β螺线管结构域优选地是如所讨论的杆状的,并且对纵横比的偏好如上所述。

类似地,对单元数量的偏好如上文所讨论,即例如,在一个实施例中,本发明的β螺线管结构域包括所述共有基序的4个到3000个单元。如上所述,单元可以连续或非连续布置,并且单元可以彼此相同或可以不彼此相同,再次如上文所讨论的。

上文还讨论了对共有基序和β螺线管横截面的偏好。

还优选的是,β螺线管结构域形成溶致液晶中间相。

再次,如关于多连体所述的,β螺线管结构域可以包括与SEQ ID NO:8-28或169的序列中的任何一个序列或由其组成,或与如先前所讨论的这些序列具有至少80%同源性或至少80%序列一致性的序列。然而,在一个实施例中,本发明的β螺线管结构域不包括SEQID NO:1、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64;和/或SEQ ID NO:66-80或由其组成。

如关于本发明的多连体所讨论的,本发明的β螺线管结构域也可以在第一端和/或第二端处包括一个或两个加帽序列。对加帽序列的偏好如先前所讨论。

如前所述,本发明的β螺线管结构域优选地包括隐藏长度,并且对此特征的偏好如上文所述。

本发明的β螺线管结构域的分子量可以为至少30kDa,任选地至少40kDa,任选地至少50kDa,任选地至少60kDa,任选地至少70kDa,任选地至少80kDa,任选地至少90kDa,任选地至少100kDa,任选地至少120kDa,任选地至少150kDa,任选地至少200kDa,任选地至少250kDa,任选地至少300kDa,任选地至少350kDa,任选地至少400kDa,任选地至少450kDa,任选地至少500kDa,任选地至少600kDa,任选地至少650kDa,任选地至少700kDa,任选地至少800kDa,任选地至少900kDa,任选地至少1000kDa;

任选地介于30kDa与1000kDa之间,如先前所讨论的。

对β螺线管结构域的溶解度的偏好类似于上文关于多连体所讨论的偏好。例如,本发明的β螺线管结构域可以在高浓度下是可溶的,任选地在至少20mg/ml,任选地至少30mg/ml,任选地至少40mg/ml,任选地至少50mg/ml,任选地至少60mg/ml,任选地至少70mg/ml,任选地至少80mg/ml,任选地至少90mg/ml,任选地至少100mg/ml,任选地至少120mg/ml,任选地至少130mg/ml,任选地至少150mg/ml,任选地至少170mg/ml,任选地至少190mg/ml,任选地至少200mg/ml,任选地至少250mg/ml,任选地至少300mg/ml,任选地至少350mg/ml,任选地至少400mg/ml的浓度下是可溶的,

任选地能够溶于选自由以下组成的组的溶剂中:

a)选自由以下中的任何一种或多种组成的组的缓冲液:MES、Bis-tris甲烷、ADA、ACES、Bis-tris丙烷、PIPES、MOPSO、氯化氯胺、MOPS、BES、TES、HEPES、DIPSO、MOBS、乙酰氨基甘氨酸、TAPSO、TEA、POPSO、HEPPSO、EPS、HEPPS、Tricine、Tris、甘氨酰胺、双甘氨肽、HEPBS、Bicine、TAPS、AMPB、CHES、AMP、AMPSO CAPSO、CAPS、CABS、Bicine、柠檬酸钠缓冲液、碳酸氢钠缓冲液、磷酸盐缓冲液、硼酸盐缓冲液,

任选地其中所述缓冲液包括一种或多种盐,任选地氯化钠和/或氯化钾,

任选地其中所述缓冲液的pH范围为3到10,任选地pH为7;

b)有机溶剂,任选地HFIP。

如先前所讨论的,β螺线管结构域优选地具有高净正电荷或高净负电荷。对β螺线管结构域的净电荷的偏好是如先前所讨论的。

如之前所讨论的,本发明的多连体和/或β螺线管结构域可以能够由细胞或无细胞转录和翻译系统表达。偏好如上所述。

多连体和/或β螺线管结构域两者可以包括一个或多个标记序列。因此,在本发明的任何方面的一个实施例中,多连体或β螺线管结构域可以包括一个或多个标签序列。标签序列是本领域熟知的,并且通常用于蛋白质纯化或可视化,例如在蛋白质印迹上或通过荧光显微术。有用的标签的实例包含但不限于白蛋白结合蛋白(ABP)、碱性磷酸酶(AP)、AU1表位、AU5表位、噬菌体T7表位(T7标签)、噬菌体V5表位(V5标签)、生物素-羧基载剂蛋白(BCCP)、蓝舌病毒标签(B标签)、钙调蛋白结合肽(CBP)、氯霉素乙酰转移酶(CAT)、纤维素结合结构域(CBP)、几丁质结合结构域(CBD)、胆碱-结合结构域(CBD)、二氢叶酸还原酶(DHFR)、E2表位、FLAG表位(DYKDDDDK)、半乳糖-结合蛋白(GBP)、绿色荧光蛋白(GFP)、Glu-Glu(EE标签)、谷胱甘肽S转移酶(GST)、人流感血凝素(HA)、

在一个实施例中,认为多连体和/或β螺线管结构域包括蛋白酶切割位点和/或纯化标签序列是有利的。

在实例中使用的标签序列是His标签,其还包括凝血酶切割位点[SEQ ID NO:33]。可以使用其它蛋白酶切割位点,例如TEV蛋白酶位点(ENLYFQS)。

为避免疑义,以下提供了本发明涵盖的β螺线管单元序列、加帽序列、标签序列和尾部序列的各种组合中的一些组合的实例。尾部序列是具有柔性结构的任选的亲水序列,所述亲水序列可以用于增加蛋白质溶解度和/或抑制结晶的目的。

在一个实施例中,β螺线管结构域可以被认为由以下组分中的所有组分或任何子集的不同组合组成:-标签序列(TAG)、N端帽序列(NCAP)、β螺线管序列,即包括共有基序的至少4个单元(UNITS)的序列、C端帽序列(CCAP);以及“尾部”序列(TAIL)。仅UNITS组分的存在被认为是必不可少的。

例如,在一个实施例中,β螺线管结构域包括所有TAG、NCAP、UNITS、CCAP和TAIL或由其组成。在其它实施例中,β螺线管结构域包括TAG、NCAP、UNITS和CCAP或由其组成,但不包括TAIL。在其它实施例中,β螺线管结构域包括NCAP、UNITS、CCAP和TAIL或由其组成,但不包括TAG。在另一实施例中,β螺线管结构域包括NCAP、UNITS和CCAP或由其组成,但不包括TAG和TAIL。在其它实施例中,β螺线管结构域包括TAG、UNITS、CCAP和TAIL或由其组成;或包括TAG、UNITS、CCAP或由其组成,并且不包括TAIL。进一步,β螺线管结构域可以包括TAG、NCAP、UNITS和TAIL或由其组成;或包括TAG、NCAP、UNITS或由其组成,并且不包括TAIL。在此还涵盖任何其它这种组合。认为UNITS组分对于本发明是必不可少的,并且β螺线管优选地包括NCAP和CCAP中的一个或多个或两个,或由其组成,尽管这不是必不可少的。TAG序列和TAIL序列被认为是任选的序列,以允许例如从例如培养基的细胞提取物中纯化β螺线管结构域。

β螺线管结构域可以包括以下组分中的每种组分中的任何数量的组分或由其组成。

因此,在一个实施例中,单个β螺线管结构域(其可以是或可以不是本发明的多连体的一部分)可以包括呈以下顺序的以下组分或由其组成:

TAG–NCAP–UNITS

其中n是至少4。

在另一实施例中,单个β结构域可以包括呈以下顺序的以下组分或由其组成:

TAG–NCAP–UNITS

其中n是至少4。

根据本发明的多连体可以包括呈以下顺序的以下组分或由其组成:

TAG–[NCAP–UNITS

TAG–[NCAP–UNITS

在其它实施例中,在最终CCAP组分与TAIL序列(如果存在)之间可能没有连接子序列:

TAG–[NCAP–UNITS

其中n是至少4,并且x是至少2。

在其它实施例中,TAG序列可以位于β螺线管结构域或多连体的C端处,例如:

NCAP–UNITS

NCAP–UNITS

其中n是至少4。

[NCAP–UNITS

[NCAP–UNITS

在其它实施例中,在最终CCAP组分与TAIL序列(如果存在)之间可能没有连接子序列:

[NCAP–UNITS

其中n是至少4,并且x是至少2。

在其它实施例中,可能不存在TAG,例如:

NCAP–UNITS

NCAP–UNITS

其中n是至少4。

[NCAP–UNITS

[NCAP–UNITS

在其它实施例中,在最终CCAP组分与TAIL序列(如果存在)之间可能没有连接子序列:

[NCAP–UNITS

其中n是至少4,并且x是至少2。

在其它实施例中,可能不存在NCAP和/或CCAP,例如:

UNITS

UNITS

NCAP-UNITS

NCAP-UNITS

UNITS

UNITS

UNITS

其中n是至少4。

[UNITS

[UNITS

[UNITS

[UNITS

[UNITS

[NCAP–UNITS

[NCAP–UNITS

[NCAP–UNITS

[NCAP–UNITS

[NCAP–UNITS

[UNITS

[UNITS

[UNITS

[UNITS

[UNITS

NCAP–[UNITS

NCAP–[UNITS

NCAP–[UNITS

NCAP–[UNITS

NCAP–[UNITS

(即,其中仅NCAP在第一UNIT上的变体)例如。

其中n是至少4,并且x是至少2。

在一些实施例中,帽序列(NCAP和/或CCAP)存在于所有β螺线管结构域上。在其它实施例中,帽序列(NCAP和/或CCAP)仅存在于所述β螺线管结构域中的一些β螺线管结构域上。

TAIL序列的一个实例是KSDDG。TAIL序列的优选特征是所述序列应在1-10个残基之间,所述残基选自由带电荷的极性的甘氨酸和丙氨酸残基组成的组。在其它实施例中,TAIL序列可以与LINKER序列相同。

TAIL序列被认为是任选的特征。因此,在一个实施例中,β螺线管结构域包括TAIL序列。在另一个实施例中,β螺线管结构域不包括TAIL序列。

NCAP、UNITS、LINKER、CCAP、TAIL和TAG的存在、不存在以及任何数量的所有组合和排列都被考虑并包含在本发明中,尽管UNITS的存在被认为是必不可少的。

在一些实施例中,本发明的β螺线管结构域或本发明的多连体包括选自以下列表的螺线管结构域(UNITS)序列、N端帽序列、C端帽序列和TAIL序列:

在具体实例中,本发明的单个β螺线管结构域或本发明的多连体包括以下序列的组合(例如,SEQ ID NO:1、2、3和81;SEQ ID NO:8、84、105和126,例如):

本文还提供了包括本发明的多连体和/或本发明的β螺线管结构域的组合物。

所述组合物可以包括浓度为至少20mg/ml,任选地至少30mg/ml,任选地至少40mg/ml,任选地至少50mg/ml,任选地至少60mg/ml,任选地至少70mg/ml,任选地至少80mg/ml,任选地至少90mg/ml,任选地至少100mg/ml,任选地至少120mg/ml,任选地至少130mg/ml,任选地至少150mg/ml,任选地至少170mg/ml,任选地至少190mg/ml,任选地至少200mg/ml,任选地至少250mg/ml,任选地至少300mg/ml,任选地至少350mg/ml,任选地至少400mg/ml的多连体和/或β螺线管结构域。

优选地,所述组合物包括处于非变性状态的多连体或β螺线管结构域。技术人员将能够选择合适的溶剂。这种溶剂可以包含,例如:

a)选自由以下中的任何一种或多种组成的组的缓冲液:MES、Bis-tris甲烷、ADA、ACES、Bis-tris丙烷、PIPES、MOPSO、氯化氯胺、MOPS、BES、TES、HEPES、DIPSO、MOBS、乙酰氨基甘氨酸、TAPSO、TEA、POPSO、HEPPSO、EPS、HEPPS、Tricine、Tris、甘氨酰胺、双甘氨肽、HEPBS、Bicine、TAPS、AMPB、CHES、AMP、AMPSO CAPSO、CAPS、CABS、Bicine、柠檬酸钠缓冲液、碳酸氢钠缓冲液、磷酸盐缓冲液、硼酸盐缓冲液,

任选地其中所述缓冲液包括一种或多种盐,任选地氯化钠和/或氯化钾,

任选地其中所述缓冲液的pH范围为3到10,任选地pH为7;

b)有机溶剂,任选地HFIP。

在优选的实例中,多连体和/或β螺线管结构域用于纺丝成纤维,其中这种纺丝涉及挤出到凝结溶剂中。因此,在优选的实施例中,所述组合物不包括溶剂,在所述溶剂中多连体和/或β螺线管结构域是不溶的,例如在一个实施例中,不包括乙醇、丙醇、丙酮、二乙醚或DMSO。对溶剂的偏好如上文所讨论。

如将理解的,由于本发明的多连体和β螺线管结构域由一系列氨基酸制成,因此其能够由核酸编码。因此,本发明提供了编码本文所描述的本发明的任何β螺线管结构域或多连体的核酸,例如具有和不具有标签序列,具有和不具有加帽序列等。

类似地,本发明提供了包括上文所描述的核酸的载体。技术人员将理解术语载体的含义,并且通常用于指质粒,但是其它核酸载体是已知的,其可以是单链或双链的,并且可以是例如DNA或RNA。

本发明还保护了包括上文所描述的核酸和/或载体的宿主细胞。在一个实施例中,所述宿主细胞是以下中的任何一种:

a)原核细胞,任选地细菌细胞,任选地大肠杆菌细胞、枯草芽孢杆菌细胞、巨大芽孢杆菌细胞、需钠弧菌细胞或荧光假单胞菌细胞;或

b)真核细胞,任选地

酵母细胞,任选地毕赤酵母或酿酒酵母;

昆虫细胞,任选地感染杆状病毒的昆虫细胞;或

哺乳动物细胞,任选地感染杆状病毒的哺乳动物细胞、HEK293细胞、HeLa细胞或CHO细胞。

如先前所讨论的,本发明的多连体和β螺线管结构域适用于形成具有特别有益性质的纤维。因此,本发明的另一方面提供了一种包括根据本发明的多连体或根据本发明的β螺线管结构域的纤维。上文描述的所有偏好在此也适用。

本发明的纤维可以通过任何手段制成。通常,所述纤维可以通过本领域熟知的湿法纺丝方法(wet-spinning method)来制成,例如在芳族聚酰胺领域中。

有利地,在一个实施例中,本发明的纤维的平均直径介于100nm与100um之间,任选地介于500nm与50um之间,任选地介于1000nm与40um之间,任选地介于2.5um与35um之间,任选地介于5um与30um之间,任选地介于7.5um与25um之间,任选地介于10um与20um之间。

在一个实施例中,本发明的纤维可以具有有利的拉伸弹性,例如所述纤维的杨氏模量(Young's modulus)可以介于0.5GPa与200GPa之间,任选地介于1.0GPa与175GPa之间,任选地介于2GPa与150GPa之间,任选地介于5.0GPa与125GPa之间,任选地介于10.0GPa与100.0GPa之间,任选地介于15.0GPa与90.0Gpa之间,任选地介于20.0Gpa与80.0Gpa之间,任选地介于25.0Gpa与75.0Gpa之间,任选地介于30.0Gpa与70.0Gpa之间,任选地介于35.0Gpa与60.0Gpa之间,任选地介于40.0Gpa与50.0Gpa之间。

在另一个实施例中,本发明的纤维的杨氏模量可以为至少0.5GPa、1.0GPa、2GPa、5.0GPa、10.0GPa、15.0GPa、20.0GPa、25.0GPa、30.0GPa、35.0GPa、40.0GPa、50.0GPa、60.0GPa、70.0GPa、75.0GPa、80.0GPa、90.0GPa、100.0GPa、125GPa、150GPa、175GPa或至少200GPa。

在另一实施例中,本发明的纤维的工程化强度可以:

介于0.1GPa与3GPa之间,任选地介于0.2GPa与2.8GPa之间,任选地介于0.3GPa与2.6GPa之间,任选地介于0.4GPa与2.4GPa之间,任选地介于0.5GPa与2.2GPa之间,任选地介于0.6GPa与2.0Gpa之间,任选地介于0.7GPa与1.8GPa之间,任选地介于0.8GPa与1.6GPa之间,任选地介于0.9GPa与1.4GPa之间,任选地介于1.0GPa与1.2GPa之间;和/或

为至少0.1GPa,任选地至少0.2GPa,任选地至少0.3GPa,任选地至少0.4GPa,任选地至少0.5GPa,任选地至少0.6GPa,任选地至少0.7GPa,任选地至少0.8GPa,任选地至少0.9GPa,任选地至少1.0GPa,任选地至少1.1GPa,任选地至少1.2GPa,任选地至少1.3GPa,任选地至少1.4GPa,任选地至少1.5GPa,任选地至少1.6GPa,任选地至少1.7GPa,任选地至少1.8GPa,任选地至少1.9GPa,任选地至少2.0GPa,任选地至少2.1GPa,任选地至少2.2GPa,任选地至少2.3GPa,任选地至少2.4GPa,任选地至少2.5GPa,任选地至少2.6GPa,任选地至少2.7GPa,任选地至少2.8GPa,任选地至少2.9GPa,任选地至少3.0GPa。

此外,在另一个实施例中,本发明的纤维的失效应变可以介于2%与300%之间,任选地介于5%与275%之间,任选地介于10%与250%之间,任选地介于15%与225%之间,任选地介于20%与200%之间,任选地介于25%与175%之间,任选地介于30%与150%之间,任选地介于35%与125%之间,任选地介于40%与100%之间,任选地介于45%与80%之间,任选地介于50%与75%之间,任选地介于55%与70%之间。

在另一个实施例中,本发明的纤维的失效应变可以为至少2%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%、100%、125%、150%、175%、200%、225%、250%、275%或至少300%。

在一个实施例中,认为本发明的纤维的韧性为至少10J/g,任选地至少20J/g,任选地至少40J/g,任选地至少60J/g,任选地至少80J/g,任选地至少100J/g,任选地至少120J/g,任选地至少140J/g,任选地至少160J/g,任选地至少180J/g,任选地至少200J/g,任选地至少250J/g,任选地至少300J/g,任选地至少350J/g,任选地至少400J/g,任选地至少450J/g,任选地至少500J/g,任选地至少550J/g,任选地至少600J/g,任选地至少650J/g,任选地至少700J/g,任选地至少750J/g,任选地至少800J/g,任选地至少850J/g,任选地至少900J/g,任选地至少950J/g,任选地至少1000J/g。

本发明的纤维可以通过将本发明的多连体纺丝成或通过将本发明的多连体组合成纤维来制成。在一个实施例中,纤维中的多连体是相同的,即所述纤维包括相同氨基酸序列的多连体。在其它实施例中,所述纤维包括不同的多连体,即包括具有不同的氨基酸序列的多连体,例如包括具有至少2个不同的氨基酸序列,例如至少3个或至少4个或至少5个或至少6个或至少7个或至少8个或至少9个或至少10个不同的氨基酸序列的多连体。例如,具有不同横截面形状的β螺线管结构域可以在单个多连体内连接。认为多连体的各种组合产生具有不同性质的纤维。

技术人员将理解,本发明的纤维可以用于形成纱线。因此,本发明还提供了包括本发明的纤维的纱线。在另一实施例中,本发明的纱线包括本发明的至少两种不同的纤维,即包括多连体的不同组合的至少两种纤维。

本发明还提供一种包括根据本发明的多连体、根据本发明的β螺线管结构域、根据本发明的纤维或根据本发明的纱线的纺织品或织物。所述纺织品或织物可以是织造的或非织造的,并且也可以在上浆(sizing)中进行涂覆。

考虑到本发明的纤维、纱线和纺织品的有利性质,如强度和拉伸弹性,本发明的产品被认为适合于许多应用。例如,本发明的一些示例性应用是在以下各项的生产中:

运动服(例如,用于防护用途,如防晒服);用于摩托车手和/或其它摩托车运动的防护服;个人防护设备(例如,排雷服、士兵防护内衣);爆炸安全壳(blast containment);叶片安全壳(blade containment)(例如,用于飞机发动机);用于降落伞的纺织品;绳索;用于服装的纺织品;用于鞋类的纺织品;等。

本发明的纤维、纱线、织物和纺织品也被认为具有许多医疗应用,所述医疗应用包含:普通医用纺织品;伤口敷料;可再吸收和不可再吸收的外科手术缝合线;可再吸收和不可再吸收的支架;用于外科手术的导丝(包含适用于MRI的非金属导丝);用于植入式医疗装置的生物相容性涂层;外科手术网;用于3D组织工程的支架等。

本说明书中对显然在前公开的文件的列举或讨论不应必然地被视为是承认所述文件是现有技术的一部分或是公知常识。

除非上下文另外指示,否则本发明的给定方面、特征或参数的偏好和选项应该被视为已经与本发明的所有其它方面、特征和参数的任何和所有偏好和选项结合而公开。例如,本发明提供了一种由β螺线管结构域构成的多连体,其中β螺线管结构域包括7个共有序列单元,并且其中β螺线管结构域仅在N端处包括加帽序列。本发明还提供了一种由20个β螺线管结构域构成的多连体,其中每个β螺线管结构域包括20个共有序列单元,其中每个共有序列单元具有不同的氨基酸序列,并且其中每个β螺线管结构域在所述20个β螺线管结构域中的每个β螺线管结构域的两个端处包括加帽序列,并且其中所述多连体在N端处包括His标签。本发明还提供了一种由β螺线管结构域构成的多连体,其中所述多连体能够形成溶致液晶中间相,并且其中所述多连体的纵横比为1:8并且净正电荷为+200电荷单位。类似地,本发明提供了一种由包括根据本发明的纤维的织物制成的服装的物品,其中所述纤维包括由20个β螺线管结构域构成的多连体,其中每个β螺线管结构域包括20个共有序列单元,其中每个共有序列单元具有不同的氨基酸序列,并且其中每个β螺线管结构域在所述20个β螺线管结构域中的每个β螺线管结构域的两个端处包括加帽序列,并且其中所述多连体在N端处包括His标签。

阴影=N端帽

斜体=C端帽

粗体=尾部序列

小写字母=His标签和凝血酶蛋白酶序列

SynRFR24.新_帽螺线管结构域UNITSn[SEQ ID NO:1]

加帽序列1SynRFR24.新_帽[SEQ ID NO:2]

RMRRDEILEEYRRGRRNFQHINLQEIELTN

加帽序列2SynRFR24.新_帽[SEQ ID NO:3]

SynRFR24.1螺线管结构域[SEQ ID NO:1]

加帽序列1原始SynRFR24.1[SEQ ID NO:4]

HMNVGEILRHYAAGKRNFQHINLQEIELTN

加帽序列2原始SynRFR24.1[SEQ ID NO:5]

>SynRFR24.新_帽螺线管结构域加上两个帽加上his标签[SEQ ID NO:6]

>SynRFR24.1螺线管结构域加上两个帽加上his标签[SEQ ID NO:7]

mgsshhhhhhssglvprgsHMNVGEILRHYAAGKRNFQHINLQEIELTN

另外的螺线管结构域序列:

[SEQ ID NO:8]

>rfr_ref_minprep_ren_neg_num_20_0004UNITSn

AKLAKANLSNANLKKARLQNANLANAKLQNANLENANLAGANLKKANLRGANLHGADLAGANLKGADLREADLRNADLRKANLTGAKLKNAKLEGANLADATLKDANLHGAKLKNANLARANLERADLRNADLTG

[SEQ ID NO:9]

>rfr_ref_minprep_ren_neg_num_21_0003UNITSn

AKLAGADLSNAKLHNANLENADLKGANLAGANLQKANLHGADLTNADLRKANLANANLANANLEGARLADADLRNADLRGAKLKRADLENADLTGANLKGANLEGARLERANLKKARLQNAKLAGADLRNARLAG

[SEQ ID NO:10]

>rfr_ref_minprep_ren_neg_num_22_0001UNITSn

ATLAGANLTGAKLHNARLENADLKDAKLARANLQKANLRGANLRNADLREADLANANLARADLTGAKLADADLRNADLREANLKNANLARANLKGANLHGANLHGARLEKANLENANLQNANLQNANLANADLRG

[SEQ ID NO:11]

>rfr_ref_minprep_ren_neg_num_23_0004UNITSn

AKLAGADLSNADLRNANLQNANLANANLENADLENADLKGARLENANLRRANLRGANLAEARLEKADLRNANLANADLRRANLRNAELQNADLQGANLEGADLTGANLKGAKLKNANLQNARLAKADLRNADLTG

[SEQ ID NO:12]

>rfr_ref_minprep_ren_neg_num_24_0002UNITSn

AELAGANLAGANLKNANLRNANLKDADLRKANLQKADLKGANLQNARLQGANLENANLAGARLQGANLAKADLRGADLRNANLTNARLEKADLTDADLHGARLQGADLHGANLERARLQNANLAEADLRNANLTG

[SEQ ID NO:13]

>rfr_ref_minprep_ren_neg_num_25_0003 UNITSn

ATLAGADLSNANLKQADLARANLKDANLQNANLKNAKLEGANLAKANLEKANLHGANLARADLTGANLANAKLENADLRKADLTNADLTNADLRGADLEGANLHGANLKGANLRKAKLKRAELQNADLRNADLTG

[SEQ ID NO:14]

>rfr_ref_minprep_ren_neg_num_26_0004 UNITSn

ATLAGAKLRNANLHNARLQNANLANADLQQADLEEANLHGANLANANLEEANLRRADLANADLTGANLANADLRQADLRGANLRNARLQKANLADADLHGADLHGANLEGANLRRARLENAKLANADLRNADLKG

[SEQ ID NO:15]

>rfr_ref_minprep_ren_neg_num_27_0004 UNITSn

ATLAGADLSKANLHRADLKNANLKGANLEKADLREADLHGADLTNANLHGARLARADLANANLKGADLANADLREANLHGADLTNARLQNARLQDADLHGANLTGARLHGADLTNARLQRADLSKADLRNANLEG

[SEQ ID NO:16]

>rfr_ref_minprep_ren_neg_num_28_0002 UNITSn

ATLAGADLRNANLKNANLQKANLANANLRNANLQGADLAKARLENADLHGARLAKANLAGANLHGADLANADLRNANLRNADLRNARLERADLAGADLEGANLHGANLREARLENANLKRANLQNANLANADLTG

[SEQ ID NO:17]

>rfr_ref_minprep_ren_neg_num_29_0005 UNITSn

ATLAGAKLEGADLTRAKLKDANLAKANLRNANLQEANLKGANLRNADLAGANLERANLAKADLHGANLANADLREADLRNANLDNADLRNADLTGADLEGASLHGANLKKARLENARLRRARLENANLAKANLTG

[SEQ ID NO:18]

>rfr_ref_minprep_ren_neg_num_30_0005 UNITSn

ATLAGADLSGADLHNADLQNAKLKGANLEKARLRRANLRGADLTNANLRGADLEEADLAGARLHGANLARARLANADLRNADLRNANLREADLTGANLHGANLHGADLERANLTNADLENARLERANLAEANLQD

[SEQ ID NO:19]

>rfr_ref_minprep_ren_neg_num_31_0005 UNITSn

ATLKGANLQDANLQEANLQNANLQGARLSNADLRRADLEGANLENADLSGARLQEANLAGARLEGADLADADLRGADLRNADLTNARLERANLADADLHGADLHGAKLHGANLERARLENARLENADLRNAKLAG

[SEQ ID NO:20]

>rfr_ref_minprep_ren_neg_num_32_0001 UNITSn

ATLAGADLSNANLENADLQNADLANAKLQNANLARANLHGADLRNADLEGADLAEANLANANLEGADLANADLRNADLRGANLTNARLQNANLTGANLRGANLHGADLHGAKLRKADLEKARLENADLRKADLKG

[SEQ ID NO:21]

>rfr_ref_minprep_ren_neg_num_33_0004 UNITSn

AKLAGADLRDADLQRANLENADLANAKLKNANLEQANLEGANLENANLAKADLRNANLARADLTGADLSNADLRGADLRKANLTNADLTNADLEGADLTDARLQGANLHGANLTNANLARANLAGADLRNAKLSG

[SEQ ID NO:22]

>rfr_ref_minprep_ren_neg_num_34_0001 UNITSn

ATLSGAKLEGANLKRADLRNANLSKADLRNANLQQANLQGADLENADLQGANLEEANLAKANLTGANLSNADLRKADLRNANLKDADLENADLEGANLHGADLHGAKLHGADLTRADLENARLENADLRNARLNG

[SEQ ID NO:23]

>rfr_ref_minprep_ren_neg_num_35_0005 UNITSn

AELAGADLANANLHRANLENANLANAKLEEANLEEANLAGADLRNANLQRANLARADLAGADLTGANLAEADLREARLQKANLENADLTNADLTGADLEGARLHGANLEGANLTNANLRKANLENADLRNADLTG

[SEQ ID NO:24]

>rfr_ref_minprep_ren_neg_num_36_0005 UNITSn

AELAGADLSGADLTRADLRDANLANADLQEANLAEAKLQGANLENANLARADLSRANLAGADLHGANLAEADLRNADLRNANLQNADLRKARLQGADLEGANLEGANLHGADLENADLARADLQKADLRNANLTG

[SEQ ID NO:25]

>rfr_ref_minprep_ren_neg_num_37_0002 UNITSn

ATLADADLSDARLHRADLQDADLENANLENADLSEANLRGADLRNANLRKADLARADLAGANLHGADLANAKLAEADLRDADLRNANLENADLTGANLQGARLEGAKLHGANLTNANLKDADLSGADLRDANLTG

[SEQ ID NO:26]

>rfr_ref_minprep_ren_neg_num_38_0005 UNITSn

ATLKGANLQGARLHNADLEEAELKDANLAEADLQNANLRRADLTNADLANANLHGANLAEANLHGANLAGADLRNADLENADLRNANLEDADLKGANLHGANLQGANLEGARLQNANLKNARLAEADLRNADLKG

[SEQ ID NO:27]

>rfr_ref_minprep_ren_neg_num_39_0003 UNITSn

AELAGADLSNADLRNAKLENANLADANLENADLENANLRGADLENADLRRADLHGADLAKANLEGANLAEADLRNADLRNANLTNADLKNADLEGADLHGARLEGANLEGANLENADLANADLSDADLRKADLTG

[SEQ ID NO:28]

>rfr_ref_minprep_ren_neg_num_40_0004 UNITSn

AELAGADLSDANLEQANLQNANLANANLENANLQDADLHGARLQNADLRGANLEDADLANARLEGANLAEADLRRADLRGADLTNADLEDADLEGANLHGARLEGANLRGANLTDARLENADLSGADLRNANLEG

[SEQ ID NO:169]

AELAGADLANANLHRANLENANLANAKLEEANLEEANLAGADLRNANLQRANLARADLAGADLTGANLAEADLREARLQSANLENADLTNADLTGADLEGARLHGANLEGANLTNANLRKANLENADLRNADLTG

>SynRFR24.新_帽.x4.1不包含N端His标签的由四个β螺线管结构域构成的多连体[SEQ ID NO:29]

>SynRFR24.新_帽.x4.1包含N端His标签的由四个β螺线管结构域构成的多连体[SEQ ID NO:30]

>SynRFR24.新_帽.x8.1不包含N端His标签的由八个β螺线管结构域构成的多连体[SEQ ID NO:31]

>SynRFR24.新_帽.x8.1包含N端His标签的由八个β螺线管结构域构成的多连体[SEQ ID NO:32]

His标签+蛋白酶位点[SEQ ID NO:33]

mgsshhhhhhssglvprgs

连接子序列

GGGS[SEQ ID NO:34]

GGGSAAAAAAGGGS[SEQ ID NO:168]

编码SynRFT24.1两个加帽序列加上His标签的核酸[SEQ ID NO:35]

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCATGAAGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAACCTGAAAGATGCTAATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGATCTGCAGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGAGCGAAGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:36]-synRFR24.2

[SEQ ID NO:37]编码synRFR24.2的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCATGAAGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAACCTGAAAGATGCTAATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGATCTGCAGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGAGCGAAGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCTAGCCTCCATGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:38]-synRFR20.1

[SEQ ID NO:39]–编码synRFR20.1的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCATGAAGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAACCTGAAAGATGCTAATCTGTCTGATGCCAACCTGGAACAGGCAAATCTGAATAATGCGAACCTGAGCGAAGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:40]-synRFR28.1

[SEQ ID NO:41]

–编码synRFR28.1的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCATGAAGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAACCTGAAAGATGCTAATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGATCTGCAGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCGGACCTCAACGGTGCCGATTTAAAACAGGCTGATTTATCTGGAGCAGATTTAGGTGGCGCAAATCTGAATAATGCGAACCTGAGCGAAGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:42]-synRFR24.t754

[SEQ ID NO:43]–编码synRFR24.t754的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGAAAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGAACCTGGCGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGCAGCTGGGCGGCTGGAGCGATAACGGCGAAACCGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGATCTGTATGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:44]-synRFR24.t801

[SEQ ID NO:45]-编码synRFR24.t801的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGCGCGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGATTGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGCAGCTGGGCCTGGGCGTGGAAGATGGCGGCCTGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTAACCTGGCGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATTATGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:46]-synRFR24.t1117

[SEQ ID NO:47]-编码synRFR24.t1117的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGCGCGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGGTGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGCAGCTGGGCGGCGTGTATCGCCTGGGCGAACCGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTAACCTGATGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATTATGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:48]-synRFR24.t1166

[SEQ ID NO:49]–编码synRFR24.t1166的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCGCGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAAACTGGGCACCTGGAGCAGCAGCGGCCTGACCGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGATCTGAAAGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATTATGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:50]-synRFR24.t1428

[SEQ ID NO:51]–编码synRFR24.t1428的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGAACCTGGTGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGATGCTGGGCCAGACCTATCCGTGGGGCACCGTGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGGTGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:52]-synRFR24.t1555

[SEQ ID NO:53]–编码synRFR24.t1555的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGGCGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGATGCTGGGCAAAGATGAAGATGGCGTGGTGTATGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGGTGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:54]-synRFR24.t1916

[SEQ ID NO:55]–编码synRFR24.t1916的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGCTGCTGACCGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGTGGCTGGGCCGCGATCCGCGCCTGGGCCTGAGCGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGAAAGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:56]-synRFR24.t2570

[SEQ ID NO:57]–编码synRFR24.t2570的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGAAAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGAACCTGGCGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGGATCTGGGCGGCCCGCCGGATGAAGGCAAAACCGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGTATGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATTATGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:58]-synRFR24.t3280

[SEQ ID NO:59]-编码synRFR24.t3280的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGAGCGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGGATCTGCGCGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAAACTGGGCGGCTATGATGATGAAGGCCTGGGCGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTGAACTGTTTGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAAAGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:60]-synRFR24.t3284

[SEQ ID NO:61]编码synRFR24.t3284的核酸

ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGGAAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGCGCCTGGCGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGAACCTGGGCGGCCCGCCGGATGATGGCGATCCGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTAACCTGGCGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:62]-synRFR24.t1428 sfGFP

[SEQ ID NO:63]-编码synRFR24.t1428 sfGFP的核酸ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGAACCTGGTGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGATGCTGGGCCAGACCTATCCGGGAGGTGGAGGCTCAATGCGTAAAGGCGAAGAGCTGTTCACTGGTGTCGTCCCTATTCTGGTGGAACTGGATGGTGATGTCAACGGTCATAAGTTTTCCGTGCGTGGCGAGGGTGAAGGTGACGCAACTAATGGTAAACTGACGCTGAAGTTCATCTGTACTACTGGTAAACTGCCGGTACCTTGGCCGACTCTGGTAACGACGCTGACTTATGGTGTTCAGTGCTTTGCTCGTTATCCGGACCATATGAAGCAGCATGACTTCTTCAAGTCCGCCATGCCGGAAGGCTATGTGCAGGAACGCACGATTTCCTTTAAGGATGACGGCACGTACAAAACGCGTGCGGAAGTGAAATTTGAAGGCGATACCCTGGTAAACCGCATTGAGCTGAAAGGCATTGACTTTAAAGAAGACGGCAATATCCTGGGCCATAAGCTGGAATACAATTTTAACAGCCACAATGTTTACATCACCGCCGATAAACAAAAAAATGGCATTAAAGCGAATTTTAAAATTCGCCACAACGTGGAGGATGGCAGCGTGCAGCTGGCTGATCACTACCAGCAAAACACTCCAATCGGTGATGGTCCTGTTCTGCTGCCAGACAATCACTATCTGAGCACGCAAAGCGTTCTGTCTAAAGATCCGAACGAGAAACGCGATCATATGGTTCTGCTGGAGTTCGTAACCGCAGCGGGCATCACGCATGGTATGGATGAACTGTCTGGAGGCGGTGGATGGGGCACCGTGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGGTGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

[SEQ ID NO:64]-synRFR24.t1428 sfGFPmut

[SEQ ID NO:65]–编码synRFR24.t1428 sfGFPmut的核酸ATGGGTAGCAGCCATCATCATCATCACCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCACATGAATGTTGGTGAAATTCTGCGTCATTATGCAGCAGGTAAACGCAATTTTCAGCATATTAACCTGCAAGAAATTGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCAAATCTGAGCCGTGCCAATCTGCGTTCTGCAGACCTGCGTAATGCCAATCTGTCACATGCGAATCTGTCAGGTGCAAATCTGGAAGAAGCCAATCTGGAAGCCGCTAATCTGCGTGGTGCGAACCTGGTGGGCGCGAATCTGAGTGGCGCTGATCTGCAAGAGGCAAATCTGACCCAGGCGATGCTGGGCCAGACCTATCCGGGAGGTGGAGGCTCAATGCGTAAAGGCGAAGAGCTGTTCACTGGTGTCGTCCCTATTCTGGTGGAACTGGATGGTGATGTCAACGGTCATAAGTTTTCCGTGCGTGGCGAGGGTGAAGGTGACGCAACTAATGGTAAACTGACGCTGAAGTTCATCTGTACTACTGGTAAACTGCCGGTACCTTGGCCGACTCTGGTAACGACGCTGACTTATGGTGTTCAGTGCTTTGCTCGTTATCCGGACCATATGAAGCAGCATGACTTCTTCAAGTCCGCCATGCCGGAAGGCTATGTGCAGGAACGCACGATTTCCTTTAAGGATGACGGCACGTACAAAACGCGTGCGGAAGTGAAATTTGAAGGCGATACCCTGGTAAACCGCATTGAGCTGAAAGGCATTGACTTTAAAGAAGACGGCAATATCCTGGGCCATAAGCTGGAATACAATTTTAACAGCCACAATGTTTACATCACCGCCGATAAACAAAAAAATGGCATTAAAGCGAATTTTAAAATTCGCCACAACGTGGAGGATGGCAGCGTGCAGCTGGCTGATCACTACCAGCAAAACACTCCAATCGGTGATGGTCCTGTTCTGCTGCCAGACAATCACTATCTGAGCACGCAAAGCGTTCTGTCTAAAGATCCGAACGAGAAACGCGATCATATGGTTCTGCTGGAGTTCGTAACCGCAGCGGGCATCACGCATGGTATGGATGAACTGTCTGGAGGCGGTGGAGCTGGCACCGTGGGCGCTGATCTGTCTGATGCCAACCTGGAACAGGCAGATCTGGCAGGGGCTCAGCTGGTGGGTGCAGTTCTGGACGGTGCTAATCTGCATGGCGCAAATCTGAATAATGCGAACCTGGATAACGCAATGCTGACCCGTGCGAATCTGGAGCAGGCCGACCTGAGCGGTGCACGTACCACCGGTGCACGTCTGGATGATGCCGACCTGCGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGGTTGGTGCACGTGTTGATGTTGATCAGGCAGTTGCATTTGCAGCAGCACATGGTCTGTGTCTGGCAGGTGGATCCGGCTGCTAA

synRFR24.2[SEQ ID NO:66]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLHEANLSGADLQEANLTQANLKDANLSDANLEQADLAGADLQGAVLDGANLHGANLNNANLSEAMLTRANLEQ

synRFR20.1[SEQ ID NO:67]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLHEANLSGADLQEANLTQANLKDANLSDANLEQANLNNANLSEAMLTRANLEQ

synRFR28.1[SEQ ID NO:68]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLHEANLSGADLQEANLTQANLKDANLSDANLEQADLAGADLQGAVLDGANLHGADLNGADLKQADLSGADLGGANLNNANLSEAMLTRANLEQ

synRFR24.t764[SEQ ID NO:69]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLKGANLEEANLEAANLRGANLAGANLSGADLQEANLTQAQLGGWSDNGETGADLSDANLEQADLAGADLYGAVLDGANLHGANLNNANLDNAMLTRANLEQ

synRFR24.t801[SEQ ID NO:70]的螺线管结构域序列

synRFR24.t1117[SEQ ID NO:71]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLRGANLEEANLEAANLRGADLVGANLSGADLQEANLTQAQLGGVYRLGEPGADLSDANLEQADLAGANLMGAVLDGANLHGANLNNANLDYAMLTRANLEQ

synRFR24.t1166[SEQ ID NO:72]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLRGANLSGADLQEANLTQAKLGTWSSSGLTGADLSDANLEQADLAGADLKGAVLDGANLHGANLNNANLDYAMLTRANLEQ

synRFR24.t1428[SEQ ID NO:73]的螺线管结构域序列

synRFR24.t1555[SEQ ID NO:74]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLAGANLSGADLQEANLTQAMLGKDEDGVVYGADLSDANLEQADLAGAQLVGAVLDGANLHGANLNNANLDNAMLTRANLEQ

synRFR24.t1916[SEQ ID NO:75]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGALLTGANLSGADLQEANLTQAWLGRDPRLGLSGADLSDANLEQADLAGAQLKGAVLDGANLHGANLNNANLDNAMLTRANLEQ

synRFR24.t2570[SEQ ID NO:76]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLKGANLEEANLEAANLRGANLAGANLSGADLQEANLTQADLGGPPDEGKTGADLSDANLEQADLAGAQLYGAVLDGANLHGANLNNANLDYAMLTRANLEQ

synRFR24.t3280[SEQ ID NO:77]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLSGANLEEANLEAANLRGADLRGANLSGADLQEANLTQAKLGGYDDEGLGGADLSDANLEQADLAGAELFGAVLDGANLHGANLNNANLDKAMLTRANLEQ

synRFR24.t3284[SEQ ID NO:78]的螺线管结构域序列

ANLHHANLSRANLRSADLRNANLSHANLEGANLEEANLEAANLRGARLAGANLSGADLQEANLTQANLGGPPDDGDPGADLSDANLEQADLAGANLAGAVLDGANLHGANLNNANLDNAMLTRANLEQ

synRFR24.t1428.sfGFP[SEQ ID NO:79]的螺线管结构域序列

synRFR24.t1428.sfGFP[SEQ ID NO:80]的螺线管结构域序列

尾部序列[SEQ ID NO:81]

N端加帽共有序列[SEQ ID NO:82]

xMxxxxILxxYxxGxxxFxxIxLxx(I/A)xLxx

其中x是任何残基;

C端加帽共有序列[SEQ I NO:83]

Ax(T/L/F)xxAx(L/F)xxAx(L/F)xxAxVxPVLWxxAxLxGAx(M/V)xxxxxxx(Y/F)xxAxx

其中x是任何残基。

>rfr_ref_minprep_ren_neg_num_20_0004.pdb NCAP[SEQ ID NO:84]

SMGKNEILNQYKNGRHDFSGINLAKADLEN

>rfr_ref_minprep_ren_neg_num_21_0003.pdb NCAP[SEQ ID NO:85]

TMQTKQILKEYKKGRTNFSGINLANANLKN

>rfr_ref_minprep_ren_neg_num_22_0001.pdb NCAP[SEQ ID NO:86]

TMRTKDILKQYNNGRHNFSGIDLANADLEK

>rfr_ref_minprep_ren_neg_num_23_0004.pdb NCAP[SEQ ID NO:87]

TMQTNQILKEYKNGRHNFSKINLANANLQN

>rfr_ref_minprep_ren_neg_num_24_0002.pdb NCAP[SEQ ID NO:88]

SMGTKEILNEYKKGRKKFANINLANADLSN

>rfr_ref_minprep_ren_neg_num_25_0003.pdb NCAP[SEQ ID NO:89]

TMRRDDILREYNNGRHNFSGINLAKADLRD

>rfr_ref_minprep_ren_neg_num_26_0004.pdb NCAP[SEQ ID NO:90]

NMKTNKILKNYKKGRHDFTGIDLANADLEN

>rfr_ref_minprep_ren_neg_num_27_0004.pdb NCAP[SEQ ID NO:91]

SMQADQILQQYDNGRRNFSGIDLENADLRN

>rfr_ref_minprep_ren_neg_num_28_0002.pdb NCAP[SEQ ID NO:92]

TMRTNEILQEYKNGRHNFEGIDLANANLQN

>rfr_ref_minprep_ren_neg_num_29_0005.pdb NCAP[SEQ ID NO:93]

SMHASEILQEYDNGRHDFRGIKLEDADLSG

>rfr_ref_minprep_ren_neg_num_30_0005.pdb NCAP[SEQ ID NO:94]

TMRTKDILKEYNKGRHDFSGINLRNANLRN

>rfr_ref_minprep_ren_neg_num_31_0005.pdb NCAP[SEQ ID NO:95]

HMQTNQILEEYNRGRHNFAGIDLQGADLRN

>rfr_ref_minprep_ren_neg_num_32_0001.pdb NCAP[SEQ ID NO:96]

TMSTNEILNEYKKGRHDFSGINLKDADLSN

>rfr_ref_minprep_ren_neg_num_33_0004.pdb NCAP[SEQ ID NO:97]

SMTTDKILEEYNKGRTDFRDIDLQNANLQN

>rfr_ref_minprep_ren_neg_num_34_0001.pdb NCAP[SEQ ID NO:98]

SMHASKILQEYNNGRHDFANIDLAKANLEN

>rfr_ref_minprep_ren_neg_num_35_0005.pdb NCAP[SEQ ID NO:99]

SMQTEQILQEYNRGRTDFAKIDLENANLKN

>rfr_ref_minprep_ren_neg_num_36_0005.pdb NCAP[SEQ ID NO:100]

TMATDKILQQYKDGQHDFSGIDLANADLSK

>rfr_ref_minprep_ren_neg_num_37_0002.pdb NCAP[SEQ ID NO:101]

SMQTNQILKEYNKGRHNFSGIDLQNADLSG

>rfr_ref_minprep_ren_neg_num_38_0005.pdb NCAP[SEQ ID NO:102]

TMGTNEILQQYKNGQHDFADIDLKNANLQK

>rfr_ref_minprep_ren_neg_num_39_0003.pdb NCAP[SEQ ID NO:103]

SMSANAILEAYDRGQRDFSKINLANANLSK

>rfr_ref_minprep_ren_neg_num_40_0004.pdb NCAP[SEQ ID NO:104]

SMHEDEILDEYNNGRKNFSGIDLQGADLED

CCAP序列:

>rfr_ref_minprep_ren_neg_num_20_0004.pdb CCAP[SEQ ID NO:105]

AKTKGANLRKANLEGAKLDPVLWRTANLKGARMSKKQAQEYQRANG

>rfr_ref_minprep_ren_neg_num_21_0003.pdb CCAP[SEQ ID NO:106]

ADTRGANLDDAKLEGAELRPVLWRTASLSGARMSKKQKQQYQRANG

>rfr_ref_minprep_ren_neg_num_22_0001.pdb CCAP[SEQ ID NO:107]

AKTTGANLKRANLKGATLDPVLWRTANLEGAKMKKEQKKEYKRARG

>rfr_ref_minprep_ren_neg_num_23_0004.pdb CCAP[SEQ ID NO:108]

AKTTGAELRNADLRGAKLDPVLWRTAKLTGAQMTKKQKKEYQRARG

>rfr_ref_minprep_ren_neg_num_24_0002.pdb CCAP[SEQ ID NO:109]

AKTKGADLARADLRGAKLRPVLWNTARLEGAQMTKEQKKEYQRANG

>rfr_ref_minprep_ren_neg_num_25_0003.pdb CCAP[SEQ ID NO:110]

AETTGAKLARADLRGAKLRPVLWNTATLTGAQMTTKQKQQYKRANG

>rfr_ref_minprep_ren_neg_num_26_0004.pdb CCAP[SEQ ID NO:111]

AKTKGAKLSGADLRGAKLDPVLWNTAKLQGAKMTDNQRNEYKRANG

>rfr_ref_minprep_ren_neg_num_27_0004.pdb CCAP[SEQ ID NO:112]

ANTQGAKLDNADLRGAKLRPVLWNTASLQGAKMQKKQKEQYKRAKG

>rfr_ref_minprep_ren_neg_num_28_0002.pdb CCAP[SEQ ID NO:113]

AETEGADLRRADLRGATLDPVLWNKADLKGAQMKDNQRKEYKRANG

>rfr_ref_minprep_ren_neg_num_29_0005.pdb CCAP[SEQ ID NO:114]

ANTQDANLQNADLRGATLDPVLWNTANLNGAQMTDKQKQEYQRANG

>rfr_ref_minprep_ren_neg_num_30_0005.pdb CCAP[SEQ ID NO:115]

AETTGAKLDNADLRGAKLDPVLWNTASLSGAQMTTAQAEQYERANG

>rfr_ref_minprep_ren_neg_num_31_0005.pdb CCAP[SEQ ID NO:116]

AKTTGADLANADLRGATLDPVLWRTARLTGAQMKTEQKNQYKRANG

>rfr_ref_minprep_ren_neg_num_32_0001.pdb CCAP[SEQ ID NO:117]

ADTRGADLRNANLRGATLDPVLWNTADLTGAQMEAEQKKEYNRARG

>rfr_ref_minprep_ren_neg_num_33_0004.pdb CCAP[SEQ ID NO:118]

ANTSGADLRNADLRGATLDPVLWNTANLKGAKMEDNQKAEYERANG

>rfr_ref_minprep_ren_neg_num_34_0001.pdb CCAP[SEQ ID NO:119]

ANTSGADLENADLRGAELQPVLWRTARLQGAQMETAQKEEYKRANG

>rfr_ref_minprep_ren_neg_num_35_0005.pdb CCAP[SEQ ID NO:120]

ANTKGANLDNADLRGATLDPVLWRTASLQGAKMTTRQAEEYDRARG

>rfr_ref_minprep_ren_neg_num_36_0005.pdb CCAP[SEQ ID NO:121]

AETTGANLNNADLRGATLDPVLWNTASLEGAQMKKEQKKEYKRANG

>rfr_ref_minprep_ren_neg_num_37_0002.pdb CCAP[SEQ ID NO:122]

ANTQGANLDNADLRGATLDPVLWNTASLEGAQMTTEEAKEYQRANG

>rfr_ref_minprep_ren_neg_num_38_0005.pdb CCAP[SEQ ID NO:123]

AETEGAELNDADLRGAELAPVLWNTASLEGAKMEEKQEQQYDRARG

>rfr_ref_minprep_ren_neg_num_39_0003.pdb CCAP[SEQ ID NO:124]

AETTGADLNNADLRGATLDPVLWNTAKLQGAQMTTNQKAEYQRANG

>rfr_ref_minprep_ren_neg_num_40_0004.pdb CCAP[SEQ ID NO:125]

ANTRGARLQDADLRGAKLRPVLWNTANLEGAQMQTNQKAEYQRANG

>rfr_ref_minprep_ren_neg_num_20_0004.pdb TAIL[SEQ ID NO:126]

KQTEG

>rfr_ref_minprep_ren_neg_num_21_0003.pdb TAIL[SEQ ID NO:127]

KQTKG

>rfr_ref_minprep_ren_neg_num_22_0001.pdb TAIL[SEQ ID NO:128]

QQTNG

>rfr_ref_minprep_ren_neg_num_23_0004.pdb TAIL[SEQ ID NO:129]

KTTEG

>rfr_ref_minprep_ren_neg_num_24_0002.pdb TAIL[SEQ ID NO:130]

QQDNG

>rfr_ref_minprep_ren_neg_num_25_0003.pdb TAIL[SEQ ID NO:131]

QQDEG

>rfr_ref_minprep_ren_neg_num_26_0004.pdb TAIL[SEQ ID NO:132]

QKDNG

>rfr_ref_minprep_ren_neg_num_27_0004.pdb TAIL[SEQ ID NO:133]

KQDNG

>rfr_ref_minprep_ren_neg_num_28_0002.pdb TAIL[SEQ ID NO:134]

QEDKG

>rfr_ref_minprep_ren_neg_num_29_0005.pdb TAIL[SEQ ID NO:135]

RKTNG

>rfr_ref_minprep_ren_neg_num_30_0005.pdb TAIL[SEQ ID NO:136]

KSTDG

>rfr_ref_minprep_ren_neg_num_31_0005.pdb TAIL[SEQ ID NO:137]

QKDNG

>rfr_ref_minprep_ren_neg_num_32_0001.pdb TAIL[SEQ ID NO:138]

QETRG

>rfr_ref_minprep_ren_neg_num_33_0004.pdb TAIL[SEQ ID NO:139]

QQDKG

>rfr_ref_minprep_ren_neg_num_34_0001.pdb TAIL[SEQ ID NO:140]

QSDDG

>rfr_ref_minprep_ren_neg_num_35_0005.pdb TAIL[SEQ ID NO:141]

QEDKG

>rfr_ref_minprep_ren_neg_num_36_0005.pdb TAIL[SEQ ID NO:142]

QSDDG

>rfr_ref_minprep_ren_neg_num_37_0002.pdb TAIL[SEQ ID NO:143]

KEDRG

>rfr_ref_minprep_ren_neg_num_38_0005.pdb TAIL[SEQ ID NO:144]

QSDDG

>rfr_ref_minprep_ren_neg_num_39_0003.pdb TAIL[SEQ ID NO:145]

QSDDG

>rfr_ref_minprep_ren_neg_num_40_0004.pdb TAIL[SEQ ID NO:146]

QQTNG

AX

其中X

X

X

AX

其中X

X

X

AX

其中X

X

X

AX

其中X

X

X

A(N/D)L*X[SEQ ID NO:151]

其中*是极性残基(C、R、H、K、D、E、S、T、N、Q),并且X是任何残基;

(S/G/T/A)X(A/V/G)X(G/A)XX[SEQ ID NO:152]

其中X是任何残基;

(S/G/T/A)X(A/V/G)X(G/A)XX(S/G/T/A)*(A/V/G)*(G/A)XX[SEQ ID NO:153]

其中*是疏水残基,并且其中X是任何残基;

SXAXGXXS*A*GXX[SEQ ID NO:154]

其中*是疏水残基,并且其中X是任何残基;

NXAXGXXST(I/V)(G/A)GGXX[SEQ ID NO:155]

其中X是任何残基;

NXAXGXXSTIGGGXX[SEQ ID NO:156]

其中X是任何残基;

GXQX(V/I/L)XXGGXAXXTX(V/I/L)XXG[SEQ ID NO:157]

其中X是任何残基。

>SynRFR24.nnum35.x4[氨基酸序列][SEQ ID NO:158]

其中:

aelagadlananlhranlenanlanakleeanleeanlagadlrnanlqranlaradlagadltganlaeadlrearlqkanlenadltnadltgadlegarlhganleganltnanlrkanlenadlrnadltg–螺线管结构域序列[SEQ ID NO:23]>rfr_ref_minprep_ren_neg_num_35_0005UNITSn

>SynRFR24.nnum36.x4[氨基酸序列][SEQ ID NO:159]

其中:

aelagadlsgadltradlrdanlanadlqeanlaeaklqganlenanlaradlsranlagadlhganlaeadlrnadlrnanlqnadlrkarlqgadleganleganlhgadlenadlaradlqkadlrnanltg–螺线管结构域序列[SEQ ID NO:24]>rfr_ref_minprep_ren_neg_num_36_0005UNITSn

gggs

>SynRFR24.nnum40.x4[氨基酸序列][SEQ ID NO:160]

其中:

MGSSHHHHHHSSGLVPRGS

aelagadlsdanleqanlqnanlananlenanlqdadlhgarlqnadlrganledadlanarleganlaeadlrradlrgadltnadledadleganlhgarleganlrganltdarlenadlsgadlrnanleg–螺线管结构域序列[SEQ ID NO:28]>rfr_ref_minprep_ren_neg_num_40_0004UNITSn

gggs

>SynRFR24.nnum35.nc.ll.x4.K129S[氨基酸序列][SEQ ID NO:161]

其中:

MGSSHHHHHHSSGLVPRGS

aelagadlananlhranlenanlanakleeanleeanlagadlrnanlqranlaradlagadltganlaeadlrearlqsanlenadltnadltgadlegarlhganleganltnanlrkanlenadlrnadltg–4个螺线管结构域序列中的1个螺线管结构域序列[SEQ ID NO:169]

aelagadlananlhranlenanlanakleeanleeanlagadlrnanlqranlaradlagadltganlaeadlrear lqkanlenadltnadltgadlegarlhganleganltnanlrkanlenadlrnadltg–4个螺线管结构域序列中的2个螺线管结构域序列、3个螺线管结构域序列和4个螺线管结构域序列[SEQ ID NO:23]>rfr_ref_minprep_ren_neg_num_35_0005UNITSn

gggsaaaaaagggs

>SynRFR24.nnum36.nc.x4[氨基酸序列][SEQ ID NO:162]

其中:

aelagadlsgadltradlrdanlanadlqeanlaeaklqganlenanlaradlsranlagadlhganlaeadlrnadlrnanlqnadlrkarlqgadleganleganlhgadlenadlaradlqkadlrnanltg–螺线管结构域序列[SEQ ID NO:24]>rfr_ref_minprep_ren_neg_num_36_0005UNITSn

gggs

>SynRFR24.nnum36.nc.x4[DNA序列][SEQ ID NO:163]

ATGGGTAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCGTATGCGTCGTGATGAAATTCTGGAAGAATATCGTCGTGGTCGTCGTAACTTTCAGCATATTAATCTGCAAGAAATCGAACTGACCAATGCAGAACTGGCAGGCGCAGATCTGAGCGGTGCCGATCTGACCCGTGCGGATCTGCGTGATGCAAATCTGGCAAACGCAGACCTGCAAGAAGCCAATCTGGCCGAAGCAAAACTGCAGGGTGCGAATCTGGAAAATGCCAACCTGGCTCGTGCTGATCTGTCACGTGCTAATTTAGCCGGTGCCGACCTGCATGGTGCAAACCTGGCGGAAGCCGATCTGCGCAATGCGGATTTACGTAATGCCAATCTGCAGAATGCGGACCTGCGTAAAGCACGTCTGCAAGGGGCAGATCTGGAAGGTGCTAACCTGGAAGGCGCAAATTTACATGGTGCAGATTTAGAAAACGCCGATCTGGCTCGCGCAGATTTACAGAAAGCTGATCTGCGTAACGCGAATCTGACCGGTGCACGTACCACCGGTGCGCGTCTGGATGATGCCGATTTACGCGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGCGTGGTGCCAAAATGGAAGAAGAACAGCGTCGCGAATATGAACGTGCCCGTGGTGGTGGCGGTTCTCGCATGCGTAGAGATGAAATCTTAGAAGAGTACCGTCGCGGACGTCGCAATTTTCAACATATCAACTTACAAGAGATCGAGCTGACAAACGCCGAATTAGCGGGTGCTGATTTAAGCGGAGCGGATTTAACACGTGCAGACTTACGTGATGCGAACCTGGCCAATGCCGATCTTCAAGAAGCAAATTTAGCAGAGGCCAAATTACAGGGTGCCAACCTTGAAAACGCTAATCTTGCGCGTGCAGACCTGAGTCGTGCTAACCTTGCCGGTGCAGATCTTCACGGTGCCAATCTTGCGGAGGCTGACCTGCGGAATGCAGACCTTCGCAACGCGAACCTGCAAAACGCGGATCTTCGCAAAGCTCGCCTGCAAGGTGCCGACTTAGAAGGTGCGAATTTAGAGGGTGCTAATCTTCATGGTGCGGACCTTGAGAACGCGGATTTAGCTAGAGCTGATCTTCAGAAAGCCGACTTACGCAATGCAAATTTAACAGGCGCTCGCACCACAGGTGCACGCTTAGATGACGCTGATTTGCGTGGCGCTACAGTTGACCCTGTGCTGTGGCGCACAGCCAGCTTACGTGGCGCTAAGATGGAAGAGGAACAACGCCGTGAGTACGAACGTGCACGCGGTGGCGGTGGCAGTCGGATGCGTCGGGACGAGATTTTAGAGGAATACCGTAGAGGTCGCAGAAATTTTCAGCACATAAACCTTCAAGAAATTGAGCTTACGAATGCGGAACTTGCTGGGGCTGATCTGAGTGGGGCAGACTTAACTAGAGCCGACCTTCGTGATGCCAATTTAGCGAACGCCGATTTGCAAGAGGCGAATTTGGCGGAGGCGAAACTTCAAGGTGCAAACTTAGAGAATGCGAACTTAGCAAGAGCGGATCTGAGTCGCGCAAATCTTGCTGGCGCAGACTTGCATGGTGCCAATTTGGCAGAGGCAGATCTTCGTAACGCTGATTTACGGAACGCAAATCTTCAGAACGCAGATTTGCGGAAAGCACGCCTTCAGGGTGCTGATCTTGAGGGTGCAAATTTGGAAGGGGCAAACTTGCACGGTGCTGACTTGGAGAACGCTGACCTGGCACGAGCGGACTTGCAGAAAGCAGACCTGAGAAATGCAAATCTGACTGGCGCACGCACAACTGGCGCTCGTTTAGATGATGCGGACTTAAGAGGTGCCACAGTAGATCCGGTTTTATGGCGCACGGCATCATTACGGGGAGCAAAAATGGAAGAGGAGCAAAGACGTGAATATGAGCGTGCTCGCGGAGGTGGTGGCTCCCGCATGCGACGCGACGAGATCCTTGAAGAGTATCGCAGAGGCCGTCGGAATTTCCAACACATTAACCTGCAAGAGATAGAGTTAACTAATGCCGAGCTTGCTGGTGCCGATTTATCTGGTGCGGATTTGACTCGAGCGGACCTTCGGGACGCAAACCTTGCGAATGCTGATTTACAAGAAGCTAACCTGGCTGAGGCCAAGCTGCAAGGCGCTAATTTGGAAAATGCGAATCTTGCACGGGCAGATTTATCAAGAGCCAACCTTGCTGGGGCAGATTTACATGGGGCTAATCTGGCTGAAGCTGACCTTCGTAATGCTGATCTTAGAAATGCAAACCTGCAGAACGCTGACTTACGTAAAGCCCGTTTGCAGGGTGCAGACCTTGAAGGCGCTAACTTAGAGGGTGCCAACTTACATGGCGCAGATCTTGAGAATGCAGATCTGGCAAGAGCCGATCTGCAAAAGGCCGATCTGAGAAACGCCAACCTGACAGGTGCTAGAACCACGGGTGCTCGCCTGGACGATGCAGACCTGCGTGGCGCAACCGTAGATCCAGTACTTTGGAGAACCGCATCTCTTCGCGGAGCCAAGATGGAGGAGGAGCAGCGAAGAGAATATGAAAGAGCACGCGGTCAGTCAGATGATGGTTAA

>SynRFR24.nnum35.nc.ll.x4.K129S[DNA序列][SEQ ID NO:164]

ATGGGTAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCGTATGCGTCGTGATGAAATTCTGGAAGAATATCGTCGTGGTCGTCGTAACTTTCAGCATATTAATCTGCAAGAAATCGAACTGACCAATGCAGAACTGGCAGGCGCAGATCTGGCAAATGCAAATCTGCATCGTGCCAATCTGGAAAATGCCAACCTGGCCAATGCGAAACTGGAAGAAGCAAATCTGGAAGAGGCCAATCTTGCCGGTGCCGATCTGCGTAACGCCAACCTGCAGCGTGCAAACCTGGCACGTGCGGATTTAGCGGGTGCAGATCTGACCGGTGCGAATCTGGCCGAAGCGGATCTGCGTGAAGCACGTCTGCAGAGTGCGAACCTGGAAAACGCCGATCTGACTAATGCGGACCTGACAGGTGCCGACCTGGAAGGTGCCCGTCTGCATGGTGCAAATTTAGAAGGCGCAAATCTGACCAACGCCAATCTGCGCAAAGCCAATTTGGAGAATGCAGACCTGCGTAATGCTGATTTAACCGGTGCACGTACCACCGGTGCGCGTCTGGATGATGCCGATTTACGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGCGTGGTGCCAAAATGGAAGAAGAACAGCGTCGCGAATATGAACGTGCCCGTGGTGGTGGCGGTAGCGCAGCTGCAGCAGCAGCCGGTGGTGGTTCTCGCATGCGTAGAGATGAAATCTTAGAAGAGTACCGTCGCGGACGTCGCAATTTTCAACATATCAACTTACAAGAGATCGAGCTGACAAACGCCGAATTAGCTGGCGCAGATTTAGCGAATGCCAACTTACATCGTGCGAACTTAGAAAATGCTAATCTGGCGAACGCCAAATTAGAAGAAGCTAACTTAGAAGAGGCGAACCTTGCGGGTGCTGATTTACGTAATGCGAATCTGCAACGCGCAAATCTTGCTCGTGCGGATCTTGCAGGGGCTGATCTTACAGGTGCTAACCTGGCGGAAGCAGACTTACGCGAGGCTCGTTTACAGAAAGCTAATCTTGAGAATGCTGATCTGACAAATGCCGATCTTACCGGTGCAGACTTAGAAGGTGCACGCTTACATGGCGCAAACCTTGAAGGTGCGAACCTGACGAACGCAAATTTAAGAAAAGCGAATTTAGAAAATGCGGACCTGCGCAACGCAGACCTGACGGGTGCGCGTACCACAGGCGCACGCTTAGATGATGCAGATCTTCGCGGTGCCACAGTGGACCCTGTGCTGTGGCGCACAGCCTCACTGAGAGGCGCTAAGATGGAAGAGGAACAACGCCGTGAGTACGAACGTGCACGCGGTGGCGGTGGTTCAGCAGCAGCTGCCGCAGCAGGTGGAGGTTCACGTATGCGACGCGACGAAATTTTAGAGGAATATAGACGCGGTCGCCGTAATTTCCAGCACATCAACCTTCAAGAAATTGAGTTAACAAATGCGGAGTTAGCCGGTGCGGACCTGGCCAACGCTAATCTTCACCGTGCTAATTTAGAGAACGCGAATTTAGCTAACGCCAAACTTGAGGAAGCCAATCTTGAAGAAGCAAACTTGGCTGGTGCGGACTTACGCAACGCAAACTTACAACGAGCCAATTTAGCACGTGCCGACCTTGCTGGTGCAGACCTTACAGGGGCAAATTTGGCGGAGGCTGATCTGCGCGAGGCAAGACTGCAAAAAGCAAACTTAGAGAATGCCGACTTAACCAATGCGGATTTAACAGGGGCAGACCTTGAAGGCGCACGCCTGCACGGTGCCAACTTAGAGGGTGCCAACCTTACAAACGCGAATCTTCGTAAAGCGAACCTTGAGAACGCGGATTTACGCAATGCCGATCTGACAGGCGCACGTACAACAGGTGCACGCCTGGACGACGCCGACCTGCGTGGCGCTACAGTTGATCCTGTGTTATGGCGTACAGCGAGCTTACGCGGAGCAAAAATGGAAGAGGAGCAAAGACGTGAATATGAGCGTGCTCGCGGAGGTGGTGGCTCTGCAGCCGCAGCAGCGGCAGGCGGTGGAAGTAGAATGCGTCGGGACGAAATCCTTGAGGAATACCGACGTGGCAGACGGAACTTTCAACACATAAACCTGCAAGAGATAGAACTTACGAACGCGGAGCTTGCAGGCGCAGACCTTGCGAACGCTAACCTTCATAGAGCAAACTTGGAAAACGCGAACTTAGCCAATGCAAAATTAGAAGAGGCAAATTTAGAAGAAGCCAACCTGGCCGGCGCAGATCTTCGTAATGCTAATTTACAGCGTGCCAATCTTGCACGCGCTGACTTAGCCGGTGCAGATTTAACTGGGGCAAATCTTGCCGAAGCAGATTTAAGAGAAGCTCGCCTTCAGAAAGCCAACTTAGAAAACGCAGATTTAACCAACGCAGATCTTACTGGCGCTGATTTGGAGGGTGCTAGATTACACGGTGCAAACCTGGAAGGCGCAAACCTTACTAATGCTAACCTGCGTAAGGCTAATCTGGAAAACGCTGACCTGCGTAACGCGGATCTTACGGGTGCTCGCACCACGGGTGCCAGACTGGATGACGCTGATCTTCGGGGAGCGACAGTAGATCCAGTTCTTTGGCGCACGGCCAGTTTACGGGGTGCAAAGATGGAGGAAGAGCAGCGAAGAGAATATGAAAGAGCACGCGGTCAAGAAGATAAAGGCTAA

>SynRFR24.nnum35.x4[DNA序列][SEQ ID NO:165]

ATGGGCAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCAGCATGCAGACCGAGCAGATTCTGCAAGAATATAATCGTGGTCGTACCGATTTCGCCAAAATTGATCTGGAAAATGCCAATCTGAAAAACGCAGAACTGGCAGGCGCAGATCTGGCCAATGCAAATCTGCATCGTGCAAACCTGGAAAACGCGAACCTGGCGAATGCCAAACTGGAAGAAGCGAATCTGGAAGAGGCCAACCTTGCCGGTGCCGATCTGCGTAATGCCAACCTGCAGCGTGCTAATCTGGCACGTGCGGATTTAGCGGGTGCAGATCTGACCGGTGCTAACCTGGCCGAAGCGGATCTGCGTGAAGCACGTCTGCAGAAAGCAAATTTAGAAAATGCGGATCTGACCAACGCCGATTTAACCGGTGCGGACCTGGAAGGTGCCCGTCTGCATGGTGCCAATTTAGAAGGCGCAAATCTGACAAATGCGAACCTGCGTAAGGCAAATCTTGAAAACGCTGATTTACGTAACGCCGATCTGACTGGCGCAAATACCAAAGGTGCCAATCTTGATAATGCAGACCTGCGTGGTGCAACCTTAGATCCGGTTCTGTGGCGTACCGCAAGCCTGCAGGGTGCAAAAATGACCACACGTCAGGCCGAAGAATATGACCGTGCACGCGGTGGTGGTGGTTCAAGTATGCAGACAGAACAAATCCTTCAAGAGTACAATCGCGGTCGCACAGACTTTGCAAAAATTGATTTAGAGAACGCCAACCTGAAGAATGCAGAATTAGCTGGTGCCGACCTGGCTAACGCGAATTTACATAGAGCCAACTTAGAGAATGCGAATCTTGCAAATGCCAAATTAGAGGAAGCAAACTTAGAAGAGGCAAATCTTGCTGGTGCAGATTTACGTAATGCAAATTTACAGCGTGCAAATTTAGCCCGTGCTGATCTTGCGGGTGCTGACTTAACAGGGGCAAATCTGGCGGAAGCCGATTTACGCGAGGCTCGTTTACAGAAAGCGAACCTTGAGAACGCGGACCTGACAAACGCGGATCTTACAGGTGCAGACTTAGAAGGTGCACGCTTACATGGCGCTAATCTTGAAGGTGCGAACCTTACCAACGCCAATCTGCGCAAGGCGAACTTGGAGAATGCTGATCTGCGCAATGCTGACCTGACAGGTGCCAACACAAAGGGTGCGAACTTAGATAACGCAGATCTTCGCGGTGCCACACTGGACCCTGTGCTGTGGCGCACAGCCTCATTACAGGGTGCCAAGATGACAACTCGCCAAGCAGAAGAATACGATCGCGCACGTGGCGGTGGCGGTAGCTCAATGCAAACCGAACAAATTTTACAAGAGTATAACAGAGGCCGTACCGACTTTGCGAAGATCGACCTTGAAAATGCTAACCTTAAAAATGCCGAGTTAGCTGGCGCTGACTTAGCAAACGCTAACTTACATCGAGCTAATTTGGAGAACGCTAATTTAGCCAACGCGAAACTTGAGGAAGCTAACCTTGAAGAGGCGAACCTGGCTGGCGCAGACCTGCGCAATGCCAATCTTCAACGTGCGAATTTAGCTCGCGCAGATTTAGCAGGGGCTGACCTTACGGGTGCGAATCTGGCTGAGGCCGATCTTCGTGAGGCAAGACTGCAAAAAGCTAATCTGGAAAACGCCGACCTGACCAATGCGGACTTGACTGGGGCAGACCTTGAAGGCGCTCGCCTGCATGGCGCAAACTTGGAGGGTGCTAATTTGACTAACGCAAACTTACGCAAAGCCAACTTGGAAAACGCAGACTTGCGTAATGCGGATTTGACAGGTGCGAATACGAAAGGCGCTAACCTGGATAATGCCGACTTACGCGGTGCTACCCTTGATCCGGTGTTATGGCGCACCGCGTCACTTCAAGGGGCTAAAATGACAACCAGACAGGCGGAAGAGTACGATAGAGCCCGTGGTGGCGGAGGTTCATCTATGCAAACTGAGCAGATCTTACAAGAATACAACCGAGGACGCACGGATTTTGCTAAAATCGATCTTGAGAACGCAAATCTTAAGAATGCCGAACTTGCCGGTGCTGATTTAGCTAATGCTAATCTTCATAGAGCCAACCTTGAAAACGCCAATCTGGCCAACGCAAAATTAGAAGAAGCCAACCTGGAAGAGGCTAATCTTGCAGGGGCTGATCTGCGGAACGCGAATCTGCAACGCGCAAACTTAGCGCGTGCCGACTTAGCTGGTGCGGATTTAACTGGTGCCAACCTTGCGGAAGCCGACCTGCGCGAGGCACGCCTTCAAAAAGCGAACCTGGAAAATGCGGATTTAACCAATGCAGATCTGACAGGGGCTGATTTGGAAGGCGCAAGACTGCATGGTGCGAATCTTGAGGGTGCAAACTTGACCAATGCAAACCTGCGCAAAGCTAACCTTGAGAATGCAGATCTTCGTAATGCCGATTTAACGGGTGCAAACACAAAAGGTGCAAATCTGGACAACGCGGATCTTCGTGGTGCGACATTAGATCCTGTTTTATGGCGGACAGCATCTCTGCAAGGTGCGAAGATGACGACCCGTCAAGCGGAAGAGTACGACCGTGCACGTGGTCAAGAAGATAAAGGTTAA

>SynRFR24.nnum36.x4[DNA序列][SEQ ID NO:166]

ATGGGCAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCACCATGGCAACCGATAAAATTCTGCAGCAGTATAAAGATGGCCAGCATGATTTTAGCGGTATTGATCTGGCAAATGCAGATCTGAGCAAAGCCGAACTGGCAGGCGCAGATCTGTCAGGTGCCGATCTGACCCGTGCGGATCTGCGTGATGCAAATCTGGCCAACGCCGATCTGCAAGAAGCCAATCTGGCCGAAGCAAAACTGCAGGGTGCGAATCTGGAAAATGCTAATCTGGCACGTGCTGATCTGTCTCGTGCAAATTTAGCCGGTGCAGACCTGCATGGTGCAAACCTGGCGGAAGCTGATCTGCGTAACGCCGACCTGCGCAATGCCAATCTGCAGAATGCGGACCTGCGTAAAGCACGTCTGCAAGGGGCAGATCTGGAAGGTGCTAACCTGGAAGGCGCAAATTTACATGGTGCCGATTTAGAAAACGCAGATTTAGCGCGTGCAGATTTACAGAAAGCCGATTTACGTAACGCAAATCTGACCGGTGCCGAAACCACCGGTGCCAACCTGAATAATGCGGATTTACGTGGTGCAACCTTAGATCCGGTTCTGTGGAATACCGCAAGCTTAGAAGGTGCACAGATGAAAAAAGAGCAGAAAAAAGAATACAAGCGTGCCAATGGTGGTGGTGGCAGTACCATGGCCACAGATAAGATCCTTCAACAATATAAAGACGGTCAGCACGACTTTTCAGGCATCGATCTGGCGAACGCGGATTTAAGTAAAGCAGAACTTGCGGGTGCCGACCTGAGCGGAGCAGATTTAACACGTGCCGACTTACGTGATGCGAACTTAGCAAACGCTGACCTGCAAGAGGCGAATTTAGCAGAGGCCAAATTACAGGGTGCTAACTTAGAAAATGCCAATTTAGCAAGAGCGGATCTGAGTCGTGCCAACCTTGCTGGTGCAGATCTTCACGGTGCTAATCTTGCCGAGGCCGATCTTCGCAATGCGGATCTTCGGAACGCAAACCTGCAAAATGCAGACTTAAGAAAAGCTCGCCTGCAAGGTGCGGACTTAGAGGGTGCAAATCTTGAAGGGGCAAACCTTCATGGCGCAGACCTGGAAAACGCGGACCTGGCACGGGCAGACCTTCAGAAAGCAGACTTACGCAATGCGAATTTAACAGGTGCAGAAACAACTGGCGCTAATCTGAACAATGCCGACCTTCGCGGTGCAACACTGGACCCTGTGCTGTGGAACACAGCCTCACTTGAGGGTGCCCAAATGAAGAAAGAACAAAAGAAAGAATATAAACGCGCAAATGGCGGTGGCGGTTCAACAATGGCGACGGACAAAATCCTGCAACAGTACAAGGACGGACAACATGATTTCTCTGGTATCGACCTGGCTAACGCTGATCTTTCAAAAGCAGAATTAGCTGGGGCTGATCTGAGTGGTGCGGATTTAACTAGAGCCGATCTGCGCGACGCCAACCTGGCTAATGCCGACTTGCAAGAGGCTAACCTGGCAGAGGCGAAACTGCAAGGCGCTAACCTTGAGAATGCGAATCTTGCTAGAGCAGACCTGTCACGCGCAAACCTTGCCGGTGCTGATTTACATGGCGCTAACTTGGCCGAGGCAGACCTGAGAAACGCAGATCTTCGTAATGCAAATCTTCAGAATGCAGATCTTCGCAAAGCGCGTCTGCAGGGTGCCGACCTTGAAGGTGCAAATTTAGAAGGTGCGAACTTACATGGTGCTGATCTTGAGAATGCCGATTTAGCCCGTGCCGATCTTCAAAAAGCTGACCTGCGGAATGCGAACCTGACAGGTGCGGAAACGACAGGTGCAAACTTAAACAACGCGGACTTACGCGGTGCCACGCTTGACCCGGTGTTATGGAATACAGCCAGCCTTGAAGGCGCTCAAATGAAAAAAGAGCAAAAAAAAGAATATAAACGAGCCAACGGTGGCGGTGGCTCTACGATGGCTACTGATAAAATCTTGCAGCAATACAAGGATGGGCAGCACGATTTCAGTGGCATTGATTTAGCTAACGCAGACTTGTCTAAAGCCGAGTTAGCTGGTGCGGACCTTTCTGGCGCTGACTTAACTCGAGCTGACCTTCGTGACGCCAATCTTGCAAACGCTGATTTACAAGAAGCAAATCTTGCGGAAGCCAAATTACAAGGCGCAAATCTGGAAAACGCAAACTTAGCTCGCGCAGACTTATCAAGAGCTAATTTAGCTGGCGCAGATTTACACGGTGCGAACCTGGCCGAAGCAGATTTACGTAATGCAGACCTGCGCAACGCAAACCTTCAGAACGCTGATTTGCGTAAAGCCCGTTTACAGGGTGCTGATTTGGAAGGTGCCAATCTTGAGGGTGCTAATCTGCATGGGGCAGACTTAGAGAATGCGGATTTGGCACGTGCGGACTTGCAGAAAGCGGATTTGAGAAATGCTAACTTAACCGGTGCGGAGACAACCGGTGCGAATCTTAATAATGCCGATCTTAGAGGTGCGACCCTTGATCCAGTTTTATGGAACACCGCATCATTAGAGGGTGCCCAGATGAAAAAAGAGCAAAAGAAAGAATACAAACGTGCGAACGGTCAGTCAGATGATGGTTAA

>SynRFR24.nnum40.x4[DNA序列][SEQ ID NO:167]

ATGGGCAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCAGCATGCATGAAGATGAAATTCTGGATGAGTATAACAACGGTCGCAAAAACTTTAGCGGTATTGATCTGCAGGGTGCAGATCTGGAAGATGCAGAACTGGCAGGCGCAGATCTGAGTGATGCAAATCTGGAACAGGCAAATCTGCAGAATGCCAATCTGGCCAATGCCAACCTGGAAAATGCGAATCTGCAGGACGCCGACCTGCATGGTGCTCGTCTGCAGAACGCGGATCTGCGTGGCGCAAATTTAGAAGATGCCGATCTGGCGAACGCACGTCTGGAAGGCGCTAATCTGGCCGAAGCCGATCTGCGTCGTGCAGACTTACGTGGTGCGGATCTGACCAATGCGGATTTAGAGGATGCGGACCTGGAAGGTGCAAATTTACATGGTGCACGTTTAGAAGGTGCGAACCTGCGTGGTGCCAATCTTACCGATGCGCGTCTGGAAAACGCCGATCTGAGCGGTGCCGATTTACGTAACGCGAATCTTGAAGGCGCAAATACCCGTGGTGCACGCCTGCAAGATGCTGATTTACGCGGTGCAAAACTGCGTCCGGTTCTGTGGAATACCGCCAACTTAGAAGGCGCACAGATGCAGACCAATCAGAAAGCAGAATATCAGCGTGCAAATGGTGGTGGTGGCAGCTCAATGCACGAGGATGAAATCCTTGACGAATACAATAATGGCCGTAAGAATTTTTCCGGCATCGATTTACAGGGTGCCGACCTTGAGGATGCCGAATTAGCCGGTGCTGATCTGTCAGACGCGAATTTAGAACAGGCCAATTTACAGAACGCAAACCTGGCAAACGCAAACTTAGAAAACGCCAACCTTCAGGATGCTGATCTTCATGGCGCACGCTTACAGAATGCAGATCTTCGCGGAGCGAACCTTGAAGATGCTGACCTGGCAAATGCTCGCCTTGAGGGTGCGAATCTGGCAGAGGCAGATTTACGCAGAGCGGACCTTCGTGGTGCAGATTTAACAAACGCTGATCTTGAGGACGCTGACTTAGAGGGTGCAAACCTTCACGGTGCTAGACTTGAAGGGGCTAACTTACGCGGAGCCAATCTGACAGACGCTCGTTTAGAAAATGCAGACCTGAGCGGAGCTGATCTGCGCAACGCCAATCTGGAAGGTGCCAATACACGCGGTGCCCGTTTACAGGACGCGGATTTACGGGGAGCGAAATTACGTCCGGTGTTATGGAATACAGCAAACCTTGAAGGTGCCCAAATGCAGACAAACCAAAAAGCCGAGTATCAACGTGCCAACGGTGGCGGAGGTTCAAGTATGCATGAGGACGAGATTTTGGACGAGTACAACAATGGAAGAAAAAACTTCTCAGGCATCGATCTGCAAGGCGCAGACTTGGAGGACGCAGAACTTGCCGGTGCCGACTTATCAGATGCTAACCTTGAACAAGCCAATCTTCAAAATGCTAATCTTGCAAACGCTAATTTGGAGAATGCGAACTTACAAGATGCGGATCTGCACGGTGCTCGCTTGCAAAATGCCGACTTGCGAGGGGCAAACTTGGAAGATGCGGACTTAGCCAATGCACGGTTGGAGGGTGCTAATTTAGCGGAAGCAGACCTTCGTCGCGCTGACCTTCGGGGAGCCGACCTGACCAACGCTGACCTGGAAGATGCCGATTTAGAAGGTGCAAATCTGCATGGCGCTCGCCTGGAAGGCGCAAACTTGCGTGGTGCTAACCTGACAGATGCACGGCTTGAAAACGCGGACCTGTCAGGGGCAGACCTGCGTAATGCCAATTTGGAGGGTGCGAACACCCGTGGGGCACGTTTACAAGACGCCGATCTTAGAGGCGCTAAACTTCGTCCTGTTTTATGGAACACCGCTAATTTAGAGGGTGCCCAGATGCAAACGAATCAAAAGGCGGAATACCAACGTGCGAATGGCGGAGGCGGTAGTAGTATGCACGAAGATGAGATTTTGGATGAATACAATAACGGACGCAAGAACTTCTCTGGAATTGACCTGCAAGGTGCGGACTTAGAAGATGCTGAGTTAGCGGGTGCCGATCTGAGTGACGCCAACCTTGAGCAGGCCAACCTGCAGAACGCAAATTTAGCAAATGCGAATTTGGAAAACGCTAACCTGCAAGACGCGGACTTACATGGCGCAAGACTGCAAAATGCGGATCTTCGGGGTGCTAACTTAGAGGACGCCGATTTAGCGAATGCTCGGTTAGAAGGGGCAAACCTGGCGGAAGCGGATTTACGTCGTGCTGATCTGCGTGGGGCAGATCTGACAAATGCCGATCTTGAAGATGCAGATCTTGAGGGTGCCAACTTGCATGGTGCACGACTTGAAGGTGCCAATTTACGTGGCGCAAATCTGACCGACGCACGCCTGGAAAATGCAGATCTTTCTGGTGCCGATCTGCGTAATGCAAACCTGGAAGGGGCTAATACGCGTGGCGCTCGGCTGCAGGATGCCGACTTAAGAGGCGCAAAATTACGCCCTGTGCTGTGGAACACGGCGAACTTGGAAGGTGCGCAAATGCAAACTAATCAGAAAGCTGAGTACCAACGCGCTAATGGTCAGCAGACAAATGGTTAA

>SynRFR24_nc.x6_1[SEQ ID NO:170]

>SynRFR24_nc.x6_1[DNA序列][SEQ ID NO:171]

ATGGGCAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCGTATGCGTCGTGATGAAATTCTGGAAGAATATCGTCGTGGTCGTCGTAACTTTCAGCATATTAATCTGCAAGAAATCGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCCAATCTGAGCCGTGCCAACCTGCGTTCAGCCGATCTGCGTAATGCGAACCTGAGTCATGCGAATCTGTCAGGCGCAAACCTGGAAGAAGCAAATCTGGAAGCAGCGAACCTGCGTGGTGCGGATCTGCATGAAGCAAACCTGTCAGGTGCCGATTTACAAGAAGCCAACCTGACACAGGCAAATCTGAAAGACGCGAATCTGAGTGACGCCAATCTGGAACAGGCAGACCTGGCAGGCGCTGATCTGCAGGGTGCAGTTCTGGATGGTGCTAATCTGCATGGTGCGAATTTGAATAACGCTAATCTGAGCGAAGCAATGCTGACTCGTGCTAATTTAGAACAGGCGGATCTGAGCGGTGCACGTACCACCGGTGCGCGTCTGGATGATGCGGATTTACGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGCGTGGCGCTAAAATGGAAGAAGAACAGCGTCGCGAATATGAACGTGCCCGTGGTGGTGGCGGTTCTCGCATGCGTAGAGATGAAATCTTAGAAGAGTACCGTCGCGGACGTCGCAATTTTCAACATATCAACTTACAAGAGATCGAGCTGACAAACGCATCACTGACAGGTGCAGACCTGTCTTATGCCAATTTACATCATGCAAATTTGTCGAGAGCGAATCTGCGCTCAGCAGATTTACGCAACGCAAATCTGTCCCATGCAAACCTGAGCGGAGCAAATTTAGAGGAAGCCAATTTAGAAGCCGCAAATCTTCGCGGTGCCGACCTGCACGAGGCTAACCTGAGTGGCGCAGATCTTCAAGAAGCGAATTTAACCCAGGCCAATCTTAAAGATGCCAACTTATCAGATGCTAACCTTGAGCAGGCAGATTTAGCGGGTGCAGACTTACAGGGTGCCGTGTTAGATGGTGCAAATTTACACGGTGCAAATCTTAATAACGCGAACTTATCTGAGGCCATGCTGACACGCGCAAACTTAGAGCAAGCGGATTTATCAGGTGCCCGTACAACAGGCGCACGTTTAGATGATGCCGATCTTCGGGGTGCGACAGTGGACCCTGTGCTGTGGCGCACAGCCAGCTTACGCGGTGCCAAGATGGAAGAGGAACAACGCCGTGAGTACGAACGTGCACGCGGTGGCGGTGGCAGTCGGATGCGTCGGGACGAGATTCTTGAGGAATACAGACGCGGTCGCAGAAATTTTCAGCACATAAACCTTCAAGAAATTGAGTTAACCAATGCCTCTTTAACCGGTGCGGACTTAAGCTATGCCAACCTTCATCACGCGAATTTATCACGTGCGAACCTTCGCAGCGCAGACCTGCGCAACGCTAATTTAAGCCATGCGAACTTAAGCGGTGCAAACCTTGAGGAAGCGAACCTTGAAGCTGCGAATTTACGCGGAGCTGATTTACATGAGGCCAATTTATCTGGGGCTGACTTGCAAGAGGCAAACTTAACGCAGGCTAACTTAAAAGACGCAAACCTTTCAGACGCCAACCTTGAACAAGCCGATCTTGCTGGTGCGGACCTTCAAGGTGCCGTGCTGGACGGTGCGAACTTGCATGGGGCTAATCTTAACAATGCTAATCTTTCCGAAGCCATGTTAACCCGTGCTAACTTGGAACAAGCTGACTTAAGTGGCGCTCGCACCACAGGTGCACGCCTGGACGACGCAGACCTTCGTGGTGCCACAGTAGATCCAGTGTTATGGCGCACCGCCTCATTACGGGGTGCAAAAATGGAAGAGGAACAAAGACGTGAATATGAGCGTGCTCGCGGAGGTGGTGGCTCTCGCATGCGACGCGACGAAATTTTAGAGGAATATCGCAGAGGTCGCCGTAATTTCCAACACATCAATTTGCAAGAAATAGAGCTTACGAATGCGTCATTGACTGGGGCAGATCTGAGTTACGCTAACCTGCACCACGCGAACCTTAGTCGGGCAAACCTGCGCTCTGCGGATCTTCGGAACGCCAACTTGAGCCACGCAAATTTAAGTGGTGCGAATCTGGAAGAGGCCAACTTAGAGGCTGCCAATCTTAGAGGGGCAGACCTGCATGAGGCGAATCTTTCAGGTGCTGATCTGCAAGAGGCCAATCTGACCCAAGCCAACTTGAAGGATGCAAACCTTAGTGATGCAAATCTTGAGCAAGCTGATCTGGCAGGCGCAGATTTACAAGGTGCGGTGCTTGATGGCGCTAACCTTCATGGGGCAAACTTGAATAATGCCAACCTGTCGGAAGCTATGCTTACCAGAGCGAACTTGGAGCAGGCCGACCTTTCTGGTGCACGCACAACGGGTGCTAGACTGGATGACGCCGACTTAAGAGGTGCGACGGTTGATCCTGTTTTATGGCGGACAGCAAGTTTAAGAGGCGCAAAGATGGAAGAGGAACAGCGAAGAGAATATGAAAGAGCACGCGGTGGTGGCGGTTCTCGCATGCGTAGAGATGAAATCTTAGAAGAGTACCGTCGCGGACGTCGCAATTTTCAACATATCAACTTACAAGAGATCGAGCTGACAAACGCATCACTGACAGGTGCAGACCTGTCTTATGCCAATTTACATCATGCAAATTTGTCGAGAGCGAATCTGCGCTCAGCAGATTTACGCAACGCAAATCTGTCCCATGCAAACCTGAGCGGAGCAAATTTAGAGGAAGCCAATTTAGAAGCCGCAAATCTTCGCGGTGCCGACCTGCACGAGGCTAACCTGAGTGGCGCAGATCTTCAAGAAGCGAATTTAACCCAGGCCAATCTTAAAGATGCCAACTTATCAGATGCTAACCTTGAGCAGGCAGATTTAGCGGGTGCAGACTTACAGGGTGCCGTGTTAGATGGTGCAAATTTACACGGTGCAAATCTTAATAACGCGAACTTATCTGAGGCCATGCTGACACGCGCAAACTTAGAGCAAGCGGATTTATCAGGTGCCCGTACAACAGGCGCACGTTTAGATGATGCCGATCTTCGGGGTGCGACAGTGGACCCTGTGCTGTGGCGCACAGCCAGCTTACGCGGTGCCAAGATGGAAGAGGAACAACGCCGTGAGTACGAACGTGCACGCGGTGGCGGTGGCAGTCGGATGCGTCGGGACGAGATTCTTGAGGAATACAGACGCGGTCGCAGAAATTTTCAGCACATAAACCTTCAAGAAATTGAGTTAACCAATGCCTCTTTAACCGGTGCGGACTTAAGCTATGCCAACCTTCATCACGCGAATTTATCACGTGCGAACCTTCGCAGCGCAGACCTGCGCAACGCTAATTTAAGCCATGCGAACTTAAGCGGTGCAAACCTTGAGGAAGCGAACCTTGAAGCTGCGAATTTACGCGGAGCTGATTTACATGAGGCCAATTTATCTGGGGCTGACTTGCAAGAGGCAAACTTAACGCAGGCTAACTTAAAAGACGCAAACCTTTCAGACGCCAACCTTGAACAAGCCGATCTTGCTGGTGCGGACCTTCAAGGTGCCGTGCTGGACGGTGCGAACTTGCATGGGGCTAATCTTAACAATGCTAATCTTTCCGAAGCCATGTTAACCCGTGCTAACTTGGAACAAGCTGACTTAAGTGGCGCTCGCACCACAGGTGCACGCCTGGACGACGCAGACCTTCGTGGTGCCACAGTAGATCCAGTGTTATGGCGCACCGCCTCATTACGGGGTGCAAAAATGGAAGAGGAACAAAGACGTGAATATGAGCGTGCTCGCGGAAAATCAGATGATGGTTAA

>SynRFR24_nc.x2_1[SEQ ID NO:172]

>SynRFR24_nc.x2_1[DNA序列][SEQ ID NO:173]

ATGGGCAGCAGCCATCACCATCATCATCATAGCAGCGGTCTGGTTCCGCGTGGTAGCCGTATGCGTCGTGATGAAATTCTGGAAGAATATCGTCGTGGTCGTCGTAACTTTCAGCATATTAATCTGCAAGAAATCGAACTGACCAATGCAAGCCTGACCGGTGCCGATCTGAGCTATGCAAATCTGCATCATGCCAATCTGAGCCGTGCCAACCTGCGTTCAGCCGATCTGCGTAATGCGAACCTGAGTCATGCGAATCTGTCAGGCGCAAACCTGGAAGAAGCAAATCTGGAAGCAGCGAACCTGCGTGGTGCGGATCTGCATGAAGCAAACCTGTCAGGTGCCGATTTACAAGAAGCCAACCTGACACAGGCAAATCTGAAAGACGCGAATCTGAGTGACGCCAATCTGGAACAGGCAGACCTGGCAGGCGCTGATCTGCAGGGTGCAGTTCTGGATGGTGCTAATCTGCATGGTGCGAATTTGAATAACGCTAATCTGAGCGAAGCAATGCTGACTCGTGCTAATTTAGAACAGGCGGATCTGAGCGGTGCACGTACCACCGGTGCGCGTCTGGATGATGCGGATTTACGTGGTGCAACCGTTGATCCGGTTCTGTGGCGTACCGCAAGCCTGCGTGGCGCTAAAATGGAAGAAGAACAGCGTCGCGAATATGAACGTGCCCGTGGTGGTGGCGGTTCTCGCATGCGTAGAGATGAAATCTTAGAAGAGTACCGTCGCGGACGTCGCAATTTTCAACATATCAACTTACAAGAGATCGAGCTGACAAACGCATCACTGACAGGTGCAGACCTGTCTTATGCCAATTTACATCATGCAAATTTGTCGAGAGCGAATCTGCGCTCAGCAGATTTACGCAACGCAAATCTGTCCCATGCAAACCTGAGCGGAGCAAATTTAGAGGAAGCCAATTTAGAAGCCGCAAATCTTCGCGGTGCCGACCTGCACGAGGCTAACCTGAGTGGCGCAGATCTTCAAGAAGCGAATTTAACCCAGGCCAATCTTAAAGATGCCAACTTATCAGATGCTAACCTTGAGCAGGCAGATTTAGCGGGTGCAGACTTACAGGGTGCCGTGTTAGATGGTGCAAATTTACACGGTGCAAATCTTAATAACGCGAACTTATCTGAGGCCATGCTGACACGCGCAAACTTAGAGCAAGCGGATTTATCAGGTGCCCGTACAACAGGCGCACGTTTAGATGATGCCGATCTTCGGGGTGCGACAGTGGACCCTGTGCTGTGGCGCACAGCCAGCTTACGCGGTGCCAAGATGGAAGAGGAACAACGCCGTGAGTACGAACGTGCACGCGGTAAATCAGATGATGGTTAA

附图说明

图1—原始SynRFR24.1序列和新设计的SynRFR24.新_帽序列的比对。

图2—SynRFR蛋白质表达和纯化。SDS-PAGE凝胶示出了SynRFR24.1和SynRFR24.新_帽蛋白质的表达和纯化,其中(L)PageRuler plus梯带(PageRuler plus ladder),(S)上清液,(I)不可溶级分,(F)Ni-NTA柱流通物,(W)洗涤级分,(E)洗脱级分。

图3—发现SynRFR24.新_帽在0.2M氯化钙、pH为8.0的0.1M Tris盐酸盐和44%v/vPEG 400中结晶。

图4—SynRFR24.新_帽在40mg ml-1下、在4度下储存a)0小时之后和b)4天之后的偏振光学显微术。

图5—SynRFR24.1 60mg ml-1在4度下储存4天之后的偏振光学显微术。在前24小时内未观察到可见的图案。

图6—a)SynRFR24.新_帽,和b)指示了一些长程有序(long range order)的概率分布,c)SynRFR24.1,以及d)也示出了一些较长程有序的概率分布的液体SAXS光谱。

图7—通过重复4个单元的SynRFR24.新_帽单体衍生的新设计的多连体蛋白质变体SynRFR24.nc.x4.1的序列。带下划线的区域指示重复序列之间的柔性连接子序列。

图8—通过重复8个单元的SynRFR24.新_帽单体衍生的新设计的多连体蛋白质变体SynRFR24.nc.x8.1的序列。紫色突出显示的区域指示重复序列之间的柔性连接子序列。

图9—SynRFR24.nc.x4.1蛋白质表达和纯化。SDS-PAGE凝胶示出了95.2kDaSynRFR24.nc.x4.1蛋白质的表达和纯化,其中(L)PageRuler plus梯带,(S)上清液,(FT)Ni-NTA柱流通物,(0-500)咪唑梯度洗涤和洗脱级分。

图10—SynRFR24.nc.x4.1、SynRFR24_nnum_35_005、SynRFR24_nnum_28_002、SynRFR24_nnum_39_003和SynRFR24_nnum_36_005蛋白质的热氟熔解曲线(Thermofluormelting curve)。竖直虚线示出了估计的熔解温度。

图11—SynRFR24.nc.x4.1 SEC-MALS。虚线示出了MALS估计的摩尔质量(Da),实线示出了UV吸光度。

图12—SynRFR24.nc.x8.1蛋白质表达和纯化。SDS-PAGE凝胶示出了188kDaSynRFR24.nc.x8.1蛋白质的表达和纯化,其中(L)PageRuler plus梯带,(S)上清液,(FT)Ni-NTA柱流通物,(0-500)咪唑梯度洗涤和洗脱级分。

图13—SynRFR24.nc.x4.1在70mg ml-1和160mg ml-1下的偏振光学显微术。

图14—手绘纤维的光学和偏振光学显微术(115mg ml-1)。

图15—a)安装的纤维预拉伸测量,b)拉伸测量的静态照片,c)SynRFR24.nc.x4.1手绘纤维的应力-应变曲线,以及d-e)拉伸后的断裂横截面的SEM。

图16—a)安装的纤维预拉伸,b)湿纺纤维(wet-spun fibre)的偏振光学显微术,c)有效拉伸测试的应力-应变曲线(排除了若干测试),以及d)断裂纤维横截面和微观结构的SEM。

图17—缠绕在玻璃小瓶上的SynRFR24.nc.x4.1 140mg ml-1湿纺纤维的数字图像。

图18—液晶级联单体相对于渐增浓度的相图(具有POM),其中N是向列相。

图19—a)SynRFR24.nc.x4.1在100mg ml-1下的POM,以及b)有效拉伸测试的应力-应变曲线。

图20—SynRFR24.1、SynRFR2.新_帽和SynRFR24.新_帽电荷变体的比对。

图21—β螺线管蛋白质在浓缩纺丝原液中的层级结构的示意图。重复共有序列基序形成杆状β螺线管结构域,其可以进一步与柔性连接子布置以形成高分子量多连体。浓缩的蛋白质溶液自组装成适用于纤维纺丝的液晶中间相。

图22—a)估计a)SynRFR24.nnum_35、b)SynRFR24.nnum_36、c)SynRFR24.nnum_40、d)SynRFR24.nc.x2、e)SynRFR24.nc.x4以及f)SynRFR24.nc.x6的大约0.5-1.5mg的摩尔质量,并使用SEC-MALS确认每种测量设计的单体状态。

图23—来自a)SynRFR24.nnum_28、b)SynRFR24.nnum_36、c)SynRFR24.nc.x4、d)SynRFR24.nnum_35以及e)SynRFR24.nnum_40的蛋白质折叠实验的1D质子NMR光谱(-5到15ppm),f)示出了-0.5到1.5的较小ppm范围并且展示了在此区域中填充良好的侧链甲基的特性峰。

图24—从190nm到260nm收集的CD光谱,以估计SynRFR24.1、SynRFR24.新_帽、SynRFR24.nc.x4.1、SynRFR24_nnum_36、SynRFR24_nnum_38和SynRFR24_nnum_40的二级结构含量。

图25—通过偏振光学显微术建立在载玻片和毛细管上的浓缩的蛋白质溶液的光学纹理。图像上方的值指示蛋白质的浓度(mg/ml)。

图26—在单纤维上进行的X射线衍射实验:a.从存在纤维的10个图像的平均强度中减去不存在样品的10个背景图像的平均强度,以降低噪声;b.经线和赤道方向的1D径向强度曲线,其中浅灰色竖直线指示

图27—a.液晶纺丝原液溶液和b.纺纤维(spun fibre)的傅立叶变换红外(FTIR)光谱,显示出了在纤维纺丝之前和之后示出类似的蛋白质结构。

图28—在以下上执行偏振拉曼光谱(Raman Spectroscopy)以鉴定纤维的不同酰胺区域,从而支持图27的FTIR发现:a.波数1000-2000 cm

图29—新的多连体变体的测试表达

经过密码子优化的基因在KRX大肠杆菌菌株中表达,并用0.1%过滤灭菌的鼠李糖诱导,并在25摄氏度下生长过夜。未经诱导的培养物也以相同的方式生长以进行比较。收获细胞并通过超声处理裂解。可溶和不可溶级分的SDS-PAGE凝胶显示出可溶级分中的所有蛋白质的显著蛋白质过表达条带。L指示PageRuler plus梯带,S指示可溶上清液、I指示不可溶级分,并且+指示培养物已经被诱导。

图30—SynRFR24.nnum35.x4的大规模纯化

将SynRFR24.nnum35.x4纯化到高纯度和浓度。L是PageRuler plus梯带,并且另一个泳道是浓缩的可溶蛋白质。发现SynRFR24.nnum35.x4样品是高度可溶的,并且可以浓缩到>200mg/ml。

图31—概括了针对多种蛋白质所获得的数据的表格。数据显示出,迄今为止测试的大多数蛋白质设计似乎是良好表达的、可溶的、折叠的、单体的,并且与原始SynRFR24.1具有类似的CD光谱特征。缺乏成功的蛋白质纯化仅指示与针对SynRFR24.nc.x4.1所描述的标准纯化方案相比,纯化方案需要进一步优化。

实例1

人工β螺线管蛋白质的原始SynRFR系列被设计成在C端加帽域处形成具有二聚体界面的同源二聚体(MacDonald等人,2016PNAS 37:10346-10351)。

刚性杆状SynRFR域的纵横比为约3:1,潜在地允许从良好有序的向列液晶相旋转。为了实现这一点,需要SynRFR域重复单元的新单体版本,然后可以将其级联成较高分子量的聚合物。

使用SynRFR24.1β螺线管蛋白质(PDB代码:4YC5)的高分辨率晶体结构,通过使用计算蛋白质设计方法完全重新设计端帽残基的序列来创建单体版本(使用罗塞塔设计算法(RosettaDesign algorithm),

将额外的约束项添加到罗塞塔势能函数(Rosetta potential energyfunction),以产生偏向不同净表面电荷范围的设计[SEQ ID NO:3-23]。除了这些设计之外,产生了一种更保守的设计,其中仅C端帽和N端帽被重新设计,因为先前发现这些帽对于通过屏蔽螺线管的疏水内芯的蛋白质的可溶折叠至关重要。称为SynRFR24.新_帽[SEQ IDNO:6]的此设计用于初始表达测试。SynRFR24.新_帽(25.52kDa)的分子量稍微高于SynRFR24.1(24.95KDa)[SEQ ID NO:7](图1)。

重复单元的克隆、表达和纯化

从IDT订购了SynRFR24.新_帽设计作为gBlock基因片段,并且将其克隆到标准pET11a表达质粒中。现有的SynRFR24.1设计先前克隆到同一质粒中。对两种质粒进行序列验证,并且然后将其转化到KRX大肠杆菌菌株中。

用5ml LB过夜培养物接种1L的2xYT培养基,以用于SynRFR24.1和SynRFR24.新_帽两者(所有培养基具有适当抗生素)。使1L培养物在37摄氏度下生长,直到达到OD600读数为1。然后用0.1%过滤灭菌的鼠李糖诱导表达,并且培养物在21摄氏度下生长过夜。收获细胞并将其重悬于裂解缓冲液(将100mM bicine和150mM NaCl缓冲液用NaOH滴定到pH 9.0)。对细胞进行超声处理,并通过在40,000×g下离心持续40分钟来澄清。用镍-次氮基三乙酸(Ni-NTA)柱纯化蛋白质;用100mM bicine、150mM NaCl和50mM咪唑在pH9.0下洗涤;并在pH9.0下,在100mM bicine、150mM NaCl和500mM咪唑中洗脱。发现新的蛋白质设计是良好表达的和可溶的(图2)。对经过纯化的蛋白质进行浓缩(浓缩到40mg/ml SynRFR24.新_帽和60mg/ml SynRFR24.1),并且使用4kDa截留离心浓缩器(cutoff centrifugalconcentrator)将其交换到不含咪唑的bicine缓冲液中。

结晶试验

使用经过浓缩的SynRFR24.新_帽样品在864种不同条件下通过蚊子机器人(Mosquito robot)(TTP Labtech)建立蒸汽扩散稀疏基质结晶试验。在两天之后,在四种条件下观察到晶体(图3)。

偏振光学显微术—液晶形成

使用偏振光学显微术以便观察蛋白质单体的任何液晶行为。将1μl的每种蛋白质(即,SynRFR24.1和SynRFR24.新_帽)滴在干净的载玻片上,其中盖玻片放置在顶部。SynRFR24.1和SynRFR24.新_帽的浓度在bicine缓冲液中分别为约60mg ml-和40mg ml-1。将样品在约4度下保存在冰箱中。一旦滴铸,就立即使用偏振光学显微术(POM)观察这些样品,并且潜在地,在SynRFR24.新_帽(图4a)的小区域中明显地开始存在纹影纹理化向列液晶,然而在SynRFR24.1中未观察到LC样行为。在4天之后,初始区域(图4a)没有进一步发展,但是其它较大区域似乎正在发展(图4b)。在4天之后,对于SynRFR24.1观察到规则的图案和一些双折射,但是不确定的是较大图案化区域是干燥效果还是液晶形成。

1D液体SAXS

小角度X射线散射(SAXS)测量是使用配备有ScatterX78模块的PANalyticalEmpyrean衍射仪在0–4°2θ范围内执行的,并且数据分析是使用PANalytic EasySAXS软件执行的。对于SAXS数据收集,使用的步长为0.003°2θ、扫描步长时间为350s并且扫描速度为0.002°/s。在运行之前,制备样品并将其储存在冰箱中20小时。大约50μl的每种蛋白质用于填充毛细管。将SynRFR24.新_帽稀释到约10mg ml-1,所述浓度低于图4a,b中观察到的蛋白质液晶。对于SynRFR24.新_帽,在SAXS光谱(图6a)中鉴定若干个峰,所述若干个峰似乎与蛋白质单体的尺寸良好相关。概率分布指示大多数事件在单独的单体之间,但是观察到一些长程有序(图6b)。由于浓度远高于预期,SynRFR24.1 SAXS光谱未被很好地分辨,并且非常可能的是SynRFR24.1对于清晰的测量是过于浓缩的(图6c)。然而,从概率分布数据中观察到一些长程有序(图6d)。

潜在的沉淀剂

研究了十种不同的凝结剂溶剂,以观察这些蛋白质中的任一种将如何沉淀以及是否沉淀。如表1中概括的,所述溶剂中的若干溶剂可以成功地凝结蛋白质。两种蛋白质在所述溶剂中的若干溶剂中,尤其是乙醇和丙醇中均产生白色纤维状沉淀。将1.5μl的每种蛋白质注入到5ml的凝结溶液中。非常合理的是,与SynRFR24.新_帽相比,SynRFR24.1的沉淀量是浓度依赖性的(60mg ml-1到40mg ml-1)。从初始结果来看,很可能较高浓度的蛋白质单体和/或级联若干蛋白质单体将导致较高程度的凝结和纤维形成。使用乙醇的沉淀程度对于两种蛋白质都是显著的(沉淀程度的差异最有可能是2种蛋白质之间的浓度依赖性),并且可能尝试纺丝具有稍微较大体积的纤维(约0.5-1ml)。

表1:用于纤维形成的潜在凝结溶剂的概括(WP—白色沉淀)。

实例2—设计SynRFR24.新_帽的高分子量级联版本

将上文描述的SynRFR24.新_帽单体与柔性聚甘氨酸连接子序列级联,以产生标记为SynRFR24.nc.x4.1(880个氨基酸残基和95.2kDa分子量;图7)的新的高分子量版本。还设计了双长度版本SynRFR24.nc.x8.1(1740个氨基酸残基和188kDa)(图8)。

SynRFR24.nc.x4.1的克隆、表达和纯化

从GeneArt/赛默飞世尔(Thermo Fisher)订购了SynRFR24.nc.x4.1设计作为经过密码子优化的合成基因,其具有侧翼T7启动子序列和终止子序列。将所述质粒转化到KRX大肠杆菌菌株中。用5ml LB过夜培养物接种1L的特级肉汤肉汤(Terrific Broth)培养基(所有培养基具有适当抗生素)。使1L培养物在37摄氏度下生长,直到达到OD600读数为1。然后用0.1%过滤灭菌的鼠李糖诱导表达,并且培养物在25摄氏度生长过夜。收获细胞并将其重悬于裂解缓冲液(将100mM bicine和150mM NaCl缓冲液用NaOH滴定到pH 9.0)。对细胞进行超声处理,并通过40,000×g下离心持续40分钟来澄清。用镍-次氮基三乙酸(Ni-NTA)柱纯化蛋白质;用100mM bicine、150mM NaCl和0到5mM咪唑在pH 9.0下洗涤;并在pH 9.0下,在100mM bicine、150mM NaCl和500mM咪唑中洗脱。发现多连体设计是良好表达的和高度可溶的(图9)。对经过纯化的蛋白质进行浓缩(浓缩到约100–150mg ml-1),并且使用30kDa截留离心浓缩器将其交换到不含咪唑的bicine缓冲液。与Ni-NTA的结合似乎是弱的,其中蛋白质在低咪唑浓度(50mM)下洗脱。

用于蛋白质稳定性的热氟测定

为了测量SynRFR24.nc.x4.1蛋白质的热稳定性,在10X最终浓度的SYPRO橙色染料(生命技术公司(Life Technologies))和最终蛋白质浓度的含大约1mg/ml的100mM bicine存在的情况下执行熔解实验,并且将150mM NaCl缓冲液用NaOH滴定到pH 9.0。将样品在StepOnePlus实时PCR系统(应用生物系统公司(Applied Biosystems))中以1摄氏度min-1的速率从摄氏度加热到99摄氏度,同时在标准激发/发射波长下测量荧光。通过拟合平滑三次样条并找到一阶导数的最大值,使用R统计软件包Rstats来估计蛋白质熔解温度T

大小排阻色谱法-多角度光散射(SEC-MALS)

将具有miniDAWN TREOS(怀雅特技术公司(Wyatt Technologies))光散射检测器和Optilab T-rEX(怀雅特技术公司)折射率检测器的安捷伦1260系统(安捷伦科技公司(Agilent Technologies))与Superdex 200Increase 10/300GL柱(通用电气医疗集团(GEHealthcare))一起使用。将所述柱用bicine缓冲液(将100mM bicine和150mM NaCl缓冲液用NaOH滴定到pH 9.0)进行预平衡。注射100μl的大约5mg/ml SynRFR24.nc.x4.1蛋白质。使用ASTRA软件(怀雅特技术公司)分析数据以便估计蛋白质的摩尔质量。

MALS估计的蛋白质的摩尔质量与单体一致(图11)。

SynRFR24.nc.x8.1的克隆、表达和纯化

使用PCR扩增和金门组装(Golden Gate assembly)的组合,从合成的SynRFR24.nc.x4.1基因产生编码双倍长度SynRFR24.nc.x8.1设计的基因。使用限制性消化和部分测序来验证这个新的质粒构建体。使用与先前部分中针对SynRFR24.nc.x4.1描述的相同方案表达和纯化新的蛋白质(图12)。

偏振光学显微术—液晶形成

在单体SynRFr24.新_帽(在第一份报告中讨论的)的初始偏振光学显微术后,还观察到在本文标记为SynRFR24.nc.x4.1的级联的SynRFR24.新_帽的任何液晶行为。将若干不同浓度的1μl的SynRFR24.nc.x4.1滴在干净的载玻片上,其中盖玻片放置在顶部。在几天内观察到通过离子交换纯化方法(如上文描述的)获得的浓度160mg ml-1、115mg ml-1、70mgml-1和140mg ml-1,以鉴定LC行为。将样品置于室温下(较冷的温度引起多肽沉淀)。如先前用单体观察到的,在若干区域中明显的是纹影纹理化手性向列液晶的成核(图13)。很可能在图7d和f中观察到的向列相是被无序物种包围的有序的端对端SynRFR24.nc.x4.1单元。这一观察结果还得到文献的支持,如Nakata等人观察到来自6-20个碱基对DNA双链体的类似LC。POM指示级联的单体的LC行为。

初始纤维形成

根据初始凝结溶剂结果,乙醇是使单体凝结的阳性候选物。对于第一级联的样品,将乙醇和丙酮用作凝结剂。乙醇产生了极有前景的结果,并且因此被选择作为凝结剂用于纺丝优化过程。最初使用微量移液器将2μl的SynRFR24.nc.x4.1吸入到填充有乙醇的玻璃培养皿中。可以操纵SynRFR24.nc.x4.1并将材料(当润湿时)拉伸到300%。使乙醇干燥,并且保留短的(约3-5cm)纤维。可能处理这些纤维并执行拉伸测量以确定其机械性质。在POM下,所述纤维是双折射的(图14)。

根据英国标准(BS ISO 11566:1996)确定单一复合材料纤维的拉伸性质。使用环氧粘合剂(50/50固化剂与树脂,英国博斯蒂克芬得利有限公司(Bostik Findley Ltd.,UK)的爱牢达快速粘合剂(Araldite Rapid Adhesive)将纤维装载到标距长度为15mm±0.5mm的卡纸板夹持器上(图15a-b)。使用配备有在1mmmin-1十字头速度下操作的20N测力传感器(load cell)的Linkam TST 350测试仪确定单纤维的拉伸性质。

在拉伸测试完成时,分析数据以获得机械性能(图15a-c),并且在光学显微术和SEM下观察纤维以确定直径和微观结构(图15d-e)。预期平均直径为40-50μm,因为所述纤维未经历任何后处理。具有热拉伸(热拉拔)的后处理将最明确地减小纤维的平均直径,并使其总体上更均匀。应力-应变曲线显示初始急剧增加,此梯度用于计算杨氏模量,所述杨氏模量为2.8GPa,这是类似于针对蜘蛛丝所观察到的初始值的鼓励初始值(encouraginginitial value)。极限工程化强度为60MPa,其中失效应变为28%,并且韧性为10J g

湿法纺丝纤维

还进行了连续纤维纺丝的优化。将所制备的不同浓度的SynRFR24.nc.x4.1(每批次的平均体积为0.5ml)吸入到1ml玻璃注射器中,并且使用注射器泵(KDS 100,KDS科学公司(KDS Scientific))通过24标距(0.31mm内径)针头将其湿纺成乙醇流,这导致凝结和纤维形成(固体)。纺丝原液的注射速率介于5ml h

根据离子交换纯化方法(上文所讨论的),在4rpm下以6ml h

表2:湿纺SynRFR24.nc.x4.1的纺丝参数

优化SynRFR24.x4.1的表达和纯化

为了获得SynRFR24.x4.1的极其纯的样品,开发了澄清的大肠杆菌裂解物的三步纯化方案。先前,发现SynRFR24.x4.1不能与Ni-NTA柱紧密地结合,在约50mM咪唑浓度下洗脱。然而,在流通物中发现非常少的蛋白质,这指示结合正在发生并且此方法仍具有作为初始纯化步骤的价值。为了进一步纯化蛋白质,添加阴离子交换和凝胶过滤步骤。如先前所描述的,在诱导型T7启动子下表达SynRFR24.x4.1的KRX细胞(普洛麦格公司(Promega))生长、收获、裂解和澄清,但重悬缓冲液被稍微改变以降低盐浓度(50mM bicine,150mM NaCl,pH9)。如前所述将裂解物装载到Ni-NTA柱上,然后立即洗脱(50mM bicine,150mM NaCl,500mM咪唑,pH 9),而无需任何中间洗涤步骤。将洗脱液稀释两倍(在50mM bicine,0mM NaCl,pH9缓冲液中)以降低盐浓度。用缓冲液A(50mM bicine,pH 9)平衡HiTrap Q HP柱(2×5ml)。向所述柱以5毫升/分钟施加来自Ni-NTA纯化的洗脱液。然后用5%缓冲液B(50mM bicine,1M NaCl,pH 9)洗涤所述柱。发现蛋白质在约300mM NaCl浓度下洗脱。合并含有蛋白质的级分,并且将其浓缩到约5ml。用两个柱体积的20mM bicine,150mM NaCl,pH 9缓冲液来平衡S200凝胶过滤柱。将来自阴离子交换步骤的合并的级分装载到柱,并收集适当的级分。合并所述级分,并且将其浓缩到约160mg/ml。

偏振光学显微术–相图

已经开发了具有浓度的级联单体的相图以鉴定向列区域,这是已经被进行,因为目标是湿纺LC SynRFR24。已经研究了若干浓度并且改进了纯化方法(如上文所讨论的)。

将若干不同浓度的1μl的级联的SynRFR24滴在干净的载玻片上,其中盖玻片放置在顶部。用油脂密封盖玻片的三个边缘,其中仅一个边缘暴露以控制蒸发速率。将样品置于室温下(较冷的温度引起多肽沉淀)。如先前用单体观察到的,在若干区域(图1)中明显的是纹影纹理化手性向列液晶的成核,但是在几天后已经形成了完全纹理化(双相)向列液晶。很可能在图18中观察到的向列相是被无序物种包围的有序的端对端SynRFR24.nc.x4.1单元(即,双相方案)。

湿法纺丝纤维

还进行了连续纤维纺丝的优化。将所制备的不同浓度的SynRFR24.nc.x4.1(每批次的平均体积为0.5ml)吸入到1ml玻璃注射器中,并且使用注射器泵(KDS 100,KDS科学公司)通过24标距(0.31mm内径)针头将其湿纺成乙醇流,这导致凝结和纤维形成(固体)。纺丝原液的注射速率为7ml h

平均应变为约3%。

表3:在100mg ml-1的浓度下湿纺SynRFR24.nc.x4.1的机械强度和纺丝参数;7mlh-1,在4.5rpm下,用24g针头。

实例4

SEC-MALS

将具有miniDAWN TREOS(怀雅特技术公司)光散射检测器和Optilab T-rEX(怀雅特技术公司)折射率检测器的安捷伦1260系统(安捷伦科技公司)与Superdex 200Increase10/300GL柱(通用电气医疗集团)或Superose 6 10/300柱(通用电气医疗集团)一起使用。将所述柱用bicine缓冲液(将20mM bicine和150mM NaCl缓冲液用NaOH滴定到pH 9.0)进行预平衡。对于不同设计中的每种不同设计,注射100μl的大约5-15mg/ml蛋白质。使用ASTRA软件(怀雅特技术公司)分析数据以便估计蛋白质的摩尔质量,并且所有测量设计(SynRFR24.nc.x6、SynRFR24.nc.x4、SynRFR24.nc.x2、SynRFR24_nnum35、SynRFR24_nnum36、SynRFR24_nnum40)被证实是单体的(图22)。

1D质子NMR

将bicine缓冲液中的蛋白质样品浓缩到>300μM,并且将D

圆二色性

使用0.5mL 7K MWCO Zeba旋转脱盐柱(赛默飞世尔科技公司(ThermoScientific))将0.1-0.2mg/ml的经过纯化的蛋白质交换到20mM硼酸盐、150mM NaF、pH为9.0缓冲液中。使用Chirascan(应用光物理学(Applied Photophysics))从190nm到260nm波长以0.5nm间隔、1nm带宽以及每点1秒时间一式三份收集光谱。使用具有0.1cm路径长度的石英比色皿(QS-284)进行测量结果。收集了SynRFR24.1、SynRFR24.新_帽、SynRFR24.新_帽.x4.1、SynRFR24_neg_num_36_0005、SynRFR24_neg_num_38_0005、SynRFR24_neg_num_40_0004的光谱(图24)。

使用具有以下值的K2D3服务器估计二级结构含量

SynRFR24.1:4.6%α螺旋,34.7%β股

SynRFR24.新_帽:4.5%α螺旋,35.9%β股

SynRFR24.新_帽.x4:5.8%α螺旋,20.6%β股

SynRFR24_nnum36:4.6%α螺旋,34.7%β股

SynRFR24_nnum38:4.9%α螺旋,34.0%β股

SynRFR24_nnum40:4.9%α螺旋,34.0%β股

到K2D3数据库中的最接近的光谱的距离很大,并且因此二级结构分解被标记为可能具有高误差。不清楚为什么SynRFR24.新_帽和SynRFR24.新_帽.x4估计在给定光谱几乎精确覆盖的情况下是如此不同的。所有变体在190-210nm区域显示出与SynRFR24.1的差异,这可能是由于在SynRFR24.1中形成二聚体界面的加帽区域中的C端中的结构较少,但在变体中的任何变体中没有(通过设计,所述变体都是单体的)。

热氟测定

为了测量SynRFR蛋白质中的每个SynRFR蛋白质的热稳定性,在10X最终浓度的SYPRO橙色染料(生命技术公司)和最终蛋白质浓度的含大约0.75mg/ml的100mM bicine存在的情况下执行熔解实验,并且将150mM NaCl缓冲液用NaOH滴定到pH 9.0。将样品在StepOnePlus实时PCR系统(应用生物系统公司)中以1摄氏度/分钟的速率从25摄氏度加热到99摄氏度,其中在标准激发/发射波长下测量荧光。通过拟合平滑三次样条并找到一阶导数的最大值,使用R统计软件包(Rstats)估计蛋白质熔解温度T

实例5

液晶(偏振光学显微术,SAXS/WAXS)

通过配备有DFC295照相机(徕卡应用套件(Leica Application Suite)v4.0.0,∞/1.1HI PLAN 40x/0.50)的偏振光学显微镜(DM2500P,徕卡微系统有限公司(LeicaMicrosystems Ltd.),GB)来研究纤维的形态。将浓缩的蛋白质样品建立在载玻片上或建立在0.2mm内部深度/2mm宽的平面玻璃毛细管中(零件3520,VitroCom;图25)并用蜡密封。

表4:在图25中,螺线管结构域的数量相对于蛋白质浓度和亚位置。

实例6

纤维的湿法纺丝

纤维通过注射到用作凝结剂(在室温下)的乙醇旋转浴中进行纺丝。在典型的实验中,使用注射器泵(KDS100,KD科学公司,美国)通过24标距套管(内径0.5588mm,不锈钢,中央外科有限公司(Central Surgical Co.Ltd.),GB)以7ml h

机械测试

根据英国标准(BS ISO 11566:1996)确定单纤维的拉伸性质。使用环氧粘合剂(50/50固化剂与树脂,英国博斯蒂克芬得利有限公司的爱牢达快速粘合剂(AralditeRapid Adhesive,Bostik Fingley Ltd.,UK))将纤维装载到标距长度为15mm+/-0.5mm的卡纸板支柱上。使用配备有在1mm min

纤维蜡

使用内部X射线源(具有Osmic VariMax光学的Rigaku Micromax 007HF-M高通量发生器)执行X射线衍射实验,并且图像是在Rigaku Saturn 944+CCD检测器上收集的。图像处理是使用Python文库FabIO(http://journals.iucr.org/j/issues/2013/02/00/kk5124/)和PyFAI(https://journals.iucr.org/j/issues/2015/02/00/fv5028/)进行的。将单纤维支撑在卡纸板支柱子上(参见机械测试部分),并安装到测角仪上,并在X射线束中对齐。

用纤维在X射线束中收集十张图像,并且还收集了十张不存在样品的十张背景图像,并对其取平均值以降低噪声。所有图像均以120秒曝光时间、以5度振荡角以及以样品到检测器之间的110cm距离拍摄的。从十个纤维衍射图像的平均值中减去十个背景图像的平均值,以去除背景伪影(图26a.)经线和赤道方向的1D径向强度曲线是通过将+/-10度(图26b.)与指示

FTIR

在具有金刚石ATR头的珀金埃尔默前沿FTIR仪器(Perkin Elmer Frontier FTIRinstrument)上以4cm

偏振拉曼光谱

执行偏振拉曼光谱以鉴定纤维的不同酰胺区域(其支持FTIR二级结构发现),并且使单色光偏振可以阐明纤维的结构基序以及潜在地在纤维中螺线管的朝向。拉曼数据是用三种不同的偏振配置IVV、IVH和IHH获得的,其中V和H分别是指平行和垂直的朝向(图28)。

实例7

新的多连体变体的测试表达

编码蛋白质SynRFR24.nnum35.x4、SynRFR24.nnum36.x4、SynRFR24.nnum40.x4的经过密码子优化的基因由GeneArt合成,其在载体主链pMK-RQ(kanR)中具有侧翼T7启动子序列和T7终止子序列。将这些质粒转化到KRX大肠杆菌菌株中。使用100uL的5ml LB过夜培养物(所有培养基补充有适当的抗生素)接种5mL的新鲜LB培养基。在用0.1%过滤灭菌的鼠李糖诱导之前,将此新鲜培养物在37摄氏度下生长3小时,并在25摄氏度下生长过夜。未经诱导的培养物也以相同的方式生长以进行比较。早晨收获细胞并重悬于100uL的裂解缓冲液(用NaOH滴定到pH 9.0的100mM bicine和150mM NaCl缓冲液)中,然后进行超声处理并通过在台式微型离心机中以20,000×g离心10分钟来澄清。可溶和不可溶级分的SDS-PAGE凝胶显示出可溶级分中的所有蛋白质的显著蛋白质过表达条带。参见图29。

SynRFR24.nnum35.x4变体的纯化

以与对SynRFR24.x4.1描述的相同方式(三步纯化:Ni-NTA、阴离子交换、如在部分:在实例3中的优化SynRFR24.x4.1的表达和纯化中描述的凝胶过滤)来进行SynRFR24.nnum35.x4的较大规模(3升的TB培养基)表达和纯化。

将SynRFR24.nnum35.x4纯化到高纯度和量(~200mg);参见图30,其中L是PageRuler plus梯带,并且另一个泳道是浓缩的可溶蛋白质。发现SynRFR24.nnum35.x4样品是高度可溶的,并且可以浓缩到>200mg/ml。

迄今为止的数据概括

数据显示出,可能设计宽范围的不同的SynRFR蛋白质域,其显示出类似的CD光谱(图24),似乎在1D质子NMR中是折叠的(图23),是单体的(图11和22)并在高温下表现出解折叠转变(unfolding transition)(参见图31中的概括)(图10)。尽管整个序列被完全重新设计(即,NCAP、UNITSn、CCAP),但这种一致性彼此间具有相当低的序列同一性。例如,除TAG序列之外,rfr_ref_minprep_ren_neg_num_40_0004[SEQ ID NO:104+28+125+146]与SynRFR24.新_帽.1[SEQ ID NO:6]具有约53%序列同一性,并且rfr_ref_minprep_ren_neg_num_28_0002[SEQ ID NO:92+16+113+134]与rfr_ref_minprep_ren_neg_num_40_0004[SEQ ID NO:104+28+125+146]具有约64%序列同一性。另外,还已经示出,这些序列可以级联到100kDa,在大肠杆菌中高度表达并且可以浓缩到高浓度(>200mg/ml)。认为不寻常的是能够进行此类广泛的蛋白质重新设计并仍然可靠地获得折叠的且表现良好的蛋白质。

SynRFR24.nc.x.4.1多连体已经一致地纺丝成强纤维,并且已经彻底研究了液晶原液的浓度范围。纤维是在形成液晶中间相的浓度下由原液溶液纺丝的,并且聚合物在纤维中强力对齐(使用纤维WAXS显示(图26))。这些两个观察结果是直接相关的,并且还与纤维的强度相关。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号