首页> 中国专利> 促红细胞生成素:促红细胞生成素的重构和糖缀合

促红细胞生成素:促红细胞生成素的重构和糖缀合

摘要

本发明包括用于重构肽分子的方法和组合物,包括向肽添加或删除一个或多个糖基基团,和/或添加肽修饰基团。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-01-12

    未缴年费专利权终止 IPC(主分类):A61K47/48 授权公告日:20080730 终止日期:20091109 申请日:20031008

    专利权的终止

  • 2008-07-30

    授权

    授权

  • 2006-08-30

    实质审查的生效

    实质审查的生效

  • 2006-07-05

    公开

    公开

说明书

发明背景

大多数天然存在的肽含有在一级肽链的长度上通过与选定数目的氨基酸的特定键合而附着到肽上的糖类部分。因而,许多天然存在的肽称为“糖肽”。任何给定的肽上的糖基化模式的可变性对于该肽的功能具有巨大的意义。例如,肽上N-连接的聚糖的结构可影响肽的各种特征,包括细胞或生物中肽的蛋白酶敏感性、细胞内运输、分泌、组织定向、生物学半衰期和抗原性。这些特征的一种或多种的改变大大地影响了肽在其天然环境中的功效,且也影响了肽作为治疗剂在一定状况中的功效,在该状况中该肽即是为该目的而生成的。

附着到肽链上的糖类结构已知为“聚糖”分子。在肽上存在的特定的聚糖结构影响该肽的可溶性和聚集特征、一级肽链的折叠及其功能或酶活性、该肽对蛋白水解攻击的抗性和对导致肽的无活性形式向活性形式转变的蛋白水解的控制。重要的是,存在于聚糖分子上的末端唾液酸残基影响哺乳动物循环系统中肽的半衰期的长度。其聚糖不含有末端唾液酸残基的肽将由肝快速从循环中去除,这是使肽的任何潜在的治疗益处失效的事件。

天然发现存在于糖肽上的聚糖结构一般分为两类,即N-连接的和O-连接的。

在真核细胞中表达的肽一般是在肽一级结构的位点上在天冬酰胺残基上N-糖基化的,该位点含有天冬酰胺-X-丝氨酸/苏氨酸的序列,其中X可为除脯氨酸和天冬氨酸之外的任何氨基酸。这种肽中的糖类部分已知为N-连接的聚糖。N-糖基化的早期事件发生于内质网(ER)中且在哺乳动物、植物、昆虫和其他高等真核生物中是相同的。首先,包含14个糖残基的寡糖链在脂质载体上构建。当新生肽翻译并转位进入ER时,整个寡糖链则在膜结合的糖基转移酶催化的反应中转移到天冬酰胺残基的酰胺基团上。N-连接的聚糖进一步在ER和高尔基体两者中进行加工。进一步的加工通常需要在由糖苷酶和糖基转移酶催化的反应中去除一些糖残基并添加其他的糖残基,其中所述酶对于去除和添加的糖残基是特异性的。

一般地,N-连接的聚糖的最终结构依赖于产生该肽的生物。例如,细菌产生的肽通常是完全无糖基化的。在昆虫细胞中表达的肽含有高的甘露糖和paunci-甘露糖N-连接的寡糖链以及其它。哺乳动物细胞培养物中产生的肽通常依赖于如物种和细胞培养条件而有差别地糖基化。即使在相同的物种中和在相同的条件下,有时也遇到糖基链中某些异质性。进一步地,植物细胞中产生的肽包含显著与那些动物细胞中产生的不同的聚糖结构。在生产重组肽的领域(特别是当该肽用作治疗剂时)中的困境是能够生成正确糖基化的肽,即能够生成具有与存在于肽的天然形式中的相似或相同的聚糖结构的肽。大多数重组方法产生的肽包含与天然存在的聚糖不同的聚糖结构。

在本领域中已提出了多种方法来定制肽的糖基化模式,包括那些描述于WO 99/22764、WO 98/58964、WO 99/54342和美国专利No.5,047,335中的,以及其它。基本地,对肽的体外糖基化所必需的许多酶已进行了克隆和测序。在一些情况中,这些酶已在体外用于将特定的糖添加到肽上不完全的聚糖分子上。在另一些情况中,细胞已进行了基因工程加工以表达酶和想要的肽的组合,从而可在细胞中发生想要的糖部分向表达的肽中的添加。

肽也可通过添加O-连接的聚糖而修饰,该聚糖由于其在粘蛋白糖肽上的普遍存在也称为粘蛋白类型的聚糖。与连接到天冬酰胺残基上并通过整体从脂质结合的中间体上转移寡糖而形成的N-聚糖不同,O-聚糖主要连接到丝氨酸和苏氨酸残基上并通过逐步添加来自核苷酸糖类的糖而形成(Tanner等人,Biochim.Biophys.Acta.906:81-91(1987);和Hounsell等人,Glycoconj.J.13:19-26(1996))。肽功能可受到在其上存在的O-连接聚糖结构的影响。例如,P-选择蛋白配体的活性受到其上存在的O-连接聚糖结构的影响。对于O-连接聚糖结构的综述,参见Schachter和Brockhausen,The Biosynthesis ofBranched O-Linked Glycans,1989,Society for Experimental Biology,pp.1-26(英国)。其他糖基化模式是通过向蛋白质羧基末端羧基基团连接糖基磷脂酰肌醇而形成的(Takeda等人,Trends Biochem.Sci.20:367-371(1995);和Udenfriend等人,Ann.Rev.Biochem.64:593-591(1995))。

尽管目前存在各种修饰肽的N-连接聚糖的技术,但本领域需要生成肽的通用方法,该肽具有想要的即定制的糖基化模式。本领域特别需要肽的定制(Customize)的体外糖基化,其中结果所得的肽可在工业规模上生产。本发明可满足这个和其他的需要。

给予糖基化和非糖基化的肽以产生特定的生理学反应是医药领域众所周知的。用于该目的的最知名的肽之一是胰岛素,它用于治疗糖尿病。酶也已因其治疗益处而使用。限制了治疗性肽的应用的主要因素是大多数肽的免疫原性特性。在患者中,对给予的肽的免疫原性反应可中和肽和/或导致患者中变态反应的发展。治疗性肽的其他不足包括亚最优的效力和快速的清除速率。在本领域中已认识到肽治疗剂固有的问题,且已研究了各种消除所述问题的方法。为了提供可溶性的肽治疗剂,已将合成的聚合物附着到肽主链上。

聚(乙二醇)(“PEG”)是已与肽缀合的示例性的聚合物。已证明使用PEG来使肽治疗剂衍生化可降低肽的免疫原性并延长从循环中的清除时间。例如,U.S.Pat.No.4,179,337(Davis等人)涉及无免疫原性的肽,如与聚乙二醇(PEG)或聚丙二醇偶联的酶和肽激素。每摩尔肽使用了10~100摩尔的聚合物且维持了至少15%的生理学活性。

WO 93/15189(Veronese等人)涉及通过将蛋白水解酶连接到大分子化的抑制剂上而维持聚乙二醇修饰的蛋白水解酶活性的方法。该缀合物计划用于医学应用。

PEG及其衍生物向肽附着的主要模式是通过肽氨基酸残基的非特定的连接。例如,美国专利No.4,088,538公开了与PEG共价连接的酶的酶活性聚合物-酶缀合物。类似地,美国专利No.4,496,689公开了α-1蛋白酶抑制剂与聚合物如PEG或甲氧基聚(乙二醇)(“mPEG”)共价附着的复合物。Abuchowski等人(J.Biol.Chem.252:3578(1977))公开了mPEG与牛血清白蛋白的氨基团的共价附着。美国专利No.4,414,147公开了通过将其与二羧酸的酸酐如聚(乙烯琥珀酸酐)的缀合而使干扰素疏水性较低的方法。PCT WO 87/00056公开了PEG和聚氧乙基化多元醇与蛋白质如干扰素-β、白细胞介素-2和免疫毒素的缀合。EP 154,316公开并请求保护化学修饰的淋巴因子如含有直接与淋巴因子的至少一个一级氨基基团连接的PEG的IL-2。美国专利No.4,055,635公开了与聚合物质如多糖共价连接的蛋白水解酶水溶性复合物的药物组合物。

PEG与肽附着的另一种模式是通过肽上糖基残基的非特定的氧化。氧化的糖可用作将PEG部分附着到肽上的座位。例如,M’Timkulu(WO 94/05332)公开了肼-PEG或氨基-PEG将PEG添加到糖蛋白质上的应用。糖基部分随机地氧化为相应的醛,并随后与氨基-PEG偶联。也参见Bona等人(WO 96/40731),其中通过酶促氧化免疫球蛋白上的聚糖然后使聚糖与氨基-PEG分子接触而将PEG添加到免疫球蛋白分子上。

在上述每一种方法中,聚(乙二醇)是以随机的非特异性的方式添加到肽主链的反应性残基上的。为了生产治疗性的肽,明显想要的是一种衍生化策略,该策略导致特定标记的、易于表征的且基本均一的产物的形成。

在糖类合成中使用两类主要的酶,即糖基转移酶(如唾酸转移酶、寡糖基转移酶、N-乙酰葡糖胺转移酶)和糖苷酶。糖苷酶进一步分为外切糖苷酶(如β-甘露糖苷酶、β-葡糖苷酶)和内切糖苷酶(如Endo-A、Endo-M)。这几类酶的每一个已成功地合成用于制备糖类。对于一般综述,参见Crout等人,Curr.Opin.Chem.Biol.2:98-111(1998)。

糖基转移酶修饰肽上的寡糖结构。糖基转移酶对于以良好的立体化学和区域化学(regiochemical)控制产生特定产物是有效的。糖基转移酶已用于制备寡糖和用于修饰末端的N-或O-连接的糖类结构,特别是在哺乳动物细胞产生的肽上的。例如,糖肽的末端寡糖已完全唾液酸化和/或岩藻糖基化已提供更坚固的糖结构,这改善了糖肽的药物动力学和各种其他的生物学特性。例如,β-1,4-半乳糖基转移酶可用于合成乳糖胺,这是糖基转移酶用于糖类合成的一个例子(参见如Wong等人,J.Org.Chem.47:5416-5418(1982))。此外,许多合成程序使用α-唾酸转移酶以将唾液酸从胞苷-5’-单磷酸-N-乙酰神经氨酸转移到半乳糖的3-OH或6-OH(参见如Kevin等人,Chem.Eur.J.2:1359-1362(1996))。岩藻糖基转移酶可用于合成途径以将岩藻糖单位从鸟苷-5’-二磷酸岩藻糖转移到糖受体的特定羟基上。例如,Ichikawa通过涉及唾液酸化的乳糖胺由克隆的岩藻糖基转移酶进行岩藻糖基化的方法制备了唾酸Lewis-X(Ichikawa等人,J.Am.Chem.Soc.114:9283-9298(1992))。对于用于治疗用途的糖缀合物合成的最近进展的讨论,参见Koeller等人,Nature Biotechnology 18:835-841(2000)。也参见美国专利No.5,876,980、6,030,815、5,728,554、5,922,577和WO/9831826。

糖苷酶也可用于制备糖类。糖苷酶通常催化糖苷键的水解。然而,在适当条件下,它们可用于形成该键。用于糖类合成的大多数糖苷酶是外切糖苷酶;糖基转移发生于底物的非还原末端。糖苷酶在糖基-酶中间体中结合糖基供体,该中间体可由水劫取而产生水解产物,或由受体劫取生成新的糖苷或寡糖。应用外切糖苷酶的一个示例性途径是所有N-连接的糖肽的核心三糖的合成,包括由β-甘露糖苷酶作用形成的β-甘露糖苷键(Singh等人,Chem.Commun.993-994(1996))。

在应用糖苷酶以形成糖苷键的另一个示例性应用中,制备了突变的糖苷酶,其中活性位点的正常的亲核氨基酸改变为非亲核氨基酸。该突变的酶不水解糖苷键,但仍可形成该键。这种突变的糖苷酶可用于用α-糖基氟化物供体和糖苷受体分子制备寡糖(Withers等人,美国专利No.5,716,812)。

尽管其应用不如外切糖苷酶的普遍,但内切糖苷酶也用于制备糖类。基于应用内切糖苷酶的方法具有可转移寡糖而不是单糖的优点。已用endo-β-N-乙酰葡糖胺如endo-F、endo-M将寡糖片段添加到底物上了(Wang等人,Tetrahedron Lett.37:1975-1978);和Haneda等人,Carbohydr.Res.292:61-70(1996))。

除其在制备糖类的应用之外,上述的酶也可应用于合成糖肽。已发表了核糖核酸酶B的均质糖形式(glycoform)的合成(Witte K.等人,J.Am.Chem.Soc.119:2114-2118(1997))。核糖核酸酶B的高甘露糖核心可通过用内切糖苷酶H处理糖肽而切割。该切割特定地发生于两个核心GlcNAc残基之间。然后通过依次应用β-1,4-半乳糖基转移酶、a-2,3-唾酸转移酶和α-1,3-岩藻糖基转移酶,四糖唾酸Lewis X可在均质的蛋白质上剩余的GlcNAc锚定位点上酶促重建。然而,尽管每一个酶催化步骤都以极好的产量进行,但这种程序不能适用于在工业规模上生成糖肽。

结合化学和酶合成元件的方法也是本领域中公知的。例如,Yamamoto及同事(Carbohydr.Res.305:415-422(1998))报道了用内切糖苷酶对糖肽、糖基化的肽T的化学酶促(chemoenzymatic)合成。N-乙酰葡糖胺肽是完全由化学方法合成的。该肽随后精心用人类运铁蛋白肽的寡糖进行酶处理。糖部分是通过用内切-β-N-乙酰葡糖胺酶(acetylglucosaminidase)处理而添加到肽上的。结果所得的糖基化的肽与肽T和N-乙酰葡糖胺肽T相比是高度稳定的并对蛋白水解有抗性。

也已探究了用于修饰具有报道基团的肽结构的糖基转移酶的应用。例如,Brossmer等人(美国专利No.5,405,753)公开了唾液酸的荧光标记的胞苷单磷酸(“CMP”)衍生物的形成和荧光糖苷在测定唾酸转移酶活性和细胞表面、糖蛋白和肽的荧光标记中的应用。Gross等人(Analyt.Biochem.186:127(1990))描述了类似的测定。Bean等人(美国专利No.5,432,059)公开了利用对不充分糖基化的蛋白质的重新糖基化对糖基化缺陷病症的测定。该缺陷蛋白质是用荧光标记的CMP糖苷重新糖基化的。每一个荧光唾液酸衍生物都用荧光部分在唾液酸中通常乙酰化的9-位置或胺上取代。应用荧光唾液酸衍生物的方法是对糖基转移酶或非糖基化的或不正确糖基化的糖蛋白是否存在的测定。该测定是在生物学来源的样品中对少量的酶或糖蛋白进行的。在现有技术领域中尚未公开或提出利用修饰的唾液酸以制备或工业规模对糖基化的或非糖基化的肽进行酶促衍生化。

也已有相当多的努力涉及通过改变由细胞表面呈现的糖基残基而修饰该细胞表面。例如,Fukuda及同事已发展了将具有限定结构的糖苷附着到细胞表面的方法。该方法利用岩藻糖基转移酶不严格的底物特异性,该酶可转移岩藻糖和具有不同糖基底物的岩藻糖类似物(Tsuboi等人,J.Biol.Chem.271:27213(1996))。

酶促方法也已用于活化糖肽上的糖基残基以有助于随后的化学处理。糖基残基一般是用半乳糖氧化酶活化的,该酶将末端半乳糖残基转变为相应的醛。该醛随后与含有氨的修饰基团偶联。例如,Casares等人(Nature Biotech.19:142(2001))已将阿霉素附着到重组的MHCII-肽嵌合体的氧化的半乳糖残基上。

也已对糖基残基进行修饰以使其含有酮基团。例如,Mahal及同事(Science 276:1125(1997))已制备了N-乙酰丙酰甘露糖胺(“ManLev”),它在天然底物中通常由乙酰基团占据的位置具有酮官能团。用ManLev处理细胞,从而将酮基团整合入细胞表面。也参见Saxon等人,Science 287:2007(2000);Hang等人,J.Am.Chem.Soc.123:1242(2001);Yarema等人,J.Biol.Chem.273:31168(1998);和Charter等人,Glycobiology 10:1049(2000)。

修饰细胞表面的方法尚未在不存在细胞时应用于修饰糖基化的或非糖基化的肽。进一步地,细胞表面修饰方法未用于将修饰的糖基供体部分酶促整合入肽中。此外,没有一种细胞表面修饰方法在以工业规模生产糖基修饰的肽中是可行的。

尽管有涉及对糖结构酶促处理的努力,但仍需要有工业上可行的方法以用于用修饰基团对糖基化的和非糖基化的肽进行修饰,该修饰基团如水溶性聚合物、治疗部分、生物分子等。特别感兴趣的是其中修饰的肽具有改善的特性的方法,该改善的特性增强了该肽作为治疗或诊断剂的应用。本发明满足了这些和其他的需要。

发明概述

本发明包括多个对肽进行重构以使其具有附着于其上的聚糖结构的方法。尽管在此处描述了特定的聚糖结构,但本发明不应该理解为限制于任何一个特定的结构。此外,尽管在此处描述了特定的肽,但本发明不应该受所描述的肽的特性的限制,而应该包含任何或所有适当的肽及其变体。

随后的描述公开了本发明优选的实施方案并提供了附加的权利要求的书面描述。本发明包含任何和所有这些实施方案的变体,该变体在阅读了本发明的说明书之后是或者将是显而易见的。

本发明包括对促红细胞生成素(EPO)肽进行重构的无细胞的体外方法,该肽具有如下分子式:

其中

AA是肽的末端或内部氨基酸残基;

X1-X2是与AA共价连接的糖,其中

X1是第一个糖基残基;而

X2是与X1共价连接的第二个糖基残基,其中X1和X2选自单糖和寡糖残基,该方法包含:

(a)从肽中去除X2或其糖亚单位,从而形成截短的聚糖;和

(b)使截短的聚糖与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到截短的聚糖的条件下接触,从而对EPO肽进行重构。

该方法进一步包含:

(c)去除X1,从而暴露AA,和

(d)使AA与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到AA的条件下接触,从而对EPO肽进行重构。

该方法另外包含:

(e)在步骤(b)之前,去除在翻译后修饰过程中添加到糖上的基团。

在一方面,该基团是选自磷酸盐、硫酸盐、羧酸盐及其酯的成员。

在该方法的另一方面,肽具有分子式:

其中

Z是选自O、S、NH和交联剂的成员。

在一个实施方案中,至少一种糖基供体包含修饰基团。在这个和其他的实施方案中,该修饰基团为选自聚合物、治疗部分、可探测的标记、反应性连接体基团、导向部分和肽的成员。优选地,该修饰基团是水溶性聚合物,优选聚(乙二醇)其中优选地,该聚(乙二醇)具有基本单分散(homodisperse)的分子量分布。

也提供了对EPO肽进行重构的无细胞的体外方法,该肽具有如下分子式:

其中

X3、X4、X5、X6、X7和X17是独立选择的单糖或寡糖残基;和

a、b、c、d、e和x独立地选自整数0、1和2,前提是选自a、b、c、d和e的至少一个成员和x是1或2,该方法包含:

(a)从肽中去除X3、X4、X5、X6、X7或X17的至少一个或其糖亚单位,从而形成截短的聚糖;和

(b)使截短的聚糖与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到截短的聚糖的条件下接触,从而对EPO肽进行重构。

在一个实施方案中,步骤(a)中的去除产生了其中a、b、c、e和x各自为0的截短的聚糖。

在另一个实施方案中,X3、X5和X7选自(甘露糖)z和(甘露糖)z-(X8)y

其中

X8是选自单-和寡-糖的糖基部分;

y是选自0和1的整数;和

z是1和20之间的整数,其中

当z是3或更大时,(甘露糖)z选自线性和分支的结构。

在进一步的实施方案中,X4选自GlcNAc和木糖。

在另一个实施方案中,X3、X5和X7是(甘露糖)u,其中u选自1和20之间的整数,且当z是3或更大时,(甘露糖)u选自线性和分支的结构。

在一方面,至少一种糖基供体包含修饰基团。

进一步提供的是对具有如下分子式的包含聚糖的EPO肽进行重构的无细胞的体外方法:

其中

r、s和t是独立选自0和1的整数,该方法包含:

(a)使肽与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到聚糖的条件下接触,从而对EPO肽进行重构。

在一方面,至少一种糖基供体包含修饰基团。

在另一方面,该肽具有分子式:

其中

X9和X10是独立选择的单糖或寡糖残基;和

m、n和f是选自0和1的整数。

此外,该肽具有分子式:

其中

X11和X12是独立选择的糖基部分;和

r和x是独立选自0和1的整数。

在另一方面,X11和X12是(甘露糖)q,其中

q是选自1和20之间的整数,且当q是3或更大时,(甘露糖)q选自线性和分支的结构。

此外,该肽具有分子式:

其中

X13、X14和X15是独立选择的糖基残基;和

g、h、i、j、k和p独立地选自整数0和1,前提是g、h、i、j、k和p的至少一个是1。

该方法也包括

其中,X14和X15是独立选自GlcNAc和Sia的成员;且i和k独立地选自整数0和1,前提是i和k的至少一个是1,且如果k是1,那么g、h和j是0。

在另一方面,该肽具有分子式:

其中

X16是选自以下分子式的成员:

其中,

s和i是独立地选自0和1的整数。

在一个实施方案中,去除步骤利用了糖苷酶。

同样包括的是对具有如下分子式的EPO肽进行重构的无细胞的体外方法:

其中

AA是肽的末端或内部氨基酸残基;

X1是与AA共价连接的糖基残基,选自单糖和寡糖残基;和

u是选自0和1的整数,该方法包含:使肽与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到截短的聚糖的条件下接触,其中该糖基供体包含修饰基团,从而对EPO肽进行重构。

本发明进一步提供了EPO肽和改变肽性质的修饰基团之间的共价缀合物,其中修饰基团是通过完整的糖基连接基团在预先选择的肽的糖基或氨基酸残基上共价地附着到肽上的。

在一方面,修饰基团为选自聚合物、治疗部分、可探测的标记、反应性连接体基团、导向部分和肽的成员。在另一方面,修饰基团和完整的糖基连接基团前体是作为共价附着单位经过酶的作用与肽连接的,该酶将该前体转变为完整的糖基连接基团,从而形成缀合物。

在进一步的方面,共价缀合物包含经过第一个完整的糖基连接基团与肽的第一个残基共价连接的第一个糖基连接基团,和经过第二个完整的糖基连接基团与肽的第二个残基连接的第二个糖基连接基团。

在一个实施方案中,第一个残基和第二个残基是结构上相同的。在另一个实施方案中,第一个残基和第二个残基具有不同的结构。在一个额外的实施方案中,第一个残基和第二个残基是糖基残基。此外,第一个残基和第二个残基是氨基酸残基。

同样,肽可为在形成缀合物之前进行重构的。在另一方面,对重构的肽进行重构以引入完整糖基连接基团的受体部分。在进一步的方面,修饰基团是水溶性聚合物。在一方面,完整的糖基连接单位是选自唾液酸残基、Gal残基、GlcNAc残基和GalNAc残基的成员

也提供了在聚合物和糖基化的或非糖基化的肽之间形成共价缀合物的方法,其中聚合物是通过完整的糖基连接基团与肽缀合的,该完整的糖基连接基团插入肽和聚合物之间并共价地与两者连接,该方法包含:

使肽与一种混合物在足以形成缀合物的条件下接触,该混合物包含与聚合物共价连接的核苷酸糖(nucleotide sugar)和以该核苷酸糖为底物的糖基转移酶,其中的肽是EPO。

在一方面,聚合物是水溶性聚合物。在另一方面,糖基连接基团是共价附着于在肽上共价附着的糖基残基上的。在进一步的方面,糖基连接基团是共价附着于肽的氨基酸残基上的。

在另外的方面,聚合物包含选自聚环氧烷和多肽的成员。在另一方面,聚环氧烷是聚(乙二醇)。

在进一步的方面,糖基转移酶选自唾酸转移酶、半乳糖基转移酶、葡糖基转移酶、GalNAc转移酶和GlcNAc转移酶。此外,糖基转移酶是重组生产的,且可为重组的原核生物的酶或重组的真核生物的酶。

在一个实施方案中,核苷酸糖选自UDP-糖苷、CMP-糖苷和GDP-糖苷。此外核苷酸糖选自UDP-半乳糖、UDP-半乳糖胺、UDP-葡萄糖、UDP-葡糖胺、UDP-N-乙酰半乳糖胺、UDP-N-乙酰葡糖胺、GDP-甘露糖、GDP-岩藻糖、GMP-唾液酸、GMP-NeuAc。

此外,糖基化的肽在进行接触之前是部分去糖基化的。

此外,完整的糖基连接基团是唾液酸残基。

此外,该方法在无细胞环境中进行。

同样地,共价缀合物是分离的,优选通过膜过滤分离。

本发明进一步包括用于在肽和修饰的糖之间形成缀合物的组合物,该组合物包含:修饰的糖、糖基转移酶和肽受体底物的混合物,其中修饰的糖在其上共价地附着有选自聚合物、治疗部分和生物分子的成员,其中的肽是EPO。

此外,提供了用本发明的方法进行重构的EPO肽以及包含该EPO肽的药物组合物。

也提供了对具有如下分子式的肽进行重构的无细胞的体外方法:

其中

AA是肽的末端或内部氨基酸残基,该方法包含:

使肽与至少一种糖基转移酶和至少一种糖基供体在适合于将所述至少一种糖基供体转移到氨基酸残基的条件下接触,其中糖基供体包含修饰基团,从而对肽进行重构,其中的肽是EPO。

此外,提供了在EPO肽和修饰基团之间形成缀合物的方法,其中修饰基团是通过完整糖基连接基团共价附着于EPO肽上的,该EPO肽包含具有选自下面分子式的糖基残基:

其中

a、b、c、d、i、n、o、p、q、r、s、t和u是独立选自0和1的成员;

e、f、g和h是独立选自0~4的整数的成员;

j、k、l和m是独立选自0~20的整数的成员;

v、w、x、y和z是0;和

R是修饰基团、甘露糖或寡聚甘露糖,该方法包含:

(a)使EPO肽与糖基转移酶和修饰的糖基供体在适合于形成完整糖基连接基团的条件下接触,该修饰的糖基供体包含共价结合到修饰基团上的作为糖基转移酶底物的糖基部分。

该方法进一步包含:

(b)在步骤(a)之前,使EPO肽与唾液酸酶在适合于从EPO肽中去除唾液酸的条件下接触。

该方法进一步包含:

(c)使步骤(a)的产物与唾酸转移酶和唾液酸供体在适合于将唾液酸转移到产物中的条件下接触。

该方法进一步包含:

(d)在步骤(a)之前,使EPO肽与起合成作用的半乳糖苷酶在适合于将半乳糖添加到EPO肽中的条件下接触。

此外,该方法包含:

(e)在步骤(a)之前,使EPO肽与半乳糖基转移酶和半乳糖供体在适合于将半乳糖转移到EPO肽中的条件下接触。

该方法也包含:

(f)使步骤(e)的产物与ST3Gal3和唾液酸供体在适合于将唾液酸转移到产物中的条件下接触。

该方法也包含:

(g)使步骤(a)的产物和与修饰基团反应的部分接触,从而在完整糖基连接基团和部分之间形成缀合物。

此外,该方法包含:

(h)在步骤(a)之前,使EPO肽与N-乙酰葡糖胺转移酶和GlcNAc供体在适合于将GlcNAc转移到EPO肽中的条件下接触。

在一方面,修饰基团是选自聚合物、毒素、放射性同位素、治疗部分和糖缀合物的成员。

在另一方面,a、b、c、d、e、f、g、n和q是1;h是选自1~3的整数的成员;i、j、k、l、m、o、p、r、s、t和u是独立选自0和1的成员;且v、w、x、y和z是0。

在另一方面,a、b、c、d、f、h、j、k、l、m、q、s、u、v、w、x、y和z是0;且e、g、i、r和t是独立选自0和1的成员。

在另外的方面,a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t和u是独立选自0和1的成员;且v、w、x、y和z是0。

在进一步的方面,a、b、c、d、e、f、g、n和q是1;h是选自1~3的整数的成员;i、j、k、l、m、o、p、r、s、t和u是独立选自0和1的成员;且v、w、x、y和z是0。

在另一方面,a、b、c、d、f、h、j、k、l、m、o、p、s、u、v、w、x、y和z是0;且e、g、i、n、q、r和t是独立选自0和1的成员。

此外,a、b、c、d、f、h、j、k、l、m、n、o、p、s、u、v、w、x、y和z是0;且e、g、i、q、r和t是独立选自0和1的成员。

此外,q是1;a、b、c、d、e、f、g、h、i、n、r、s、t和u是独立选自0和1的成员;且j、k、l、m、o、p、v、w、x、y和z是0。

也提供了由本发明的方法形成的EPO肽缀合物。

进一步提供的是包含一个或多个聚糖的EPO肽,在该肽上共价附着有糖缀合物分子。在一方面,一个或多个聚糖是单触角(monoantennary)聚糖。在另一方面,一个或多个聚糖是双触角(diantennary)聚糖。在进一步的方面,一个或多个聚糖是三触角(triantennary)聚糖。在进一步的方面,一个或多个聚糖至少是三触角聚糖。在进一步的方面,一个或多个聚糖包含至少两个聚糖,该至少两个聚糖包含混合的单触角或多触角(multiantennary)聚糖。在另一方面,一个或多个聚糖选自N-连接的聚糖和O-连接的聚糖。在进一步的方面,一个或多个聚糖是至少两个选自N-连接的和O-连接的聚糖的聚糖。

此外,肽在选自原核细胞和真核细胞的细胞中表达,且真核细胞选自哺乳动物细胞、昆虫细胞和酵母细胞。

在本发明中也提供了包含EPO肽和至少一个聚糖和至少一个共价附着于聚糖的聚乙二醇分子的糖PEG化(glycoPEGylated)的EPO肽,其中聚乙二醇分子用糖基转移酶添加到EPO上。在一方面,糖PEG化的EPO肽包含至少一个单触角聚糖。在另一方面,所有聚糖均为N-连接的和单触角的。在进一步的方面,所有聚糖均为N-连接的,且至少一个聚糖包含聚乙二醇。在另外的方面,多于一个聚糖包含聚乙二醇。在进一步的方面,所有聚糖均为N-连接的,且所有聚糖均包含聚乙二醇。此外,糖PEG化的肽包含至少3个在其上共价附着有聚乙二醇的单触角聚糖。

进一步提供的是糖PEG化的EPO肽,其中EPO肽包含3个或更多聚糖。在一方面,至少一个聚糖包含在其上共价附着的聚乙二醇。在另一方面,多于一个聚糖包含在其上共价附着的聚乙二醇。在进一步的方面,所有聚糖均包含在其上共价附着的聚乙二醇。此外,聚乙二醇连接于至少一个选自岩藻糖(Fuc)、N-乙酰葡糖胺(GlcNAc)、半乳糖(Gal)和唾液酸(SA)的糖部分。此外,唾液酸是N-乙酰神经氨酸。此外,EPO肽不包含O-连接的聚糖。此外,EPO肽包含至少一个O-连接的聚糖。此外,O-连接的肽包含在其上共价附着的聚乙二醇。此外,EPO肽是在细胞中重组表达的。此外,该细胞选自昆虫细胞、酵母细胞和哺乳动物细胞。优选地,哺乳动物细胞是CHO细胞。在一方面,聚乙二醇具有选自约1kDa、2kDa、5kDa、10kDa、20kDa、30kDa和40kDa的分子量。在另一方面,EPO肽选自天然存在的EPO肽和突变的EPO肽。在另一方面,突变的EPO肽包含具有至少一个选自Arg139到Ala139、Arg143到Ala143和Lys154到Ala154的突变的氨基酸序列SEQ ID NO:73。

也提供了制备糖PEG化的EPO肽的方法,该方法包含如下步骤:

(a)使EPO肽与包含共价连接于聚乙二醇的核苷酸糖和糖基转移酶的混合物在足以将聚乙二醇转移到EPO肽上的条件下接触。

在一个实施方案中,核苷酸糖的糖选自岩藻糖(Fuc)、N-乙酰葡糖胺(GlcNAc)、半乳糖(Gal)和唾液酸(SA)。在另一个实施方案中,唾液酸是N-乙酰神经氨酸(NAN)。在进一步的实施方案中,聚乙二醇具有选自约1kDa、2kDa、5kDa、10kDa、20kDa、30kDa和40kDa的分子量。在另外的实施方案中,EPO肽是在细胞中重组表达的,其中该细胞选自昆虫细胞、酵母细胞和哺乳动物细胞。在一方面,EPO肽选自天然存在的EPO肽和突变的EPO肽。在另一方面,成熟EPO肽具有序列SEQ ID NO:73。在进一步的方面,突变的EPO肽包含具有至少一个选自Arg139到Ala139、Arg143到Ala143和Lys154到Ala154的突变的氨基酸序列SEQ ID NO:73。

在本发明方法的另一个方面,在步骤(a)前,该方法包含:

(b)使EPO肽与包含核苷酸-N-乙酰葡糖胺(GlcNAc)分子和以核苷酸-GlcNAc为底物的N-乙酰葡糖胺转移酶(GnT)的混合物在足以在GlcNAc和EPO之间形成键的条件下接触,其中GnT选自GnTI、GnT II、GnT III、GnT IV、GnT V和GnT VI。

在一方面,混合物包含一个选自GnT I、GnT II、GnT IV、GnTV和GnT VI的GnT。在另一方面,糖PEG化的EPO肽包含至少一个单触角聚糖。在进一步的方面,核苷酸糖的糖是半乳糖,且糖基转移酶是半乳糖基转移酶I(GalT I)。

在方法的另外方面,在步骤(a)前但在步骤(b)后:

(c)使EPO肽与包含核苷酸半乳糖(Gal)和半乳糖基转移酶I(GalT I)的混合物在足以将半乳糖转移到EPO肽上的条件下接触。

在一个实施方案中,在步骤(a)中,核苷酸糖的糖是唾液酸,且糖基转移酶是唾酸转移酶。在另一个实施方案中,唾液酸是N-乙酰神经氨酸(NAN)。在进一步的实施方案中,唾酸转移酶选自α(2,3)-唾酸转移酶、α(2,6)-唾酸转移酶和α(2,8)-唾酸转移酶。也提供了糖PEG化的EPO,该EPO包含序列SEQ ID NO:73。在一方面,该EPO包含序列SEQ ID NO:73,且进一步包含该序列中的突变。

进一步提供了制备糖PEG化的EPO肽的方法,该方法包含如下步骤:

(a)使EPO肽与包含共价连接于聚乙二醇的核苷酸糖和糖基转移酶的混合物在足以将聚乙二醇转移到EPO肽上的条件下接触,其中该糖基转移酶是岩藻糖基转移酶。

在一方面,岩藻糖基转移酶选自岩藻糖基转移酶I、岩藻糖基转移酶III、岩藻糖基转移酶IV、岩藻糖基转移酶V、岩藻糖基转移酶VI和岩藻糖基转移酶VII,且在另一方面,EPO在CHO细胞中表达。

进一步提供了治疗患有贫血的哺乳动物的方法,该方法包含给哺乳动物施用具有一个或多个聚糖的在肽上附着有糖缀合物分子的EPO肽,其中EPO是以有效增加哺乳动物中血细胞比容水平的量施用的。在这个和其他实施方案中,哺乳动物是人。

同样提供的是给哺乳动物提供促红细胞生成素治疗的方法,该方法包含施用有效量的糖PEG化的EPO肽,该肽包含EPO肽和至少一个聚糖和至少一个共价附着于聚糖上的聚乙二醇分子,其中聚乙二醇分子是用糖基转移酶添加到EPO上的,其中EPO是以有效增加哺乳动物中血细胞比容水平的量施用的。

此外,提供了治疗患有贫血的哺乳动物的方法,该方法包含给哺乳动物施用糖PEG化的EPO肽,该肽包含EPO肽和至少一个聚糖和至少一个共价附着于聚糖上的聚乙二醇分子,其中聚乙二醇分子是用糖基转移酶添加到EPO上的,其中EPO是以有效增加哺乳动物中血细胞比容水平的量施用的。在一方面,贫血与化学疗法相关。

进一步提供了治疗肾透析患者的方法,该方法包含给患者施用糖PEG化的EPO肽,该肽包含EPO肽和至少一个聚糖和至少一个共价附着于聚糖上的聚乙二醇分子,其中聚乙二醇分子是用糖基转移酶添加到EPO上的,其中EPO是以有效增加患者中血细胞比容水平的量施用的。

附图简述

为了阐明本发明的目的,本发明的某些实施方案在附图中进行了描述。然而,本发明不局限于在附图中描述的实施方案的精确排列和工具。

图1是描述三甘露糖基核心聚糖(左边)和生成具有等分的(bisecting)GlcNAc的聚糖的酶方法(右边)的示意图。

图2是描述基本的三甘露糖基核心结构和各种完成程度的复杂链的示意图。显示了基本的三甘露糖基核心结构从不含有等分的GlcNAc残基的复杂糖类聚糖结构的体外酶促生成方法以及含有等分的GlcNAc的聚糖结构的生成。符号:正方形:GlcNAc;浅色圆圈:Man;黑色圆圈:Gal;三角形:NeuAc。

图3是从具有三甘露糖基核心和等分的GlcNAc(左边)开始酶促生成唾液酸化的聚糖结构(右边)的示意图。

图4是高甘露糖含量的典型聚糖结构(左边)和将该结构还原为基本的三甘露糖基核心结构的酶方法的示意图。在该示意图中,X是作为单糖、寡糖或多糖的甘露糖。

图5是一般在植物细胞中产生的含有岩藻糖和木糖的N-连接的聚糖结构示意图。

图6是一般在昆虫细胞中产生的含有岩藻糖的N-连接的聚糖结构示意图。注意,聚糖可以不具有核心岩藻糖,其可以具有任意一种键的单核心岩藻糖,或者其可以具有一种键占优势的单核心岩藻糖。

图7是描述修剪高甘露糖结构的各种途径和从其中合成复杂的糖链的示意图。符号:正方形:GlcNAc;圆圈:Man;菱形:岩藻糖;五角形:木糖。

图8是描述从基本的三甘露糖基核心结构合成复杂结构的体外策略的示意图。符号:正方形:GlcNAc;浅色圆圈:Man;黑色圆圈:Gal;黑色三角形:NeuAc;GnT:N-乙酰葡糖胺转移酶;GalT:半乳糖基转移酶;ST:唾酸转移酶。

图9是描述合成单触角聚糖和任选对该聚糖进行糖PEG化的两种体外策略的示意图。黑色正方形:GlcNAc;黑色圆圈:Man;浅色圆圈:Gal;黑色三角形:唾液酸。

图10是描述合成单触角聚糖和任选对该聚糖进行糖PEG化的两种体外策略的示意图。黑色正方形:GlcNAc;黑色圆圈:Man;浅色圆圈:Gal;黑色三角形:唾液酸。

图11是描述可从基本的三甘露糖基核心结构合成的各种复杂结构的示意图。符号:正方形:GlcNAc;浅色圆圈:Man;黑色圆圈:Gal;三角形:NeuAc;菱形:岩藻糖;FT和FucT:岩藻糖基转移酶;GalT:半乳糖基转移酶;ST:唾酸转移酶;Le:Lewis抗原;SLe:唾液酸化的Lewis抗原。

图12是制备源自丝氨酸或苏氨酸的O-连接糖肽的示例性示意图。任选地,将水溶性聚合物(WSP)如聚乙二醇添加到最终的聚糖结构中。

图13是一系列描述4类O-聚糖结构的图解,称为核心1~4。核心结构用虚线描绘。

图14,包含图14A和图14B,是一系列表示本发明的示例性实施方案的示意图,其中将包含复杂糖结构和/或高甘露糖结构的糖残基修剪为第一代双触角(the first generation biantennary)的结构。任选地,仅在与GnT I反应之后添加岩藻糖。然后使具有水溶性聚合物(WSP)的修饰的糖与由修剪过程中暴露的一个或多个糖残基缀合。

图15是与图4所示的相似的示意图,其中将高甘露糖结构(highmannose structure)或复合结构“修剪”为甘露糖β-连接的核心,且然后使具有水溶性聚合物的修饰的糖与由修剪过程中暴露的一个或多个糖残基缀合。糖用糖基转移酶按顺序添加。

图16是与图4所示的相似的示意图,其中“修剪”高甘露糖结构或复合结构直至第一个甘露糖所附着的GlcNAc,且然后使具有水溶性聚合物的修饰糖与由修剪过程中暴露的一个或多个糖残基缀合。糖用糖基转移酶按顺序添加。

图17是与图4所示的相似的示意图,其中“修剪”高甘露糖结构或复合结构直至第一个附着到肽的Asn上的GlcNAc,然后使水溶性聚合物与随后已添加的一个或多个糖残基缀合。糖用糖基转移酶按顺序添加。

图18包含图18A和图18B,是任选从高甘露糖结构或复合结构将N-连接的糖进行修剪并随后用具有水溶性聚合物的修饰糖部分(Gal或GlcNAc)进行衍生化的示意图。

图19包含图19A和图19B,是从高甘露糖结构或复合结构将N-连接的糖进行修剪并随后用具有水溶性聚合物的唾液酸部分进行衍生化的示意图。糖用糖基转移酶按顺序添加。

图20是任选从高甘露糖结构或复合结构将N-连接的糖进行修剪并随后用一种或多种唾液酸部分进行衍生化,并用水溶性聚合物衍生化的唾液酸终止的示意图。糖用糖基转移酶按顺序添加。

图21是将O-连接的糖进行“修剪”并随后与具有水溶性聚合物的修饰糖缀合的示意图。在示例性的示意图中,“修剪”糖部分直至第一代双触角结构。

图22例示性显示,对O-连接的糖肽的糖部分进行修剪以产生可用于与在其上附着了水溶性聚合物的修饰糖缀合的甘露糖。

图23包含图23A~图23C,是一系列的示例性示意图。图23A是阐明添加PEG化的糖和随后添加无修饰的糖的示意图。图23B是阐明将超过一种修饰的糖添加到一种聚糖上的示意图。图23C是阐明将不同的修饰的糖添加到O-连接的聚糖和N-连接的聚糖上的示意图。

图24是通过聚糖重构(包括缀合)而改善肽的治疗功能的各种方法的图解。

图25是一套对治疗高歇(Gaucher)病的治疗肽进行聚糖重构的示意图。

图26是进行聚糖重构以生成具有末端甘露糖-6-磷酸部分的聚糖的示意图。

图27是阐明经唾液酸化后在CHO-产生的葡糖脑苷脂酶(CerezymeTM)上的聚糖结构排列的图解。

图28包含图28A~28Z和图28AA~28CC,是本发明方法中所用的肽列表。

图29包含图29A~29G,提供了用于对粒细胞集落刺激因子(G-CSF)上的聚糖结构进行重构的示例性示意图。图29A是描述G-CSF肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所结合的氨基酸残基。图29B~29G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图29A中肽的聚糖进行的预期重构步骤。

图30包含图30A~30EE,给出了对干扰素α上的聚糖结构进行重构的示例性示意图。图30A是描述干扰素α同种型14c肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所结合的氨基酸残基。图30B~30D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图30A中肽的聚糖进行的预期重构步骤的图解。图30E是描述干扰素α同种型14c肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所连接的氨基酸残基。图30F~30N是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图30E中肽的聚糖进行的预期重构步骤的图解。图30O是描述干扰素α同种型2a或2b肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所连接的氨基酸残基。图30P~30W是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图30O中肽的聚糖进行的预期重构步骤的图解。图30X是描述干扰素α-粘蛋白融合肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图30Y~30AA是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图30X中肽的聚糖进行的预期重构步骤的图解。图30BB是描述干扰素α-粘蛋白融合肽和干扰素α肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图30CC~30EE是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图30BB中肽的聚糖进行的预期重构步骤的图解。

图31包含图31A~31S,给出了对干扰素β上的聚糖结构进行重构的示例性示意图。图31A是描述干扰素β肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所连接的氨基酸残基。图31B~31O是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图31A中肽的聚糖进行的预期重构步骤的图解。图31P是描述干扰素β肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所连接的氨基酸残基。图31Q~31S是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图31P中肽的聚糖进行的预期重构步骤的图解。

图32包含图32A~32D,给出了对凝血因子VII和凝血因子VIIa上的聚糖结构进行重构的示例性示意图。图32A是描述凝血因子VII和凝血因子VIIa肽A(实线)和B(虚线)及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图32B~32D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图32A中肽的聚糖进行的预期重构步骤的图解。

图33包含图33A~33G,给出了对凝血因子IX上的聚糖结构进行重构的示例性示意图。图33A是描述凝血因子IX肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图33B~33G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图33A中肽的聚糖进行的预期重构步骤的图解。

图34包含图34A~34J,给出了对促卵泡激素(FSH)(包括α和β亚基)上的聚糖结构进行重构的示例性示意图。图34A是描述促卵泡激素肽FSHα和FSHβ及在其上结合的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图34B~34J是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图34A中肽的聚糖进行的预期重构步骤的图解。

图35包含图35A~35AA,给出了对红细胞生成素(EPO)上的聚糖结构进行重构的示例性示意图。图35A是描述EPO肽及聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图35B~35S是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图35A中肽的聚糖进行的预期重构步骤的图解。图35T是描述EPO肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图35U~35W是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图35T中肽的聚糖进行的预期重构步骤的图解。图35X是描述EPO肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图35Y~35AA是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图35X中肽的聚糖进行的预期重构步骤的图解。

图36包含图36A~36K,给出了对粒细胞巨噬细胞集落刺激因子(GM-CSF)上的聚糖结构进行重构的示例性示意图。图36A是描述GM-CSF肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图36B~36G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图36A中肽的聚糖进行的预期重构步骤的图解。图36H是描述GM-CSF肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图36I~36K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图36H中肽的聚糖进行的预期重构步骤的图解。

图37包含图37A~37N,给出了对干扰素γ肽上的聚糖结构进行重构的示例性示意图。图37A是描述干扰素γ肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图37B~37G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图37A中肽进行的预期重构步骤的图解。图37H是描述干扰素γ肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图37I~37N是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图37H中肽进行的预期重构步骤的图解。

图38包含图38A~38N,给出了对α1-抗胰蛋白酶(ATT或α-1蛋白酶抑制剂)上的聚糖结构进行重构的示例性示意图。图38A是描述ATT肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图38B~38F是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图38A中肽的聚糖进行的预期重构步骤的图解。图38G是描述ATT肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图38H~38J是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图38G中肽进行的预期重构步骤的图解。图38K是描述ATT肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图38L~38N是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图38K中肽进行的预期重构步骤的图解。

图39包含图39A~39J,给出了对葡糖脑苷脂酶上的聚糖结构进行重构的示例性示意图。图39A是描述葡糖脑苷脂酶肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图39B~39F是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图39A中肽的聚糖进行的预期重构步骤的图解。图39G是描述葡糖脑苷脂酶肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图39H~39K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图39G中肽的聚糖进行的预期重构步骤的图解。

图40包含图40A~40W,给出了对组织型血纤维蛋白溶酶原活化因子(TPA)上的聚糖结构进行重构的示例性示意图。图40A是描述TPA肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图40B~40G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图40A中肽进行的预期重构步骤的图解。图40H是描述TPA肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图40I~40K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图40H中肽进行的预期重构步骤的图解。图40L是描述突变的TPA肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图40M~40O是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图40L中肽进行的预期重构步骤的图解。图40P是描述突变的TPA肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图40Q~40S是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图40P中肽进行的预期重构步骤的图解。图40T是描述突变的TPA肽及聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图40U~40W是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图40T中肽进行的预期重构步骤的图解。

图41包含图41A~41G,给出了对白细胞介素-2(IL-2)上的聚糖结构进行重构的示例性示意图。图41A是描述白细胞介素-2肽及在其上连接的示例性聚糖的分子式的图解,显示了聚糖所结合的氨基酸残基。图41B~41G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图41A中肽的聚糖进行的预期重构步骤的图解。

图42包含图42A~42M,给出了对凝血因子VIII上的聚糖结构进行重构的示例性示意图。图42A是结合到凝血因子VIII肽的N-连接糖基化位点(A和A’)和O-连接位点(B)的聚糖的分子式。图42B~42F是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图42A中肽进行的预期重构步骤的图解。图42G是结合到凝血因子VIII肽的N-连接糖基化位点(A和A’)和O-连接位点(B)的聚糖的分子式。图42H~42M是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图42G中肽进行的预期重构步骤的图解。

图43包含图43A~43L,给出了对尿激酶上的聚糖结构进行重构的示例性示意图。图43A是描述尿激酶肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图43B~43F是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图43A中肽的聚糖进行的预期重构步骤的图解。图43G是描述尿激酶肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图43H~43L是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图43G中肽的聚糖进行的预期重构步骤的图解。

图44包含图44A~44J,给出了对人DNase(hDNase)上的聚糖结构进行重构的示例性示意图。图44A是描述人DNase肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图44B~44F是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图44A中肽进行的预期重构步骤的图解。图44G是描述人DNase肽及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图44H~44J是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图44F中肽进行的预期重构步骤的图解。

图45包含图45A~45L,给出了对胰岛素上的聚糖结构进行重构的示例性示意图。图45A是描述突变后含有N糖基化位点的胰岛素肽及在其上连接的示例性聚糖的分子式的图解。图45B~45D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图45A中肽进行的预期重构步骤的图解。图45E是描述胰岛素-粘蛋白融合肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图45F~45H是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图45E中肽进行的预期重构步骤的图解。图45I是描述胰岛素-粘蛋白融合肽和胰岛素肽及聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图45J~45L是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图45I中肽进行的预期重构步骤的图解。

图46包含图46A~46K,给出了对乙型肝炎表面蛋白质的M-抗原(preS和S)(HbsAg)上的聚糖结构进行重构的示例性示意图。图46A是描述M-抗原肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图46B~46G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图46A中肽进行的预期重构步骤的图解。图46H是描述M-抗原肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图46I~46K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图46H中肽进行的预期重构步骤的图解。

图47包含图47A~47K,给出了对人生长激素(包括N、V及其变体)上的聚糖结构进行重构的示例性示意图。图47A是描述人生长激素肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图47B~47D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图47A中肽的聚糖进行的预期重构步骤的图解。图47E是描述包含人生长激素肽和粘蛋白肽的部分或全部的3个融合肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图47F~47K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图47E中肽的聚糖进行的预期重构步骤的图解。

图48包含图48A~48G,给出了对TNF受体-IgG Fc区域融合蛋白质(EnbrelTM)上的聚糖结构进行重构的示例性示意图。图48A是描述可进行突变以含有额外的N糖基化位点的TNF受体-IgG Fc区域融合肽及聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。TNF受体肽以粗线描述,而IgG Fc区域以普通线描述。图48B~48G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图48A中肽进行的预期重构步骤的图解。

图49,包含图49A~49D,给出了抗-HER2单克隆抗体(HerceptinTM)上的聚糖结构进行重构的示例性示意图。图49A是描述经突变含有N糖基化位点的抗-HER2单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的抗体重链上的残基。图49B~49D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图49A中肽的聚糖进行的预期重构步骤的图解。

图50包含图50A~50D,给出了对呼吸道合胞病毒蛋白质F的单克隆抗体(SynagisTM)上的聚糖结构进行重构的示例性示意图。图50A是描述经突变含有N糖基化位点的蛋白质F肽的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图50B~50D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图50A中肽进行的预期重构步骤的图解。

图51包含图51A~51D,给出了对TNF-α的单克隆抗体(RemicadeTM)上的聚糖结构进行重构的示例性示意图。图51A是描述含有N糖基化位点的TNF-α的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图51B~51D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图51A中肽进行的预期重构步骤的图解。

图52包含图52A~52L,给出了对糖蛋白IIb/IIIa的单克隆抗体(ReoproTM)上的聚糖结构进行重构的示例性示意图。图52A是描述经突变含有N糖基化位点的突变的糖蛋白IIb/IIIa肽的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图52B~52D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而进行的预期重构步骤的图解。图52E是描述糖蛋白IIb/IIIa-粘蛋白融合肽的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图52F~52H是基于表达该肽的细胞的类型以及想要的重构聚糖结构而进行的预期重构步骤的图解。图52I是描述糖蛋白IIb/IIIa-粘蛋白融合肽的单克隆抗体和糖蛋白IIb/IIIa肽的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了结合到预期进行重构的聚糖上的残基。图52J~52L是基于表达该肽的细胞的类型以及想要的重构聚糖结构而进行的预期重构步骤的图解。

图53包含图53A~53G,给出了对CD20的单克隆抗体(RituxanTM)上的聚糖结构进行重构的示例性示意图。图53A是描述经突变含有N糖基化位点的CD20的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图53B~53D是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图53A中肽的聚糖进行的预期重构步骤的图解。图53E是描述经突变含有N糖基化位点的CD20的单克隆抗体及在其上连接的示例性聚糖的分子式的图解,显示了连接到预期进行重构的聚糖上的残基。图53F~53G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图53E中肽的聚糖进行的预期重构步骤的图解。

图54包含图54A~54O,给出了对抗凝血酶III(AT III)上的聚糖结构进行重构的示例性示意图。图54A是描述抗凝血酶III肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到N-连接的聚糖上的氨基酸残基。图54B~54G是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图54A中肽的聚糖进行的预期重构步骤的图解。图54H是描述抗凝血酶III肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到N-连接的聚糖上的氨基酸残基。图54I~54K是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图54H中肽的聚糖进行的预期重构步骤的图解。图54L是描述抗凝血酶III肽及在其上连接的示例性聚糖的分子式的图解,显示了连接到N-连接的聚糖上的氨基酸残基。图54M~54O是基于表达该肽的细胞的类型以及想要的重构聚糖结构而对图54L中肽的聚糖进行的预期重构步骤的图解。

图55包含图55A~55J,给出了对人绒毛膜促性腺激素(hCG)α和β亚基上的聚糖结构进行重构的示例性示意图。图55A是描述hCGα和hCGβ肽的图解,显示了结合到预期进行重构的N-连接的聚糖(A)和O-连接的聚糖(B)上的氨基酸残基和聚糖的分子式。图55B~55J是基于表达该肽的细胞的类型以及想要的重构聚糖结构进行的预期重构步骤的图解。

图56包含图56A~56J,给出了对α-半乳糖苷酶(FabrazymeTM)上的聚糖结构进行重构的示例性示意图。图56A是描述α-半乳糖苷酶A肽的图解,显示了结合到预期进行重构的N-连接的聚糖(A)上的氨基酸残基和聚糖的分子式。图56B~56J是基于表达该肽的细胞的类型以及想要的重构聚糖结构进行的预期重构步骤的图解。

图57包含图57A~57J,给出了对α-艾杜糖苷酶(iduronidase)(AldurazymeTM)上的聚糖结构进行重构的示例性示意图。图57A是描述α-艾杜糖苷酶肽的图解,显示了结合到预期进行重构的N-连接的聚糖(A)上的氨基酸残基和聚糖的分子式。图57B~57J是基于表达该肽的细胞的类型以及想要的重构聚糖结构进行的预期重构步骤的图解。

图58包含图58A和58B,是粒细胞集落刺激因子(G-CSF)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:1和2)。

图59包含图59A~59D,是干扰素α(IFN-α)的示例性核苷酸和相应氨基酸序列(分别为图59A和59B,SEQ ID NO:3和4),以及干扰素ω(IFN-ω)的示例性核苷酸和相应氨基酸序列(分别为图59C和59D,SEQ ID NO:74和75)。

图60包含图60A和60B,是干扰素β(IFN-β)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:5和6)。

图61包含图61A和61B,是凝血因子VIIa的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:7和8)。

图62包含图62A和62B,是凝血因子IX的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:9和10)。

图63包含图63A~63D,分别是促卵泡激素(FSH)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:11~14)。

图64包含图64A和64B,是促红细胞生成素(EPO)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:15和16)。

图65是成熟EPO即165个氨基酸的氨基酸序列(SEQ ID NO:73)。

图66包含图66A和66B,是粒细胞-巨噬细胞集落刺激因子(GM-CSF)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:17和18)。

图67包含图67A和67B,是干扰素γ(IFN-γ)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:19和20)。

图68包含图68A和68B,是α-1蛋白酶抑制剂(A-1-PI或α-抗胰蛋白酶)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:21和22)。

图69包含图69A-1~69A-2和69B,是葡糖脑苷脂酶的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:23和24)。

图70包含图70A和70B,是组织型血纤维蛋白溶酶原活化因子(TPA)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:25和26)。

图71包含图71A和71B,是白细胞介素-2(IL-2)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:27和28)。

图72包含图72A-1~71A-4和72B-1~72B-4,分别为凝血因子VIII的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:29和30)。

图73包含图73A和73B,是尿激酶的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:33和34)。

图74包含图74A和74B,是人重组DNase(hrDNase)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:39和40)。

图75包含图75A和75B,是胰岛素分子的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:43和44)。

图76包含图76A和76B,是来自乙型肝炎病毒的S-蛋白质(HBsAg)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:45和46)。

图77包含图77A和77B,是人生长激素(hGH)的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:47和48)。

图78包含图78A和78B,是抗凝血酶III的示例性核苷酸和相应氨基酸序列。78A和78B是“野生型(WT)”抗凝血酶III的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:63和64)。

图79包含图79A~79D,是人绒毛膜促性腺激素(hCG)α和β亚基的示例性核苷酸和相应氨基酸序列。79A和79B是人绒毛膜促性腺激素α亚基的示例性核苷酸和相应氨基酸序列(分别为SEQ IDNO:69和70)。79C和79D是人绒毛膜促性腺激素β亚基的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:71和72)。

图80包含图80A和80B,是α-艾杜糖苷酶的示例性核苷酸和相应氨基酸序列。(分别为SEQ ID NO:65和66)。

图81包含图81A和81B,是α-半乳糖苷酶的示例性核苷酸和相应氨基酸序列。(分别为SEQ ID NO:67和68)。

图82包含图82A和82B,是包含EnbrelTM的部分(肿瘤坏死因子受体(TNF-R)/IgG融合物)的75kDa肿瘤坏死因子(TNF-R)的示例性核苷酸和相应的氨基酸序列(分别为SEQ ID NO:31和32)。

图83包含图83A和83B,分别为HerceptinTM(抗人表皮生长因子受体Her-2的单克隆抗体(MAb))的轻和重链的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:35和36)。

图84包含图84A和84B,分别为SynagisTM(呼吸道合胞病毒F肽的MAb)的重和轻链的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:37和38)。

图85包含图85A和85B,是RemicadeTM(抗TNFα的MAb)的非人类的可变区的示例性核苷酸和相应氨基酸序列(分别为SEQ IDNO:41和42)。

图86包含图86A和86B,是人IgG的Fc部分的示例性核苷酸和相应氨基酸序列(分别为SEQ ID NO:49和50)。

图87是抗糖蛋白IIb/IIIa的鼠抗体成熟可变区轻链的示例性氨基酸序列(SEQ ID NO:52)。

图88是抗糖蛋白IIb/IIIa的鼠抗体成熟可变区重链的示例性氨基酸序列(SEQ ID NO:54)。

图89是人IgG可变区轻链的示例性氨基酸序列(SEQ ID NO:51)。

图90是人IgG可变区重链的示例性氨基酸序列(SEQ ID NO:53)。

图91是人IgG轻链的示例性氨基酸序列(SEQ ID NO:55)。

图92是人IgG重链的示例性氨基酸序列(SEQ ID NO:56)。

图93包含图93A和93B,是抗-CD20的鼠抗体轻链的成熟可变区的示例性核苷酸和相应的氨基酸序列(分别为SEQ ID NO:59和60)。

图94包含图94A和94B,是抗-CD20的鼠抗体重链的成熟可变区的示例性核苷酸和相应的氨基酸序列(分别为SEQ ID NO:61和62)。

图95包含图95A~95E,是串联嵌合抗体表达载体TCAE 8的核苷酸序列(SEQ ID NO:57)。

图96包含图96A~96E,是包含抗-CD20的鼠抗体轻链和重链可变结构域的串联嵌合抗体表达载体TCAE 8的核苷酸序列(SEQ IDNO:58)。

图97包含图97A~97C,是描述对通过PNGaseF从骨髓瘤表达的Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图。聚糖的结构通过存留时间来确定:G0糖形式(glycoform)在30分钟洗脱,G1糖形式在~33分钟洗脱,G2糖形式在大约37分钟洗脱,且S1-G1糖形式在~70分钟洗脱。图97A描述了对DEAE抗体样品的分析。图97B描述了对SPA抗体样品的分析。图97C描述了对Fc抗体样品的分析。在表14中总结了这些曲线图中峰下的面积百分数。

图98包含图98A~98C,是描述对通过PNGaseF从骨髓瘤表达的Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图。聚糖用2-AA进行衍生化然后通过MALDI进行分析。图98A描述了对DEAE抗体样品的分析。图98B描述了对SPA抗体样品的分析。图98C描述了对Fc抗体样品的分析。

图99包含图99A~99D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已对该抗体进行了糖重构(glycoremodeled)以使其含有M3N2糖形式。在图99A中显示了对用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图99B描述了对DEAE抗体样品的分析。图99C描述了对SPA抗体样品的分析。图99D描述了对Fc抗体样品的分析。在表15中总结了这些曲线图中峰下的面积百分数。

图100包含图100A~100D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已对该抗体进行了糖重构以使其含有G0糖形式。在图100A中显示了用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图100B描述了对DEAE抗体样品的分析。图100C描述了对SPA抗体样品的分析。图100D描述了对Fc抗体样品的分析。在表16中总结了这些曲线图中峰下的面积百分数。

图101包含图101A~101C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已对该抗体进行了糖重构以使其含有G0糖形式。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图101A描述了对DEAE抗体样品的分析。图101B描述了对SPA抗体样品的分析。图101C描述了对Fc抗体样品的分析。在表16中总结了这些曲线图中峰下的面积百分数。

图102包含图102A~102C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已对该抗体进行了糖重构以使其含有G0糖形式。释放的聚糖用2-AA进行衍生化然后通过MALDI进行分析。图102A描述了对DEAE抗体样品的分析。图102B描述了对SPA抗体样品的分析。图102C描述了对Fc抗体样品的分析。

图103包含图103A~103D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已对该抗体进行了糖重构以使其含有G2糖形式。在图103A中显示了用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图103B描述了对DEAE抗体样品的分析。图103C描述了对SPA抗体样品的分析。图103D描述了对Fc抗体样品的分析。在表17中总结了这些曲线图中峰下的面积百分数。

图104包含图104A~104C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已对该抗体进行了糖重构以使其含有G2糖形式。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图104A描述了对DEAE抗体样品的分析。图104B描述了对SPA抗体样品的分析。图104C描述了对Fc抗体样品的分析。在表17中总结了这些曲线图中峰下的面积百分数。

图105包含图105A~105C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已对该抗体进行了糖重构以使其含有G2糖形式。释放的聚糖用2-AA进行衍生化然后通过MALDI进行分析。图105A描述了对DEAE抗体样品的分析。图105B描述了对SPA抗体样品的分析。图105C描述了对Fc抗体样品的分析。

图106包含图106A~106D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已通过对M3N2糖形式进行GnT-I处理对该抗体进行了糖重构。在图106A中显示了用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图106B描述了对DEAE抗体样品的分析。图106C描述了对SPA抗体样品的分析。图106D描述了对Fc抗体样品的分析。

图107包含图107A~107C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已通过对M3N2糖形式进行GnT-I处理对该抗体进行了重构。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图107A描述了对DEAE抗体样品的分析。图107B描述了对SPA抗体样品的分析。图107C描述了对Fc抗体样品的分析。

图108包含图108A~108C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已通过对M3N2糖形式进行GnT-I处理对该抗体进行了糖重构。释放的聚糖用2-AA进行衍生化然后通过MALDI进行分析。图108A描述了对DEAE抗体样品的分析。图108B描述了对SPA抗体样品的分析。图108C描述了对Fc抗体样品的分析。

图109包含图109A~109D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已通过对M3N2糖形式进行GnT-I、II和III处理对该抗体进行了糖重构。在图109A中显示了用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图109B描述了对DEAE抗体样品的分析。图109C描述了对SPA抗体样品的分析。图109D描述了对Fc抗体样品的分析。在表18中总结了这些曲线图中峰下的面积百分数。

图110包含图110A~110C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已通过对M3N2糖形式进行GnT-I、II和III处理对该抗体进行了糖重构。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图110A描述了对DEAE抗体样品的分析。图110B描述了对SPA抗体样品的分析。图110C描述了对Fc抗体样品的分析。在表18中总结了这些曲线图中峰下的面积百分数。

图111包含图111A~111C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已通过对NGA2F糖形式进行半乳糖基转移酶处理对该抗体进行了糖重构。释放的聚糖用2-AA进行衍生化然后通过MALDI进行分析。图111A描述了对DEAE抗体样品的分析。图111B描述了对SPA抗体样品的分析。图111C描述了对Fc抗体样品的分析。

图112包含图112A~112D,是描述在GalT1处理前(图112A和112C)和GalT1处理后(图112B和112D)对从含有NGA2F同种型的Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图。图112A和112B描述了对DEAE抗体样品的分析。图112C和112D描述了对Fc抗体样品的分析。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。

图113包含图113A~113C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已通过对G2糖形式进行ST3Gal3处理对该抗体进行了糖重构。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图113A描述了对DEAE抗体样品的分析。图113B描述了对SPA抗体样品的分析。图113C描述了对Fc抗体样品的分析。在表19中总结了这些曲线图中峰下的面积百分数。

图114包含图114A~114C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已通过对G2糖形式进行ST3Gal3处理对该抗体进行了糖重构。释放的聚糖用2-AA进行衍生化,然后通过MALDI进行分析。图114A描述了对DEAE抗体样品的分析。图114B描述了对SPA抗体样品的分析。图114C描述了对Fc抗体样品的分析。

图115包含图115A~115D,是描述对从Cri-IgG1抗体释放的聚糖的毛细管电泳分析的曲线图,已通过对G2糖形式进行ST6Gal1处理对该抗体进行了糖重构。在图115A中显示了用APTS进行衍生化的聚糖标准物的毛细管电泳分析的曲线图。图115B描述了对DEAE抗体样品的分析。图115C描述了对SPA抗体样品的分析。图115D描述了对Fc抗体样品的分析。

图116包含图116A~116C,是描述对从Cri-IgG1抗体释放的聚糖的2-AA HPLC分析的曲线图,已通过对G2糖形式进行ST6Gal1处理对该抗体进行了糖重构。释放的聚糖用2AA进行标记,并通过HPLC在NH2P-504D氨基柱上进行分离。图116A描述了对DEAE抗体样品的分析。图116B描述了对SPA抗体样品的分析。图116C描述了对Fc抗体样品的分析。

图117包含图117A~117C,是描述对从Cri-IgG1抗体释放的聚糖的MALDI分析的曲线图,已通过对G2糖形式进行ST6Gal1处理对该抗体进行了糖重构。释放的聚糖用2-AA进行衍生化然后通过MALDI进行分析。图117A描述了对DEAE抗体样品的分析。图117B描述了对SPA抗体样品的分析。图117C描述了对Fc抗体样品的分析。

图118包含图118A~118E,描述了在非还原条件下对用不同糖形式进行糖重构的Cri-IgG1抗体的SDS-PAGE分析图象。牛血清白蛋白(BSA)在非还原条件下运行作为定量标准物。显示了蛋白质分子量标准物,且其大小以kDa显示。图118A描述对进行了糖重构以含有G0和G2糖形式的DEAE、SPA和Fc Cri-IgG1抗体的SDS-PAGE分析。图118B描述对进行了糖重构以含有NGA2F(二等分的)和GnT-I-M3N2(GnT1)糖形式的DEAE、SPA和Fc Cri-IgG1抗体的SDS-PAGE分析。图118C描述对进行了糖重构以含有S2G2(ST6Gal1)糖形式的DEAE、SPA和Fc Cri-IgG1抗体的SDS-PAGE分析。图118D描述对进行了糖重构以含有M3N2糖形式的DEAE、SPA和FcCri-IgG1抗体以及BSA的SDS-PAGE分析。图118E描述对进行了糖重构以含有Gal-NGA2F(Gal-二等分的)糖形式的DEAE、SPA和Fc Cri-IgG1抗体以及BSA的SDS-PAGE分析。

图119是描述唾液酸化前后TP10的FACE分析结果的丙烯酰胺凝胶图象。BiNA0种类不具有唾液酸残基。BiNA1种类具有1个唾液酸残基。BiNA2种类具有2个唾液酸残基。Bi=双触角的;NA=神经氨酸。

图120是注射入大鼠中的唾液酸化前后的TP10的血浆浓度(μg/ml)一时间曲线图。

图121是对于唾液酸化前后的TP10以μg/hr/ml描述血浆浓度—时间曲线下的面积(AUC)的曲线图。

图122是描述岩藻糖化前后TP10的FACE聚糖分析和CHO细胞产生的TP-20的FACE聚糖分析结果的丙烯酰胺凝胶图象。BiNA2F2种类具有2个神经氨酸(NA)残基和2个岩藻糖残基(F)。

图123是描述在体外(菱形)和在Lec11 CHO细胞中体内(正方形)糖基化的TP20(sCR1sLeX)的体外结合的曲线图。

图124是描述对来自EPO的GlcNAc化的糖形式的2-AA HPLC分析的曲线图。

图125包含图125A和125B,是描述对2批EPO的2-AA HPLC分析的曲线图,已向该EPO中加入了N-乙酰葡糖胺。图125A描述了对A批的分析,图125B描述了对B批的分析。

图126是描述对用GnT-V向EPO引入第三个聚糖分支的反应产物的2-AA HPLC分析的曲线图。

图127是描述用GnT-I、GnT-II、GnT-III、GnT-V和GalT1和适当的供体处理后EPO制剂的聚糖的MALDI-TOF谱曲线图。

图128是描述天然EPO的聚糖MALDI谱的曲线图。

图129是用CMP-SA-PEG(1kDa)和CMP-SA-PEG(10kDa)的PEG化反应产物的SDS-PAGE凝胶图象。

图130是描述PEG化的EPO体外生物测定结果的曲线图。菱形代表来自不具有PEG分子的唾液酸化的EPO的数据。正方形代表用具有PEG(1kDa)的EPO获得的数据。三角形代表用具有PEG(10kDa)的EPO获得的数据。

图131是CHO-表达的EPO的示意图。EPO肽长度为165个氨基酸,没有糖基化的分子量为18kDa。在CHO细胞中产生的糖基化形式的EPO分子量为约33kDa~39kDa。表示聚糖链中糖的形状在图底边的框中给出。

图132是昆虫细胞表达的EPO的示意图。表示聚糖链中糖的形状在图131底边的框中给出。

图133是描述在昆虫细胞中表达的EPO肽的分子量的条线图,该EPO肽被进行重构以形成完全的单-、双-和三触角聚糖,并任选用1kDa、10kDa或20kDa PEG进行糖PEG化。EpoetinTM是表达于哺乳动物细胞中而不进行进一步的聚糖修饰或PEG化的EPO。NESP(AranespTM,Amgen,Thousand Oaks,CA)是具有5个N-连接的聚糖位点的EPO形式,其也表达于哺乳动物细胞中而不进行进一步的聚糖修饰或PEG化。

图134包含图134A和134B,描述对昆虫细胞表达的EPO进行重构和糖PEG化的一种方案。图134A描述将昆虫表达的聚糖重构为单触角糖PEG化聚糖的重构和糖PEG化步骤。图134B描述在多肽的每一个N-连接的聚糖位点均具有完全的糖PEG化单触角聚糖的重构的EPO肽。表示聚糖链中糖的形状在图131底边的框中给出,只是三角形代表唾液酸。

图135是描述EPO-SA和EPO-SA-PEG构建体体外生物活性的曲线图。体外测定测量在加入10.0、5.0、2.0、1.0、0.5和0μg/ml EPO构建体后在RBMI+FBS 10%+GM-CSF(12ng/ml)中维持48小时的TF-1红白血病细胞的增殖。Tri-SA指聚糖为三触角的且具有SA的EPO构建体。Tri-SA 1K PEG指聚糖为三触角的且具有Gal并然后用SA-PEG 1kDa糖PEG化的EPO构建体。Di-SA 10K PEG指聚糖为双触角的且具有Gal并然后用SA-PEG 10kDa糖PEG化的EPO构建体。Di-SA 1K PEG指聚糖为双触角的且具有Gal并然后用SA-PEG 1kDa糖PEG化的EPO构建体。Di-SA指聚糖为双触角的且构建到SA的EPO构建体。EpogenTM是表达于CHO细胞中并不具有进一步的聚糖修饰的EPO。

图136是描述大鼠中EPO构建体的药物代谢动力学的曲线图。将大鼠用[I125]-标记的糖PEG化和非糖PEG化EPO进行推注。曲线图显示注射后0~约72分钟的大鼠血流中放射性标记的EPO的浓度。“Biant-10K”指具有双触角聚糖结构的EPO,该双触角聚糖结构具有末端的10kDa PEG部分。“Mono-20K”指具有单触角聚糖结构的EPO,该单触角聚糖结构具有末端的20kDa PEG部分。NESP指商业上可购得的Aranesp。“Biant-1K”指具有双触角聚糖结构的EPO,该双触角聚糖结构具有末端的1kDa PEG部分。“Biant-SA”指具有双触角聚糖结构的EPO,该双触角聚糖结构具有末端的1kDa部分。72小时时血流中EPO构建体的浓度如下:Biant-10K,5.1cpm/ml;Mono-20K,3.2cpm/ml;NESP,1cpm/ml;及Biant-1K,0.2cpm/ml;Biant-SA,0.1cpm/ml。EPO构建体中曲线下的相对面积如下:Biant-10K,2.9;Mono-20K,2.1;NESP,1;Biant-1K,0.5;及Biant-SA,0.2。

图137是描述EPO构建体在体内刺激网状细胞增多(reticulocytosis)能力的条线图。每一个处理组由8只小鼠组成。给予小鼠10μg蛋白质/kg体重的单次皮下注射。在96小时时测量网状细胞增多百分数。三触角-SA2,3(6)构建体具有以2,3或2,6键结合的SA分子(参见本文的制备实施例18),其中EPO上的聚糖是在其上附着有SA-PEG 10K的三触角聚糖。类似地,双触角-10K PEG是具有在其上附着有10K PEG的SA-PEG的双触角N-聚糖的EPO。

图138是描述EPO构建体在体内增加小鼠血液的血细胞比容能力的曲线图。对CD-1雌性小鼠用2.5μg蛋白质/kg体重进行腹膜内(i.p.)注射。在EPO注射后的第15日测量小鼠的血细胞比容。Bi-1K指聚糖为双触角的且构建到(built out to)Gal并然后用SA-PEG 1kDa糖PEG化的EPO构建体。Mono-20K指聚糖为单触角的且构建到Gal并然后用SA-PEG 20kDa糖PEG化的EPO构建体。

图139包含图139A和139B,描述从在昆虫细胞中表达的EPO(Protein Sciences,Lot#060302)酶促释放的聚糖的分析。图139A描述对释放的聚糖的HPLC分析。图139B描述对释放的聚糖的MALDI分析。菱形表示岩藻糖,正方形表示GlcNAc,圆圈表示甘露糖。

图140描述在GnT-I/GalT-1反应后从EPO释放的聚糖的MALDI分析。聚糖的结构通过与标准聚糖进行峰谱的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖,星形表示半乳糖。

图141描述在GnT-I/GalT-1反应、Superdex 75纯化、与SA-PEG(10kDa)和SA-PEG(20kDa)的ST3Gal3反应后,对EPO的SDS-PAGE分析。

图142描述对PEG化单触角EPO的TF-1细胞体外生物测定的结果。

图143包含图143A和143B,描述在GnT-I/GnT-II反应后从EPO释放的聚糖的分析。图143A描述对释放的聚糖的HPLC分析,其中峰3表示双触角GlcNAc聚糖。图143B描述对释放的聚糖的MALDI分析。聚糖的结构通过与标准聚糖进行峰谱的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖。

图144包含图144A和144B,描述在GalT-1反应后从EPO释放的聚糖的HPLC分析。图144A描述在小规模GalT-1反应后释放的聚糖。图144B描述在大规模GalT-1反应后释放的聚糖。在两个图中,峰1是具有末端半乳糖部分的双触角聚糖,而峰2是不具有末端半乳糖部分的双触角聚糖。

图145描述在GalT-1反应后对EPO种类的Superdex 75层析分离。峰2含有具有双触角聚糖的EPO,该聚糖具有末端的半乳糖部分。

图146描述对制备具有末端半乳糖部分的双触角聚糖的糖重构过程的每一产物的SDS-PAGE分析。

图147描述在ST3Gal3唾液酸化或用SA-PEG(1kDa)和SA-PEG(10kDa)进行PEG化后,对EPO的SDS-PAGE分析。

图148描述在GnT-I/GnT-II反应后从EPO释放的聚糖的HPLC分析。聚糖的结构通过与标准聚糖进行峰滞留的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖。

图149描述在GnT-V反应后从EPO释放的聚糖的HPLC分析。聚糖的结构通过与标准聚糖进行峰滞留的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖。

图150描述在GalT-1反应后从EPO释放的聚糖的HPLC分析。聚糖的结构通过与标准聚糖进行峰滞留的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖,空心圆圈表示半乳糖,且三角形表示唾液酸。

图151描述在ST3Gal3反应后从EPO释放的聚糖的HPLC分析。聚糖的结构通过与标准聚糖进行峰滞留的比较来确定。聚糖的结构描绘在峰的旁边。菱形表示岩藻糖,及正方形表示GlcNAc,圆圈表示甘露糖,空心圆圈表示半乳糖,且三角形表示唾液酸。

图152描述在ST6Gal1反应后从EPO释放的聚糖的HPLC分析。聚糖的结构通过与标准聚糖进行峰滞留的比较来确定。聚糖的结构描绘在峰的旁边。

图153描述对具有双触角和三触角聚糖的EPO的TF-1细胞体外生物测定的结果。“Di-SA”指末端为唾液酸的具有双触角聚糖的EPO。“Di-SA 10K PEG”指末端为用PEG(10kDa)衍生化的唾液酸的具有双触角聚糖的EPO。“Di-SA 1K PEG”指末端为用PEG(1kDa)衍生化的唾液酸的具有双触角聚糖的EPO。“Tri-SA ST6+ST3”指末端为用2,3-SA加帽的2,6-SA的具有三触角聚糖的EPO。“Tri-SA ST3”指末端为2,3-SA的具有三触角聚糖的EPO。

图154是描述脱唾液酸化程序的产物的pI的IEF凝胶图象。泳道1和5是IEF标准物。泳道2是凝血因子IX蛋白质。泳道3是rfactorIX蛋白质。泳道4是rFactor IX蛋白质在20小时的脱唾液酸反应。

图155是描述在与CMP-SA-PEG反应后与SA-PEG(1kDa)或SA-PEG(10kDa)缀合的凝血因子IX的分子量的SDS-PAGE凝胶图象。泳道1和6是SeeBlue+2分子量标准。泳道2是rF-IX。泳道3是脱唾液酸化的rF-IX。泳道4是与SA-PEG(1kDa)缀合的rFactorIX。泳道5是与SA-PEG(10kDa)缀合的rFactor IX。

图156是描述凝血因子IX的直接唾液酸化和凝血因子IX-SA-PEG的唾液酸加帽反应产物的SDS-PAGE凝胶图象。泳道1是蛋白质标准物,泳道2是空白;泳道3是rFactor-IX;泳道4是SA加帽的rFactor-IX-SA-PEG(10kDa);泳道5是rFactor-IX-SA-PEG(10kDa);泳道6是ST3Gal1;泳道7是ST3Gal3;泳道8、9、10是未进行唾液酸酶预先处理的rFactor-IX-SA-PEG(10kDa)。

图157是脱唾液酸(asialo)-凝血因子VIIa的等电聚焦凝胶(pH3-7)的图象。泳道1是rFactor VIIa;泳道2-5是脱唾液酸-凝血因子VIIa。

图158是凝血因子VIIa的MALDI谱的曲线图。

图159是凝血因子VIIa-PEG(1kDa)的MALDI谱的曲线图。

图160是描述凝血因子VIIa-PEG(10kDa)的MALDI谱的曲线图。

图161是PEG化的凝血因子VIIa的SDS-PAGE凝胶图象。泳道1是脱唾液酸-凝血因子VIIa。泳道2是脱唾液酸-凝血因子VIIa和CMP-SA-PEG(1kDa)与ST3Gal3在反应48小时后的产物。泳道3是脱唾液酸-凝血因子VIIa和CMP-SA-PEG(1kDa)与ST3Gal3在反应48小时后的产物。泳道4是脱唾液酸-凝血因子VIIa和CMP-SA-PEG(10kDa)与ST3Gal3在反应96小时后的产物。

图162是描述人垂体FSH脱唾液酸化反应产物的等电聚焦(IEF)凝胶的图象。泳道1和4是等电聚焦(IEF)的标准物。泳道2是天然的FSH。泳道3是脱唾液酸化的FSH。

图163是制备PEG-唾液酸化的rFSH的反应的产物的SDS-PAGE凝胶图象。泳道1和8是SeeBlue+2分子量标准物。泳道2是15μg天然的FSH。泳道3是15μg脱唾液酸-FSH(AS-FSH)。泳道4是15μg AS-FSH与CMP-SA反应的产物。泳道5是15μg AS-FSH与CMP-SA-PEG(1kDa)反应的产物。泳道6是15μg AS-FSH与CMP-SA-PEG(5kDa)反应的产物。泳道7是15μg AS-FSH与CMP-SA-PEG(10kDa)反应的产物。

图164是制备PEG-唾液酸化的FSH的反应的产物的等电聚焦凝胶图象。泳道1和8是IEF标准物。泳道2是15μg天然的FSH。泳道3是15μg脱唾液酸-FSH(AS-FSH)。泳道4是15μg AS-FSH与CMP-SA反应的产物。泳道5是15μg AS-FSH与CMP-SA-PEG(1kDa)反应的产物。泳道6是15μg AS-FSH与CMP-SA-PEG(5kDa)反应的产物。泳道7是15μg AS-FSH与CMP-SA-PEG(10kDa)反应的产物。

图165是在人垂体细胞中产生的天然非重组FSH的SDS-PAGE凝胶图象。泳道1、2和5是SeeBlueTM+2分子量标准物。泳道3和4分别为5μg和25μg的天然FSH。

图166是描述rFSH的脱唾液酸化反应的产物的等电聚焦凝胶(pH 3-7)图象。泳道1和4是IEF标准物。泳道2是天然的rFSH。泳道3是脱唾液酸-rFSH。

图167是描述脱唾液酸-rFSH的PEG-唾液酸化的结果的SDS-PAGE凝胶图象。泳道1是天然的rFSH。泳道2是脱唾液酸-FSH。泳道3是脱唾液酸-FSH与CMP-SA反应的产物。泳道4-7是脱唾液酸-FSH与0.5mM CMP-SA-PEG(10kDa)分别在2小时、5小时、24小时和48小时反应的产物。泳道8是脱唾液酸-FSH与1.0mMCMP-SA-PEG(10kDa)在48小时反应的产物。泳道9是脱唾液酸-FSH与1.0mM CMP-SA-PEG(1kDa)在48小时反应的产物。

图168是表示脱唾液酸-rFSH用CMP-SA-PEG(1kDa)进行PEG-唾液酸化的产物的等电聚焦凝胶图象。泳道1是天然的rFSH。泳道2是脱唾液酸-rFSH。泳道3是脱唾液酸-rFSH与CMP-SA在24小时反应的产物。泳道4-7是脱唾液酸-rFSH与0.5mM CMP-SA-PEG(1kDa)分别在2小时、5小时、24小时和48小时反应的产物。泳道8是空白。泳道9和10是脱唾液酸-rFSH分别与0.5mM和1.0mMCMP-SA-PEG(10kDa)在48小时反应的产物。

图169是rFSH和rFSH-SA-PEG(1KDa和10KDa)的药物代谢动力学的曲线图。该曲线图阐明了糖PEG化的rFSH与非PEG化的rFSH相比,rFSH化合物在大鼠血流中的时间和rFSH化合物在血液中的平均浓度之间的关系。

图170是利用支持细胞的FSH生物测定结果的曲线图。该曲线图阐明了支持细胞温育培养基中FSH的浓度和从支持细胞释放的17-β雌二醇量之间的关系。

图171是描述对糖PEG化和非糖PEG化FSH的Steelman-Pohley生物测定结果的曲线图。用人绒毛膜促性腺激素和各种量的FSH在3日内对大鼠进行皮下注射,在第4日确定处理组的平均卵巢重量。rFSH-SA-PEG指已用PEG(1kDa)进行糖PEG化的重组FSH。rFSH指非糖PEG化的FSH。每一个处理组含有10只大鼠。

图172包含图172A和172B,描述从Superdex-75柱的INF-β洗脱的层析谱。图172A描述整个层析谱。图172B更详细地描述图172A中含有峰4和5的框形区域。

图173包含图173A和173B,描述从INF-β酶促释放的聚糖的MALDI分析。图173A描述对从天然INF-β释放的聚糖的MALDI分析。图173B描述对从脱唾液酸化的INF-β释放的聚糖的MALDI分析。聚糖的结构通过与标准聚糖进行峰谱的比较来确定。聚糖的结构描绘在峰的旁边。正方形表示GlcNAc,三角形表示岩藻糖,圆圈表示甘露糖,菱形表示半乳糖和星形表示唾液酸。

图174描述对脱唾液酸化的INF-β进行唾液酸化的凝集素印迹分析。右侧的印迹用进行了洋地黄毒苷(digoxogenin)(DIG)(RocheApplied Science,Indianapolis,IL)标记的怀槐(Maackia amurensis)凝集素(MAA)进行探测,以探测α2,3-唾液酸化。左侧的印迹用进行了生物素(Vector Laboratories,Burlingame,CA)标记的Erthrinacristagalli凝集素(ECL)进行探测,以探测暴露的半乳糖残基。图175描述INF-β的PEG(10kDa)PEG化反应产物的SDS-PAGE分析。“-PEG”指在PEG化反应之前的INF-β。“+PEG”指在PEG化反应之后的INF-β。

图176描述INF-β的PEG(20kDa)PEG化反应产物的SDS-PAGE分析。“未修饰的”指在PEG化反应之前的INF-β。“PEG化的”指在PEG化反应之后的INF-β。

图177描述从Superdex-200柱的PEG(10kDa)PEG化的INF-β洗脱的层析谱。

图178描述示于图INF-PEG 6层析谱中的PEG(10kDa)PEG化的INF-β峰级分生物测定的结果。

图179描述从Superdex-200柱的PEG(20kDa)PEG化的INF-β洗脱的层析谱。

图180包含图180A和180B,是描述RNaseB的MALDI-TOF谱(图180A)和由N-聚糖酶从RNaseB中切割的寡糖的HPLC特征(图180B)的两个曲线图。该肽的大多数N-糖基化位点是用由5~9个甘露糖残基组成的高甘露糖寡糖修饰的。

图181是描述高甘露糖N-聚糖向杂合N-聚糖转变的示意图。酶1是来自里氏木霉(Trichodoma reesei)或Aspergillus saitoi的α1,2-甘露糖苷酶。酶2是GnT-I(β-1,2-N-乙酰葡糖胺转移酶I)。酶3是GalT-I(β-1,4-半乳糖基转移酶1)。酶4是α2,3-唾酸转移酶或α2,6-唾酸转移酶。

图182包含图182A和182B,是描述用重组里氏木霉α1,2-甘露糖苷酶处理的RNaseB的MALDI-TOF谱(图182A)和由N-聚糖酶从修饰的RNaseB中切割的寡糖的HPLC特征(图182B)的两个曲线图。

图183是描述用从A.saitoi纯化的商业上可购得的α1,2-甘露糖苷酶(Glyko & CalBioChem)处理的RNaseB的MALDI-TOF谱的曲线图。

图184是描述通过用重组GnT-I(GlcNAc转移酶I)处理图182所示的产物得到的修饰的RNaseB的MALDI-TOF谱的曲线图。

图185是描述通过用重组GalT-1(半乳糖基转移酶1)处理图184所示的产物得到的修饰的RNaseB的MALDI-TOF谱的曲线图。

图186是描述通过以CMP-SA作为转移酶供体用重组ST3Gal III(α2,3-唾酸转移酶III)处理图185所示的产物得到的修饰的RNaseB的MALDI-TOF谱的曲线图。

图187包含187A和187B,是描述通过以CMP-SA-PEG(10kDa)作为转移酶供体用重组ST3Gal III(α2,3-唾酸转移酶III)处理图185所示的产物得到的修饰的RNaseB的MALDI-TOF谱的曲线图。

图188是高甘露糖N-聚糖向复合的N-聚糖转变的一系列方案。酶1是来自里氏木霉或Aspergillus saitoi的α1,2-甘露糖苷酶。酶2是GnT-I。酶3是GalT 1。酶4是α2,3-唾酸转移酶或α2,6-唾酸转移酶。酶5是α甘露糖苷酶II。酶6是α甘露糖苷酶。酶7是GnT-II。酶8是α1,6-甘露糖苷酶。酶9是α1,3-甘露糖苷酶。

图189是由N-乙酰葡糖胺转移酶I~VI(GnT-I~VI)催化的连接的图解。R=GlcNAcβ1,4GlcNAc-Asn-X。

图190是SDS-PAGE凝胶的图象:标准物(泳道1);天然运铁蛋白(泳道2);脱唾液酸运铁蛋白(泳道3);脱唾液酸运铁蛋白和CMP-SA(泳道4);泳道5和6,脱唾液酸运铁蛋白和分别为0.5mM和5mM的CMP-SA-PEG(1kDa);泳道7和8,脱唾液酸运铁蛋白和分别为0.5mM和5mM的CMP-SA-PEG(5kDa);泳道9和10,脱唾液酸运铁蛋白和分别为0.5mM和5mM的CMP-SA-PEG(10kDa)。

图191是IEF凝胶的图象:天然运铁蛋白(泳道1);脱唾液酸运铁蛋白(泳道2);脱唾液酸运铁蛋白和CMP-SA,24小时(泳道3);脱唾液酸运铁蛋白和CMP-SA,96小时(泳道4);泳道5和6,分别在24和96小时的脱唾液酸运铁蛋白和CMP-SA-PEG(1kDa);泳道7和8,分别在24和96小时的脱唾液酸运铁蛋白和CMP-SA-PEG(5kDa);泳道9和10,分别在24和96小时的脱唾液酸运铁蛋白和CMP-SA-PEG(10kDa)。

图192是描述在Sprague Dawley大鼠中EPO-SA-PEG(10kDa)、EPO-SA-PEG(20kDa)和NESP对血红蛋白反应的作用的曲线图。通过以每Kg体重50μg蛋白质进行皮下注射给大鼠以施用药物(以箭标显示)。绘图的值为针对从单独用载体注射的对照获得的值进行校正的总血红蛋白基线的平均增加值(n=5/组)。

发明详述

本发明包括以这样的方式向肽分子中添加和/或从肽分子中去除糖的无细胞体外方法和组合物,从而提供具有特定定制的或想要的糖基化模式的糖肽分子,其中该糖肽是以工业规模生产的。在本发明优选的实施方案中,这样制备的糖肽在其上附着了修饰的糖,该修饰的糖是通过酶促反应添加到肽上的。本发明的一个关键的特性是获取由任何细胞类型产生的肽并在该肽上生成核心聚糖结构,随后将聚糖结构在体外进行重构以生成具有适合于在哺乳动物中的治疗应用的糖基化模式的糖肽。更特定地,根据本发明可能的是制备具有修饰的糖分子或在其上缀合的其他化合物的糖肽分子,从而缀合的分子赋予该肽有益的特征。根据本发明,因为缀合物分子向肽的基于酶的添加具有区域选择性和立体选择性的优点,所以将缀合物分子酶促地添加到肽中。糖缀合物可在糖基化完成之前或之后添加到肽上的聚糖上。换句话说,糖缀合和糖基化的顺序可以如本文别处所述的那样有变化。因此可能的是利用在此处提供的方法和组合物对肽进行重构以赋予该肽想要的聚糖,该聚糖优选地为在其上附着有修饰糖的。同样可能的是利用本发明的方法和组合物在工业规模上生成具有想要的和或修饰的聚糖结构的肽分子,因此,第一次向本领域提供了有效生成改善的治疗性肽的实践解决方案。

定义

除非另外有定义,在此处所用的所有技术和科学术语一般具有与本发明所属的领域中技术人员普遍理解的相同的意义。通常,在此处所用的名称和细胞培养、分子遗传学、有机化学和核酸化学和杂交中的实验室程序是那些本领域中众所周知的和普遍采用的。标准的技术应用于核酸和肽合成。该技术和程序通常是根据本领域的常规方法和各种普通的参考文献进行的(如Sambrook等人,1989,MolecularCloning:A Laboratory Manual,2d ed.Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY),该方法和参考文献是提供于本文件全文中的。在此处所用的名称和用于下述的分析化学和有机合成的实验室程序是那些本领域中众所周知的和普遍采用的。将标准的技术或其经修饰的方法用于化学合成和化学分析。

冠词“a”和“an”在此处用于指一种或超过一种(即至少一种)该冠词的语法对象。作为例子,“an element”指一个元件或超过一个元件。

如在此处所用的,术语“抗体”指能够特异性地与抗原上特定的抗原决定部位结合的免疫球蛋白分子。抗体可为源自天然来源或重组来源的完整免疫球蛋白,且也可为完整免疫球蛋白的免疫反应性部分。抗体一般是免疫球蛋白分子的四聚体。本发明中的抗体可以各种形式存在,包括如多克隆抗体、单克隆抗体、Fv、Fab和F(ab)2以及单链抗体和人源化的抗体(Harlow等人,1999,Using Antibodies:ALaboratory Manual,Cold Spring Harbor Laboratory Press NY;Harlow等人,1989,Antibodies:A Laboratory Manual,Cold SpringHarbor,New York;Houston等人,1988,Proc.Natl.Acad.Sci.USA85:5879-5883;Bird等人,1988,Science 242:423-426)。

如在此处所用的,术语“合成抗体”指用重组DNA技术生成的抗体,例如由在此处所述的噬菌体表达的抗体。该术语也可解释为指通过合成编码抗体的DNA分子(该DNA分子表达抗体蛋白质)或编码该抗体的氨基酸序列而生成的抗体,其中该DNA或氨基酸序列已用本领域可用的且众所周知的合成DNA或氨基酸序列的技术获得。

如在此处所用的,术语“有功能的”生物学分子是一定形式的生物学分子,其中在该形式下该分子展示了对其进行表征所依据的特征。例如,有功能的酶是展示对该酶进行表征所依据的特征性催化活性的酶。

如在此处所用的,结构是肽链中氨基酸或氨基酸侧链和聚糖结构连接的点。

“N-连接的”寡糖是那些通过天冬酰胺以天冬酰胺-N-乙酰葡糖胺连接的方式与肽主链连接的寡糖。N-连接的寡糖也称为“N-聚糖”。所有N-连接的寡糖都具有共同的五糖核心Man3GlcNAc2。它们差别在外周糖分支(也称为触角)的存在与否和数目中,如N-乙酰葡糖胺、半乳糖、N-乙酰半乳糖胺、岩藻糖和唾液酸。可选择地,该结构也可含有核心的岩藻糖分子和/或木糖分子。

“基本的三甘露糖核心结构”指只包含三甘露糖核心结构的聚糖部分,而在其上无额外的糖附着。当术语“基本的”不包括于“三甘露糖核心结构”的描述中时,那么该聚糖包含在其上附着有额外的糖的三甘露糖核心结构。可选择地,该结构也可含有核心的岩藻糖分子和/或木糖分子。

术语“基本的三甘露糖核心糖肽”在此处用于指具有主要包含基本的三甘露糖核心结构的聚糖结构的糖肽。可选择地,该结构也可含有核心的岩藻糖分子和/或木糖分子。

“O-连接的”寡糖是那些通过苏氨酸、丝氨酸、羟脯氨酸、酪氨酸或其他含有羟基的氨基酸连接到肽主链上的寡糖。

所有在此处描述的寡糖都是以非还原糖的名称或缩写(即Gal)来表示的,其后为糖苷键的构型(α或β),环键(1或2),键中涉及的还原糖的环位置(2、3、4、6或8)然后为还原糖的名称或缩写(即GlcNAc)。每一个糖都优选地为吡喃糖。对于标准糖生物学命名法综述,参见Essentials of Glycobiology Varki等人eds.,1999,CSHL Press。

术语“唾液酸”指九碳的羧化的糖家族的任何成员。唾液酸家族中最普通的成员是N-乙酰神经氨酸(2-酮-5-乙酰氨基-3,5-双脱氧-D-甘油-D-galactononulopyranos-1-onic acid(常缩写为Neu5Ac、NeuAc或NANA))。该家族的第二个成员是N-乙醇酰-神经氨酸(Neu5Gc或NeuGc),其中NeuAc的N-乙酰基是羟基化的。第三个唾液酸家族成员是2-酮-3-脱氧-nonulosonic acid(KDN)(Nadano等人,(1986)J.Biol.Chem.261:11550-11557;Kanamori等人,J.Biol.Chem.265:21811-21819(1990))。同样包括的是9-取代的唾液酸如9-O-C1-C6酰基-Neu5Ac,如9-O-乳酰基-Neu5Ac或9-O-乙酰基-Neu5Ac、9-脱氧-9-氟-Neu5Ac和9-叠氮-9-脱氧-Neu5Ac。对于唾液酸家族的综述,参见Varki,Glycobiology 2:25-40(1992);Sialic Acids:Chemistry,Metabolism and Function,R.Schauer,Ed.(Springer-Verlag,New York(1992))。唾液酸化合物在唾液酸化过程中的合成和应用公开于1992年10月1日发表的国际申请WO 92/16640中。

如在此处所用的,具有“想要的糖基化”的肽是包含该肽有效的生物学活性所必需的一种或多种寡糖分子的肽。

“疾病”是动物的一种健康状况,其中动物不能维持体内稳态,且其中如果疾病不得到改善,那么动物的健康将继续恶化。

如在此处向患者给予肽药物中所用的,“曲线下的面积”或“AUC”定义为曲线下的总面积,该曲线描述作为从0到无穷大的时间的函数的患者全身循环中药物的浓度。

如在此处向患者给予肽药物中所用的,术语“半衰期”或“t1/2”定义为患者中药物的血浆浓度减少一半所需的时间。依赖于多种清除机制、重新分配和其他本领域中众所周知的机制,可以有超过一个与肽药物相关的半衰期。通常,定义了α半衰期和β半衰期,从而α期与重新分配相关,而β期与清除相关。然而,对于绝大部分限制于血流中的蛋白质药物有至少2个清除半衰期。对于一些糖基化的肽,快速的β期清除可以通过识别末端半乳糖、N-乙酰半乳糖胺、N-乙酰葡糖胺、甘露糖或岩藻糖的内皮细胞或巨噬细胞上的受体介导。慢速的β期清除可以通过对有效半径<2nm的分子(约68kD)的肾小球过滤和/或在组织中特异性或非特异性的摄取和代谢介导。糖PEG化可对末端糖(如半乳糖或N-乙酰半乳糖胺)进行加帽,从而阻断通过识别这些糖的受体的快速α期清除。它也可赋予较大的有效半径,从而降低了分配体积和组织摄取,从而延长了晚β期。因而,糖PEG化对α期和β期半衰期的精确影响将依赖于大小、糖基化状态和其他参数而变化,如在本领域中众所周知的。对“半衰期”的进一步解释可发现于Pharmaceutical Biotechnology(1997,DFA Crommelin and RDSindelar,eds.,Harwood Publisher,Amsterdam,pp 101-120)。

如在此处向患者给予肽药物中所用的,术语“保留时间”定义为在服药后药物在患者体内存留的平均时间。

“分离的核酸”指已从在天然存在的状态时在两侧与其相接的序列中分离的核酸区段或片段,如已从正常时在侧面与该片段相接的序列中取出的DNA片段,该序列如在天然存在的基因组中与该片段在侧面相接的序列。该术语也应用于已基本从天然地与核酸伴随的其他成分中纯化的核酸,如在细胞中天然与核酸伴随的RNA或DNA或蛋白质。因此该术语也包括如整合入载体中的、或整合入自主复制质粒或病毒中的、或整合入原核生物或真核生物基因组DNA中的、或作为不依赖于其他序列的单独分子(如由PCR或限制性酶消化产生的cDNA或基因组或cDNA片段)存在的重组DNA。它也包括作为编码额外的肽序列的杂交核酸的一部分的重组DNA。

“多核苷酸”指单链或平行和反平行链的核酸。因而,多核苷酸可为单链的或双链的核酸。

术语“核酸”一般指大的多核苷酸。术语“寡核苷酸”一般指短的多核苷酸,通常不超过约50个核苷酸。

在此处将常规符号用于描述多核苷酸序列:单链多核苷酸序列的左手末端是5’-末端;双链多核苷酸序列的左手方向称为5’-方向。从5’到3’向新生RNA转录物添加核苷酸的方向称为转录方向。与mRNA具有相同序列的DNA链称为“编码链”;DNA链上位于DNA上参考位点5’的序列称为“上游序列”;DNA链上位于DNA上参考位点3’的序列称为“下游序列”。

“编码”指多核苷酸(如基因、cDNA或mRNA)中特定核苷酸序列充当模板用于在生物学过程中合成其他聚合物和大分子的固有特征,该聚合物和大分子具有限定的核苷酸序列(即rRNA、tRNA和mRNA)或限定的氨基酸序列和从中产生的生物学特征。因而,如果相应于核酸的mRNA的转录和翻译在细胞或其他生物学系统中产生了蛋白质,则该核酸序列编码该蛋白质。编码链和非编码链均可以称为编码该核酸或cDNA的蛋白质或其他产物,其中编码链的核苷酸序列与mRNA的序列相同且通常在序列表中提供,而非编码链用作模板以转录基因或cDNA。

除非另外有定义,“编码氨基酸序列的核苷酸序列”包括所有编码相同氨基酸序列的相互为简并形式的核苷酸序列。编码蛋白质和RNA的核苷酸序列可包括内含子。

如在此处所用的,“同源”指两个聚合物分子之间的亚基序列相似性,如两个核酸分子之间,如两个DNA分子或两个RNA分子之间,或两个肽分子之间的。当两个分子中的亚基位置由相同的单体亚基占据时,例如,如果两个DNA分子中的某一位置都由腺嘌呤占据时,则它们在该位置是同源的。两个序列之间的同源性是匹配数或同源位置数的正函数,例如,如果两个化合物序列中一半的位置(如长度为10个亚基的聚合物中的5个位置)是同源的,那么两个序列是50%同源的,如果90%的位置如10个中的9个是匹配或同源的,则两个序列具有90%的同源性。例如,DNA序列3’ATTGCC5’和3’TATGGC具有50%的同源性。

如在此处所用的,“同源性”是与“一致性”同义使用的。

对两个核苷酸或氨基酸序列之间百分比一致性的确定可用数学算法来实现。例如,用于比较两个序列的数学算法是Karlin和Altschul(1990,Proc.Natl.Acad.Sci.USA 87:2264-2268)的算法,进一步被Karlin和Altschul修改(1993,Proc.Natl.Acad.Sci.USA 90:5873-5877)。该算法整合入Altschul等人(1990,J.Mol.Biol.215:403-410)的NBLAST和XBLAST程序中,且可从如国家生物技术信息中心(National Center for Biotechnology Information)(NCBI)的全球互联网站点上获取,该站点具有通用资源位置http://www.ncbi.nlm.nih.gov/BLAST/。BLAST核苷酸搜索可用NBLAST程序(在NCBI互联网站点上命名为“blastn”)进行,应用如下参数:缺口罚分=5;缺口延伸罚分=2;错配罚分=3;匹配奖分=1;预期值10.0;和字串大小=11,以获得与在此处描述的核酸同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(在NCBI互联网站点上命名为“blastn”)或NCBI的“blastp”程序进行,应用如下参数:预期值10.0;BLOSUM62记分矩阵,以获得与在此处描述的蛋白质分子同源的氨基酸序列。为了获得用于比较目的的有缺口的比对,可应用如在Altschul等人(1997,Nucleic Acids Res.25:3389-3402)中描述的Gapped BLAST。可选择地,可将PSI-Blast或PHI-Blast用于进行重复的搜索,该重复搜索探测分子间较远的关系(Id.)和具有共同模式的分子间的关系。当应用BLAST、Gapped BLAST、PSI-Blast和PHI-Blast程序时,可应用各个程序(如XBLAST和NBLAST)的默认参数。参见http://www.ncbi.nlm.nih.gov。

两个序列间的百分比一致性可用与上述那些相似的允许或不允许缺口的技术确定。在计算百分比一致性时,计算典型的精确匹配。

编码肽的“异源核酸表达单位”定义为具有可操作地与一种或多种表达控制序列如启动子和/或抑制物序列连接的目标肽编码序列的核酸,且其中至少一个序列是异源的,即通常不发现于宿主细胞中。

两个多核苷酸“可操作地连接”指两个多核苷酸在核酸部分中以这样的方式排列,从而两个多核苷酸的至少一个能够对另一个发挥其特征性的生理学作用。例如,可操作地连接到核酸编码区的启动子能够启动编码区的转录。

如在此处所用的,术语“启动子/调节序列”指可操作地与该启动子/调节序列连接的基因产物的表达所必需的核酸序列。在一些例子中,该序列可为核心启动子序列,而在其他例子中,该序列也可包括基因产物表达所必需的增强子序列和其他调节元件。例如,启动子/调节序列可为以组织特异性方式表达基因产物的序列。

“组成型”启动子是在细胞中以不变的方式启动与其可操作地连接的基因的表达的启动子。例如,启动细胞的管家基因的表达的启动子可认为是组成型启动子。

“诱导型”启动子是一种核苷酸序列,当该核苷酸序列与编码或限定基因产物的多核苷酸可操作地连接时,基本上仅当相应于该启动子的诱导物存在于细胞中时可导致基因产物在活细胞中产生。

“组织特异性”启动子是核苷酸序列,当该核苷酸序列与编码或限定基因产物的多核苷酸可操作地连接时,基本上仅当该细胞是相应于该启动子的组织类型的细胞时可导致基因产物在活细胞中产生。

“载体”是包含分离的核酸且可用于将分离的核酸送递入细胞内部的物质组成。本领域中已知有许多载体,包括但不局限于线性多核苷酸、与离子型或两性分子的化合物相关的多核苷酸、质粒和病毒。因而,术语“载体”包括自主复制的质粒或病毒。该术语也可解释为包括能够促进核酸向细胞转移的非质粒和非病毒化合物,如多赖氨酸化合物、脂质体等。病毒载体的例子包括但不局限于腺病毒载体、腺伴随病毒载体、反转录病毒载体等。

“表达载体”指包含重组多核苷酸的载体,该重组多核苷酸包含可操作地与要表达的核苷酸序列连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件;其他用于表达的元件可由宿主细胞或在体外表达系统中提供。表达载体包括所有那些本领域中公知的,如整合了重组多核苷酸的粘粒、质粒(如裸露的或包含于脂质体中的)和病毒。

“基因工程加工的”或“重组的”细胞是对细胞的遗传材料进行了一种或多种修饰的细胞。这种修饰可包括但不局限于插入遗传材料、删除遗传材料和插入不管能否稳定保持的染色体外的遗传材料。

“肽”是寡肽、多肽、肽、蛋白质或糖蛋白。当糖分子在其上附着时,此处术语“肽”的应用包括具有在其上附着的糖分子的肽。

如在此处所用的,“天然形式”指由细胞和/或生物产生的肽的形式,其中在天然状态下所述肽是发现于所述细胞或生物中的。当该肽由多个细胞和/或生物产生时,该肽可具有各种天然形式。

“肽”指其中单体为氨基酸且通过酰胺键连接在一起的聚合物,该酰胺键可选择地称为肽键。可选择地,也包括非天然的氨基酸如β-丙氨酸、苯甘氨酸和高精氨酸。非核酸编码的氨基酸也可用于本发明中。此外,在本发明中也可应用已进行修饰而包括反应基团、糖基化位点、聚合物、治疗部分、生物分子等的氨基酸。在本发明中所用的所有氨基酸可为其D-或L-异构体。L-异构体通常是优选的。此外,在本发明中也可应用其他肽模拟物。如在此处所用的,“肽”指糖基化的和非糖基化的肽。同样包括的是由表达该肽的系统不完全糖基化的肽。对于一般的综述,参见Spatola,A F.,Chemistry and Biochemistry of AminoAcids,Peptides and Proteins,B.Weinstein,eds.,Marcel Dekker,New York,p.267(1983)。

术语“肽缀合物”指本发明的种类(species),其中肽与在此处提出的修饰的糖缀合。

术语“氨基酸”指天然存在的和合成的氨基酸,以及以与天然存在的氨基酸相似的方式发挥功能的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是那些由遗传密码编码的,以及那些后来进行修饰的氨基酸,如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指与天然氨基酸具有相同的基本化学结构的化合物,即与氢连接的α碳、羧基、氨基和R基团,如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这种类似物具有修饰的R基团(如正亮氨酸)或修饰的肽主链,但保持了与天然存在的氨基酸相同的基本化学结构。氨基酸模拟物指具有与氨基酸的普遍化学结构不同的结构的化学化合物,但该化合物以与天然存在的氨基酸相似的方式发挥功能。

如在此处所用的,氨基酸以其完整名称、相应的三字母编码或相应的单字母编码表示,如在下面表1中所示的:

表1.氨基酸及三字母和单字母编码

  完整名称  三字母编码  单字母编码  天冬氨酸  谷氨酸  赖氨酸  精氨酸  组氨酸  酪氨酸  半胱氨酸  天冬酰胺  谷氨酰胺  丝氨酸  苏氨酸  甘氨酸  丙氨酸  缬氨酸  亮氨酸  异亮氨酸  甲硫氨酸  脯氨酸  苯丙氨酸  色氨酸  Asp  Glu  Lys  Arg  His  Tyr  Cys  Asn  Gln  Ser  Thr  Gly  Ala  Val  Leu  Ile  Met  Pro  Phe  Trp  D  E  K  R  H  Y  C  N  Q  S  T  G  A  V  L  I  M  P  F  W

本发明也提供了包含上述蛋白质的蛋白质或肽的类似物。类似物与天然存在的蛋白质或肽差别在于保守的氨基酸序列的差异或不影响序列的修饰,或者为两者。例如,可进行保守的氨基酸改变,该改变尽管改变了蛋白质或肽的一级序列,但通常不改变其功能。保守的氨基酸替代一般包括下面组内的替代:

甘氨酸、丙氨酸;

缬氨酸、异亮氨酸、亮氨酸;

天冬氨酸、谷氨酸;

天冬酰胺、谷氨酰胺;

丝氨酸、苏氨酸;

赖氨酸、精氨酸;

苯丙氨酸、酪氨酸。

修饰(通常不改变一级序列)包括肽的体内或体外化学衍生化,如乙酰化或羧化。同样包括的是糖基化修饰,如通过在其合成和加工或在进一步的加工步骤中对肽的糖基化模式进行修饰而进行的;如通过将肽暴露于影响糖基化的酶如哺乳动物糖基化或脱糖基化酶而进行的。同样包含的是具有磷酸化的氨基酸残基的序列,如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸。

当然,应该理解的是肽可整合进行了修饰但不影响活性的氨基酸残基。例如,可对末端进行衍生化以包括封闭基团,即适合于保护和/或稳定N-和C-末端不受“不想要的降解”的化学取代基,该“不想要的降解”是包含在末端进行的可能影响化合物功能的任何类型的对化合物的酶促、化学或生物化学破坏,即在化合物的末端依次进行的降解。

封闭基团包括常规地用于肽化学领域的保护基团,该基团不对肽的体内活性产生不利影响。例如,适当的N-末端封闭基团可通过对N-末端的烷基化或酰基化而引入。适当的N-末端封闭基团的例子包括C1-C5分支或不分支的烷基基团、酰基基团如甲酰基和乙酰基基团及其取代的形式,如乙酰氨基甲基(Acm)、Fmoc或Boc基团。氨基酸的脱氨类似物也是有用的N-末端封闭基团,且可与肽的N-末端偶联或用于替代N-末端残基。适当的C-末端封闭基团包括酯、酮和酰胺,其中整合了或未整合C-末端的羧基基团。形成酯或酮的烷基基团,特别是低级烷基基团如甲基、乙基和丙基,和形成酰胺的氨基基团如伯胺(-NH2),以及单-和双-烷基氨基基团如甲基氨基、乙基氨基、二甲基氨基、二乙基氨基、甲基乙基氨基等是C-末端封闭基团的例子。脱羧基的氨基酸类似物如精胺也是有用的C-末端封闭基团且可用于与肽的C-末端偶联或用于替代该末端。进一步地,应该理解的是末端的游离氨基和羧基基团可一起从肽中去除以获得其脱氨基和脱羧基的形式而不影响肽活性。

也可整合其他的修饰而不不利地影响活性,且这些修饰包括但不局限于D-异构型氨基酸对一个或多个天然的L-异构型氨基酸的取代。因而,肽可包括一个或多个D-氨基酸残基,或可包含全部为D-形式的氨基酸。根据本发明的肽的反转型(retro-inverso)也可使用,例如反向(inverted)的肽(其中所有的氨基酸均被D-氨基酸形式取代)。

也预期本发明的酸加成盐是功能等价物。因而用无机酸或有机酸处理本发明的肽以提供肽的水溶性盐适用于本发明,其中无机酸如氢氯酸、氢溴酸、硫酸、硝酸、磷酸等,有机酸如乙酸、丙酸、乙醇酸、丙酮酸、草酸、苹果酸、琥珀酸、马来酸、延胡索酸、酒石酸、柠檬酸、苯甲酸、桂皮酸、扁桃酸、甲磺酸、乙磺酸、对甲苯磺酸、唾液酸等。

同样包括的是已用普通的分子生物学技术进行修饰的肽,从而改善其对蛋白酶降解的抗性或使溶解性质最适化或使其更适合于用作治疗剂。这种肽的类似物包括那些含有除天然存在的L-氨基酸之外的残基的,如D-氨基酸或非天然存在的合成氨基酸。本发明的肽不局限于在此处所列的任何特定的示例性方法的产物。

如在此处所用的,术语“MALDI”是基质辅助的激光解吸电离的缩写。在电离中,SA-PEG(唾液酸-聚(乙二醇))可部分地从糖蛋白的N-聚糖结构上去除。

如在此处所用的,术语“糖基转移酶”指具有将供体糖转移到受体部分上的能力的任何酶/蛋白质。

如在此处所用的,术语“修饰的糖”指在本发明的方法中酶促添加到氨基酸或肽的糖基残基上的天然或非天然存在的糖。修饰的糖选自许多酶底物,包括但不局限于糖核苷酸(单-、二-和三-磷酸)、活化的糖(如糖基卤化物、糖基甲磺酸)和既非活化的也非核苷酸的糖。

“修饰的糖”是用“修饰基团”共价地功能化的。有用的修饰基团包括但不局限于水溶性聚合物、治疗部分、诊断部分、生物分子等。用修饰基团进行功能化的位置是这样选择的,从而不防止“修饰的糖”酶促地添加到肽上。

术语“水溶性”指在水中具有一些可探测的溶解性程度的部分。探测和/或定量水溶性的方法是本领域中众所周知的。示例性的水溶性聚合物包括肽、糖、聚(醚)、多(胺)、聚(羧酸)等。肽可具有混合的序列或只由单种氨基酸组成,如聚(赖氨酸)。类似地,糖可为混合的序列或只由单种糖亚单位组成,如葡聚糖、直链淀粉、脱乙酰壳多糖和聚(唾液酸)。示例性的聚(醚)是聚(乙二醇)。聚(乙烯亚胺)是示例性的多胺,且聚(天冬氨)酸是代表性的聚(羧酸)。

“聚环氧烷”指具有聚醚主链的一类化合物。在本发明中应用的聚环氧烷种类包括如直链和支链种类。此外,示例性的聚环氧烷的末端可以为一个或多个反应性的、可活化的或惰性的部分。例如,聚环氧烷是由重复的环氧乙烷亚单位组成的聚环氧烷,其在每一末端包括或不包括额外的反应性的、可活化的或惰性的部分。有用的聚环氧烷种类包括那些一个末端被惰性基团“加帽”的种类,如单甲氧基-聚环氧烷。当分子是分支的种类时,在环氧烷链的末端可包括多个反应性的、可活化的或惰性的基团,且反应性基团可以相同或不同。异双功能的直链聚环氧烷种类的衍生物也是本领域中公知的。

如在此处所用的,术语“糖基连接基团”指试剂(如水溶性聚合物、治疗部分、生物分子)共价附着的糖基残基。在本发明的方法中,“糖基连接基团”共价附着到糖基化的或非糖基化的肽上,从而将试剂连接到肽上的氨基酸和/或糖基残基上。“糖基连接基团”通常通过“修饰的糖”向肽上的氨基酸和/或糖基残基上的酶促附着而源自“修饰的糖”。更具体的,如在此处所用的,“糖基连接基团”指共价结合如此处所讨论的“修饰基团”和肽的氨基酸残基的部分。糖基连接基团-修饰基团加成物具有作为酶底物的结构。以糖基连接基团-修饰基团加成物为底物的酶通常是那些能够将糖基部分转移到肽的氨基酸残基上的酶,如糖基转移酶、酰胺酶、糖苷酶、反式唾液酸酶等。“糖基连接基团”插入“修饰基团”和肽的氨基酸残基之间并与其共价结合。

“完整的糖基连接基团”指源自糖基部分的连接基团,其中与缀合物连接的单个糖单体不是降解的,如氧化的(如通过偏高碘酸钠)。本发明的“完整的糖基连接基团”可通过添加糖基单位或从亲体糖结构上去除一个或多个糖基单位而源自天然存在的寡糖。示例性的“完整的糖基连接基团”包括至少一个完整的(如非降解的)糖基部分,该部分共价附着于肽上的氨基酸残基上。“连接基团”的剩余部分可以具有基本任何结构。例如,修饰基团任选直接与完整的糖基部分连接。可选择地,修饰基团通过连接体臂连接于完整的糖基部分。连接体臂可具有可用于选择的实施方案中的基本任何结构。在一个示例性实施方案中,连接体臂是一个或多个完整的糖基部分,即,“完整的糖基连接基团”类似一个寡糖。另一个示例性完整的糖基连接基团是其中直接或间接附着于完整的糖基部分的糖基部分被降解或衍生化(如,高碘酸盐氧化,随后为还原性氨基化)的基团。另一个连接体臂包括直接或间接通过交联剂附着于完整的糖基部分的修饰基团,如那些在此处所述的基团及其类似物。

如在此处所用的,“降解”指从糖基部分去除一个或多个碳原子。

如在此处所用的,术语“导向部分”和“导向试剂”指选择性地定位于身体的特定组织或区域的种类。该定位是由对分子决定因素的特定识别、导向试剂或缀合物的分子大小、离子相互作用、疏水相互作用等介导的。其他将试剂导向到特定组织或区域的机制是本领域技术人员公知的。

如在此处所用的,“治疗部分”指任何用于治疗的试剂,包括但不局限于抗生素、抗炎症剂、抗肿瘤药物、细胞毒素和放射性试剂。“治疗部分”包括生物活性剂的前体药物,即一种构建体,其中超过一种治疗部分连接到载体如多价试剂上。治疗部分也包括肽和包括该肽的构建体。示例性的肽包括那些在此处公开于图28和表6和7中的。因而,“治疗部分”意思为任何用于治疗的试剂,包括但不局限于抗生素、消炎剂、抗肿瘤药物、细胞毒素和放射性试剂。“治疗部分”包括生物活性试剂的前体药物,即其中超过一种治疗部分连接于载体的构建体如多价试剂。

如在此处所用的,“抗肿瘤药物”指任何用于对抗癌症的试剂,包括但不局限于细胞毒素和如抗代谢物、烷基化剂、安慈拉环素、抗生素、抗有丝分裂剂、普鲁苄肼、羟脲、天冬酰胺酶、皮质类固醇、干扰素和放射性试剂之类的试剂。同样包含于术语“抗肿瘤药物”范畴内的是肽与抗肿瘤活性物如TNF-α的缀合物。缀合物包括,但不局限于那些在治疗性蛋白质和本发明的糖蛋白质之间形成的。代表性的缀合物是在PSGL-1和TNF-α之间形成的。

如在此处所用的,“细胞毒素或细胞毒素剂”指任何对细胞有害的试剂。例子包括紫杉醇、细胞松弛素B、短杆菌肽D、溴化乙锭、吐根碱、丝裂霉素、表鬼臼毒吡喃葡糖苷、表鬼臼毒噻吩糖苷(tenoposide)、长春花新碱、长春花碱、秋水仙素、阿霉素、道诺红菌素、二羟anthracinedione、米托蒽醌、普卡霉素、放线菌素D、1-脱氢睾甾酮、糖皮质激素、普鲁卡因、丁卡因、利度卡因、普萘洛尔和嘌罗霉素及其类似物或同系物。其他毒素包括如蓖麻毒蛋白、CC-1065和类似物倍癌霉素。另外其他的毒素包括白喉毒素和蛇毒液(如眼镜蛇毒液)。

如在此处所用的,“放射性试剂”包括任何在诊断或破坏肿瘤中有效的放射性同位素。例子包括但不局限于铟-111、钴-60和锝。此外,一般代表放射性同位素混合物的天然存在的放射性元素如铀、镭和钍是放射性试剂的适当的例子。金属离子一般是与有机螯合部分螯合的。

许多有用的螯合基团、冠醚、穴状配体等是本领域中公知的且可整合入本发明的化合物中(如EDTA、DTPA、DOTA、NTA、HDTA等及其磷酸盐类似物如DTPP、EDTP、HDTP、NTP等)。参见如Pitt等人,“The Design of Chelating Agents for the Treatment of IronOverload”,Inorgnic Chemistry in Biology and Medicine;Martell,Ed.;American Chemistry Society,Washington,D.C.,1980,pp.279-312;Lindoy,The Chemistry of Macrocyclic Ligand Complexes;Cambridge University Press,Cambridge,1989;Dugas,BioorganicChemistry;Springer-Verlag,New York,1989,及在其中含有的参考文献。

此外,使得螯合剂、冠醚和环化糊精向其他分子附着的多种途径是本领域技术人员可获得的。参见如Meares等人,“Properties of InVivo Chelate-Tagged Proteins and Polypeptides”,Modification ofProteins:Food,Nutritional and Pharmacological Aspects;Feeney等人,Eds.,American Chemical Society,Washington,D.C.,1982,pp.370-387;Kasina等人,Bioconjugate Chem.,9:108-117(1998);Song等人,Bioconjugate Chem.,8:249-255(1997)。

如在此处所用的,“药物可接受的载体”包括任何材料,该材料当与缀合物结合时保持缀合物的活性,且与被试者的免疫系统是非反应性的。例子包括但不局限于任何标准的药物载体,如磷酸缓冲的盐溶液、水、乳剂如油/水乳剂和各种类型的润湿剂。其他载体也可包括无菌的溶液、片剂(包括包被的片剂)和胶囊。一般这种载体含有赋形剂,如淀粉、奶、糖、某些类型的粘土、明胶、硬脂酸及其盐、硬脂酸镁或硬脂酸钙、滑石、植物脂肪或油、树胶、乙二醇或其他已知的赋形剂。这种载体也可包括香料和颜色添加剂或其他成分。包含这种载体的组合物是用众所周知的常规方法制备的。

如在此处所用的,“给予”指向被试者的口服给予、作为栓剂的给予、局部接触、静脉内的、腹膜内的、肌内的、病灶内的(intralesional)、鼻内的或皮下的给予、鞘内给予或缓慢释放设备的植入,如小渗透泵(mini-osmotic pump)。

术语“分离的”指基本上不含有用于制备该材料的成分的材料。对于本发明的肽缀合物,术语“分离的”指基本上不含有通常在用于制备肽缀合物的混合物中与该材料相伴的成分的材料。“分离的”和“纯的”可互换使用一般地,本发明分离的肽缀合物具有优选地表达为一个范围的纯度水平。该纯度范围的下限是约60%、约70%或约80%,而该纯度范围的上限是约70%、约80%、约90%或超过约90%。

当肽缀合物为超过约90%纯时,其纯度也优选地表达为一个范围。该纯度范围的下限是约90%、约92%、约94%、约96%或约98%,而该纯度范围的上限是约92%、约94%、约96%、约98%或约100%。

纯度是用任何本领域认可的分析方法确定的(如银染凝胶上的条带亮度、聚丙烯酰胺凝胶电泳、HPLC或类似的方法)。

如在从此处所用的,“商业规模”指在方法中产生约1克或几克终产物。

如在此处所用的,“群体的基本每一个成员”指本发明肽缀合物群体的特征,其中将添加到肽上的选定百分比的修饰的糖添加到肽上多个相同的受体位点上。“群体的基本每一个成员”提及与修饰的糖缀合的肽上位点的“同质性”,并涉及本发明至少约80%、优选地为至少约90%且更优选地为至少约95%同质的缀合物。

“同质性”指修饰的糖所缀合的受体部分群体中的结构一致性。因而,在本发明的肽缀合物中,其中每一个修饰的糖部分与受体位点缀合,并且该受体位点具有与每一个其他的修饰的糖所缀合的受体位点相同的结构,该肽缀合物则称为是约100%同质的。同质性一般表达为一个范围。肽缀合物同质性范围的下限是约60%、约70%或约80%,而纯度范围的上限是约70%、约80%、约90%或超过约90%。

当肽缀合物为超过或等于约90%同质的时,其同质性也优选地表达为一个范围。该同质性范围的下限是约90%、约92%、约94%、约96%或约98%,而该纯度范围的上限是约92%、约94%、约96%、约98%或约100%。肽缀合物的纯度一般用一种或多种本领域技术人员公知的方法确定,如液相层析-质谱分析法(LC-MS)、基质辅助的激光解吸飞行时间质谱分析法(MALDI-TOF)、毛细管电泳等。

当涉及糖肽时,“基本统一的糖形式”或“基本统一的糖基化模式”指由目标糖基转移酶(如岩藻糖基转移酶)进行糖基化的受体部分的百分比。例如,在α1,2-岩藻糖基转移酶的情况下,如果本发明的肽缀合物中基本所有的(如在下面定义的)Galβ1,4-GlcNAc-R及其唾液酸化类似物均被岩藻糖基化,则存在基本统一的岩藻糖基化模式。本领域技术人员可以理解起始材料可含有糖基化的受体部分(如岩藻糖基化的Galβ1,4-GlcNAc-R部分)。因而,计算的糖基化百分比将包括由本发明的方法糖基化的受体部分以及在起始材料中已经糖基化的那些受体部分。

在上述对“基本统一的”定义中的术语“基本”通常指特定糖基转移酶的受体部分的至少约40%、至少约70%、至少约80%、或更优选地至少约90%且更加优选地至少约95%是糖基化的。

发明描述

I.重构聚糖链的方法

本发明包括以这样的方式在体外向糖肽分子添加糖和/或从糖肽分子中删除糖的方法和组合物,从而提供具有特定定制的或想要的糖基化模式的肽分子,优选地包括在其上添加修饰的糖。因此本发明的一个关键特征是获取由任何细胞类型产生的肽并在该肽上生成核心聚糖结构,随后将聚糖结构在体外进行重构以生成具有适合于在哺乳动物中的治疗应用的糖基化模式的肽。

肽的糖基化模式的重要性是本领域中众所周知的,正如现有的生产适当糖基化的肽的体内方法的局限性也是众所周知的,特别是当这些肽用重组DNA方法生产时。此外,直到本发明,尚不可能生成在其上具有想要的聚糖结构的糖肽,其中该肽可在工业规模上生产。

在本发明中,将由细胞产生的肽在体外通过系统地添加适当的酶及其底物而进行酶处理,从而不应该存在于肽上的糖部分可被去除,而应该添加到肽上的糖部分(可选择地包括修饰的糖)则以这样的方式添加到肽上,从而提供具有如在别处所定义的“想要的糖基化”的糖肽。

A.重构N-连接聚糖的方法

在一方面,本发明利用如下事实,即大多数具有商业意义或药物意义的肽包含共同的在此处称为三甘露糖核心的五糖结构,该结构与肽链上Asn-X-Ser/Thr序列中的天冬酰胺进行N-连接。基本的三甘露糖核心基本由附着到肽上的2个N-乙酰葡糖胺(GlcNAc)和3个甘露糖(Man)残基组成,即它包含这5个糖残基而无额外的糖,例外是它可选择地可包括一个岩藻糖残基。第一个GlcNAc附着到天冬酰胺的酰胺基团上,而第二个GlcNAc通过β1,4-键附着到第一个上。1个甘露糖残基通过β1,4-键附着到第二个GlcNAc上,且2个甘露糖分别通过α1,3和α1,6键附着到该甘露糖上。对三甘露糖核心结构的示意性描述显示于图1左边。尽管大多数肽上的聚糖结构包含除三甘露糖核心之外的其他糖,但三甘露糖核心结构代表了哺乳动物肽上N-连接的聚糖的基本特征。

本发明包括生成以三甘露糖核心结构作为在其上含有的聚糖分子的基本结构元件的肽。假定有各种用于生产肽的细胞系统,不管该系统本身是天然存在的还是涉及重组DNA方法学的,本发明均提供了使在任何细胞类型中产生的肽上的聚糖结构可还原为基本的三甘露糖核心结构的方法。一旦生成了基本的三甘露糖核心结构,那么可能的是利用在此处描述的方法在体外生成肽上想要的聚糖结构,该结构赋予该肽一种或多种增强其治疗功效的性质。

从此处的讨论中可以看出术语“三甘露糖核心”用于描述在图1左边所示的聚糖结构。具有三甘露糖核心结构的糖肽也具有在其上添加的额外的糖,且在极大程度上,具有在其上添加的额外结构,而不管该糖是否使肽具有想要的聚糖结构。术语“基本的三甘露糖核心结构”在别处定义。当术语“基本的”不包括于“三甘露糖核心结构”的描述中时,那么该聚糖包含在甘露糖上附着有额外的糖的三甘露糖核心结构。

术语“基本的三甘露糖核心糖肽”在此处用于指具有主要包含基本的三甘露糖核心结构的聚糖结构的糖肽。然而,它也可选择地含有在其上附着的岩藻糖残基。如在此处所讨论的,基本的三甘露糖核心糖肽是最适的,且因此是优选的用于本发明的聚糖重构过程的起始材料。

另一种最适的用于本发明的聚糖重构过程的起始材料是具有三甘露糖核心的聚糖结构,其中一个或多个额外的GlcNAc残基添加到甘露糖残基的α1,3和α1,6的每一个上(参见如图2中第二条线上的结构,从图的左边起第二个结构)。该结构在此处称为“Man3GlcNAc4”。当该结构为单触角时,该结构在此处称为“Man3GlcNAc3”可选择地,该结构也可含有核心岩藻糖分子。一旦生成了Man3GlcNAc3或Man3GlcNAc4结构,那么可能的是利用在此处描述的方法在体外生成肽上想要的聚糖结构,该结构赋予该肽一种或多种增强其治疗功效的性质。

在其天然形式中,本发明N-连接的糖肽,特别是用于本发明的哺乳动物和人类的糖肽是用在其上附着一个或多个糖的三甘露糖核心结构进行N-连接糖基化的。

术语“糖肽”和“糖多肽”在此处同义地用于指具有在其上附着的糖部分的肽链。在此处对小的糖多肽或糖肽与大的糖多肽或糖肽未作区分。因而,在其肽链中具有非常少的氨基酸(如常少至3个氨基酸)的激素分子和其他非常大的肽均包括于通用术语“糖多肽”和“糖肽”中,只要它们具有在其上附着的糖部分。然而,术语“肽”的使用不排除该肽为糖肽。

具有想要的糖基化的N-连接糖肽的例子是具有N-连接的聚糖的肽,该聚糖具有在其上附着至少一个GlcNAc残基的三甘露糖核心。该残基是用N-乙酰葡糖胺转移酶I(GnT-I)添加到三甘露糖核心上的。如果添加第二个GlcNAc,则应用N-乙酰葡糖胺转移酶II(GnT-II)。可选择地,可用GnT-IV和/或GnT-V添加额外的GlcNAc残基,且第三个等分的GlcNAc残基可用N-乙酰葡糖胺转移酶III(GnT-III)附着到三甘露糖核心的β1,4甘露糖上。可选择地,该结构可用β1,4半乳糖基转移酶处理进行延伸以向每一个非等分的GlcNAc上添加半乳糖残基,且进一步可选择地,利用α2,3或α2,6-唾酸转移酶可将唾液酸残基添加到每一个半乳糖残基上。等分的GlcNAc向聚糖的添加不是随后添加半乳糖和唾液酸残基所必需的;然而,对于大鼠和人类GnT-III酶的底物亲和力,聚糖上一个或多个半乳糖残基的存在排除了等分的GlcNAc的添加,这是因为含有半乳糖的聚糖不是这些形式的GnT-III的底物。因而,在等分的GlcNAc想要存在和应用这些形式的GnT-III的情况下,重要的是如果聚糖含有添加的半乳糖和/或唾液酸,那么它们应该在添加等分的GlcNAc之前去除。其他形式的GnT-III的活性可能不需要这种特定的底物顺序。在更优选的反应中,将GnT-I、GnT-II和GnT-III的混合物加入到反应混合物中,从而GlcNAc残基可以以任何顺序添加。

代表具有“想要的糖基化”的肽的各个方面的聚糖结构的例子在此处提供的附图中显示。体外生成具有“想要的糖基化”的肽的精确过程在别处描述。然而,本发明决不应该解释为只是局限于在此处公开的任何一个聚糖结构。本发明更合适地应该解释为包括可用在此处提供的方法制备的任何一个或全部的聚糖结构。

在一些情况下,基本的三甘露糖核心单独可构成肽的想要的糖基化。例如,已显示仅具有三甘露糖核心的肽是用于治疗高歇病的酶的有用成分(Mistry等人,1966,Lancet 348:1555-1559;Bijsterbosch等人,1966,Eur.J.Biochem.237:344-349)。

根据本发明,下面描述生成具有想要的糖基化的肽的程序。

a)起始于具有一个或多个聚糖分子的糖肽,该聚糖分子的共同特征为具有三甘露糖核心结构和在其上添加的一个或多个糖的至少一种或多种异质的或同质的混合物,可能的是增加具有基本的三甘露糖核心结构作为唯一聚糖结构的或具有Man3GlcNAc3或Man3GlcNAc4作为唯一聚糖结构的糖肽的比例。这是在体外通过以适当的顺序系统地向糖肽添加适当数目的酶而实现,该酶可切割聚糖结构上的糖的异质的或同质的混合物直到其减少到基本的三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4结构。这些如何实现的特定例子将依赖于各种因素,在很大部分上包括产生肽的细胞类型及因此在最初由细胞产生的肽上存在的聚糖结构的复杂性程度。复杂的聚糖结构如何减少为基本三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4结构的例子在图2中显示,或在别处有详细描述。

b)可能的是通过分离天然存在的细胞而生成具有基本的三甘露糖核心结构作为唯一聚糖结构的肽,其中该细胞的糖基化机器产生这种肽。然后将编码目标肽的DNA转染到细胞中,在其中DNA进行转录、翻译和糖基化,从而目标肽具有基本的三甘露糖核心结构作为唯一聚糖结构。例如,缺乏有功能的GnT-I酶的细胞将产生几种类型的糖肽。在一些情况下,这些将是不具有附着到三甘露糖核心上的额外糖的糖肽。然而,在其他的情况下,产生的肽可具有附着到三甘露糖核心上的2个额外的甘露糖残基,从而结果得到Man5聚糖。这也是用于本发明的重构过程的想要的起始材料。生成这种聚糖结构的特定例子在此处描述。

c)可选择地,可能的是对细胞进行基因工程加工以赋予该细胞特定的糖基化机器,从而可产生具有基本三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4结构作为肽上唯一聚糖结构的肽。然后将编码目标肽的DNA转染到细胞中,在其中DNA进行转录、翻译和糖基化,从而目标肽具有增加数目的单独包含基本的三甘露糖核心结构的聚糖。例如,进行基因工程加工而缺乏GnT-I的某些类型的细胞将产生具有基本的三甘露糖核心结构的聚糖,或者依赖于该细胞,可产生具有三甘露糖核心以及在其上附着的2个额外的甘露糖残基的聚糖(Man5)。当细胞产生Man5聚糖结构时,可对细胞进一步进行基因工程加工以表达甘露糖苷酶3,该甘露糖苷酶3切割2个额外的甘露糖残基以生成三甘露糖核心。可选择地,Man5聚糖可在体外与甘露糖苷酶3进行温育以达到相同的效果。

d)当肽在昆虫细胞中表达时,肽上的聚糖包含部分复合的链。昆虫细胞也在细胞中表达氨基己糖苷酶,该酶将部分复合的链修剪为三甘露糖核心结构,然后该结构如在此处所述进行重构。

e)从b)、c)和d)中的讨论看显而易见的是细胞不需要仅产生在其上附着有基本三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4结构的肽。更适当的是除非b)和c)中描述的细胞产生具有100%的基本三甘露糖核心结构(即不具有在其上附着的额外的糖)或100%的Man3GlcNAc3或Man3GlcNAc4结构,细胞事实上产生肽的异质的混合物,该肽除具有基本三甘露糖核心结构或Man3GlcNAc3或Man3GlcNAc4结构的组合作为唯一的聚糖结构之外,还具有在其上附着有其它糖的这些结构。具有在其上附着有额外的糖的三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4结构的肽对那些仅具有一种结构的肽的比例将依赖于产生它们的细胞而变化。聚糖的复杂性(即何种及多少糖附着于三甘露糖核心上)也将依赖于产生它们的细胞。

f)一旦根据本发明通过a)、b)或c)产生了具有基本的三甘露糖核心或在其上附着有一个或多个GlcNAc残基的三甘露糖核心的糖肽,那么在体外可将额外的糖分子添加到三甘露糖核心结构上以生成具有想要的糖基化的肽(即具有在体外定制的聚糖结构的肽)。

g)然而,当产生了具有在其上附着有一些但不是全部想要的糖的基本三甘露糖核心或Man3GlcNAc4结构的肽时,那么仅需要添加剩余的想要的糖,而不用将聚糖结构减少为基本三甘露糖核心或Man3GlcNAc4结构。因此,在一些情况下,具有在其上附着有额外的糖的三甘露糖核心结构的聚糖结构的肽将是进行重构的适当底物。

基本三甘露糖核心糖肽的分离

如果需要,本发明的基本三甘露糖核心或Man3GlcNAc3或Man3GlcNAc4糖肽可用肽纯化领域众所周知的技术进行分离和纯化。适当的技术包括层析技术、等电聚焦技术、超滤技术等。利用任何这样的技术,可制备本发明的组合物,其中本发明的糖肽是与其他肽和与其他通常发现于细胞培养基中的成分分离的。相对于其它肽,纯化的程度可为如90%、或95%或更高,如98%。参见如Deutscher等人(ed.,1990,Guide to Protein Purification,Harcourt BraceJovanovich,San Diego)。

存在于由现有技术领域的方法产生的糖肽中的N-连接聚糖的异质性通常仅允许小部分目标糖肽的分离,该目标糖肽可进行修饰以产生想要的糖肽。在本发明的方法中,可产生大量的基本三甘露糖核心糖肽和其他想要的糖肽,包括Man3GlcNAc3或Man3GlcNAc4糖肽,这些糖肽然后可进一步进行修饰以生成大量具有想要的糖基化的肽。

连接到肽上的任何特定类型的聚糖的特异性富集可用对想要的聚糖具有亲和力的凝集素来实现。这种技术是糖生物学领域中众所周知的。

在下面更详细描述的本发明的关键特征是一旦在任何肽上生成了聚糖结构,那么该聚糖结构可在体外进行重构以生成具有想要的糖基化的肽,该肽在哺乳动物中具有改善的治疗应用。哺乳动物可为任何类型的适当哺乳动物,且优选地为人。

生成具有想要的糖基化的肽的各种情形和精确的方法和组合物在随后的公开内容中将变为显而易见的。

生产用于哺乳动物中治疗应用的肽的最终目的是该肽应该包含促进而不是取消该肽的治疗益处的聚糖结构。如贯穿本说明书所公开的,在细胞中产生的肽可在体外用各种酶进行处理,该酶催化不应该存在于聚糖上的糖的切割和应该存在于聚糖上的糖的添加,从而则产生了具有想要的糖基化并因而适合于哺乳动物中的治疗应用的肽。细胞中肽的不同糖形式的生成在上文描述。现在描述了各种生成具有想要的糖基化的肽的机制,其中起始材料即由细胞产生的肽依细胞类型而有差异。如从本发明的公开内容中将显而易见的,在其聚糖组成方面,起始材料不必是统一的。然而,优选地是富集某些糖形式的起始材料以产生大量的终产物,即正确糖基化的肽。

在根据本发明优选的实施方案中,结果得到具有想要的糖基化的肽的降解和合成事件在一些时候涉及肽上基本三甘露糖核心结构或Man3GlcNAc3或Man3GlcNAc4结构的生成。

本发明也提供了向肽添加一个或多个选择的糖基残基的方法,其后将修饰的糖缀合到肽上至少一个选择的糖基残基上。本实施方案当例如想要将修饰的糖与选择的糖基残基缀合时是有用的,其中该选择的糖基残基不存在于肽上或不以想要的量存在。因而,在使修饰的糖与肽进行偶联之前,将选择的糖基残基与肽通过酶促或化学偶联进行缀合。在另一个实施方案中,肽的糖基化模式是在修饰的糖的缀合之前通过从肽中去除糖残基而改变的。参见如WO 98/31826。

存在于肽上的任何糖部分的添加或去除是化学地或酶促实现的。化学脱糖基化优选地是通过将肽变体暴露于化合物三氟甲磺酸或等价的化合物而发生的。该处理导致除连接糖(N-乙酰葡糖胺或N-乙酰半乳糖胺)之外大多数或全部糖的切割,而剩下完整的肽。化学降解描述于Hakimuddin等人,1987,Arch.Biochem.Biophys.259:52和Edge等人,1981,Anal.Biochem.118:131。肽变体上糖部分的酶促切割可通过应用各种内切-和外切-糖苷酶而实现,如由Thotakura等人,1987,Meth.Enzymol.138:350所描述的。

糖基部分的化学添加是通过任何本领域认可的方法实施的。糖基部分的酶促添加优选地是用对在此处提出的方法的修改方法实现的,即用天然的糖基单位替代用于本发明中的修饰的糖。其他添加糖部分的方法描述于美国专利No.5,876,980、6,030,815、5,728,554和5,922,577。

选择的糖基残基的示例性附着位点包括但不局限于:(a)N-和O-糖基化位点;(b)作为糖基转移酶受体的末端糖基部分;(c)精氨酸、天冬酰胺和组氨酸;(d)游离羧基;(e)游离巯基基团如半胱氨酸的;(f)游离羟基如丝氨酸、苏氨酸或羟脯氨酸的;(g)芳族残基如那些苯丙氨酸、酪氨酸或色氨酸的;或(h)谷氨酰胺的酰胺基团。用于本发明的示例性方法描述于1987年9月11日发表的WO 87/05330和Aplin和Wriston,CRC Crit.Rev.Biochem.,pp.259-306(1981)中。

特定地涉及到在此处提供的几个图中所示的例子,现在提供了对在肽上产生想要的聚糖结构的体外酶促反应顺序的描述。在下面描述的每一个酶促转变的精确反应条件是糖生物学领域的技术人员众所周知的且因此不在此进行重复。对于这些类型反应的反应条件的综述,参见Sadler等人,1982,Methods in Enzymology 83:458-514及在其中引用的参考文献。

在图1中左边显示了基本的三甘露糖核心聚糖的结构。可能的是通过GnT-I随后为GnT-II且进一步随后为GnT-III和包含UDP-GlcNAc的糖供体存在时温育基本的三甘露糖核心结构而将该结构转变为具有等分的GlcNAc的完整聚糖结构,其中将GlcNAc依次添加到基本三甘露糖核心结构上以生成具有等分的GlcNAc的三甘露糖核心。在一些情况中,例如当如在此处所述对Fc聚糖进行重构时,添加GnT-I、GnT-II和GnT-III的顺序可以与文献中报道的相反。可以通过向反应混合物中添加GnT-I、GnT-II和GnT-III以及UDP-GlcNAc来产生等分的GlcNAc结构。

在图3中显示了含有等分的GlcNAc的三甘露糖核心聚糖向包含半乳糖和N-乙酰神经氨酸的复杂聚糖结构的转变。首先将含有等分的GlcNAc的三甘露糖核心聚糖与半乳糖基转移酶和作为供体分子的UDP-Gal进行温育,其中将两个半乳糖残基添加到分子上的外周GlcNAc残基上。然后将NeuAc-转移酶用于向每一个半乳糖残基各添加一个NeuAc,共两个NeuAc。

在图4中显示了高甘露糖聚糖结构向基本的三甘露糖核心聚糖的转变。使高甘露糖聚糖(Man9)依次在甘露糖苷酶1存在时进行温育以生成Man5结构,然后在甘露糖苷酶3存在时进行温育,其中除3个甘露糖残基之外的所有甘露糖残基将从聚糖上去除。可选择地,Man9结构的温育可仅通过在甘露糖苷酶3存在时进行温育而修剪到三甘露糖核心结构。根据在上述图1和3中提供的方案,然后该基本的三甘露糖核心聚糖向复杂的聚糖分子的转变则是可能的。

在图5中显示了植物细胞中产生的典型的复杂N-连接的聚糖结构。重要的是注意当植物细胞缺失GnT-I酶活性时,木糖和岩藻糖不能添加到聚糖中。因而,GnT-I基因敲除细胞的应用提供了本发明中特别的优点,即这些细胞可产生具有基本的三甘露糖核心的肽,在该基本的三甘露糖核心上可添加额外的糖而不用进行任何“修剪”反应。类似地,在植物细胞中产生的结构为聚糖的Man5变体的情况下,如果在这些细胞中无GnT-I,那么木糖和岩藻糖则不能添加到该结构中。在这种情况下,可将Man5结构用甘露糖苷酶3修剪为基本的三甘露糖核心(Man3)。根据在此处提供的方法,目前可能的是将糖部分添加到三甘露糖核心以生成想要的聚糖结构。

在图6中显示了昆虫细胞中产生的典型的复杂N-连接的聚糖结构。明显的是额外的糖如岩藻糖也可存在。尽管未进一步在此处显示,但昆虫细胞可产生具有多达9个甘露糖残基的且可在其上附着有额外的糖的高甘露糖聚糖。同样的情况是在昆虫细胞中,GnT-I基因敲除的细胞防止了岩藻糖向聚糖上的添加。因而,昆虫细胞中肽的产生优选地可以在GnT-I基因敲除细胞中实现。因而如果需要,如此产生的聚糖然后可用在此处描述的任何方法和方案进行体外修剪,且额外的糖也可用在此处描述的方法和方案在体外添加到其上。

在图2中显示了各种完成程度的聚糖结构。特定地,显示了基本的三甘露糖核心结构从不含有等分的GlcNAc残基的复杂糖聚糖结构的体外酶促生成。同样显示的是由此生成的含有等分的GlcNAc的聚糖结构。显示了几个可产生的中间聚糖结构。这些结构可由细胞产生,或可在此处描述的体外修剪反应中产生。糖部分可在体外添加到基本的三甘露糖核心结构上,或添加到任何适当的中间结构上以产生想要的聚糖。

在图7中显示了一系列可能的体外反应,该反应可执行对起始于高甘露糖结构的聚糖的修剪和添加。例如,Man9聚糖可用甘露糖苷酶1进行修剪以生成Man5聚糖,或它可用甘露糖苷酶3或一种或多种微生物甘露糖苷酶修剪为三甘露糖核心。然后可将GnT-I和或GnT-II用于将额外的GlcNAc残基转移到聚糖上。进一步地,显示了当聚糖分子在不具有GnT-I的细胞中产生时不发生的状况(参见阴影框)。例如,岩藻糖和木糖仅当GnT-I是活性的且促进GlcNAc向分子的转移时可添加到聚糖上。

图8描述起始于三甘露糖核心结构合成双触角的、三触角的和甚至四触角的聚糖结构的众所周知的策略。根据本发明的方法,可能的是用糖生物学领域中众所周知的适当的酶和反应条件在体外合成这些结构的每一个。

图9描述从高甘露糖(6~9个甘露糖部分)聚糖结构开始合成单触角聚糖结构的两种方法。根据此处所述的糖PEG化方法,可添加末端唾液酸-PEG部分以替代唾液酸部分。在第一个方法中,endo-H用于将肽上的聚糖结构切割到第一个GlcNAc残基。然后用半乳糖基转移酶添加半乳糖,而如本文别处所述添加唾液酸化的PEG。在第二个方法中,甘露糖苷酶I用于从肽中的聚糖结构切割甘露糖残基。将半乳糖残基添加到剩余的甘露糖残基的一个臂上,该甘露糖残基是用刀豆α-甘露糖苷酶从聚糖中切除的。然后如所述的将唾液酸化的PEG添加到该结构上。

图10描述从高甘露糖(6~9个甘露糖部分)聚糖结构开始合成单触角聚糖结构的另外两种方法。与图9中的一样,根据此处所述的糖PEG化方法,添加末端唾液酸-PEG部分以替代唾液酸部分。在此处所述的情形中,从未添加唾液酸化的PEG的臂去除一些甘露糖残基。

在图11中显示了起始于三甘露糖核心结构合成更复杂的糖结构的方案。例如,显示了体外生产唾液酸化或非唾液酸化的Lewis x和Lewis a抗原结构的方案。这种结构当存在于肽上时可赋予肽免疫学的优点,以用于增量调节或减量调节免疫反应。此外,这种结构可用于肽向特定细胞的导向,这是因为这类结构参与与细胞附着肽等的结合。

图12是用于制备源自丝氨酸或苏氨酸的O-连接的肽阵列的示例性方案。

图13是一系列描述称为核心1~4的4类O-连接的聚糖结构的图解。核心结构以虚线描述。也可包括于该结构中的糖包括添加到半乳糖残基上的唾液酸残基和添加到GlcNAc残基上的岩藻糖残基。

因而,在优选的实施方案中,本发明提供了制备N-连接的糖基化糖肽的方法,该方法为:提供在其上附着了基本的三甘露糖核心或Man3GlcNAc4结构的分离的和纯化的糖肽,使糖肽与糖基转移酶和具有糖基部分的供体分子在适合于将糖基部分转移到糖肽中的条件下接触。然后定制基本的三甘露糖核心或Man3GlcNAc4结构以产生具有想要的糖基化模式的肽,这可通过用本领域中众所周知的技术依次添加想要的糖部分而实现。

聚糖一级结构的确定

当N-连接的糖肽由细胞产生时,如在别处提到的,它可包含聚糖结构的异质性混合物,该聚糖结构必须在向其上添加其他的糖部分之前减少为共有的和普通的基本的三甘露糖核心或Man3GlcNAc4结构。为了精确确定应将哪个糖从特定的聚糖结构上去除,有时必需的是鉴定一级聚糖结构。确定聚糖一级结构的技术是本领域中众所周知的,且详细描述于如Montreuil,“Structure and Biosynthesis ofGlycopeptides”,Polysaccharides in Medicinal Applications,pp.273-327,1996,Eds.Severian Damitriu,Marcel Dekker,NY。因此对于糖生物学领域中的技术人员而言分离由细胞产生的肽群体和确定在其上附着的聚糖结构是简单的事情。例如,对于下面部分有可用的有效方法:(i)通过化学切割如水解、乙酸酐分解、肼解或通过亚硝酸脱氨而使糖苷键断裂;(ii)完全甲基化,随后进行水解或甲醇分解并随后进行对部分甲基化的单糖的气-液层析法和质谱分析法分析;和(iii)用外切糖苷酶对单糖之间异头键的确定,这也通过依次降解提供了对一级聚糖结构的认识。特别地,质谱分析法和核磁共振(NMR)谱测定法特别是高场的NMR可成功用于确定聚糖一级结构。

用于糖分析的试剂盒和设备也是商业上可购得的。荧光团辅助的糖电泳(FACE_)可购自Glyko,Inc.(Novato,CA)。在FACE分析中,将糖缀合物用针对N-连接聚糖的内切H或N-聚糖酶(PNGaseF)或针对Ser/Thr连接聚糖的肼从肽中释放。然后将该聚糖用荧光团以非结构区分的方式在还原末端进行标记。然后将荧光团标记的聚糖基于糖的荷/质比以及流体动力学体积而在聚丙烯酰胺凝胶上分离。在UV光下获取凝胶图象,且聚糖的组成是通过与标准物相比较的迁移距离确定的。寡糖可以以这种方式通过分析归因于用外切糖苷酶消化的依次去除糖的迁移变化而测序。

示例性实施方案

N-连接的糖基化的重构参照下面分子式1进行了最好的阐明

其中X3、X4、X5、X6、X7和X17是(独立选择的)单糖或寡糖残基;且

a、b、c、d、e和x是(独立选择的)0、1或2,前提是选自a、b、c、d、e和x的至少一个成员是1或2。

分子式1描述了包含三甘露糖核心的聚糖结构,该结构优选地是共价连接到肽主链上的天冬酰胺残基上的。优选的表达系统将表达并分泌具有包含三甘露糖核心的N-连接聚糖的外源性肽。利用本发明的重构方法,这些肽上的聚糖结构可方便地重构为任何想要的聚糖结构。示例性的反应条件可发现于实施例和文献中。

在优选的实施方案中,对聚糖结构进行了重构,从而在分子式1中描述的结构具有特定的决定簇(determinate)。可选择聚糖的结构以增强肽的生物学活性、赋予肽新的生物学活性、去除肽的生物学活性或更好地近似化(approximate)天然肽的糖基化模式,以及其它。

在第一个优选的实施方案中,对肽N-连接的聚糖进行了重构以更好地近似化天然人类蛋白质的糖基化模式。在该实施方案中,对描述于分子式1中的聚糖结构进行了重构以具有下面的部分:

X3和X5=|-GlcNAc-Gal-SA;

a和c=1;

d=0或1;

b、e和x=0。

该实施方案对于表达于异源细胞表达系统中的人类肽是特别有利的。通过将N-连接的聚糖结构重构为该构型,该肽可为在人患者中较低免疫原性的和/或更稳定的,以及具有其它特性。

在第二个优选的实施方案中,对肽N-连接的聚糖进行了重构以在三甘露糖核心上具有等分的GlcNAc。在该实施方案中,对描述于分子式1中的聚糖结构进行了重构以具有下面的部分:

X3和X5是|-GlcNAc-Gal-SA;

a和c=1;

X4是GlcNAc;

b=1;

d=0或1;

e和x=0。

该实施方案对于表达于异源细胞系统中的重组抗体是特别有利的。当抗体分子包括Fc-介导的细胞毒性时,公知的是与Fc结构域连接的等分的寡糖的存在巨大地增加了抗体依赖性细胞毒性。

在第三个优选的实施方案中,对肽N-连接的聚糖进行了重构以具有唾液酸化的Lewis X部分。在该实施方案中,对描述于分子式1中的聚糖结构进行了重构以具有下面的部分:

X3和X5

a、c和d=1;

b、e和x=0;

X6是岩藻糖。

该实施方案当进行重构的肽想要导向到选择蛋白分子和展示相同分子的细胞中时是特别有利的。

在第四个优选的实施方案中,对肽N-连接的聚糖进行了重构以具有缀合的部分。该缀合的部分可为PEG分子、另一个肽、小分子如药物,以及其它。在该实施方案中,对描述于分子式1中的聚糖结构进行了重构以具有下面的部分:

X3和X5是|-GlcNAc-Gal-SA-R;

a和c=1或2;

d=0或1;

b、d、e和x=0。

其中R=缀合基团。

缀合的部分可为PEG分子、另一个肽、小分子如药物,以及其它。因此该实施方案可用于将肽与减慢肽从患者血流中清除的PEG分子缀合,与将两个肽导向到特定的组织或细胞中的肽缀合,或与具有互补的治疗应用的另一个肽缀合。

对于本领域技术人员显而易见的是本发明不局限于上述的优选的聚糖分子。优选的实施方案仅是可用本发明的重构方法制备的许多有用的聚糖分子中的少数。本领域的技术人员知道如何设计其他有用的聚糖。

在第一个示例性的实施方案中,肽是根据本领域中众所周知的方法在CHO(中国仓鼠卵巢细胞)中表达的。当具有N-连接的聚糖一致位点的肽在CHO细胞中表达并分泌时,该N-连接的聚糖将具有描述于图2顶行但也包含核心岩藻糖的结构。尽管可能存在所有这些结构,但迄今最普遍的结构是在右边的两个。在分子式1的术语中,

X3和X5是|-GlcNAc-Gal-(SA);

a和c=1;

b、e和x=0,和

d=0或1。

因此,在一个示例性的实施方案中,将表达于CHO细胞中的肽的N-连接聚糖通过使该肽与糖基转移酶的接触而重构为优选的人源化的聚糖,该糖基转移酶对于半乳糖受体分子和唾液酸供体分子是特异性的。该过程阐述于图2和实施例17中。在另一个示例性的实施方案中,将在CHO细胞中表达并分泌的肽的N-连接聚糖重构为优选的PEG化的结构。使该肽首先与对唾液酸特异性的糖苷酶接触以去除末端的SA部分,然后与对半乳糖受体部分和唾液酸受体部分特异性的糖基转移酶在PEG-唾液酸-核苷酸供体分子存在时接触。可选择地,然后可使该肽与糖基转移酶在唾液酸-核苷酸供体分子存在时进行接触以确保完成所有聚糖分子的SA加帽,其中糖基转移酶是对半乳糖受体部分和唾液酸受体部分特异性的。

在另一个示例性的实施方案中,肽是根据本领域中众所周知的方法在昆虫细胞中表达的,如sf9细胞系。当具有N-连接的聚糖一致位点的肽在sf9细胞中表达并分泌时,该N-连接的聚糖常具有描述于图6顶行的结构。在分子式1的术语中:

X3和X5是|-GlcNAc;

a和c=0或1;

b=0;

X6是岩藻糖;

d=0、1或2;且

e和x=0。

三甘露糖核心存在于由昆虫细胞制备的绝大多数N-连接的聚糖中,且有时也存在触角GlcNAc和/或岩藻糖残基。注意,聚糖可以不具有核心岩藻糖,其可以具有任意一种键的单核心岩藻糖,或者其可以具有一种键占优势(perponderance)的单核心岩藻糖。在一个示例性的实施方案中,对在昆虫细胞中表达并分泌的肽的N-连接的聚糖重构为优选地人源化的聚糖,这是通过以下步骤实现的:首先使聚糖与对岩藻糖特异性的糖苷酶接触,然后使聚糖与糖基化转移酶在核苷酸-GlcNAc分子存在时进行接触,该糖基转移酶对三甘露糖核心的每一个触角上的甘露糖受体分子、GlcNAc供体分子是特异性的;然后使聚糖与对GlcNAc受体分子、Gal供体分子特异性的糖基转移酶在核苷酸-Gal分子存在时进行接触;然后使聚糖与对半乳糖受体分子、唾液酸供体分子特异性的糖基转移酶在核苷酸-SA分子存在时进行接触。本领域的技术人员将理解如果存在一些岩藻糖分子,那么它们可在该过程的任何时候去除,且如果核心岩藻糖具有与在人聚糖中发现的相同的α1,6键,则可以使其保持完整。在另一个示例性的实施方案中,将前面例子中人源化的聚糖进一步通过使聚糖进一步与糖基转移酶在核苷酸-岩藻糖分子存在时进行接触以重构为唾液酸化的Lewis X聚糖,该糖基转移酶是对GlcNAc受体分子、岩藻糖供体分子特异性的。该过程在图11和实施例39中阐明。

在另外一个示例性的实施方案中,肽是根据本领域中众所周知的方法在酵母中表达的,如啤酒糖酵母(Saccharomyces cerevisiae)。当具有N-连接的聚糖一致位点的肽在啤酒糖酵母细胞中表达并分泌时,该N-连接的聚糖将具有描述于图4中左边的结构。N-连接的聚糖将常常具有三甘露糖核心,这将通常由甘露糖或多达1000个残基的相关多糖来详细说明。在分子式1的术语中:

X3和X5是|-Man-Man-(Man)0-1000

a和c=1或2;

b、d、e和x=0。

在一个示例性的实施方案中,将在酵母细胞中表达并分泌的肽的N-连接的聚糖重构为基本的三甘露糖核心,这是通过以下步骤实现的:首先使聚糖与对α2甘露糖分子特异性的糖苷酶接触,然后使聚糖与对α6甘露糖分子特异性的糖苷酶接触。该过程在图4和实施例38中阐明。

在另一个示例性的实施方案中,对N-连接的聚糖进一步重构以制备聚糖,该聚糖适合用于具有Fc-介导的细胞毒性功能的重组抗体,上述重构是通过以下步骤实现的:使基本的三甘露糖核心聚糖与糖基转移酶在核苷酸-GlcNAc分子存在时接触,其中该糖基转移酶对三甘露糖核心的每一个触角上的甘露糖受体分子、GlcNAc供体分子是特异性的。然后使聚糖与对三甘露糖核心中部的受体甘露糖分子、GlcNAc供体分子特异性的糖基转移酶在核苷酸-GlcNAc分子存在时进行接触,并进一步使聚糖与对GlcNAc受体分子、Gal供体分子特异性的糖基转移酶在核苷酸-Gal分子存在时进行接触;然后任选地使聚糖与对半乳糖受体分子、并进一步任选对唾液酸供体分子特异性的糖基转移酶在核苷酸-SA分子存在时进行接触。该过程在图1、2和3中阐明。

在另外一个示例性的实施方案中,肽是根据本领域中众所周知的方法在细菌中表达的,特别是在大肠杆菌(E.coli)细胞中。当具有N-连接的聚糖一致位点的肽在大肠杆菌细胞中表达时,该N-连接的一致位点将不是糖基化的。在一个示例性的实施方案中,人源化的聚糖分子是从肽主链中构造的,这是通过以下步骤实现的:使肽与对N-连接的一致位点和GlcNAc供体分子特异性的糖基转移酶在核苷酸-GlcNAc存在时接触;且进一步依次使生长的聚糖与对受体和供体部分特异的糖基转移酶在必需的供体部分存在时接触直到完成想要的聚糖结构。当具有N-连接的聚糖的肽在真核细胞中表达,但不具有将新生肽导向到高尔基体中的适当前导肽时,成熟的肽可能不被糖基化。同样在这种情况下,该肽可通过从如上述的肽N-连接的一致位点构造N-连接的糖基化。当蛋白质用糖部分进行化学修饰时,它可如上述地进行构造。

这些例子想要阐明本发明而不是进行限制。本领域技术人员将理解在每一个例子中进行的步骤在一些情况下能够以不同的顺序进行而取得相同的结果。本领域的技术人员也将理解不同的步骤也可产生相同的聚糖。优选地重构的聚糖决不对表达该肽的表达系统是特异性的。重构的聚糖仅是阐明性的,且本领域的技术人员将知道如何从这些例子中取得原则并将其应用于在不同表达系统中产生的肽以制备在此处未特定描述的聚糖。

B.重构O-连接聚糖的方法

O-糖基化特征在于以O-糖苷键向羟基氨基酸附着了各种单糖。O-糖基化是动物和植物界中普遍的翻译后修饰。与蛋白质O-连接的聚糖的结构复杂性远远超过了N-连接的聚糖。新翻译的肽的丝氨酸或苏氨酸残基在高尔基体的内侧到外侧区室中基本由肽基GalNAc转移酶修饰。O-糖基化的位点不仅是由糖基转移酶的序列特异性确定的,而且是由不同底物位点之间的竞争和与其他负责形成聚糖的糖基转移酶之间的竞争介导的外遗传调节(epigenetic regulation)确定的。

已将O-连接的聚糖人为地定义为具有3个区域:核心、主链和外周区域。O-连接聚糖的“核心”区域是最接近肽的聚糖链的最内部的2个或3个糖。主链区域主要组成由统一的延伸形成的聚糖链的长度。外周区域展示高度的结构复杂性。O-连接聚糖的结构复杂性开始于核心结构。在大多数情况下,在O-连接聚糖一致位点添加的第一个糖残基是GalNAc;然而该糖也可为GlcNAc、葡萄糖、甘露糖、半乳糖或岩藻糖等。图12是一些已知的O-连接聚糖核心结构和负责其体内合成的酶的图解。

在哺乳动物细胞中,至少发现了8个不同的O-连接的核心结构,全部是基于核心-α-GalNAc残基的。在图13中描述的4个核心结构是最普遍的。核心1和核心2是哺乳动物细胞中最丰富的结构,而核心3和核心4发现于更加限制性和器官特征性的表达系统中。O-连接聚糖的综述有Montreuil,Structure and Synthesis of Glycopeptides,Polysaccharides in Medicinal Applications,pp.273-327,1996,Eds.Severian Damitriu,Marcel Dekker,NY,和Schachter和Brockhausen,The Biosynthesis of Branced O-Linked Glycans,1989,Society forExperimental Biology,pp.1-26(英国)。

从本发明的公开内容看显而易见的是O-糖基化的肽的聚糖结构可用与对N-连接的聚糖描述的相似的技术进行重构。O-聚糖与N-聚糖区别在于它们连接到丝氨酸或苏氨酸而不是天冬酰胺残基上。如在此处关于N-聚糖重构所描述的,水解酶可用于切割O-连接聚糖上不想要的糖部分,且额外的想要的糖然后可添加到其上,从而在肽上构造定制的O-聚糖结构(参见图12和13)。

哺乳动物细胞中O-糖基化的起始步骤是用至少11个已知的α-N-乙酰半乳糖胺转移酶家族的任何一个附着N-乙酰半乳糖胺(GalNAc),该酶的每一个均具有严格的受体肽特异性。通常,由每一个酶识别的受体肽组成至少10个氨基酸的序列。含有由一个特定的GalNAc-转移酶识别的氨基酸序列的肽如果在表达该酶的细胞中表达且如果它们大致位于UDP-GalNAc也存在的高尔基体上时则变成O-糖基化的。

然而,在重组蛋白质的情况下,GalNAc的起始附着可能不会发生。表达细胞的天然α-N-乙酰半乳糖胺转移酶可具有与表达的重组肽不同的一致序列特异性。

想要的重组肽可表达于不合成聚糖链的细菌细胞中,如大肠杆菌中。在这些情况下,在体外添加起始的GalNAc部分是有利的。一旦重组肽以可溶性的形式回收,则GalNAc部分可通过使肽与适当的GalNAc转移酶在UDP-GalNAc存在时接触而在体外引入到肽上。

在一个实施方案中,可存在额外的氨基酸序列,该氨基酸序列组成用于转移O-连接的糖的有效受体。这种氨基酸序列是由在读框内与肽的编码序列融合的DNA序列编码的,或者可选择地可由化学方法引入。该肽另外可能缺乏聚糖链。可选择地,该肽可能具有N-和/或O-连接的聚糖链,但需要额外的糖基化位点,如当需要额外的聚糖取代基时。

在一个示例性的实施方案中,添加氨基酸序列PTTTK-COOH作为融合标记,该氨基酸序列是人粘蛋白MUC-1中的天然GalNAc受体序列。然后使融合蛋白质在大肠杆菌中表达并纯化。使该肽然后与重组的人GalNAc-转移酶T3或T6在UDP-GalNAc存在时接触以将GalNAc残基在体外转移到肽中。

肽上的聚糖链然后可进一步用在此处对于N-连接的或O-连接的聚糖描述的方法进行延伸。可选择地,GalNAc转移酶反应可在UDP-GalNAc存在时进行,在UDP-GalNAc上PEG共价取代了O-3、4或6位置或N-2位置。糖缀合在别处有详细描述。由新的肽序列引入的任何抗原性可方便地由对相关聚糖的PEG化而掩盖。受体位点融合技术可用于不仅引入PEG部分,而且引入其他的聚糖和非聚糖部分,包括但不局限于毒素、抗感染药、细胞毒性剂、放射性核苷酸的螯合剂和具有其他功能如组织导向的聚糖。

示例性实施方案

O-连接糖基化的重构是用下面分子式2进行最好的阐明的:

分子式2描述了包含优选地与肽主链上的丝氨酸或苏氨酸残基共价连接的GalNAc的聚糖结构。尽管该结构用于阐明最普通形式的O-连接聚糖,但不应解释为它将本发明仅仅局限于这些O-连接的聚糖。其他形式的O-连接聚糖阐明于图12中。用于本发明的优选的表达系统表达并分泌具有包含GalNAc残基的O-连接聚糖的外源肽。利用本发明的重构方法,可对这些肽上的聚糖结构方便地进行重构以生成任何想要的聚糖结构。本领域的技术人员将理解O-连接聚糖可用与本领域中一旦由本发明的公开内容提供即可用的相同的原则、酶和反应条件进行重构。示例性的反应条件可发现于实施例的始终。

在优选的实施方案中,对聚糖结构进行了重构从而分子式2中描述的结构具有特定的部分。可选择聚糖的结构以增强肽的生物学活性、赋予肽新的生物学活性、去除或改变肽的生物学活性或更好地近似化天然肽的糖基化模式,以及其它。

在第一个优选的实施方案中,对肽O-连接的聚糖进行了重构以更好地近似化天然人类蛋白质的糖基化模式。在该实施方案中,对描述于分子式2中的聚糖结构进行了重构以具有下面的部分:

X2是|-SA;或|-SA-SA;

f和n=0或1;

X10是SA;

m=0。

该实施方案对于表达于异源细胞表达系统中的人类肽是特别有利的。通过将O-连接的聚糖结构重构为具有该构型,可使得该肽在人患者中为较低免疫原性的和/或更稳定的。

在另一个优选的实施方案中,对肽O-连接的聚糖进行了重构以展示唾液酸化的Lewis X抗原。在该实施方案中,对描述于分子式2中的聚糖结构进行了重构以具有下面的部分:

X2是|-SA;

X10是Fuc或|-GlcNAc(Fuc)-Gal-SA;

f和n=1

m=0。

该实施方案当进行重构的肽在导向到选择蛋白分子和展示相同分子的细胞中最有效时是特别有利的。

在另外一个优选的实施方案中,对肽O-连接的聚糖进行了重构以具有缀合的部分。该缀合的部分可为PEG分子、另一个肽、小分子如药物,以及其它。在该实施方案中,对描述于分子式2中的聚糖结构进行了重构以具有下面的部分:

X2是|-SA-R;

f=1;

n和m=0。

其中R=缀合基团。

该实施方案可用于将肽与减慢肽从患者血流中清除的PEG分子缀合,与将两个肽导向到特定的组织或细胞中的肽缀合,或与具有互补的治疗应用的另一个肽缀合。

对于本领域技术人员显而易见的是本发明不局限于上述的优选的聚糖分子。优选的实施方案仅是可用本发明的重构方法制备的许多有用的聚糖分子中的少数。本领域的技术人员一旦读了本发明后则知道如何设计其他有用的聚糖。

在第一个示例性的实施方案中,肽是根据本领域中众所周知的方法在CHO(中国仓鼠卵巢细胞)中表达的。当具有O-连接的聚糖一致位点的肽在CHO细胞中表达并分泌时,该O-连接聚糖的大多数将通常具有下面的结构,即在分子式2的术语中,

X2是|-SA;

f=1;

m和n=0。

因此,大多数CHO细胞中的聚糖不需要进行重构以适用于人患者。在一个示例性的实施方案中,将在CHO细胞中表达并分泌的肽的O-连接聚糖通过使该聚糖与糖基转移酶在核苷酸-岩藻糖存在时接触而重构为含有唾液酸化的Lewis X结构,该糖基转移酶对GalNAc受体部分和岩藻糖供体部分是特异性的。该过程阐述于图11和实施例39的N-连接聚糖中。

在另一个示例性的实施方案中,肽是根据本领域中众所周知的方法在昆虫细胞如sf9中表达的系。当具有O-连接的聚糖一致位点的肽在大多数sf9细胞中表达并分泌时,该O-连接聚糖的大多数具有分子式2的结构,其中:

X2=H;

f=0或1;

n和m=0。

参见如Marchal等人,(2001,Biol.Chem.382:151-159)。在一个示例性的实施方案中,对在昆虫细胞中表达的肽的O-连接聚糖通过以下步骤重构为人源化的聚糖:首先使聚糖与对GlcNAc受体分子和半乳糖供体分子特异性的糖基转移酶在核苷酸-Gal存在时进行接触;然后使聚糖与对Gal受体分子和SA供体分子特异性的糖基转移酶在核苷酸-SA存在时进行接触。在另一个示例性的实施方案中,将O-连接聚糖进一步通过使聚糖与糖基转移酶在核苷酸-岩藻糖存在时进行接触以从人源化的形式重构为唾液酸化的Lewis X形式,其中该糖基转移酶是对GalNAc受体分子和岩藻糖供体分子特异性的。

在另外一个示例性的实施方案中,肽是根据本领域中众所周知的方法在真菌中表达的,特别是啤酒糖酵母细胞中。当具有O-连接的聚糖一致位点的肽在啤酒糖酵母细胞中表达并分泌时,该O-连接聚糖的大多数具有下面的结构:

|-AA-Man-Man1-2.

参见Gemmill和Trimble(1999,Biochim.Biophys.Acta 1426:227-237)。为了重构这些O-连接聚糖以用于人类中,优选地是将聚糖在氨基酸水平进行切割并从那里进行重构。

在一个示例性的实施方案中,聚糖是在真菌细胞中表达的肽的O-连接聚糖,且重构为人源化的聚糖,这是通过以下步骤实现的:使聚糖与对氨基酸-GalNAc键特异性的内切糖基化酶接触;然后使聚糖与对O-连接的一致位点和GalNAc供体分子特异性的糖基转移酶在核苷酸-GalNAc存在时接触;然后使聚糖与对GalNAc受体分子和半乳糖供体分子特异性的糖基转移酶在核苷酸-Gal存在时进行接触;然后使聚糖与对Gal受体分子和SA供体分子特异性的糖基转移酶在核苷酸-SA存在时进行接触。

可选择地,在另一个示例性的实施方案中,聚糖是在真菌细胞中表达的肽的O-连接聚糖,且重构为人源化的聚糖,这是通过以下步骤实现的:使聚糖与蛋白质O-甘露糖β-1,2-N-乙酰葡糖胺转移酶(POMGnTI)在GlcNac-核苷酸存在时接触;然后使聚糖与半乳糖基转移酶在核苷酸-Gal存在时接触;然后使聚糖与唾酸转移酶在核苷酸-SA存在时进行接触。

在另一个示例性的实施方案中,肽是根据本领域中众所周知的方法在细菌中表达的,特别是在大肠杆菌细胞中。当具有O-连接的聚糖一致位点的肽在大肠杆菌细胞中表达时,该O-连接的一致位点将不是糖基化的。在该情况下,想要的聚糖分子必须以与上文对啤酒糖酵母表达所描述的相似的方式从肽主链中构造。进一步地,当具有O-连接聚糖的肽在真核细胞中表达,但不具有将新生肽导向到高尔基体中的适当前导肽时,成熟的肽可能不被糖基化。同样在这种情况下,可通过直接从肽O-连接一致位点构造聚糖而使O-连接的糖基结构添加到该肽中。进一步地,当蛋白质用糖部分进行化学修饰时,它也可如上述地进行重构。

这些例子想要阐明本发明而决不是进行限制。本领域技术人员将理解在每一个例子中进行的步骤在一些情况下能够以不同的顺序进行而取得相同的结果。本领域的技术人员也将理解不同的步骤也可产生相同的聚糖。进一步地,优选地重构的聚糖决不对表达该肽的表达系统是特异性的。重构的聚糖仅是阐明性的,且本领域的技术人员将知道如何从这些例子中取得原则并将其应用于在不同表达系统中产生的肽中以制备在此处未特定描述的聚糖。

C.糖缀合,一般性描述

本发明提供了制备糖基化的或非糖基化的肽的缀合物的方法。本发明的缀合物是在肽和不同种类如水溶性聚合物、治疗部分、诊断部分、导向部分等之间形成的。同样提供的是包括通过连接体臂连接在一起的两个或多个肽的缀合物,即多功能缀合物。本发明的多功能缀合物可包括相同肽的两个或多个拷贝或具有不同结构和/或性质的不同肽的集合。

本发明的缀合物也可通过修饰的糖向糖基化的或非糖基化的肽的酶促附着而形成。当在肽和糖上修饰基团之间插入时,该修饰的糖则变为在此处所称的“完整糖基连接基团”。利用酶如糖基转移酶的精确的选择性,本发明的方法提供了在一个或多个特定位置具有想要的基团的肽。因而,根据本发明,修饰的糖是直接附着到肽链上选择的位置的,或可选择地,修饰的糖是附加到肽的糖部分上的。其中修饰的糖连接到肽的糖上和直接连接到肽主链的氨基酸残基两者上的肽也在本发明的范围之内。

与已知的化学和酶促肽处理策略相反,本发明的方法使得可能组装具有基本同质的衍生化模式的肽和糖肽;用于本发明的酶通常对肽上特定的氨基酸残基或氨基酸残基的组合或者特定的聚糖结构是选择性的。该方法对于修饰的肽和糖肽的大规模生产也是可行的。因而,本发明的方法提供了大规模制备具有预选的基本统一的衍生化模式的肽的实用方法。该方法特别适合于对治疗性肽的修饰,该治疗性肽包括但不局限于在细胞培养的细胞(如哺乳动物细胞、昆虫细胞、真菌细胞、植物细胞、酵母细胞或原核细胞)或转基因植物或动物细胞中的生产过程中不完全糖基化的肽。

本发明的方法也提供了具有增加的半衰期的糖基化的和非糖基化的肽缀合物,该增加的半衰期归因于如由免疫或网状内皮系统(RES)降低的清除速率或降低的摄取速率。此外,本发明的方法提供了掩盖肽上抗原决定簇的方法,因而降低或消除了宿主对肽的免疫反应。导向剂的选择性附着也可用于将肽导向对该特定的导向剂特异性的特定组织或细胞表面受体。此外,提供了一类特定地用治疗部分修饰的肽。

1.缀合物

在第一方面,本发明提供了肽和选择的部分之间的缀合物。肽和选择的部分之间的连接包括在肽和选择的部分之间插入的完整糖基连接基团。如在此处讨论的,选择的部分基本是可附着到糖单位上的任何种类,结果导致可由适当的转移酶识别的“修饰的糖”,该酶将修饰的糖附加到肽上。当在肽和选择的部分之间插入时,该修饰的糖的糖成分则变为“完整糖基连接基团”。该糖基连接基团是从任何单或寡糖形成的,该单或寡糖在用选择的部分修饰之后为适当的转移酶的底物。

本发明的缀合物一般将相应于下面的通常结构:

其中符号a、b、c、d和s代表正的非0的整数;且t是0或正整数。“试剂”是治疗剂、生物活性试剂、可探测的标记、水溶性部分等。该“试剂”可为肽,如酶、抗体、抗原等。连接体可为下文中广泛的连接基团的任何一个。可选择地,该连接体可为单键或“零级连接体(zeroorder linker)”。该肽的特征是不受限制的。示例性的肽在图28中提供。

在一个示例性的实施方案中,选择的部分为水溶性的聚合物。该水溶性聚合物是通过完整糖基连接基团共价附着到肽上的。该糖基连接基团是共价附着到肽的氨基酸残基或糖基残基上的。可选择地,糖基连接基团附着到糖肽的一个或多个糖基单位上。本发明也提供了其中糖基连接基团附着到氨基酸残基和糖基残基两者上的缀合物。

除提供通过酶促添加的完整糖基连接基团而形成的缀合物之外,本发明提供了其取代模式高度同质的缀合物。利用本发明的方法,可能的是形成如下肽缀合物,其中基本所有在本发明缀合物群体中的修饰的糖部分均附着在结构相同的氨基酸或糖基残基的多个拷贝上。因而,在第二方面,本发明提供了具有水溶性聚合物部分群体的肽缀合物,该部分是通过完整糖基连接基团共价连接到肽上的。在本发明优选的缀合物中,基本每一个群体成员均是通过糖基连接基团连接到肽的糖基残基上的,且糖基连接基团所附着的肽的每一个糖基残基均具有相同的结构。

同样提供的是在其上具有通过完整糖基连接基团共价连接的水溶性聚合物部分群体的肽缀合物。在优选的实施方案中,水溶性聚合物部分群体的基本每一个成员均是通过完整糖基连接基团连接到肽的氨基酸残基上的,且在其上附着有完整糖基连接基团的每一个氨基酸残基均具有相同的结构。

本发明也提供了与上述的类似的缀合物,其中肽是通过完整糖基连接基团与治疗部分、诊断部分、导向部分、毒素部分等缀合的。每一个上述的部分可为小分子、天然聚合物(如肽)或合成的聚合物。

在一个示例性的实施方案中,白细胞介素-2(IL-2)是通过双功能的连接体与运铁蛋白缀合的,该双功能的连接体在PEG部分的每一个末端均包括完整糖基连接基团(方案1)。例如,PEG连接体的一个末端用与运铁蛋白附着的完整唾液酸连接体官能化,而另一个末端用与IL-2附着的完整GalNAc连接体官能化。

在另一个示例性的实施方案中,EPO与运铁蛋白缀合。在另一个示例性的实施方案中,EPO与胶质衍生的神经营养生长因子(GDNF)缀合。在这些实施方案中,每一个缀合都是通过前述双功能的连接体实现的,该双功能的连接体在PEG部分的每一个末端均包括完整糖基连接基团。运铁蛋白转运蛋白质通过血-脑屏障。

如在附图中提出的,本发明的缀合物可包括单或多价(如触角结构)的完整糖基连接基团,参见图14-22。本发明的缀合物也包括源自丝氨酸或苏氨酸的O-连接聚糖的糖基连接基团(图11)。因而,本发明的缀合物包括两个种类,其中选择的部分通过单价糖基连接基团附着到肽上。本发明中同样包括的是其中超过一个选择的部分通过多价连接基团附着到肽上的缀合物。一种或多种蛋白质可缀合在一起以利用其生物物理学和生物学性质。

在另外进一步的实施方案中,本发明提供了由于作为缀合物成分的导向剂的存在而选择性地定位于特定组织中的缀合物。在一个示例性的实施方案中,该导向剂是蛋白质。示例性的蛋白质包括运铁蛋白(脑,血液库(blood pool))、人血清(HS)-糖蛋白(骨骼,脑,血液库)、抗体(脑,具有抗体特异性抗原的组织,血液库)、凝固因子V-XII(损伤组织,凝块,癌,血液库)、血清蛋白质如α-酸性糖蛋白、胎球蛋白、α-胎儿蛋白质(脑,血液库)、β2-糖蛋白(肝,动脉粥样斑块,脑,血液库)、G-CSF、GM-CSF、M-CSF和EPO(免疫刺激,癌症,血液库,红血细胞超量生产,神经保护)及白蛋白(半衰期的增加)。

除上面讨论的缀合物之外,本发明提供了制备这些和其他的缀合物的方法。因而,在进一步的方面,本发明提供了在选择的部分和肽之间形成共价缀合物的方法。此外,本发明提供了将本发明的缀合物导向到身体的特定组织或区域的方法。

在示例性的实施方案中,缀合物是在水溶性聚合物、治疗部分、导向部分或生物分子和糖基化或非糖基化的肽之间形成的。聚合物、治疗部分或生物分子是通过完整糖基连接基团与肽缀合的,该完整糖基连接基团在肽和修饰基团(如水溶性聚合物)之间插入并共价地与两者连接。该方法包括使肽与含有修饰的糖和以该修饰的糖为底物的糖基转移酶的混合物接触。该反应是在足以在修饰的糖和肽之间形成共价键的条件下进行的。修饰的糖的糖部分优选地选自核苷酸糖、活化的糖和既非核苷酸糖也非活化的糖的糖。

在一个实施方案中,本发明提供了通过连接基团连接两个或多个肽的方法。连接基团具有任何有用的结构且可选自直链或支链的结构。优选地,附着到肽上的连接体的每一个末端都包括修饰的糖(即新生的完整糖基连接基团)。

在本发明示例性的方法中,两个肽是通过包括PEG连接体的连接体部分连接在一起的。该构建体与在上文图中提出的一般结构一致。如在此处所描述的,本发明的构建体包括两个完整糖基连接基团(即s+t=1)。重点描述包括两个糖基基团的PEG连接体是为了简明的目的,而不应理解为限制用于本发明该实施方案中的连接体臂的特征。

因而,PEG部分在第一个末端用第一个糖基单位官能化,而在第二个末端用第二个糖基单位官能化。第一个和第二个糖基单位优选地为不同转移酶的底物,从而使得第一个肽和第二个肽能够分别直角地附着到第一个和第二个肽上。在实践中,使(糖基)1-PEG-(糖基)2连接体与第一个肽和以第一个糖基单位为底物的第一个转移酶接触,从而形成(肽)1-(糖基)1-PEG-(糖基)2。然后可选择地将第一个转移酶和/或未反应的肽从反应混合物中去除。将第二个肽和以第二个糖基单位为底物的第二个转移酶加入到(肽)1-(糖基)1-PEG-(糖基)2缀合物中,从而形成(肽)1-(糖基)1-pEG-(糖基)2-(肽)2。本领域的技术人员将理解上述的方法也可应用于通过用如分支的PEG、dendrimer、聚(氨基酸)、多糖等在超过两个肽之间形成缀合物。

如在前文所述的,在一个示例性的实施方案中,白细胞介素-2(IL-2)是通过双功能的连接体与运铁蛋白缀合的,该双功能的连接体在PEG部分的每一个末端均包括完整糖基连接基团(方案1)。该IL-2缀合物利用缀合物更大的分子大小而具有比IL-2自身增加的体内半衰期。此外,IL-2与运铁蛋白的缀合选择性地将缀合物导向到脑中。例如,PEG连接体的一个末端用CMP-唾液酸官能化,而另一个用UDP-GalNAc官能化。使该连接体在GalNAc转移酶存在时与IL-2组合,从而导致连接体臂上的GalNAc附着到IL-2上的丝氨酸和/或苏氨酸残基上。

在另一个示例性的实施方案中,运铁蛋白与核酸进行缀合以用于基因治疗

方案1

上述过程可进行多次循环,且不局限于用单个连接体在两个肽之间形成缀合物。此外,本领域的技术人员将理解使位于肽的PEG(或其他的)连接体末端的完整糖基连接基团功能化的反应可在相同的反应容器中同时发生,或者可以逐步的方式进行。当该反应以逐步的方式进行时,在每一个步骤中产生的缀合物是可选择地从一种或多种反应成分(如酶、肽)中纯化的。

进一步的示例性实施方案在方案2中提出。方案2表示制备将选择的蛋白质如EPO导向骨骼并增加选择的蛋白质的循环半衰期的缀合物的方法。

方案2

应用PEG(或其他连接体)的反应性衍生物将一个或多个肽部分附着于连接体上是在本发明的范围之内的。本发明不受反应性PEG类似物的特征的限制。聚(乙二醇)的许多活化的衍生物都是商业上和文献中可获得的。同样在技术人员能力范围内的是选择及如果需要时合成适当活化的PEG衍生物,利用该PEG衍生物可制备用于本发明的底物。参见Abuchowski等人,Cancer Biochem.Biophys.,7:175-186(1984);Abuchowski等人,J.Biol.Chem.,252:3582-3586(1977);Jackson等人,Anal.Biochem.,165:114-127(1987);Koide等人,Biochem.Biophys.Res.Commun.,111:659-667(1983)),二氟乙磺酸(Nilsson等人,Methods Enzymol.,104:56-69(1984);Delgado等人,Biotechnol.Appl.Biochem.,12:119-128(1990));N-羟基琥珀酰亚胺衍生的活性酯(Buckmann等人,Makromol.Chem.,182:1379-1384(1981);Joppich等人,Makromol.Chem.,180:1381-1384(1979);Abuchowski等人,Cancer Biochem.Biophys.,7:175-186(1984);Katre等人,Proc.Natl.Acad.Sci.U.S.A.,84:1487-1491(1987);Kitamura等人,Cancer Res.,51:4310-4315(1991);Boccu等人,Z.Naturforsch.,38C:94-99(1983))、碳酸盐(Zalipsky等人,Poly(ethylene glycol)Chemistry:Biotechnical and BiomedicalApplications,Harris,Ed.,Plenum Press,New York,1992,pp.347-370;Zalipsky等人,Biotechnol.Appl.Biochem.,15:100-114(1992);Veronese等人,Appl.Biochem.Biotech.,11:141-152(1985)),咪唑基甲酸酯(Beauchamp等人,Anal.Biochem.,131:25-33(1983);Berger等人,Blood,71:1641-1647(1988)),4-二硫吡啶(Woghiren等人,Bioconjugate Chem.,4:314-318(1993)),异氰酸盐(Byun等人,ASAIO Journal,M649-M-653(1992))和环氧化物(授予Noishiki等人(1989)的U.S.Pat.No.4,806,595)。其他连接基团包括氨基基团和活化的PEG之间的氨基甲酸乙酯连接。参见Veronese等人,Appl.Biochem.Biotechnol,11:141-152(1985)。

在另一个利用反应性PEG衍生物的示例性实施方案中,本发明提供了延伸选择的肽的血液循环半衰期并基本上将肽导向到血液库中的方法,这是通过使肽与大小足以阻碍肾小球对蛋白质(如白蛋白)的过滤的合成或天然的聚合物进行缀合而实现的。本发明的实施方案在方案3中阐明,其中促红细胞生成素(EPO)利用化学和酶促修饰通过PEG连接体与白蛋白缀合。

方案3

因而,如在方案3中所示的,白蛋白的氨基酸残基是用反应性PEG衍生物修饰的,如X-PEG-(CMP-唾液酸)),其中X是活化基团(如活性酯、异硫氰酸酯等)。使PEG衍生物和EPO组合并与以CMP-唾液酸作为底物的转移酶接触。在进一步的阐明性实施方案中,使赖氨酸的ε-氨基与PEG-连接体的N-羟基琥珀酰亚胺酯反应以形成白蛋白缀合物。使连接体的CMP-唾液酸与EPO上适当的残基如Gal酶促地缀合,从而形成缀合物。技术人员将理解上述方法不局限于所提出的反应物。此外,该方法实际上可利用如具有超过两个末端的分支连接体形成包括超过两个蛋白质的缀合物。

2.修饰的糖

修饰的糖基供体种类(“修饰的糖”)优选地选自修饰的糖核苷酸、活化的修饰的糖和既非核苷酸也未活化的修饰单糖的糖。任何想要的糖结构都可用本发明的方法添加到肽上。一般地,该结构为单糖,但本发明不局限于应用修饰的单糖;寡糖和多糖也可应用。

修饰的基团是通过酶方法、化学方法或其组合附着到糖部分上的,从而产生修饰的糖。糖是在任何使得能够附着修饰的部分的位置取代的,且这仍然使得该糖能够充当用于将修饰的糖连接到肽上的酶的底物。在一个优选的实施方案中,当唾液酸是该糖时,使唾液酸在Pyruvyl侧链上的9-位置或在胺部分上的5-位置用修饰基团取代,该胺部分在唾液酸中通常是乙酰化的。

在本发明某些实施方案中,将修饰的糖核苷酸用于将修饰的糖添加到肽上。以其修饰的形式用于本发明中的示例性糖核苷酸包括单、二或三磷酸核苷酸或其类似物。在一个优选的实施方案中,修饰的糖核苷酸选自UDP-糖苷、CMP-糖苷或GDP-糖苷。甚至更优选地,修饰的糖核苷酸选自UDP-半乳糖、UDP-半乳糖胺、UDP-葡萄糖、UDP-葡糖胺、GDP-甘露糖、GDP-岩藻糖、CMP-唾液酸或CMP-NeuAc。糖核苷酸的N-乙酰胺衍生物也用于本发明的方法中。

本发明也提供了用修饰的糖合成修饰的肽的方法,如修饰的半乳糖、修饰的岩藻糖和修饰的唾液酸。当应用修饰的唾液酸时,唾酸转移酶或反式唾液酸酶(仅针对α2,3-连接的唾液酸)可用于这些方法中。

在另一个实施方案中,修饰的糖是活化的糖。用于本发明的活化的修饰的糖一般为已进行合成改变以包括活化的离去基团的糖苷。如在此处所用的,术语“活化的离去基团”指那些在酶调节的亲核取代反应中易于置换的部分。许多活化的糖是本领域中公知的。参见如Vocadlo等人,Carbohydrate Chemistry and Biology,卷2,Ernst等人,Wiley-VCH Verlag:Weinheim,德国,2000;Kodama等人,Tetrahedron Lett.34:6419(1993);Lougheed等人,J.Biol.Chem.274:37717(1999))。

活化基团(离去基团)的例子包括氟、氯、溴、甲苯磺酸酯(tosylate)、甲磺酸酯(mesylate)、三氟甲基磺酸酯等。用于本发明的优选的活化的离去基团是那些不显著地空间阻碍糖苷向受体的酶促转移的。因此,活化的糖苷衍生物的优选实施方案包括糖基氟化物和糖基甲磺酸酯,其中糖基氟化物是特别优选的。在糖基氟化物中,最优选的是α-半乳糖基氟化物、α-甘露糖基氟化物、α-葡糖基氟化物、α-岩藻糖基氟化物、α-木糖基氟化物、α-唾液酸氟化物、α-N-乙酰葡糖胺氟化物、α-N-乙酰半乳糖胺氟化物、β-半乳糖基氟化物、β-甘露糖基氟化物、β-葡糖基氟化物、β-岩藻糖基氟化物、β-木糖基氟化物、β-唾液酸氟化物、β-N-乙酰葡糖胺氟化物、β-N-乙酰半乳糖胺氟化物。

举例来说,糖基氟化物可通过首先使糖乙酰化并然后用HF/吡啶对其进行处理而从游离糖制备。这生成了热力学上最稳定的保护的(乙酰化的)糖基氟化物的异头物(即α-糖基氟化物)。如果想要较不稳定的异头物(即β-糖基氟化物),那么它可通过用HBr/HOAc或用HCl将过乙酰化的糖转变为异头的溴化物或氯化物而制备。使该中间物与氟化物盐如氟化银反应以生成糖基氟化物。乙酰化的糖基氟化物可通过与甲醇中温和的(催化性的)碱(如NaOMe/MeOH)反应而去保护。此外,许多糖基氟化物是商业上可购得的。

其他活化的糖基衍生物可用本领域技术人员公知的常规方法制备。例如,糖基甲磺酸酯可通过用甲磺酰基氯化物对糖的完全苄化的半缩醛形式进行处理并随后通过催化加氢作用去除苯甲基基团而制备。

在进一步的示例性实施方案中,修饰的糖是具有触角结构的寡糖。在一个优选的实施方案中,触角的一个或多个末端具有修饰部分。当一个或多个修饰部分附着到具有触角结构的寡糖上时,该寡糖可用于“扩增”修饰部分;每一个缀合到肽上的寡糖单位均将修饰基团的多个拷贝附着在肽上。如在上面图中提出的本发明螯合物的一般结构包含多价种类,该多价种类是从用触角结构制备本发明的缀合物中结果得到的。许多触角糖结构是本领域中公知的,且本发明的方法可不受限制地对它们实施。

示例性的修饰基团在下文讨论。该修饰基团可根据一种或多种想要的性质进行选择。示例性的性质包括但不局限于增强的药物代谢动力学、增强的药物动力学、改善的生物分配、提供多价种类、改善的水溶性、增强的或减小的亲脂性和组织导向。

D.肽缀合物

a)水溶性聚合物

选择的肽的亲水性是通过与极性分子如含有胺、酯、羟基和多羟基的分子缀合而增强的。代表性的例子包括但不局限于聚赖氨酸、聚乙烯亚胺、聚(乙二醇)和聚(丙二醇)。优选的水溶性聚合物基本为非荧光的,或仅放射少量的荧光,从而它们不适合于用作测定中的荧光标记。可使用是天然不存在的糖的聚合物。此外,也可应用其他通过共价附着其他实体(如,聚(乙二醇)、聚(丙二醇)、聚(天冬氨酸)、生物分子、治疗部分、诊断部分等)而修饰的天然存在的糖。在另一个示例性实施方案中,治疗性的糖部分是缀合到连接体臂上的,且该糖-连接体臂随后通过本发明的方法缀合到肽上。

使水溶性聚合物和糖活化的方法和化学物以及用于使糖和聚合物与各个种类缀合的方法描述于文献中。常用的活化聚合物的方法包括用溴化氰、过碘酸盐、戊二醛、二环氧化物(biepoxides)、表氯醇、二乙烯砜、碳二亚胺、磺酰卤、三氯三嗪等对官能基团的活化(参见R.F.Taylor,(1991),Protein Immobilisation:Fundamentals andApplications,Marcel Dekker,N.Y.;S.S.Wong,(1992)Chemistry ofProtein Conjugation and Crosslinking,CRC Press,Boca Raton;G.T.Hermanson等人,(1993),Immobilized Affinity Ligand Techniques,Academic Press,N.Y.;Dunn,R.L.等人,Eds.Polymeric Drugs andDrug Delivery Systems,ACS Symposium Series Vol.469,AmericanChemical Society,Washington,D.C.1991)。

制备反应性PEG分子和用反应性分子形成缀合物的途径是本领域中公知的。例如,美国专利No.5,672,662公开了聚合物酸的活性酯的水溶性和可分离的缀合物,该聚合物酸选自线性或分支的聚环氧烷、聚(氧乙基化多元醇)、聚(烯醇)、聚(丙烯吗啉),其中聚合物具有约44个或更多的重复单位。

美国专利No.6,376,604提出了制备水溶性和非肽的聚合物的水溶性1-苯并三唑基碳酸酯的方法,该方法通过使聚合物的末端羟基与二(1-苯并三唑基)碳酸酯在有机溶剂中反应而完成。该活性酯可用于与生物学活性剂如蛋白质或肽形成缀合物。

WO 99/45964描述了包含生物学活性剂和活化的水溶聚合物的缀合物,所述聚合物包含具有至少一个通过稳定键与聚合物主链连接的末端的聚合物主链,其中至少一个末端包含具有与分支部分连接的近端反应性基团的分支部分,在其中生物学活性剂连接到至少一个近端反应性基团上。其他分支的聚(乙二醇)描述于WO 96/21469中,美国专利No.5,932,462描述了与包括分支末端的分支PEG分子形成的缀合物,该分支末端包括反应性的官能基团。游离的反应性基团能够与生物学活性种类如蛋白质或肽进行反应,从而在聚(乙二醇)和生物学活性种类之间形成缀合物。美国专利No.5,446,090描述了双功能的PEG连接体及其在形成缀合物中的应用,该缀合物在每一个PEG连接体末端均具有肽。

包括可降解的PEG连接的缀合物描述于WO 99/34833中和WO99/14259以及美国专利No.6,348,558中。这种可降解的连接可应用于本发明中。

尽管反应性的PEG衍生物和用该衍生物形成的缀合物两者在本领域中均是公知的,但直到本发明,人们尚未认识到在PEG(或其他聚合物)和其他种类如肽或糖肽之间可以通过完整糖基连接基团形成缀合物。

许多水溶性聚合物是本领域技术人员公知的且可用于本发明的实践中。术语水溶性聚合物包含以下种类,如糖(如葡聚糖、直链淀粉、透明质酸、聚(唾液酸)、类肝素、肝素等);聚(氨基酸),如聚(谷氨酸);核酸;合成的聚合物(如聚(丙烯酸));聚(醚)如聚(乙二醇);肽;蛋白质等。本发明可用任何水溶性的聚合物来进行,唯一的限制是该聚合物必须包括缀合物的剩余部分可附着的位点。

使聚合物活化的方法也发现于WO 94/17039、U.S.Pat.No.5,324,844、WO 94/18247、WO 94/04193、U.S.Pat.No.5,219,564、U.S.Pat.No.5,122,614、WO 90/13540、U.S.Pat.No.5,281,698中,且更多的为WO 93/15189,且也有方法是针对活化的聚合物和肽之间的缀合物的,如凝固因子VIII(WO 94/15625)、血红蛋白(WO 94/09027)、携带氧的分子(U.S.Pat.No.4,412,989)、核糖核酸酶和超氧化物歧化酶(Veronese等人,Appl.Biochem.Biotech.11:141-145(1985))。

优选的水溶性聚合物是那些其中聚合物样品中大量比例的聚合物分子具有大约相同的分子量;这种聚合物是“单分散的(homodisperse)”。

本发明进一步用聚(乙二醇)缀合物进行了阐明。对PEG的官能化和缀合的几个综述和专著是可获得的。参见如Harris,Macronol.Chem.Phys.C25:325-373(1985);Scouten,Methods in Enzymology135:30-65(1987);Wong等人,Enzyme Microb.Technol.14:866-874(1992);Delgado等人,Critical Reviews in Therapeutic Drug CarrierSystems 9:249-304(1992);Zalipsky,Bioconjugate Chem.6:150-165(1995);和Bhadra等人,Pharmazie,57:5-29(2002)。

适用于本发明的聚(乙二醇)包括但不局限于那些由下面分子式3所描述的:

分子式3

R=H、烷基、苄基、芳基、缩醛、OHC-、H2N-CH2CH2-、HS-CH2CH2-、-糖-核苷酸、蛋白质、甲基、乙基;

X、Y、W、U(独立选择的)=O、S、NH、H-R’;

R’、R_(独立选择的)=烷基、苄基、芳基、烷基芳基、吡啶基、取代的芳基、芳基烷基、酰基烷基;

n=1~2000;

m、q、p(独立选择的)=0~20;

o=0~20;

Z=HO、NH2、卤素、S-R_、活化酯、

-糖-核苷酸、蛋白质、咪唑、HOBT、四唑、卤化物;和

V=HO、NH2、卤素、S-R_、活化酯、活化酰胺、-糖-核苷酸、蛋白质。

在优选的实施方案中,聚(乙二醇)分子选自下面的:

用于形成本发明缀合物的聚(乙二醇)是线性的或分支的。适用于本发明的分支的聚(乙二醇)包括但不局限于那些由下面分子式描述的:

分子式4

R’、R”、R_(独立选择的)=H、烷基、苄基、芳基、缩醛、OHC-、H2N-CH2CH2-、HS-CH2CH2-、-(CH2)qCY-Z、-糖-核苷酸、蛋白质、甲基、乙基、杂芳基、酰基烷基、酰基芳基、酰基烷基芳基;

X、Y、W、A、B(独立选择的)=O、S、NH、H-R’、(CH2)1

n、p(独立选择的)=1~2000;

m、q、o(独立选择的)=0~20;

Z=HO、NH2、卤素、S-R_、活化酯、

-糖-核苷酸、蛋白质;

V=HO、NH2、卤素、S-R_、活化酯、活化酰胺、-糖-核苷酸、蛋白质。

治疗剂的体内半衰期、曲线下面积和/或保留时间也可用水溶性聚合物如聚乙二醇(PEG)和聚丙二醇(PPG)来增强。例如,用PEG对蛋白质的化学修饰(PEG化)增加了其分子大小并减小了其表面可接近性和功能基团可接近性,这均依赖于在蛋白质上附着的PEG的大小。这导致了血浆半衰期和蛋白水解稳定性的改善及免疫原性和肝摄取的降低(Chaffee等人,J.Clin.Invest.89:1643-1651(1992);Pyatak等人,Res.Commun.Chem.Pathol Pharmacol.29:113-127(1980))。已报道白细胞介素-2的PEG化可增加在体内的抗肿瘤能力(Katre等人,Proc.Natl.Acad.Sci.USA.84:1487-1491(1987)),而源自单克隆抗体A7的F(ab’)2的PEG化可改善其肿瘤定位(Kitamura等人,Biochem.Biophys.Res.Commun.28:1387-1394(1990))。

在一个优选的实施方案中,通过本发明的方法用水溶性聚合物衍生化的肽的体内半衰期相对于非衍生化的肽的体内半衰期增加了。在另一个优选的实施方案中,通过本发明的方法用水溶性聚合物衍生化的肽的曲线下面积相对于非衍生化的肽的曲线下面积增加了。在另一个优选的实施方案中,通过本发明的方法用水溶性聚合物衍生化的肽的保留时间相对于非衍生化的肽的保留时间增加了。确定体内半衰期、曲线下面积和保留时间的技术是本领域中众所周知的。这种技术的描述可参见J.G.Wagner,1993,Pharmacokinetics for thePharmaceutical Scientist,Technomic Publishing Company,Inc.Lancaster PA。

肽体内半衰期的增加最好表达为该量的百分比增加范围。该百分比增加范围的下限是约40%、约60%、约80%、约100%、约150%或约200%。该范围的上限是约60%、约80%、约100%、约150%或超过约250%。

在一个示例性的实施方案中,本发明提供了PEG化的促卵泡激素(实施例23和24)。在进一步优选的实施方案中,本发明提供了PEG化的运铁蛋白(实施例42)。

用于本发明的水溶性聚合物的其他例子包括但不局限于线性或分支的聚环氧烷、(聚氧乙基化多元醇)、聚(烯醇)、聚(丙烯吗啉)、葡聚糖、淀粉、聚(氨基酸)等。

b)水不溶性聚合物

本发明的缀合物也可包括一种或多种水不溶性的聚合物。本发明的实施方案是通过应用缀合物作为以有控制的方式送递治疗性肽的载体来阐明的。聚合物药物送递系统是本领域中公知的。参见如Dunn等人,Eds.Polymeric Drugs and Drug Delivery Systems,ACSSymposium Series Vol.469,American Chemistry Society,Washington,D.C.1991。本领域的技术人员将理解基本上任何已知的药物送递系统均可应用于本发明的缀合物。

代表性的水不溶性聚合物包括但不局限于聚膦嗪、聚乙烯醇、聚酰胺、聚碳酸酯、聚亚烷类、聚丙烯酰胺、聚(亚烷基)二醇、聚环氧烷、聚亚烷基对苯二酸酯、聚乙烯醚、聚乙烯酯、聚卤代乙烯、聚乙烯吡咯烷酮、聚乙醇酸交酯、聚硅氧烷、聚氨基甲酸酯、聚甲基丙烯酸甲酯、聚甲基丙烯酸乙酯、聚甲基丙烯酸丁酯、聚甲基丙烯酸异丁酯、聚甲基丙烯酸己酯、聚甲基丙烯酸异癸酯、聚甲基丙烯酸月桂酯、聚甲基丙烯酸苯酯、聚丙烯酸甲酯、聚丙烯酸异丙酯、聚丙烯酸异丁酯、聚丙烯酸十八酯、聚乙烯、聚丙烯、聚乙二醇、聚环氧乙烷、聚对苯二甲酸乙二酯、聚乙酸乙烯酯、聚氯乙烯、聚苯乙烯、聚乙烯吡咯烷酮、pluronics和聚乙烯苯酚及其共聚物。

用于本发明的缀合物中的合成性修饰的天然聚合物包括但不局限于烷基纤维素、羟烷基纤维素、纤维素醚、纤维素酯和硝酸纤维素。合成性修饰的天然聚合物大类中特别优选的成员包括但不局限于甲基纤维素、乙基纤维素、羟丙基纤维素、羟丙基甲基纤维素、羟丁基甲基纤维素、乙酸纤维素、丙酸纤维素、乙酸丁酸纤维素、乙酸邻苯二甲酸纤维素、羧甲基纤维素、三乙酸纤维素、硫酸纤维素钠盐及丙烯酸和甲基丙烯酸酯和藻酸的聚合物。

在此处讨论的这些和其他聚合物可易于从商业来源购得,如Sigma Chemical Co.(St.Louis,MO.)、Polysciences(Warrenton,PA.)、Aldrich(Milwaukee,WI.)、Fluka(Ronkonkoma,NY)和BioRad(Richmond,CA),或者可用标准技术从自这些供应商获得的单体进行合成。

用于本发明的缀合物中的代表性生物可降解的聚合物包括但不局限于聚交酯、聚乙醇酸交酯及其共聚物、聚对苯二甲酸乙二酯、聚丁酸、聚戊酸、聚(丙交酯-共-己内酯)、聚(丙交酯-共-乙内酯)、聚酐、聚原酸酯及其混合物和共聚物。具有特别的应用的是形成凝胶的组合物,如那些包括胶原、pluronics等的。

用于本发明的聚合物包括具有水不溶性材料的“杂合”聚合物,该水不溶性材料在其结构的至少一部分中具有可生物再吸收的分子。这种聚合物的一个例子如下:其包括具有可生物再吸收区域的水不溶性共聚物、亲水区域,并且每条聚合物链具有多个可交联的官能团。

对于本发明的目的,“水不溶性材料”包括在水中或含有水的环境中基本不溶解的材料。因而,尽管共聚物的某些区域或区段可为亲水的或甚至水溶性的,但聚合物分子整体在水中不能在任何基本可测量的程度溶解。

对于本发明的目的,术语“可生物再吸收的材料”包括能够进行代谢或分解并由身体通过正常的排泄途径再吸收和/或排除的区域。这种代谢物或分解产物优选地对身体是基本无毒的。

可生物再吸收的区域可为疏水或亲水的,只要使聚合物整体不是水可溶性的。因而,可生物再吸收的区域是基于聚合物整体保持水不溶性而优选选择的。因此,选择相关的性质(即可生物再吸收的区域含有的功能基团的种类和该区域的相对比例以及亲水区域)以确保有用的可生物再吸收的组合物保持水不溶性。

示例性的可再吸收的聚合物包括如合成生产的可再吸收的多α-羟基-羧酸/聚氧化烯的嵌段共聚物(参见Cohn等人,美国专利No.4,826,945)。这些共聚物不是交联的且是水溶性的,从而身体可排泄降解的嵌段共聚物组合物。参见Younes等人,J.Biomed.Mater.Res.21:1301-1316(1987);和Cohn等人,J.Biomed.Mater.Res.22:993-1009(1988)。

目前优选的生物可再吸收的聚合物包括一种或多种选自聚酯、多羟基酸、聚内酯、聚酰胺、聚酰胺酯、聚氨基酸、聚酐、聚原酸酯、聚碳酸酯、聚膦嗪、聚磷酸酯、聚硫酯、多糖及其混合物的成分。该可生物再吸收的聚合物更加优选地包括多羟基酸成分。多羟基酸,聚乳酸、聚乙醇酸、聚己酸、聚丁酸、聚戊酸及其共聚物和混合物是优选的。

除形成在体内吸收的(“生物再吸收的”)片段之外,用于本发明的方法的优选的聚合物包被物也可形成可排泄的和/或可代谢的片段。

更高级的共聚物也可用于本发明中。例如,Casey等人于1984年3月20日发表的美国专利No.4,438,253公开了从对聚乙醇酸和羟基结尾的聚(亚烷基)二醇的转酯生产的三-嵌段的共聚物。将这种组合物公开以用作可再吸收的单丝缝线。这种组合物的柔性是通过将芳族原碳酸酯如四-对-甲苯基原碳酸酯整合入共聚物结构中而控制的。

也可应用基于乳酸和/或乙醇酸的其他包被物。例如,Spinu于1993年4月13日发表的美国专利No.5,202,413公开了生物可降解的具有连续顺序的聚交酯和/或聚乙醇酸交酯嵌段的多嵌段共聚物,该嵌段共聚物是通过交酯和/或乙交酯在寡聚二醇或二胺上的开环聚合及随后通过用双功能的化合物进行的链延伸而产生的,该双功能的化合物如二异氰酸酯、二酰基氯化物或二氯硅烷。

用于本发明的包被物的可生物再吸收区域可设计为可水解和/或酶切割的。为了本发明的目的,“可水切割”指共聚物尤其是可生物再吸收区域对在水中或含水的环境中水解的易感性。类似地,“可酶切割”在此处用于指共聚物尤其是可生物再吸收区域对内源或外源酶切割的易感性。

当处于身体中时,亲水区域可加工为可排泄的和/或可代谢的片段。因而,亲水区域可包括如聚醚、聚环氧烷、多元醇、聚(乙烯吡咯烷)、聚乙烯醇、聚(烷基噁唑啉)、多糖、糖、肽、蛋白质及其共聚物和混合物。此外,亲水区域也可为如聚环氧烷。这种聚环氧烷可包括如聚环氧乙烷、聚环氧丙烷及其混合物和共聚物。

作为水凝胶的成分的聚合物也可用于本发明中。水凝胶是能够吸收相对大量的水的聚合物材料。形成水凝胶的化合物的例子包括但不局限于聚丙烯酸、羧甲基纤维素钠、聚乙烯醇、聚乙烯吡咯烷、明胶、角叉藻聚糖和其他多糖、羟亚乙基甲基丙烯酸(HEMA)以及其衍生物等。可生产稳定的、生物可降解的和可生物再吸收的水凝胶。此外,水凝胶组合物可包括展示一种或多种该性质的亚基。

其完整性可通过交联控制的生物相容性水凝胶组合物是公知的且目前优选地用于本发明的方法中。例如,Hubbell等人于1995年4月25日发表的美国专利No.5,410,016和于1996年6月25日发表的5,529,914公开了水溶性系统,该系统是具有水溶性中心嵌段区段的交联嵌段共聚物,该水溶性中心嵌段区段在两个水解不稳定的延伸物中夹入。这种共聚物进一步用可光聚合的丙烯酸酯官能团进行末端加帽。当交联后,这些系统变为水凝胶。这种共聚物的水溶性中央嵌段物可包括聚乙二醇;然而水解不稳定的延伸物可为多α-羟基酸,如聚乙醇酸或聚乳酸。参见Sawhney等人,Macromolecules 26:581-587(1993)。

在另一个优选的实施方案中,凝胶是热可逆的(thermoreversible)凝胶。如下热可逆的凝胶是目前优选的,即该热可逆的凝胶包括如pluronics、胶原、明胶、透明质酸、多糖、聚氨基甲酸酯水凝胶、聚氨基甲酸酯-尿素水凝胶及其组合。

在另一个示例性实施方案中,本发明的缀合物包括脂质体成分。脂质体可根据本领域的技术人员公知的方法制备,如描述于Eppstein等人于1985年6月11日发表的美国专利No.4,522,811中的。例如,脂质体可通过将适当的脂质(如硬酰脂基磷脂酰乙醇胺、硬脂酰基磷脂酰胆碱、花生酰基(arachadoyl)磷脂酰胆碱和胆固醇)溶解于无机溶剂中然后蒸发而制备,从而在容器表面剩余一薄层干燥的脂质。然后将活性化合物或其药物可接受的盐的水溶液引入到容器中。然后用手使容器旋转以使脂质材料从容器的侧面释放并分散脂质团聚体,从而形成脂质体悬浮液。

上述的微颗粒和制备该微颗粒的方法是通过例示的方法提供的,且它们不是想要限制用于本发明的微颗粒的范围。对于本领域的技术人员显而易见的是由不同方法制造的一系列微颗粒都可用于本发明中。

c)生物分子

在另一个优选的实施方案中,修饰的糖具有生物分子。在另外进一步优选的实施方案中,该生物分子是功能蛋白质、酶、抗原、抗体、肽、核酸(如单核苷酸或核苷、寡核苷酸、多核苷酸和单链和多于一条链的核酸)、凝集素、受体或其组合。

一些优选的生物分子是基本无荧光的,或仅放射最小量的荧光,从而它们不适合于用作测定中的荧光标记。其他生物分子可为荧光的。应用其他通过共价附着另一个实体(如PEG、生物分子、治疗部分、诊断部分等)而修饰的天然存在的糖是适当的。在一个示例性的实施方案中,使作为生物分子的糖部分与连接体臂缀合,且随后将糖-连接体臂盒与肽通过本发明的方法进行缀合。

用于本发明的实践中的生物分子可源自任何来源。该生物分子可从天然来源分离或可由合成方法生产。肽可为天然的肽或突变的肽。突变可由化学诱变、定点诱变或其他本领域技术人员公知的诱导突变的方法来实现。用于实践本发明的肽包括如酶、抗原、抗体和受体。抗体可为多克隆或单克隆的;完整的或片段的。肽可选择地是定向进化程序的产物。

源自天然的和合成的肽和核酸两者一起均可用于本发明中;这些分子可通过任何可用的反应基团而附着到糖基残基成分或交联剂上。例如,肽可通过反应性的胺、羧基、巯基或羟基基团而附着。该反应性基团可位于肽的末端或位于肽链的内部位点。核酸可通过碱基上的反应性基团(如环外胺)或糖部分上可用的羟基(如3’-或5’-羟基)来附着。肽和核酸链可进一步在一个或多个位点进行衍生化以使得能够将适当的反应性基团附着到链上。参见Chrisey等人,Nucleic AcidsRes.24:3031-3039(1996)。

在进一步优选的实施方案中,选择生物分子以将用本发明的方法修饰的肽导向到特定的组织中,从而相对于送递到该组织中的未衍生化的肽的量增强肽向该组织的送递。在另外进一步的优选实施方案中,在选择的时间段内送递到特定组织中的衍生化肽的量通过衍生化增强了至少约20%、更优选地为至少约40%,且更加优选地为至少约100%。目前,用于导向应用的优选的生物分子包括抗体、激素和细胞表面受体的配体。示例性的导向生物分子包括,但不局限于对用于将分子送递到脑的运铁蛋白受体特异性的抗体(Penichet等人,1999,J.Immunol.163:4421-4426;Pardridge,2002,Adv.Exp.Med.Biol.513:397-430)、识别前列腺的维管结构的肽(Arap等人,2002,PNAS99:1527-1531)和对肺细胞膜穴样内陷特异性的抗体(McIntosh等人,2002,PNAS 99:1996-2001)。

在目前优选的实施方案中,修饰基团是蛋白质。在一个示例性的实施方案中,该蛋白质是干扰素。该干扰素是抗病毒的糖蛋白,该糖蛋白在人中是由人的初级成纤维细胞在用病毒或双链RNA诱导后分泌的。干扰素可用作治疗剂,如抗病毒和对多发性硬化的治疗。对于讨论干扰素-β的参考文献,参见如Yu等人,J.Neuroimmunol.,64(1):91-100(1996);Schmidt,J.Neurosci.Res.,65(1):59-67(2001);Wender等人,Folia Neuropathol.,39(2):91-93(2001);Martin等人,Springer Semin.Immunopathol.,18(1):1-24(1996);Takane等人,J.Pharmacol.Exp.Ther.,294(2):746-752(2000);Sburlati等人,Biotechnol.Prog.,14:189-192(1998);Dodd等人,Biochimicaet Biophysica Acta,787:183-187(1984);Edelbaum等人,J.InterferonRes.,12:449-453(1992);Conradt等人,J.Biol.Chem.,262(30):14600-14605(1987);Civas等人,Eur.J.Biochem.,173:311-316(1988);Demolder等人,J.Biotechnol.,32:179-189(1994);Sedmak等人,J.Interferon Res.,9(Suppl 1):S61-S65(1989);Kagawa等人,J.Biol.Chem.,263(33):17508-17515(1988);Hershenson等人,美国专利No.4,894,330;Jayaram等人,J.InterferonRes.,3(2):177-180(1983);Menge等人,Develop.Biol.Standard.,66:391-401(1987);Vonk等人,J.Interferon Res.,3(2):169-175(1983);和Adolf等人,J.Interferon Res.,10:255-267(1990)。关于干扰素-α的参考文献,参见Asano等人,Eur.J.Cancer,27(Suppl 4):S21-S25(1991);Nagy等人,Anticancer Research,8(3):467-470(1988);Dron等人,J.Biol.Regul.Homeost.Agents,3(1):13-19(1989);Habib等人,Am.Surg.,67(3):257-260(3/2001);和Sugyiama等人,Eur.J.Biochem.,217:921-927(1993)。

在示例性的干扰素缀合物中,干扰素β是通过连接体臂与第二个肽缀合的。该连接体臂包括完整糖基连接基团,该连接体臂是通过该完整糖基连接基团而用本发明的方法附着到第二个肽上的。该连接体臂也可选择地包括第二个完整糖基连接基团,通过该完整糖基连接基团可附着到干扰素上。

在另一个示例性的实施方案中,本发明提供了促卵泡激素(FSH)的缀合物。FSH是糖蛋白激素。参见如Saneyoshi等人,Biol.Reprod.,65:1686-1690(2001);Hakola等人,J.Endocrinol.,158:441-448(1998);Stanton等人,Mol.Cell.Endocrinol.,125:133-141(1996);Walton等人,J.Clin.Endocrinol.Metab.,86(8):3675-3685(08/2001);Ulloa-Aguirre等人,Endocrine,11(3):205-215(12/1999);Castro-Fernández等人,I.J.Clin.Endocrinol.Metab.,85(12):4603-4610(2000);Prevost,Rebecca R.,Pharmacotherapy,18(5):1001-1010(1998);Linskens等人,The FASEB Journal,13:639-645(04/1999);Butnev等人,Biol.Reprod.,58:458-469(1998);Muyan等人,Mol.Endo.,12(5):766-772(1998);Min等人,Endo.J.,43(5):585-593(1996);Boime等人,Recent Progress in HormoneResearch,34:271-289(1999);和Rafferty等人,J.Endo.,145:527-533(1995)。FSH缀合物可以以与对干扰素描述的相似的方式形成。

在另外一个示例性实施方案中,缀合物包括促红细胞生成素(EPO)。EPO已知介导低氧的反应和刺激红血细胞的产生。对于有关的参考文献,参见Cerami等人,Seminars in Oncology,28(2)(Suppl 8):66-70(04/2001)。示例性的EPO缀合物的形成方法与干扰素的缀合物类似。

在进一步示例性的实施方案中,本发明提供了人粒细胞集落刺激因子(G-CSF)的缀合物。G-CSF是刺激促神经生成性(neutropoietic)祖先细胞繁殖、分化和活化以形成功能上成熟的嗜中性细胞的糖蛋白。已知注射的G-CSF将很快从身体中清除。参见如Nohynek等人,Cancer Chemother.Pharmacol.,39:259-266(1997);Lord等人,ClinicalCancer Research,7(7):2085-2090(07/2001);Rotondaro等人,Molecular Biotechnology,11(2):117-128(1999)和B_nig等人,Bone Marrow Transplatation,28:259-264(2001)。示例性的G-CSF缀合物是如上文对干扰素的缀合物的描述那样制备的。本领域的技术人员将理解许多其他的蛋白质可用本发明的方法和组合物与干扰素缀合,这包括但不局限于列于表7和8(在别处提供)和图28和图29-57中的肽,其中提供了单独的修饰方案。

在另外进一步的示例性实施方案中,提供了与生物素的缀合物。因而,例如选择性生物素化的肽可通过附着具有一个或多个修饰基团的抗生物素蛋白或链霉抗生物素蛋白而制作。

在进一步优选的实施方案中,选择生物分子以将用本发明的方法修饰的肽导向到特定的细胞内区室中,从而相对于送递到该组织中的未衍生化的肽的量增强肽向该细胞内区室中的送递。在另外进一步的优选实施方案中,在选择的时间段内送递到特定细胞内区室中的衍生化的肽的量通过衍生化增强了至少约20%、更优选地为至少约40%,且更加优选地为至少约100%。在另一个特别优选的实施方案中,使生物分子通过可切割的连接体与肽进行连接,该连接体一旦内化后即可水解。目前,用于细胞内导向应用的优选的生物分子包括运铁蛋白、乳运铁蛋白(乳铁蛋白)、黑素瘤运铁蛋白(melanotranferrin)(p97)、血浆铜蓝蛋白和二价阳离子转运蛋白,以及抗特定的血管靶标的抗体。预期的连接包括但不局限于蛋白质-糖-连接体-糖-蛋白质、蛋白质-糖-连接体-蛋白质及其多价形式,和蛋白质-糖-连接体-药物,其中药物包括小分子、肽、脂质等。

治疗剂的位点特异性和目标导向的送递是为了治疗各种人类疾病的目的所想要的,该疾病如各种类型的恶性肿瘤和某些神经病症。这种程序是由药物的较低副作用和较高的功效伴随的。在设计这些送递系统时依赖于各种原则。关于综述,参见Garnett,Advanced DrugDelivery Reviews 53:171-216(2001)。

在设计药物送递系统中一个重要的考虑是目标组织特异性。肿瘤表面抗原的发现使得可能发展治疗方法,在该治疗方法中展示限定的表面抗原的肿瘤细胞是特异性地导向并被杀死的。主要有3类在人类临床治疗恶性肿瘤的实验中证明有效的治疗性单克隆抗体(抗体):(1)未缀合的MAb,它可直接诱导生长抑制和/或细胞程序死亡,或者间接地活化宿主的防御机制以介导抗肿瘤细胞毒性;(2)药物缀合的MAb,它优选地将有力的细胞毒素送递到肿瘤细胞中因而使通常与常规治疗相关的全身性细胞毒性最小化;和(3)放射性同位素缀合的MAb,它将无菌剂量的放射物送递到肿瘤中。参见Reff等人,CancerControl 9:152-166(2002)的综述。

为了使MAb具有杀死恶性细胞的能力,可使MAb与毒素连接,该毒素可从植物、细菌或真菌来源获得,从而形成称为免疫毒素的嵌合蛋白质。常用的植物毒素分为两类:(1)全毒素(或II类核糖体失活蛋白),如蓖麻毒蛋白、相思豆毒蛋白、槲寄生凝集素和modeccin,和(2)半毒素(I类核糖体失活蛋白),如美洲商陆抗病毒蛋白(PAP)、皂角素、Bryodin 1、bouganin和gelonin。常用的细菌毒素包括白喉毒素(DT)和假单胞菌外毒素(PE)。Kreitman,Current PharmaceuticalBiotechnology 2:313-325(2001)。其他预期用于本发明的毒素包括,但不局限于表2中所示的毒素。

表2.毒素。

1 WO-09739025;US-6025466

2 EP-00626383 30 November 1994

3 JP-10101676

4 WO-09705162;WO-09717364(dolastatin synthesis and analogs)

5 Kosan licensed patent for Epothilone analogs from Sloan-Kettering;US 00185968

6 WO-09723211

7 WO-09723211

8 JP-08092232

9 WO-09633211

10 EP-00608111;EP-00632042;EP-00634414;WO-09748278

11 EP-00425235;JP-53124692

12 US-05416064;US-05208020;EP-00425235B

13 EP-004252351 JP-53124692;US-06333410B1

14 JP-1104183

15 EP-00689845

16 EP-00689845

17 EP-00136791;EP-00087957

18 US 50001112;US 5143906.

19 WO-00136048

常规的免疫毒素含有与毒素化学缀合的MAb,对该毒素进行了突变或化学修饰以使与正常细胞的结合最小化。例子包括导向CD5的抗-B4-阻断的蓖麻毒蛋白和导向CD22的RFB4-去糖基化的蓖麻毒蛋白A链。最近发展的重组免疫毒素是嵌合蛋白质,该嵌合蛋白质由用重组DNA技术融合到蛋白质毒素上的抗肿瘤抗原的抗体的可变区组成。该毒素也经常进行基因工程修饰以去除正常组织的结合位点但保持其细胞毒性。大量的分化抗原、超量表达的受体或癌症特异性抗原已鉴定为免疫毒素的靶标,如CD19、CD22、CD20、IL-2受体(CD25)、CD33、IL-4受体、EGF受体及其突变体、Erβ2、Lewis糖、mesothelin、运铁蛋白受体、GM-CSF受体、Ras、Bcr-Abl和c-Kit,以用于治疗各种恶性肿瘤,包括造血细胞癌、神经胶质瘤和乳、结肠、子宫、膀胱和胃肠癌。参见如Brinkmann等人,Expert Opin.Biol.Ther.1:693-702(2001);Perentesis和Sievers,Hematology/Oncology Cliinics ofNorth America 15:677-701(2001)。

将与放射性同位素缀合的MAb用作另一种治疗人类恶性肿瘤的方法,特别是造血细胞恶性肿瘤,该方法具有高水平的特异性和效力。用于治疗的最常用的同位素是高能量的发射物,如131I和90Y。最近,213Bi标记的抗-CD33人源化MAb也已在I期人临床实验中进行了检验。Reff等人,见上文。

已将许多MAb用于治疗目的。例如,用于治疗某些造血细胞恶性肿瘤的重组嵌合抗-CD20MAb即rituximab(RituxanTM)的应用已于1997年获得FDA的批准。从那时起已获准用于治疗人类癌症的其他MAb包括:一种人源化的大鼠抗CD52抗体alemtuzumab(Campath-1HTM);和一种加利车霉素缀合的人源化小鼠抗CD33的MAb gemtuzumab ozogamicin(MylotargTM)。目前FDA也检查了几种其他的用于位点特异性送递细胞毒性剂或放射物目的的MAb的安全性和功效,如放射性标记的ZevalinTM和BexxarTM。Reff等人,见上文。

在设计药物送递系统中第二个重要的考虑是目标组织对治疗剂的可接近性。这是在治疗中枢神经系统(CNS)的疾病中特别要考虑的情况,因为血-脑屏障防止了大分子的扩散。已发展了几种方法已绕开血-脑屏障而将治疗剂有效地送递到CNS。

对从血浆到脑的铁转运机制的理解提供了绕开血-脑屏障(BBB)的有用工具。由运铁蛋白在血浆中转运的铁是几乎所有类型细胞的基本成分。脑需要铁以进行代谢过程并通过位于脑毛细管内皮细胞上的运铁蛋白受体经受体介导的转胞吞作用和内吞作用而接受铁。Moos和Morgan,Cellular and Molecular Neurobiology 20:77-95(2000)。已确立了有效地将肽、蛋白质和脂质体送递到脑中的基于运铁蛋白-运铁蛋白受体相互作用的送递系统。例如,可以使肽与抗运铁蛋白受体的MAb偶联以获得更大的脑摄取,Moos和Morgan,见上文。类似地,当与抗运铁蛋白受体的MAb偶联时,碱性成纤维生长因子(bFGF)跨过血-脑屏障的转运得到了增强。Song等人,The Journalof Pharmacology and Experimental Therapeutics 301:605-610(2002);Wu等人,Journal of Drug Targeting 10:239-245(2002)。此外,已报道了有效将化疗药物阿霉素转运到C6神经胶质瘤中的脂质体送递系统,其中将运铁蛋白附着到脂质体PEG链上的远端。Eavarone等人,J.Biomed.Mater.Res.51:10-14(2000)。许多美国专利也涉及基于运铁蛋白-运铁蛋白受体相互作用的绕开血-脑屏障的送递方法。参见如美国专利No.5,154,924、5,182,107、5,527,527、5,833,988、6,015,555。

对于绕开血-脑屏障的药物试剂有其他适当的缀合物配偶体。例如,美国专利No.5,672,683、5,977,307和WO 95/02421涉及将神经药物试剂跨过血-脑屏障送递的方法,其中该试剂是以与配体的融合蛋白的形式给予的,该配体可以与脑的毛细管内皮细胞受体反应;WO99/00150描述了一种药物送递系统,其中药物跨过血-脑屏障的转运是通过与抗人胰岛素受体的MAb缀合而促进的;WO 89/10134描述了嵌合的蛋白质,该嵌合蛋白质包括能够以相对高的速率跨过血-脑屏障的肽及不能进行转胞吞作用的亲水神经肽,从而作为一种将亲水神经肽引入到脑中的方法;WO 01/60411提供了一种可容易地将药物活性成分转运入脑中的药物组合物。该活性成分结合到用作缀合物的冬眠特异性蛋白质上,并与甲状腺激素或促进甲状腺激素产生的物质一起给予。此外,已探究了用于绕开血-脑屏障的可选择的药物送递途径。例如,无需缀合的治疗剂的鼻内给予已显示是有前途的可选择的送递方法(Frey,2002,Drug Delivery Technology,2(5):46-49)。

除促进药物跨过血-脑屏障的转运之外,运铁蛋白-运铁蛋白受体相互作用也可用于某些肿瘤细胞的特异性导向,这是因为许多肿瘤细胞在其表明超量表达运铁蛋白。该策略已用于通过运铁蛋白缀合物将生物活性大分子送递入K562细胞中(Wellhoner等人,The Journal ofBiological Chemistry 266:4309-4314(1991)),以及用于通过运铁蛋白缀合物将胰岛素送递入类肠细胞(enterocyte-like)Caco-2细胞中(Shah和Shen,Journal of Pharmaceutical Sciences 85:1306-1311(1996))。

此外,由于对铁转运蛋白质的功能及其表达模式有了更多的了解,如乳运铁蛋白受体、黑素瘤运铁蛋白、血浆铜蓝蛋白和二价阳离子转运蛋白,已发现一些参与铁转运机制的蛋白质(如黑素瘤运铁蛋白)或其片段在辅助治疗剂跨过血-脑屏障转运或导向特定的组织中具有相似的效率(WO 02/13843 A2、WO 02/13873 A2)。对于药物送递中参与铁摄取的运铁蛋白和相关蛋白质作为缀合物的应用的综述,参见Li和Qian,Medical Research Reviews 22:225-250(2002)。

治疗剂的组织特异性送递的概念不只局限于运铁蛋白和运铁蛋白受体或其相关蛋白质之间的相互作用。例如,已描述了骨骼特异性的送递系统,其中蛋白质是与亲骨的氨基二磷酸缀合以改善蛋白质向矿化组织的送递的。Uludag和Yang,Biotechnol.Prog.18:604-611(2002)。关于该主题的综述,参见Vyas等人,Critical Reviews inTherapeutic Drug Carrier System 18:1-76(2001)。

各种连接体可用于生成用于治疗剂的特异性送递目的的生物缀合物的方法中。适当的连接体包括同双功能和异双功能的交联试剂,该试剂为可由如酸催化的解离切割的或不可切割的(参见如Srinivasachar和Neville,Biochemistry 28:2501-2509(1989);Wellhoner等人,The Journal of Biological Chemistry 266:4309-4314(1991))。任何已知的结合配偶体如生物素和抗生物素蛋白/链霉抗生物素蛋白之间的相互作用也可用于将治疗剂和缀合物配偶体结合的方法,从而确保治疗剂的特异性且有效的送递。利用本发明的方法,蛋白质可用于将分子与缀合物送递到细胞内区室中。结合到特定的细胞表面受体上的蛋白质、肽、激素、细胞因子、小分子等可用于对缀合的治疗性化合物的细胞内导向,该特定的细胞表面受体在配体结合后可内化。一般地,受体-配体复合物将依赖于由受体导向的细胞内位置而内化到送递到特定细胞区室中的细胞内小泡中,该细胞区室包括但不局限于核、线粒体、高尔基体、ER、溶酶体和内体中。通过使受体配体与想要的分子缀合,可将药物携带于受体-配体复合物中并送递到该受体正常导向的细胞内区室中。因此,该药物可送递到细胞的特定细胞内位置,它需要在该位置治疗疾病。

许多蛋白质可用于将治疗剂导向到特定的组织和器官中。导向蛋白质包括但不局限于生长因子(EPO、HGH、EGF、神经生长因子、FGF等),细胞因子(GM-CSF、G-CSF、干扰素家族、白细胞介素等)、激素(FSH、LH、类固醇家族、雌激素、皮质类固醇、胰岛素等)、血清蛋白质(白蛋白、脂蛋白、胎蛋白、人血清蛋白质、抗体和抗体片段等)和维生素(叶酸、维生素C、维生素A等)。对大多数细胞类型上受体特异性的导向剂是可购得的。

预期的连接构型包括但不局限于蛋白质-糖-连接体-糖-蛋白质及其多价形式、蛋白质-糖-连接体-蛋白质及其多价形式、蛋白质-糖-连接体-治疗剂,其中该治疗剂包括但不局限于小分子、肽和脂质。在一些实施方案中,应用一旦内化后即水解的可水解连接体。当蛋白质缀合物内化入具有酸性pH的内体或溶酶体对,可应用酸不稳定的连接体以得到优势。一旦内化入内体或溶酶体中,连接体则被水解且治疗剂从导向剂中释放。

在一个示例性的实施方案中,运铁蛋白通过连接体缀合到想要导向到患者细胞中的酶或编码该酶的核酸载体上,该细胞展示运铁蛋白受体。该患者可需要对该特定的酶的酶置换治疗。在特别优选的实施方案中,该酶是具有溶酶体贮积病的患者中缺乏的(参见表5)。一旦进入循环后,运铁蛋白-酶缀合物可与运铁蛋白受体连接并在早期内体中内化(Xing等人,1998,Biochem.J.336:667;Li等人,2002,Trends in Pharmacol.Sci.23:206;Suhaila等人,1998,J.Biol.Chem.273:14355)。与运铁蛋白相关的其他预期的导向剂包括但不局限于乳运铁蛋白(乳铁蛋白)、黑素瘤运铁蛋白(p97)、血浆铜蓝蛋白和二价阳离子转运蛋白。

在另一个示例性实施方案中,运铁蛋白-肌营养不良蛋白缀合物将通过运铁蛋白途径进入内体中。一旦在内体中后,肌营养不良蛋白则由于可水解的连接体而释放,然后可将它们带到需要它们的细胞内区室中。该实施例可用于通过用与运铁蛋白连接的有功能的肌营养不良蛋白补充遗传缺陷的肌营养不良蛋白基因和/或蛋白质而治疗患有肌营养不良的患者。

E.治疗部分

在另一个优选的实施方案中,修饰的糖包括治疗部分。本领域的技术人员将理解在治疗部分和生物分子的范畴之间有重叠;许多生物分子具有治疗性质或潜力。

治疗部分可为已接受用作临床应用的试剂,或者它们可为在实验中的药物,或其活性或作用机制在研究之中。治疗部分在给定的疾病状态中具有已证实的作用,或可仅仅假设在给定的疾病状态中显示想要的作用。在优选的实施方案中,治疗部分是化合物,该化合物是根据其与选定的组织相互作用的能力选择的。用于实践本发明的的治疗部分包括来自广泛药物种类的药物,该药物种类具有各种药物学活性。在一些实施方案中,优选的是应用非糖的治疗部分。该优选性的一个例外是应用通过共价附着到另一个实体上的糖,该实体如PEG、生物分子、治疗部分、诊断部分等。在一个示例性的实施方案中,将反义核酸部分缀合到附着于导向部分的连接体臂上。在另一个示例性的实施方案中,治疗性糖部分是缀合到连接体臂上的,且糖-连接体臂盒随后通过本发明的方法与肽缀合。

使治疗和诊断试剂与各种其他种类缀合的方法是本领域技术人员众所周知的。参见如Hermanson,Bioconjugate Techniques,AcademicPress,San Diego,1996;和Dunn等人,Eds.Polymeric DrugsAnd DrugDelivery Systems,ACS Symposium Series Vol.469,AmericanChemical Society,Washington,D.C.1991。

在一个示例性的实施方案中,治疗部分是通过在选择的条件下可进行切割的键附着到修饰的糖上的。示例性的条件包括但不局限于选择的pH(如胃、肠、内吞噬泡)、活性酶的存在(如酯酶、蛋白酶、还原酶、氧化酶)、光、热等。许多可切割的基团是本领域中公知的。参见如Jung等人,Biochem.Biophys.Acta,761:152-162(1983);Joshi等人,J.BioL Chem.265:14518-14525(1990);Zarling等人,J.Immunol.,124:913-920(1980);Bouizar等人,Eur.J.Biochem.,155:141-147(1986);Park等人,J.Biol.Chem.261:205-210(1986);Browning等人,J.Immunol.,143:1859-1867(1989)。

有用的治疗部分的种类包括如非类固醇的抗炎症药物(NSAIDS)。NSAIDS可选自下面的种类:(如丙酸衍生物、乙酸衍生物、fenamic acid衍生物、二苯基羧酸衍生物和oxicams);类固醇抗炎症药物,包括氢化可的松等;佐剂;抗组胺药物(如氯屈米、曲普利啶);止咳药(如右旋甲吗喃、可待因、卡拉美芬和喷托维林);抗瘙痒药物(如甲地嗪和阿利马嗪);抗胆碱能药物(如莨菪胺、阿托品、后马托品、左旋多巴);抗催吐和抗恶心药(如赛克力嗪、美克洛嗪、氯丙嗪、布克力嗪);厌食药物(如苄非他明、芬特明、对氯苯丁胺、芬氟拉明);中央刺激药物(如苯丙胺、脱氧麻黄碱、右苯丙胺和哌甲酯);抗节律紊乱药物(如普萘洛尔、普鲁卡因酰胺、丙吡胺、奎尼定、恩卡尼);β-肾上腺素能阻断药物(如美托洛尔、醋丁洛尔、倍他洛尔、拉贝洛尔和噻吗洛尔);强心药(如米力农、氨力农和多巴酚丁胺);抗高血压药(如依那普利、cloidine、肼曲嗪、米诺地尔、胍那决尔、胍乙啶);利尿药物(如阿米洛利和氢氯噻嗪);血管舒张药物(如diltiazem、胺碘酮、异克舒令、布酚宁、妥拉唑林和维拉帕米);血管收缩药物(如二氢麦角胺、麦角胺和美西麦角(methylsergide));抗溃疡药物(如雷尼替丁和西咪替丁);麻醉药物(如利度卡因、布比卡因、氯普鲁卡因、地布卡因);抗抑郁药物(如丙咪嗪、地昔帕明、阿米替林(amitryptiline)、去甲替林(nortryptiline));安定药和镇静药物(如氯氮_、胃复康(benacytyzine)、苯喹胺、氟西泮、羟嗪、洛沙平和丙嗪;抗精神病药物(如氯普噻吨、氟奋乃静、氟哌啶醇、吗茚酮、硫利达嗪和三氟拉嗪);抗微生物药物(如抗细菌的、抗真菌的、抗原生动物的和抗病毒的药物)。

有用的治疗部分种类包括佐剂。该佐剂可选自如匙孔血蓝蛋白缀合物、单磷酰脂质A、源自支原体的脂肽MALP-2、霍乱毒素B亚基、大肠杆菌热不稳定性毒素、来自破伤风类毒素的通用T辅助细胞抗原决定部位、白细胞介素-12、CpG寡脱氧核苷酸、二甲基二(十八烷基)溴化铵、环化糊精、鲨烯、铝盐、脑膜炎球菌外膜小泡(OMV)、montanide ISA、TiterMaxTM(购自Sigma,St.Louis MO)、硝酸纤维素吸收物、免疫刺激复合物如Quil A、GerbuTM佐剂(GerbuBiotechnik,Kirchwald,德国)、苏氨酰胞壁酰二肽、胸腺素α、布比卡因、GM-CSF、不完全弗氏佐剂、MTP-PE/MF59(Ciba/Geigy,Basel,瑞士)、聚磷腈、源自皂树Quillaja saponaria的皂苷和Syntex佐剂制剂(Biocine,Emeryville,CA),以及其它本领域众所周知的。

优选地整合入本发明的组合物的抗微生物药物包括如β-内酰胺药物的药物可接受盐、喹喏酮药物、环丙沙星、诺氟沙星、四环素、红霉素、阿米卡星、三氟生、强力霉素、卷曲霉素、氯己定、金霉素、羟四环素、氯林肯霉素、乙胺丁醇、己脒定异硫代硫酸盐(hexamidineisothionate)、甲硝基羟乙唑、喷他脒、艮他霉素、卡那霉素、lineomycin、甲烯土霉素、六胺、二甲胺四环素、新霉素、奈替米星(netilmycin)、巴龙霉素、链霉素、妥布拉霉素、霉抗唑和金刚胺。

其他用于本发明的实践中的药物部分包括抗肿瘤药物(如,抗雄激素物质(如亮丙立德或氟他胺)、杀细胞的试剂(如andriamycin、阿霉素、紫杉醇、环磷酰胺、白消安、顺式铂氨、β-2-干扰素)、抗雌激素物质(如三苯氧胺)、抗代谢物(如氟尿嘧啶、氨甲蝶呤、巯基嘌呤、硫代鸟嘌呤)。在该类中同样包括的是用于诊断和治疗两者的基于放射性同位素的试剂及缀合的毒素,如蓖麻毒蛋白、格尔德霉素、mytansin、CC-1065、C-1027、倍癌霉素、刺胞霉素及其相关结构和类似物,以及列于表2中的毒素。

治疗部分也可为激素(如6α-甲基-17α-孕甾酮、雌二醇、亮丙立德、甲地孕酮、生长抑素八肽或促生长素抑制素);肌肉松弛药物(如桂麻黄碱、环苯扎林、黄酮哌酯、奥芬那君、paraverine、美贝维林、异达维林、利托君、地芬诺酯、硝苯呋海因和阿珠莫林(azumolen));镇痉药物;骨骼活化药物(如二磷酸盐和膦酰基烷基次膦酸盐(phosphonoalkylphosphinate)药物化合物);内分泌调节药物(如避孕药(如ethinodiol、乙炔基雌二醇、炔诺酮、美雌醇、去氧孕烯、6α-甲基-17α-孕甾酮)、糖尿病调节剂(如格列本脲或氯磺丙脲)、合成代谢物如睾内酯或司坦唑醇、雄激素(如甲基睾酮、睾酮或氟甲睾酮)、抗利尿剂(如去氨加压素)和降钙素)。

同样用于本发明的是雌激素(如乙菧酚)、糖皮质激素(如氟羟脱氢皮甾醇、倍他米松等)和孕酮,如炔诺酮、炔诺醇(ethynodiol)、炔诺酮、左炔诺孕酮;甲状腺试剂(如碘噻罗宁或左甲状腺素)或抗甲状腺试剂(如甲巯咪唑);抗高催乳素血症药物(如卡麦角林);激素抑制剂(如达那唑或戈舍瑞林)、催产素(如甲麦角新碱或催产素)和前列腺素,如mioprostol、前列地尔或地诺前列酮。

其他有用的修饰基团包括免疫调节药物(如抗组胺、肥大细胞稳定剂如洛度沙胺和/或色甘酸(cromolyn),类固醇(如氟羟脱氢皮甾醇、倍氯米松(beclomethazone)、可的松、地塞米松、强的松龙、甲基强的松龙、倍氯米松(beclomethasone)或氯倍他松)、组胺H2拮抗剂(如法莫替丁、甲腈咪胍、雷尼替丁)、免疫抑制剂(如硫唑嘌呤、环孢菌素)等。也可应用具有抗炎症活性的种类,如舒林酸、依托度酸、酮洛芬和酮咯酸。用于本发明的缀合中的其他药物对本领域的技术人员而言是显而易见的。

有用的治疗部分的种类包括如反义药物,且也包括裸DNA。反义药物可选自如Affinitak(ISIS,Carlsbad,CA)和GenasenseTM(购自Genta,Berkeley Heights,NJ)。裸DNA例如可以与编码如治疗血友病的凝血因子VIII和IX的DNA一起作为基因治疗剂进行送递。

F.修饰的糖的制备

用于形成本发明的缀合物的修饰的糖在此处讨论。为了阐明的清晰,该讨论集中在制备用水溶性聚合物修饰的糖上。特别地,该讨论集中在包括聚(乙二醇)部分的修饰的糖的制备上。技术人员将理解在此处提出的方法可广泛应用于修饰的糖的制备上,因此,该讨论不应认为是对本发明范围的限制。

通常,糖部分和修饰基团是通过反应性基团的应用而连接在一起的,该反应性基团一般被连接方法转化到新的有机官能基团或非反应性种类。该糖反应性官能基团位于糖部分上的任何位置。反应性基团和用于实践本发明的反应类型通常是那些生物缀合物化学领域中众所周知的。目前占优势的对反应性糖部分可用的反应类型是那些在相对温和的条件下进行的。这些包括但不局限于亲核取代(如胺和醇与酰基卤化物、活性酯的反应)、亲电取代(如烯胺反应)和对碳-碳和碳-杂原子重键的加成(如Michael氏反应、Diels-Alder加成)。这些和其他有用的反应的讨论可见于如Smith和March,Advanced OrganicChemistry,5th Ed.,John Wiley & Sons,New York,2001;Hermanson,Bioconjugate Techniques,Academic Press,San Diego,1996;和Feeney等人,Modification of Proteins;Advances in Chemistry Series,Vol.198,American Chemical Society,Washington,D.C.,1982。

在糖核心或修饰基团中伸出(pendent)的有用反应性功能基团包括,但不局限于:

(a)羧基基团及其各种衍生物,包括但不局限于N-羟基琥珀酰亚胺酯、N-羟基苯并三唑酯、酸性卤化物、酰基咪唑、硫酯、对硝基苯酯、烷基、链烯基、炔基和芳香基酯;

(b)羟基基团,该基团可转变为如酯、醚、醛等。

(c)卤烷基基团,其中卤化物后来可用亲核基团替代,如胺、羧酸盐阴离子、硫醇阴离子、负碳离子或醇盐离子,从而导致新的基团在卤素原子官能基团上的共价附着;

(d)亲双烯体基团,该基团能够参与Diels-Alder反应,如马来酰亚胺基(maleimido)基团;

(e)醛或酮基团,从而随后通过形成羰基衍生物或通过如Grignard加成或烷基锂加成的机制进行衍生是可能的,该羰基衍生物如亚胺、腙、缩氨基脲或肟;

(f)用于随后与胺反应以形成例如氨磺酰的磺酰基卤化物基团;

(g)硫醇基团,该基团可转变为如二硫化物或与烷基和酰基卤化物反应;

(h)胺或硫氢基团,该基团可进行如酰化、烷基化或氧化;

(i)链烯,该链烯可进行如环加成、酰化、Michael加成等;和

(j)环氧化物,该环氧化物可与如胺和羟基化合物反应。

可这样选择官能基团,从而使得它们不参与或不干扰组装反应性糖核心或修饰基团所必需的反应。可选择地,可对反应性官能基团通过在保护基团存在时进行保护以防止其参与反应。本领域的技术人员理解如何保护特定的官能基团,从而使其不干扰选定的一套反应条件。对于有用的保护基团的例子,参见如Greene等人,Protective Groupsin Organic Synthesis,John Wiley & Sons,New York,1991。

在下面的讨论中,提出了许多修饰的糖的特定的例子,该修饰的糖可用于本发明的实践中。在一个示例性的实施方案中,将唾液酸衍生物用作在其上附着修饰基团的糖核心。侧重于对唾液酸衍生物的讨论仅仅是为了阐明清晰的目的,且不应该解释为对本发明范围的限制。本领域的技术人员将理解各种其他的糖部分可以以与用唾液酸作为例子提出的相似的方式进行活化和衍生化。例如,许多修饰半乳糖、葡萄糖、N-乙酰半乳糖胺和岩藻糖的方法是可用的,这些糖仅是少数提到的底物,它们可易于用本领域认可的方法进行修饰。参见如Elhalabi等人,Curr.Med.Chem.6:93(1999);和Schafer等人,J.Org.Chem.65:24(2000)。

在一个示例性的实施方案中,通过本发明的方法修饰的肽是在哺乳动物细胞(如CHO细胞)中或在转基因动物中产生的肽,因而含有不完全唾液酸化的N-和/或O-连接的寡糖链。该糖肽的缺少唾液酸和含有末端半乳糖残基的寡糖链可以进行PEG化、PPG化或用修饰的唾液酸进行修饰。

在方案4中,用保护的氨基酸(如甘氨酸)衍生物的活性酯处理甘露糖胺糖苷1,从而将糖胺残基转变为相应的保护的氨基酸酰胺加合物。将该加合物用醛缩酶处理以形成唾液酸2。通过CMP-SA合成酶的作用使化合物2转变为相应的CMP衍生物,随后通过对CMP衍生物的催化加氢以生成化合物3。将通过形成甘氨酸加合物而引入的胺用作PEG或PPG附着的位置从而使化合物3分别与活化的PEG或PPG衍生物(如PEG-C(O)NHS、PPG-C(O)NHS)反应,形成4或5。

方案4

表3提出了用PEG或PPG部分衍生化的糖单磷酸酯的代表性例子。表3中的某些化合物是通过方案1的方法制备的。其他衍生物是通过本领域认可的方法制备的。参见如Keppler等人,Glycobiology 11:11R(2001);和Charter等人,Glycobiology 10:1049(2000))。其他胺反应性PEG和PPG类似物是商业上可购得的,或它们可通过本领域的技术人员易于获得的方法制备。

表3.用PEG或PPG部分衍生化的糖单磷酸酯的例子

用于实践本发明的修饰的糖磷酸酯可在其他位置以及在上文提出的位置替代。“i”可为Na或另一种盐,且“i”可以与Na互换。目前唾液酸优选的替代在分子式5中提出。

分子式5:

其中,X是优选地选自-O-、-N(H)-、-S、CH2-和N(R)2的连接基团,其中每一个R均为独立选自R1-R5的成员。“i”可为Na或另一种盐,且Na可以与“i”互换。符号Y、Z、A和B各自代表选自在上文中对X所描述的基团。X、Y、Z、A和B每一个均独立地进行选择,因此它们可为相同或不同的。符号R1、R2、R3、R4和R5代表H、聚合物、水溶性聚合物、治疗部分、生物分子或其他部分。符号R6代表H、OH或聚合物。可选择地,这些符号代表连接到聚合物、水溶性聚合物、治疗部分、生物分子或其他部分上的连接体。

在另一个示例性的实施方案中,甘露糖胺是通过应用如在方案5中提出的氯乙酸酐同时进行亲核取代的酰化和活化的。在本部分中提供的每一个方案中,i+或Na+可以互换,其中盐可为钠,或者可为任何其他适当的盐。

方案5

使结果所得的氯衍生化的聚糖与丙酮酸盐在醛缩酶存在时接触,从而形成氯衍生化的唾液酸。相应的核苷酸糖是通过使唾液酸衍生物与适当的核苷酸三磷酸和合成酶接触而制备的。然后唾液酸部分上的氯基团可用亲核的PEG衍生物如硫代-PEG取代。

在进一步的示例性实施方案中,如在方案6中显示的,甘露糖胺是用双-HOBT二羧酸盐进行酰化的,从而产生相应的酰胺-烷基-羧酸,该酰胺-烷基-羧酸随后转变为唾液酸衍生物。将该唾液酸衍生物转变为核苷酸糖,并将羧酸活化且与亲核PEG衍生物如氨基-PEG反应。

方案6

在另一个示例性的实施方案中,如在方案7中提出的,通过将伯羟基基团转变为相应的对甲苯磺酸酯而使胺-和羧基-保护的神经氨酸活化,且将甲基酯切除。使活化的神经氨酸转变为相应的核苷酸糖,且使活化基团用亲核的PEG种类如硫代-PEG置换。

方案7

在另外进一步的示例性实施方案中,如在方案8中提出的,用亲核的PEG如氯-PEG使胺-和羧基-保护的神经氨酸衍生物的伯羟基部分烷基化。随后切除甲基酯并将PEG-糖转变为核苷酸糖。

方案8

除唾液酸之外的聚糖可用在此处提出的方法用PEG进行衍生化。衍生化的聚糖本身也在本发明的范围之内。因而,方案9提供了PEG化的半乳糖核苷酸糖的示例性合成途径。使半乳糖的伯羟基基团活化为相应的对甲苯磺酸酯,随后再转变为核苷酸糖。

方案9

方案10提出了基于半乳糖-6-胺部分的制备半乳糖-PEG衍生物的示例性途径。因而,使半乳糖胺转变为核苷酸糖,并使半乳糖胺的胺部分用活性PEG衍生物进行官能化。

方案10

方案11提供了制备半乳糖衍生物的另一个示例性途径。方案11的起始点是半乳糖-2-胺,该半乳糖-2-胺转变为核苷酸糖。核苷酸糖的胺部分是附着PEG衍生物的位置,如甲氧基-PEG(mPEG)羧酸。

方案11

附着到在此处公开的缀合物上的示例性部分包括但不局限于PEG衍生物(如酰基-PEG、酰基-烷基-PEG、烷基-酰基-PFG氨甲酰基-PEG、芳基-PEG、烷基-PEG)、PPG衍生物(如酰基-PPG、酰基-烷基-PPG、烷基-酰基-PPG氨甲酰基-PPG、芳基-PPG)、聚天冬氨酸、聚谷氨酸、聚赖氨酸、治疗部分、诊断部分、甘露糖-6-磷酸、肝素、类肝素、SLex、甘露糖、甘露糖-6-磷酸、Sialyl Lewis X、FGF、VFGF、蛋白质(如运铁蛋白)、软骨素、角质素、皮肤素、葡聚糖、修饰的葡聚糖、直链淀粉、二磷酸盐、poly-SA、透明质酸、keritan、白蛋白、整合蛋白、触角寡糖、肽等。使各种修饰基团与糖部分缀合的方法是本领域的技术人员易于获得的(Poly(Ethylene Glycol)Chemistry:Biotechnical and Biomedical Applications,J.MiltonHarris,Ed.,Plenum Pub.Corp.,1992;Poly(Ethylene Glycol)Chemical and Biological Applications,J.Milton Harris,Ed.,ACSSymposium Series No.680,American Chemical Society,1997;Hermanson,Bioconj ugate Techniques,Academic Press,San Diego,1996;和Dunn等人,Eds.Polymeric Drugs and Drug DeliverySystems,ACS Symposium Series Vol.469,American ChemicalSociety,Washington,D.C.1991)。

糖、核苷酸糖和衍生物的纯化

由上述方法产生的核苷酸糖和衍生物可不经纯化而应用。然而,通常优选地是回收产物。可应用标准的众所周知的用于回收糖基化的糖的技术,如薄层或厚层层析、柱层析、离子交换层析或膜过滤。优选地是应用膜过滤,更优选地为将反向渗透膜或一种或多种柱层析技术用于回收,如在下文和在此处引用的参考文献中讨论的。例如,可用膜过滤来去除分子量小于10,000Da的试剂的蛋白质,该膜具有约3000~约10,000的分子量截止点。然后膜过滤或反向渗透可用于去除盐和/或纯化产物糖(参见如WO 98/15581)。Nanofilter膜是一类可以使单价盐经过而保留多价的盐和大于约100~约2,000道尔顿(依赖于所用的膜)的不带电荷的溶质的反向渗透膜。因而,在一般的应用中,由本发明的方法制备的糖将保留在膜上,而杂质盐将通过膜。

G.交联基团

用于本发明的方法中的修饰的糖的制备包括修饰基团向糖残基上的附着及形成稳定的加合物,该加合物是糖基转移酶的底物。因而,经常优选地是应用交联剂将修饰基团与糖进行缀合。可用于将修饰基团附着到糖部分上的示例性的双功能化合物包括,但不局限于双功能聚(乙二醇)、聚酰胺、聚醚、聚酯等。使糖类与其他分子上的连接的一般方法在文献中是公知的。参见如Lee等人,Biochemistry 28:1856(1989);Bhatia等人,Anal.Biochem.178:408(1989);Janda等人,J.Am.Chem.Soc.112:8886(1990)和Bednarski等人,WO 92/18135。在随后的讨论中,对新生的修饰的糖的糖部分反应性基团进行温和处理。该讨论的侧重点是为了阐明清晰的目的。本领域的技术人员将理解该讨论也适用于修饰基团上的反应性基团。

一个示例性的策略包括将用异双功能交联剂SPDP(正琥珀酰亚胺-3-(2-吡啶基二硫代)丙酸)保护的硫氢基整合入糖中,然后对硫氢基去保护以与修饰基团上的其他硫氢基形成二硫键。

如果SPDP有害地影响修饰的糖作为糖基转移酶底物的能力,那么可将某个其他交联剂用于形成二硫键,如2-亚胺基四氢噻吩或N-琥珀酰亚胺S-乙酰基硫代乙酸(SATA)。2-亚胺基四氢噻吩可与伯胺反应,并立即将未保护的硫氢基整合入含有胺的分子上。SATA也与伯胺反应,但整合保护的硫氢基,该保护的硫氢基随后用羟胺脱乙酰化以产生游离的硫氢基。在每一种情况下,整合的硫氢基可自由地与其他的硫氢基或保护的硫氢基如SPDP进行反应以形成所需的二硫键。

上述策略对于用于本发明的连接体是示例性的,而不是限制性的。可用于将修饰基团与肽进行交联的不同策略中的其他交联剂是可得到的。例如,TPCH(S-(2-硫代吡啶基)-L-半胱氨酸酰肼和TPMPH((S-(2-硫代吡啶基)巯基-丙酰基酰肼)与预先用过碘酸盐温和处理氧化的糖部分反应,从而在交联剂的酰肼部分和过碘酸盐生成的醛之间形成腙键。TPCH和TPMPH在糖上引入了2-吡啶基硫酮保护的硫氢基基团,该基团可用DTT去保护并随后用于缀合,如在成分之间形成二硫键。

如果发现二硫键对于产生稳定的修饰的糖是不适当的,那么可应用在成分之间整合更稳定的键的其他交联剂。异双功能交联剂GMBS(N-gama-malimidobutyryloxy)succinimide)和SMCC(琥珀酰亚胺基4-(N-马来酰亚胺-甲基)环己烷)与伯胺反应,从而将马来酰亚胺基团引入到成分上。该马来酰亚胺基团随后可以与其他成分上可通过前文所述的交联剂引入的硫氢基反应,从而在成分之间形成稳定的硫醚键。如果成分之间的空间位阻干扰了成分的活性或修饰的糖作为糖基转移酶底物的能力,那么可应用能够在成分之间引入较长间隔臂的交联剂,且该交联剂包括一些前文所述的交联剂(即SPDP)的衍生物。因而,存在大量有用的适当交联剂;它们的每一个均是依赖于其对最适的肽缀合物和修饰的糖生产的作用选择的。

许多试剂可用于修饰具有分子内化学交联的修饰的糖的成分(对于交联剂和交联程序的综述,参见:Wold,F.,Meth.Enzymol.25:623-651,1972;Weetall,H.H.和Cooney,D.A.,Enzymes as Drugs(Holcenberg和Roberts,eds.)pp.395-442,Wiley,New York,1981;Ji,T.H.,Meth.Enzymol.91:580-609,1983;Mattson等人,Mol.Biol.Rep.17:167-183,1993,均在此处引入作为参考)。优选的交联剂可源自各种零长度的、同双功能的和异双功能的交联剂。零长度的交联剂包括两个内部化学基团的直接缀合,而不引入外部的材料。催化二硫键形成的试剂属于这个类型。另一个例子是诱导羧基和伯氨基团的缩合而形成酰胺键的试剂,如碳二亚胺、乙基氯代甲酸、Woodward试剂K(2-ethyl-5-phenylisoxazolium-3’-sulfonate)和羰基二咪唑。除这些化学试剂之外,转谷氨酰胺酶(谷氨酰-肽γ-谷氨酰转移酶;EC2.3.2.13)可用作零长度的交联剂。该酶催化蛋白质连接的谷氨酰胺残基的氨甲酰的酰基转移反应,通常以伯氨基团作为底物。优选的同-和异-双功能的试剂分别含有两个相同或不同的位点,该位点对于氨基、硫氢基、胍基、吲哚或非特定的基团是反应性的。

2.交联剂上优选的特异性位点

a.氨基反应性基团

在一个优选的实施方案中,交联剂上的位点是氨基反应性基团。氨基反应性基团的有用的非限制性例子包括N-羟基琥珀酰亚胺(NHS)酯、亚氨酯、异氰酸酯、酰基卤化物、芳基氮化物、对硝基苯酯、醛和磺酰氯。

NHS酯优选地与修饰的糖成分的伯(包括芳族的)氨基团反应。组氨酸的咪唑基团已知可与伯胺竞争反应,但其反应产物是不稳定且易于水解的。该反应包括对NHS酯的酸性羧基上胺的亲核攻击以形成酰胺,从而释放N-羟基琥珀酰亚胺。因而初始氨基基团的正电荷则丢失了。

亚氨酯是与修饰的糖成分的胺基团反应的最特异性的酰化试剂。在7~10的pH时,亚氨酯仅与伯胺反应。伯胺亲核地攻击亚胺酯以产生中间物,该中间物在高pH时分解为脒而在低pH时分解为新的亚胺酸酯。该新的亚胺酸酯可与另一个伯胺反应,从而使两个氨基基团交联,这是推定的单功能亚胺酸酯进行双功能反应的情况。与伯胺反应的主要产物是脒,该脒是比初始的胺碱性更强的碱。因此初始氨基基团上的正电荷则保留了。

异氰酸酯(和异硫氰酸酯)与修饰的糖成分的伯胺反应以形成稳定的键。它们与硫氢基、咪唑和酪氨酰基团的反应产生相对不稳定的产物。

酰基氮化物也用作氨基特异性的试剂,其中亲和成分的亲核胺在微碱性如pH 8.5的条件下攻击酸性羧基基团。

芳基卤化物如1,5-二氟-2,4-二硝基苯优选地与修饰的糖成分的氨基基团和酪氨酸的酚基团反应,但也与硫氢基和咪唑基团反应。

单-和二羧酸的对硝基苯酯也是有用的氨基反应性基团。尽管该试剂的特异性不是特别高,但α-和ε-氨基基团的反应是最快的。

醛如戊二醛与修饰的糖的伯胺反应。尽管在氨基基团与醛的反应中形成了不稳定的希夫碱,但戊二醛能够用稳定的交联修饰修饰的糖。在典型的交联pH条件pH 6-8时,环形聚合物进行脱水以形成α-β不饱和的醛聚合物。然而希夫碱当与另一个双键缀合时是稳定的。两个双键的共振相互作用阻止了希夫键的水解。此外,高局部浓度的胺可以攻击乙烯双键以形成稳定的Michael加成产物。

芳族磺酰氯与修饰的糖成分的多个位点反应,但与氨基基团的反应是最重要的,结果形成稳定的氨磺酰键。

b.硫氢基反应性基团

在另一个优选的实施方案中,该位点是硫氢基反应性基团。有用的非限制性的硫氢基反应性基团包括马来酰亚胺、烷基卤化物、吡啶基二硫化物和硫代邻苯二甲酰亚胺。

马来酰亚胺与修饰的糖成分的硫氢基基团反应以形成稳定的硫醚键。它们也以非常低的速率与伯氨基团和组氨酸的咪唑基团反应。然而,在pH 7时可认为马来酰亚胺是硫氢基特异性的基团,这是因为在pH 7时简单硫醇的反应速率比相应胺的反应速率高1000倍。

烷基卤化物与硫氢基、硫化物、咪唑和氨基基团反应。然而,在中性到微碱性的pH时,烷基卤化物主要与硫氢基反应以形成稳定的硫醚键。在更高的pH时,与氨基基团的反应是占优势的。

吡啶基二硫化物与游离硫氢基通过二硫化物交换进行反应以形成混合的二硫化物。结果吡啶基二硫化物是最特异性的硫氢基反应性基团。

硫代邻苯二甲酰亚胺与游离硫氢基基团反应以形成二硫化物。

c.羧基反应性残基

在另一个实施方案中,将在水和有机溶剂中可溶的碳二亚胺用作羧基反应性试剂。这些化合物与游离羧基基团反应以形成假脲,然后该假脲可以与可用的胺偶联以形成酰胺键。用碳二亚胺修饰羧基基团的程序是本领域中众所周知的(参见Yamada等人,Biochemistry 20:4836-4842,1981)。

3.交联剂中优选的非特异性位点

除应用位点特异性反应性部分之外,本发明也涉及应用非特异性的反应性基团以使糖与修饰基团连接。

示例性的非特异性交联剂包括在黑暗中完全惰性的光活化型基团,该基团在吸收适当能量的光子之后可转变为反应性的种类。在一个优选的实施方案中,光活化型基团选自通过加热或光解氮化物而生成的氮宾前体。电子缺陷型氮宾是极度反应性的,且可与各种化学键反应,包括N-H、O-H、C-H和C=C。尽管可应用3类氮化物(芳基、烷基和酰基衍生物),但芳基氮化物是目前优选的。芳基氮化物在光解后与N-H和O-H的反应性比与C-H的好。电子缺陷型芳基氮宾快速地进行环扩张以形成脱氢氮杂,该脱氢氮杂倾向于与亲核物反应,而不是形成C-H插入产物。芳基氮化物的反应性可通过在环中存在吸电子取代基如硝基或羟基基团而增强。这种取代基将芳基氮化物的最大吸收推到更大的波长。未取代的芳基氮化物在260-280nm的范围内具有最大吸收,而羟基和硝基芳基氮化物显著吸收超过305nm的光。因此,羟基和硝基芳基氮化物是最优选的,这是因为它们使得能够比未取代的芳基氮化物应用对亲和成分害处更低的光解条件。

在另一个优选的实施方案中,光活化型基团选自氟化的芳基氮化物。氟化的芳基氮化物的光解产物是芳基氮宾,它们均与该基团进行高效的特征性反应,包括C-H键插入(Keana等人,J.Org.Chem.55:3640-3647,1990)。

在另一个实施方案中,光活化型基团选自benzophenone残基。benzophenone试剂通常比芳基氮化物试剂给出更高的交联结果。

在另一个实施方案中,光活化型基团选自重氮化合物,该重氮化合物在光解后形成电子缺陷型卡宾。这些卡宾可进行各种反应,包括向C-H键的插入、向双键(包括芳族系统)的加成、氢吸引和向亲核中心的配位以给出碳离子。

在另外一个实施方案中,光活化型基团选自重氮丙酮酸盐。例如,对硝基苯重氮丙酮酸盐的对硝基苯酯与脂族胺反应形成重氮丙酮酸酰胺,该重氮丙酮酸酰胺进行紫外线光解形成醛。光解的重氮丙酮酸盐修饰的亲和成分将类似于甲醛或戊二醛进行反应以形成交联。

4.同双功能试剂

a.与伯胺反应的同双功能试剂

胺反应性交联剂的合成、性质和应用商业性地描述于文献中(对于交联程序和试剂的综述,见上文)。许多试剂是可购得的(如PierceChemical Company,Rockford,III.;Sigma Chemical Company,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。

同双功能NHS酯的优选的非限制性例子包括二琥珀酰亚胺基戊二酸酯(DSG)、二琥珀酰亚胺基辛二酸酯(DSS)、双(磺基琥珀酰亚胺基)辛二酸酯(BS)、二琥珀酰亚胺基酒石酸酯(DST)、二磺基琥珀酰亚胺基酒石酸酯(磺基-DST)、双-2-(琥珀酰亚胺基氧基羰基氧基)乙基砜(BSOCOES)、双-2-(磺基琥珀酰亚胺基氧基羰基氧基)乙基砜(磺基-BSOCOES)、乙二醇二(琥珀酰亚胺基琥珀酸酯)(EGS)、乙二醇二(磺基琥珀酰亚胺基琥珀酸酯)(磺基-EGS)、二硫代双(琥珀酰亚胺基丙酸酯)(DSP)、和二硫代双(磺基琥珀酰亚胺基丙酸酯)(磺基-DSP)。同双功能亚氨酸酯的优选的非限制性例子包括二甲基丙二酰亚胺酸酯(DMM)、二甲基琥珀酰亚胺酸酯(DMSC)、二甲基己二酰亚胺酸酯(DMA)、二甲基庚二酰亚胺酸酯(DMP)、二甲基辛二酰亚胺酸酯(DMS)、二甲基-3,3’-氧基二丙酰亚胺酸酯(DODP)、二甲基-3,3’-(亚甲基二氧)二丙酰亚胺酸酯(DMDP)、二甲基-3’-(二亚甲基二氧)二丙酰亚胺酸酯(DDDP)、二甲基-3,3’-(四亚甲基二氧)二丙酰亚胺酸酯(DTDP)和二甲基-3,3’-二硫代双丙酰亚胺酸酯(DTBP)。

同双功能异硫氰酸酯的优选的非限制性例子包括:对苯二异硫氰酸酯(DITC)和4,4’-二异硫氰酸-2,2’-二磺酸stilbene(DIDS)。

同双功能异氰酸酯的优选的非限制性例子包括二甲苯-二异氰酸酯、甲苯-2,4-二异氰酸酯、甲苯-2-异氰酸酯-4-异硫氰酸酯、3-甲氧基二苯基甲烷-4,4’-二异氰酸酯、2,2’-二羧基-4,4’-偶氮苯基二异氰酸酯和六亚甲基二异氰酸酯。

同双功能芳基卤化物的优选的非限制性例子包括1,5-二氟-2,4-二硝基苯(DFDNB)和4,4’-二氟-3,3’-二硝基苯基砜。

同双功能脂族醛试剂的优选的非限制性例子包括乙二醛、丙二醛(malondialdehyde)和戊二醛。

同双功能酰化试剂的优选的非限制性例子包括二羧酸的硝基苯酯。

同双功能芳族磺酰氯的优选的非限制性例子包括苯酚-2,4-二磺酰基氯化物和α-萘酚-2,4-二磺酰基氯化物。

额外的氨基反应性同双功能试剂的优选的非限制性例子包括与胺反应生成二氨基甲酸酯(biscarbamate)的赤藓醇二羧酸(erythriolbiscarbonate)。

b.与游离硫氧基基团反应的同双功能交联剂

这种试剂的合成、性质和应用描述于文献中(对于交联程序和试剂的综述,见上文)。许多试剂是商业上可购得的(如Pierce ChemicalCompany,Rockford,III.;Sigma Chemical Company,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。

同双功能马来酰亚胺的优选的非限制性例子包括双马来酰亚胺己烷(BMH)、N,N’-(1,3-亚苯基)双马来酰亚胺、N,N’-(1,2-亚苯基)双马来酰亚胺、偶氮苯基双马来酰亚胺和双(N-马来酰亚胺甲基)醚。

同双功能吡啶基二硫化物的优选的非限制性例子包括1,4-二-3’-(2’-吡啶基二硫代)丙酰胺基丁烷(DPDPB)。

同双功能烷基卤化物的优选的非限制性例子包括2,2’-二羧基-4,4’-二碘乙酰胺基偶氮苯、α,α’-二碘-对二甲苯磺酸、α,α’二溴-对二甲苯磺酸、N,N’-双(b-溴乙基)苄胺、N,N’-二(溴乙酰基)苯基肼和1,2-二(溴乙酰基)氨基-3-苯基丙烷。

c.同双功能光活化型交联剂

这种试剂的合成、性质和应用描述于文献中(对于交联程序和试剂的综述,见上文)。许多试剂是商业上可购得的(如Pierce ChemicalCompany,Rockford,III.;Sigma Chemical Company,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。

同双功能光活化型交联剂的优选的非限制性例子包括双-β-(4-叠氮基水杨基酰胺基)乙基二硫化物(BASED)、二-N-(2-硝基-4-叠氮基苯基)-胱胺-S,S’-二氧化物(DNCO)和4,4’-二硫代双苯基氮化物。

5.异双功能试剂

a.具有吡啶基二硫化物部分的氨基反应性异双功能试剂

这种试剂的合成、性质和应用描述于文献中(对于交联程序和试剂的综述,见上文)。许多试剂是可购得的(如Pierce ChemicalCompany,Rockford,III.;Sigma Chemical Company,St.Louis,Mo.;Molecular Probes,Inc.,Eugene,OR)。

具有吡啶基二硫化物部分和氨基反应性NHS酯的异双功能试剂的优选的非限制性例子包括N-琥珀酰亚胺基-3-(2-吡啶基二硫代)丙酸(SPDP)、琥珀酰亚胺基6-3-(2-吡啶基二硫代)丙酰胺己酸(LC-SPDP)、磺基琥珀酰亚胺基6-3-(2-吡啶基二硫代)丙酰胺己酸(磺基-LCSPDP)、4-琥珀酰亚胺基氧基羰基-α-甲基-α-(2-吡啶基二硫代)甲苯(SMPT)和磺基琥珀酰亚胺基6-α-甲基-α-(2-吡啶基二硫代)甲苯甲酰胺己酸(磺基-LC-SMPT)。

b.具有马来酰亚胺部分的氨基反应性异双功能试剂

这种试剂的合成、性质和应用描述于文献中。具有马来酰亚胺部分和氨基反应性NHS酯的异双功能试剂的优选的非限制性例子包括琥珀酰亚胺马来酰亚胺乙酰酯(AMAS)、琥珀酰亚胺3-马来酰亚胺丙酸酯(BMPS)、N-γ-马来酰亚胺丁酰氧琥珀酰亚胺酯(GMBS)、N-γ-马来酰亚胺丁酰氧磺基琥珀酰亚胺酯(磺基-GMBS)、琥珀酰亚胺6-马来酰亚胺己酸酯(EMCS)、琥珀酰亚胺3-马来酰亚胺苯甲酸酯(SMB)、间马来酰亚胺苯甲酰-N-羟基琥珀酰亚胺酯(MBS)、间马来酰亚胺苯甲酰-N-羟基磺基琥珀酰亚胺酯(磺基-MBS)、琥珀酰亚胺4-(N-马来酰亚胺甲基)-环己烷-1-羧酸酯(SMCC)、磺基琥珀酰亚胺4-(N-马来酰亚胺甲基)-环己烷-1-羧酸酯(磺基-SMCC)、琥珀酰亚胺4-(对马来酰亚胺苯基)丁酸酯(SMPB)和磺基琥珀酰亚胺4-(对马来酰亚胺苯基)丁酸酯(磺基-SMPB)。

c.具有烷基卤化物部分的氨基反应性异双功能试剂

这种试剂的合成、性质和应用描述于文献中。具有烷基卤化物部分和氨基反应性NHS酯的异双功能试剂的优选的非限制性例子包括N-琥珀酰亚胺-(4-碘代乙酰基)氨基苯甲酸酯(SIAB)、磺基琥珀酰亚胺-(4-碘代乙酰基)氨基苯甲酸酯(磺基-SIAB)、琥珀酰亚胺-6-(碘代乙酰基)氨基己酸酯(SIAX)、琥珀酰亚胺-6-(6-((碘代乙酰基)-氨基)己酰氨基)己酸酯(SIAXX)、琥珀酰亚胺-6-(((4-碘代乙酰基)-氨基)-甲基)-环己烷-1-羰基)氨基己酸酯(SIACX)和琥珀酰亚胺-4((碘代乙酰)-氨基)甲基环己烷-1-羧酸酯(SIAC)。

具有氨基反应性NHS酯和烷基二卤化物部分的异双功能试剂的优选的例子是N-羟基琥珀酰亚胺2,3-二溴丙酸酯(SDBP)。SDBP通过缀合其氨基基团而向亲和成分引入分子内交联。二溴丙酰基部分与伯胺的反应性可通过反应温度控制(McKenzie等人,Protein Chem.7:581-592(1988))。

具有烷基卤化物部分和氨基反应性对硝基苯酯的异双功能试剂的优选的非限制性例子包括对硝基苯基碘乙酸酯。

其他交联剂是本领域技术人员公知的。参见如Pomato等人,美国专利No.5,965,106。对特定的应用选择适当的交联剂是在本领域技术人员的能力范围内的。

d.可切割的连接体基团

在另外进一步的实施方案中,连接体基团具有可进行切割以将修饰基团从糖残基上释放的基团。许多可切割的基团是本领域中公知的。参见如Jung等人,Biochem.Biophys.Acta 761:152-162(1983);Joshi等人,J.Biol.Chem.265:14518-14525(1990);Zarling等人,J.Immunol.124:913-920(1980);Bouizar等人,Eur.J.Biochem.155:141-147(1986);Park等人,J.Biol.Chem.261:205-210(1986);Browning等人,J.Immunol.143:1859-1867(1989)。此外,广泛的可切割的双功能连接体基团(同或异双功能的)是商业上可从如Pierce的供应商购得的。

示例性的可切割的部分可用光、热或试剂切割,该试剂如硫醇、羟胺、碱、过碘酸盐等。此外,某些优选的基团是在体内响应于内吞而切割的(如顺式乌头基(cis-aconityl);参见Shen等人,Biochem.Biophys.Res.Commun.102:1048(1991))。优选的可切割的基团包含选自二硫化物、酯、二酰亚胺、碳酸盐、硝基苄基、苯乙酮基和安息香基团的成员的可切割部分。

e.修饰的糖与肽的缀合

修饰的糖是通过介导缀合的适当的酶与糖基化或非糖基化的肽进行缀合的。优选地,选择修饰的供体糖、酶和受体肽的浓度,从而糖基化可以进行到受体被用完时。尽管是关于唾酸转移酶提出的,但在下面讨论的因素通常可应用于其他的糖基转移酶反应中。

许多用糖基转移酶合成想要的寡糖结构的方法是公知的,且通常应用于本发明中。一些文献描述了示例性的方法,如WO 96/32491、Ito等人,Pure Appl.Chem.65:753(1993)和U.S.Pat.No.5,352,670、5,374,541和5,545,553。

本发明是用单一糖基转移酶或糖基转移酶的组合实践的。例如,人们可以应用唾酸转移酶和半乳糖基转移酶的组合。在应用超过一种酶的实施方案中,酶和底物优选地是在初始反应化合物中组合的,或者第二个酶促反应的酶和试剂是在第一个酶促反应完成或接近完成时添加到反应介质中的。通过在单个容器中依次进行两个酶促反应,总产量相对于要分离中间物种类的程序改善了。此外,减少了对额外的溶剂和副产品的清除和处理。

在一个优选的实施方案中,第一种和第二种酶均是糖基转移酶。在另一个优选的实施方案中,一种酶是内切糖苷酶。在另一个优选的实施方案中,一种酶是外切糖苷酶。在额外优选的实施方案中,将超过两种酶用于组装本发明的修饰糖蛋白。该酶用于在将修饰的糖添加到肽上之前或之后在任何位点改变肽上的糖结构。

在另一个实施方案中,至少两种酶是糖基转移酶,且添加到肽上糖结构中的最后的糖是非修饰的糖。或者,修饰的糖位于聚糖结构的内部,因此不必是聚糖上的最后的糖。在一个示例性的实施方案中,半乳糖基转移酶可催化Gal-PEG从UDP-Gal-PEG向聚糖上的转移,随后在ST3Gal3和CMP-SA存在时进行温育,这将向聚糖添加未修饰的“加帽”唾液酸(图23A)。

在另一个实施方案中,至少两种所用的酶是糖基转移酶,且将至少两个修饰的糖添加到肽的聚糖结构上。以这种方式,两个或多个不同的肽缀合物可添加到肽上一个或多个聚糖上。该过程产生了具有两个或多个功能不同的修饰的糖的聚糖结构。在一个示例性的实施方案中,肽与GnT-I、II和UDP-GlcNAc-PEG的温育可将GlcNAc-PEG分子添加到聚糖上;然后与半乳糖基转移酶和UDP-Gal的温育可在其上添加Gal残基;且与ST3Gal3和CMP-SA-Man-6-磷酸的温育可将SA-甘露糖-6-磷酸分子添加到聚糖上。该系列反应结果产生具有PEG化聚糖的功能特征以及甘露糖-6-磷酸导向活性的聚糖链(图23B)。

在另一个实施方案中,至少两种用于反应中的酶是糖基转移酶,且将不同的修饰的糖添加到肽上N-连接的和O-连接的聚糖上。当将两个不同的修饰的糖添加到肽的聚糖上,且当重要的是在空间上对肽上所述修饰的糖进行相互分隔时,该实施方案是有用的。例如,如果修饰的糖包含体积大的分子,则该方法是优选的,该体积大的分子包括但不局限于PEG和其他分子如连接体分子。修饰的糖可同时添加到肽的聚糖上,或者它们可依次加入。在一个示例性的实施方案中,与ST3Gal3和CMP-SA-PEG的温育可将唾液酸-PEG添加到N-连接的聚糖上,而与ST3Gal1和CMP-SA-二磷酸酯的温育可将唾液酸二磷酸酯添加到O-连接的聚糖上(图23C)。

在另一个实施方案中,该方法应用一种或多种外切或内切糖苷酶。该糖苷酶一般是突变体,该突变体是经过加工的以形成糖基键而不是破坏该键。有时称为糖合成酶的突变聚糖酶一般包括氨基酸残基对活性位点酸性氨基酸残基的取代。例如,当内切聚糖酶是endo-H时,取代的活性位点一般是位置130的Asp、位置132的Glu或其组合。该氨基酸通常是用丝氨酸、丙氨酸、天冬酰胺或谷氨酰胺取代的。外切糖苷酶如转唾液酸酶(transialylidase)也是有用的。

突变的酶通常以合成步骤催化反应,这是与内切聚糖酶的水解步骤的反向反应类似的。在这些实施方案中,糖基供体分子(如想要的寡-或单-糖结构)含有离去基团,且反应随着向蛋白质上的GlcNAc残基上添加供体分子而进行。例如,离去基团可为卤素,如氟化物。在其他实施方案中,离去基团是Asn或Asn-肽部分。在另外进一步的实施方案中,糖基供体分子上的GlcNAc残基得到了修饰。例如,GlcNAc残基可包含1,2噁唑啉部分。

在一个优选的实施方案中,用于产生本发明的缀合物的每一种酶均是以催化量存在的。特定酶的催化量根据该酶底物的浓度以及反应条件而变化,该反应条件如温度、时间和pH值。确定给定的酶在预先选择的底物浓度和反应条件下的催化量的方法是本领域技术人员众所周知的。

实施上述方法的温度范围为冰冻点到最敏感的酶变性的温度。优选的温度范围为约0℃~约55℃,且更优选地为约20℃~约37℃。在另一个示例性的实施方案中,本发明方法中的一种或多种成分是用嗜热的酶在升高的温度下进行的。

使反应混合物维持足够的时间以使得受体可进行糖基化,从而形成想要的缀合物。一些缀合物常在少数几个小时即可探测到,而可回收的量通常在24小时内或更短时间内获得。本领域的技术人员理解反应速率依赖于许多可变的因素(如酶浓度、供体浓度、受体浓度、温度、溶剂体积),根据选择的系统使这些因素最适化。

本发明也提供了对修饰肽的工业规模的生产。如在此处所用的,工业规模通常生产至少一克最终纯化的缀合物。

在随后的讨论中,本发明是通过修饰的唾液酸部分与糖基化的肽的缀合进行示例的。该示例性的修饰唾液酸是用PEG标记的。下面对PEG-修饰的唾液酸和糖基化的肽的应用的讨论是为了阐明清晰的目的,而不是意味着本发明局限于这两个配偶体的缀合。技术人员可以理解该讨论通常可用于添加除唾液酸之外的修饰糖基部分。此外,该讨论同样用于用除PEG之外的试剂对糖基单位的修饰,该试剂包括其他的水溶性聚合物、治疗部分和生物分子。

一种酶促方法可用于选择性地将PEG化的或PPG化的糖引入到肽或糖肽中。该方法利用含有PEG、PPG或掩盖的反应性官能基团的修饰的糖,且与适当的糖基转移酶或糖合成酶组合。通过选择可形成想要的糖连接和利用修饰糖作为供体底物的糖基转移酶,可将PEG或PPG直接引入到肽主链上、引入到糖肽上已存在的糖残基上或引入到已添加到肽上的糖残基上。

唾酸转移酶的受体存在于由本发明的方法修饰的肽上,它或者作为天然存在的结构,或者是重组地、酶促地或化学地置于其上的。适当的受体包括如半乳糖基受体如Galβ1,4GlcNAc、Galβ1,4GalNAc、Galβ1,3GalNAc、lacto-N-tetraose、Galβ1,3GlcNAc、Galβ1,3Ara、Galβ1,6GlcNAc、Galβ1,4Glc(乳糖)和其他本领域的技术人员公知的受体(参见如Paulson等人,J.Biol.Chem.253:5617-5624(1978))。

在一个实施方案中,唾酸转移酶的受体是在待修饰的肽体内合成后即存在于其上的。这种肽可不预先对肽的糖基化模式进行修饰而用本发明的方法进行唾液酸化。可选择地,本发明的方法可用于对不包括适当的受体的肽进行唾液酸化;人们首先通过本领域的技术人员公知的方法对肽进行修饰以使其包括受体。在一个示例性的实施方案中,GalNAc残基是通过GalNAc转移酶的作用而添加的。

在一个示例性的实施方案中,半乳糖基受体是通过将半乳糖残基添加到与肽连接的适当受体如GlcNAc上而组装的。该方法包括使要进行修饰的肽与反应混合物进行温育,该反应混合物含有适当量的半乳糖基转移酶(如galβ1,3或galβ1,4)和适当的半乳糖基供体(如UDP-半乳糖)。使该反应基本进行完全,或可选择地使该反应在已添加了预先选择的量的半乳糖残基时终止。其他组装选择的糖受体的方法对于本领域的技术人员是显而易见的。

在另外一个实施方案中,首先完全或部分地对肽连接的寡糖进行“修剪”以暴露唾酸转移酶的受体或一种部分,其中一种或多种适当的残基可添加到该部分上以获得适当的受体。例如糖基转移酶和内切糖苷酶(参见如美国专利No.5,716,812)对于附着和修剪反应是有用的。“修剪”和重构N-连接的和O-连接的聚糖的详细讨论在别处提供。

在随后的讨论中,本发明的方法是通过应用在其上附着有水溶性聚合物的修饰的糖而示例的。讨论的侧重点是为了阐明清晰的目的。技术人员将理解该讨论同样适用于其中修饰的糖携带有治疗部分、生物分子等的实施方案。

本发明的一个示例性的实施方案在图14中提出,其中糖残基在添加修饰的糖之前进行了“修剪”,该实施方案提出了将高甘露糖修剪至第一代双触角结构的方案。携带有水溶性聚合物的修饰的糖则与由“修剪”所暴露的一个或多个糖残基缀合。在一个例子中,水溶性聚合物是通过GlcNAc部分进行添加的,该GlcNAc部分与水溶性聚合物缀合。修饰的GlcNAc是附着到双触角结构的一个或两个末端甘露糖残基上的。可选择地,未修饰的GlcNAc可添加到分支种类的一个或两个末端上。

在另一个示例性的实施方案中,水溶性聚合物是通过具有半乳糖残基的修饰的糖而添加到双触角结构的一个或两个末端甘露糖残基上的,该修饰的糖是与添加到末端甘露糖残基上的GlcNAc残基缀合的。可选择地,未修饰的Gal可添加到一个或两个末端GlcNAc残基上。

在另外进一步的例子中,水溶性聚合物是用修饰的唾液酸添加到Gal残基上的。

另一个示例性的实施方案在图15中提出,该图展示了与图14所示的类似的方案,其中将高甘露糖结构“修剪”至甘露糖(双触角结构从该甘露糖分支)。在一个例子中,水溶性聚合物是通过用聚合物修饰的GlcNAc进行添加的。可选择地,未修饰的GlcNAc是添加到甘露糖上的,随后再添加具有附着的水溶性聚合物的Gal。在另外一个实施方案中,未修饰的GlcNAc和Gal残基是依次添加到甘露糖上的,随后再添加用水溶性聚合物修饰的唾液酸部分。

图16提出了利用与图14中所示的类似的方案的进一步的示例性实施方案,其中将高甘露糖“修剪”至第一个甘露糖所附着的GlcNAc。该GlcNAc是与携带有水溶性聚合物的Gal残基缀合的。可选择地,将未修饰的Gal添加到GlcNAc上,随后添加用水溶性糖修饰的唾液酸。在另外进一步的例子中,使末端GlcNAc与Gal缀合,并随后将GlcNAc用携带有水溶性聚合物的修饰岩藻糖进行岩藻糖基化。

图17是与图14中所示的相似的方案,其中将高甘露糖修剪至附着到肽的Asn上的第一个GlcNAc。在一个例子中,GlcNAc-(Fuc)a残基的GlcNAc是与携带有水溶性聚合物的GlcNAc缀合的。在另一个例子中,GlcNAc-(Fuc)a残基的GlcNAc是用携带有水溶性聚合物的Gal修饰的。在另外进一步的实施方案中,GlcNAc是用Gal修饰的,随后与用水溶性聚合物修饰的唾液酸的Gal缀合。

其他示例性的实施方案在图18-22中提出。在每一个前述的图中提供了本发明所实践的一系列反应类型的说明。

在上面给出的例子提供了对在此处提出的方法的力量的阐明。利用本发明的方法,可能的是“修剪”并构造具有几乎任何想要的结构的糖残基。修饰的糖可添加到如在上面提出的糖部分末端上,或者它可介于肽核心和糖末端之间。

在一个示例性的实施方案中,将存在的唾液酸用唾液酸酶从糖肽上去除,从而暴露下面所有或大多数的半乳糖基残基。可选择地,肽或糖肽是用半乳糖残基或者以半乳糖单位结束的寡糖残基进行标记的。在暴露或添加了半乳糖残基之后,将适当的唾酸转移酶用于添加修饰的唾液酸。该方法总结于方案12中。

方案12

在更进一步的总结于方案13的方法中,在唾液酸上存在掩盖的反应性官能团。该掩盖的反应性基团优选地不受用于将修饰的唾液酸附着到肽上的条件影响。在修饰的唾液酸与肽的共价附着之后,该掩盖被去除,且该肽与如PEG、PPG、治疗部分、生物分子或其他试剂进行缀合。该试剂是以特定的方式通过其与修饰的糖残基上的暴露的反应性基团的反应与肽缀合的。

方案13

依赖于糖肽的寡糖侧链的末端糖,可应用任何修饰的糖与其适当的糖基转移酶(表4)。如上所述,引入PEG化或PPG化结构所必需的糖肽的末端糖可在其表达过程中天然引入,或者它可在表达后用适当的糖苷酶、糖基转移酶或糖苷酶和糖基转移酶的混合物产生。

表4.修饰的糖

X=O,NH,S,CH2,N-(R1-5)2.    Y=X;Z=X;A=X;B=X.                  目标配体=酰基-PEG、酰基-PPG、烷基-PEG、

                                         酰基-烷基-PEG、酰基-烷基-PEG、氨基甲酰基-PEG、    Q=H2,O,S,NH,N-R.          氨基甲酰基-PPG、PEG、PPG、酰基-芳基-PEG、

                                         酰基-芳基-PPG、芳基-PEG、 芳基-PPG、    R,R1-4=H,连接体-M,M                甘露糖-6-磷酸、肝素、类肝素、SLex、

                                         甘露糖、FGF、VFGF、蛋白质、软骨素、    M=目标配体

                                         角质素、皮肤素、白蛋白、整合蛋白、肽等

在进一步的示例性实施方案中,UDP-半乳糖-PEG是与牛奶β1,4-半乳糖基转移酶反应的,从而将修饰的半乳糖转移到适当的末端N-乙酰葡糖胺结构上。糖肽上的末端GlcNAc残基可在表达过程中产生,如在哺乳动物、昆虫、植物或真菌的表达系统中出现的,但也可通过用所需的唾液酸酶和/或糖苷酶和/或糖基转移酶对糖肽进行处理以产生。

在另一个示例性的实施方案中,将GlcNAc转移酶如GnT-I-IV用于将PEG化的GlcNAc转移到糖肽的甘露糖残基上。在更进一步的示例性实施方案中,将N-和/或O-连接的聚糖结构酶促地从糖肽上去除以暴露随后可与修饰的糖缀合的氨基酸或末端糖基残基。例如,将内切聚糖酶用于去除糖肽的N-连接的结构以暴露末端GlcNAc,使其显示为糖肽上GlcNAc连接的Asn。UDP-Gal-PEG和适当的半乳糖基转移酶可用于将PEG-或PPG-半乳糖官能团引入到暴露的GlNAc上。

在一个可选择的实施方案中,修饰的糖是用糖基转移酶直接添加到肽主链上的,其中该酶已知可将糖残基转移到肽主链上。该示例性的实施方案在方案14中提出。用于实践本发明的示例性糖基转移酶包括但不局限于GalNAc转移酶(GalNAc T1-14)、GlcNAc转移酶、岩藻糖基转移酶、葡糖基转移酶、木糖基转移酶、甘露糖基转移酶等。应用本方法使得能够直接将修饰的糖添加到缺乏任何糖的肽上或添加到现有的糖肽上。在这两种情况下,修饰的糖的添加发生于由糖基转移酶的底物特异性所限定的肽主链上的特定位置,而不是如用化学方法修饰蛋白质的肽主链过程中发生的随机方式。通过将适当的氨基酸序列加工入肽链中,可将一系列试剂引入到原本缺乏糖基转移酶的底物肽序列的蛋白质或糖肽中。

方案14

在上文提出的每一个示例性的实施方案中,在修饰的糖与肽缀合之后可应用一个或多个额外的化学或酶促修饰步骤。在一个示例性的实施方案中,可将酶(如岩藻糖基转移酶)用于在附着于肽上的末端修饰的糖上附加糖基单位(如岩藻糖)。在另一个例子中,可将酶促反应用于对修饰的糖不能缀合的位点进行“加帽”。可选择地,将化学反应用于改变缀合的修饰的糖的结构。例如,使缀合的修饰的糖与试剂进行反应,该试剂可使其与修饰的糖所附着的肽成分的连接稳定化或去稳定化。在另一个例子中,在与肽缀合之后,修饰的糖的成分是去保护的。技术人员将理解有一系列的酶促和化学程序可在修饰的糖与肽缀合之后的阶段用于本发明的方法中。对修饰的糖-肽缀合物的进一步的修饰是在本发明的范围之内的。

用甘露糖-6-磷酸导向的肽

在一个示例性的实施方案中,肽是用至少一种甘露糖-6-磷酸部分衍生化的。该甘露糖-6-磷酸部分可将肽导向到细胞的溶酶体中,且可用于如将治疗性蛋白质导向到溶酶体中以治疗溶酶体贮积病。

溶酶体贮积病是超过40种病症的群体,它们是编码分解细胞溶酶体中糖脂或多糖废物的酶的基因缺陷的结果。该酶的产物如糖和脂质可再循环为新的产物。这些病症的每一个均源自遗传的常染色体或X-连锁的隐性性状,该性状影响溶酶体中酶的水平。通常,染病的个体的细胞和组织中受影响的酶没有生物学或功能活性。表5提供了代表性贮积病和与疾病相关的酶缺陷的列表。在这种疾病中,酶功能的缺陷造成身体细胞溶酶体中脂质或糖类底物的逐步地全身性沉积,最终导致器官功能的丧失和死亡。溶酶体贮积病的遗传病因学、临床表现、分子生物学和发病率详细描述于Scriver等人,eds.,The Metabolic andMolecular Basis of Inherited Disease,7.sup.th Ed.,Vol.II,McGrawHill,(1995)。

表5.溶酶体贮积病及相关的酶缺陷

  疾病  酶缺陷  旁帕氏病  MPSI*(赫尔勒氏病)  MPSII(亨特氏疾病)  MPSIII(山菲立普病)  MPSIV(莫尔基奥氏病A)  MPSIV(莫尔基奥氏病B)  MPSVII(Sly氏病)  I-cell疾病  Schindler氏病   Wolman氏病  胆固醇酯贮积病  Farber氏病  尼-皮二氏病  高歇病  Krabbe氏病  法布莱氏病  GM1神经节苷脂沉积症  galactosialidosis  泰-萨二氏病  Magakaryotic脑白质营养不良  山霍夫氏病  酸性α-葡糖苷酶(酸性麦芽糖酶)  α-L-艾杜糖苷酶  艾杜糖醛酸硫酸酯酶  类肝素N-硫酸酯酶  半乳糖-6-硫酸酯酶  酸性β-半乳糖苷酶  β-glucoronidase  N-乙酰葡糖胺-1-磷酸转移酶  α-N-乙酰半乳糖胺酶  (α-半乳糖苷酶B)  酸性脂酶  酸性脂酶  溶酶体酸性神经酰胺酶  酸性鞘磷脂酶  葡糖脑苷脂酶  半乳糖苷神经酰胺酶  α-半乳糖苷酶A  酸性β-半乳糖苷酶  β-半乳糖苷酶和神经氨酸酶  氨基己糖苷酶A  芳基硫酸酯酶a  氨基己糖苷酶A和B

*MPS=粘多糖

De Duve首先提出用外源生物学活性的酶替代缺失的溶酶体酶可能是治疗溶酶体贮积病的可行的方法(De Duve,Fed.Proc.23:1045(1964))。从那时开始,各种研究已提出酶替代治疗对于治疗各种溶酶体贮积病均是有益的。在具有I型高歇病的个体中已显示了最大的成功,该个体已用从胎盘中制备的外源酶(β-葡糖脑苷脂酶)(CeredaseTM)或最近重组生产的酶(CerezymeTM)进行治疗。也已提出酶替代对于治疗法布莱氏病以及其他的溶酶体贮积病均是有益的。参见如Dawson等人,Ped.Res.7(8):684-690(1973)(在体外)和Mapes等人,Science 169:987(1970)(在体内)。酶替代治疗的临床实验已在用正常血浆(Mapes等人,Science 169:987-989(1970))、从胎盘中纯化的α-半乳糖苷酶A(Brady等人,N.Eng.J.Med.279:1163(1973))或从脾或血浆中纯化的α-半乳糖苷酶A(Desnick等人,Proc.Natl.Acad.Sci.,USA 76:5326-5330(1979))灌输的法布莱氏病患者中报道,并已证明对法布莱氏病直接进行酶替代的生物医学效力。这些研究显示通过重复的酶替代消除或显著减少病理学的糖脂贮积的潜力。例如,在一个研究中(Desnick等人,见上文),纯化的酶的静脉注射导致贮积的脂质底物globotriasylceramide的血浆水平暂时的降低。

因此,本领域中需要向缺陷细胞提供足够量的生物学活性的溶酶体酶如人类α-半乳糖苷酶A的方法。最近,已尝试用重组方法来满足这些需要,参见如U.S.Pat.No.5,658,567、5,580,757;Bishop等人,Proc.Natl.Acad.Sci.,USA,83:4859-4863(1986);Medin等人,Proc.Natl.Acad.Sci.,USA93:7917-7922(1996);Novo,F.J.,Gene Therapy 4:488-492(1997);Ohshima等人,Proc.Natl.Acad.Sci.,USA 94:2540-2544(1997);和Sugimoto等人,Human Gene Therapy 6:905-915(1995)。通过甘露糖-6-磷酸介导的治疗性肽向溶酶体中的导向,本发明提供了用于将足够量的生物学活性溶酶体肽送递到缺陷细胞中的组合物和方法。

因而,在一个示例性的实施方案中,本发明提供了用甘露糖-6-磷酸衍生化的表7中的肽(图24和图25)。该肽可为重组或化学制备的。此外,该肽可为完整的天然序列,或者可通过如截断、延伸而修饰,或者它可包括替代或缺失。用本发明的方法重构的示例性蛋白质包括葡糖脑苷脂酶、β-葡糖苷酶、α-半乳糖苷酶A、酸性-α-葡糖苷酶(酸性麦芽糖酶)。用于临床应用的代表性修饰的肽包括但不局限于CeredaseTM、CerezymeTM和FabryzymeTM。在修饰的和临床上相当的肽上的糖基基团也可用本发明的方法进行改变。甘露糖-6-磷酸是通过糖基连接基团附着到肽上的。在一个示例性的实施方案中,糖基连接基团源自唾液酸。示例性的源自唾液酸的糖基连接基团在表3中提出,其中一个或多个“R”部分是甘露糖-6-磷酸或在其上附着有一个或多个甘露糖-6-磷酸部分的间隔基团。该修饰的唾液酸部分优选地是连接到肽表面上的寡糖的末端残基(图26)。

除甘露糖-6-磷酸之外,本发明的肽可进一步用诸如水溶性聚合物、治疗部分或额外的导向部分的部分进行衍生化。用于附着这些和其他的基团的方法在此处提出。在一个示例性的实施方案中,除甘露糖-6-磷酸之外的基团是通过根据表3的衍生化的唾液酸衍生物附着到肽上的,其中一个或多个“R”部分是除甘露糖-6-磷酸之外的基团。

在一个示例性的实施方案中,制备了用Cbz-保护的基于甘氨酸的连接体臂修饰的唾液酸部分。制备了相应的核苷酸糖,并通过催化加氢将Cbz基团去除。结果所得的核苷酸糖具有与活化的甘露糖-6-磷酸衍生物接触的可用的反应性胺,从而提供了可用于实践本发明的甘露糖-6-磷酸衍生化的核苷酸糖。

如在下面方案(方案15)中所示的,示例性活化的甘露糖-6-磷酸衍生物的形成方式如下:将2-溴-苄基-保护的磷酸三酯在原位转变为相应的三氟甲基磺酸酯,并使该三氟甲基磺酸酯与具有反应性含氧部分的连接体反应,从而在糖和连接体之间形成醚键。苄基保护基团是通过催化加氢去除的,且将连接体的甲酯水解,从而提供相应的羧酸。该羧酸可通过本领域公知的任何方法活化。一个示例性的活化程序依赖于羧酸向N-羟基琥珀酰亚胺酯的转变。

方案15

在另一个示例性的实施方案中,如在下面方案(方案16)中所示的,N-乙酰化的唾液酸是通过对pyruvyl部分的处理而转变为胺的。因而,将伯羟基转变为磺酸酯并使其与叠氮化钠反应。将叠氮化物催化还原为相应的胺。随后将糖转变为其核苷酸类似物,并使其通过胺基团与如上所述制备的连接体臂衍生的甘露糖-6-磷酸偶联。

方案16

用于治疗溶酶体贮积病的肽可用其他导向部分进行衍生化,该导向部分包括但不局限于运铁蛋白(将肽跨过血-脑屏障送递和送到内体)、肉碱(将肽送递入肌肉细胞)和磷酸盐,如二磷酸盐(将肽导向到骨骼和其他钙化的组织中)。导向部分和治疗性肽是通过任何在此处讨论的方法或另外本领域中公知的方法缀合的。

在一个示例性的实施方案中,导向剂和治疗性肽是通过连接体部分偶联的。在该实施方案中,至少一个治疗性肽或导向剂是根据本发明的方法通过完整糖基连接基团与连接体部分偶联的。在一个示例性的实施方案中,连接体部分包括聚(醚)如聚(乙二醇)。在另一个示例性的实施方案中,连接体部分包括至少一个在体内降解的键,从而在将缀合物送递到身体的目标组织或区域中后从导向剂中释放治疗性肽。

在另外一个示例性的实施方案中,治疗部分的体内分配是通过改变治疗部分上的糖形式而改变的,而无需将治疗性肽与导向部分缀合。例如,通过用唾液酸(或其衍生物)对糖基基团的末端半乳糖部分进行加帽可使治疗性肽避开网状内皮系统的摄取(图24和27)。覆盖末端Gal的唾液酸化避免了肝脱唾液酸糖蛋白(ASGP)受体对肽的摄取,且可延伸该肽相对于无唾液酸化而仅具有复杂的聚糖链的肽的半衰期。

II.本发明的肽/糖肽

在一个实施方案中,本发明提供了包含多拷贝的单个肽的组合物,该肽以基本的三甘露糖核心作为在其上附着的主要聚糖结构。在优选的实施方案中,该肽可为治疗性分子。该肽的天然形式可包含复杂的N-连接的聚糖或可为高甘露糖聚糖。该肽可为哺乳动物的肽,且优选地为人类的肽。在一些实施方案中,该肽选自免疫球蛋白、促红细胞生成素、组织型活化因子肽等(见图28)。

其聚糖可用本发明的方法进行重构的示例性肽在图28中提出。

表6.用于进行聚糖重构的优选的肽

  激素和生长因子受体和嵌合受体  G-CSF  GM-CSF  TPO  EPO  EPO变体  FSH  HGH  胰岛素  α-TNF  Leptin  人绒毛膜促性腺激素  酶和抑制剂  TPA  TPA变体  尿激酶  凝血因子VII、VIII、IX、X  DNase  葡糖脑苷脂酶  蛭素  α1抗胰蛋白酶(α1蛋白酶抑制剂)  抗凝血酶III  酸性α-葡糖苷酶(酸性麦芽糖酶)  α半乳糖苷酶A  α-L-iduronidase  尿激酶  细胞因子和嵌合细胞因子  白细胞介素-1(IL-1)、1B、2、3、4  干扰素-α(IFN-α)  IFN-α-2b  IFN-β    IFN-γ    IFN-ω    嵌合的白喉毒素-IL-2CD4肿瘤坏死因子受体(TNF-R)TNF-R:IgGFc融合体α-CD20PSGL-1补体GlyCAM或其嵌合体N-CAM或其嵌合体单克隆抗体(免疫球蛋白)MAb-抗-RSVMAb-抗-IL-2受体MAb-抗-CEAMAb-抗糖蛋白IIb/IIIaMAb-抗-EGFMAb-抗-Her2MAb-CD20MAb-α-CD3MAb-TNFαMAb-CD4MAb-PSGL-1Mab-抗呼吸道合胞病毒F蛋白质抗凝血酶-III细胞血红细胞白血细胞(如T细胞、B细胞、树突细胞、巨噬细胞、NK细胞、嗜中性白细胞、单核细胞等)干细胞其他乙型肝炎表面抗原(HbsAg)

表7.用于进行聚糖重构的最优选的肽

  α-半乳糖苷酶A  α-L-艾杜糖苷酶  抗凝血酶-III  粒细胞集落刺激因子(G-CSF)  干扰素α    干扰素β    干扰素ω    凝血因子VII凝血因子  凝血因子IX凝血因子  促卵泡激素(FSH)  促红细胞生成素(EPO)  粒细胞巨噬细胞集落刺激因子  (GM-CSF)  干扰素γ    α1蛋白酶抑制剂(α1抗胰蛋白酶)  组织型血纤维蛋白溶酶原活化因子  (TPA)  葡糖脑苷脂酶(CerezymeTM)  白细胞介素-2(IL-2)  凝血因子VIII  hrDNase  胰岛素  乙型肝炎表面抗原(HbsAg)  人生长激素(HGH)  人绒毛膜促性腺激素  尿激酶  TNF受体-IgG Fc融合体(EnbrelTM)  MAb-Her-2(HerceptinTM)  MAb-呼吸道合胞病毒F蛋白质  (SynagisTM)  MAb-CD20(RituxanTM)  MAb-TNFa(RemicadeTM)  MAb-糖蛋白IIb/IIIa(ReoproTM)

用于本发明的肽及其来源的更详细的列表在图28中提出。

用本发明的方法修饰的其他示例性肽包括免疫球蛋白家族的成员(如抗体、MHC分子、T细胞受体等)、细胞间受体(如整合蛋白、激素或生长因子受体等)、凝集素和细胞因子(如白细胞介素)。额外的例子包括组织型血纤维蛋白溶酶原活化因子(TPA)、肾素、凝血因子如凝血因子VIII和凝血因子IX、铃蟾肽、凝血酶、造血生长因子、集落刺激因子、病毒抗原、补体肽、α1-抗胰蛋白酶、促红细胞生成素、P-选择蛋白糖肽配体-1(PSGL-1)、粒细胞巨噬细胞集落刺激因子、抗凝血酶III、白细胞介素、干扰素、肽A和C、血纤蛋白原、herceptinTM、leptin、糖苷酶等。该肽列表是示例性的,且并不应该认为是排它性的。相反,如从在此处提供的公开内容中显而易见的,本发明方法可应用于任何肽中,在该肽中可形成任何想要的聚糖结构。

本发明的方法也用于修饰嵌合的肽,该嵌合的肽包括但不局限于包括源自免疫球蛋白如IgG的部分的嵌合肽。

用本发明的方法修饰的肽可为合成的或野生型的肽,或者它们可为用本领域公知的方法产生的突变肽,如定点诱变。肽的糖基化一般是N-连接的或O-连接的。一个示例性的N-连接是修饰的糖向天冬酰胺残基侧链的附着。三肽结构天冬酰胺-X-丝氨酸和天冬酰胺-X-苏氨酸是糖部分向天冬酰胺侧链上酶促附着的识别序列,其中X是除脯氨酸之外的任何氨基酸。因而,肽中任何一个这些三肽序列的存在均产生了潜在的糖基化位点。如在别处所描述的,O-连接的糖基化指一个糖(如N-乙酰半乳糖胺、半乳糖、甘露糖、GlcNAc、葡萄糖、岩藻糖或木糖)向羟基氨基酸的羟基侧链的附着,优选地为丝氨酸或苏氨酸,尽管也可应用5-羟基脯氨酸或5-羟基赖氨酸。

本发明的几个示例性的实施方案在下面进行讨论。尽管这些实施方案的几个应用具有商标名称的肽和其他特定的肽作为示例性的肽,但这些例子不局限于任何特定的肽。下面的示例性实施方案包括所有肽等价物和任何肽的变体。这种变体包括但不局限于添加和删除N-连接的和O-连接的糖基化位点及具有添加的糖基化位点的融合蛋白质。本领域的技术人员将理解下面的实施方案和在此处公开的基本方法可同样成功地应用于许多肽。

在一个示例性的实施方案中,本发明提供了用于修饰粒细胞集落刺激因子(G-CSF)的方法。图29A~29G提出了一些如何用在此处公开的方法实现该修饰的例子。在图29B中,将在哺乳动物细胞中表达的G-CSF肽用唾液酸酶进行修剪。这样暴露的残基可通过用其适当供体和ST3Gal1添加唾液酸-聚(乙二醇)部分(PEG部分)而修饰。图29C提出了用于修饰在昆虫细胞上表达的G-CSF肽的示例性方案。该肽是通过用其适当的供体和半乳糖基转移酶添加半乳糖部分而修饰的。半乳糖残基是通过ST3Gal1的作用和唾液酸-PEG衍生物用PEG进行官能化的。在图29D中,使细菌表达的G-CSF与N-乙酰半乳糖胺供体和N-乙酰半乳糖胺转移酶接触。该肽是通过PEG化的唾液酸供体和唾酸转移酶用PEG官能化的。在图29E中,使哺乳动物细胞表达的G-CSF与唾液酸供体接触,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽上聚糖的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图29F中,细菌表达的G-CSF是通过使肽与内切-GalNAc酶在其发挥合成功能而不是水解功能的条件下接触而重构的,从而从其活化的衍生物中添加PEG-Gal-GalNAc分子。图29G提供了重构细菌表达的G-CSF的另一个途径。多肽是通过使该多肽与N-乙酰半乳糖胺转移酶和适当的PEG化的N-乙酰半乳糖胺供体接触而用PEG化的N-乙酰半乳糖胺残基衍生化的。

在另一个示例性的实施方案中,本发明提供了用于修饰干扰素α-14C(IFNα14C)的方法,如图30A~30N所示。IFNα的各种形式在别处公开。在图30B中,将在哺乳动物细胞中表达的IFNα14C首先用唾液酸酶处理以修剪其上的唾液酸单位,然后用ST3Gal3和PEG化的唾液酸供体对该分子进行PEG化。在图30C中,使N-乙酰葡糖胺首先添加到在昆虫或真菌细胞中表达的IFNα14C上,该反应是通过利用N-乙酰葡糖胺供体的GnT-I和/或II的作用进行的。然后用半乳糖基转移酶和PEG-半乳糖供体对该多肽进行PEG化。在图30D中,使在酵母中表达的IFNα14C首先用Endo-H处理以修剪其上的糖基单位。用半乳糖基转移酶和半乳糖供体对该分子进行半乳糖基化,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图30F中,用ST3Gal3和PEG-唾液酸供体对由哺乳动物细胞产生的IFNα14C进行修饰以使其具有(inched)PEG部分。在图30G中,首先用一种或多种GnT-I、II、IV和V和N-乙酰葡糖胺供体将N-乙酰葡糖胺添加到在昆虫或真菌细胞中表达的IFNα14C中。随后用适当的供体和半乳糖基转移酶对该蛋白质进行半乳糖基化。然后用ST3Gal3和PEG-唾液酸供体对IFNα14C进行PEG化。在图30H中,首先用甘露糖苷酶处理酵母产生的IFNα14C以修剪甘露糖基基团。然后用N-乙酰葡糖胺供体和一种或多种GnT-I、II、IV和V添加N-乙酰葡糖胺。进一步用适当的供体和半乳糖基转移酶对IFNα14C进行半乳糖基化。然后,用ST3Gal3和PEG-唾液酸供体对该多肽进行PEG化。在图30I中,通过用唾液酸供体对适当的末端残基进行加帽而修饰NSO细胞表达的IFNα14C,其中该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图30J中,用PEG-唾液酸供体和α2,8-唾酸转移酶对由哺乳动物细胞表达的IFNα14C进行PEG化。在图30K中,首先用唾液酸酶处理由哺乳动物细胞产生的IFNα14C以修剪末端唾液酸残基,然后用反式唾液酸酶和PEG化的唾液酸-乳糖复合物对该分子进行PEG化。在图30L中,用唾液酸供体和α2,8-唾酸转移酶对由哺乳动物系统表达的IFNα14C进行唾液酸化。在图30M中,首先用适当的供体和GnT-I和/或II将N-乙酰葡糖胺添加到在昆虫或真菌细胞中表达的IFNα14C中。然后使该分子与半乳糖基转移酶和半乳糖供体接触,该半乳糖供体是通过连接体用反应性唾液酸衍生化的,从而该多肽可通过连接体和半乳糖残基附着到反应性唾液酸上。然后使该多肽与ST3Gal1和运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。在图30N中,首先用内切聚糖酶处理昆虫或真菌细胞中表达的IFNα14C以修剪糖基基团,然后使其与半乳糖基转移酶和半乳糖供体接触,该半乳糖供体是通过连接体用反应性唾液酸衍生化的,从而该多肽可通过连接体和半乳糖残基附着到反应性唾液酸上。然后使该分子与ST3Gal3和运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。

在另一个示例性的实施方案中,本发明提供了用于修饰干扰素α-2a或2b(IFNα)的方法,如图30O~30EE所示。在图30P中,将在哺乳动物细胞中表达的IFNα首先用唾液酸酶处理以修剪糖基单位,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。在图30Q中,首先用适当的供体和半乳糖基转移酶对在昆虫细胞中表达的IFNα进行半乳糖基化,然后用ST3Gal1和PEG化的唾液酸供体对其进行PEG化。图30R提供了在细菌中重构IFNα的另一种方法:用适当的供体和N-乙酰半乳糖胺转移酶将PEG化的N-乙酰半乳糖胺添加到蛋白质中。在图30S中,通过用唾液酸供体对适当的末端残基进行加帽而修饰在哺乳动物细胞中表达的IFNα,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图30T中,用以合成而不是水解方式发挥功能的修饰的酶内切-N-乙酰半乳糖胺酶和用PEG部分衍生化的N-乙酰半乳糖胺供体对细菌表达的IFNα进行PEG化。在图30U中,首先用适当的供体和N-乙酰半乳糖胺转移酶将N-乙酰半乳糖胺添加到IFNα中,然后用唾酸转移酶和PEG化的唾液酸供体对其进行PEG化。在图30V中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNα以修剪唾液酸残基,然后用适当的供体和ST3Gal1和/或ST3Gal3对其进行PEG化。在图30W中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNα以修剪唾液酸残基。然后使该多肽与ST3Gal1和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。随后使该多肽与ST3Gal3和运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。在图30Y中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNα以修剪唾液酸残基,然后用ST3Gal1和PEG-唾液酸供体对其进行PEG化。在图30Z中,用半乳糖基转移酶和PEG化的半乳糖供体对由昆虫细胞产生的IFNα进行PEG化。在图30AA中,首先用适当的供体和N-乙酰半乳糖胺转移酶将N-乙酰半乳糖胺添加到细菌表达的IFNα中。然后用唾酸转移酶和PEG-唾液酸供体对该蛋白质进行PEG化。在图30CC中,细菌中表达的IFNα是以另一个程序修饰的:即用PEG化的N-乙酰半乳糖胺供体通过N-乙酰半乳糖胺转移酶将PEG化的N-乙酰半乳糖胺添加到蛋白质中。在图30DD中,在细菌中表达的IFNα是以另一种方案重构的。首先使该多肽与N-乙酰半乳糖胺转移酶和用反应性唾液酸通过连接体衍生化的N-乙酰半乳糖胺供体接触,从而IFNα通过连接体和N-乙酰半乳糖胺附着到反应性唾液酸上。然后使IFNα与ST3Gal3和脱唾液酸运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。然后用ST3Gal3和唾液酸供体对IFNα进行唾液酸残基加帽。修饰细菌表达的IFNα的额外方法在图30EE中公开,其中首先使IFNα暴露于NHS-CO-连接体-SA-CMP中,然后使其通过连接体与反应性唾液酸连接。随后用ST3Gal3和运铁蛋白使其与运铁蛋白缀合。

对IFNω进行重构的方法基本与此处对IFNα提供的方法相同,只是聚糖与IFNω肽的附着发生于SEQ ID NO:75的氨基酸残基101。IFNω的核苷酸和氨基酸序列在此处提供为SEQ ID NO:74和75。制备和应用IFNω的方法见美国专利No.4,917,887和5,317,089,以及欧洲专利No.0170204-A。

在另一个示例性的实施方案中,本发明提供了用于修饰干扰素β(IFNβ)的方法,如图31A~31S所示。在图31B中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNβ以修剪末端唾液酸残基。然后用ST3Gal3和PEG化的唾液酸供体对该蛋白质进行PEG化。图31C是修饰由昆虫细胞产生的IFNβ的方案。首先用适当的供体和GnT-I和/或-II将N-乙酰葡糖胺添加到IFNβ中。然后用半乳糖供体和半乳糖基转移酶对该蛋白质进行半乳糖基化。最后,用ST3Gal3和PEG-唾液酸供体对IFNβ进行PEG化。在图31D中,首先用Endo-H处理在酵母中表达的IFNβ以修剪其糖基链,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。在图31E中,由哺乳动物细胞产生的IFNβ是用ST3Gal3和已用PEG部分衍生化的唾液酸供体进行PEG化修饰的。在图31F中,首先用N-乙酰葡糖胺供体通过一种或多种GnT-I、II、IV和V将N-乙酰葡糖胺添加到在昆虫细胞中表达的IFNβ中,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图31G中,首先用甘露糖苷酶处理在酵母中表达的IFNβ以修剪甘露糖单位,然后用N-乙酰葡糖胺供体通过一种或多种GnT-I、II、IV和V添加N-乙酰葡糖胺。将该蛋白质进一步用半乳糖供体和半乳糖基转移酶进行半乳糖基化,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图31H中,通过用唾液酸供体对适当的末端残基进行加帽而修饰哺乳动物细胞表达的IFNβ,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图31I中,用PEG-唾液酸供体和α2,8-唾酸转移酶对哺乳动物系统中表达的IFNβ进行PEG化。在图31J中,首先用唾液酸酶处理由哺乳动物细胞表达的IFNβ以修剪末端唾液酸残基,然后用反式唾液酸酶和PEG化的唾液酸供体对其进行PEG化。在图31K中,首先用唾液酸酶处理哺乳动物细胞中表达的IFNβ以修剪末端唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。在图31L中,首先用唾液酸酶和半乳糖苷酶处理哺乳动物细胞中表达的IFNβ以修剪糖基链,然后用半乳糖供体和α-半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3或唾酸转移酶和PEG-唾液酸供体对其进行PEG化。在图31M中,首先用唾液酸酶处理哺乳动物细胞中表达的IFNβ以修剪糖基单位。然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。在图31N中,通过用唾液酸供体对适当的末端残基进行加帽而修饰哺乳动物细胞表达的IFNβ,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图31O中,用唾液酸供体和α2,8-唾酸转移酶对哺乳动物细胞中表达的IFNβ进行唾液酸化。在图31Q中,首先用N-乙酰葡糖胺供体通过一种或多种GnT-I、II、IV和V将N-乙酰葡糖胺添加到在昆虫细胞中表达的IFNβ中,并进一步用PEG-半乳糖供体和半乳糖基转移酶对其进行PEG化。在图31R中,首先用内切聚糖酶处理酵母中表达的IFNβ以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图31S中,首先使在哺乳动物系统中表达的IFNβ与ST3Gal3和两个通过连接体连接的反应性唾液酸接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。然后使该多肽与ST3Gal3和脱唾液酸化的运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。然后,进一步用唾液酸供体和ST3Gal3对IFNβ进行唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于修饰凝血因子VII或VIIa的方法,如图32A~32D所示。在图32B中,首先用唾液酸酶处理在哺乳动物系统中产生的凝血因子VII或VIIa以修剪末端唾液酸残基,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。在图32C中,首先用唾液酸酶处理在哺乳动物细胞中表达的凝血因子VII或VIIa以修剪末端唾液酸残基,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。进一步地,用ST3Gal3和唾液酸供体对该多肽进行唾液酸化。图32D提供了对由哺乳动物细胞产生的凝血因子VII或VIIa的另一种修饰方案:即首先用唾液酸酶和半乳糖苷酶处理该多肽以修剪其唾液酸和半乳糖残基,然后用半乳糖基转移酶和半乳糖供体对其进行半乳糖基化,且然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。

在另一个示例性的实施方案中,本发明提供了用于修饰凝血因子IX的方法,其一些例子包括于图33A~33G中。在图33B中,首先用唾液酸酶处理在哺乳动物细胞中产生的凝血因子IX以修剪末端唾液酸残基,然后以PEG-唾液酸为供体用ST3Gal3对其进行PEG化。在图33C中,首先用唾液酸酶处理在哺乳动物细胞中表达的凝血因子IX以修剪末端唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,并进一步用ST3Gal1和唾液酸供体对该多肽进行唾液酸化。在图33D中可发现对哺乳动物细胞产生的凝血因子IX进行重构的另一种方案。首先用唾液酸酶处理该多肽以修剪末端唾液酸残基,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,进一步用唾液酸供体和ST3Gal3对其进行唾液酸化,且然后用PEG化的唾液酸供体和ST3Gal1对其进行PEG化。在图33E中,在哺乳动物系统中表达的凝血因子IX是通过用PEG-唾液酸供体以ST3Gal3催化的唾液酸化过程而PEG化的。在图33F中,通过用唾液酸供体对适当的末端残基进行加帽而修饰哺乳动物细胞表达的凝血因子IX,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。图33G提供了修饰凝血因子IX的额外的方法。由哺乳动物细胞产生的该多肽是用PEG-唾液酸供体和α2,8-唾酸转移酶进行PEG化的。

在另一个示例性的实施方案中,本发明提供了用于修饰促卵泡激素(FSH)的方法。图34A~34J提供了一些例子。在图34B中,FSH是在哺乳动物系统中表达的并通过唾液酸酶处理来修饰以修剪末端唾液酸残基,随后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图34C中,首先用唾液酸酶处理在哺乳动物细胞中表达的FSH以修剪末端唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。图34D提供了修饰哺乳动物系统中表达的FSH的方案。用唾液酸酶和半乳糖苷酶处理该多肽以修剪其唾液酸和半乳糖残基,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图34E中,在哺乳动物细胞中表达的FSH是用下面的程序修饰的:即首先用唾液酸酶处理FSH以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。图34F提供了修饰由哺乳动物细胞产生的FSH的另一个例子:即通过用唾液酸供体对适当的末端残基进行加帽而修饰该多肽,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图34G中,表达于哺乳动物系统中的FSH是用另一种程序修饰的:即通过用唾液酸供体和α2,8-唾酸转移酶添加唾液酸而对该多肽进行重构。在图34H中,FSH是表达于昆虫细胞中的且用下面的程序进行修饰:即用适当的N-乙酰葡糖胺供体通过一种或多种GnT-I、II、IV和V将N-乙酰葡糖胺添加到FSH中;然后用PEG-半乳糖供体和半乳糖基转移酶对FSH进行PEG化。图34I描述了修饰由酵母产生的FSH的方案。根据该方案,首先用内切聚糖酶处理FSH以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图34J中,首先使在哺乳动物细胞中表达的FSH与ST3Gal3和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到反应性唾液酸上。然后使该多肽与ST3Gal1和在CHO中产生的脱唾液酸化的绒毛膜促性腺激素(CG)接触,从而使其通过唾液酸残基与CG连接。然后,用唾液酸供体和ST3Gal3和/或ST3Gal1对FSH进行唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于修饰促红细胞生成素(EPO)的方法。图35A~35AA提出了一些与重构野生型或突变的EPO肽相关的例子。在图35B中,EPO是在各种哺乳动物系统中表达的并通过使表达的蛋白质与唾液酸酶接触以除去末端唾液酸残基而进行重构。使结果所得的肽与唾酸转移酶和用PEG部分衍生化的CMP-唾液酸接触。在图35C中,在昆虫细胞中表达的EPO是用GnT-I和/或-II以N-乙酰葡糖胺进行重构的。然后用半乳糖基转移酶把半乳糖加到该肽上。PEG基团是通过使肽与唾酸转移酶和用PEG部分衍生化的CMP-唾液酸接触而添加到重构的肽上的。在图35D中,在哺乳动物细胞系统中表达的EPO是通过唾酸转移酶的作用去除末端唾液酸残基而进行重构的。N-连接的糖基基团的末端半乳糖残基是用ST3Gal3和唾液酸供体以唾液酸“加帽的”。用适当的唾液酸供体和ST3Gal1以携带有PEG部分的唾液酸对O-连接聚糖的末端半乳糖残基进行官能化。在图35E中,表达于哺乳动物细胞系统中的EPO是通过用PEG-衍生化的唾液酸部分对N-连接的糖基残基的官能化而重构的。使该肽与ST3Gal3和适当修饰的唾液酸供体接触。在图35F中,表达于昆虫细胞系统、酵母或真菌中的EPO是通过添加至少一个N-乙酰葡糖胺残基而重构的,这些N-乙酰葡糖胺残基是通过使肽与N-乙酰葡糖胺供体和一种或多种GnT-I、GnT-II和GnT-V接触而添加的。然后通过使该肽与PEG化的半乳糖供体和半乳糖基转移酶接触而对其进行PEG化。在图35G中,表达于昆虫细胞系统、酵母或真菌中的EPO是通过用适当的N-乙酰葡糖胺供体和一种或多种GnT-I、GnT-II和GnT-V添加至少一种N-乙酰葡糖胺残基而进行重构的。将改变为以合成而不是水解方式发挥功能的半乳糖苷酶用于将活化的PEG化半乳糖供体添加到N-乙酰葡糖胺残基上。在图35H中,将表达于昆虫细胞系统、酵母或真菌中的EPO通过添加至少一个末端N-乙酰葡糖胺-PEG残基进行重构。使肽与GnT-I和用PEG部分衍生化的适当N-乙酰葡糖胺供体进行接触。在图35I中,将表达于昆虫细胞系统、酵母或真菌中的EPO通过添加一个或多个末端半乳糖-PEG残基进行重构。使肽与GnT-I和用PEG部分衍生化的适当N-乙酰葡糖胺供体进行接触。然后使肽与半乳糖基转移酶和用PEG部分修饰的适当半乳糖供体进行接触。在图35J中,将表达于昆虫细胞系统、酵母或真菌中的EPO通过再添加一个末端唾液酸-PEG残基进行重构。使肽与适当N-乙酰葡糖胺供体和GnT-I进行接触。进一步使肽与半乳糖基转移酶和适当半乳糖供体进行接触。然后使肽与ST3Gal3和用PEG部分衍生化的适当唾液酸供体进行接触。在图35K中,将表达于昆虫细胞系统、酵母或真菌中的EPO通过添加末端唾液酸-PEG残基进行重构。使肽与适当N-乙酰葡糖胺供体和一个或多个GnT-I、GnT-II和GnT-V进行接触。然后使肽与半乳糖基转移酶和适当半乳糖供体进行接触。进一步使肽与ST3Gal3和用PEG部分衍生化的适当唾液酸供体进行接触。在图35L中,将表达于昆虫细胞系统、酵母或真菌中的EPO通过添加一个或多个末端α2,6-唾液酸-PEG残基进行重构。使肽与适当N-乙酰葡糖胺供体和一个或多个GnT-I、GnT-II和GnT-V进行接触。进一步使肽与半乳糖基转移酶和适当半乳糖供体进行接触。然后使肽与α2,6-唾酸转移酶和适当修饰的唾液酸供体进行接触。在图35M中,将表达于哺乳动物细胞系统中的EPO通过添加一个或多个末端唾液酸-PEG残基进行重构。使肽与唾液酸酶进行接触以除去末端唾液酸残基。进一步使肽与唾酸转移酶和适当的唾液酸供体进行接触。进一步使肽与唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35N中,将表达于哺乳动物细胞系统中的EPO通过添加一个或多个末端唾液酸-PEG残基进行重构。使肽与唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35O中将表达于哺乳动物细胞系统中的EPO通过向主要O-连接的聚糖添加一个或多个末端α2,8-唾液酸-PEG残基进行重构。使肽与α2,8-唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35P中,将表达于哺乳动物细胞系统中的EPO通过向O-连接的和N-连接的聚糖添加一个或多个末端α2,8-唾液酸-PEG残基进行重构。使肽与α2,8-唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35Q中,将表达于酵母或真菌中的EPO通过添加一个或多个末端唾液酸-PEG残基进行重构。使肽与甘露糖苷酶进行接触以除去末端甘露糖残基。下一步,使肽与GnT-I和适当的N-乙酰葡糖胺供体进行接触。进一步使肽与半乳糖基转移酶和适当的半乳糖供体进行接触。然后使肽与唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35R中,将表达于酵母或真菌中的EPO通过添加至少一个末端N-乙酰葡糖胺-PEG残基进行重构。使肽与甘露糖苷酶进行接触以除去末端甘露糖残基。然后使肽与GnT-I和用PEG部分衍生化的适当N-乙酰葡糖胺供体进行接触。在图35S中,将表达于酵母或真菌中的EPO通过添加一个或多个末端唾液酸-PEG残基进行重构。使肽与甘露糖苷酶-I进行接触以除去α2甘露糖残基。进一步使肽与GnT-I和适当的N-乙酰葡糖胺供体进行接触。然后使肽与半乳糖基转移酶和适当的半乳糖供体进行接触。然后使肽与唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35U中,将表达于酵母或真菌中的EPO通过添加一个或多个半乳糖-PEG残基进行重构。使肽与endo-H进行接触以修剪至糖基基团。然后使肽与半乳糖基转移酶和用PEG部分衍生化的适当半乳糖供体进行接触。在图35V中,将表达于酵母或真菌中的EPO通过添加一个或多个末端唾液酸-PEG残基进行重构。使肽与endo-H进行接触以修剪至糖基基团。进一步使肽与半乳糖基转移酶和适当的半乳糖供体进行接触。然后使肽与唾酸转移酶和用PEG部分衍生化的适当唾液酸供体进行接触。在图35W中,将表达于昆虫细胞系统中的EPO通过添加末端半乳糖-PEG残基进行重构。使肽与甘露糖苷酶进行接触以除去末端甘露糖残基。然后使肽与半乳糖基转移酶和用PEG部分衍生化的适当半乳糖供体进行接触。在图35Y中,将表达于NSO鼠骨髓瘤细胞中的称为“新型红细胞发生刺激蛋白质”或NESP的突变的EPO通过用唾液酸供体对适当的末端残基进行加帽而重构,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图35Z中,将表达于哺乳动物细胞系统中的突变EPO即NESP通过添加一个或多个末端唾液酸-PEG残基进行重构。应用PEG修饰的唾液酸和α2,8-唾酸转移酶将PEG添加到聚糖上的糖基残基上。在图35AA中,将表达于哺乳动物细胞系统中的NESP通过添加末端唾液酸残基进行重构。唾液酸是用唾液酸供体和α2,8-唾酸转移酶添加到糖基残基上的。

在另一个示例性的实施方案中,本发明提供了重构粒细胞巨噬细胞集落刺激因子(GM-CSF)的方法,如图36A~36K所示。在图36B中,首先用唾液酸酶处理在哺乳动物细胞中表达的GM-CSF以修剪唾液酸残基,随后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图36C中,首先用唾液酸酶处理在哺乳动物细胞中表达的GM-CSF以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后进一步用唾液酸供体和ST3Gal3和/或ST3Gal1对其进行唾液酸化。在图36D中,首先用唾液酸酶和α-半乳糖苷酶处理在NSO细胞中表达的GM-CSF以修剪糖基基团,然后用唾液酸供体和ST3Gal3对其进行唾液酸化,且然后用ST3Gal1和PEG-唾液酸供体对其进行PEG化。在图36E中,首先用唾液酸酶处理在哺乳动物细胞中表达的GM-CSF以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。在图36F中,通过用唾液酸供体对适当的末端残基进行加帽而修饰在哺乳动物细胞中表达的GM-CSF,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图36G中,表达于哺乳动物细胞中的GM-CSF是用唾液酸供体和α2,8-唾酸转移酶进行唾液酸化的。在图36I中,表达于昆虫细胞中的GM-CSF的修饰是通过用适当的供体和一种或多种GnT-I、II、IV和V添加N-乙酰葡糖胺,及随后用适当的供体和半乳糖基转移酶添加PEG化的半乳糖而进行的。在图36J中,首先用内切聚糖酶和/或甘露糖苷酶处理酵母表达的GM-CSF以修剪糖基单位,随后用半乳糖基转移酶和PEG-半乳糖供体对其进行PEG化。在图36K中,首先用唾液酸酶处理在哺乳动物细胞中表达的GM-CSF以修剪唾液酸残基,且随后用ST3Gal1和唾液酸供体对其进行唾液酸化。然后使该多肽与ST3Gal1和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。进一步使该多肽与ST3Gal3和运铁蛋白接触,从而使其与运铁蛋白连接。

在另一个示例性的实施方案中,本发明提供了用于修饰干扰素γ(IFNγ)的方法。图37A~37N含有一些例子。在图37B中,首先用唾液酸酶处理在各种哺乳动物细胞中表达的IFNγ以修剪末端唾液酸残基,随后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图37C中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNγ以修剪末端唾液酸残基。然后用ST3Gal3和PEG-唾液酸供体对该多肽进行PEG化,并进一步用ST3Gal3和唾液酸供体对其进行唾液酸化。在图37D中,首先用唾液酸酶和α-半乳糖苷酶处理哺乳动物细胞表达的IFNγ以修剪唾液酸和半乳糖残基。然后用半乳糖供体和半乳糖基转移酶对该多肽进行半乳糖基化。然后用PEG-唾液酸供体和ST3Gal3对IFNγ进行PEG化。在图37E中,首先用唾液酸酶处理在哺乳动物系统中表达的IFNγ以修剪末端唾液酸残基。然后用ST3Gal3和PEG-唾液酸供体对该多肽进行PEG化,并进一步用ST3Gal3和唾液酸供体对其进行唾液酸化。图37F描述了修饰在哺乳动物系统中表达的IFNγ的另一种方法。通过用唾液酸供体对适当的末端残基进行加帽而修饰该蛋白质,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图37G中,表达于哺乳动物细胞中的IFNγ是通过用唾液酸供体和α2,8-唾酸转移酶添加唾液酸而进行重构的。在图37I中,表达于昆虫或真菌细胞中的IFNγ是通过用适当的供体和一种或多种GnT-I、II、IV和V添加N-乙酰葡糖胺而修饰的。该蛋白质进一步通过用PEG化的半乳糖供体和半乳糖基转移酶添加PEG部分而进行修饰。图37J提供了修饰在酵母中表达的IFNγ的方法。首先用内切聚糖酶处理该多肽以修剪糖链,随后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化。然后用PEG化的唾液酸供体和ST3Gal3对IFNγ进行PEG化。在图37K中,哺乳动物细胞产生的IFNγ是如下进行修饰的:首先使该多肽与ST3Gal3和唾液酸供体接触,该唾液酸供体是通过连接体用反应性半乳糖衍生化的,从而该多肽可通过连接体和唾液酸残基附着到反应性半乳糖上。然后使该多肽与半乳糖基转移酶和用内切聚糖酶预先处理的运铁蛋白接触,从而使其通过半乳糖残基与运铁蛋白连接。在由图37L描述的方案中,表达于哺乳动物系统中的IFNγ是通过ST3Gal3的作用而修饰的:即使PEG化的唾液酸从适当的供体转移到IFNγ上。图37M是修饰表达于昆虫或真菌细胞中的IFNγ的例子,其中多肽的PEG化是通过用GnT-I和/或II将PEG化的N-乙酰葡糖胺从供体转移到IFNγ上而实现的。在图37N中,表达于哺乳动物系统中的IFNγ是通过用适当的供体和α2,8-唾酸转移酶添加PEG化的唾液酸而重构的。

在另一个示例性的实施方案中,本发明提供了用于修饰α1抗胰蛋白酶(α1-蛋白酶抑制剂)的方法。一些这种例子可发现于图38A~38O中。在图38B中,首先用唾液酸酶处理在各种哺乳动物细胞中表达的α1抗胰蛋白酶以修剪唾液酸残基。然后用适当的供体如CMP-SA-PEG和唾酸转移酶如ST3Gal3添加PEG化的唾液酸残基。图38C中示范了α1抗胰蛋白酶修饰的另一种方案。首先用唾液酸酶处理在哺乳动物系统中表达的α1抗胰蛋白酶以修剪唾液酸残基。然后用适当的供体和唾酸转移酶如ST3Gal3添加用PEG衍生化的唾液酸残基。随后,进一步通过用唾液酸供体和ST3Gal3添加唾液酸残基而修饰该分子。任选地,首先用唾液酸酶和α-半乳糖苷酶处理哺乳动物细胞表达的α1抗胰蛋白酶以修剪唾液酸和α-连接的半乳糖残基。然后用半乳糖基转移酶和适当的半乳糖供体对该多肽进行半乳糖基化。进一步地,通过利用PEG化的唾液酸供体的ST3Gal3作用添加用PEG衍生化的唾液酸。在图38D中,首先用唾液酸酶处理在哺乳动物系统中表达的α1抗胰蛋白酶,从而修剪末端唾液酸残基。然后通过ST3Gal3的作用将PEG添加到N-连接的糖基残基上,该ST3Gal3介导PEG化的唾液酸从供体如CMP-SA-PEG向α1抗胰蛋白酶的转移。随后用唾液酸供体和ST3Gal3附着了更多的唾液酸残基。图38E描述了重构α1抗胰蛋白酶的另一种方法。通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物细胞中的α1抗胰蛋白酶,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图38F中,公开了α1抗胰蛋白酶修饰的另外一个方法。从哺乳动物表达系统中获得的α1抗胰蛋白酶是通过用唾液酸供体和α2,8-唾酸转移酶添加唾液酸而进行重构的。在图38H中,α1抗胰蛋白酶是表达于昆虫或酵母细胞中的,且是通过使该多肽与UDP-N-乙酰葡糖胺和一种或多种GnT-I、II、IV或V接触以添加末端N-乙酰葡糖胺残基而进行重构的。然后,利用PEG化的半乳糖供体和半乳糖基转移酶以PEG部分对该多肽进行修饰。在图38I中,首先用内切聚糖酶处理在酵母细胞中表达的α1抗胰蛋白酶以修剪糖链。然后用半乳糖基转移酶和半乳糖供体对其进行半乳糖基化。然后,用ST3Gal3和PEG-唾液酸供体对该多肽进行PEG化。在图38J中,α1抗胰蛋白酶是在哺乳动物系统中表达的。首先使该多肽与ST3Gal3和唾液酸供体接触,该唾液酸供体是通过连接体用反应性半乳糖衍生化的,从而该多肽可通过连接体和唾液酸残基附着到反应性半乳糖上。然后使该多肽与半乳糖基转移酶和用内切聚糖酶预先处理的运铁蛋白接触,从而使其通过半乳糖残基与运铁蛋白连接。在图38L中,首先用内切聚糖酶处理在酵母中表达的α1抗胰蛋白酶以修剪其糖基基团。然后用半乳糖基转移酶和具有PEG部分的半乳糖基供体对该蛋白质进行PEG化。在图38M中,用氨基己糖苷酶、甘露糖苷酶和木糖苷酶处理在植物细胞中表达的α1抗胰蛋白酶以修剪其糖基链,并随后用N-乙酰葡糖胺转移酶和适当的供体以用PEG部分衍生化的N-乙酰葡糖胺进行修饰。在图38N中,表达于哺乳动物细胞中的α1抗胰蛋白酶是通过用ST3Gal3和用PEG衍生化的唾液酸供体添加PEG化的唾液酸残基而修饰的。

在另一个示例性的实施方案中,本发明提供了用于修饰葡糖脑苷脂酶(β-葡糖苷酶、CerezymeTM或CeredaseTM)的方法,如图39A~39K所示。在图39B中,首先用唾液酸酶处理在哺乳动物系统中表达的CerezymeTM以修剪末端唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图39C中,首先用唾液酸酶处理在哺乳动物细胞中表达的CerezymeTM以修剪唾液酸残基,然后用ST3Gal3和用甘露糖-6-磷酸衍生化的反应性唾液酸来附着甘露糖-6-磷酸,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。任选地,首先用唾液酸酶和半乳糖苷酶处理NSO细胞表达的CerezymeTM以修剪糖基基团,然后用半乳糖供体和α-半乳糖基转移酶对其进行半乳糖基化。然后,甘露糖-6-磷酸部分可用ST3Gal3和用甘露糖-6-磷酸衍生化的反应性唾液酸添加到该分子上。在图39D中,首先用唾液酸酶处理在哺乳动物细胞中表达的CerezymeTM以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸对其进行唾液酸化。在图39E中,通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物细胞中的CerezymeTM,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如例如一种或多种甘露糖-6-磷酸基团的部分进行衍生化。在图39F中,表达于哺乳动物细胞中的CerezymeTM是用唾液酸供体和α2,8-唾酸转移酶进行唾液酸化的。在图39H中,用适当的供体和一种或多种GnT-I、II、IV和V向表达于昆虫细胞中的CerezymeTM中添加N-乙酰葡糖胺,然后用半乳糖基转移酶和PEG-半乳糖供体对其进行PEG化。在图39I中,首先用内切聚糖酶处理在酵母细胞中表达的CerezymeTM以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对该多肽进行PEG化。在图39JK中,首先使表达于哺乳动物细胞中的CerezymeTM与ST3Gal3和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。然后使该多肽与ST3Gal3和脱唾液酸化的运铁蛋白接触,从而使其与运铁蛋白连接。然后用唾液酸供体和ST3Gal3对该多肽进行唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于组织型血纤维蛋白溶酶原活化因子(TPA)及其突变体的修饰方法。在图40A~40W中给出了几个特定的修饰方案。图40B阐明了一种修饰程序:在TPA在哺乳动物细胞中表达之后,用一种或多种甘露糖苷酶和唾液酸酶对其进行处理以修剪甘露糖基和/或唾液酸残基。然后通过使多肽与适当的N-乙酰葡糖胺供体和一种或多种GnT-I、II、IV和V接触而添加末端N-乙酰葡糖胺。进一步用半乳糖供体和半乳糖基转移酶对TPA进行半乳糖基化。然后通过由ST3Gal3催化和用PEG部分衍生化的唾液酸供体的唾液酸化将PEG附着到该分子上。在图40C中,TPA是在昆虫或真菌细胞中表达的。该修饰包括以下步骤,即用适当的N-乙酰葡糖胺供体和GnT-I和/或II添加N-乙酰葡糖胺;用半乳糖供体和半乳糖基转移酶进行半乳糖基化;和通过用ST3Gal3和PEG部分衍生化的唾液酸供体的唾液酸化附着PEG。在图40D中,TPA是在酵母中表达的,并随后用内切聚糖酶对其进行处理以修剪糖链。该多肽进一步通过半乳糖基转移酶的作用而PEG化,该半乳糖基转移酶催化PEG-半乳糖从供体向TPA的转移。在图40E中,TPA是在昆虫或酵母细胞中表达的。然后用α-和β-甘露糖苷酶处理该多肽以修剪末端甘露糖残基。进一步地,PEG部分是通过PEG-半乳糖从适当的供体向TPA的转移而附着到该分子上的,该转移是由半乳糖基转移酶介导的。图40F提供了对从昆虫或酵母系统中获得的TPA进行修饰的不同方法:对该多肽的重构为用N-乙酰葡糖胺供体和GnT-I和/或II添加N-乙酰葡糖胺,随后用半乳糖基转移酶和PEG化的半乳糖供体对其进行PEG化。图40G提供了对表达于昆虫或酵母细胞中的TPA进行重构的另一种方案。末端N-乙酰葡糖胺是用N-乙酰葡糖胺供体和GnT-I和/或II添加的。将修饰为以合成而不是水解方式发挥功能的半乳糖苷酶用于将PEG化的半乳糖从适当的供体添加到N-乙酰葡糖胺残基上。在图40I中,首先用唾液酸酶和半乳糖苷酶处理表达于哺乳动物系统中的TPA以修唾液酸和半乳糖残基。通过用唾液酸供体对适当的末端残基进行加帽而进一步修饰该多肽,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图40J中,表达于哺乳动物系统中的TPA是根据下面的方案重构的:首先,用α-和β-甘露糖苷酶处理该多肽以修剪末端甘露糖残基;然后用唾液酸供体和ST3Gal3将唾液酸残基附着到末端半乳糖残基上;进一步地,TPA通过由半乳糖基转移酶催化的PEG化半乳糖从供体向N-乙酰葡糖胺残基转移而PEG化。在图40K中,TPA是在植物系统中表达的。在该例子中的修饰程序如下:首先用氨基己糖苷酶、甘露糖苷酶和木糖苷酶处理TPA以修剪其糖基基团;然后用适当的供体和N-乙酰葡糖胺转移酶将PEG化的N-乙酰葡糖胺添加到TPA中。在图40M中,对表达于哺乳动物细胞中的TPA突变体(TNK TPA)进行了重构。首先用唾液酸酶修剪末端唾液酸残基;然后将ST3Gal3用于将PEG化的唾液酸从供体向TNK TPA转移,从而使该多肽PEG化。在图40N中,首先用唾液酸酶处理表达于哺乳动物系统中的TNK TPA以修剪末端唾液酸残基。然后用CMP-SA-PEG作为供体和ST3Gal3将该蛋白质PEG化,并进一步用唾液酸供体和ST3Gal3对其进行唾液酸化。在图40O中,首先用唾液酸酶和α-半乳糖苷酶处理NSO细胞表达的TNK TPA以修剪末端唾液酸和半乳糖残基。然后用半乳糖供体和半乳糖基转移酶对TNK TPA进行半乳糖基化。该重构方案中的最后步骤是用唾酸转移酶如ST3Gal3将PEG部分衍生化的唾液酸从供体转移到TNK TPA中。在图40Q中,TNK TPA是在哺乳动物系统中表达的,且首先用唾液酸酶对其进行处理以修剪末端唾液酸残基。然后用ST3Gal3和PEG化的唾液酸供体对该蛋白质进行PEG化。然后用唾液酸供体和ST3Gal3对该蛋白质进行唾液酸化。在图40R中,通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物系统中的TNK TPA,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图40S中,表达于哺乳动物细胞中的TNK TPA是通过不同的方法修饰的:该多肽是通过用唾液酸供体和α2,8-唾酸转移酶添加唾液酸而进行重构的。在图40U中,表达于昆虫细胞中的TNK TPA是通过用适当的供体和一种或多种GnT-I、II、IV和V添加N-乙酰葡糖胺而进行重构的。该蛋白质进一步通过用PEG化的半乳糖供体和半乳糖基转移酶添加PEG部分而进行修饰。在图40V中,TNK TPA是在酵母中表达的。首先用内切聚糖酶处理该多肽以修剪其糖基链,然后用PEG衍生化的半乳糖供体和半乳糖基转移酶对其进行PEG化。在图40W中,TNK TPA是在哺乳动物系统中产生的。首先使该多肽与ST3Gal3和唾液酸供体接触,该唾液酸供体是通过连接体用反应性半乳糖衍生化的,从而该多肽可通过连接体和唾液酸残基附着到反应性半乳糖上。然后使该多肽与半乳糖基转移酶和CHO中产生的抗-TNF IG嵌合体接触,从而使其通过半乳糖残基与嵌合体连接。

在另一个示例性的实施方案中,本发明提供了用于修饰白细胞介素-2(IL-2)的方法。图41A~41G提供了一些例子。图41B提供了两步骤的修饰方案:首先用唾液酸酶处理由哺乳动物细胞产生的IL-2以修剪末端唾液酸残基,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。在图41C中,昆虫细胞表达的IL-2是首先用半乳糖供体和半乳糖基转移酶的半乳糖基化进行修饰的。随后用ST3Gal3和PEG化的唾液酸供体对IL-2进行PEG化。在图41D中,在细菌中表达的IL-2是用适当的供体和N-乙酰葡糖胺转移酶以N-乙酰葡糖胺修饰的,随后为用PEG-唾液酸供体和唾酸转移酶的PEG化步骤。图41E提供了修饰由哺乳动物系统产生的IL-2的另一种方案。通过用唾液酸供体对适当的末端残基进行加帽而修饰该多肽,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。图41F阐明了对由大肠杆菌表达的IL-2进行重构的例子。该多肽是用PEG基团衍生化的反应性N-乙酰葡糖胺复合物和一种酶进行PEG化的,其中对该酶进行了修饰从而它的功能为合成酶而不是水解酶。在图41G中,由细菌表达的IL-2是通过用适当的供体和N-乙酰半乳糖胺转移酶添加PEG化的N-乙酰半乳糖胺而修饰的。

在另一个示例性的实施方案中,本发明提供了用于修饰凝血因子VIII的方法,如图42A~42N所示。在图42B中,首先用唾液酸酶处理在哺乳动物细胞中表达的凝血因子VIII以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图42C中,首先用唾液酸酶处理在哺乳动物细胞中表达的凝血因子VIII以修剪唾液酸残基,然后用ST3Gal3和适当的供体对其进行PEG化,并进一步用ST3Gal1和唾液酸供体对其进行唾液酸化。

在图42E中,哺乳动物细胞产生的凝血因子VIII是通过用ST3Gal3和PEG化的唾液酸供体进行的一步PEG化修饰的。图42F提供了修饰表达于哺乳动物细胞中的凝血因子VIII的另一个例子。该蛋白质是用ST3Gal1和PEG化的唾液酸供体PEG化的。在图42G中,哺乳动物细胞表达的凝血因子VIII是根据下面的方案重构的:即用α2,8-唾酸转移酶和PEG-唾液酸供体对其进行PEG化。在图42I中,通过用唾液酸供体对适当的末端残基进行加帽而修饰由哺乳动物细胞表达的凝血因子VIII,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图42J中,首先将哺乳动物细胞表达的凝血因子VIII用Endo-H处理,以修剪至糖基基团。然后用半乳糖基转移酶和PEG-半乳糖供体进行PEG化。在图42K中,首先用ST3Gal3和唾液酸供体对表达于哺乳动物系统中的凝血因子VIII进行唾液酸化,然后用Endo-H处理以修剪糖基基团,然后用半乳糖基转移酶和PEG-半乳糖供体进行PEG化。在图42L中,首先用甘露糖苷酶处理表达于哺乳动物系统中的凝血因子VIII以修剪末端甘露糖残基,然后用适当的供体和GnT-I和/或II添加N-乙酰葡糖胺基团,然后用半乳糖基转移酶和PEG-半乳糖供体进行PEG化。在图42M中,首先用甘露糖苷酶处理表达于哺乳动物细胞中的凝血因子VIII以修剪甘露糖单位,然后用N-乙酰葡糖胺转移酶和适当的供体添加N-乙酰葡糖胺基团。进一步用半乳糖基转移酶和半乳糖供体进行半乳糖基化,然后用ST3Gal3和唾液酸供体进行唾液酸化。在图42N中,由哺乳动物细胞产生凝血因子VIII并进行如下修饰:首先用甘露糖苷酶处理以修剪末端甘露糖残基。然后用GnT-I和适当的PEG化N-乙酰葡糖胺供体添加PEG化的N-乙酰葡糖胺基团。

在另一个示例性的实施方案中,本发明提供了用于修饰尿激酶的方法,如图43A~43M所示。在图43B中,首先用唾液酸酶处理在哺乳动物细胞中表达的尿激酶以修剪唾液酸残基,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化。在图43C中,首先用唾液酸酶处理在哺乳动物细胞中表达的尿激酶以修剪唾液酸残基,然后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。任选地,首先用唾液酸酶和半乳糖苷酶处理哺乳动物系统中表达的尿激酶以修剪糖基链,然后用半乳糖供体和α-半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3或唾酸转移酶和PEG-唾液酸供体对其进行PEG化。在图43D中,首先用唾液酸酶处理在哺乳动物细胞中表达的尿激酶以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且进一步用ST3Gal3和唾液酸供体对其进行唾液酸化。在图43E中,通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物细胞中的尿激酶,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图43F中,表达于哺乳动物细胞中的尿激酶是用唾液酸供体和α2,8-唾酸转移酶进行唾液酸化的。在图43H中,表达于昆虫细胞中的尿激酶是用下面的步骤修饰的:首先,用适当的N-乙酰葡糖胺供体和一种或多种GnT-I、II、IV和V向该多肽中添加N-乙酰葡糖胺;然后用半乳糖基转移酶和PEG-半乳糖供体添加PEG化的半乳糖。在图43I中,首先用内切聚糖酶处理表达于酵母中的尿激酶以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体进行PEG化。在图41J中,首先使表达于哺乳动物细胞中的尿激酶与ST3Gal3和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。然后使该多肽与ST3Gal1和哺乳动物细胞中产生的脱唾液酸化尿激酶接触,从而使其与第二个尿激酶分子连接。然后进一步用唾液酸供体和ST3Gal1和/或ST3Gal3对整个分子进行唾液酸化。在图43K中,首先用磺基水解酶(sulfohydrolase)处理分离的尿激酶以去除硫酸基团,然后用唾酸转移酶和PEG-唾液酸供体对其进行PEG化。在图43LM中,首先用磺基水解酶和氨基己糖苷酶处理分离的尿激酶以去除硫酸基团和己糖胺基团,然后用半乳糖基转移酶和PEG-半乳糖供体对其进行PEG化。

在另一个示例性的实施方案中,本发明提供了用于修饰DNase I的方法,如图44A~44J所示。在图44B中,DNase I是在哺乳动物系统中表达的并用下面的步骤进行修饰:首先,用唾液酸酶处理该蛋白质以修剪唾液酸残基;然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图44C中,首先用唾液酸酶处理在哺乳动物细胞中表达的DNase I以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。任选地,首先使哺乳动物系统中表达的DNase I暴露于唾液酸酶和半乳糖苷酶中以修剪糖基基团,然后用半乳糖供体和α-半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3或唾酸转移酶和PEG-唾液酸供体对其进行PEG化。在图44D中,首先用唾液酸酶处理在哺乳动物细胞中表达的DNase I以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。在图44E中,通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物细胞中的DNase I,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图44F中,表达于哺乳动物细胞中的DNase I是用唾液酸供体和α2,8-唾酸转移酶进行唾液酸化的。在图44H中,首先用适当的供体和一种或多种GnT-I、II、IV和V向表达于昆虫细胞中的DNase I添加N-乙酰葡糖胺。然后用半乳糖基转移酶和PEG-半乳糖供体对该蛋白质进行PEG化。在图44I中,首先用内切聚糖酶处理在酵母中表达的DNase I以修剪糖基单位,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图44JK中,首先使表达于哺乳动物细胞中的DNase I与ST3Gal3和两个通过连接体连接的反应性唾液酸残基接触,从而将该多肽通过连接体和第二个唾液酸残基附着到一个反应性唾液酸上。然后使该多肽与ST3Gal1和脱唾液酸化的α-1-蛋白酶抑制剂接触,从而使其通过唾液酸残基与该抑制剂连接。然后,进一步用适当的供体和ST3Gal1和/或ST3Gal3对该多肽进行唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于修饰突变后含有N-糖基化位点的胰岛素的方法,如图45A~45L所示。在图45B中,首先用唾液酸酶处理在哺乳动物系统中表达的胰岛素以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图45C中,表达于昆虫细胞中的胰岛素是通过用适当的供体和GnT-I和/或II添加PEG化的N-乙酰葡糖胺而修饰的。在图45D中,首先用Endo-H处理在酵母中表达的胰岛素以修剪糖基基团,然后用半乳糖基转移酶和PEG-半乳糖供体对其进行PEG化。在图45F中,首先用唾液酸酶处理在哺乳动物细胞中表达的胰岛素以修剪唾液酸残基,然后用ST3Gal1和PEG-唾液酸供体对其进行PEG化。在图45G中,表达于昆虫细胞中的胰岛素是通过用适当的供体和半乳糖基转移酶添加PEG化的半乳糖而修饰的。在图45H中,首先用适当的供体和N-乙酰半乳糖胺转移酶向表达于细菌中的胰岛素添加N-乙酰半乳糖胺。然后用唾酸转移酶和PEG-唾液酸供体对该多肽进行PEG化。在图45J中,表达于细菌中的胰岛素是通过不同的方法修饰的:即用适当的供体和N-乙酰半乳糖胺转移酶向蛋白质添加PEG化的N-乙酰半乳糖胺。在图45K中,表达于细菌中的胰岛素是根据另一个方案修饰的:首先使该多肽与N-乙酰半乳糖胺转移酶和反应性N-乙酰半乳糖胺接触,该N-乙酰半乳糖胺是通过连接体用反应性唾液酸衍生化的,从而该多肽可通过连接体和N-乙酰半乳糖胺附着在反应性唾液酸上。然后使该多肽与ST3Gal3和脱唾液酸化运铁蛋白接触,因此可与运铁蛋白连接,然后用ST3Gal3和唾液酸供体使该多肽唾液酸化。在图45L中,表达于细菌中的胰岛素是用另外一个方法修饰的:首先使该多肽暴露于NHS-CO-连接体-SA-CMP中并通过连接体与反应性唾液酸残基连接。然后用ST3Gal3和脱唾液酸化运铁蛋白使该多肽与运铁蛋白缀合。然后进一步用ST3Gal3和唾液酸供体使该多肽唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于修饰乙型肝炎B抗原(M抗原-preS和S)的方法,如图46A~46K所示。在图46B中,M-抗原是表达于哺乳动物系统中的并通过最初用唾液酸酶处理以修剪末端唾液酸残基和随后用ST3Gal3和通过连接体与脂质A连接的反应性唾液酸使其与脂质A缀合而修饰。在图46C中,首先用唾液酸酶处理在哺乳动物细胞中表达的M-抗原以修剪末端唾液酸残基,然后用ST3Gal1和通过连接体与毒素连接的反应性唾液酸残基使其与破伤风毒素进行缀合,且然后用ST3Gal3和唾液酸供体对其进行唾液酸化。在图46D中,首先用半乳糖苷酶处理哺乳动物系统中表达的M-抗原以修剪半乳糖基残基,然后用ST3Gal3和唾液酸供体对其进行唾液酸化。然后用ST3Gal1和适当的供体向该多肽添加用KLH衍生化的唾液酸。在图46E中,首先用甘露糖苷酶处理酵母表达的M-抗原以修剪甘露糖基残基,然后用GnT-I和与白喉毒素连接的N-乙酰葡糖胺供体使其与白喉毒素缀合。在图46F中,通过用唾液酸供体对适当的末端残基进行加帽而修饰哺乳动物细胞表达的M-抗原,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到肽的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图46G中,从哺乳动物系统中获得的M-抗原是通过用唾液酸供体和聚α2,8-唾酸转移酶进行唾液酸化而重构的。在图46I中,表达于昆虫细胞中的M-抗原是用GnT-II和适当的与奈瑟球菌属(Neisseria)蛋白质连接的N-乙酰葡糖胺供体而与奈瑟球菌属蛋白质缀合的。在图46J中,首先用内切聚糖酶处理在酵母中表达的M-抗原以修剪糖基链,然后用半乳糖基转移酶和适当的与奈瑟球菌属蛋白质连接的半乳糖供体使其与奈瑟球菌属蛋白质缀合。图46K是修饰在酵母中表达的M-抗原的另一个例子。首先用甘露糖苷酶处理该多肽以修剪末端甘露糖基残基,然后用GnT-I和/或II向其添加N-乙酰葡糖胺。随后,用半乳糖供体和半乳糖基转移酶使该多肽半乳糖基化,然后用唾酸转移酶和唾液酸供体对其用唾液酸残基进行加帽。

在另一个示例性的实施方案中,本发明提供了用于修饰人生长激素(N,V及其变体)的方法,如图47A~47K所示。在图47B中,首先用唾液酸酶处理由哺乳动物细胞产生的人生长激素以修剪末端唾液酸残基并随后用ST3Gal3和PEG化的唾液酸供体对其进行PEG化,该人生长激素是突变后含有N-连接位点的或是具有N-连接位点的天然存在的同工型(即胎盘酶)。在图47C中,表达于昆虫细胞中的人生长激素是通过用GnT-I和/或II和适当的PEG化的N-乙酰葡糖胺供体添加PEG化的N-乙酰葡糖胺而修饰的。在图47D中,人生长激素在酵母中表达,用Endo-H进行处理以修剪糖基基团,并进一步用半乳糖基转移酶和PEG化的半乳糖供体进行PEG化。在图47F中,表达于哺乳动物系统中的人生长激素-粘蛋白融合蛋白质通过最初用唾液酸酶处理以修剪唾液酸残基和随后用PEG-唾液酸供体和ST3Gal1对其进行PEG化而修饰。在图47G中,表达于昆虫细胞中的人生长激素-粘蛋白融合蛋白质是通过用半乳糖基转移酶和PEG化的半乳糖供体进行PEG化而重构的。在图47H中,人生长激素-粘蛋白融合蛋白质是在细菌中产生的。首先用N-乙酰半乳糖胺供体通过N-乙酰半乳糖胺转移酶的作用将N-乙酰半乳糖胺添加到融合蛋白质中,随后用PEG-唾液酸供体和唾酸转移酶对该融合蛋白质进行PEG化。图47I描述了修饰细菌表达的人生长激素-粘蛋白融合蛋白质的另一个方案:用PEG化的N-乙酰半乳糖胺供体通过N-乙酰半乳糖胺转移酶的作用对该融合蛋白质进行PEG化。图47J提供了对人生长激素-粘蛋白融合蛋白质进一步的重构方案。首先使该融合蛋白质与N-乙酰半乳糖胺转移酶和N-乙酰半乳糖胺供体接触,该N-乙酰半乳糖胺供体是通过连接体用反应性唾液酸衍生化的,从而该融合蛋白质可通过连接体和N-乙酰半乳糖胺附着在反应性唾液酸上。然后使该融合蛋白质与唾酸转移酶和脱唾液酸化运铁蛋白接触,因此使其通过唾液酸残基与运铁蛋白连接。然后,用ST3Gal3和唾液酸供体对融合蛋白质用唾液酸残基进行加帽。在图47K中,提供了修饰细菌中产生的人生长激素(N)的另一种方案。首先使该多肽与NHS-CO-连接体-SA-CMP接触并通过连接体与反应性唾液酸偶联。然后使该多肽与ST3Gal3和脱唾液酸化运铁蛋白接触并使该多肽通过唾液酸残基与运铁蛋白缀合。然后用ST3Gal3和唾液酸供体使该多肽唾液酸化。

在另一个示例性的实施方案中,本发明提供了用于修饰TNF受体IgG融合蛋白质(TNFR-IgG或EnbrelTM)的方法,如图48A~48G所示。图48B阐明了一种修饰程序,其中首先用唾液酸供体和唾酸转移酶ST3Gal1使在哺乳动物系统中表达的TNFR-IgG唾液酸化;然后用半乳糖供体和半乳糖基转移酶对融合蛋白质进行半乳糖基化;然后通过ST3Gal3和用PEG衍生化的唾液酸供体对融合蛋白质进行PEG化。在图48C中,首先用唾液酸酶处理在哺乳动物细胞中表达的TNFR-IgG以修剪唾液酸残基。随后通过在由ST3Gal1催化的反应中将PEG化的唾液酸从供体转移到融合蛋白质中而使PEG部分附着到TNFR-IgG上。在图48D中,TNFR-IgG是表达于哺乳动物系统中的并通过半乳糖基化程序添加PEG而修饰,该半乳糖基化程序是由半乳糖基转移酶用PEG-半乳糖供体介导的。在图48E中,TNFR-IgG是在哺乳动物系统中表达的。重构融合蛋白质的第一个步骤是用唾液酸供体和唾酸转移酶ST3Gal1添加O-连接的唾液酸残基。随后,用半乳糖基转移酶和适当的具有PEG部分的半乳糖供体向融合蛋白质中添加PEG化的半乳糖。在图48F中,通过用唾液酸供体对适当的末端残基进行加帽而修饰表达于哺乳动物细胞中的TNFR-IgG,该唾液酸供体是用乙酰丙酸修饰的,从而在唾液酸供体上添加了反应性的酮。在添加到融合蛋白质的糖基残基上之后,该酮用如肼-或胺-PEG的部分进行衍生化。在图48G中,表达于哺乳动物细胞中的TNFR-IgG是用α2,8-唾酸转移酶进行重构的,该酶催化将PEG化的唾液酸从具有PEG部分的唾液酸供体转移到融合蛋白质的反应。

在另一个示例性的实施方案中,本发明提供了用于生成HerceptinTM缀合物的方法,如图49A~49D所示。在图49B中,HerceptinTM是表达于哺乳动物系统中的,并首先用半乳糖供体和半乳糖基转移酶进行半乳糖基化。然后通过利用反应性唾液酸-毒素复合物的ST3Gal3的作用使HerceptinTM通过唾液酸与毒素缀合。在图49C中,使哺乳动物细胞或真菌中产生的HerceptinTM通过半乳糖基化过程与毒素缀合,该半乳糖基化过程应用半乳糖基转移酶和反应性半乳糖-毒素复合物。图49D含有制备HerceptinTM缀合物的另一种方案:首先用Endo-H处理在真菌中产生的HerceptinTM以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后通过唾液酸化使其与放射性同位素缀合,该唾液酸化应用ST3Gal3和反应性唾液酸-放射性同位素复合物。可选择地,反应性唾液酸部分可以只附着螯合部分,然后可以在随后的阶段加载放射性同位素。

在另一个示例性的实施方案中,本发明提供了用于制备SynagisTM缀合物的方法,如图50A~50D所示。在图50B中,首先用半乳糖供体和半乳糖基转移酶对表达于哺乳动物细胞中的SynagisTM进行半乳糖基化,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图50C中,哺乳动物细胞或真菌中表达的SynagisTM是用半乳糖基转移酶和PEG-半乳糖供体进行PEG化的。在图50D中,首先用Endo-H处理在表达的SynagisTM以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。

在另一个示例性的实施方案中,本发明提供了用于生成RemicadeTM缀合物的方法,如图51A~51D所示。在图51B中,首先用半乳糖供体和半乳糖基转移酶对表达于哺乳动物细胞中的RemicadeTM进行半乳糖基化,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图51C中,在哺乳动物系统中表达的RemicadeTM是通过用适当的供体和半乳糖基转移酶添加PEG化的半乳糖而修饰的。在图51D中,首先用Endo-H处理在真菌中表达的RemicadeTM以修剪糖基基团,然后用半乳糖供体和半乳糖基转移酶对其进行半乳糖基化,且然后用ST3Gal3和用放射性同位素衍生化的反应性唾液酸使其与放射性同位素缀合。

在另一个示例性的实施方案中,本发明提供了用于修饰突变后含有N糖基化位点的Reopro的方法。图52A~52L含有这种例子。在图52B中,首先用唾液酸酶处理在哺乳动物系统中表达的Reopro以修剪唾液酸残基,然后用ST3Gal3和PEG-唾液酸供体对其进行PEG化。在图52C中,表达于昆虫细胞中的Reopro是通过用适当的供体和GnT-I和/或II添加PEG化的N-乙酰葡糖胺而修饰的。在图52D中,首先用Endo-H处理在酵母中表达的Reopro以修剪糖基基团。随后,用半乳糖基转移酶和PEG-半乳糖供体对该蛋白质进行PEG化。在图52F中,首先用唾液酸酶处理在哺乳动物细胞中表达的Reopro以修剪唾液酸残基,然后用ST3Gal1和PEG-唾液酸供体对其进行PEG化。在图52G中,表达于昆虫细胞中的Reopro是通过用半乳糖基转移酶和PEG-半乳糖供体进行的PEG化而修饰的。在图52H中,首先用N-乙酰半乳糖胺转移酶和适当的供体向表达于细菌中的Reopro添加N-乙酰半乳糖胺。然后用唾酸转移酶和PEG-唾液酸供体对该蛋白质进行PEG化。在图52J中,表达于细菌中的Reopro是通过不同的方案修饰的:即用PEG化的N-乙酰半乳糖胺供体通过N-乙酰半乳糖胺转移酶的作用对其进行PEG化。在图52K中,细菌表达的Reopro是用另外一个方法修饰的:首先,使该多肽与N-乙酰半乳糖胺转移酶和N-乙酰半乳糖胺供体接触,该N-乙酰半乳糖胺供体是通过连接体用反应性唾液酸衍生化的,从而该多肽可通过连接体和N-乙酰半乳糖胺附着在反应性唾液酸上。然后使该多肽与ST3Gal3和脱唾液酸化运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白连接。然后用适当的供体和ST3Gal3对该多肽用唾液酸残基进行加帽。图52L提供了修饰细菌表达的Reopro的额外的方案。首先使该多肽暴露于NHS-CO-连接体-SA-CMP中并使其通过连接体与反应性唾液酸连接。然后使该多肽与ST3Gal3和脱唾液酸化运铁蛋白接触,从而使其通过唾液酸残基与运铁蛋白缀合。然后用适当的供体和ST3Gal3对该多肽用唾液酸残基加帽。

在另一个示例性的实施方案中,本发明提供了用于生成RituxanTM缀合物的方法。图53A~53G提供了一些例子。在图53B中,首先用适当的半乳糖供体和半乳糖基转移酶对表达于各种哺乳动物系统中的RituxanTM进行半乳糖基化。然后用唾液酸供体和ST3Gal3以用毒素部分衍生化的唾液酸对该肽进行官能化。在图53C中,表达于哺乳动物细胞或真菌细胞中的RituxanTM是用半乳糖基转移酶和半乳糖供体进行半乳糖基化的,这给肽提供了含有药物部分的半乳糖。图53D提供了重构在真菌系统中表达的RituxanTM的另一个例子。首先用Endo-H修剪该多肽的糖基基团。然后用半乳糖基转移酶和半乳糖供体添加半乳糖。随后,通过放射性同位素复合的唾液酸供体和唾酸转移酶ST3Gal3使放射性同位素和该分子缀合。在图53F中,RituxanTM是表达于哺乳动物系统中的,并首先用半乳糖基转移酶和适当的半乳糖供体对其进行半乳糖基化;然后用ST3Gal3和PEG化的唾液酸供体使具有PEG部分的唾液酸附着。如在图53G中所示的,表达于真菌、酵母或哺乳动物细胞中的RituxanTM也可用下面的方法修饰:首先,用α-和β-甘露糖苷酶处理该多肽以除去末端甘露糖残基;然后用GnT-I和II和GlcNAc供体将GlcNAc附着于该分子上,然后通过半乳糖基化将放射性同位素附着在其上,该半乳糖基化应用半乳糖基转移酶和与能够结合放射性同位素的螯合部分偶联的半乳糖供体。

在另一个示例性的实施方案中,本发明提供了用于修饰抗凝血酶III(AT III)的方法。图54A~54O提供了一些例子。在图54B中,将表达于各种哺乳动物系统中的抗凝血酶III通过添加一个或多个末端唾液酸-PEG部分进行重构。首先使AT III分子与唾液酸酶接触以除去末端唾液酸部分。然后,使分子与唾酸转移酶和已用PEG部分衍生化的适当唾液酸供体接触。在图54C中,将表达于各种哺乳动物系统中的AT III通过添加唾液酸-PEG部分进行重构。使AT III分子与唾液酸酶接触以除去末端唾液酸部分。然后使分子与ST3Gal3和已用1.2mol当量的PEG部分衍生化的适当唾液酸供体接触。然后使分子与ST3Gal3和适当的唾液酸供体接触以对剩余的末端半乳糖部分进行加帽。在图54D中,将表达于NSO鼠骨髓瘤细胞中的AT III重构为具有复杂聚糖分子,该聚糖分子具有末端唾液酸-PEG部分。使AT III分子与唾液酸酶和α-半乳糖苷酶接触以除去末端唾液酸和半乳糖部分。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。然后使分子与ST3Gal3和已用PEG部分衍生化的适当唾液酸供体接触。在图54E中,将表达于各种哺乳动物系统中的AT III重构为具有基本完全的末端唾液酸-PEG部分。使AT III分子与唾液酸酶接触以除去末端唾液酸部分。然后使分子与ST3Gal3和已用16mol当量的PEG部分衍生化的适当唾液酸供体接触。然后使分子与ST3Gal3和适当的唾液酸供体接触以对剩余的末端半乳糖部分进行加帽。在图54F中,将表达于各种哺乳动物系统中的AT III通过添加一个或多个末端唾液酸-PEG部分进行重构。使AT III分子与ST3Gal3和已用乙酰丙酸部分衍生化的适当唾液酸供体接触。然后使分子与肼-PEG接触。在图54G中,将表达于各种哺乳动物系统中的AT III通过添加一个或多个末端聚α2,8-连接的唾液酸部分进行重构。使AT III分子与聚α2,8-唾酸转移酶和适当的唾液酸供体接触。在图54I中,将表达于昆虫、酵母或真菌细胞中的AT III通过添加分支的N-N-乙酰葡糖胺-PEG部分进行重构。使AT III分子与GnT-I和已用PEG衍生化的适当N-乙酰葡糖胺供体接触。在图54J中,将表达于酵母中的AT III通过除去高甘露糖聚糖结构和添加末端唾液酸-PEG部分进行重构。使AT III分子与内切聚糖酶接触以修剪糖基基团。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。然后使分子与ST3Gal3和已用PEG部分衍生化的适当唾液酸供体接触。在图54K中,将表达于各种哺乳动物系统中的AT III通过添加糖缀合的运铁蛋白进行重构。使AT III分子与ST3Gal3和已用连接体-半乳糖供体部分衍生化的适当唾液酸供体接触。然后使分子与半乳糖基转移酶和内切聚糖酶处理的运铁蛋白接触。在图54M中,将表达于酵母中的AT III通过除去高甘露糖聚糖结构和添加末端半乳糖-PEG部分进行重构。使分子与内切聚糖酶接触以修剪糖基基团。进一步使分子与半乳糖基转移酶和已用PEG部分衍生化的适当半乳糖供体接触。在图54N中,将表达于植物细胞中的AT III通过将聚糖结构转变为哺乳动物型复杂聚糖且然后添加一个或多个末端半乳糖-PEG部分进行重构。使AT III分子与木糖苷酶(xylosidase)接触以除去木糖残基。然后使分子与半乳糖基转移酶和已用PEG部分衍生化的适当半乳糖供体接触。在图54O中,将表达于各种哺乳动物系统中的AT III通过向末端半乳糖部分添加一个或多个末端唾液酸-PEG部分进行重构。使AT III分子与ST3Gal3和已用PEG衍生化的适当唾液酸PEG供体接触。

在另一个示例性的实施方案中,本发明提供了用于修饰人绒毛膜促性腺激素(hCG)的α和β亚基的方法。图55A~55J提供了一些例子。在图55B中,将表达于各种哺乳动物和昆虫系统中的hCG通过添加末端唾液酸-PEG部分进行重构。使hCG分子与唾液酸酶接触以除去末端唾液酸部分。然后,使分子与ST3Gal3和已用PEG部分衍生化的适当唾液酸供体接触。在图55C中,将表达于昆虫细胞、酵母或真菌系统中的hCG通过构建N-连接的聚糖和添加末端唾液酸-PEG部分进行重构。使hCG分子与GnT-I和GnT-II和适当的N-乙酰葡糖胺供体接触。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。进一步使分子与ST3Gal3和已用PEG部分衍生化的适当唾液酸供体接触。在图55D中,将表达于各种哺乳动物和昆虫系统中的hCG通过在O-连接的聚糖结构上添加一个或多个末端唾液酸-PEG部分进行重构。使hCG分子与唾液酸酶接触以除去末端唾液酸。然后使分子与ST3Gal3和适当的唾液酸供体接触,以用唾液酸部分对聚糖结构进行加帽。然后使分子与ST3Gal1和已用PEG部分衍生化的适当唾液酸供体接触。在图55E中,将表达于各种哺乳动物和昆虫系统中的hCG通过向N-连接的聚糖结构添加唾液酸-PEG部分进行重构。使hCG分子与ST3Gal3和已用PEG衍生化的适当唾液酸供体接触。在图55F中,将表达于昆虫细胞、酵母或真菌中的hCG通过添加末端N-乙酰葡糖胺-PEG分子进行重构。使hCG分子与GnT-I和GnT-II和已用PEG衍生化的适当N-乙酰葡糖胺供体接触。在图55G中,将表达于昆虫细胞、酵母或真菌中的hCG通过每个N-连接的聚糖结构添加不超过一个N-乙酰葡糖胺-PEG部分而进行重构。使hCG分子与GnT-I和已用PEG部分衍生化的适当N-乙酰葡糖胺供体接触。在图55H中,将表达于各种哺乳动物系统中的hCG通过向O-连接的聚糖结构添加一个或多个末端唾液酸-PEG部分进行重构。使hCG分子与ST3Gal3和已用PEG衍生化的适当唾液酸供体接触。在图55I中,将表达于各种哺乳动物系统中的hCG通过添加末端唾液酸-PEG部分进行重构。使hCG分子与α2,8-SA和已用PEG部分衍生化的适当唾液酸供体接触。在图55J中,将表达于各种哺乳动物系统中的hCG通过添加末端唾液酸部分进行重构。使hCG分子与聚α2,8-ST和已用PEG部分衍生化的适当唾液酸供体接触。

在另一个示例性的实施方案中,本发明提供了用于修饰α-半乳糖苷酶A(FabrazymeTM)的方法。图56A~56J提供了一些例子。在图56B中,将表达于并分泌自各种哺乳动物和昆虫系统中的α-半乳糖苷酶A通过添加一个或多个末端半乳糖-PEG-运铁蛋白部分进行重构。使α-半乳糖苷酶A分子与Endo-H接触以修剪糖基基团。然后,使分子与半乳糖基转移酶和已用PEG和运铁蛋白衍生化的适当半乳糖供体接触。在图56C中,将表达于并分泌自各种哺乳动物和昆虫细胞系统中的α-半乳糖苷酶A通过添加一个或多个末端唾液酸-连接体-甘露糖-6-磷酸部分进行重构。使α-半乳糖苷酶A分子与唾液酸酶接触以除去末端唾液酸部分。进一步使分子与ST3Gal3和已通过连接体缀合于甘露糖-6-磷酸的适当唾液酸供体接触。在图56D中,将表达于NSO鼠骨髓瘤细胞中的α-半乳糖苷酶A通过添加末端唾液酸-连接体-甘露糖-6-磷酸部分进行重构。使α-半乳糖苷酶A分子与唾液酸酶和α-半乳糖苷酶接触以除去末端唾液酸和半乳糖部分。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。然后使分子与唾酸转移酶和已通过连接体缀合于甘露糖-6-磷酸的适当唾液酸供体接触。在图56E中,将表达于并分泌自各种哺乳动物和昆虫细胞系统中的α-半乳糖苷酶A通过添加一个或多个末端唾液酸-PEG部分进行重构。使α-半乳糖苷酶A分子与唾液酸酶接触以除去末端唾液酸部分。然后使分子与唾酸转移酶和已用PEG部分衍生化的适当唾液酸供体接触。在图56F中,将表达于哺乳动物、昆虫、酵母或真菌系统中的α-半乳糖苷酶A通过添加一个或多个末端甘露糖-连接体-ApoE部分进行重构。使α-半乳糖苷酶A分子与甘露糖基转移酶和已通过连接体缀合于ApoE的适当甘露糖供体接触。在图56G中,将表达于哺乳动物、昆虫、酵母或真菌系统中的α-半乳糖苷酶A通过添加半乳糖-连接体-α2-巨球蛋白部分进行重构。使α-半乳糖苷酶A分子与Endo-H接触以修剪糖基基团。然后使分子与半乳糖基转移酶和已通过连接体缀合于α2-巨球蛋白的适当半乳糖供体接触。在图56H中,将表达于昆虫、酵母和真菌系统中的α-半乳糖苷酶A通过添加一个或多个N-乙酰葡糖胺-PEG-甘露糖-6-磷酸部分进行重构。使α-半乳糖苷酶A分子与GnT-I和已用PEG和甘露糖-6-磷酸衍生化的适当N-乙酰葡糖胺供体接触。在图56I中,将表达于昆虫、酵母或真菌系统中的α-半乳糖苷酶A通过添加一个或多个末端半乳糖-PEG-运铁蛋白部分进行重构。使α-半乳糖苷酶A分子与GnT-I和适当的N-乙酰葡糖胺供体接触。然后使分子与半乳糖基转移酶和已用PEG和运铁蛋白衍生化的适当半乳糖供体接触。在图56J中,将表达于昆虫、酵母或真菌系统中的α-半乳糖苷酶A通过添加一个或多个末端唾液酸-PEG-黑运铁蛋白(melanotransferrin)部分进行重构。使α-半乳糖苷酶A分子与GnT-I和GnT-II和适当的N-乙酰葡糖胺供体接触。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。然后使分子与唾酸转移酶和已用PEG和黑运铁蛋白衍生化的适当唾液酸供体接触。

在另一个示例性的实施方案中,本发明提供了用于修饰α-艾杜糖苷酶(AldurazymeTM)的方法。图57A~57J提供了一些例子。在图57B中,将表达于并分泌自各种哺乳动物和昆虫系统中的α-艾杜糖苷酶通过添加一个或多个末端半乳糖-PEG-运铁蛋白部分进行重构。使α-艾杜糖苷酶分子与Endo-H接触以修剪糖基基团。然后,使分子与半乳糖基转移酶和已用PEG和运铁蛋白衍生化的适当半乳糖供体接触。在图57C中,将表达于并分泌自各种哺乳动物和昆虫细胞系统中的α-艾杜糖苷酶通过添加末端唾液酸-连接体-甘露糖-6-磷酸部分进行重构。使α-艾杜糖苷酶分子与唾液酸酶接触以除去末端唾液酸部分。进一步使分子与ST3Gal3和已通过连接体缀合于甘露糖-6-磷酸的适当唾液酸供体接触。在图57D中,将表达于NSO鼠骨髓瘤细胞中的α-艾杜糖苷酶通过添加一个或多个末端唾液酸-连接体-甘露糖-6-磷酸部分进行重构。使α-艾杜糖苷酶分子与唾液酸酶和α-半乳糖苷酶接触以除去末端唾液酸和半乳糖部分。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。然后使分子与唾酸转移酶和已通过连接体缀合于甘露糖-6-磷酸的适当唾液酸供体接触。在图57E中,将表达于并分泌自各种哺乳动物和昆虫细胞系统中的α-艾杜糖苷酶通过添加一个或多个末端唾液酸-PEG部分进行重构。使α-艾杜糖苷酶分子与唾液酸酶接触以除去末端唾液酸部分。进一步使分子与唾酸转移酶和已用PEG部分衍生化的适当唾液酸供体接触。在图57F中,将表达于哺乳动物、昆虫、酵母或真菌系统中的α-艾杜糖苷酶通过添加一个或多个末端甘露糖-连接体-ApoE部分进行重构。使α-艾杜糖苷酶分子与甘露糖基转移酶和已通过连接体缀合于ApoE的适当甘露糖供体接触。在图57G中,将表达于哺乳动物、昆虫、酵母或真菌系统中的α-艾杜糖苷酶通过添加一个或多个半乳糖-连接体-α2-巨球蛋白部分进行重构。使α-艾杜糖苷酶分子与Endo-H接触以修剪糖基基团。然后使分子与半乳糖基转移酶和已通过连接体缀合于α2-巨球蛋白的适当半乳糖供体接触。在图57H中,将表达于昆虫、酵母和真菌系统中的α-艾杜糖苷酶通过添加一个或多个N-乙酰葡糖胺-PEG-甘露糖-6-磷酸部分进行重构。使α-艾杜糖苷酶分子与GnT-I和已用PEG和甘露糖-6-磷酸衍生化的适当N-乙酰葡糖胺供体接触。在图57I中,将表达于昆虫、酵母或真菌系统中的α-艾杜糖苷酶通过添加一个或多个末端半乳糖-PEG-运铁蛋白部分进行重构。使α-艾杜糖苷酶分子与GnT-I和适当的N-乙酰葡糖胺供体接触。然后使分子与半乳糖基转移酶和已用PEG和运铁蛋白衍生化的适当半乳糖供体接触。在图57J中,将表达于昆虫、酵母或真菌系统中的α-艾杜糖苷酶通过添加一个或多个末端唾液酸-PEG-黑运铁蛋白部分进行重构。使α-艾杜糖苷酶分子与GnT-I和GnT-II和适当的N-乙酰葡糖胺供体接触。然后使分子与半乳糖基转移酶和适当的半乳糖供体接触。进一步使分子与唾酸转移酶和已用PEG和黑运铁蛋白衍生化的适当唾液酸供体接触。

A.生成或消除N-连接的糖基化位点

本发明涉及应用以下肽,其中该肽上的聚糖链位点已相对于天然肽的进行了改变。一般地,N-连接的聚糖链是在天冬酰胺残基连接到一级肽结构上的,其中该天冬酰胺残基位于可由内质网(ER)上的膜结合糖基转移酶识别的氨基酸序列中。一般地,一级肽结构上的识别位点是序列天冬酰胺-X-丝氨酸/苏氨酸,其中X可为除脯氨酸和天冬氨酸之外的任何氨基酸。尽管该识别位点是典型的,但本发明进一步包含在其他识别位点具有N-连接聚糖的肽,其中该N-连接的链是用天然的或重组的糖基转移酶添加的。

由于N-连接的糖基化的识别位点是已知的,所以生成突变的一级肽序列是在本领域技术人员的技术范围之内的,其中在所述突变的序列中去除了天然的N-连接糖基化识别位点,或者可选择地另外又生成了一个或多个额外的N-糖基化识别位点。最简单地,可将天冬酰胺残基从肽的一级序列中去除,从而去除聚糖的附着位点,因而可从成熟肽中去除一种聚糖。例如,可用基因工程方法将具有天冬酰胺-丝氨酸-丝氨酸序列的识别天然位点加工为具有亮氨酸-丝氨酸-丝氨酸序列,从而在该位置消除了N-连接的糖基化位点。

进一步地,N-连接的糖基化位点可通过改变识别位点中的残基而去除,从而即使存在天冬酰胺残基,一个或多个另外的识别残基却不存在。例如,可使天然序列天冬酰胺-丝氨酸-丝氨酸突变为天冬酰胺-丝氨酸-赖氨酸,从而在该位置消除N-糖基化位点。在N-连接的糖基化位点包含除上述典型的识别位点之外的残基的情况下,技术人员可确定适当的糖基转移酶识别所必需的序列和残基,然后突变至少一个残基,从而适当的糖基转移酶不再识别该位点。换句话说,对肽的一级序列进行处理以生成或去除或同时生成和去除糖基化位点是在技术人员的技术范围内的,从而可生成具有改变的糖基化模式的肽。因此,不应将本发明解释为局限于将在此处提供的任何一级肽序列作为进行聚糖重构的唯一序列,而应解释为包括任何或全部适合于进行聚糖重构的肽序列。

为了生成突变的肽,对编码肽一级序列的核酸序列进行了改变,从而使编码天然氨基酸残基的天然密码子突变以生成编码其他氨基酸残基的密码子。改变核酸序列的技术是本领域中普遍的,且描述于例如任何众所周知的分子生物学手册中。

此外,可用标准技术在体外合成编码一级肽结构的核酸。例如,可用如亚磷酰胺方法的规程在“基因机”中合成核酸分子。如果在如合成核酸或其片段的应用中需要化学合成的双链DNA,那么每一个互补链可单独合成。短的核酸(60~80个碱基对)的生产在技术上是简单的,且可通过合成互补链然后使其退火而实现。对于较长的核酸(>300个碱基对)的生产,需要特定的技术,这是因为在化学DNA合成的每一个循环中的偶联效率很少是100%的。为了解决该问题,合成的基因(双链的)是以模块的模式从长度为20~100个核苷酸的单链片段组装而来的。对于多核苷酸合成的综述,参见如Glick和Paternak(Molecular Biotechnology,Principles and Applications ofRecombinant DNA,1994,ASM Press),Itakura等人(1984,Annu.Rev.Biochem.53:323)和Climie等人(1990,Proc.Nat’l.Acad.Sci.USA 87:633)。

此外,编码肽的核酸序列中的改变可通过定点诱变来形成。如所理解的,该技术一般应用同时以单链和双链形式存在的噬菌体载体。用于定点诱变的一般载体包括如M13噬菌体的载体。这些噬菌体是易于获得的,且其应用通常是本领域的技术人员众所周知的。在定点诱变中也常规地应用双链质粒,这消除了将目标核酸从质粒转移到噬菌体中的步骤。

通常,定点诱变是通过首先获得单链载体或熔解双链载体的两条链而进行的,其中该双链载体在其序列中包括编码想要的肽的DNA序列。具有想要的突变序列的寡核苷酸引物通常是合成制备的。然后使该引物与单链载体退火,然后用DNA聚合酶如大肠杆菌聚合酶I的Klenow片段处理以完成具有突变的链的合成。因而,形成了异双链体,其中一条链编码最初的无突变的序列,而另一条链具有想要的突变。然后将该异双链体用于转化或转染适当的细胞,如大肠杆菌细胞,并选择包括具有突变的序列的重组载体的克隆。Kunkel等人(1987,Kunkel等人,Methods Enzymol.154:367-382)设计了一种遗传选择方案以富集整合了诱变的寡核苷酸的克隆。可选择地,可将商业上可购得的热稳定性酶如Taq聚合酶和PCRTM用于将诱变的寡核苷酸引物整合入扩增的DNA片段中,然后可将该片段克隆入适当的克隆或表达载体中。Tomic等人(1990,Nucl.Acids Res.,12:1656)和Upender等人(1995,Biotechniques,18:29-31)的PCRTM-介导的诱变方法提供了这种规程的两个例子。除热稳定性聚合酶之外还应用热稳定性连接酶的PCRTM也可用于将磷酸化的诱变寡核苷酸整合入扩增的DNA片段中,然后可将该片段克隆入适当的克隆或表达载体中。由Michael(1994,Biotechniques 16:410-412)描述的诱变方法提供了这种规程的一个例子。

不是所有的Asn-X-Ser/Thr序列均是N-糖基化的,这提示该基元所处的前后环境是重要的。在另一个方法中,生成了具有新的N-连接一致位点的突变肽的文库以鉴定新的N-连接位点,该新的N-连接位点在体内进行糖基化,且对肽的活性、稳定性或其他特征是有益的。

如前文所指出的,在糖蛋白中添加N-连接的聚糖链的一致序列是Asn-X-Ser/Thr,其中X可为任何氨基酸。编码距Asn的羧基末端一侧两个位置的氨基酸的核苷酸序列可用本领域的技术人员公知的标准方法进行突变以编码Ser和/或Thr。如上文所陈述的,不是所有的Asn-X-Ser/Thr位点均通过添加聚糖来修饰。因此,必须使每一个重组突变的糖蛋白在真菌、酵母或动物或哺乳动物表达系统中表达并分析N-连接的聚糖链的添加。表征糖基化位点的技术是本领域的技术人员众所周知的。进一步地,突变的重组糖蛋白的生物学功能可用对于检查的特定蛋白质是标准的测定法来确定。因而,对肽的一级序列进行处理和鉴定在其中含有的新糖基化位点,并且进一步确定该新位点对肽的生物学活性的作用则变为简单的事情。

在一个可选择的实施方案中,编码距Ser和/或Thr的氨基末端一侧为两个位置的氨基酸的核苷酸序列可用本领域的技术人员公知的标准程序进行突变以编码Asn。确定是否生成了新的糖基化位点及该位点对肽的生物学活性的作用的方法如上文所述。

B.生成或消除O-连接的糖基化位点

向肽中添加O-连接的糖基化位点可方便地通过改变肽的一级氨基酸序列而实现,从而使其与开始的肽一级氨基酸序列相比含有一个或多个额外的O-连接的糖基化位点。向肽中添加O-连接的糖基化位点也可通过将一个或多个氨基酸种类整合入在其肽序列中包含-OH基团(优选地为丝氨酸或苏氨酸残基)的肽中而实现,从而OH基团是可接近的且能够用于O-连接的糖基化。与肽中N-连接的糖基化位点的改变相似,肽的一级氨基酸序列优选地是在核苷酸水平上改变的。可对编码肽的DNA序列中特定的核苷酸进行改变,从而使该序列编码想要的氨基酸。DNA中的突变优选地是用本领域中公知的方法实现的,如上述的亚磷酰胺DNA合成方法和定点诱变的技术。

可选择地,编码用于添加O-连接的聚糖的推定位点的核苷酸序列可以以一个或几个拷贝在DNA分子的5’或3’末端添加到该分子中。然后可使改变的DNA序列在真菌、酵母或动物或哺乳动物表达系统中表达并分析向肽中添加的序列及该序列是否是有功能的O-连接的糖基化位点。简言之,合成的肽受体序列是在核苷酸分子的5’或3’末端引入的。原则上,当在适当的表达系统中表达时该类序列的添加对结果所得的糖蛋白的破坏性是较小的。然后使改变的DNA在CHO细胞或其他适当的表达系统中表达,并检查在其中表达的蛋白质以确定是否存在O-连接的糖基化位点。此外,可确定聚糖链的存在与否。

在另外一个方法中,通过生成含有各种新O-连接位点的肽的文库可在肽中发现新的O-连接位点的有利位点。例如,通过N-乙酰半乳糖胺转移酶添加N-乙酰半乳糖胺的一致氨基酸序列依赖于所用的特定转移酶。可对肽的氨基酸序列进行扫描以鉴定连续的氨基酸组,该氨基酸组可进行突变以生成添加O-连接的聚糖链的潜在位点。这些突变可用如前文所述的本领域技术人员公知的标准程序生成。为了确定是否任何发现的糖基化位点实际上是糖基化的,使每一个重组突变的肽在适当的表达系统中表达并随后分析位点的添加和/或O-连接的聚糖链的存在与否。

C.肽的化学合成

尽管用于本发明中的肽的一级结构可最有效地在基于细胞的表达系统中生成,但在本发明的范围之内的是肽可以合成地生成。肽的化学合成是本领域中众所周知的,且不限制地包括逐步的固相合成及在溶液或固相中的片段缩合。典型的逐步固相合成包括使相应于想要的肽链的羧基末端氨基酸的氨基酸共价地与固体支持体连接,然后通过逐步结合具有活化的羧基基团的活化氨基酸衍生物而向氨基末端延伸肽链。在完全保护的固相结合肽链组装完成之后,通过适当的化学反应切割肽-固相的共价附着,并去除保护基团以得到产物肽。参见R.Merrifield,Solid Phase Peptide Synthesis:The Synthesis of aTetrapeptide,J.Am.Chem.Soc.,85:2149-2154(1963)。肽链越长,获得高纯度的确定产物越是具有挑战性。由于复杂的混合物的产生,逐步固相合成方法具有大小的限制。通常,具有100个连续的或更多氨基酸残基的确定肽不能通过逐步固相合成常规地制备。

区段缩合方法包括通过固相逐步方法制备几个肽区段,随后从固相上切割并纯化这些最大限度保护的区段。使保护的区段一个接一个与结合到固相上的第一个区段缩合。

用于本发明的肽可通过完全固相合成、部分固相方法、片段缩合或经典的溶液合成来合成。这些合成方法是本领域技术人员众所周知的(参见如Merrifield,J.Am.Chem.Soc.,85:2149(1963),Stewart等人,“Solid Phase Peptide Synthesis”(第二版),(Pierce ChemicalCo.1984),Bayer和Rapp,Chem.Pept.Prot.3:3(1986),Atherton等人,Solid Phase Peptide Synthesis:A Practical Approach(IRL Press1989),Fields和Colowick,“Solid-Phase Peptide Synthesis”,Methodsin Enzymology 289卷(Academic Press 1997)和Lloyd-Williams等人,Chemical Approaches to the Synthesis of Peptides and Peptides(CRCPress,Inc.1997))。总的化学合成策略的改变方法如“天然化学连接”和“表达的肽连接”也是标准的(参见如Dawson等人,Science 266:776(1994),Hackeng等人,Proc.Nat’l.Acad.Sci.USA94:7845(1997),Dawson,Methods Enzymol.287:34(1997),Muir等人,Proc.Nat’l.Acad.Sci.USA 95:6705(1998)和Severinov和Muir,J.Biol.Chem.273:16205(1998))。同样有用的是由GryphonSciences,South San Francisco,CA开发的固相肽合成方法。参见美国专利No.6,326,468、6,217,873、6,174,530和6,001,364,在此处将它们全部整体引入作为参考。

D.翻译后修饰

本领域的技术人员将理解肽除在其上添加N-连接的和/或O-连接的聚糖之外还可进行翻译后修饰。预期具有糖基化以外的翻译后修饰的肽可用作本发明的肽,只要维持或改善了该肽的想要的生物学活性或功能。这种翻译后修饰可为通常在体内进行的天然修饰,或者为在体外进行的对肽的加工修饰。预期的已知修饰包括但不局限于乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价附着、血红素部分的共价附着、核苷酸或核苷酸衍生物的共价附着、脂质或脂质衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环化、二硫键形成、脱甲基作用、共价交联的形成、半胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ羧化、糖基化、GPI锚定物形成、羟化、碘化、甲基化、豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二酰化、外消旋化、硒化(selenoylation)、硫酸盐化、转运RNA介导的氨基酸向肽的添加如精氨酰化(和遍在蛋白化。可用于进行许多这些修饰的酶是本领域中众所周知的,且可从如Boehringer Mannheim(Indianapolis,IN)和Sigma Chemical Company(St.Louis,MO)的公司购得。

这种修饰是本领域技术人员众所周知的,且已详细描述于科学文献中。几个特别普通的修饰如糖基化、脂质附着、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化描述于最基本的课本中,如Peptides—Structure and Molecular Properties,2ndEd.,T.E.Creighton,W.H.Freeman and Company,New York(1993)。对于该主题上有许多详细的综述,如Wold,F.,Post-translational CovalentModification of Peptides,B.C.Johnson,Ed.,Academic Press,NewYork 1-12(1983);Seifter等人(Meth.Enzymol.182:626-646(1990))和Rattan等人(Ann.N.Y.Acad.Sci.663:48-62(1992))。

肽的共价修饰也可在体外通过使肽的反应性目标氨基酸残基与有机衍生化试剂进行反应而引入到分子中,该有机衍生化试剂能够与选择的侧链或末端氨基酸残基反应。最常用的衍生化的残基为半胱氨酰、组氨酰、赖氨酰、精氨酰、酪氨酰、谷氨酰胺酰、天冬酰胺酰和氨基末端残基。脯氨酸和赖氨酸的羟化,丝氨酰和苏氨酰残基的羟基基团的磷酸化,赖氨酸、组氨酸和组氨酸侧链的α-氨基基团的甲基化,N-末端胺的乙酰化和C-末端羧基的酰胺化。这种衍生化的部分可改善溶解性、吸收、生物学半衰期等。该部分也可消除或减少肽的任何不想要的副作用等。

此外,用双功能试剂的衍生化可用于使肽与水不溶性支持体基质或其他的大分子载体交联。常用的交联剂包括戊二醛、N-羟基琥珀酰亚胺酯、同双功能亚氨酸酯、1,1-双(-二唑乙酰基)-2-苯基乙烷和双功能马来酰亚胺。衍生化试剂如甲基-3-[9-对叠氮基苯基)]二硫代丙酰亚胺酸酯产生了能够在光存在时交联的光活化型中间物。可选择地,可将描述于U.S.Pat.No.3,969,287和3,691,016中的反应性水不溶性基质如溴化氰活化的糖和反应性底物用于肽固定。

E.融合肽/肽

用于本发明的肽可包含融合肽。当需要将两个肽的生物学和/或功能特征组合在一个肽分子中时,融合肽是特别有利的。这种融合肽可展示生物学活性和功能的天然不存在的组合以生成治疗和工业应用中新的有用分子。目标生物学活性包括但不局限于酶活性、受体和/或配体活性、免疫原性基元和结构性结构域。

这种融合肽是本领域中众所周知的,且其生成方法是本领域技术人员众所周知的。例如,已经制备了人α-干扰素-人白蛋白融合肽,其中结果所得的肽具有与白蛋白长的循环寿命组合的α-干扰素的治疗益处,从而生成了使得能够减少服药频率和对患者的潜在副作用的治疗组合物。参见来自Human Genome Sciences,Inc.和美国专利No.5,766,883的AlbuferonTM。其他融合肽包括在别处描述的抗体分子。

F.较小的“生物学活性”分子的生成

用于本发明的肽可为天然肽的变体,其中用天然肽的片段替代全长的天然肽。此外,预期应用前原肽(pre-pro-peptide)和前肽(pre-peptide)。变体肽在大小上可比天然肽小,且可包含较大的肽的一个或多个结构域。当肽中某些结构域的生物学活性是想要的但肽中其他结构域的生物学活性不是想要的时,对特定肽结构域的选择是有利的。同样包括的是可增强肽的想要的治疗作用的肽的截断和内部缺失。倘若可保持肽的想要的生物学活性,那么任何这种形式的肽均可用于本发明中。

肽的较短形式可能具有天然肽中未发现的独特优点。在人白蛋白的情况下,已发现包含少至63%的天然白蛋白肽的截短形式作为血浆体积的膨胀剂是有利的。人们认为截短的白蛋白肽在此治疗目的上优于天然的肽,这是因为相对于天然人血清白蛋白剂量或重组人血清白蛋剂量,所述肽只要1/2到2/3的剂量即可达到等价的胶体渗透作用。参见美国专利No.5,380,712,在此处将其整体引入作为参考。

也发现较小的“生物学活性”肽与天然肽相比具有增强的治疗活性。IL-2的治疗潜力受以血管渗漏综合症为主的副作用的限制。人们发现由相应于整个α-螺旋的残基1-30组成的肽的较小的化学合成形式可正确折叠并含有天然的IL-2生物学活性,而不具有主要的副作用。

G.新肽的生成

本发明的肽可源自天然肽的一级序列,或者可用本领域的技术人员公知的许多方法进行加工。这种加工的肽可根据其与天然的肽相比增强的或新的性质而设计和/或选择。例如,可对肽进行加工以使其具有增加的酶反应速率、增加的或降低的对底物或配体的亲和力、增加的或降低的对受体的结合亲和力、改变的对底物、配体、受体或其他结合配偶体的特异性、增加的或降低的体内和/或体外稳定性或增加的或降低的在动物中的免疫原性。

H.突变

1.推理的设计突变

用于本发明方法中的肽可进行突变以增强想要的生物学活性或功能、减少肽的不想要的性质和/或向肽添加新的活性或功能。“合理的肽设计”可用于生成这种改变的肽。一旦肽的氨基酸序列和结构是已知的且计划了想要的突变,那么可最方便地在相应的核酸密码子进行突变,该核酸密码子编码想要进行突变的氨基酸残基。本领域的技术人员基于通用遗传密码和所选择的表达系统的密码子偏爱性的知识易于确定应该如何对核酸序列进行改变。可在密码子中进行突变以改变在翻译过程中将聚合入肽中的氨基酸残基。可选择地,可对密码子进行突变,从而相应编码的氨基酸残基不变,但密码子的选择更适合于想要的肽表达系统。例如,可用其他的氨基酸替代cys-残基以去除天然肽中的二硫键,可对催化性结构域进行突变以改变生物学活性,且通常可对肽的同种型进行加工。这种突变可为点突变、缺失、插入和截短等。

使肽中特定的氨基酸突变的技术是本领域中众所周知的。上述定点诱变技术非常适用于密码子的定向突变。寡核苷酸介导的诱变方法也在Sambrook等人(2001,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Laboratory,New York,从15.51页开始)中详细讨论。可以用接头插入诱变、核酸酶Bal31消化和接头分区诱变以及其他本领域中众所周知的方法进行系统性的缺失、插入和截短(Sambrook等人,2001,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Laboratory,New York)。

推理(rational)的肽设计已成功地用于增加酶对热失活和氧化的稳定性。例如,酶的稳定性可通过去除α-淀粉酶中的天冬酰胺残基(Declerck等人,2000,J.Mol.Biol.301:1041-1057)、向α-淀粉酶(Igarashi等人,1999,Biosci.Biotechnol.Biochem.63:1535-1540)和D-木糖异构酶(Zhu等人,1999,Peptide Eng.12:635-638)中引入更刚性的结构元件如脯氨酸而改善。进一步地,额外的疏水接触的引入可稳定3-异丙基苹果酸脱氢酶(Akanuma等人,1999,Eur.J.Biochem.260:499-504)和从假单胞菌属物种(Pseudonomas sp.)中获得的甲酸脱氢酶(Rojkova等人,1999,FEBS Lett.445:183-188)。这些突变的稳定作用的机制通常可应用于许多肽。预期这些和类似的突变对于本发明的方法中重构的肽是有用的。

2.随机诱变技术

用于本发明的方法中的新肽可用在核酸的编码序列中引入随机突变的技术生成。然后使核酸在想要的表达系统中表达,并对结果所得的肽评估目的性质。将随机突变引入DNA序列的技术是本领域中众所周知的,且包括PCR诱变、饱和诱变和简并寡核苷酸方法。参见Sambrook和Russell(2001,Molecular Cloning,A LaboratoryManual,Cold Spring Harbor Press,Cold Spring Harbor,NY)和Ausubel等人(2002,Current Protocols in Molecular Biology,JohnWiley & Sons,NY)。

在PCR诱变中,将降低的Taq聚合酶的保真性用于向克隆的DNA片段中引入随机突变(Leung等人,1989,Technique 1:11-15)。这是将随机突变引入到DNA序列中的非常有力和相对快速的方法。要进行诱变的DNA区域是用聚合酶链反应(PCR)在降低Taq DNA聚合酶合成DNA的保真性的条件下扩增的,如应用改变的dGTP/dATP比例和通过向PCR反应中添加Mn2+。将扩增的DNA片段的集合插入到适当的克隆载体中以提供随机的突变文库。

饱和诱变使得能够快速向克隆的DNA片段中引入大量的单碱基替代(Mayers等人,1985,Science 229:242)。该技术包括例如用在体外对单链DNA的化学处理或辐射生成突变和合成互补的DNA链。突变频率可通过调节处理的激烈程度来调节,且基本可获得所有可能的碱基替代。因为该程序不涉及突变片段的遗传选择,所以可获得中性替代以及那些改变功能的替代。点突变的分布不偏向于保守的序列元件。

核酸同源物的文库也可从一套简并寡核苷酸序列中生成。简并寡核苷酸序列的化学合成可在自动DNA合成仪上进行,且然后可将合成的基因连接到适当的表达载体上。简并寡核苷酸的合成是本领域中公知的(参见如Narang,SA(1983)Tetrahedron 39:3;Itakura等人(1981)Recombinant DNA,Proc 3rd Cleveland Sympos.Macromolecules,ed.AG Walton,Amsterdam:Elsevier pp.273-289;Itakura等人(1984)Annu.Rev.Biochem.53:323;Itakura等人(1984)Science 198:1056;Ike等人(1983)Nucleic Acid Res.11:477)。这种技术已应用于其他肽的定向进化中(参见如Scott等人(1990)Science249:386-390;Roberts等人(1992)PNAS 89:2429-2433;Devlin等人(1990)Science 249:404-406;Cwirla等人(1990)PNAS 87:6378-6382以及U.S.Pat.No.5,223,409、5,198,346和5,096,815)。

a.定向进化

用于本发明方法中的肽也可用“定向进化”技术生成。与定点诱变技术(其中肽结构的知识是必需的)相反,目前存在无需知道肽结构特征而生成突变文库的策略,从该文库中可获得具有改善的性质的肽。这些策略通常称为“定向进化”技术且与传统的随机诱变程序差别在于它们对编码目标肽的核酸序列进行多轮重复的突变、筛选和扩增。

在一些“定向进化”技术中,获得的核酸中的多样性是通过在核酸序列中随机生成点突变的突变方法生成的。点突变技术包括但不局限于“易错的PCRTM”(Caldwell和Joyce,1994;PCR Methods Appl.2:28-33;和Ke和Madison,1997,Nucleic Acids Res.25:3371-3372)、重复的寡核苷酸指导的诱变(Reidhaar-Olson等人,1991,MethodsEnzymol.208:564-586)和任何前述的随机诱变方法。

另一种生成多样性的方法是应用增变(mutator)基因,定向进化可在该多样性上进行作用。将目标核酸培养于增变细胞株中,该细胞株的基因组一般编码缺陷的DNA修复基因(美国专利No.6,365,410;Selifonova等人,2001,Appl.Environ.Microbiol.67:3645-3649;Long-McGie等人,2000,Biotach.Bioeng.68:121-125,参见GenencorInternational Inc,Palo Alto CA)。

用定向进化技术获得多样性也可用简并引物和饱和诱变实现(Gene Site Saturation MutagenesisTM,Diversa Corp.,San Diego,CA)。在该类饱和诱变中,将设计为覆盖要进行多样化的核酸序列全长的简并引物用于引发PCR反应中的聚合酶。在该方式中可将氨基酸编码序列的每一个密码子进行突变以使其编码剩余的19个普通氨基酸的每一个。该技术也可用于向核酸编码序列的特定区域引入突变、缺失和插入,而使核酸分子的剩余部分保持不变。基因饱和技术的程序是本领域中众所周知的,且可发现于美国专利6,171,820。

b.DNA重排(shuffling)

用于本发明方法中的新肽也可用基因重排、基元重排、外显子重排和/或密码子重排(统称为“DNA重排”)技术生成。DNA重排技术可应用于调节用于本发明的肽的活性或可用于生成具有改变的活性的肽。通常参见U.S.Pat.Nos.5,605,793、5,811,238、5,830,721、5,834,252和5,837,458和Stemmer等人(1994,Nature 370(6488):389-391);Crameri等人(1998,Nature 391(6664):288-291);Zhang等人(1997,Proc.Natl.Acad.Sci.USA 94(9):4504-4509);Stemmer等人(1994,Proc.Natl.Acad.Sci.USA 91(22):10747-10751),Patten等人(1997,Curr.Opinion Biotechnol.8:724-33);Harayama(1998,TrendsBiotechnol.16(2):76-82);Hansson等人(1999,J.Mol.Biol.287:265-76)和Lorenzo和Blasco(1998,Biotechniques 24(2):308-13)(这些专利的每一个均在此处整体引入作为参考),

DNA重排包括通过同源或位点专一性重组组装两个或多个DNA片段以生成多核苷酸序列中的变异。已将DNA重排用于生成1型人免疫缺陷病毒蛋白质(Pekrun等人,2002,J.Virol.76(6):2924-35)、三嗪水解酶(Raillard等人,2001,Chem Biol 8(9):891-898)、鼠白血病病毒(MLV)蛋白质(Powell等人2000,Nat Biotechnol 18(12):1279-1282)和吲哚甘油磷酸合成酶(Merz等人2000,Biochemistry 39(5):880-889)。

DNA重排技术也发展为可通过在体外进行DNA的同源重组而模拟天然的重组以生成分子多样性(Stemmler,1994,Nature 370:389-391;和Stemmler,1994,PNAS 91:10747-10751)。通常,在该方法中将相关基因的群体进行片段化并进行多次变性、再次杂交并伴随着Taq聚合酶对5’突出端的延伸。在每一个循环中,片段的长度增加,且当源自不同基因的片段相互杂交时可发生重组。最初的DNA片段化可通过核酸酶消化来实现,一般应用DNase(参见Stemmler的参考文献,见上文),但也可通过间断的PCR合成来实现(美国专利5,965,408,在此处整体引入作为参考;参见Diversa Corp.,SanDiego,CA)。DNA重排方法相对于随机点突变方法的优势在于可实现对由每一轮重排生成的有利突变的直接重组,因此对于改善的肽表型有自主的选择。

DNA重排技术是本领域中众所周知的。对该技术的详细解释可发现于Stemmler,1994,Nature 370:389-391和Stemmler,1994,PNAS91:10747-10751中。DNA重排技术也描述于美国专利6,180,406、6,165,793、6,132,970、6,117,679、6,096,548、5,837,458、5,834,252、5,830,721、5,811,238和5,605,793中(在此处将其全部整体引入作为参考)。

本领域也提供了对DNA重排的基本技术的最近修饰。在一个例子中,利用嵌合的寡核苷酸扩增了外显子重排、外显子或编码肽的特定结构域的外显子的组合。然后通过自身引导的PCR组装对扩增的分子进行了重组(Kolkman和Stemmler,2001,Nat.Biotech.19:423-428)。在另一个例子中,利用瞬时模板文库构建体中随机嵌合体生成(RACHITT)的技术,使单链的亲代DNA片段与全长的单链模板进行退火(Coco等人,2001,Nat Biotechnol.19:354-359)。在另一个例子中(交错的延伸过程(StEP))将具有大大缩减的退火/延伸循环的热循环用于重复中断DNA从侧面引物的聚合(Zhao等人,1998,Nat Biotechnol.16:258-261)。在已知为CLERY的技术中,将体外的系列重排与酵母中的体内同源重组进行组合(Abecassis等人,2000,Nucleic Acids Res.28:E88)。为了使基因间重组最大化,将来自每一个核酸的互补链的单链DNA用DNase消化并进行退火(Kikuchi等人,2000,Gene 243:133-137)。然后使由可切割的序列连接的可变长度的两个截短核酸的平端进行连接以生成基因融合物,而无需进行同源重组(Sieber等人,2001,Nat Biotechnol.19:456-460;Lutz等人,2001,Nucleic Acids Res.29:E16;Ostermeier等人,1999,Nat Biotechnol.17:1205-1209;Lutz和Benkovic,2000,Curr.Opin.Biotechnol.11:319-324)。也可用外切核酸酶介导的对DNA片段的平端化和将片段连接在一起以使其进行重组来增强具有很小的共有序列同源性的核酸之间的重组(美国专利No.6,361,974,在此处整体引入作为参考)。本发明预期应用上述的每一个和全部变体方法作为增强用于本发明方法中的任何肽和/或酶的生物学性质的方法。

除发表的详细描述定向进化和基因重排技术的规程之外,目前对选择的肽进行基因重排和选择程序的商业服务也是可用的。Maxygen(Redwood City,CA)提供了生成定制的DNA重排文库的商业服务。此外,该公司将进行定制的进化程序,该程序包括对选择的肽种类的基因重排和选择。

Optigenix,Inc.(Newark,DE)提供了质粒重排的相关服务。Optigenix利用基因家族以获得其中具有新性质的突变。将该目标核酸克隆入曲霉属(Aspergillus)表达系统的质粒中。然后将相关家族的DNA引入表达系统中,且在宿主中可发生家族中保守区域中的重组。然后使结果所得的突变DNA表达,并从其中产生的肽中筛选存在想要的性质和不存在不想要的性质的肽。

c.筛选程序

在每一个“进化”循环之后,对由突变基因表达的想要的肽进行目标特征的筛选。然后使“候选”基因进行扩增并汇集以进行下一轮的DNA重排。所用的筛选程序高度依赖于进行“进化”的肽和目标特征。利用本领域中众所周知的程序可选择如肽稳定性、生物学活性、抗原性等的特征。对于用于本发明方法中的优选的肽的生物学活性的单个测定法在别处描述。

d.技术的组合

技术人员将理解上述突变和选择技术可相互组合并与额外的程序进行组合以生成用于本发明方法中的最可能的肽分子。因而,本发明不局限于生成肽的任何一个方法,而应解释为包含在此处描述的任何或全部方法。例如,开始可进行向核酸序列中引入点突变的程序,随后进行DNA重排、选择和扩增的循环。开始的点突变的引入可用于将多样性引入到缺乏该多样性的基因群体中,且随后的DNA重排和筛选的循环将选择并重组有利的点突变。

III.糖苷酶和糖基转移酶

A.糖苷酶

糖苷酶是用水作为受体分子的糖基转移酶,且一般同样地是糖苷水解酶。通过控制反应混合物的热力学和动力学可将糖苷酶用于在体外形成糖苷键。但即使在修饰的反应条件下,糖苷酶反应仍然是难以操作的,且作为可逆的转糖基酶反应和竞争性的水解反应的结果,糖苷酶倾向于给出低的合成结果。

糖苷酶可通过对在水解过程中断裂的键位置保持其立体化学或通过对在水解过程中断裂的键位置颠倒其立体化学而发挥功能,从而分别将糖苷酶分为“保持型”糖苷酶或“颠倒型”糖苷酶。保持型糖苷酶具有存在于活性位点的两个关键羧酸部分,其一个羧酸充当酸/碱催化剂而另一个充当亲核试剂,而对于颠倒型糖苷酶,一个羧酸发挥酸的功能,而另一个发挥碱的功能。

确定任何糖苷酶的活性和连接特异性的方法是本领域中众所周知的,包括简化的HPLC规程(Jacob和Scudder,1994,Methods inEnzymol.230:280-300)。对于糖苷酶和糖苷酶处理的一般讨论可发现于Glycobiology,A Practical Approach,(1993,Fukuda和Kobataeds.,Oxford University Press Inc.,New York)。

用于本发明中的糖苷酶包括但不局限于唾液酸酶、半乳糖苷酶、内切聚糖酶、甘露糖苷酶(即α和βManI、ManII和ManIII)、木糖苷酶、岩藻糖苷酶、土壤杆菌属物种(Agrobacterium sp.)β-葡糖苷酶、粪肥纤维单胞菌(Cellulomonas fimi)甘露糖苷酶2A、Humicolainsolens糖苷酶、硫磺矿硫化叶菌(Sulfolobus solfataricus)糖苷酶和地衣芽孢杆菌(Bacillus licheniformis)糖苷酶。

用于本发明中的岩藻糖苷酶的选择依赖于岩藻糖与其他分子的连接。许多用于本发明方法中的α-岩藻糖苷酶的特异性是本领域技术人员众所周知的,且许多岩藻糖苷酶的变体也是商业上可购得的(Glyko,Novato,CA;PROzyme,San Leandro,CA;Calbiochem-NovabiochemCorp.,San Diego,CA等)。目标α-岩藻糖苷酶包括但不局限于来自Turbo cornutus、Charonia lampas、迅雷鼓胀菌(Bacillus fulminans)、黑曲霉(Aspergillus niger)、产气荚膜羧菌(Clostridium perfringens)、牛肾(Glyko)、鸡肝(Tyagarajan等人,1996,Glycobiology 6:83-93)的α-岩藻糖葡酶和来自木薯假单胞菌(Xanthomonas manihotis)(Glyko,PROzyme)的α-岩藻糖苷酶II。鸡肝岩藻糖苷酶对于从N-连接的聚糖中去除核心岩藻糖是特别有用的。

B.糖基转移酶

糖基转移酶以逐步的方式催化活化的糖(供体NDP-糖响蛋白质、糖肽、脂质或糖脂或生长的寡糖的非还原末端的添加。N-连接的糖肽是通过转移酶和脂质连接的寡糖供体Dol-PP-NAG2Glc3Man9进行总体(en block)转移并随后对核心进行修剪而合成的。在该情况下,“核心”糖的特性与随后的附着物有些不同。大量的糖基转移酶是本领域中公知的。

用于本发明中的糖基转移酶可为任何只要能够利用修饰糖作为糖供体的糖基转移酶。这种酶的例子包括Leloir氏途径的糖基转移酶,如半乳糖基转移酶、N-乙酰葡糖胺转移酶、N-乙酰半乳糖胺转移酶、岩藻糖基转移酶、唾酸转移酶、甘露糖基转移酶、木糖基转移酶、葡糖醛酸基转移酶等。

对于涉及糖基转移酶反应的酶促糖合成,可克隆或从任何来源分离糖基转移酶。许多克隆的糖基转移酶及其多核苷酸序列是已知的。参见如Taniguchi等人,2002,Handbook of glycosyltransferases andrelated genes,Springer,Tokyo。

糖基转移酶氨基酸序列和编码糖基转移酶的核苷酸序列也发现于各种公用的数据库中,包括GenBank、Swiss-Prot、EMBL等,其中从该核苷酸序列中可推断氨基酸序列。

可用于本发明方法中的糖基转移酶包括但不局限于半乳糖基转移酶、岩藻糖基转移酶、葡糖基转移酶、N-乙酰半乳糖胺转移酶、N-乙酰葡糖胺转移酶、葡糖醛酸基转移酶、唾酸转移酶、甘露糖基转移酶、葡糖醛酸转移酶、半乳糖醛酸转移酶和寡糖基转移酶。适当的糖基转移酶包括那些从真核生物以及原核生物中获得的。

编码糖基转移酶的DNA可通过化学合成、通过筛选来自适当的细胞或细胞系培养物的mRNA的反转录物、通过筛选来自适当的细胞的基因组文库或通过组合这些程序而获得。对mRNA或基因组DNA的筛选可用源自糖基转移酶核酸序列的寡核苷酸探针来进行。探针根据已知的程序可用可探测的标记进行标记并用于常规的杂交测定中,该标记如但不局限于荧光基团、放射性原子或化学发光基团。可选择地,糖基转移酶核酸序列可通过应用聚合酶链反应(PCR)程序获得,其中PCR的寡核苷酸引物是从糖基转移酶核酸序列中产生的。参见Mullis等人的U.S.Pat.No.4,683,195和Mullis的U.S.Pat.No.4,683,202。

糖基转移酶可在用含有编码糖基转移酶的DNA的载体转化的宿主细胞中合成。载体是可复制的DNA构建体。载体可用于扩增编码糖基转移酶的DNA和/或表达编码糖基转移酶的DNA。表达载体是可复制的DNA构建体,其中编码糖基转移酶的DNA序列是可操作地连接到适当的控制序列上的,该控制序列能够实现糖基转移酶在适当的宿主细胞中的表达。对这种控制序列的需要将依赖于选择的宿主和选择的转化方法而有变化。通常,控制序列包括转录启动子、控制转录的可选择的操纵基因序列、编码适当的mRNA核糖体结合位点的序列和控制转录和翻译终止的序列。扩增载体不需要表达控制结构域。所需的只是通常由复制起点所赋予的在宿主中复制的能力和促进转化体识别的选择基因。

1.岩藻糖基转移酶

在一些实施方案中,用于本发明方法中的糖基转移酶是岩藻糖基转移酶。岩藻糖基转移酶是本领域技术人员公知的。示例性的岩藻糖基转移酶包括将L-岩藻糖从GDP-岩藻糖向受体糖的羟基位置转移的酶。将非核苷酸的糖转移到受体中的岩藻糖基转移酶也可用于本发明中。

在一些实施方案中,受体糖例如是寡糖糖苷中Galβ(1→3,4)GlcNAcβ-基团中的GlcNAc。该反应的适当的岩藻糖基转移酶包括首先从人乳中表征的Galβ(1→3,4)GlcNAcβ1-α(1→3,4)岩藻糖基转移酶(FTIII E.C.No.2.4.1.65)(参见Palcic等人,Carbohydrate Res.190:1-11(1989);Prieels等人,J.Biol.Chem.256:10456-10463(1981);和Nunez等人,Can.J.Chem.59:2086-2095(1981))和发现于人血清中的Galβ(1→4)GlcNAcβ-α岩藻糖基转移酶(FTIV、FTV、FTVI)。也表征了唾液酸基α(2→3)Galβ(1→3)GlcNAcβ岩藻糖基转移酶FTVII(E.C.No.2.4.1.65)。Galβ(1→3,4)GlcNAcβ1-α(1→3,4)岩藻糖基转移酶的重组形式也进行了表征(参见Dumas等人,Bioorg.Med.Letters 1:425-428(1991)和Kukowska-Latallo等人,Genes andDevelopment 4:1288-1303(1990))。其他示例性的岩藻糖基转移酶包括如α1,2岩藻糖基转移酶(E.C.No.2.4.1.69)。酶促岩藻糖基化可通过描述于Mollicone等人,Eur.J.Biochem.191:169-176(1990)或美国专利No.5,374,655中的方法进行。

2.半乳糖基转移酶

在另一组实施方案中,糖基转移酶是半乳糖基转移酶。示例性的半乳糖基转移酶包括α(1,3)半乳糖基转移酶(E.C.No.2.4.1.151,参见如Dabkowski等人,Transplant Proc.25:2921(1993)和Yamamoto等人,Nature 345:229-233(1990),牛的(GenBank j04989,Joziasse等人,J.Biol.Chem.264:14290-14297(1989)),鼠的(GenBank m26925;Larsen等人,Proc.Nat’l.Acad.Sci.USA 86:8227-8231(1989)),猪的(GenBank L36152;Strahan等人,Immunogenetics 41:101-105(1995))。另一种适当的α1,3半乳糖基转移酶是参与血液B组抗原形成的(E.C.2.4.1.37,Yamamoto等人,J.Biol.Chem.265:1146-1151(1990)(人的))。

同样适用于本发明方法中的是β(1,4)半乳糖基转移酶,该酶包括如E.C.2.4.1.90(LacNAc合成酶)和E.C.2.4.1.22(乳糖合成酶)(牛的(D’Agostaro等人,Eur.J.Biochem.183:211-217(1989)),人的(Masri等人,Biochem.Biophys.Res.Commun.157:657-663(1988)),鼠的(Nakazawa等人,J.Biochem.104:165-168(1988)),以及E.C.2.4.1.38和神经酰胺半乳糖基转移酶(E.C.2.4.1.45,Stahl等人,J.Neurosci.Res.38:234-242(1994)。其他适当的半乳糖基转移酶包括如α1,2半乳糖基转移酶(来自如粟酒裂殖糖酵母(Schizosaccharomyces pombe),Chapell等人,Mol.Biol.Cell 5:519-528(1994))。对于进一步的适当的半乳糖基转移酶,参见Taniguchi等人(2002,Handbook of Glycosyltransferases and RelatedGenes,Springer,Tokyo),Guo等人(2001,Glycobiology,11(10):813-820)和Breton等人(1998,J Biochem.123:1000-1009)。

通过基因工程从克隆的基因中生产如酶GalNAc TI-XIV的蛋白质是众所周知的。参见如U.S.Pat.No.4,761,371。一个方法包括集中足够的样品,然后通过N-末端测序确定酶的氨基酸序列。然后将该信息用于分离编码全长(膜结合的)转移酶的cDNA克隆,该cDNA克隆在昆虫细胞系Sf9中表达后导致完全活性的酶的合成。然后通过对16个不同蛋白质中已知的糖基化位点周围氨基酸的半定量分析并伴随着对合成肽的体外糖基化研究以确定酶的受体特异性。该研究已证明某些氨基酸残基在糖基化的肽区段中是高频率存在的(overrepresent),且在围绕糖基化的丝氨酸和苏氨酸残基的特定位置的残基对于受体功效具有比其他氨基酸部分更显著的影响。

3.唾酸转移酶

唾酸转移酶是用于本发明的重组细胞和反应混合物中的另一类糖基转移酶。适用于本发明的唾酸转移酶的例子包括ST3GalIII(如大鼠或人的ST3GalIII)、ST3GalIV、ST3GalI、ST6GalI、ST3GalV、ST6GalII、ST6GalNAcI、ST6GalNAcII和ST6GalNAcIII(用于此处的唾酸转移酶的命名法描述于Tsuji等人,Glycobiology 6:v-x iv(1996)中)。称为α(2,3)唾酸转移酶(E.C.2.4.99.6)的示例性α(2,3)唾酸转移酶可将唾液酸转移到Galβ1→3Glc二糖或糖苷的非还原末端Gal上。参见Van den Eijnden等人,J.Biol.Chem.256:3159(1981),Weinstein等人,J.Biol.Chem.257:13845(1982)和Wen等人,J.Biol.Chem.267:21011(1992)。另一个示例性的α2,3-唾酸转移酶(E.C.2.4.99.4)可将唾液酸转移到二糖或糖苷的非还原末端Gal上。参见Rearick等人,J.Biol.Chem.254:4444(1979)和Gillespie等人,J.Biol.Chem.267:21004(1992)。进一步示例性的酶包括Gal-β-1,4-GlcNAcα-2,6唾酸转移酶(参见Kurosawa等人,Eur.J.Biochem.219:375-381(1994))。

优选地,对于糖肽的糖的糖基化,唾酸转移酶能够将唾液酸转移到序列Galβ1,4GlcNAc-、Galβ1,3GlcNAc-或Galβ1,3GalNAc-上,即完全唾液酸化的糖结构上末端唾液酸的最常见的倒数第二个序列(参见表8)。能够将唾液酸转移到α2,3Galβ1,4GlcNAc的α2,8-唾酸转移酶也可用于本发明的方法中。

表8.用Galβ1,4GlcNAc序列作为受体底物的唾酸转移酶

  唾酸转移酶  来源  形成的序列  Ref.  ST6Gal I  ST3Gal III   ST3Gal IV   ST6Gal II  ST6Gal II  ST3Gal V  哺乳动物  哺乳动物   哺乳动物   哺乳动物  发光杆菌属  N.meningitides  N.gonorrhoeae  NeuAcα2,6Galβ1,4GlcNAc-  NeuAcα2,3Galβ1,4GlcNAc-  NeuAcα2,3Galβ1,3GlcNAc-  NeuAcα2,3Galβ1,4GlcNAc-  NeuAcα2,3Galβ1,3GlcNAc-  NeuAcα2,6Galβ1,4GlcNAc-  NeuAcα2,6Galβ1,4GlcNAc-  NeuAcα2,3Galβ1,4GlcNAc-  1  1   1    2  3

1)Goochee et al.,Bio/Technology 9:1347-1355(1991)

2)Yamamoto et al.,J.Biochem.120:104-11O(1996)

3)Gilbert et al.,J.Biol.Chem.271:28271-28276(1996)

用于本发明方法中的唾酸转移酶的一个例子是ST3GalIII,它也称为α(2,3)唾酸转移酶(E.C.2.4.99.6)。该酶催化唾液酸向Galβ1,3GlcNAc或Galβ1,4GlcNAc糖苷的Gal的转移(参见如Wen等人,J.Biol.Chem.267:21011(1992);Van den Eijnden等人,J.Biol.Chem.256:3159(1991)),且负责糖肽中天冬酰胺连接的寡糖的唾液酸化。唾液酸与Gal连接,从而在两个糖之间形成α-连接。糖之间的键(连接)是在NeuAc的2-位置和Gal的3-位置之间的。该特定的酶可从大鼠肝中分离(Weinstein等人,J.Biol.Chem.257:13845(1982));人的cDNA(Sasaki等人(1993)J.Biol.Chem.268:22782-22787;Kitagawa & Paulson(1994)J.Biol.Chem.269:1394-1401)和基因组(Kitagawa等人(1996)J.Biol.Chem.271:931-938)DNA序列是已知的,从而促进了通过重组表达对该酶的生产。在一个优选的实施方案中,本发明的唾液酸化方法应用大鼠ST3GalIII。

用于请求保护的方法的唾酸转移酶的例子是来自弯曲杆菌属(Campylobacter)的CST-I(参见如美国专利No.6,503,744、6,096,529和6,210,933以及WO99/49051,以及公布的美国专利申请2002/2,042,369)。该酶催化唾液酸向Galβ1,4Glc或Galβ1,3GalNAc的转移。用于本发明的其他示例性的唾酸转移酶包括那些从空肠弯曲杆菌空肠亚种(Campylobacter jejuni)中分离的,包括α(2,3)唾酸转移酶。参见如WO99/49051。

其他唾酸转移酶(包括那些列于表8中的)也用于经济和有效的大规模过程中以对商业上重要的糖肽进行唾液酸化。作为发现这些其他的酶的效用的简单检验,使各种量的每一种酶(1-100mU/mg蛋白质)与脱唾液酸化-α1AGP(1-10mg/ml)进行反应,以比较目标唾酸转移酶相对于牛的ST6GalI、ST3GalIII的每一个或两者对糖肽进行唾液酸化的能力。可选择地,可将从肽主链中酶促释放的其他糖肽或糖肽或N-连接的寡糖代替脱唾液酸化-α1AGP用于进行该估计。将具有比ST6GalI更有效地对糖肽的N-连接的寡糖进行唾液酸化能力的唾酸转移酶用于肽唾液酸化的大规模实践过程中(如在本公开内容中对ST3GalIII所阐明的)。

4.其他糖基转移酶

本领域的技术人员将理解可将其他的糖基转移酶替代入类似的转移酶循环中,如对唾酸转移酶详细描述的。特别地,糖基转移酶也可为如葡糖基转移酶,如Alg8(Stagljov等人,Proc.Natl.Acad.Sci.USA 91:5977(1994))或Alg5(Heesen等人,Eur.J.Biochem.224:71(1994))。

N-乙酰半乳糖胺转移酶也可用于本发明的实践中。适当的N-乙酰半乳糖胺转移酶包括但不局限于α(1,3)N-乙酰半乳糖胺转移酶、β(1,4)N-乙酰半乳糖胺转移酶(Nagata等人,J.Biol.Chem.267:12082-12089(1992)和Smith等人,J.Biol.Chem.269:15162(1994))和肽N-乙酰半乳糖胺转移酶(Homa等人,J.Biol.Chem.268:12609(1993))。适当的N-乙酰葡糖胺转移酶包括GnT-I(2.4.1.101,Hull等人,BBRC 176:608(1991))、GnT-II、GnT-III(Ihara等人,J.Biochem.113:692(1993))、GnT-IV、GnT-V(Shoreibah等人,J.Biol.Chem.268:15381(1993))和GnT-VI、O-连接的N-乙酰葡糖胺转移酶(Bierhuizen等人,Proc.Natl.Acad.Sci.USA 89:9326(1992))、N-乙酰葡糖胺-1-磷酸转移酶(Rajput等人,Biochem J.285:985(1992))和透明质酸合成酶(hyaluronan synthase)。

甘露糖基转移酶可用于转移修饰的甘露糖部分。适当的甘露糖基转移酶包括α(1,2)甘露糖基转移酶、α(1,3)甘露糖基转移酶、α(1,6)甘露糖基转移酶、β(1,4)甘露糖基转移酶、Dol-P-Man合成酶、Och1和Pmt1(参见Kornfeld等人,Annu.Rev.Biochem.54:631-664(1985))。

木糖基转移酶也可用于本发明中。参见如Rodgers等人,Biochem.J.,288:817-822(1992);和Elbain等人,美国专利No.,6,168,937。

其他适当的糖基转移酶循环描述于Ichikawa等人,JACS 114:9283(1992)、Wong等人,J.Org.Chem.57:4343(1992)和Ichikawa等人Carbohydrates and Carbohydrate Polymers,Yaltami,ed.(ATLPress,1993)。

原核生物的糖基转移酶也可用于本发明的实践中。这种糖基转移酶包括参与脂寡糖(LOS)合成的酶,该LOS可由许多革兰氏阴性细菌产生。LOS一般具有模拟在人上皮细胞表面或在宿主分泌物中发现的糖缀合物的末端聚糖序列(Preston等人,Critical Reviews in Microbiology 23(3):139-180(1996))。这种酶包括但不局限于如大肠杆菌和鼠伤寒沙门氏菌(SalmoneHa typhimurium)物种的rfa操纵子的蛋白质,这包括β1,6半乳糖基转移酶和β1,3半乳糖基转移酶(参见如EMBLAccession Nos.M80599和M86935(大肠杆菌);EMBLAccession No.S56361(鼠伤寒沙门氏菌))、葡糖基转移酶(Swiss-Prot Accession No.P25740(大肠杆菌)、β1,2-葡糖基转移酶(rfaJ)(Swiss-Prot Accession No.P27129(大肠杆菌)和Swiss-ProtAccession No.P19817(鼠伤寒沙门氏菌))和β1,2-N-乙酰葡糖胺转移酶(rfaK)(EMBL Accession No.U00039(大肠杆菌))。其他氨基酸序列已知的糖基转移酶包括那些由操纵子如rfaB编码的,这已在下面生物中进行了表征,如肺炎克雷伯氏菌(Klebsiella pneumoniae)、大肠杆菌、鼠伤寒沙门氏菌、肠沙门氏菌(Salmonella enterica)、小肠结肠炎耶尔森氏菌(Yersinia enterocolitica)、Mycobacterium leprosum和铜绿假单胞菌(Pseudomonas aeruginosa)的rh1操纵子。

同样适用于本发明的是参与产生含有乳-N-新四糖(lacto-N-neotetraose)D-半乳糖基-β-1,4-N-乙酰基-D-葡糖胺基-β-1,3-D-半乳糖基-β-1,4-D-葡萄糖和Pk血液基团三糖序列D-半乳糖基-α-1,4-D-半乳糖基-β-1,4-D-葡萄糖的结构的糖基转移酶,该结构已在粘膜病原体淋病奈瑟氏球菌(Neisseria gonnorhoeae)和脑膜炎奈瑟氏球菌(N.meningitidis)的LOS中进行了鉴定(Scholten等人,J.Med.Microbiol.41:236-243(1994))。来自脑膜炎奈瑟氏球菌和淋病奈瑟氏球菌的编码参与这些结构生物合成的糖基转移酶的基因已从脑膜炎奈瑟氏球菌免疫型L3和L1(Jennings等人,Mol.Microbiol.18:729-740(1995))和淋病奈瑟氏球菌突变体F62(Gotshlich,J.Exp.Med.180:2181-2190(1994))中进行了鉴定。在脑膜炎奈瑟氏球菌中,由3个基因lgtA、lgtB和lgE组成的座位编码在乳-N-新四糖中添加最后3个糖所必需的糖基转移酶(Wakarchuk等人,J.Biol.Chem.271:19166-73(1996))。最近证明了lgtB和lgtA基因产物的酶活性,从而提供了对于它们的糖基转移酶功能的第一个直接证据(Wakarchuk等人,J.Biol.Chem.271(45):28271-276(1996))。在淋病奈瑟氏球菌中,有2个额外的基因,即将β-D-GalNAc添加到乳-N-新四糖结构的末端半乳糖的3位置中的lgtD和将末端α-D-Gal添加到截短的LOS的乳糖元件中的lgtC,从而生成了Pk血液基团抗原结构(Gotshlich(1994),见上文)。在脑膜炎奈瑟氏球菌中,单独免疫型L1也表达Pk血液基团抗原且已显示具有lgtC基因(Jennings等人(1995),见上文)。奈瑟氏球菌糖基转移酶和相关基因也描述于USPN5,545,553中(Gotshlich)。也已表征了来自幽门螺杆菌(Helicobacterpylori)的α1,2-岩藻糖基转移酶和α1,3-岩藻糖基转移酶(Martin等人,J.Biol.Chem.272:21349-21356(1997))。同样用于本发明中的是空肠弯曲杆菌空肠亚种的糖基转移酶(参见Taniguchi等人,2002,Handbook ofglycosyltransferases and related genes,Springer,Tokyo)。

B.磺基转移酶

本发明也提供了生成包括硫酸化分子的肽的方法,该硫酸化的分子包括如硫酸化的多糖如肝素、类肝素硫酸盐、角叉藻聚糖和相关化合物。适当的磺基转移酶包括如软骨素-6-磺基转移酶(由Fukuta等人,J.Biol.Chem.270:18575-18580(1995)描述的鸡cDNA;GenBankAccession No.D49915)、糖胺聚糖N-乙酰葡糖胺N-脱乙酰基酶/N-磺基转移酶1(Dixon等人,Genomics 26:239-241(1995);UL18918)和糖胺聚糖N-乙酰葡糖胺N-脱乙酰基酶/N-磺基转移酶2(在Orellana等人,J.Biol.Chem.269:2270-2276(1994)和Eriksson等人,J.Biol.Chem.269:10438-10443(1994)中描述的鼠cDNA;描述于GenBankAccession No.U2304中描述的人cDNA)。

C.细胞结合的糖基转移酶

在另一个实施方案中,用于本发明方法中的酶是细胞结合的糖基转移酶。尽管许多可溶性的糖基转移酶是已知的(参见如U.S.Pat.No.5,032,519),但当与细胞结合时糖基转移酶通常是膜结合形式的。迄今研究的许多膜结合酶可认为是内在蛋白质;即它们不可通过超声处理而从膜中释放且需要去污剂以使其溶解。已在脊椎动物和无脊椎动物细胞的表面鉴定了表面糖基转移酶,并已认识到这些表面转移酶在生理学条件下可保持催化活性。然而,细胞表面糖基转移酶更认可的功能是细胞间识别(Roth,1990,Molecular Approaches to SupracellularPhenomena)。

已发展了改变由细胞表达的糖基转移酶的方法。例如,Larsen等人,Proc.Natl.Acad.Sci.USA 86:8227-8231(1989)报道了分离克隆的cDNA序列的遗传方法,该克隆的cDNA序列决定细胞表面寡糖结构及其同源的糖基转移酶的表达。将从mRNA生成的cDNA文库转染入COS-1细胞中,该mRNA是从已知表达UDP-半乳糖:.β.-D-半乳糖基-1,4-N-乙酰基-D-氨基葡糖苷α-1,3-半乳糖基转移酶的鼠细胞系分离的。然后培养该转染的细胞并测定α1-3半乳糖基转移酶活性。

Francisco等人,Proc.Natl.Acad.Sci.USA 89:2713-2717(1992)公开了将β-内酰胺酶锚定于大肠杆菌外表面的方法。产生了三重的融合物,结果导致了表面结合的活性β-内酰胺酶分子,该三重的融合物由(i)外膜蛋白质的信号序列,(ii)外膜蛋白质的跨膜部分和(iii)完整的成熟β-内酰胺酶序列组成。然而,Francisco方法仅限于原核细胞系统,且如作者所承认的,需要完整的三重结构以发挥正确的功能。

D.融合酶

在另一个示例性的实施方案中,本发明的方法利用融合肽,该融合肽具有超过一种参与想要的糖肽缀合物合成的酶活性。该融合蛋白质可包含如与辅助酶的催化活性结构域结合的糖基转移酶的催化活性结构域。该辅助酶的催化结构域可催化如核苷酸糖形成中的一个步骤,该核苷酸糖是糖基转移酶的供体,或者催化参与糖基转移酶循环的反应。例如,可以使编码糖基转移酶的多核苷酸按阅读框(in-frame)与编码参与核苷酸糖合成的酶的多核苷酸结合。然后结果所得的融合肽不仅可催化核苷酸糖的合成,而且可将糖部分转移到受体分子上。融合肽可为连接至一个可表达的核苷酸序列的两个或多个循环酶。在其他的实施方案中,融合肽包括两个或多个糖基转移酶的催化活性结构域。参见如美国专利No.5,641,668。本发明修饰的糖肽可易于用各种适当的融合肽进行设计和生产(参见如于1999年6月24日作为WO 99/31224发表的PCT专利申请PCT/CA98/01180)。

E.固定的酶

除细胞结合的酶之外,本发明也提供了固定于固体和/或可溶性支持体上的酶的应用。在一个示例性的实施方案中,提供了根据本发明的方法通过完整糖基连接体与PEG缀合的糖基转移酶。该PEG-连接体-酶缀合物可选择地是附着于固体支持体上的。在本发明方法中固体支持的酶的应用简化了反应混合物的操作和反应产物的纯化,且也使得该酶易于回收。该糖基转移酶缀合物应用于本发明的方法中。酶和支持体的其他组合对于本领域的技术人员是显而易见的。

F.糖基转移酶的诱变

用于本发明的方法中的糖基转移酶、唾酸转移酶、磺基转移酶和任何其他酶的新形式可用前文所述的任何方法以及本领域技术人员众所周知的其他方法生成。特别感兴趣的是具有改变的受体特异性和/或供体特异性的转移酶。同样感兴趣的是具有较高转化率和较高稳定性等的酶。

当肽的序列已知时可应用推理的设计诱变技术。由于用于本发明的转移酶和葡糖苷酶的序列以及许多三级结构是已知的,所以这些酶可理想地用于推理的突变设计。例如,可以使酶的催化位点进行突变以改变酶的供体和/或受体特异性。

糖基转移酶和糖苷酶水解酶的详尽的三级结构数据也使得这些酶可理想地用于包括结构域交换的突变。糖基转移酶和糖苷酶水解酶是模块化的酶(参见Bourne和Henrissat,2001,Current Opinion inStructural Biology 11:593-600)。糖基转移酶可基于其结构分为两类:GT-A和GT-B。GT-A类的糖基转移酶包含2个不同的结构域,一个参与核苷酸结合而另一个参与受体结合。因而,人们可方便地将来自一个基因的编码结构域的DNA序列与来自第二个基因的结构域按读码框融合以生成新的基因,该新的基因编码具有新的受体/供体特异性的蛋白质。这种结构域交换额外地可包括糖模块和其他辅助结构域。

如上所述的随机突变和/或定向进化技术也可用于生成用于本发明的新形式的糖基转移酶和糖苷酶。

IV.体外和体内表达系统

A.生产糖肽的细胞

糖基转移酶的作用是肽的糖基化的关键,因而,任何给定的细胞类型中一套糖基转移酶的表达中的差异可影响在该细胞中产生的任何给定肽的糖基化模式。对于宿主细胞依赖性肽糖基化的综述,参见Kabata和Takasaki,“Structure and Biosynthesis of Cell SurfaceCarbohydrates”,Cell Surface Carbohydrates and Cell Development,1991,pp.1-24,Eds.Minoru Fukuda,CRC Press,Boca Raton,FL。

根据本发明的公开内容,产生肽的细胞类型仅与生成具有想要的糖基化的肽所必需的重构程度相关。例如,在体外生成具有想要的糖基化的肽所必需的酶促消化反应的数目和顺序及酶促合成反应的数目和顺序将依赖于由特定细胞类型产生的肽上聚糖的结构而变化。尽管本发明决不应该解释为局限于从任何特定的细胞类型(包括在此处公开的细胞类型)产生肽,但现在提供了对几个细胞系统的讨论,该讨论确定了本发明的效力及生成肽的细胞类型的独立性。

通常,为了从编码肽的核酸中表达该肽,必须将该核酸整合入表达盒中,该表达盒包含启动子元件、终止子元件和在两者之间可操作地连接的肽编码序列。然后使该表达盒可操作地与载体连接。为此目的,可将连接物或连接体用于连接核苷酸片段,或可包括其他操作以提供便利的限制酶切位点、去除多余的核苷酸、去除限制酶切位点等。为此目的,可包括体外诱变、引物修复、限制性切割、退火、再次替代如转换和颠换。穿梭载体具有在细胞中复制所必需的遗传元件。一些载体仅可在原核生物中复制,或者可同时在原核生物和真核生物中复制。这种质粒表达载体将在一个或多个复制系统中维持,优选地为两个复制系统,这使得能够为了表达的目的在酵母宿主细胞中稳定地维持且为了克隆的目的在原核宿主中稳定维持。许多具有不同特征的载体是商业上可购得的。载体通常是质粒或噬菌体,但也可为粘粒或微型染色体。方便地是,许多商业上可购得的载体将具有已存在的表达盒的启动子和终止子及可用于插入目标肽的编码序列的多连接体位点。然后使含有表达盒的穿梭载体在大肠杆菌中转化,在其中该载体在细胞分裂过程中复制以生成载体制剂,该载体制剂足以转化具有选择的表达系统的宿主细胞。上述方法是本领域中众所周知的,且实施的规程可发现于Sambrook等人(2001,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory,New York)。

该载体一旦从使其扩增的细胞中纯化后,则转化入表达系统的细胞中。转化规程依赖于细胞类型和载体的特性。使转化体生长于适当的营养培养基上,且在适当时在选择性压力下维持以确保内源DNA的保持。当表达是诱导型的时,可使得酵母宿主生长以得到高密度的细胞,然后诱导表达。分泌的成熟的异源肽可通过任何常规方法来收获,且可通过层析、电泳、透析、溶剂-溶剂提取等来纯化。

分子克隆技术是本领域中众所周知的。进一步地,分子克隆程序的技术可发现于Sambrook等人(2001,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.);Glover等人(1985,DNA Cloning:A PracticalApproach,I和II卷);Gait等人(1985,Oligonucleotide Synthesis);Hames和Higgins(1985,Nucleic Acid Hybridization);Hames和Higgins(1984,Transcription And Translation);Freshney等人(1986,Animal Cell Culture);Perbal(1986,Immobilized Cells And Enzymes,IRL Press);Perbal(1984,A Practical Guide To Molecular Cloning);Ausubel等人(2002,Current Protocols in Molecular Biology,JohnWiley & Sons,Inc.)。

B.真菌和酵母

在酵母中产生的肽是糖基化的,且在其上存在的聚糖结构主要是高甘露糖结构。在N-聚糖的情况下,在酵母中产生的聚糖结构可含有多达9个或更多的甘露糖残基,该结构可含有或不含有额外的糖。由酵母细胞产生的肽上聚糖的类型的例子在图4左侧显示。不管甘露糖残基的数目和在其上添加的额外糖的类型和复杂性,作为酵母细胞中产生的肽的成分的N-聚糖包含如图4所示的三甘露糖核心结构。当由酵母细胞产生的肽上的聚糖结构是高甘露糖结构时,在体外用适当的甘露糖苷酶从分子中(除包含聚糖的三甘露糖核心的分子之外)去除所有甘露糖对于技术人员而言是简单的事情,从而生成了在其上附着有基本的三甘露糖核心结构的肽。目前,利用本领域中可用的技术并利用本发明的公开内容,在体外向基本的三甘露糖核心结构酶促地添加额外的糖部分以生成具有在其上附着有想要的聚糖结构的肽是简单的事情。类似地,当由酵母细胞产生的肽除在其上附着的其他复杂糖之外还包含高甘露糖结构时,酶促地去除所有额外的糖(包括额外的甘露糖残基)以得到基本的三甘露糖核心结构是简单的事情。一旦产生了基本的三甘露糖核心结构,则可能根据在此处提供的说明生成具有想要的糖基化的肽。

“酵母”意思指产子囊酵母(Endomycetales)、担子孢子囊酵母和属于Fungi Imperfecti(Blastomycetes)的酵母。产子囊酵母可分为两个科,即蚀精霉科和糖酵母科。后一个科包含4个亚科,即裂殖糖酵母亚科(如裂殖糖酵母属)、拿逊氏亚科、油脂酵母亚科和糖酵母亚科(如毕赤氏酵母属、克鲁维氏酵母属和糖酵母属)。担子孢子囊酵母包括Leucosporidium、红冬饱属、锁掷酵母属、Filobasidium和线黑粉菌属。属于Fungi Imperfecti的酵母可分为两个科,即掷孢酵母科(如掷孢酵母属、布氏弹孢酵母属)和隐球酵母科(如假丝酵母属)。本发明特别感兴趣的是糖酵母属、毕赤氏酵母属、曲霉属、木霉属、克鲁维氏酵母属的物种,尤其是乳克鲁维氏酵母(K.lactis)和果蝇克鲁维氏酵母(K.drosophilum)、假丝酵母属、汉逊氏酵母属、裂殖糖酵母属、Yarrowia和`金孢子菌属(Chrysoporium)。由于酵母的分类将来可能变化,所以为了本发明的目的,酵母定义应如Skinner等人,eds.(1980)Biology and Activities of Yeast(Soc.App.Bacteriol.Symp.Series No.9)描述的。

除前文所述的之外,本领域的技术人员可能熟悉酵母的生物学和酵母遗传学的操作。参见如Bacila等人,eds.(1978,Biochemistry andGenetics of Yeast,Academic Press,New York);和Rose和Harrison(1987,The Yeast(2nd ed.)Academic Press,London)。将外源DNA引入到酵母宿主中的方法是本领域中众所周知的。有众多方法可用于转化酵母。原生质球转化是由Hinnen等人(1978,Proc.Natl.Acad.Sci.USA 75:1919-1933)、Beggs(1978,Nature 275(5676):104-109)和Stinchcomb等人(EPO Publication No.45,573;在此处引入作为参考)介绍的。电穿孔是由Becker和Gaurante(1991,Methods Enzymol.194:182-187)介绍的,乙酸锂是由Gietz等人(2002,Methods Enzymol.350:87-96)和Mount等人(1996,Methods Mol Biol.53:139-145)介绍的。对于非-糖酵母的转化系统的综述,参见Wang等人(Crit RevBiotechnol.2001;21(3):177-218)。对于酵母基因工程的一般程序,参见Barr等人(1989,Yeast genetic engineering,Butterworths,Boston)。

除野生型酵母和真菌细胞之外,也有已进行突变和/或选择的酵母和真菌菌株,以增强外源基因的表达水平,结果所得的肽的纯度、翻译后加工,以及成熟肽的回收和纯度。外源肽的表达也可指向细胞分泌途径,如由胰岛素的表达所阐明的(参见Kjeldsen,2000,Appl.Microbiol.Biotechnol.54:277-286及在其中引用的参考文献)。通常,为了导致外源肽从酵母细胞中分泌,可应用源自酵母基因的分泌信号,如那些杀伤毒素(Stark和Boyd,1986,EMBO J.5:1995-2002)或α信息素(Kurjan和Herskowita,1982,Cell 30:933;Brake等人,1988,Yeast 4:S436)的基因的分泌信号。

关于通常的丝状真菌,遗传操作的方法可发现于Kinghorn和Turner(1992,Applied Molecular Genetics of Filamentous Fungi,Blackie Academic and Professional,New York)。适当载体的指南可发现于Martinelli和Kinghorn(1994,Aspergilus:50 years,Elsevier,Amsterdam)。

1.糖酵母

在糖酵母中,用于产生肽的适当的酵母载体包括YRp7(Struhl等人,Proc.Natl.Acad.Sci.USA 76:1035-1039,1978)、YEp13(Broach等人,Gene 8:121-133,1979)、POT载体(Kawasaki等人,U.S.Pat.No.4,931,373,在此处引入作为参考)、pJDB249和pJDB219(Beggs,Nature 275:104-108,1978)及其衍生物。用于酵母中的优选的启动子包括酵母糖酵解基因表达(Hitzeman等人,J.Biol.Chem.255:12073-12080,1980;Alber和Kawasaki,J.Mol.Appl.Genet.1:419-434,1982;Kawasaki,U.S.Pat.No.4,599,311)或醇脱氢酶基因(Young等人,Genetic Engineering of Microorganisms forChemicals,Hollaender等人,(eds.),p.355,Plenum,New York,1982;Ammerer,Meth.Enzymol.101:192-201,1983)的启动子和ADH2-4c启动子(Russell等人,Nature 304:652-654,1983;Irani和Kilgore,美国专利申请Ser.No.07/784,653,CA 1,304,020和EP 284044,在此处引入作为参考)。表达单位也可包括转录终止子。优选的转录终止子是TP I 1终止子(Alber和Kawasaki,如上)。

这种酵母-细菌穿梭载体的例子包括Yep24(Botstein等人(1979)Gene 8:17-24)、pC1(Brake等人(1984)Proc.Natl.Acad.Sci.USA81:4642-4646)和Yrp17(Stnichomb等人(1982)J.Mol.Biol.158:157)。此外,质粒表达载体可为高或低拷贝数目的质粒,该拷贝数目范围一般为约1个~约200个。在高拷贝数目酵母载体的情况下,在单个宿主中通常将有至少10个、优选地为至少20个且通常不超过约150个载体拷贝。依赖于选择的异源肽,高或低拷贝数目的载体依赖于载体和重组肽对宿主的作用均可为想要的。参见如Brake等人(1984)Proc.Natl.Acad.Sci.USA 81:4642-4646。本发明的DNA构建体也可通过整合型载体整合入酵母基因组中。这种载体的例子是本领域中公知的。参见如Botstein等人(1979)Gene 8:17-24。

选择适当的酵母和其他微生物宿主以实践本发明是在本领域的技术范围之内的。特别感兴趣的是糖酵母物种:啤酒糖酵母(S.cerevisae)、卡尔斯伯糖酵母(S.carlsbergensis)、糖化糖酵母(S.diastaticus)、S.douglasii、S.kluyveri、S.norbensis和卵形糖酵母(S.oviformis)。当选择酵母宿主细胞以表达想要的肽时,适当的宿主细胞可包括那些具有好的分泌能力、低的蛋白水解活性和总体活力等的。酵母和其他微生物通常可从各种来源获得,包括Yeast Genetic StockCenter,Department of Biophysics and Medical Physics,University ofCalifornia,Berkeley,Calif.;和美国典型培养物保藏中心(AmericanType Culture Collection),Manassas VA。至于综述,参见Strathern等人,eds.(1981,The Molecular Biology of the Yeast Saccharomyces,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.)。

将外源DNA引入到酵母宿主中的方法是本领域中众所周知的。

2.毕赤氏酵母

用Pichia methanolica作为宿主细胞对重组肽的生产公开于PCT申请WO 97/17450、WO 97/17451、WO 98/02536和WO 98/02565中。用于转化P.methanolica的DNA分子通常是作为双链的环状质粒制备的,该质粒在进行转化之前优选地进行线性化。对于P.methanolica中的肽生产,优选地是质粒的启动子和终止子是P.methanolica基因的,如P.methanolica醇利用基因(AUG1或AUG2)的。其他有用的启动子包括那些二羟丙酮合成酶(DHAS)、甲酸脱氢酶(FMD)和过氧化氢酶(CAT)基因的以及那些公开于美国专利No.5,252,726中的。为了促进DNA向宿主染色体中的整合,优选地是使质粒的整个表达区段在两端与宿主DNA序列相接。用于Pichia methanolica中的优选的选择标记是P.methanolica ADE2基因,该基因编码磷酸核糖-5-氨基咪唑羧化酶(phosphoribosyl-5-aminoimidazole carboxylase)(AIRC;EC 4.1.1.21),这使得ade2宿主细胞可在不存在腺嘌呤时生长。对于想要使甲醇的应用最小化的大规模工业过程,两个甲醇利用基因(AUG1和AUG2)均缺失的宿主细胞是优选的。对于分泌的肽的生产,液泡蛋白酶基因(PEP4和PRB1)缺失的宿主细胞是优选的。电穿孔可用于促进含有编码目标肽的DNA的质粒向P.methanolica细胞中的引入。优选的是用电穿孔转化P.methanolica细胞,该电穿孔应用指数衰变的电场强度为2.5~4.5kV/cm的脉冲电场,优选地为约3.75kV/cm,和1~40毫秒的时间常数(t),最优选地为约20毫秒。对于应用巴斯德毕赤氏酵母(Pichia pastoris)以进行大规模抗体片段生产的综述,参见Fischer等人(1999,Biotechnol Appl Biochem.30(Pt2):117-120)。

3.曲霉属

在曲霉属物种中表达肽的方法是本领域中众所周知的,包括但不局限于那些描述于Carrez等人,1990,Gene 94:147-154;Contreras,1991,Bio/Technology 9:378-381;Yelton等人,1984,Proc.Natl.Acad.Sci.USA 81:1470-1474;Tilburn等人,1983,Gene 26:205-221;Kelly和Hynes,1985,EMBO J.4:475-479;Ballance等人,1983,Biochem.Biophys.Res.Comm.112:284-289;Buxton等人,1985,Gene 37:207-214和U.S.Pat.No.4,935,349中的,在此处整体引入作为参考。用于曲霉属中的启动子的例子可发现于美国专利No.5,252,726。用于肽表达的曲霉属的菌株可发现于美国专利No.4,935,349。黑曲霉和米曲霉(Aspergillus oryzae)外源肽的商业产物可从Novoenzymes购得。

4.木霉

对于表达想要的肽,木霉具有优于其他重组宿主细胞物种的优点。该生物易于大量生长,且具有进行糖基化和有效地将高产量的重组哺乳动物肽分泌到培养基中的能力,从而使得对肽的分离相对容易。此外,表达的肽上的糖基化模式比在许多其他系统中表达的肽更与人的肽上的相似。然而,在这些细胞中表达的肽上的聚糖结构中仍然有差异。例如,末端唾液酸残基对于哺乳动物系统中肽的治疗功能是重要的,这是因为这些部分在聚糖结构末端的存在阻止了肽从哺乳动物血液中的清除。人们认为唾液酸化的分子增加的生物学半衰期的机制在于凝集素对它们的识别降低(Drickamer,1988,J.Biol.Chem.263:9557-9560)。然而,通常真菌细胞不将额外的末端唾液酸残基添加到肽上的聚糖上,且因此在真菌细胞中合成的肽是脱唾液酸化的。根据本发明,该缺陷可用在别处详细描述的本发明的体外聚糖重构方法进行弥补。

用作宿主以生产要进行重构的肽的木霉属物种包括T.reesei,如QM6a、ALKO2442或CBS383.78(Centraalbureau voorSchimmelcultures,Oosterstraat 1,PO Box 273,3740 AG Baarn,荷兰)或ATCC13631(美国典型培养物保藏中心,Manassas VA,10852,美国,模式));绿色木霉(T.viride)(如CBS189.79(det.W.Gams));T.longibrachiatum,如CBS816.68(模式);T.pseudokoningii(如MUCL19358;Mycotheque de l’Universite Catholique de Louvain);T.saturnisporum CBS330.70(模式);T.harzianum CBS316.31(det.W.Gams);T.virgatum(T.pseudokoningii)ATCC24961。最优选地,宿主为T.reesei,且更优选地为T.reesei菌株QM9414(ATCC26921)、RUT-C-30(ATCC56765)和源自QM9414的高生产性的突变体如VTT-D-79125(Nevalainen,Technical Research Centre of FinlandPublications 26,(1985),Espoo,芬兰)。

用DNA对木霉的转化是用本领域中公知的任何技术进行的,包括在欧洲专利No.EP0244234、Harkki(1989,Bio/Technology 7:596-601)和Uusitalo(1991,J.Biotech.17:35-50)中介绍的。木霉的培养是由前述工业规模发酵技术的大量经验所支持;例如参见Finkelstein,1992,Biotechnology of Filamentous Fungi:Technologyand Products,Butterworth-Heinemann,publishers,Stoneham,Mass。

5.克鲁维氏酵母

属于克鲁维氏酵母属的酵母已用作宿主生物以生产重组的肽。由该属酵母产生的肽特别地为凝乳酶(欧洲专利96 430)、奇异果甜蛋白(欧洲专利96 910)、白蛋白、白细胞介素-1β、TPA、TIMP(欧洲专利361 991)和具有治疗功能的白蛋白衍生物(欧洲专利413 622)。克鲁维氏酵母属中特别感兴趣的物种包括乳克鲁维氏酵母。

在克鲁维氏酵母属物种中表达重组肽的方法是本领域中众所周知的。在克鲁维氏酵母属中表达和分泌人重组肽的载体是本领域中公知的(Yeh,J.Cell.Biochem.Suppl.14C:68,Abst.H402;Fleer,1990,Yeast 6(特别期号):S449),重组肽转化和表达的程序也是公知的(Ito等人,1983,J.Bacteriol.153:163-168;van den Berg,1990,Bio/Technology 8:135-139;美国专利No.5,633,146、WO8304050A1、EP0096910、EP0241435、EP0301670、EP0361991,在此处全部整体引入作为参考)。对于通过基因导向和质粒穿梭对乳克鲁维氏酵母线性DNA质粒的遗传操作的综述,参见Schaffrath等人(1999,FEMSMicrobiol Lett.178(2):201-210)。

6.金孢子菌

最近已将真菌金孢子菌属用于表达外源重组肽。本领域的技术人员利用金孢子菌以表达外源肽的程序的描述可发现于WO 00/20555中(在此处整体引入作为参考)。特别适用于表达系统的物种包括,但不局限于C.botryoides、C.carmichaelii、C.crassitunicatum、C.europae、C.evolceannui、F.fastidium、C.filiforme、C.gerogiae、C.globiferum、C.globiferum var.articulatum、C.globiferum var.niveum、C.hirundo、C.hispanicum、C.holmii、C.indicum、C.inops、嗜角质金孢子菌(C.keratinophilum)、C.kreiselii、C.kuzurovianum、C.lignorum、C.lobatum、C.lucknowense、C.lucknowense Garg 27K、C.medium、C.medium var.spissescens、C.mephiticum、C.merdarium、C.merdarium var.roseum、C.minor、C.pannicola、短小金孢子菌(C.parvum)、C.parvum var.crescens、C.pilosum、C.peodomerderium、C.pyriformis、C.queenslandicum、C.sigleri、C.sulfureum、C.synchronum、C.tropicum、C.undulatum、C.vallenarense、C.vespertilium和C.zonatum。

7.其他

用于转化许旺氏酵母属(Schwanniomyces)的方法公开于欧洲专利394538中。用于转化Acremonium chrysogenum的方法由U.S.Pat.No.5,162,228公开。用于转化链孢霉属的方法由U.S.Pat.No.4,486,533公开。同样已知的是对粟酒裂殖糖酵母特异性的表达系统(欧洲专利385391)。在裂殖酵母粟酒裂殖糖酵母中表达肽的常规方法可发现于Giga-Hama和Kumagai(1977,Foreign gene expression infission yeast:Schizosaccharomyces pombe,Springer,Berlin)。

C.哺乳动物系统

如上所述,哺乳动物细胞一般产生N-聚糖结构的异源混合物,该N-聚糖在附着到三甘露糖核心上的额外的糖的数目和排列方面有变化。一般地,哺乳动物细胞产生具有复杂的聚糖结构的肽,如在图3右侧显示的。利用本发明的方法,可对在哺乳动物细胞中产生的肽进行重构以生成具有想要的糖基化的肽,该重构通过首先鉴定一级聚糖结构,然后再确定为了重构聚糖结构必须去除哪些糖而实现。如在此处所讨论的,要去除的糖将决定将使用何种切割酶,且因而重构过程的精确步骤将依赖于用作初始底物的一级聚糖结构而变化。用于对通常在哺乳动物细胞中产生的聚糖结构进行重构的示例性方案在图2中显示。哺乳动物细胞中的N-聚糖生物合成途径已进行了充分的表征(综述见Moremen,1994,Glycobiology 4:113-125)。已鉴定了许多聚糖合成所必需的酶,且已分离了在该酶途径中有缺陷的突变细胞系,包括中国仓鼠卵巢(CHO)细胞系Lec23(α-葡糖苷酶I缺陷)和Lec18(新的GlcNAc-TVIII)。由这些突变细胞产生的肽的糖基化模式相对于正常CHO细胞是改变的。如在此处所讨论的,可将这些和其他突变细胞中的糖基化缺陷应用于产生缺乏复杂聚糖结构的肽的目的。例如,由Lec23细胞产生的肽缺乏唾液酸残基,因而为了将聚糖结构减少到基本的三甘露糖核心或Man3GlcNAc4需要较少的酶操作。因而,由这些细胞产生的肽可充当聚糖重构的优选底物。本领域的技术人员可基于公知的方法分离或鉴定其他的糖基化-缺陷的细胞系,如描述于Stanley等人,1990,Somatic Cell Mol.Genet.,16:211-223中的方法。为了生成用于在此处描述的重构过程的优选肽底物的目的,可将那些鉴定的和尚未鉴定的糖基化缺陷细胞系的应用包括于本发明中。

用于在哺乳动物细胞中表达外源肽的表达载体是众多的,且是本领域中众所周知的。许多哺乳动物表达载体目前是商业上可从公司购得的,包括Novagen,Inc(Madison,WI)、Gene Therapy Systems(San Diego,CA)、Promega(Madison,WI)、ClonTech Inc.(PaloAlto,CA)和Stratagene(La Jolla,CA)等。

有几种特别擅长表达外源肽的哺乳动物细胞系。一般哺乳动物细胞系源自从哺乳动物中提取的已永生化的肿瘤细胞,即它们可在培养基中基本无限地复制。这些细胞系包括,但不局限于CHO(中国仓鼠卵巢,如CHO-K1;ATCC No.CCL 61)及其变体、NS0(小鼠骨髓瘤)、BNK、BHK 570(ATCC No.CRL 10314)、BHK(ATCC No.CRL1632)、Per.C6TM(永生化的人细胞,Crucell N.V,Leiden,荷兰)、COS-1(ATCC No.CRL 1650)、COS-7(ATCC No.CRL 1651)、HEK293、小鼠L细胞、T淋巴样细胞系、BW5147细胞和MDCK(Madin-Darby犬肾的)、HeLa(人的)、A549(人肺癌)、293(ATCCNo.CRL 1573;Graham等人,1977,Gen.Virol.36:59-72)、BGMK(水牛绿猴肾(Buffalo Green Monkey kidney)、Hep-2(人表皮样喉癌)、LLC-MK2(非洲绿猴肾、McCoy、NCI-H292(人肺粘液表皮样瘤管)、RD(横纹肌肉瘤)、Vero(非洲绿猴肾)、HEL(人胚胎肺)、人胎儿肺-Chang、MRC5(胚胎肺)、MRHF(人包皮)和WI-38(人胚胎肺)。在一些情况下,表达治疗性肽的细胞可为源自要治疗的患者的细胞,或者可源自另一种相关或无关的哺乳动物。例如,成纤维细胞可从哺乳动物皮肤组织中分离并在体外培养和转化。该技术商业上可从Transkaryotic Therapies,Inc.(Cambridge,MA)获得。几乎所有目前所用的细胞系均可从美国典型培养物保藏中心(ATCC,Manassas,VA)和BioWhittaker(Walkersville,Maryland)获得。

哺乳动物细胞可以用本领域众所周知的几种技术的任何一种用DNA进行转化。这种技术包括但不局限于磷酸钙转化(Chen和Okayama,1988;Graham和van der Eb,1973;Corsaro和Pearson,1981,Somatic Cell Genetics 7:603)、二乙氨乙基(DEAE)-葡聚糖转染(Fujita等人,1986;Lopata等人,1984;Selden等人,1986)、电穿孔(Neumann等人,1982;Potter,1988;Potter等人,1984;Wong和Neuman,1982)、阳离子脂质试剂转染(Elroy-Stein和Moss,1990;Feigner等人,1987;Rose等人,1991;Whitt等人,1990;Hawley-Nelson等人,1993,Focus 15:73;Ciccarone等人,1993,Focus 15:80)、反转录病毒(Cepko等人,1984;Miller和Baltimore,1986;Pear等人,1993;Austin和Cepko,1990;Bodine等人,1991;Fekete和Cepko,1993;Lemischka等人,1986;Turner等人,1990;Williams等人,1984;Miller和Rosman,1989,BioTechniques 7:980-90;Wang和Finer,1996,Nature Med.2:714-6)、1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物(polybrene)(Chaney等人,1986;Kawai和Nishizawa,1984)、微注射(Capecchi,1980)和原生质体融合(Rassoulzadegan等人,1982;Sandri-Goldin等人,1981;Schaffer,1980)等。通常,转化技术参见Sambrook等人(2001,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory,New York)和Ausubel等人(2002,Current Protocols in MolecularBiology,John Wiley&Sons,New York)。

最近已使昆虫细胞转化所常用的杆状病毒系统适合于稳定转化哺乳动物细胞(参见综述Koat和Condreay,2002,Trends Biotechnol.20:173-180及在其中引用的参考文献)。重组肽在培养的哺乳动物细胞中的生产公开于如U.S.Pat.No.4,713,339、4,784,950、4,579,821和4,656,134中。几个公司提供了转化和培养哺乳动物细胞的服务,包括Cell Trends,Inc.(Middletown,MD)。培养哺乳动物细胞的技术是本领域中众所周知的,且进一步可发现于Hauser等人(1997,Mammalian Cell Biotechnology,Walter de Gruver,Inc.,Hawthorne,NY)和Sambrook等人(2001,Molecular Cloning,A LaboratoryManual,Cold Spring Harbor)及在其中引用的参考文献中。

D.昆虫

昆虫细胞特别是培养的昆虫细胞可表达具有N-连接的聚糖结构的肽,该N-连接的聚糖结构是很少唾液酸化的,且通常包含在其上具有或不具有附着的额外的岩藻糖的甘露糖残基。存在于培养的昆虫细胞中产生的肽上的这类聚糖结构及其甘露糖聚糖的例子在图6中显示。在该情形中,可以存在或不存在核心岩藻糖,如果存在的话,该核心岩藻糖可通过几个不同的键连接到聚糖。

昆虫细胞中杆状病毒介导的表达对重组肽的生产已变为特别适合的(Altmann等人,1999,Glycoconjugate J.16:109-123)。在肽折叠和翻译后加工方面,昆虫细胞仅次于哺乳动物细胞。然而,如上文所注意到的,昆虫细胞中肽的N-糖基化与哺乳动物细胞中的N-糖基化在许多方面有差异,特别是昆虫细胞经常生成截短的聚糖结构,该聚糖结构包含仅含有3个或有时仅仅2个甘露糖残基的寡糖。这些结构可额外地由岩藻糖残基替代。

根据本发明,可首先通过用适当的岩藻糖苷酶可选择地去除任何替代的岩藻糖残基而在体外对昆虫细胞中产生的肽进行重构以生成具有想要的糖基化的肽。在去除岩藻糖残基后肽包含基本的三甘露糖核心结构的情况下,那么所有需要的是在体外向三甘露糖核心结构添加适当的糖以生成具有想要的糖基化的肽。在去除任何岩藻糖残基后肽在聚糖结构中可能仅含有2个甘露糖残基的情况下,可用甘露糖基转移酶和适当的供体分子如GDP-甘露糖添加第三个甘露糖残基,从而添加适当的残基以生成具有想要的糖基化的肽。任选地,也可从这些种类中生成单触角聚糖。

用杆状病毒转化昆虫细胞的规程是本领域中众所周知的。已出版了几本提供利用杆状病毒系统在昆虫细胞中表达肽的程序的书。这些书包括但不局限于Richardson(Baculovirus Expression Protocols,1998,Methods in Molecular Biology,39卷,Humana Pr)、O’Reilly等人(1994,Baculovirus Expression Vectors:A Laboratory Manual,Oxford Univ Press)和King和Possee(1992,The BaculovirusExpression System:A Laboratory Guide,Chapman&Hall)。此外,也有如Lucklow(1993,Curr.Opin.Biotechnol.4:564-572)和Miller(1993,Curr.Opin.Genet.Dev.3:97-101)的出版物。

也已授予了许多与外源蛋白质的杆状病毒表达系统相关的专利。这些专利包括但不局限于美国专利No.6,210,966(缺乏谷氨酰胺但含有铵盐的昆虫细胞培养基)、美国专利No.6,090,584(BVAC(杆状病毒人工染色体)生产重组肽的应用)、美国专利No.5,871,986(杆状病毒在哺乳动物细胞中表达重组核酸的应用)、美国专利No.5,759,809(在昆虫细胞中表达肽的方法和杀死昆虫的方法)、美国专利No.5,753,220(半胱氨酸蛋白酶基因缺陷型杆状病毒、其生产过程及用其生产经济的肽的过程)、美国专利No.5,750,383(杆状病毒克隆系统)、美国专利No.5,731,182(在哺乳动物细胞中表达重组核酸的非哺乳动物DNA病毒)、美国专利No.5,728,580(在昆虫细胞系中诱导单细胞悬浮的方法和培养基)、美国专利No.5,583,023(修饰的杆状病毒、其制备过程及其作为基因表达载体的应用)、美国专利No.5,571,709(修饰的杆状病毒及杆状病毒表达载体)、美国专利No.5,521,299(探测杆状病毒感染的寡核苷酸)、美国专利No.5,516,657(用于表达分泌型和膜结合型肽的杆状病毒载体)、美国专利No.5,475,090(编码增强对宿主昆虫的病毒感染的肽的基因)、美国专利No.5,472,858(昆虫幼虫中重组肽的生产)、美国专利No.5,348,886(在细菌中产生重组真核生物病毒的方法)、美国专利No.5,322,774(重组杆状病毒表达系统中的原核生物前导序列)、美国专利No.5,278,050(改善昆虫系统中重组基因的加工和分泌效率的方法)、美国专利No.5,244,805(杆状病毒表达载体)、美国专利No.5,229,293(重组杆状病毒)、美国专利No.5,194,376(能够以高水平产生重组肽的杆状病毒表达系统)、美国专利No.5,179,007(纯化重组肽的方法和载体)、美国专利No.5,169,784(杆状病毒双启动子表达载体)、美国专利No.5,162,222(杆状病毒早期启动子在稳定转化的昆虫细胞或重组杆状病毒中表达重组核酸的应用)、美国专利No.5,155,037(用于改善昆虫系统中重组核酸加工和分泌效率的昆虫信号序列)、美国专利No.5,147,788(杆状病毒载体及应用方法)、美国专利No.5,110,729(用杆状病毒载体在培养的细胞中产生肽的方法)、美国专利No.5,077,214(杆状病毒早期启动子在稳定转化的昆虫细胞中表达重组基因的应用)、美国专利No.5,023,328(鳞翅目(Lepidopteran)AKH信号序列)和美国专利No.4,879,236和4,745,051(产生重组杆状病毒表达载体的方法)。上述的专利全部在此处整体引入作为参考。

目前几个不同物种来源的昆虫细胞系应用于肽的表达中,且这些细胞系是本领域中众所周知的。目标昆虫细胞系包括但不局限于通常的双翅目和鳞翅目昆虫细胞、Sf9及其变体(秋季粘虫(fall armyworm)草地夜蛾(Spodoptera frugiperda))、Estigmene acrea、Trichoplusia ni、家蚕(Bombyx mori)、Malacosoma disstri、果蝇品系Kc1和SL2等及蚊子。

E.植物

作为肽生产者的植物细胞提供了不同的情况。尽管植物中产生的N-连接聚糖包含三甘露糖核心结构,但该五糖主链可包含如图5所示的几个不同的额外的糖。例如,在一种情况下,该三甘露糖核心结构是由β1,2连接的木糖残基和α1,3连接的岩藻糖残基取代的。此外,植物细胞也可产生Man5GlcNAc2结构。植物细胞中产生的肽由于在聚糖结构上存在核心α1,3木糖和岩藻糖而经常是高抗原性的,且当引入到哺乳动物中后由于不存在末端唾液酸残基而将快速地从血流中清除。因此,除非用在此处提供的方法对这些肽进行重构,否则通常认为它们不适合于用作哺乳动物中的治疗剂。尽管发现植物中表达的一些单克隆抗体在小鼠中是无免疫原性的,但可能的是该聚糖链由于埋藏在这些抗体的Fc区域而无免疫原性(Chargelegue等人,2000,Transgenic Res.9(3):187-194)。

根据在此处提供的说明,目前可能的是生成在植物细胞中产生的肽,其中在其上存在的增加数目的聚糖结构包含基本的三甘露糖核心结构或Man3GlcNAc4结构。这是通过用适当的糖苷酶的组合在体外切除额外的糖直到达到基本的三甘露糖核心结构或Man3GlcNAc4结构而实现的,该糖苷酶包括岩藻糖苷酶。这些切割反应也应该包括从结构中去除任何岩藻糖或木糖残基以消除最终的肽当引入哺乳动物中时的抗原性。具有抑制岩藻糖和木糖残基向三甘露糖核心结构添加的突变的植物细胞是本领域中公知的(von Schaewen等人,1993,PlantPhysiology 102:1109-1118)。本发明预期了这些细胞在生产具有缺乏岩藻糖和木糖的聚糖的肽中的应用。在产生了基本的三甘露糖核心或Man3GlcNAc4结构之后,然后可将额外的糖添加到其上以得到具有想要的糖基化的肽,该肽因此适合于哺乳动物中的治疗应用。

许多人认为转基因植物是药物肽精选的表达系统。潜在地,植物可提供便宜的重组肽来源。已估计植物中重组肽的生产成本可比在大肠杆菌中生产相同的肽的成本低10~50倍。尽管与动物相比植物中密码子使用有微小的差异,但这可通过调节重组DNA序列而得以补偿(参见Kusnadi等人,1997,Biotechnol.Bioeng.56:473-484;Khoudi等人,1999,Biotechnol.Bioeng.135-143;Hood等人,1999,Adv.Exp.Med.Biol.464:127-147)。此外,肽合成、分泌和翻译后修饰在植物和动物中是非常相似的,仅在植物糖基化中有细小的差异(参见Fischer等人,2000,J.Biol.Regul.Homest.Agents 14:83-92)。然后,来自转基因植物的产物也不大可能被动物病原体、微生物毒素和致癌序列污染。

植物细胞中重组肽的表达是本领域中众所周知的。除转基因植物之外,肽也可在转基因植物细胞培养物(Lee等人,1997,Mol.Cell.7:783-787)和用重组植物病毒接种的非转基因植物中产生。已出版了几本描述植物细胞的遗传转化过程的书:Potrykus(1995,Gene transferto plants,Springer,New York)、Nickoloff(1995,Plant cellelectroporation and electrofusion protocols,Humana Press,Totowa,New York)和Draper(1988,Plant genetic transformation,OxfordPress,Boston)。

目前已将几种方法用于用重组遗传材料稳定转化植物细胞。这些方法包括但不局限于农杆菌转化(Bechtold和Pelletier,1998;Escudero和Hohn,1997;Hansen和Chilton,1999;Touraev等人,1997)、生物弹法(微弹轰击法)(Finer等人,1999;Hansen和Chilton,1999;Shilito,1999)、原生质体电穿孔(Fromm等人,1985;Ou-Lee等人,1986;Rhodes等人,1988;Saunders等人,1989;Trick等人,1997)、聚乙二醇处理(Shilito,1999;Trick等人,1997)、in planta微注射(Leduc等人,1996;Zhou等人,1983)、种子吸涨(Trick等人,1997)、激光束(1996)和silicon carbide whiskers(Thompson等人,1995;U.S.Patent Appln.No.20020100077,在此处整体引入作为参考)。

许多种类的植物可进行外源肽的转化和表达。表达用于本发明的重构方法中的肽的特别感兴趣的植物包括,但不局限于拟南芥(Arabidopsis thalliana)、油菜籽(Brassica spp.;Ruiz和Blumwald,2002,Planta 214:965-969))、大豆(Glycine max)、向日葵(Helianthusunnuus)、油棕榈树(Elaeis guineeis)、落花生(花生,Arachis hypogaea;Deng等人,2001,Cell.Res.11:156-160)、椰子(Cocus nucifra)、蓖麻(Ricinus communis)、红花(Carthamus tinctorius)、芥菜(Brassicaspp.和Sinapis alba)、胡荽(Coriandrum sativum)、南瓜(Cucurbitamaxima;Spencer和Snow,2001,Heredity 86(Pt 6):694-702)、亚麻子/亚麻(Linum usitatissimum;Lamblin等人,2001,Physiol Plant112:223-232)、巴西坚果(Bertholletia excelsa)、杨柳料(Simmondsiachinensis)、玉米(Zea mays;Hood等人,1999,Adv.Exp.Med.Biol.464:127-147;Hood等人,1997,Mol.Breed.3:291-306;Petolino等人,2000,Transgenic Research 9:1-9)、紫花苜蓿(Khoudi等人,1999,Biotechnol.Bioeng.64:135-143)、烟草(Nicotiana tabacum;Wright等人,Transgenic Res.10:177-181;Frigerio等人,2000,PlantPhysiol.123:1483-1493;Cramer等人,1996,Ann.New York Acad.Sci.792:62-8-71;Cabanes-Macheteau等人,1999,Glycobiology 9:365-372;Ruggiero等人,2000,FEBS Lett.469:132-136)、canola(Bai等人,2001,Biotechnol.Prog.17:168-174;Zhang等人,2000,J.Anim.Sci.78:2868-2878))、马铃薯(Tacket等人,1998,J.Infect.Dis.182:302-305;Richter等人,2000,Nat.Biotechnol.18:1167-1171;Chong等人,2000,Transgenic Res.9:71-78)、紫花苜蓿(Wigdorovitz等人,1999,Virology 255:347-353)、豌豆(Pisum sativum;Perrin等人,2000,Mol.Breed.6:345-352)、水稻(Oryza sativa;Stoger等人,2001;Plant Mol.Biol.42:583-590)、棉花(Gossypium hirsutum;Kornyeyev等人,2001,Physiol Plant 113:323-331)、大麦(Hordeumvulgare;Petersen等人,2002,Plant Mol Biol 49:45-58);小麦(Triticumspp.;Pellegrineschi等人,2002,Genome 45:421-430)和豆(Vicia spp.,Saalbach等人,1994,Mol Gen Genet 242:226-236)。

如果想要在完整植物而不是培养的细胞中表达重组核酸,那么可首先用编码肽的DNA转化植物细胞,随后使植物再生。这包括一般对于每一种植物物种最适化的组织培养程序。对于许多物种,植物再生程序在本领域中是公知的。此外,本领域的技术人员可利用常规的实验发展对其他物种的规程。许多描述植物再生程序的实验室手册是可用的,包括但不局限于Smith(2000,Plant tissue culture:techniquesand experiments,Academic Press,San Diego)、Bhojwani和Razdan(1996,Plant tissue culture:theory and practice,Elsevier SciencePub.,Amsterdam)、Islam(1996,Plant tissue culture,Oxford&IBHPub.Co.,New Delhi,印度)、Dodds和Roberts(1995,Experimentsin plant tissue culture,New York:Cambridge University Press,Cambridge英国)、Bhojwani(Plant tissue culture:applications andlimitations,Elsevier,Amsterdam,1990)、Trigiano和Gray(2000,Plant tissue culture concepts and laboratory exercises,CRC Press,Boca Raton,Fla)和Lindsey(1991,Plant tissue culture manual:fundamentals and applications,Kluwer Academic,Boston)。

尽管从植物中纯化重组的肽可能是昂贵的,但已发展了几个系统以使该成本最小化。一种方法将合成的肽导向种子的胚乳,该肽在此胚乳中易于提取(Wright等人,2001,Transgenic Res.10:177-181,Guda等人,2000,Plant Cell Res.19:257-262和美国专利No.5,767,379,在此处整体引入作为参考)。一种可选择的方法是使重组肽与常规的植物产物如淀粉、粗粉或油共提取。在油料种子油菜中,油质蛋白-hurudin融合肽当在植物中表达时附着于种子的油体上,且可与油一起从植物种子中提取(Parmenter,1995,Plant Mol.Biol.29:1167-1180;美国专利No.5,650,554、5,792,922、5,948,682和6,288,304及美国申请2002/0037303,在此处将它们全部整体引入作为参考)。在该方法的一个变体中,使油质蛋白与对外源共表达的目标肽具有亲和力的肽融合(美国专利No.5,856,452,在此处整体引入作为参考)。

重组肽在植物质体如叶绿体中的表达生成了在其上不具有聚糖结构的肽,这与原核生物中的情形类似。然而,当在这种植物细胞器中表达时这种肽的产量是极其大的,因而这类表达系统可具有优于其他系统的优点。对于外源肽在高等植物质体中表达技术的一般综述,参见Hager和Beck(2000,Appl.Microbiol.Biotechnol.54:302-310及在其中引用的参考文献)。质体表达在烟草中是特别成功的(参见如Staub等人,2000,Nat.Biotechnol.18:333-338)。

F.转基因动物

将重组DNA引入到动物(如哺乳动物)的受精卵中可用转基因动物技术中的任何数目的标准技术来实现。参见如Hogan等人,Manipulating the Mouse Embryo:A Laboratory Manual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1986;和U.S.Pat.No.5,811,634,在此处整体引入作为参考。更一般地,重组DNA可通过前核微注射而引入到胚胎中(Gordon等人,1980,PNAS 77:7380-7384:Gordon和Ruddle,1981,Science 214:1244-1246;Brinster等人,1981,Cell 27:223-231;Costantini和Lacy,1981,Nature 294:92-94)。微注射具有可应用于大量物种中的优点。植入前胚胎也可用反转录病毒进行转化(Jaenisch和Mintz,1974,Proc.Natl.Acad.Sci.U.S.A.71:1250-1254;Jaenisch等人,1976,Hamatol Bluttransfus.19:341-356;Stuhlmann等人,1984,Proc.Natl.Acad.Sci.U.S.A.81:7151-7155)。反转录病毒介导的转化具有可将单拷贝的重组核酸添加到细胞中的优点,但它产生了高水平的镶嵌现象。最近,已应用了胚胎干细胞介导的技术(Gossler等人,1986,Proc.Natl.Acad.Sci.U.S.A.83:9065-9069)、完整染色体片段的转移(Lavitrano等人,1989,Cell57:717-723),且也已应用了与体外受精结合的配子转染(Lavitrano等人,1989,Cell 57:717-723)。已出版了几本公开这些技术的实验室程序的书:Cid-Arregui和Garcia-Carrancá(1998,Microiniectionand Transgenesis:Strategies and Protocols,Springer,Berlin)、Clarke(2002,Transgenesis Techniques:Principles and Protocols,HumanaPress,Totowa,NJ)和Pinkert(1994,Transgenic Animal Technology:A Laboratory Handbook,Academic Press,San Diego)。

一旦将重组DNA引入到卵中,则将卵温育短的时间段,然后转移到获得该卵的相同物种的假孕动物中(Hogan等人,见上文)。在哺乳动物的情况下,一般每次实验注射125个卵,其中大约三分之二将在程序中存活。将20个有生活力的卵转移到假孕的哺乳动物中,其中4~10个将发育为活的后代。一般地,后代的10-30%(在小鼠的情况下)携带有重组DNA。

尽管可将整个动物用作本发明肽的表达系统,但在一个优选的实施方案中,外源肽在动物的产物中积聚,该外源肽可以从该产物中收获而无需伤害该动物。在优选的实施方案中,外源肽积聚在乳、卵、毛发、血液和尿中。

如果重组肽积聚在动物的乳中,那么适当的哺乳动物为反刍动物、有蹄类动物、驯化的哺乳动物和产乳动物。特别优选的动物为山羊、绵羊、骆驼、母牛、猪、马、公牛和美洲驼(llamas)。生成在其乳中积聚重组肽的转基因母牛的技术是众所周知的:参见Newton(1999,J.Immunol.Methods 231:159-167)、Ebert等人(1991,Biotechnology9:835-838)和美国专利No.6,210,736、5,849,992、5,843,705、5,827,690、6,222,094,在此处将它们全部整体引入作为参考。可产生想要的重组肽的转基因动物的生成是商业上从GTC Biotherapeutics,Framingham,MA可获得的。

如果重组肽想要积聚在卵中,适当的鸟包括但不局限于鸡、鹅和火鸡。其他目标动物包括但不局限于鸟类其他物种、鱼、爬行动物和两栖动物。通过反转录病毒转化向鸡中引入重组DNA是本领域中众所周知的:Thoraval等人(1995,Transgenic Research 4:369-376)、Bosselman等人,(1989,Science 243:533-535)、Petropoulos等人(1992,J.Virol.66:3391-3397)、美国专利No.5,162,215,在此处整体引入作为参考。用重组DNA对鸡的成功转化也通过将DNA引入胚盘细胞并将这样转染的胚盘细胞引入胚胎而实现:Brazolot等人(1991,Mol.Reprod.Dev.30:304-312)、Fraster等人(1993,Iht.J.Dev.Biol.37:381-385)和Petitte等人(1990,Development 108:185-189)。已发展了高通量的技术来估计转基因鸡是否表达想要的肽(Harvey等人,2002,Poult.Sci.81:202-212,美国专利No.6,423,488,在此处整体引入作为参考)。利用重组DNA对鸡的反转录病毒转化,外源β-内酰胺酶积聚在鸡的蛋清中(Harvey等人,2002,Nat.Biotechnol.20(4):396-399)。在卵中产生外源肽的鸡的生产商业上可从AviGenics,Inc.,Athens GA购得。

G.细菌

在细菌中产生的重组表达的肽通常不是糖基化的。然而,能够使肽糖基化的细菌系统已变为显而易见的,因此将来可能在细菌中产生糖基化的重组肽。

许多细菌表达系统是本领域中公知的。优选的细菌物种包括但不局限于大肠杆菌和芽孢杆菌属(Bacillus)物种。

重组肽在大肠杆菌中的表达是本领域中众所周知的。基于大肠杆菌的表达系统的规程可发现于U.S.Appln No.20020064835、美国专利No.6,245,539、5,606,031、5,420,027、5,151,511和RE33,653等。转化细菌的方法包括但不局限于氯化钙(Cohen等人,1972,Proc.Natl.Acad.Sci.U.S.A.69:2110-2114;Hanahan,1983,J.Mol.Biol.166:557-580;Mandel和Higa,1970,J.Mol.Biol.53:159-162)和电穿孔(Shigekawa和Dower,1988,Biotechniques 6:742-751),以及那些描述于sambrook等人,2001(见上文)中的。对于微生物转化和表达系统的实验室规程的综述,参见Saunders和Saunders(1987,Microbial Genetics Applied to Biotechnology:Principles andTechniques of Gene Transfer and Manipulation,Croom Helm,London)、Pühler(1993,Genetic Engineering of Microorganisms,Weinheim,New York)、Lee等人(1999,Metabolic Engineering,Marcel Dekker,New York)、Adolph(1996,Microbial GenomeMethods,CRC Press,Boca Raton)和Birren和Lai(1996,Nonmammalian Genomic Analysis:A Practical Guide,AcademicPress,San Diego)。

对于大肠杆菌中肽表达的文献的一般综述,参见Balbas(2001,Mol.Biotechnol.19:251-267)。几个公司目前提供选择用于表达哺乳动物肽的细菌菌株,如大肠杆菌的RosettaTM菌株(Novagen,inc.,Madison,WI;具有通常不用于细菌细胞中的真核生物密码子的增强表达和增强的二硫键形成)。

H.细胞工程

从本发明的公开内容看显而易见的是,由细胞产生的起始材料越均一,在体外生成大量具有想要的糖基化的肽则越有效。因而,在此处公开的对宿主细胞进行基因工程操作以产生均一糖基化的肽作为体外酶促反应的起始材料提供了优于用具有在其上附着的异质聚糖结构的肽起始材料的显著优势。一种用于本发明的优选的肽起始材料是主要具有唯一由基本的三甘露糖核心结构组成的聚糖分子的肽。另一种优选的起始材料是Man3GlcNAc4。在重构过程后,该优选的肽将产生最大量的具有想要的糖基化的肽,因而改善了临床功效。然而,其他聚糖起始材料也适用于在此处描述的方法,例如在体外高甘露糖可易于用一系列甘露糖苷酶裁剪为基本的三甘露糖核心结构。如在别处描述的,也可应用其他聚糖起始材料,只要能切除所有无关的糖部分从而生成基本的三甘露糖核心结构或Man3GlcNAc4。因而,应用基因工程加工的细胞以生产本发明的肽的目的是为了生成具有尽量均一的在其上附着的聚糖结构的肽,其中聚糖结构可在体外进行重构以生成具有想要的糖基化的肽。这将导致这些肽生产成本的急剧降低。由于由该方法产生的糖肽主要具有相同的N-连接聚糖结构,所以可使生产后修饰规程标准化和最适化以产生更大的终产物批次间一致性。结果,最终完成的链产物的异质性可比那些目前可用的更低。该产物与现有技术领域的产物相比将具有改善的生物学半衰期和生物活性。可选择地,如果需要,本发明可用于引入有限且特定的异质性,如通过选择导致糖部分的差异添加的反应条件。

优选地(不是严格的必要条件),基因工程加工的细胞是可产生具有主要由基本三甘露糖核心结构或Man3GlcNAc4组成的聚糖结构的肽的细胞。最低限度的要求是:由基因工程加工的细胞产生的这些优选的结构的比例必须足以在重构规程后产生具有想要的糖基化的肽。

通常,可对任何真核细胞进行修饰以使其变为本发明的宿主细胞。首先,确定内源的和由生物产生的重组糖肽的糖基化模式以鉴定酶活性的添加/删除,其中该酶活性可导致产生基本的三甘露糖核心糖肽或Man3GlcNAc4糖肽。这一般需要删除用三甘露糖糖肽作为底物的糖基转移酶的活性和增加降解更复杂的N-连接聚糖以产生较短链的酶活性。此外,基因工程加工的细胞可产生高甘露糖聚糖,该聚糖可用甘露糖苷酶切割以产生想要的起始聚糖结构。该甘露糖苷酶可为在细胞体内有活性的(即对该细胞进行基因工程加工以产生该酶),或者它们可用于体外生产后的反应中。

对宿主细胞进行遗传修饰以改变表达的肽的糖基化性质的技术是众所周知的。参见如Altmann等人(1999,Glycoconjugate J.16:109-123)、Ailor等人(2000,Glycobiology 10(8):837-847)、Jarvis等人(In vitrogen Conference,March,1999,摘要)、Hollister和Jarvis(2001,Glycobiology 11(1):1-9)和Palacpac等人(1999,PNAS USA96:4697)、Jarvis等人(1998,Curr.Opin.Biotechnol.9:528-533)、Gerngross(U.S.Patent Publication No.20020137134),它们均公开了通过用糖基转移酶基因转染昆虫或植物细胞而使昆虫或植物细胞表达系统“哺乳动物化(mammalianize)”的技术。

遗传地改变大肠杆菌中表达的肽的糖基化性质的技术也是存在的。大肠杆菌已用来自细菌脑膜炎奈瑟氏球菌和固氮根瘤菌属的各种糖基转移酶进行了加工以在体内产生寡糖(Bettler等人,1999,Glycoconj.J.16:205-212)。进行了基因工程加工以超表达脑膜炎奈瑟氏球菌的β1,3N乙酰葡糖胺转移酶lgtA基因的大肠杆菌将有效地使外源乳糖糖基化(Priem等人,2002,Glycobiology 12:235-240)。

也已对真菌细胞进行了遗传修饰以使其产生外源的糖基转移酶(Yoshida等人,1999,Glycobiology 9(1):53-58;Kalsner等人,1995,Glycoconj.J.12:360-370;Schwientek和Ernst,1994,Gene145(2):299-303;Chiba等人,1995,Biochem J.308:405-409)。

因而,在一方面,本发明提供了使糖肽群体糖基化的细胞,从而产生的一部分糖肽具有基本的三甘露糖核心或Man3GlcNAc4结构。优选地,细胞产生具有唯一由基本三甘露糖核心组成的聚糖结构的肽。最低限度的要求是:具有基本的三甘露糖核心或Man3GlcNAc4结构的肽的比例必须足以在重构过程后产生具有想要的糖基化的肽。在该细胞中引入了一种或多种异源核酸表达单位,这些表达单位的每一个可包含一种或多种编码一种或多种目标肽的核酸序列。目标糖肽的天然形式可包含一种或多种复杂的N-连接聚糖或可简单地为高甘露糖聚糖。

该细胞可为任何类型的细胞,且优选地为真核细胞。该细胞可为哺乳动物细胞,如人的、小鼠的、大鼠的、兔的、仓鼠的或其他类型的哺乳动物细胞。当该细胞是哺乳动物细胞时,该哺乳动物细胞可源自或包含于非人类的转基因哺乳动物中,其中哺乳动物中的细胞编码想要的糖肽和生产想要的糖肽分子所必需的各种糖基化和糖苷酶酶类。此外,该细胞可为真菌细胞,优选地为酵母细胞,或者该细胞可为昆虫或植物细胞。类似地,当该细胞是植物细胞时,该植物细胞可源自或包含于转基因植物中,其中该植物编码想要的糖肽和生产想要的糖肽分子所必需的各种糖基化和糖苷酶酶类。

在一些实施方案中,宿主细胞可为表达一种或多种异源糖基转移酶和/或一种或多种异源糖苷酶的真核细胞,其中重组糖肽在宿主细胞中的表达导致具有基本三甘露糖核心作为在其上附着的主要聚糖结构的重组糖肽的产生。

在一些实施方案中,用于细胞中的异源糖基转移酶可选自任何已知的糖基转移酶,该糖基转移酶包括在例如Taniguchi等人(2002,Handbook of Glycosyltransferases and Related Genes,Springer,NewYork)的糖基转移酶家族列表中。

在其他的实施方案中,异源的糖基化酶可选自甘露糖苷酶1、甘露糖苷酶2、甘露糖苷酶3和其他甘露糖苷酶,包括但不局限于微生物甘露糖苷酶。关于用于本发明中的酶的额外的公开内容在别处提供。

在另外其他的实施方案中,宿主细胞可为真核细胞,其中已使一种或多种内源糖基转移酶和/或一种或多种内源糖苷酶失活,从而宿主细胞中重组糖肽的表达导致具有基本三甘露糖核心作为在其上附着的主要聚糖结构的重组糖肽的产生。

在额外的实施方案中,宿主细胞可表达异源糖基转移酶和/或糖苷酶,而同时一种或多种内源糖基转移酶和/或糖苷酶是失活的。内源糖基转移酶和/或糖苷酶可用本领域技术人员公知的任何技术进行失活,该技术包括但不局限于反义技术和涉及将核酸向宿主细胞基因组中插入的技术。在一些实施方案中,内源酶可选自GnT-I、甘露糖苷酶、木糖基转移酶、核心α1,3岩藻糖基转移酶、丝氨酸/苏氨酸O-甘露糖基转移酶等。

可选择地,可应用使肽天然地糖基化的表达系统,从而N-连接的聚糖主要是三甘露糖核心类型的或Man3GlcNAc4类型的。产生三甘露糖核心的细胞类型的一个例子是Sf9细胞。其他这种系统可通过分析天然地或重组地在细胞中表达的糖肽并选择那些展示想要的糖基化特征的系统而鉴定。本发明应该解释为包括任何或所有这些用于产生本发明的肽的细胞。

V.聚糖重构的和/或糖缀合的肽的纯化

如果修饰的糖蛋白质是细胞内产生的或分泌的,那么第一步可通过如离心或超滤去除微粒残渣或者宿主细胞裂解的片段;可选择地,蛋白质可用商业上可购得的蛋白质浓缩滤器进行浓缩,随后通过一个或多个步骤从其他杂质中分离肽变体,该步骤选自免疫亲和层析,离子交换柱分级分离(如二乙氨乙基(DEAE)或含有羧甲基或磺丙基的基质),在Blue-琼脂糖、CM Blue-琼脂糖、MONO-Q、MONO-S、晶状体凝集素-琼脂糖、WGA-琼脂糖、Con A-琼脂糖、醚Toyopearl、丁基Toyopearl、苯基Toyopearl或蛋白质A琼脂糖上的层析,SDS-PAGE层析,硅层析,层析聚焦,反相HPLC(RP-HPLC),利用如交联葡聚糖分子筛或大小排阻层析的凝胶过滤,在选择性结合肽的柱子上的层析,和乙醇、pH或硫酸铵沉淀,膜过滤和各种技术。

在培养物中产生的修饰的肽通常是通过从细胞、酶等的初始提取和随后通过一种或多种浓缩、盐析、水相离子交换或大小排阻层析步骤而分离的。此外,修饰的糖蛋白可通过亲和层析来纯化。然后可应用HPLC进行最后的纯化步骤。

可将蛋白酶抑制剂如苯甲基磺酰氟(PMSF)包括于前述的任何步骤中以抑制蛋白水解,且可包括抗生素以防止外来污染物的生长。

在另一个实施方案中,首先用商业上可购得的蛋白质浓缩滤器浓缩来自产生本发明修饰肽的系统的上清液,该浓缩滤器如Amicon或Millipore Pellicon超滤单位。在浓缩步骤之后,可将浓缩物应用于适当的纯化基质中。例如,适当的亲和基质可包含肽的配体、与适当的支持体结合的凝集素或抗体分子。可选择地,可应用阴离子交换树脂,如具有伸出的DEAE基团的基质或底物。适当的基质包括丙烯酰胺、琼脂糖、葡聚糖、纤维素或蛋白质纯化中常用的其他类型。可选择地,可应用阳离子交换步骤。适当的阳离子交换剂包括各种不溶性的基质,该基质包含磺丙基或羧甲基基团。磺丙基基团是特别优选的。

然后,可应用一种或多种RP-HPLC步骤以进一步纯化肽变体组合物,该RP-HPLC步骤应用疏水RP-HPLC介质如具有伸出的甲基或其他脂肪族基团的硅胶。前述纯化步骤的一些或全部的各种组合也可用于提供同质的修饰的糖蛋白。

从大规模发酵中得到的本发明修饰的肽可通过与由Urdal等人,J.Chromatog.296:171(1984)公开的类似的方法进行纯化。该参考文献描述了在制备型HPLC柱上纯化重组人IL-2的两个连续的RP-HPLC步骤。可选择地,可应用如亲和层析的技术以纯化修饰的糖蛋白。

VI.优选的肽和编码优选的肽的核酸

本发明包括编码各种肽和蛋白质的分离的核酸及其相似分子或片段。本发明不应被理解为以任何方式仅局限于这些肽在本发明方法中的应用,而应被理解为包括任何和所有对本领域技术人员而言目前可用的肽或将变为可用的肽。此外,本发明不应被理解为仅包括此处所列的肽的一个特定的核酸或氨基酸序列,而应被理解为包括每一个肽的任何和所有变体、同系物、突变体等。应该注意,当肽被鉴定为具有该肽序列中的突变或其他改变时,除非此处另有说明,如下确定改变或突变的氨基酸的编号方式,即这样成熟肽序列中的第一个氨基酸是第1位氨基酸。

优选的肽包括但不局限于人粒细胞集落刺激因子(G-CSF)、人干扰素α(IFN-α)、人干扰素β(IFN-β)、人凝血因子VII(FactorVII)、人凝血因子IX(FactorIX)、人促卵泡激素(FSH)、人促红细胞生成素(EPO)、人粒细胞/巨噬细胞集落刺激因子(GM-CSF)、人干扰素γ(IFN-γ)、人α-1-蛋白酶抑制剂(也已知为α-1-抗胰蛋白酶或α-1-胰蛋白酶抑制剂;A-1-PI)、葡糖脑苷脂酶、人组织型活化因子(TPA)、人白细胞介素-2(IL-2)、人凝血因子VIII(FactorVIII)、与人IgG免疫球蛋白Fc部分融合的75kDa的肿瘤坏死因子受体,商业上已知为ENBRELTM或ETANERCEPTTM(嵌合的TNFR)、人尿激酶(尿激酶)、特异性结合糖蛋白IIb/IIIa和玻连蛋白αvβ3受体的人/鼠嵌合的单克隆抗体的Fab片段,商业上已知为REOPROTM或ABCIXIMAB(嵌合的抗糖蛋白IIb/IIIa)、特异性结合人HER2的人/鼠嵌合的单克隆抗体,商业上已知为HERCEPTINTM(嵌合的抗-HER2)、特异性结合呼吸道合胞病毒F蛋白质或A抗原性位点的人/鼠嵌合的抗体,商业上已知为SYNAGISTM或PALIVIZUMAB(嵌合的抗-RSV)、特异性结合人B-细胞上的CD20的嵌合人/鼠单克隆抗体,商业上已知为RITUXANTM或RITUXAMAB(嵌合的抗-CD20)、人重组DNase(DNase)、特异性结合人肿瘤坏死因子的嵌合人/鼠单克隆抗体,商业上已知为REMICADETM或INFLIXIMAB(嵌合的抗-TNF)、人胰岛素、乙型肝炎病毒的表面抗原(adw亚型;HBsAg)和人生长激素(HGH)、α-半乳糖苷酶A(FabryzymeTM)、α-艾杜糖苷酶(AldurazymeTM)、抗凝血酶(抗凝血酶lII,AT-III)、人绒毛膜促性腺激素(hCG)、干扰素ω等。

本发明分离的核酸应该解释为包括编码任何上述的本发明肽的RNA或DNA序列及其修饰形式,该修饰形式包括对DNA或RNA的化学修饰以使得当无细胞时或与细胞结合时该核苷酸序列更稳定。作为非限制性的例子,含有至少一种硫代磷酸修饰的寡核苷酸已知可赋予该寡核苷酸对核酸酶增强的抗性。修饰的寡核苷酸的特定的例子包括那些含有硫代磷酸、磷酸三酯、甲基磷酸酯、短链烷基或环烷基糖间连接或短链杂原子或杂环糖间(“主链”)连接。此外,也可应用具有吗啉主链结构(美国专利No:5,034,506)或聚酰胺主链结构(Nielsen等人,1991,Science 254:1497)的寡核苷酸。

对核苷酸的化学修饰可用于增强细胞摄取核苷酸序列的效率和该核苷酸序列在细胞中表达的效率。本发明涉及对核苷酸序列进行修饰的任何和所有组合。

本发明不应解释为仅局限于在此处公开的核酸和氨基酸序列。如在别处更详细描述的,一旦阅读了本发明,则对本领域的技术人员显而易见的是编码本发明肽的其他核酸可通过在此处描述的程序(即定点诱变、移码突变等)和本领域中众所周知的技术来获得。

同样包括的是分离的编码肽片段的核酸,其中该肽片段保持了肽想要的生物学活性。此外,尽管在此处用特定的SEQ ID NOS公开了编码肽的示例性核酸,但本发明决不应解释为局限于在此处公开的任何特定的核酸。相反,本发明应该解释为包括与在此处公开的序列具有足够的百分比一致性的任何或所有核酸分子,从而这些核酸也编码具有在此处公开的想要的生物学活性的肽。同样涉及的是比全长核酸短的分离的核酸,其保持了其编码的肽的生物学活性。确定一个核酸和另一个之间的百分比一致性的方法与确定任何特定的优选肽的生物学活性的测定一样在文中其它地方公开。

同样如在文中其它地方公开的,任何其他程序可用于用本领域中众所周知的重组DNA方法生成本发明的肽的衍生物、突变体或变体形式,该重组DNA方法如描述于Sambrook等人(1989,MolecularCloning,A Laboratory Manual,Cold Spring Harbor LaboratoryPress,New York)和Ausubel等人(1997,Current Protocols inMolecular Biology,Green&Wiley,New York)。通过改变编码肽的DNA序列而引入肽或多肽中氨基酸改变的程序是本领域中众所周知的且同样描述于Sambrook等人(1989,见上文);Ausubel等人(1997,见上文)中。

本发明包括编码G-CSF、IFN-α、IFN-β、凝血因子VII、凝血因子IX、FSH、EPO、GM-CSF、IFN-γ、A-1-PI、葡糖脑苷脂酶、TPA、IL-2、凝血因子VIII、嵌合的TNFR、尿激酶、嵌合的抗-糖蛋白IIb/IIIa、嵌合的抗-HER2、嵌合的抗-RSV、嵌合的抗-CD20、DNase、嵌合的抗-TNF、人胰岛换素、HBsAg和HGH、的核酸,其中在其上共价连接了编码标记肽的核酸。即本发明包含嵌合的核酸,其中编码标记肽的核酸序列共价地与编码本发明的肽的核酸连接。这种标记肽是本领域中众所周知的,且包括如绿色荧光蛋白(GFP)、myc、myc-丙酮酸激酶(myc-PK)、His6、麦芽糖结合蛋白质(MBP)、流感病毒血凝素标记多肽、旗型(flag)标记多肽(FLAG)和谷胱甘肽-S-转移酶(GST)标记多肽。然而,本发明决不应解释为局限于编码上面所列的标记肽的核酸。相反,编码可以与这些标记肽以基本相似的方式发挥功能的肽的任何核酸序列均应解释为包括于本发明中。

包含编码标记肽的核酸的核酸可用于将本发明的肽定位于细胞、组织和/或整个生物(如哺乳动物胚胎)中,探测从细胞分泌的本发明的肽和研究该肽在细胞中的作用。进一步地,标记肽的添加促进了“标记的”肽的分离和纯化,从而本发明的肽可易于生产和纯化。

本发明包括下面优选的分离肽:G-CSF、IFN-α、IFN-β、凝血因子VII、凝血因子IX、FSH、EPO、GM-CSF、IFN-γ、A-1-PI、葡糖脑苷脂酶、TPA、IL-2、凝血因子VIII、嵌合的TNFR、尿激酶、嵌合的抗-糖蛋白IIb/IIIa、嵌合的抗-HER2、嵌合的抗-RSV、嵌合的抗-CD20、DNase、嵌合的抗-TNF、人胰岛素、HBsAg、HGH、α-半乳糖苷酶A、α-艾杜糖苷酶、抗凝血酶III、hCG和干扰素ω等。

本发明也应解释为包含本发明的肽(或编码该肽的DNA)的“衍生物”、“突变体”和“变体”,该衍生物、突变体和变体是在一个或多个氨基酸进行了改变的(或者当指编码该肽的核苷酸序列时,是在一个或多个碱基对进行了改变的),从而结果所得的肽(或DNA)与在此处列举的序列不同,但具有与在此处公开的肽相同的生物学性质,即该肽具有G-CSF、IFN-α、IFN-β、凝血因子VII、凝血因子IX、FSH、EPO、GM-CSF、IFN-γ、A-1-PI、葡糖脑苷脂酶、TPA、IL-2、凝血因子VIII、嵌合的TNFR、尿激酶、嵌合的抗-糖蛋白IIb/IIIa、嵌合的抗-HER2、嵌合的抗-RSV、嵌合的抗-CD20、DNase、嵌合的抗-TNF、人胰岛素、HBsAg和HGH的生物学/生物化学性质。

进一步包括的是保持了肽的想要的生物学活性的肽片段,而不管其长度。完全在技术人员技术范围之内的是分离比用于本发明中的任何肽的全长形式短的肽,及用在此处提供的测定确定哪些分离的片段保持了想要的生物学活性并因而是可用于本发明的肽。

本发明的蛋白质的生物学性质应该解释为包括但不局限于该肽在生物学测定和在此处描述的环境中发挥功能的能力,该功能如减少炎症、消除免疫反应、血液凝集、增加的造血产出、蛋白酶抑制、免疫系统调节、结合抗原、生长、减轻或治疗疾病、DNA切割等。

A.G-CSF

本发明包含修饰G-CSF上聚糖结构的方法。G-CSF是本领域中众所周知的由活化的T-细胞、巨噬细胞、内皮细胞和基质成纤维细胞产生的细胞因子。G-CSF主要在骨髓发挥作用以增加炎症白细胞的产生,并进一步发挥内分泌激素的功能以起始对在炎症功能过程中消耗的嗜中性粒细胞的补充。G-CSF在化学疗法后的骨髓替代中也具有临床应用。

重构的G-CSF肽可施用于如下患者,该患者选自接受骨髓抑制化学疗法的非骨髓癌患者、接受诱导或强化化学疗法的急性髓性白血病(AML)患者、接受骨髓移植的非骨髓癌患者、进行外周血祖先细胞收集的患者、患有严重慢性中性白细胞减少症的患者和患有持久性中性白细胞减少症且也患有晚期HIV感染的患者。优选地,患者是人患者。

尽管G-CSF对于哺乳动物特别是人的治疗性应用是重要的和有用的,但从重组细胞中生产G-CSF的现有方法导致如下产物,该产物具有相对短的生物学寿命、可潜在地导致免疫原性的不正确的糖基化模式、功能的丧失和对更大量和更频繁服药的需要以达到相同的效果等。

已分离和克隆了G-CSF,且其核酸和氨基酸序列分别如SEQ IDNO:1和SEQ ID NO:2所示(分别为图58A和58B)。本发明包含修饰G-CSF的方法,特别当其涉及G-CSF充当有效的和有功能的生物学分子的能力时。当利用本发明的公开内容和在此处的介绍时,技术人员易于理解本发明提供了修饰G-CSF的组合物和方法。

本发明进一步包含G-CSF变体,如在本领域中众所周知的。作为例子,但决不意味着限制本发明,在美国专利No.6,166,183中已描述了G-CSF变体,其中描述了包含赖氨酸残基的天然补体(complement)并进一步连接到一个或两个聚乙二醇分子上的G-CSF。此外,美国专利No.6,004,548、5,580,755、5,582,823和5,676,941描述了G-CSF变体,其中位置17、36、42、64和74上的一个或多个半胱氨酸残基由丙氨酸或丝氨酸替代。美国专利No.5,416,195描述了G-CSF分子,其中位置17上的半胱氨酸、位置27上的天冬氨酸和位置65和66上的丝氨酸分别由丝氨酸、丝氨酸、脯氨酸和脯氨酸替代。其他变体是本领域中众所周知的,且描述于如美国专利No.5,399,345中。

本发明修饰的G-CSF分子的表达和活性可用本领域中众所周知及描述于如美国专利No.4,810,643中的方法进行测定。作为例子,活性可用放射性标记的胸腺嘧啶摄取测定法进行测量。简言之,使来自健康供体的人骨髓用Ficoll-Hypaque(1.077g/ml,Pharmacia,Piscataway,NJ)进行密度分离(cut),且低密度的细胞悬浮于含有10%胎牛血清、谷氨酰胺和抗生素的Iscove氏培养基中(GIBCO,LaJolla,CA)中。使约2×104的人骨髓细胞与对照培养基或本发明的G-CSF在96-孔平底平板上在空气中5%的CO2于约37℃温育约2天。然后用0.5μCi/孔的3H-胸腺嘧啶(New England Nuclear,Boston,Mass.)对培养物脉冲处理约4小时,并以描述于如Ventua等人(1983,Blood 61:781)中的方法对摄取进行测量。与用对照化合物处理的骨髓细胞相比3H-胸腺嘧啶向人骨髓细胞中整合的增加是活性和有生活力的G-CSF化合物的指示。

B.IFNα、IFNβ和IFNω

本发明进一步包换换含重构和修饰IFNα、IFNβ和IFNω的方法。IFNα是重量为约18kDa的约20个肽的家族的部分。IFNω在结构和功能上非常类似于IFNα。当宿主对IFNα的免疫反应增长从而使得该治疗无效时,IFNω可用于治疗丙型肝炎病毒感染。抗IFNa的抗体不能与IFNω交叉反应。因而,当IFNα疗法不再可能时,可以应用IFNω继续治疗丙型肝炎。

共同已知为I型干扰素的IFNα、ω和IFNβ结合到相同的细胞受体上并引起相似的反应。I型IFN抑制病毒复制、增加NK细胞的裂解潜力、调节MHC分子的表达并抑制细胞增殖等。I型IFN已用作对病毒感染特别是肝炎病毒感染以及对多发性硬化的治疗剂。

如上所述I型IFN的现有组合物是对于调节异常免疫学反应和用作对各种疾病的治疗剂有用的化合物。然而,与包含糖基化的天然补体的天然细胞因子相比它们受到降低的能力和功能及有限的体内半衰期的阻碍。

重构的IFNα肽可施用于如下患者,该患者选自患有多毛细胞白血病的患者、患有恶性黑素瘤的患者、患有滤泡性淋巴瘤的患者、患有尖锐湿疣的患者、患有AIDS-相关的卡波西肉瘤的患者、患有丙型肝炎的患者、患有乙型肝炎的患者、患有人乳头瘤病毒感染的患者、患有慢性髓性白血病(CML)的患者、患有慢性相费城染色体(Ph)阳性慢性髓细胞性白血病的患者、患有非何杰金氏淋巴瘤(NHL)的患者、患有淋巴瘤的患者、患有膀胱癌的患者和患有肾癌的患者。优选地,患者是人患者。

重构的IFNβ肽可施用于如下患者,该患者选自患有多发性硬化(MS)的患者、患有乙型肝炎的患者、患有丙型肝炎的患者、患有人乳头瘤病毒感染的患者、患有乳腺癌的患者、患有脑癌的患者、患有结肠直肠癌的患者、患有肺纤维化的患者和患有类风湿关节炎的患者。优选地,患者是人患者。

重构的IFNω肽可施用于如下患者,该患者选自患有多毛细胞白血病的患者、患有恶性黑素瘤的患者、患有滤泡性淋巴瘤的患者、患有尖锐湿疣的患者、患有AIDS-相关的卡波西肉瘤的患者、患有丙型肝炎的患者、患有乙型肝炎的患者、患有人乳头瘤病毒感染的患者、患有慢性髓性白血病(CML)的患者、患有慢性相费城染色体(Ph)阳性慢性髓细胞性白血病的患者、患有非何杰金氏淋巴瘤(NHL)的患者、患有淋巴瘤的患者、患有膀胱癌的患者和患有肾癌的患者。优选地,患者是人患者。

IFNα的原型核苷酸和氨基酸序列在此处分别以SEQ ID NO:3和SEQ ID NO:4提出(分别为图59A和59B)。IFNω的原型核苷酸和氨基酸序列在此处分别以SEQ ID NO:74和SEQ ID NO:75提出(分别为图59C和59D)。IFNβ包含约20kDa的单基因产物,其核酸和氨基酸序列在此处分别以SEQ ID NO:5和SEQ ID NO:6提出(分别为图60A和60B)。本发明不局限于此处的核苷酸和氨基酸序列。本领域的技术人员将易于理解天然地或作为加工的衍生物存在许多IFNα的变体。类似地,已对IFNβ进行修饰以实现更有利的治疗性质。修饰的I型IFN的例子是本领域中众所周知的(参见表9),且描述于如美国专利6,323,006中,其中半胱氨酸-60被酪氨酸替代,也描述于如美国专利No.4,737,462、4,588,585、4,545,723和6,127,332中,其中描述了具有多种氨基酸替代的IFNβ。此外,美国专利No.4,966,843、5,376,567、5,795,779描述了IFNα-61和IFNα-76。美国专利No.4,748,233和4,695,543描述了IFNαgx-1,而美国专利No.4,975,276描述了IFNα-54。此外,美国专利No.4,695,623、4,897,471、5,661,009和5,541,293均描述了代表在提交日期已知的所有变体的一致IFNα序列。尽管I型IFN及其变体的该列表决不是无遗漏的,但本领域的技术人员易于理解本发明包含已知的或将来发现的IFNβ和IFNα分子、衍生物和变体。

表9.干扰素-α同种型

  α型  AA特征  1a  A174  1b  V114  2a  K23-H34  2b  R23-H34  2c  R23-R34  4a  A51-E114  4b  T51-V114  7a  M132-K159-G161  7b  M132-Q159-R161  7c  T132-K159-G161  8a  V98-L99-C100-D101-R161  8b  S98-C99-V100-M101-R161  8c  S98-C99-V100-M101-D161Δ(162-166)  10a  S8-L89  10b  T8-I89  14a  F152-Q159-R161  14b  F152-K159-G161  14c  L152-Q159-R161  17a  P34-S55-I161  17b  H34-S55-I161  17c  H34-S55-R161  17d  H34-P55-R161  21a  M96  21b  L96

在重组细胞中表达IFN的方法是本领域中众所周知的,且易于用如下技术实现,该技术描述于如美国专利No.4,966,843和Sambrook等人(2001,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory Press,New York)和Ausubel等人(1997,CurrentProtocols in Molecular Biology,Green&Wiley,New York)。

确定由本发明修饰的I型IFN的生物学活性的测定法是本领域的技术人员众所周知的。例如,描述于Rubinstein等人(1981,Journalof Virology 37:755-758)中的测定法通常用于通过测量细胞群体中的病毒感染致细胞病变效应而确定I型IFN的作用。该方法仅是本领域中许多已知用于测定I型IFN的生物学功能的方法之一。

C.凝血因子VIIa

本发明进一步包含重构和修饰凝血因子换换VII的方法。血液凝结途径是包含许多事件的复杂反应。该途径中的一个中间事件是凝血因子VII,其是通过在组织因子和钙离子存在时将凝血因子X转变为Xa而参与血液凝结的外在途径的酶原(活化后为凝血因子VIIa)。凝血因子Xa然后在凝血因子Va、钙离子和磷脂存在时将凝血酶原转变为凝血酶。凝血因子X向凝血因子Xa的活化是内在和外在血液凝结途径所共有的事件,因此凝血因子VIIa可用于治疗具有凝血因子VIII缺陷或抑制的患者。也有证据表明凝血因子VIIa也可参与内在途径,因此增加了凝血因子VII在血液凝结中作用的突出性和重要性。

凝血因子VII是分子量约50kDa的单链糖蛋白。在该形式时,该因子在血液中以无活性的酶原进行循环。凝血因子VII向凝血因子VIIa的活化可由几种不同的血浆蛋白酶催化,如凝血因子XIIa。凝血因子VII的活化导致重链和轻链通过至少一个二硫键结合在一起。进一步地,描述了不能转变为凝血因子VIIa的修饰的凝血因子VII分子,且该分子可用作抗凝结药物,如在血凝块、血栓等情况下。鉴于凝血因子VII在血液凝结途径中的重要性及其可用作对增加和降低的凝结水平的治疗,那么具有以下性质的分子将是有利的且可用于对血液凝结病症的治疗,该分子具有较长的生物学半衰期、增加的能力,且通常具有与在健康人体中合成和分泌的野生型凝血因子VII更相似的治疗性质。

重构的凝血因子VII肽可施用于如下患者,该患者选自具有流血发作的血友病患者;患有A型血友病的患者;患有B型血友病的患者;患有A型血友病的患者,其中该患者也具有抗凝血因子VIII的抗体;患有B型血友病的患者,其中该患者也具有抗凝血因子IX的抗体;患有肝硬化的患者;具有同位肝移植的硬化患者;具有上胃肠流血的硬化患者;具有骨髓移植的患者和具有肝切除的患者。优选地,患者是人患者。

凝血因子VII已进行了克隆和测序,且其核酸和氨基酸序列在此处以SEQ ID NO:7和SEQ ID NO:8提供(分别为图61A和61B)。

本发明决不应该解释为局限于在此处提出的凝血因子VII核酸和氨基酸序列。凝血因子VII的变体描述于如美国专利No.4,784,950和5,580,560中,其中赖氨酸-38、赖氨酸-32、精氨酸-290、精氨酸-341、异亮氨酸-42、酪氨酸-278和酪氨酸-332由各种氨基酸替代。进一步地,美国专利No.5,861,374、6,039,944、5,833,982、5,788,965、6,183,743、5,997,864和5,817,788描述了不能进行切割以形成凝血因子VIIa的凝血因子VII变体。技术人员可认识到血液凝结途径及其中凝血因子VII的作用是众所周知的,因此在本发明中包括许多如上所述的天然存在的和加工的变体。

表达和确定凝血因子VII的活性的方法是本领域中众所周知的,并且描述于如美国专利No.4,784,950中。简言之,凝血因子VII或其变体的表达可在各种原核生物和真核生物系统中实现,包括大肠杆菌、CHO细胞、BHK细胞、应用杆状病毒表达系统的昆虫细胞,它们全部是本领域中众所周知的。

对根据本发明的方法制备的修饰的凝血因子VII的活性的测定是本领域中众所周知的。作为非限制性的例子,Quick等人(HemorragicDisease and Thrombosis,2nd ed.,Leat Febiger,Philadelphia,1966)描述了用于确定根据本发明的方法制备的凝血因子VII分子的生物学活性的一步凝结测定法(one-stage clotting assay)。

D.凝血因子IX

本发明进一步包含重构和/或修饰凝血因子IX的方法。如上所述,凝血因子IX在血液凝结级联中是至关重要的。身体中凝血因子IX的缺陷是一类血友病(B型)的特征。对该疾病的治疗通常局限于输入凝血因子IX的人血浆蛋白质浓缩物。然而,除操作时间和花费的缺点之外,血液浓缩物的输入涉及向受体传递病毒性肝炎、获得性免疫缺陷综合症或血栓栓塞疾病的危险。

尽管已证明凝血因子IX本身对于治疗应用是重要和有用的化合物,但从重组细胞产生凝血因子IX的现有方法(美国专利No.4,770,999)导致如下产物,该产物具有相当短的生物学寿命、可潜在导致免疫原性的不正确的糖基化模式、功能的丧失和对更大量和更频繁服药的需要以达到相同的效果等。

重构的凝血因子IX肽可施用于如下患者,该患者选自具有流血发作且也患有B型血友病的血友病患者、患有B型血友病的患者、患有B型血友病且也具有抗凝血因子IX的抗体的患者、患有肝硬化的患者、具有同位肝移植的硬化患者、具有上胃肠流血的硬化患者、具有骨髓移植的患者和具有肝切除的患者。也可施用重构的凝血因子IX肽以控制和/或预防患有B型血友病、先天性凝血因子IX不足或克里斯马斯病的患者中的出血发作。也可对患者施用重构的凝血因子IX肽以控制和/或预防外科手术过程中患者中的出血发作。优选地,患者是人患者。

凝血因子IX的核酸和氨基酸序列在此处以SEQ ID NO:9和SEQID NO:10提出(分别为图62A和62B)。本发明决不局限于在此处提出的序列。凝血因子IX变体是本领域中众所周知的,如描述于美国专利No.4,770,999,其中第一个位置的酪氨酸由丙氨酸替代的5,521,070,其中凝血因子Ⅺ连接到烯化氧基团上的美国专利No.6,037,452,以及其中编码凝血因子IX的DNA在至少一个剪接位点进行修饰的美国专利No.6,046,380中的。如在此处证明的,凝血因子IX的变体是本领域中众所周知的,且本发明的公开内容包含那些已知的或将来可发展或发现的变体。

确定根据本发明的方法制备的修饰的凝血因子IX的方法可用上述的方法实现,或者此外用本领域中众所周知的方法实施,如一步活化的局部组织促凝血酶原激酶时间测定,如描述于Biggs(1972,Human Blood Coagulation Haemostasis and Thrombosis(Ed.1),Oxford,Blackwell,Scientific,pg.614)中的。简言之,为了测定根据本发明的方法发展的凝血因子IX分子的生物学活性,可用等体积的活化的局部组织促凝血酶原激酶试剂、用本领域中众所周知的无菌静脉切开放血术技术从B型血友病患者中分离的凝血因子IX缺陷型血浆和作为标准或样品的正常收集的血浆进行测定。在该测定中,1单位的活性定义为在1毫升正常收集的血浆中存在的该量。进一步地,可进行基于凝血因子IX减少从凝血因子IX缺陷型患者的血浆凝结时间至正常时间的能力的测定法,如描述于Proctor和Rapaport(1961,Amer.J.Clin.Path.36:212)中的。

E.FSH

本发明进一步包括重构和/或修饰FSH的方法。人的生殖功能部分是由异二聚体的人糖蛋白激素家族控制的,该家族具有共同的92个氨基酸的糖蛋白α亚基,但在其激素特异性的β亚基上有差异。该家族包括促卵泡激素(FSH)、黄体生成素(LH)、促甲状腺素或促甲状腺激素(TSH)和人绒毛膜促性腺激素(hCG)。人FSH和LH在治疗上可用于调节人类女性中与生殖相关的代谢的各个方面。例如,部分从尿中纯化的FSH可临床地用于刺激无卵性综合症或黄体期缺陷的无卵性妇女中卵泡的成熟。黄体生成素(LH)和FSH可组合地用于刺激卵泡的发育以进行体外受精。FSH在生殖循环中的作用是充分已知的,从而允许其进行治疗应用,但部分由于来自天然来源的制剂的异质性和不纯而遇到了困难。该异质性归因于糖基化模式中的变化。

FSH在体外受精和对体内受精的刺激中均是有价值的工具,但如上所述,其临床功效受到蛋白质糖基化中的不一致性的阻碍。因此明显的是重构FSH的方法将对于生殖科学具有巨大的益处。

重构的FSH肽可施用于如下患者,该患者选自进行子宫内授精(IUI)的患者、进行体外受精(IVF)的患者和不育性患者。也可施用重构的FSH肽以诱导或增加患者中的排卵;刺激患者中卵泡的发育;诱导患者中的配子形成的卵泡生长;刺激、诱导或增加患者中的卵泡发育和随后的排卵或治疗患者中的不育。优选地,患者是人女性患者。也可将重构的FSH肽施用于患有垂体缺陷的患者或者青春期中的患者。优选地,患者是人男性患者。

FSH已进行了克隆和测序,其核酸和氨基酸序列在此处分别以SEQ ID NO:11、SEQ ID NO:12(α亚基)和分别以SEQ ID NO:13和SEQ ID NO:14(β亚基)提出(分别为图63A、63B、63C和63D)。技术人员将易于理解本发明不局限于在此处描述的序列,这是因为FSH的变体是本领域中众所周知的。作为非限制性的例子,美国专利No.5,639,640描述了包含两个不同氨基酸序列的β亚基,而美国专利No.5,338,835描述了包含额外的氨基酸序列的β亚基,该额外的氨基酸序列源自人绒毛膜促性腺激素β亚基并且长约27个氨基酸。因此,本发明包含天然的和由人类手工加工的FSH变体,它们均是本领域中众所周知的。

在原核和真核细胞两者中表达FSH的方法是本领域中众所周知的,且大量描述于文献中(美国专利No.4,840,896、4,923,805、5,156,957)。进一步地,估计本发明重构的FSH分子的生物学活性的方法是本领域中众所周知的,且描述于如美国专利No.4,589,402中,其中描述了非人的灵长类和人被试者中确定FSH对生育力、卵的产生和怀孕率的影响的方法。

F.EPO

本发明进一步包含重构和/或修饰EPO的方法。EPO是约34kDa的酸性糖蛋白,且可以以3种天然形式存在:α、β和脱唾液酸化的。α和β形式仅在糖成分上有细微差异,但具有相同的能力、生物学活性和分子量。脱唾液酸化形式是去除了末端唾液酸的α或β形式。在健康状态时EPO以非常低的浓度存在于血浆中,其中组织从现有数目的红细胞中接受足够的氧化。该正常的浓度足以刺激通过正常衰老损失的红血细胞的替代。循环中促红细胞生成素的量在当循环中由血细胞转运的氧减少时的低氧状况下是增加的。低氧可由通过出血造成的大量血液丧失、红血细胞由于过度暴露于放射中的破坏、由于高海拔或长期的人事不省导致的氧摄入的减少或各种形式的贫血而导致。因此EPO是在放射治疗、贫血和其他危害生命的状况后补充红血细胞的有用化合物。

重构的EPO肽可施用于如下患者,该患者选自患有贫血的患者、具有慢性肾机能不全的贫血患者、具有末期肾病的贫血患者、进行透析的贫血患者、具有慢性肾衰竭的贫血患者、贫血性叠氮胸苷治疗的HIV感染患者、具有非骨髓癌和进行化学疗法的贫血患者以及安排进行非心脏非血管外科手术的贫血患者。也可将重构的EPO肽施用于进行外科手术的患者以减少同种异体输血的需要。也可将重构的EPO肽施用于预期有显著的血液丧失而具有增加的手术期间输血风险的患者。优选地,患者是人患者。

根据EPO在辅助从各种疾病和病症恢复中的重要性,本发明可用于产生具有天然的且因此更有效的糖成分的EPO。目前所合成的EPO缺乏完全的糖基化,因此由于其在体内的短寿命而必须更频繁地且以更高的剂量给予。本发明也提供了PEG化EPO分子的生产,该EPO分子与可通过使所需的糖形式最大化所得的EPO分子相比具有大大改进的半衰期。

EPO已进行了克隆和测序,且其核苷酸和氨基酸序列在此处分别以SEQ ID NO:15和SEQ ID NO:16提出(分别为图64A和64B)。本领域的技术人员易于理解在此处提出的序列仅是编码和包含EPO的序列的例子。作为例子,美国专利No.6,187,564描述了包含两个或多个EPO肽的氨基酸序列的融合蛋白质,美国专利No.6,048,971和5,614,184描述了在位置101、103、104和108具有氨基酸替代的突变EPO分子。美国专利No.5,106,954描述了截短的EPO分子,且美国专利No.5,888,772描述了在位置33、139和166具有替代的EPO类似物。因此,技术人员将认识到本发明包含EPO和EPO衍生物和变体,这些是在文献和本领域中整体充分证明的。

此外,在细胞中表达EPO的方法是本领域中众所周知的。如在美国专利No.4,703,008、5,688,679和6,376,218等中示例的,EPO可在原核生物和真核生物表达系统中表达。测定EPO的生物学活性的方法同样是本领域中众所周知的。作为例子,Krystal测定(Krystal,1983,Exp.Hematol.11:649-660)可用于确定根据本发明的方法制备的EPO的活性。简言之,该测定测量促红细胞生成素对完整小鼠脾细胞的作用。用苯肼处理小鼠以刺激促红细胞生成素反应性红血细胞祖先细胞的产生。在处理后,获取脾,将完整的脾细胞分离并使其与各种量的野生型促红细胞生成素或在此处描述的促红细胞生成素蛋白质进行温育。在过夜温育后,添加3H-胸腺嘧啶并测量其向细胞DNA中的整合。3H-胸腺嘧啶整合的量指示了通过促红细胞生成素与其细胞受体的相互作用导致的促红细胞生成素刺激的红血细胞的生产。本发明的促红细胞生成素蛋白质的浓度以及野生型促红细胞生成素的浓度通过本领域中众所周知的竞争性放射免疫测定方法进行了定量。特定的活性以在Krystal测定中测量的国际单位除以由放射免疫测定测量的免疫沉淀性蛋白质的微克数而计算。

已报道了几个具有不同糖基化模式的不同的突变EPO。许多具有改进的网状细胞增多活性的刺激,而不影响该肽在动物血流中的半衰期。预期突变的EPO肽可以替代天然的EPO肽用于此处所述的任何聚糖重构、糖PEG化和/或糖缀合实施方案中。优选的EPO突变列于下表中,但不局限于列于下表中的那些(参见如Chern等人,1991,Eur.J.Biochem.202:225-229;Grodberg等人,1993,Eur.J.Biochem.218:597-601;Burns等人,2002,Blood 99:4400-4405;美国专利No.5,614,184;GenBank Accession No.AAN76993;O’Connell等人,1992,J.Biol.Chem.267:25010-25018;Elliott等人,1984,Proc.Natl.Acad.Sci.U.S.A.81:2708-2712;Biossel等人,1993,J.Biol.Chem.268:15983-15993)。最优选的EPO突变是Arg139到Ala139,Arg143到Ala143和Lys154到Ala154。制备这些突变的优选天然EPO形式是165aa的形式,其描述于图65中;然而也可应用其他EPO的天然形式。最后,描述于表10中的突变可以相互或与其他突变组合,以制备用于本发明中的EPO肽。

表10.EPO突变

  突变换换  引用文献  注释  Arg139到Ala139  J.Biol.Chem.  269:22839(1994)  生物测定中120%到150%的增加的活性  Arg143到Ala143  生物测定中比天然EPO增加的活性  Lys154到Ala154  J.Biol.Chem.  269:22839(1994)  生物测定中120%到150%的增加的活性  Ser126到Met126  Met54到Leu54  美国专利No.4,385,260  Met54到Leu54  美国专利No.4,385,260  Asn38到Gln38  Δ1-30  Ser132Leu132到  Asn132Phe132  Pro149到Gln149  Funakoshi等人,1993,  Biochem.Biophys.Res.  Commun.195:717-722.  Genbank Accession No.  AAD13964.  从肝细胞癌分离的突变型  Gly101到Ala101  美国专利No.5,615,184  J.Biol.Chem.  269:22839(1994)  生物测定中120%到150%的增加的活性  Ser147到Ala147和/  或Ile146到Ala146  Wen等人,1994,J.Biol.  Chem.269:22839-22846.  导致增加的生物活性的突变  Ser126到Thr126  J.Biol.Chem.  267:25010(1992)

GGM-CSF

本发明包含修饰GM-CSF的方法。GM-CSF是本领域中众所周知的由活化的T-细胞、巨噬细胞、内皮细胞和基质成纤维细胞产生的细胞因子。GM-CSF主要在骨髓发挥作用以增加炎症白细胞的产生,并进一步发挥内分泌激素的功能以起始对在炎症功能过程中消耗的嗜中性粒细胞的补充。GM-CSF进一步是巨噬细胞刺激因子且促进Lagerhans细胞向树突细胞的分化。与G-CSF类似,GM-CSF在化学疗法后的骨髓替代中也具有临床应用。

尽管已证明G-CSF本身是治疗性应用的重要和有用化合物,但从重组细胞中生产G-CSF的现有方法导致如下产物,该产物具有相对短的生物学寿命、可潜在地导致免疫原性的不正确的糖基化模式、功能的丧失和对更大量和更频繁服药的需要以达到相同的效果等。

重构的GM-CSF肽可施用于如下患者,该患者选自患有急性髓细胞性白血病(AML)或急性非淋巴细胞性白血病(ANLL)的患者、进行白细胞提取法以从外周血中收集造血祖先细胞的患者、进行自体外周血祖先细胞移植的患者、进行自体骨髓移植的非何杰金氏淋巴瘤(NHL)患者、进行自体骨髓移植的何杰金氏病患者和进行自体骨髓移植的急性成淋巴细胞性白血病(ALL)患者。也可将重构的GM-CSF肽施用于患者以加快骨髓植入、缩短化学疗法后嗜中性粒细胞恢复的时间、调动造血祖先细胞进入外周血以通过白细胞提取法进行收集或者在自体或同种异体骨髓移植(BMT)后促进骨髓重建。也可将重构的GM-CSF肽施用于骨髓移植失败或骨髓植入延迟的患者。优选地,患者是人患者。

已分离和克隆了GM-CSF,且其核酸和氨基酸序列分别如SEQ IDNO:17和SEQ ID NO:18所提出的(分别为图66A和66B)。本发明包含修饰GM-CSF的方法,特别当涉及GM-CSF充当有效的和有功能的生物学分子的能力时。当利用本发明的公开内容和在此处的介绍时,技术人员易于理解本发明提供了修饰GM-CSF的组合物和方法。

本发明进一步包含GM-CSF变体,如在本领域中众所周知的。作为例子,但决不意味着限制本发明,在WO 86/06358中已描述了GM-CSF变体,其中的蛋白质修饰为一种替代的四级结构。进一步地,美国专利No.6,287,557描述了为了基因治疗的应用与疱疹病毒的基因组连接的GM-CSF核酸序列。此外,欧洲专利出版物No.0288809(相应于PCT专利出版物No.WO 87/02060)报道了包含IL-2和GM-CSF的融合蛋白质。IL-2序列可在GM-CSF的N-或C-末端,从而在对融合蛋白质的酸性切割后,可生成具有N-或C-末端序列修饰的GM-CSF。因此,GM-CSF衍生物、突变体和变体是本领域中众所周知的,且包含于本发明的方法之内。

本发明修饰的GM-CSF分子的表达和活性可用本领域中众所周知及描述于如美国专利No.4,810,643中的方法进行测定。作为例子,活性可用放射性标记的胸腺嘧啶摄取测定法进行测量。简言之,使来自健康供体的人骨髓用Ficoll-Hypaque(1.077g/ml,Pharmacia,Piscataway,NJ)进行密度分离,且低密度的细胞悬浮于含有10%胎牛血清、谷氨酰胺和抗生素的Iscove氏培养基中(GIBCO,La Jolla,CA)中。使约2×104的人骨髓细胞与对照培养基或本发明的G-CSF在96-孔平底平板上在空气中5%的CO2于约37℃温育约2天。然后用0.5μCi/孔的3H-胸腺嘧啶(New England Nuclear,Boston,Mass.)对培养物脉冲处理约4小时,并如描述于Ventua等人(1983,Blood 61:781)中的方法对摄取进行测量。与用对照化合物处理的骨髓细胞相比3H-胸腺嘧啶向人骨髓细胞中整合的增加是活性和有生活力的GM-CSF化合物的指示。

H.IFN-γ

本发明的一个目的是包含修饰和/或重构IFN-γ的方法。也称为II型干扰素的IFN-γ与IFNα和IFNβ相反,其是包含约21-24kDa的两个亚基的同二聚体糖蛋白。该大小变异归因于变化的糖基化模式,该模式当在本领域公知的各种表达系统中重组生产时通常不能再现。IFN-γ是巨噬细胞的有力激活剂,可增加I型MHC分子的表达,且在较低的程度上是II型MHC分子的刺激剂。进一步地,IFN-γ促进T-胞的分化和B-细胞中同种型转换。也充分证明IFN-γ是嗜中性粒细胞、NK细胞和导致巨噬细胞介导的清除的抗体反应的刺激剂。IFN-γ已计划作为治疗药品用于细胞内病原体的感染中,如结核病和利什曼病,或者可作为抗增殖治疗剂用于以异常细胞增殖为特点的病症中,如各种癌和其他的瘤形成。

IFN-γ已证明具有有力的免疫学活性,但由于来自目前用于表达IFN-γ的系统的糖基化的差异,其治疗剂的能力、功效、生物学半衰期和其他重要的因素是可变的。本发明包含纠正该关键缺陷的方法。

重构的IFN-γ肽可施用于如下患者,该患者选自患有慢性肉芽肿性疾病的患者、患有恶性骨硬化病的患者、患有肺纤维化的患者、患有结核的患者、患有隐球菌性脑膜炎的患者和患有肺鸟分枝杆菌(Mycobacterium avium)复合(MAC)感染的患者。优选地,患者是人患者。

IFN-γ的核苷酸和氨基酸序列在此处分别以SEQ ID NO:19和SEQID NO:20提出(分别为图67A和67B)。易于理解在此处提出的序列决不限制本发明。相反,IFN-γ的变体、衍生物和突变体是技术人员众所周知的。作为例子,美国专利No.6,083,724描述了重组的鸟类IFN-γ,而美国专利No.5,770,191描述了人IFN-γ的C-末端变体。此外,美国专利No.4,758,656描述了新的IFN-γ衍生物及在各种表达系统中合成该衍生物的方法。因此本发明不局限于在文中别处公开的IFN-γ序列,但包含本领域中众所周知的所有衍生物、变体、突变体等。

IFN-γ的表达系统同样是本领域中众所周知的,且包括原核生物和真核生物系统以及植物和昆虫制剂,其方法是技术人员公知的。作为例子,美国专利No.4,758,656描述了在大肠杆菌中表达IFN-γ衍生物的系统,而美国专利No.4,889,803描述了应用中国仓鼠卵巢细胞和SV40启动子的表达系统。

对根据在此处公开的方法制备的重构的IFN-γ的生物学活性的测定是本领域中技术人员众所周知的。IFN-γ表达的生物学测定可发现于如美国专利No.5,807,744中。简言之,将IFN-γ添加到CD34++CD38-细胞(每孔100个细胞)培养物中,该培养物用细胞因子组合进行了刺激以诱导CD34++CD38-细胞的增殖,其中细胞因子为如IL-3、c-kit配体和IL-1、IL-6或G-CSF。细胞增殖及第二集落形成性细胞的产生将以剂量依赖性的方式大大受到抑制,且在5000U/毫升IFN-γ时接近完全抑制。作为对IFN-γ抑制作用的证实性检验,可添加IFN-γ抗体作为对照。

I.α-蛋白酶抑制剂(α-抗胰蛋白酶)

本发明进一步包括重构α-蛋白酶抑制剂(A-1-PI、α-1-抗胰蛋白酶或α-1-胰蛋白酶抑制剂)的方法,该α-蛋白酶抑制剂也已知为α-抗胰蛋白酶。A-1-PI是分子量为53kDa的糖蛋白。A-1-PI在控制由内源丝氨酸蛋白酶导致的组织破坏中起作用,且是血浆中最显著的丝氨酸蛋白酶抑制剂。特别地,A-1-PI抑制各种弹性蛋白酶,包括嗜中性粒细胞弹性蛋白酶。弹性蛋白酶是降解组织的蛋白酶,且当其活性在肺组织中不受调节时可为特别有问题的。该蛋白酶通过降解外源蛋白而行使功能。然而,当API不以足以调节弹性蛋白酶活性的量存在时,弹性蛋白酶可降解肺组织。因此,该不平衡可导致慢性肺组织损害和肺气肿。事实上,A-1-PI的遗传缺陷已显示与肺气肿的过早发展相关。A-1-PI补充已成功地用于该类肺气肿的治疗中。进一步地,A-1-PI的缺陷也将导致其他疾病的恶化,如囊性纤维化和关节炎,其中白细胞移入肺中或关节中以对抗感染。

因此,A-1-PI可令人信服地用于治疗疾病,在该疾病中抑制剂和蛋白酶尤其是嗜中性粒细胞弹性蛋白酶之间的不平衡是疾病状况发展的原因。A-1-PI也具有抗病毒活性。根据这些,可逻辑地推断本发明可用于产生A-1-PI,该A-1-PI在肺的永远变化的环境中是安全、有效和有力的。

重构的A-1-PI肽可施用于如下患者,该患者选自患有先天性α-1-抗胰蛋白酶不足和肺气肿的患者、患有囊性纤维化的患者和患有肺纤维化的患者。优选地,患者是人患者。

A-1-PI已进行了克隆和测序,且在SEQ ID NO:21和SEQ ID NO:22中提出(分别为图68A和68B)。如本领域技术人员所理解的,A-1-PI的天然和加工的变体是存在的,且包含于本发明中。作为例子,美国专利No.5,723,316描述了在位置356-361具有氨基酸替代并进一步包含约3个氨基酸的N-末端延伸的A-1-PI衍生物。美国专利No.5,674,708描述了在一级氨基酸序列的位置358具有氨基酸替代的A-1-PI类似物。技术人员将易于认识到本发明包含已知的和要发现的A-1-PI变体、衍生物和突变体。

根据本发明的方法产生的重构的A-1-PI的表达和活性确定方法是本领域中众所周知的,且描述于如美国专利No.5,674,708和美国专利No.5,723,316中。简言之,生物学活性可通过测量胰凝乳蛋白酶催化的底物N-suc-Ala-Ala-Pro-Phe-p-nitroanilide(0.1ml的90%DMSO中的10mM溶液)的水解的抑制而用对胰凝乳蛋白酶活性的测定法确定,如描述于DelMar等人(1979,Anal.Biochem.99:316)中的。一般的1.0毫升胰凝乳蛋白酶测定物包含:100mM Tris-Cl缓冲液,pH 8.3,0.005%(v/v)Triton X-100,牛胰凝乳蛋白酶(18kmmol)和本发明的A-1-PI。使该测定混合物在室温预先温育约5分钟,加入底物(0.01ml的90%DMSO中的10mM溶液),且剩余的胰凝乳蛋白酶活性是通过由对硝基酰苯胺释放导致的在410nm吸收的改变范围确定的。光吸收的测量是在25℃用安装了温控样品室的分光光度计进行的。

J.葡糖脑苷脂酶

在此处描述的本发明进一步包括修饰葡糖脑苷脂酶的方法。葡糖脑苷脂酶是催化糖脂葡糖脑苷脂水解为葡萄糖和神经酰胺的溶酶体糖蛋白酶。葡糖脑苷脂酶的变体是以CerezymeTM和CeredaseTM在商业上销售的,且是已批准的治疗高歇病的治疗剂。CeredaseTM是具有完全N-连接的结构的葡糖脑苷脂酶的胎盘衍生化形式。CerezymeTM是长度为497个氨基酸且在CHO细胞中表达的葡糖脑苷脂酶的重组变体。已对Cerezyme的4个N-连接聚糖进行修饰以终止于三甘露糖核心。

葡糖脑苷脂酶目前是在重组哺乳动物细胞培养物中产生的,因此反映了那些细胞的糖基化模式,通常为啮齿动物细胞如中国仓鼠卵巢细胞或幼仓鼠肾细胞,该糖基化模式与人的糖基化模式有巨大的不同,从而导致免疫原性和效能丧失等。

重构的葡糖脑苷脂酶肽可施用于如下患者,该患者选自患有溶酶体贮积症的患者、患有葡糖脑苷脂酶不足的患者和患有高歇病的患者。优选地,患者是人患者。

葡糖脑苷脂酶的核酸和氨基酸序列在此处以SEQ ID NO:23和24提出(分别为图69A和69B)。然而,如技术人员所理解的,在此处代表的序列是原型序列,且不限制本发明。事实上,葡糖脑苷脂酶的变体是众所周知的且描述于如美国专利No.6,015,703,该专利描述了葡糖脑苷脂酶类似物及其变体的增强的产生。进一步地,美国专利No.6,087,131描述了另外一个葡糖脑苷脂酶变体的克隆和测序。本发明将包含这些和其他已知的或在将来可发现的衍生物、变体和突变体。

用标准技术表达葡糖脑苷脂酶的方法是本领域中众所周知的,且详细描述于如美国专利No.6,015,703中。对根据本发明的方法制备的葡糖脑苷脂酶分子的生物学功效的测定也是本领域中众所周知的,且用于估计和应用葡糖脑苷脂酶治疗剂的小鼠高歇病模型描述于如Marshall等人(2002,Mol.Ther.6:179)中。

K.TPA

本发明进一步包含重构组织型活化因子(TPA)的方法。TPA活化纤溶酶原以形成溶解血纤蛋白的纤溶酶,该血纤蛋白是血栓蛋白质底物的主要成分。TPA制剂已发展为溶栓剂治疗中的溶栓剂,该溶栓剂对导致心肌梗死和大脑梗塞的血栓形成的血栓具有高度的选择性。

进一步地,为了获得对血纤蛋白的更高亲和力和比天然TPA更长的血液半衰期的目的,通过基因工程已产生各种修饰的TPA。TPA是通常极难溶于水的蛋白质。特别地,修饰的TPA比天然的TPA更难溶于水,从而使得修饰的TPA的制备非常困难。因而在给予患者时修饰的TPA难以溶于水。然而,修饰的TPA具有各种优点,如对血纤蛋白增加的亲和力和血液中的更长的半衰期。本发明的目的是增加修饰的TPA的溶解性。

重构的TPA肽可施用于如下患者,该患者选自患有急性心肌梗死的患者和患有急性缺血性发作的患者。重构的TPA肽也可施用于患者以改善急性心肌梗死后的心室功能、减少急性心肌梗死后充血性心力衰竭的发病率或减少与急性心肌梗死相关的死亡率。重构的TPA肽也可施用于患者以改善急性缺血性发作后的神经学恢复或减少急性缺血性发作后的残疾和瘫痪的发病率。优选地,患者是人患者。

TPA的核酸和氨基酸序列在此处分别以SEQ ID NO:25和SEQ IDNO:26提出(分别为图70A和70B)。如上所述,已构建了TPA变体并用于治疗应用中。例如,美国专利No.5,770,425描述了其中一些或所有血纤蛋白结构域被删除的TPA变体。进一步地,美国专利No.5,736,134描述了对位置276的氨基酸进行修饰了的TPA。技术人员利用本发明的公开内容和在此处的介绍将易于理解本发明包含在此处提出的TPA序列以及精通文献的技术人员众所周知的那些变体。

TPA从编码TPA的核酸序列中的表达是众所周知的,且详细描述于如美国专利No.5,753,486中。用于确定根据本发明的方法制备的TPA分子的生物学性质的测定是本领域中众所周知的。简言之,用文中别处公开的方法合成的TPA分子可根据Carlsen等人(1988,Anal.Biochem.168:428)的方法在饱和浓度的纤溶酶原存在时测定其裂解血纤蛋白的能力。体外凝块裂解测定法用微量离心机分析仪通过浊度测定来测量组织型活化因子的活性。使凝血酶和TPA的混合物离心入血纤蛋白原和纤溶酶原的混合物中以起始凝块形成和随后的凝块溶解。对结果所得的吸收-时间关系进行分析以确定测定终点。将TPA变体的活性与TPA的标准曲线进行了比较。在测定过程中所用的缓冲液是含有0.01%(v/v)TWEEN 80和0.01%(w/v)叠氮化钠的0.06M磷酸钠,pH 7.4。人的凝血酶的浓度为约33单位/ml。将血纤蛋白原(2.0mg/ml可成块的蛋白质)在湿冰上冷冻以沉淀纤连蛋白,然后进行重力过滤。Glu-纤溶酶原浓度为1mg/ml。分析仪区室温度设为37℃。装料器设定为分配20微升TPA(约500纳克/毫升~约1.5微克/毫升)作为标准曲线的样品,或者以可导致在标准曲线范围内裂解的浓度分配20微升TPA变体。用20微升凝血酶作为二级试剂,并用200微升50∶1(v/v)的血纤蛋白原∶纤溶酶原混合物作为一级试剂。吸收/时间程序应用5分钟的温育时间、340-纳米-滤波器和90秒间隔的读数。

L.IL-2

本发明进一步包含重构和修饰IL-2的方法。IL-2是T淋巴细胞的主要生长因子且可通过刺激细胞毒性CD8T细胞和NK细胞增加体液和细胞免疫反应。因此IL-2在对抗肿瘤和病毒感染的防御机制中是关键的。IL-2也用于对抗转移性黑素瘤和肾腺癌的治疗中,且已用于许多形式癌症的临床试验中。进一步地,IL-2也已用于HIV感染的患者中,在其中它导致CD4数目的显著增加。

由于IL-2在处理和治疗危害生命的疾病如各种癌症和AIDS中的成功,那么本发明的方法对于发展如下IL-2分子是有用的,该IL-2分子具有更长的生物学半衰期、增加的能力及通常与在健康人中合成分泌的野生型IL-2更类似的治疗性质。

重构的IL-2肽可施用于如下患者,该患者选自患有转移性肾细胞癌的患者、患有转移性黑素瘤的患者、患有卵巢癌的患者、患有急性髓细胞性白血病(AML)的患者、患有非何杰金氏淋巴瘤(NHL)的患者、感染了HIV的患者和感染了丙型肝炎的患者。重构的IL-2肽也可施用于患者作为癌疫苗佐剂。优选地,患者是人患者。

IL-2已进行了克隆和测序,且核酸和氨基酸序列在此处以SEQ IDNO:27和SEQ ID NO:28提出(分别为图71A和71B)。本发明决不应解释为局限于在此处提出的IL-2核酸和氨基酸序列。IL-2的变体描述于如美国专利No.6,348,193中,其中位置88的天冬酰胺由精氨酸替代,及美国专利No.5,206,344中,其中描述了包含具有各种氨基酸替代的IL-2变体的多聚体。本发明包含这些和本领域中众所周知的其他IL-2变体。

IL-2的表达和活性确定的方法是本领域中众所周知的,且描述于如美国专利No.5,417,970中。简言之,IL-2或其变体的表达可在各种原核生物和真核生物系统中实现,包括大肠杆菌、CHO细胞、BHK细胞、应用杆状病毒表达系统的昆虫细胞,它们全部是本领域中众所周知的。

对根据本发明的方法制备的修饰的IL-2的活性的测定可进行如下。通过描述于如A.Boyum等人(Methods in Enzymology,1984,108卷,88页,Academic Press,Inc.)的方法在Ficoll-Hypaque(Pharmacia,Piscataway,NJ)梯度上离心以从红细胞和粒细胞分离外周血淋巴细胞。随后在培养基中将淋巴细胞洗涤约3次,该培养基由RPMI 1640(Gibco-BRL,La Jolla,CA)和加热(于56℃进行1小时)失活的10%AB人血清(CTS Purpan,Toulouse,法国)、2mM丙酮酸钠、5mMHEPES、4mM L-谷氨酰胺、100U/ml青霉素、100μg/ml链霉素和0.25μg/ml两性霉素组成(完全培养基)。通过附着到塑料上而将粘着细胞(单核细胞和巨噬细胞)去除,将剩余的细胞以每毫升约5~10×105细胞的浓度重悬于完全培养基中并以每平方厘米约1-2×105细胞的密度接种于培养瓶中。然后使瓶在5%CO2中于37℃温育约1小时,其后在轻轻搅动培养瓶后通过吸引术回收非附着的淋巴细胞。

将非附着的淋巴细胞洗涤一次,并以每毫升约105细胞的浓度在本发明的IL-2存在时在完全培养基上于如上所述的培养箱中培养约48小时。然后将细胞洗涤一次。

细胞的细胞毒性活性是在与抗NK细胞细胞毒性的人T淋巴样细胞系C8166-45/C63(HT1细胞)的目标细胞接触约4小时后估计的,如由Salahuddin等人(1983,Virology 129:51-64;1984,Science 223:703-707)所描述的。使6×105个HT1细胞于37℃在无血清的完全培养基中用约200μCi的51Cr(铬酸钠,Amersham,Arlington Heights,IL)放射性标记约1小时,然后洗涤几次。使目标细胞和有效细胞以不同的有效细胞对目标细胞的比例(50∶1、10∶1、1∶1)在圆底的微量滴定板上进行分配。将微量滴定板离心,并在如上所述的温育之后,从每一个孔回收上清液并用γ计数器测量放射性。细胞毒性是从由死亡目标细胞释放的51Cr量确定的。非特异性的细胞毒性是从在不存在有效细胞时从目标细胞中自发释放的放射性量确定的。

本发明的方法仅是用于本领域中众所周知的测量效应细胞的细胞毒性的许多方法中的一个,且不应该解释为限制本发明。

M.凝血因子VIII

本发明进一步包含重构和修饰凝血因子VIII的方法。如在前文对凝血因子VII和凝血因子IX所描述的,凝血因子VIII是血液凝结途径中的一个关键成分。人凝血因子VIII(抗血友病因子;FVIII:C)是由两个肽(分子量为80kDa的轻链和分子量依赖于糖基化状态在90~220kDa的重链)组成的人血浆蛋白质。它是凝结途径中基本的辅因子且是凝血因子X向其活性形式(凝血因子Xa)转变所必需的。凝血因子VIII在血浆中作为与冯·维勒布兰德(Von willibrand)因子的非共价复合物(akaVIII:RP)循环,该冯·维勒布兰德因子为2050个aa的肽(参见美国专利No.6,307,032)。低于正常值的20%的凝血因子VIII血液浓度导致称为血友病A的流血性疾病。低于1%的凝血因子VIII血液水平导致严重的流血性病症,其中自发的关节流血是最常见的症状。

与其他血液凝结因子类似,凝血因子VIII是对各种流血性病症如血友病A和血友病B的治疗具有巨大潜力的治疗剂。由于重链的糖基化,从重组细胞中制备凝血因子VIII的现有方法导致不如天然凝血因子VIII有效的产物。从人血浆的纯化方法导致较不有效且比重组凝血因子VIII更难制备的粗组合物。本发明寻求改善该状况。

重构的凝血因子VIII肽可施用于如下患者,该患者选自患有维勒布兰德病的患者、患有A型血友病的患者、患有凝血因子VIII:C不足的患者、患有血纤蛋白原不足的患者、患有凝血因子XIII不足的患者和具有获得的凝血因子VIII抑制剂(获得性血友病)的患者。重构的凝血因子VIII肽也可施用于患者以预防、治疗或控制流血或出血发作。优选地,患者是人患者。

凝血因子VIII的核酸和氨基酸序列在此处分别以SEQ ID NO:29和SEQ ID NO:30提出(分别为图72A和72B)。各种凝血因子VIII在本领域中是普遍的,如描述于美国专利No.5,668,108中的,其中位置1241的天冬氨酸由谷氨酸替代,且伴随着核酸的同样变化。美国专利No.5,149,637描述了包含糖基化的或非糖基化的C-末端片段的凝血因子VIII变体,且美国专利No.5,661,008描述了包含与氨基酸1649~2332通过至少3个氨基酸残基连接的氨基酸1-740的凝血因子VIII变体。因此,凝血因子VIII的变体、衍生物、修饰物和复合物是本领域中众所周知的并包含于本发明中。

产生凝血因子VIII的表达系统是本领域中众所周知的,且包括原核和真核细胞,如在美国专利No.5,633,150、5,804,420和5,422,250中所示例的。

为了确定根据本发明的方法合成的凝血因子VIII分子的生物学活性,技术人员将认识到在此处描述的用于估计凝血因子VII和凝血因子IX的测定可应用于凝血因子VIII。

N.尿激酶

本发明也包括重构和/或修饰尿激酶的方法。尿激酶是将纤溶酶原活化为纤溶酶的丝氨酸蛋白酶。该蛋白质是在各种组织中合成的,包括内皮和肾,且以痕量排泄到尿中。纯化的尿激酶以两种活性形式存在,即高分子量的形式(HUK;约50kDa)和低分子量的形式(LUK;约30kDa)。已显示LUK源自HUK,其通过在赖氨酸135后的蛋白水解,从而从HUK中释放前135个氨基酸。一般认为HUK或LUK必须通过在赖氨酸158和异亮氨酸159之间对称为尿激酶原的单链前体进行蛋白水解以生成两链的活性形式(该形式继续相应于HUK或LUK)而转变为蛋白水解活性的形式。从该蛋白水解修剪中得到的蛋白水解活性的尿激酶种类含有通过单个二硫键连接在一起的两个氨基酸链。通过活化修剪形成的该两个链称为A或A1链(分别为HUK或LUK),和包含分子的蛋白酶结构域的B链。

已显示尿激酶是有效的溶栓剂。然而,由于它天然地是以痕量产生的,所以有效剂量的酶的成本是高的。尿激酶已在重组细胞培养物中生产,且编码尿激酶的DNA以及适当的载体和宿主微生物都是已知的。现有的包含尿激酶的组合物及重组生产尿激酶的方法受具有缺陷的糖基化模式的产物的阻碍,且由于在尿激酶活化时有复杂的蛋白水解切割事件,该异常的糖基化导致低效的和低能力的产物。

重构的尿激酶肽可施用于如下患者,该患者选自患有栓塞的患者、患有急性肺动脉大块栓塞的患者和患有冠状动脉血栓形成的患者。优选地,患者是人患者。重构的尿激酶肽也可用于恢复静脉内导管的开放,包括由凝结的血或血纤蛋白堵塞的中央静脉导管。

编码尿激酶一级氨基酸链的核苷酸序列描述于SEQ ID NO:33和SEQ ID NO:34中(分别为图73A和73B)。尿激酶的变体是本领域中众所周知的,因此本发明不局限于在此处提出的序列。事实上,技术人员易于认识到在美国专利No.5,219,569、5,648,253和4,892,826中描述的尿激酶变体作为有功能的部分存在,且因此包含于本发明中。

对根据本发明的方法制备的尿激酶分子的表达和估计也是本领域中众所周知的。作为非限制性的例子,尿激酶在各种系统中的表达详细描述于美国专利No.5,219,569中。确定根据在此处提供的方法制备的尿激酶的活性和功能性的测定法在该文献中有描述,且与在别处描述的其他纤溶酶原和血纤蛋白相关的测定类似。一个确定在此处所述的方法合成的尿激酶分子的活性的测定法描述于如Ploug等人(1957,Biochim.Biophys.Acta 24:278-282)中,该测定法应用包含1.25%琼脂糖、4.1mg/ml人纤溶酶原、0.3单位/ml凝血酶和0.5μg/ml大豆胰蛋白酶抑制剂的血纤蛋白平板。

O.人DNase

本发明进一步包含重构和/或修饰重组人DNase的方法。人DNase I已验证为治疗剂且显示可在体外减少囊性纤维化粘液的粘度。已确定的是化脓性的粘液含有约10-13mg/ml的DNA,即影响呼吸道流体的流变学性质的离子聚合物。因此,可降解DNA的酶牛胰DNase I在多年前即验证为粘液溶解剂,但未进入临床实践,这是因为由抗原性和/或污染的蛋白酶导致的副作用。目前重组人DNase可用作治疗剂以减轻如囊性纤维化疾病的症状。

重构的rDNase肽可施用于患有囊性纤维化的患者。重构的rDNase肽也可施用于囊性纤维化患者以改善肺功能。优选地,患者是人患者。

与源自牛来源的DNase类似,重组人DNase也引起了一些问题,大多数是由于降低的功效,这归因于由目前所用的哺乳动物表达系统导致的不适当的糖基化。本发明描述了重构DNase的方法,该方法可导致增加的功效和更好的治疗结果。

人DNase的核苷酸和氨基酸序列在此处以SEQ ID NO:39和SEQID NO:40提出(分别为图74A和74B)。包含DNase的肽变体是本领域中众所周知的。作为例子,美国专利No.6,348,343描述了在整个一级结构中具有多个氨基酸替代的人DNase。此外,美国专利No.6,391,607描述了在位置9、14、74、75和205具有多个氨基酸替代的极度活跃的DNase变体。本实施例和其他本领域中众所周知的或将来可发现的均包含于本发明中。

产生DNase肽的表达系统是技术人员众所周知的,且已描述于原核生物和真核生物系统中。例如,PCT专利出版物No.WO 90/07572相当详细地描述了这些方法。

确定根据本发明的方法发展的DNase分子的生物学活性的测定法是本领域中众所周知的。作为例子,但决不意味着限制本发明,在此处提供了确定人DNase I的DNA-水解活性的测定法。简言之,应用了两个不同的质粒消化测定法。第一个测定法(“超螺旋DNA消化测定法”)测量超螺旋双链质粒DNA向松弛的(具缺口的)、线性的和降解的形式的转变。第二个测定法(“线性DNA消化测定法”)测量线性双链质粒DNA向降解的形式的转变。特定地,将根据本发明的方法制备的DNase加入到160微升溶液中,该溶液包含每毫升25微克的在25mM HEPES(pH7.1)中的超螺旋质粒DNA或EcoR I-消化的线性化的质粒DNA、100μg/ml牛血清白蛋白、1mM MgCl2、2.5mM CaCl2、150mM NaCl,且将样品在室温进行温育。在各个时间获取等份试样的反应混合物并通过添加25mM EDTA及二甲苯腈蓝、溴酚蓝和甘油而终止反应。终止的样品中质粒DNA的完整性可通过将样品在琼脂糖凝胶上进行电泳而分析。在电泳后,将凝胶用溴化乙锭染色,并通过紫外线使凝胶中的DNA显现。质粒DNA中超螺旋的、松弛的和线性形式的相对量是通过用荧光图象仪(如Molecular Dynamics Model 575 FluorImager)扫描凝胶并对凝胶上相应于不同形式的条带中的DNA进行定量而确定的。

P.胰岛素

本发明进一步包括重构胰岛素的方法。胰岛素是众所周知的对I型糖尿病的最有效的治疗药品,在I型糖尿病中胰脏的β胰岛细胞不产生用于调节血液葡萄糖水平的胰岛素。糖尿病和失控的血液葡萄糖的后果包括循环和足部问题,和失明,以及各种其他由糖尿病导致的或由糖尿病恶化的并发症。

在对人胰岛素进行克隆和测序之前,将猪胰岛素用作糖尿病的治疗药物。目前胰岛素是重组生产的,但是成熟分子的51个氨基酸短序列是包含多个二硫键的复杂结构。现有重组生产胰岛素的方法导致与在健康的非胰岛素被试者中产生的天然蛋白质缺乏相似性的产物。本发明寻求弥补该缺点。

重构的胰岛素肽可施用于如下患者,该患者选自患有I型糖尿病(糖尿病)的患者和患有2型糖尿病而需要基础(长期作用的)胰岛素以控制高血糖的患者。重构的胰岛素肽也可施用于糖尿病患者以控制高血糖。优选地,患者是人患者。

人胰岛素的核苷酸和氨基酸序列分别在SEQ ID NO:43和SEQ IDNO:44中描述(分别为图75A和75B)。胰岛素变体在本领域中是大量的。美国专利No.6,337,194描述了胰岛素融合蛋白质类似物,美国专利No.6,323,311描述了包含二羧酸的环状酐的胰岛素衍生物,且美国专利No.6,251,856描述了包含多个氨基酸替代和亲脂基团的胰岛素衍生物。技术人员将认识到下面胰岛素衍生物的例子决不是排他性的,仅仅代表了那些本领域中众所周知的一个小部分。因此,本发明包含已知或将发现的胰岛素衍生物。

用于产生胰岛素的表达系统是本领域中众所周知的,且可用分子生物学技术来实现,如描述于Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press,New York)中的。

用于确定根据本发明的方法制备的胰岛素分子的功能性的测定法也是本领域中众所周知的。例如,一个葡萄糖抑制的体外模型可用于估计用本发明的方法合成的胰岛素的生物学活性。可用于该目的的是大鼠模型。在实验前使动物禁食过夜(16个小时),然后用腹膜内给予戊巴比妥钠或其他适当的麻醉剂如氯胺酮进行麻醉。每一个动物接受特定胰岛素衍生物(20μg/ml/kg)的静脉内注射(尾部静脉)。在注射前15和5分钟及注射后15、30、60、90、120、180和240分钟从颈静脉获取血液样品。血液葡萄糖水平是用血液葡萄糖监控器测量的,该监控器可购自各个商业供应商。

Q.乙型肝炎疫苗(HBsAg)

本发明进一步包含重构用于乙型肝炎疫苗的抗原(HbsAg或乙型肝炎表面抗原)的方法。HBsAg是重组生产的乙型肝炎S-蛋白质的表面抗原,并用于引起对乙型肝炎病毒的免疫反应,该病毒是日益危险的病毒,可导致肝疾病如肝硬变和癌等,并导致全世界每年超过1百万的死亡。目前HBsAg疫苗在6个月的时间间隔给予3次以引起保护性和中和性的免疫反应。

目前HBsAg是在酵母品系中产生的,因此反映了真菌天然的糖基化模式。本发明提供了重构HBsAg的方法,该方法还导致改善的免疫原性、具有改善的对病毒的亲和力的抗体等。

重构的HBsAg肽可施用于患者,以对患者进行抗由乙型肝炎病毒引起的疾病的免疫接种。重构的HBsAg肽也可施用于透析前(predialysis)或透析患者,以对患者进行抗由乙型肝炎病毒引起的疾病的免疫接种。优选地,患者是人患者。

来自乙型肝炎病毒S-蛋白质(HBsAg)的核酸和一级氨基酸链的序列在此处以SEQ ID NO:45和SEQ ID NO:46提出(分别为图76A和76B)。核苷酸长度为1203个碱基。氨基酸为400个残基长。最后226个氨基酸残基是小S-抗原,该抗原可用于GlaxoSmithKline疫苗和Merck疫苗。小S-抗原上游的55个氨基酸是Pre-S起始密码子。该Pre-S加S区域是中S-抗原,该抗原可用于Aventis Pasteur疫苗。从第一个密码子到Pre-S的起始密码子之间包含S-蛋白质的其余部分,且称为大S-蛋白质。这仅是用于疫苗中的HBsAg的一个例子,且其他亚型是众所周知的,如由GenBank Acc No.:AF415222、AF415221、AF415220和AF415219所示例的。在此处提出的序列仅是本领域中公知的HBsAg的例子。类似的抗原已从乙型肝炎病毒的其他品系分离,且已对其作为疫苗候选物的抗原性和潜力做了或未做估计。因此本发明包含已知或将发现的乙型肝炎病毒疫苗S-蛋白质表面抗原。

HBsAg在表达系统中的表达对于本领域的技术人员而言是常规程序,且描述于如美国专利No.5,851,823中。对疫苗免疫原性的测定是本领域中众所周知的,且包含产生中和抗体的各种测定,并应用如ELISA、中和测定、蛋白质印迹、免疫沉淀等技术。简言之,描述了用于探测有效的抗-HBsAg抗体的夹心式ELISA。Enzygnost HBsAg测定(AventisBehring,King of Prussia,PA)可用于这种方法中。将孔用抗-HB覆盖。将血清血浆或纯化的蛋白质和适当的对照添加到孔中并进行温育。洗涤后,使抗HBsAg的过氧化物酶标记的抗体与剩余的抗原决定簇反应。通过洗涤去除未结合的酶联抗体,且固相上的酶活性是由本领域中众所周知的方法确定的。对过氧化氢和色素原的酶催化的反应是通过加入稀释的硫酸而终止的。颜色强度与样品中HBsAg的浓度成比例,且是通过对未知样品的颜色强度与伴随的负对照和正对照血清的颜色强度的光度比较而获得的。

R.人生长激素

本发明进一步包含重构人生长激素(HGH)的方法。在人的垂体中分泌的HGH同种型由191个氨基酸组成并具有约21,500的分子量。在胎盘中制备的HGH同种型是糖基化的形式。HGH参与正常人生长和发育的许多调节,包括线性生长(体质发生)、泌乳、巨噬细胞活化和胰岛素样及致糖尿作用等。

HGH是复杂的激素,且其作用作为与各种细胞受体的相互作用的结果而有变化。尽管包含HGH的组合物已用于临床情况下,尤其是治疗侏儒症中,但其功效受到重组产生的HGH中不存在糖基化的限制。

重构的HGH肽可施用于如下患者,该患者选自患有生长激素不足的患者、患有特纳综合征的患者、患有由于缺乏足够的内源生长激素分泌而生长不足的患者、患有由于普-韦综合征(PWS)而生长不足的患者、患有与慢性肾机能不全相关的生长不足的患者和患有AIDS相关的消瘦或恶病质的患者。重构的HGH肽也可施用于身材小的患者。优选地,患者是人患者。

HGH的核酸和氨基酸序列在此处以SEQ ID NO:47和SEQ ID NO:48提出(分别为图77A和77B)。技术人员将认识到HGH的变体、衍生物和突变体是众所周知的。例子可发现于美国专利No.6,143,523中,其中位置10、14、18、21、167、171、174、176和179的氨基酸残基是替代的,及发现于美国专利No.5,962,411中,该专利描述了HGH的剪接变体。本发明包含这些本领域中公知的HGH变体和将发现的变体。

在重组细胞中表达HGH的方法描述于如美国专利No.5,795,745中。除其他因素之外,在原核生物、真核生物、昆虫细胞系统、植物和体外翻译系统中表达HGH的方法是本领域中众所周知的。

用本发明的方法产生的HGH分子可用技术人员公知的各种方法进行活性测定。例如,美国专利No.5,734,024描述了确定表达的HGH的生物学功能的方法。

S.抗凝血酶III

抗凝血酶(抗凝血酶III,AT-III)是血液中凝结级联的有力抑制剂。它是抑制凝血酶以及其他前凝血剂因子(procoagulant factol)(如凝血因子Xa)的非维生素K依赖性蛋白酶。先天性抗凝血酶III不足是常染色体显性病征,其中个体遗传了一个拷贝的缺陷基因。该状况导致增加的静脉和动脉血栓形成的风险,临床表现的发作一般出现于年轻成人期。个体遗传两个缺陷基因的严重先天性抗凝血酶III不足是与增加的血栓形成相关的常染色体隐性状况,一般在幼年时显著。获得性抗凝血酶III不足最常见于凝结系统不正确活化的情形中。导致获得性抗凝血酶III不足的一般状况包括弥散性血管内凝血、由于内皮损伤的微血管病性溶血性贫血(即溶血性尿毒性综合征)和见于进行骨髓移植的患者中的静脉闭塞性病(VOD)。AT-III不足可通过输注AT-III浓缩物进行短期矫正。

重构的AT-III肽可施用于如下患者,该患者选自患有与外科或产科手术相关的遗传性AT-III不足的患者和患有血栓栓塞的遗传性AT-III不足患者。优选地,患者是人患者。

抗凝血酶III(AT-III)是分子量为58,000的α2-糖蛋白。它以Thrombate IIITM进行商业销售(Bayer Corp.,West Haven,CT)。人抗凝血酶III的核酸和氨基酸序列分别示于图78A(SEQ ID NO:63)和78B(SEQ ID NO:64)中。

制备抗凝血酶III的方法是本领域技术人员众所周知的。例如,人抗凝血酶III(参见美国专利No.4,517,294)和人抗凝血酶III的突变型(参见美国专利No.5,420,252、5,618,713、5,700,663)的公布的核酸和氨基酸序列是可获得的。本发明的方法可应用任何这些氨基酸序列及任何其编码序列,但不局限于这些序列。产生重组抗凝血酶III的示例性方法是本领域中众所周知的,且几种方法描述于美国专利No.5,420,252、5,843,705、6,441,145和5,994,628中。纯化重组抗凝血酶III的示例性方法描述于美国专利No.5,989,593、6,268,487、6,395,888、6,395,881、6,451,978和6,518,406中。

重组抗凝血酶III有许多公知的用途。抗凝血酶III可被用作外科手术中的抗凝剂(美国专利No.5,252,557、5,182,259)、作为抑制血栓形成的药物制剂或方法的部分(美国专利No.5,565,471、6,001,820)以及减少细胞移植的有害副作用(美国专利No.6,387,366)。此外,抗凝血酶III制剂可用于增加胎盘血流(美国专利No.5,888,964)、抑制受精(美国专利No.5,545,615)、治疗哮喘(美国专利No.6,355,626)和治疗关节炎(美国专利No.5,252,557)和其他炎症(美国专利No.6,399,572)。抗凝血酶III也可用于制造替换血浆(美国专利No.4,900,720)或制备用于输血的稳定细胞血液产品(美国专利No.6,139,878)。抗凝血酶III可以作为药物制剂施用(美国专利No.5,084,273、5,866,122、6,399,572、6,156,731和6,514,940)或应用基因治疗方法施用(美国专利No.6,410,015)。包含抗凝血酶III的组合物可用作组织粘合剂(美国专利No.6,500,427)或引入到患者中的医疗设备的润滑剂(美国专利No.6,391,832)。抗凝血酶III通常也可用于包被血管内支架(美国专利No.6,355,055、6,240,616、5,985,307、5,685,847和5,222,971)、眼植入物(美国专利No.5,944,753)和假器官(美国专利No.6,503,556、6,491,965和6,451,373)。抗凝血酶III也可用于定位患者中内部流血位点(美国专利No.6,314,314)和确定患者中止血机能障碍(美国专利No.6,429,017)的方法中。

T.人绒毛膜促性腺激素

人绒毛膜促性腺激素(hCG)是由α亚基和β亚基组成的糖蛋白。HCG与另外两个促性腺激素黄体生成素(LH)和促卵泡激素(FSH)以及促甲状腺激素(TSH)密切相关,所有该三种激素均是糖蛋白激素。这些不同糖蛋白激素的α亚基在结构上非常相似,但β亚基在氨基酸序列上不同。

人绒毛膜促性腺激素α亚基的核酸和氨基酸序列分别示于图79A(SEQ ID NO:69)和79B(SEQ ID NO:70)中。人绒毛膜促性腺激素β亚基的核酸和氨基酸序列分别示于图79C(SEQ ID NO:71)和79D(SEQID NO:72)中。

人绒毛膜促性腺激素用于不育治疗中以促进不能自己排卵的女性排卵或从卵巢中释放卵子。人绒毛膜促性腺激素也施用于年轻男性以治疗未降到阴囊的或发育不全的睾丸。它用于男性中刺激睾酮的产生。一些医生也给患有缺乏性欲的勃起机能障碍的患者和对男性“绝经期”的治疗开具人绒毛膜促性腺激素处方。

重构的hCG肽可施用于如下患者,该患者选自进行辅助生殖技术(ART)的患者、进行体外受精(IVF)的患者、进行胚胎移植的患者、不育患者、患有不是由于解剖学阻塞的青春前期隐睾症的男性患者和患有低促性腺素功能减退症的男性患者。也可在不育女性患者中施用重构的hCG肽以诱导最终的卵泡成熟,其中该不育女性患者已进行了垂体脱敏和用促卵泡激素进行了预治疗。也可在不排卵不育患者中施用重构的hCG肽以诱导排卵和怀孕。优选地,患者是人患者。

制备人绒毛膜促性腺激素的方法是本领域技术人员众所周知的。异二聚体hCG可在目前用于工业生产重组蛋白质的许多表达系统中的任何一种中进行重组制备。一种制备重组hCG的方法描述于美国专利No.5,639,639中。通过在相同细胞中表达两个亚基制备重组异二聚体蛋白质的方法通常是本领域中众所周知的,且几种方法描述于美国专利No.5,643,745(在丝状真菌中表达)、5,985,611和6,087,129(在分泌细胞中表达)。可选择地,每一个亚基可单独在细胞中表达,且以后在体外将两个亚基置于一起以装配成异二聚体。

应用人绒毛膜促性腺激素的方法非常多且是本领域中众所周知的。通常,hCG用于诱导哺乳动物排卵或使哺乳动物排卵同步化(参见美国专利No.6,489,288、5,589,457、5,532,155、4,196,123、4,062,942和4,845,077)。此外,hCG可用于怀孕试验中,特别是基于凝集的试验中(参见美国专利No.3,991,175、4,003,988、4,071,314和4,088,749)。hCG也可用于避孕药疫苗中(参见美国专利No.4,161,519和4,966,888)。此外,hCG可用于治疗与年老和改变的激素平衡相关的状况如良性前列腺肥大(参见美国专利No.5,610,136)和常见于老年人中的中枢神经系统疾病(参见美国专利No.4,791,099)。

可选择地,hCG可用于探测和治疗表达hCG或其一个亚基的癌。表达hCG的肿瘤包括,但不局限于乳腺癌、前列腺癌、卵巢癌和胃癌,以及成神经细胞瘤如卡波西肉瘤。可以产生抗hCG的抗体,该hCG已进行糖重构从而具有与在肿瘤表达的hCG上发现的聚糖相似的聚糖结构,且这些抗体可用于根据本领域中众所周知的方法在患者中探测表达hCG的肿瘤(参见美国专利No.4,311,688、4,478,815和4,323,546)。此外,重构的hCG可用于引起对表达hCG的肿瘤的免疫反应(参见美国专利No.5,677,275、5,762,931、5,877,148、4,970,071和4,966,753)。

hCG也可用于通常对动物进行免疫调制的方法中,如描述于美国专利No.5,554,595、5,851,997和5,700,781中的方法。此外,hCG可在从这种治疗中获益的状况中用作基质金属蛋白酶的抑制剂,该状况如慢性炎症、多发性硬化和依赖血管发生的疾病(参见美国专利No.6,444,639)。

U.α-艾杜糖苷酶

α-艾杜糖苷酶以AldurazymeTM进行商业销售(BioMarin andGenzyme)。它用于MPS I(一种溶酶体贮积症)的替代治疗。MPS I(也称为胡尔勒病)是由α-L-艾杜糖苷酶不足导致的遗传疾病,该酶通常是某些称为糖胺聚糖(GAG)的复合糖分解所必需的。如果酶不以足够的量存在,那么GAG的正常分解是不完全的或被阻断的。从而细胞不能排出糖残基,于是它们在细胞的溶酶体中累积并导致MPS I。

重构的α-艾杜糖苷酶肽可施用于如下患者,该患者选自患有溶酶体贮积症的患者、患有α-L-艾杜糖苷酶不足的患者、患有粘多糖贮积症I(MPS I)的患者和患有胡尔勒病的患者。优选地,患者是人患者。

生产和纯化α-艾杜糖苷酶的方法以及治疗某些遗传病征的方法描述于美国专利No.6,426,208中,该遗传病征包括α-L-艾杜糖苷酶不足和粘多糖贮积症I(MPS I)。人类α-艾杜糖苷酶的核酸和氨基酸序列分别见于图80A(SEQ ID NO:65)和80B(SEQ ID NO:66)中。

V.α-半乳糖苷酶A

α-半乳糖苷酶A(也称为agalsidaseβ)以FabrazymeTM进行商业销售(Genzyme)。α-半乳糖苷酶A用于治疗法布里病。法布里病是由关键的α-半乳糖苷酶A不足导致的罕见遗传病征。没有该酶时,法布里患者不能分解其体内称为globotriasylceramide(GL-3)的脂肪酸物质,该物质在心、肾、脑和其他关键器官血管中的细胞中累积。该物质的逐渐累积使患者具有中风、心脏病发作、肾损伤和debilitating pain的风险。许多患者在成人期发展为肾衰竭,且严重的器官并发症在约四十岁时导致死亡。

重构的α-半乳糖苷酶A肽可施用于如下患者,该患者选自患有溶酶体贮积症的患者、患有α-半乳糖苷酶A不足的患者和患有法节里病的患者。优选地,患者是人患者。

α-半乳糖苷酶A是水解globotriaosylceramide和相关具有末端α-半乳糖苷酶键的糖脂的溶酶体酶。它是在X染色体长臂上编码的45kDa的N-糖基化蛋白质。在人成纤维细胞或Chang肝细胞中合成的初始糖基化形式(Mr=55,000~58,000)被加工成成熟糖基化形式(Mr=50,000)。从人组织和血浆中纯化的成熟活性酶是同二聚体(Bishop等人,1986,Proc.Natl.Acad.Sci.USA 83:4859-4863)。α-半乳糖苷酶A的核酸和氨基酸序列分别见于图81A(SEQ ID NO:67)和81B(SEQ ID NO:68)中。其他有用的α-半乳糖苷酶A的核酸和氨基酸序列见于美国专利No.6,329,191中。

教导如何制备α-半乳糖苷酶A的参考文献见于美国专利No.5,179,023和5,658,567(在昆虫细胞中表达)、美国专利No.5,356,804(在哺乳动物细胞中表达和分泌,包括CHO细胞)、美国专利No.5,401,451(在哺乳动物细胞中表达)、美国专利No.5,580,757(在哺乳动物细胞中作为融合蛋白质表达)和美国专利No.5,929,304(在植物细胞中表达)。用于纯化重组α-半乳糖苷酶A的方法见于美国专利No.6,395,884中。

教导如何应用α-半乳糖苷酶A以治疗患者的参考文献包括,但不局限于美国专利No.6,066,626(基因治疗)和美国专利No.6,461,609(用蛋白质进行治疗)。用于本发明方法中的α-半乳糖苷酶A突变型包括,但不局限于那些描述于美国专利No.6,210,666中的突变型。

W.抗体

本发明进一步包含重构各种包括嵌合抗体制剂的抗体制剂的方法,包括嵌合的TNFR、嵌合的抗-糖蛋白IIb/IIIa、嵌合的抗-HER2、嵌合的抗-RSV、嵌合的抗-CD20和嵌合的抗-TNF。嵌合抗体制剂包含来自IgG抗体的人Fc部分和来自对抗原特异性的单克隆抗体的可变区。其他制剂包含与人IgG Fc部分融合的受体,如75kDa的TNF受体。这些分子进一步包括包含来自人和小鼠的轻链和重链的Fab片段。嵌合的TNFR可用于治疗炎症疾病,如类风湿性关节炎。嵌合的抗-糖蛋白IIb/IIIa可用于治疗心脏异常、血液凝结和血小板功能紊乱。嵌合的抗-HER2可用作乳腺癌的治疗药物,嵌合的抗-RSV可用于治疗呼吸道合胞病毒,嵌合的抗-CD20可用于治疗非何杰金氏淋巴瘤,且嵌合的抗-TNF可用于治疗Crohn氏病。

尽管这些嵌合抗体已证明可用于处理各种疾病,但由于在啮齿类细胞中产生的重组蛋白质的相对短的半衰期而需要相当频繁且以相当高的剂量给予。尽管大多数嵌合抗体是人的,因此由免疫系统识别为“自身的”,但它们由于非天然的糖基化模式将被降解并破坏。本发明要解决该问题,从而大大增加这些新药物的功效。

抗体及其生成方法

如在此处所用的,术语“抗体”指能够特异性地与抗原上的特定抗原决定部位结合的免疫球蛋白分子。抗体可为源自天然来源或源自重组来源的完整免疫球蛋白,或者完整免疫球蛋白的免疫反应性部分。抗体一般是免疫球蛋白分子四聚体。本发明中的抗体可以以各种形式存在,该形式包括如多克隆抗体、单克隆抗体、Fv、Fab和F(ab)2以及单链抗体和人源化的抗体(Harlow等人,1999,Using Antibodies:A LaboratoryManual,Cold Spring Harbor Laboratory Press,NY;Harlow等人,1989,Antibodies:A Laboratory Manual,Cold Spring Harbor,New York;Houston等人,1988,Proc.Natl.Acad.Sci.USA 85:5879-5883;Bird等人,1988,Science 242:423-426)。

如在此处所用的,术语“合成抗体”指用重组DNA技术生成的抗体,如由在此处所描述的噬菌体表达的抗体。该术语也应该解释为通过合成编码和表达抗体的DNA或编码抗体的氨基酸序列而生成的抗体,其中DNA或氨基酸序列以用本领域中可用的且众所周知的合成DNA或氨基酸序列技术获得。

针对全长肽或肽片段的单克隆抗体可用任何众所周知的单克隆抗体制备程序制备,如那些描述于Harlow等人(1988,Antibodies,ALaboratory Manual,Cold Spring Harbor,NY)和Tuszynski等人(1988,Blood,72:109-115)中的。想要的肽也可用化学合成技术合成。可选择地,编码想要的肽的DNA可进行克隆并在适合于生成大量的肽的细胞中从适当的启动子序列表达。针对肽的单克隆抗体是用如在此处所参考的标准程序从用该肽免疫接种的小鼠中生成的。

编码用在此处描述的程序获得的单克隆抗体的核酸可用本领域中可用的技术进行克隆和测序,且描述于如Wright等人(1992,Critical Rev.in Immunol.12(3,4):125-168)及在其中引用的参考文献中。进一步地,本发明的抗体可用描述于Wright等人(见上文)及在其中引用的参考文献和Gu等人(1997,Thrombosis and Hematocyst 77(4):755-759)中的技术进行“人源化”。

为了生成噬菌体抗体文库,首先从分离自细胞(如杂交瘤)的mRNA中获得cDNA文库,该mRNA表达要表达于噬菌体表面上的想要的肽,如想要的抗体。mRNA的cDNA拷贝是用反转录酶产生的。编码免疫球蛋白片段的cDNA是通过PCR获得的,且将结果所得的DNA克隆入适当的噬菌体载体中以生成噬菌体DNA文库,该文库包含DNA限定的免疫球蛋白基因。制备包含异源DNA的噬菌体文库的程序是本领域中众所周知的,且描述于如Sambrook和Russell(2001,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor,NY)。

可对编码想要的抗体的噬菌体进行加工,从而肽以这样一种方式在其表面上展示,即这些肽能够与其相应的结合肽结合,如抗体所针对的抗原。因此,当表达特定抗体的噬菌体在表达相应抗原的细胞存在时进行温育时,噬菌体将结合到细胞上。不表达抗体的噬菌体将不结合到细胞上。这种淘选技术是本领域中众所周知的且描述于如Wright等人(见上文)中。

已发展了用M13噬菌体展示来生产人抗体的方法,如那些在上面所描述的(Burton等人,1994,Adv.Immunol.57:191-280)。基本地,cDNA文库是从mRNA中生成的,该mRNA是从产生抗体的细胞群体中获得的。该mRNA编码重排的免疫球蛋白基因,因而cDNA编码同样的重排的免疫球蛋白基因。将扩增的cDNA克隆入M13表达载体中,从而生成在其表面表达人抗体片段的噬菌体文库。通过抗原结合选择展示目标抗体的噬菌体,并使其在细菌中繁殖以产生可溶性的人免疫球蛋白。因而,与常规单克隆抗体合成相反,该程序使编码人免疫球蛋白的DNA而不是表达人免疫球蛋白的细胞永生化。

对抗体分子聚糖的重构

一类肽即免疫球蛋白的特定糖基化对这些肽的生物学活性具有特别重要的作用。本发明不应解释为仅局限于IgG类的免疫球蛋白,而应解释为包括IgA、IgE和IgM类抗体的免疫球蛋白。

进一步地,本发明不应解释为仅局限于任何类型的常规抗体结构。相反,本发明应该解释为包括所有类型的抗体分子,包括如抗体片段、嵌合抗体、人抗体、人源化抗体等。

一般的免疫球蛋白分子包含效应部分和抗原结合部分。对于免疫球蛋白的综述,参见Harlow等人,1988,Antibodies:A Laboratory Manual,Cold Spring Harbor,New York;和Harlow等人,1999,Using Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory Press,NY。免疫球蛋白的效应部分位于分子的Fc部分并部分负责免疫球蛋白向其相关的细胞受体的有效结合。免疫球蛋白分子特别是该分子Fc部分的CH2结构域中的不正确的糖基化可影响免疫球蛋白的生物学活性。

关于免疫球蛋白IgG,更特定的是,IgG效应功能大部分是由IgG是否含有N-乙酰葡糖胺(GlcNAc)残基决定的,该残基附着于IgG分子CH2结构域中天冬酰胺(Asn)297上的N-连接聚糖的三甘露糖核心的分支甘露糖的4-O位置。该残基已知为“等分的GlcNAc”。将等分的GlcNAc添加到天然或重组IgG分子或含有IgG-Fc的嵌合构建体的N-聚糖链中的目的是使该分子Fc部分的Fc免疫效应功能最优化。这种效应功能可包括依赖抗体的细胞毒性(ADCC)和任何其他的生物学作用,该生物学作用需要对FcγR受体的有效结合及与补体的C1成分的结合。已描述了等分的GlcNAc对于实现IgG分子的最大免疫效应功能的重要性(Lifely等人,1995,Glycobiology 5(8):813-822;Jeffris等人,1990,Biochem.J.268(3):529-537)。

在IgG分子CH2结构域的Asn 297的糖基化位点发现的聚糖在结构上对于发现循环于人和动物血液血浆中的IgG分子,由骨髓瘤细胞、杂交瘤细胞和各种转染的永生化哺乳动物和昆虫细胞系产生的IgG是特征性的。在所有情况下,N-聚糖是高甘露糖链或具有或不具有等分的GlcNAc的完全的(Man3、GlcNAc4、Gal2、NeuAc2、Fuc1)或可变的不完全的双触角链(Raju等人,2000,Glycobiology 10(5):477-486;Jeffris等人,1998,Immunological.Rev.163L59-76;Lerouge等人,1998,Plant Mol.Biol.38:41-48;James等人,1995,Biotechnology 13:592-596)。

本发明提供了在体外定制的糖基化免疫球蛋白分子。该免疫球蛋白分子可为任何免疫球蛋白分子,包括但不局限于单克隆抗体、合成抗体、嵌合抗体、人源化的抗体等。生成抗体及对其进行表征的特定方法在别处描述。优选地,免疫球蛋白是IgG,且更优选地IgG是人源化的或人IgG,最优选地为IgG1。

本发明特定地涉及使用β1,4-甘露糖基-糖肽β1,4-N-乙酰葡糖胺转移酶GnT-III:EC2.4.1.144作为体外试剂,以使N-乙酰葡糖胺(GlcNAc)通过糖苷键连接到IgG分子CH2结构域中位于Asn 297的N-聚糖的三甘露糖核心的分支甘露糖的4-O位置上。然而,如从在此处提供的公开内容可以理解的,本发明不应解释为仅仅包括应用该酶以向免疫球蛋白分子提供等分的GlcNAc。相反,已发现可能的是对抗体分子的糖基化模式进行调节,从而该抗体分子除其他性质如稳定性等的潜在增强之外具有增强的生物学活性,即效应功能。

在本发明中提供了为了增强对Fc-γRIIIA的结合和增强的依赖抗体的细胞毒性的目的而从Asn(297)N-连接的聚糖中去除岩藻糖分子的一般方法(参见Shields等人,2002,J.Biol.Chem.277:26733-26740)。该方法需要使抗体分子与适合于抗体聚糖上岩藻糖分子的连接的岩藻糖苷酶接触。可选择地,重组抗体可表达于表达岩藻糖基转移酶的细胞中,如CHO细胞的Lec13变体。岩藻糖从抗体聚糖中的去除可单独进行,或与其他重构聚糖的方法如添加等分的GlcNAc结合进行。抗体在缺乏GnT-I的细胞中的表达也产生缺乏核心岩藻糖的Fc聚糖,该聚糖可进一步通过本发明进行修饰。

在本发明中提供了为了在IgG分子制剂中增强Fc免疫效应功能的目的而引入等分的GlcNAc的一般方法,其中该IgG分子在CH2结构域中特别是在Asn 297含有N-连接的寡糖。该方法需要使IgG分子群体达到一定的糖基化状态,换换从而聚糖链是GnT-III的受体。这是通过下面3个途径的任何一个实现的:1)通过对宿主表达系统的选择或遗传操作,该宿主表达系统分泌作为GnT-III的底物的具有N-聚糖链的IgG;2)通过用外切糖苷酶对IgG糖形式群体进行处理,从而在外切糖苷酶处理后剩余的聚糖结构是GnT-III的受体;3)如上文1)和2)中宿主选择和外切糖苷酶处理的一些组合,再加上随后由GnT-I和GnT-II添加GlcNAc以生成GnT-III的受体。

例如,从鸡血浆中获得的IgG主要含有高甘露糖链,且需要用一种或多种α-甘露糖苷酶进行消化以生成底物,从而由GnT-I将GlcNAc添加到甘露糖核心的α1,3甘露糖分支上。该底物可为基本的三甘露糖核心,即Man3GlcNAc2。用GnT-I、GnT-II和GnT-III的组合以UDP-GlcNAc作为糖供体对该核心结构的处理生成如图1所示的Man3GlcNAc5。这些糖基转移酶的作用顺序可进行改变以使所需产物的生产最优化。可选择地,该结构然后可用β1,4半乳糖基转移酶处理而进行延伸。如果需要,半乳糖基化的寡糖可进一步用α2,3-或α2,6-唾酸转移酶进行延伸以得到完整的双触角结构。利用本方法,可如任何开发中的治疗性IgG的最适Fc免疫效应功能所必需的对双触角聚糖链进行重构(图3)。

可选择地,发现于大多数动物的血浆中的IgG分子或作为重组产物由大多数动物细胞或由转基因动物分泌的IgG一般包括一系列双触角糖形式,该糖形式包括具有或不具有等分的GlcNAc的完全形式(NeuAc2、Gal2、GlcNAc4、Man3、±Fuc1)(图3)或可变的不完全形式(Raju等人,2000,Glycobiology 10(5):477-486;Jeffiris等人,1998,ImmunologicalRev.163:59-76)。为了确保等分的GlcNAc存在于这样产生的整个免疫球蛋白群体中,可依次地或在混合物中用下面的外切糖苷酶处理分子混合物:神经氨酸酶、β-半乳糖苷酶、β-氨基己糖苷酶、α-岩藻糖苷酶。然后结果所得的三甘露糖核心可用如上所述的糖基转移酶进行重构。

在一些情形中,需要从现存的抗体分子中消除效应子功能。本发明也包括用适当的糖苷酶和糖基转移酶修饰Fc聚糖,以消除效应子功能。同样预期的是添加用PEG或其他聚合物修饰的糖,该PEG或其他聚合物用于阻碍或消除Fc受体或补体与抗体的结合。

此外,对由转基因动物分泌的和由转基因植物作为“植物体(plantibodies)”贮藏的IgG进行了表征。在转基因植物中产生的具有含有β1,2连接的木糖和/或α1,3连接的岩藻糖的N-聚糖的IgG分子还可用除上述外切糖苷酶之外的外切糖苷酶处理以去除这些残基,从而生成三甘露糖核心或Man3GlcNAc4结构,然后用糖基转移酶处理以重构上述N-聚糖。

本发明的主要创新方面是适当的糖基转移酶的应用,该应用具有或不具有预先的外切糖苷酶处理,并以正确的顺序应用以使抗体的效应功能最优化。在一个示例性的实施方案中,将等分的GIcNAc引入到需要该等分的GlcNAc的IgG分子或其他IgG-Fc-嵌合构建体的聚糖中。在另一个示例性的实施方案中,将核心岩藻糖从IgG分子或其他IgG-Fc-嵌合构建体的聚糖中去除。

X.TNF受体-IgG Fc融合蛋白质

75kDa的人TNF受体的核苷酸和氨基酸序列在此处分别以SEQ IDNO:31和SEQ ID NO:32提出(分别为图82A和82B)。嵌合的抗-HER2的轻链和重链可变区的氨基酸序列分别以SEQ ID NO:35和SEQ IDNO:36提出(分别为图83A和83B)。嵌合的抗-RSV的重链和轻链可变区的氨基酸序列分别以SEQ ID NO:38和SEQ ID NO:37提出(分别为图84A和84B)。抗-TNF的非人的可变区的氢基酸序列在此处分别以SEQ ID NO:41和SEQ ID NO:42提出(分别为图85A和85B)。人IgG的Fc部分的核苷酸和氨基酸序列分别以SEQ ID NO:49和SEQID NO:50提出(分别为图86A和86B)。

重构的嵌合ENBRELTM可施用于如下患者,该患者选自患有类风湿关节炎的患者和患有多关节过程的少年关节炎的患者。重构的嵌合ENBRELTM也可施用于关节炎患者以减轻患者中的病征、症状或结构损伤。优选地,患者是人患者。

重构的SynagisTM抗体可施用于患者以对患者进行抗呼吸道合胞病毒(RSV)感染的免疫接种。重构的SynagisTM抗体也可施用于患者以预防或减轻由RSV导致的下呼吸道疾病的严重性。优选地,患者是人患者。

Y.MAb抗-糖蛋白IIb/IIIa

鼠抗-糖蛋白IIb/IIIa抗体可变区的氨基酸序列分别以SEQ ID NO:52(鼠成熟的可变的轻链,图87)和SEQ ID NO:54提出(鼠成熟的可变的重链,图88)。这些鼠的序列可根据美国专利No.5,777,085中的程序与人IgG氨基酸序列SEQ ID NO:51(人成熟的可变的轻链,图89)、SEQ ID NO:53(人成熟的可变的重链,图90)、SEQ ID NO:55(人的轻链,图91)和SEQ ID NO:56(人的重链,图92)进行组合以生成嵌合的人源化鼠抗-糖蛋白IIb/IIIa抗体。其他抗-糖蛋白IIb/IIIa人源化的抗体可发现于美国专利No.5,877,006中。表达抗-糖蛋白IIb/IIIaMAb 7E3的细胞系可商业上从ATCC(Manassas,VA)以目录号no.HB-8832购得。

所选抗体的适应症

重构的ReoproTM可施用于如下患者,该患者选自进行经皮肤的冠状介入的患者和患有不稳定心绞痛的患者(其中该患者计划在24小时内进行经皮肤的冠状介入。重构的ReoproTM也可施用于进行经皮肤的冠状介入的患者以减轻或预防患者中的心脏缺血并发症。优选地,患者是人患者。

重构的HerceptinTM可施用于患有超表达HER2蛋白质的转移性乳腺癌的患者。优选地,患者是人患者。

重构的RemicadeTM可施用于如下患者,该患者选自患有类风湿关节炎的患者、患有Crohn氏病的患者和患有成瘘的Crohn氏病的患者。重构的RemicadeTM也可施用于类风湿关节炎患者以减轻患者中类风湿关节炎的病征和症状。RemicadeTM也可施用于Crohn氏病患者以减轻患者中Crohn氏病的病征和症状。优选地,患者是人患者。

Z.MAb抗-CD20

嵌合的抗-CD20抗体的核酸和氨基酸序列在SEQ ID NO:59(鼠可变区轻链的核酸序列,图93A)、SEQ ID NO:60(鼠可变区轻链的氨基酸序列,图93B)、SEQ ID NO:61(鼠可变区重链的核酸序列,图94A)和SEQ ID NO:62(鼠可变区重链的氨基酸序列,图94B)中提出。为了使鼠抗体人源化,可方便地应用含有人IgG重链和轻链恒定结构域的TCAE 8(SEQ ID NO:57,图95A-95E)。根据美国专利No.5,736,137给出的说明将上述鼠可变区编码DNA克隆入TCAE 8载体中构建了一个载体(SEQ ID NO:58,图96A-96E),该载体当转化入哺乳动物细胞系中时可表达嵌合的抗-CD20抗体。其他人源化的抗-CD20抗体可发现于美国专利No.6,120,767中。表达抗-CD20抗体MAb C273的细胞系可商业上从ATCC(Manassas,VA)以目录号no.HB-9303购得。

技术人员将易于理解在此处提出的序列不是排他性的,而是嵌合抗体的可变区、受体和其他结合部分的例子。进一步地,构建嵌合的或“人源化的”抗体的方法是本领域中众所周知的,且描述于如美国专利No.6,329,511和美国专利No.6,210,671中。结合本公开内容和本领域中众所周知的方法,技术人员将认识到本发明不局限于在此处公开的序列。

嵌合抗体的表达是本领域中众所周知的,且详细描述于如美国专利No.6,329,511中。表达系统可为原核生物的、真核生物的等。进一步地,嵌合抗体在用杆状病毒表达系统的昆虫细胞中的表达描述于Putlitz等人(1990,Bio/Technology 8:651-654)中。此外,表达编码融合或嵌合蛋白质的核酸的方法是本领域中众所周知的,且描述于如Sambrook等人(2001,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory Press,New York)和Ausubel等人(1997,Current Protocolsin Molecular Biology,Green&Wiley,New York)中。

对根据本发明的方法产生的嵌合抗体的功能和生物学活性的确定对于本领域的技术人员而言也是基本的操作。通过竞争测定法确定抗体亲和力的方法详细描述于Berzofsky(J.A.Berzofsky和I.J.Berkower,1984,Fundamental Immunology(ed.W.E.Paul),Raven Press(NewYork),595)中。简言之,使用放射性碘化的单克隆抗体将嵌合抗体的亲和力与单克隆抗体的进行比较,其中该嵌合抗体是从该单克隆抗体中衍生的。

重构的抗-CD20抗体可施用于如下患者,该患者患有复发的或难治的低级或卵泡性、CD20-阳性、B-细胞非何杰金氏淋巴瘤。优选地,患者是人患者。

VII.药物组合物

在另一方面,本发明提供了药物组合物。该药物组合物包括药物可接受的稀释剂和在非天然存在的水溶性聚合物、治疗部分或生物分子和糖基化或非糖基化的肽之间的共价缀合物。该聚合物、治疗部分或生物分子是通过完整糖基连接基团与肽缀合的,该糖基连接基团插入肽和聚合物、治疗部分或生物分子之间并共价地与两者连接。

本发明的药物组合物适用于各种药物送递系统。用于本发明的适当的制剂可发现于Remington’s Pharmaceutical Sciences,Mace PublishingCompany,Philadelphia,PA,17th ed.(1985)。对于药物送递方法的简述,参见Langer,Science 249:1527-1533(1990)。

该药物组合物可制备为任何适当的给予方式,包括如局部的、口服的、鼻的、静脉内的、颅内的、腹膜内的、皮下的或肌内的给予。对于肠胃外的给予,如皮下注射,载体优选地包含水、盐水、醇、脂肪、蜡或缓冲液。对于口服给予,可应用任何上述载体或固体载体,如甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖和碳酸镁。生物可降解的微球体(如polylactate polyglycolate)也可用作本发明的药物组合物的载体。适当的生物可降解的微球体公开于如美国专利No.4,897,268和5,075,109中。

通常,药物组合物是肠胃外给予的,如静脉内给予。因而,本发明提供了用于肠胃外给予的组合物,该组合物包含溶解或悬浮于适当的载体中的化合物,优选地为水相载体,如水、缓冲的水、盐水、PBS等。该组合物可含有接近生理学状况所需的药物可接受的辅助物质,如调节pH的和缓冲的试剂、张力调节剂、润湿剂、去污剂等。

这些组合物可通过常规的灭菌技术进行灭菌,或可为过滤灭菌的。结果所得的水溶液可原样进行包装以供使用,或者可以冻干,冻干的制剂在给予之前是与无菌的水相载体组合的。制剂的pH一般为3~11,更优选地为5~9,最优选地为7~8。

在一些实施方案中,本发明的肽可整合入从标准的小泡形成性脂质形成的脂质体中。制备脂质体的各种方法是可用的,如描述于Szoka等人,Ann.Rev.Biophys.Bioeng.9:467(1980),美国专利No.4,235,871、4,501,728和4,837,028。应用各种导向剂(如本发明的唾液酸半乳糖苷)对脂质体的导向是本领域中众所周知的(参见美国专利No.4,957,773和4,603,044)。

可应用使导向剂与脂质体偶联的标准方法。这些方法一般包括将脂质成分整合入脂质体中,如可进行活化以附着导向剂的磷脂酰乙醇胺,或者衍生化的亲脂化合物,如本发明的脂质衍生的肽。

导向机制一般需要导向剂以这样的方式定位于脂质体的表面,从而导向部分能够与目标如细胞表面受体相互作用。本发明的糖可用本领域的技术人员公知的方法(如分别用长链烷基卤化物或脂肪酸对存在于糖上的羟基基团的烷基化或酰基化)在形成脂质体前附着于脂质分子上。可选择地,可以以这样的方式形成脂质体,从而连接体部分在膜形成时可首先整合入膜中。该连接体部分必须具有亲脂的部分,该部分可坚固地嵌入并锚定在膜中。它也必须具有反应部分,该部分是在脂质体的水相表面可化学利用的。对反应部分进行选择,从而它在化学上适合于与后来添加的导向剂或糖形成稳定的化学键。在一些情况下,可能的是使导向剂与连接体分子直接附着,但在大多数情况下,更适合于用第三个分子作为化学桥接,从而连接膜中的连接体分子和导向剂或糖,该导向剂或糖是从小泡表面三维延伸的。本发明的肽给予的剂量范围是大到足以产生想要的作用的剂量,其中免疫反应的症状显示了一些程度的抑制。该剂量不应该太大而导致副作用。通常,该剂量将依年龄、状况、性别及动物中疾病的程度而变化,且可由本领域的技术人员确定。该剂量可由单个医生在出现任何禁忌症的情况下进行调节。

额外的药物方法可应用于控制作用的持续时间。控释制剂可通过应用聚合物而缀合、复合或吸附肽而实现。控释送递可通过选择适当的大分子(如聚酯、多氨基羧甲基纤维素和鱼精蛋白硫酸盐)和大分子的浓度以及整合方法来实践以控制释放。控制控释制剂作用时间的另一个可能的方法是将肽整合入聚合材料的颗粒中,如聚酯、多氨基酸、水凝胶、聚(乳酸)或乙烯乙酸乙烯酯共聚物。

为了防止肽与血浆蛋白质结合,优选地是将肽捕获于通过凝聚技术或界面聚合制备的微囊中,如分别为羟甲基纤维素或明胶-微囊和聚(甲基丙烯酸甲酯)微囊,或者将肽捕获于胶体药物送递系统中,如脂质体、白蛋白微球体、微乳、纳米颗粒(nanoparticle)和纳米囊(nanocapsule)或大乳剂中。这种介绍公开于Remington’s Pharmaceutical Sciences(16th Ed.,A.Oslo,ed.,Mark,Easton,Pa.,1980)。

本发明的肽非常适用于可导向的药物送递系统,如大分子复合物、纳米囊、微球体或珠子形式的合成或天然的聚合物,且适用于基于脂质的系统,该系统包括水包油乳剂、微团、混合的微团、脂质体和重封红细胞。这些系统共同已知为胶体药物送递系统。一般地,含有分散的肽的这种胶体颗粒直径约为50nm-2μm。胶体颗粒的大小使得其能够通过注射经静脉内给予或者作为气溶胶而给予。用于胶体系统制剂中的材料一般是通过过滤灭菌而灭菌的、无毒性的及生物可降解的,例如白蛋白、乙基纤维素、酪蛋白、明胶、卵磷脂、磷脂和豆油。聚合的胶体系统是通过与凝聚微囊化类似的方法制备的。

在一个示例性的实施方案中,肽是用作导向送递系统的脂质体的成分。当将磷脂轻轻分散在水相介质中时,它们膨胀、水合并自发地形成多层同心的双层小泡,在该小泡中,水相介质层分隔脂双层。这种系统通常称为多层脂质体或多层小泡(MLV),且直径范围为约100nm~约4μm。当对MLV进行超声处理时,则形成直径范围为约20~约50nm的小的单层小泡(SUVS),该小的单层小泡在SUV核心含有水溶液。

用于脂质体生产中的脂质的例子包括磷脂酰化合物,如磷脂酰甘油、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰乙醇胺。特别有用的是二酰基磷脂酰甘油,其中脂质部分含有14-18个碳原子,特别地为16-18个碳原子,且是饱和的。示例性的磷脂包括卵磷脂酰胆碱、二棕榈酰磷脂酰胆碱和二硬脂酰磷脂酰胆碱。

在制备含有本发明的肽的脂质体中,应该考虑这些变量,如肽被囊化的效率、肽的不稳定性、结果所得的脂质体群体的同质性和大小、肽-脂质比例、制剂的渗透不稳定性和制剂的药物可接受性。Szoka等人,Annual Review of Biophysics and Bioengineering,9:467(1980);Deamer等人,Liposomes,Marcel Dekker,New York,1983,27;Hope等人,Chem.Phys.Lipids,40:89(1986))。

含有本发明的肽的导向送递系统可以各种方式给予宿主,特别是哺乳动物宿主,如静脉内的、肌内的、皮下的、腹膜内的、血管内的、局部的、腔内的、经皮肤的、鼻内的或吸入的。肽的浓度将依赖于特定的应用、疾病的特性、给予的频率等而变化。导向的送递系统被囊化的肽可以在包含其他适当的化合物和水相生理学可接受的介质的制剂中提供,该介质如盐水、磷酸盐缓冲盐水等。

由本发明的方法制备的化合物也可用作诊断试剂。例如,标记的化合物可用于在怀疑具有炎症的患者中定位炎症或肿瘤转移的区域。为此应用,该化合物可用125I、14C或氚进行标记。

实验实施例

现在本发明将结合下面的实施例进行描述。这些实施例是仅仅为了阐明的目的而提供的,且本发明决不应解释为局限于这些实施例,而应解释为包含由于在此处提供的介绍而变为显而易见的任何和所有变异。

现在描述了用于在本实施例中提出的实验中的材料和方法。

A.一般方法

l.CMP-SA-PEG的制备

本实施例提出了对CMP-SA-PEG的制备。

2-(苄氧基酰胺)-甘氨酰酰胺-2-脱氧-D-吡喃甘露糖的制备.将N-苄氧基羰基-甘氨酰-N-羟基琥珀酰亚胺酯(3.125g,10.2mmol)添加到含有溶解于MeOH(10mL)和H2O(6mL)中的D-甘露糖胺-HCl(2g,9.3mmol)和三乙胺(1.42mL,10.2mmol)的溶液中。将反应物在室温搅动16小时并用回旋蒸发(rotoevaporation)进行浓缩。层析(硅,10%MeOH/CH2Cl2)得到了1.71g(50%产量)白色固体产物:Rf=0.62(硅,CHCl3:MeOH:H2O,6/4/1);1H NMR(CD3OD,500MHz)δ3.24-3.27(m,2H),3.44(t,1H),3.55(t,1H),3.63-3.66(m,1H),3.76-3.90(m,6H),3.91(s,2H),4.0(dd,2H),4.28(d,1H,J=4.4),4.41(d,1H,J=3.2),5.03(s,1H),5.10(m,3H),7.29-7.38(m,10H)。

5-(N-苄氧基酰胺)甘氨酰酰胺-3,5-双脱氧-D-甘油-D-半乳糖-2-nonulopyranosuronate换的制备.将2换-(N-苄氧基酰胺)甘氨酰酰胺-2-脱氧-D-吡喃甘露糖(1.59g,4.3mmol)溶解于0.1M HEPES(12mL,pH 7.5)和丙酮酸钠(4.73g,43mmol)的溶液中。使神经氨酸醛缩酶(在45mL含有0.1M NaCl的pH 6.9的10mM磷酸盐缓冲溶液中540U的酶)和反应混合物加热到37℃持续24小时。然后将反应混合物离心并将上清液进行层析(C18硅,从H20(100%)到30%MeoH/水的梯度)。收集合适的级分,浓缩,将残余物进行层析(C18硅,从10%MeOH/CH2Cl2到CH2Cl2/MeOH/H2O 6/4/1的梯度)。收集适当的级分,将其浓缩并将剩余物重悬于水中。冻干后,获得了白色固体产物(1.67g,87%产量):Rf=0.26(硅,CHCl3:MeOH:H2O为6/4/1);1H NMR(D2O,500MHz)δ1.82(t,1H),2.20(m,1H),3.49(d,1H),3.59(dd,1H),3.67-3.86(m,2H),3.87(s,2H),8.89-4.05(m,3H),5.16(s,2H),7.45(m,5H)。

5-甘氨酰酰胺-3,5-双脱氧-D-甘油-D-半乳糖-2-nonulopyranosuronate的制备.将5-(N-苄氧基酰胺)甘氨酰酰胺-3,5-双脱氧-D-甘油-D-半乳糖-nonulopyranosuronate(1.66g,3.6mmol)溶解于20mL 50%的水/甲醇中。将烧瓶重复地抽真空并置于氩中,然后加入10%的Pd/C(0.225g)。在重复抽真空之后,将氢(约1atm)加入到烧瓶中,并将反应混合物搅动18小时。使反应混合物通过硅藻土过滤,用旋转的蒸发器进行浓缩并冻干以得到1.24g(100%产量)的白色固体产物:Rf=0.25(硅,IPA/H2O/NH4OH 7/2/1);1H NMR(D2O,500MHz)δ1.83(t,1H,J=9.9),2.23(dd,1H,J=12.9,4.69),3.51-3.70(m,2H),3.61(s,2H),3.75-3.84(m,2H),3.95-4.06(m,3H)。

胞苷-5’-单磷酰-[5-(N-芴甲氧基-酰胺)甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate]的制备.将含有溶解于20mLH2O中的5-甘氨酰酰胺-3,5-双脱氧-D-甘油-D-半乳糖-2-nonulopyranosuronate(0.55g,1.70mmol)的溶液添加到Tris(1.38g,11.4mmol)、1M MgCl2(1.1mL)和BSA(55mg)的溶液中。用1M NaOH(2mL)将溶液的pH调节到8.8并添加CTP-2Na+(2.23g,4.2mmol)。反应混合物的pH是由pH控制器控制的,该控制器可释放所需要的1M NaOH以维持pH 8.8。将融合蛋白质(唾酸转移酶/CMP-神经氨酸合成酶)添加到溶液中并在室温搅动反应混合物。2日后,加入额外量的融合蛋白质并将反应物搅动额外的40小时。使反应混合物在EtOH中沉淀,并将沉淀用冷的EtOH洗涤5次以得到2.3克白色固体。将约1.0g粗产物溶解于1,4二噁烷(4mL)、H2O(4mL)和饱和的NaHCO3(3mL)中,并逐滴加入溶解于2ml二噁烷中的FMOC-Cl(308mg,1.2mmol)溶液。在室温搅动16小时后,将反应混合物通过旋转蒸发浓缩到约6mL并用层析(C18硅,从100%H2O到30%MeOH/H2O的梯度)进行纯化。组合并浓缩适当的级分。将剩余物溶解于水中并冻干以获得253mg白色固体:Rf=0.50(硅,IPA/H2O/NH4OH 7/2/1);1HNMR(D2O,500MHz)δ1.64(dt,1H,J=12.0,6.0),2.50(dd,1H,J=13.2,4.9),3.38(d,J=9.67,1H),3.60(dd,J=11.65,6.64,1H),3.79(d,J=4.11,1H),3.87(dd,J=12.24,1.0,1H),3.97(m,2H),4.07(td,J=10.75,4.84,1H),4.17(dd,J=10.68,1.0,1H),4.25(s,2H),4.32(t,J=4.4,1H),4.37(t,J=5.8,1H),4.6-4.7(m,由溶剂的峰而导致模糊),5.95(d,J=4,1H),6.03(d,J=7.4,1H),7.43-7.53(m,3H),7.74(m,2H),7.94(q,J=7,3H)。MS(ES);对C35H42N5O18P([M-H]-)的计算值为851.7;实测值850.0。

胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)的制备.将二异丙基胺(83μL,0.587μmol)添加到溶解于水(3mL)和甲醇(1mL)中的胞苷-5’-单磷酰-[5-(N-芴甲氧基-酰胺)甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate](100mg,0.117mmol)中。将反应混合物在室温搅动16小时并将反应物甲醇通过旋转蒸发从反应混合物中去除。将粗的反应混合物通过应用水的C18硅胶柱过滤,并将洗脱液收集且冻干以得到白色固体产物(87mg,100%):Rf=0.21(硅,IPA/H2O/NH4OH7/2/1);1H NMR(D2O,500MHz)δ1.66(td,1H,J=5.3),2.50(dd,1H,J=13.2,4.6),3.43(d,J=9.58,1H),3.63(dd,J=11.9,6.44,1H),3.88(dd,J=11.8,1.0,1H),3.95(td,J=9.0,2.3,1H),4.10(t,J=10.42,1H),4.12(td,J=10.34,4.66,1H),4.18(d,J=10.36,1H),4.24(m,2H),4.31(t,J=4.64,1H),4.35(t,1H),6.00(d,J=4.37,1H),6.13(d,J=7.71,1H),7.98(d,J=7.64,1H)。MS(ES);对C21H32N5O11P([M-H]-)的计算值为629.47;实测值627.9。

胞苷-5’-单磷酰-[5-(N-甲氧基-聚氧乙烯-(1kDa)-3-氧代丙酰胺)-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate]的制备.将苄基三唑-1-基氧-三(二甲基氨基)-鏻六氟磷酸盐(BOP,21mg,48μmol)添加到溶解于无水DMF(700μL)和三乙胺(13μL,95μmol)中的甲氧基聚氧乙烯-(1kDa平均分子量)-3-氧代丙酸(48mg,48μmol)溶液中。30分钟后,添加含有胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(30mg,48μmol)、水(400μL)和三乙胺(13μL,95μmol)的溶液。将该溶液在室温搅动20分钟,然后进行层析(C18硅,甲醇/水梯度)。收集适当的级分,将其浓缩并将剩余物重悬于水中,且冻干以获得40mg(50%产量)白色固体:Rf=0.36(硅,IPA/H2O/NH4OH 7/2/1);1H NMR(D2O,500MHz)δ1.66(td,1H,J=5.3),2.50(dd,1H,J=13.2,4.6),2.64(t,J=5.99,3H),3.43(d,J=9.58,1H),3.63(m,1H),3.71(s,70H),3.79(m,由3.71的峰导致模糊),3.82(t,J=6.19,1H),3.88(dd,J=11.8,1.0,1H),3.95(td,J=9.0,2.3,1H),3.98(t,J=5.06,1H),4.12(td,J=10.34,4.66,1H),4.18(d,J=10.36,1H),4.23(d,J=4.85,2H),4.31(t,J=4.64,1H),4.35(t,1H),6.00(d,J=4.55,1H),6.13(d,J=7.56,1H),7.98(d,J=7.54,1H)。MS(MALDI),观察的[M-H];1594.5,1638.5,1682.4,1726.4,1770.3,1814.4,1858.2,1881.5,1903.5,1947.3。

胞苷-5’-单磷酰-[5-(N-甲氧基-聚氧乙烯-(10kDa)-氧代酰胺)-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronatel的制备.将胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(2.5mg,4μmol)和水(180μL)添加到含有三乙胺(1.1μL,8μmol)的无水DMF(800μL)中的(甲氧基聚氧乙烯-(10kDa,平均分子量)-氧代羰基-(N-氧代苯并三唑)酯(40mg,4μmol)溶液中,并将反应混合物在室温搅动1小时。然后用水(8mL)稀释反应混合物并通过反相快速层析(C18硅,甲醇/水梯度)进行纯化。合并适当的级分,将其浓缩并将剩余物溶解于水中,且冻干以得到20mg(46%产量)白色固体产物:Rf=0.35(硅,IPA/H2O/NH4OH 7/2/1);1H NMR(D2O,500MHz)δ1.66(td,1H),2.50(dd,1H),2.64(t,3H),3.55-3.7(m,由3.71的峰导致模糊),3.71(s,488H),3.72-4.0(m,由3.71的峰导致模糊),4.23(m,3H),4.31(t,1H),4.35(t,1H),6.00(d,J=4.77,1H),6.12(d,J=7.52,1H),7.98(d,J=7.89,1H)。MS(MALDI),观察的[M-CMP+Na];10780。

2.CMP-SA-PEG II的制备

本实施例提出了制备CMP-SA-PEG的一般方法,且具体是制备CMP-SA-PEG(1kDa)和CMP-SA-PEG(20kDa)的方法。

制备胞苷-5-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)的一般方法.胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(870mg,1.02mmol)溶解于25mL水中,并添加5.5mL 40wt%的二甲胺水溶液。将反应物搅动1小时,然后通过旋转蒸发去除过量的二甲胺。将水溶液通过C-18硅胶柱过滤,并用水洗涤该柱。将洗脱液合并且冻干以得到638mg(93%)白色固体产物:Rf=0.10(硅,IPA/H2O/NH4OH 7/2/1);1H NMR(D2O,500MHz)δ1.66(td,1H,J=5.3),2.50(dd,1H,J=13.2,4.6),3.43(d,J=9.58,1H),3.63(dd,J=11.9,6.44,1H),3.88(dd,J=11.8,1.0,1H),3.95(td,J=9.0,2.3,1H),4.10(t,J=10.42,1H),4.12(td,J=10.34,4.66,1H),4.18(d,J=10.36,1H),4.24(m,2H),4.31(t,J=4.64,1H),4.35(t,1H),6.00(d,J=4.37,1H),6.13(d,J=7.71,1H),7.98(d,J=7.64,1H)。MS(ES);对C21H32N5O11P([M-H]-)的计算值为629.47;实测值627.9。

应用mPEG-(对硝基苯酚)碳酸酯制备CMP-SA-PEG的一般方法.

将胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(175mg,0.259mMol)溶解于pH 8.5的水和DMF或THF的混合物(比例为1∶2)中。于室温在8小时内将mPEG-硝基苯酚碳酸酯(2~20kDa mPEG)(0.519mMole)分几部分加入,并将反应混合物于室温搅动3日。当完成时,加入水(40ml)和1.5mlNH4OH(29%的水溶液)。将黄色的反应混合物再搅动2小时,然后通过旋转蒸发进行浓缩。然后用水(pH 8.5)将反应混合物稀释至约500ml体积,并通过反相快速层析法(Biotage 40M,C18硅柱)用甲醇/水梯度进行纯化。合并适当的级分,并浓缩以得到白色固体产物。Rf(硅;1-丙醇/水/29%NH4OH;7/2/1);(2kDa PEG)=0.31;(5kDa PEG)=0.33;(10kDa PEG)=0.36;(20kDa PEG)=0.38(TLC硅,IPA/H2O/NH4OH 7/2/1);MS(MALDI),[M-CMP+Na]观察值;(2kDa)=2460;(5kDa)=5250;(10kDa)=10700;(20kDa)=22500。

制备胞苷-5’-单磷酰-[5-(N-芴甲氧基-甲酰胺)-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate]的一般方法.将丙酮酸钠(2.4g,218mmol)、HEPES缓冲液(0.25M,pH 7.34)和1.0g(22mmol)Fmoc-甘氨酰甘露糖酰胺在150mL的聚碳酸酯瓶中混合。然后加入神经氨酸醛缩酶溶液(19mL,~600U),并将反应混合物在定轨摇床上于30℃进行温育。23小时后,薄层层析(TLC)显示已经发生了大约75%向产物的转变。然后向反应混合物中加入CTP(1.72g,33mmol)和0.1M MnCl2(6mL)。用1M NaOH(5.5mL)将pH调节到7.5,并加入含有CMP-神经氨酸合成酶(奈瑟氏球菌属)的溶液(25mL,386U)。反应在24小时后完成,并将反应混合物进行层析(C-18硅,H2O(100%)到10%MeOH/H2O的梯度)。合并适当的级分,浓缩和冻干以得到白色固体。Rf(IPA/H2O/NH4OH,7/2/1)=0.52.1H NMR(D2O,500MHz)δ1.64(dt,1H,J=12.0,6.0),2.50(dd,1H,J=13.2,4.9),3.38(d,J=9.67,1H),3.60(dd,J=11.65,6.64,1H),3.79(d,J=4.11,1H),3.87(dd,J=12.24,1.0,1H),3.97(m,2H),4.07(td,J=10.75,4.84,1H),4.17(dd,J=10.68,1.0,1H),4.25(s,2H),4.32(t,J=4.4,1H),4.37(t,J=5.81H),4.6-4.7(m,由溶剂的峰而导致模糊),5.95(d,J=4,1H),6.03(d,J=7.4,1H),7.43-7.53(m,3H),7.74(m,2H),7.94(q,J=7,3H).MS(ES);对C35H42N5O18P([M-H]-)的计算值为850.7;实测值850.8。

制备胞苷-5’-单磷酰-[5-(N-甲氧基-聚氧乙烯-(1kDa)-3-氧代丙酰胺)-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate]的一般方法.将甲氧基-聚氧乙烯-(1kDa平均分子量)-3-氧代丙酸-N-琥珀酰亚胺酯(52mg,52μmol)溶解于无水DMF(450μL)和三乙胺(33μL,238μmol)中。加入固体胞苷-5’-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(30mg,48μmol)。加入pH 8的水(330μL),且30分钟后,加入另外28mg NHS-活化的PEG。再过5分钟后,将反应混合物进行层析(C-18硅,甲醇/水梯度),并浓缩适当的级分得到32mg(40%产量)的白色固体。Rf=0.31(硅,IPA/H2O/NH4OH 7/2/1);1H NMR(D2O,500MHz)δ1.66(td,1H,J=5.3),2.50(dd,1H,J=13.2,4.6),2.64(t,J=5.99,3H)3.43(d,J=9.58,1H),3.63(m,1H),3.71(s,70H),3.79(m,由3.71的峰而导致模糊),3.82(t,J=6.19,1H)3.88(dd,J=11.8,1.0,1H),3.95(td,J=9.0,2.3,1H),3.98(t,J=5.06,1H),4.12(td,J=10.34,4.66,1H),4.18(d,J=10.36,1H),4.23(d,J=4.85,2H),4.31(t,J=4.64,1H),4.35(t,1H),6.00(d,J=4.55,1H),6.13(d,J=7.56,1H),7.98(d,J=7.54,1H).MS(MALDI),[(M-CMP)-H]观察值;1506.4,1550.4,1594.5,1638.5,1682.4,1726.4,1770.3,1814.4,1858.2。

制备胞苷-5’-单磷酰-{5-[N-(2,6-二甲氧基-聚氧乙烯-(20kDa)-3-氧代丙酰胺-赖氨酰酰胺-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate}的一般方法.将2,6-二[甲氧基-聚氧乙烯-(20kDa平均分子量)-3-氧代丙酰胺]-赖氨酰酰胺-N-琥珀酰亚胺酯(367mg,9μmol)溶解于无水THF(7mL)和三乙胺(5μL,36μmol)中。

将胞苷-5,-单磷酰-(5-甘氨酰酰胺-3,5-双脱氧-β-D-甘油-D-半乳糖-2-nonulopyranosuronate)(30mg,48μmol)溶解于1.0mL水中,并加入到反应混合物中。将反应物于室温搅动4小时,然后进行层析(HPLC,Waters Xterra RP8,水/NH4OH,100%到20%甲醇/水/NH4OH的梯度,1mL/分钟)以获得白色固体,其Rt=22.8分钟。MS(MALDI),[(M-CMP)-H]观察值;43027.01(40,000-45,500)。

3.UDP-Gal-PEG的制备

本实施例提出了制备UDP-Gal-PEG的一般方法。

将THF(0.5ml)中的348mg甲氧基-聚氧乙烯丙酸N-羟基琥珀酰亚胺酯(mPEG-SPA,MW1,000)加入到25mg半乳糖胺-1-磷酸在1ml水的溶液中,随后添加67μL三乙胺。将结果所得的混合物于室温搅动17小时。在减压下浓缩提供粗的反应混合物,该粗的反应混合物通过层析(C-18硅,应用10%、20%、30%、40%含水MeOH的分级梯度)进行纯化,以在合并适当的级分并浓缩至干燥后得到90mg(74%)的产物。Rf=0.5(硅,丙醇/H2O/NH4OH 30/20/2);MS(MALDI),观察值1356,1400,1444,1488,1532,1576,1620。

[α-1-(尿苷-5’-二磷酰)]-2-脱氧-2-(甲氧基-聚氧乙烯-丙酰胺-1kDa)-α-D-半乳糖胺.将2-脱氧-2-(甲氧基-聚氧乙烯-丙酰胺-1kDa)-α-1-单磷酸-D-半乳糖胺(58mg)溶解于6mL DMF和1.2mL吡啶中。然后加入UMP-morpholidate(60mg),并于70℃将结果所得的混合物搅动48小时。浓缩后,将残余物进行层析(C-18硅,应用10%、20%、30%、40%、50%、80%MeOH的分级梯度)以在浓缩适当的级分后得到50mg产物。Rf=0.54(硅,丙醇/H2O/NH4OH 30/20/2)。MS(MALDI);观察值1485,1529,1618,1706。

[α-1-(尿苷-5’-二磷酰)]-6-脱氧-6-(甲氧基-聚氧乙烯-氨基-2kDa)-α-D-半乳糖.将[α-1-(尿苷-5’-二磷酰)1-6-羰基醛(carboxaldehyde)-α-D-半乳糖(10mg)溶解于2mL 25mM的磷酸钠缓冲液(pH 6.0)中,并用甲氧基-聚乙二醇胺(MW 2,000,70mg)处理,然后用25uL 1M NaBH3CN溶液于0℃进行处理。将结果所得的混合物于-20℃冷冻3日。将反应混合物进行层析(HPLC,Water XterraP8),应用0.015M NH4OH作为流动相A,MeOH作为流动相B,流速为1.0mL/分钟。收集产物,浓缩得到固体:Rt=9.4分钟。Rf=0.27(硅,EtOH/H2O 7/3)。

[α-1-(尿苷-5’-二磷酰)]-6-氨基-6-脱氧-α-D-半乳糖.将15mg乙酸铵加入到[α-1-(尿苷-5’-二磷酰)]-6-羰基醛(carboxaldehyde)-α-D-吡喃型半乳糖(10mg)在磷酸钠缓冲液(pH 6.0)中的溶液中。然后加入1M NaBH3CN溶液(25μL),并将混合物搅动24小时。将溶液进行浓缩并将残余物进行层析(Sephadex G10)以获得10mg白色固体。Rf=0.62(硅,EtOH/0.1M NH4Ac)。

[α-1-(尿苷-5’-二磷酰)]-6-脱氧-6-(甲氧基-聚氧乙烯-丙酰胺,~2kDa)-α-D-吡喃型半乳糖.将[α-1-(尿苷-5’-二磷酰)]-6-氨基-6-脱氧-α-D-吡喃型半乳糖(5mg)溶解于1mL H2O中。然后加入甲氧基-聚乙二醇丙酰-NHS酯(MW~2,000,66mg),然后加入4.6μL三乙胺。将结果所得的混合物在室温搅动过夜,然后在HPLC(C-8硅)上纯化以得到产物,Rt=9.0分钟。

[α-1-(尿苷-5’-二磷酰)]-6-脱氧-6-(甲氧基-聚氧乙烯-甲酰胺,~2kDa)-α-D-吡喃型半乳糖.将[α-1-(尿苷-5’-二磷酰)]-6-氨基-6-脱氧-α-D-吡喃型半乳糖(10mg)与甲氧基-聚乙二醇羧基-HOBT(MW 2,000,67mg)在1mL H2O中混合,随后加入6.4mg EDC(1-乙基-3-(3-二甲氨基丙基)碳二亚胺盐酸和4.6μL三乙胺。将结果所得的混合物在室温搅动24小时。将混合物层析(C-8硅)以得到产物。

4.UDP-GlcNAc-PEG的制备

本实施例提出了制备UDP-GlcNAc-PEG的一般方法。在方案17的左侧,将保护的氨基糖二磷酸-核苷酸进行氧化以在糖的6-位形成醛。通过希夫碱的形成和还原将该醛转变为相应的伯胺。使结果所得的加合物与m-PEG的对硝基苯酚碳酸酯接触,该酯与胺反应,从而使m-PEG通过酰胺键结合到糖核上。在方案17上部的右侧,用化学氧化剂处理保护的氨基糖二磷酸-核苷酸以在糖核的6位碳上形成羧基。使羧基活化并与m-PEG胺反应,从而使m-PEG通过酰胺键结合到糖核上。在方案17下部的右侧,反应基本与右侧上部的相同,只是使起始的糖核苷酸与氧化性酶如脱氢酶接触,而不是与化学氧化剂接触。

方案17.

5.UDP-GalNAc-PEG的制备

本实施例(方案18)提出了制备UDP-GalNAc-PEG的一般方法。上面提出的反应开始于糖二磷酸-核苷酸,其中R是羟基1或保护的胺2。在步骤a中,用氧化酶和过氧化氢酶的混合物处理起始的糖,从而将糖的6位转变为醛部分(3和4)。在步骤c中,通过希夫碱的形成和还原将该醛转变为相应的胺(7和8)。在步骤e中,任选用活化的m-PEG衍生物处理该胺,从而将胺酰化以产生相应的m-PEG酰胺(11和13)。可选择地,在步骤f中,使胺与活化的m-PEG种类如m-PEG活性酯接触,从而形成相应的m-PEG酰胺(12和14)。在步骤b中,也用过氧化氢酶和氧化酶处理起始材料,完全氧化羟甲基部分,从而在6-位形成羧基。在步骤d中,将羧基部分活化,并随后通过与m-PEG胺中间物反应而转变为m-PEG加合物(9和10)。这示于方案18中。

方案18.

                                     R=OH,11;R=NHAc,12

                                     R=OH,13;R=NHAc,14

                                     R=OH,15;R=NHAc,16

                                     R1=COCH2CH2(OCH2CH2)nOCH3

                                     R1=NHCH2CH2(OCH2CH2)nOCH3

a和b):半乳糖氧化酶和过氧化氢酶,溶于25mM磷酸钠缓冲液(pH6.0)中;c)NH4Ac,NaBH3CN,溶于25mM磷酸钠缓冲液(pH6.0)中;

d)CH3(OCH2CH2)NH2,EDC,H2O;e).CH3(OCH2CH2)nNH2,NaBH3CN,H2O对于15和16;f)CH3O(CH2CH2O)nCH2CH2CONHS,H2O,Et3N

使氨基-糖磷酸与m-PEG N-羟基琥珀酰亚胺活性酯接触,从而形成相应的糖-PEG-酰胺。使该酰胺与UMP-morpholidate接触以形成相应的活性糖二磷酸-核苷酸。

方案19.

6.CMP-SA-乙酰丙酸的合成

本实施例提出了合成CMP-SA-乙酰丙酸的程序。

2-乙酰丙酰胺-2-脱氧-D-吡喃甘露糖的制备.将氯甲酸异丁酯(100μL,0.77mmol)逐滴加入到乙酰丙酸(86μL,0.84mmol)、无水THF(3mL)和三乙胺(127μL,0.91mmol)的溶液中。将该溶液在室温搅动3小时,然后逐滴加入到含有D-甘露糖胺盐酸(151mg,0.7mmol)、三乙胺(127μL,0.91mmol)、THF(2mL)和水(2mL)的溶液中。将反应混合物搅动15小时,然后通过旋转蒸发浓缩至干燥。将层析(硅,5-15%MeOH/CH2Cl2逐级梯度)用于分离产物,从而得到了0.156g(73%产量)白色固体:Rf=0.41(硅,CHCl3/MeOH/水6/4/1);1H NMR(D2O,500MHz)δ2.23(s,3H),2.24(s,3H),2.57(td,J=6.54,3.68,2H),2.63(t,J=6.71,2H),2.86-2.90(m,4H),3.42(m,1H),3.53(t,J=9.76,1H),3.64(t,J=9.43,1H),3.80-3.91(m,4H),4.04(dd,J=9.79,4.71,1H),4.31(dd,J=4.63,1.14,1H),4.45(dd,J=4.16,1.13,1H),5.02(d,J=1.29,1H),5.11(s,J=1.30,1H),MS(ES);C11H19NO7的计算值,277.27;实测值[M+1]277.9。

5-乙酰丙酰胺-3,5-双脱氧-D-甘油-D-半乳糖-2-nonulopyranosuronate的制备。将丙酮酸钠(0.616g,5.6mmol)和N-乙酰神经氨酸醛缩酶(50U)添加到0.1M HEPEES(pH 7.5)中的2-乙酰丙酰胺-2-脱氧-D-吡喃甘露糖溶液中(0.156g,0.56mmol)。将反应混合物加热到37℃持续20小时,并随后冷冻。然后将反应混合物通过C18硅过滤、冷冻并冻干。将粗固体用快速层析(硅,首先应用10-40%MeOH/CH2Cl2然后为CH2Cl2/MeOH/H2O 6/4/0.5)进行纯化。合并并浓缩适当的级分,从而得到45mg(80%产量)白色固体:Rf=0.15(硅,CHCl3/MeOH/水6/4/1);1H NMR(D2O,500MHz)δ1.82(t,J=11.9,1H),2.21(dd,J=13.76,4.84,1H),2.23(s,3H),2.57(appq,J=6.6,2H),2.86-2.95(m,2H),3.15-3.18(m,1H),3.28-3.61(复合的,1H),3.60(dd,J=11.91,6.66,1H),3.75(td,J=6.65,2.62,1H),3.84(dd,J=11.89,2.65,1H),3.88-4.01(复合的,2H),4.04(td,J=11.18,4.67,1H),MS(ES);对C14H23NO10的计算值,365.33;实测值([M-1]-),363.97。

胞苷-5’-单磷酰-(5-乙酰丙酰胺-3,5-双脱氧-β-D-甘油-D-半乳煻-2-nonulopyranosuronate)的制备。将5-乙酰丙酰胺-3,5-双脱氧-D-甘油-D-半乳糖-2-nonulopyranosuronate(50mg,137μmol)溶解于2mL的100mM HEPES(pH 7.5)的缓冲液中,并加入1M MnCl2(300μL,300μmol)。将CTP-2Na+(79mg,1.5μmol)溶解于5mL HEPES缓冲液中并添加到糖中。添加唾酸转移酶/CMP-神经氨酸合成酶融合酶(11U)并将反应混合物在室温搅动45小时。将反应混合物通过10,000MWCO滤器过滤并将含有反应产物的滤液不经进一步纯化而直接应用:Rf=0.35(硅,IPA/水/NH4OH 7/2/1)。

B.肽的糖缀合和糖PEG化

α-蛋白酶抑制剂(α-抗胰蛋白酶)

7.重组糖蛋白抗凝血酶III、胎球蛋白和α1-抗胰蛋白酶的唾液酸化本实施例提出了对几种重组肽的唾液酸化形式的制备。

用ST3Gal III对重组糖蛋白的唾液酸化.检查了几个糖蛋白由重组大鼠ST3Gal III唾液酸化的能力。对于这些糖蛋白中的每一个,唾液酸化在各个糖蛋白作为商业产物的开发中将是有价值的加工步骤。

反应条件.反应条件总结于表11中。唾酸转移酶反应在室温和37℃之间进行24小时。唾液酸化的程度是通过确定整合入糖蛋白连接的寡糖中的14C-NeuAc的量而确定的。对于每一个蛋白质的反应条件参见表11。

表11.反应条件

蛋白质  来源  蛋白质总量  (mg)  蛋白质浓度  (mg/ml)  ST  (mU/mL) ST/蛋白质 (mU/mg)  “循环”1的  CMP-NeuAcATIII  Genzyme  Transgenics  8.6  4.3  210  48  循环ATIII  Genzyme  Transgenics  860  403  53  12  循环脱唾液酸化-胎球蛋白  Sigma  0.4  105  20  13  10mM脱唾液酸化-AAAT  PPL  0.4  0.5  20  20  20mM

1“循环”指用描述于说明书中的标准条件(20mM NeuAc和2mMCMP)“原位”酶促生成CMP-NeuAc。缓冲液为0.1M HEPES,pH 7.5。

表12中提出的结果证明尽管应用了低水平的酶,但在每一个情况下均实现了显著程度的唾液酸化。基本地,基于对可得的末端半乳糖的估计获得了完全的唾液酸化。表12显示唾液酸化反应的结果。在各个研究中,每mg蛋白质所用的酶量(mU/mg)作为比较的基准。在几个所示的实施例中,每mg蛋白质仅需要7-13mU的ST3Gal III就可以在24小时后得到基本完全的唾液酸化。

表12.分析结果

 蛋白质  来源 末端Gal1 摩尔/摩尔  NeuAc整合2  摩尔/摩尔  %  Rxn3其他特征 ATIII4  Genzyme  Transgenics 102  104  117 ATIII4  Genzyme  Transgenics 102  1.3  108SDS-凝胶:蛋白质纯度FACs:糖类糖形式 脱唾液酸化-胎 球蛋白  Sigma 802  905  116 脱唾液酸化 -AAAT5  PPL 7  7.0  100SDS-凝胶:蛋白质纯度

1由供应商确定的或来自文献值的N-连接的寡糖上末端(暴露的)Gal量(胎球蛋白,脱唾液酸化-AAAT)。

2通过经凝胶过滤从游离放射性标记的前体上分离后由14C-NeuAc的整合所确定的整合的NeuAc。

3%Rxn指基于理论最大值的末端Gal量的反应完成程度百分比。

4抗凝血酶III。

5α1抗胰蛋白酶。

这些结果显著地与那些在用牛ST6Gal I的详细研究中报道的相反,在该研究中在24小时中少于50mU/mg蛋白质可引起少于50%的唾液酸化,而1070mU/mg蛋白质可引起约85-90%的唾液酸化。Paulson等人(1977),J.Biol.Chem.252:2363-2371;Paulson等人(1978),J.Biol.Chem.253:5617-5624。由另一个研究组对大鼠α2,3和α2,6唾酸转移酶的研究揭示脱唾液酸化-AGP的完全唾液酸化需要150-250mU/mg蛋白质的酶浓度(Weinstein等人(1982)J.Biol.Chem.257:13845-13853)。这些早期的研究一起表明ST6Gal I唾酸转移酶需要超过50mU/mg并高达150mU/mg以实现完全唾液酸化。

本实施例证明用ST3Gal III唾酸转移酶对重组糖蛋白的唾液酸化需要比预期更少的酶。对于一个千克级的反应,需要约7,000单位的ST3GalIII唾酸转移酶,而不是早期研究中所显示的100,000-150,000单位。这些酶从天然来源的纯化是不现实的,在大规模制备中于1-2个月后仅得到1-10个单位的产量。假设ST6Gal I和ST3Gal III唾酸转移酶均是作为重组唾酸转移酶生产的,且实现了两个酶的相同的表达水平,那么相对于ST3Gal III唾酸转移酶,ST6Gal I唾酸转移酶需要14-21倍高(或更高)的发酵规模。对于ST6Gal I唾酸转移酶,已报道了酵母中0.3U/l的表达水平(Borsig等人(1995)Biochem.Biophys.Res.Commun.210:14-20)。在黑曲霉中已实现了ST3Gal III唾酸转移酶1000U/升的表达水平。在现有的表达水平上,将需要300-450,000升的酵母发酵物以产生用ST6Gal I唾酸转移酶对1kg糖蛋白进行唾液酸化所需要的足够的酶。相反地,用ST3Gal III唾酸转移酶对1kg糖蛋白进行唾液酸化需要少于10升黑曲霉发酵物。因而,生产用于大规模唾液酸化反应的ST3Gal III唾酸转移酶所需的发酵能力比生产ST6Gal I所需的低10-100倍;生产唾酸转移酶的成本将成比例地减少。

Cri-IgG抗体

8.Cri-IgG1抗体的糖重构

本实施例提出了对Cri-IgG1抗体进行体外重构的方法。

在单克隆抗体Fc结构域中Asn297的一个保守位点的N-糖基化可以调节其药物代谢动力学性能和效应子功能(Dwek等人,1995,J.Anat.187:279-292;Boyd等人,1995,Mol.Immunol.32:1311-1318;Lund等人,1995,FASEB J.1995,9:115-119;Lund等人,1996,J.Immunol.157:4963-4969;Wright&Morrison,1998,J.Immunol.160:3393-3402;Flynn&Byrd,2000,Curr.Opin.Oncol.12:574-581)。在细胞培养发酵或某些病理学状况过程中,在该位点的糖基化模式中产生了显著的异质性。在Fc结构域上结果所得的不同糖基化模式特征为具有0个、1个和2个末端半乳糖残基的复杂二触角结构(分别为G0、G1和G2,参见表13)。观察到的糖形式变异,如在末端半乳糖基化、截短的N-糖形式和等分的修饰中的变异已显示可影响抗体的治疗性质,尤其是其通过补体结合和活化而调节靶细胞杀伤的能力(Boyd等人,1995,同上;Wright&Morrison,1998,同上;Mimura等人,2000,Molec.Immunol.37:697-706;Davies等人,2001,Biotechnol.Bioeng.74:288-294)。

为了获得Cri-IgG1抗体的不同糖形式并检验其Fc效应子功能,应用外切糖苷酶逐步修剪Cri-IgG1抗体以生成缺乏唾液酸的糖形式(G2,G1)、缺乏唾液酸和半乳糖的糖形式(G0)以及缺乏唾液酸、半乳糖和N-乙酰葡糖胺的糖形式(M3N2F),如表13所示。这些分子随后用不同的糖基转移酶和适当的糖进行修饰。将修饰条件发展为导致初始抗体聚糖结构转变为不同糖形式的条件:M3N2、GnT-I-M3N2(应用GnT-I添加了GlcNAc部分的M3M2形式)、G0、等分-G0(用GnT-III添加了等分的GlcNAc的G0部分)、半乳糖基化的等分-G0(添加了末端半乳糖部分的等分-G0糖形式)、G2、单唾液酸化的S1(α2,6)-G2(具有一个用α2,6-唾酸转移酶添加的末端唾液酸部分的G2糖形式)、S1(α2,3)-G2(具有一个用α2,3-唾酸转移酶添加的末端唾液酸部分的G2糖形式)和脱唾液酸化的S2(α2,3)-G2(G2糖形式)。在每一个糖重构步骤后,聚糖结构从抗体蛋白质上酶促释放,并用各种方法进行分析,包括通过毛细管电泳、2-AA HPLC表征和MALDI-TOF质谱分析法进行分离。

表13.糖形式结构的缩写

◇=岩藻糖,□=GlcNAc,○=甘露糖,●=半乳糖

现在描述在这些实验中应用的材料和方法。

Cri-IgG1单克隆抗体.Cri-IgG1抗体获自R.Jefferies(MRCCenter for ImmuneRegulation,The Medical School,University ofBirmingham,英国)。抗体是非重组抗体,且从人骨髓瘤中分离。抗体应用三种方法制备。在第一种方法中,该方法称为“DEAE”,抗体在相对温和的条件下应用DEAE离子交换柱进行分离。在第二种方法中,该方法称为“SPA”,抗体在A蛋白柱(金黄色葡萄球菌(Staphylococcusaureus)A蛋白)上进行纯化,其中具有低pH的洗脱步骤。在第三种方法中,该方法称为“Fc”,用蛋白酶处理抗体,从而仅保留抗体的Fc部分,而去除了抗体结合结构域。这些抗体纯化方法是本领域技术人员众所周知的,且不在此处详细重述。

重构抗体的亲和纯化.将通过外切糖苷酶或糖基转移酶修饰的抗体在ProA-琼脂糖4-快速流动柱(Amersham Bioscience,Arlington Heights,IL)上进行纯化,用0.1M甘氨酸-HCl缓冲液(pH2.7)洗脱,并立即用1M pH 9.5的Tris进行中和。将洗脱物应用NAP-10柱(AmershamBioscience,Arlington Heights,IL)进行缓冲液更换,更换为进行下一步糖基化的适当缓冲液,如100mM pH 6.5的MES或50mM pH 7.2的Tris-HCl。于4℃在Tube-O-DialyzersTM(Chemicon International,Temecula,CA)上将重构的终产物对PBS进行充分透析,MWCO为8kDa。

Cri-抗体的体外糖苷酶处理.应用NAP-10柱(AmershamBioscience,Arlington Heights,IL)对抗体进行缓冲液更换,更换为50mM pH 6.0的磷酸钠/柠檬酸钠。通过使抗体(5mg/mL)与20mU/mg蛋白质神经氨酸酶于37℃接触过夜(以去除末端唾液酸部分),与20mU/mg蛋白质β-半乳糖苷酶于37℃接触过夜(以去除末端半乳糖部分,从而导致G0糖形式),和/或与2mU/mgβ-N-乙酰氨基己糖苷酶(来自刀豆,Seikagaku,Tokyo,日本)于37℃接触过夜(以去除末端N-乙酰葡糖胺,从而导致M3N2糖形式),以逐步在体外修剪糖部分。将样品如上文所述进行亲和纯化。

Cri-抗体的体外糖基化.利用如下条件进行体外GnT1修饰,即应用1mg/ml M3N2糖形式抗体作为底物,应用25mU/mg重组人β1,2-甘露糖基-UDP-N-乙酰葡糖胺基转移酶,在100mM pH 6.5的MES、5mMMnCl2、5mM UDP-GlcNAc和0.02%NaN3的缓冲液中于32℃进行24小时。获取等分试样进行聚糖分析,且结果所得的产物如上文所述进行亲和纯化。

利用如下条件进行等分-糖形式的体外修饰,即应用1mg/ml M3N2糖形式抗体作为底物,应用25mU/mgβ1,2-重组人甘露糖基-UDP-N-乙酰葡糖胺基转移酶I,应用25mU/mgβ1,2-重组人甘露糖基-UDP-N-乙酰葡糖胺基转移酶II,和应用3.5mU/mgβ1,4-重组小鼠甘露糖基-UDP-N-乙酰葡糖胺基转移酶III,在100mM pH 6.5的MES、10mM MnCl2、5mM UDP-GlcNAc和0.02%NaN3的缓冲液中于32℃进行24小时。获取等分试样进行聚糖分析,且剩余的产物如上文所述进行亲和纯化。

利用如下条件应用G0糖形式抗体或等分糖形式抗体进行体外半乳糖基化,即通过使抗体与0.6U/mg重组牛奶β1,4-半乳糖基转移酶在50mM pH 7.4的Tris-HCl、150mM NaCl、5mM UDP-半乳糖、5m MnCl2的缓冲液中于32℃接触24小时。获取等分试样进行聚糖分析,且剩余的产物如上文所述进行亲和纯化。

利用如下条件应用G2糖形式抗体(1mg/ml)进行体外唾液酸化,即通过使抗体与0.1U/mg ST3Gal3或0.1U/mg ST6Gal1、5mM CMP-唾液酸在50mM pH 7.4的Tris、150mM NaCl和3mM CMP-SA的缓冲液中于32℃接触24小时。获取等分试样进行聚糖分析,且剩余的产物如上文所述进行亲和纯化。

聚糖分析:

具有激光诱导的荧光探测的毛细管电泳.通过稀释和在MicroconTMYM-30微量浓缩器(Millipore,Bedford,MA)上进行浓缩从糖重构的抗体的等分试样中去除缓冲剂成分和核苷酸糖。通过应用制造商提供的方法使蛋白质与PNGase F(Prozyme,San Leandro,CA)接触而从该蛋白质上释放N-连接的寡糖。简言之,使样品于100℃在50mM pH 7.5的磷酸钠、0.1%SDS和50mMβ-巯基乙醇的缓冲液中变性10分钟。然后加入TX100至0.75%(v/v)以及10U PNGase F/200μg蛋白质。于37℃温育3小时后,将蛋白质进行乙醇沉淀,并使上清液干燥。然后将释放的游离寡糖用8-氨基芘-1,3,6-三磺酸进行标记,并应用购自Beckman-Coulter,Inc.(Fullerton,CA)的糖类标记和分析试剂盒通过毛细管电泳进行分析,如制造商所显示的(也参见Ma和Nashabeh,1999,Anal.Chem.71:5185-5192)。

毛细管电泳(CE)在eCAPTM N-CHO包被的毛细管(50μm I.D.,到探测器的长度为40cm;Beckman-Coulter,Inc.,Fullerton,CA)上进行,其中应用具有激光诱导的荧光探测器(Beckman-Coulter,Inc.Fullerton,CA)的P/ACETM MDQ糖蛋白系统(Beckman-Coulter,Inc.Fullerton,CA)。通过20磅/英寸2的压力作用10秒钟将样品引入到柱体中,然后在25kV下用反极性分离20分钟。柱体温度控制在20℃。电泳图是由激光诱导的荧光探测法在488nm的激发波长和520nm的发射波长生成的。

糖类标准物(Calbiochem_,EMD Biosciences,Inc.,San Diego,CA)包括M3N2(无核心岩藻糖的N-连接的三甘露糖核心)、G0(脱唾液酸、脱半乳糖、双触角具有核心岩藻糖的N-连接的寡糖)、G2(脱唾液酸、双触角具有核心岩藻糖的N-连接的寡糖)和无岩藻糖的G2、S1-G2(无核心岩藻糖的单唾液酸化、半乳糖基化双触角寡糖)和S2-G2(无核心岩藻糖的二唾液酸化、半乳糖基化双触角寡糖)(购自Glyko,参见Prozyme,San Leandro,CA)、M3N2F(具有核心岩藻糖的N-连接的三甘露糖核心)和NGA2F(脱唾液酸、脱半乳糖、双触角具有核心岩藻糖和具有等分GlcNAc的N-连接的寡糖),将这些糖类标准物用1-氨基芘-3,6,8-三磺酸盐(APTS,Beckman-Coulter,Inc.,Fullerton,CA)进行标记并用于鉴定从抗体释放的聚糖的分布。

2-AA HPLC.根据略作修改的由Anumula和Dhume描述的方法(1998,Glycobiology 8:685-694),将PNGase F释放的聚糖用2-AA(2-邻氨基苯甲酸)进行标记。将还原性胺化的N-聚糖用Shodex AsahipakNH2P-50 4D氨基柱(4.6mm×150mm)(Showa Denko K.K.,Tokyo,Japan)进行分析。用于分离的两种溶剂为A)2%乙酸和1%四氢呋喃,溶于乙腈中,和B)5%乙酸、3%三乙胺和1%四氢呋喃,溶于水中。

为了分离2-AA标记的中性聚糖,将柱子用70%A等度洗脱5分钟,随后为在60分钟时间段内从70%到50%B的线性梯度,随后为在5分钟时间段内从50%到5%B的陡坡梯度,最后为用5%B等度洗脱10分钟。洗脱的峰用荧光探测进行探测,其中在230nm激发,探测波长为420nm。在该梯度条件下,G0糖形式将在约30.5分钟洗脱,G1糖形式将在约34.0分钟洗脱,而G2糖形式将在约37.0分钟洗脱。在这些条件下,岩藻糖的存在不改变洗脱时间。

为了分离2-AA标记的阴离子聚糖,将柱子用70%A等度洗脱2.5分钟,随后为在97.5分钟时间段内从70%到5%A的线性梯度,最后为用5%A等度洗脱15分钟。洗脱的峰用荧光探测进行探测,其中在230nm激发,在420nm探测。在该梯度条件下,中性聚糖预期在18.00-29.00分钟之间洗脱,具有一个电荷的聚糖预期在30.00-40.00分钟之间洗脱,具有两个电荷的聚糖预期在43.00-52.00分钟之间洗脱,具有三个电荷的聚糖预期在54.00-63.00分钟之间洗脱,具有四个电荷的聚糖预期在65.00-74.00分钟之间洗脱。

对还原性胺化的N-聚糖的MALDI分析.将用2-邻氨基苯甲酸(2AA)标记的PNGase-释放的N-聚糖的小等分试样在MF-Millipore薄膜滤器(0.025μm的孔,直径47mm)上透析45分钟,该薄膜滤器漂浮在水上。将透析的等分试样在SpeedvacTM(ThermoSavant,Holbrook,NY)上干燥,重新溶解于小量水中,并与溶于水/乙腈(50∶50)中的2,5-二羟基苯甲酸(10g/L)溶液混合。

将混合物干燥于MALDI目标上,并应用在线性/负离子模式运行的Biosystems DE-Pro质谱分析仪(Applied Biosystems,Inc.,Foster City,CA)进行分析。基于观察到的质荷比和以前的文献确定寡糖的结构。未尝试充分表征等压结构。

SDS-PAGE.为了确定糖重构的抗体的稳定性,将所有样品通过SDS-PAGE进行分析。将样品的终产物用8-16%Tris-甘氨酸凝胶(Invitrogen,Carlsbad,CA)在非还原条件下进行电泳。牛血清白蛋白在还原条件下进行电泳以作为定量标准物。将凝胶用GelCode BlueStain Reagent(Pierce Chemical Co.,Rockford,IL)进行染色,以进行显色。

现在描述实验的结果。

表达于人骨髓瘤细胞中的Cri的天然糖形式.从患有多发性骨髓瘤的患者血清中纯化的Cri-IgG1抗体含有不定的糖形式。图97A-97C显示了从Cri-IgG1抗体中酶促释放的聚糖的HPLC曲线。图98A-98C显示了从表达于人骨髓瘤细胞的Cri-IgG1抗体中酶促释放的聚糖的MALDI曲线。主要的形式是半乳糖基化不足的G0、G1,而G2和唾液酸化结构是相对少的(表14和图97C)。为了检验修饰的聚糖对单克隆抗体治疗性质的影响,通过进行体外外切糖苷酶修剪和体外糖基化重构对Cri-IgG1抗体进行修饰,以生成该抗体不同的糖形式。

表14.通过HPLC分离的人骨髓瘤细胞表达的Cri-IgG1不同糖形式的相对量是从各自的峰的面积计算得来的。

 Cri抗体  S1G2  G2  G1  G0 DEAE  45.04  54.96 SPA  6  3.17  48.25  51.75 Fc  51.41  38.83

最初,外切糖苷酶修剪和糖基化中每一个步骤的优化是在小规模上进行的(各100μg)。

Cri-IgG1抗体的三甘露糖核心糖形式(M3N2).通过糖苷酶的逐步处理生成M3N2,该糖苷酶包括神经氨酸酶、β1,4-半乳糖苷酶和β1-2,3,4,6N-乙酰氨基己糖苷酶。为了估计糖重构的Cri-IgG1抗体样品上末端半乳糖和GlcNAc的去除,应用了定量毛细管电泳(CE)方法。聚糖是用PNGase F从糖重构的抗体上酶促释放的,并用8-氨基芘-1,3,6-三磺酸(APTS)在还原性末端进行衍生化。结果所得的产物通过具有柱上激光诱导的荧光探测(LIF)的CE进行分析(Ma&Nashabeh,1999,同上)。由于聚糖的分离是基于流体力学大小的不同,所以APTS标记的聚糖以大小逐渐增加的顺序进行迁移(M3N2<M3N2F<G0<G1<G2)。

图99A-99D显示从糖重构的Cri-IgG1抗体释放的聚糖以及用APTS衍生化的聚糖标准物(图99A)的电泳图。糖形式是通过将其电泳迁移率与标准物进行比较而鉴定的。每一个聚糖种类的相对量是从每一个所示的峰的相对面积百分比计算得来的,且结果示于表15中。M3N2F糖形式代表91%的DEAE-Cri聚糖、80%的SPA-Cri聚糖和100%的Fc-Cri聚糖。在来自DEAE-Cri(8.6%)和SPA-Cri(~20%)的聚糖结构中观察到导致GnT-I-M3N2F糖形式的GlcNAc部分的不完全去除(参见表15)。糖形式GnT-I-M3N2F是具有一个额外的GlcNAc的M3N2F糖形式,如可由GnT-I添加的。

表15.计算了图99中CE曲线单独的峰的面积,并确定了M3N2F和GnT-I-M3N2F糖形式的相对量。

  M3N2F  GnT-I-M3N2F  RT(分钟)  %  RT(分钟)  %  DEAE  10.133  91.4  10.842  8.6  SPA  10.133  80.01  10.842  19.99  Fc  10.133  100  10.842  0

脱半乳糖基化的糖形式(G0).具有G0糖形式的Cri-IgG1抗体是通过用神经氨酸酶和β1,4-半乳糖苷酶逐步处理天然Cri-IgG1抗体而获得的,每一个反应进行24小时。从糖重构的抗体释放的聚糖通过CE、HPLC和MALDI进行分析。图100A显示了释放的聚糖的CE曲线。在所有三个样品中,仅观察到了一个峰,基于与标准物的比较将该峰命名为G0糖形式(图100A和表16)。

表16.通过CE和HPLC确定的Cri-IgG1 G0糖形式的相对量。

  CE  HPLC  RT(分钟)  %  RT(分钟)  %  DEAE  11.408  100.0  31.194  100.0  SPA  11.408  100.0  31.194  100.0  Fc  11.408  100.0  31.194  100.0

除了由CE提供的聚糖分析之外,定量HPLC方法也用于确定由Cri-IgG1抗体的重构聚糖代表的G0糖形式的百分比。糖重构抗体上的聚糖分布是通过用PNGase F酶促释放聚糖和用2-邻氨基苯甲酸(2-AA)在还原性末端衍生化释放的产物而进行监控的。衍生化的混合物在具有荧光探测的Shodex Asahipak NH2P-50 4D柱上通过HPLC进行分离。图101A-101C显示从释放的聚糖获得的层析谱。由于在所有三个样品中仅发现了一个主要的峰,所以HPLC结果证实了CE分析。与CE和HPLC数据一致,MALDI分析也显示几乎完全糖重构为G0糖形式(图102A-102C)。

完全半乳糖基化的G2糖形式(G2).用神经氨酸酶处理Cri-IgG抗体以获得脱唾液酸糖形式,该糖形式也是半乳糖基化不足的。然后用0.6U/ml牛β1,4半乳糖基转移酶和半乳糖供体分子处理这些脱唾液酸糖形式,以将抗体糖重构为具有G2糖形式。

末端半乳糖基化的程度是通过聚糖分析确定的。在CE和HPLC曲线中仅观察到一个主要的峰(图103A-103C和图104A-104C)。该峰相应于每一种情形中的G2糖形式。百分比总峰面积的计算显示几乎完全(~90%)从最初样品的半乳糖基化不足糖形式转变为G2(参见表14)。这些结果总结于表17中。聚糖的MALDI分析进一步支持在所有样品中几乎完全糖重构为G2糖形式(图105A-105C)。

表17.由CE和HPLC分析中百分比总峰面积确定的重构Cri-IgI1抗体G2糖形式的相对量。

  CE  HPLC  RT(分钟)  %  RT(分钟)  %  DEAE  12.94  90  31.194  100  SPA  12.94  92  31.194  90  Fc  12.94  84  31.194  89

GnT-I-糖形式(GnT-I-M3N2).通过向分子添加一个GlcNAc部分而将M3N2糖形式Cri-IgG抗体糖重构为GnT-I-M3N2糖形式。使该分子与25mU GnT-I/mg抗体和适当的GlcNAc供体分子接触。释放的聚糖的CE、HPLC和MALDI分析(分别为图106A-106D、图107A-107C和图108A-108C)显示最初的M3N2F糖形式被完全重构。然而,仅有40-60%的修饰结构是GnT-I-M3N2糖形式,而约30%是G0糖形式。G0糖形式的存在可能是在制备最初的M3N2形式时不完全的GlcNAc修剪的结果。

等分糖形式(NGA2F).通过使M3N2糖形式Cri-IgG抗体与三种转移酶GnT-I、GnT-II和GnT-III的组合以及适当的N-乙酰葡糖胺供体分子接触而将其糖重构为NGA2F糖形式。反应在24小时内完成。为了确定等分-GlcNAc部分添加到聚糖中的程度,应用CE分析确定存在于糖重构抗体上的糖形式。

图109A-109D显示从糖重构的Cri-IgG1抗体释放的聚糖的CE分析获得的电泳图。在重构后出现了4个峰。一个主要的峰以与NGA2F标准糖形式相同的保留时间进行迁移。3个其他的次要峰可能是不完全重构的聚糖。为了进行比较,也应用了定量HPLC方法,其中2-AA标记的聚糖以大小逐渐增加的顺序洗脱(Gn1<G0<NGA2F)。如图110A-110C所示,从聚糖的CE分析中获得了类似的结果。应用CE或HPLC分析均未发现M3N2F。NGA2F聚糖是CE和HPLC分析的主要峰。仍然保留在样品中的Gn1和G0聚糖可能是不完全修饰的结果。大多数最初的M3N2F糖形式通过3个GlcNAc部分重构为NGA2F糖形式(60~70%),约15~18%通过添加2个GlcNAc部分重构为G0糖形式,而仅有少量(~7%)通过仅添加一个GlcNAc部分进行重构。释放的聚糖的MALDI分析(图111A-111C)显示了具有1个、2个或3个末端GlcNAc部分的糖形式的峰,其与CE和HPLC分析(图109和110)一致。每一种聚糖种类的相对量是从每一个所示峰的相对面积百分比计算得来的,并总结于表18中。

表18.来自GnT-I、II和III重构的Cri-IgG1的不同糖形式的相对量,由CE和HPLC所确定。

  保留(分钟)  %峰面积  DEAE  SPA  Fc  CE  峰1  10.238  6.39  6.89  7.98  峰2  10.775  15.82  14.29  17.9  峰3  11.325  14.14  8.87  15.69  等分  11.625  63.65  70.04  58.43  HPLC  峰1  21.117  37.4  15.02  14  峰2  26.817  12.9  14.24  10.15  峰3  31.224  14.78  2.11  30.2  等分  32.078  34.93  68.63  45.64

半乳糖基化的等分(Gal-NGA2F)糖形式.Cri-IgG1抗体的NGA2F糖形式是用牛β1,4-半乳糖基转移酶和适当的半乳糖供体进行糖重构的。应用0.6U/mlβ1,4-半乳糖基转移酶添加末端半乳糖部分。图112A-112D显示用2-AA HPLC方法获得的电泳图。简言之,末端为GalNAc的糖形式几乎100%是半乳糖基化的。比较DEAE Cri-IgG1的图112A~112B和Fc Cri-IgG1的图112C~112D,GnT-I、II和III修饰的聚糖的2-AA HPLC曲线(图112A和112C)被GalT1修饰,从而所有聚糖的峰均由于添加半乳糖部分后大小增加而变得较晚洗脱(图112B和112D)。这些结果进一步得到了MALDI-MS分析的证实。

Cri-IgG1的唾液酸化(S2G2)糖形式.Cri-IgG1抗体的糖重构G2糖形式进一步应用ST3Gal3和ST6Gal1进行重构。图113A-113C显示了用ST3Ga13重构的G2糖形式的HPLC曲线。大多数G2糖形式转变为S2G2糖形式(具有2个额外末端唾液酸部分的G2糖形式;~70%,参见表19),仅有少量为S1G2糖形式(具有1个额外末端唾液酸部分的G2糖形式;<25%,参见表19)。这些结果进一步得到了示于图114A-114C中的MALDI分析的证实。MALDI数据也显示所有G2糖形式均被唾液酸化为S2G2或S1G2糖形式。

表19.由HPLC确定的来自ST3Gal3重构的Cri-IgG1的不同糖形式的相对量。

  RT(分钟)  DEAE  SPA  Fc  S1G2  36.7  25.6  24.83  23.39  46.9  4.12  6.83  S2G2  49.4  58.93  50.68  61.88  52.19  9.1  7.56  6.07

通过比较,G0糖形式的ST6Gal1重构不能达到在ST3Gal3重构中发现的完全水平。图115A-115D和图116A-116C分别显示了从CE和HPLC分析获得的结果。在任意一种糖重构样品中均没有发现S2G2糖形式。然而,所有G2糖形式均转变为S1-G2。MALDI-MS分析也支持这些数据(图117A-117C)。

Cri-IgG1的重构聚糖的稳定性.最后,研究了通过外切糖苷酶处理和糖基化进行重构的Cri-IgG1聚糖的稳定性。将每一种糖重构的Cri-IgG1抗体贮存于4℃,并在重构后2周通过SDS-PAGE检查降解。如图118A-118E所示,重构的DEAE和SPA抗体均保持约150kDa的分子量,显示很少至没有降解,而不管进行的糖重构类型如何。Fc Cri-IgG1抗体保持约38kDa的分子量,也显示很少至没有降解,而不管进行的重构类型如何。

重构的Cri-IgG1抗体的效应子功能生物测定.效应子功能生物测定源自Mimura等人(2000,Molecular Immunology 37:697-706)的方法。Cri-IgG1抗体的糖形式的IC50是通过抑制由红细胞引起的U937细胞的超氧化物反应来确定的,其中红细胞由天然抗-NIP抗体进行了敏化。

在1000单位/mL干扰素γ存在时将单细胞的U937细胞培养2日,以诱导细胞分化及其产生超氧化物的能力。然后将细胞洗涤并以2×10b细胞/mL重悬于Hanks平衡盐溶液中,该盐溶液中不具有酚红,而含有20mM pH 7.4的HEPES和0.15mM BSA。在Cri-IgG1抗体的各种糖形式不存在或存在时于37℃温育30分钟用抗-NIP(5-碘-4-羟基-3-硝基苯乙酰)抗体对红细胞进行敏化。然后用PBS洗涤细胞3次,并将其以2.5×107细胞/mL重悬于HBSS-BSA中。将U937细胞(100μl,2×106细胞/mL)加入到塑料试管中,并将硝酸双-N-甲基吖啶(20μl,2.5mM)加入到试管中。将试管于37℃水浴中加温5分钟。然后将敏化的红细胞(80μl,2.5×107细胞/mL)加入到试管中。超氧化物阴离子生产是通过应用Berthold LV953发光计(Berthold Australia Pty Ltd,Bundoora,澳大利亚)在30分钟时间段内于37℃时硝酸双-N-甲基吖啶增强的化学发光进行测量的。

与天然抗体相比,G0和M3N2糖形式Cri-IgG1抗体分别具有92%和85%的相对抑制值。然而,天然Cri-1gG1抗体缺乏核心岩藻糖。Shields等人(2002,J.Biol.Chem.277:26733-26740)提示缺乏核心岩藻糖将抑制值改进10倍。基于这些结果,预期半乳糖基化-等分-G0糖形式的抑制值将高于等分-G0糖形式,等分-G0糖形式将大大高于G2糖形式,G2糖形式将大约等于二唾液酸化-G2糖形式和单唾液酸化-G2糖形式,二唾液酸化-G2糖形式和单唾液酸化-G2糖形式将高于天然抗体糖形式,天然抗体糖形式将高于G0糖形式,G0糖形式将高于M3N2糖形式。

补体受体-1

9.TP10的唾液酸化和岩藻糖基化

本实施例提出了对具有唾液酸Lewis X部分的TP10的制备和对增强的生物学活性的分析。

即使短时间内中断到脑中的血流也可触发大脑微血管结构中的炎症事件,这将加剧大脑组织的损伤。产生的该组织损伤可通过炎症和凝结级联的活化而增大。在中风的鼠模型中,P-选择蛋白和ICAM-1的增加的表达可促进白细胞的募集。sCR-1是补体受体-1(CR-1)的细胞外结构域的重组形式。sCR-1是补体活化的有力抑制剂。sCR1sLeX(CD20)是sCR1的替代性糖基化形式,对其进行了替代性糖基化以展示唾液酸化的LewisX抗原。以前,发现在体内于工程化的Lec11 CHO细胞中表达和糖基化的sCR-1sLeX正确定位于缺血的大脑微血管中和表达C1q的神经元中,从而抑制嗜中性粒细胞和血小板积聚并减少大脑梗死体积(Huang等人,1999,Science 285:595-599)。在本实施例中,在体外通过聚糖重构制备的sCR1sLeX显示与体内糖基化的sCRsLeX相似的增强的生物学活性。

TP10肽是在BUK B11 CHO细胞中表达的。该CHO细胞系产生具有典型CHO细胞糖基化的TP10肽,该肽具有许多但不是全部用唾液酸加帽的聚糖。

66mg TP10的唾液酸化.将TP10(2.5mg/mL)、CMPSA(5mM)和ST3Gal3(0.1U/mL)在50mM Tris、0.15M NaCl、0.05%叠氮化钠,pH 7.2中于32℃温育48小时。将放射性标记的CMP唾液酸添加到小的等份试样中以监控整合。TP10是用SEC HPLC从核苷酸糖中分离的。在24小时和48小时分析的样品证明反应在24小时后结束。然后使反应混合物冷冻。将反应产物进行荧光团辅助的糖电泳(Fluorophore AssistedCarbohydrate Electrophoresis)(FACE_;Glyko,Inc,Novato CA)分析(图119)。

药物代谢动力学研究.购买具有颈静脉插管的大鼠。将10mg/kg唾液酸化前或唾液酸化后的TP10肽通过尾部静脉注射给予每一组处理的3只大鼠(n=3)。从0~50小时获取14个血液样品。0小时后在每一个时间点,血液中唾液酸化后的TP10肽的浓度均比唾液酸化前的TP10的高(图120)。唾液酸的添加与起始材料相比,使药物代谢动力学曲线的血浆浓度-时间曲线(AUC)下的面积加倍了(图121)。

唾液酸化TP10的岩藻糖基化.将10mL(25mg TP10)上述唾液酸化混合物解冻,并添加GDP-岩藻糖至5mM,MnCl2至5mM,及FTVI(岩藻糖基转移酶VI)至0.05U/mL。使反应物在32℃温育48小时。将反应产物进行荧光团辅助的糖电泳(Fluorophore AssistedCarbohydrate Electrophoresis)(FACE_;Glyko,Inc,Novato CA)分析(图122)。向小的等份试样中添加放射性标记的GDP-岩藻糖以监控整合。TP10是用SEC HPLC从核苷酸糖中分离的。在24小时和48小时分析的样品证明反应在24小时结束。测量对E-选择蛋白的结合的体外测定法显示:添加岩藻糖可产生生物学活性的E-选择蛋白配体(图123)。

EnbrelTM

10.抗体EnbrelTM的糖PEG化

本实施例提出了对抗体分子的O-连接聚糖的PEG化程序。在此,将EnbrelTM用作例子,然而,本领域的技术人员将理解本程序可应用于许多抗体分子。

EnbrelTM-SA-PEG(10KDa)的制备.将在PEG化之前使O-连接聚糖唾液酸化的或未唾液酸化的EnbrelTM(TNF-受体-IgG1-嵌合体)以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与5mM UDP-半乳糖和0.1U/mL半乳糖基转移酶于32℃温育2日以对半乳糖基化不足的聚糖用半乳糖进行加帽。为了监控半乳糖的整合,向反应物的小等份试样添加了14C-半乳糖-UDP配体;整合入肽中的标记是在甲醇和水中用Toso Haas G2000SW分析型柱通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置(in-line)的放射性探测器进行定量的。

当反应结束时,使该溶液与1mM CMP-唾液酸-连接体-PEG(10kDa)和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸-连接体-PEG的整合,将肽在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤分离。当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas TSK-Gel-3000制备型柱进行纯化并基于UV吸收收集级分。将含有产物的级分合并、浓缩、交换缓冲液,然后冻干。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

促红细胞生成素(EPO)

11.GlcNAc向EPO的添加

本实施例给出了GlcNAc残基向三甘露糖核心的添加。

GlcNAc向EPO的添加.EPO是在SF-9昆虫细胞中表达并纯化的(Protein Sciences,Meriden,CT)。从Epo的三甘露糖糖形式向“三甘露糖核心+2GlcNAc”(峰1,图124中的P1)的100%转变是于32℃与100mU/ml GlcNAcT-I和100mU/ml GlcNAcT-II在下面的终反应浓度时温育24小时而实现的:

100mM MES pH 6.5,或100mM Tris pH 7.5

5mM UDP-GlcNAc

20mM MnCl2

100mU/ml GlcNAcT-I

100mU/ml GlcNAcT-II

1mg/ml EPO(纯化的,表达于Sf9细胞,购自Protein Sciences)。

糖形式的分析.本测定是K-R Anumula和ST Dhume,Glycobiolgy 8(1998)685-69的细微修改。N-聚糖酶(PNGase)释放的N-聚糖是用邻氨基苯甲酸进行还原标记的。将还原性氨基化的N-聚糖注射入ShodexAsahipak NH2P-50 4D氨基柱(4.6mm×150mm)上。将两种溶剂用于分离:A)5%(v/v)的乙酸、1%的四氢呋喃和3%的三乙胺,溶于水中;和B)2%的乙酸和1%的四氢呋喃,溶于乙腈。然后使柱子用70%B等度洗脱2.5分钟,随后为在97.5分钟的时间段上从70%到5%B的线性梯度,最后用5%B等度洗脱15分钟。洗脱的峰是用荧光探测器进行探测的,激发波长为230nm和发射波长为420nm。

在这些条件下,三甘露糖核心具有22.3分钟的保留时间,且GnT反应的产物具有30分钟的保留时间。起始材料都为具有核心GlcNAc的三甘露糖核心(图124)。

12.具有多触角复杂聚糖的EPO的制备

本实施例提出了从昆虫细胞表达的EPO制备PEG化的、双触角的EPO和三触角的唾液酸化的EPO。

对来自杆状病毒/Sf9表达系统的重组人促红细胞生成素(rhEPO)(Protein Sciences Corp.,Meriden,CT)进行聚糖分析,且结果所得的聚糖显示主要为具有核心岩藻糖的三甘露糖核心,只有小百分比的聚糖也具有单个GlcNAc。

用GnT-I和GnT-II添加N-乙酰葡糖胺.使两批rhEPO(1mg/ml)与GnT-I和GnT-II、5mM UDP-GlcNAc、20mM MnCl2和0.02%叠氮化钠在100mM pH 6.5的MES中于32℃温育24小时。A批含有20mgEPO和100mU/mL GnT-I和60mU/mL GnT-II。B批含有41mg EPO和41mU/mL GnT-I+50mU/mL GnT-II。在反应后,将样品通过凝胶过滤脱盐(PD10柱子,Pharmacia LKB Biotechnology Inc.,Piscataway,NJ)。

由2-AA HPLC图谱分析的EPO聚糖.该测定法是对Anumula和Dhume,Glycobiology 8(1998)685-69的细微修改。将还原性氨基化的N-聚糖注射入Shodex Asahipak NH2P-50 4D氨基柱(4.6mm×150mm)上。将两种溶剂用于分离:A)5%(v/v)的乙酸、1%的四氢呋喃和3%的三乙胺,溶于水中;和B)2%的乙酸和1%的四氢呋喃,溶于乙腈中。然后使柱子用70%B等度洗脱2.5分钟,随后为在100分钟的时间段上从70%到5%B的线性梯度,最后用5%B等度洗脱20分钟。洗脱的峰是用230nm的激发波长和420nm的发射波长进行荧光探测的。非唾液酸化的N-连接聚糖处于23-34分钟的LC范围内,单唾液酸化的处于34-42分钟,二唾液酸化的处于42-52分钟,三唾液酸化的处于55-65分钟,而四唾液酸化的处于68-78分钟。

通过2AA HPLC的聚糖表征揭示A批中有92%转变为具有两个GlcNAc的双触角结构(其余(balance)具有单个GlcNAc)。B批显示有97%转变为想要的产物(图125A和125B)。

用GnT-V引入第三个触角分支.使来自GnT-I和GnT-II反应的产物EPO(B批的1mg/mL)在PD-10柱子上脱盐和随后浓缩后与10mU/mL GnR-V和5mM UDP-GlcNAc在100mM pH 6.5的MES中于32℃温育24小时,该MES含有5mM MnCl2和0.02%叠氮化钠。2AA HPLC分析证明转变是以92%的效率发生的(图126)。

在脱盐(PD-10)和浓缩后,用rGalTI添加半乳糖:即将EPO(1mg/ml)与0.1U/ml GalT1、5mM UDP-半乳糖、5mM MnCl2于32℃温育24小时。

对来自EPO的还原性氨基化的N-聚糖的MALDI分析.将已用邻氨基苯甲酸进行还原性标记的用PNGase从EPO释放的N-聚糖的小等份试样在漂浮于水上的MF-Millipore薄膜滤器(0.025μm的孔,直径47mm)上透析45分钟。透析的等份试样在真空离心蒸发浓缩器中干燥,再次溶解于小量的水中,并与溶解于水/乙腈(50∶50)的2,5-二羟基苯甲酸(10g/L)溶液混合。使该混合物在目标上干燥并用以线性/负离子模式运行的Applied Biosystems DE-Pro MALDI-TOF质谱仪进行分析。寡糖是基于观察到的质荷比和以前的文献而确定的。

由MALDI对释放的聚糖的分析显示半乳糖是定量添加到所有可用位点的(图127)。然后将来自上述的半乳糖基化的EPO通过在Superdex1.6/60柱子上于50mM Tris、0.15M NaCl,pH 6中进行凝胶过滤而纯化。

唾液酸化.在浓缩和脱盐(PD-10)后,使10mg半乳糖基化的EPO(1mg/mL)与ST3Gal3(0.05U/mL)和CMP-SA(3mM)在含有0.02%叠氮化钠的pH 7.2的50mM Tris、150mM NaCl中温育。单独的等份试样含有放射性标记的CMP-SA。将结果所得的整合标记和自由标记通过等度的大小排阻层析/HPLC在45%MeOH、0.1%TFA中以0.5mL/分钟进行分离(7.8mm×30cm的柱子,颗粒大小5μm,TSK G2000SWXL,Toso Haas,Ansys Technologies,Lake Forest,CA)。利用该程序,整合了12%的数目(360微摩尔,于33微摩尔EPO,或约10.9摩尔/摩尔)。理论值(3N-连接的位点,三触角的)为约9摩尔/摩尔的整合。这些符合本方法的限制范围。在用ST6Gal1代替ST3Gal3的相同反应中,5.7%的放射性标记整合入半乳糖基化的EPO中,或与ST3Gal3相比约48%。

13.昆虫细胞中产生的EPO的糖PEG化

本实施例提出了从昆虫细胞表达的EPO制备PEG化的双触角EPO。

将来自杆状病毒/Sf9表达系统的重组人促红细胞生成素(rhEPO)(Protein Sciences Corp.,Meriden,CT)进行聚糖分析,且显示聚糖主要为具有核心岩藻糖的三甘露糖核心,而小百分比的聚糖也具有单个的GlcNAc(图128)。

用GnT-I和GnT-II添加N-乙酰葡糖胺.使两批rhEPO(1mg/ml)与GnT-I和GnT-II、5mM UDP-GlcNAc、20mM MnCl2和0.02%叠氮化钠在100mM pH 6.5的MES中于32℃温育24小时。A批含有20mgEPO和100mU/mL GnT-I和60mU/mL GnT-II。B批含有41mg EPO和41mU/mL GnT-I+50mU/mL GnT-II。在反应后,将样品通过凝胶过滤脱盐(PD10柱子,Pharmacia LKB Biotechnology Inc.,Piscataway,NJ)。

通过2AA HPLC的聚糖表征揭示A批有92%转变为具有两个GlcNAc的双触角结构(其余具有单个GlcNAc)。B批显示97%转变为想要的产物(图125A和125B)。

A批EPO的半乳糖基化.将EPO(~16mg的A批)用GnT-II处理以完成GlcNAc的添加。该反应在含有150mM NaCl、EPOmg/mL、1mM UDP-GlcNAc、5mM MnCl2、0.02%叠氮化钠和0.02U/ml GnT-II的pH 7.2的50mM Tris中于32℃进行4小时。然后通过将UDP-半乳糖添加至3mM和将GalT1添加至0.5U/ml并于32℃温育48小时而进行EPO的半乳糖基化。

半乳糖基化的EPO然后在50mM Tris、0.15M NaCl,pH 6中于Superdex75 1.6/60柱子上通过凝胶过滤而纯化。含有EPO的峰然后通过2AA HPLC进行分析。基于HPLC的数据,在半乳糖基化反应后~85%的聚糖含有两个半乳糖,且~15%的聚糖不具有任何半乳糖。

半乳糖基化的EPO的唾液酸化.半乳糖基EPO的唾液酸化是在100mM含有150mM NaCl、0.5mg/ml EPO、200U/ml ST3Gal3的Tris中与0.5mM CMP-SA或CMP-SA-PEG(1kDa)或CMP-SA-PEG(10kPa)于32℃进行48小时的。在与CMP-SA的唾液酸化反应后几乎所有具有两个半乳糖残基的聚糖均是完全唾液酸化的(2个唾液酸/聚糖)。MALDI-TOF分析证实了HPLC数据。

半乳糖基化的EPO的PEG化.对于应用CMP-SA-PEG(1kDa)和CMP-SA-PEG(10kDa)的PEG化反应,将反应混合物的等份试样用SDS-PAGE进行分析(图129)。EPO肽的分子量随着添加每一个糖而增加,且在PEG化反应后分子量有更急剧的增加。

EPO的体外生物测定.体外EPO测定(从Hammerling等人,1996,J.Pharm.Biomed.Anal.14:1455-1469改编)基于TF-1细胞系对多种浓度EPO的反应性。TF-1细胞提供了研究髓样祖先细胞增殖和分化的良好系统。该细胞系是由T.Kitamura等人于1987年10月从来自一个患有严重的各类血细胞减少症的35岁日本男性的肝素化的骨髓吸取样品中建立的。这些细胞完全依赖于白细胞介素3或粒细胞巨噬细胞集落刺激因子(GM-CSF)。

TF-1细胞系(ATCC,Cat.No.CRL-2003)生长于RPMI+FBS10%+GM-CSF(12ng/ml)中并于37℃在5%CO2中温育。该细胞以5000个细胞/ml培养基的浓度存在于悬浮液中,并将200μl放置于96孔平板中。使该细胞与各种浓度的EPO(0.1μg/ml-10μg/ml)温育48小时。然后进行MTT生存力测定,该测定如下:添加25μl的5mg/ml MTT(SIGMA M5655)、使平板于37℃温育20分钟~4小时、添加100μl异丙醇/HCl溶液(100ml异丙醇+333μl HCl 6N)、在570nm和630nm或690nm读取OD,并从570nm的读数中减去630nm或690nm的读数。

图130含有当将唾液酸化的EPO和用1kDa或10kDa PEG进行糖PEG化的EPO进行体外EPO生物活性检验时所得的结果。当均在约5μg/ml的浓度时,用1kDa PEG进行糖PEG化的EPO与未进行糖PEG化的EPO具有几乎相同的活性。当均在约5μg/ml的浓度时,用10kDaPEG进行糖PEG化的EPO具有未进行糖PEG化的EPO约一半的活性。

14.CHO细胞中产生的EPO的O-连接聚糖的糖PEG化

O-连接的EPO-SA-PEG(10kDa)的制备.将最初由CHO细胞产生的脱唾液酸化-EPO以2.5mg/mL溶解于50mM Tris-HCl、0.15MNaCl、0.05%NaN3,pH 7.2中。使该溶液与5mM CMP-SA和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸向N-连接聚糖中的整合,向反应物的小等份试样添加了CMP-SA-14C;肽是在应用甲醇和水的TosoHaas G3000SW分析型柱上通过凝胶过滤分离的,产物是用放射探测器探测的。当反应结束时,将溶液用Centricon-20滤器进行浓缩。将剩余的溶液与0.05M Tris(pH 7.2)、0.15M NaCl、0.05%NaN3交换缓冲液到7.2mL的终体积,直到不再探测到CMP-SA。然后将存留物以2.5mg/mL蛋白质重悬于0.05M Tris(pH 7.2)、0.15M NaCl、0.05%NaN3中。为了使O-连接位点糖基化,使该溶液与1mM CMP-SA-PEG(10kDa)和ST3Gal1于32℃温育2日。为了监控唾液酸-PEG的整合,将反应物的小等份试样在应用PBS pH 7.0进行洗脱的Toso Haas TSK-凝胶-3000分析型柱上通过凝胶过滤分离并通过UV探测进行分析。当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.0)的Toso Haas TSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

15.EPO-运铁蛋白

本实施例提出了使蛋白质与O-连接聚糖进行糖缀合的程序,特别是将运铁蛋白与EPO进行糖缀合。使唾液酸残基从EPO的O-连接聚糖上去除,并制备EPO-SA-连接体-SA-CMP。用ST3Gal3使EPO-SA-连接体-SA-CMP与脱唾液酸化运铁蛋白进行糖缀合。

O-连接的脱唾液酸化-EPO的制备.将CHO细胞中产生的EPO(促红细胞生成素)以2.5mg/mL溶解于50mM Tris-HCl pH 7.4、0.15M NaCl中,并使其与300mU/mL唾液酸酶(霍乱弧菌(Vibrio cholera))-琼脂糖缀合物于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并根据Invitrogen的程序运行IEF凝胶。将混合物在10,000rpm离心并收集上清液。将上清液浓缩至50mM Tris-HCl、0.15M NaCl、0.05%NaN3、pH 7.2中约2.5mg/mL的EPO浓度。使该溶液与5mM CMP-唾液酸和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸的整合,向反应物的小等份试样添加了CMP-SA-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW分析型柱上通过凝胶过滤而与游离标记分离的。当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。将样品对水进行透析并由MALDI-TOF MS进行分析。

EPO-SA-连接体-SA-CMP的制备.将O-连接的脱唾液酸化-EPO以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-连接体-SA-CMP和0.1U/mL的ST3Gal1于32℃温育2日。为了监控唾液酸-连接体-SA-CMP的整合,将肽在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而分离。

2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

运铁蛋白-SA-连接体-SA-EPO的制备.将上述EPO-SA-连接体-SA-CMP以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与2.5mg/mL脱唾液酸化运铁蛋白和0.1U/mL的ST3Gal3于32℃温育2日。为了监控运铁蛋白的整合,将肽在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而分离,且产物通过UV吸收而探测。当反应结束时,使该溶液与5mMCMP-SA和0.1U/mL的ST3Gal3(以向任何未反应的运铁蛋白聚糖进行加帽)于32℃温育2日。将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

16.EPO-GDNF

本实施例提出了对蛋白质进行糖缀合的程序,特别是EPO-SA-连接体-SA-GDNF的制备。

EPO-SA-连接体-SA-GDNF的制备.将上述EPO-SA-连接体-SA-CMP以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与2.5mg/mL GDNF(在NSO细胞中产生)和0.1U/mL的ST3Gal3于32℃温育2日。为了监控GDNF的整合,将肽在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而分离,且产物通过UV吸收而探测。当反应结束时,使该溶液与5mM CMP-SA和0.1U/mL的ST3Gal3(以向任何未反应的GDNF聚糖进行加帽)于32℃温育2日。将反应混合物用应用PBS缓冲液(pH7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

17.EPO的单触角糖PEG化

本实施例提出了制备糖PEG化的单触角促红细胞生成素(EPO)的方法,及其体外和体内生物活性。

当EPO(GenBank Accession No.P01588)表达于CHO细胞中时,在氨基酸残基24、38和83形成N-连接的聚糖,而在氨基酸残基126形成O-连接的聚糖(图131;Lai等人,1986,J.Biol.Chem.261:3116-3121)。该糖蛋白的生物活性直接与NeuAc含量相关。增加的唾液酸降低了EPO在体外与其受体的结合;然而增加的唾液酸增加了EPO的体内生物活性。O-连接的聚糖对EPO的体外或体内活性或该分子的药物代谢动力学没有影响(Wasley等人,1991,Blood 77:2624-2632)。

当EPO表达于昆虫细胞中时,如应用杆状病毒/Sf9表达系统所实现的(也参见Wojchowshi等人,1987,Biochem.Biophys.Acta 910:224-232;Quelle等人,1989,Blood 74:652-657),在氨基酸残基24、38和83形成N-连接的聚糖,而在氨基酸残基126不形成O-连接的聚糖(图132)。这是因为昆虫细胞不具有识别EPO的氨基酸残基126周围的氨基酸序列的糖基转移酶。大多数N-连接的聚糖由GlcNAc2Man3Fuc组成。在本实施例中,对表达于昆虫细胞中的EPO进行高效重构以通过使蛋白质在适当的供体分子存在时连续地与GnT1、2、GalT-1和ST接触而生成复合聚糖SA2Gal2GlcNAc2Man3FucGlcNAc2。这些酶促反应是在昆虫细胞表达的EPO上应用此处所述的反应条件进行的,从而92%的总效率产生此处的复合聚糖(表21)。任选地,也可添加O-连接的聚糖(O’Connell和Tabak,1993,J.Dent.Res.72:1554-1558;Wang等人,1993,J.Biol.Chem.268:22979-22983)。

表21.在昆虫细胞表达的EPO(“起始材料”)上和在每一个连续的酶促重构步骤后在EPO上的聚糖结构群体中每一种聚糖结构种类的百分比。

聚糖  起始材料  GnT-I,II之后  GalT-I之后  ST之后○○□□○  0.5%○◇○□□○  98.0%○◇○□□□○  1.0%  0.5%  0.5%□○◇○□□□○  0.5%  99.5%  4%  2%○□○◇○□□○□○  95.9%  5%_□○◇○□□_⊙□○  92.0%

◇=岩藻糖,□=GlcNAc,○=甘露糖,⊙=半乳糖,▲=N-乙酰神经氨酸

同样在本实施例中,将表达于昆虫细胞中的EPO进行重构以形成单触角的、双触角的和三触角的聚糖,该聚糖随后用本文中别处描述的方法用1kDa、10kDa和20kDa PEG分子进行糖PEG化。确定这些EPO形式的分子量,然后与具有3个N-连接的聚糖的EpoetinTM和具有5个N-连接的聚糖的NESP(AranespTM)进行比较(图133)。制备双触角和三触角聚糖结构的实例在此处的实施例7中给出。

具有单触角PEG化聚糖结构的EPO通过如下方法制备,即通过在昆虫细胞中表达EPO肽,然后在GlcNAc供体存在时使EPO肽仅与GnTI(或者可选择地仅与GnTII)接触。然后在半乳糖供体存在时使EPO肽与GalT-I接触。然后在SA-PEG供体分子存在时使EPO肽与ST接触(图134A)以生成具有3个N-连接的单触角PEG化聚糖结构的EPO肽(图134B)。

从昆虫细胞表达的EPO生成的EPO-SA和EPO-SA-PEG的体外生物活性是通过测量该分子刺激TF-1红白血病细胞的增殖来估计。三触角EPO-SA-PEG 1kDa展示几乎所有三触角EPO-SA的生物活性,而双触角EPO-SA-PEG 10kDa在某些EPO浓度范围内展示几乎所有双触角EPO-SA的生物活性(图135)。生成于昆虫细胞中的重构和糖PEG化的EPO展示高达94%的EpogenTM的体外生物活性,该EpogenTM是不具有进一步的聚糖重构或PEG化的表达于CHO中的EPO(表22)。

表22.在2μg/ml蛋白质和48小时时与EpogenTM相比的EPO构建体的体外活性。

 化合物(2μg/ml蛋白质)  活性(EpogenTM的百分比) 双触角的-SA  146 双触角的-SA-PEG 1K  94 双触角的-SA-PEG 10K  75 三触角的-SA 2,31  42 三触角的-SA-PEG 1K  48 三触角的-SA-PEG 10K  34

1三触角的-SA2,3构建体具有以2,3键结合的SA分子。

确定了糖PEG化的和非糖PEG化的EPO的体内药物代谢动力学。将糖PEG化的和非糖PEG化的[I125]-标记EPO推注到大鼠中,并确定分子的药物代谢动力学。与双触角的EPO相比,双触角的EPO-PEG 1kDa的AUC高1.8倍,而双触角的EPO-PEG 10kDa的AUC高11倍(图136)。与双触角的EPO相比,双触角的EPO-PEG 1kDa的AUC高1.6倍,而双触角的EPO-PEG 10kDa的AUC高46倍(图136)。因此,糖PEG化大大改善了EPO的药物代谢动力学。

也通过测量EPO构建体刺激网状细胞增多的程度来确定糖PEG化的和非糖PEG化的EPO的体内生物活性。网状细胞增多是红细胞前体细胞成熟为成熟红细胞(erythrocyte)的速率的测量。对每个处理组的8只小鼠进行10μg蛋白质/Kg的单次皮下注射,并在96小时测量网状细胞百分比(图137)。三触角和双触角PEG化的EPO比非PEG化的EPO形式(包括EpogenTM)展示更高的体内生物活性。

EPO构建体体内生物活性的进一步确定通过如下方法进行估计,即通过在以2.5μg肽/Kg体重的EPO构建体进行每周三次的腹膜内注射后15日测量CD-1雌性小鼠的血细胞比容(由红细胞组成的全血的百分比)。血细胞比容增量随EPO形式的大小而增加,82.7kDa的单触角EPO-PEG20kDa具有略大于35.6kDa的NESP(AranespTM)的活性,且其活性是28.5kDa的EpogenTM的生物活性的约2倍(图138)。

本实施例阐明生成更长作用时间的糖PEG化EPO是可行的。糖PEG化EPO的药物代谢动力学特征可以通过改变糖PEG化位点数目和添加后用于改变肽在血流中的半衰期的PEG分子大小来定制。最后,糖PEG化的EPO保持了体外和体内生物活性。

18.唾液酸化和PEG化的单-、双-和三-触角EPO的制备和生物活性

本实施例阐明了糖PEG化的EPO的生产,特别是具有在其上连接了PEG的单触角和双触角聚糖的PEG化的EPO。生产了下述EPO变体:单触角PEG(1kDa)、PEG(10kDa)和PEG(20kDa);双触角2,3-唾液酸(SA)、双触角SA-PEG(1kDa)、双触角SA-PEG(10kDa);用2,3-SA进行加帽的三触角2,3-SA和三触角2,6-SA。

表达于昆虫细胞的重组促红细胞生成素(rEPO)获自ProteinSciences(Lot#060302,Meridan CT)。该批EPO的聚糖组成具有约98%的三甘露糖核心结构。图139A描述了从该EPO释放的聚糖的HPLC分析,其中峰“P2”表示三甘露糖核心。图139B显示释放的聚糖的MALDI分析,其中释放的聚糖的结构示于它们代表的峰旁边。

单触角分支

进行了几个步骤以产生单触角分支的结构。简言之,第一步是GnT-I/GalT-1反应,随后用Superdex-75层析进行纯化。该反应向三甘露糖核心的一个分支添加GlcNAc部分,向GlcNAc部分添加半乳糖部分。分支通过用ST3Gal3反应在末端半乳糖部分上添加SA-PEG(10kDa)部分或SA-PEG(20kDa)部分来延伸。最后的纯化是用Superdex-200层析实现的(Amersham Biosciences,Arlington Heights,IL)。

GnT-I/GalT-1反应.组合GnT-I和GalT-1反应物,并于32℃温育36小时。反应物含有1mg/mL EPO、100mM Tris-Cl pH 7.2、150mMNaCl、5mM MnCl2、0.02%NaN3、3mM UDP-GlcNAc、50mU/mgGnT-I、3mM UDP-Gal和200mU/mg GalT-1。图140描述了在GnT-I/GalT-1反应后从EPO释放的聚糖的MALDl分析。聚糖分析显示约90%的聚糖具有预期的单触角分支结构,该结构具有末端半乳糖部分。

Superdex-75纯化.在GnT-I/GalT-1反应后,应用1.6cm×60cm的Superdex-75凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS(Sigma-Aldrich Corp.,St.Louis,MO)中从酶蛋白质污染物和核苷酸糖纯化EPO。

ST3Gal3反应.将ST3Gal3 PEG化反应物于32℃温育24小时。反应物含有1mg/mL EPO、100mM Tris-Cl pH 7.2、150mM NaCl、0.02%NaN3、200mU/mg ST3Gal3和0.5mM CMP-SA-PEG(10kDa)或0.5mMCMP-SA-PEG(20kDa)。图141描述了该反应后的EPO的SDS-PAGE分析。蛋白质条带的相应分子量显示通过GnT-I/GalT-1反应形成的EPO聚糖完全被PEG衍生物唾液酸化。

Superdex-200纯化.然后应用1.6cm×60cm的Superdex-200凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS中从ST3Gal3反应污染物纯化EPO。

单触角PEG化EPO的TF-1细胞体外生物测定.将TF-1细胞系用于估计体外EPO的活性。TF-1细胞系是可从美国典型培养物保藏中心(Catalogue No.CRL-2003,Rockville,MD)获得的骨髓祖先细胞系。该细胞系的生存力完全依赖于白细胞介素-3或粒细胞-巨噬细胞集落刺激因子。TF-1细胞提供了研究EPO对增殖和分化的作用的良好系统。

TF-1细胞于37℃在5%CO2中生长于具有10%FBS和12ng/mlGM-CSF的RPMI培养基中。细胞以10,000个细胞/ml培养基的浓度悬浮。将200μl细胞等分试样分散于96-孔平板中。使细胞与0.1~10μg/mlEPO温育48小时。

然后通过首先添加25μl 5μg/ml的MTT(溴化3-[4,5-二甲基噻唑-2-基]-2,5-二苯基四氮唑或噻唑基蓝(thiazolyl blue);Sigma Chemical Co.,St.Louis,Mo.,Catalogue No.M5655)来进行MTT生存力测定。将平板于37℃温育4小时。加入100μl异丙醇/HCl溶液(100ml异丙醇和333μl HCl 6N)。在570nm和630或690nm读取平板的吸光率,并从570nm的读数中减去630或690nm的读数。

图142描述了在其单触角聚糖进行PEG化后对EPO活性的生物测定结果。在该生物测定中,单触角PEG化的EPO的活性比非PEG化的EPO(Epogen)低很多。

单触角PEG化EPO的体内生物测定-血液学参数的检查.

检查了EPO-SA-PEG(10kDa)和EPO-SA-PEG(20kDa)对雄性Sprague Dawley大鼠血液学参数的影响,该化合物的制备在上文中详细描述。Sprague Dawley大鼠是充分研究的实验模型,且应用和维护这种动物的技术是本领域技术人员众所周知的。因此,Sprague Dawley大鼠提供了研究本发明的EPO-SA-PEG(10kDa)和EPO-SA-PEG(20kDa)的临床和生理学作用的良好系统。

实验受试者的制备、/维护和处理.根据本发明的方法和组合物的体内试验是在TherImmune Research Corporation(Gaithersburg,MD)进行的。体内研究的受试者包括170只雄性Sprague Dawley大鼠,购自Harlan(Harlan Sprague Dawley,Inc.,Indianapolis,IN)。在出货时受试者体重均为至少300克,且至少为70日龄。根据TherImmune’s Institutional AnimalCare and Use Committee对受试者进行维护,符合USDA Animal WelfareAct、PHS Policy on Humane Care and Use of Laboratory Animals以及U.S.Interagency Research Animal Committee Principles for theUtilization and Care of Research Animals的规定。研究的进行符合FDAGood Laboratory Practice Standards,21 CFR Part 58。在控制的环境条件下,将受试者单独置于聚碳酸酯笼中,并每周提供一次新鲜的食物,随意食用,并且使受试者可通过自动供水系统或水瓶随意获得自来水。

将受试者随机分配为试验组,并应用给出生物学上有意义的数据所需的最小数目的动物。通过皮下注射向受试者给药,给药频率和量示于表25中,并在施用剂量前和至少每日两次观察毒性、发病率和死亡率的迹象。在研究前和研究后以及研究过程中每周一次的基础上测量体重和进行身体检查。

对于血液学研究,在研究日1的第一次给药前以及在研究日3、5、8、10、12、15、17、19、22、24、26和29从所有存活的受试者的颈静脉收集0.25ml(±15%)血液样品。对实验受试者血液的血液学分析包括细胞形态学的检查、红细胞计数、血细胞比容、血红蛋白、白细胞、白细胞分化、平均细胞血红蛋白、平均细胞血红蛋白浓度、平均细胞体积、平均血小板体积、血小板计数和网状细胞。

表25.实验受试者分组和剂量的总结。

  组  处理  剂量  (μg/kg)  剂量体积  (ml/kg)  浓度 (μg/ml)  给药频率  动物数目  1  媒介物  -  0.33  -  每隔2天1  10  2  P113  2.5  0.33  7.5  每隔2日1  5  3  P113  6.0  0.33  18  每隔2日1  5  4  P140  2.5  0.33  7.5  每隔2日1  5  5  P140  6.0  0.33  18  每隔2日1  5  6  P138  2.5  0.33  7.5  每隔2日1  5  7  P138  6.0  0.33  18  每隔2日1  5  8  P139  2.5  0.33  7.5  每隔2日1  5  9  P139  6.0  0.33  18  每隔2日1  5  10  媒介物  -  0.33  -  每隔4日2  10  11  P140  4  0.33  12  每隔4日2  5  12  P140  12  0.33  36  每隔4日2  5  13  P138  4  0.33  12  每隔4日2  5  14  P138  12  0.33  36  每隔4日2  5  15  P139  4  0.33  12  每隔4日2  5  16  P139  12  0.33  36  每隔4日2  5  17  媒介物  -  0.33  -  每隔6日3  10  18  P140  6  0.33  18  每隔6日3  5  19  P140  25  0.33  75  每隔6日3  5  20  P138  6  0.33  18  每隔6日3  5  21  P138  25  0.33  75  每隔6日3  5  22  P139  6  0.33  18  每隔6日3  5  23  P139  25  0.33  75  每隔6日3  5  24  媒介物  -  0.33  -  每隔9日4  10  25  P140  7.5  0.33  23  每隔9日4  5  26  P140  50  0.33  150  每隔9日4  5  27  P138  7.5  0.33  23  每隔9日4  5  28  P138  50  0.33  150  每隔9日4  5  29  P139  7.5  0.33  23  每隔9日4  5  30  P139  50  0.33  150  每隔9日4  5

每一组受试者所示的研究日如下:

1=SD 1、4、7、10、13、16、19、22、25和28

2=SD 1、6、11、16、21和27

3=SD 1、8、15和22

4=SD 1、11和21

在研究日29,在临床病理学血液收集后,将所有存活的受试者通过吸入二氧化碳进行无痛处死。从腹大动脉收集血液。将以前进行无痛处死的濒死受试者以及在研究过程中发现死亡的受试者进行完全的尸体剖检。

结果分析和数据解释.定量结果是应用相关领域技术人员熟知的技术进行分析的。具体而言,结果是应用对正态(normality)的Kolmogorov-Smirnov检验、对相等方差的Levene Median检验和单因素方差分析(ANOVA)进行分析的。在正态或相等方差检验失败的情形中,应用非参变量的Kruskal-Wallis ANOVA对秩转化(rank-transformed)数据继续进行分析。应用Dunnett’s t-检验对参变量的数据进行分析,以描述哪一组与对照不同。对于非参变量数据,应用Dunns检验来描述哪一组与对照不同。将小于0.05的概率值(two-tailed)用作所有检验显著性的临界水平。

基于对来自研究的第一个15日的数据的一个分析,显示单剂量的50μg/kg糖PEG化单触角EPO,即根据本发明的EPO-SA-PEG(10kDa)或者EPO-SA-PEG(20kDa),给出大鼠中血液血红蛋白的充分增加,这与相同剂量的NESP给出的作用相当(图192)。不希望受到任何具体理论的限制,图192阐明了EPO-SA-PEG(10kDa)和EPO-SA-PEG(20kDa)具有出乎意料的增强的生物学性质。

双触角分支

进行了几个反应以实现EPO的双触角分支。简言之,第一个反应是GnT-I和GnT-II反应的组合,以向两个三甘露糖核心分支添加GlcNAc部分。第二个反应即GalT-1反应向每一个GlcNAc部分添加半乳糖部分。在ST3Gal3反应前进行Superdex-75层析(Amersham Bosciences,Arlington Heights,IL)。双触角分支进一步用ST3Gal3反应来延伸,以添加2,3-SA或SA-PEG(1kDa)、SA-PEG(10kDa)。应用Superdex-200层析实现最后的纯化(Amersham Biosciences,Arlington Heights,IL)。

GnT-I/GnT-II反应.组合GnT-I和GnT-II反应物,并干32℃温育48小时。反应物含有1mg/mL EPO、100mM MES pH 6.5、150mMNaCl、20mM MnCl2、0.02%NaN3、5mM UDP-GlcNAc、100mU/mgGnT-I、60mU/mg GnT-II。反应实现了添加双触角GlcNAc部分的92%完成程度,而8%是单触角GlcNAc部分。图143A显示释放的聚糖的HPLC分析,其中峰“P3”表示双触角GlcNAc聚糖。图143B显示释放的聚糖的MALDI分析,其中聚糖的结构示于它们代表的峰旁边。

为了进一步进行反应,连同1mM UDP-GlcNAc、5mM MnCl2、0.02%NaN3一起添加另外20mU/mg GnT-II,使混合物于32℃温育4小时。该反应的大于99%实现了双触角GlcNAc聚糖的完成。

GalT-1反应.在完成第二个GnT-II反应后,立即开始GalT-1反应。以0.5mU/mg GalT-1和3mM UDP-Gal的浓度向完成的GnT-II反应物中添加酶和核苷酸糖。

当GalT-1反应在每个反应具有约100μg EPO的小规模进行时,大约95%的反应产生具有双触角末端半乳糖部分的EPO。图144A显示释放的聚糖的HPLC分析,其中峰“P2”是具有末端半乳糖部分的双触角聚糖(聚糖的85%),而峰“P1”是不具有末端半乳糖部分的双触角聚糖(聚糖的15%)。

GalT-1反应在每个反应具有约16mg EPO的大规模进行。图144B显示从大规模GalT-1反应释放的聚糖的HPLC分析,其中峰“P2”是具有末端半乳糖部分的双触角聚糖,而峰“P1”是不具有末端半乳糖部分的双触角聚糖。

Superdex-75纯化.在GnT-1/GalT1反应后,应用1.6cm×60cm的Superdex-75凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS中从酶蛋白质污染物和核苷酸糖纯化EPO。图145描述了Superdex 75凝胶过滤的层析谱,其中峰2是具有末端半乳糖部分的双触角聚糖。图146示出了每一个重构步骤产物的SDS-PAGE分析,显示了EPO分子量随着每一个重构步骤的增加。

ST3Gal3反应.将ST3Gal3反应物于32℃温育24小时。反应物含有0.5mg/mL EPO、100mM Tris-Cl pH 7.2、150mM NaCl、0.02%NaN3、100mU/mg ST3Gal3和0.5mM CMP-SA、0.5mM CMP-SA-PEG(1kDa)或0.5mM CMP-SA-PEG(10kDa)。图147描述了ST3Gal3反应前和反应后的EPO的SDS-PAGE分析。基于该SDS-PAGE分析,在每一个ST3Gal3反应后,含有末端Gal的双触角EPO不再能被可见地探测到。所有唾液酸化的EPO变体与反应起始时非唾液酸化的EPO相比显示大小增加。

Superdex-200纯化.然后应用1.6cm×60cm的Superdex-200凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS中从ST3Gal3反应污染物纯化EPO。表23总结了每一个重构步骤时聚糖结构的分布。

表23.每一个重构步骤后EPO上聚糖结构的总结。

菱形表示岩藻糖,且正方形表示GlcNAc,圆圈表示甘露糖,空心圆圈表示半乳糖。

三触角分支

进行了几个反应以实现EPO的三触角分支化。简言之,第一个反应是GnT-I和GnT-II反应的组合,以向聚糖的两个外部三甘露糖核心分支添加GlcNAc部分。第二个反应即GnT-V反应向两个外部三甘露糖核心分支之一添加第二个GlcNAc部分,从而现在有3个GlcNAc部分。第三个反应即GalT-1反应向每一个末端GlcNAc部分添加半乳糖部分。EPO产物然后通过Superdex-75层析进行分离。三触角分支进一步用ST3Gal3反应来延伸,以添加2,3-SA或2,6-SA部分,且用2,3-SA部分进行加帽。应用Superdex-75层析实现最后的纯化。

GnT-I/GnT-II反应.组合GnT-I和GnT-II反应物,并于32℃温育24小时。反应物含有1mg/mL EPO、100mM MES pH 6.5、150mMNaCl、20mM MnCl2、0.02%NaN3、5mM UDP-GlcNAc、50mU/mgGnT-I和41mU/mg GnT-II。反应实现了添加双触角GlcNAc部分的97%完成程度,而剩余3%三甘露糖核心。图148描述了在GnT-I/GnT-II反应后从EPO释放的聚糖的HPLC分析。

GnT-V反应.GnT-V反应物含有100mM MES pH 6.5、5mMUDP-GlcNAc、5mM MnCl2、0.02%NaN3、10mU/mg GnT-V和1mg/mLEPO,并于32℃温育24小时。该反应向已经含有GlcNAc部分的外部甘露糖部分添加GlcNAc部分。图149描述了在GnT-V反应后从EPO释放的聚糖的HPLC分析。基于聚糖和MALDI分析,大约92%的从EPO释放的聚糖是预期产物,即具有末端GlcNAc部分的三触角分支的EPO。聚糖的剩余8%是含有末端GlcNAc部分的双触角分支的结构。

GalT-1反应.GalT-1反应物含有100mM Tris pH 7.2、150mM NaCl、5mM UDP-Gal、100mU/mg GalT-1、5mM MnCl2、0.02%NaN3和1mg/mL EPO,并于32℃温育24小时。图150描述了在该反应后从EPO释放的聚糖的HPLC分析。聚糖和MALDI分析显示释放的聚糖的97%在三触角分支结构上具有末端半乳糖部分。剩余的3%为含有末端半乳糖的双触角结构。

Superdex-75纯化.在GnT-I/GalT1反应后,应用1.6cm×60cm的Superdex-75凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS中从酶蛋白质污染物和核苷酸糖纯化EPO。纯化的材料分为两批,以产生具有末端2,6-SA部分的三触角聚糖和具有用2,6-SA部分加帽的末端2,6-SA部分的三触角聚糖。

ST3Gal3反应.将ST3Gal3反应物于32℃温育24小时。反应物含有1mg/mL半乳糖基化的EPO、100mM Tris-Cl pH 7.2、150mM NaCl、0.02%NaN3、50mU/mg ST3Gal3和3mM CMP-SA。图151描述了该步骤后从EPO释放的聚糖的HPLC分析。基于聚糖和MALDI分析,大约80%的释放的聚糖是具有末端2,3-SA部分的三触角分支的结构。释放的聚糖的剩余20%是含有末端2,3-SA部分的双触角结构。

ST3Gal3反应后的ST6Gal1唾液酸化反应.将ST6Gal1反应物于32℃温育24小时。反应物含有1mg/mL唾液酸化并半乳糖基化的EPO、100mM Tris-Cl pH 7.2、150mM NaCl、0.02%NaN3、50mU/mg ST6Gal1和3mM CMP-SA。图152描述了ST6Gal1反应后从EPO释放的聚糖的HPLC分析。基于聚糖和MALDI分析,大约80%的三触角分支的聚糖含有末端2,3-SA部分。聚糖的剩余20%是含有末端2,3-SA部分的双触角的。

Superdex-75纯化.应用1.6cm×60cm的Superdex-75凝胶过滤层析(Amersham Biosciences,Arlington Heights,IL)在含有0.02%Tween 20的PBS中从ST3Gal3反应污染物纯化EPO。

三触角和双触角唾液酸化或PEG化EPO的生物测定.如上文所述,应用TF-1细胞系和MTT生存力试验测定三触角和双触角唾液酸化EPO糖形式和PEG 10kDa和1kDa双触角糖形式的活性。图153描述了MTT细胞增殖测定的结果。在2μg/ml EDP时,双触角唾液酸化的EPO几乎具有对照Epogen的活性,而三触角唾液酸化的EPO具有显著低的活性。

凝血因子IX

19.由CHO细胞产生的凝血因子IX的糖PEG化

本实施例提出了对脱唾液酸化凝血因子IX的制备和用CMP-唾液酸-PEG对其的唾液酸化。

rFactor IX的脱唾液酸化.重组形式的凝结凝血因子IX(r FacorIX)是在CHO细胞中产生的。将6000IU的rFactor IX溶解于总共12mL的USP H2O中。将该溶液与另外6mL USP H2O转移到Centricon Plus20,PL-10离心滤器中。将该溶液浓缩至2mL,然后用15mL的50MTris-HCl pH 7.4、0.15M NaCl、5mM CaCl2、0.05%NaN3进行稀释并再次浓缩。使稀释/浓缩重复4次以有效地将缓冲液改变为3.0mL的终体积。将该溶液的2.9mL(约29mg rFactor IX)转移到小的塑料试管中并向其中添加530mU α2-3,6,8-神经氨酸酶-琼脂糖缀合物(霍乱弧菌,Calbiochem,450μL)。将反应混合物于32℃轻轻旋转26.5小时。将混合物于10,000rpm离心2分钟并收集上清液。将琼脂糖珠子(含有神经氨酸酶)用0.5mL的50M Tris-HCl pH 7.12、1M NaCl、0.05%NaN3洗涤6次。将收集的洗涤液和上清液再次于10,000rpm离心2分钟以去除任何残留的琼脂糖树脂。将收集的脱唾液酸化的蛋白质溶液用相同的缓冲液稀释到19mL并在Centricon Plus 20PL-10离心滤器中浓缩至~2mL。将该溶液用15mL的50M Tris-HCl pH 7.4、0.15M NaCl、0.05%NaN3稀释两倍并浓缩至2mL。将最终的脱唾液酸化的rFactor IX溶液用Tris缓冲液稀释到3mL的终体积(~10mg/mL)。天然的和脱唾液酸化的rFactor IX样品是用IEF-电泳进行分析的。Isoelectric Fousing Gels(pH 3-7)是用1.5μL(15μg)样品运行的,该样品首先用10μL Tris缓冲液稀释并与12μL样品加样缓冲液混合。凝胶是用标准程序加样、运行和固定的。凝胶用Colloidal Blue Stain染色(图154),显示脱唾液酸化的凝血因子IX的条带。

PEG(1kDa和10kDa)-SA-凝血因子IX的制备.将脱唾液酸化的rFactorg-IX(29mg,3mL)在两个1.5mL的离心管中分为两个1.5mL(14.5mg)的样品。每一个溶液均用12.67mL的50mM Tris-HCl pH7.4、0g.15M NaCl、0.05%NaN3稀释,并添加CMP-SA-PEG-1k或10k(7.25μmol)。将试管轻轻颠倒以混合,并添加2.9U ST3Gal3(326μL)(14.5mL总体积)。对试管再次进行颠倒,并轻轻于32℃旋转65小时。该反应通过于-20℃冷冻而停止。将10μg反应样品通过SDS-PAGE进行分析。PEG化的蛋白质是在Toso Haas Biosep G3000SW(21.5×30cm,13um)HPLC柱子上进行纯化的,该柱子应用pH 7.1的Dulbecco氏磷酸盐缓冲盐水(Gibco),6mL/分钟。反应和纯化是用SDS Page和IEF凝胶监控的。在将样品用2μL的50mM Tris-HCl pH 7.4、150mM NaCl、0.05%NaN3缓冲液稀释,与12μL样品加样缓冲液和1μL的0.5M DTT混合,并于85℃加热6分钟后,向Novex Tris-甘氨酸4-20%1mm凝胶加载10μL(10μg)该样品。凝胶是用Colloidal Blue Stain染色的(图155),显示PEG(1kDa和10kDa)-SA-凝血因子IX的条带。

20.凝血因子IX的直接唾液酸-糖PEG化

本实施例提出了不经预先唾液酸酶处理而对凝血因子IX进行唾液酸-PEG化。

应用CMP-SA-PEG(10kDa)对凝血因子IX的唾液酸-PEG化.将凝血因子IX(1100IU)溶解于5mL的20mM组氨酸、520mM甘氨酸、2%蔗糖、0.05%NaN3和0.01%聚山梨酸酯80,pH 5.0中,所述凝血因子IX表达于CHO细胞中,且是完全唾液酸化的。然后将CMP-SA-PEG-(10kDa)(27mg,2.5μmol)溶解于该溶液中并加入1U ST3Gal3。于32℃轻轻混合28小时后反应结束。反应物是用Invitrogen描述的SDS-PAGE进行分析的。产物蛋白质在Amersham Superdex 200(10×300nm,13μm)HPLC柱子上进行纯化,该柱子应用pH 7.0的磷酸盐缓冲盐水(PBS),1mL/分钟。Rt=9.5分钟。

应用CMP-SA-PEG(20kDa)对凝血因子IX的唾液酸-PEG化.将凝血因子IX(1100IU)溶解于5mL的20mM组氨酸、520mM甘氨酸、2%蔗糖、0.05%NaN3和0.01%聚山梨酸酯80,pH 5.0中,所述凝血因子IX表达于CHO细胞中,且是完全唾液酸化的。然后将CMP-SA-PEG-(20kDa)(50mg,2.3μmol)溶解于该溶液中并加入CST-II。于32℃轻轻混合42小时后反应混合结束。反应物是用Invitrogen描述的SDS-PAGE进行分析的。

产物蛋白质在Amersham Superdex 200(10×300nm,13μm)HPLC柱子上进行纯化,该柱子应用pH 7.0的磷酸盐缓冲盐水(Fisher),1mL/分钟。Rt=8.6分钟。

21.糖PEG化凝血因子IX的唾液酸加帽

本实施例提出了对唾液酸-糖PEG化肽进行唾液酸加帽的程序。在此,凝血因子-IX是示例性的肽。

凝血因子-IX-SA-PEG(10kDa)的N-连接和O-连接聚糖的唾液酸加帽.将纯化的rFactor-IX-PEG(10kDa)(2.4mg)在Centricon_Plus20PL-10(Millipore Corp.,Bedford,MA)离心滤器中进行浓缩,并将缓冲液改变为1.85mL终体积的50mM Tris-HCl pH 7.2、0.15M NaCl、0.05%NaN3。将蛋白质溶液用372μL相同的Tris缓冲液稀释并添加7.4mg CMP-SA(12μmol)固体。将该溶液轻轻颠倒以混合并添加0.1UST3Gal1和0.1U ST3Gal3。将反应混合物于32℃轻轻旋转42小时。

10μg反应样品是用SDS-PAGE进行分析的。Novex Tris-甘氨酸4-12%1mm凝胶是如Invitrogen描述的那样运行并用Colloidd Blue染色的。简言之,将10μL(10μg)样品与12μL样品加样缓冲液和1μL的0.5M DTT混合,并于85℃加热6分钟(图156,泳道4)。

凝血因子VIIa

22.BHK细胞中产生的重组凝血因子VIIa的糖PEG化

本实施例提出了对BHK细胞中产生的重组凝血因子VIIa的PEG化。

脱唾液酸化凝血VIIa的制备.重组凝血因子VIIa是在BHK细胞(幼仓鼠肾细胞)中产生的。将凝血因子VIIa(14.2mg)以1mg/ml溶解于缓冲液pH 7.4,0.05M Tris、0.15M NaCl、0.001M CaCl2、0.05%NaN3)中,并与300mU/mL唾液酸酶(霍乱弧菌)-琼脂糖缀合物于32℃温育3日。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释,并根据Invitrogen的程序进行了IEF凝胶(图157)分析。将混合物于3,500rpm进行离心并收集上清液。将该树脂用上述缓冲液(pH 7.4,0.05M Tris、0.15M NaCl、0.05%NaN3)洗涤3次(3×2mL)并将合并的洗涤液在Centricon-Plus-20中浓缩。将剩余的溶液与0.05MTris(pH 7.4)、0.15M NaCl、0.05%NaN3进行缓冲液交换以得到14.4mL的终体积。

凝血因子VIIa-SA-PEG(1kDa和10kDa)的制备.将脱唾液酸化的rFactorVIIa溶液分为两份相等的7.2ml样品。向每一个样品中加入CMP-SA-5-PEG(1kDa)(7.4mg)或CMP-SA-5-PEG(10kDa)(7.4mg)。将ST3Gal3(1.58U)添加到两个试管中,并使反应混合物于32℃温育96小时。该反应是用Invitrogen描述的试剂和条件通过SDS-PAGE凝胶监控的。当反应结束时,将反应混合物用Toso Haas TSK-Gel-3000制备型柱子进行纯化,该柱子应用PBS缓冲液(pH 7.1),并基于UV吸收收集级分。将合并的含有产物的级分于4℃在Centricon-Plus-20离心滤器(Millipore,Bedford,MA)中浓缩,并对浓缩的溶液进行重新配制以得到1.97mg(bicinchoninic acid蛋白质测定,BCA测定,Sigma-Aldrich,St.Louis MO)凝血因子VIIa-PEG。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析法进行分析的。样品是对水进行透析的并由MALDI-TOF分析。图158显示从天然凝血因子VIIa得到的MALDI结果。图159含有对于用1kDa PEG进行PEG化的凝血因子VIIa的MALDI结果,其中用1kDa PEG进行PEG化的凝血因子VIIa的峰是明显的。图160含有对于用10kDa PEG进行PEG化的凝血因子VIIa的MALDI结果,其中用10kDa PEG进行PEG化的凝血因子VIIa的峰是明显的。图161描述了所有反应产物的SDS-PAGE分析,其中凝血因子VIIa-SA-PEG(10-kDa)的条带是明显的。

促卵泡激素(FSH)

23.人垂体衍生的FSH的糖PEG化

本实施例阐明了本发明缀合物的组装。将促卵泡激素(FSH)脱唾液酸化然后与CMP-(唾液酸)-PEG缀合。

促卵泡激素的脱唾液酸化.将1mg促卵泡激素(FSH)(HumanPituitary,Calbiochem Cat No.869001)溶解于500μL的pH 7.4的50mMTris-HCl、0.15M NaCl、5mM CaCl2中。将375μL该溶液转移到小的塑料试管中,并向其中加入263mU神经氨酸酶II(霍乱弧菌)。将反应混合物于32℃轻轻摇动15小时。将反应混合物加入到600μL N-(对氨基苯基)草氨酸-琼脂糖缀合物中,该缀合物预先用50mM pH7.4的Tris-HCl、150mM NaCl和0.05%NaN3进行平衡,并于4℃轻轻旋转6.5小时。将悬浮液于14,000rpm离心2分钟并收集上清液。将珠子用0.5mL缓冲液洗涤5次并收集所有上清液。将酶溶液用2L含有50mM Tris-HClpH 7.4、1M NaCl、0.05%NaN3的溶液于4℃透析(7000MWCO)15小时,然后于4℃在4小时内向50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3中透析两次。用Speed Vac将该溶液浓缩至2μg/μL并贮存于-20℃。反应样品是由IEF凝胶(pH 3-7)(Invitrogen)分析的(图162)。

人垂体衍生的SA-FSH和PEG-SA-促卵泡激素的制备.将脱唾液酸化的FSH(100μg,50μL)和CMP-唾液酸或CMP-SA-PEG(1kDa或10kDa)(0.05μmol)在0.5mL塑料试管中溶解于13.5μL H2O(用NaOH调节到pH 8)。将试管简单地涡旋并添加40mU ST3Gal3(36.5μL)(100μL总体积)。对试管再次进行涡旋,并轻轻于32℃摇动24小时。将该反应通过于-80℃冷冻而停止。对15μg反应样品用SDS-PAGE(图163)、IEF凝胶(图164)和MALDI-TOF进行分析。天然的FSH也用SDS-PAGE进行分析(图165)。

对反应产物的SDS PAGE和IEF凝胶分析.用于SDS PA4GE分析的Novex Tris-甘氨酸8-16%1mm凝胶购自Invitrogen。将7.5μL(15μg)FSH反应样品用5μL的50mM Tris-HCl pH 7.4、150mM NaCl、0.05%NaN3缓冲液稀释,与15μL样品加样缓冲液和1μL 9Mμ-巯基乙醇混合并于85℃加热6分钟。凝胶是如Invitrogen所指示的运行的并用ColloidalBlue Stain染色(Invitrogen)。

将FSH样品(15μg)用5μL Tris缓冲液稀释并与15μL样品加样缓冲液混合(图162)。然后将样品应用于Isoelectric Focusing Gels中(pH3-7)(Invitrogen)(图165)。凝胶是如Invitrogen所指示的运行并固定的,然后用Colloidal Blue Stain染色。

24.CHO细胞中重组产生的重组FSH的糖PEG化

本实施例阐明了对本发明缀合物的组装。脱唾液酸化的FSH是与CMP-(唾液酸)-PEG缀合的。

重组脱唾液酸化-促卵泡激素的制备.将从CHO中产生的重组促卵泡激素(rFSH)用于这些研究中。将7,500IU的rFSH溶解于8mL水中。使FSH溶液在50mM Tris-HCl pH 7.4、0.15M NaCl、5mM CaCl2中透析并在Centricon Plus 20离心滤器上浓缩至500μL。将该溶液的一部分(400μL)(~0.8mg FSH)转移到小的塑料试管中并向其中添加275mU神经氨酸酶II(霍乱弧菌)。使反应混合物于32℃混合16小时。将反应混合物添加于预先洗涤的N-(对氨基苯基)草氨酸-琼脂糖缀合物(800μL)中并于4℃轻轻旋转24小时。将混合物于10,000rpm离心并收集上清液。将珠子用0.6mL Tris-EDTA缓冲液洗涤3次,用0.4mLTris-EDTA缓冲液洗涤1次并用0.2mL Tris-EDTA缓冲液洗涤1次,且收集所有上清液。将上清液于4℃对2L的50mM Tris-HCl pH 7.4、1MNaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1MNaCl、0.05%NaN3透析两次。然后将透析的溶液在Centricon Plus 20离心滤器中浓缩至420μL并贮存于-20℃。

天然的和脱唾液酸化的rFSH样品是用SDS-PAGE和IEF分析的(图166)。Novex Tris-甘氨酸8-16%1mm凝胶购自Invitrogen。将样品(7.5μL,15μg)用5μL的50mM Tris-HCl pH 7.4、150mM NaCl、0.05%NaN3缓冲液稀释,与15μL样品加样缓冲液和1μL 9Mβ-巯基乙醇混合并于85℃加热6分钟。凝胶是如Invitrogen所指示的运行的并用ColloidalBlue Stain(Invitrogen)染色。Isoelectric Focusing Gels(pH 3-7)购自Invitrogen。将样品(7.5μL,15μg)用5μL Tris缓冲液稀释并与15μL样品加样缓冲液混合。凝胶是如Invitrogen所指示的加样、运行和固定的。凝胶用Colloidal Blue Stain染色。天然和脱唾液酸化的FSH样品也对水进行透析并用MALDI-TOF进行分析。

重组促卵泡激素的唾液酸-PEG化.将脱唾液酸化的FSH(100μg,54μL)和CMP-SA-PEG(1kDa或10kDa)(0.05μmol)于0.5mL塑料试管中溶解于28μL的50mM Tris-HCl、0.15M NaCl、0.05%NaN3pH 7.2中。将试管简单地涡旋并添加20mU ST3Gal3(100μL总体积)。对试管再次进行涡旋,并轻轻于32℃混合24小时,且该反应通过于-80℃冷冻而停止。对该反应的样品用如上所述的SDS-PAGE(图167)、IEF凝胶(图168)和MALDI-TOF MS进行分析。

也对PEG化的rFSH进行了MALDI。在电离过程中,将SA-PEG从糖蛋白的N-聚糖结构中去除。天然的FSH给出了在13928的峰;AS-rFSH(13282);再次唾液酸化的r-FSH(13332);PEG1000-rFSH(13515;14960(1);16455(2);17796(3);19321(4));和PEG 10000(23560(1);34790(2);45670(3)和56760(4))。

25.糖PEG化的FSH的药物代谢动力学研究

本实施例提出了根据本发明的方法制备的糖PEG化的促卵泡激素(FSH)与非PEG化的FSH相比的药物代谢动力学性质的体内检验。

将FSH、FSH-SA-PEG(1kDa)和FSH-SA-PEG(10kDa)用标准条件(Amersham Biosciences,Arlington Heights,IL)进行放射性碘化并在含有0.1%BSA的磷酸盐缓冲盐水中制备。在磷酸盐缓冲液中稀释到适当的浓度后,将每一种检验的FSH蛋白质(各自0.4μg)静脉内注射入雌性Sprague Dawley大鼠中(体重为250-300g)并在0~80小时的时间点抽血。血液样品中的放射性是用γ计数器分析的,且药物代谢动力学是用标准方法分析的(图169)。FSH比FSH-PEG(1kDa)更快地从血液中清除,而FSH-PEG(1kDa)比FSH-PEG(10kDa)被稍微快地清除的。

26.糖PEG化FSH体外活性的支持细胞生物测定

本实施例提出了基于培养的支持细胞对促卵泡激素(FSH)的生物测定。该测定可用于确定聚糖重构(包括糖缀合)后FSH的生物活性。

该生物测定基于雌二醇量之间存在的剂量-反应关系,该雌二醇是当FSH而不是黄体生成素(LH)添加到从不成熟的老龄大鼠中获得的培养的支持细胞中时产生的。外源的睾酮在FSH存在时可转变为17β-雌二醇。

将7~10日龄的老Sprague-Dawley大鼠用于获得支持细胞。在处死后,通过在胶原酶(1mg/ml)、胰蛋白酶(1mg/ml)、透明质酸酶(1mg/ml)和DNase(5μg/ml)中温育5~10分钟而使睾丸脱被膜并使组织分散。将小管片段置于烧瓶底部并在PBS(1x)中洗涤。使小管片段再次与含有同样酶的介质温育20分钟:胶原酶(1mg/ml)、胰蛋白酶(1mg/ml)、透明质酸酶(1mg/ml)和DNase(5μg/ml)。

将小管片段匀浆并置于24孔平板上无血清的培养基中。每孔放置5×105个细胞。在于37℃和5%CO2中温育48小时后,向细胞添加新鲜的培养基。无血清培养基的组成:DMEM(1体积)、Ham’s F10营养混合物(1体积)、胰岛素1μg/ml、运铁蛋白5μg/ml、EGF 10ng/ml、T420pg/ml、氢化可的松10-8M、视黄酸10-6M。

刺激实验为:与标准FSH或样品于37℃和5%CO2中温育24小时。测定内的平均变异系数为9%,且测定间的平均变异系数为11%。

将17B-雌二醇Elisa试剂盒DE2000(R&D Systems,Minneapolis,MN)用于在与FSH、FSH-SA-PEG(1kDa)和FSH-SA-PEG(10kDa)温育之后定量雌二醇的水平。

该程序如下:将100μl雌二醇标准(由试剂盒提供并根据试剂盒的说明书制备)或样品吸取到17B-雌二醇Elisa平板上;将50μl 17B-雌二醇缀合物(由试剂盒提供并根据试剂盒的说明书制备)添加到每一个孔中;将50μl 17B-雌二醇抗体溶液(由试剂盒提供并根据试剂盒的说明书制备)添加到每一个孔中;使平板于室温在200rpm温育2小时;将液体从每一个孔中吸出;将孔用洗涤溶液洗涤四次;将所有液体从孔中移去;将200μl pNPP底物(由试剂盒提供并根据试剂盒的说明书制备)添加到所有孔中并温育45分钟;添加50μl终止溶液(由试剂盒提供并根据试剂盒的说明书制备)并在405nm读取平板(图170)。尽管FSH-PEG(10kDa)在1μl/ml时显示对支持细胞的中等刺激,但FSH-PEG(1kDa)对支持细胞的刺激比未PEG化的FSH高50%。

27.糖PEG化FSH体内活性的Steelman-Pohley生物测定

在本实施例中,将Steelman-Pohley生物测定(Steelman和Pohley,1953,Endocrinology 53:604-615)用于确定糖PEG化FSH的体内活性。Steelman-Pohley生物测定利用大鼠卵巢重量的变化来测量FSH的体内活性,该FSH是与人绒毛膜促性腺激素共同注射的。

Steelman-Pohley生物测定根据Christin-Maitre等人(2000,Methods21:51-57)描述的规程进行。将70只21-22日龄的雌性Sprague-Dawley大鼠(Charles River Laboratories,Wilmington,MA)在开始测定程序之前在试验设备中放置至少5日。在整个程序过程中,动物室的气候控制为18~26℃、30~70%相对湿度和12小时人工光照/12小时黑暗。所有动物均用Certified Rodent Chow(Harlan Teklad,Madison WI)或等同物以及水饲喂,均可随意获得。在Calvert Preclinical Services,Inc.(Olyphant,PA)进行动物程序。

重组FSH表达于CHO细胞中,通过标准技术进行纯化并用PEG(1kDa)进行糖PEG化。将大鼠分为7个实验组,每组10只动物。在-1日和0日,所有组的动物均用0.5ml 0.9%NaCl中的20I.U.人绒毛膜促性腺激素(HCG)进行皮下注射。在1、2和3日,对照动物用在0.9%NaCl中含有20I.U.HCG的0.5ml剂量进行皮下注射,而在其他组中,HCG剂量随着每次给药中0.14μg、0.4μg或1.2μg的rFSH或rFSH-SA-PEG(1kDa)而增加。在4日,通过CO2吸入无痛处死动物。获取卵巢、修整并称重。确定每一组的平均卵巢重量。

图171表示4日时实验组的平均卵巢重量。单独接受HCG的组(对照)或接受低剂量(0.14μg)rFSH或rFSH-SA-PEG(1kDa)的组具有大约相等的卵巢重量。接受中等(0.4μg)或高(1.2μg)剂量rFSH或rFSH-SA-PEG(1kDa)的组具有大约两倍于对照组的卵巢重量。在中等剂量(0.4μg)时,糖PEG化的rFSH具有与非PEG化的rFSH大约相同的体内活性(由卵巢重量所确定)。在高剂量(1.2μg)时,糖PEG化的rFSH具有比非PEG化的rFSH略高的体内活性。

G-CSF

28.CHO细胞中产生的G-CSF的糖PEG化

脱唾液酸化-粒细胞集落刺激因子(G-CSF)的制备.将CHO细胞中产生的G-CSF以2.5mg/mL溶解于50mM Tris-HCl pH 7.4、0.15MNaCl、5mM CaCl2中并在Centricon Plus 20离心滤器中浓缩至500μL。使该溶液与300mU/ml神经氨酸酶II(霍乱弧菌)于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并运行IEF凝胶分析。然后将反应混合物添加入预先洗涤的N-(对氨基苯基)草氨酸-琼脂糖缀合物(800μL/mL反应体积),并使洗涤的珠子于4℃轻轻旋转24小时。将混合物于10,000rpm离心并收集上清液。将珠子用Tris-EDTA缓冲液洗涤3次,用0.4mL Tris-EDTA缓冲液洗涤一次且用0.2mL Tris-EDTA缓冲液洗涤一次,并收集所有上清液。将上清液于4℃对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3透析两次。透析的溶液然后用Centricon Plus 20离心滤器浓缩并贮存于-20℃。IEF凝胶的条件是根据由Invitrogen提供的程序和试剂运行的。将天然的和脱唾液酸化的G-CSF样品对水进行透析并由MALDI-TOF MS进行分析。

G-CSF-(α2,3)-唾液酸-PEG的制备.将脱唾液酸化的G-CSF以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的ST3Gal1于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和PEG化的G-CSF样品对水进行透析并由MALDI-TOF MS进行分析。

G-CSF-(α2,8)-唾液酸-PEG的制备.将CHO细胞中产生的含有α2,3-唾液酸化的O-连接聚糖的G-CSF以2.5mg/mL溶解于50mMTris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的CST-II于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和PEG化的G-CSF样品对水进行透析并由MALDI-TOF MS进行分析。

G-CSF-(α2,6)-唾液酸-PEG的制备.将仅含有O-连接的GalNAc的G-CSF以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的ST6GalNAc I或II于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和PEG化的G-CSF样品对水进行透析并由MALDI-TOF MS进行分析。

将在CHO细胞中产生的G-CSF用节杆菌属(Arthrobacter)唾液酸酶进行处理,并在Superdex 75上通过大小排阻进行纯化,用ST3Gal1或ST3Gal2进行处理,然后用CMP-SA-PEG 20kDa进行处理。结果所得的分子通过离子交换和凝胶过滤进行纯化,且通过SDS PAGE的分析证明PEG化是完全的。这是O-连接的聚糖的糖PEG化的第一次证明。

葡糖脑苷脂酶

29.CHO细胞中产生的葡糖脑苷脂酶-甘露糖-6-磷酸

本实施例提出了使甘露糖-6-磷酸与CHO细胞中产生的肽如葡糖脑苷脂酶进行糖缀合的程序。

脱唾液酸化葡糖脑苷脂酶的制备.将CHO细胞中产生的葡糖脑苷脂酶以2.5mg/mL溶解于50mM Tris-HCl pH 7.4、0.15M NaCl中,并使其与300mU/mL唾液酸酶-琼脂糖缀合物于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并根据Invitrogen的程序运行IEF凝胶和SDS-PAGE。将混合物于10,000rpm离心并收集上清液。将珠子用Tris-EDTA缓冲液洗涤3次,用0.4mL Tris-EDTA缓冲液洗涤一次且用0.2mL Tris-EDTA缓冲液洗涤一次。收集所有上清液。将上清液于4℃对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3透析两次。透析的溶液然后用Centricon Plus 20离心滤器浓缩。反应产物是根据Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。将样品对水进行透析并由MALDI-TOF MS进行分析。

葡糖脑苷脂酶-SA-连接体-甘露糖-6-磷酸的制备(程序1).将上述脱唾液酸化的葡糖脑苷脂酶以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-连接体-Man-6-磷酸和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸-连接体-Man-6-磷酸的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH7.1)的Toso Haas TSK-凝胶-3000分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。当反应结束后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso HaasTSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

葡糖脑苷脂酶-SA-连接体-甘露糖-6-磷酸的制备(程序2).将CHO中产生的但不完全唾液酸化的葡糖脑苷脂酶以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-连接体-Man-6-磷酸和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸-连接体-Man-6-磷酸的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas TSK-凝胶-3000分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。当反应结束后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas TSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

30.葡糖脑苷脂酶-运铁蛋白

本实施例提出了对蛋白质进行糖缀合的程序,特别是将运铁蛋白与葡糖脑苷脂酶进行糖缀合。在葡糖脑苷脂酶上生成了GlcNAc-ASN结构,并用半乳糖基转移酶使运铁蛋白-SA-连接体-Gal-UDP与GDNF的GlcNAc-ASN结构缀合。

GlcNAc-葡糖脑苷脂酶(CerezymeTM)的制备.将CHO细胞中产生的CerezymeTM(葡糖脑苷脂酶)以2.5mg/mL溶解于50mM Tris-HClpH 7.4、0.15M NaCl中,并使其与300mU/mL Endo-H-琼脂糖缀合物于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并根据Invitrogen的程序运行IEF凝胶和SDS-PAGE。将混合物于10,000rpm离心并收集上清液。将珠子用Tris-EDTA缓冲液洗涤3次,用0.4mL Tris-EDTA缓冲液洗涤一次且用0.2mL Tris-EDTA缓冲液洗涤一次,并收集所有上清液。将上清液于4℃对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1MNaCl、0.05%NaN3透析两次。透析的溶液然后用Centricon Plus 20离心滤器浓缩。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。将样品对水进行透析并由MALDI-TOF MS进行分析。

运铁蛋白-SA-连接体-Gal-葡糖脑苷脂酶的制备.将上述的运铁蛋白-SA-连接体-Gal-UDP以2.5mg/mL溶解于50mM Tris-HCl、0.15MNaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与2.5mg/mLGlcNAc-葡糖脑苷脂酶和0.1U/mL半乳糖基转移酶于32℃温育2日。为了监控葡糖脑苷脂酶的整合,将肽在应用PBS缓冲液(pH 7.1)的TosoHaas G3000SW分析型柱上通过凝胶过滤而分离,且产物通过UV吸收而探测。然后将反应混合物用应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

GM-CSF

31.GlcNAc-ASN结构的生成和PEG化:糖酵母属(Saccharomyces)中产生的GM-CSF

本实施例提出了对具有PEG化的GlcNAc-Asn结构的组织型激活物的制备。

酵母中表达的重组GM-CSF预期含有2个N-连接的和2个O-连接的聚糖。N-连接的聚糖应该是分支的甘露糖类型。对该重组糖蛋白用选自内切糖苷酶H、内切糖苷酶-F1、内切糖苷酶-F2、内切糖苷酶-F3、内切糖苷酶-M的内切糖苷酶单独处理或与甘露糖苷酶I、II和III组合处理以在肽/蛋白质主链上的天冬酰胺(Asn)残基上生成GlcNAc结节。

然后肽/蛋白质主链上的GlcNAc-Asn结构可分别用UDP-半乳糖或UDP-半乳糖-6-PEG及半乳糖基转移酶如GalT1进行半乳糖或半乳糖-PEG修饰。在一种情况下,半乳糖-PEG是末端残基。在第二种情况下,半乳糖可进一步用CMP-SA-PEG供体和唾酸转移酶如ST3GalIII以SA-PEG进行修饰。在另一个实施方案中,肽/蛋白质主链上的GlcNAc-Asn结构可如上所述进行半乳糖基化和唾液酸化,然后进一步用CMP-SA-PEG和α2,8-唾酸转移酶进行唾液酸化,如由空肠弯曲杆菌空肠亚种的cst-II基因编码的酶。

HerceptinTM

32.光神霉素与HerceptinTM的糖缀合

本实施例提出了使小分子如光神霉素与哺乳动物细胞中产生的抗体分子的Fc区域聚糖进行糖缀合的程序。在此,应用了抗体HerceptinTM,但本领域的技术人员将理解该方法可应用于许多其他的抗体。

HerceptinTM-Gal-连接体-光神霉素的制备.将HerceptinTM以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与1mM UDP-半乳糖-连接体-光神霉素和0.1U/mL半乳糖基转移酶于32℃温育2日以在Fc区域的聚糖中引入光神霉素。为了监控半乳糖的整合,向反应物的小等份试样添加了14C-半乳糖-UDP配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的TosoHaas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置的放射性探测器进行定量的。

当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.1)的TosoHaas TSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。将含有产物的级分合并、浓缩、交换缓冲液,然后冻干。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

干扰素α和干扰素β

33.哺乳动物或昆虫系统中表达的蛋白质的糖PEG化:EPO、干扰素α和干扰素β

本实施例提出了对表达于哺乳动物和昆虫系统中的PEG化肽的制备。

来自哺乳动物表达系统的受体的制备.用CMP-唾液酸PEG进行糖PEG化的肽需要具有以半乳糖结尾的聚糖。大多数来自哺乳动物表达系统的肽将具有首先需要去除的末端唾液酸。

唾液酸酶消化.将肽用唾液酸酶进行脱唾液酸化。一般的程序包括:使1mg/mL肽溶液在添加了5mM CaCl2的pH 7.2的Tris-缓冲的盐中与0.2U/mL来自霍乱弧菌的固定的唾液酸酶(Calbiochem)于32℃温育24小时。微生物生长可通过无菌过滤或包含0.02%的叠氮化钠而停止。然后通过离心或过滤去除该树脂,并进行洗涤以回收捕获的肽。在这时,可将EDTA添加到溶液中以抑制从树脂中渗漏的任何唾液酸酶。

来自昆虫表达系统的制剂.EPO、干扰素α和干扰素β也可表达于非哺乳动物系统中,如酵母、植物或昆虫细胞中。用CMP-唾液酸PEG进行糖PEG化的肽需要具有以半乳糖结尾的聚糖。大多数表达于昆虫细胞中的肽上的聚糖是例如三甘露糖核心。这些聚糖在成为唾酸转移酶的受体之前首先构建为以半乳糖结尾的聚糖。

从三甘露糖核心构建受体聚糖.使肽(1mg/mL)在含有5mMMnCl2、5mM UDP-GlcNAc、0.05U/mL GLCNACT I、0.05U/mLGLCNACTII的pH 7.2的Tris-缓冲盐中于32℃温育24小时或直到反应基本结束。微生物生长可通过无菌过滤或包含0.02%的叠氮化钠而停止。在交换缓冲液以去除UDP和其他小分子之后,将UDP-半乳糖和MnCl2各自添加至5mM,将半乳糖基转移酶添加至0.05U/mL,并于32℃温育24小时或直到反应基本结束。微生物生长可通过无菌过滤或包含0.02%的叠氮化钠而停止。然后该肽可用于进行糖PEG化。

构建O-连接聚糖.类似的策略可应用于干扰素α以酶促产生想要的O-聚糖Gal-GalNAc。如果需要,可用适当的肽GalNAc转移酶(如GalNAc T1、GalNAc T2、T3、T4等)和UDP-GalNAc将连接到丝氨酸或苏氨酸上的GalNAc添加到肽上。同样地,如果需要,可用半乳糖基转移酶和UDP-半乳糖添加半乳糖。

用唾酸转移酶进行糖PEG化.使Tris缓冲的盐水+0.02%叠氮化钠中的具有末端半乳糖的糖肽(1mg/mL)与CMP-SA-PEG(0.75mM)和0.4U/mL唾酸转移酶(对于EPO和干扰素β上的N-聚糖为ST3Gal3或ST3Gal4;对于干扰素α上的O-聚糖为ST3Gal4或ST3Gal1)于32℃温育24小时。其他可用的转移酶包括来自美人鱼发光杆菌(Photobacterium damsella)的α2,6唾酸转移酶。受体肽浓度最优选地为0.1mg/mL到肽的溶解极限。CMP-SA-PEG的浓度应足以超过可用的位点,但不应该太高而导致肽溶解性问题(PEG造成的),且可为50μM~5mM,且温度可为2℃~40℃。完成反应需要的时间将依赖于温度、酶对受体底物的相对量、供体底物的浓度及pH。

34.CHO细胞中产生的干扰素α的糖PEG化

脱唾液酸化-干扰素α的制备.将从CHO细胞中产生的干扰素α以2.5mg/mL溶解于50mM Tris-HCl pH 7.4、0.15M NaCl、5mM CaCl2中并在Centricon Plus 20离心滤器中浓缩至500μL。使该溶液与300mU/mL神经氨酸酶II(霍乱弧菌)于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并运行IEF凝胶分析。然后将反应混合物添加入预先洗涤的N-(对氨基苯基)草氨酸-琼脂糖缀合物(800μL/mL反应体积),并使洗涤的珠子于4℃轻轻旋转24小时。将混合物于10,000rpm离心并收集上清液。将珠子用Tris-EDTA缓冲液洗涤3次,用0.4mL Tris-EDTA缓冲液洗涤一次且用0.2mL Tris-EDTA缓冲液洗涤一次,并收集所有上清液。将上清液于4℃对50mM Tris-HCl pH7.4、1M NaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1M NaCl、0.05%NaN3透析两次。透析的溶液然后用Centricon Plus 20离心滤器浓缩并贮存于-20℃。IEF凝胶的条件是根据由Invitrogen提供的程序和试剂运行的。将天然的和脱唾液酸化的G-CSF样品对水进行透析并由MALDI-TOF MS进行分析。

干扰素α-(α2,3)-唾液酸-PEG的制备.将脱唾液酸化的干扰素α以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的ST3Gal1于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和脱唾液酸化的干扰素α样品对水进行透析并由MALDI-TOF MS进行分析。

干扰素α-(α2,8)-唾液酸-PEG的制备.将CHO细胞中产生的含有α2,3-唾液酸化的O-连接聚糖的干扰素α以2.5mg/mL溶解于50mMTris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的CST-II于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和PEG化的干扰素α样品对水进行透析并由MALDI-TOF MS进行分析。

干扰素α-(α2,6)-唾液酸-PEG的制备.将仅含有O-连接的GalNAc的干扰素α以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与1mM CMP-唾液酸-PEG和0.1U/mL的ST6GalNAc I或II于32℃温育2日。为了监控唾液酸-PEG的整合,向反应物的小等份试样添加了CMP-SA-PEG-荧光配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的荧光标记是用内置的荧光探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使天然的和PEG化的干扰素α样品对水进行透析并由MALDI-TOF MS进行分析。

35.用PEG(10kDa)和PEG(20kDa)对干扰素-β-1a的糖PEG

本实施例阐明了用PEG(10kDa)或PEG(20kDa)对干扰素-β进行PEG化的程序。

简言之,干扰素-β-1a(INF-β)购自Biogen(AvonexTM)。INF-β首先通过Superdex-75进行纯化。然后INF-β用霍乱弧菌唾液酸酶进行脱唾液酸化。然后INF-β用SA-PEG(10kDa)和SA-PEG(20kDa)进行PEG化,并用Superdex-200进行纯化。

Superdex-75层析纯化.将INF-β(150μg)应用于Superdex-75柱上(Amersham Biosciences,Arlington Heights,IL),并用具有0.5MNaCl、0.02 Tween-20、20mM组氨酸和10%甘油的PBS进行洗脱。监控洗脱液在280nm的吸收(图172A和172B),并收集级分。汇集峰4和5,在Amicon Ultra 15旋转滤器(Millipore,Billerica,MA)上浓缩,并将缓冲液交换为具有0.5M CaCl2、0.02%Tween-20、20mM组氨酸和10%甘油的TBS。

唾液酸酶反应.然后在具有5mM CaCl2、0.02%Tween-20、20mM组氨酸和10%甘油的TBS中的琼脂糖上用霍乱弧菌唾液酸酶(70mU/ml,CALBIOCHEM_,EMD Biosciences,Inc.,San Diego,CA)对INF-β进行脱唾液酸化。反应在32℃进行18小时。用0.22μm Spin-XTM滤器(Corning Technology,Inc.,Norcross,GA)从琼脂糖上获取INF-β。图173A描述了从天然INF-β释放的聚糖的MALDI分析。天然的INF-β具有许多含有末端唾液酸部分的糖形式。图173B描述了从脱唾液酸的INF-β释放的聚糖的MALDI分析。脱唾液酸的INF-β主要具有一种含有末端唾液酸部分的双触角糖形式。

唾液酸化的凝集素斑点印迹分析.将来自脱唾液酸酶反应的INF-β样品斑点印迹在硝化纤维素上,然后用Tris缓冲的盐水(TBS:0.05MTris,0.15M NaCl,pH 7.5)和DIG试剂盒(购自Roche#1 210 238的聚糖区别试剂盒)封闭缓冲液进行封闭。将一些印迹与用洋地黄毒苷(DIG)(Roche Applied Science,Indianapolis,IL)标记的怀槐凝集素(MAA)一起温育,以探测INF-β的α2,3-唾液酸化。将这些印迹用TBS进行洗涤,然后与用碱性磷酸酶标记的抗毛地黄皂苷一起温育,然后再次用TBS洗涤,并用NBT/X-磷酸盐溶液进行显影,其中NBT是4-硝基蓝氯化四氮唑,而X-磷酸盐是5-溴-4-氯-3吲哚磷酸盐。图174的左侧描述了脱唾液酸化反应后INF-β的MAA印迹的结果。INF-β是部分脱唾液酸化的,这通过与脱唾液酸化的样品中的天然INF-β相比,在印迹显影中的减弱所显示。

将其他印迹与用生物素(Vetor Laboratories,Burlingame,CA)标记的Erthrina cristagalli凝集素(ECL)一起温育,以探测在INF-β上暴露的半乳糖残基。在与2.5μg/ml ECL一起温育后,在TBS中洗涤印迹,并使其与用碱性磷酸酶标记的链霉抗生物素蛋白一起温育。然后再次洗涤印迹,并显影。图174的右侧描述了显影后的ECL印迹。与天然INF-β相比脱唾液酸化的INF-β的印记增加的强度显示更多暴露的半乳糖部分,因而显示充分的脱唾液酸化。

用SA-PEG(10kDa)对脱唾液酸化的INF-β的PEG化.在适当的缓冲液中应用ST3Gal3(50mU/ml)和CMP-SA-PEG(10kDa)(250μM)对脱唾液酸化的INF-β(0.05mg/ml)于32℃PEG化50小时,所述缓冲液为TBS+5mM CaCl2、0.02%Tween 20、20mM组氨酸、10%甘油。图175描述了反应产物的SDS-PAGE分析,显示了大约98kDa的PEG化的INF-β。

用SA-PEG(20kDa)对脱唾液酸化的INF-β的PEG化.在适当的缓冲液中应用ST3Gal3(170mU/ml)和CMP-SA-PEG(20kDa)对脱唾液酸化的INF-β(0.5mg/ml)于32℃PEG化50小时,所述缓冲液为TBS+5mM CaCl2、0.02%Tween 20、20mM组氨酸、10%甘油。图176描述了PEG化反应产物的SDS-PAGE分析。PEG化的INF-β具有许多在未修饰的INF-β中未见到的更高分子量的条带,这表明其进行了更充分的PEG化。

用PEG(10kDa)PEG化的INF-β的Superdex-200纯化.PEG化反应产物在Superdex-200柱上(Amersham Biosciences,ArlingtonHeights,IL)进行分离,该柱子应用具有0.5M NaCl、0.02 Tween-20、20mM组氨酸和10%甘油的PBS,流速为1ml/分钟和30cm/小时。监控洗脱液在280nm的吸收(图177),并收集级分。汇集峰3和4,并在Amicon Ultra 15旋转滤器上浓缩。

用PEG(10kDa)PEG化的INF-β的生物测定.

该试验是肺癌细胞系A549增殖的抑制。A549细胞系是在37℃5%CO2生长于RPMI+10%FBS中的肺癌贴壁细胞。它们可从ATCC#CCL-185获得。用10ml PBS洗涤细胞,并去除PBS。添加5ml胰蛋白酶,于室温温育5分钟,或者于37℃温育2分钟。当细胞离壁时,重悬于25ml培养基中并对细胞进行计数。以10000细胞/ml的浓度稀释细胞,并以200μl/孔添加(96孔平板)。在37℃5%CO2温育4小时。以0.1μg/ml的浓度制备1ml INF-β。在通风橱下用0.2μm滤器进行过滤。每孔添加100μl(8次重复=1道)。温育3日(不使细胞会合)。去除200μl培养基(每孔只剩100μl)。添加25μl MTT(Sigma)(5mg/ml,进行了0.22μm过滤)。在37℃和5%CO2温育4小时。轻轻吸出培养基并添加100μl异丙醇(100ml)和6N HCl的混合物。上下抽吸以使结晶紫匀浆。读取570nm的OD(去除在630或690nm的背景)。

图178描述了对从Superdex-200柱洗脱的含有用PEG(10kDa)PEG化的INF-β的峰的生物测定。

用PEG(20kDa)PEG化的INF-β的Superdex-200纯化.PEG(20kDa)PEG化反应产物在Superdex-200柱上(Amersham Biosciences,Arlington Heights,IL)进行分离,该柱子应用具有0.5 NaCl、0.02Tween-20、20mM组氨酸和10%甘油的PBS,流速为1ml/分钟。监控洗脱液在280nm的吸收(图179),并收集级分。峰3含有大部分用PEG(20kDa)PEG化的INF-β。

用PEG(20kDa)PEG化的INF-β的内毒素测试.

进行了鲎裂解物试验,Bio Whittaker#50-647U

表24.用PEG(20kDa)PEG化的INF-β的内毒素试验结果。

  浓度  具有PEG(20kDa)的INF-β  10EU/ml  0.06mg/ml  0.16EU/μg  具有PEG(20kDa)的INF-β  1EU/ml  0.07mg/ml  0.014EU/μg  天然INF-β  40EU/ml  0.1mg/ml  0.4EU/μg

RemicadeTM

36.RemicadeTM抗体的糖PEG化

本实施例提出了通过向Fc区域的聚糖引入PEG分子而对重组抗体分子进行糖PEG化的程序。在此,RemicadeTM,即TNF-R:IgG Fc区域融合蛋白质,是示例性的肽。

RemicadeTM-Gal-PEG(10kDa)的制备.将RemicadeTM以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与1mM UDP-半乳糖-PEG(10kDa)和0.1U/mL半乳糖基转移酶于32℃温育2日以在Fc区域的聚糖中引入PEG。为了监控半乳糖的整合,向反应物的小等份试样添加了14C-半乳糖-UDP配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置的放射性探测器进行定量的。

当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.1)的TosoHaas TSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。将含有产物的级分合并、浓缩、交换缓冲液,然后冻干。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

RituxanTM

37.格尔德霉素与RituxanTM的糖缀合

本实施例提出了使小分子如格尔德霉素与CHO细胞中产生的抗体如RituxanTM的Fc区域聚糖进行糖缀合的程序。在此,应用了抗体RituxanTM,但本领域的技术人员将理解该方法可应用于许多其他的抗体。

RituxanTM-Gal-连接体-格尔德霉素的制备.将RituxanTM以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与1mM UDP-半乳糖-连接体-格尔德霉素和0.1U/mL半乳糖基转移酶于32℃温育2日以在Fc区域的聚糖中引入格尔德霉素。为了监控半乳糖的整合,向反应物的小等份试样添加了14C-半乳糖-UDP配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置的放射性探测器进行定量的。

当反应结束时,将反应混合物用应用PBS缓冲液(pH 7.1)的TosoHaas TSK-凝胶-3000制备型柱进行纯化并基于UV吸收收集级分。将含有产物的级分合并、浓缩、交换缓冲液,然后冻干。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

Rnase

38.将高甘露糖N-聚糖重构为杂合的和复杂的N-聚糖:牛胰RNase

本实施例提出了对具有杂合的或复杂的N-聚糖的牛胰RNase的制备。对RNase的高甘露糖N-连接聚糖进行酶促消化和处理以生成杂合的N-连接聚糖。此外,可对RNase的高甘露糖N-连接聚糖进行酶促消化和处理以生成复杂的N-连接聚糖。

糖肽中N-连接寡糖的高甘露糖结构可用α-甘露糖苷酶和糖基转移酶的组合修饰为杂合的或复杂的形式。本实施例总结了用简单的N-聚糖作为模型底物的这种努力的结果。

从牛胰脏中纯化的核糖核酸酶B(RNaseB)(Sigma)是由124个氨基酸残基组成的糖肽。它具有由高甘露糖结构修饰的单个潜在的N-糖基化位点。由于其简单性和低分子量(13.7kDa~15.5kDa),所以核糖核酸酶B是证明从高甘露糖结构向杂合的或复杂的N-连接寡糖的N-聚糖重构的可能性的良好候选物。RNaseB的MALDI-TOF谱(图180A)与由N-聚糖酶从RNaseB切割的寡糖的HPLC图(图180B)显示:除未修饰的肽的小部分之外,肽的大多数N-糖基化位点均用由5~9个甘露糖残基组成的高甘露糖寡糖进行了修饰。

高甘露糖N-聚糖向杂合的N-聚糖的转变.高甘露糖N-聚糖是用α1,2-甘露糖苷酶、GlcNAcT-I(β-1,2-N-乙酰葡糖胺转移酶)、GalT-I(β1,4-半乳糖基转移酶)和α2,3-唾酸转移酶/或α2,6-唾酸转移酶的组合转变为杂合的N-聚糖的,如图181所示。

作为例子,将RNaseB中的高甘露糖结构成功地转变为杂合的结构。

Man5GlcNAc2-R是用从里氏木霉克隆的单个α1,2-甘露糖苷酶催化Man5-9GlcNAc2-R获得的(图182)。使RNaseB(1g,约67μmol)与15mU重组里氏木霉的α1,2-甘露糖苷酶在MES缓冲液(50mM,pH6.5)在10mL总体积中于30℃温育45小时。Man6-9GlcNAc2-蛋白质结构已成功地用重组甘露糖苷酶高效地转变为Man5GlcNAc2-蛋白质。

可选择地,Man5GlcNAc2-R是用从Aspergillus saitoi纯化的单个α1,2-甘露糖苷酶催化Man5-9GlcNAc2-R获得的(图183)。使RNaseB(40μg,约2.7nmol)与25μU商业A.saitoi的α1,2-甘露糖苷酶(Glyko或CalBioChem)在NaOAC缓冲液(100mM,pH 5.0)在20μL总体积中于37℃温育42.5小时。Man6-9GlcNAc2-蛋白质结构已成功地用商业上可购得的甘露糖苷酶转变为Man5GlcNAc2-蛋白质。然而,在谱中出现了相应于GlcNAc-蛋白质的新峰,从而显示制剂中可能的内切糖苷酶H的污染。尽管需要几种哺乳动物α-甘露糖苷酶以实现该步骤,但真菌α1,2-甘露糖苷酶对于去除所有α1,2-连接的甘露糖残基是非常有效的。

然后GlcNAcT-I将GlcNAc残基添加到Man5GlcNAc2-R中(图184)。在里氏木霉的α1,2-甘露糖苷酶反应后使含有RNaseB(600μg,约40nmol)的反应混合物与非纯化的重组GlcNAcT-I(34mU)在MES缓冲液(50mM,pH 6.5)中在400μL的总体积中于37℃温育42小时,该MES缓冲液含有MnCl2(20mM)和UDP-GlcNAc(5mM)。GlcNAc残基是由重组GlcNAcT-I定量地添加到Man5GlcNAc2-蛋白质中的。

然后用GalT 1添加Gal残基(图185)。在GnT-I反应后使含有RNaseB(120μg,约8nmol)的反应混合物与3.3mU重组GalT-1在Tris-HCl缓冲液(100mM,pH 7.3)中在100μL的总体积中于37℃温育20小时,该Tris-HCl缓冲液含有UDP-Gal(7.5mM)和MnCl2(20mM)。Gal残基是由重组GalT 1添加到约98%的GlcNAc-Man5GlcNAc2-蛋白质中的。

下一个步骤是用α2,3-唾酸转移酶或α2,6-唾酸转移酶添加唾液酸(图186)。作为例子,应用ST3GalIII,即一种α2,3-唾酸转移酶。在GalT-1反应后使含有RNaseB(13μg,约0.87nmol)的反应混合物与8.9mU重组ST3GalIII在Tris-HCl缓冲液(100mM,pH 7.3)中在20μL的总体积中于37℃温育16小时,该Tris-HCl缓冲液含有CMP-唾液酸(5mM)和MnCl2(20mM)。唾液酸残基是由重组ST3GalIII用CMP-SA作为供体添加到约90%的Gal-GlcNAc-Man5GlcNAc2-蛋白质中的。该产量可进一步通过调节反应条件而改善。

为方便起见,在上述每一个反应之后不需要纯化或透析。更有趣的是,GnT-I和ST3GalIII可组合在一个(one pot)反应中。与分离的反应相比可获得类似的产量。在GlcNAcT-I反应后使含有RNaseB(60μg,约4nmol)的反应混合物与1.7mU重组GalT 1、9.8mU重组ST3GalIII在Tris-HCl缓冲液(100mM,pH 7.3)中在60μL的总体积中于37℃温育20小时,该Tris-HCl缓冲液含有UDP-Gal(7.5mM)、CMP-唾液酸(5mM)和MnCl2(20mM)。

如图187所示,将SA-PEG(10kDa)成功地添加到RNaseB中。在GalT-1反应后使含有RNaseB(6.7μg,约0.45nmol)的反应混合物在室温对H2O透析1小时,并与55mU重组ST3GalIII在Tris-HCl缓冲液(50mM,pH 7.3)中在20μL的总体积中于37℃温育15.5小时,该Tris-HCl缓冲液含有CMP-SA-PEG(10kDa)(0.25mM)和MnCl2(20mM)。PEG-修饰的唾液酸残基是由重组ST3GalIII成功添加到Gal-GlcNAc-Man5GlcNAc2-肽中的。该产量可进一步通过调节反应条件而改善。

高甘露糖N-聚糖向复杂N-聚糖的转变.为了实现该转变,获得了GlcNAcβ1,2Man3GlcNAc2-肽中间物。如图188所示,至少有4个可行的路线可实现从Man5GlcNAc2-肽向该中间物的反应:

路线I:由真菌α1,2甘露糖苷酶产生的Man5GlcNAc2-肽是添加一个GlcNAc的GlcNAc转移酶I(GlcNAcT-I,酶2)的底物。GlcNAcMan5GlcNAc2-肽的末端α1,3-和α1,6-连接的甘露糖残基可由高尔基体α甘露糖苷酶II(ManII,酶5)去除。该路线是高等生物中进行的加工N-连接寡糖的天然途径的一部分。

路线II:首先用α甘露糖苷酶(酶6)去除2个甘露糖残基,然后用GlcNAcT-I(酶2)添加GlcNAc。除其天然受体Man5GlcNAc2-R之外,GlcNAcT-I也可识别Man3GlcNAc2-R作为其底物并将一个GlcNAc添加到甘露糖核心结构上以形成GlcNAcMan3GlcNAc2-肽。

路线III:α1,6-连接的甘露糖是由α1,6-甘露糖苷酶去除的,随后由GlcNAcT-I添加GlcNAc及由α1,3-甘露糖苷酶去除末端α1,3-连接的甘露糖。从获得的实验数据看,GlcNAcT-I可识别该Man4GlcNAc2-肽作为受体并添加一个GlcNAc残基以形成GlcNAcMan4GlcNAc2-肽。

路线IV:与路线III相似,α1,3-连接的甘露糖是由α1,3-甘露糖苷酶去除的,随后为GlcNAcT-I反应。然后末端α1,6-连接的甘露糖可由α1,6-甘露糖苷酶去除。

在GlcNAcT-I(负责在甘露糖核心上添加与α1,3-甘露糖β1,2连接的GlcNAc)和GlcNAcT-II(负责在甘露糖核心上添加第二个与α1,6-甘露糖β1,2连接的GlcNAc)作用之后,GlcNAc2Man3GlcNAc2-肽可由GalT 1和唾酸转移酶进行加工以形成双触角的复杂N-聚糖。其他GlcNAc转移酶如GlcNAcT-IV、GlcNAcT-V和/或GlcNAcT-IV(图188和图189)也可对GlcNAc2Man3GlcNAc2-肽进行糖基化。由GalT 1和唾酸转移酶进行的额外的糖基化将形成多触角的复杂N-聚糖。酶GlcNAcT-III催化等分的GlcNAc的插入,从而阻止了ManII的作用和随后转移酶GlcNAcT-II、GlcNAcT-IV和GlcNAcT-V的作用。

组织型纤溶酶原激活物(TPA)

39.对TPA进行岩藻糖基化以生成唾液酸化Lewis X

本实施例提出了带有N-连接的唾液酸化Lewis X抗原的组织型纤溶酶原激活物(TPA)的制备。

唾液酸化.在哺乳动物细胞中表达的TPA常常含有大多数以唾液酸结尾的聚糖,但为了确保完全的唾液酸化,首先进行体外唾液酸化是有利的。使在适当缓冲液(最优选地在pH 5.5~9,例如Tris缓冲的盐,pH7.2)中的TPA与CMP唾液酸和唾酸转移酶温育足够的时间,以将任何缺乏唾液酸的聚糖转变为唾液酸化的种类。一般的条件为1mg/mL TPA、3mM CMP唾液酸、0.02U/mL ST3Gal3,32℃进行24小时。微生物生长可通过无菌过滤或包含0.02%的叠氮化钠而抑制。TPA浓度最优选地为0.1mg/mL到肽的溶解极限。CMP-SA的浓度应足以超过可用的位点,且可在50μM~50mM,且温度为2℃~40℃。完成反应所需要的时间将依赖于温度、酶对受体底物的相对量、供体底物的浓度及pH。能够以2,3键添加唾液酸的其他唾酸转移酶包括ST3Gal4;也可应用微生物转移酶。

岩藻糖基化.岩藻糖基化的一般条件为1mg/mL TPA、3mM GDP-岩藻糖、0.02U/mL FTVI、5mM MnCl2,在Tris缓冲的盐中于32℃进行24小时。微生物生长可通过无菌过滤或包含0.02%的叠氮化钠而抑制。TPA浓度最优选地为0.1mg/mL到肽的溶解极限。GDP-岩藻糖的浓度应足以超过可用的位点,且可在50μM~50mM,且温度为2℃~40℃。完成反应所需要的时间将依赖于温度、酶对受体底物的相对量、供体底物的浓度及pH。能够制备唾液酸化的Lewis X的其他岩藻糖基转移酶包括FTVII、FTV、FTIII,也可应用微生物转移酶。

40.修剪高甘露糖为三甘露糖核心结构:CHO中产生的组织型纤溶酶原激活物。

本实施例提出了通过修剪高甘露糖聚糖而制备具有三甘露糖核心的组织型纤溶酶原激活物。

组织型纤溶酶原激活物(TPA)的制备目前在中国仓鼠卵巢(CHO)细胞中生产且含有低量的高甘露糖N-连接的寡糖。该甘露糖可用各种特定的甘露糖苷酶修剪。第一个步骤是从Man9GlcNAc2(Fuc0-1)生成Man5GlcNAc2(Fuc0-1)。这可用甘露糖苷酶I进行。然后将GlcNAcT1(GlcNAc转移酶I)用于制备GlcNAc1Man5GlcNAc2(Fuc0-1)或将甘露糖苷酶III用于制备Man3GlcNAc2(Fuc0-1)。GlcNAc1Man3GlcNAc2(Fuc0-1)可用GlcNAcT1从Man3GlcNAc2(Fuc0-1)制备,或者GlcNAc1Man3GlcNAc2(Fuc0-1)可用甘露糖苷酶II从GlcNAc1Man5GlcNAc2(Fuc0-1)制备。然后用GlcNAc转移酶II(GlcNAcTII)将GlcNAc1Man3GlcNAc2(Fuc0-1)转变为GlcNAc2Man3GlcNAc2(Fuc0-1)。两个末端GlcNAc残基然后可用GalT I进行半乳糖基化,并然后用ST3GalIII以SA-PEG进行唾液酸化。

相反地,TPA可在酵母或真菌系统中产生。对于真菌衍生的材料将需要类似的过程。

41.GlcNAc-ASN结构的生成和PEG化:酵母中产生的TPA

本实施例提出了对肽如酵母中表达的TPA上PEG化的GlcNAc-Asn结构的制备。

酵母表达能够得到含有单个N-连接的甘露糖型结构的TPA。对该重组糖蛋白首先用内切糖苷酶H处理以在肽上的天冬酰胺(Asn)残基上生成GlcNAc结构。

然后肽/蛋白质主链上的GlcNAc-Asn结构分别用UDP-半乳糖或UDP-半乳糖-6-PEG及半乳糖基转移酶如GalT1进行半乳糖或半乳糖-PEG修饰。在一种情况下,半乳糖-PEG是末端残基。在第二种情况下,半乳糖可进一步用CMP-SA-PEG供体和唾酸转移酶如S][3GalIII以SA-PEG进行修饰。在另一个实施方案中,肽/蛋白质主链上的GlcNAc-Asn结构可如上所述进行半乳糖基化和唾液酸化,然后进一步用CMP-SA-PEG和α2,8-唾酸转移酶进行唾液酸化,如由空肠弯曲杆菌空肠亚种的cst-II基因编码的酶。

运铁蛋白

42.运铁蛋白的糖PEG化

本实施例提出了对脱唾液酸化运铁蛋白的制备及用PEG-CMP-唾液酸进行的唾液酸化。

脱唾液酸化运铁蛋白的制备.将人源的完整运铁蛋白(10mg)溶解于500μL的50mM NaOAc、5mM CaCl2,pH 5.5中。向该溶液中加入500mU神经氨酸酶II(霍乱弧菌),并将反应混合物于37℃轻轻摇动20.5小时。将反应混合物加入到预先洗涤的N-(对氨基苯基)草氨酸-琼脂糖缀合物(600μL)中,并将洗涤的珠子于4℃轻轻旋转24小时。将混合物于10,000rpm离心并收集上清液。通过向洗过的珠子加上100μl的30mM EDTA,从而将反应混合物调节为5mM EDTA,该珠子然后在4℃轻轻旋转20小时。将悬浮液在10,000rpm离心2分钟,并收集上清液。将珠子用0.35mL的50mM NaOAc、5mM CaCl2、5mM EDTA,pH 5.5洗涤5次并收集所有上清液。将酶溶液于4℃两次透析于15mMTris-HCl、1M NaCl,pH 7.4中。获取0.3mL运铁蛋白溶液(总共3.3mL)并对水透析两次。将剩余物再次于4℃对磷酸盐缓冲盐水透析两次。将透析的溶液贮存于-20℃。蛋白质样品是由IEF电泳分析的。将样品(9μL,25μg)用16μLTris缓冲液稀释并与25μL样品加样缓冲液混合,并应用于Isoelectric Focusing Gels(pH 3-7)。凝胶是用标准程序运行和固定的。凝胶用Colloidal Blue Stain染色。

脱唾液酸化运铁蛋白的唾液酸-PEG化.将脱唾液酸化的运铁蛋白(250μg)和CMP-唾液酸或CMP-SA-PEG(1kDa或10kDa)(0.05μmol)于1.5mL塑料试管中溶解于69μL的50mM Tris-HCl、0.15MNaCl、0.05%NaN3,pH 7.2中。将试管简单地涡旋并添加100mUST3Gal3(90μL)(250μL总体积)。对试管再次进行涡旋,并轻轻于32℃混合24小时。该反应通过于-80℃冷冻而停止。将Novex Tris-甘氨酸8-16%1mm凝胶用于SDS-PAGE分析(图190)。将样品(25μL,25μg)与25μL样品加样缓冲液和0.4μLβ-巯基乙醇混合并于85℃加热6分钟。凝胶是用标准条件运行的并用Colloidal Blue Stain染色。IEF凝胶也如上所述进行(图191)。样品也对水进行透析并由MALDI-TOF进行分析。

结果.也进行了MALDI。天然的运铁蛋白(78729);脱唾液酸化运铁蛋白(78197);再次唾液酸化的运铁蛋白(79626/80703);具有SA-PEG 1k(79037(1);80961(2);82535(3);84778(4));具有SA-PEG 5k(90003(2);96117(3);96117(4));具有SA-PEG 10k(100336(2);111421(3);122510(4))。

43.运铁蛋白-GDNF

本实施例提出了对蛋白质进行糖缀合的程序,特别是将运铁蛋白与GDNF进行糖缀合。运铁蛋白-SA-连接体-Gal-UDP是从运铁蛋白制备的。将半乳糖残基从GDNF聚糖中去除,并用半乳糖基转移酶使运铁蛋白-SA-连接体-Gal-UDP与GDNF聚糖缀合。

脱半乳糖化(agalacto)-GDNF的制备.将NSO细胞(NSO鼠骨髓瘤细胞)中产生的GDNF以2.5mg/mL溶解于50mM Tris-HCl pH 7.4、0.15M NaCl中,并使其与300mU/mLβ-半乳糖苷酶-琼脂糖缀合物于32℃温育16小时。为了监控反应,将反应物的小等份试样用适当的缓冲液稀释并根据Invitrogen的程序运行IEF凝胶分析。将混合物于10,000rpm离心并收集上清液。将上清液于4℃对50mM Tris-HCl pH 7.4、1MNaCl、0.05%NaN3进行透析,然后再对50mM Tris-HCl pH 7.4、1MNaCl、0.05%NaN3透析两次。透析的溶液然后用Centricon Plus 20离心滤器浓缩并贮存于-20℃。IEF凝胶的条件是根据Invitrogen提供的程序和试剂运行的。将样品对水进行透析并由MALDI-TOF MS进行分析。

运铁蛋白-SA-连接体-Gal-UDP的制备.将脱唾液酸化的运铁蛋白以2.5mg/mL溶解于50mM Tris-HCl、0.15M NaCl、0.05%NaN3,pH 7.2中。使该溶液与CMP-唾液酸-连接体-Gal-UDP(摩尔总计为使1摩尔等价的核苷酸糖添加到运铁蛋白上)和0.1U/mL的ST3Gal3于32℃温育2日。为了监控唾液酸的整合,向反应物的小等份试样添加了14C-SA-UDP配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置的放射性探测器进行定量的。

使该溶液与5mM CMP-唾液酸和0.1U/mL的ST3Gal3(以对任何未反应的运铁蛋白聚糖进行加帽)于32℃温育2日。向肽中的整合是用内置的UV探测器进行定量的。2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

运铁蛋白-SA-连接体-Gal-GDNF的制备.将上述制备的运铁蛋白-SA-连接体-Gal-UDP以2.5mg/mL溶解于50mM Tris-HCl、0.15MNaCl、5mM MnCl2、0.05%NaN3,pH 7.2中。使该溶液与2.5mg/mL脱半乳糖化-GDNF和0.1U/mL半乳糖基转移酶于32℃温育2日。为了监控半乳糖的整合,向反应物的小等份试样添加了14C-半乳糖-UDP配体;整合入肽中的标记是在应用PBS缓冲液(pH 7.1)的Toso HaasG3000SW分析型柱上通过凝胶过滤而与游离标记分离的。整合入肽中的放射性标记是用内置的放射性探测器进行定量的。

当反应结束时,使该溶液与5mM UDP-Gal和0.1U/mL半乳糖基转移酶(以对任何未反应的运铁蛋白聚糖进行加帽)于32℃温育2日,随后添加5mM CMP-SA和0.1U/mL的ST3Gal3。在额外的2日后,将反应混合物用应用PBS缓冲液(pH 7.1)的Toso Haas G3000SW制备型柱进行纯化并基于UV吸收收集级分。反应产物是根据由Invitrogen提供的程序和试剂用SDS-PAGE和IEF分析进行分析的。使样品对水进行透析并由MALDI-TOF MS进行分析。

在此处引用的每一个和全部专利、专利申请和出版物的公开内容均在此处整体引入作为参考。

尽管本发明用某些特定的实施方案进行了公开,但显而易见的是可由本领域的技术人员设计本发明的其他实施方案和修改方案而不背离本发明的真正精神和范围。附加的权利要求应解释为包括所有这种实施方案和等价的修改方案。

                              序列表

<110>Neose Technologies,Inc.

     DeFrees,Shawn

     Zopf,David

     Bayer,Robert

     Hakes,David

     Chen,Xi

     Bowe,Caryne

<120>促红细胞生成素:促红细胞生成素的重构和糖缀合

<130>040853-01-5083W0

<150>PCT/US02/32263

<151>2002-10-09

<150>US 10/287,994

<151>2002-11-5

<150>US 10/360,770

<151>2003-01-06

<150>US 10/369,779

<151>2003-03-17

<150>US 10/410,945

<151>2003-04-09

<160>75

<170>PatentIn version 3.2

<210>1

<211>525

<212>DNA

<213>智人

<400>1

acccccctgg gccctgccag ctccctgccc cagagcttcc tgctcaagtg cttagagcaa   60

gtgaggaaga tccagggcga tggcgcagcg ctccaggaga agctgtgtgc cacctacaag  120

ctgtgccacc ccgaggagct ggtgctgctc ggacactctc tgggcatccc ctgggctccc  180

ctgagcagct gccccagcca ggccctgcag ctggcaggct gcttgagcca actccatagc  240

ggccttttcc tctaccaggg gctcctgcag gccctggaag ggatctcccc cgagttgggt  300

cccaccttgg acacactgca gctggacgtc gccgactttg ccaccaccat ctggcagcag  360

atggaagaac tgggaatggc ccctgccctg cagcccaccc agggtgccat gccggccttc  420

gcctctgctt tccagcgccg ggcaggaggg gtcctggttg cctcccatct gcagagcttc 480

ctggaggtgt cgtaccgcgt tctacgccac cttgcccagc cctga                 525

<210>2

<211>174

<212>PRT

<213>智人

<400>2

Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Lys

1               5                   10                  15

Cys Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln

            20                  25                  30

Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val

        35                  40                  45

Leu Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys

    50                  55                  60

Pro Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Set Gln Leu His Ser

65                  70                  75                  80

Gly Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser

                85                  90                  95

Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp

            100                 105                 110

Phe Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro

        115                 120                 125

Ala Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe

    130                 135                 140

Gln Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe

145                 150                 155                 160

Leu Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro

                165                 170

<210>3

<211>1733

<212>DNA

<213>智人

<400>3

gcgcctctta tgtacccaca aaaatctatt ttcaaaaaag ttgctctaag aatatagtta   60

tcaagttaag taaaatgtca atagcctttt aatttaattt ttaattgttt tatcattctt  120

tgcaataata aaacattaac tttatacttt ttaatttaat gtatagaata gagatataca    180

taggatatgt aaatagatac acagtgtata tgtgattaaa atataatggg agattcaatc    240

agaaaaaagt ttctaaaaag gctctggggt aaaagaggaa ggaaacaata atgaaaaaaa    300

tgtggtgaga aaaacagctg aaaacccatg taaagagtgt ataaagaaag caaaaagaga    360

agtagaaagt aacacagggg catttggaaa atgtaaacga gtatgttccc tatttaaggc    420

taggcacaaa gcaaggtctt cagagaacct ggagcctaag gtttaggctc acccatttca    480

accagtctag cagcatctgc aacatctaca atggccttga cctttgcttt actggtggcc    540

ctcctggtgc tcagctgcaa gtcaagctgc tctgtgggct gtgatctgcc tcaaacccac    600

agcctgggta gcaggaggac cttgatgctc ctggcacaga tgaggagaat ctctcttttc    660

tcctgcttga aggacagaca tgactttgga tttccccagg aggagtttgg caaccagttc    720

caaaaggctg aaaccatccc tgtcctccat gagatgatcc agcagatctt caatctcttc    780

agcacaaagg actcatctgc tgcttgggat gagaccctcc tagacaaatt ctacactgaa    840

ctctaccagc agctgaatga cctggaagcc tgtgtgatac agggggtggg ggtgacagag    900

actcccctga tgaaggagga ctccattctg gctgtgagga aatacttcca aagaatcact    960

ctctatctga aagagaagaa atacagccct tgtgcctggg aggttgtcag agcagaaatc   1020

atgagatctt tttctttgtc aacaaacttg caagaaagtt taagaagtaa ggaatgaaaa   1080

ctggttcaac atggaaatga ttttcattga ttcgtatgcc agctcacctt tttatgatct   1140

gccatttcaa agactcatgt ttctgctatg accatgacac gatttaaatc ttttcaaatg   1200

tttttaggag tattaatcaa cattgtattc agctcttaag gcactagtcc cttacagagg   1260

accatgctga ctgatccatt atctatttaa atatttttaa aatattattt atttaactat   1320

ttataaaaca acttattttt gttcatatta tgtcatgtgc acctttgcac agtggttaat   1380

gtaataaaat gtgttctttg tatttggtaa atttattttg tgttgttcat tgaacttttg   1440

ctatggaact tttgtacttg tttattcttt aaaatgaaat tccaagccta attgtgcaac   1500

ctgattacag aataactggt acacttcatt tgtccatcaa tattatattc aagatataag   1560

taaaaataaa ctttctgtaa accaagttgt atgttgtact caagataaca gggtgaacct   1620

aacaaataca attctgctct cttgtgtatt tgatttttgt atgaaaaaaa ctaaaaatgg   1680

taatcatact taattatcag ttatggtaaa tggtatgaag agaagaagga acg          1733

<210>4

<211>188

<212>PRT

<213>智人

<400>4

Met Ala Leu Thr Phe Ala Leu Leu Val Ala Leu Leu Val Leu Ser Cys

1               5                   10                  15

Lys Ser Ser Cys Ser Val Gly Cys Asp Leu Pro Gln Thr His Ser Leu

            20                  25                  30

Gly Ser Arg Arg Thr Leu Met Leu Leu Ala Gln Met Arg Arg Ile Ser

        35                  40                  45

Leu Phe Ser Cys Leu Lys Asp Arg His Asp Phe Gly Phe Pro Gln Glu

    50                  55                  60

Glu Phe Gly Asn Gln Phe Gln Lys Ala Glu Thr Ile Pro Val Leu His

65                  70                  75                  80

Glu Met Ile Gln Gln Ile Phe Asn Leu Phe Ser Thr Lys Asp Ser Set

                85                  90                  95

Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr

            100                 105                 110

Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Ile Gln Gly Val Gly Val

        115                 120                 125

Thr Glu Thr Pro Leu Met Lys Glu Asp Ser Ile Leu Ala Val Arg Lys

    130                 135                 140

Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro

145                 150                 155                 160

Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser Leu

                165                 170                 175

Ser Thr Asn Leu Gln Glu Ser Leu Arg Ser Lys Glu

            180                 185

<210>5

<211>757

<212>DNA

<213>智人

<400>5

atgaccaaca agtgtctcct ccaaattgct ctcctgttgt gcttctccac tacagctctt   60

tccatgagct acaacttgct tggattccta caaagaagca gcaattttca gtgtcagaag  120

ctcctgtggc aattgaatgg gaggcttgaa tattgcctca aggacaggat gaactttgac  180

atccctgagg agattaagca gctgcagcag ttccagaagg aggacgccgc attgaccatc  240

tatgagatgc tccagaacat ctttgctatt ttcagacaag attcatctag cactggctgg  300

aatgagacta ttgttgagaa cctcctggct aatgtctatc atcagataaa ccatctgaag  360

acagtcctgg aagaaaaact ggagaaagaa gattttacca ggggaaaact catgagcagt  420

ctgcacctga aaagatatta tgggaggatt ctgcattacc tgaaggccaa ggagtacagt  480

cactgtgcct ggaccatagt cagagtggaa atcctaagga acttttactt cattaacaga  540

cttacaggtt acctccgaaa ctgaagatct cctagcctgt ccctctggga ctggacaatt  600

gcttcaagca ttcttcaacc agcagatgct gtttaagtga ctgatggcta atgtactgca  660

aatgaaagga cactagaaga ttttgaaatt tttattaaat tatgagttat ttttatttat  720

ttaaatttta ttttggaaaa taaattattt ttggtgc                           757

<210>6

<211>187

<212>PRT

<213>智人

<400>6

Met Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser

1               5                   10                  15

Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg

            20                  25                  30

Ser Ser Asn Phe Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg

        35                  40                  45

Leu Glu Tyr Cys Leu Lys Asp Arg Met Asn Phe Asp Ile Pro Glu Glu

    50                  55                  60

Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Leu Thr Ile

65                  70                  75                  80

Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser

                85                  90                  95

Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val

            100                 105                 110

Tyr His Gln Ile Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu

        115                 120                 125

Lys Glu Asp Phe Thr Arg Gly Lys Leu Met Ser Ser Leu His Leu Lys

    130                 135                 140

Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Tyr Ser

145                 150                 155                 160

His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr

                165                 170                 175

Phe Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn

            180                 185

<210>7

<211>1332

<212>DNA

<213>智人

<400>7

atggtctccc aggccctcag gctcctctgc cttctgcttg ggcttcaggg ctgcctggct   60

gcagtcttcg taacccagga ggaagcccac ggcgtcctgc accggcgccg gcgcgccaac  120

gcgttcctgg aggagctgcg gccgggctcc ctggagaggg agtgcaagga ggagcagtgc  180

tccttcgagg aggcccggga gatcttcaag gacgcggaga ggacgaagct gttctggatt  240

tcttacagtg atggggacca gtgtgcctca agtccatgcc agaatggggg ctcctgcaag  300

gaccagctcc agtcctatat ctgcttctgc ctccctgcct tcgagggccg gaactgtgag  360

acgcacaagg atgaccagct gatctgtgtg aacgagaacg gcggctgtga gcagtactgc  420

agtgaccaca cgggcaccaa gcgctcctgt cggtgccacg aggggtactc tctgctggca  480

gacggggtgt cctgcacacc cacagttgaa tatccatgtg gaaaaatacc tattctagaa  540

aaaagaaatg ccagcaaacc ccaaggccga attgtggggg gcaaggtgtg ccccaaaggg  600

gagtgtccat ggcaggtcct gttgttggtg aatggagctc agttgtgtgg ggggaccctg  660

atcaacacca tctgggtggt ctccgcggcc cactgtttcg acaaaatcaa gaactggagg  720

aacctgatcg cggtgctggg cgagcacgac ctcagcgagc acgacgggga tgagcagagc  780

cggcgggtgg cgcaggtcat catccccagc acgtacgtcc cgggcaccac caaccacgac  840

atcgcgctgc tccgcctgca ccagcccgtg gtcctcactg accatgtggt gcccctctgc  900

ctgcccgaac ggacgttctc tgagaggacg ctggccttcg tgcgcttctc attggtcagc  960

ggctggggcc agctgctgga ccgtggcgcc acggccctgg agctcatggt gctcaacgtg 1020

ccccggctga tgacccagga ctgcctgcag cagtcacgga aggtgggaga ctccccaaat 1080

atcacggagt acatgttctg tgccggctac tcggatggca gcaaggactc ctgcaagggg  1140

gacagtggag gcccacatgc cacccactac cggggcacgt ggtacctgac gggcatcgtc  1200

agctggggcc agggctgcgc aaccgtgggc cactttgggg tgtacaccag ggtctcccag  1260

tacatcgagt ggctgcaaaa gctcatgcgc tcagagccac gcccaggagt cctcctgcga  1320

gccccatttc cc                                                      1332

<210>8

<211>444

<212>PRT

<213>智人

<400>8

Met Val Ser Gln Ala Leu Arg Leu Leu Cys Leu Leu Leu Gly Leu Gln

1               5                   10                  15

Gly Cys Leu Ala Ala Val Phe Val Thr Gln Glu Glu Ala His Gly Val

            20                  25                  30

Leu His Arg Arg Arg Arg Ala Asn Ala Phe Leu Glu Glu Leu Arg Pro

        35                  40                  45

Gly Ser Leu Glu Arg Glu Cys Lys Glu Glu Gln Cys Ser Phe Glu Glu

    50                  55                  60

Ala Arg Glu Ile Phe Lys Asp Ala Glu Arg Thr Lys Leu Phe Trp Ile

65                  70                  75                  80

Ser Tyr Ser Asp Gly Asp Gln Cys Ala Ser Ser Pro Cys Gln Asn Gly

                85                  90                  95

Gly Ser Cys Lys Asp Gln Leu Gln Ser Tyr Ile Cys Phe Cys Leu Pro

            100                 105                 110

Ala Phe Glu Gly Arg Asn Cys Glu Thr His Lys Asp Asp Gln Leu Ile

        115                 120                 125

Cys Val Asn Glu Asn Gly Gly Cys Glu Gln Tyr Cys Ser Asp His Thr

    130                 135                 140

Gly Thr Lys Arg Ser Cys Arg Cys His Glu Gly Tyr Ser Leu Leu Ala

145                 150                 155                 160

Asp Gly Val Ser Cys Thr Pro Thr Val Glu Tyr Pro Cys Gly Lys Ile

                165                 170                 175

Pro Ile Leu Glu Lys Arg Asn Ala Ser Lys Pro Gln Gly Arg Ile Val

            180                 185                 190

Gly Gly Lys Val Cys Pro Lys Gly Glu Cys Pro Trp Gln Val Leu Leu

        195                 200                 205

Leu Val Asn Gly Ala Gln Leu Cys Gly Gly Thr Leu Ile Ash Thr Ile

    210                 215                 220

Trp Val Val Ser Ala Ala His Cys Phe Asp Lys Ile Lys Ash Trp Arg

225                 230                 235                 240

Asn Leu Ile Ala Val Leu Gly Glu His Asp Leu Ser Glu His Asp Gly

                245                 250                 255

Asp Glu Gln Ser Arg Arg Val Ala Gln Val Ile Ile Pro Ser Thr Tyr

            260                 265                 270

Val Pro Gly Thr Thr Asn His Asp Ile Ala Leu Leu Arg Leu His Gln

        275                 280                 285

Pro Val Val Leu Thr Asp His Val Val Pro Leu Cys Leu Pro Glu Arg

    290                 295                 300

Thr Phe Ser Glu Arg Thr Leu Ala Phe Val Arg Phe Ser Leu Val Ser

305                 310                 315                 320

Gly Trp Gly Gln Leu Leu Asp Arg Gly Ala Thr Ala Leu Glu Leu Met

                325                 330                 335

Val Leu Ash Val Pro Arg Leu Met Thr Gln Asp Cys Leu Gln Gln Ser

            340                 345                 350

Arg Lys Val Gly Asp Ser Pro Asn Ile Thr Glu Tyr Met Phe Cys Ala

        355                 360                 365

Gly Tyr Ser Asp Gly Ser Lys Asp Set Cys Lys Gly Asp Ser Gly Gly

    370                 375                 380

Pro His Ala Thr His Tyr Arg Gly Thr Trp Tyr Leu Thr Gly Ile Val

385                 390                 395                 400

Ser Trp Gly Gln Gly Cys Ala Thr Val Gly His Phe Gly Val Tyr Thr

                405                 410                 415

Arg Val Ser Gln Tyr Ile Glu Trp Leu Gln Lys Leu Met Arg Ser Glu

            420                 425                 430

Pro Arg Pro Gly Val Leu Leu Arg Ala Pro Phe Pro

        435                 440

<210>9

<211>1437

<212>DNA

<213>智人

<400>9

atgcagcgcg tgaacatgat eatggcagaa tcaccaagcc tcatcaccat ctgcctttta   60

ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt  120

ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt  180

gagagagaat gtatggaaga aaagtgtagt tttgaagaac cacgagaagt ttttgaaaac  240

actgaaaaga caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat  300

ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc  360

tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga  420

tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga  480

tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga  540

gtttctgttt cacaaacttc taagctcacc cgtgctgagg ctgtttttcc tgatgtggac  600

tatgtaaatc ctactgaagc tgaaaccatt ttggataaca tcactcaagg cacccaatca  660

tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg  720

caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa  780

tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt  840

gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgagcaatt  900

attcctcacc acaactacaa tgcagctatt aataagtaca accatgacat tgcccttctg  960

gaactggacg aacccttagt gctaaacagc tacgttacac ctatttgcat tgctgacaag 1020

gaatacacga acatcttcct caaatttgga tctggctatg taagtggctg ggcaagagtc 1080

tccacaaag ggagatcagc tttagttctt cagtacctta gagttccact tgttgaccga  1140

gccacatgtc ttcgatctac aaagttcacc atctataaca acatgttctg tgctggcttc 1200

catgaaggag gtagagattc atgtcaagga gatagtgggg gaccccatgt tactgaagtg 1260

gaagggacca gtttcttaac tggaattatt agctggggtg aagagtgtgc aatgaaaggc 1320

aaatatggaa tatataccaa ggtatcccgg tatgtcaact ggattaagga aaaaacaaag 1380

ctcacttaat gaaagatgga tttccaaggt taattcattg gaattgaaaa ttaacag    1437

<210>10

<211>462

<212>PRT

<213>智人

<400>10

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Ser Leu Ile Thr

1               5                   10                  15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

            20                  25                  30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

        35                  40                  45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

    50                  55                  60

Met Glu Glu Lys Cys Ser Phe Glu Glu Pro Arg Glu Val Phe Glu Asn

65                  70                  75                  80

Thr Glu Lys Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

                85                  90                  95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

            100                 105                 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

        115                 120                 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

    130                 135                 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145                 150                 155                 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

                165                 170                 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

            180                 185                 190

Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Pro Thr Glu Ala Glu

        195                 200                 205

Thr Ile Leu Asp Asn Ile Thr Gln Gly Thr Gln Ser Phe Asn Asp Phe

    210                 215                 220

Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp

225                 230                 235                 240

Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile

                245                 250                 255

Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly

            260                 265                 270

Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu

        275                 280                 285

His Thr Glu Gln Lys Arg Asn Val Ile Arg Ala Ile Ile Pro His His

    290                 295                 300

Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu

305                 310                 315                 320

Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys

                325                 330                 335

Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly

            340                 345                 350

Tyr Val Ser Gly Trp Ala Arg Val Phe His Lys Gly Arg Ser Ala Leu

        355                 360                 365

Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu

    370                 375                 380

Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe

385                 390                 395                 400

His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His

                405                 410                 415

Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp

            420                 425                 430

Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val

        435                 440                 445

Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

    450                 455                 460

<210>11

<211>603

<212>DNA

<213>智人

<400>11

atggattact acagaaaata tgcagctatc tttctggtca cattgtcggt gtttctgcat   60

gttctccatt ccgctcctga tgtgcaggat tgcccagaat gcacgctaca ggaaaaccca  120

ttcttctccc agccgggtgc cccaatactt cagtgcatgg gctgctgctt ctctagagca  180

tatcccactc cactaaggtc caagaagacg atgttggtcc aaaagaacgt cacctcagag  240

tccacttgct gtgtagctaa atcatataac agggtcacag taatgggggg tttcaaagtg  300

gagaaccaca cggcgtgcca ctgcagtact tgttattatc acaaatctta aatgttttac  360

caagtgctgt cttgatgact gctgattttc tggaatggaa aattaagttg tttagtgttt  420

atggctttgt gagataaaac tctccttttc cttaccatac cactttgaca cgcttcaagg 480

atatactgca gctttactgc cttcctcctt atcctacagt acaatcagca gtctagttct 540

tttcatttgg aatgaataca gcattaagct tgttccactg caaataaagc cttttaaatc 600

atc                                                               603

<210>12

<211>116

<212>PRT

<213>智人

<400>12

Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser

1               5                   10                  15

Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro

            20                  25                  30

Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro

        35                  40                  45

Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro

    50                  55                  60

Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu

65                  70                  75                  80

Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly

                85                  90                  95

Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr

            100                 105                 110

Tyr His Lys Ser

        115

<210>13

<211>390

<212>DNA

<213>智人

<400>13

atgaagacac tccagttttt cttccttttc tgttgctgga aagcaatctg ctgcaatagc   60

tgtgagctga ccaacatcac cattgcaata gagaaagaag aatgtcgttt ctgcataagc  120

atcaacacca cttggtgtgc tggctactgc tacaccaggg atctggtgta taaggaccca  180

gccaggccca aaatccagaa aacatgtacc ttcaaggaac tggtatatga aacagtgaga  240

gtgcccggct gtgctcacca tgcagattcc ttgtatacat acccagtggc cacccagtgt  300

cactgtggca agtgtgacag cgacagcact gattgtactg tgcgaggcct ggggcccagc  360

tactgctcct ttggtgaaat gaaagaataa                                   390

<210>14

<211>129

<212>PRT

<213>智人

<400>14

Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile

1               5                   10                  15

Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys

            20                  25                  30

Glu Glu Cys Arg Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly

        35                  40                  45

Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys

    50                  55                  60

Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg

65                  70                  75                  80

Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val

                85                  90                  95

Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys

            100                 105                 110

Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys

        115                 120                 125

Glu

<210>15

<211>1342

<212>DNA

<213>智人

<400>15

cccggagccg gaccggggcc accgcgcccg ctctgctccg acaccgcgcc ccctggacag   60

ccgccctctc ctccaggccc gtggggctgg ccctgcaccg ccgagcttcc cgggatgagg  120

gcccccggtg tggtcacccg gcgcgcccca ggtcgctgag ggaccccggc caggcgcgga  180

gatgggggtg cacgaatgtc ctgcctggct gtggcttctc ctgtccctgc tgtcgctccc  240

tctgggcctc ccagtcctgg gcgccccacc acgcctcatc tgtgacagcc gagtcctgga  300

gaggtacctc ttggaggcca aggaggccga gaatatcacg acgggctgtg ctgaacactg  360

cagcttgaat gagaatatca ctgtcccaga caccaaagtt aatttctatg cctggaagag  420

gatggaggtc gggcagcagg ccgtagaagt ctggcagggc ctggccctgc tgtcggaagc  480

tgtcctgcgg ggccaggccc tgttggtcaa ctcttcccag ccgtgggagc ccctgcagct  540

gcatgtggat aaagccgtca gtggccttcg cagcctcacc actctgcttc gggctctgcg  600

agcccagaag gaagccatct cccctccaga tgcggcctca gctgctccac tccgaacaat  660

cactgctgac actttccgca aactcttccg agtctactcc aatttcctcc ggggaaagct  720

gaagctgtac acaggggagg cctgcaggac aggggacaga tgaccaggtg tgtccacctg  780

ggcatatcca ccacctccct caccaacatt gcttgtgcca caccctcccc cgccactcct  840

gaaccccgtc gaggggctct cagctcagcg ccagcctgtc ccatggacac tccagtgcca  900

gcaatgacat ctcaggggcc agaggaactg tccagagagc aactctgaga tctaaggatg  960

tcacagggcc aacttgaggg cccagagcag gaagcattca gagagcagct ttaaactcag 1020

ggacagagcc atgctgggaa gacgcctgag ctcactcggc accctgcaaa atttgatgcc 1080

aggacacgct ttggaggcga tttacctgtt ttcgcaccta ccatcaggga caggatgacc 1140

tggagaactt aggtggcaag ctgtgacttc tccaggtctc acgggcatgg gcactccctt 1200

ggtggcaaga gcccccttga caccggggtg gtgggaacca tgaagacagg atgggggctg 1260

gcctctggct ctcatggggt ccaagttttg tgtattcttc aacctcattg acaagaactg 1320

aaaccaccaa aaaaaaaaaa aa                                          1342

<210>16

<211>193

<212>PRT

<213>智人

<400>16

Met Gly Val His Glu Cys Pro Ala Trp Leu Trp Leu Leu Leu Ser Leu

1               5                   10                  15

Leu Ser Leu Pro Leu Gly Leu Pro Val Leu Gly Ala Pro Pro Arg Leu

            20                  25                  30

Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu Leu Glu Ala Lys Glu

        35                  40                  45

Ala Glu Ash Ile Thr Thr Gly Cys Ala Glu His Cys Ser Leu Ash Glu

    50                  55                  60

Asn Ile Thr Val Pro Asp Thr Lys Val Asn Phe Tyr Ala Trp Lys Arg

65                  70                  75                  80

Met Glu Val Gly Gln Gln Ala Val Glu Val Trp Gln Gly Leu Ala Leu

                85                  90                  95

Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu Leu Val Asn Ser Ser

            100                 105                 110

Gln Pro Trp Glu Pro Leu Gln Leu His Val Asp Lys Ala Val Ser Gly

        115                 120                 125

Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu Arg Ala Gln Lys Glu

    130                 135                 140

Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala Pro Leu Arg Thr Ile

145                 150                 155                 160

Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val Tyr Ser Ash Phe Leu

                165                 170                 175

Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala Cys Arg Thr Gly Asp

            180                 185                 190

Arg

<210>17

<211>435

<212>DNA

<213>智人

<400>17

atgtggctgc agagcctgct gctcttgggc actgtggcct gcagcatctc tgcacccgcc   60

cgctcgccca gccccagcac gcagccctgg gagcatgtga atgccatcca ggaggcccgg  120

cgtctcctga acctgagtag agacactgct gctgagatga atgaaacagt agaagtcatc  180

tcagaaatgt ttgacctcca ggagccgacc tgcctacaga cccgcctgga gctgtacaag  240

cagggcctgc ggggcagcct caccaagctc aagggcccct tgaccatgat ggccagccac  300

tacaagcagc actgccctcc aaccccggaa acttcctgtg caacccagat tatcaccttt  360

gaaagtttca aagagaacct gaaggacttt ctgcttgtca tcccctttga ctgctgggag  420

ccagtccagg agtga                                                   435

<210>18

<211>144

<212>PRT

<213>智人

<400>18

Met Trp Leu Gln Ser Leu Leu Leu Leu Gly Thr Val Ala Cys Ser Ile

1               5                   10                  15

Ser Ala Pro Ala Arg Ser Pro Ser Pro Ser Thr Gln Pro Trp Glu His

            20                  25                  30

Val Asn Ala Ile Gln Glu Ala Arg Arg Leu Leu Ash Leu Ser Arg Asp

        35                  40                  45

Thr Ala Ala Glu Met Asn Glu Thr Val Glu Val Ile Ser Glu Met Phe

    50                  55                  60

Asp Leu Gln Glu Pro Thr Cys Leu Gln Thr Arg Leu Glu Leu Tyr Lys

65                  70                  75                  80

Gln Gly Leu Arg Gly Ser Leu Thr Lys Leu Lys Gly Pro Leu Thr Met

                85                  90                  95

Met Ala Ser His Tyr Lys Gln His Cys Pro Pro Thr Pro Glu Thr Ser

            100                 105                 110

Cys Ala Thr Gln Ile Ile Thr Phe Glu Ser Phe Lys Glu Asn Leu Lys

        115                 120                 125

Asp Phe Leu Leu Val Ile Pro Phe Asp Cys Trp Glu Pro Val Gln Glu

    130                 135                 140

<210>19

<211>501

<212>DNA

<213>智人

<400>19

atgaaatata caagttatat cttggctttt cagctctgca tcgttttggg ttctcttggc   60

tgttactgcc aggacccata tgtaaaagaa gcagaaaacc ttaagaaata ttttaatgca  120

ggtcattcag atgtagcgga taatggaact cttttcttag gcattttgaa gaattggaaa  180

gaggagagtg acagaaaaat aatgcagagc caaattgtct ccttttactt caaacttttt  240

aaaaacttta aagatgacca gagcatccaa aagagtgtgg agaccatcaa ggaagacatg  300

aatgtcaagt ttttcaatag caacaaaaag aaacgagatg acttcgaaaa gctgactaat  360

tattcggtaa ctgacttgaa tgtccaacgc aaagcaatac atgaactcat ccaagtgatg  420

gctgaactgt cgccagcagc taaaacaggg aagcgaaaaa ggagtcagat gctgtttcga  480

ggtcgaagag catcccagta a                                             501

<210>20

<211>166

<212>PRT

<213>智人

<400>20

Met Lys Tyr Thr Ser Tyr Ile Leu Ala Phe Gln Leu Cys Ile Val Leu

1               5                   10                  15

Gly Ser Leu Gly Cys Tyr Cys Gln Asp Pro Tyr Val Lys Glu Ala Glu

            20                  25                  30

Asn Leu Lys Lys Tyr Phe Asn Ala Gly His Ser Asp Val Ala Asp Asn

        35                  40                  45

Gly Thr Leu Phe Leu Gly Ile Leu Lys Asn Trp Lys Glu Glu Ser Asp

    50                  55                  60

Arg Lys Ile Met Gln Ser Gln Ile Val Ser Phe Tyr Phe Lys Leu Phe

65                  70                  75                  80

Lys Asn Phe Lys Asp Asp Gln Ser Ile Gln Lys Ser Val Glu Thr Ile

                85                  90                  95

Lys Glu Asp Met Asn Val Lys Phe Phe Asn Ser Asn Lys Lys Lys Arg

            100                 105                 110

Asp Asp Phe Glu Lys Leu Thr Asn Tyr Ser Val Thr Asp Leu Asn Val

        115                 120                 125

Gln Arg Lys Ala Ile His Glu Leu Ile Gln Val Met Ala Glu Leu Ser

    130                 135                 140

Pro Ala Ala Lys Thr Gly Lys Arg Lys Arg Ser Gln Met Leu Phe Arg

145                 150                 155                 160

Gly Arg Arg Ala Ser Gln

                165

<210>21

<211>1352

<212>DNA

<213>智人

<400>21

ctgggacagt gaatcgacaa tgccgtcttc tgtctcgtgg ggcatcctcc tgctggcagg   60

cctgtgctgc ctggtccctg tctccctggc tgaggatccc cagggagatg ctgcccagaa  120

gacagataca tcccaccatg atcaggatca cccaaccttc aacaagatca cccccaacct  180

ggctgagttc gccttcagcc tataccgcca gctggcacac cagtccaaca gcaccaatat  240

cttcttctcc ccagtgagca tcgctacagc ctttgcaatg ctctccctgg ggaccaaggc  300

tgacactcac gatgaaatcc tggagggcct gaatttcaac ctcacggaga ttccggaggc  360

tcagatccat gaaggcttcc aggaactcct ccgtaccctc aaccagccag acagccagct  420

ccagctgacc accggcaatg gcctgttcct cagcgagggc ctgaagctag tggataagtt  480

tttggaggat gttaaaaagt tgtaccactc agaagccttc actgtcaact tcggggacac  540

cgaagaggcc aagaaacaga tcaacgatta cgtggagaag ggtactcaag ggaaaattgt  600

ggatttggtc aaggagcttg acagagacac agtttttgct ctggtgaatt acatcttctt  660

taaaggcaaa tgggagagac cctttgaagt caaggacacc gaggaagagg acttccacgt  720

ggaccaggtg accaccgtga aggtgcctat gatgaagcgt ttaggcatgt ttaacatcca  780

gcactgtaag aagctgtcca gctgggtgct gctgatgaaa tacctgggca atgccaccgc  840

catcttcttc ctgcctgatg aggggaaact acagcacctg gaaaatgaac tcacccacga  900

tatcatcacc aagttcctgg aaaatgaaga cagaaggtct gccagcttac atttacccaa  960

actgtccatt actggaacct atgatctgaa gagcgtcctg ggtcaactgg gcatcactaa 1020

ggtcttcagc aatggggctg acctctccgg ggtcacagag gaggcacccc tgaagctctc 1080

caaggccgtg cataaggctg tgctgaccat cgacgagaaa gggactgaag ctgctggggc 1140

catgttttta gaggccatac ccatgtctat cccccccgag gtcaagttca acaaaccctt 1200

tgtcttctta atgattgaac aaaataccaa gtctcccctc ttcatgggaa aagtggtgaa 1260

tcccacccaa aaataactgc ctctcgctcc tcaacccctc ccctccatcc ctggccccct 1320

ccctggatga cattaaagaa gggttgagct gg                               1352

<210>22

<211>418

<212>PRT

<213>智人

<400>22

Met Pro Ser Ser Val Ser Trp Gly Ile Leu Leu Leu Ala Gly Leu Cys

1               5                   10                  15

Cys Leu Val Pro Val Ser Leu Ala Glu Asp Pro Gln Gly Asp Ala Ala

            20                  25                  30

Gln Lys Thr Asp Thr Ser His His Asp Gln Asp His Pro Thr Phe Asn

        35                  40                  45

Lys Ile Thr Pro Asn Leu Ala Glu Phe Ala Phe Ser Leu Tyr Arg Gln

    50                  55                  60

Leu Ala His Gln Ser Asn Ser Thr Asn Ile Phe Phe Ser Pro Val Ser

65                  70                  75                  80

Ile Ala Thr Ala Phe Ala Met Leu Ser Leu Gly Thr Lys Ala Asp Thr

                85                  90                  95

His Asp Glu Ile Leu Glu Gly Leu Asn Phe Asn Leu Thr Glu Ile Pro

            100                 105                 110

Glu Ala Gln Ile His Glu Gly Phe Gln Glu Leu Leu Arg Thr Leu Asn

        115                 120                 125

Gln Pro Asp Ser Gln Leu Gln Leu Thr Thr Gly Asn Gly Leu Phe Leu

    130                 135                 140

Ser Glu Gly Leu Lys Leu Val Asp Lys Phe Leu Glu Asp Val Lys Lys

145                 150                 155                 160

Leu Tyr His Ser Glu Ala Phe Thr Val Asn Phe Gly Asp Thr Glu Glu

                165                 170                 175

Ala Lys Lys Gln Ile Asn Asp Tyr Val Glu Lys Gly Thr Gln Gly Lys

            180                 185                 190

Ile Val Asp Leu Val Lys Glu Leu Asp Arg Asp Thr Val Phe Ala Leu

        195                 200                 205

Val Asn Tyr Ile Phe Phe Lys Gly Lys Trp Glu Arg Pro Phe Glu Val

    210                 215                 220

Lys Asp Thr Glu Glu Glu Asp Phe His Val Asp Gln Val Thr Thr Val

225                 230                 235                 240

Lys Val Pro Met Met Lys Arg Leu Gly Met Phe Asn Ile Gln His Cys

                245                 250                 255

Lys Lys Leu Ser Ser Trp Val Leu Leu Met Lys Tyr Leu Gly Asn Ala

            260                 265                 270

Thr Ala Ile Phe Phe Leu Pro Asp Glu Gly Lys Leu Gln His Leu Glu

        275                 280                 285

Asn Glu Leu Thr His Asp Ile Ile Thr Lys Phe Leu Glu Asn Glu Asp

    290                 295                 300

Arg Arg Ser Ala Ser Leu His Leu Pro Lys Leu Ser Ile Thr Gly Thr

305                 310                 315                 320

Tyr Asp Leu Lys Ser Val Leu Gly Gln Leu Gly Ile Thr Lys Val Phe

                325                 330                 335

Ser Asn Gly Ala Asp Leu Set Gly Val Thr Glu Glu Ala Pro Leu Lys

            340                 345                 350

Leu Ser Lys Ala Val His Lys Ala Val Leu Thr Ile Asp Glu Lys Gly

        355                 360                 365

Thr Glu Ala Ala Gly Ala Met Phe Leu Glu Ala Ile Pro Met Ser Ile

    370                 375                 380

Pro Pro Glu Val Lys Phe Asn Lys Pro Phe Val Phe Leu Met Ile Glu

385                 390                 395                 400

Gln Asn Thr Lys Ser Pro Leu Phe Met Gly Lys Val Val Asn Pro Thr

                405                 410                 415

Gln Lys

<210>23

<211>2004

<212>DNA

<213>智人

<400>23

gctaacctag tgcctatagc taaggcaggt acctgcatcc ttgtttttgt ttagtggatc   60

ctctatcctt cagagactct ggaacccctg tggtcttctc ttcatctaat gaccctgagg  120

ggatggagtt ttcaagtcct tccagagagg aatgtcccaa gcctttgagt agggtaagca  180

tcatggctgg cagcctcaca ggtttgcttc tacttcaggc agtgtcgtgg gcatcaggtg  240

cccgcccctg catccctaaa agcttcggct acagctcggt ggtgtgtgtc tgcaatgcca  300

catactgtga ctcctttgac cccccgacct ttcctgccct tggtaccttc agccgctatg  360

agagtacacg cagtgggcga cggatggagc tgagtatggg gcccatccag gctaatcaca  420

cgggcacagg cctgctactg accctgcagc cagaacagaa gttccagaaa gtgaagggat  480

ttggaggggc catgacagat gctgctgctc tcaacatcct tgccctgtca ccccctgccc  540

aaaatttgct acttaaatcg tacttctctg aagaaggaat cggatataac atcatccggg  600

tacccatggc cagctgtgac ttctccatcc gcacctacac ctatgcagac acccctgatg  660

atttccagtt gcacaacttc agcctcccag aggaagatac caagctcaag atacccctga  720

ttcaccgagc cctgcagttg gcccagcgtc ccgtttcact ccttgccagc ccctggacat  780

cacccacttg gctcaagacc aatggagcgg tgaatgggaa ggggtcactc aagggacagc   840

ccggagacat ctaccaccag acctgggcca gatactttgt gaagttcctg gatgcctatg   900

ctgagcacaa gttacagttc tgggcagtga cagctgaaaa tgagccttct gctgggctgt   960

tgagtggata ccccttccag tgcctgggct tcacccctga acatcagcga gacttcattg  1020

cccgtgacct aggtcctacc ctcgccaaca gtactcacca caatgtccgc ctactcatgc  1080

tggatgacca acgcttgctg ctgccccact gggcaaaggt ggtactgaca gacccagaag  1140

cagctaaata tgttcatggc attgctgtac attggtacct ggactttctg gctccagcca  1200

aagccaccct aggggagaca caccgcctgt tccccaacac catgctcttt gcctcagagg  1260

cctgtgtggg ctccaagttc tgggagcaga gtgtgcggct aggctcctgg gatcgaggga  1320

tgcagtacag ccacagcatc atcacgaacc tcctgtacca tgtggtcggc tggaccgact  1380

ggaaccttgc cctgaacccc gaaggaggac ccaattgggt gcgtaacttt gtcgacagtc  1440

ccatcattgt agacatcacc aaggacacgt tttacaaaca gcccatgttc taccaccttg  1500

gccacttcag caagttcatt cctgagggct cccagagagt ggggctggtt gccagtcaga  1560

agaacgacct ggacgcagtg gcactgatgc atcccgatgg ctctgctgtt gtggtcgtgc  1620

taaaccgctc ctctaaggat gtgcctctta ccatcaagga tcctgctgtg ggcttcctgg  1680

agacaatctc acctggctac tccattcaca cctacctgtg gcatcgccag tgatggagca  1740

gatactcaag gaggcactgg gctcagcctg ggcattaaag ggacagagtc agctcacacg  1800

ctgtctgtga ctaaagaggg cacagcaggg ccagtgtgag cttacagcga cgtaagccca  1860

ggggcaatgg tttgggtgac tcactttccc ctctaggtgg tgcccagggc tggaggcccc  1920

tagaaaaaga tcagtaagcc ccagtgtccc cccagccccc atgcttatgt gaacatgcgc  1980

tgtgtgctgc ttgctttgga aact                                         2004

<210>24

<211>536

<212>PRT

<213>智人

<400>24

Met Glu Phe Ser Ser Pro Ser Arg Glu Glu Cys Pro Lys Pro Leu Ser

1               5                   10                  15

Arg Val Ser Ile Met Ala Gly Ser Leu Thr Gly Leu Leu Leu Leu Gln

            20                  25                  30

Ala Val Ser Trp Ala Ser Gly Ala Arg Pro Cys Ile Pro Lys Ser Phe

        35                  40                  45

Gly Tyr Ser Ser Val Val Cys Val Cys Asn Ala Thr Tyr Cys Asp Ser

    50                  55                  60

Phe Asp Pro Pro Thr Phe Pro Ala Leu Gly Thr Phe Ser Arg Tyr Glu

65                  70                  75                  80

Ser Thr Arg Ser Gly Arg Arg Met Glu Leu Ser Met Gly Pro Ile Gln

                85                  90                  95

Ala Asn His Thr Gly Thr Gly Leu Leu Leu Thr Leu Gln Pro Glu Gln

            100                 105                 110

Lys Phe Gln Lys Val Lys Gly Phe Gly Gly Ala Met Thr Asp Ala Ala

        115                 120                 125

Ala Leu Asn Ile Leu Ala Leu Ser Pro Pro Ala Gln Asn Leu Leu Leu

    130                 135                 140

Lys Ser Tyr Phe Ser Glu Glu Gly Ile Gly Tyr Asn Ile Ile Arg Val

145                 150                 155                 160

Pro Met Ala Ser Cys Asp Phe Ser Ile Arg Thr Tyr Thr Tyr Ala Asp

                165                 170                 175

Thr Pro Asp Asp Phe Gln Leu His Asn Phe Ser Leu Pro Glu Glu Asp

            180                 185                 190

Thr Lys Leu Lys Ile Pro Leu Ile His Arg Ala Leu Gln Leu Ala Gln

        195                 200                 205

Arg Pro VaI Ser Leu Leu Ala Ser Pro Trp Thr Ser Pro Thr Trp Leu

    210                 215                 220

Lys Thr Asn Gly Ala Val Asn Gly Lys Gly Ser Leu Lys Gly Gln Pro

225                 230                 235                 240

Gly Asp Ile Tyr His Gln Thr Trp Ala Arg Tyr Phe Val Lys Phe Leu

                245                 250                 255

Asp Ala Tyr Ala Glu His Lys Leu Gln Phe Trp Ala Val Thr Ala Glu

            260                 265                 270

Asn Glu Pro Ser Ala Gly Leu Leu Ser Gly Tyr Pro Phe Gln Cys Leu

        275                 280                 285

Gly Phe Thr Pro Glu His Gln Arg Asp Phe Ile Ala Arg Asp Leu Gly

    290                 295                 300

Pro ThT Leu Ala Asn Ser Thr His His Asn Val Arg Leu Leu Met Leu

305                 310                 315                 320

Asp Asp Gln Arg Leu Leu Leu Pro His Trp Ala Lys Val Val Leu Thr

                325                 330                 335

Asp Pro Glu Ala Ala Lys Tyr Val His Gly Ile Ala Val His Trp Tyr

            340                 345                 350

Leu Asp Phc Leu Ala Pro Ala Lys Ala Thr Leu Gly Glu Thr His Arg

        355                 360                 365

Leu Phe Pro Asn Thr Met Leu Phe Ala Ser Glu Ala Cys Val Gly Ser

    370                 375                 380

Lys Phe Trp Glu Gln Ser Val Arg Leu Gly Ser Trp Asp Arg Gly Met

385                 390                 395                 400

Gln Tyr Ser His Ser Ile Ile Thr Asn Leu Leu Tyr His Val Val Gly

                405                 410                 415

Trp Thr Asp Trp Asn Leu Ala Leu Asn Pro Glu Gly Gly Pro Asn Trp

            420                 425                 430

Val Arg Asn Phe Val Asp Ser Pro Ile Ile Val Asp Ile Thr Lys Asp

        435                 440                 445

Thr Phe Tyr Lys Gln Pro Met Phe Tyr His Leu Gly His Phe Ser Lys

    450                 455                 460

Phe Ile Pro Glu Gly Ser Gln Arg Val Gly Leu Val Ala Ser Gln Lys

465                 470                 475                 480

Asn Asp Leu Asp Ala Val Ala Leu Met His Pro Asp Gly Ser Ala Val

                485                 490                 495

Val Val Val Leu Asn Arg Ser Ser Lys Asp Val Pro Leu Thr Ile Lys

            500                 505                 510

Asp Pro Ala Val Gly Phe Leu Glu Thr Ile Ser Pro Gly Tyr Ser Ile

        515                 520                 525

His Thr Tyr Leu Trp His Arg Gln

    530                 535

<210>25

<211>1726

<212>DNA

<213>智人

<400>25

atggatgcaa tgaagagagg gctctgctgt gtgctgctgc tgtgtggagc agtcttcgtt   60

tcgcccagcc aggaaatcca tgcccgattc agaagaggag ccagatctta ccaagtgatc  120

tgcagagatg aaaaaacgca gatgatatac cagcaacatc agtcatggct gcgccctgtg    180

ctcagaagca accgggtgga atattgctgg tgcaacagtg gcagggcaca gtgccactca    240

gtgcctgtca aaagttgcag cgagccaagg tgtttcaacg ggggcacctg ccagcaggcc    300

ctgtacttct cagatttcgt gtgccagtgc cccgaaggat ttgctgggaa gtgctgtgaa    360

atagatacca gggccacgtg ctacgaggac cagggcatca gctacagggg cacgtggagc    420

acagcggaga gtggcgccga gtgcaccaac tggaacagca gcgcgttggc ccagaagccc    480

tacagcgggc ggaggccaga cgccatcagg ctgggcctgg ggaaccacaa ctactgcaga    540

aacccagatc gagactcaaa gccctggtgc tacgtcttta aggcggggaa gtacagctca    600

gagttctgca gcacccctgc ctgctctgag ggaaacagtg actgctactt tgggaatggg    660

tcagcctacc gtggcacgca cagcctcacc gagtcgggtg cctcctgcct cccgtggaat    720

tccatgatcc tgataggcaa ggtttacaca gcacagaacc ccagtgccca ggcactgggc    780

ctgggcaaac ataattactg ccggaatcct gatggggatg ccaagccctg gtgccacgtg    840

ctgaagaacc gcaggctgac gtgggagtac tgtgatgtgc cctcctgctc cacctgcggc    900

ctgagacagt acagccagcc tcagtttcgc atcaaaggag ggctcttcgc cgacatcgcc    960

tcccacccct ggcaggctgc catctttgcc aagcacagga ggtcgccggg agagcggttc   1020

ctgtgcgggg gcatactcat cagctcctgc tggattctct ctgcegccca ctgcttccag   1080

gagaggtttc cgccccacca cctgacggtg atcttgggca gaacataccg ggtggtccct   1140

ggcgaggagg agcagaaatt tgaagtcgaa aaatacattg tccataagga attcgatgat   1200

gacacttacg acaatgacat tgcgctgctg cagctgaaat cggattcgtc ccgctgtgcc   1260

caggagagca gcgtggtccg cactgtgtgc cttcccccgg cggacctgca gctgccggac   1320

tggacggagt gtgagctctc cggctacggc aagcatgagg ccttgtctcc tttctattcg   1380

gagcggctga aggaggctca tgtcagactg tacccatcca gccgctgcac atcacaacat   1440

ttacttaaca gaacagtcac cgacaacatg ctgtgtgctg gagacactcg gagcggcggg   1500

ccccaggcaa acttgcacga cgcctgccag ggcgattcgg gaggccccct ggtgtgtctg   1560

aacgatggcc gcatgacttt ggtgggcatc atcagctggg gcctgggctg tggacagaag   1620

gatgtcccgg gtgtgtacac caaggttacc aactacctag actggattcg tgacaacatg   1680

cgaccgtgac caggaacacc cgactcctca aaagcaaatg agatcc                  1726

<210>26

<211>562

<212>PRT

<213>智人

<400>26

Met Asp Ala Met Lys Arg Gly Leu Cys Cys Val Leu Leu Leu Cys Gly

1               5                   10                  15

Ala Val Phe Val Ser Pro Ser Gln Glu Ile His Ala Arg Phe Arg Arg

            20                  25                  30

Gly Ala Arg Ser Tyr Gln Val Ile Cys Arg Asp Glu Lys Thr Gln Met

        35                  40                  45

Ile Tyr Gln Gln His Gln Ser Trp Leu Arg Pro Val Leu Arg Ser Asn

    50                  55                  60

Arg Val Glu Tyr Cys Trp Cys Asn Ser Gly Arg Ala Gln Cys His Ser

65                  70                  75                  80

Val Pro Val Lys Ser Cys Ser Glu Pro Arg Cys Phe Asn Gly Gly Thr

                85                  90                  95

Cys Gln Gln Ala Leu Tyr Phe Ser Asp Phe Val Cys Gln Cys Pro Glu

            100                 105                 110

Gly Phe Ala Gly Lys Cys Cys Glu Ile Asp Thr Arg Ala Thr Cys Tyr

        115                 120                 125

Glu Asp Gln Gly Ile Ser Tyr Arg Gly Thr Trp Ser Thr Ala Glu Ser

    130                 135                 140

Gly Ala Glu Cys Thr Asn Trp Asn Ser Ser Ala Leu Ala Gln Lys Pro

145                 150                 155                 160

Tyr Ser Gly Arg Arg Pro Asp Ala Ile Arg Leu Gly Leu Gly Ash His

                165                 170                 175

Asn Tyr Cys Arg Asn Pro Asp Arg Asp Ser Lys Pro Trp Cys Tyr Val

            180                 185                 190

Phe Lys Ala Gly Lys Tyr Ser Ser Glu Phe Cys Ser Thr Pro Ala Cys

        195                 200                 205

Ser Glu Gly Asn Ser Asp Cys Tyr Phe Gly Asn Gly Ser Ala Tyr Arg

    210                 215                 220

Gly Thr His Ser Leu Thr Glu Ser Gly Ala Ser Cys Leu Pro Trp Asn

225                 230                 235                 240

Ser Met Ile Leu Ile Gly Lys Val Tyr Thr Ala Gln Asn Pro Ser Ala

                245                 250                 255

Gln Ala Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Gly

            260                 265                 270

Asp Ala Lys Pro Trp Cys His Val Leu Lys Asn Arg Arg Leu Thr Trp

        275                 280                 285

Glu Tyr Cys Asp Val Pro Ser Cys Ser Thr Cys Gly Leu Arg Gln Tyr

    290                 295                 300

Ser Gln Pro Gln Phe Arg Ile Lys Gly Gly Leu Phe Ala Asp Ile Ala

305                 310                 315                 320

Ser His Pro Trp Gln Ala Ala Ile Phe Ala Lys His Arg Arg Ser Pro

                325                 330                 335

Gly Glu Arg Phe Leu Cys Gly Gly Ile Leu Ile Ser Ser Cys Trp Ile

            340                 345                 350

Leu Ser Ala Ala His Cys Phe Gln Glu Arg Phe Pro Pro His His Leu

        355                 360                 365

Thr Val Ile Leu Gly Arg Thr Tyr Arg Val Val Pro Gly Glu Glu Glu

    370                 375                 380

Gln Lys Phe Glu Val Glu Lys Tyr Ile Val His Lys Glu Phe Asp Asp

385                 390                 395                 400

Asp Thr Tyr Asp Asn Asp Ile Ala Leu Leu Gln Leu Lys Ser Asp Ser

                405                 410                 415

Ser Arg Cys Ala Gln Glu Ser Ser Val Val Arg Thr Val Cys Leu Pro

            420                 425                 430

Pro Ala Asp Leu Gln Leu Pro Asp Trp Thr Glu Cys Glu Leu Ser Gly

        435                 440                 445

Tyr Gly Lys His Glu Ala Leu Ser Pro Phe Tyr Ser Glu Arg Leu Lys

    450                 455                 460

Glu Ala His Val Arg Leu Tyr Pro Ser Ser Arg Cys Thr Ser Gln His

465                 470                 475                 480

Leu Leu Asn Arg Thr Val Thr Asp Asn Met Leu Cys Ala Gly Asp Thr

                485                 490                 495

Arg Ser Gly Gly Pro Gln Ala Asn Leu His Asp Ala Cys Gln Gly Asp

            500                 505                 510

Ser Gly Gly Pro Leu Val Cys Leu Asn Asp Gly Arg Met Thr Leu Val

        515                 520                 525

Gly Ile Ile Ser Trp Gly Leu Gly Cys Gly Gln Lys Asp Val Pro Gly

    530                 535                 540

Val Tyr Thr Lys Val Thr Asn Tyr Leu Asp Trp Ile Arg Asp Asn Met

545                 550                 555                 560

Arg Pro

<210>27

<211>825

<212>DNA

<213>智人

<400>27

atcactctct ttaatcacta ctcacattaa cctcaactcc tgccacaatg tacaggatgc   60

aactcctgtc ttgcattgca ctaattcttg cacttgtcac aaacagtgca cctacttcaa  120

gttcgacaaa gaaaacaaag aaaacacagc tacaactgga gcatttactg ctggatttac  180

agatgatttt gaatggaatt aataattaca agaatcccaa actcaccagg atgctcacat  240

ttaagtttta catgcccaag aaggccacag aactgaaaca gcttcagtgt ctagaagaag  300

aactcaaacc tctggaggaa gtgctgaatt tagctcaaag caaaaacttt cacttaagac  360

ccagggactt aatcagcaat atcaacgtaa tagttctgga actaaaggga tctgaaacaa  420

cattcatgtg tgaatatgca gatgagacag caaccattgt agaatttctg aacagatgga  480

ttaccttttg tcaaagcatc atctcaacac taacttgata attaagtgct tcccacttaa  540

aacatatcag gccttctatt tatttattta aatatttaaa ttttatattt attgttgaat  600

gtatggttgc tacctattgt aactattatt cttaatctta aaactataaa tatggatctt  660

ttatgattct ttttgtaagc cctaggggct ctaaaatggt ttaccttatt tatcccaaaa  720

atatttatta ttatgttgaa tgttaaatat agtatctatg tagattggtt agtaaaacta  780

tttaataaat ttgataaata taaaaaaaaa aaacaaaaaa aaaaa                  825

<210>28

<211>156

<212>PRT

<213>智人

<400>28

Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ile Leu Ala Leu

1               5                   10                  15

Val Thr Asn Ser Ala Pro Thr Ser Ser Ser Thr Lys Lys Thr Lys Lys

            20                  25                  30

Thr Gln Leu Gln Leu Glu His Leu Leu Leu Asp Leu Gln Met Ile Leu

        35                  40                  45

Asn Gly Ile Asn Asn Tyr Lys Asn Pro Lys Leu Thr Arg Met Leu Thr

    50                  55                  60

Phe Lys Phe Tyr Met Pro Lys Lys Ala Thr Glu Leu Lys Gln Leu Gln

65                  70                  75                  80

Cys Leu Glu Glu Glu Leu Lys Pro Leu Glu Glu Val Leu Asn Leu Ala

                85                  90                  95

Gln Ser Lys Asn Phe His Leu Arg Pro Arg Asp Leu Ile Ser Asn Ile

            100                 105                 110

Asn Val Ile Val Leu Glu Leu Lys Gly Ser Glu Thr Thr Phe Met Cys

        115                 120                 125

Glu Tyr Ala Asp Glu Thr Ala Thr Ile Val Glu Phe Leu Asn Arg Trp

    130                 135                 140

Ile Thr Phe Cys Gln Ser Ile Ile Ser Thr Leu Thr

145                 150                 155

<210>29

<211>7931

<212>DNA

<213>智人

<400>29

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc   60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc  120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac  180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc  240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat  300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt  360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg  420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg  480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat  540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa  600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta  660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat   720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct   780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc   840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat   900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg   960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa  1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa  1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat  1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact  1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc  1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg  1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct  1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg  1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact  1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt  1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca  1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga  1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa  1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag  1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg  1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt  1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc  1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa  2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg  2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc  2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac  2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc  2280

ttctcccaga attcaagaca ccgtagcact aggcaaaagc aatttaatgc caccacaatt  2340

ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa  2400

atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat  2460

gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca  2520

cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc  2580

catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag  2640

aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca  2700

tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca  2760

agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta  2820

tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa  2880

aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga  2940

aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct  3000

gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac  3060

aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta  3120

attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa  3180

gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta  3240

aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa  3300

gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc  3360

ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg  3420

caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag  3480

aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta  3540

ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat  3600

ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag  3660

gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag  3720

aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac  3780

ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca  3840

aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga  3900

aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca  3960

agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca  4020

ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc  4080

aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag  4140

aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct  4200

caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct  4260

atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat  4320

agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat  4380

aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc  4440

ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg  4500

aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat  4560

cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg  4620

gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct  4680

ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta  4740

ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa  4800

tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg  4860

aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa  4920

atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca  4980

gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa  5040

attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat  5100

gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct  5160

gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg  5220

gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc  5280

tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca  5340

tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt  5400

ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa  5460

cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat  5520

catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt  5580

gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac  5640

acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc  5700

atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct  5760

ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc  5820

aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga  5880

tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat  5940

gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt  6000

gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt  6060

attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt  6120

cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga  6180

caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc  6240

tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt  6300

cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt  6360

atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga  6420

accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac  6480

cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact  6540

cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag  6600

agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc  6660

acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct  6720

caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca  6780

ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc  6840

atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag  6900

gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta  6960

ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg  7020

gaggttctgg gctgcgaggc acaggacctc tactgagggt ggccactgca gcacctgcca 7080

ctgccgtcac ctctccctcc tcagctccag ggcagtgtcc ctccctggct tgccttctac 7140

ctttgtgcta aatcctagca gacactgcct tgaagcctcc tgaattaact atcatcagtc 7200

ctgcatttct ttggtggggg gccaggaggg tgcatccaat ttaacttaac tcttacctat 7260

tttctgcagc tgctcccaga ttactccttc cttccaatat aactaggcaa aaagaagtga 7320

ggagaaacct gcatgaaagc attcttccct gaaaagttag gcctctcaga gtcaccactt 7380

cctctgttgt agaaaaacta tgtgatgaaa ctttgaaaaa gatatttatg atgttaacat 7440

ttcaggttaa gcctcatacg tttaaaataa aactctcagt tgtttattat cctgatcaag 7500

catggaacaa agcatgtttc aggatcagat caatacaatc ttggagtcaa aaggcaaatc 7560

atttggacaa tctgcaaaat ggagagaata caataactac tacagtaaag tctgtttctg 7620

cttccttaca catagatata attatgttat ttagtcatta tgaggggcac attcttatct 7680

ccaaaactag cattcttaaa ctgagaatta tagatggggt tcaagaatcc ctaagtcccc 7740

tgaaattata taaggcattc tgtataaatg caaatgtgca tttttctgac gagtgtccat 7800

agatataaag ccatttggtc ttaattctga ccaataaaaa aataagtcag gaggatgcaa 7860

ttgttgaaag ctttgaaata aaataacaat gtcttcttga aatttgtgat ggccaagaaa 7920

 gaaaatgatg a                                                     7931

<210>30

<211>2351

<212>PRT

<213>智人

<400>30

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1               5                   10                  15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

            20                  25                  30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

        35                  40                  45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

    50                  55                  60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

 65                 70                  75                  80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

                85                  90                  95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

            100                 105                 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

        115                 120                 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

    130                 135                 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145                 150                 155                 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

                165                 170                 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

            180                 185                 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

        195                 200                 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

    210                 215                 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225                 230                 235                 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

                245                250                 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

            260                 265                 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

        275                 280                 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

    290                 295                 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305                 3l0                 315                 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

                325                 330                 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

            340                 345                 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

        355                 360             365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

    370                 375             380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385                 390             395                     400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

                405             410                     415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

            420             425                     430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

        435             440                     445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

    450             455                     460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465             470                     475                 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

            485                     490                 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

        500                     505                 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

    515                     520                 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530                     535                 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545                 550                 555                 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

                565                 570                 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

            580                 585                 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

        595                 600                 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

    610                 615                 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625                 630                 635                 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

                645                 650                 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

            660                 665                 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

        675                 680                 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

    690                 695                 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705                 710                 715                 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

                725                 730                 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

            740                 745                 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Arg

        755                 760                 765

Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp

    770                 775                 780

Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys

785                 790                 795                 800

Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser

                805                 810                 815

Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr

            820                 825                 830

Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn

        835                 840                 845

Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly

    850                 855                 860

Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu

865                 870                 875                 880

Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys

                885                 890                 895

Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn

            900                 905                 910

Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met

        959                 920                 925

Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys

    930                 935                 940

Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu

945                 950                 955                 960

Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu

                965                 970                 975

Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe

            980                 985                 990

Lys Gly Lys Arg Ala His Gly Pro  Ala Leu Leu Thr Lys  Asp Asn Ala

        995                 1000                 1005

Leu Phe  Lys Val Ser Ile Ser  Leu Leu Lys Thr Asn  Lys Thr Ser

    1010                 1015                 1020

Asn Asn  Ser Ala Thr Asn Arg  Lys Thr His Ile Asp  Gly Pro Ser

    1025                 1030                 1035

Leu Leu  Ile Glu Asn Ser Pro  Ser Val Trp Gln Asn  Ile Leu Glu

    1040                 1045                 1050

Ser Asp  Thr Glu Phe Lys Lys  Val Thr Pro Leu Ile  His Asp Arg

    1055                 1060                 1065

Met Leu  Met Asp Lys Asn Ala  Thr Ala Leu Arg Leu  Asn His Met

    1070                 1075                 1080

Ser Asn  Lys Thr Thr Ser Ser  Lys Asn Met Glu Met  Val Gln Gln

    1085                 1090                 1095

Lys Lys  Glu Gly Pro Ile Pro  Pro Asp Ala Gln Asn  Pro Asp Met

    1100                 1105                 1110

Ser Phe  Phe Lys Met Leu Phe  Leu Pro Glu Ser Ala  Arg Trp Ile

    1115                 1120                 1125

Gln Arg  Thr His Gly Lys Asn  Ser Leu Asn Ser Gly  Gln Gly Pro

    1130                 1135                 1140

Ser Pro  Lys Gln Leu Val Ser  Leu Gly Pro Glu Lys  Ser Val Glu

    1145                 1150                 1155

Gly Gln  Asn Phe Leu Ser Glu  Lys Asn Lys Val Val  Val Gly Lys

    1160                 1165                 1170

Gly Glu  Phe Thr Lys Asp Val  Gly Leu Lys Glu Met  Val Phe Pro

    1175                 1180                 1185

Ser Ser  Arg Asn Leu Phe Leu  Thr Asn Leu Asp Asn  Leu His Glu

    1190                 1195                 1200

Asn Asn  Thr His Asn Gln Glu  Lys Lys Ile Gln Glu  Glu Ile Glu

    1205                 1210                 1215

Lys Lys  Glu Thr Leu Ile Gln  Glu Asn Val Val Leu  Pro Gln Ile

    1220                 1225                 1230

His Thr  Val Thr Gly Thr Lys  Asn Phe Met Lys Asn  Leu Phe Leu

    1235                 1240                 1245

Leu Ser  Thr Arg Gln Asn Val  Glu Gly Ser Tyr Asp  Gly Ala Tyr

    1250                 1255                 1260

Ala Pro  Val Leu Gln Asp Phe  Arg Ser Leu Asn Asp  Ser Thr Asn

    1265                 1270                 1275

Arg Thr  Lys Lys His Thr Ala  His Phe Ser Lys Lys  Gly Glu Glu

    1280                 1285                 1290

Glu Asn  Leu Glu Gly Leu Gly  Asn Gln Thr Lys Gln  Ile Val Glu

    1295                 1300                 1305

Lys Tyr  Ala Cys Thr Thr Arg  Ile Ser Pro Asn Thr  Ser Gln Gln

    1310                 1315                 1320

Asn Phe  Val Thr Gln Arg Ser  Lys Arg Ala Leu Lys  Gln Phe Arg

    1325                 1330                 1335

Leu Pro  Leu Glu Glu Thr Glu  Leu Glu Lys Arg Ile  Ile Val Asp

    1340                 1345                 1350

Asp Thr  Ser Thr Gln Trp Ser  Lys Asn Met Lys His  Leu Thr Pro

    1355                 1360                 1365

Ser Thr  Leu Thr Gln Ile Asp  Tyr Asn Glu Lys Glu  Lys Gly Ala

    1370                 1375                 1380

Ile Thr  Gln Ser Pro Leu Ser  Asp Cys Leu Thr Arg  Ser His Ser

    1385                 1390                 1395

Ile Pro  Gln Ala Asn Arg Ser  Pro Leu Pro Ile Ala  Lys Val Ser

    l400                 1405                 1410

Ser Phe  Pro Ser Ile Arg Pro  Ile Tyr Leu Thr Arg  Val Leu Phe

    1415                 1420                 1425

Gln Asp  Asn Ser Ser His Leu  Pro Ala Ala Ser Tyr  Arg Lys Lys

    1430                 1435                 1440

Asp Ser  Gly Val Gln Glu Ser  Ser His Phe Leu Gln  Gly Ala Lys

    1445                 1450                 1455

Lys Asn  Asn Leu Ser Leu Ala  Ile Leu Thr Leu Glu  Met Thr Gly

    1460                 1465                 1470

Asp Gln  Arg Glu Val Gly Ser  Leu Gly Thr Ser Ala  Thr Asn Ser

    1475                 1480                 1485

Val Thr  Tyr Lys Lys Val Glu  Asn Thr Val Leu Pro  Lys Pro Asp

    1490                 1495                 1500

Leu Pro  Lys Thr Ser Gly Lys  Val Glu Leu Leu Pro  Lys Val His

    1505                 1510                 1515

Ile Tyr  Gln Lys Asp Leu Phe  Pro Thr Glu Thr Ser  Asn Gly Ser

    1520                 1525                 1530

Pro Gly  His Leu Asp Leu Val  Glu Gly Ser Leu Leu  Gln Gly Thr

    1535                 1540                 1545

Glu Gly  Ala Ile Lys Trp Asn  Glu Ala Asn Arg Pro  Gly Lys Val

    1550                 1555                 1560

Pro Phe  Leu Arg Val Ala Thr  Glu Ser Ser Ala Lys  Thr Pro Ser

    1565                 1570                 1575

Lys Leu  Leu Asp Pro Leu Ala  Trp Asp Asn His Tyr  Gly Thr Gln

    1580                 1585                 1590

Ile Pro  Lys Glu Glu Trp Lys  Ser Gln Glu Lys Ser  Pro Glu Lys

    1595                 1600                 1605

Thr Ala  Phe Lys Lys Lys Asp  Thr Ile Leu Ser Leu  Asn Ala Cys

    1610                 1615                 1620

Glu Ser  Asn His Ala Ile Ala  Ala Ile Asn Glu Gly  Gln Asn Lys

    1625                 1630                 1635

Pro Glu  Ile Glu Val Thr Trp  Ala Lys Gln Gly Arg  Thr Glu Arg

    1640                 1645                 1650

Leu Cys  Ser Gln Asn Pro Pro  Val Leu Lys Arg His  Gln Arg Glu

    1655                 1660                 1665

Ile Thr  Arg Thr Thr Leu Gln  Ser Asp Gln Glu Glu  Ile Asp Tyr

    1670                 1675                 1680

Asp Asp  Thr Ile Ser Val Glu  Met Lys Lys Glu Asp  Phe Asp Ile

    1685                 1690                 1695

Tyr Asp  Glu Asp Glu Asn Gln  Ser Pro Arg Ser Phe  Gln Lys Lys

    1700                 1705                 1710

Thr Arg  His Tyr Phe Ile Ala  Ala Val Glu Arg Leu  Trp Asp Tyr

    1715                 1720                 1725 

Gly Met  Ser Ser Ser Pro His  Val Leu Arg Asn Arg  Ala Gln Ser

    1730                 1735                 1740

Gly Ser  Val Pro Gln Phe Lys  Lys Val Val Phe Gln  Glu Phe Thr

    1745                 1750                 1755

Asp Gly  Ser Phe Thr Gln Pro  Leu Tyr Arg Gly Glu  Leu Asn Glu

    1760                 1765                 1770

His Leu  Gly Leu Leu Gly Pro  Tyr Ile Arg Ala Glu  Val Glu Asp

    1775                 1780                 1785

Asn Ile  Met Val Thr Phe Arg  Asn Gln Ala Ser Arg  Pro Tyr Ser

    1790                 1795                 1800

Phe Tyr  Ser Ser Leu Ile Ser  Tyr Glu Glu Asp Gln  Arg Gln Gly

    1805                 1810                 1815

Ala Glu  Pro Arg Lys Asn Phe  Val Lys Pro Asn Glu  Thr Lys Thr

    1820                 1825                 1830

Tyr Phe  Trp Lys Val Gln His  His Met Ala Pro Thr  Lys Asp Glu

    1835                 1840                 1845

Phe Asp  Cys Lys Ala Trp Ala  Tyr Phe Ser Asp Val  Asp Leu Glu

    1850                 1855                 1860

Lys Asp  Val His Ser Gly Leu  Ile Gly Pro Leu Leu  Val Cys His

    1865                 1870                 1875

Thr Asn  Thr Leu Asn Pro Ala  His Gly Arg Gln Val  Thr Val Gln

    1880                 1885                 1890

Glu Phe  Ala Leu Phe Phe Thr  Ile Phe Asp Glu Thr  Lys Ser Trp

    1895                 1900                 1905

Tyr Phe  Thr Glu Asn Met Glu  Arg Asn Cys Arg Ala  Pro Cys Asn

    1910                 1915                 1920

Ile Gln  Met Glu Asp Pro Thr  Phe Lys Glu Asn Tyr  Arg Phe His

    1925                 1930                 1935

Ala Ile  Asn Gly Tyr Ile Met  Asp Thr Leu Pro Gly  Leu Val Met

    1940                 1945                 1950

Ala Gln  Asp Gln Arg Ile Arg  Trp Tyr Leu Leu Ser  Met Gly Ser

    1955                 1960                 1965

Asn Glu  Asn Ile His Ser Ile  His Phe Ser Gly His  Val Phe Thr

    1970                 1975                 1980

Val Arg  Lys Lys Glu Glu Tyr  Lys Met Ala Leu Tyr  Asn Leu Tyr

    1985                 1990                 1995

Pro Gly  Val Phe Glu Thr Val  Glu Met Leu Pro Ser  Lys Ala Gly

    2000                 2005                 2010

Ile Trp  Arg Val Glu Cys Leu  Ile Gly Glu His Leu  His Ala Gly

    2015                 2020                 2025

Met Ser  Thr Leu Phe Leu Val  Tyr Ser Asn Lys Cys  Gln Thr Pro

    2030                 2035                 2040

Leu Gly  Met Ala Ser Gly His  Ile Arg Asp Phe Gln  Ile Thr Ala

    2045                 2050                 2055

Ser Gly  Gln Tyr Gly Gln Trp  Ala Pro Lys Leu Ala  Arg Leu His

    2060                 2065                 2070

Tyr Ser  Gly Ser Ile Asn Ala  Trp Ser Thr Lys Glu  Pro Phe Ser

    2075                 2080                 2085

Trp Ile  Lys Val Asp Leu Leu  Ala Pro Met Ile Ile  His Gly Ile

    2090                 2095                 2100

Lys Thr  Gln Gly Ala Arg Gln  Lys Phe Ser Ser Leu  Tyr Ile Ser

    2105                 2110                 2115

Gln Phe  Ile Ile Met Tyr Ser  Leu Asp Gly Lys Lys  Trp Gln Thr

    2120                 2125                 2130

Tyr Arg  Gly Asn Ser Thr Gly  Thr Leu Met Val Phe  Phe Gly Asn

    2135                 2140                 2145

Val Asp  Ser Ser Gly Ile Lys  His Asn Ile Phe Asn  Pro Pro Ile

    2150                 2155                 2160

Ile Ala  Arg Tyr Ile Arg Leu  His Pro Thr His Tyr  Ser Ile Arg

    2165                 2170                 2175

Ser Thr  Leu Arg Met Glu Leu  Met Gly Cys Asp Leu  Asn Ser Cys

    2180                 2185                 2190

Ser Met  Pro Leu Gly Met Glu  Ser Lys Ala Ile Ser  Asp Ala Gln

    2195                 2200                 2205

Ile Thr  Ala Ser Ser Tyr Phe  Thr Asn Met Phe Ala  Thr Trp Ser

    2210                 2215                 2220

Pro Ser  Lys Ala Arg Leu His  Leu Gln Gly Arg Ser  Asn Ala Trp

    2225                 2230                 2235

Arg Pro  Gln Val Asn Asn Pro  Lys Glu Trp Leu Gln  Val Asp Phe

    2240                 2245                 2250

Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys

    2255                 2260                 2265

Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser

    2270                 2275                 2280

Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys

    2285                 2290                 2295

Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val

    2300                 2305                 2310

Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His

    2315                 2320                 2325

Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu

    2330                 2335                 2340

Gly Cys Glu Ala Gln Asp Leu Tyr

    2345                 2350

<210>31

<211>1471

<212>DNA

<213>智人

<400>31

atggcgcccg tcgccgtctg ggccgcgctg gccgtcggac tggagctctg ggctgcggcg   60

cacgccttgc ccgcccaggt ggcatttaca ccctacgccc cggagcccgg gagcacatgc  120

cggctcagag aatactatga ccagacagct cagatgtgct gcagcaaatg ctcgccgggc  180

caacatgcaa aagtcttctg taccaagacc tcggacaccg tgtgtgactc ctgtgaggac  240

agcacataca cccagctctg gaactgggtt cccgagtgct tgagctgtgg ctcccgctgt  300

agctctgacc aggtggaaac tcaagcctgc actcgggaac agaaccgcat ctgcacctgc  360

aggcccggct ggtactgcgc gctgagcaag caggaggggt gccggctgtg cgcgccgctg  420

cgcaagtgcc gcccgggctt cggcgtggcc agaccaggaa ctgaaacatc agacgtggtg  480

tgcaagccct gtgccccggg gacgttctcc aacacgactt catccacgga tatttgcagg  540

ccccaccaga tctgtaacgt ggtggccatc cctgggaatg caagcatgga tgcagtctgc  600

acgtccacgt cccccacccg gagtatggcc ccaggggcag tacacttacc ccagccagtg  660

tccacacgat cccaacacac gcagccaact ccagaaccca gcactgctcc aagcacctcc  720

ttcctgctcc caatgggccc cagcccccca gctgaaggga gcactggcga cttcgctctt  780

ccagttggac tgattgtggg tgtgacagcc ttgggtctac taataatagg agtggtgaac  840

tgtgtcatca tgacccaggt gaaaaagaag cccttgtgcc tgcagagaga agccaaggtg  900

cctcacttgc ctgccgataa ggcccggggt acacagggcc ccgagcagca gcacctgctg  960

atcacagcgc cgagctccag cagcagctcc ctggagagct cggccagtgc gttggacaga 1020

agggcgccca ctcggaacca gccacaggca ccaggcgtgg aggccagtgg ggccggggag 1080

gcccgggcca gcaccgggag ctcagattct tcccctggtg gccatgggac ccaggtcaat 1140

gtcacctgca tcgtgaacgt ctgtagcagc tctgaccaca gctcacagtg ctcctcccaa 1200

gccagctcca caatgggaga cacagattcc agcccctcgg agtccccgaa ggacgagcag 1260

gtccccttct ccaaggagga atgtgccttt cggtcacagc tggagacgcc agagaccctg 1320

ctggggagca ccgaagagaa gcccctgccc cttggagtgc ctgatgctgg gatgaagccc 1380

agttaaccag gccggtgtgg gctgtgtcgt agccaaggtg ggctgagccc tggcaggatg 1440

accctgcgaa ggggccctgg tccttccagg c                                1471

<210>32

<211>461

<212>PRT

<213>智人

<400>32

Met Ala Pro Val Ala Val Trp Ala Ala Leu Ala Val Gly Leu Glu Leu

1               5                   10                  15

Trp Ala Ala Ala His Ala Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr

            20                  25                  30

Ala Pro Glu Pro Gly Ser Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln

        35                  40                  45

Thr Ala Gln Met Cys Cys Ser Lys Cys Ser Pro Gly Gln His Ala Lys

    50                  55                  60

Val Phe Cys Thr Lys Thr Ser Asp Thr Val Cys Asp Ser Cys Glu Asp

65                  70                  75                  80

Ser Thr Tyr Thr Gln Leu Trp Asn Trp Val Pro Glu Cys Leu Ser Cys

                85                  90                  95

Gly Ser Arg Cys Ser Ser Asp Gln Val Glu Thr Gln Ala Cys Thr Arg

            100                 105                 110

Glu Gln Asn Arg Ile Cys Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu

        115                 120                 125

Ser Lys Gln Glu Gly Cys Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg

    130                 135                 140

Pro Gly Phe Gly Val Ala Arg Pro Gly Thr Glu Thr Ser Asp Val Val

l45                 150                 155                 160

Cys Lys Pro Cys Ala Pro Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr

                165                 170                 175

Asp Ile Cys Arg Pro His Gln Ile Cys Asn Val Val Ala Ile Pro Gly

            180                 185                 190

Asn Ala Ser Met Asp Ala Val Cys Thr Ser Thr Ser Pro Thr Arg Ser

        195                 200                 205

Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Val Ser Thr Arg Ser

    210                 215                 220

Gln His Thr Gln Pro Thr Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser

225                 230                 235                 240

Phe Leu Leu Pro Met Gly Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly

                245                 250                 255

Asp Phe Ala Leu Pro Val Gly Leu Ile Val Gly Val Thr Ala Leu Gly

            260                 265                 270

Leu Leu Ile Ile Gly Val Val Asn Cys Val Ile Met Thr Gln Val Lys

        275                 280                 285

Lys Lys Pro Leu Cys Leu Gln Arg Glu Ala Lys Val Pro His Leu Pro

    290                 295                 300

Ala Asp Lys Ala Arg Gly Thr Gln Gly Pro Glu Gln Gln His Leu Leu

305                 310                 315                 320

Ile Thr Ala Pro Ser Ser Ser Ser Ser Ser Leu Glu Ser Ser Ala Ser

                325                 330                 335

Ala Leu Asp Arg Arg Ala Pro Thr Arg Asn Gln Pro Gln Ala Pro Gly

            340                 345                 350

Val Glu Ala Ser Gly Ala Gly Glu Ala Arg Ala Ser Thr Gly Ser Ser

        355                 360                 365

Asp Ser Ser Pro Gly Gly His Gly Thr Gln Val Asn Val Thr Cys Ile

    370                 375                 380

Val Asn Val Cys Ser Ser Ser Asp His Ser Ser Gln Cys Ser Ser Gln

385                 390                 395                 400

Ala Ser Ser Thr Met Gly Asp Thr Asp Ser Ser Pro Ser Glu Ser Pro

                405                 410                 415

Lys Asp Glu Gln Val Pro Phe Ser Lys Glu Glu Cys Ala Phe Arg Ser

            420                 425                 430

Gln Leu Glu Thr Pro Glu Thr Leu Leu Gly Ser Thr Glu Glu Lys Pro

        435                 440                 445

Leu Pro Leu Gly Val Pro Asp Ala Gly Met Lys Pro Ser

    450                 455                 460

<210>33

<211>1475

<212>DNA

<213>智人

<400>33

tccacctgtc cccgcagcgc cggctcgcgc cctcctgccg cagccaccga gccgccgtct    60

agcgccccga cctcgccacc atgagagccc tgctggcgcg cctgcttctc tgcgtcctgg   120

tcgtgagcga ctccaaaggc agcaatgaac ttcatcaagt tccatcgaac tgtgactgtc   180

taaatggagg aacatgtgtg tccaacaagt acttctccaa cattcactgg tgcaactgcc   240

caaagaaatt cggagggcag cactgtgaaa tagataagtc aaaaacctgc tatgagggga   300

atggtcactt ttaccgagga aaggccagca ctgacaccat gggccggccc tgcctgccct   360

ggaactctgc cactgtcctt cagcaaacgt accatgccca cagatctgat gctcttcagc   420

tgggcctggg gaaacataat tactgcagga acccagacaa ccggaggcga ccctggtgct   480

atgtgcaggt gggcctaaag ccgcttgtcc aagagtgcat ggtgcatgac tgcgcagatg   540

gaaaaaagcc ctcctctcct ccagaagaat taaaatttca gtgtggccaa aagactctga   600

ggccccgctt taagattatt gggggagaat tcaccaccat cgagaaccag ccctggtttg   660

cggccatcta caggaggcac cgggggggct ctgtcaccta cgtgtgtgga ggcagcctca   720

tcagcccttg ctgggtgatc agcgccacac actgcttcat tgattaccca aagaaggagg   780

actacatcgt ctacctgggt cgctcaaggc ttaactccaa cacgcaaggg gagatgaagt   840

ttgaggtgga aaacctcatc ctacacaagg actacagcgc tgacacgctt gctcaccaca   900

acgacattgc cttgctgaag atccgttcca aggagggcag gtgtgcgcag ccatcccgga   960

ctatacagac catctgcctg ccctcgatgt ataacgatcc ccagtttggc acaagctgtg  1020

agatcactgg ctttggaaaa gagaattcta ccgactatct ctatccggag cagctgaaga  1080

tgactgttgt gaagctgatt tcccaccggg agtgtcagca gccccactac tacggctctg  1140

aagtcaccac caaaatgctg tgtgctgctg acccacagtg gaaaacagat tcctgccagg  1200

gagactcagg gggacccctc gtctgttccc tccaaggccg catgactttg actggaattg  1260

tgagctgggg ccgtggatgt gccctgaagg acaagccagg cgtctacacg agagtctcac  1320

acttcttacc ctggatccgc agtcacacca aggaagagaa tggcctggcc ctctgagggt  1380

ccccagggag gaaacgggca ccacccgctt tcttgctggt tgtcattttt gcagtagagt  1440

catctccatc agctgtaaga agagactggg aagat                             1475

<210>34

<211>431

<212>PRT

<213>智人

<400>34

Met Arg Ala Leu Leu Ala Arg Leu Leu Leu Cys Val Leu Val Val Ser

1               5                   10                  15

Asp Ser Lys Gly Ser Asn Glu Leu His Gln Val Pro Ser Asn Cys Asp

            20                  25                  30

Cys Leu Asn Gly Gly Thr Cys Val Ser Asn Lys Tyr Phe Ser Asn Ile

        35                  40                  45

His Trp Cys Asn Cys Pro Lys Lys Phe Gly Gly Gln His Cys Glu Ile

    50                  55                  60

Asp Lys Ser Lys Thr Cys Tyr Glu Gly Asn Gly His Phe Tyr Arg Gly

65                  70                  75                  80

Lys Ala Ser Thr Asp Thr Met Gly Arg Pro Cys Leu Pro Trp Asn Ser

                85                  90                  95

Ala Thr Val Leu Gln Gln Thr Tyr His Ala His Arg Ser Asp Ala Leu

            100                 105                 110

Gln Leu Gly Leu Gly Lys His Asn Tyr Cys Arg Asn Pro Asp Asn Arg

        115                 120                 125

Arg Arg Pro Trp Cys Tyr Val Gln Val Gly Leu Lys Pro Leu Val Gln

    130                 135                 140

Glu Cys Met Val His Asp Cys Ala Asp Gly Lys Lys Pro Ser Ser Pro

145                 150                 155                 160

Pro Glu Glu Leu Lys Phe Gln Cys Gly Gln Lys Thr Leu Arg Pro Arg

                165                 170                 175

Phe Lys Ile Ile Gly Gly Glu Phe Thr Thr Ile Glu Asn Gln Pro Trp

            180                 185                 190

Phe Ala Ala Ile Tyr Arg Arg His Arg Gly Gly Ser Val Thr Tyr Val

        195                 200                 205

Cys Gly Gly Ser Leu Ile Ser Pro Cys Trp Val Ile Ser Ala Thr His

    210                 215                 220

Cys Phe Ile Asp Tyr Pro Lys Lys Glu Asp Tyr Ile Val Tyr Leu Gly

225                 230                 235                 240

Arg Ser Arg Leu Asn Ser Asn Thr Gln Gly Glu Met Lys Phe Glu Val

                245                 250                 255

Glu Asn Leu Ile Leu His Lys Asp Tyr Ser Ala Asp Thr Leu Ala His

            260                 265                 270

His Asn Asp Ile Ala Leu Leu Lys Ile Arg Ser Lys Glu Gly Arg Cys

        275                 280                 285

Ala Gln Pro Ser Arg Thr Ile Gln Thr Ile Cys Leu Pro Ser Met Tyr

    290                 295                 300

Asn Asp Pro Gln Phe Gly Thr Ser Cys Glu Ile Thr Gly Phe Gly Lys

305                 310                 315                 320

Glu Asn Ser Thr Asp Tyr Leu Tyr Pro Glu Gln Leu Lys Met Thr Val

                325                 330                 335

Val Lys Leu Ile Ser His Arg Glu Cys Gln Gln Pro His Tyr Tyr Gly

            340                 345                 350

Ser Glu Val Thr Thr Lys Met Leu Cys Ala Ala Asp Pro Gln Trp Lys

        355                 360                 365

Thr Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Leu Val Cys Ser Leu

    370                 375                 380

Gln Gly Arg Met Thr Leu Thr Gly Ile Val Ser Trp Gly Arg Gly Cys

385                 390                 395                 400

Ala Leu Lys Asp Lys Pro Gly Val Tyr Thr Arg Val Ser His Phe Leu

                405                 410                 415

Pro Trp Ile Arg Ser His Thr Lys Glu Glu Asn Gly Leu Ala Leu

            420                 425                 430

<210>35

<21l>107

<212>PRT

<213>Mus musculus

<400>35

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1               5                   10                  15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala

            20                  25                  30

Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

        35                  40                  45

Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly

    50                  55                  60

Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65                  70                  75                  80

Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro

                85                  90                  95

Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys

            100                 105

<210>36

<211>120

<212>PRT

<213>Mus musculus

<400>36

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly

1               5                   10                  15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr

            20                  25                  30

Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

        35                  40                  45

Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val

    50                  55                  60

Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr

65                  70                  75                  80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

                85                  90                  95

Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln

            100                 105                 110

Gly Thr Leu Val Thr Val Ser Ser

        115                 120

<210>37

<2ll>120

<212>PRT

<213>Mus musculus

<400>37

Gln Val Thr Leu Arg Glu Ser Gly Pro Ala Leu Val Lys Pro Thr Gln

1               5                   10                  15

Thr Leu Thr Leu Thr Cys Thr Phe Ser Gly Phe Ser Leu Ser Thr Ser

            20                  25                  30

Gly Met Ser Val Gly Trp Ile Arg Gln Pro Ser Gly Lys Ala Leu Glu

        35                  40                  45

Trp Leu Ala Asp Ile Trp Trp Asp Asp Lys Lys Asp Tyr Asn Pro Ser

    50                  55                  60

Leu Lys Ser Arg Leu Thr Ile Ser Lys Asp Thr Ser Lys Asn Gln Val

65                  70                  75                  80

Val Leu Lys Val Thr Asn Met Asp Pro Ala Asp Thr Ala Thr Tyr Tyr

                85                  90                  95

Cys Ala Arg Ser Met Ile Thr Asn Trp Tyr Phe Asp Val Trp Gly Ala

            100                 105                 110

Gly Thr Thr Val Thr Val Ser Ser

        115                 120

<210>38

<211>106

<212>PRT

<213>Mus musculus

<400>38

Asp Ile Gln Met Thr Gln Ser Pro Ser Thr Leu Ser Ala Ser Val Gly

1               5                   10                  15

Asp Arg Val Thr Ile Thr Cys Lys Cys Gln Leu Ser Val Gly Tyr Met

            20                  25                  30

His Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Trp Ile Tyr

        35                  40                  45

Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ser Arg Phe Ser Gly Ser

    50                  55                  60

Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Asp

65                  70                  75                  80

Asp Phe Ala Thr Tyr Tyr Cys Phe Gln Gly Ser Gly Tyr Pro Phe Thr

                85                  90                  95

Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

            100                 105

<210>39

<211>1039

<212>DNA

<213>智人

<400>39

tcctgcacag gcagtgcctt gaagtgcttc ttcagagacc tttcttcata gactactttt   60

ttttctttaa gcagcaaaag gagaaaattg tcatcaaagg atattccaga ttcttgacag  120

cattctcgtc atctctgagg acatcaccat catctcagga tgaggggcat gaagctgctg  180

ggggcgctgc tggcactggc ggccctactg cagggggccg tgtccctgaa gatcgcagcc  240

ttcaacatcc agacatttgg ggagaccaag atgtccaatg ccaccctcgt cagctacatt  300

gtgcagatcc tgagccgcta tgacatcgcc ctggtccagg aggtcagaga cagccacctg  360

actgccgtgg ggaagctgct ggacaacctc aatcaggatg caccagacac ctatcactac  420

gtggtcagtg agccactggg acggaacagc tataaggagc gctacctgtt cgtgtacagg  480

cctgaccagg tgtctgcggt ggacagctac tactacgatg atggctgcga gccctgcggg  540

aacgacacct tcaaccgaga gccagccatt gtcaggttct tctcccggtt cacagaggtc  600

agggagtttg ccattgttcc cctgcatgcg gccccggggg acgcagtagc cgagatcgac  660

gctctctatg acgtctacct ggatgtccaa gagaaatggg gcttggagga cgtcatgttg  720

atgggcgact tcaatgcggg ctgcagctat gtgagaccct cccagtggtc atccatccgc  780

ctgtggacaa gccccacctt ccagtggctg atccccgaca gcgctgacac cacagctaca  840

cccacgcact gtgcctatga caggatcgtg gttgcaggga tgctgctccg aggcgccgtt  900

gttcccgact cggctcttcc ctttaacttc caggctgcct atggcctgag tgaccaactg  960

gcccaagcca tcagtgacca ctatccagtg gaggtgatgc tgaagtgagc agcccctccc 1020

cacaccagtt gaactgcag                                              1039

<210>40

<211>282

<212>PRT

<213>智人

<400>40

Met Arg Gly Met Lys Leu Leu Gly Ala Leu Leu Ala Leu Ala Ala Leu

1               5                   10                  15

Leu Gln Gly Ala Val Ser Leu Lys Ile Ala Ala Phe Asn Ile Gln Thr

            20                  25                  30

Phe Gly Glu Thr Lys Met Ser Asn Ala Thr Leu Val Ser Tyr Ile Val

        35                  40                  45

Gln Ile Leu Ser Arg Tyr Asp Ile Ala Leu Val Gln Glu Val Arg Asp

    50                  55                  60

Ser His Leu Thr Ala Val Gly Lys Leu Leu Asp Asn Leu Asn Gln Asp

65                  70                  75                  80

Ala Pro Asp Thr Tyr His Tyr Val Val Ser Glu Pro Leu Gly Arg Asn

                85                  90                  95

Ser Tyr Lys Glu Arg Tyr Leu Phe Val Tyr Arg Pro Asp Gln Val Ser

            100                 105                 110

Ala Val Asp Ser Tyr Tyr Tyr Asp Asp Gly Cys Glu Pro Cys Gly Asn

        115                 120                 125

Asp Thr Phe Asn Arg Glu Pro Ala Ile Val Arg Phe Phe Ser Arg Phe

    130                 135                 140

Thr Glu Val Arg Glu Phe Ala Ile Val Pro Leu His Ala Ala Pro Gly

145                 150                 155                 160

Asp Ala Val Ala Glu Ile Asp Ala Leu Tyr Asp Val Tyr Leu Asp Val

                165                 170                 175

Gln Glu Lys Trp Gly Leu Glu Asp Val Met Leu Met Gly Asp Phe Asn

            180                 185                 190

Ala Gly Cys Ser Tyr Val Arg Pro Ser Gln Trp Ser Ser Ile Arg Leu

        195                 200                 205

Trp Thr Ser Pro Thr Phe Gln Trp Leu Ile Pro Asp Ser Ala Asp Thr

    210                 215                 220

Thr Ala Thr Pro Thr His Cys Ala Tyr Asp Arg Ile Val Val Ala Gly

225                 230                 235                 240

Met Leu Leu Arg Gly Ala Val Val Pro Asp Ser Ala Leu Pro Phe Asn

                245                 250                 255

Phe Gln Ala Ala Tyr Gly Leu Ser Asp Gln Leu Ala Gln Ala Ile Ser

            260                 265                 270

Asp His Tyr Pro Val Glu Val Met Leu Lys

        275                 280

<210>41

<211>678

<212>DNA

<213>Mus musculus

<400>41

gacatcttgc tgactcagtc tccagccatc ctgtctgtga gtccaggaga aagagtcagt     60

ttctcctgca gggccagtca gttcgttggc tcaagcatcc actggtatca gcaaagaaca    120

aatggttctc caaggcttct cataaagtat gcttctgagt ctatgtctgg gatcccttcc    180

aggtttagtg gcagtggatc agggaeagat tttactctta gcatcaacac tgtggagtct    240

gaagatattg cagattatta ctgtcaacaa agtcatagct ggccattcac gttcggctcg    300

gggacaaatt tggaagtaaa agaagtgaag cttgaggagt ctggaggagg cttggtgcaa    360

cctggaggat ccatgaaact ctcctgtgtt gcctctggat tcattttcag taaccactgg    420

atgaactggg tccgccagtc tccagagaag gggcttgagt gggttgctga aattagatca    480

aaatctatta attctgcaac acattatgcg gagtctgtga aagggaggtt caccatctca    540

agagatgatt ccaaaagtgc tgtctacctg caaatgaccg acttaagaac tgaagacact    600

ggcgtttatt actgttccag gaattactac ggtagtacct acgactactg gggccaaggc    660

accactctca cagtctcc                                                  678

<210>42

<211>226

<212>PRT

<213>Mus musculus

<400>42

Asp Ile Leu Leu Thr Gln Ser Pro Ala Ile Leu Ser Val Ser Pro Gly

1               5                   10                  15

Glu Arg Val Ser Phe Ser Cys Arg Ala Ser Gln Phe Val Gly Ser Ser

            20                  25                  30

Ile His Trp Tyr Gln Gln Arg Thr Asn Gly Ser Pro Arg Leu Leu Ile

        35                  40                  45

Lys Tyr Ala Ser Glu Ser Met Ser Gly Ile Pro Ser Arg Phe Ser Gly

    50                  55                  60

Ser Gly Ser Gly Thr Asp Phe Thr Leu Ser Ile Asn Thr Val Glu Ser

65                  70                  75                  80

Glu Asp Ile Ala Asp Tyr Tyr Cys Gln Gln Ser His Ser Trp Pro Phe

                85                  90                  95

Thr Phe Gly Ser Gly Thr Asn Leu Glu Val Lys Glu Val Lys Leu Glu

            100                 105                 110

Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Met Lys Leu Set

        115                 120                 125

Cys Val Ala Ser Gly Phe Ile Phe Ser Asn His Trp Met Asn Trp Val

    130                 135                 140

Arg Gln Ser Pro Glu Lys Gly Leu Glu Trp Val Ala Glu Ile Arg Ser

145                 150                 155                 160

Lys Ser Ile Asn Ser Ala Thr His Tyr Ala Glu Ser Val Lys Gly Arg

                165                 170                 175

Phe Thr Ile Ser Arg Asp Asp Ser Lys Ser Ala Val Tyr Leu Gln Met

            180                 185                 190

Thr Asp Leu Arg Thr Glu Asp Thr Gly Val Tyr Tyr Cys Set Arg Asn

        195                 200                 205

Tyr Tyr Gly Ser Thr Tyr Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr

    210                 215                 220

Val Ser

225

<210>43

<211>450

<212>DNA

<213>智人

<400>43

gctgcatcag aagaggccat caagcacatc actgtccttc tgccatggcc ctgtggatgc    60

gcctcctgcc cctgctggcg ctgctggccc tctggggacc tgacccagcc gcagcctttg   120

tgaaccaaca cctgtgcggc tcacacctgg tggaagctct ctacctagtg tgcggggaac   180

gaggcttctt ctacacaccc aagacccgcc gggaggcaga ggacctgcag gtggggcagg   240

tggagctggg cgggggccct ggtgcaggca gcctgcagcc cttggccctg gaggggtccc   300

tgcagaagcg tggcattgtg gaacaatgct gtaccagcat ctgctccctc taccagctgg   360

agaactactg caactagacg cagcccgcag gcagcccccc acccgccgcc tcctgcaccg   420

agagagatgg aataaagccc ttgaaccagc                                    450

<210>44

<211>110

<212>PRT

<213>智人

<400>44

Met Ala Leu Trp Met Arg Leu Leu Pro Leu Leu Ala Leu Leu Ala Leu

1               5                  10                  15

Trp Gly Pro Asp Pro Ala Ala Ala Phe Val Asn Gln His Leu Cys Gly

            20                  25                  30

Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe

        35                  40                  45

Phe Tyr Thr Pro Lys Thr Arg Arg Glu Ala Glu Asp Leu Gln Val Gly

    50                  55                  60

Gln Val Glu Leu Gly Gly Gly Pro Gly Ala Gly Ser Leu Gln Pro Leu

65                  70                  75                  80

Ala Leu Glu Gly Ser Leu Gln Lys Arg Gly Ile Val Glu Gln Cys Cys

                85                  90                  95

Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

            100                 105                 110

<210>45

<211>1203

<212>DNA

<213>乙肝病毒

<400>45

atgggaggtt ggtcttccaa acctcgacaa ggcatgggga cgaatctttc tgttcccaat   60

cctctgggat tctttcccga tcaccagttg gaccctgcgt tcggagccaa ctcaaacaat  120

ccagattggg acttcaaccc caacaaggat cactggccag aggcaatcaa ggtaggagcg  180

ggagacttcg ggccagggtt caccccacca cacggcggtc ttttggggtg gagccctcag  240

gctcagggca tattgacaac agtgccagca gcgcctcctc ctgtttccac caatcggcag  300

tcaggaagac agcctactcc catctctcca cctctaagag acagtcatcc tcaggccatg  360

cagtggaact ccacaacatt ccaccaagct ctgctagatc ccagagtgag gggcctatat  420

tttcctgctg gtggctccag ttccggaaca gtaaaccctg ttccgactac tgtctcaccc  480

atatcgtcaa tcttctcgag gactggggac cctgcaccga acatggagag cacaacatca  540

ggattcctag gacccctgct cgtgttacag gcggggtttt tcttgttgac aagaatcctc  600

acaataccac agagtctaga ctcgtggtgg acttctctca attttctagg gggagcaccc  660

acgtgtcctg gccaaaattc gcagtcccca acctccaatc actcaccaac ctcttgtcct  720

ccaatttgtc ctggttatcg ctggatgtgt ctgcggcgtt ttatcatatt cctcttcatc  780

ctgctgctat gcctcatctt cttgttggtt cttctggact accaaggtat gttgcccgtt  840

tgtcctctac ttccaggaac atcaactacc agcacgggac catgcaagac ctgcacgatt  900

cctgctcaag gaacctctat gtttccctct tgttgctgta caaaaccttc ggacggaaac  960

tgcacttgta ttcccatccc atcatcctgg gctttcgcaa gattcctatg ggagtgggcc 1020

tcagtccgtt tctcctggct cagtttacta gtgccatttg ttcagtggtt cgcagggctt 1080

tcccccactg tttggctttc agttatatgg atgatgtggt attgggggcc aagtctgtac 1140

aacatcttga gtcccttttt acctctatta ccaattttct tttgtctttg ggtatacatt 1200

tga                                                               1203

<210>46

<211>400

<212>PRT

<213>乙肝病毒

<400>46

Met Gly Gly Trp Ser Ser Lys Pro Arg Gln Gly Met Gly Thr Asn Leu

1               5                   10                  15

Ser Val Pro Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro

            20                  25                  30

Ala Phe Gly Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn

        35                  40                  45

Lys Asp His Trp Pro Glu Ala Ile Lys Val Gly Ala Gly Asp Phe Gly

    50                  55                  60

Pro Gly Phe Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln

65                  70                  75                  80

Ala Gln Gly Ile Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Val Ser

                85                  90                  95

Thr Asn Arg Gln Ser Gly Arg Gln Pro Thr Pro Ile Ser Pro Pro Leu

            100                 105                 110

Arg Asp Ser His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His

        115                 120                 125

Gln Ala Leu Leu Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly

    130                 135                 140

Gly Ser Ser Ser Gly Thr Val Asn Pro Val Pro Thr Thr Val Ser Pro

145                 150                 155                 160

Ile Ser Ser Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu

                165                 170                 175

Ser Thr Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly

            180                 185                 190

Phe Phe Leu Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser

        195                 200                 205

Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ala Pro Thr Cys Pro Gly

    210                 215                 220

Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro

225                 230                 235                 240

Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile

                245                 250                 255

Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu

            260                 265                 270

Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Leu Pro Gly Thr Ser

        275                 280                 285

Thr Thr Ser Thr Gly Pro Cys Lys Thr Cys Thr Ile Pro Ala Gln Gly

    290                 295                 300

Thr Ser Met Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn

305                 310                 315                 320

Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Arg Phe Leu

                325                 330                 335

Trp Glu Trp Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro

            340                 345                 350

Phe Val Gln Trp Phe Ala Gly Leu Ser Pro Thr Val Trp Leu Ser Val

        355                 360                 365

Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser

    370                 375                 380

Pro Phe Leu Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val Tyr Ile

385                 390                 395                 400

<210>47

<211>799

<212>DNA

<213>智人

<400>47

cgaaccactc agggtcctgt ggacagctca cctagctgca atggctacag gctcccggac    60

gtccctgctc ctggcttttg gcctgctctg cctgccctgg cttcaagagg gcagtgcctt  120

cccaaccatt cccttatcca ggccttttga caacgctatg ctccgcgccc atcgtctgca  180

ccagctggcc tttgacacct accaggagtt tgaagaagcc tatatcccaa aggaacagaa  240

gtattcattc ctgcagaacc cccagacctc cctctgtttc tcagagtcta ttccgacacc  300

ctccaacagg gaggaaacac aacagaaatc caacctagag ctgctccgca tctccctgct  360

gctcatccag tcgtggctgg agcccgtgca gttcctcagg agtgtcttcg ccaacagcct  420

ggtgtacggc gcctctgaca gcaacgtcta tgacctccta aaggacctag aggaaggcat  480

ccaaacgctg atggggaggc tggaagatgg cagcccccgg actgggcaga tcttcaagca  540

gacctacagc aagttcgaca caaactcaca caacgatgac gcactactca agaactacgg  600

gctgctctac tgcttcagga aggacatgga caaggtcgag acattcctgc gcatcgtgca  660

gtgccgctct gtggagggca gctgtggctt ctagctgccc gggtggcatc cctgtgaccc  720

ctccccagtg cctctcctgg ccctggaagt tgccactcca gtgcccacca gccttgtcct  780

aataaaatta agttgcatc                                               799

<210>48

<211>217

<212>PRT

<213>智人

<400>48

Met Ala Thr Gly Ser Arg Thr Ser Leu Leu Leu Ala Phe Gly Leu Leu

1               5                   10                  15

Cys Leu Pro Trp Leu Gln Glu Gly Ser Ala Phe Pro Thr Ile Pro Leu

            20                  25                  30

Ser Arg Pro Phe Asp Asn Ala Met Leu Arg Ala His Arg Leu His Gln

        35                  40                  45

Leu Ala Phe Asp Thr Tyr Gln Glu Phe Glu Glu Ala Tyr Ile Pro Lys

    50                  55                  60

Glu Gln Lys Tyr Ser Phe Leu Gln Asn Pro Gln Thr Ser Leu Cys Phe

65                  70                  75                  80

Ser Glu Ser Ile Pro Thr Pro Ser AsnArg Glu Glu Thr Gln Gln Lys

                85                  90                  95

Ser Asn Leu Glu Leu Leu Arg Ile Ser Leu Leu Leu Ile Gln Ser Trp

            100                 105                 110

Leu Glu Pro Val Gln Phe Leu Arg Ser Val Phe Ala Asn Ser Leu Val

        115                 120                 125

Tyr Gly Ala Ser Asp Ser Asn Val Tyr Asp Leu Leu Lys Asp Leu Glu

    130                 135                 140

Glu Gly Ile Gln Thr Leu Met Gly Arg Leu Glu Asp Gly Ser Pro Arg

145                 150                 155                 160

Thr Gly Gln Ile Phe Lys Gln Thr Tyr Ser Lys Phe Asp Thr Asn Ser

                165                 170                 175

His Asn Asp Asp Ala Leu Leu Lys Asn Tyr Gly Leu Leu Tyr Cys Phe

            180                 185                 190

Arg Lys Asp Met Asp Lys Val Glu Thr Phe Leu Arg Ile Val Gln Cys

        195                 200                 205

Arg Ser Val Glu Gly Ser Cys Gly Phe

    210                 215

<210>49

<211>963

<212>DNA

<213>智人

<400>49

atggagacag acacactcct gttatgggtg ctgctgctct gggttccagg ttccactggt   60

gacgtcaggc gagggccccg gagcctgcgg ggcagggacg cgccagcccc cacgccctgc  120

gtcccggccg agtgcttcga cctgctggtc cgccactgcg tggcctgcgg gctcctgcgc  180

acgccgcggc cgaaaccggc cggggccagc agccctgcgc ccaggacggc gctgcagccg  240

caggagtcgg tgggcgcggg ggccggcgag gcggcggtcg acaaaactca cacatgccca  300

ccgtgcccag cacctgaact cctgggggga ccgtcagtct tcctcttccc cccaaaaccc  360

aaggacaccc tcatgatctc ccggacccct gaggtcacat gcgtggtggt ggacgtgagc  420

cacgaagacc ctgaggtcaa gttcaactgg tacgtggacg gcgtggaggt gcataatgcc  480

aagacaaagc cgcgggagga gcagtacaac agcacgtacc gtgtggtcag cgtcctcacc  540

gtcctgcacc aggactggct gaatggcaag gagtacaagt gcaaggtctc caacaaagcc  600

ctcccagccc ccatcgagaa aaccatctcc aaagccaaag ggcagccccg agaaccacag  660

gtgtacaccc tgcccccatc ccgggatgag ctgaccaaga accaggtcag cctgacctgc  720

ctggtcaaag gcttctatcc cagcgacatc gccgtggagt gggagagcaa tgggcagccg  780

gagaacaact acaagaccac gcctcccgtg ttggactccg acggctcctt cttcctctac  840

agcaagctca ccgtggacaa gagcaggtgg cagcagggga acgtcttctc atgctccgtg  900

atgcatgagg ctctgcacaa ccactacacg cagaagagcc tctccctgtc tcccgggaaa  960

tga                                                                963

<210>50

<211>320

<212>PRT

<213>智人

<400>50

Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro

1               5                   10                   15

Gly Ser Thr Gly Asp Val Arg Arg Gly Pro Arg Ser Leu Arg Gly Arg

            20                  25                  30

Asp Ala Pro Ala Pro Thr Pro Cys Val Pro Ala Glu Cys Phe Asp Leu

        35                  40                  45

Leu Val Arg His Cys Val Ala Cys Gly Leu Leu Arg Thr Pro Arg Pro

    50                  55                  60

Lys Pro Ala Gly Ala Ser Ser Pro Ala Pro Arg Thr Ala Leu Gln Pro

65                  70                  75                  80

Gln Glu Ser Val Gly Ala Gly Ala Gly Glu Ala Ala Val Asp Lys Thr

                85                  90                  95

His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

            100                 105                 110

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

        115                 120                 125

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro

    130                 135                 140

Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

145                 150                 155                 160

Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val

                165                 170                 175

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

            180                 185                 190

Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

        195                 200                 205

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

    210                 215                 220

Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

225                 230                 235                 240

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

                245                 250                 255

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

            260                 265                 270

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser

        275                 280                 285

Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

    290                 295                 300

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

305                 310                 315                 320

<210>51

<211>107

<212>PRT

<213>智人

<400>51

Asp Ile Gln Met Thr Gln Thr Pro Ser Thr Leu Ser Ala Ser Val Gly

1               5                   10                  15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Asn Asn Tyr

            20                  25                  30

Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

        35                  40                  45

Tyr Tyr Thr Ser Thr Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

    50                  55                  60

Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser Ser Leu Gln Pro

65                  70                  75                  80

Asp Asp Phe Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Trp

                85                  90                  95

Thr Phe Gly Gln Gly Thr Lys Val Glu Val Lys

            100                 105

<210>52

<211>107

<212>PRT

<213>Mus musculus

<400>52

Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser Ala Ser Leu Gly

1               5                   10                  15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Asn Asn Tyr

            20                  25                  30

Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Ile Val Lys Leu Leu Ile

        35                  40                  45

Tyr Tyr Thr Ser Thr Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

    50                  55                  60

Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser Asn Leu Glu Gln

65                  70                  75                  80

Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Trp

                85                  90                  95

Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

            100                 105

<210>53

<211>119

<212>PRT

<213>智人

<400>53

Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser

1               5                   10                  15

Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Ala Phe Thr Asn Tyr

            20                  25                  30

Leu Ile Glu Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Ile

        35                  40                  45

Gly Val Ile Tyr Pro Gly Ser Gly Gly Thr Asn Tyr Asn Glu Lys Phe

    50                  55                  60

Lys Gly Arg Val Thr Leu Thr Val Asp Glu Ser Thr Asn Thr Ala Tyr

65                  70                  75                  80

Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Phe Cys

                85                  90                  95

Ala Arg Arg Asp Gly Asn Tyr Gly Trp Phe Ala Tyr Trp Gly Gln Gly

            100                 105                 110

Thr Leu Val Thr Val Ser Ser

        115

<210>54

<211>119

<212>PRT

<213>Mus musculus

<400>54

Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Leu Val Gly Pro Gly Thr

1               5                   10                  15

Ser Val Arg Val Ser Cys Lys Ala Ser Gly Tyr Ala Phe Thr Asn Tyr

            20                  25                  30

Leu Ile Glu Trp Val Lys Gln Arg Pro Gly Gln Gly Leu Glu Trp Ile

        35                  40                  45

Gly Val Ile Tyr Pro Gly Ser Gly Gly Thr Asn Tyr Asn Glu Lys Phe

    50                  55                  60

Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Thr Thr Ala Tyr

65                  70                  75                  80

Met Gln Leu Ser Ser Leu Thr Ser Asp Asp Ser Ala Val Tyr Phe Cys

                85                  90                  95

Ala Arg Arg Asp Gly Asn Tyr Gly Trp Phe Ala Tyr Trp Gly Arg Gly

            100                 105                 110

Thr Leu Val Thr Val Ser Ala

        115

<210>55

<211>214

<212>PRT

<213>智人

<400>55

Asp Ile Gln Met Thr Gln Thr Pro Ser Thr Leu Ser Ala Ser Val Gly

1               5                   10                  15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp Ile Asn Asn Tyr

            20                  25                  30

Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

        35                  40                  45

Tyr Tyr Thr Ser Thr Leu His Ser Gly Val Pro Ser Arg Phe Ser Gly

    50                  55                  60

Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Ser Ser Leu Gln Pro

65                  70                  75                  80

Asp Asp Phe Ala Thr Tyr Phe Cys Gln Gln Gly Asn Thr Leu Pro Trp

                85                  90                  95

Thr Phe Gly Gln Gly Thr Lys Val Glu Val Lys Arg Thr Val Ala Ala

            100                 105                 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

        115                 120                 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

    130                 135                 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145                 150                 155                 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

                165                 170                 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

            180                 185                 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

        195                 200                 205

Phe Asn Arg Gly Glu Cys

    210

<210>56

<211>448

<212>PRT

<213>智人

<400>56

Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ser

1               5                   10                  15

Ser Val Lys Val Ser Cys Lys Ala Ser Gly Tyr Ala Phe Thr Asn Tyr

            20                  25                  30

Leu Ile Glu Trp Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Ile

        35                  40                  45

Gly Val Ile Tyr Pro Gly Ser Gly Gly Thr Asn Tyr Asn Glu Lys Phe

    50                  55                  60

Lys Gly Arg Val Thr Leu Thr Val Asp Glu Ser Thr Asn Thr Ala Tyr

65                  70                  75                  80

Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Phe Cys

                85                  90                  95

Ala Arg Arg Asp Gly Asn Tyr Gly Trp Phe Ala Tyr Trp Gly Gln Gly

            100                 105                 110

Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe

        115                 120                 125

Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu

    130                 135                 140

Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp

145                 150                 155                 160

Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu

                165                 170                 175

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser

            180                 185                 190

Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro

        195                 200                 205

Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys

    210                 215                 220

Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro

225                 230                 235                 240

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

                245                 250                 255

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp

            260                 265                 270

Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

        275                 280                 285

Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val

    290                 295                 300

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

305                 310                 315                 320

Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys

                325                 330                 335

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

            340                 345                 350

Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr

        355                 360                 365

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

    370                 375                 380

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

385                 390                 395                 400

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys

                405                 410                 415

Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu

            420                 425                 430

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

        435                 440                 445

<210>57

<211>8540

<212>DNA

<213>智人

<400>57

gacgtcgcgg ccgctctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag   60

aggccgaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tgcatggggc  120

ggagaatggg cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact  180

atggttgctg actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg  240

gactttccac acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct  300

ggggagcctg gggactttcc acaccctaac tgacacacat tccacagaat taattcccct  360

agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc  420

gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg  480

acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa  540

tgggtggact atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca  600

agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac  660

atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc  720

atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga ctcacgggga  780

tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg  840

gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta  900

cggtgggagg tctatataag cagagctggg tacgtgaacc gtcagatcgc ctggagacgc  960

catcacagat ctctcaccat gagggtcccc gctcagctcc tggggctcct gctgctctgg 1020

ctcccaggtg cacgatgtga tggtaccaag gtggaaatca aacgtacggt ggctgcacca 1080

tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg l140

tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc  1200

ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac  1260

agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc  1320

tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag  1380

tgttgaattc agatccgtta acggttacca actacctaga ctggattcgt gacaacatgc  1440

ggccgtgata tctacgtatg atcagcctcg actgtgcctt ctagttgcca gccatctgtt  1500

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc  1560

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt  1620

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat  1680

gcggtgggct ctatggaacc agctggggct cgacagctat gccaagtacg ccccctattg  1740

acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact  1800

ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt  1860

ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc  1920

ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc  1980

gtaacaactc cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata  2040

taagcagagc tgggtacgtc ctcacattca gtgatcagca ctgaacacag acccgtcgac  2100

atgggttgga gcctcatctt gctcttcctt gtcgctgttg ctacgcgtgt cgctagcacc  2160

aagggcccat cggtcttccc cctggcaccc tcctccaaga gcacctctgg gggcacagcg  2220

gccctgggct gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca  2280

ggcgccctga ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac  2340

tccctcagca gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc  2400

aacgtgaatc acaagcccag caacaccaag gtggacaaga aagcagagcc caaatcttgt  2460

gacaaaactc acacatgccc accgtgccca gcacctgaac tcctgggggg accgtcagtc  2520

ttcctcttcc ccccaaaacc caaggacacc ctcatgatct cccggacccc tgaggtcaca  2580

tgcgtggtgg tggacgtgag ccacgaagac cctgaggtca agttcaactg gtacgtggac  2640

ggcgtggagg tgcataatgc caagacaaag ccgcgggagg agcagtacaa cagcacgtac  2700

cgtgtggtca gcgtcctcac cgtcctgcac caggactggc tgaatggcaa ggactacaag  2760

tgcaaggtct ccaacaaagc cctcccagcc cccatcgaga aaaccatctc caaagccaaa  2820

gggcagcccc gagaaccaca ggtgtacacc ctgcccccat cccgggatga gctgaccagg  2880

aaccaggtca gcctgacctg cctggtcaaa ggcttctatc ccagcgacat cgccgtggag  2940

tgggagagca atgggcagcc ggagaacaac tacaagacca cgcctcccgt gctggactcc  3000

gacggctcct tcttcctcta cagcaagctc accgtggaca agagcaggtg gcagcagggg  3060

aacgtcttct catgctccgt gatgcatgag gctctgcaca accactacac gcagaagagc  3120

ctctccctgt ctccgggtaa atgaggatcc gttaacggtt accaactacc tagactggat  3180

tcgtgacaac atgcggccgt gatatctacg tatgatcagc ctcgactgtg ccttctagtt  3240

gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc  3300

ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt  3360

ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca  3420

ggcatgctgg ggatgcggtg ggctctatgg aaccagctgg ggctcgacag cgctggatct  3480

cccgatcccc agctttgctt ctcaatttct tatttgcata atgagaaaaa aaggaaaatt  3540

aattttaaca ccaattcagt agttgattga gcaaatgcgt tgccaaaaag gatgctttag  3600

agacagtgtt ctctgcacag ataaggacaa acattattca gagggagtac ccagagctga  3660

gactcctaag ccagtgagtg gcacagcatt ctagggagaa atatgcttgt catcaccgaa  3720

gcctgattcc gtagagccac accttggtaa gggccaatct gctcacacag gatagagagg  3780

gcaggagcca gggcagagca tataaggtga ggtaggatca gttgctcctc acatttgctt  3840

ctgacatagt tgtgttggga gcttggatag cttggacagc tcagggctgc gatttcgcgc  3900

caaacttgac ggcaatccta gcgtgaaggc tggtaggatt ttatccccgc tgccatcatg  3960

gttcgaccat tgaactgcat cgtcgccgtg tcccaaaata tggggattgg caagaacgga  4020

gacctaccct ggcctccgct caggaacgag ttcaagtact tccaaagaat gaccacaacc  4080

tcttcagtgg aaggtaaaca gaatctggtg attatgggta ggaaaacctg gttctccatt  4140

cctgagaaca atcgaccttt aaaggacaga attaatatag ttctcagtag agaactcaaa  4200

gaaccaccac gaggagctca ttttcttgcc aaaagtttgg atgatgcctt aagacttatt  4260

gaacaaccgg aattggcaag taaagtagac atggtttgga tagtcggagg cagttctgtt  4320

taccaggaag ccatgaatca accaggccac cttagactct ttgtgacaag gatcatgcag  4380

gaatttgaaa gtgacacgtt tttcccagaa attgatttgg ggaaatataa acttctccca  4440

gaatacccag gcgtcctctc tgaggtccag gaggaaaaag gcatcaagta taagtttgaa  4500

gtctacgaga agaaagacta acaggaagat gctttcaagt tctctgctcc cctcctaaag  4560

tcatgcattt ttataagacc atgggacttt tgctggcttt agatcagcct cgactgtgcc  4620

ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg  4680

tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag  4740

gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga  4800

caatagcagg catgctgggg atgcggtggg ctctatggaa ccagctgggg ctcgagctac  4860

tagctttgct tctcaatttc ttatttgcat aatgagaaaa aaaggaaaat taattttaac  4920

accaattcag tagttgattg agcaaatgcg ttgccaaaaa ggatgcttta gagacagtgt  4980

tctctgcaca gataaggaca aacattattc agagggagta cccagagctg agactcctaa  5040

gccagtgagt ggcacagcat tctagggaga aatatgcttg tcatcaccga agcctgattc  5100

cgtagagcca caccttggta agggccaatc tgctcacaca ggatagagag ggcaggagcc  5160

agggcagagc atataaggtg aggtaggatc agttgctcct cacatttgct tctgacatag  5220

ttgtgttggg agcttggatc gatcctctat ggttgaacaa gatggattgc acgcaggttc  5280

tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg  5340

ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac  5400

cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc  5460

cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg  5520

gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga  5580

gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg  5640

cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg  5700

tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt  5760

cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc  5820

ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg  5880

gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga  5940

gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg cttcccgatt  6000

cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt  6060

cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc  6120

cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca  6180

gcgcggggat ctcatgctgg agttcttcgc ccaccccaac ttgtttattg cagcttataa  6240

tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca  6300

ttctagttgt ggtttgtcca aactcatcaa tctatcttat catgtctgga tcgcggccgc  6360

gatcccgtcg agagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat  6420

ccgctcacaa ttccacacaa catacgagcc ggagcataaa gtgtaaagcc tggggtgcct  6480

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa  6540

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta  6600

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc  6660

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg  6720

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt  6780

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa  6840

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct  6900

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc  6960

cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg  7020

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct  7080

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag  7140

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga  7200

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga  7260

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg  7320

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag  7380

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag  7440

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat  7500

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct  7560

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac  7620

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa  7680

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg  7740

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt  7800

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca  7860

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt  7920

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct  7980

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg  8040

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg  8100

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg  8160

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa  8220

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt  8280

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt  8340

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt  8400

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca  8460

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat  8520

ttccccgaaa agtgccacct                                              8540

<210>58

<211>9209

<212>DNA

<213>Mus musculus

<400>58

gacgtcgcgg ccgctctagg cctccaaaaa agcctcctca ctacttctgg aatagctcag     60

aggccgaggc ggcctcggcc tctgcataaa taaaaaaaat tagtcagcca tgcatggggc    120

ggagaatggg cggaactggg cggagttagg ggcgggatgg gcggagttag gggcgggact    180

atggttgctg actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg    240

gactttccac acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct    300

ggggagcctg gggactttcc acaccctaac tgacacacat tccacagaat taattcccct    360

agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc  420

gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg  480

acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa  540

tgggtggact atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca  600

agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac  660

atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc  720

atggtgatgc ggttttggca gtacatcaat gggcgtggat accggtttga ctcacgcgga  780

tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca aaatcaacgg  840

gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg taggcgtgta  900

cggtgggagg tctatataag cagagctggg tacgtgaacc gtcagatcgc ctggagacgc  960

catcacagat ctctcactat ggattttcag gtgcagatta tcagcttcct gctaatcagt 1020

gcttcagtca taatgtccag aggacaaatt gttctctccc agtctccagc aatcctgtct 1080

gcatctccag gggagaaggt cacaatgact tgcagggcca gctcaagtgt aagttacatc l140

cactggttcc agcagaagcc aggatcctcc cccaaaccct ggatttatgc cacatccaac 1200

ctggcttctg gagtccctgt tcgcttcagt ggcagtgggt ctgggacttc ttactctctc 1260

acaatcagca gagtggaggc tgaagatgct gccacttatt actgccagca gtggactagt 1320

aacccaccca cgttcggagg ggggaccaag ctggaaatca aacgtacggt ggctgcacca 1380

tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg 1440

tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc 1500

ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac 1560

agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc 1620

tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag 1680

tgttgaattc agatccgtta acggttacca actacctaga ctggattcgt gacaacatgc 1740

ggccgtgata tctacgtatg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 1800

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 1860

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 1920

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat  1980

gcggtgggct ctatggaacc agctggggct cgacagctat gccaagtacg ccccctattg  2040

acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact  2100

ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt  2160

ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc  2220

ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc  2280

gtaacaactc cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata  2340

taagcagagc tgggtacgtc ctcacattca gtgatcagca ctgaacacag acccgtcgac  2400

atgggttgga gcctcatctt gctcttcctt gtcgctgttg ctacgcgtgt cctgtcccag  2460

gtacaactgc agcagcctgg ggctgagctg gtgaagcctg gggcctcagt gaagatgtcc  2520

tgcaaggctt ctggctacac atttaccagt tacaatatgc actgggtaaa acagacacct  2580

ggtcggggcc tggaatggat tggagctatt tatcccggaa atggtgatac ttcctacaat  2640

cagaagttca aaggcaaggc cacattgact gcagacaaat cctccagcac agcctacatg  2700

cagctcagca gcctgacatc tgaggactct gcggtctatt actgtgcaag atcgacttac  2760

tacggcggtg actggtactt caatgtctgg ggcgcaggga ccacggtcac cgtctctgca  2820

gctagcacca agggcccatc ggtcttcccc ctggcaccct cctccaagag cacctctggg  2880

ggcacagcgg ccctgggctg cctggtcaag gactacttcc ccgaaccggt gacggtgtcg  2940

tggaactcag gcgccctgac cagcggcgtg cacaccttcc cggctgtcct acagtcctca  3000

ggactctact ccctcagcag cgtggtgacc gtgccctcca gcagcttggg cacccagacc  3060

tacatctgca acgtgaatca caagcccagc aacaccaagg tggacaagaa agcagagccc  3120

aaatcttgtg acaaaactca cacatgccca ccgtgcccag cacctgaact cctgggggga  3180

ccgtcagtct tcctcttccc cccaaaaccc aaggacaccc tcatgatctc ccggacccct  3240

gaggtcacat gcgtggtggt ggacgtgagc cacgaagacc ctgaggtcaa gttcaactgg  3300

tacgtggacg gcgtggaggt gcataatgcc aagacaaagc cgcgggagga gcagtacaac  3360

agcacgtacc gtgtggtcag cgtcctcacc gtcctgcacc aggactggct gaatggcaag  3420

gagtacaagt gcaaggtctc caacaaagcc ctcccagccc ccatcgagaa aaccatctcc  3480

aaagccaaag ggcagccccg agaaccacag gtgtacaccc tgcccccatc ccgggatgag  3540

ctgaccaaga accaggtcag cctgacctgc ctggtcaaag gcttctatcc cagcgacatc  3600

gccgtggagt gggagagcaa tgggcagccg gagaacaact acaagaccac gcctcccgtg  3660

ctggactccg acggctcctt cttcctctac agcaagctca ccgtggacaa gagcaggtgg  3720

cagcagggga acgtcttctc atgctccgtg atgcatgagg ctctgcacaa ccactacacg  3780

cagaagagcc tctccctgtc tccgggtaaa tgaggatccg ttaacggtta ccaactacct  3840

agactggatt cgtgacaaca tgcggccgtg atatctacgt atgatcagcc tcgactgtgc  3900

cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag  3960

gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta  4020

ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag  4080

acaatagcag gcatgctggg gatgcggtgg gctctatgga accagctggg gctcgacagc  4140

gctggatctc ccgatcccca gctttgcttc tcaatttctt atttgcataa tgagaaaaaa  4200

aggaaaatta attttaacac caattcagta gttgattgag caaatgcgtt gccaaaaagg  4260

atgctttaga gacagtgttc tctgcacaga taaggacaaa cattattcag agggagtacc  4320

cagagctgag actcctaagc cagtgagtgg cacagcattc tagggagaaa tatgcttgtc  4380

atcaccgaag cctgattccg tagagccaca ccttggtaag ggccaatctg ctcacacagg  4440

atagagaggg caggagccag ggcagagcat ataaggtgag gtaggatcag ttgctcctca  4500

catttgcttc tgacatagtt gtgttgggag cttggatagc ttggacagct cagggctgcg  4560

atttcgcgcc aaacttgacg gcaatcctag cgtgaaggct ggtaggattt tatccccgct  4620

gccatcatgg ttcgaccatt gaactgcatc gtcgccgtgt cccaaaatat ggggattggc  4680

aagaacggag acctaccctg gcctccgctc aggaacgagt tcaagtactt ccaaagaatg  4740

accacaacct cttcagtgga aggtaaacag aatctggtga ttatgggtag gaaaacctgg  4800

ttctccattc ctgagaagaa tcgaccttta aaggacagaa ttaatatagt tctcagtaga  4860

gaactcaaag aaccaccacg aggagctcat tttcttgcca aaagtttgga tgatgcctta  4920

agacttattg aacaaccgga attggcaagt aaagtagaca tggtttggat agtcggaggc  4980

agttctgttt accaggaagc catgaatcaa ccaggccacc ttagactctt tgtgacaagg  5040

atcatgcagg aatttgaaag tgacacgttt ttcccagaaa ttgatttggg gaaatataaa  5100

cttctcccag aatacccagg cgtcctctct gaggtccagg aggaaaaagg catcaagtat  5160

aagtttgaag tctacgagaa gaaagactaa caggaagatg ctttcaagtt ctctgctccc  5220

ctcctaaagc tatgcatttt tataagacca tgggactttt gctggcttta gatcagcctc  5280

gactgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac  5340

cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg  5400

tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga  5460

ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggaac cagctggggc  5520

tcgagctact agctttgctt ctcaatttct tatttgcata atgagaaaaa aaggaaaatt  5580

aattttaaca ccaattcagt agttgattga gcaaatgcgt tgccaaaaag gatgctttag  5640

agacagtgtt ctctgcacag ataaggacaa acattattca gagggagtac ccagagctga  5700

gactcctaag ccagtgagtg gcacagcatt ctagggagaa atatgcttgt catcaccgaa  5760

gcctgattcc gtagagccac accttggtaa gggccaatct gctcacacag gatagagagg  5820

gcaggagcca gggcagagca tataaggtga ggtaggatca gttgctcctc acatttgctt  5880

ctgacatagt tgtgttggga gcttggatcg atcctctatg gttgaacaag atggattgca  5940

cgcaggttct ccggccgctt gggtggagag gctattcggc tatgactggg cacaacagac  6000

aatcggctgc tctgatgccg ccgtgttccg gctgtcagcg caggggcgcc cggttctttt  6060

tgtcaagacc gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc  6120

gtggctggcc acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg  6180

aagggactgg ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc  6240

tcctgccgag aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc  6300

ggctacctgc ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat  6360

ggaagccggt cttgtcgatc aggatgatct ggacgaagag catcaggggc tcgcgccagc  6420

cgaactgttc gccaggctca aggcgcgcat gcccgacggc gaggatctcg tcgtgaccca  6480

tggcgatgcc tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga  6540

ctgtggccgg ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat  6600

tgctgaagag cttggcggcg aatgggctga ccgcttcctc gtgctttacg gtatcgccgc  6660

tcccgattcg cagcgcatcg ccttctatcg ccttcttgac gagttcttct gagcgggact  6720

ctggggttcg aaatgaccga ccaagcgacg cccaacctgc catcacgaga tttcgattcc  6780

accgccgcct tctatgaaag gttgggcttc ggaatcgttt tccgggacgc cggctggatg  6840

atcctccagc gcggggatct catgctggag ttcttcgccc accccaactt gtttattgca  6900

gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt  6960

tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatc tatcttatca tgtctggatc  7020

gcggccgcga tcccgtcgag agcttggcgt aatcatggtc atagctgttt cctgtgtgaa  7080

attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct  7140

ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc  7200

agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg  7260

gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc  7320

ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag  7380

gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa  7440

aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc  7500

gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc  7560

ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg  7620

cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt  7680

cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc  7740

gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc  7800

cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag  7860

agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg  7920

ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa  7980

ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag  8040

gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact  8100

cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa  8160

attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt  8220

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag  8280

ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca  8340

gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc  8400

agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt  8460

ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg  8520

ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca  8580

gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg  8640

ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca  8700

tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg  8760

tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct  8820

cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca  8880

tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca  8940

gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg  9000

tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac  9060

ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt  9120

attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc  9180

cgcgcacatt tccccgaaaa gtgccacct                                    9209

<210>59

<211>384

<212>DNA

<213>Mus musculus

<400>59

atggattttc aggtgcagat tatcagcttc ctgctaatca gtgcttcagt cataatgtcc     60

agagggcaaa ttgttctctc ccagtctcca gcaatcctgt ctgcatctcc aggggagaag    120

gtcacaatga cttgcagggc cagctcaagt gtaagttaca tccactggtt ccagcagaag    180

ccaggatcct cccccaaacc ctggatttat gccacatcca acctggcttc tggagtccct    240

gttcgcttca gtggcagtgg gtctgggact tcttactctc tcacaatcag cagagtggag    300

gctgaagatg ctgccactta ttactgccag cagtggacta gtaacccacc cacgttcgga    360

ggggggacca agctggaaat caaa                                           384

<2l0>60

<211>128

<212>PRT

<213>Mus musculus

<400>60

Met Asp Phe Gln Val Gln Ile Ile Ser Phe Leu Leu Ile Ser Ala Ser

1               5                   10                  15

Val Ile Met Ser Arg Gly Gln Ile Val Leu Ser Gln Ser Pro Ala Ile

            20                  25                  30

Leu Ser Ala Ser Pro Gly Glu Lys Val Thr Met Thr Cys Arg Ala Ser

        35                  40                  45

Ser Ser Val Ser Tyr Ile His Trp Phe Gln Gln Lys Pro Gly Ser Ser

    50                  55                  60

Pro Lys Pro Trp Ile Tyr Ala Thr Ser Asn Leu Ala Ser Gly Val Pro

65                  70                  75                  80

Val Arg Phe Ser Gly Ser Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile

                85                  90                  95

Ser Arg Val Glu Ala Glu Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp

            100                 105                 110

Thr Ser Asn Pro Pro Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

        115                 120                 125

<210>61

<211>420

<212>DNA

<213>Mus musculus

<400>61

atgggttgga gcctcatctt gctcttcctt gtcgctgttg ctacgcgtgt cctgtcccag     60

gtacaactgc agcagcctgg ggctgagctg gtgaagcctg gggcctcagt gaagatgtcc    120

tgcaaggctt ctggctacac atttaccagt tacaatatgc actgggtaaa acagacacct    180

ggtcggggcc tggaatggat tggagctatt tatcccggaa atggtgatac ttcctacaat    240

cagaagttca aaggcaaggc cacattgact gcagacaaat cctccagcac agcctacatg    300

cagctcagca gcctgacatc tgaggactct gcggtctatt actgtgcaag atcgacttac    360

tacggcggtg actggtactt caatgtctgg ggcgcaggga ccacggtcac cgtctctgca    420

<210>62

<211>140

<212>PRT

<213>Mus musculus

<400>62

Met Gly Trp Ser Leu Ile Leu Leu Phe Leu Val Ala Val Ala Thr Arg

1               5                   10                  15

Val Leu Ser Gln Val Gln Leu Gln Gln Pro Gly Ala Glu Leu Val Lys

            20                  25                  30

Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr Phe

        35                  40                  45

Thr Ser Tyr Asn Met His Trp Val Lys Gln Thr Pro Gly Arg Gly Leu

    50                  55                  60

Glu Trp Ile Gly Ala Ile Tyr Pro Gly Asn Gly Asp Thr Ser Tyr Asn

65                  70                  75              80

Gln Lys Phe Lys Gly Lys Ala Thr Leu Thr Ala Asp Lys Ser Ser Ser

                85                  90                  95

Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala Val

            100                 105                 110

Tyr Tyr Cys Ala Arg Ser Thr Tyr Tyr Gly Gly Asp Trp Tyr Phe Asn

        115                 120                 125

Val Trp Gly Ala Gly Thr Thr Val Thr Val Ser Ala

    130                 135                 140

<210>63

<211>1395

<212>DNA

<213>智人

<400>63

atgtattcca atgtgatagg aactgtaacc tctggaaaaa ggaaggttta tcttttgtcc     60

ttgctgctca ttggcttctg ggactgcgtg acctgtcacg ggagccctgt ggacatctgc    120

acagccaagc cgcgggacat tcccatgaat cccatgtgca tttaccgctc cccggagaag    180

aaggcaactg aggatgaggg ctcagaacag aagatcccgg aggccaccaa ccggcgtgtc    240

tgggaactgt ccaaggccaa ttcccgcttt gctaccactt tctatcagca cctggcagat    300

tccaagaatg acaatgataa cattttcctg tcacccctga gtatctccac ggcttttgct    360

atgaccaagc tgggtgcctg taatgacacc ctccagcaac tgatggaggt atttaagttt    420

gacaccatat ctgagaaaac atctgatcag atccacttct tctttgccaa actgaactgc    480

cgactctatc gaaaagccaa caaatcctcc aagttagtat cagccaatcg cctttttgga    540

gacaaatccc ttaccttcaa tgagacctac caggacatca gtgagttggt atatggagcc   600

aagctccagc ccctggactt caaggaaaat gcagagcaat ccagagcggc catcaacaaa   660

tgggtgtcca ataagaccga aggccgaatc accgatgtca ttccctcgga agccatcaat   720

gagctcactg ttctggtgct ggttaacacc atttacttca agggcctgtg gaagtcaaag   780

ttcagccctg agaacacaag gaaggaactg ttctacaagg ctgatggaga gtcgtgttca   840

gcatctatga tgtaccagga aggcaagttc cgttatcggc gcgtggctga aggcacccag   900

gtgcttgagt tgcccttcaa aggtgatgac atcaccatgg tcctcatctt gcccaagcct   960

gagaagagcc tggccaaggt ggagaaggaa ctcaccccag aggtgctgca ggagtggctg  1020

gatgaattgg aggagatgat gctggtggtc cacatgcccc gcttccgcat tgaggacggc  1080

ttcagtttga aggagcagct gcaagacatg ggccttgtcg atctgttcag ccctgaaaag  1140

tccaaactcc caggtattgt tgcagaaggc cgagatgacc tctatgtctc agatgcattc  1200

cataaggcat ttcttgaggt aaatgaagaa ggcagtgaag cagctgcaag taccgctgtt  1260

gtgattgctg gccgttcgct aaaccccaac agggtgactt tcaaggccaa caggcctttc  1320

ctggttttta taagagaagt tcctctgaac actattatct tcatgggcag agtagccaac  1380

ccttgtgtta agtaa                                                   1395

<210>64

<211>464

<212>PRT

<213>智人

<400>64

Met Tyr Ser Asn Val Ile Gly Thr Val Thr Ser Gly Lys Arg Lys Val

1               5                   10                  15

Tyr Leu Leu Ser Leu Leu Leu Ile Gly Phe Trp Asp Cys Val Thr Cys

            20                  25                  30

His Gly Ser Pro Val Asp Ile Cys Thr Ala Lys Pro Arg Asp Ile Pro

        35                  40                  45

Met Asn Pro Met Cys Ile Tyr Arg Ser Pro Glu Lys Lys Ala Thr Glu

    50                  55                  60

Asp Glu Gly Ser Glu Gin Lys Ile Pro Glu Ala Thr Asn Arg Arg Val

65                  70                  75                  80

Trp Glu Leu Ser Lys Ala Asn Ser Arg Phe Ala Thr Thr Phe Tyr Gln

                85                  90                  95

His Leu Ala Asp Ser Lys Asn Asp Asn Asp Asn Ile Phe Leu Ser Pro

            100                 105                 110

Leu Ser Ile Ser Thr Ala Phe Ala Met Thr Lys Leu Gly Ala Cys Asn

        115                 120                 125

Asp Thr Leu Gln Gln Leu Met Glu Val Phe Lys Phe Asp Thr Ile Ser

    130                 135                 140

Glu Lys Thr Ser Asp Gln Ile His Phe Phe Phe Ala Lys Leu Asn Cys

145                 150                 155                 160

Arg Leu Tyr Arg Lys Ala Asn Lys Ser Ser Lys Leu Val Ser Ala Asn

                165                 170                 175

Arg Leu Phe Gly Asp Lys Ser Leu Thr Phe Asn Glu Thr Tyr Gln Asp

            180                 185                 190

Ile Ser Glu Leu Val Tyr Gly Ala Lys Leu Gln Pro Leu Asp Phe Lys

        195                 200                 205

Glu Asn Ala Glu Gln Ser Arg Ala Ala Ile Asn Lys Trp Val Ser Asn

    210                 215                 220

Lys Thr Glu Gly Arg Ile Thr Asp Val Ile Pro Ser Glu Ala Ile Asn

225                 230                 235                 240

Glu Leu Thr Val Leu Val Leu Val Asn Thr Ile Tyr Phe Lys Gly Leu

                245                 250                 255

Trp Lys Ser Lys Phe Ser Pro Glu Asn Thr Arg Lys Glu Leu Phe Tyr

            260                 265                 270

Lys Ala Asp Gly Glu Ser Cys Ser Ala Ser Met Met Tyr Gln Glu Gly

        275                 280                 285

Lys Phe Arg Tyr Arg Arg Val Ala Glu Gly Thr Gln Val Leu Glu Leu

    290                 295                 300

Pro Phe Lys Gly Asp Asp Ile Thr Met Val Leu Ile Leu Pro Lys Pro

305                 310                 315                 320

Glu Lys Ser Leu Ala Lys Val Glu Lys Glu Leu Thr Pro Glu Val Leu

                325                 330                 335

Gln Glu Trp Leu Asp Glu Leu Glu Glu Met Met Leu Val Val His Met

            340                 345                 350

Pro Arg Phe Arg Ile Glu Asp Gly Phe Ser Leu Lys Glu Gln Leu Gln

        355                 360                 365

Asp Met Gly Leu Val Asp Leu Phe Ser Pro Glu Lys Ser Lys Leu Pro

    370                 375                 380

Gly Ile Val Ala Glu Gly Arg Asp Asp Leu Tyr Val Ser Asp Ala Phe

385                 390                 395                 400

His Lys Ala Phe Leu Glu Val Asn Glu Glu Gly Ser Glu Ala Ala Ala

                405                 410                 415

Ser Thr Ala Val Val Ile Ala Gly Arg Ser Leu Asn Pro Asn Arg Val

            420                 425                 430

Thr Phe Lys Ala Asn Arg Pro Phe Leu Val Phe Ile Arg Glu Val Pro

        435                 440                 445

Leu Asn Thr Ile Ile Phe Met Gly Arg Val Ala Asn Pro Cys Val Lys

    450                 455                 460

<210>65

<211>1962

<212>DNA

<213>智人

<400>65

atgcgtcccc tgcgcccccg cgccgcgctg ctggcgctcc tggcctcgct cctggccgcg   60

cccccggtgg ccccggccga ggccccgcac ctggtgcagg tggacgcggc ccgcgcgctg  120

tggcccctgc ggcgcttctg gaggagcaca ggcttctgcc ccccgctgcc acacagccag  180

gctgaccagt acgtcctcag ctgggaccag cagctcaacc tcgcctatgt gggcgccgtc  240

cctcaccgcg gcatcaagca ggtccggacc cactggctgc tggagcttgt caccaccagg  300

gggtccactg gacggggcct gagctacaac ttcacccacc tggacgggta cttggacctt  360

ctcagggaga accagctcct cccagggttt gagctgatgg gcagcgcctc gggccacttc  420

actgactttg aggacaagca gcaggtgttt gagtggaagg acttggtctc cagcctggcc  480

aggagataca tcggtaggta cggactggcg catgtttcca agtggaactt cgagacgtgg  540

aatgagccag accaccacga ctttgacaac gtctccatga ccatgcaagg cttcctgaac  600

tactacgatg cctgctcgga gggtctgcgc gccgccagcc ccgccctgcg gctgggaggc  660

cccggcgact ccttccacac cccaccgcga tccccgctga gctggggcct cctgcgccac  720

tgccacgacg gtaccaactt cttcactggg gaggcgggcg tgcggctgga ctacatctcc  780

ctccacagga agggtgcgcg cagctccatc tccatcctgg agcaggagaa ggtcgtcgcg  840

cagcagatcc ggcagctctt ccccaagttc gcggacaccc ccatttacaa cgacgaggcg  900

gacccgctgg tgggctggtc cctgccacag ccgtggaggg cggacgtgac ctacgcggcc   960

atggtggtga aggtcatcgc gcagcatcag aacctgctac tggccaacac cacctccgcc  1020

ttcccctacg cgctcctgag caacgacaat gccttcctga gctaccaccc gcaccccttc  1080

gcgcagcgca cgctcaccgc gcgcttccag gtcaacaaca cccgcccgcc gcacgtgcag  1140

ctgttgcgca agccggtgct cacggccatg gggctgctgg cgctgctgga tgaggagcag  1200

ctctgggccg aagtgtcgca ggccgggacc gtcctggaca gcaaccacac ggtgggcgtc  1260

ctggccagcg cccaccgccc ccagggcccg gccgacgcct ggcgcgccgc ggtgctgatc  1320

tacgcgagcg acgacacccg cgcccacccc aaccgcagcg tcgcggtgac cctgcggctg  1380

cgcggggtgc cccccggccc gggcctggtc tacgtcacgc gctacctgga caacgggctc  1440

tgcagccccg acggcgagtg gcggcgcctg ggccggcccg tcttccccac ggcagagcag  1500

ttccggcgca tgcgcgcggc tgaggacccg gtggccgcgg cgccccgccc cttacccgcc  1560

ggcggccgcc tgaccctgcg ccccgcgctg cggctgccgt cgcttttgct ggtgcacgtg  1620

tgtgcgcgcc ccgagaagcc gcccgggcag gtcacgcggc tccgcgccct gcccctgacc  1680

caagggcagc tggttctggt ctggtcggat gaacacgtgg gctccaagtg cctgtggaca  1740

tacgagatcc agttctctca ggacggtaag gcgtacaccc cggtcagcag gaagccatcg  1800

accttcaacc tctttgtgtt cagcccagac acaggtgctg tctctggctc ctaccgagtt  1860

cgagccctgg actactgggc ccgaccaggc cccttctcgg accctgtgcc gtacctggag  1920

gtccctgtgc caagagggcc cccatccccg ggcaatccat ga                     1962

<210>66

<211>653

<212>PRT

<213>智人

<400>66

Met Arg Pro Leu Arg Pro Arg Ala Ala Leu Leu Ala Leu Leu Ala Ser

1               5                   10                  15

Leu Leu Ala Ala Pro Pro Val Ala Pro Ala Glu Ala Pro His Leu Val

            20                  25                  30

Gln Val Asp Ala Ala Arg Ala Leu Trp Pro Leu Arg Arg Phe Trp Arg

        35                  40                  45

Ser Thr Gly Phe Cys Pro Pro Leu Pro His Ser Gln Ala Asp Gln Tyr

    50                  55                  60

Val Leu Ser Trp Asp Gln Gln Leu Asn Leu Ala Tyr Val Gly Ala Val

65                  70                  75                  80

Pro His Arg Gly Ile Lys Gln Val Arg Thr His Trp Leu Leu Glu Leu

                85                  90                  95

Val Thr Thr Arg Gly Ser Thr Gly Arg Gly Leu Ser Tyr Asn Phe Thr

            100                 105                 110

His Leu Asp Gly Tyr Leu Asp Leu Leu Arg Glu Asn Gln Leu Leu Pro

        115                 120                 125

Gly Phe Glu Leu Met Gly Ser Ala Ser Gly His Phe Thr Asp Phe Glu

    130                 135                 140

Asp Lys Gln Gln Val Phe Glu Trp Lys Asp Leu Val Ser Ser Leu Ala

145                 150                 155                 160

Arg Arg Tyr Ile Gly Arg Tyr Gly Leu Ala His Val Ser Lys Trp Asn

                165                 170                 175

Phe Glu Thr Trp Asn Glu Pro Asp His His Asp Phe Asp Asn Val Ser

            180                 185                 190

Met Thr Met Gln Gly Phe Leu Asn Tyr Tyr Asp Ala Cys Ser Glu Gly

        195                 200                 205

Leu Arg Ala Ala Ser Pro Ala Leu Arg Leu Gly Gly Pro Gly Asp Ser

    2l0                 215                 220

Phe His Thr Pro Pro Arg Ser Pro Leu Ser Trp Gly Leu Leu Arg His

225                 230                 235                 240

Cys His Asp Gly Thr Asn Phe Phe Thr Gly Glu Ala Gly Val Arg Leu

                245                 250                 255

Asp Tyr Ile Ser Leu His Arg Lys Gly Ala Arg Ser Ser Ile Ser Ile

            260                 265                 270

Leu Glu Gln Glu Lys Val Val Ala Gln Gln Ile Arg Gln Leu Phe Pro

        275                 280                 285

Lys Phe Ala Asp Thr Pro Ile Tyr Asn Asp Glu Ala Asp Pro Leu Val

    290                 295                 300

Gly Trp Ser Leu Pro Gln Pro Trp Arg Ala Asp Val Thr Tyr Ala Ala

305                 310                 315                 320

Met Val Val Lys Val Ile Ala Gln His Gln Asn Leu Leu Leu Ala Asn

                325                 330                 335

Thr Thr Ser Ala Phe Pro Tyr Ala Leu Leu Ser Asn Asp Asn Ala Phe

            340                 345                 350

Leu Ser Tyr His Pro His Pro Phe Ala Gln Arg Thr Leu Thr Ala Arg

        355                 360                 365

Phe Gln Val Asn Asn Thr Arg Pro Pro His Val Gln Leu Leu Arg Lys

    370                 375                 380

Pro Val Leu Thr Ala Met Gly Leu Leu Ala Leu Leu Asp Glu Glu Gln

385                 390                 395                 400

Leu Trp Ala Glu Val Ser Gln Ala Gly Thr Val Leu Asp Ser Asn His

                405                 410                 415

Thr Val Gly Val Leu Ala Ser Ala His Arg Pro Gln Gly Pro Ala Asp

            420                 425                 430

Ala Trp Arg Ala Ala Val Leu Ile Tyr Ala Ser Asp Asp Thr Arg Ala

        435                 440                 445

His Pro Asn Arg Ser Val Ala Val Thr Leu Arg Leu Arg Gly Val Pro

    450                 455                 460

Pro Gly Pro Gly Leu Val Tyr Val Thr Arg Tyr Leu Asp Asn Gly Leu

465                 470                 475                 480

Cys Ser Pro Asp Gly Glu Trp Arg Arg Leu Gly Arg Pro Val Phe Pro

                485                 490                 495

Thr Ala Glu Gln Phe Arg Arg Met Arg Ala Ala Glu Asp Pro Val Ala

            500                 505                 510

Ala Ala Pro Arg Pro Leu Pro Ala Gly Gly Arg Leu Thr Leu Arg Pro

        515                 520                 525

Ala Leu Arg Leu Pro Ser Leu Leu Leu Val His Val Cys Ala Arg Pro

    530                 535                 540

Glu Lys Pro Pro Gly Gln Val Thr Arg Leu Arg Ala Leu Pro Leu Thr

545                 550                 555                 560

Gln Gly Gln Leu Val Leu Val Trp Ser Asp Glu His Val Gly Ser Lys

                565                 570                 575

Cys Leu Trp Thr Tyr Glu Ile Gln Phe Ser Gln Asp Gly Lys Ala Tyr

            580                 585                 590

Thr Pro Val Ser Arg Lys Pro Ser Thr Phe Asn Leu Phe Val Phe Ser

        595                 600                 605

Pro Asp Thr Gly Ala Val Ser Gly Ser Tyr Arg Val Arg Ala Leu Asp

    610                 615                 620

Tyr Trp Ala Arg Pro Gly Pro Phe Ser Asp Pro Val Pro Tyr Leu Glu

625                 630                 635                 640

Val Pro Val Pro Arg Gly Pro Pro Ser Pro Gly Asn Pro

                645                 650

<210>67

<211>1290

<212>DNA

<213>智人

<400>67

atgcagctga ggaacccaga actacatctg ggctgcgcgc ttgcgcttcg cttcctggcc   60

ctcgtttcct gggacatccc tggggctaga gcactggaca atggattggc aaggacgcct  120

accatgggct ggctgcactg ggagcgcttc atgtgcaacc ttgactgcca ggaagagcca  180

gattcctgca tcagtgagaa gctcttcatg gagatggcag agctcatggt ctcagaaggc  240

tggaaggatg caggttatga gtacctctgc attgatgact gttggatggc tccccaaaga  300

gattcagaag gcagacttca ggcagaccct cagcgctttc ctcatgggat tcgccagcta  360

gctaattatg ttcacagcaa aggactgaag ctagggattt atgcagatgt tggaaataaa  420

acctgcgcag gcttccctgg gagttttgga tactacgaca ttgatgccca gacctttgct  480

gactggggag tagatctgct aaaatttgat ggttgttact gtgacagttt ggaaaatttg  540

gcagatggtt ataagcacat gtccttggcc ctgaatagga ctggcagaag cattgtgtac  600

tcctgtgagt ggcctcttta tatgtggccc tttcaaaagc ccaattatac agaaatccga  660

cagtactgca atcactggcg aaattttgct gacattgatg attcctggaa aagtataaag  720

agtatcttgg actggacatc ttttaaccag gagagaattg ttgatgttgc tggaccaggg  780

ggttggaatg acccagatat gttagtgatt ggcaactttg gcctcagctg gaatcagcaa  840

gtaactcaga tggccctctg ggctatcatg gctgctcctt tattcatgtc taatgacctc  900

cgacacatca gccctcaagc caaagctctc cttcaggata aggacgtaat tgccatcaat  960

caggacccct tgggcaagca agggtaccag cttagacagg gagacaactt tgaagtgtgg 1020

gaacgacctc tctcaggctt agcctgggct gtagctatga taaaccggca ggagattggt 1080

ggacctcgct cttataccat cgcagttgct tccctgggta aaggagtggc ctgtaatcct 1140

gcctgcttca tcacacagct cctccctgtg aaaaggaagc tagggttcta tgaatggact 1200

tcaaggttaa gaagtcacat aaatcccaca ggcactgttt tgcttcagct agaaaataca  1260

atgcagatgt cattaaaaga cttactttaa                                   1290

<210>68

<211>429

<212>PRT

<213>智人

<400>68

Met Gln Leu Arg Asn Pro Glu Leu His Leu Gly Cys Ala Leu Ala Leu

1               5                   10                  15

Arg Phe Leu Ala Leu Val Ser Trp Asp Ile Pro Gly Ala Arg Ala Leu

            20                  25                  30

Asp Asn Gly Leu Ala Arg Thr Pro Thr Met Gly Trp Leu His Trp Glu

        35                  40                  45

Arg Phe Met Cys Ash Leu Asp Cys Gln Glu Glu Pro Asp Ser Cys Ile

    50                  55                  60

Ser Glu Lys Leu Phe Met Glu Met Ala Glu Leu Met Val Ser Glu Gly

65                  70                  75                  80

Trp Lys Asp Ala Gly Tyr Glu Tyr Leu Cys Ile Asp Asp Cys Trp Met

                85                  90                  95

Ala Pro Gln Arg Asp Ser Glu Gly Arg Leu Gln Ala Asp Pro Gln Arg

            100                 105                 110

Phe Pro His Gly Ile Arg Gln Leu Ala Asn Tyr Val His Ser Lys Gly

        115                 120                 125

Leu Lys Leu Gly Ile Tyr Ala Asp Val Gly Asn Lys Thr Cys Ala Gly

    130                 135                 140

Phe Pro Gly Ser Phe Gly Tyr Tyr Asp Ile Asp Ala Gln Thr Phe Ala

145                 150                 155                 160

Asp Trp Gly Val Asp Leu Leu Lys Phe Asp Gly Cys Tyr Cys Asp Ser

                165                 170                 175

Leu Glu Asn Leu Ala Asp Gly Tyr Lys His Met Ser Leu Ala Leu Asn

            180                 185                 190

Arg Thr Gly Arg Ser Ile Val Tyr Set Cys Glu Trp Pro Leu Tyr Met

        195                 200                 205

Trp Pro Phe Gln Lys Pro Asn Tyr Thr Glu Ile Arg Gln Tyr Cys Asn

    210                 215                 220

His Trp Arg Asn Phe Ala Asp Ile Asp Asp Ser Trp Lys Ser Ile Lys

225                 230                 235                 240

Ser Ile Leu Asp Trp Thr Ser Phe Asn Gln Glu Arg Ile Val Asp Val

                245                 250                 255

Ala Gly Pro Gly Gly Trp Asn Asp Pro Asp Met Leu Val Ile Gly Asn

            260                 265                 270

Phe Gly Leu Ser Trp Asn Gln Gln Val Thr Gln Met Ala Leu Trp Ala

        275                 280                 285

Ile Met Ala Ala Pro Leu Phe Met Ser Asn Asp Leu Arg His Ile Ser

    290                 295                 300

Pro Gln Ala Lys Ala Leu Leu Gln Asp Lys Asp Val Ile Ala Ile Asn

305                 310                 315                 320

Gln Asp Pro Leu Gly Lys Gln Gly Tyr Gln Leu Arg Gln Gly Asp Asn

                325                 330                 335

Phe Glu Val Trp Glu Arg Pro Leu Ser Gly Leu Ala Trp Ala Val Ala

            340                 345                 350

Met Ile Asn Arg Gln Glu Ile Gly Gly Pro Arg Ser Tyr Thr Ile Ala

        355                 360                 365

Val Ala Ser Leu Gly Lys Gly Val Ala Cys Asn Pro Ala Cys Phe Ile

    370                 375                 380

Thr Gln Leu Leu Pro Val Lys Arg Lys Leu Gly Phe Tyr Glu Trp Thr

385                 390                 395                 400

Ser Arg Leu Arg Ser His Ile Asn Pro Thr Gly Thr Val Leu Leu Gln

                405                 410                 415

Leu Glu Asn Thr Met Gln Met Ser Leu Lys Asp Leu Leu

            420                 425

<210>69

<211>351

<212>DNA

<213>智人

<400>69

atggattact acagaaaata tgcagctatc tttctggtca cattgtcggt gtttctgcat   60

gttctccatt ccgctcctga tgtgcaggat tgcccagaat gcacgctaca ggaaaaccca  120

ttcttctccc agccgggtgc cccaatactt cagtgcatgg gctgctgctt ctctagagca  180

tatcccactc cactaaggtc caagaagacg atgttggtcc aaaagaacgt cacctcagag  240

tccacttgct gtgtagctaa atcatataac agggtcacag taatgggggg tttcaaagtg  300

gagaaccaca cggcgtgcca ctgcagtact tgttattatc acaaatctta a           351

<210>70

<211>116

<212>PRT

<213>智人

<400>70

Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser

1               5                   10                  15

Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro

            20                  25                  30

Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro

        35                  40                  45

Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro

    50                  55                  60

Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu

65                  70                  75                  80

Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly

                85                  90                  95

Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr

            100                 105                 110

Tyr His Lys Ser

        115

<210>71

<211>498

<212>DNA

<213>智人

<400>71

atggagatgt tccaggggct gctgctgttg ctgctgctga gcatgggcgg gacatgggca   60

tccaaggagc cgcttcggcc acggtgccgc cccatcaatg ccaccctggc tgtggagaag  120

gagggctgcc ccgtgtgcat caccgtcaac accaccatct gtgccggcta ctgccccacc  180

atgacccgcg tgctgcaggg ggtcctgccg gccctgcctc aggtggtgtg caactaccgc  240

gatgtgcgct tcgagtccat ccggctccct ggctgcccgc gcggcgtgaa ccccgtggtc  300

tcctacgccg tggctctcag ctgtcaatgt gcactctgcc gccgcagcac cactgactgc  360

gggggtccca aggaccaccc cttgacctgt gatgaccccc gcttccagga ctcctcttcc  420

tcaaaggccc ctccccccag ccttccaagc ccatcccgac tcccggggcc ctcggacacc 480

ccgatcctcc cacaataa                                               498

<210>72

<211>165

<212>PRT

<213>智人

<400>72

Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly

1               5                   10                  15

Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile

            20                  25                  30

Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr

        35                  40                  45

Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val

    50                  55                  60

Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg

65                  70                  75                  80

Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val

                85                  90                  95

Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu

            100                 105                 110

Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu

        115                 120                 125

Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro

    130                 135                 140

Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr

145                 150                 155                 160

Pro Ile Leu Pro Gln

                165

<210>73

<211>165

<212>PRT

<213>智人

<400>73

Ala Pro Pro Arg Leu Ile Cys Asp Ser Arg Val Leu Glu Arg Tyr Leu

1               5                   10                  15

Leu Glu Ala Lys Glu Ala Glu Asn Ile Thr Thr Gly Cys Ala Glu His

            20                  25                      30

Cys Ser Leu Asn Glu Asn Ile Thr Val Pro Asp Thr Lys Val Asn Phe

        35                  40                      45

Tyr Ala Trp Lys Arg Met Glu Val Gly Gln Gln Ala Val Glu Val Trp

    50                  55                      60

Gln Gly Leu Ala Leu Leu Ser Glu Ala Val Leu Arg Gly Gln Ala Leu

65                  70                  75                  80

Leu Val Asn Ser Ser Gln Pro Trp Glu Pro Leu Gln Leu His Val Asp

                85                  90                  95

Lys Ala Val Ser Gly Leu Arg Ser Leu Thr Thr Leu Leu Arg Ala Leu

            100                 105                 110

Gly Ala Gln Lys Glu Ala Ile Ser Pro Pro Asp Ala Ala Ser Ala Ala

        115                 120                 125

Pro Leu Arg Thr Ile Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg Val

    130                 135                 140

Tyr Ser Asn Phe Leu Arg Gly Lys Leu Lys Leu Tyr Thr Gly Glu Ala

145                 150                 155                 160

Cys Arg Thr Gly Asp

                165

<210>74

<211>588

<212>DNA

<213>智人

<400>74

atggccctcc tgttccctct actggcagcc ctagtgatga ccagctatag ccctgttgga   60

tctctgggct gtgatctgcc tcagaaccat ggcctactta gcaggaacac cttggtgctt  120

ctgcaccaaa tgaggagaat ctcccctttc ttgtgtctca aggacagaag agacttcagg  180

ttcccccagg agatggtaaa agggagccag ttgcagaagg cccatgtcat gtctgtcctc  240

catgagatgc tgcagcagat cttcagcctc ttccacacag agcgctcctc tgctgcctgg  300

aacatgaccc tcctagacca actccacact ggacttcatc agcaactgca acacctggag  360

acctgcttgc tgcaggtagt gggagaagga gaatctgctg gggcaattag cagccctgca  420

ctgaccttga ggaggtactt ccagggaatc cgtgtctacc tgaaagagaa gaaatacagc  480

gactgtgcct gggaagttgt cagaatggaa atcatgaaat ccttgttctt atcaacaaac  540

atgcaagaaa gactgagaag taaagataga gacctgggct catcttga                588

<210>75

<211>195

<212>PRT

<213>智人

<400>75

Met Ala Leu Leu Phe Pro Leu Leu Ala Ala Leu Val Met Thr Ser Tyr

1               5                   10                  15

Ser Pro Val Gly Ser Leu Gly Cys Asp Leu Pro Gln Asn His Gly Leu

            20                  25                  30

Leu Ser Arg Asn Thr Leu Val Leu Leu His Gln Met Arg Arg Ile Ser

        35                  40                  45

Pro Phe Leu Cys Leu Lys Asp Arg Arg Asp Phe Arg Phe Pro Gln Glu

    50                  55                  60

Met Val Lys Gly Ser Gln Leu Gln Lys Ala His Val Met Ser Val Leu

65                  70                  75                  80

His Glu Met Leu Gln Gln Ile Phe Ser Leu Phe His Thr Glu Arg Ser

                85                  90                  95

Ser Ala Ala Trp Asn Met Thr Leu Leu Asp Gln Leu His Thr Gly Leu

            100                 105                 110

His Gln Gln Leu Gln His Leu Glu Thr Cys Leu Leu Gln Val Val Gly

        115                 120                 125

Glu Gly Glu Ser Ala Gly Ala Ile Ser Ser Pro Ala Leu Thr Leu Arg

    130                 135                 140

Arg Tyr Phe Gln Gly Ile Arg Val Tyr Leu Lys Glu Lys Lys Tyr Ser

145                 150                 155                 160

Asp Cys Ala Trp Glu Val Val Arg Met Glu Ile Met Lys Ser Leu Phe

                165                 170                     175

Leu Ser Thr Asn Met Gln Glu Arg Leu Arg Ser Lys Asp Arg Asp Leu

            180                 185                 190

Gly Ser Ser

        195

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号