首页> 中国专利> 来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶的PA亚基片段及其用途

来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶的PA亚基片段及其用途

摘要

本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基之氨基端片段的多肽片段,其中所述PA亚基来自甲型流感2009大流行H1N1病毒或其变体。本发明还涉及(i)适于使用X射线晶体衍射对所述多肽片段进行结构测定的多肽片段晶体,以及(ii)使用所述多肽的结构坐标来筛选和设计对多肽片段中的核酸内裂解(endonucleolytically)活性位点进行调节(优选抑制)的化合物的计算方法。此外,本发明涉及鉴定(优选以高通量形式鉴定)与具有核酸内切酶活性的PA多肽片段结合并且优选抑制所述核酸内裂解活性的化合物的方法。本发明还涉及能够调节(优选抑制)本发明PA亚基多肽片段或其变体的核酸内切酶活性的化合物,以及包含所述化合物的药物组合物,其用于治疗由正粘病毒(Orthomyxoviridae)科、布尼亚病毒(Bunyaviridae)科和/或沙粒病毒科(Arenviridae)病毒通过病毒感染引起(优选由甲型流感2009大流行H1N1病毒的病毒感染引起)的疾病病症。优选地,所述化合物可通过本文公开的方法进行鉴定,或者所述药物组合物可通过本文公开的方法生产。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-03-10

    未缴年费专利权终止 IPC(主分类):C07K14/11 授权公告日:20150923 终止日期:20190315 申请日:20110315

    专利权的终止

  • 2015-09-23

    授权

    授权

  • 2013-03-06

    实质审查的生效 IPC(主分类):C07K14/11 申请日:20110315

    实质审查的生效

  • 2012-11-28

    公开

    公开

说明书

技术领域

本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基之氨基端片段的多肽片段,其中所述PA亚基来自甲型流感2009大流行H1N1病毒或其变体。本发明还涉及(i)适于使用X射线晶体衍射对所述多肽片段进行结构测定的多肽片段晶体,以及(ii)使用所述多肽的结构坐标来筛选和设计对多肽片段中的核酸内裂解(endonucleolytically)活性位点进行调节(优选抑制)的化合物的计算方法。此外,本发明涉及鉴定(优选以高通量形式鉴定)与具有核酸内切酶活性的PA多肽片段结合并且优选抑制所述核酸内裂解活性的化合物的方法。本发明还涉及能够调节(优选抑制)本发明PA亚基多肽片段或其变体的核酸内切酶活性的化合物,以及包含所述化合物的药物组合物,其用于治疗由正粘病毒(Orthomyxoviridae)科、布尼亚病毒(Bunyaviridae)科和/或沙粒病毒科(Arenviridae)病毒通过病毒感染引起(优选由甲型流感2009大流行H1N1病毒的病毒感染引起)的疾病病症。优选地,所述化合物可通过本文公开的方法进行鉴定,或者所述药物组合物可通过本文公开的方法生产。

背景技术

流感在世界范围内导致很高的发病率和死亡率,许多人认为它对人类来说是最为重要的病毒威胁。每年的流感流行席卷全球,而且偶发的新毒株导致破坏力巨大的大流行。目前,控制流感病毒流行的主要方法是疫苗接种。但是,很快就产生了避开疫苗接种作用的突变流感病毒。由于生产新的流感疫苗需要约6个月,所以尤其需要替代性治疗方法(即抗病毒药物)来作为对抗迅速传播的大流行的第一道防线。

开发抗病毒药物的一个极佳出发点是病毒必需蛋白的结构数据。因此,对流感病毒表面抗原神经氨酸酶的晶体结构测定(yon Itzstein等,1993;Nature 363:418-423)直接引导开发出了具有抗病毒活性的神经氨酸酶抑制剂,其阻止病毒从细胞中释放,但是不阻止病毒产生。随后这些神经氨酸酶抑制剂及其衍生物被开发成抗流感药物扎那米韦(Glaxo)和奥司他韦(Roche),许多国家目前都储备它们以用作对抗可能的大流行的第一道防线。但是,这些药物仅仅缩短临床疾病的持续时间。作为替代地,其它抗流感化合物例如金刚烷胺和金刚乙胺靶向病毒膜中的离子通道蛋白(即M2蛋白),干扰病毒在细胞内部的脱壳。但是,由于它们的副作用和抗性病毒突变体的迅速产生,它们尚未被广泛应用(Magden等,2005,Appl.Microbiol.Biotechnol.66:612-621)。此外,已经表明更不特异的病毒药物(例如利巴韦林)可用于治疗流感感染(Eriksson等,1977,Antimicrob.Agents Chemother.11:946-951)。但是,可能是由于严重的副作用,利巴韦林仅在几个国家得到批准(Furuta等,2005,Antimicrob.Agents Chemother.49:981-986)。显然,需要新型抗病毒化合物,优选为针对不同靶标的化合物。

甲、乙、丙型流感病毒和鲑传贫病毒(Isavirus)以及托高土病毒(Thogotovirus)属于正粘病毒,其与布尼亚病毒科(包括汉坦病毒(Hantavirus)、内罗病毒(Nairovirus)、正布尼亚病毒(Orthobunyavirus)、白蛉病毒(Phlebovirus)和番茄斑萎病毒(Tospovirus))都是负链RNA病毒。它们的基因组是分段的,并且存在于包含RNA依赖性RNA聚合酶的核糖核蛋白颗粒中,所述RNA依赖性RNA聚合酶(i)将最初的单链病毒粒RNA(vRNA)复制为病毒mRNA以及(ii)复制vRNA。对于病毒mRNA的产生,所述聚合酶利用所谓的“抢帽(cap-snatching)”机制(Plotch等,1981,Cell 23:847-858;Kukkonen等,2005,Arch.Virol.150:533-556;Lcahy等,1997,J.Virol.71:8347-8351;Noah和Krug,2005,Adv.Virus Res.65:121-145)。所述聚合酶包含三个亚基:PB1(聚合酶碱性蛋白)、PB2和PA。对于抢帽机制,病毒聚合酶通过PB2亚基与细胞mRNA分子的5’RNA帽结合,并且通过聚合酶的核酸内裂解活性在核苷酸10至13位对其进行切割。加帽的RNA片段作为引物用于通过PB1亚基中的核苷酸转移酶中心合成病毒mRNA(Li等,2001,EMBO J.20:2078-2086)。最终,通过聚合酶在模板5’端的寡聚U基序处的推进,病毒mRNA的3’端被聚腺苷酸化。最近的研究已清楚地确定了负责帽结合的PB2的结构域(Fechter等,2003,J.Biol.Chem.278:20381-20388;Guilligay等,2008 Nat.Struct.Mol.Biol.15:500-506)。至今认为聚合酶的核酸内裂解活性存在于PB1亚基中(Li等,同上)。

所述聚合酶复合体似乎是合适的抗病毒药物靶标,因为其对于病毒mRNA的合成和病毒复制来说是必需的,并且包含数个可能与宿主细胞蛋白质中存在的显著不同的功能性活性位点(Magden等,同上)。因此,例如,已尝试通过类似于PB1内PA结合结构域的25个氨基酸的肽来干扰聚合酶亚基的组装(Ghanem等,2007,J.Virol.81:7801-7804)。此外,已尝试通过核苷类似物(如2’-脱氧-2’-氟鸟苷)来干扰病毒转录(Tisdale等,1995,Antimicrob.Agents Chemother.39:2454-2458),并且已经证明T-705(经取代的吡嗪化合物)可用作流感病毒RNA聚合酶的特异性抑制剂(Furuta等,同上)。此外,已靶向聚合酶的核酸内切酶活性,并已鉴定出一系列4-取代的2,4-二氧代丁酸化合物作为流感病毒此活性的选择性抑制剂(Tomassini等,1994,Antimicrob.Agents Chemother.38:2827-2837)。另外,已证明氟他胺(在真菌物种Delitschia confertaspora的提取物中鉴定到的经取代的2,6-二酮哌嗪)抑制流感病毒的核酸内切酶(Tomassini等,1996,Antimicrob.Agents Chemother.40:1189-1193)。但是,迄今仅在聚合酶的完整三聚复合体的环境下研究了化合物对病毒聚合酶核酸内裂解活性的抑制作用。

虽然提出了聚合酶的PA亚基的帽结合和核酸内切酶活性、vRNA复制和有争议的蛋白酶活性,但是对其的功能性表征是最不充分的。PA(在甲型流感病毒中有716个残基)可通过胰酶消化在213位残基处分割。最近所测定的与PB1N端肽结合的PA C端三分之二的晶体结构提供了对PA亚基的一大部分(但是其功能仍不清楚)和亚基间关键相互作用之一的确切性质的一级结构的理解(He等,2008,Nature 454:1123-1126;Obayashi等,2008,Nature 454:1127-1131)。PA氨基端结构域中保守残基的系统突变已经鉴定出对聚合酶复合体的蛋白质稳定性、启动子结合、帽结合和核酸内切酶活性重要的残基(Hara等,2006,J.Virol.80:7789-7798)。已经广泛研究了完整病毒核糖核蛋白颗粒(RNP)环境下的核酸内切酶的酶学。

最近已发现,与本领域的一般观点相反,对于甲型H3N2流感病毒的RNA依赖性RNA聚合酶,核酸内裂解活性仅存在于PA亚基内(Dias等,2009)。

本发明人现已通过X射线晶体衍射对甲型流感2009大流行H1N1病毒的PA结构域进行结构表征,并且鉴定出所述结构域内的核酸内裂解活性中心。本发明人出乎意料的发现,所述病毒PA亚基的多肽片段易于结晶,因此,所述多肽片段非常适合于在所述多肽片段环境下研究甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶的核酸内裂解活性,从而简化靶向所述病毒聚合酶之核酸内切酶活性的新型抗病毒化合物的开发,并且优化之前鉴定的化合物。

本发明人对具有甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之核酸内裂解活性的PA多肽片段的重组产生允许使用可从直接表达系统中易于得到的材料对所述病毒聚合酶功能性位点的抑制剂进行体外高通量筛选。此外,核酸内裂解性PA H1N1多肽片段以及其中的酶活中心的结构数据允许定向设计抑制剂并且用计算机筛选潜在的治疗化合物。

而且,本发明人第一次实现了甲型流感2009大流行H1N1病毒PA亚基的PA多肽片段及其变体与结合的抑制剂的共结晶,并且发现可以改进靶向甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之核酸内切酶活性的新型抗病毒化合物的开发。尤其是,共结晶数据第一次详细示出甲型流感2009大流行H1N1病毒PA亚基的PA多肽片段活性位点中所包含的哪些氨基酸特别地参与化合物结合。该新知识允许对现有抑制剂的修饰进行优化设计以改善其效力,或者允许设计和优化有效阻断核酸内切酶活性的新型抑制剂。

本发明的一个目的是:(i)通过X射线晶体衍射提供H1N1病毒聚合酶PA亚基的核酸内裂解氨基端结构域的高分辨率结构数据,(ii)通过X射线晶体衍射提供与已知抑制剂共结晶的H1N1病毒聚合酶PA亚基的核酸内裂解氨基端结构域的高分辨率结构数据,(iii)提供计算及体外方法(优选是高通量形式)来鉴定可以调节且优选抑制(优选通过阻断H1N1PA亚基内的核酸内裂解活性位点)甲型流感2009大流行H1N1病毒病毒聚合酶的核酸内切酶活性的化合物,以及(iv)提供包含这些化合物的药理学组合物以用于治疗由利用抢帽机制合成病毒mRNA的病毒所致的传染性疾病。

发明概述

在第一方面中,本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基的氨基端片段的多肽片段,其中所述PA亚基来自SEQ ID NO:2的甲型流感2009大流行H1N1病毒或者是其变体,其中所述变体在SEQ ID NO:2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。

在另一方面中,本发明涉及编码本发明的分离多肽片段的分离的多核苷酸。

在另一方面中,本发明涉及包含本发明的分离多核苷酸的重组载体。

在另一方面中,本发明涉及包含本发明的分离多核苷酸或本发明的重组载体的重组宿主细胞。

在另一方面中,本发明涉及鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括以下步骤:

a)构建由以下结构坐标定义的活性位点的计算机模型(i)如图1所示的本发明多肽片段的结构坐标,(ii)如图2所示的本发明多肽片段的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标,(v)如图5所示的本发明多肽片段的结构坐标,(vi)如图15所示的本发明多肽片段的结构坐标,或者(vii)如图16所示的本发明多肽片段的结构坐标。

b)通过选自以下的方法来选择潜在的调节化合物:

(iv)将分子片段组装成所述化合物,

(v)从小分子数据库中选择化合物,和

(vi)对所述化合物进行从头配体设计;

c)采用计算方法进行所述化合物与所述活性位点的计算机模型之间的拟合程序运算,以提供所述化合物在所述活性位点的能量最低的构型;以及

d)评价所述拟合运算的结果来定量所述化合物与活性位点的模型之间的关联,从而评价所述化合物与所述活性位点相关联的能力。

在另一方面,本发明涉及鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括以下步骤:

(i)使本发明的多肽片段或其变体或者本发明的重组宿主细胞与测试化合物接触,以及

(ii)分析所述测试化合物调节所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。

在另一方面中,本发明涉及能够调节(优选抑制)本发明的PA亚基多肽片段或其变体的核酸内切酶活性的化合物。优选地,所述化合物可通过本发明的(体外)方法进行鉴定。

在另一方面中,本发明涉及包含本发明化合物或其可药用盐以及一种或更多种可药用赋形剂和/或载体的药物组合物。优选地,所述药物组合物可通过本发明的(体外)方法产生。

在另一方面中,本发明涉及针对SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基或其变体的活性位点的抗体,其中所述变体在SEQ ID NO:2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。

在另一方面中,本发明涉及本发明的化合物、本发明的药物组合物或本发明的抗体在制备用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染所引起(优选由甲型流感2009大流行H1N1病毒的病毒感染引起)之疾病病症的药物中的用途。

在另一方面中,本发明涉及以下化合物在制备用于治疗、改善或预防由甲型流感2009大流行H1N1病毒通过病毒感染所引起之疾病病症的药物中的用途:4-[3-[(4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)。

在另一方面中,本发明涉及本发明的化合物、本发明的药物组合物或本发明的抗体用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染所引起(优选由甲型流感2009大流行H1N1病毒通过病毒感染所引起)的疾病病症。

在另一方面中,本发明涉及用于治疗、改善或预防由甲型流感2009大流行H1N1病毒通过病毒感染所引起的疾病病症的以下化合物:4-[3-[(4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)。

发明详述

在下文对本发明详细描述之前,应理解本发明不限于本文所述的具体方法、方案和试剂,因为这些可以不同。还应理解,本文所用术语仅用于描述具体的实施方案,而不意在限制仅由所附权利要求所限定的本发明的范围。除非另外定义,否则本文所使用的所有的技术和科学术语与本领域普通技术人员通常所理解的含义相同。

以下将描述本发明的要素。虽然这些要素在具体的实施方案中列出,但是应理解它们可以以任何方式和任何数目组合以产生另外的实施方案。不应将多种描述的实施例和优选的实施方案解释为将本发明限制为仅明确描述的实施方案。应将该描述理解为支持和涵盖具有任何数目的公开和/或优选要素的明确描述的实施方案组合的实施方案。此外,除非另有说明,否则应认为本申请中所有所述要素的任何排列和组合是本发明说明书所公开的。例如,如果在一个优选实施方案中本发明的多肽片段对应SEQID NO:2所示氨基酸序列的1至198位氨基酸,而在另一个优选实施方案中本发明的PA多肽片段可以使用优选可从PA多肽片段切割(优选使用TEV蛋白酶)下来的肽标签来标记,那么本发明的一个优选实施方案是,利用可使用TEV蛋白酶从PA多肽上切割下来的肽标签标记对应SEQID NO:2所示氨基酸序列的1至198位氨基酸的多肽片段。

优选地,本文所用术语如“A multilingual glossary of biotechnologicalterms:(IUPAC Recommendations)”,H.G.W.Leuenberger,B.Nagel和编,Helvetica Chimica Acta,CH-4010 Basel,Switzerland,(1995)中所述。

为了实施本发明,除非另有说明,否则采用在本领域文献中解释的常规化学、生物化学方法和重组DNA技术(参见,例如,Molecular Cloning:A Laboratory Manual,第二版,J.Sambrook等编,Cold Spring HarborLaboratory Press,Cold Spring Harbor 1989)。

在本说明书及所附权利要求的通篇中,除非上下文另有要求,否则词语“包含”及其变化形式例如“包括”和“含有”应理解为表示包含所述整数或步骤或者整数或步骤的组,但是不排除任何其它的整数或步骤或者整数或步骤的组。除非上下文明确指出,否则本说明书和所附权利要求书中不使用数量词限制时包括复数的情况。

在本说明书中引用了一些文件。本文上文或下文中所引用的每个文件(包括所有专利、专利申请、科技文献、制造商说明、说明书等)都通过引用整体并入本文。本文中的任何内容均不应解释为认可本发明不能由于在先发明而早于这些公开内容。

定义

术语“多肽片段”指包含单个氨基酸链的蛋白质的一部分。术语“蛋白质”包括呈现二级和三级结构的多肽片段,还指由形成四级结构的数个氨基酸链(即数个亚基)形成的蛋白质。术语“肽”指最多50个氨基酸的短氨基酸链,其不一定呈现二级或三级结构。“拟肽”是由N-取代的甘氨酸通过寡聚组装而产生的肽类似物。

如果两个或更多个多肽中的残基在多肽结构中占据类似的位置,则称所述残基为彼此“对应”。如本领域所熟知的,两个或更多个多肽中的类似位置可通过根据氨基酸序列或结构相似性比对多肽序列来确定。这样的比对工具对本领域技术人员来说是公知的,可以例如获得自万维网,例如使用标准设置的ClustalW(www.ebi.ac.uk/clustalw)或Align(http://www.ebi.ac.uk/emboss/align/index.html),对于Align优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5。本领域技术人员理解,为产生满意的比对,可能需要在任一序列中引入缺口。如果两个或更多个PA亚基中的残基在最佳序列比对中对齐,则称所述残基为“对应”的。将两个多肽之间的“最佳序列比对”定义为产生最大数量的对齐的相同残基的比对。如果两个比对序列之间的序列相似性(优选同一性)在10、20或30个氨基酸的长度上降至低于30%,优选低于20%,更优选低于10%,则“最佳序列比对区”结束并由此确定用于测定相似性得分的比较序列的长度边界。

本发明涉及具有核酸内切酶活性的甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基片段。术语“RNA依赖性RNA聚合酶PA亚基”指具有SEQ ID NO:2所示氨基酸序列的甲型流感2009大流行H1N1病毒的PA亚基。术语“RNA依赖性RNA聚合酶PA亚基变体”指这样的甲型流感2009大流行H1N1病毒的PA亚基变体,其在SEQ IDNO:2的氨基酸位置186或与其对应的氨基酸位置上包含氨基酸丝氨酸,并且优选其在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:2所示氨基酸序列的序列相似性(优选序列同一性)至少为60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%,其中的最佳序列比对可用本领域已知工具得到,例如使用标准设置(优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align。优选地,当PA亚基变体与SEQ ID NO:2的PA亚基比对时,比对将在两个多肽的全长上进行,并因而在此基础上确定比对得分。但是,有可能PA亚基变体可包含C端/N端或内部的缺失或添加,例如通过N端/C端的融合。在此情况下,仅将最佳比对区域用于分别评估相似性和同一性。优选地,来自这些变体的片段优选在产生核酸内切酶活性所需的区域内分别显示出所示的相似性和同一性。因此,SEQ ID NO:2与PA亚基变体之间的任何比对都应优选地包含核酸内切酶活性位点。因此,上述序列与SEQ ID NO:2的相似性和同一性存在于至少80、90、100、110、120、130、140、150、160、165、170、180、190、200、210、220、230、240、250、300个或更多个氨基酸长度上,优选包含核酸内切酶活性位点。

因此,本发明的多肽片段基于上面定义的甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体。因此,在以下说明书中,术语“多肽片段”和“PA多肽片段”总是包括来自具有核酸内切酶活性之SEQ ID NO:2所示PA蛋白质和其PA蛋白质变体(如上所述)的两种片段。

然而本说明书还使用术语“PA多肽片段变体”或“PA片段变体”来特别表示来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之PA亚基变体的具有核酸内切酶活性的PA多肽片段或PA片段。因此,本发明的PA多肽片段优选包含天然甲型流感2009大流行H1N1病毒的PA亚基序列,或基本由其组成或由其组成。但是,还设想PA多肽片段变体在SEQ ID NO:2的186位氨基酸或其对应氨基酸位点上包含氨基酸丝氨酸,并且优选还包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15位或更多个氨基酸位置上的氨基酸替换,和/或在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:2所示氨基酸序列的序列相似性(优选序列同一性)为至少60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align。应理解本发明的PA片段可包含不来自PA的另外的氨基酸如标签、酶等,在该比对中不考虑这些另外的氨基酸,即在比对得分的计算中将其排除在外。在一个优选实施方案中,当将片段序列与SEQ ID NO:2在至少70、80、90、100、110、120、130、140、150、160、165、170、180或190个氨基酸的长度上进行比对时得到上述比对得分,其中SEQ ID NO:2的序列优选包含核酸内切酶活性位点。

在一个优选的实施方案中,PA多肽片段变体包含至少这样的氨基酸残基:其对应于SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至190位氨基酸残基,或者其由SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至190位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:2所示氨基酸序列的1至190位氨基酸残基的序列相似性(优选序列同一性)为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align。更优选地,PA多肽片段变体包含至少这样的氨基酸残基:其对应于SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至198位氨基酸残基,或者其由SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至198位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:2所示氨基酸序列的1至198位氨基酸残基的序列相似性(优选序列同一性)优选为至少70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align。还优选PA多肽片段变体包含至少这样的氨基酸残基,其对应于SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至200位氨基酸残基,或者其由SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基的1至200位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO:2所示氨基酸序列的1至200位氨基酸残基的序列相似性(优选序列同一性)为至少60%、更优选65%、更优选70%、更优选75%、更优选80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS::needle,Matrix:Blosum62,缺口打开10.0,缺口延伸0.5)的Align。应注意,所有上述优选的PA多肽片段变体在SEQ ID NO:2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。

在本发明的上下文中,术语“PA N端(PA-Nter)”指由SEQ ID NO:2所示氨基酸序列的1至198位氨基酸残基(PA H1N1 1至198)以及任选地额外氨基端接头(即MGSGMA(SEQ ID NO:3))所组成的多肽片段。在本发明的上下文中,术语“PAN端突变体”指由SEQ ID NO:2所示氨基酸序列中的1至198位氨基酸残基(其中52至64位氨基酸被替换为氨基酸甘氨酸)(PA H1N1 1至198 Δ52-64:Gly)以及任选地额外氨基端接头(即MGSGMA(SEQ ID NO:3))组成的多肽片段(变体)。

术语“序列相似性”意指最佳序列比对中相同位置处的氨基酸相同或相似,优选相同。“相似氨基酸”具有相似的特征,例如极性、可溶性、亲水性、疏水性、电荷或大小。相似的氨基酸优选为亮氨酸、异亮氨酸和缬氨酸;苯丙氨酸、色氨酸和酪氨酸;赖氨酸、精氨酸和组氨酸;谷氨酸和天冬氨酸;甘氨酸、丙氨酸和丝氨酸;苏氨酸、天冬酰胺、谷氨酰胺和甲硫氨酸。本领域技术人员非常了解序列相似性检索工具,例如可从万维网上获得(例如www.ebi.ac.uk/Tools/similarity.html)。

本文使用的术语“可溶”指在生理等渗条件(例如,0.14M氯化钠或蔗糖)下,在有效浓度的变性剂(如胍或尿素)不存在的情况下,的水性缓冲剂中以100,000×g离心30分钟之后,仍以至少200μg/ml、优选至少500μg/ml、优选至少1mg/ml、更优选至少2mg/ml、甚至更优选至少3mg/ml、甚至更优选至少4mg/ml、最优选至少5mg/ml的蛋白质浓度保留在上清液中的多肽片段。被测试溶解度的蛋白质片段优选在下文所述的细胞表达系统之一中表达。

涉及多肽时,术语“纯化的”不需要是绝对纯的(例如均一制备物),而是表示所述多肽相对于自然环境中的来说相对更纯。通常,纯化的多肽基本不含其它蛋白质、脂类、碳水化合物或与其天然相关联的其他物质,纯化的多肽优选为功能显著性水平,例如至少85%纯,更优选至少90%或95%纯,最优选至少99%纯。表述“纯化至适于结晶的程度”指多肽为85%至100%纯,优选90%至100%纯,更优选95%至100%或98%至100%纯,并且可以浓缩至高于3mg/ml,优选高于10mg/ml,更优选高于18mg/ml而没有沉淀。本领域技术人员可以使用蛋白质纯化的标准技术来纯化多肽。基本纯的多肽会在非还原性聚丙烯酰胺凝胶上产生单个主要条带。

在使用本发明方法鉴定化合物的上下文中使用的术语“关联”是指部分(即化学实体或化合物或其部分或片段)与PA亚基的核酸内切酶活性位点之间接近的状态。该关联可以是非共价的,即通过例如氢键、范德华力、静电或疏水性相互作用在能量上有利地接近,或者该关联可以是共价的。

术语“核酸内切酶活性”或“核酸内裂解活性”是指导致多核苷酸链中磷酸二酯键的切割的酶促活性。在本发明的上下文中,多肽片段具有核酸内裂解活性,其优选对多核苷酸类型是非选择性的,即本发明的多肽片段优选表现出对DNA和RNA、优选对单链DNA(ssDNA)或单链RNA(ssRNA)的核酸内裂解活性。在这种情况下中,“单链”是指在多核苷酸链中优选至少3个核苷酸、优选至少5个核苷酸、更优选至少10个核苷酸的一段是单链的,即不与另一核苷酸碱基配对。优选地,虽然本发明的多肽片段的核酸内裂解活性不取决于识别位点(即特定核苷酸序列),但是其引起多核苷酸链的非特异性切割。例如,本领域技术人员可以这样测试本发明多肽片段的核酸内裂解活性:孵育具有或不具有各自多肽片段的RNA或DNA底物(例如锅柄状RNA或者线性或环形单链DNA)(例如在37℃下孵育某一时间段(例如5、10、20、40、60或80分钟),并且通过例如凝胶电泳检测多核苷酸的完整性。

本文使用的术语“核苷酸”是指由与戊糖1’位相连之嘌呤、氮杂嘌呤或嘧啶核苷碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、氮杂腺嘌呤、氮杂鸟嘌呤等)组成的化合物,包括2’-脱氧和2’-羟基形式,例如Kornberg和Baker,DNA Replication,第二版(Freeman,San Francisco,1992)中所述,并且还包括但不限于具有经修饰碱基部分和/或经修饰糖部分的合成核苷,例如Scheit,Nucleotide Analogs(John Wiley,N.Y.,1980)中一般性描述的。

术语“分离的多核苷酸”指这样的多核苷酸,其为(i)从其天然环境中分离的,(ii)通过聚合酶链式反应扩增的,或者(iii)全部或部分合成的,并且是指脱氧核糖核苷酸碱基或核糖核苷酸碱基的单链或双链多聚体,包括DNA和RNA分子,有义和反义链两者。该术语包括cDNA、cRNA、基因组DNA以及重组DNA。多核苷酸可以由完整基因或其部分组成。

本文使用的术语“重组载体”包括本领域技术人员已知的任何载体,包括质粒载体、粘粒载体、噬菌体载体(例如λ噬菌体)、病毒载体(例如腺病毒或杆状病毒载体)或者人工染色体载体(例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或者P1人工染色体(PAC))。所述载体包括表达载体及克隆载体。表达载体包括质粒和病毒载体,并且一般包含期望的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)或体外表达系统中表达有效连接之编码序列所需的合适DNA序列。克隆载体一般用于改造和扩增某个期望的DNA片段,并且可缺乏表达期望DNA片段所需的功能序列。

本文使用的“重组宿主细胞”是指包含编码目的多肽片段(即本发明的甲型H1N1流感的PA多肽片段或其变体)的多核苷酸的宿主细胞。此多核苷酸可以以如下方式存在于宿主细胞中:(i)本身自由分散的,(ii)整合入重组载体中,或者(iii)整合入宿主细胞基因组或线粒体DNA中。重组细胞可用于表达目的多核苷酸,或者用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括用本发明的多核苷酸或重组载体转化、转染或感染的原始细胞的后代。重组宿主细胞可以是细菌细胞如大肠杆菌细胞、酵母细胞如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris)、植物细胞、昆虫细胞如SF9或High Five细胞或者哺乳动物细胞。优选的哺乳动物细胞的实例有中国仓鼠卵巢(CHO)细胞、非洲绿猴肾(COS)细胞、人胚肾(HEK293)细胞、HELA细胞等。

本文使用的术语“晶体”或“结晶”是指这样的结构(例如三维固体聚集体),其中平面以确定的角度相交,并且其中化学组成物质有规则的结构(例如内部结构)。术语“晶体”可包括下列任一项:固体物理晶形例如实验制备的晶体,可来源于晶体的晶体结构(包括二级和/或三级和/或四级结构元件),基于晶体结构的2D和/或3D模型、其代表物如其示意图或图示或者用于计算机的其数据集。在一个方面中,所述晶体可用于X射线晶体衍射技术。在这里,所用的晶体可承受X射线束中的暴露并用于产生解析X射线晶体结构所需的衍射图样数据。晶体可以表征为能够以T.L.Blundell和L.N.Johnson,“Protein Crystallography”,AcademicPress,New York(1976)所示晶形之一定义的图样衍射X射线。

术语“晶胞”指基本的立方体形或平行六面体形的单元。晶体的整个体积可以由规则装配的这些单元构建。每个晶胞包含图样单位的完整呈现,对其进行重复构建出晶体。

术语“空间群”指晶体对称元素的排布。在空间群的命名中,大写字母表示晶格类型,其它符号表示可以在不改变外观的情况下对不对称单元进行的对称操作。

术语“结构坐标”是指定义一个或更多个氨基酸残基相对于坐标系的位置的一组数值。该术语指定义分子三维结构的数据集(例如笛卡儿坐标、温度因子和占位)。结构坐标可略微改变而仍保持几乎相同的三维结构。独特结构坐标组的度量是所得结构的均方根差。本领域普遍技术人员可以认为使三维结构(特别是酶促活性中心的三维结构)的均方根差彼此相差小于的结构坐标非常相似。

术语“均方根差”意指与平均值的偏差的平方的算术平均值的平方根。这是表示与趋势或目标的偏差或偏离的一种方法。为本发明的目的,“均方根差”定义PA多肽片段或其酶促活性中心的变体的骨架与图1中PA多肽片段PA N端的结构坐标所定义的PA多肽片段或其酶促活性中心的骨架之间的偏差。

本文使用的术语“构建计算机模型”包括根据原子结构信息和相互作用模型进行的分子结构和/或功能的定量和定性分析。术语“建模”包括常规的基于数字的分子动力学和能量最低化模型,交互式计算机图像模型,经修改的分子力学模型,距离几何以及其它基于结构的约束模型。

术语“拟合程序运算”是指利用化学实体、酶促活性中心、结合口袋、分子或分子复合物或其部分的结构坐标,将化学实体与酶促活性中心、结合口袋、分子或分子复合物或其部分相关联的操作。这可通过在酶促活性中心处定位、旋转或移动化学实体以匹配酶促活性中心的形状和静电互补性来实现。可对共价相互作用、非共价相互作用(例如氢键、静电、疏水、范德华力相互作用以及非互补静电相互作用例如排斥的电荷-电荷、偶极-偶极和电荷-偶极相互作用)进行优化。或者,可使化学实体与酶促活性中心的结合形变能量最小化。

本文使用的术语“测试化合物”是指包含被测试抑制目的多肽片段(即具有核酸内裂解活性的本发明PA多肽片段或其变体)之核酸内裂解活性的能力的化合物、分子或复合物的物质。测试化合物可以是任何物质,包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷酸类似物、核苷、核酸、小有机或无机分子、化学化合物、元素、糖类、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺以及其组合和衍生物。术语“小分子”指分子量为50至约2,500道尔顿、优选200至800道尔顿的分子。此外,本发明的测试化合物可任选地包含可检测标记。这些标记包括但不限于酶标记、放射性同位素或者放射活性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可使用公知方法将这些可检测标记连接到测试化合物。本发明的测试化合物还可包含物质的复杂混合物,例如含有天然产物的提取物,或者混合的组合性合成的产物。它们也可以被测试,并且可以在后续步骤中从混合物纯化出抑制靶多肽片段之核酸内裂解活性的组分。测试化合物可来自或选自合成或天然化合物的文库。例如,合成化合物文库可购自MaybridgeChemical Co.(Trevillet,Cornwall,UK)、ChemBridge Corporation(SanDiego,CA)或Aldrich(Milwaukee,WI)。天然化合物文库例如可得自TimTec LLC(Newark,DE)。或者,可使用细菌、真菌、植物和动物细胞以及组织提取物形式的天然化合物文库。另外,测试化合物可使用组合化学法或作为单个化合物或作为混合物而合成产生。使用组合化学法制成的化合物集合在本文中称为组合文库。

在本发明的上下文中,“调节核酸内裂解活性的化合物”可提高或降低(优选抑制)甲型流感2009大流行H1N1病毒或甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或者其变体的核酸内裂解活性。优选地,这类化合物特异性针对甲型流感2009大流行H1N1病毒的PA亚基或其变体的核酸内裂解活性,而不调节(优选降低)其它核酸内切酶(尤其是哺乳动物的核酸内切酶)的核酸内裂解活性。

术语“降低核酸内裂解活性的化合物”是指这样的化合物:与不存在所述化合物而其它反应条件(即缓冲条件、反应时间和温度)相同的甲型流感2009大流行H1N1病毒或甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性相比,所述化合物使所述PA亚基或其变体的核酸内裂解活性降低50%、更优选60%、甚至更优选70%、甚至更优选80%、甚至更优选90%,以及最优选100%。

最优选地,降低甲型流感2009大流行H1N1病毒PA亚基或其变体的核酸内裂解活性的化合物抑制所述活性,即与不存在所述化合物时的活性相比,将所述活性降低至少95%,优选100%。尤其优选地,降低或抑制甲型流感2009大流行H1N1病毒PA亚基或其变体的核酸内裂解活性的化合物特异性降低或抑制所述PA亚基或其变体的核酸内裂解活性,而不以相同的程度抑制(优选根本不抑制)其它核酸内切酶(如RNase H或限制性核酸内切酶)的核酸内裂解活性。例如,本领域技术人员可以使用相同的缓冲剂和反应条件以及底物和核酸内切酶浓度来建立以下样品:(1)底物(如锅柄状RNA)、核酸内裂解活性的PA H1N1多肽片段或其变体,(2)底物(如锅柄状RNA)、核酸内裂解活性的PA H1N1多肽片段或其变体、测试化合物,(3)底物(如锅柄状RNA)、参照核酸内切酶(如RNAse H),(4)底物(如锅柄状RNA)、参照核苷酸(如RNAse H)、测试化合物。孵育样品之后,本领域技术人员可通过例如凝胶电泳分析底物。优选对样品(4)产生切割底物和对样品(2)产生完整底物的测试化合物。

术语“高通量形式”是指多种类型的高通量筛选测定和技术,其用于筛选测试化合物文库抑制目的多肽片段的核酸内切酶活性的能力。通常,以多孔形式进行高通量测定,并且包括无细胞测定以及基于细胞的测定。

术语“抗体”是指单克隆和多克隆抗体二者,即任何免疫球蛋白或其能够识别抗原或半抗原的部分,即识别具有核酸内裂解活性的甲型流感2009大流行H1N1病毒的PA多肽片段或其肽。在一个优选实施方案中,抗体能够与甲型流感2009大流行H1N1病毒的PA多肽片段或其变体中的酶促(核酸内裂解)活性中心结合。抗体的抗原结合部分可通过重组DNA技术或者对完整抗体进行酶促或化学切割产生。在一些实施方案中,抗原结合部分包括Fab、Fab’、F(ab’)2、Fd、Fv、dAb以及互补决定区(CDR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及多肽,所述多肽至少含有抗体中足以使特异性抗原与该多肽结合的部分。

术语“可药用盐”是指可通过本发明的方法鉴定的化合物的盐或本发明化合物的盐。合适的可药用盐包括酸加成盐,其可以例如通过将本发明化合物的溶液与可药用酸(如盐酸、硫酸、富马酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸)的溶液混合来形成。此外,当所述化合物带有酸性部分时,其合适的可药用盐可包括碱金属盐(例如钠盐或钾盐);碱土金属盐(例如钙或镁盐);以及与合适的有机配体形成的盐(例如使用反阴离子(counteranion)例如卤离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、烷基磺酸根和芳基磺酸根形成的铵,季铵,以及胺阳离子)。可药用盐的示例性实例包括但不限于:乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐、右旋樟脑磺酸盐、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡萄糖酸盐、二盐酸盐、十二烷基硫酸盐、乙二胺四乙酸盐、乙二磺酸盐、丙酸酯十二烷硫酸盐、乙磺酸盐(esylate)、乙磺酸盐(ethanesulfonate)、甲酸盐、富马酸盐、葡庚糖酸盐(gluceptate)、葡庚糖酸盐(glucoheptonate)、葡糖酸盐、谷氨酸盐、甘油磷酸盐、对羟乙酰氨基苯胂酸、半硫酸盐、庚酸盐、己酸盐、己基间苯二酸盐、哈胺盐(hydrabamine)、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、羟基萘酸盐、碘化物、异硫代羟酸盐(isothionate)、乳酸盐、乳糖酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐(mesylate)、甲磺酸盐(methanesulfonate)、甲基硫酸盐、粘酸盐、2-萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐、油酸盐、草酸盐、双羟萘酸盐(pamoate)(恩波酸盐(embonate))、棕榈酸盐、泛酸盐、pectinate、过硫酸盐、3-苯基丙酸盐、磷酸盐/二磷酸盐、苦味酸盐、特戊酸盐、聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、碱式醋酸盐、琥珀酸盐、单宁酸盐、酒石酸盐、茶氯酸盐、甲苯磺酸盐、三乙基碘化物、十一酸盐、戊酸盐等(参见例如S.M.Berge等,“Pharmaceutical Salts”,J.Pharm.Sci.66:1-19(1977))。

在用于本文时,术语“赋形剂”用于表示药物制剂中非活性成分的所有物质,例如载体、粘合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、调味剂或着色剂。

术语“可药用载体”包括例如碳酸镁、硬脂酸镁、滑石、糖、乳糖、果胶、糊精、淀粉、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。

详述

尽管之前人们认为仅可在三聚复合体中检测到核酸内切酶活性,本发明人出乎意料地发现,来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基N端的独立折叠的小结构域表现出对三聚复合体所报道的核酸内切酶功能特性。此外,本发明人发现该PA多肽片段可通过重组方法容易地产生,因此适用于核酸内裂解活性及其调节的体外研究。本发明人出乎意料地发现,来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基N端的结构域易于结晶,因此所述结构域适用于鉴定、选择和设计靶向甲型流感2009大流行H1N1聚合酶之核酸内切酶活性的新型抗病毒化合物,以及通过计算机方法优化先前鉴定的化合物。

本发明的一个方面是提供包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基氨基端片段的多肽片段,其中所述PA亚基来自SEQ ID NO:2的甲型流感2009大流行H1N1病毒或其变体,其中所述变体在SEQ ID NO:2的186氨基酸位置或与其对应的氨基酸位置上包含氨基酸丝氨酸。

在本发明的一个优选实施方案中,所述变体包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸。在本发明的另一个更优选实施方案中,所述变体包含SEQID NO:2所示氨基酸序列的1至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸。

优选地,本发明的多肽片段是可溶的,优选可溶于水溶液中。本发明多肽片段的最短长度由其切割多核苷酸链(例如锅柄状RNA或单链DNA)的能力来确定,即多肽的最短长度由其核酸内裂解活性来确定。优选地,核酸内切酶活性不取决于多核苷酸类型,因此,它可以作用于DNA和RNA,优选作用于单链DNA和RNA。优选地,核酸内切酶活性不取决于底物核苷酸中的特异性识别位点。

在一个优选实施方案中,本发明的多肽片段适于结晶,即优选所述多肽片段可结晶。优选地,可从本发明多肽片段得到的晶体适用于通过X射线晶体衍射对多肽片段进行结构测定。优选地,所述晶体大于25立方微米,并且优选对辐射足够稳定以在优选或更好的分辨率下使得暴露于单色X射线时收集的衍射数据完整性大于85%。

在一个实施方案中,所述多肽片段可使用以下溶液结晶:(i)蛋白质水溶液,即结晶溶液,其中在浓度范围为10mM至3M、优选10mM至2M、更优选20mM至1M且pH 3至pH 9、优选pH 4至pH 9、更优选pH 7至pH 9之缓冲体系(如HEPES或Tris-HCl)中蛋白质浓度为5至20mg/ml,如5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5或20mg/ml,优选8至15mg/ml,最优选10至15mg/ml;和(ii)包含一种或更多种物质的沉淀溶液/储集溶液,所述物质例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、氯化钠、甘油或乙二醇。

任选地,蛋白质溶液可包含一种或更多种盐,例如单价盐,如NaCl、KCl或LiCl,优选NaCl,其浓度为10mM至1M、优选20mM至500mM、更优选50mM至200mM;和/或二价盐,如MnCl2、CaCl2、MgCl2、ZnCl2或CoCl、优选MgCl2和MnCl2,其浓度为0.1mM至50mM、优选0.5mM至25mM、更优选1mM至10mM或1mM至5mM。

优选地,沉淀/储集溶液包含浓度范围为0.5M至2M、优选为1M至1.8M的甲酸钠,浓度范围为10mM至1M、优选50mM至500mM、更优选75mM至150mM并且pH优选为4至8、更优选为5至7的缓冲体系(如HEPES),和/或浓度范围为1%至20%、优选2%至8%、更优选2%至5%的乙二醇。

结晶溶液中的PA多肽片段或其变体优选为85%至100%纯、更优选90%至100%纯、甚至更优选95%至100%纯。为了产生晶体,将适于结晶的蛋白质溶液与等体积的沉淀溶液混合。

在一个优选实施方案中,结晶介质包含0.05μl至2μl、优选0.8μl至1.2μl的适于结晶的蛋白质溶液,其与相似体积、优选等体积的包含1.0mM至2.0mM甲酸钠、80mM至120mM HEPES(pH 6.5至DH 7.5)和2%至5%乙二醇或甘油的沉淀溶液混合。

在另一个实施方案中,沉淀溶液包含1.6mM甲酸钠、0.1M HEPES(pH 7.0)和5%乙二醇或甘油,优选基本由它们组成或由它们组成;而结晶/蛋白质溶液包含20mM HEPES(pH 7.5)、150mM NaCl、2.0mMMnCl2和2.0mM MgCl2中的10mg/ml至15mg/ml,优选基本由它们组成或由它们组成。

在另一个实施方案中,PA多肽片段可使用以下溶液与化合物(优选与调节(优选抑制)PA多肽片段的核酸内切酶活性的化合物,优选与表1或2的化合物)共结晶:(i)蛋白质水溶液,在浓度范围为10mM至3M、优选10mM至2M、更优选20mM至1M且pH为pH 3至pH 9、优选pH 4至pH 9、更优选pH 7至pH 9的缓冲体系(如HEPES或Tris-HCl)中的PA多肽片段浓度为5至20mg/ml,如5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5或20mg/ml,优选8至15mg/ml,最优选10至15mg/ml;和(ii)包含一种或更多种物质的沉淀溶液/储集溶液,所述物质例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、氯化钠、乙二醇、甘油或PEG。为了共结晶,将化合物(优选调节(优选抑制)PA多肽片段的核酸内切酶活性的化合物,优选表1或表2的化合物)添加到蛋白质水溶液中至终浓度为0.5mM至5mM,优选1.5mM至5mM,即0.5、1、1.5、2、2.5、3、4.5或5mM。

任选地,蛋白质溶液可包含一种或更多种盐,例如单价盐,如NaCl、KCl或LiCl,优选NaCl,其浓度范围为10mM至1M、优选20mM至500mM、更优选50mM至200mM;和/或二价盐,如MnCl2、CaCl2、MgCl2、ZnCl2或CoCl,优选MgCl2和MnCl2,其浓度范围为0.1mM至50mM、优选0.5mM至25mM、更优选1mM至10mM或1mM至5mM。

优选地,沉淀/储集溶液包含浓度范围为0.1M至2.5M、优选0.1M至2.0M的硫酸铵,浓度范围为10mM至1M、优选50mM至500mM、更优选75mM至150mM并且pH为4至7、更优选pH为5至6的缓冲体系(如Bis-Tris),和/或浓度范围为1%至30%、优选15%至30%、更优选20%至25%的PEG(如PEG 3350)。

蛋白质溶液中的PA多肽片段或其变体优选85%至100%纯、更优选90%至100%纯、甚至更优选95%至100%纯。为进行共结晶,可将包含PA多肽片段或其变体和化合物的蛋白质水溶液与等体积的沉淀溶液混合。

在一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH 7.5)、150mM NaCl、2.0mM MnCl2和2.0mM MgCl2以及终浓度为1.5mM的4-[3-[(4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)中的10mg/ml至15mg/ml PA多肽片段,优选基本由它们组成或由它们组成;而储集溶液/沉淀溶液包含2.0M硫酸铵和0.1MBis-Tris(pH 5.5),优选基本由它们组成或由它们组成(也参见表1)。

在另一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH7.5)、150mM NaCl、2.0mM MnCl2、2.0mM MgCl2和终浓度为1.5mM的4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)中的10mg/ml至15mg/ml PA多肽片段,优选基本由它们组成或由它们组成,优选浸入到最初用核糖尿苷一磷酸(rUMP)生长的晶体中;而储集溶液/沉淀溶液包含0.1M硫酸铵、0.1M Bis-Tris(pH 5.5)和25%(w/v)PEG 3350,优选基本由它们组成或由它们组成(也参见表1)。

在另一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH7.5)、150mM NaCl、2.0mM MnCl2和2.0mM MgCl2以及终浓度为5mM的核糖尿苷一磷酸(rUMP)中的10mg/ml至15mg/ml PA多肽片段,优选基本上由它们组成或由它们组成;而储集溶液/沉淀溶液包含0.1M硫酸铵、0.1M Bis-Tris(pH 5.5)和25%(w/v)PEG 3350,优选基本上由它们组成或由它们组成(也参见表1)。

用于PA多肽片段或其变体与例如4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)的共结晶的另一些优选储集溶液/沉淀溶液也可从表1中得到。

可通过任何本领域技术人员已知的任何方法使晶体生长,包括但不限于悬滴(hanging drop)和坐滴(sitting drop)技术、夹心滴(sandwich-drop)、透析以及微批量或微管批量设备。对本领域技术人员来说很明显的是,改变上面公开的结晶条件来鉴定产生单独或与化合物相复合之本发明PA多肽片段或其变体的晶体的其它结晶条件。这些改变包括但不限于调整pH、蛋白质浓度和/或结晶温度,改变所用盐和/或沉淀剂的种类或浓度,使用不同的结晶方法,或者引入有助于结晶的添加剂例如去污剂(例如吐温20(单月桂酯)、LDOA、Brij 30(4月桂基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二噁烷、二甲基甲酰胺)、镧系元素离子或者多聚离子化合物。还可使用高通量结晶测定来帮助发现或优化结晶条件。

可使用微接种(microseeding)来提高晶体的尺寸和质量。简言之,将微晶体破碎以产生晶种储备溶液(stock seed solution)。对所述晶种储备溶液进行系列稀释。使用针、玻璃棒或毛发线,将来自各稀释液的小样品添加到一组经平衡的滴中,其中含有的蛋白质浓度等于或小于不存在晶种时产生晶体所需的浓度。目的是最后得到在滴中发挥晶体生长的晶核作用的单晶种。

如本文所述获得如图1至5所示结构坐标、对所述坐标进行解读的方法及其在了解蛋白质结构中的应用为本领域技术人员公知,并参考标准教科书,例如J.Drenth,″Principles of protein X-ray crystallography″,第二版,Springer Advanced Texts in Chemistry,New York(1999);和G.E.Schulz和R.H.Schirmer,″Principles of Protein Structure″,SpringerVerlag,New York(1985)。例如,通常使用冷冻至100K的低温保护(例如用20%至30%甘油)的晶体首先获得X射线衍射数据,例如使用同步加速器设备的线束或者旋转阳极作为X射线源。然后,通过公知的方法解析相位问题,例如多波长异常衍射(multiwavelength anomalousdiffraction,MAD)、多重同晶置换(multiple isomorphous replacement,MIR)、单波长异常衍射(single wavelength anomalous diffraction,SAD)或者分子置换(molecular replacement,MR)。可使用SHELXD解出亚结构(Schneider和Sheldrick,2002,Acta Crystallogr.D.Biol.Crystallogr.(Pt10 Pt 2),1772-1779),使用SHARP计算相位(Vonrhein等,2006,MethodsMol.Biol.364:215-30),用溶剂扁平化及非结晶对称平均化进行改进(例如使用RESOLVE(Terwilliger,2000,Acta Cryst.D.Biol.Crystallogr.56:965-972))。可使用例如ARP/wARP(Perrakis等,1999,Nat.Struct.Biol.6:458-63)进行模型自构建并使用例如REFMAC进行精修化(Murshudov,1997,Acta Crystallogr.D.Biol.Crystallogr.53:240-255)。

优选地,本发明多肽片段内包含的PA片段氨基端对应于(优选地基本由其组成或由其组成)SEQ ID NO:2的甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基的1至190位,优选1至198位,优选1至200位氨基酸或其变体。

在一个优选实施方案中,将本发明的多肽片段纯化至适于结晶的程度,优选其为85%至100%纯、更优选90%至100%纯、最优选95%至100%纯。在另一个优选实施方案中,将本发明的多肽片段纯化至适于共结晶的程度,其优选为85%至100%纯、更优选90%至100%纯、最优选95%至100%纯。

在另一个实施方案中,本发明的多肽片段能够与二价阳离子结合。优选地,本发明的多肽片段与一个或更多个二价阳离子结合,优选与两个二价阳离子结合。在此情况下,二价阳离子优选选自锰、钴、钙、镁和锌,并且更优选锰或钴,最优选锰和/或镁。因此,在一个优选实施方案中,本发明的多肽片段以以与以下复合的形式存在:(i)两个锰阳离子,(ii)两个镁阳离子或(iii)一个锰阳离子和一个镁阳离子。在一个优选实施方案中,二价阳离子与对应于SEQ ID NO:2中氨基酸Glu80和Asp108的氨基酸(第二阳离子)和对应于SEQ ID NO:2中氨基酸His41、Asp108、Ile120和Glu119的氨基酸(第一阳离子)配位。在一个优选实施方案中,1位的二价阳离子为锰且2位为锰或镁,即1位为锰且2位为镁(参见图6),或者1位为锰且2位为锰(参见图7至10、图17和图18)。

在另一个实施方案中,本发明的多肽片段是这样的多肽片段或其变体,其中N端与SEQ ID NO:2的PA亚基氨基酸序列的15位或更低位(例如15、14、13、12、11、10、9、8、7、6、5、4、3、2或1位)上的氨基酸相同或相对应;而C端与选自SEQ ID NO:2的PA亚基氨基酸序列的186至200位(例如186、187、188、189、190、191、192、193、194、195、196、197、198、199或200位)上的氨基酸相同或相对应,优选C端与SEQ ID NO:2的PA亚基氨基酸序列的190至200、更优选190至198位上的氨基酸相同或相对应;其中所述变体在SEQ ID NO:2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸并且保留核酸内切酶活性。

在本发明的一个优选实施方案中,所述变体包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52位至64位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成:SEQID NO:2所示氨基酸序列的1至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA(SEQ IDNO:3)的氨基端接头。

在本发明的一个更优选实施方案中,所述变体包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成:SEQID NO:2所示氨基酸序列的1至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA(SEQ IDNO:3)的氨基端接头。

在本发明的另一个更优选实施方案中,所述变体包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA(SEQ ID NO:3)的氨基端接头。

优选地,所述多肽片段具有或者对应于选自以下的氨基酸序列:SEQID NO:2所示氨基酸序列的5至190位、10至190位、15至190位、20至190位、5至198位、10至198位、15至198位、20至198位氨基酸及其变体,其中所述变体在SEQ ID NO:2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸并且保留核酸内切酶活性。

在另一个实施方案中,本发明的多肽片段(变体)

a)由以下组成:SEQ ID NO:2所示氨基酸序列的1至198位氨基酸和任选的具有氨基酸序列MGSGMA(SEQ ID NO:3)的氨基端接头,并且其结构由以下来限定(i)图1所示的结构坐标,(ii)图2所示的结构坐标,(iii)图3所示的结构坐标,(iv)图4所示的结构坐标,或(v)图5所示的结构坐标,或者

b)由以下组成:SEQ ID NO:2所示氨基酸序列的1至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸,和任选的具有氨基酸序列MGSGMA(SEQ ID NO:3)的氨基端接头,并且其结构由以下来限定(vi)图15所示的结构坐标,或(vii)图16所示的结构坐标。

优选地,本发明多肽片段的晶体结构由图1所示的结构坐标来限定且未与化合物共结晶(天然结构)。

更优选地,在与化合物共结晶后,优选与调节(优选抑制)本发明多肽片段核酸内切酶活性的化合物共结晶之后,所述多肽片段(变体)具有图2至图5、图15或图16所示结构坐标限定的晶体结构。

尤其优选地,在与表1或表2的化合物共结晶之后,所述多肽片段(变体)具有如图2至图5、图15或图16所示结构坐标来限定的结构,即,与4-[3-[(4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)共结晶之后具有如图2和图3所示的结构坐标所限定的结构,与4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)共结晶之后具有如图4所示的结构坐标所限定的结构,与核糖尿苷一磷酸(rUMP)共结晶之后具有如图5所示的结构坐标所限定的结构,与4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)共结晶之后具有如图15所示的结构坐标所限定的结构,或者与[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)共结晶之后具有如图16所示的结构坐标所限定的结构。

鉴于以上内容,本领域技术人员容易理解的是,所述多肽片段(变体)的晶体结构仅由图1、图2至图5、图15或图16中所含其氨基酸和任选地其结合之二价阳离子的结构坐标来限定,而不由图2至图5、图15或图16中还包含的用于共结晶的各化合物的结构坐标限定,即图2和图3中化合物EMBL-R05-3具有残基描述子(descriptor)ci3,图4中化合物EMBL-R05-2具有残基描述子ci2,图5中的化合物rUMP具有残基描述子U,图15中化合物EMBL-R05-1具有残基描述子ci1,图16中化合物EGCG具有残基描述子tte。

还优选的是,具有由图1所示结构坐标限定的结构的所述多肽片段(变体)具有空间群C2的晶型,并且晶胞尺寸为a=26.36nm±0.5nm,b=6.62nm±0.3nm,c=6.63nm±0.3nm,α=90°,β=96±2°,γ=90°;具有由图2至图5所示结构坐标限定的结构的所述多肽片段(变体)具有空间群P212121的晶型,并且晶胞尺寸为a=5.46±0.3nm,b=12.25±0.4nm,c=13.0±0.3nm,α=90°,β=90°,γ=90°;具有由图15所示结构坐标限定的结构的所述多肽片段(变体)具有空间群P6222的晶型,并且晶胞尺寸为a=7.50nm±0.3nm,b=7.50nm±0.3nm,c=12.00nm±0.5nm,α=90°,β=90°,γ=120°;或具有由图16所示结构坐标限定的结构的所述多肽片段(变体)具有空间群P6422的晶型,并且晶胞尺寸为a=9.99nm±0.5nm,b=9.99nm±0.5nm,c=8.27nm±0.3nm,α=90°,β=90°,γ=120°。

优选地,多肽片段(变体)的晶体以或更高、优选或更高、更优选或更高、甚至更优选或更高、最优选或更高或者或更高的分辨率衍射X射线。例如多肽片段(变体)的晶体以1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、或更高的分辨率衍射X射线。

本发明的另一方面提供了编码本发明的上述(分离的)PA多肽片段及其变体的分离的多核苷酸。

在本发明的一个优选实施方案中,所述分离的多核苷酸编码包含SEQ ID NO:2所示氨基酸序列之1至198位氨基酸的PA多肽片段。

在本发明的另一个优选实施方案中,所述分离的多核苷酸编码包含SEQ ID NO:2所示氨基酸序列之1至198位氨基酸的PA多肽片段变体,其中52位至64位氨基酸被替换为氨基酸甘氨酸。

在本发明的一个更优选实施方案中,所述分离的多核苷酸编码包含SEQ ID NO:2所示氨基酸序列之1至198位氨基酸的PA多肽片段变体,其中52位至72位氨基酸被替换为氨基酸甘氨酸。

在本发明的另一更优选实施方案中,所述分离的多核苷酸编码包含SEQ ID NO:2所示氨基酸序列的1至198位氨基酸的PA多肽片段变体,其中52位至69位氨基酸被替换为氨基酸甘氨酸。

用于得到这些分离的核苷酸片段的分子生物学方为本领域技术人员公知(对于标准分子生物学方法,参见Sambrook等编,″MolecularCloning:A Laboratory Manual″,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York(1989),其通过引用并入本文)。例如,可从经甲型流感2009大流行H1N1病毒感染的细胞中分离RNA,并且使用随机引物(例如随机六聚体或十聚体)或者用于产生目的片段的特异性引物通过逆转录聚合酶链式反应(RT-PCR)产生cDNA。然后可通过标准PCR使用片段特异性引物扩增目的片段。

编码甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基片段的分离的核苷酸来自SEQ ID NO:1。在此情况下,“来自”是指SEQ ID NO:1编码全长PA多肽,因此编码优选PA多肽片段的多核苷酸可根据各自所编码PA多肽片段的需要在多核苷酸的3’和/或5’端包含缺失。

在另一方面中,本发明涉及包含本发明的分离的多核苷酸的重组载体。本领域技术人员十分了解用于将目的多核苷酸序列整合入载体的技术(也参见Sambrook等,1989,见上)。这些载体包括本领域技术人员已知的任何载体,包括质粒载体、粘粒载体、噬菌体载体例如λ噬菌体、病毒载体例如腺病毒或杆状病毒、或者人工染色体载体例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或P1人工染色体(PAC)。所述载体可以是适于原核或真核表达的表达载体。所述质粒可包含复制起点(ori),多克隆位点和调节序列例如启动子(组成型或诱导型)、转录起始位点、核糖体结合位点、转录终止位点、多聚腺苷酸化信号以及选择标记,例如抗生素抗性或基于对突变或缺失进行回补(complementation)的营养缺陷型标记。在一个实施方案中,所述目的多核苷酸序列与调节序列有效连接。

在另一个实施方案中,所述载体包含编码帮助纯化目的多肽片段之表位、肽或蛋白质标签的核苷酸序列。这些表位、肽或蛋白质标签包括但不限于血凝素(HA)、FLAG、myc标签、多聚His标签、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、NusA以及硫氧还蛋白标签,或者荧光蛋白标签例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E)YFP)、来自珊瑚(Discosoma)物种的(DsRed)或者单体的(mRFP)红色荧光蛋白(RFP)、青色荧光蛋白(CFP)等。在一个优选实施方案中,可将表位、肽或蛋白质标签从目的多肽片段上切下,例如,使用蛋白酶如凝血酶、因子Xa、PreScission、TEV蛋白酶等。优选地,标签可用TEV蛋白酶切下。这些蛋白酶的识别位点是本领域技术人员公知的。例如,TEV蛋白酶的七氨基酸的共有序列识别位点为Glu-X-X-Tyr-X-Gln-Gly/Ser,其中X可以是任何氨基酸并且在本发明的情况下优选为Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:12)。在另一个实施方案中,所述载体包含导致目的多肽片段分泌到重组宿主细胞的培养基中或者细菌的周质间隙中的功能性序列。所述信号序列片段通常编码信号肽,该信号肽由引导蛋白质从细胞中分泌出来的疏水氨基酸构成。所述蛋白质或分泌到生长培养基中(革兰氏阳性菌),或分泌到位于细胞外膜与内膜之间的周质间隙中(革兰氏阴性菌)。优选地,在信号肽片段与外源基因之间编码有加工位点,其可在体内或体外被切割。

在另一方面中,本发明提供包含本发明的分离的多核苷酸或本发明的重组载体的重组宿主细胞。所述重组宿主细胞可以是原核细胞例如古细菌和细菌细胞、或者真核细胞例如酵母、植物、昆虫或哺乳动物细胞。在一个优选实施方案中,所述宿主细胞是细菌细胞例如大肠杆菌细胞。本领域技术人员十分了解将所述分离的多核苷酸或所述重组载体引入所述宿主细胞的方法。例如,细菌细胞可使用例如化学转化(如氯化钙法)或者电穿孔容易地进行转化。酵母细胞可以例如使用醋酸锂转化法或电穿孔进行转化。其它真核细胞可例如使用市售的基于脂质体的转染试剂盒例如LipofectamineTM(Invitrogen)、市售的基于脂类的转染试剂盒例如Fugene(Roche Diagnostics)、基于聚乙二醇的转染、磷酸钙沉淀、基因枪(生物轰击(biolistic))、电穿孔或者病毒感染进行转染。在本发明的一个优选实施方案中,所述重组宿主细胞表达目的多核苷酸片段。在一个甚至更优选实施方案中,所述表达产生本发明的可溶性多肽片段。这些多肽片段可利用本领域技术人员公知的蛋白质纯化方法进行纯化,任选地利用上述表位、肽或蛋白质标签。

在另一方面中,本发明涉及鉴定对甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内切酶活性进行调节的化合物的方法,其包括下列步骤:

a)构建由以下结构坐标定义的活性位点的计算机模型(i)如图1所示的本发明多肽片段的结构坐标,(ii)如图2所示的本发明多肽片段的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标,(v)如图5所示的本发明多肽片段的结构坐标,(vi)如图15所示的本发明多肽片段(变体)的结构坐标,或者(vii)如图16所示的本发明多肽片段(变体)的结构坐标。

b)通过选自以下的方法来选择潜在的调节化合物:

(i)将分子片段组装成所述化合物,

(ii)从小分子数据库中选择化合物,和

(iii)对所述化合物进行从头配体设计;

c)采用计算方法进行所述化合物与所述活性位点的计算机模型之间的拟合程序运算,以提供所述化合物在所述活性位点的能量最低的构型;以及

d)评价所述拟合运算的结果来定量所述化合物与活性位点的模型之间的关联,从而评价所述化合物与所述活性位点相关联的能力。

在一个优选实施方案中,在本发明方法中的步骤a)中构建由以下结构坐标定义的活性位点的计算机模型:(i)如图1所示的本发明多肽片段的结构坐标(即氨基酸结构坐标)和如图1所示的二价阳离子的结构坐标,(ii)如图2所示的本发明多肽片段的结构坐标(即氨基酸结构坐标)和如图2所示的二价阳离子的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标和如3所示的二价阳离子的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标和如图4所示的二价阳离子的结构坐标,(v)如图5所示的本发明多肽片段的结构坐标和如图5所示的二价阳离子的结构坐标,(vi)如图15所示的本发明多肽片段(变体)的结构坐标(即氨基酸结构坐标)和如图15所示的二价阳离子的结构坐标,和/或(vii)如图16所示的本发明多肽片段(变体)的结构坐标(即氨基酸结构坐标)和如图16所示的二价阳离子的结构坐标。

优选地,调节化合物与甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基及其变体中的核酸内裂解活性位点相关联,优选结合。调节化合物可提高或降低(优选降低)所述核酸内裂解活性。

在本发明该方面的一个优选实施方案中,调节来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性的化合物降低所述活性,更优选地所述化合物抑制所述活性。优选地,与不具有所述化合物而其它反应条件(即缓冲条件、反应时间和温度)相同的来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性相比,化合物使所述PA亚基或其变体的核酸内裂解活性降低50%、更优选60%、甚至更优选70%、甚至更优选80%、甚至更优选90%且最优选100%。尤其优选地,化合物特异性降低或抑制来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性,但是不以相同程度降低或抑制(优选根本不降低或抑制)其它核酸内切酶、尤其是哺乳动物的核酸内切酶的核酸内裂解活性。

基于图1的(天然)核酸内裂解活性位点的结构坐标,本发明允许使用分子设计技术来鉴定、选择或设计潜在地对来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性进行调节的化合物。基于图2至图5、图15或图16的核酸内裂解活性位点的结构坐标,本发明首次进一步允许优化鉴定、选择和设计潜在地对来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性进行调节的化合物。所述结构坐标由已与调节化合物共结晶的本发明多肽片段(多肽片段变体)得到,优选与4-[3-[(4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)(参见图2和图3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)(参见图4)、核糖尿苷一磷酸(rUMP)(参见图5)、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)(参见图15)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)(参见图16)共结晶(还参见表1或表2)。换言之,本发明人出乎意料的发现,不具有结合化合物的本发明多肽片段(变体)(即天然多肽片段(变体))的结构坐标(参见例如图1)与具有结合化合物的本发明多肽片段(变体)的结构坐标(参见例如图2至图5、图15或图16)不同,因为在化合物结合之后,所述多肽片段(变体)改变了其构象。因此,这种新的三维信息允许对现有抑制剂的修饰进行优化设计以改善其效力,或设计和优化有效阻断核酸内切酶活性的新型抑制剂。

鉴于与制备和测试可能可调节核酸内裂解活性的多种化合物相关的较高成本,这样的预测模型是有价值的。为了使用针对甲型流感2009大流行H1N1的PA多肽片段(变体)产生的结构坐标,必须将结构坐标转变为三维形状。这通过使用能够从一组结构坐标产生分子或其部分之三维图示的市售软件来完成。这样的计算机程序的一个实例为MODELER(在Insight II Homology软件包(Sali和Blundell,1993,J.Mol.Biol.,234,779-815在Insight II(97.0),Molecular Simulations Incorporated,SanDiego,CA)中运行)。

本领域技术人员可使用数种方法来根据调节2009流行性甲型H1N1流感PA亚基或甲型流感2009大流行H1N1PA亚基PA多肽变体之核酸内裂解活性的能力筛选化学实体或片段。该过程可从对例如基于图1至图5、图15或图16之结构坐标的核酸内裂解活性位点的三维计算机模型进行肉眼观察开始。然后可将选择的片段或化学化合物以多种方向放置于或对接入活性位点内。可使用软件例如Cerius、Quanta和Sybyl(TriposAssociates,St.Louis,MO)完成对接,然后是的能量最小化和具有标准分子动力学力场的分子动力学,例如OPLS-AA、CHARMM和AMBER。可在合适化合物或片段的选择过程中协助本领域技术人员的另一些专门化计算机程序包括,例如(i)AUTODOCK(Goodsell等,1990,Proteins:Struct.,Funct.,Genet.,8:195-202;AUTODOCK可得自Scripps ResearchInstitute,La Jolla,CA)以及(ii)DOCK(Kuntz等,1982,J.Mol.Biol.,161:269-288页;DOCK可得自University of California,San Francisco,CA)。

一旦选择了合适的化合物或片段,则可将其设计或组装成单个化合物或复合物。这种人工建模利用软件例如Quanta或Sybyl进行。在单个化合物或片段的连接中协助本领域技术人员的可用程序包括,例如(i)CAVEAT(Bartlett等,1989,Molecular Recognition in Chemical和Biological Problems,Special Publication,Royal Chem.Soc.78:182-196;Lauri和Bartlett,1994,J.Comp.Aid.Mol.Des.8:51-66;CAVEAT可得自University of California,Berkley,CA),(ii)3D Database系统例如ISIS(MDL Information Systems,San Leandro,CA;综述于Martin,1992,J.Med.Chem.35:2145-2154),和(iii)HOOK(Eisen等,1994,Proteins:Struct.,Funct.,Genet.19:199-221;HOOK可得自Molecular SimulationsIncorporated,San Diego,CA)。

本发明能够进行的另一种方法是在小分子数据库中用计算机筛选可以与甲型流感2009大流行H1N1PA亚基的核酸内裂解活性位点或甲型流感2009大流行H1N1PA多肽变体之活性位点以整体或部分结合的化合物。在此筛选中,这些化合物与活性位点的匹配度可由形状互补性或者由估计的相互作用能量来判断(Meng等,1992,J.Comp.Chem.13:505-524)。

或者,用于甲型流感2009大流行H1N1PA亚基或其甲型流感2009大流行H1N1多肽变体的核酸内裂解活性的潜在调节剂(优选核酸内裂解活性的抑制剂)可基于图1至图5的PA多肽片段的3D结构从头设计。有本领域技术人员可得到的多种配体从头设计方法。这些方法包括(i)LUDI(Bohm,1992,J.Comp.Aid.Mol.Des.6:61-78;LUDI可得自Molecular Simulations Incorporated,San Diego,CA),(ii)LEGEND(Nishibata和Itai,Tetrahedron 47:8985-8990;LEGEND可得自Molecular Simulations Incorporated,San Diego,CA),(iii)LeapFrog(可得自Tripos Associates,St.Louis,MO),(iv)SPROUT(Gillet等,1993,J.Comp.Aid.Mol.Des.7:127-153;SPROUT可得自University of Leeds,UK),(v)GROUPBUILD(Rotstein和Murcko,1993,J.Med.Chem.36:1700-1710),以及(vi)GROW(Moon和Howe,1991,Proteins11:314-328)。

此外,可支持本领域技术人员对核酸内裂解活性位点的潜在调节剂和/或抑制剂(优选核酸内裂解活性位点的结合伴侣)进行从头设计和建模的数种分子建模方法(通过引用并入本文)已有描述,并且包括如Cohen等,1990,J.Med.Chem.33:883-894;Navia和Murcko,1992,Curr.Opin.Struct.Biol.2:202-210;Balbes等,1994,综述于ComputationalChemistry,第5卷,Lipkowitz和Boyd编,VCH,New York,第37-380页;Guida,1994,Curr.Opin.Struct.Biol.4:777-781。

被设计或选择用作与甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点相结合的分子可以进一步通过计算进行优化,从而使其在结合状态下优选与目标区域不存在排斥性静电相互作用。这些非互补性(例如静电)相互作用包括排斥性电荷-电荷、偶极-偶极以及电荷-偶极相互作用。特别地,在结合状态下结合化合物与结合口袋之间所有静电相互作用之和优选对结合焓无影响或有有利贡献。本领域有可评价化合物形变能和静电相互作用的特定计算机程序。合适的程序实例包括(i)Gaussian 92修订版C(Frisch,Gaussian,Incorporated,Pittsburgh,PA),(ii)AMBER,4.0版(Kollman,University of California,San Francisco,CA),(iii)QUANTA/CHARMM(Molecular Simulations Incorporated,San Diego,CA),(iv)OPLS-AA(Jorgensen,1998,Encyclopedia ofComputational Chemistry,Schleyer编,Wiley,New York,第3卷,第1986-1989页),以及(v)Insight II/Discover(Biosysm TechnologiesIncorporated,San Diego,CA)。这些程序可使用例如Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000工作站550型来执行。其它硬件系统和软件包是本领域技术人员已知的。

一旦如上所述选择和设计了目的分子,就可对其进行一些原子或侧链基团的替换以改善或修饰其结合特性。一般来说,最初的替换是保守的,即,替换基团与原始基团的大小、形状、疏水性和电荷大致相同。当然,应理解,应避免本领域中已知改变构象的组分。然后可通过与如上详细所述相同的计算机方法来分析这些经替换的化学化合物与甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点的匹配效率。

在本发明上述方法的一个实施方案中,甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120和His41或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys34或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr24或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg84或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Phe105或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr130或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Ile38或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg124或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34和Tyr24或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24和Arg84或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84和Phe105或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105和Tyr130或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130和Ile38或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Arg124或其对应氨基酸。

而在又一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Glu26或其对应氨基酸,或者SEQ IDNO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124和Glu26或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Lys134或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124和Lys134或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Leu106或其对应氨基酸,或者SEQ IDNO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Lys137或其对应氨基酸,或者SEQ IDNO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124和Lys137或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Gly26和Lys134或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Gly26和Lys134或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Leu106和Lys137或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Leu106和Lys137或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Lys137或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26和Lys137或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Leu106或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Leu106或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Lys134和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Lys137或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Lys134和Lys137或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134和Leu106或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26、Lys134和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134、Leu106和Lys137或其对应氨基酸,或者SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26、Lys134、Leu106和Lys137或其对应氨基酸。

在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Glu26或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys134或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、I1e120、His41和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys137或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26和Lys134或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134和Leu106或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134、Leu106和Lys137或其对应氨基酸。

在本发明上述方法的一个实施方案中,甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120和His41的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120和His41的PA亚基氨基酸Glu、Glu、Asp、Ile和His的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys34的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120和His41和Lys34的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr24的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr24的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg84的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg84的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Arg的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Phe105的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Phe105的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Phe的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr130的结构坐标来限定,或者由根据图15或图16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Tyr130的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ IDNO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Ile38的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Ile38的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Ile的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg124的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Arg124的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Arg的结构坐标来限定。

在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34和Tyr24的结构坐标来限定,或者由根据图15或图16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34和Tyr24的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24和Arg84的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24和Arg84的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr和Arg的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84和Phe105的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84和Phe105的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg和Phe的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105和Tyr 130的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105和Tyr 130的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130和Ile38的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130和Ile38的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr和Ile的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至图5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp 108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Arg124的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp 108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Arg124的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile和Arg的结构坐标来限定。

在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Glu26的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Glu26的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile和Glu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Lys134的结构坐标来限定,或者由根据图15或16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Lys134的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile138和Lys 137的结构坐标来限定,或者由根据图15或16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Gly26和Lys134的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Lys134的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Leu106和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Leu106和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Leu和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ilel 20、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Lys和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Lys134和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Lys和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu、Lys和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyrl 30、Ile38、Glu26、Lys134、Leu106和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134、Leu106和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu、Lys、Leu和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26、Lys134、Leu106和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Arg124、Glu26、Lys134、Leu106和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Arg、Glu、Lys、Leu和Lys的结构坐标来限定。

在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Glu26的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Glu26的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Glu的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys134的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys134的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Leu的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26和Lys134的结构坐标来限定,或者由根据图15或16的分别对应于SEQ IDNO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26和Lys134的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Glu和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134和Leu106的结构坐标来限定,或者由根据图15或16的分别对应于SEQID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134和Leu106的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Glu、Lys和Leu的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图1至5的PA亚基SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134、Leu106和Lys137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134、Leu106和Lys137的PA亚基氨基酸Glu、Glu、Asp、Ile、His、Glu、Lys、Leu和Lys的结构坐标来限定。

本发明人出乎意料地发现,二价阳离子的结合需要甲型流感2009大流行H1N1PA亚基的活性位点中SEQ ID NO:2的氨基酸His41、Glu80、Asp108、Glu119和Ile120(参见,例如图1和6),而在图2至5(也参见图7至10以及表1和2)所示的结构中化合物(即抑制剂)的结合需要甲型流感2009大流行H1N1PA亚基的活性位点中SEQ ID NO:2的氨基酸Tyr24、Lys34、Ile38、Arg84、Phe105和Tyr130,并且这些氨基酸的构象从未连接结构(unligated structure)改变(参见图1和6)。另外,本发明人确定了还需要甲型流感2009大流行H1N1PA亚基的活性位点中SEQ ID NO:2的氨基酸残基Leu106、Lys134、Lys137和Glue26以与测试化合物接触(参见表1和2、图2至5以及图7至10)。也参见图15至19。另外,本发明人发现,在图16和18所示的结构中化合物(即抑制剂)相互作用需要甲型流感2009大流行H1N1PA亚基的活性位点中的氨基酸Arg124。化合物/配体相互作用的残基和活性位点的可塑性的三维信息对为改善现有抑制剂的效力而对其进行的修饰优化设计非常重要。另外,因而,设计、鉴定和选择与这些氨基酸相互作用的新型抗病毒化合物是高度优选的。

如果根据本文上述方法的计算机建模表明化合物与甲型流感2009大流行H1N1PA亚基或其变体的活性位点结合,则可合成所述化合物并且任选地,所述化合物或其可药用盐可以与一种或更多种可药用赋形剂和/或载体一起配制。因而,上述方法还可包括以下步骤:

(e)合成所述化合物并且任选地将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制。

任选地,所述化合物或其可药用盐或其制剂调节(优选降低、更优选抑制)甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性的能力可在体内或体外进行测试,其还包括进一步的以下步骤:

(f)将所述化合物与本发明的PA多肽片段或其变体或者本发明的重组宿主细胞相接触,并确定所述化合物的以下能力:(i)结合活性位点和/或(ii)调节(优选降低、更优选抑制)甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性的能力。这些化合物与活性位点的匹配度可通过形状互补性或估计的相互作用能来判断(Meng等,1992,J.Comp.Chem.13:505-524)。合成所述化合物的方法为本领域技术人员熟知或者这些化合物可以是市售的。

本发明的另一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行H1N1PA亚基或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。

本发明的又一方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基多肽片段或其变体的核酸内裂解活性位点来调节(优选地降低、更优选地抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性。

本发明的又一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)另一些病毒(优选地正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。

优选地,上述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点具有如上所述的结构。

因而,优选地,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120和His41或其相应氨基酸。

更优选地,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130和Ile38或其相应氨基酸,或者包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38和Arg124或其相应氨基酸。

还更优选地,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Glu26、Lys134、Leu106和Lys137或其相应氨基酸。

最优选地,所述活性位点包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Glu26、Lys134、Leu106和Lys137或其相应氨基酸,或者包含SEQ ID NO:2的PA亚基的氨基酸Glu80、Glu119、Asp108、Ile120、His41、Lys34、Tyr24、Arg84、Phe105、Tyr130、Ile38、Argl 24、Glu26、Lys134、Leu106和Lys137或其相应氨基酸。

优选地,上述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点由上述的PA亚基的结构坐标来限义。

可以容易地评估化合物关联(优选结合)前述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点的能力和/或调节(优选降低、更优选抑制)PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不存在或存在不同量的测试化合物的情况下将经纯化的PA亚基或PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定的时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件以使得PA亚基或PA亚基多肽片段在没有测试化合物的情况下有核酸内裂解活性。之后,通过例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解地切割时提供信号,但如果底物分子完整则不提供信号。例如,底物多核苷酸链可用荧光报告分子和荧光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么荧光报告分子就会被淬灭。如果底物多核酸链被切割,那么荧光报告分子和淬灭剂分离,从而荧光报告分子发出可被例如ELISA阅读器检测到信号。另一些合适的方法在下文描述。

优选地,所述化合物可通过上述方法鉴定。更优选地,所述化合物通过上述方法鉴定。

可由上述方法鉴定的化合物可以调节甲型流感2009大流行H1N1PA亚基或其变体的核酸内切酶活性。可由上述方法鉴定的化合物可以调节(优选降低、更优选抑制)本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性。还可以的是,可由上述方法鉴定的化合物也可以调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。

本发明的化合物可以是任何试剂,包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂质、金属、核苷酸、核苷、核酸、小有机或无机分子、化学化合物、元素、糖、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺及其组合和衍生物。术语“小分子”指分子量为50至约2,500道尔顿、优选200~800道尔顿的分子。另外,根据本发明的测试化合物可任选地包含可检测标记。这些标记包括但不限于酶标记、放射性同位素或放射活性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。

在本发明化合物的一个优选实施方案中,所述化合物不是4-取代的2-二氧代丁酸、4-取代的4-二氧代丁酸、4-取代的2,4-二氧代丁酸、2,6-二酮哌嗪或其衍生物、取代的2,6-二酮哌嗪或其衍生物、吡嗪-2,6-二酮或取代的吡嗪-2,6-二酮如flutimide、N-异羟戊酸或N-羟酰胺(N-hydroxymide)。

尤其地,根据本发明的化合物不是式I的化合物:

式I

R1=Me、Et、Ph

R2=酰基、氨基甲酰基、磺酰基

在本发明化合物的另一个优选实施方案中,化合物不是4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸、核糖尿苷一磷酸(rUMP)、脱氧胸苷一磷酸(dTMP)或2.4-二氧代-4-苯基丁酸(DPBA)。

在本发明化合物的又一个优选实施方案中,所述化合物不是儿茶素,优选地不是(-)-表没食子儿茶素没食子酸酯(EGCG)如[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟苯基)色满-3-基]3,4,5-三羟基苯甲酸酯、(-)-表儿茶素没食子酸酯(ECG)、(-)-表没食子儿茶素(EGC)、(-)-表儿茶素(EC)或没食子酸(GA)。在本发明之化合物的另一个优选实施方案中,所述化合物不是苯乙基苯基酞亚胺、源自反应酮或雷特格韦的苯乙基苯基酞亚胺类似物(也是二酮丁酸衍生物)。

在又一个方面中,本发明提供一种(体外)方法,其用于鉴定调节(优选降低、更优选抑制)来自甲型流感2009大流行H1N1病的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性的化合物,所述方法包括下列步骤:

(i)将根据本发明的所述多肽片段或其变体或者根据本发明的所述重组宿主细胞与测试化合物接触,和

(ii)分析所述测试化合物调节(优选降低、更优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。

优选地,所述化合物通过关联(优选结合)来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。

在又一个方面中,本发明提供一种(体外)方法,其用于鉴定结合核酸内裂解活性位点,(和)优选地调节(更优选降低、最优选抑制)来自甲型流感2009大流行H1N1病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性的化合物,所述方法包括下列步骤:

(i)将根据本发明的所述多肽片段或其变体或者根据本发明的所述重组宿主细胞与测试化合物接触,和

(ii)分析所述测试化合物结合核酸内裂解位点,(和)优选地调节(更优选降低、最优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。

在一个实施方案中,甲型流感2009大流行H1N1PA多肽片段或其变体和测试化合物之间的相互作用可以以下拉测定(pull down assay)的形式进行分析。例如,可将根据本发明的PA多肽片段或其变体纯化并固定在珠子上。在一个实施方案中,固定在珠子上的PA多肽片段可与下列物质接触:例如(i)另一种经纯化的蛋白质、多肽片段或肽,(ii)蛋白质、多肽片段或肽的混合物或者(iii)细胞或组织提取物,并且蛋白质、多肽片段或肽的结合可通过将聚丙烯酰胺凝胶电泳与考马斯染色或Western印迹联合进行验证。未知的结合伴侣可通过质谱分析进行鉴定。

在另一个实施方案中,甲型流感2009大流行H1N1PA多肽片段或其变体和测试化合物之间的相互作用可采用基于酶联免疫吸附测定(ELISA)的实验的形式进行分析。在一个实施方案中,可将根据本发明的PA多肽片段或其变体固定在ELISA板的表面并与测试化合物接触。对于例如蛋白质、多肽、肽和表位标签化的化合物,可以通过对测试化合物或表位标签特异的抗体来验证测试化合物的结合。这些抗体可以直接偶联酶或用偶联所述酶(与合适的底物组合)的第二抗体进行化学发光反应(例如,辣根过氧化物酶)或显色反应(碱性磷酸酶)来检测。在另一个实施方案中,不能通过抗体检测的化合物结合可通过直接偶联测试化合物的标记来验证。这些标记可包括酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个实施方案中,可将测试化合物固定在ELISA板上并与根据本发明的PA多肽片段或其变体接触。所述多肽的结合可通过如上述的PA多肽片段特异性抗体和化学发光或显色反应来验证。

在又一个实施方案中,经纯化的甲型流感2009大流行H1N1PA多肽片段或其变体可与肽阵列一起孵育,并且PA多肽片段与对应特定肽序列的特异性肽点的结合可通过以下进行分析:例如PA多肽特异性抗体、针对融合至PA多肽片段的表位标签的抗体或者通过由PA多肽片段偶联的荧光标签发出的荧光信号。

在另一个实施方案中,将根据本发明的重组宿主细胞与测试化合物接触。这可通过将测试蛋白质或多肽共表达并通过例如荧光共振能量转移(FRET)或免疫共沉淀验证相互作用来实现。在另一个实施方案中,可将直接标记的测试化合物添加至重组宿主细胞的培养基中。测试化合物穿透膜并结合PA多肽片段的能力可例如通过所述多肽的免疫沉淀以及验证标记的存在来验证。

在另一个实施方案中,评估测试化合物调节(优选降低、更优选抑制)甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不同量的测试化合物存在或不存在的情况下使经纯化的PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件以使PA亚基多肽在没有测试化合物的情况下有核酸内裂解活性。之后,通过例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解切割时提供信号,而如果底物分子完整则不提供信号。例如,底物多核苷酸链可用荧光报告分子和荧光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么荧光报告分子就被淬灭。如果底物多核酸链被切割,那么荧光报告分子和淬灭剂分离,从而荧光报告分子发出可被例如ELISA阅读器检测到信号。这个实验设置可应用于多孔板形式并且适于根据化合物调节、降低或抑制甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性的能力来高通量筛选所述化合物。

优选地,测试化合物抑制甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性的能力在上述方法中进行分析。

在一个优选实施方案中,关联(优选结合)核酸内裂解活性位点且调节、降低和/或抑制甲型流感2009大流行H1N1 PA亚基多肽片段或其变体之核酸内裂解活性的化合物的上述鉴定方法以高通量形式进行。在一个优选实施方案中,所述方法使用根据本发明的PA多肽片段或其变体和标记的测试化合物在如上述的多孔微量滴定板中进行。

在一个优选实施方案中,测试化合物来自合成或天然化合物的文库。例如,合成化合物文库可购自Maybridge Chemical Co.(Trevillet,Cornwall,UK)、ChemBridge Corporation(San Diego,CA)或Aldrich(Milwaukee,WI)。天然化合物文库例如可得自TimTec LLC(Newark,DE)。或者,可使用细菌、真菌、植物和动物提取物的天然化合物文库。另外,可使用组合化学合成产生单种化合物或混合物形式的测试化合物。

在另一个实施方案中,可以以体内形式测试所鉴定化合物对甲型流感2009大流行H1N1病毒的生命周期的抑制作用。可以在所鉴定化合物存在或不存在的情况下,用甲型流感2009大流行H1N1病毒感染对易受流感病毒感染的细胞系,如293T人胚肾细胞、Madin-Darby狗肾细胞或鸡胚成纤维细胞。在一个优选实施方案中,可将已鉴定的化合物以多种浓度添加至细胞培养基中。病毒蚀斑的形成可被用作甲型流感2009大流行H1N1病毒的感染能力的读出值,并且可将经鉴定化合物处理的细胞与未用其处理的细胞进行比较。

在本发明的又一个实施方案中,应用于任何上述方法的测试化合物是小分子。在一个优选实施方案中,所述小分子来自文库,例如小分子抑制剂文库。在另一个实施方案中,所述测试化合物是肽或蛋白质。在一个优选实施方案中,所述肽或蛋白质来自肽文库或蛋白质文库。

在用于计算和体外鉴定关联(优选结合)核酸内裂解活性位点且调节、降低和/或抑制本发明甲型流感2009大流行H1N1PA亚基多肽片段或其变体之核酸内裂解活性的化合物的上述方法的另一个实施方案中,所述方法还包括将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制的步骤。

如上文所述,本发明的一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行H1N1PA亚基或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。

本发明的另一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)根据本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)根据本发明的PA亚基多肽片段或其变体的核酸内裂解活性位点来调节、优选地降低、更优选地抑制所述PA亚基多肽片段或其变体的核酸内切酶活性。

本发明的又一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)另一些病毒(优选为正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)另一些病毒(优选为正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。

可容易地评估化合物关联(优选结合)前述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点和/或调节(优选降低、更优选抑制)PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不同量的测试化合物存在或不存在的情况下使经纯化的PA亚基或PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定的时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件使得PA亚基或PA亚基多肽片段在没有测试化合物的情况下有核酸内裂解活性。之后,通过例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解切割时提供信号,而如果底物分子完整则不提供信号。例如,底物多核苷酸链可用荧光报告分子和荧光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么荧光报告子就会被淬灭。如果底物多核酸链被切割,那么荧光报告子和淬灭剂分离,从而荧光报告子发出可被例如ELISA阅读器检测到信号。另一些合适的方法在下文描述。

优选地,所述化合物可通过上述(体外)方法进行鉴定。更优选地,所述化合物通过上述(体外)方法进行鉴定。

可由上述(体外)方法鉴定的化合物可以调节甲型流感2009大流行H1N1PA亚基或其变体的核酸内切酶活性。可由上述(体外)方法鉴定的化合物可以调节(优选降低、更优选抑制)根据本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内切酶活性。

还可以的是,可由上述(体外)方法鉴定的化合物可以调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。

本发明化合物可以是以上计算机(in silico)筛选方法中所述的任何试剂。在本发明化合物的一个优选实施方案中,化合物不是4-取代的2-二氧代丁酸、4-取代的4-二氧代丁酸、4-取代的2,4-二氧代丁酸、2,6-二酮哌嗪或其衍生物、取代的2,6-二酮哌嗪或其衍生物、吡嗪-2,6-二酮或取代的吡嗪-2,6-二酮如flutimide、N-异羟戊酸或N-羟酰胺。

尤其地,根据本发明的化合物不是式I的化合物:

式I

R1=Me、Et、Ph

R2=酰基、氨基甲酰基、磺酰基

在本发明化合物的另一个优选实施方案中,化合物不是4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸、核糖尿苷一磷酸(rUMP)、脱氧胸苷一磷酸(dTMP)或2.4-二氧代-4-苯基丁酸(DPBA)。

在本发明化合物的又一个优选实施方案中,所述化合物不是儿茶素,优选不是(-)-表没食子儿茶素没食子酸酯(EGCG)如[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯、(-)-表儿茶素没食子酸酯(ECG)、(-)-表没食子儿茶素(EGC)、(-)-表儿茶素(EC)或没食子酸(GA)。在本发明化合物的另一个优选实施方案中,所述化合物不是不是苯乙基苯基酞亚胺、源自反应酮或雷特格韦的苯乙基苯基酞亚胺类似物(也是二酮丁酸衍生物)。

本发明的一个方面是提供一种药物组合物,其包含前述的本发明化合物或其可药用盐。本发明的又一个方面是提供一种药物组合物,其包含前述的本发明化合物或其可药用盐以及一种或更多种可药用赋形剂和/或载体。

如上文所述,在本发明的药物组合物中包含的化合物(i)能够例如通过结合根据本发明的甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述亚基或其变体的核酸内切酶活性;(ii)能够例如通过结合根据本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述多肽片段或其变体的核酸内切酶活性,或者(iii)能够例如通过结合另一些病毒(优选地正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。优选地,本发明药物组合物中包含的化合物可通过上述方法进行鉴定。更优选地,本发明药物组合物中包含的化合物通过上述方法进行鉴定。

优选地,根据上述方法可生产所述药物组合物。

根据本发明的化合物可单独施用,但是在对人的治疗中,通常与根据预期施用途径和标准药物实践所选择的合适的药物赋形剂、稀释剂或载体混合施用(参见后文)。

在计算建模或筛选本发明甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点的结合伴侣、核酸内裂解活性的调节剂和/或抑制剂的方面中,可以将对作为药物施用的分子有利的化学部分引入目的分子。例如,可将化学部分引入目的分子或从其中去除化学部分,所述化学部分可不直接影响分子与靶区域结合但影响例如该分子在可药用载体中的总体溶解度、该分子的生物利用率和/或该分子的毒性。优化目的分子之药理学的注意事项和方法可见于,例如“Goodman andGilman′s The Pharmacological Basis of Therapeutics”第8版,Goodman、Gilman、Rail、Nies和Taylor编,Pergamon Press(1985);Jorgensen &Duffy,2000,Bioorg.Med.Chem.Lett.10:1155-1158。另外,计算机程序“Qik Prop”可用以对目的有机分子的身体意义上的描述(physicallysignificant description)和药学相关特性进行快速预测。“五项标准(Ruleof Five)”概率方案可用以估计新合成化合物的口服吸收(Lipinski et al.,1997,Adv.Drug Deliv.Rev.23:3-25)。适于药效团选择和设计的程序包括(i)DISCO(Abbot Laboratories,Abbot Park,IL),(ii)Catalyst(Bio-CADCorp.,Mountain View,CA)和(iii)Chem DBS-3D(Chemical Design Ltd.,Oxford,UK)。

本发明考虑的药物组合物可以以本领域技术人员公知的多种方式进行配制。例如,本发明的药物组合物可以是固体形式如片剂、丸剂、胶囊剂(包括软凝胶囊剂)、扁囊剂、锭剂、阴道栓剂(ovule)、粉剂、颗粒剂或栓剂,或者液体形式如酏剂、溶液剂、乳剂或悬浮剂。

固体施用形式可包含赋形剂如微晶纤维素、乳糖、柠檬酸钠、碳酸钙、二碱式磷酸钙、甘氨酸和淀粉(优选为玉米淀粉、马铃薯淀粉或木薯淀粉),崩解剂如羟乙酸淀粉钠、交联羧甲基纤维素钠和某些复合硅酸盐,以及颗粒粘合剂如聚乙烯吡咯烷酮、羟丙基甲基纤维素(HPMC)、羟丙基纤维素(HPC)、蔗糖、明胶和阿拉伯胶。另外,可包含润滑剂如硬脂酸镁、硬脂酸、山嵛酸甘油酯和滑石。相似类型的固体组合物还可用作明胶胶囊的填充剂。在这点上,优选的赋形剂包括乳糖(lactose)、淀粉、纤维素、乳糖(milk sugar)或高分子量聚乙二醇。

对于适于经口施用的水性悬浮剂、溶液剂、酏剂和乳剂,化合物可与以下物质组合:多种甜味剂或调味剂、色素或染料;乳化剂和/或混悬剂以及稀释剂如水、乙醇、丙二醇和甘油及其组合。

本发明的药物组合物可包含释放率调节剂,包括,例如羟丙基甲基纤维素、甲基纤维素、羧甲基纤维素钠、乙基纤维素、醋酸纤维素酯、聚氧化乙烯、黄原酸胶、卡波姆(Carbomer)、铵甲基丙烯酸酯共聚物、氢化蓖麻油、卡瑙巴蜡、石蜡、醋酸邻苯二甲酸纤维素、羟丙基甲基纤维素邻苯二甲酸酯、甲基丙烯酸共聚物及其混合物。

本发明的药物组合物可以是快速分散或溶解的剂量制剂(FDDF)的形式,并且可包含下列成分:阿斯巴甜、乙酰磺胺酸钾、柠檬酸、交联羧甲基纤维素钠、聚乙烯聚吡咯烷酮、二抗坏血酸(diascorbic acid)、丙烯酸乙酯、乙基纤维素、明胶、羟丙基甲基纤维素、硬脂酸镁、甘露醇、丙烯酸甲酯、薄荷调味剂、聚乙二醇、锻制氧化硅、二氧化硅、淀粉羟基乙酸钠、硬脂酰富马酸钠、山梨醇、木糖醇。

对于制备栓剂,首先使低熔点腊(如脂肪酸甘油酯或可可脂的混合物)熔化,然后如通过搅拌将活性组分均匀地分散于其中。之后,将熔化的均匀混合物倒入合适大小的模,使其冷却,从而固化。

适于胃肠外施用的本发明药物组合物最好是无菌水溶液的形式施用,其可包含其它物质,例如充足的盐或葡萄糖以使溶液与血液等渗。如果需要,水溶液应被适当缓冲(优选地,pH为3至9)。

适于鼻内施用和吸入施用的药物组合物最好以以下形式递送:干粉吸入器或来自使用合适推进剂(例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、氢氟烷烃(如1,1,1,2-四氟乙烷(HFA 134A.TM.)或1,1,1,2,3,3,3-七氟丙烷(HFA 227EA.TM.))、二氧化碳或其它合适的气体)的加压容器、泵、喷雾器(spray)或雾化器的气溶胶喷雾。加压容器、泵、喷雾器或雾化器可包含活性化合物的溶液或悬液,例如,使用乙醇和推进剂的混合物作为溶剂,其可另外地包含润滑剂,例如,三油酸山梨坦。

在另一个方面中,本发明提供针对SEQ ID NO:2的甲型流感2009大流行H1N1病毒PA亚基或其变体的活性位点的抗体,其中所述变体在SEQ ID NO:2的氨基酸位点186或其对应其氨基酸位点上包含氨基酸丝氨酸。

在一个优选实施方案中,所述抗体通过识别选自SEQ ID NO:4至11所述多肽的多肽片段来识别核酸内切酶结构域,即,SEQ ID NO:2所示氨基酸序列的20位至30位(SEQ ID NO:4)、32位至40位(SEQ ID NO:5)、41位至51位(SEQ ID NO:6)、80位至90位(SEQ ID NO:7)、100位至110位(SEQ ID NO:8)、115位至125位(SEQ ID NO:9)、130位至140位(SEQ ID NO:10)和176位至186位(SEQ ID NO:11)氨基酸。

尤其地,所述抗体特异性结合包含一个或更多个上述氨基酸的表位,其限定了活性位点。在这种情况下中,术语表位具有其领域公认的含义并且优选地指4至20个、优选5至18、5至15或7至14个氨基酸的链,例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸的链。因此,优选的表位的长度为4至20、5至18,优选5至15或7至14个氨基酸,例如长度为4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸,和/或包含SEQ ID NO:2的Lys34、Glu26、Ile38、Tyr24、His41、Glu80、Arg84、Leu106、Asp108、Glu119、Ile120、Arg124、Tyr130、Lys134、Phe105和Lys137中的一个或更多个或者一个或更多个对应的氨基酸。因而,在一个优选实施方案中,所述抗体识别SEQ ID NO:2所示氨基酸序列的5至15个氨基酸的多肽片段,其中所述多肽片段包含一个或更多个选自以下的氨基酸残基:Lys34、Glu26、Ile38、Tyr24、His41、Glu80、Arg84、Leu106、Asp108、Glu119、Ile120、Tyr130、Lys134、Phe105、Lys137和Arg124。

本发明的抗体可以是单克隆抗体或多克隆抗体或其部分。抗原结合部分可通过重组DNA技术或通过酶切割或化学切割完整抗体来产生。在一些实施方案中,抗原结合部分包括Fab、Fab’、F(ab’)2、Fd、Fv、dAb和互补决定区(CDR)片段、单链抗体(scFv)、嵌合抗体(如人源化抗体)、双抗体和至少包含足以使特异性抗原结合多肽的一部分抗体的多肽。本发明的抗体根据标准方案产生。例如,可根据本领域技术人员熟知的标准方法,通过使用目的抗原(任选地与佐剂(如弗氏完全佐剂或不完全佐剂,RIBI(胞壁酰二肽)或ISCOM(免疫刺激复合物))相组合)免疫动物(如小鼠、大鼠、兔子、山羊、绵羊、猪、牛或马)来产生多克隆抗体。针对甲型流感2009大流行H1N1PA或其片段的核酸内切酶结构域的多克隆抗血清通过对经免疫动物放血或将其处死而获得自该动物。血清(i)可以以从动物中获得的形式原样使用,(ii)可从血清获得免疫球蛋白级分,或者(iii)可从血清中纯化甲型流感2009大流行H1N1PA或其片段的核酸内切酶结构域的特异性抗体。单克隆抗体可由本领域技术人员熟知的方法产生。简言之,在免疫后将动物处死,通过使用本领域已知的任何方法使淋巴结和/或脾B细胞永生化。使细胞永生化的方法包括但不限于,用癌基因转染它们;用致癌病毒感染它们以及将它们在选择永生化细胞的条件下培养;使它们经受致癌或突变化合物;使它们与永生化细胞(例如,骨髓瘤细胞)融合;以及使肿瘤抑制基因失活。使用H1N1PA核酸内切酶结构域或其片段筛选永生化细胞。选择产生针对H1N1PA核酸内切酶结构域或其片段之抗体的细胞(例如,杂交瘤),克隆并对其期望的特征(包括稳定生长、高抗体产生和期望的抗体特征)进行进一步筛选。杂交瘤可在以下中扩增:(i)同基因(syngeneic)动物体内扩增,(ii)缺少免疫系统的动物,例如裸鼠,或者(iii)细胞培养物体外扩增。选择、克隆和扩增杂交瘤的方法为本领域技术人员熟知。技术人员可参考标准教科书,如“Antibodies:A Laboratory Manual”,Harlow和Lane编,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York(1990),其通过引用并入本文用于为抗体产生提供支持。

在另一个方面中,本发明涉及根据本发明的化合物、根据本发明的药物组合物或根据本发明的抗体在制备药物中的用途,所述药物用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染而引起的(优选由甲型流感2009大流行H1N1病毒通过病毒感染而引起的)疾病病症,。

所述化合物(i)能够通过例如结合根据本发明的甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性,(ii)能够通过例如结合根据本发明的甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性,或者(iii)能够通过例如结合另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。

优选地,所述化合物通过上述方法可鉴定。进一步优选地,所述药物组合物可根据上述方法产生。因而,优选地,本发明涉及由上述方法可鉴定的化合物的用途,所述化合物能够结合甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点,和/或能够调节(优选降低、更优选抑制)甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性;或者本发明涉及根据上述方法可产生的药物组合物用于制备药剂的用途,所述药剂用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染而引起(优选由甲型流感2009大流行H1N1病毒通过病毒感染而引起)的疾病病症。

在另一个方面中,本发明涉及根据本发明的化合物、根据本发明的药物组合物或根据本发明的抗体用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染而引起(优选由甲型流感2009大流行H1N1病毒通过病毒感染而引起)的疾病病症。

所述化合物(i)能够通过例如结合甲型流感2009大流行H1N1PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性,(ii)能够通过例如结合甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性,或者(iii)能够通过例如结合另一些病(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。

优选地,所述化合物由上述方法可鉴定。进一步优选地,所述药物组合物根据上述方法可产生。因而,优选地,本发明涉及由上述方法鉴定的化合物,其能够结合甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点,和/或能够调节(优选降低、更优选抑制)甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性;或者本发明涉及根据上述方法可产生的药物组合物,其用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染而引起(优选由甲型流感2009大流行H1N1病毒通过病毒感染而引起)的疾病。

在另一个方面中,本发明涉及以下化合物在制备药剂方面的用途:4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG),所述药剂用于治疗、改善或预防由甲型流感2009大流行H1N1病毒通过病毒感染而引起的疾病病症,因为本发明人已经确定了所述化合物能够结合甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性位点并且能够调节(即抑制)甲型流感2009大流行H1N1PA亚基多肽片段或其变体的核酸内裂解活性。

在另一个方面中,本发明涉及用于治疗、改善或预防由甲型流感2009大流行H1N1病毒通过病毒感染而引起的疾病的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)、4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)。

在另一个方面中,本发明涉及4-取代的2,4-二氧代丁酸化合物或绿茶儿茶素在治疗、改善或预防由甲型流感2009大流行H1N1病毒通过病毒感染而引起的疾病病症方面的用途。

为治疗、改善或预防所述疾病病症,本发明的药剂可经口、口腔、舌下、鼻内、经由肺途径如吸入、经由直肠途径,或者胃肠外,如海绵窦体内、静脉内、动脉内、腹膜内、鞘内、心室内、尿道内、胸骨内、颅内、肌内或皮下施用给动物患者,优选哺乳动物患者,优选人患者,它们可通过输注或无针注射技术进行施用。

本发明的药物组合物可用本领域技术人员熟知的和上述的多种方式配制。

药物制剂优选地为单位剂型。在这样的形式中,制剂被再分为包含合适量的活性组分的单位剂量。单位剂型可以是包装的制剂,所述包装包括分散量制剂,如包装的片剂、胶囊和小瓶或安瓿中的粉剂。另外,单位剂型可以是胶囊、片剂、扁囊剂或锭剂本身,或者它可以是包装形式的合适数目的任何这些。

根据具体应用和活性组分的效力,在本发明使用中施用的单位剂量制剂中活性组分的量可以在约1mg至约1000mg/m2,优选地约5mg至约150mg/m2之间改变或调节。

应用于本发明医学用途的化合物的初始施用剂量为每日约0.05mg/kg至约20mg/kg。优选日剂量为约0.05mg/kg至约2mg/kg,最优选日剂量为约0.05mg/kg至约1mg/kg。但是,剂量可根据患者的需求、所治疗病症的严重程度和所使用的化合物而异。具体情况下的合适剂量的确定在每个医师的技能范围之内。通常,治疗以较小的剂量开始,该剂量小于化合物的最佳剂量。其后,少量增加剂量直至达到该情况下的最佳效果。为了方便起见,如期望,总日剂量可被分开并在一天当中分次施用。

本发明的多种修改和改变对本领域技术人员而言是显而易见的,并且没有背离本发明的范围。尽管针对特定的优选实施方案描述了本发明,但是应理解,要求保护的本发明不应被过度地限于这些特定的实施方案。事实上,对于进行本发明而言,所述方式的多种修改对相关领域技术人员而言是显然的,并且意图被本发明覆盖。

下列附图和实施例仅仅阐述本发明并且不应视作以任何方式限制所附权利要求所述的本发明范围。

附图说明

图1~5(共用注解):在具有或不具有结合化合物的情况下,根据SEQID NO:2所示氨基酸序列之1至198位氨基酸的PA多肽片段1至198位氨基酸(PA H1N1 1至198)的精修原子结构坐标。对于每个结构,通常在表示为A、B、C和D的结晶不对称单元(AUS)中具有四个分子。但是,在图1~5中,只显示了一个选定分子(参见下文)。文件标题给出了关于结构精修化的信息。“Atom”指其坐标被测量的元素。列中的第一个字母定义元素。给出各氨基酸的三字母代码和氨基酸序列位置。“Atom”列中的前三个值定义所测量元素的原子位置。第四个值对应占位(occupancy),第五个(最后)值是温度因子(B因子)。占位因子指分子中每个原子占据坐标所表示的位置的比例。值为“1”表明所有等价的晶体分子中每个原子具有相同的构象,即相同位置。B是温度因子,其度量原子围绕它的原子中心的运动。该名词对应蛋白质数据库(Protein DataBank(PDB))格式。

图1:按照标准蛋白质数据库(PDB)格式的天然(即没有化合物/配体)H1N1PA核酸内切酶结构域的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即一个镁离子和一个锰离子,以及水分子)。链B、C和D非常相似。

图2:按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)的H1N1PA核酸内切酶结构域的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-R05-3具有残基描述子ci3。

图3:按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)的H1N1 PA核酸内切酶结构域的结构坐标。仅包含来自不对称单元的链D(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-05-03的构象与在链A中不同(图2)。所述化合物具有残基描述子ci3。

图4:按照标准蛋白质数据库(PDB)格式的具有结合的4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)的H1N1PA核酸内切酶结构域的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。链B、C和D非常相似。化合物EMBL-R05-2具有残基描述子ci2。

图5:按照标准蛋白质数据库(PDB)格式的具有结合的核糖尿苷一磷酸(rUMP)的H1N1PA核酸内切酶结构域的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。链B、C和D非常相似。化合物rUMP具有残基描述子U。

图6:使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图1之结构坐标的图,该图显示了二价阳离子(一个锰和一个镁)和关键活性位点残基。

图7:(A)使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图2之结构坐标的图,显示了结合化合物EMBL-R05-3、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Arg84);和(B)比较图1(在左侧下面的链)和图2的坐标的图,该图显示了在结合EMBL-R05-3后Tyr24附近的环构象的改变(链A)。Tyr24侧链移动至与EMBL-R05-3的氯苯部分层叠。

图8:使用阐明核酸内切酶活性位点(PA多肽片段(链D))的图3之结构坐标的图,该图显示了结合化合物EMBL-R05-3、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Arg84)。

图9:使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图4之结构坐标的图,显示了结合化合物EMBL-R05-2、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Phe105)。

图10:使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图5之结构坐标的图,显示了结合化合物rUMP、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Lys34)。

图11:来自H1N1 PA 1至198的常规纯化物的15% PAGE凝胶和凝胶过滤谱。箭头表明残余MBP的模糊痕迹。

图12:在P212121空间群中与rUMP共结晶的H1N1 PA N端的冷冻晶体。

图13:天然核酸内切酶结构中的二价离子坐标。

图14:在与H1N1 PA N端的共结晶的rUMP和二价阳离子(锰,Mn1和Mn2)的电子密度。在1.1σ的精修的2Fo-Fc电子密度轮廓。在2.8σ的不偏的Fo-Fc电子密度轮廓。在4σ的不规则差异图。

图15~16(共用注解):具有结合化合物的SEQ ID NO:2所示氨基酸序列PA多肽片段的1至198位氨基酸中52位至64位氨基酸被替换为氨基酸甘氨酸(PA H1N1的1位至198位Δ52-64:Gly)的精修原子结构坐标。对于每个结构,在结晶不对称单元(ASU)中具有一个分子。文件标题给出了关于结构精修化的信息。“Atom”指其坐标被测量的元素。列中的第一个字母定义元素。给出各氨基酸的三字母代码和氨基酸序列位置。“Atom”列中的前三个值定义所测量元素的原子位置。第四个值对应占位(occupancy),第五个(最后)值是温度因子(B因子)。占位因子指分子中每个原子占据坐标所表示的位置的比例。值为“1”表明所有等价的晶体分子中每个原子具有相同的构象,即相同位置。B是温度因子,其度量原子围绕它的原子中心的运动。该名词对应蛋白质数据库(PDB)格式。

图15:按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)的H1N1 PA核酸内切酶结构域的结构坐标。包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-R05-1具有残基描述子ci1。

图16:按照标准蛋白质数据库(PDB)格式的具有结合的表没食子儿茶素3-没食子酸酯(EGCG)的H1N1 PA核酸内切酶结构域的结构坐标。包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EGCG具有残基描述子tte。

图17:使用阐明核酸内切酶活性位点(PA多肽片段)的图15之结构坐标的图,该图显示了结合化合物EMBL-R05-1、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Arg84)。

图18:(A)使用阐明核酸内切酶活性位点(PA多肽片段)的图16之结构坐标的图,该图显示了结合化合物EGCG、二价阳离子(两个锰离子)和与化合物相互作用或与其接近的关键活性位点残基。(B)结合EGCG、二价阳离子(两个锰离子)以及与化合物相互作用或与其接近的关键活性位点残基。相互作用小于(灰色虚线),其他可能的相互作用小于(深灰色虚线)。

图19:PA活性位点处结合的所有二酮抑制剂化合物(EMBL-R05-1、EMBL-R05-2以及EMBL-R05-3A和D)和EGCG的重叠。如图19所示,三种二酮抑制剂与金属结合的模式是保守的(尽管在准确位置处有一些变化),但是每个化合物的两个“臂”被插入至口袋1至4的不同组合。EMBL-R05-1与EMBL-R05-3D具有相似的构象,其中两个臂占据口袋2和3。EMBL-R05-3A占据口袋2和4。EMBL-R05-2(在哌啶基环上取代点与R05-1和R05-3显著不同(表2))占据口袋3和独有的口袋1(图7B)。绿茶化合物EGCG占据口袋3和4。也许可以设计占据多于两个口袋的更有效且更特异的化合物。

实施例

为了进一步阐明本发明并提供更好的理解,设计了实施例。不能认为它们以任何方式限制本发明的范围。

1.方法

1.1克隆、表达和纯化来自流感毒株A/加利福尼亚/04/2009-H1N1的PA N端(PA H1N1 1至198)和PA N端突变体(PA H1N1 1至198 Δ52-64:Gly)

由GeneArt,Regensburg,Germany合成来自流感毒株A/加利福尼亚/04/2009-H1N1 PA N端(残基1~198)(参见SEQ ID NO:1和2)的编码DNA(PA H1N1 1至198)并且亚克隆至表达载体pESPRIT002(EMBL)中。该序列被设计成在N端的烟草蚀刻病毒(tobacco etch virus(TEV))切割位点之间包含MGSGMA(SEQ ID NO:3)多肽接头,用以通过TEV蛋白酶获得100%的切割。

为了进一步改善结晶特性,通过定位诱变改造,缺失了一部分柔性环(52~73)。对此,使用突变位点侧翼的两条引物(其中一条磷酸化)和TurboPfu聚合酶(Stratagene)对包含野生型基因的整个载体进行PCR扩增。随后,模板载体用Dpn I(New England Biolabs)消化并且将突变的载体重新连接。在PA N端突变体中,52至64位氨基酸覆盖的氨基酸序列被替换为单一的甘氨酸(PA H1N1 1至198 Δ52-64:Gly)。

用野生型和突变质粒转化大肠杆菌BL21(DE3)(Stratagene),并且用下述方法表达蛋白质:在OD 0.8~1.0时用0.2mM异丙基-β-硫代半乳糖苷(IPTG)诱导,之后在LB培养基中于20℃过夜。蛋白质通过固定化金属亲和柱(IMAC)进行纯化。用带His标签的TEV蛋白酶切割之后,进行第二IMAC步骤,然后在Superdex 75柱(GE Healthcare)上进行凝胶过滤。最后,将蛋白质浓缩至10~15mg/ml。参见图11。

1.2化合物

用于共结晶的化合物在表2中给出。化合物rUMP购自Sigma。化合物EMBL-R05-1、EMBL-R05-2和EMBL-R05-3(在{Tomassini,1994#397}中首次描述)通过Shanghai ChemPartner定制合成。EGCG购自Sigma(E4143)。

1.3结晶

在20℃进行最初的坐滴筛选(sitting drop screening),其中在EMBLGrenoble结晶平台上使用Cartesian机器人混合100nL蛋白质溶液(15mg/mL)和100nL储集溶液。筛选了大约600种条件。随后,通过以1∶1的比率混合蛋白质和储集溶液的悬滴法(hanging drop method)在20℃得到更大的晶体。蛋白质溶液在20mM HEPES pH 7.5、150mL NaCl、2mM MnCl2、2mM MgCl2中包含10~15mg/ml PA N端。天然晶体和与不同化合物/配体的共结晶的精修储集组分(refined reservoircomposition)在表1中列出。为了共结晶,将化合物/配体rUMP、EMBL-R05-3和EGCG添加至蛋白质溶液至终浓度分别为5mM、1.5mM和5mM。天然晶体和与EMBL-R05-3和EGCG共结晶的那些晶体在它们的储集溶液(具有另外的25%甘油作为防冻剂)中于液氮中立即冷冻。与rUMP的共结晶在其储集溶液(具有另外的10mM浓度的rUMP和另外的20%甘油作为防冻剂)中冷冻。具有EMBL-R05-2的结构通过以下获得:用含有1.5mM EMBL-R05-2且不含rUMP(抑制剂代替了rUMP)的储集溶液浸没PA N端和rUMP的共结晶2小时,然后用包含20%甘油和1.5mM EMBL-R05-2的储集溶液进行防冻保护。图12显示了与rUMP的常规共结晶。具有EMBL-R05-1的结构通过以下获得:用含有抑制剂的储集溶液浸没PA N-端突变体和dTMP的共结晶2小时,然后用包含20%甘油和抑制剂的储集溶液进行防冻保护。对于化合物/配体,也参见表2。

表1:多种化合物的结晶条件和结晶参数汇总

表2:所使用的化合物

1.4晶体结构测定

在European Synchrotron Radiation Facility以多种光束线收集衍射数据。数据集与XDS整合并且用XSCALE衡量。随后的数据分析用CCP4i程序组件进行。使用预先确定的H3N2PA N端结构,通过PHASER用分子替换解析初始的H1N1结构(Dias等,Nature 2009)。随后,共结晶结构通过PHASER使用H1N1结构来确定。通过REFMAC和/或用COOT或O进行建模来精修。在C2和P212121晶体形式中,每个不对称单元有四个分子。但是由于分子之间的结构变化(由于可塑性(尤其53至73位区域)和通常的良好分辨率),没有应用NCS限制。

2.结果

2.1PA H1N1多肽片段或PA H1N1多肽片段变体的产生和结晶

本发明人发现,包含流感毒株A/加利福尼亚04/2009-H1N1(2009年流行性毒株)SEQ ID NO:2的1至198位氨基酸的多肽片段(PA H1N11至198)在有和没有相关化合物/配体的情况下都容易结晶(参见图1至10)。还可以通过用多肽片段变体(PA H1N11至198 Δ52-64:Gly)改善结晶特性,该多肽片段变体包含流感毒株A/加利福尼亚/04/2009-H1N1(2009年流行性毒株)SEQ ID NO:2的1至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸(参见图15至18)。

因而,与在现有技术中进行的许多失败尝试相比,本发明人能够得到具有或不具有化合物/配体的PA H1N1多肽片段或PA H1N1多肽片段变体的结构。

具有或不具有化合物/配体的PA H1N1多肽片段或PA H1N1多肽片段变体的结构如下描述。所有的这些结构详细地显示了这些化合物/配体如何直接结合金属离子以及与活性位点的多个残基相互作用。另外,数个相互作用的残基在结合配体后改变了构象,该信息在之前是未知的。配体相互作用残基和活性位点可塑性区域的三维信息对于优化设计现有抑制剂的修饰以改善它们的效力,或对有效阻断核酸内切酶活性的新抑制剂进行基于结构的设计和优化是至关重要的。

2.2H1N1 PA的天然结构

图1显示了按照标准蛋白质数据库(PDB)格式的天然(即没有化合物/配体)H1N1 PA核酸内切酶结构域(PA H1N11至198)(链A)的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即一个镁离子和一个锰离子,以及水分子)。链B、C和D非常相似。图6显示了使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图1之结构坐标的图。它显示了二价阳离子(一个锰和一个镁)和关键活性位点残基。

2.3结合EMBL-R05-3的结构

图2显示了按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)的H1N1 PA核酸内切酶结构域(PA H1N11至198)(链A)的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-R05-3具有残基描述子ci3。图7A显示了使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图2之结构坐标的图。它显示了结合化合物EMBL-R05-3、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Arg84)。

图7B显示了图1(在左侧下面的链)和图2的坐标的比较图,该图显示了结合EMBL-R05-3后Tyr24附近的环构象的改变(链A)。在天然的结构中围绕Tyr24的环较为无序。Tyr24侧链移动至与EMBL-R05-3的氯苯部分堆叠。这表明活性位点的可塑性和配体结合的诱导配合模式。设计更强抑制剂的一个重要结论是,确保任何离子结合支架的延伸(“臂”)优化一个或更多个口袋中的相互作用。不优选的匹配将引起残基的柔性和次优的效力,现有化合物似乎是这种情况,它们均没有表现出很好限定的、完全占据的结合模式。

此外,图3显示了按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)的H1N1PA核酸内切酶结构域(PA H1N11至198)(链D)的结构坐标。仅包含来自不对称单元的链D(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-R05-3与在链A中的构象不同(图2)。所述化合物具有残基描述子ci3。图8显示了使用阐明核酸内切酶活性位点(PA多肽片段(链D))的图3之结构坐标的图。它显示了结合化合物EMBL-R05-3、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Arg84)。

2.4结合EMBL-R05-2的结构

图4显示了按照标准蛋白质数据库(PDB)格式的具有结合的4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)的H1N1 PA核酸内切酶结构域(PA H1N11至198)(链A)的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。链B、C和D非常相似。化合物EMBL-R05-2具有残基描述子ci2。图9显示了使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图4之结构坐标的图。它显示了结合化合物EMBL-R05-2、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Phe105)。

2.5结合核糖尿苷一磷酸(rUMP)的结构

图5显示了按照标准蛋白质数据库(PDB)格式的具有结合的核糖尿苷一磷酸(rUMP)的H1N1PA核酸内切酶结构域(PA H1N11至198)(链A)的结构坐标。仅包含来自不对称单元的链A(具有关联的二价阳离子,即两个锰离子,以及水分子)。链B、C和D非常相似。化合物rUMP具有残基描述子U。

在新的正交空间群中与rUMP的共结晶测试得到了大的、有序的晶体(图12和14)。

图10显示了使用阐明核酸内切酶活性位点(PA多肽片段(链A))的图5之结构坐标的图。它显示了结合化合物rUMP、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Lys34)。rUMP与磷酸盐的两个氧结合完成Mn1的配位层,它们之一也与Mn2配位。这个碱基较好地堆叠在Tyr24上并且Lys34与O2位置形成氢键。核糖羟基不与蛋白质形成氢键,这与下列事实相符:脱氧核糖同样很好地结合并且蛋白质是RNAase与是DNAase的情况差不多{Dias,2009 #448}。

对于rUMP所观察到的构象与之前公开(PDB entry 3hw3{Zhao,2009 #444})非常不同。后者的结构通过在不存在锰的情况下使核苷酸浸入在现有的核酸内切酶晶体中而得到并且电子密度较差。在这个结构中,水分子替换Mn1并且镁离子替换了Mn2。金属连接的该差异表现在Glu119的构象改变上。核糖和碱基位置与本文所提供的结构中的位置非常不同并且不能与Lys34或Tyr24相互作用。这两种结构之间的差异可反映出:首先,不存在锰;其次浸没预生长的晶体不会使活性位点适于配体,对于共结晶很可能也一样。

2.6结合EMBL-R05-1的结构

图15显示了按照标准蛋白质数据库(PDB)格式的具有结合的4-[3-[(4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)的H1N1 PA核酸内切酶结构域(PA H1N1 1至198Δ52-64:Gly)的结构坐标。包含来自不对称单元的链(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EMBL-R05-1具有残基描述子ci1。图17显示了使用阐明核酸内切酶活性位点(PA多肽片段)的图15之结构坐标的图。它显示了结合化合物EMBL-R05-1、二价阳离子(两个锰)和与化合物相互作用或与其接近的关键活性位点残基(尤其是Tyr24和Arg84)。

2.7结合EGCG的结构

表没食子儿茶素3-没食子酸酯(EGCG)是表没食子儿茶素和没食子酸的酯,并且是绿茶中最丰富的儿茶素。近来已报道,EGCG抑制流感核酸内切酶{Kuzuhara,2009#629}。PA H1N11至198 Δ52-64:Gly与(-)-表没食子儿茶素没食子酸酯共结晶得到了分辨率衍射的新晶体形式(表1)。在活性位点清晰的观察到化合物。在2倍晶轴周围还存在强的额外密度,并且很可能表示被晶体堆积所捕获的其他EGCG分子。

图16显示了按照标准蛋白质数据库(PDB)格式的具有结合的表没食子儿茶素3-没食子酸酯(EGCG)的H1N1 PA核酸内切酶结构域(PAH1N1 1至198 Δ52-64:Gly)的结构坐标。包含来自不对称单元的链(具有关联的二价阳离子,即两个锰离子,以及水分子)。化合物EGCG具有残基描述子tte。图18A显示了使用阐明核酸内切酶活性位点(PA多肽片段)的图16之结构坐标的图。它显示了结合化合物EGCG、二价阳离子(两个锰离子)和与化合物相互作用或与其接近的关键活性位点残基。图18B显示了结合EGCG、二价阳离子(两个锰离子)以及与化合物相互作用或与其接近的关键活性位点残基。显示了相互作用小于(灰色虚线),另外可能的相互作用小于(深灰色虚线)。

2.8所有的二酮抑制剂化合物的重叠

图19显示了PA活性位点中结合的所有的二酮抑制剂化合物(EMBL-R05-1、EMBL-R05-2以及EMBL-R05-3A和D)和EGCG的重叠。如图19所示,三种二酮抑制剂与金属的结合模式是保守的(但是在准确的位置中一些变化),但是每个化合物的两个“臂”插入口袋1至4的不同组合中。EMBL-R05-1与EMBL-R05-3D具有相似的构象,其中两个臂占据口袋2和3。EMBL-R05-3A占据口袋2和4。EMBL-R05-2(哌啶基环上的取代点与R05-1和R05-3显著不同(表2))占据口袋3和独有的口袋1(图7B)。绿茶化合物EGCG占据口袋3和4。或许可以设计占据多于两个口袋的更强且更特异的化合物。

2.9二价阳离子结合

在天然结构(图1和图6)中,在活性位点中观察到两个二价阳离子。鉴定出(使用电子密度量级(magnitude of electron density)和反常散射(anomalous scattering),数据未给出)在位点1锰原子(图13中的Mn1),其连接His41、Asp 108、Glu119、Ile120和两个水分子(W4和W5),在位点2为镁离子(图13中的Mg2),其连接Glu80和Asp108及四个水分子(W1、W2、W3和W4)。在其它结构(图2~5和图7~10以及图15~18)中,如通过电子密度量级和反常散射所鉴定的,位点1和位点2中的离子均是锰离子(Mn1和Mn2)(例如rUMP,参见图14)。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号