首页> 中国专利> cGAS的调节剂

cGAS的调节剂

摘要

本发明涉及与cGAMP异构体的使用和/或利用以及酶cGAS的结构相关的组合物、方法、试剂盒和测定。特别涉及用于改变第二信使信号传导的组合物和方法。

著录项

说明书

本申请是申请号为201480024192.8,申请日为2014年4月29日的中国专利申请《用于改变第二信使信号传导的组合物和方法》的分案申请。

发明背景

作为细菌第二信使的环状二核苷酸的重要性是已经充分确立的,其中环状二 -GMP(c-二-GMP)现在被公认为通用的细菌第二信使。这种通用型分子已经显示在细胞周期和分化、运动和毒力中以及在调控生物膜形成和分散中起关键作用。对c-二-GMP了解的进展随着对负责合成和降解此第二信使的细菌酶的鉴别、结构表征和催化活性的机制理解而出现。呈游离状态和当结合负责其合成和降解的酶时c-二-GMP的晶体机构已经显示此第二信使可采用单体或二聚体双插入折叠。似乎从两个GTP分子形成c-(3’,5’)-二-GMP经由两步反应和3’,5’-磷酸二酯键的形成而发生,其中两个焦磷酸分子作为环化反应的副产物。此外,已经鉴别了由c-(3’,5’)-二-GMP靶向的多种受体和通过此第二信使的不同方式的细菌信号。确实,作为第二信使的c-二-GMP研究的领域极大地发展并且在过去二十五年在了解细菌环状二核苷酸信号传导的生理学和机制方面产生主要进展。在平行研究中,还已经鉴别了c-(3’,5’)-二-GMP特异性核糖开关,包括参与环状二核苷酸诱导的RNA剪接的一些。

当前存在针对获得识别细胞质中的核酸且触发I型干扰素诱导的高等后生动物的先天性免疫传感器的分子和功能理解的极大兴趣。病原细菌或病毒起源的细胞质dsDNA以及可能还有在细胞应激之后置换的核或线粒体DNA代表这种触发。涉及自我核酸识别的这些事件进而能够触发自身免疫性疾病如系统性红斑狼疮和斯耶格仑氏

发明概述

本发明尤其提供如下文更详细地描述的新型环状-GMP-AMP(cGAMP)类似物、模拟物、拟态物和变体。这些cGAMP化合物和组合物尤其适用于设计研究工具、适用作研究工具并且适用作治疗方式如酶调节剂,包括cGAS的激动剂和拮抗剂。本发明还提供环状-GMP-AMP合酶(cGAS)的晶体学数据。这些晶体学数据提供设计调节剂(激动剂和拮抗剂)如cGAMP化合物或小分子的基础,该调节剂适用于研究、治疗学和/或诊断学领域。

附图简述

图1A-H.呈游离状态和结合至dsDNA的cGAMP合酶(cGAS)的结构。(A) 呈游离状态的cGAS的

图2A-H.cGAS、dsDNA和ATP的三元复合物的结构。(A)结合至dsDNA和 ATP的cGAS的三元复合物的

图3A-H.cGAS、dsDNA与结合产物5’-pppG(2’,5’)pG和5’-pG(2’,5’)pA的三元复合物的结构。(A)结合至dsDNA和5’-pppG(2’,5’)pG的cGAS的三元复合物的

图4A-H.cGAS、DNA与结合的产物c[G(2’,5’)pA(3’,5’)p]的三元复合物的结构。(A)结合至dsDNA和产物c[G(2’,5’)pA(3’,5’)p]的cGAS的三元复合物的

图5A-D.通过cGAS形成c[G(2’,5’)pA(3’,5’)p]的表征。通过薄层色谱法(TLC) 使用纯化的重组截短cGAS(图A,氨基酸147-507,用于结晶研究)和全长cGAS (图B-D,氨基酸1-507)测定c[G(2’,5’)pA(3’,5’)p]和线性产物以及中间体的产生。长虚线和短虚线分别指示起点和溶剂前沿。(A)将45-nt dsDNA与cGAS(x-y)在含有所指示的二价阳离子(或EDTA)以及α

图6A-C.确定性鉴别c[G(2’,5’)pA(3’,5’)p]为cGAS的酶产物。(A)来自反相 HPLC分析的GTP、ATP、c[G(2’,5’)pA(2’,5’)p]、c[G(3’,5’)pA(3’,5’)p]、 c[G(2’,5’)pA(3’,5’)p]和cGAS反应(rxn,星号)溶液的UV 260nm色谱。单独或在添加所指示的参考标准品的情况下注射cGAS反应样品。阴影区域示出对应于 c[G(2’,5’)pA(3’,5’)p]的洗脱的保留时间。(B)从当单独注射(顶部迹线)或与 c[G(2’,5’)pA(2’,5’)p]参考化合物共同注射(中间迹线)时溶解的晶体获得的cGAS 产物的HPLC分析的UV 260nm色谱。另外的未鉴别的峰存在于溶解的晶体溶液中,但稍后洗脱。三种参考cGAMP化合物由于作为将溶解的晶体溶液施加至柱的结果的c[G(2’,5’)pA(3’,5’)p]的保留时间的变化(0.5秒)而共同注射。(C)三种化学合成的cGAMP参考化合物与cGAS rxn在于10mM K

图7A-D.cGAS突变体的功能分析和用于两步产生c[G(2’,5’)pA(3’,5’)p]的模型。(A)通过TLC分析来比较通过cGAS全长wt和所指示的突变体形成c[G(2’, 5’)pA(3’,5’)p]的水平。长虚线和短虚线分别指示起点和溶剂前沿。(B,C)将鼠c GAS WT的表达载体或携带DNA结合残基(图B)和催化残基(图C)的单个和多个丙氨酸突变的表达载体与IFN-βGluc报道基因以及组成型STING和萤火虫荧光素酶表达质粒一起瞬时转染至HEK 293细胞中。在此情形下,表达的cGAS 通过共转染的DNA质粒接合在细胞溶质中。在转染后36小时一式三份测定Gl uc值,将该值标准化至萤火虫荧光素酶并且示为相对于对照质粒的诱导倍数(示为平均值±s.e.m)。图B和C中的数据代表针对每种突变体的3–5次独立实验。 (D)与cGAS的单个催化口袋内c[G(2’,5’)pA(3’,5’)p]的两步产生相关的所提出的模型的示意性图示。在此模型中,第一步涉及形成5’-pppGpA中间体,接着形成c[G(2’,5’)pA(3’,5’)p]。还应注意结合的配体据信在c[G(2’,5’)pA(3’,5’)p]形成的途径上经历两次翻转。

图8A-8C.呈游离状态的cGAS的序列比对和晶体结构以及与人OAS1的比较。(8A)来自小鼠和人(用于结构研究的构建体)的跨越氨基酸147至507(C-末端) 的cGAS的序列比对。推定的催化残基以盒指示。(8B)呈游离状态的cGAS的结构的两个替代视图。蛋白质的主链以带状图示示出且以浅灰色标注。(8C)呈游离状态的cGAS(浅灰色)和人寡腺苷酸合成酶1(OAS1)(黑色;PDB:1PX5)的叠加结构的立体视图。结构之间的r.m.s.d是

图9A-F.结合至dsDNA的cGAS结构中的分子识别特征以及与结合至 dsRNA和2’-Datp的hOAS1的比较。(A,B)cGAS与dsDNA之间的分子间接触的实例。水分子示为黑色球体,其中氢键由虚线指示。观察到在Arg161的侧链与T8的O2羰基之间的一个序列特异性氢键,如在图B中所示。(C,D,E)在从呈游离状态的cGAS(浅灰色)前进至与结合的dsDNA的二元复合物(灰色)时构象位移的实例。在复合物形成时在β-折叠区段中观察到

图10A-I.在与GTP结晶之后形成的其三元复合物的催化口袋中具有 5’-pppG(2’,5’)pG的cGAS的结构。(A)cGAS与DNA的二元复合物(灰色)和与结合的5’-pppG(2’,5’)pG中间体产物的三元复合物(深灰色)的叠加结构。(B,C)在从二元复合物前进至与结合的5’-pppG(2’,5’)pG的三元复合物时在β-折叠(图B) 和催化口袋(图C)区段内的主链中观察到最小变化。(D)三元复合物的催化口袋中结合的5’-pppG(2’,5’)pG的两个替代视图。Mg

图11A-F.在与GTP+ATP结晶之后形成的三元复合物的催化口袋中结合的 cGAS和c[G(2’,5’)pA(3’,5’)p]的结构。(A)cGAS和DNA的二元复合物(灰色)和与添加的GTP+ATP的三元复合物的叠加结构,针对GTP+ATP,结合产物是从与ATP和GTP结晶获得的c[G(2’,5’)pA(3’,5’)p](深灰色)。(B,C)在从二元复合物前进至与结合的c[G(2’,5’)pA(3’,5’)p]的三元复合物时在β-折叠(图B)和催化口袋(图C)区段内的主链中未发生构象变化。(D)三元复合物的催化口袋中结合产物 cGAMP的两个替代视图。注意结合配体c[G(2’,5’)pA(3’,5’)p]揭示GpA步骤内的 2’,5’磷酸二酯键。基于HPLC比较,c[G(2’,5’)pA(3’,5’)p]的结构示出在ApG步骤具有3’,5’键联。G残基和A残基两者均在其糖苷键处采用反式比对。(E)在3.0σ下勾画的三元复合物的催化口袋中结合的c[G(2’,5’)pA(3’,5’)p]的Fo-Fc省略电子密度图的两个替代视图。(F)在其与cGAS和dsDNA的相应三元复合物中结合的c[G(2’,5’)pA(3’,5’)p](灰色)和ATP(深灰色)的叠加结构的两个替代视图。

图12A-C.用于监测Cgamp形成的薄层色谱法(TLC)条件。(A,B)将所指示的核苷酸点样在高效硅胶TLC板上,通过不同溶剂系统解析并且通过UV可视化。使用两种流动相条件(A和B)。溶剂系统1用于检测c[G(2’,5’)pA(3’,5’)p]的大多数实验中,而溶剂2用于更好地分离单和三磷酸化的线性中间体。虚线指示溶剂前沿。(C)计算的Rf值。

图13A-E.cGAS活性的dsDNA长度和核苷酸要求。(A)将全长cGAS与等摩尔或质量标准化量的16-、36-或45-nt dsDNA一起孵育,然后针对cGAMP形成进行测定。图A-C中的长虚线和短虚线分别指示起点和溶剂前沿。(B)将截短的 (tr)和全长(fl)cGAS与45bp dsDNA在含有各种所指示的核苷酸的反应缓冲液中一起孵育。cGAS(tr)展示活性,但小于cGAS(fl)。当2’-dATP或GTP被放射性标记时,使用2’-dATP形成c[G(2’,5’)pA(3’,5’)p],但当使用2’-dGTP时根本不形成。2’-dATP与2’-dGTP不产生c[G(2’,5’)pA(3’,5’)p],从而指示腺苷、且更重要地鸟苷中2’OH位置的封闭阻止c[G(2’,5’)pA(3’,5’)p]产生。星号(*)表示哪些核苷酸补充有α

图14A-14B.cGAMP异构体的合成。在GpA步骤和ApG步骤两者处含有 2’,5’键联的cGAMP的合成(6)(顶图14A)。在GpA步骤处含有2’,5’和在ApG步骤处含有3’,5’的cGAMP的合成(11)(中间图)。在GpA步骤和ApG步骤两者处含有3’,5’键联的cGAMP的合成(15)(底图14B)。

图15A-D.来自HMBC、COSY和HSQC二维NMR光谱的 c[G(2’,5’)pA(3’,5’)p]的共振分配。(A)示出芳族化合物与糖C1’-H1’之间的相关性的HMBC光谱。(B)示出糖环内的相关性的HMBC光谱。在(A)和(B)中,鸟嘌呤碱基内的相关性由实线连接并且分别针对质子和碳在上边缘和左边缘上指定分配,而腺嘌呤碱基内的相关性由虚线连接并且分别针对质子和碳在下边缘和右边缘上指定分配;较大的未抑制的1-键C-H偶联由连接偶联的信号对的蓝线指示。 (C)双量子过滤的COSY光谱。鸟嘌呤相关性由实线连接并且共振标记在对角线上面的交叉峰上;腺嘌呤相关性由虚线连接并且共振标记在对角线下面的交叉峰上。(D)总结糖质子和碳分配的脂族HSQC光谱。还参见图6C和表S4。

图16A-16D.通过cGAMP化合物STING-依赖性诱导鼠α-干扰素和人 CXCL10。通过酶联免疫吸附测定(ELISA),定量内源性鼠α-干扰素(m-Ifna)或人 CXCL10(h-CXCL10)蛋白质的诱导来测量所指示的cGAMP异构体的剂量依赖性生物活性。(16A-16B),将小鼠骨髓源性巨噬细胞(BMDM)在cGAMP添加之前首先用洋地黄皂苷(Dig)处理以渗透质膜(A)或通过添加在培养基中将cGAMP异构体被动递送至细胞(B)。(16C),还在人THP-1细胞中测量cGAMP活化。数据代表2次独立实验,各自一式三份进行(误差线,s.e.m.)。(16D),基于4-参数S 形剂量反应曲线估计半数最大有效浓度(EC

图17是计算装置和移动计算装置的示例性框图。

图18是用于建立多通道情境感知通信环境的网络环境的示例性框图。

某些实施方案的详细描述

已经显示VSP-1(弧菌第7次大流行基因岛-1(Vibrio 7

在这些研究中关于cGAS的关键性假设是cGAMP包含一对3’,5’键联(Sun 等2013;Wu等2013),与如上文所概述先前针对细菌系统中的c-二-GMP所报道的那些一致。本发明涵盖以下认识:由Sun和Wu先前指定的cGAMP结构是不正确的。因此,本发明的一方面是鉴别cGAMP结构的错误鉴别的先前未知问题。本公开将结构、化学、体外生物化学和体内细胞测定组合来明确地确立这种第二信使出人意料地含有在GpA步骤处的2’,5’键联和在ApG步骤处的3’,5’键联{指定为c[G(2’,5’)pA(3’,5’)p]},从而正确地且首次鉴别响应于细胞质DNA的调控I型干扰素诱导的后生动物第二信使的新家族的创始成员。

在某些实施方案中,本发明提供包含含有2’,5’键联(在GpA步骤处)的环状 GA-二核苷酸[c[G(2’,5’)pA(3’,5’)p]]的化合物。在一些实施方案中,此类化合物适用于研究后生动物中的细胞信号传导和免疫监视。在一些实施方案中,此类化合物在医学中适用于治疗、诊断或预防病症、疾病或病状。在一些实施方案中,此类化合物适用于调节参与免疫应答的靶标。在一些实施方案中,本发明的化合物和/或组合物适用作研究工具和/或试剂,特别是在用于生物或化学研究的试剂盒和测定中。

本发明还提供适用于设计cGAS的调节剂的晶体学数据。在某些实施方案中,本发明提供包含形成与cGAS的适当结合相互作用的特征的cGAS的调节剂。在一些实施方案中,此类调节剂包含形成与结合cGAMP的靶标的适当结合相互作用的特征。

定义

本发明的化合物包括上文总体上描述的那些,并且通过本文公开的类别、子类和种类进一步说明。如本文所用,除非另外指明,应应用以下定义。出于本发明的目的,化学元素根据元素周期表CAS版、Handbook of Chemistry and Physics, 第75版进行鉴别。另外,有机化学的一般原理描述于“Organic Chemistry”,Thomas Sorrell,University ScienceBooks,Sausalito:1999和“March's Advanced Organic Chemistry”,第5版,编辑Smith,M.B.和March,J.,John Wiley&Sons,New York: 2001中,其全部内容特此以引用的方式并入。

本文使用的缩写具有其在化学和生物学领域中的常规含义。根据在化学领域已知的化学价的标准规则对本文所示的化学结构和化学式进行构建。

除非另外指明,本文描绘的结构还意欲包括结构的所有异构(例如对映异构、非对映异构和几何异构(或构象))形式;例如各不对称中心的R和S构型、Z和E 双键异构体以及Z和E构象异构体。因此,本发明化合物的单一立体化学异构体以及对映异构体、非对映异构体和几何异构体(或构象)混合物在本发明的范围内。除非另作说明,否则本发明的化合物的所有互变异构形式在本发明的范围内。另外,除非另外说明,否则本文所描述的结构也意在包括仅在一种或多种同位素富集原子的存在下不同的化合物。例如,具有本发明结构的包括氢被氘或氚代替或碳被富含

所提供的化合物可包含一个或多个糖部分。除非另外说明,否则D-和L-构型及其混合物在本公开的范围内。除非另外说明,否则α-和β-连接的实施方案及其混合物由本公开预期。

如果例如需要本公开的化合物的特定对映异构体,那么它可通过不对称合成、手性色谱或通过用手性助剂衍生来制备,其中分离所得非对映异构混合物,并且裂解辅助基团以提供纯的所需对映异构体。或者,当分子含有碱性官能团(如氨基)或酸性官能团(如羧基)时,非对映异构盐是用适当光学活性酸或碱形成,接着拆分从而通过本领域中熟知的分步结晶或色谱方法形成非对映异构体,并且随后回收纯的对映异构体。

如本文所使用的术语“酰基”代表通过如本文所定义的羰基连接至母体分子基团的氢或如本文所定义的烷基(例如,卤代烷基)并且由甲酰基(即羧基醛基团)、乙酰基、丙酰基、丁酰基等举例说明。示例性未取代的酰基包括1至7、1至11 或1至21个碳。在一些实施方案中,烷基进一步用如本文所述的1、2、3或4 个取代基取代。

如本文所用的术语“脂族基”或“脂族基团”是指直链(即未分支)或支链、取代或未取代的完全饱和或含有一个或多个不饱和单元的烃链,或完全饱和或含有一个或多个不饱和单元、但不是芳族(在本文中也称为“碳环”、“环脂族基”或“环烷基”)、与分子的其余部分具有单一连接点的单环烃或双环烃。除非另外规定,否则脂族基团含有1-6个脂族碳原子。在一些实施方案中,脂族基团含有1-5个脂族碳原子。在一些实施方案中,脂族基团含有1-4个脂族碳原子。在一些实施方案中,脂族基团含有1-3个脂族碳原子,并且在其他实施方案中,脂族基团含有 1-2个脂族碳原子。在一些实施方案中,“环脂族基”(或“碳环”或“环烷基”)是指完全饱和或含有一个或多个不饱和单元、但不是芳族、与分子的其余部分具有单一连接点的单环C

术语“杂原子”是指氧、硫、氮、磷或硅中的一个或多个(包括氮、硫、磷或硅的任何氧化形式;任何碱性氮的季铵化形式;或杂环的可取代氮,例如N(如在3,4-二氢-2H-吡咯基中)、NH(如在吡咯烷基中)或NR

如本文所用的术语“不饱和”是指某一部分具有一个或多个不饱和单元。

如本文使用,术语“烷基”是指通过移除单一氢原子从含有一个与六个之间的碳原子的脂族部分衍生的饱和、直链或支链烃基团。除非另外规定,否则烷基含有1–12个碳原子。在某些实施方案中,烷基含有1–8个碳原子。在某些实施方案中,烷基含有1-6个碳原子。在一些实施方案中,烷基含有1–5个碳原子,在一些实施方案中,烷基含有1–4个碳原子,在一些实施方案中,烷基含有1–3 个碳原子,并且在一些实施方案中,烷基含有1–2个碳原子。烷基的实例包括但不限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、仲戊基、异戊基、叔丁基、正戊基、新戊基、正己基、仲己基、正庚基、正辛基、正癸基、正十一基、十二基等。

如本文使用,术语“烯基”表示通过移除单一氢原子从具有至少一个碳-碳双键的直链或支链脂族部分衍生的一价基团。除非另外规定,否则烯基含有2–12 个碳原子。在某些实施方案中,烯基含有2–8个碳原子。在某些实施方案中,烯基含有2-6个碳原子。在一些实施方案中,烯基含有2–5个碳原子,在一些实施方案中,烯基含有2–4个碳原子,在一些实施方案中,烯基含有2–3个碳原子,并且在一些实施方案中,烯基含有2个碳原子。烯基包括例如乙烯基、丙烯基、丁烯基、1–甲基–2–丁烯–1–基等。

如本文使用,术语“炔基”是指通过移除单一氢原子从具有至少一个碳-碳三键的直链或支链脂族部分衍生的一价基团。除非另外规定,否则炔基含有2–12 个碳原子。在某些实施方案中,炔基含有2-8个碳原子。在某些实施方案中,炔基含有2-6个碳原子。在一些实施方案中,炔基含有2–5个碳原子,在一些实施方案中,炔基含有2–4个碳原子,在一些实施方案中,炔基含有2–3个碳原子,并且在一些实施方案中,炔基含有2个碳原子。代表性炔基包括但不限于乙炔基、 2–丙炔基(炔丙基)、1–丙炔基等。

术语“亚烷基”是指二价烷基。“亚烷基链”是聚亚甲基,即-(CH

术语“亚烯基”是指二价烯基。取代的亚烯基链是其中一个或多个氢原子被取代基置换的含有至少一个双键的聚亚甲基。合适的取代基包括以下描述的取代基。

如本文所用的术语“卤代”表示选自溴、氯、碘或氟的卤素。

术语“卤素”是指F、Cl、Br或I。

如本文所使用的术语“卤代烷氧基”代表被卤素基团(即,F、Cl、Br或I)取代的如本文所定义的烷氧基。卤代烷氧基可用一个、两个、三个或(在具有两个或更多个碳的烷基情况下)四个卤素取代。卤代烷氧基包括全氟烷氧基(例如, -OCF

如本文所使用的术语“卤代烷基”表示被卤素基团(即,F、Cl、Br或I)取代的如本文所定义的烷基。卤代烷基可用一个、两个、三个或(在具有两个或更多个碳的烷基情况下)四个卤素取代。卤代烷基包括全氟烷基(例如,-CF

单独使用或如在“芳烷基”、“芳烷氧基”或“芳基氧基烷基”中,作为较大部分的一部分使用的术语“芳基”是指具有总计5至10个环成员的单环和双环系统,其中系统中的至少一个环是芳族,并且其中系统中的各环含有3至7个环成员。术语“芳基”可与术语“芳基环”互换使用。在一些实施方案中,8-10元双环芳基是任选取代的萘基环。在本发明的某些实施方案中,“芳基”是指可携带一个或多个取代基的芳族环系统,其包括但不限于苯基、联苯、萘基、蒽基等。在如本文所用的术语“芳基”的范围内也包括其中芳族环稠合于一个或多个非芳族环的基团,如茚满基、邻苯二甲酰亚胺基、萘酰亚胺基、菲啶基或四氢萘基等。

单独使用或作为例如“杂芳烷基”或“杂芳烷氧基”的较大部分的一部分使用的术语“杂芳基”和“杂芳-”是指具有5至10个环原子,优选5、6或9个环原子;具有6、10或14个在环状阵列中共有的π电子;并且除碳原子之外具有1至5 个杂原子的基团。杂芳基包括但不限于噻吩基、呋喃基、吡咯基、咪唑基、吡唑基、三唑基、四唑基、噁唑基、异噁唑基、噁二唑基、噻唑基、异噻唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、吲哚嗪基、嘌呤基、萘啶基以及喋啶基。如本文使用,术语“杂芳基”和“杂芳-”还包括其中杂芳族环稠合至一个或多个芳基、环脂族基或杂环基环的基团,其中连接基团或连接点是在杂芳族环上。非限制性实例包括吲哚基、异吲哚基、苯并噻吩基、苯并呋喃基、二苯并呋喃基、吲唑基、苯并咪唑基、苯并噻唑基、喹啉基、异喹啉基、噌啉基、酞嗪基、喹唑啉基、喹喔啉基、4H–喹嗪基、咔唑基、吖啶基、吩嗪基、吩噻嗪基、吩噁嗪基、四氢喹啉基、四氢异喹啉基和吡啶并[2,3–b]–1,4–噁嗪–3(4H)–酮。杂芳基可为单环或双环。术语“杂芳基”可与术语“杂芳基环”、“杂芳基基团”或“杂芳族”互换使用,该术语中的任一个都包括任选地被取代的环。术语“杂芳烷基”是指被杂芳基取代的烷基,其中烷基和杂芳基部分独立地被任选取代。

如本文所用,术语“杂环”、“杂环基”、“杂环基团”以及“杂环环”可互换使用且是指含有一个、两个、三个或四个杂原子的5元环、6元环或7元环(除非另外指明),该杂原子独立地选自由氮、氧和硫组成的组。5元环具有0至2个双键,并且6元环和7元环具有0至3个双键。示例性未取代的杂环基具有1至12(例如,1至11、1至10、1至9、2至12、2至11、2至10或2至9)个碳。术语“杂环基”还代表具有桥接的多环结构的杂环化合物,其中一个或多个碳和/或杂原子桥接单环的两个非相邻成员,例如奎宁环基。术语“杂环基”包括双环基团、三环基团和四环基团,其中任何以上杂环稠合至一个、两个或三个碳环,例如芳环、环己烷环、环己烯环、环戊烷环、环戊烯环或另一个单环杂环,如吲哚基、喹啉基、异喹啉基、四氢喹啉基、苯并呋喃基、苯并噻吩基等。稠合杂环的实例包括莨菪烷(tropane)和1,2,3,5,8,8a-六氢吲嗪。杂环包括吡咯基、吡咯啉基、吡咯烷基、吡唑基、吡唑啉基、吡唑烷基、咪唑基、咪唑啉基、咪唑烷基、吡啶基、哌啶基、高哌啶基、吡嗪基、哌嗪基、嘧啶基、哒嗪基、噁唑基、噁唑烷基、异噁唑基、异噁唑烷基、吗啉基、硫代吗啉基、噻唑基、噻唑烷基、异噻唑基、异噻唑烷基、吲哚基、吲唑基、喹啉基、异喹啉基、喹喔啉基、二氢喹喔啉基、喹唑啉基、噌啉基、酞嗪基、苯并咪唑基、苯并噻唑基、苯并噁唑基、苯并噻二唑基、呋喃基、噻吩基、噻唑烷基、异噻唑基、三唑基、四唑基、噁二唑基(例如,1,2,3-噁二唑基)、嘌呤基、噻二唑基(例如,1,2,3-噻二唑基)、四氢呋喃基、二氢呋喃基、四氢噻吩基、二氢噻吩基、二氢吲哚基、二氢喹啉基、四氢喹啉基、四氢异喹啉基、二氢异喹啉基、吡喃基、二氢吡喃基、二噻唑基、苯并呋喃基、异苯并呋喃基、苯并噻吩基等,包括其二氢形式和四氢形式,其中一个或多个双键被还原并且用氢替代。其他示例性杂环基包括:2,3,4,5-四氢-2-氧代-噁唑基;2,3-二氢-2-氧代 -1H-咪唑基;2,3,4,5-四氢-5-氧代-1H-吡唑基(例如,2,3,4,5-四氢-2-苯基-5-氧代 -1H-吡唑基);2,3,4,5-四氢-2,4-二氧代-1H-咪唑基(例如,2,3,4,5-四氢-2,4-二氧代 -5-甲基-5-苯基-1H-咪唑基);2,3-二氢-2-硫代-1,3,4-噁二唑基(例如,2,3-二氢-2- 硫代-5-苯基-1,3,4-噁二唑基);4,5-二氢-5-氧代-1H-三唑基(例如,4,5-二氢-3-甲基 -4-氨基5-氧代-1H-三唑基);1,2,3,4-四氢-2,4-二氧代吡啶基(例如,1,2,3,4-四氢 -2,4-二氧代-3,3-二乙基吡啶基);2,6-二氧代-哌啶基(例如,2,6-二氧代-3-乙基-3- 苯基哌啶基);1,6-二氢-6-氧代嘧啶基;1,6-二氢-4-氧代嘧啶基(例如,2-(甲硫基)-1,6-二氢-4-氧代-5-甲基嘧啶-1-基);1,2,3,4-四氢-2,4-二氧代嘧啶基(例如, 1,2,3,4-四氢-2,4-二氧代-3-乙基嘧啶基);1,6-二氢-6-氧代-哒嗪基(例如,1,6-二氢 -6-氧代-3-乙基哒嗪基);1,6-二氢-6-氧代-1,2,4-三嗪基(例如,1,6-二氢-5-异丙基-6- 氧代-1,2,4-三嗪基);2,3-二氢-2-氧代-1H-吲哚基(例如,3,3-二甲基-2,3-二氢-2-氧代-1H-吲哚基和2,3-二氢-2-氧代-3,3’-螺环丙烷-1H-吲哚-1-基);1,3-二氢-1-氧代 -2H-异吲哚基;1,3-二氢-1,3-二氧代-2H-异吲哚基;1H-苯并吡唑基(例如,1-(乙氧基羰基)-1H-苯并吡唑基);2,3-二氢-2-氧代-1H-苯并咪唑基(例如,3-乙基-2,3- 二氢-2-氧代-1H-苯并咪唑基);2,3-二氢-2-氧代-苯并噁唑基(例如,5-氯-2,3-二氢 -2-氧代-苯并噁唑基);2,3-二氢-2-氧代-苯并噁唑基;2-氧代-2H-苯并吡喃基;1,4- 苯并二氧杂环己烷基;1,3-苯并二氧杂环己烷基;2,3-二氢-3-氧代,4H-1,3-苯并噻嗪基;3,4-二氢-4-氧代-3H-喹唑啉基(例如,2-甲基-3,4-二氢-4-氧代-3H-喹唑啉基); 1,2,3,4-四氢-2,4-二氧代-3H-喹唑啉基(例如,1-乙基-1,2,3,4-四氢-2,4-二氧代-3H- 喹唑啉基);1,2,3,6-四氢-2,6-二氧代-7H-嘌呤基(例如,1,2,3,6-四氢-1,3-二甲基-2,6- 二氧代-7H-嘌呤基);1,2,3,6-四氢-2,6-二氧代-1H-嘌呤基(例如,1,2,3,6-四氢-3,7- 二甲基-2,6-二氧代-1H-嘌呤基);2-氧代苯并[c,d]吲哚基;1,1-二氧代-2H-萘并[1,8-c,d]异噻唑基;以及1,8-亚萘基二甲酰胺基。另外的杂环包括3,3a,4,5,6,6a- 六氢-吡咯并[3,4-b]吡咯-(2H)-基和2,5-二氮杂二环[2.2.1]庚-2-基、高哌嗪基(或二氮杂环庚烷基)、四氢吡喃基、二噻唑基、苯并呋喃基、苯并噻吩基、氧杂环庚烷基、硫杂环庚烷基、氮杂环辛烷基、氧杂环辛烷基(oxecanyl)以及硫杂环辛烷基。

如本文使用,术语“部分不饱和”是指包括至少一个双键或三键的环部分。术语“部分不饱和”意欲涵盖具有多个不饱和位点的环,但是不欲包括如本文定义的芳基或杂芳基部分。

如本文描述,本发明的化合物(当指定时)可含有“任选取代的”部分。一般来说,术语“取代”无论之前是否是术语“任选地”都是指指定部分的一个或多个氢被合适的取代基置换。除非另外指示,“任选取代的”基团可在基团的每个可取代位置处具有合适取代基,并且当任何给定结构中的多于一个位置可用选自指定组的多于一个取代基取代时,取代基可在每个位置处相同或不同。本发明预期的取代基的组合优选地是导致形成稳定或化学可行的化合物的那些取代基。如本文所用的术语“稳定”是指化合物在经受允许其产生、检测以及在某些实施方案中其回收、纯化和出于本文公开的一个或多个目的使用的条件时基本不改变。

在“任选取代的”基团的可取代碳原子上的合适的一价取代基独立地是卤素;–(CH

R

“任选取代的”基团的饱和碳原子上的合适的二价取代基包括以下:=O、=S、=NNR

R

“任选取代的”基团的可取代氮上的合适的取代基包括

另一方面,本公开提供“药学上可接受的”组合物,其包含与一种或多种药学上可接受的载体(添加剂)和/或稀释剂一起配制的治疗有效量的本文所述的一种或多种化合物。如详细描述,本公开的药物组合物可被特别配制来以固体或液体形式施用,该形式包括适合于以下的那些:经口施用,例如灌服剂(drenche)(水性或非水性溶液剂或混悬剂)、片剂(例如以经颊、舌下和全身性吸收为靶标的那些)、大丸剂、粉末剂、颗粒剂、用于向舌施用的糊剂;胃肠外施用,例如通过以例如无菌溶液剂或混悬剂、或持续释放制剂形式进行皮下、肌肉内、静脉内或硬膜外注射;局部施用,例如以霜剂、软膏剂或控释贴片或向皮肤、肺或口腔施用的喷雾剂形式;阴道内或直肠内,例如以子宫托、霜剂或泡沫形式;舌下;经眼;经皮;或经鼻、经肺以及向其他粘膜表面。

短语“药学上可接受的”在本文中用于指在可靠的医学判断范围内适用于与人类和动物的组织接触而无过度毒性、刺激、过敏反应或其他问题或并发症,与合理的益处/风险比相称的那些化合物、物质、组合物和/或剂型。

如本文所用,短语“药学上可接受的载体”是指将主题化合物自身体的一个器官或部分携带或运输至身体的另一器官或部分时涉及的药学上可接受的材料、组合物或媒介物,如液体或固体填充剂、稀释剂、赋形剂或溶剂囊封材料。各载体在可与制剂的其他成分相容、并且不损伤患者的意义上必须是“可接受的”。可充当药学上可接受的载体的材料的一些实例包括:糖,如乳糖、葡萄糖和蔗糖;淀粉,如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;粉末状黄芪胶;麦芽糖;明胶;滑石;赋形剂,如可可脂和栓剂蜡;油,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二醇,如丙二醇;多元醇,如甘油、山梨糖醇、甘露糖醇和聚乙二醇;酯,如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,如氢氧化镁和氢氧化铝;海藻酸;无热原水;等渗盐水;林格氏溶液(Ringer’s solution);乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酸酐;和其他用于药物制剂中的无毒可相容物质。

如本文所用,术语“药学上可接受的盐”是指在可靠的医学判断范围内适合用于与人类和低等动物的组织相接触而无过度毒性、刺激、过敏反应等、并且与合理的益处/风险比相称的那些盐。药学上可接受的盐在本领域中是熟知的。例如, S.M.Berge等在以引用的方式并入本文的J.Pharmaceutical Sciences,1977,66, 1–19中详细描述了药学上可接受的盐。本发明的化合物的药学上可接受的盐包括来源于合适的无机和有机酸和碱的那些。药学上可接受的无毒酸加成盐的实例是氨基与无机酸(如盐酸、氢溴酸、磷酸、硫酸以及高氯酸)或与有机酸(如乙酸、草酸、顺丁烯二酸、酒石酸、柠檬酸、琥珀酸或丙二酸)形成的盐,或通过使用本领域中所用的其他方法(如离子交换法)形成的盐。其他药学上可接受的盐包括己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙烷磺酸盐、甲酸盐、富马酸盐、葡庚糖酸盐、甘油磷酸盐、葡糖酸盐、半硫酸盐、庚酸盐、己酸盐、氢碘化物、2-羟基-乙烷磺酸盐、乳糖酸盐、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲烷磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸盐、磷酸盐、新戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、对-甲苯磺酸盐、十一烷酸盐、戊酸盐等。

衍生自适当碱的盐包括碱金属盐、碱土金属盐、铵盐以及N

在某些实施方案中,化合物的中性形式通过使盐与碱或酸接触并且以常规方式分离母体化合物而再生。在一些实施方案中,化合物的母体形式在某些物理特性如在极性溶剂中的溶解度上不同于各种盐形式。

本领域普通技术人员将了解如本文描述的合成方法利用各种保护基团。如本文使用,术语“保护基团”意指具体官能部分例如O、S或N被掩蔽或封闭,从而如果需要的话允许反应选择性地在多官能化合物中的另一个反应性位点进行。合适的保护基团是本领域中熟知的并且包括在Protecting Groups in Organic Synthesis,T.W.Greene和P.G.M.Wuts,第3版,John Wiley&Sons,1999中详细描述的那些保护基团,该文献的全部内容以引用的方式并入本文。在一些实施方案中,保护基团选择性地以良好产率反应以给出对于预计反应稳定的受保护底物;保护基团优选地通过不侵袭其他官能团的易于得到的优选无毒试剂来选择性地移除;保护基团形成可分离的衍生物(更优选地不产生新的立体中心);并且保护基团将优选地具有最小的额外官能度以避免其他反应位点。如在本文中详述,可利用氧、硫、氮和碳保护基团。作为非限制实例,羟基保护基团包括甲基、甲氧基甲基(MOM)、甲硫基甲基(MTM)、叔-丁硫基甲基、(苯基二甲基甲硅烷基) 甲氧基甲基(SMOM)、苄氧基甲基(BOM)、对-甲氧基苄氧基甲基(PMBM)、(4- 甲氧基苯氧基)甲基(p-AOM)、愈创木酚甲基(GUM)、叔-丁氧基甲基、4-戊烯基氧基甲基(POM)、甲硅烷氧基甲基、2-甲氧基乙氧基甲基(MEM)、2,2,2-三氯乙氧基甲基、双(2-氯乙氧基)甲基、2-(三甲基硅烷基)乙氧基甲基(SEMOR)、四氢吡喃基(THP)、3-溴四氢吡喃基、四氢噻喃基、1-甲氧基环己基、4-甲氧基四氢吡喃基(MTHP)、4-甲氧基四氢噻喃基、4-甲氧基四氢噻喃基S,S-二氧化物、1-[(2-氯 -4-甲基)苯基]-4-甲氧基哌啶-4-基(CTMP)、1,4-二噁烷-2-基、四氢呋喃基、四氢噻吩基、2,3,3a,4,5,6,7,7a-八氢-7,8,8-三甲基-4,7-甲桥苯并呋喃-2-基、1-乙氧基乙基、1-(2-氯乙氧基)乙基、1-甲基-1-甲氧基乙基、1-甲基-1-苄氧基乙基、1-甲基-1- 苄氧基-2-氟代乙基、2,2,2-三氯乙基、2-三甲基硅烷基乙基、2-(苯基氢硒基)乙基、叔-丁基、烯丙基、对-氯苯基、对-甲氧基苯基、2,4-二硝基苯、苄基、对-甲氧基苄基、3,4-二甲氧基苄基、邻-硝基苄基、对-硝基苄基、对-卤代苄基、2,6-二氯苄基、对-氰基苄基、对-苯基苄基、2-吡啶甲基、4-吡啶甲基、3-甲基-2-吡啶甲基N-氧桥、二苯基甲基、p,p’-二硝基二苯甲基、5-二苯并环庚基、三苯基甲基、α-萘基二苯基甲基、对-甲氧苯基二苯基甲基、二(对-甲氧基苯基)苯基甲基、三(对 -甲氧基苯基)甲基、4-(4’-溴苯酰基氧基苯基)二苯基甲基、4,4’,4”-三(4,5-二氯苯二甲酰亚氨基苯基)甲基、4,4’,4”-三(乙酰丙酸基氧基苯基)甲基、4,4’,4”-三(苯甲酰氧基苯基)甲基、3-(咪唑-1-基)双(4’,4”-二甲氧基苯基)甲基、1,1-双(4-甲氧基苯基)-1’-芘基甲基、9-蒽基、9-(9-苯基)呫吨基、9-(9-苯基-10-氧代)蒽基、1,3-苯并二硫戊环-2-基、苯并异噻唑基S,S-二氧桥、三甲基硅烷基(TMS)、三乙基硅烷基 (TES)、三异丙基硅烷基(TIPS)、二甲基异丙基硅烷基(IPDMS)、二乙基异丙基硅烷基(DEIPS)、二甲基己基硅烷基、叔-丁基二甲基硅烷基(TBDMS)、叔-丁基二苯基硅烷基(TBDPS)、三苄基硅烷基、三-对-二甲苯基硅烷基、三苯基硅烷基、二苯基甲基硅烷基(DPMS)、叔-丁基甲氧基苯基硅烷基(TBMPS)、甲酸酯、苯甲酰甲酸酯、乙酸酯、氯乙酸酯、二氯乙酸酯、三氯乙酸酯、三氟乙酸酯、甲氧基乙酸酯、三苯基甲氧基乙酸酯、苯氧基乙酸酯、对-氯苯氧基乙酸酯、3-苯基丙酸酯、4-氧代戊酸酯(乙酰丙酸酯)、4,4-(亚乙二硫代)戊酸酯(乙酰丙基二硫缩醛)、新戊酸酯、金刚烷酸酯、巴豆酸酯、4-甲氧基巴豆酸酯、苯甲酸酯、对-苯基苯甲酸酯、2,4,6-三甲基苯甲酸酯(三甲基苯甲酸酯)、烷基甲基碳酸酯、9-芴甲基碳酸酯(Fmoc)、烷基乙基碳酸酯、2,2,2-三氯乙基碳酸烷基酯(Troc)、2-(三甲基硅烷基)碳酸乙酯(TMSEC)、2-(苯基磺酰基)碳酸乙酯(Psec)、2-(三苯基磷鎓基)碳酸乙酯(Peoc)、烷基异丁基碳酸酯、烷基乙烯基碳酸酯烷基烯丙基碳酸酯、对-硝基苯基碳酸烷基酯、烷基苄基碳酸酯、烷基对-甲氧基苄基碳酸酯、烷基3,4-二甲氧基苄基碳酸酯、烷基邻-硝基苄基碳酸酯、烷基对-硝基苄基碳酸酯、烷基S-苄基硫代碳酸酯、4-乙氧基-1-萘基碳酸酯、甲基二硫代碳酸酯、2-碘苯甲酸酯、4-叠氮丁酸酯、4-硝基-4-甲基戊酸酯、邻-(二溴甲基)苯甲酸酯、2-甲酰苯磺酸酯、2-(甲硫基甲氧基)乙基、4-(甲硫基甲氧基)丁酸酯、2-(甲硫基甲氧基甲基)苯甲酸酯、 2,6-二氯-4-甲基苯氧基乙酸酯、2,6-二氯-4-(1,1,3,3-四甲基丁基)苯氧基乙酸酯、 2,4-双(1,1-二甲基丙基)苯氧基乙酸酯、氯二苯基乙酸酯、异丁酸酯、单琥珀酸酯、 (E)-2-甲基-2-丁烯酸酯、邻-(甲氧基羰基)苯甲酸酯、α-萘甲酸酯、硝酸酯、烷基 N,N,N’,N’-四甲基偶磷二酰胺、烷基N-氨基甲酸苯酯、硼酸酯、二甲基硫膦基、烷基2,4-二硝基苯基次磺酸酯、硫酸酯、甲烷磺酸酯(甲磺酸酯)、苄基磺酸酯和甲苯磺酸酯(Ts)。为了保护1,2-或1,3-二醇,保护基团包括亚甲基缩醛、亚乙基缩醛、1-叔-丁基亚乙基缩酮、1-苯基亚乙基缩酮、(4-甲氧基苯基)亚乙基缩醛、2,2,2-三氯亚乙基缩醛、丙酮化合物、亚环戊基缩酮、亚环己基缩酮、亚环庚基缩酮、亚苄基缩醛、对-甲氧基亚苄基缩醛、3,4-二甲氧基亚苄基缩酮、2-硝基亚苄基缩醛、甲氧基亚甲基缩醛、乙氧基亚甲基缩醛、α-甲氧基亚苄基原酸酯、α-(N,N’-二甲氨基)亚苄基衍生物、2-氧杂亚环戊基原酸酯、二-叔-丁基亚甲硅基基团(DTBS)、1,3-(1,1,3,3-四异丙基二亚硅氧烷基)衍生物(TIPDS)、环状碳酸酯、环状硼酸酯、硼酸乙酯和硼酸苯酯。示例性的保护基团在本文详细说明,然而,应了解的是本发明不是意图来限制这些保护基团;更确切的说,多种其他等效的保护基团可以使用上文的标准被容易地鉴别,并且可以利用在本发明的方法中。此外,多种保护基团被Greene和Wuts(上文)描述。

除了当用作键来描绘未知或混合立体化学时,符号“”表示化学部分与分子或化学式的其余部分的连接点。

如本文所用,术语“分离的”是指物质或实体已(1)与它在最初产生时(无论在自然界中和/或在实验环境中)与之相关联的至少一些组分分离,和/或(2)通过人手设计、产生、制备和/或制造。分离的物质和/或实体可从约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或多于约99%的它们最初与其关联的其他组分分离。在一些实施方案中,分离的药剂是约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或大于约99%纯。如本文所使用,如果物质基本上不含其他组分,则它为“纯的”。在一些实施方案中,如本领域的技术人员将理解,在已经与某些其他组分诸如例如一种或多种载体或赋形剂(例如,缓冲剂、溶剂、水等)组合之后,物质仍可被认为是“分离的”或甚至“纯的”;在此类实施方案中,在不包括此类载体或赋形剂的情况下计算物质的分离或纯度百分比。在一些实施方案中,分离涉及或需要共价键的断裂(例如,以使多肽结构域与更长的多肽分离和/或使核苷酸序列元件与更长的寡核苷酸或核酸分离)。

术语“调节剂”用于指实体,其在其中观察到目标活性的系统中的存在与如与当调节剂不存在时在另外可比较的条件下所观察到的活性相比该活性的水平和/ 或性质的变化相关。在一些实施方案中,调节剂是活化剂或激动剂,因为活性如与当调节剂不存在时在另外可比较的条件下所观察到的活性相比在其存在下增加。在一些实施方案中,调节剂是抑制剂或拮抗剂,因为活性如与当调节剂不存在时在另外可比较的条件下所观察到的活性相比在其存在下减少。在一些实施方案中,调节剂与以其活性为目标的靶标实体直接相互作用。在一些实施方案中,调节剂与以其活性为目标的靶标实体间接相互作用(即,与同靶标实体相互作用的中间体剂直接相互作用)。在一些实施方案中,调节剂影响目标靶标实体的水平;或者或另外,在一些实施方案中,调节剂影响目标靶标实体的活性而不影响靶标实体的水平。在一些实施方案中,调节剂影响目标靶标实体的水平和活性,以使得所观察到的活性差异不完全由所观察到的水平差异解释或与所观察到的水平差异相称。如本文所用,“活性”是由分子、化合物、细胞、组织或器官进行的任何过程。此类过程可以是催化性或非催化性的。例如,本发明的cGAS分子可充当酶且如此可具有酶活性。

术语“核酸”在其广义上包括包含核苷酸聚合物的任何化合物和/或物质。这些聚合物经常被称为多核苷酸。本发明的示例性核酸或多核苷酸包括但不限于,核糖核酸(RNA)、脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA,包括具有β-D-核糖构型的LNA、具有α-L-核糖构型的α-LNA(LNA的非对映体)、具有2′-氨基官能化的2′-氨基-LNA以及具有2′- 氨基官能化的2′-氨基-α-LNA)或其杂合物。

本公开提供修饰的核苷和核苷酸。如本文所描述,“核苷”被定义为含有糖分子(例如,戊糖或核糖)或其衍生物与有机碱基(例如,嘌呤或嘧啶)或其衍生物(本文还被称为“核碱基”)的组合的化合物。如本文所描述,“核苷酸”被定义为包含磷酸酯基的核苷。修饰的核苷酸可通过如本文所描述的任何有用的方法(例如,化学方法、酶方法或重组方法以便包括一个或多个修饰的或非天然的核苷)来合成。

修饰的核苷酸碱基配对不仅涵盖标准腺苷-胸腺嘧啶、腺苷-尿嘧啶或鸟苷- 胞嘧啶碱基对,而且涵盖在核苷酸和/或包含非标准或修饰碱基的修饰核苷酸之间形成的碱基对,其中氢键供体和氢键受体的排列允许非标准碱基与标准碱基之间或两个互补的非标准碱基结构之间的氢键合。此类非标准碱基配对的一个实例是修饰的核苷酸肌苷与腺嘌呤、胞嘧啶或尿嘧啶之间的碱基配对。

修饰的核苷和核苷酸可包括修饰的核碱基。RNA中发现的核碱基的实例包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶和尿嘧啶。DNA中发现的核碱基的实例包括但不限于腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。

如将从上下文中清楚,在一些实施方案中,“核酸”是指个别核酸残基(例如,核苷酸和/或核苷);在一些实施方案中,“核酸”是指包括个别核酸残基的寡核苷酸链。在一些实施方案中,“核酸”是RNA或包含RNA;在一些实施方案中,“核酸”是DNA或包含DNA。在一些实施方案中,核酸是一个或多个天然核酸残基、包含一个或多个天然核酸残基或由其组成。在一些实施方案中,核酸是一种或多种核酸类似物、包含一种或多种核酸类似物或由其组成。在一些实施方案中,核酸类似物不同于核酸,因为它不使用磷酸二酯主链。举例来说,在一些实施方案中,核酸是一种或多种“肽核酸”、包含一种或多种“肽核酸”或由其组成,本领域中已知的并且在主链中具有肽键代替磷酸二酯键的所谓“肽核酸”被认为在本发明的范围内。或者或另外,在一些实施方案中,核酸具有一个或多个硫代磷酸酯和/或5’-N-亚磷酰胺键联而不是磷酸二酯键。在一些实施方案中,核酸是一种或多种天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)、包含一种或多种天然核苷或由其组成。在一些实施方案中,核酸是一种或多种核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、 C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、 O(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入碱基以及其组合)、包含一种或多种核苷类似物或由其组成。在一些实施方案中,如与天然核酸中的那些糖相比,核酸包含一种或多种修饰的糖(例如,2’-氟代核糖、核糖、2’-脱氧核糖、阿拉伯糖以及己糖)。在一些实施方案中,核酸具有编码功能性基因产物如RNA或蛋白质的核苷酸序列。在一些实施方案中,核酸包括一个或多个内含子。在一些实施方案中,通过从天然来源分离、基于互补模板通过聚合酶合成(体内或体外)、在重组细胞或系统中繁殖以及化学合成中的一种或多种来制备核酸。在一些实施方案中,核酸是至少2(二核苷酸或二核苷)、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、 110、120、130、140、150、160、170、180、190、20、225、250、275、300、 325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、 2000、2500、3000、3500、4000、4500、5000或更多个残基长。

如本文所用,术语“多肽”通常具有通过肽键彼此连接的至少三个氨基酸的聚合物的其领域公认的意义。在一些实施方案中,该术语用于指特定功能类别的多肽,诸如例如受体、酶、信号传导蛋白质、结构蛋白质、自身抗原多肽、烟碱型乙酰胆碱受体多肽、同种抗原多肽等。对于每种此类别,本说明书提供该类别内的已知示例性多肽的氨基酸序列的几个实例;在一些实施方案中,此类已知多肽是该类别的参考多肽。在一些情况下,编码的多肽小于约50个氨基酸并且该多肽然后被称为肽。如果多肽是肽,那么它将是至少约2、3、4、或至少5个氨基酸残基长。因此,多肽包括基因产物、天然存在的多肽、合成多肽、同源物、直系同源物、旁系同源物、前述的片段和其他等效物、变体和类似物。多肽可以是单个分子或可以是多分子复合物如二聚体、三聚体或四聚体。它们还可包含单链或多链多肽如抗体或胰岛素并且可以是缔合的或连接的。最常见地,在多链多肽中发现二硫键。术语多肽还可应用于氨基酸聚合物,其中一个或多个氨基酸残基是对应的天然存在的氨基酸的人工化学类似物。在此类实施方案中,术语“多肽”是指显示与相关参考多肽的显著序列同源性或同一性的类别的任何成员。在许多实施方案中,此类成员还与参考多肽共享显著活性。例如,在一些实施方案中,成员多肽显示与参考多肽至少约30%-40%、并且经常大于约50%、60%、70%、 80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的总体序列同源性或同一性程度和/或包括显示极高序列同一性、经常大于90%或甚至95%、96%、97%、98%或99%的至少一个区(即,保守区,经常包括特征性序列元件)。此类保守区通常涵盖至少3-4并且经常多达20或更多个氨基酸;在一些实施方案中,保守区涵盖至少2、3、4、5、6、7、8、9、10、11、12、13、 14、15或更多个连续氨基酸的至少一个段。在一些实施方案中,如本文所述的有用的多肽可包含母体多肽的片段或由其组成。在一些实施方案中,如本文所述的有用的多肽可包含多个片段或由其组成,该片段各自发现于同一母体多肽中相对于彼此呈与在目标多肽中发现的不同的空间排列(例如,直接连接在母体中的片段可在目标多肽中空间上分离,反之亦然;和/或片段可以与母体中不同的顺序存在于目标多肽中),以使得目标多肽是其母体多肽的衍生物。

术语“多肽变体”是指在其氨基酸序列方面与天然或参考序列不同的分子。与天然或参考序列相比,氨基酸序列变体可具有在氨基酸序列内的某些位置处的取代、缺失和/或插入。通常,变体将与天然或参考序列具有至少约50%同一性(同源性),并且优选地它们将与天然或参考序列至少约80%、更优选至少约90%同一(同源)。

在一些实施方案中,提供“变体模拟物”。如本文所用,术语“变体模拟物”是含有将模拟所激活的序列的一个或多个氨基酸的一种变体模拟物。例如,谷氨酸可用作磷-苏氨酸和/或磷-丝氨酸的模拟物。或者,变体模拟物可引起去激活或含有模拟物的灭活产物,例如,苯丙氨酸可充当酪氨酸的灭活取代;或丙氨酸可充当丝氨酸的灭活取代。

“同源性”在其应用于氨基酸序列时被定义为在比对序列并在必要时引入空位以实现最大百分比同源性之后,候选氨基酸序列中与第二序列的氨基酸序列中的残基同一的残基百分比。用于比对的方法和计算机程序是本领域熟知的。应理解同源性取决于百分比同一性的计算,但由于计算中的引入空位和罚分可能得到不同的值。

“同源物”在其应用于多肽序列时意指与第二物种的第二序列具有基本同一性的其他物种的对应序列。

“类似物”在多肽的背景下意欲包括因一个或多个氨基酸改变(例如,氨基酸残基的取代、添加或缺失)而不同但仍维持亲本或起始多肽的一种或多种特性的多肽变体。

如本文所用,术语“蛋白质”是指多肽(即一串至少两个通过肽键彼此连接的氨基酸)。蛋白质可包括除了氨基酸以外的部分(例如,可为糖蛋白、蛋白聚糖等) 和/或可另外加工或修饰。本领域普通技术人员将了解“蛋白质”可为如由细胞产生的完整多肽链(具有或不具有信号序列),或可为其特征部分。本领域普通技术人员将了解蛋白质有时可包括一条以上多肽链,例如由一个或多个二硫键连接或通过其他方式缔合。多肽可含有L-氨基酸、D-氨基酸或两者并且可含有在本领域中已知的各种氨基酸修饰或类似物中的任何一种。有用修饰包括例如末端乙酰化、酰胺化、甲基化等。在一些实施方案中,蛋白质可包括天然氨基酸、非天然氨基酸、合成氨基酸及其组合。术语“肽”一般用于指具有小于约100个氨基酸、小于约50个氨基酸、小于20个氨基酸或小于10个氨基酸的长度的多肽。在一些实施方案中,蛋白质是抗体、抗体片段、其生物活性部分和/或其特征部分。

如本文使用的短语“胃肠外施用”和“胃肠外地施用”是指除肠内和局部施用以外的施用模式,通常通过注射,并且包括而不限于静脉内、肌肉内、动脉内、鞘内、囊内、眶内、心脏内、真皮内、腹膜内、经气管、皮下、表皮下、关节内、包膜下、蛛网膜下、脊柱内、以及胸骨内注射和输注。

如本文所用的短语“全身性施用(systemic administration)”、“全身性施用(administered systemically)”、“外周施用(peripheral administration)”和“外周施用(administered peripherally)”是指不同于直接进入中枢神经系统来施用化合物、药物或其他材料,以使得它进入患者的系统,并且因此经受新陈代谢和其他类似过程,例如皮下施用。

术语“缓解性”是指集中于缓解疾病的症状和/或治疗方案的副作用但不是治愈性的治疗。

术语“治疗剂”或“治疗方式”是指当向受试者施用时具有治疗、诊断和/或预防作用和/或引出所需的生物和/或药理学作用的任何药剂。

如本文所用,术语“治疗有效量”是指物质(例如治疗剂、组合物和/或制剂) 在作为治疗方案的一部分施用时引发所需生物反应的量。在一些实施方案中,物质的治疗有效量是当向患有或易患疾病、病症和/或病状的受试者施用时足以治疗该疾病、病症和/或病状的量。如本领域普通技术人员将了解,物质的有效量可取决于如所需生物终点、待递送的物质、靶细胞或组织等的此类因素而变化。例如,制剂中的化合物用以治疗疾病、病症和/或病状的有效量是减轻、改善、缓和、抑制、预防该疾病、病症和/或病状、延迟其发作、减轻其严重性和/或降低其一种或多种症状或特征的发生的量。在一些实施方案中,治疗有效量是以单次剂量施用;在一些实施方案中,递送治疗有效量需要多个单位剂量。

如本文所用,术语“治疗(treat、treatment或treating)”是指用于部分或完全减轻、改善、缓和、抑制、预防疾病、病症和/或病状、延迟其发作、减轻其严重性、和/或降低其一种或多种症状或特征的发生的任何方法。治疗可向未展现疾病、病症和/或病状的征象的受试者施用。在一些实施方案中,治疗可向仅展现疾病、病症和/或病状的早期征象的受试者施用以达成降低发展与该疾病、病症和/或病状相关的病理学的风险的目的。

如本文所用的表达“单位剂量”是指适于待治疗的受试者的制剂的物理上离散的单位。然而,将理解的是,本发明的制剂的总每日用量将由主治医师在可靠的医学判断范围内决定。用于任何特定受试者或生物体的具体有效剂量水平可取决于多种因素,包括所治疗的病症和病症的严重性;所用的具体活性化合物的活性;所用的具体组合物;受试者的年龄、体重、总体健康状况、性别和饮食;所用的具体活性化合物的施用时间和排泄速率;治疗的持续时间;与所用的一种或多种具体化合物组合或同时使用的药物和/或另外疗法;以及医学领域中熟知的类似因素。具体单位剂量可以或可以不含有治疗剂的治疗有效量。

如本文所使用,术语“患者”或“受试者”是指向其施用疗法的人或任何非人动物(例如,小鼠、大鼠、兔、犬、猫、牛、猪、绵羊、马或灵长类动物)。在许多实施方案中,患者是人类。人包括出生前和出生后形式。在一些实施方案中,患者是呈递至医疗提供方以用于诊断或治疗疾病、病症或病状的人。在一些实施方案中,患者展示疾病、病症或病状的一种或多种症状或特征。在一些实施方案中,患者未展示疾病、病症或病状的任何症状或特征。在一些实施方案中,患者是具有易患疾病、病症或病状或处于其风险的一种或多种特征性特征的患者。

如本文所使用,术语“样品”或“生物样品”是指其组织、细胞或组成部分的子集(例如体液,包括但不限于血液、粘液、淋巴液、滑液、脑脊髓液、唾液、羊水、羊膜脐带血、尿、阴道液和精液)。样品还可包括从整个生物体或其组织、细胞或组成部分的子集或其馏分或部分制备的匀浆、裂解物或萃取物,包括但不限于例如血浆、血清、脊髓液、淋巴液,皮肤、呼吸道、肠道和泌尿生殖道的外切片,眼泪、唾液、乳、血细胞、肿瘤、器官。样品还指可含有细胞组分如蛋白质或核酸分子的培养基如营养肉汤或凝胶。

如本文所用,“稳定的”是指足够稳固以经受从反应混合物中分离成有用的纯度并且优选能够配制成有效治疗剂的化合物或分子。或者,如果化合物或分子足够稳固以耐受任何处理、损害或使用而不在选定时间点、事件或定位之前经历显著降解,则它可被说成是稳定的。

如本文所用,术语“使……稳定”、“稳定化的”、“稳定区”意指使之稳定或变得稳定。

“患有”疾病、病症和/或病状的个体已被诊断具有和/或展示出疾病、病症和/ 或病状的一种或多种症状。

“易患”疾病、病症和/或病状的个体尚未被诊断具有该疾病、病症和/或病状。在一些实施方案中,易患疾病、病症和/或病状的个体可展示该疾病、病症和/或病状的症状。在一些实施方案中,易患疾病、病症和/或病状的个体可不展示该疾病、病症和/或病状的症状。在一些实施方案中,易患疾病、病症和/或病状的个体将发展该疾病、病症和/或病状。在一些实施方案中,易患疾病、病症和/或病状的个体将不发展该疾病、病症和/或病状。

如本文所用,术语“计算机可读介质”是指非易失性(即,二级存储器)计算机数据存储和/或即使在无电源时仍然保留数字数据的存储器。计算机可读介质的实例包括但不限于硬盘、软盘、闪存(即固态存储器)、铁电RAM(F-RAM)、磁阻RAM(MRAM)、光盘、独立RAM磁盘、ZIP驱动、磁带以及全息照相存储器。

如本文所用,术语“计算机系统”或“计算机”是指可用于实施在此公开中描述的技术的计算装置。示例性计算装置2500和移动计算装置在图18中示出。

如本文所用,术语组合物的“晶体结构”应意指计算机可读介质,其中存储该组合物的原子的三维定位信息(即坐标)的表示。

如本文所用,术语“对接”是指基于距离几何或能量在结合口袋、结构域、分子或分子复合物或其部分中定向、旋转、平移化学实体。对接可通过发现匹配该结合口袋、结构域、分子或分子复合物或其部分的多组球心的化学实体的多组原子的距离几何方法来进行。参见Meng等J.Comp.Chem.4:505-524(1992)。球心通过提供与该结合口袋、结构域、分子或分子复合物或其部分中的原子(排除氢原子)的给定长度的额外半径来产生。可在定向化学实体时进行实时相互作用能量计算、能量最低化或刚体最小化(Gschwend等,J.Mol.Recognition 9:175-186 (1996))以促进对接。例如,相互作用对接实验可被设计成遵循最小阻力的路径。如果相互作用对接实验中的使用者进行移动以增加能量,则系统将抵抗该移动。然而,如果该使用者进行移动以减少能量,则系统将通过增加的响应性而有利于该移动。(Cohen等,J.Med.Chem.33:889-894(1990))。对接还可通过组合蒙特卡洛搜索技术与使用分子亲和势的快速能量评价来进行。参见Goodsell和Olson, Proteins:Structure,Function and Genetics 8:195-202(1990)。进行对接功能的软件程序包括但不限于MATCHMOL(Cory等,J.Mol.Graphics 2:39(1984);MOLFIT (Redington,Comput.Chem.16:217(1992))和DOCK(Meng等,同上)。

如本文所用,术语“设计的”是指以下药剂:(i)其结构经或已经人手动选择; (ii)通过需要人手的方法产生;和/或(iii)不同于天然物质和其他已知药剂。

如本文所用,术语“存储环境”包括含有二级存储即长期持久性存储的任何环境。在一些实施方案中,存储环境包括计算机可读介质。在一些实施方案中,存储环境包括用于建立多通道情境感知通信环境(即云计算)的网络环境。例如,图 18是用于建立多通道情境感知通信环境的网络环境的框图。

如本文所用,术语“基本上”是指展示总体或接近总体范围或程度的目标特征或性质的定性情况。生物领域普通技术人员将了解如果曾发生,那么生物和化学现象很少达到完全和/或进行至完整或达成或避免绝对结果。因此,本文使用术语“基本上”来获得在许多生物现象和化学现象中固有的潜在完整性缺乏。

本发明的化合物和组合物

已经出人意料地发现,与本领域中的公开内容相反,响应于细胞质DNA调控I型干扰素诱导的后生动物环状二核苷酸第二信使家族的创始成员包括迄今未知的独特特征。这些见解现在提供设计所鉴别的分子的类似物、模拟物和/或拟态物且基于在研究和发展中的母体分子的结构进一步使用所设计的一种或多种母体分子的机会。

被称为cGAMP或环状GAMP的第二信使家族包括被定义为具有至少一个鸟嘌呤(G)和一个腺嘌呤(A)核苷酸且以环状形式连接的环状结构中的一个或多个。两个核苷酸之间的键联涉及糖与主链键形成。根据本发明,存在cGAMP家族的四种主要亲本成员。这些包括[c[G(2’,5’)pA(3’,5’)p]]、[c[G(2’,5’)pA(2’,5’)p]]、 [c[G(3’,5’)pA(2’,5’)p]]、[c[G(3’,5’)pA(3’,5’)p]]。此外,该对的核苷酸各自可采用顺式或反式糖苷扭转取向。

如本文所用,术语“cGAMP”是指该家族的任何母体分子以及可能的扭转取向中的任何一种。该家族的单个成员可通过其糖-主链键联形式被提及,例如,新发现的第二信使[c[G(2’,5’)pA(3’,5’)p]]可被称为“2-端-3’端(2-prime-3’prime)”异构体,引用形成糖-主链键的糖环上的位置。其他异构体可类似地命名。总之,为cGAMP家族的野生型、类似物、模拟物、拟态物或修饰型式的本发明的化合物被称为“cGMP化合物”的组。

在本文提供的教导的情况下,本领域的技术人员现在可设计用作cGAS酶的调节剂(激动剂或拮抗剂)的母体分子中的任何一种的类似物、模拟物或修饰,并且最终用作与干扰素信号传导相关的下游生理事件的调节剂。线性型式还可被设计为cGAS或与cGAS酶活性或干扰素信号传导相关的下游信号传导事件的激动剂、拮抗剂或竞争性抑制剂。

本发明考虑为基于核酸的几种类型的化合物或组合物,包括变体和衍生物。这些包括取代、插入、缺失和共价变体和衍生物。术语“衍生物”与术语“变体”同义地使用,但通常是指已经相对于参考分子或起始分子以任何方式修饰和/或改变的分子。

如本文所用,“类似物”意指包括因一个或多个改变(例如,取代、添加或缺失)而不同但仍维持亲本或起始分子的一种或多种特性的cGAMP变体。通常使用结构-活性关系(SAR)如本文所述的那些来设计类似物。

现在手头现有呈天然和不同结合状态的几种蛋白质晶体结构,有可能通过设计cGAS酶的变体、衍生物或突变体来利用这些蛋白质结构。如此,cGAS酶多肽(包括其变体、衍生物和突变体)被认为是本发明的化合物。这些变体、衍生物和突变体适用作研究工具,例如用于试剂盒或测定中或用作治疗方式的来源。为此,cGAS多肽或变体、衍生物和突变体的片段或部分可用作用于产生抗体的抗原,或其中该片段维持与活性相关的结构元件(无论结合、催化还是转运)还可用作酶本身的调节剂或用作dsDNA结合的替代。总之,为cGAS的野生型、变体、衍生物或突变体的本发明的化合物被称为“cGAS分子”的组。cGAS分子可包含cGAS分子的任何部分或片段或可包含由如由本文公开的晶体结构定义的不同结构引起的来自cGAS分子的混合结构域或片段。

本发明考虑为基于多肽的几种类型的组合物,包括变体和衍生物。这些包括取代、插入、缺失和共价变体和衍生物。术语“衍生物”与术语“变体”同义地使用,但通常是指已经相对于参考分子或起始分子以任何方式修饰和/或改变的分子。

如此,编码相对于参考序列(具体地说本文所公开的多肽序列)含有取代、插入和/或添加、缺失和共价修饰的多肽的cGAS包括在本发明的范围内。例如,序列标签或氨基酸(如一个或多个赖氨酸)可添加至本发明的肽序列(例如,在N 末端或C末端处)。序列标签可用于肽纯化或定位。赖氨酸可用于增加肽溶解度或允许生物素化。或者,位于肽或蛋白质的氨基酸序列的羧基和氨基末端区域处的氨基酸残基可任选地缺失,从而提供截短序列。某些氨基酸(例如,C末端或N 末端残基)可替代地缺失,这取决于序列的使用,作为例如可溶或连接至固相支持物的较大序列的一部分的序列的表达。

当提及多肽时“取代变体”是天然或起始序列中的至少一个氨基酸残基被去除并且在其相同位置处的位置中插入不同的氨基酸的多肽。取代可以是单一的,其中分子中的仅一个氨基酸已被取代;或取代可以是多重的,其中相同分子中的两个或更多个氨基酸已被取代。

如本文所用,术语“保守的氨基酸取代”是指通常存在于序列中的氨基酸被具有类似大小、电荷或极性的不同氨基酸取代。保守取代的实例包括非极性(疏水性)残基如异亮氨酸、缬氨酸和亮氨酸取代另一种非极性残基。同样,保守取代的实例包括一种极性(亲水性)残基取代另一种,如精氨酸与赖氨酸之间、谷氨酰胺与天冬酰胺之间和甘氨酸与丝氨酸之间。另外,碱性残基如赖氨酸、精氨酸或组氨酸取代另一种碱性残基、或一种酸性残基如天冬氨酸或谷氨酸取代另一种酸性残基是保守取代的另外实例。非保守取代的实例包括非极性(疏水性)氨基酸残基如异亮氨酸、缬氨酸、亮氨酸、丙氨酸、蛋氨酸取代极性(亲水性)残基如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸,和/或极性残基取代非极性残基。

当提及多肽时“插入变体”是具有紧邻天然或起始序列中的特定位置处的氨基酸插入的一个或多个氨基酸的那些变体。“紧邻”氨基酸意指连接至该氨基酸的α-羧基或α-氨基官能团。

当提及多肽时“缺失变体”是天然或起始氨基酸序列中的一个或多个氨基酸被去除的那些变体。通常,缺失变体将使一个或多个氨基酸在分子的特定区域中缺失。

当提及多肽时“共价衍生物”包括用有机蛋白质或非蛋白质衍生化试剂修饰天然或起始蛋白质,和/或翻译后修饰。传统上通过使蛋白质的靶标氨基酸残基与能够与选定侧链或末端残基反应的有机衍生化试剂反应,或通过利用在选定重组宿主细胞中起作用的翻译后修饰的机制来引入共价修饰。所得共价衍生物适用于旨在鉴别对于生物活性、对于免疫测定或对于制备用于重组糖蛋白的免疫亲和纯化的抗蛋白质抗体来说重要的残基的程序中。此类修饰在本领域普通技术的范围内并且在无过度实验的情况下进行。

某些翻译后修饰是重组宿主细胞对所表达多肽的作用的结果。谷氨酰胺酰基和天冬酰胺酰基残基经常在翻译后脱去酰胺基成对应的谷氨酰基和天冬氨酰基残基。或者,这些残基在温和酸性条件下脱去酰胺基。这些残基的任一形式可存在于根据本发明产生的多肽中。

其他翻译后修饰包括脯氨酸和赖氨酸的羟基化,丝氨酰基或苏氨酰基残基的羟基的磷酸化,赖氨酸、精氨酸和组氨酸侧链的α-氨基的甲基化(T.E.Creighton, Proteins:Structure and Molecular Properties,W.H.Freeman&Co.,San Francisco, 第79-86页(1983)),其内容以引用的方式整体并入。

当提及多肽时“特征”被定义为分子的基于氨基酸序列的不同组分。由本发明编码的cGAS多肽的特征包括表面表观、局部构象形状、折叠、环、半环、结构域、半结构域、位点、末端或其任何组合。

如本文所用当提及多肽时,术语“表面表观”是指蛋白质的出现在最外表面上的基于多肽的组分。

如本文所用,当提及多肽时术语“局部构象形状”是指蛋白质的位于其可限定空间内的基于多肽的结构表观。

如本文所用当提及多肽时,术语“折叠”是指在能量最低化时氨基酸序列的所得构象。折叠可在折叠过程的二级或三级水平下发生。二级水平折叠的实例包括β折叠和α螺旋。三级折叠的实例包括由于高能力的聚集或分离形成的结构域和区域。以这种方式形成的区域包括疏水袋和亲水袋等。

如本文所用,术语“转角”在其涉及蛋白质构象时意指使肽或多肽的主链方向改变的弯曲并且可涉及一个、两个、三个或更多个氨基酸残基。

如本文所用,当提及多肽时,术语“环”是指可用于使肽或多肽的主链方向反向的多肽的结构特征。当环在多肽中存在并且仅改变主链的方向时,它可包含四个或更多个氨基酸残基。Oliva等人已经鉴别了至少5类蛋白质环(J.Mol Biol 266 (4):814-830;1997)。环可以是开放的或闭合的。闭合的环或“环状”环可在桥接部分之间包含2、3、4、5、6、7、8、9、10或更多个氨基酸。此类桥接部分可包含在具有二硫桥的多肽中典型的半胱氨酸-半胱氨酸桥(Cys-Cys),或可替代地桥接部分可以是基于非蛋白质的,如本文所使用的dibromozylyl试剂。

如本文所用,当提及多肽时术语“半环”是指所鉴别的环的一部分,该部分具有其所衍生自的环的至少一半数目的氨基酸残基。应理解,环可能不总是含有偶数数目的氨基酸残基。因此,在环含有或被鉴别为包含奇数数目的氨基酸的那些情况下,奇数数目的环的半环将包含该环的整数部分或下一个整数部分(该环的氨基酸的数目/2+/-0.5个氨基酸)。例如,被鉴别为7个氨基酸环的环可产生3个氨基酸或4个氨基酸的半环(7/2=3.5+/-0.5为3或4)。

如本文所用,当提及多肽时术语“结构域”是指具有一种或多种可鉴别的结构或功能特征或特性(例如,结合能力,用作蛋白质-蛋白质相互作用的位点)的多肽的基序。

如本文所用,当提及多肽时术语“半结构域”意指鉴别的结构域的一部分,该部分具有其所衍生自的结构域的至少一半数目的氨基酸残基。应理解结构域可能不总是包含偶数数目的氨基酸残基。因此,在结构域包含或被鉴别为包含奇数数目的氨基酸的那些情况下,奇数数目的结构域的半结构域将包含该结构域的整数部分或下一个整数部分(该结构域的氨基酸的数目/2+/-0.5个氨基酸)。例如,被鉴别为7个氨基酸结构域的结构域可产生3个氨基酸或4个氨基酸的半结构域 (7/2=3.5+/-0.5为3或4)。还应理解,可在结构域或半结构域内鉴别亚结构域,这些亚结构域拥有少于其所衍生自的结构域或半结构域中鉴别出的所有结构或功能特性。还应理解,包含本文的任何结构域类型的氨基酸不必是沿多肽的主链连续的(即,不相邻的氨基酸可在结构上折叠以产生结构域、半结构域或亚结构域)。

如本文所用,当提及多肽时术语“位点”在其涉及基于氨基酸的实施方案时与“氨基酸残基”和“氨基酸侧链”同义地使用。位点表示肽或多肽内的可在本发明的基于多肽的分子内修饰、操纵、改变、衍生或变化的位置。

如本文所用,术语“末端(termini)”或“末端(terminus)”当提及多肽时是指肽或多肽的末尾。此类末尾不仅仅限于肽或多肽的第一或最后位点,而且可包括末端区域中的另外氨基酸。本发明的基于多肽的分子可被表征为具有N末端(由具有自由氨基(NH2)的氨基酸封端)和C末端(由具有自由羧基(COOH)的氨基酸封端) 两者。本发明的蛋白质在一些情况下由通过二硫键或通过非共价力(多聚体、低聚物)集合在一起的多个多肽链组成。这些种类的蛋白质将具有多个N末端和C 末端。或者,多肽的末端可进行修饰以使得它们根据情况以基于非多肽的部分(如有机缀合物)开始或结束。

一旦任何特征已被鉴别或定义为本发明的多肽的所需组分,便可通过移动、交换、反转、缺失、随机化或复制来进行这些特征的若干操纵和/或修饰中的任何一种。此外,应理解特征的操纵可产生与对本发明分子的修饰相同的结果。例如,涉及使结构域缺失的操纵将产生正如修饰核酸以编码小于全长分子将产生的那样的分子长度的改变。

修饰和操纵可通过本领域已知的方法来实现,例如但不限于定点诱变。然后可使用体外或体内测定(如本文所描述的那些)或本领域已知的任何其他合适的筛选测定来测试所得到的修饰分子的活性。

根据本发明,多肽可包含通过多轮实验发现的共有序列。如本文所用,“共有”序列是表示允许在一个或多个位点处的变异的序列集合群体的单个序列。

如本领域技术人员所认识到,蛋白质片段、功能性蛋白质结构域和同源蛋白质也被认为在本发明的目标多肽的范围内。例如,本文提供长度为10、20、30、 40、50、60、70、80、90、100或大于100个氨基酸的参考蛋白质的任何蛋白质片段(意指比参考多肽序列短至少一个氨基酸残基但在其他方面相同的多肽序列)。在另一个实例中,可根据本发明使用包括与本文所描述的任何序列为约 40%、约50%、约60%、约70%、约80%、约90%、约95%或约100%同一的具有约20、约30、约40、约50或约100个氨基酸的段的任何蛋白质。在某些实施方案中,待根据本发明使用的多肽包括2、3、4、5、6、7、8、9、10或更多个突变,如本文所提供或提及的任何序列中所示。

在一些实施方案中,cGAMP化合物或cGAS分子可用于产生抗体。因此,如此产生的抗体被认为是本发明的另外化合物和组合物。如本文所用,术语“抗体”包括单克隆抗体(包括具有免疫球蛋白Fc区的全长抗体)、具有多表位特异性的抗体组合物、多特异性抗体(例如,双特异性抗体、双抗体和单链分子)以及抗体片段。术语“免疫球蛋白”(Ig)在本文可与“抗体”互换使用。如本文所用,术语“单克隆抗体”是指从基本上同质抗体的群体获得的抗体,即构成该群体的单个抗体是同一的,除了可能以微量存在的可能的天然存在的突变和/或翻译后修饰(例如,异构化,酰胺化)。单克隆抗体是高度特异性的,从而针对单一抗原位点。

本文的单克隆抗体具体地包括“嵌合”抗体(免疫球蛋白),其中重链和/或轻链的一部分与源自特定物种或属于特定抗体类别或亚类的抗体中的对应序列同一或同源,而该链的剩余部分与源自另一物种或属于另一抗体类别或亚类的抗体以及此类抗体的片段中的对应序列同一或同源,只要它们表现出所需的生物活性。本文的目标嵌合抗体包括但不限于包含源自非人灵长类动物(例如,旧世纪猴 (Old World Monkey)、猿等)的可变结构域抗原结合序列和人恒定区序列的“灵长类化”抗体。

“抗体片段”包含完整抗体的一部分,优选地该完整抗体的抗原结合区和/或可变区。抗体片段的实例包括Fab、Fab'、F(ab')

五类免疫球蛋白IgA、IgD、IgE、IgG和IgM中的任何一种可由本发明的化合物或分子产生,包括分别指定为α、δ、ε、γ和μ的重链。

虽然不希望受理论束缚,但据信使用本文公开的cGAMP化合物或cGAS分子产生的抗体将产生改进的治疗功效。

本发明的抗体可用于治疗许多治疗领域中的病状或疾病,该治疗领域如但不限于血液、心血管、CNS、中毒(包括抗蛇毒素)、皮肤病学、内分泌学、胃肠、医学成像、肌肉骨骼、肿瘤学、免疫学、炎症、呼吸系统、感觉系统以及抗感染的治疗领域。

在一个实施方案中,抗体的变体还可包括但不限于,取代变体、保守的氨基酸取代、插入变体、缺失变体和/或共价衍生物。

如本文所用,“疫苗”是改善对特定疾病或传染原的免疫性的生物制剂。根据本发明并且同时不希望受理论束缚,据信利用本发明的cGAMP化合物或cGAS 分子可用作疫苗或疫苗佐剂。

本发明的疫苗可用于治疗许多治疗领域中的病状或疾病,该治疗领域如但不限于心血管、CNS、皮肤病学、内分泌学、肿瘤学、免疫学和自身免疫性、炎症、呼吸系统以及抗感染。

在一些实施方案中,本发明提供一种结合具有包含以下特征的结构的 cGAMP的多肽的调节剂:

A-----L-----B

其中:

A是配合在cGAS腺苷结合位点的部分或包含配合在cGAS腺苷结合位点的部分;

B是配合在cGAS鸟苷结合位点的部分或包含配合在cGAS鸟苷结合位点的部分;以及

任选地,L是以允许A和B采用适当的相互作用以结合cGAS的方式连接A 和B的接头部分。

在一些实施方案中,结合cGAMP的多肽是cGAS。在一些实施方案中,结合cGAMP的多肽是STING。

在一些实施方案中,A是如以下所定义且在本文的类别和子类中所述的环 A,单独地和组合地。在一些实施方案中,A任选地在选自由Ser199、Ser420、 Lys402、Glu211、Asp213、Asp307、Tyr421、Arg364以及其组合组成的组的一个或多个位点处进行与cGAS的一种或多种相互作用。在一些实施方案中,A任选地在选自由Tyr421、Asp213、Asp307、Arg364以及其组合组成的组的一个或多个位点处进行与cGAS的一种或多种相互作用。

在一些实施方案中,B是如以下所定义且在本文的类别和子类中所述的环B,单独地和组合地。在一些实施方案中,B任选地在选自由Tyr421、Thr197、Ser366、 Ser368、Arg364以及其组合组成的组的一个或多个位点处进行与cGAS的一种或多种相互作用。

在一些实施方案中,接头部分是适合于共价连接A和B且允许A和B采用适当的相互作用以结合cGAS的接头。在一些实施方案中,接头连同A和/或B 包含任选地含有一个或多个磷酸酯基的核苷。在一些实施方案中,接头连同A 和/或B包含任选地含有一个或多个磷酸酯基的环状二核苷。在一些实施方案中,调节剂是环状-GMP-AMP类似物。

在一些实施方案中,接头部分包含一个或多个核糖或磷酸酯基。在一些实施方案中,此类核糖和磷酸酯基连同环A或B形成核糖核苷酸。在一些实施方案中,调节剂包含一个或多个修饰的核糖核苷酸。修饰的核糖核苷酸是本领域中熟知的,并且包括对磷酸酯基、核糖基、核苷酸碱基以及其组合的修饰。本发明考虑所有可能的修饰的核糖核苷酸用于本文所述的调节剂和化合物。在一些实施方案中,这些修饰增强化合物体内稳定性。在一些实施方案中,修饰增加化合物对磷酸二酯酶的顺应性。

在一些实施方案中,接头包含修饰的磷酸二酯基。此类修饰是本领域中已知的并且包括但不限于,用硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基磷酸酯(包括3′-磷酸亚烷基酯、5′-磷酸亚烷基酯和手性磷酸酯、次磷酸酯)、氨基磷酸酯(包括3′-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、硫羰氨基磷酸酯(thionophosphoramidate))、硫羰烷基磷酸酯(thi onoalkylphosphonate)、硫羰烷基磷酸三酯(thionoalkylphosphotriester)、硒代磷酸酯、硼代磷酸酯(boranophosphate)以及其组合取代磷酸二酯。在一些实施方案中,磷酸二酯被修饰成氨基磷酸酯。合适的氨基磷酸酯包括但不限于在www.glenres earch.com/Reference/StructureListing.php可获得列出的那些,其全部内容特此以引用的方式并入。

在一些实施方案中,接头不包括磷。在一些实施方案中,接头包含短链烷基或环烷基核苷间键联、混合的杂原子和烷基或环烷基核苷间键联、或一个或多个短链杂原子或杂环核苷间键联。这些包括具有以下的那些:吗啉代键联(部分由核苷的糖部分形成);硅氧烷部分;硫化物、亚砜和砜部分;酰胺、羧酸酯、甲酰乙酰基和硫代甲酰乙酰基部分;亚甲基甲酰乙酰基和硫代甲酰乙酰基部分;核糖乙酰基部分;含亚烷基的部分;氨基磺酸酯部分;亚甲基亚氨基和亚甲基肼基部分;磺酸酯和磺酰胺部分;酰胺部分;以及具有混合的N、O、S和CH

此外,可修饰磷酸二酯接头以改进化合物的稳定性。例如,在某些情况中,将P═O键联改变成对体内核酸酶降解不敏感的P═S键联。在某些情况中,将核苷酸的糖部分的C-2羟基转化成烷基或杂烷基醚。这种修饰使得寡核苷酸不太易于核溶降解。

另外的磷酸二酯修饰由Dellinger等Curr Protoc Nucleic Acid Chem.2004年10月;第4章;第4单元;Marshall等Science.1993年3月12日;259(5101):1564-70 描述,其全部内容特此以引用的方式并入。

接头部分还可包含一个或多个修饰的核糖部分。在一些实施方案中,接头包含在2’或3’位置处在以下中的一个处修饰的核糖:OH;F;O-、S-或N-烷基; O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、烯基以及炔基可以是取代或未取代的C

类似修饰还可在寡核苷酸上的其他位置处进行,特别是3'末端核苷酸上的糖的3'位置和5'位置。寡核苷酸还可具有替代戊呋喃糖基糖的糖模拟物,如环丁基部分。

在一些实施方案中,接头核糖被修饰成锁核酸(LNA),其中2’-羟基连接至糖环的3’或4’碳原子,从而形成双环糖部分。键联优选地是桥接2’氧原子和4’碳原子的亚甲基(-CH

在某些实施方案中,接头包含己糖部分。在一些实施方案中,己糖是葡萄糖或甘露糖。在某些情况中,核糖糖部分被环己烯基或多环杂烷基环置换。在一些实施方案中,核糖部分被吗啉代基置换。另外的核糖修饰由Engels,New Biotechnology,第30卷,3,第302页(2013)讨论,其全部内容特此以引用的方式并入。

在一些实施方案中,A或B是选自腺嘌呤(A)和鸟嘌呤(G),以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)的未修饰的或天然核碱基。在一些实施方案中, A或B是修饰的核碱基。修饰的核碱基是本领域中已知的并且包括但不限于合成和天然核碱基如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基衍生物和其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基衍生物和其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤代尿嘧啶和胞嘧啶、5-丙炔基(—C≡C—CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇基、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代(具体为5-溴)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3- 脱氮腺嘌呤。另外的修饰的核碱基包括三环嘧啶类,如吩噁嗪胞苷(1H-嘧啶并 5,4-b][1,4]苯并噁嗪2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并[5,4-b][1,4]苯并噻嗪 -2(3H)-酮)、G-钳如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并[5,4-b][1,4] 苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并[4,5-b]吲哚-2-酮)、吡啶并吲哚胞苷(H- 吡啶并[3′,2′:4,5]吡咯并[2,3-d]嘧啶2-酮)。修饰的核碱基还可包括嘌呤或嘧啶碱基被其他杂环类置换的那些核碱基,例如7-脱氮腺嘌呤、7-脱氮鸟嘌呤、2-氨基吡啶和2-吡啶酮。另外的核碱基包括公开于美国专利号3,687,808中的那些、公开于The Concise Encyclopedia Of Polymer Science And Engineering,第858-859页, Kroschwitz,J.I.编著John Wiley&Sons,1990中的那些、由Englisch等,Angewandte Chemie,International Edition,1991,30,613公开的那些以及由 Sanghvi,Y.S.,第15章,Antisense Research and Applications,第289-302页, Crooke,S.T.和Lebleu,B.编著,CRC Press,1993公开的那些。在一些实施方案中,非天然核碱基是二氟甲苯基、硝基吡咯基或硝基咪唑基。在某些实施方案中,非天然核碱基是7-脱氮腺嘌呤、3-脱氮腺嘌呤、N1-甲基-鸟苷、6-硫代鸟苷、2-嘧啶酮、4-硫代尿苷、2-吡啶酮、5-丙炔基-尿苷、咪唑-4-甲酰胺、5-硝基吲哚、3- 硝基吡咯、2-氨基嘌呤、5-甲基-2-嘧啶酮、N3-硫代乙基胸苷、6-巯基嘌呤、5- 碘尿苷、8-叠氮腺苷、5-巯基尿苷,或源自5-溴尿嘧啶、二氨基嘌呤、2-硫尿嘧啶、4-硫尿嘧啶、假尿嘧啶、二氟甲苯以及二氢尿嘧啶的那些。另外的修饰的核碱基包括在www.glenresearch.com/Reference/StructureListing.php和www.thermoscientificbio.com/rna-pricing-and-modifications/中发现的那些,其各自的全部内容特此以引用的方式并入。另外的修饰由Verma等Annu.Rev.Biochem. 1998.67:99–134论述。

在一些实施方案中,接头部分包含置换核糖核苷酸的磷酸二酯基和核糖基的基团。一种此类接头被称为肽核酸(PNA)。在PNA化合物中,寡核苷酸的通常糖主链被含有酰胺的主链置换,例如氨基乙基甘氨酸主链。保留核苷碱基并且与主链的酰胺部分的氮杂氮原子直接或间接结合。教导PNA化合物的制备的代表性的美国专利包括但不限于美国专利号5,539,082;5,714,331;和5,719,262,其各自均以引用的方式并入本文。PNA化合物的另外教导可见于Nielsen等,Science, 1991,254,1497-1500;Nielsen等,Chem.Soc.Rev.,1997,26,73-78;Shakeel等, Journal of Chemical Technology&Biotechnology,第81卷,第6期,2006年6月, 第892-899(8)页;Nielsen,CHEMISTRY&BIODIVERSITY–第7卷(2010),第786页。

这些和其他合适的接头论述于美国专利号7,365,058、8,101,348、8,088,902、 7,579,451、7,582,744、8,334,373、8,017,762、7,919,612、7,812,149以及7,723,508 中,其各自的全部内容特此以引用的方式并入本文。

在一些实施方案中,本发明提供一种式I化合物:

或其药学上可接受的盐,

其中:

环A选自由以下组成的组:

环B选自由以下组成的组:

每个X

X

X

X

X

每个X

每个W独立地是P或S;

每个R

每个R

每个R

每个R独立地选自由以下组成的组:氢或选自以下的任选取代的基团:C

相同氮上的两个R基团与其居间原子合在一起形成任选取代的3-7元饱和、部分不饱和或具有独立地选自氮、氧或硫的1-4个杂原子的杂芳基环;以及

R

在一些实施方案中,环A是

在一些实施方案中,环A是

在一些实施方案中,环A是

在一些实施方案中,环B是

在一些实施方案中,环B是

在一些实施方案中,X

在某些实施方案中,X

在某些实施方案中,X

在某些实施方案中,X

在某些实施方案中,X

在一些实施方案中,X

在一些实施方案中,X

在一些实施方案中,X

在一些实施方案中,X

在一些实施方案中,W是P。在其他实施方案中,W是S。

在一些实施方案中,R

在一些实施方案中,是氢、R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

在一些实施方案中,R

应理解对于本文描绘的化合物,其中示出负电荷磷酸酯,本公开考虑此类化合物的游离形式和盐形式两者以及其互变异构体。在一些实施方案中,所提供的化合物可具有平衡游离磷酸酯的电荷的一个或多个质子化氮。

在一些实施方案中,本发明提供一种式II化合物:

或其药学上可接受的盐,

其中环A、环B、X

在一些实施方案中,所提供的化合物不同于:

在一些实施方案中,所提供的化合物具有式I-a或II-a:

或其药学上可接受的盐。

在一些实施方案中,所提供的化合物具有式III、IV、V、VI、VII、VIII或 IX:

或其药学上可接受的盐,其中环A、X

在一些实施方案中,所提供的化合物具有式X、XI、XII、XIII、XIV、XV 或XVI:

或其药学上可接受的盐,

其中环A、X

在一些实施方案中,所提供的化合物选自:

或其药学上可接受的盐,

其中环A、X

在一些实施方案中,所提供的化合物选自:

或其药学上可接受的盐,

其中环A、X

在一些实施方案中,所提供的化合物选自:

应理解在前述段落中描绘的化合物可使用其他惯例描绘。例如,以下两种化合物被认为是在化学结构和立体化学方面等效的:

在一些实施方案中,所提供的化合物呈分离形式。在一些实施方案中,所提供的化合物是纯的。

药物组合物

所提供的药物组合物可呈各种形式,包括口服剂型、局部霜剂、局部贴剂、离子电渗疗法形式、栓剂、鼻用喷雾剂和吸入器、滴眼液、眼内注射形式、储库形式以及可注射和可输注溶液。用于制备药物组合物的方法是在本领域中熟知的。

药物组合物通常含有有效实现所需治疗作用同时避免或最小化不良副作用的量的本文所述的活性剂。活性剂的药学上可接受的制剂和盐在本文提供并且是本领域中熟知的。对于cGAS调节剂等的施用,选择具有很少至无不良副作用的治疗有效的合乎需要施用的量。有效治疗具体疾病、病症或病状的治疗性或药物组合物的量取决于疾病的性质和严重程度、目标作用部位、受试者的体重、由受试者遵循的特殊饮食、所使用的并行药物、施用途径以及由本领域的技术人员认识到的其他因素。剂量可由临床医师根据常规因素如疾病的程度和来自受试者的不同参数而调整。可由来源于体外或动物模型测试系统的剂量-反应曲线外推有效剂量(例如,如由美国卫生和公共服务部(U.S.Department of Health andHuman Services)、食品和药品管理局(Food and Drug Administration)以及药物评价与研究中心(Center for Drug Evaluation and Research)在“Guidance for Industry:Estimating Maximum Safe Starting Dose in Initial Clinical Trials forTherapeutics in Adult Healthy Volunteers”,Pharmacology and Toxicology,2005年7月中所描述,其全部内容以引用的方式并入本文)。

各种递送系统是已知的并且可用于施用本文所述的活性剂或包含该活性剂的药物组合物。

本文所述的药物组合物可通过包括但不限于以下的任何合适的途径施用:肠内、胃肠、硬膜外、经口、透皮、硬膜外(epidural)(硬膜外(peridural))、脑内(进入大脑)、脑室内(进入脑室)、皮外(epicutaneous)(涂敷在皮肤上)、皮内(进入皮肤本身)、皮下(在皮肤下)、鼻施用(通过鼻子)、静脉内(进入静脉)、动脉内(进入动脉)、肌内(进入肌肉)、心脏内(进入心脏)、骨内输注(进入骨髓)、鞘内(进入椎管)、腹膜内(输注或注射到腹膜中)、膀胱内输注、玻璃体内(通过眼睛)、海绵体内注射(进入阴茎底部)、阴道内施用、子宫内、羊膜外施用、透皮(扩散穿过完好的皮肤用于全身性分布)、透粘膜(扩散穿过粘膜)、吹入(嗅吸)、舌下、唇下、灌肠、滴眼液(滴在结膜上)或用滴耳液。在具体实施方案中,组合物可以允许其穿过血脑屏障、血管屏障或其他上皮屏障的方式施用。本领域中熟知的其他递送系统可用于递送本文所述的药物组合物,例如通过水溶液、封装在微颗粒中或微胶囊中。本发明的药物组合物还可在控释系统中递送。例如,可使用聚合物材料(参见,例如Smolen和Ball,Controlled Drug Bioavailability,Drug product design and performance,1984,JohnWiley&Sons;Ranade和Hollinger,Drug Delivery Systems, pharmacology andtoxicology series,2003,第2版,CRRC Press)。或者,可使用泵 (Saudek等,N.Engl.J.Med.321:574(1989))。本文所述的组合物还可偶联至适用于实现药物的控释的一类生物可降解聚合物,例如,聚乳酸、聚原酸酯、交联的两亲性嵌段共聚物和水凝胶、聚羟基丁酸以及聚二氢吡喃。

如上文所述,药物组合物合乎需要地包括药学上可接受的载体。术语载体是指与调节剂一起施用的稀释剂、佐剂、赋形剂或媒介物。此类药物载体包括无菌液体如水和油,包括矿物油、植物油(例如,大豆油或玉米油)、动物油或合成来源的油。甘油和葡萄糖水溶液以及盐水溶液也可用作本发明的药物组合物的液体载体。载体的选择取决于本领域中公认的因素,如肽、肽衍生物或肽模拟物的性质、其溶解度和其他生理特性以及递送和应用的靶标部位。合适的药物载体的实例描述于Remington:The Science and Practice ofPharmacy by Alfonso R.Gennaro, 2003,第21版,Mack Publishing Company中。此外,用于口服施用的合适载体是本领域中已知的且描述于例如美国专利号6,086,918、6,673,574、6,960,355和 7,351,741以及WO2007/131286中,其公开内容特此以引用的方式并入。

可并入药物制剂的另外药学上合适的材料包括吸收增强剂(包括意图增加细胞旁路吸收的那些)、pH调节剂和缓冲剂、渗透压调节剂、防腐剂、稳定剂、抗氧化剂、表面活性剂、增稠剂、软化剂、分散剂、调味剂、着色剂以及润湿剂。

合适的药物赋形剂的实例包括,水、葡萄糖、蔗糖、乳糖、二醇、乙醇、单硬脂酸甘油酯、明胶、淀粉末(例如,米粉)、白垩、硬脂酸钠、麦芽、氯化钠等。包含调节剂的药物组合物可采取溶液剂、胶囊剂、片剂、霜剂、凝胶、粉末、缓释制剂等的形式。组合物可用传统粘合剂和载体(如甘油三酯)配制成栓剂(参见 Remington:The Science and Practice ofPharmacy by Alfonso R.Gennaro,2003,第 21版,Mack Publishing Company)。此类组合物含有治疗有效量的治疗性组合物连同合适量的载体以便提供用于适当施用至受试者的形式。该制剂被设计成合适施用模式和靶标作用部位(例如,特定器官或细胞类型)。

包含本文所述的活性剂的药物组合物还包括被配制为中性或盐形式的组合物。药学上可接受的盐包括与游离氨基形成的那些盐和与游离羧基反应的那些盐。通常用于制药工业的无毒碱金属盐、碱土金属盐以及铵盐包括钠、钾、锂、钙、镁、钡、铵以及鱼精蛋白锌盐,其通过本领域中熟知的方法制备。还包括无毒酸加成盐,其通常通过使本发明的化合物与合适的有机或无机酸反应来制备。代表性盐包括氢溴酸盐、盐酸盐、戊酸盐、草酸盐、油酸盐、月桂酸盐、硼酸盐、苯甲酸盐、硫酸盐、硫酸氢盐、乙酸盐、磷酸盐、甲苯磺酸盐(tysolate)、柠檬酸盐、马来酸盐、富马酸盐、酒石酸盐、琥珀酸盐、萘磺酸盐等。

可根据本发明使用的填充剂或粘合剂的实例包括阿拉伯胶、海藻酸、磷酸钙 (磷酸氢钙)、羧甲基纤维素、羧甲基纤维素钠、羟乙基纤维素、羟丙纤维素、羟丙基甲基纤维素、糊精、葡萄糖结合剂、蔗糖、纤基乙酸钠(tylose)、预胶凝淀粉、硫酸钙、直链淀粉、甘氨酸、膨润土、麦芽糖、山梨糖醇、乙基纤维素、磷酸氢二钠、磷酸二钠、焦亚硫酸二钠、聚乙烯醇、明胶、葡萄糖、瓜尔胶、液体葡萄糖、可压缩糖、硅酸铝镁、麦芽糊精、聚环氧乙烷、聚甲基丙烯酸酯、聚维酮、海藻酸钠、黄芪胶微晶纤维素、淀粉以及玉米蛋白。在某些实施方案中,填充剂或粘合剂是微晶纤维素。

可使用的崩解剂的实例包括藻酸、羧甲基纤维素、羧甲基纤维素钠、羟丙纤维素(低取代的)、微晶纤维素、粉末纤维素、胶体二氧化硅、交联羧甲基纤维素钠、交联聚维酮、甲基纤维素、聚克利林钾(polacrilin potassium)、聚维酮、海藻酸钠、羟基乙酸淀粉钠、淀粉、偏重亚硫酸二钠(disodium disulfite)、依地酸二钠 (disodium edathamil)、依地酸二钠(disodium edetate)、乙二胺四乙酸二钠(EDTA) 交联的聚乙烯吡咯烷酮、预胶凝淀粉、羧甲基淀粉、羧甲基淀粉钠、微晶纤维素。

润滑剂的实例包括硬脂酸钙、菜籽油、棕榈硬脂酸甘油酯、氢化植物油(I 型)、氧化镁、硬脂酸镁、矿物油、泊洛沙姆、聚乙二醇、月桂基硫酸钠、硬脂酸富马酸钠、硬脂酸、滑石和硬脂酸锌、二十二烷酸甘油酯(glyceryl behapate)、月桂基硫酸镁、硼酸、苯甲酸钠、乙酸钠、苯甲酸钠/乙酸钠(组合)、DL-亮氨酸。

二氧化硅流动调节剂的实例包括胶体二氧化硅、硅酸铝镁和瓜尔胶。另一种最优选的二氧化硅流动调节剂由二氧化硅组成。

稳定剂的实例包括阿拉伯胶、白蛋白、聚乙烯醇、海藻酸、膨润土、磷酸二钙、羧甲基纤维素、羟丙基纤维素、胶体二氧化硅、环糊精、单硬脂酸甘油酯、羟丙基甲基纤维素、三硅酸镁、硅酸铝镁、丙二醇、海藻酸丙二醇酯、海藻酸钠、巴西棕榈蜡、黄原胶、淀粉、硬脂酸酯、硬脂酸、硬脂酸单甘油酯和硬脂醇。

在一些实施方案中,本发明考虑含有本文所述的活性剂的口服制剂。例如,本文所述的药物组合物可包括环糊精或环糊精衍生物。环糊精通常由五个或更多个1->4连接的α-D-吡喃葡糖苷单位组成。通常,环糊精含有呈环状的六至八个单位范围的多个葡萄糖单体,从而产生圆锥体形状(α-环糊精:六元糖环分子,β-环糊精:七糖环分子,γ-环糊精:八糖环分子)。示例性环糊精和环糊精衍生物公开于美国专利号7,723,304、美国公布号2010/0196452以及美国公布号 2010/0144624中,其各自的全部内容以引用的方式并入本文。例如,在一些实施方案中,根据本发明的环糊精是烷基化环糊精、羟基烷基化环糊精或酰化环糊精。在一些实施方案中,环糊精是羟丙基β-环糊精。示例性环糊精衍生物公开于Szejtli,J.Chem Rev,(1998),98,1743-1753;和Szente,L和Szejtli,J.,Advance DrugDelivery Reviews,36(1999)17-28中,其各自的全部内容特此以引用的方式并入。环糊精衍生物的实例包括甲基化环糊精(例如,RAMEB;随机甲基化的β-环糊精);羟基烷基化环糊精(羟丙基-β-环糊精和羟丙基γ-环糊精);乙酰化环糊精(乙酰基-γ-环糊精);反应性环糊精(氯三嗪基β-环糊精);以及支链环糊精(葡糖基- 和麦芽糖基β-环糊精);乙酰基-γ-环糊精;乙酰基-β-环糊精、磺丁基-β环糊精、硫酸化α-、β-和γ-环糊精;磺烷基化环糊精;以及羟丙基β-环糊精。

给药

通常,将0.001至100mg/kg/天范围内的量的本文所述的活性剂施用至受试者。例如,在一些实施方案中,将约0.01mg/kg/天至约25mg/kg/天、约1mg/kg/ 天至约20mg/kg/天、0.2mg/kg/天至约10mg/kg/天、约0.02mg/kg/天至约0.1 mg/kg/天或约1mg/kg/天至约100mg/kg/天施用至受试者。在一些实施方案中,将约10μg/kg/天、50μg/kg/天、100μg/kg/天、200μg/kg/天、300μg/kg/天、400 μg/kg/天、500μg/kg/天、600μg/kg/天、700μg/kg/天、800μg/kg/天、900μg/kg/ 天或1000μg/kg/天的量的本文所述的活性剂施用至受试者。

在一些实施方案中,以约1-1,000μg/kg/天范围内(例如,约1-900μg/kg/天、 1-800μg/kg/天、1-700μg/kg/天、1-600μg/kg/天、1-500μg/kg/天、1-400μg/kg/ 天、1-300μg/kg/天、1-200μg/kg/天、1-100μg/kg/天、1-90μg/kg/天、1-80μg/kg/ 天、1-70μg/kg/天、1-60μg/kg/天、1-50μg/kg/天、1-40μg/kg/天、1-30μg/kg/天、 1-20μg/kg/天、1-10μg/kg/天范围内)的有效剂量施用该化合物。在一些实施方案中,以约1-500μg/kg/天范围内的有效剂量施用该化合物。在一些实施方案中,以约1-100μg/kg/天范围内的有效剂量施用该化合物。在一些实施方案中,以约 1-60μg/kg/天范围内的有效剂量施用该化合物。在一些实施方案中,以选自约1、 2、4、6、8、10、15、20、25、30、35、40、45、50、75、100、150、200、250、 300、350、400、450、500、550、600、650、700、750、800、850、900、950 或1,000ug/kg/天的有效剂量施用该化合物。

在一些实施方案中,化合物的治疗有效量可以是约10-1,000mg(例如,约 20mg–1,000mg、30mg–1,000mg、40mg–1,000mg、50mg–1,000mg、60mg –1,000mg、70mg–1,000mg、80mg–1,000mg、90mg–1,000mg、约10-900mg、 10-800mg、10-700mg、10-600mg、10-500mg、100-1000mg、100-900mg、100-800 mg、100-700mg、100-600mg、100-500mg、100-400mg、100-300mg、200-1000 mg、200-900mg、200-800mg、200-700mg、200-600mg、200-500mg、200-400mg、300-1000mg、300-900mg、300-800mg、300-700mg、300-600mg、300-500 mg、400mg–1,000mg、500mg–1,000mg、100mg-900mg、200mg–800mg、 300mg–700mg、400mg–700mg以及500mg–600mg)范围内的量。在一些实施方案中,化合物以或大于约10mg、50mg、100mg、150mg、200mg、250mg、 300mg、350mg、400mg、450mg、500mg、550mg、600mg、650mg、700mg、750mg、800mg的量存在。在一些实施方案中,化合物以或小于约1000mg、950 mg、900mg、850mg、800mg、750mg、700mg、650mg、600mg、550mg、 500mg、450mg、400mg、350mg、300mg、250mg、200mg、150mg或100mg 的量存在。在一些实施方案中,本文所述的治疗有效量以一个剂量提供。在一些实施方案中,本文所述的治疗有效量在一天提供。

在其他实施方案中,治疗有效量可以是例如,约0.001mg/kg重量至500 mg/kg重量,例如约0.001mg/kg重量至400mg/kg重量、约0.001mg/kg重量至300mg/kg重量、约0.001mg/kg重量至200mg/kg重量、约0.001mg/kg重量至 100mg/kg重量、约0.001mg/kg重量至90mg/kg重量、约0.001mg/kg重量至 80mg/kg重量、约0.001mg/kg重量至70mg/kg重量、约0.001mg/kg重量至60 mg/kg重量、约0.001mg/kg重量至50mg/kg重量、约0.001mg/kg重量至40mg/kg 重量、约0.001mg/kg重量至30mg/kg重量、约0.001mg/kg重量至25mg/kg重量、约0.001mg/kg重量至20mg/kg重量、约0.001mg/kg重量至15mg/kg重量、约0.001mg/kg重量至10mg/kg重量。在一些实施方案中,本文所述的治疗有效量以一个剂量提供。在一些实施方案中,本文所述的治疗有效量在一天提供。

在其他实施方案中,治疗有效量可以是例如,约0.0001mg/kg重量至0.1 mg/kg重量,例如约0.0001mg/kg重量至0.09mg/kg重量、约0.0001mg/kg重量至0.08mg/kg重量、约0.0001mg/kg重量至0.07mg/kg重量、约0.0001mg/kg 重量至0.06mg/kg重量、约0.0001mg/kg重量至0.05mg/kg重量、约0.0001mg/kg 重量至约0.04mg/kg重量、约0.0001mg/kg重量至0.03mg/kg重量、约0.0001 mg/kg重量至0.02mg/kg重量、约0.0001mg/kg重量至0.019mg/kg重量、约0.0001 mg/kg重量至0.018mg/kg重量、约0.0001mg/kg重量至0.017mg/kg重量、约0.0001mg/kg重量至0.016mg/kg重量、约0.0001mg/kg重量至0.015mg/kg重量、约0.0001mg/kg重量至0.014mg/kg重量、约0.0001mg/kg重量至0.013mg/kg 重量、约0.0001mg/kg重量至0.012mg/kg重量、约0.0001mg/kg重量至0.011 mg/kg重量、约0.0001mg/kg重量至0.01mg/kg重量、约0.0001mg/kg重量至 0.009mg/kg重量、约0.0001mg/kg重量至0.008mg/kg重量、约0.0001mg/kg重量至0.007mg/kg重量、约0.0001mg/kg重量至0.006mg/kg重量、约0.0001mg/kg 重量至0.005mg/kg重量、约0.0001mg/kg重量至0.004mg/kg重量、约0.0001mg/kg重量至0.003mg/kg重量、约0.0001mg/kg重量至0.002mg/kg重量。在一些实施方案中,治疗有效剂量可以是0.0001mg/kg重量、0.0002mg/kg重量、 0.0003mg/kg重量、0.0004mg/kg重量、0.0005mg/kg重量、0.0006mg/kg重量、 0.0007mg/kg重量、0.0008mg/kg重量、0.0009mg/kg重量、0.001mg/kg重量、 0.002mg/kg重量、0.003mg/kg重量、0.004mg/kg重量、0.005mg/kg重量、0.006 mg/kg重量、0.007mg/kg重量、0.008mg/kg重量、0.009mg/kg重量、0.01mg/kg 重量、0.02mg/kg重量、0.03mg/kg重量、0.04mg/kg重量、0.05mg/kg重量、0.06mg/kg重量、0.07mg/kg重量、0.08mg/kg重量、0.09mg/kg重量或0.1mg/kg 重量。对于具体个体的有效剂量可取决于个体的需要随时间推移而改变(例如,增加或减少)。在一些实施方案中,本文所述的治疗有效量以一个剂量提供。在一些实施方案中,本文所述的治疗有效量在一天提供。

在一些实施方案中,包含如本文所述的化合物的制剂作为单个剂量施用。在一些实施方案中,包含如本文所述的化合物的制剂以定期间隔施用。如本文所用,在“间隔”下施用指示周期性地(如与一次性剂量区别)施用治疗有效量。间隔可通过标准临床技术确定。在一些实施方案中,两月一次、每月一次、每月两次、三周一次、两周一次、每周一次、每周两次、每周三次、每日一次、每日两次或每六小时施用包含如本文所述的化合物的制剂。对于单个个体的施用间隔不必是固定间隔,但可取决于个体的需要随时间推移改变。

如本文所用,术语“两月一次”意指每两个月施用一次(即,每两个月一次);术语“每月一次”意指每个月施用一次;术语“三周一次”意指每三周施用一次(即,每三周一次);术语“两周一次”意指每两周施用一次(即,每两周一次);术语“每周一次”意指每周施用一次;并且术语“每日一次”意指每天施用一次。

在一些实施方案中,包含如本文所述的化合物的制剂以定期间隔无限施用。在一些实施方案中,包含如本文所述的化合物的制剂以定期间隔施用持续限定时期。在一些实施方案中,包含如本文所述的化合物的制剂以定期间隔施用持续5 年、4年、3年、2年、1年、11个月、10个月、9个月、8个月、7个月、6个月、5个月、4个月、3个月、2个月、1个月、3周、2周、1周、6天、5天、4 天、3天、2天或1天。

使用方法

在某些实施方案中,所提供的化合物适用于医学。在一些实施方案中,所提供的化合物适用于治疗免疫疾病、病症或病状。在一些实施方案中,本发明提供一种用于治疗或预防免疫疾病、病症或病状的方法,该方法包括向有需要的受试者施用所提供的化合物或其药物组合物。

在一些实施方案中,免疫疾病、病症或病状是自身免疫性疾病、病症或病状。在某些实施方案中,免疫疾病、病症或病状选自由任何各种疾病、病症和/或病状组成的组,包括但不限于以下中的一种或多种:自身免疫病症(例如糖尿病、狼疮、多发性硬化症、银屑病、类风湿性关节炎);炎症性病症(例如关节炎、盆腔炎症性疾病);感染性疾病(例如病毒感染(例如,HIV、HCV、RSV)、细菌感染、真菌感染、脓毒症);神经性病症(例如阿尔茨海默氏病(Alzheimer's disease)、亨廷顿氏疾病(Huntington's disease);孤独症;假肥大型肌营养不良);心血管疾病(例如动脉粥样硬化、高胆固醇血症、血栓形成、凝血病症、血管生成病症如黄斑变性);增生性病症(例如癌症、良性肿瘤);呼吸系统病症(例如慢性阻塞性肺病);消化病症(例如炎症性肠病、溃疡);肌肉骨骼病症(例如纤维肌瘤、关节炎);内分泌、代谢和营养病症(例如糖尿病、骨质疏松症);泌尿系统病症(例如肾病);心理病症(例如抑郁症、精神分裂症);皮肤病症(例如伤口、湿疹);血液和淋巴病症(例如贫血、血友病);等。在一些实施方案中,免疫疾病、病症或病状特征在于炎症。在一些实施方案中,免疫疾病、病症或病状由cGAS活化引起、维持或与cGAS活化相关。在一些实施方案中,免疫疾病、病症或病状由STING 活化引起、维持或与STING活化相关。

在一些实施方案中,自身免疫病症或疾病选自急性散播性脑脊髓炎 (ADEM)、阿狄森氏病(Addison's disease)、无丙种球蛋白血症、斑秃、肌萎缩性侧索硬化(还被称为路格里克氏病(Lou Gehrig's disease);运动神经元疾病)、强直性脊柱炎、抗磷脂综合征、抗合成酶综合征、特应性过敏、特应性皮炎、自身免疫性再生障碍性贫血、自身免疫性心肌病、自身免疫性肠病、自身免疫性溶血性贫血、自身免疫性肝炎、自身免疫性内耳疾病、自身免疫性淋巴增生综合征、自身免疫性周围神经病变、自身免疫性胰腺炎、自身免疫性多内分泌腺病综合征、自身免疫性孕酮皮炎、自体免疫性血小板减少性紫癜、自体免疫的荨麻疹、自体免疫性葡萄膜炎、巴洛病(Balo disease)/巴洛同心性硬化、白塞氏病(

在某些实施方案中,向有需要的患者施用化合物导致cGAS活性降低。在一些实施方案中,向有需要的患者施用化合物导致STING活性降低。

在一些实施方案中,用于所提供的方法中的化合物通过化学合成来制备。

在某些实施方案中,本发明提供一种抑制cGAS的方法,该方法包括使cGAS 与所提供的化合物相接触。在一些实施方案中,本发明提供一种抑制患者中的 cGAS的方法,该方法包括向患者施用所提供的化合物。在某些实施方案中,本发明提供一种抑制STING的方法,该方法包括使STING与所提供的化合物相接触。在一些实施方案中,本发明提供一种抑制患者中的STING的方法,该方法包括向患者施用所提供的化合物。

在某些实施方案中,本发明提供一种调节cGAS多肽的活性的方法,该方法包括使该cGAS多肽与通过本文公开的方法设计的cGAS调节剂相接触,该调节剂不是cGAS的已知调节剂、底物或产物。在一些实施方案中,该调节剂是所提供的化合物。

试剂盒

本发明提供各种用于方便和/或有效进行本发明的方法的试剂盒。通常试剂盒将包括足够量和/或数目的组分以允许使用者进行受试者的多次治疗和/或进行多个实验。

一方面,本发明提供包括本发明的分子(如上所述的化合物和组合物)的试剂盒。在一个实施方案中,试剂盒包括一种或多种功能性抗体或其功能片段。

本发明的试剂盒可包括一种或多种cGAMP母体分子或其任何模拟物、类似物或变体。试剂盒还可包括本文所述的任何cGAS变体、衍生物或突变体。试剂盒还可包括包装和说明书和/或形成制剂组合物的递送剂。递送剂可包含盐水、缓冲溶液、脂质或本文公开的任何递送剂。

在一个实施方案中,缓冲溶液可包括氯化钠、氯化钙、磷酸盐和/或EDTA。在另一个实施方案中,缓冲溶液可包括但不限于盐水、具有2mM钙的盐水、5%蔗糖、具有2mM钙的5%蔗糖、5%甘露醇、具有2mM钙的5%甘露醇、林格氏乳酸盐、氯化钠、具有2mM钙的氯化钠以及甘露糖(参见例如美国公布号 20120258046;其以引用的方式整体并入本文)。在另外的实施方案中,缓冲溶液可以是沉淀的或它可以是冻干的。可改变每种组分的量以实现一致的、可再现的更高浓度的盐水或简单的缓冲制剂。还可改变组分以便增加经过一段时间和/或在各种条件下化合物或组合物在缓冲溶液中的稳定性。一方面,本发明提供用于与cGAS活性或cGAMP信号传导相关的研究应用的试剂盒,其以当引入至靶细胞中有效研究伴随信号传导途径的量提供。试剂盒还可包括本文所述的第二或另外的化合物或组合物。此类第二或另外的分子可调节免疫应答或炎症过程或包含一种或多种治疗性分子。在一个实施方案中,试剂盒包括至少一种cGAS多肽和至少一种cGAMP分子。在一个实施方案中,本发明的试剂盒包括包装和说明书。

cGAS晶体结构

除其他事项之外,本发明提供一种包含如本文所述的cGAS多肽的晶体(即,含有至少一种晶体)或可结晶组合物(还参见Gao等Cell 153,1094-1107(2013),包括补充材料)。在一些实施方案中,这种提供的组合物由cGAS多肽组成或基本上由cGAS多肽组成。在一些实施方案中,组合物在其仅包括cGAS多肽、一种或多种溶剂以及任选地盐和/或金属的情况下被认为“由该多肽组成”。在一些实施方案中,此类提供的组合物包括一种或多种其他药剂,如一种或多种其他多肽(例如,一种或多种潜在或实际cGAS结合配偶体多肽或核酸)和/或一种或多种相互作用剂(例如,小分子)。

本发明还提供cGAS多肽晶体的结构信息和/或分析和/或其集。在一些实施方案中,此类结构信息包括但不限于,衍射图案和/或坐标以及其或由其产生的任何数据集、图像、模型和/或图形表示。在一些实施方案中,此类图形表示可包括例如,空间填充模型、分子表面表示、壳或边界模型、条带模型、条形模型;和/或其组合。

在一些实施方案中,所提供的信息是或包括在存在或不存在一种或多种结合配偶体和/或相互作用剂的情况下在彼此不同的结构之间或之中所观察到的差异。在一些实施方案中,所提供的信息是或包括在存在或不存在一种或多种结合配偶体和/或一种或多种调节剂的情况下在彼此不同的结构之间或之中所观察到的差异。

在一些实施方案中,此类结构信息和/或分析可以有形介质(例如,计算机可读介质)或存储环境体现。因此,本发明在任何多种应用中例如通过或使用计算机系统提供cGAS多肽晶体结构信息以及其使用的有形实施方案。例如,在一些实施方案中,此类结构信息和/或分析可由计算机系统或在其上运行的程序访问、输送至计算机系统或在其上运行的程序或自计算机系统或在其上运行的程序输送和/或以另外的方式由计算机系统或在其上运行的程序使用。

基于结构的药物设计

在一些实施方案中,本公开提供用于鉴别和/或表征cGAS调节剂的系统。在一些实施方案中,本公开提供一种设计或表征cGAS调节剂的方法,该方法包括以下步骤:

a)提供包括至少一个潜在相互作用位点的cGAS晶体的图像;

b)在图像中对接为潜在cGAS调节剂结构元件的至少一个部分;以及

c)评估潜在部分-相互作用位点相互作用的一种或多种特征。

在一些实施方案中,至少一个潜在相互作用位点包括选自由Ser199、Ser420、Lys402、Glu211、Asp213、Asp307、Tyr421、Arg364以及其组合组成的组的一个位点。在某些实施方案中,至少一个潜在相互作用位点包括选自由Tyr421、 Thr197、Ser366、Ser368、Arg364以及其组合组成的组的一个位点。在某些实施方案中,至少一个潜在相互作用位点包括选自由Tyr421、Asp213、Asp307、Arg364 以及其组合组成的组的一个位点。在一些实施方案中,至少一个潜在相互作用位点包括Arg161。在一些实施方案中,调节剂是本文所公开化合物。

在一些实施方案中,一种或多种特征包括至少一种选自由以下组成的组的特征:该部分与潜在相互作用位点之间的空间分离;潜在部分-相互作用位点相互作用的能量,和/或其组合。

在一些实施方案中,一种方法还包括提供包含与cGAS晶体的图像对接的部分的潜在cGAS调节剂的图像的步骤。在一些实施方案中,一种方法还包括将图像与包括结合的已知调节剂、底物或产物的cGAS晶体的图像进行比较的步骤。

如本领域的技术人员在阅读本公开时将理解,在一些方面,本发明非常适合用于在计算机实施的发明中使用。如图17中所示,示出且描述示例性云计算环境2400的实施。云计算环境2400可包括一个或多个资源提供者2402a、2402b、 2402c(统称2402)。每个资源提供者2402可包括计算资源。在一些实施方式中,计算资源可包括用于处理数据的任何硬件和/或软件。例如,计算资源可包括能够执行算法、计算机程序和/或计算机应用的硬件和/或软件。在一些实施方式中,示例性计算资源可包括应用服务器和/或具有存储和检索能力的数据库。每个资源提供者2402可连接至云计算环境2400中的任何其他资源提供者2402。在一些实施方式中,资源提供者2402可连接在计算机网络2408上。每个资源提供者 2402可在计算机网络2408上连接至一个或多个计算装置2404a、2404b、2404c(统称2404)。

云计算环境2400可包括资源管理器2406。资源管理器2406可连接至计算机网络2408上的资源提供者2402和计算装置2404。在一些实施方式中,资源管理器2406可有助于通过一个或多个资源提供者2402将计算资源提供至一个或多个计算装置2404。资源管理器2406可接收来自具体计算装置2404针对计算资源的请求。资源管理器2406可鉴别能够提供由计算装置2404要求的计算资源的一个或多个资源提供者2402。资源管理器2406可选择资源提供者2402来提供计算资源。资源管理器2406可有助于资源提供者2402与特定计算装置2404 之间的连接。在一些实施方式中,资源管理器2406可建立特定资源提供者2402 与特定计算装置2404之间的连接。在一些实施方式中,资源管理器2406可将特定计算装置2404重定向至具有所要求的计算资源的特定资源提供者2402。

图18示出可用于实施本公开中描述的技术的计算装置2500和移动计算装置 2550的一个实例。计算装置2500意图表示各种形式的数字计算机,如膝上型计算机、台式计算机、工作站、个人数字助理、服务器、刀片式服务器、主机和其他适当计算机。移动计算装置2550意图表示各种形式的移动装置,如个人数字助理、蜂窝电话、智能手机、平板计算机和其他类似的计算装置。此处所示的部件、其连接和关系以及其功能旨在仅是示例性的,而不是旨在是限制的。

计算装置2500包括处理器2502、存储器2504、存储装置2506、连接至存储器2504和多个高速扩展端口2510的高速接口2508,以及连接至低速扩展端口2514和存储装置2506的低速接口2512。使用各种总线将处理器2502、存储器2504、存储装置2506、高速接口2508、高速扩展端口2510以及低速接口2512 中的每一个互连起来,并且可以将其安装在常见主板上或者视情况以其他方式来安装。处理器2502可处理用于在计算装置2500内执行的指令,该指令包括存储在存储器2504中或存储装置2506上的指令,以便在外部输入/输出装置上显示用于GUI的图形信息,外部输入/输出装置如连接至高速接口2508的显示器 2516。在其他实施方式中,可视情况使用多个处理器和/或多条总线以及多个存储器和多种类型的存储器。另外,多个计算装置可连接起来,其中每个装置提供必要操作的部分(例如,作为服务器组、一组刀片式服务器或多处理器系统)。

存储器2504将信息存储在计算装置2500内。在一些实施方式中,存储器2504是一个或多个易失性存储单元。在一些实施方式中,存储器2504是一个或多个非易失性存储单元。存储器2504还可以是另一形式的计算机可读介质,如磁盘或光盘。

存储装置2506能够为计算装置2500提供大容量存储。在一些实施方式中,存储装置2506可以是或者包含计算机可读介质,如软盘装置、硬盘装置、光盘装置或磁带装置、闪存或其他类似的固态存储装置或者装置阵列,该阵列包括存储区域网络或其他配置中的装置。指令可存储在信息载体中。当由一个或多个处理装置(例如处理器2502)执行时,该指令进行一种或多种方法,如以上所述的那些。指令还可由一个或多个存储装置如计算机或机器可读介质(例如,存储器 2504、存储装置2506或处理器2502上的存储器)存储。

高速接口2508管理计算装置2500的带宽密集型操作,而低速接口2512管理较低带宽密集型操作。此类功能分配仅是示例性的。在一些实施方式中,高速接口2508连接至存储器2504、显示器2516(例如,通过图形处理器或加速器),并且连接至可接受各种扩展卡(未图示)的高速扩展端口2510。在该实施方式中,低速接口2512连接至存储装置2506和低速扩展端口2514。可包括各种通信端口(例如,USB、蓝牙

计算装置2500可以如图所示的多个不同形式来实施。例如,计算装置2500 可作为标准服务器2520实施,或多次在一组此类服务器中实施。另外,计算装置2500可在如膝上型计算机2522的个人计算机中实施。计算装置2500还可作为架式服务器系统2524的一部分实施。或者,来自计算装置2500的部件可与如移动计算装置2550的移动装置(未图示)中的其他部件组合。此类装置中的每一个可包括计算装置2500和移动计算装置2550中的一个或多个,并且整个系统可由彼此通信的多个计算装置组成。

移动计算装置2550包括处理器2552、存储器2564、如显示器2554的输入/ 输出装置、通信接口2566和收发器2568,以及其他部件。移动计算装置2550 还可配备有如微型驱动或其他装置的存储装置以用于提供另外的存储。使用各种总线将处理器2552、存储器2564、显示器2554、通信接口2566以及收发器2568 中的每一个互连起来,并且可将该部件中的若干个安装在常见主板上或者视情况以其他方式来安装。

处理器2552可执行移动计算装置2550内的指令,该指令包括存储在存储器 2564中的指令。处理器2552可作为芯片的芯片组实施,该芯片包括分开的和多个模拟和数字处理器。处理器2552可例如提供对移动计算装置2550的其他部件的协调,如用户界面控制、移动计算装置2550所运行的应用和移动计算装置2550 所进行的无线通信。

处理器2552可通过连接至显示器2554的控制接口2558和显示接口2556 与用户通信。显示器2554可以是例如TFT(薄膜晶体管液晶显示器)显示器或 OLED(有机发光二极管)显示器,或者其他适当显示技术。显示接口2556可包括用于驱动显示器2554来向用户呈现图形和其他信息的适当电路。控制接口2558 可从用户接收命令并且转换该命令以便提交给处理器2552。另外,外部接口2562 可提供与处理器2552的通信,以使移动计算装置2550能够与其他装置进行邻近区域通信。外部接口2562可例如在一些实施方式中提供有线通信,或在其他实施方式中提供无线通信,并且还可使用多个接口。

存储器2564将信息存储在移动计算装置2550内。存储器2564可作为一个或多个计算机可读介质或媒介、一个或多个易失性存储单元或一个或多个非易失性存储单元中的一或多个实施。还可提供扩展存储器2574,该扩展存储器通过扩展接口2572连接至移动计算装置2550,该扩展接口可包括例如SIMM(单列直插式存储模块)卡接口。扩展存储器2574可为移动计算装置2550提供额外的存储空间,或者还可存储用于移动计算装置2550的应用或其他信息。具体地说,扩展存储器2574可包括用来执行或补充上述过程的指令,并且还可包括安全信息。因此,例如,扩展存储器2574可提供为用于移动计算装置2550的安全模块,并且可用允许安全使用移动计算装置2550的指令进行编程。另外,可经由SIMM 卡提供安全应用以及另外的信息,如以无法被黑客攻击的方式将识别信息放在 SIMM卡上。

如在下文中所讨论,存储器可包括例如闪存和/或NVRAM存储器(非易失性随机存取存储器)。在一些实施方式中,指令存储在信息载体中。当由一个或多个处理装置(例如处理器2552)执行时,该指令进行一种或多种方法,如以上所述的那些。指令还可由一个或多个存储装置如一个或多个计算机或机器可读介质 (例如,存储器2564、扩展存储器2574或处理器2552上的存储器)存储。在一些实施方式中,指令可以传播信号接收,例如在收发器2568或外部接口2562上。

移动计算装置2550可通过通信接口2566进行无线通信,该通信接口必要时可包括数字信号处理电路。通信接口2566可在各种模式或协议下提供通信,如 GSM语音呼叫(全球移动通信系统)、SMS(短消息服务)、EMS(增强型消息服务) 或MMS消息发送(多媒体消息服务)、CDMA(码分多址)、TDMA(时分多址)、 PDC(个人数字蜂窝电话)、WCDMA(宽带码分多址)、CDMA2000或GPRS(通用分组无线业务)等等。此类通信可例如使用射频通过收发器2568来发生。另外,可如使用蓝牙

移动计算装置2550还可使用音频编码解码器2560以听得见的方式进行通信,该音频编码解码器可从用户接收说出来的信息并将其转换为可用的数字信息。音频编码解码器2560同样可为用户产生听得见的声音,如通过例如在移动计算装置2550的听筒中的扬声器来产生。此类声音可包括来自语音电话呼叫的声音,可包括所记录的声音(例如,语音消息、音乐文件等等)并且还可包括在移动计算装置2550上操作的应用所产生的声音。

移动计算装置2550可以如图所示的多个不同形式来实施。例如,其可作为蜂窝电话2580实施。其还可作为智能手机2582、个人数字助理或者其他类似的移动装置的部分实施。

此处所述的系统和技术的各种实施方式可用数字电子电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合来实现。这些各种实施方式可包括一个或多个计算机程序中的实施方式,计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解译,可编程系统可以是专用或通用的,其被连接以便从存储系统、至少一个输入装置以及至少一个输出装置接收数据和指令并向其发送数据和指令。

这些计算机程序(还被称为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可以高水平的程序性或面向对象的编程语言和/或以汇编/ 机器语言实施。如本文所用,术语机器可读介质和计算机可读介质是指用于向可编程处理器提供机器指令和/或数据的任何计算机程序产品、设备和/或装置(例如,磁盘、光盘、存储器、可编程逻辑器件(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语机器可读信号是指用于向可编程处理器提供机器指令和/或数据的任何信号。

为了提供与用户的互动,在此描述的系统和技术可在具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监测器)和用户可通过其向计算机提供输入的键盘以及指针装置(例如,鼠标或追踪球)的计算机上实施。其他类型的装置也可用于提供与用户的互动;例如,向用户提供的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈或触觉反馈);并且来自用户的输入可以任何形式接收,包括声音、语音或触觉输入。

在此所述的系统和技术可在计算系统中实施,该计算系统包括后端组件(例如,作为数据服务器)或包括中间件组件(例如,应用服务器)或包括前端组件(例如,具有图形用户界面或网页浏览器的客户端计算机,通过客户端计算机用户可与在此所述的系统和技术的实施互动),或此类后端、中间件或前端组件的任何组合。该系统的组件可通过任何数字数据通信形式或介质(例如,通信网络)互连。通信网络的实例可包括局域网(LAN)、广域网(WAN)和互联网。

计算系统可包括客户端和服务器。客户端和服务器通常彼此远离且通常通过通信网络交互。客户端与服务器的关系凭借在相应计算机上运行且彼此具有客户端-服务器关系的计算机程序形成。

在某些实施方案中,本发明提供一种系统,其包括计算机或计算机可读介质,其中嵌入和/或显示cGAS晶体结构或其坐标。

在一些实施方案中,本发明提供一种设计和/或表征cGAS调节剂的方法,该方法包括以下步骤:

(i)使用所提供的系统来评估cGAS调节剂的一个或多个结构特征;以及

(ii)进行一个或多个体外测定、体内测定或基于细胞的测定以表征cGAS调节剂。

在一些实施方案中,该方法还包括在cGAS调节剂与已知的cGAS调节剂、底物或产物之间进行竞争性实验的步骤。在一些实施方案中,该方法还包括确定抑制剂的三维形状的步骤。

在一些实施方案中,本发明提供一种含有用于进行cGAS抑制剂的设计或表征的信息集合的计算机系统,该计算机系统具有包括显示单元的用户界面,该信息集合包括:

(i)用于输入关于cGAS蛋白与已知结合cGAS蛋白的部分的结合的信息的逻辑;

(ii)用于基于cGAS蛋白与已知结合cGAS蛋白的部分的结合设计候选 cGAS抑制剂的逻辑;

(iii)用于测定关于cGAS蛋白与候选cGAS抑制剂的结合的信息的逻辑;以及

(iv)用于基于步骤(iii)的测定作出关于候选cGAS抑制剂的cGAS抑制特性的结论的逻辑。

在一些实施方案中,本发明提供一种含有用于通用计算机的信息集合的计算机可读存储介质,该计算机具有包括显示单元的用户界面,该信息集合包括:

(i)用于输入关于cGAS蛋白与已知结合cGAS蛋白的化学品的结合的信息的逻辑;

(ii)用于基于cGAS蛋白与已知结合cGAS蛋白的化学品的结合设计候选 cGAS抑制剂的逻辑;

(iii)用于测定关于cGAS蛋白与候选cGAS抑制剂的结合的信息的逻辑;以及

(iv)用于基于步骤(iii)的测定步骤作出关于候选cGAS抑制剂的cGAS抑制特性的结论的逻辑。

在一些实施方案中,本发明提供一种在包括用于通用计算机的信息集合的计算机之间在互联网上传播的电子信号或载波,该计算机具有包括显示单元的用户界面,该信息集合包括含有用于通用计算机的信息集合的计算机可读存储介质,该计算机具有包括显示单元的用户界面,该信息集合包括:

(i)用于输入关于cGAS蛋白与已知结合cGAS蛋白的化学品的结合的信息的逻辑;

(ii)用于基于cGAS蛋白与已知结合cGAS蛋白的化学品的结合设计候选 cGAS抑制剂的逻辑;

(iii)用于测定关于cGAS蛋白与候选cGAS抑制剂的结合的信息的逻辑;以及

(iv)用于基于步骤(iii)的测定作出关于候选cGAS抑制剂的cGAS抑制特性的结论的逻辑。

实施例

以下坐标已经保藏在熟练的技术人员将熟悉的RCSB蛋白质数据库中,并且对应于本文所引用的表1-7。还参见Gao等Cell 153,1094-1107(2013),包括补充材料,其全部内容特此以引用的方式并入本文。此外,在随后的图1-4、7和图8-11的背景下,在2013年5月3日提交的美国临时专利申请号61/819,369的表1-7中呈现的数据特此以引用的方式并入。

表E1

实施例1

晶体结构

蛋白质表达和纯化

编码小鼠cGAS的基因购自Open Biosystems Inc。将对应于cGAS的全长和残基147-507的序列插入至修饰的pRSFDuet-1载体(Novagen)中,其中cGAS通过泛素样蛋白酶(ULP1)裂解位点自先前His

结晶

对于呈游离状态的cGAS(147-507)的结晶,首先将蛋白质稀释成约15mg/ml 并且然后通过使用悬滴蒸汽扩散法在4℃下与等体积储器溶液(0.1M HEPES、0.1 M MgAc

对于cGAS(147-507)-dsDNA二元复合物,通过将蛋白质与16-bp DNA(在任一端处1-nt 5’-突出端:上链5’-AAATTGCCGAAGACGAA-3’;下链5’-TTT CGTCTTCGGCAATT-3’)以1:1.2摩尔比直接混合来制备样品。在20℃下通过悬滴蒸汽扩散法从自1μl的cGAS-dsDNA溶液与1μl的储器溶液(0.1M MES, 8%MPD,pH 6.6)混合的液滴产生晶体。在相同条件下生长与dsDNA的复合物中的Se-蛋氨酸取代的cGAS(147-507)的晶体。

通过以1:1.2摩尔比混合蛋白质与dsDNA来制备cGAS (147-507)-dsDNA-ATP、cGAS(147-507)-dsDNA-GTP以及cGAS (147-507)-dsDNA-3’-dGTP三元复合物,并且然后在室温下在ATP/GTP/3’-dGTP (5mM)和MgCl

通过以1:1.2摩尔比混合蛋白质与dsDNA来制备cGAS (147-507)-dsDNA-GMP+ATP和cGAS(147-507)-dsDNA-GTP+ATP三元复合物,并且然后在室温下与GMP/GTP(5mM)、ATP(5mM)和MgCl

结构确定

通过与5mM硫柳汞在储器溶液中浸泡24小时来产生自由状态的重原子衍生物晶体。在布鲁克黑文国立实验室(Brookhaven National Laboratory)收集呈游离状态(天然和Hg-衍生物两者)和DNA-结合状态(天然和Se-衍生物两者)的cGAS (147-507)的衍射数据集。在阿贡国家实验室(Argonne National Laboratory)的高能光子源(Advanced PhotoSource)(APS)收集所有三元复合物的数据集。使用 HKL2000程序(Otwinowski和Minor,1997)对衍射数据进行索引、整合和缩放。呈游离状态的Hg-取代的cGAS(147-507)和呈DNA结合状态的Se-取代的cGAS (147-507)的结构两者均使用如在程序PHENIX(Adams等,2010)中实施的单波长反常色散方法进行解析。使用程序COOT(Emsley等,2010)进行模型建立并且使用程序PHENIX(Adams等,2010)进行结构精修。用于游离和二元结构的数据收集和精修的统计数据在表S1中示出。使用PHASER(McCoy等,2007)中的分子置换法使用二元结构作为搜索模型来解析所有三元复合物的结构。使用程序 COOT(Emsley等,2010)进行模型建立并且使用程序PHENIX(Adams等,2010) 进行结构精修。数据收集和精修的统计数据在表S2和S3中示出。

表S1

呈游离和DNA结合状态的cGAS的结构的数据收集和精修统计数据

表S2

cGAS和dsDNA与ATP、GTP和3’-dGTP的三元复合物的数据收集和精修统计数据

表S3.

cGAS和dsDNA与GMP+ATP和GTP+ATP的三元复合物的数据收集和精修统计数据

环状GMP-AMP合酶(cGAS)的结构

已经解析了呈游离状态(图1A和8B)的cGAS(构建体147-507)(图8A)的

cGAS与结合的dsDNA的二元复合物的结构

已经共结晶了结合至16-bp互补dsDNA(加在任一端的1-nt 5’-突出端)的 cGAS并且在

cGAS与dsDNA和结合的ATP的三元复合物的结构

共结晶了结合至dsDNA和ATP的cGAS且在

应注意在三元复合物的

cGAS与dsDNA和结合的5’-pppG(2’,5’)pG的三元复合物的结构

共结晶了结合至dsDNA和GTP的cGAS且在

显著地,5’-pppGpG的GpG键联是2’,5’而不是预期的3’,5’,其中第一和第二G残基此外分别采用顺式和反式糖苷扭转取向(图10D)。5’-pppG(2’,5’)pG的三磷酸基团配位至两个阳离子(图3B),其中第一G堆叠在Tyr421上,而第二G 使用其沃森-克里克(Watson-Crick)边缘来与极性侧链(Thr197、Ser366和Ser368) 氢键合,且使用其Hoogsteen边缘来与Arg364氢键合(图3C)。由于在三元复合物的

还生长了具有3’-dGTP的三元复合物的晶体,并且在此复合物的

cGAS与dsDNA和结合的5’-pG(2’,5’)pA的三元复合物的结构

还已经在dsDNA、GMP和ATP存在下共结晶了cGAS,并且在

cGAS与dsDNA和结合的c[G(2’,5’)pA(3’,5’)p]的三元复合物的结构

共结晶了cGAS与dsDNA、GTP和ATP且在

重要地,能够在结合的环状二核苷酸中追踪GpA步骤而无模糊性(可追踪G 的3’-OH)且确立此键联是2’,5’(图11D)。一方面,基于所观察到的密度,在结合的环状二核苷酸中ApG步骤处的键联可以是2’,5’或3’,5’,并且仅基于结构不能确定地分配。已经基于随后概述的证据在ApG步骤处用3’,5’键联进行了精修,并且准备了图4和11的图,其中在GpA步骤处2’,5’键联且在ApG步骤中3’,5’键联。能够基于所观察到的G的2-氨基密度区分G与A,并且注意两者均在结合的环状二核苷酸{c[G(2’,5’)pA(3’,5’)p]}中采用反式排列(图11D)。结合的 c[G(2’,5’)pA(3’,5’)p]的A残基堆叠在Tyr421上(图4B、4C),而结合的 c[G(2’,5’)pA(3’,5’)p]的G残基通过氢键合至Asp213、Asp307和Arg364的侧链锚定在适当位置(图4B、4C)。此外,A和G残基彼此部分堆叠。结合的 c[G(2’,5’)pA(3’,5’)p]的2Fo-Fc电子密度在图4D中示出,其中省略图在图11E中示出。调查三元复合物的催化口袋的结合的c[G(2’,5’)pA(3’,5’)p]的视图在图4E 中示出,其中c[G(2’,5’)pA(3’,5’)p]朝向开口的一端结合。同样未观察到结合的阳离子,鉴于c[G(2’,5’)pA(3’,5’)p]不包含三磷酸,并且G碱基与Asp213和Asp307 直接配位(图4C)。已经使结合的c[G(2’,5’)pA(3’,5’)p]和ATP的结构在其与cGAS 和dsDNA的相应三元复合物中叠加,并且观察到结合的c[G(2’,5’)pA(3’,5’)p]的 A定位在结合的ATP的平面中(图11F)。

突出在GpA步骤处的2’,5’键联和在ApG步骤处的3’,5’键联的 c[G(2’,5’)pA(3’,5’)p]的视图在图4F中示出。注意到在与5’-pG(2’,5’)pA线性产物的三元复合物中,是G碱基堆叠在Tyr421上(图3G和4G),而在与c[G(2’,5’)pA(3’,5’)p]产物的三元复合物中,是A碱基堆叠在Tyr421上(图4C、4H)。因此,线性产物和环状最终产物在催化口袋内采用不同的排列。

实施例2

cGAS活性的生物化学表征

为了验证结构结果,使用薄层色谱法确立活性测定(图12)并且使用纯化的重组全长和截短的cGAS蛋白监测自ATP和GTP的环状二核苷酸 c[G(2’,5’)pA(3’,5’)p]形成。cGAS要求dsDNA和Mg

定量了cGAS在多次转换条件下产生c[G(2’,5’)pA(3’,5’)p]的活性。超过78%(s.d.+/-2.6%,n=5)的所提供的原始ATP和GTP在40分钟内被转化成 c[G(2’,5’)pA(3’,5’)p],从而导致估计的表观速率常数为0.19分钟

为了确定中间体形成的顺序,首先用GMP或GDP取代GTP(图5C)。两种化合物导致相应5’-pG(2’,5’)pA产物和5’-ppG(2’,5’)pA中间体的形成,并且仅 5’-ppG(2’,5’)pA能够进一步反应以产生减少量的环状二核苷酸。ATP被ADP或 AMP取代导致无产物或中间体形成,其中仅ADP(与GTP一起)导致产生降低水平的c[G(2’,5’)pA(3’,5’)p]。

为了确定GTP和ATP的2’或3’-羟基(OH)对于c[G(2’,5’)pA(3’,5’)p]形成的参与,测试了作为cGAS的底物的2’-和3’-脱氧鸟苷三磷酸以及2’和3’脱氧腺苷三磷酸(图5D和13B)。不同于3’-dGTP,2’-dGTP不能形成环状二核苷酸,从而指示需要鸟苷的2’-OH来形成与腺苷的5’位置处的α-磷酸的键联。相比之下, 2’-和3’-dATP均导致显著减少的环状GA-二核苷酸形成,但是2’-dATP+GTP产生显著更多的产物。在两种情况下,观察到5’-pppG(2’,5’)pdA反应中间体的积聚(图5D,泳道2和3),其比所有核糖中间体(5’-pppG(2’,5’)pA,泳道1)稍微更快地迁移。

实施例3

鉴别c[G(2’,5’)pA(3’,5’)p]为通过dsDNA依赖性cGAS活性形成的产物。

在图14中示出的三种异构cGAMP分子c[G(2’,5’)pA(2’,5’)p](在GpA和ApG 步骤处的2’,5’键联)6、c[G(2’,5’)pA(3’,5’)p](在GpA步骤处的2’,5’和在ApG步骤的3’,5’)11和c[G(3’,5’)pA(3’,5’)p](在GpA和ApG步骤处的3’,5’)15的合成和纯化使用先前由琼斯(Jones)实验室报道的工序进行(Gaffney等2010;Gaffney 和Jones,2012)。三种异构cGAMP分子6、11和15(图14)的身份使用通过键的连接从异核NMR分析验证。c[G(2’,5’)pA(3’,5’)p]的实验NMR数据在图15中概述,其中所有三种异构GMP分子的质子和碳化学位移在表S4中列出。

使用反相高效液相色谱法(HPLC)对通过dsDNA依赖性cGAS活性产生的产物进行了分析,并且将其洗脱曲线与化学合成的c[G(3’,5’)pA(3’,5’)p]、 c[G(2’,5’)pA(2’,5’)p]和c[G(2’,5’)pA(3’,5’)p]化合物进行比较(图6A和13D)。突出峰始终精确地在23.5分钟从HPLC系统洗脱,其对应于c[G(2’,5’)pA(3’,5’)p]的洗脱曲线。与c[G(3’,5’)pA(3’,5’)p]或c[G(2’,5’)pA(2’,5’)p]共注射证明cGAS反应产物不会共洗脱,不同于与化学合成的c[G(2’,5’)pA(3’,5’)p]共注射。

为了证明体外产生的环状二核苷酸匹配晶体学上确定的分子,通过HPLC分析了已经与DNA、ATP和GTP共孵育的溶解的cGAS晶体(图6B)。观察到对应于c[G(2’,5’)pA(3’,5’)p]的峰,不同于如之前c[G(2’,5’)pA(2’,5’)p]共注射的参考分子。还观察到更长保留时间的另外未鉴别的峰。可假定,尽管在HPLC分析之前洗涤晶体,但来源于结晶缓冲液和/或添加剂的这些未鉴别的化合物未完全除去。

此外,通过HPLC纯化cGAS产生的c[G(2’,5’)pA(3’,5’)p]并且使其经受一维 NMR分析。其在糖H1’区域中的NMR光谱与化学合成的标准品 c[G(2’,5’)pA(3’,5’)p]的NMR光谱相同且不同于化学合成的c[G(2’,5’)pA(2’,5’)p] 和c[G(3’,5’)pA(3’,5’)p](图6C)。因此,HPLC(图6A)和NMR(图6C)两者独立地验证由cGAS产生的产物是c[G(2’,5’)pA(3’,5’)p]。

实施例4

cGAS突变蛋白的功能分析

接着测定cGAS上的突变在其体外形成c[G(2’,5’)pA(3’,5’)p]且刺激细胞中的 I型干扰素途径的能力方面的生物化学和功能后果。产生了对应于共晶体结构揭示的参与dsDNA结合或cGAS活性的氨基酸残基的丙氨酸取代突变体。对于体外cGAS活性测定,产生且纯化了六种重组突变cGAS形式;四种被预测消除 dsDNA结合且两种点突变蛋白在潜在关键催化残基处被丙氨酸取代。对于除两种突变体(R161A,S199A,图7A)之外的所有来说,将DNA与突变cGAS蛋白一起孵育导致很少或无c[G(2’,5’)pA(3’,5’)p]形成。

为了评估对细胞中的cGAS功能的影响,产生了cGAS的另外丙氨酸突变体以用于在哺乳动物细胞中表达。将全长cGAS突变体连同STING和IFN-β荧光素酶报道基因在HEK 293细胞中瞬时表达。在此测定中,cGAS通过共转染的 DNA质粒接合,并且WT cGAS表达导致相较于对照质粒接近15倍增强的荧光素酶活性(图7B)。DNA结合残基的单一突变(包括负责仅与DNA碱基直接相互作用的Arg161)不足以损害cGAS活性。然而,与任一DNA链中的两个或三个连续磷酸二酯相互作用的消除(图1C,9B-C)导致减少或完全消除cGAS功能(图 7B)。在催化位点处,影响二价阳离子的结合的单一突变体Glu211、Asp213或 Asp307(图2E、3B)全部导致非功能性cGAS(图7C)。此外,消除cGAS活性要求参与(i)ATP(或GTP)γ磷酸酯的结合(Lys402、Ser420;图2E、3B)、(ii)ATP 腺苷的结合(Glu371、Lys424;图2F)或(iii)ATP与c[G(2’,5’)pA(3’,5’)p]的碱基堆叠(Arg364、Tyr 421;图2F、4B)的两个氨基酸残基的突变,而这些残基的单一突变体仅略微损害cGAS功能(图7C)。Gly198和Ser199是发现在配体结合时经历显著构象变化的高度保守型残基(图1F、2D)。然而,单一突变G198A和S199A 未严重损害cGAS功能,但这些位置的双重突变体不是功能性的(图13E)。类似地,高度可移动的Gly198转化成空间受限的脯氨酸消除cGAS活性(图13E)。

实施例5

关于构象转变、键形成和中间体的研究

在复合物形成时cGAS中的构象转变

结构研究突出了以下事实:cGAS在结合dsDNA时经历显著构象变化(图 1D),其中其重定位催化残基Glu211、Asp213、Asp307以及Ser199(图1E、1F),而同时开口接近催化口袋(图1G、1H)。本质上,cGAS仅在接合dsDNA时采用催化感受态构象,从而说明其作为细胞溶质dsDNA传感器的作用。相比之下,当从cGAS和dsDNA的二元复合物前进至与ATP(图2B-D)和GTP的三元复合物时观察到受限于Glu211的侧链的仅最小构象变化(其中口袋含有途径外中间体 5’-pppG(2’,5’)G;图10A-C),其中在与ATP+GTP形成三元复合物时未观察到甚至Glu211的侧链的变化(其中口袋含有产物c[G(2’,5’)pA(3’,5’)p];图11A-C)。

催化口袋中的磷酸二酯键形成

结构和功能实验两者均确立在不存在任何另外组分的情况下,在dsDNA结合至cGAS之后催化口袋中的磷酸二酯键形成。在存在dsDNA和GTP情况下关于cGAS的结构研究鉴别了线性反应中间体5’-pppG(2’,5’)pG的积聚(图3B、3C),而在存在GMP和ATP的情况下鉴别了线性反应产物5’-pG(2’,5’)pA的积聚。虽然不希望受任何具体理论束缚,但据信前者中间体是途径外的并且因此损害用于形成环状产物的第二磷酸二酯键的形成,鉴于第一G是顺式,并且在第二G的 2’-OH(或3’-OH)与三磷酸部分的α-磷酸之间的距离较长。然而,这些结果表明 c[G(2’,5’)pA(3’,5’)p]的形成很可能以逐步方式发生,从而涉及形成随后的磷酸二酯键以产生环状二核苷酸产物。相比之下,在存在dsDNA、GTP和ATP的情况下关于cGAS的结构研究导致形成c[G(2’,5’)pA(3’,5’)p](图4B、4C),而无中间体的积聚并且与涉及一对随后磷酸二酯键的形成的途径上反应一致。

结合的c[G(2’,5’)pA(3’,5’)p]的G和A残基的定位

c[G(2’,5’)pA(3’,5’)p]的G和A残基在与cGAS和dsDNA的三元复合物的结构中采用不同位置。结合的c[G(2’,5’)pA(3’,5’)p]的A残基堆叠在Tyr421上(图 4B)并且占据ATP复合物中的腺嘌呤环的位置(图2F)以及5’-pppG(2’,5’)pG(图3C) 和5’-pG(2’,5’)pA(图3G)复合物中的第一碱基。结合的c[G(2’,5’)pA(3’,5’)p]的A 残基不参与任何分子间氢键并且因此能够潜在被甚至嘧啶(C或U)残基置换。相比之下,结合的c[G(2’,5’)pA(3’,5’)p]的G残基(其部分堆叠在A残基上)形成涉及其沃森-克里克和Hoogsteen边缘的分子间氢键的网络(图4B、4C)并且不能被其他三种碱基(C、A和U)中的任一种置换。因此,cGAS结合口袋具有在G与A 之间区分的不同识别元件并且因此可以独特取向结合c[G(2’,5’)pA(3’,5’)p]。

与晶体学数据一致,生物化学结果指示GTP的较强偏好,这与在cGAS与此碱基之间的结构中观察到的精细氨基酸相互作用一致。单独孵育cGAS与GTP 以及GTP加CTP或UTP可导致环状二核苷酸形成(图13C)。虽然单独ATP不产生任何环状或中间体产物,但与UTP孵育导致一些环状产物形成,从而表明UTP 还可取代GTP,但以大大降低的反应速率。总之,这些发现指示cGAS相较于第一尿苷对于第二核苷酸具有更宽松的需求。

线性5’-pG(2’,5’)pA和环状c[G(2’,5’)pA(3’,5’)p]产物的结构比较

观察到途径下线性5’-pG(顺式)(2’,5’)pA(反式)产物(图3F、3G)与环状 5’-pG(反式)(2’,5’)A(反式)产物(图4B、4C)之间催化口袋内的排列的显著差异。在前者情况下,是G碱基堆叠在Tyr421上(图3G),而在后者情况下是A碱基堆叠在Tyr421上(图4C)。将两种排列进行立体比较,其中线性5’-pG(2’,5’)pA在图4G中示出且环状c[G(2’,5’)pA(3’,5’)p]在图4H中示出。这意味着在环化反应之前中间体可能必须通过催化口袋内的完全翻转来重排其取向。这可能不是太出人意料的,因为从内衬催化口袋的三种碱性氨基酸(Glu211、Asp213和Asp307) 和一种极性氨基酸(Ser199)判断,仅存在一组单一催化残基并且因此在第一磷酸二酯键形成之后,中间体可能必须重新排列以便有助于第二磷酸二酯键形成以完成环化。

磷酸二酯键

导致鉴别环状GAMP作为由细胞质dsDNA传感器cGAS产生的第二信使的早期研究中的明确假设(Sun等2013;Wu等2013)是两个磷酸二酯键均具有3’,5’性质。此类3’,5’键联先前已经在结合至STING(Yin等2010;Ouygang等2012; Huang等2012;Shu等2012)和核糖开关(Smith等2009;Kulshina等2009)二者的细菌第二信使c-二-GMP的结构中观察到。然而,所利用的质谱方法(Wu等2013) 不能在3’,5’与2’,5’键联之间针对环状GAMP的一个或两个磷酸二酯键进行区分。

2’,5’键联的第一指示自cGAS、dsDNA和GTP的结构出现,其中在催化口袋中形成的途径外产物展示5’-pppG(2’,5’)pG键联(图3B、3C)。此外,在cGAS、 dsDNA和GMP+ATP的结构中观察到pG(2’,5’)pA(图3F、3G)。更重要地,还观察到针对cGAS、dsDNA和GTP+ATP的结构中的催化口袋中结合的 c[G(2’,5’)pA(3’,5’)p]产物的GpA步骤的2’,5’键联(图4B、4C)。

初始生物化学分析指示GTP与ATP之间的2’,5’键联首先发生,在腺苷环化回至鸟苷之前。此证据由以下观察结果进一步支持:将2’-dATP与2’-dGTP一起孵育不能反应以形成任何环状反应产物(图13)。在第二步骤中,通过腺苷的2’或3’OH形成环状二核苷酸可甚至在其他位置通过除去氧而封闭时进行,但是存在针对利用2’-dATP的可观察到的偏好。在任一情况下环状二核苷酸产生是效率非常低的,从而表明两个位置均可能参与有效的磷酸水解和环化的过渡态的形成。此令人困惑的结果与涉及从腺苷连接至鸟苷的三元结构数据组合促进进一步检查cGAS是否将最终具有针对产生用于环化的2’,5’或3’,5’连接的偏好。

观察到作为dsDNA-依赖性cGAS活性的产物的单个HPLC峰,其不同于两种环状-GA二核苷酸参考分子(2’,5’键联两者或3’,5’键联两者)且与 c[G(2’,5’)pA(3’,5’)p]一致(图6A)。此结论从独立NMR研究得以验证(图6C)。虽然环状二核苷酸的生物学产生似乎从原核生物至真核生物在进化上是保守的,但基于化学键联的其形成是不同的。在cGAS的情况下,c[G(2’,5’)pA(3’,5’)p]的形成似乎类似于由OAS产生的2’,5’寡腺苷酸,而且类似于由细菌环化酶产生的 3’,5’二核苷酸键联(Sadler和Williams,2008;Kodym等2009;Donovan等2013)。

c[G(2’,5’)pA(3’,5’)p]中2’,5’(GA步骤)和3’,5’(AG步骤)键联的潜在益处

尚不清楚cGAS为何优选产生2’,5’(GpA步骤)和3’,5’(ApG步骤)环状GA- 二核苷酸。2’,5’磷酸二酯键不常见且很少核酸酶已知能够水解此类键联(Kubota 等2004)。不希望受任何具体理论束缚,2’,5’键联可促进细胞中的更大稳定性以实现第二信使的有效转导,但3’,5’键联可有助于其通过多种常规内切核酸酶分解以防止延长的干扰素应答。总之,结构和功能研究已经鉴别了后生动物cGAMP 的化学性质,从而突出2’,5’键联在活化I型干扰素途径的第二信使中的作用。

cGAS dsDNA结合突变体的影响

结构研究已经鉴别了在形成cGAS-dsDNA复合物时的分子间蛋白质-DNA 接触(图1C)。因为这些主要具有静电性质且涉及DNA磷酸二酯主链的非特异性识别,所以它们已被分类成三组三重突变体,其中体外测定(图7A)和细胞测定(图 7B)确立针对S165A、N172A、K372A三重突变体,N196A、Y200A、K372A三重突变体以及R158A、R161A、K395A三重突变体的刺激干扰素产生的活性和能力的完全丧失,以及针对S165A、N172A、Y200A三重突变体的活性的部分丧失。这加强cGAS与dsDNA之间的复合物形成对于cGAS的催化活性的重要性。

cGAS催化口袋突变体的影响

cGAS和dsDNA与结合的NTP的三元复合物的结构研究已经鉴别了Glu211、 Asp213、Asp307作为磷酸二酯键形成的重要催化残基。所有三种催化性酸性残基在被Ala置换之后是功能上死亡的,如在体外测定(图7A;Glu211A)或细胞测定(图7C,所有三种催化残基)中所观察到,而S199A突变保留基本活性。Tyr421 参与与A的堆叠相互作用,而Arg364与cGAMP三元复合物中的G氢键合(图 4B、4C)。Y421A、R364A的双重突变导致细胞测定中大部分活性的丧失(图7C)。

二价阳离子的作用

dsDNA结合的cGAS与配体的三元复合物的结构研究已经显示ATP(图2E、 2F)和5’-pppG(2’,5’)pG(图3B、3C)的三磷酸部分配位至一对阳离子(暂时分配至 Mg

与细胞质dsRNA传感器OAS1的比较

在贡献的平行研究中,结构研究和生物化学测定最近已经报道关于dsRNA 传感器人寡腺苷酸合成酶1(OAS1)的表征,其将ATP聚合成线性2’,5’-连接的寡腺苷酸(Donovan等2013)。晶体学研究明确地证明在从游离状态(Hartmann等 2003)前进至与结合的dsRNA和2’-dATP的三元复合物(Donovan等2013)时OAS1 中的构象转变,其遵循与在针对cGAS与dsDNA和结合的配体的复合物形成的此研究中所观察到的那些类似的模式。因此,OAS1的三个催化Glu残基在形成与dsRNA和2’-dATP的三元复合物时紧邻,从而产生用于结合两个Mg

除了以上提及的类似性之外,还存在cGAS dsDNA传感器(本研究)与OAS1 dsRNA传感器(Donovan等2013)之间蛋白质-核酸识别原理的差异,因为cGAS 靶向dsDNA双链体的中心区段内的dsDNA的糖-磷酸酯主链(图1C),而OAS1 通过接触分离

此外,由OAS1介导的线性2’,5’-连接的异-RNA的形成与由cGAS形成含有在GpA步骤处的2’,5’键联的c[G(2’,5’)pA(3’,5’)p]并行。因此,不同于如先前针对细菌第二信使c-二-GMP所观察到的对3’,5’键联的早期唯一强调(在Romling 等2013中综述),突出后生动物第二信使c[G(2’,5’)pA(3’,5’)p]利用涉及在GpA 步骤处的2’,5’和在ApG步骤处的3’,5’的混合键联。

cGAS含有用于逐步磷酸二酯键形成的单个活性位点

先前研究已经确立双鸟苷酸环化酶PleD形成头对尾同二聚体以形成在其界面的反应中心,以使得中间体在形成c-二-GMP的途径中不需要改变其取向(Chan 等2004)。相比之下,在cGAS、dsDNA和结合的配体的三元复合物的当前研究中,未观察到针对呈晶体形式的二聚体或更高级寡聚体形成的证据。此外,结构中的配体结合口袋被包埋在cGAS拓扑内并且不位于表面上,如在PleD中一样 (Chan等2004)。

确实,cGAS含有用于随后磷酸二酯键形成步骤的单个活性位点,鉴于配体是GTP和ATP并且首先形成的GpA键联是2’-5’且其次形成的ApG键联是3’,5’的非常显著的特征,从而导致c[G(2’,5’)pA(3’,5’)p]的产生。不希望受任何具体理论束缚,在图7D中概述了用于在dsDNA结合的cGAS的单个催化口袋内从GTP 和ATP形成c[G(2’,5’)pA(3’,5’)p]的模型。在此模型中,第一步涉及形成5’-pppGpA 中间体,接着在第二步形成c[G(2’,5’)pA(3’,5’)p]。还应注意结合的配体据信在 c[G(2’,5’)pA(3’,5’)p]形成的途径上经历两次翻转。

二核苷酸环化酶DncV的影响

在早期研究中,细菌二核苷酸环化酶DncV显示产生环状GMP-AMP (cGAMP)(Davies等2012)。关于cGAMP的形成的此第一报道提出关于此细菌系统中的一对磷酸二酯键的性质的令人感兴趣的问题。

实施例6

合成的cGAMP键联异构体的NMR光谱分析

将冻干的cGAMP键联异构体溶解于10mM K

实施例7

薄层色谱法(TLC)分析

用于TLC测定的寡核苷酸的制备

用于cGAS核苷酸转移酶活性的生物化学测定的寡核苷酸在表S6中列出。使用3400DNA合成仪(Applied Biosystems)内部合成寡脱氧核苷酸,寡核糖核苷酸是商购的(Dharmacon)。将双链DNA、RNA和DNA/RNA双链体在70mM Tris-HCl pH 7.6、10mM MgCl

c[G(2’,5’)pA(3’,5’)p]形成的TLC分析

将纯化的重组全长(fl,氨基酸1-507)和截短的(tr,氨基酸147-507)鼠cGAS (包括截短的突变体型式1-6)在含有以下的20μL反应中在37℃下孵育40分钟: 1μM cGAS、3.3μM dsDNA、5mM MgCl

实施例8

cGAS反应产物的定量

在从HPLC纯化之后,使用FIJI(ImageJ 1.47i)或光谱光度计(在260nm下的吸光度,E

实施例9

用于高效液相色谱法分析的cGAS反应产物的制备

将体外产生的c[G(2’,5’)pA(3’,5’)p]反应产物或洗涤且溶解的cGAS晶体用 25单位的全能核酸酶(Benzonase)(Novagen,目录号70746,纯度>90%)在37℃下处理30分钟,在95℃下热灭活10分钟,然后在21,000g下离心15分钟(Sorvall Legend Micro 21R,Thermo Scientific);将上清液用于HPLC分析。使有或无3-8 纳摩尔的化学合成的所有3’,5’cGAMP、所有2’,5’cGAMP或c[G(2’,5’)pA(3’,5’)p] 的反应产物经受使用C18柱(25cm×4.5mm,5μM孔,Supelco Analytical)的反相HPLC分析(AKTA Purifier,GE Healthcare)。通过UV 260和280nm检测分析物。使用0%-10%溶剂B(2个柱体积)、10%-50%溶剂B(2个柱体积)两步线性梯度;溶剂A(乙酸三乙铵:乙腈:H

用于1D NMR分析的cGAS反应产物的制备

在通过HPLC分级分离之前,将100μl的体外产生的c[G(2’,5’)pA(3’,5’)p] 反应产物如之前经全能核酸酶和热处理。进行三次连续HPLC运行(两次40μl 和一次20μl反应注射)并且将对应于c[G(2’,5’)pA(3’,5’)p]的峰收集至15ml falcon管(总计大约4.5ml)中。通过在室温下真空离心(Vacufuge,Eppendorf)3天直到完全干燥来完成溶剂除去。

实施例10

细胞测定

cGAS点突变的产生

将鼠cGAS CDS插入至修饰的pMAX克隆载体(Amaxa,Cologne,Germany) 中。使用Quikchange方法(Agilent,Santa Clara,CA)使用Pfu Ultra热启动DNA聚合酶(Agilent)或KOD热启动DNA聚合酶(Merck,Darmstadt,Germany)进行定点诱变。将鼠STING CDS和萤火虫荧光素酶(Promega,Madison,WI)克隆至EF1- 启动子修饰的pLenti6(Invitrogen,Carlsbad,CA)表达质粒中。pGL3 IFN-βGluc报道基因获自Brian Monks(Institute ofInnate Immunity,University of Bonn, Germany)。通过对CDS测序来验证所有构建体。

荧光素酶测定

将3×10

实施例11

环状GA-二核苷酸的合成

使用由琼斯实验室先前报道的工序(Gaffney等2010;Gaffney和Jones 2012) 进行所有2’,5’-cGAMP(6,图14)、c[G(2’,5’)pA(3’,5’)p](11,图14)和所有 3’,5’-cGAMP(15,图14)的制备。向溶解于5mL的CH

将此过程再重复两次,最后一次留下A H-磷酸酯2或8,2mL。向此溶液中添加于3mLCH

将含有5、10或14的有机层合并且浓缩成油状物。对于14,将油状物溶解于5mLCH

在具有光电二极管阵列检测器的Waters 2965系统上,使用Atlantis C18柱,

实施例12

通过cGAMP化合物STING-依赖性诱导鼠α-干扰素和人CXCL10(参见图 16A-16D)。

THP-1培养和测定条件

在具有10%FBS、丙酮酸钠和青霉素/链霉素(Gibco,Life Technologies)的RPMI1640中培养THP-1细胞。将8×104个细胞/96孔涂铺于100μl的培养基中且在37℃/5%CO2下平衡2小时。为了产生巨噬细胞样细胞,将8×104个THP-1 细胞用10ng/ml PMA(Sigma)分化过夜,改变培养基且将细胞在刺激之前孵育另外24小时。

BMDM培养和测定条件

从C57BL/6小鼠的股骨冲洗骨髓源性巨噬细胞(BMDM)。裂解红细胞 (PharmLyse,BD Biosciences)并且将1×107个细胞/皮氏培养皿(Petri dish)在DMEM 10%FBS、丙酮酸钠和青霉素/链霉素(Gibco,Life Technologies)与30% L929-上清液中孵育7天。将细胞用PBS 2mM EDTA收获且以1×105个细胞/96- 孔的密度涂铺。将BMDM在所指示的cGAMP浓度存在下经洋地黄皂苷透化或对照处理30分钟,然后补充新鲜培养基。在18小时之后取得上清液并且通过 ELISA测定细胞因子。

细胞透化/刺激

如先前所描述(Woodward等,2010)进行用于递送环状二核苷酸的细胞透化。简言之,除去上清液且将细胞用50μl Perm-缓冲液(50mM HEPES pH 7.0,100 mM KCl,3mMMgCl2,1mM ATP,0.1mM GTP,0.1mM DTT,85mM蔗糖, 0.2%BSA)+/-10μg/ml洋地黄皂苷和cGAMP异构体的连续稀释液覆盖,接着在 37℃下孵育30分钟。然后除去Perm-缓冲液并且将细胞用100μl的预先加热的培养基覆盖。相较于未处理的,透化细胞的存活力>50%,如通过光学显微镜和细胞滴度蓝(Cell Titer Blue)(Roche)所监测。

在刺激之后16小时收集上清液且分别通过ELISA和HEK-BlueTMIFN-α/β生物测定测定细胞因子。

ELISA

根据制造商的建议通过ELISA(BD Opteia人IP-10ELISA-Set)测定人 CXCL-10。通过夹心-ELISA测定鼠Ifna:单克隆大鼠抗Ifna(克隆RMMA-1)用作捕获抗体,重组Ifna用作标准品且针对Ifna的多克隆大鼠血清用于检测(全部来自PBL Interferon Source,Piscataway NJ,USA),接着抗兔HRP(Bio-Rad)。

剂量反应曲线的拟合

用Graph Pad Prism(Graph Pad Software,La Jolla CA,USA)分析4-参数S形剂量反应曲线和EC50值。

表S4.cGAMP的质子和碳化学位移质子化学位移列表

碳化学位移列表

表S5.用于Quickchange诱变PCR(Metabion,Martinsried,D)的引物:

表S6.用于TLC分析的寡核苷酸:

加粗和加下划线的核苷酸表示用于分开产生的修饰的寡核苷酸的8-氧代鸟苷。寡核苷酸经3400DNA合成仪(Applied Biosystems)内部合成或商购的 (Dharmacon)。

参考文献

Adams,P.D.,Afonine,P.V.,Bunkoczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,et al.(2010).PHENIX:acomprehensive Python-based system for macromolecular structure solution.ActaCrystallogr.D Biol.Crystallogr.66,213-221.

Burckstummer,T.,Baumann,C.,Blumi,S.,Dixit,E.,Durnberger,G.,Jahn,H.,Planyavsky,M.,Bilban,M.,Colinge,J.,Bennet,K.L.et al.(2009).An orthogonalproteomic- genomic screen identifies AIM2 as a cytoplasmic DNA sensor for theinflammasome.Nat. Immunol.10,266-272.

Chan,C.,Paul,R.,Samoray,D.,Amiot,N.C.,Giese,B.,Jenal,U.and Schirmer,T.(2004).Structural basis of activity and allosteric control of diguanylatecyclase.Proc.Natl. Acad.Scis.USA.101,17084-17089.

Davies,B.W.,Bogard,R.W.,Young,T.S.,and Mekalanos,J.J.(2012).Coordinated regulation of accessory genetic elements preduces cyclic di-nucleotides for V. cholerae virulence.Cell 149,358-370.

Donovan,J.,Dufner,M.,and Korennykh,A.(2013).Structural basis forcytosolic double-stranded RNA surveillance by human oligoadenylate synthetase1.Proc.Natl.Acad.Sci. USA 110,1652-1657.

Egli,M.,Gessner,R.V.,Williams,L.D.,Quigley,G.J.,van der Marel,G.A.,van Boom,J.H.,Rich,A.,and Frederick,C.A.(1990).Atomic-resolution structure ofthe cellulose synthase regulator cyclic diguanylicacid.Proc.Natl.Acad.Sci.USA 87,3235-3239.

Emsley,P.,Lohkamp,B.,Scott,W.G.,and Cowtan,K.(2010).Features anddevelopment of Coot.Aeta Crystallogr.D Biol.Crystallogr.66,486-501.

Fernandes-Alnemri,T.,Yu,J.W.,Datta,P.,Wu,J.,and Alnemri,E.S.(2009).AIM2 activates the inflammasome and cell death in response to cytoplasmicDNA.Nature 458, 509-513.

Gaffney,B.L.,and Jones,R.A.(2012).One-flask syntheses of cyclicdiguanosine monophosphate(c-di-GMP).Current Protocols in Nacleic AcidChemistry 14,14.18.11- 14.18.17.

Gaffney,B.L.,Veliath,E.,Zhao,J.,and Jones,R.A.(2010).One-flasksyntheses of c-di-GMP and the[Rp,Rp]and[Rp,Sp]thiophosphate analogues.OrgLett 12,3269-3271.

Hartmann,R.,Justesen,J.,Sarkar,S.N.,Sen,G.C.,and Yee,V.C.(2003).Crystal structure of the 2′-snecific and double-stranded RNA-activatedinterferon-induced antiviral protein 2′-5′-oligoadenylate synthetase.Mol.Cell12,1173-1185.

Higashida,H.,Hossain,K.Z.,Takahagi,H.,and Noda,M.(2002).Measurementof adenylyl cyclase by separating cyclic AMP on silica gel thin-layerchromatography.Anal. Biochem.308,106-111.

Hornung,V.,Ablasser,A.,Charrel-Dennis.M.,Bauernfeind,F.,Horvath,G.,Caffrey,D.R.,Latz,E.,and Fitzgerald,K.A.(2009).AIM2 recognizes cytosolicdsDNA and forms a caspase-l-activating inflammasome with ASC.Nature 458,514-518.

Hornung,V.,and Latz,E.(2010).Intracellular DNA recognition.Nat.Rev.Immunol.10,123-130.

Huang,Y.H.,Liu,X.Y.,Du,X.X.,Jiang,Z.F.,and Su,X.D.(2012).Thestructural basis for the sensing and binding of cyclic di-GMP by STING.NatStruct Mol Biol 19, 728-730.

Huffman,J.L.and Brennan,R.G.(2002).Prokaryotic transcriptionregulators: more than juust the helix-turn-helix motif.12,98-106.

Ishikawa,H.,and Barber,G.N.(2008).STING is an endoplasmic reticulumadaptor that facilitates innate immune signalling.Nature 455,674-678.

Jin,L.,Waterman,P.M.,Jonnscher,K.R.,Short,C.M.,Reisdorph,N.A.,andCambier,J.C.(2008).MPYS,a novel membrane tetraspanner,is associated withmajor histocompatibility complex class II and mediates transduction ofapoptotic signals.Mol.Cell Biol.28,5014-5026.

Jin,T.,Perry,A.,Jiang,J.,Smith,P.,Curry,J.A.,Unterholzner,L.,Jiang,Z., Horvath,G.,Rathinam,V.A,Johnstone,R.W.,et al.(2012).Structures of the HINdomain:DNA complexes reveal ligand binding and activation mechanisms of theAIM2 inflammasome and IFI16 receptor.Immunity 36,561-571.

Keating,S.E.,Barann,M.,and Bowie,A.G.(2011).Cytosolic DNA sensorsregulating type I interferon induction.Trends Immunol.32,574-581.

Kerur,N.,Veettil,M.V.,Sharma-Walia,N.,Bottero,V.,Sadagopan,S.,Otageri, P.,and Chandran,B.(20l1).IFI16 acts as a nuclear pathogen sensor toinduce the inflammasome in response to Kaposi Sarcoma-associated herpesvirusinfection.Cell Host Microbe 9,363-375.

Kodym,R.,Kodym,E.,and Story,M.D.(2009).2′-5′-Oligoadenylatesynthetase is activated by a specific RNA sequence motif.Biochem.Biophys.Res.Commun.388,317-322.

Krasteva,P.V.,Giglio,K.M.,and Sondermann,H.(2012).Sensing themessenger:the diverse ways that bacteria signal through c-di-GMP.ProteinSci.21,929-948.

Kubota,K.,Nakahara,K.,Ohtsuka,T.,Yoshida,S.,Kawaguchi,J.,Fujita,Y.,Ozeki,Y.,Hara,A.,Yoshimura,C.,Furukawa,H.et al.Identification of 2’-phophodiesterase, which plays a role in 2-5A system reulated byinterferon.J.Biol.Chem,279,37832-37841.

Kulshina,N.,Baird,N.J.,and Ferre-D′Amare,A.R.(2009)Recognition of thebacterial second messenger cyclic diguanylate by its cognateriboswitch.Nat.Struct.Mol.Biol. 16,1212-1217.

Lee,E.R.,Baker,J.L.,Weinberg,Z.,Sudarsan,N.,and Breaker,R.R.(2010).Anallosteric self-splicing ribozyme triggered by a bacterial secondmessenger.Science 329,845- 848.

Lunde,B.M.,Moore,C.and Varani,G.(2007).RNA-binding proteins:modulardesign for efficient funetion.Nat.Rev.Mol Cell.Biol.8,479-490

McCoy,A.J.,Grosse-Kunstleve,R.W.,Adams,P.D.,Winn,M.D.,Storoni,L.C.,and Read,R.J.(2007).Phaser crystallographic software.J.Appl.Crystallogr.40,658-674.

O′Neill,L.A.(2013).Immunology.Sensing the dark side ofDNA.Science339, 763-764.

Otwinowski,Z.,and Minor,W.(1997).Processing of X-ray Diffraction DataCollected in Oscillation Modc.Methods in Enzymology 276,307-326.

Ouyang,S.,Song,X.,Wang,Y.,Ru,H.,Shaw,N.,Jiang,Y.,Niu,F.,Zhu,Y., Qiu,W.,Parvatiyar,K.,et al.(2012).Structural analysis of the STING adaptorprotein reveals a hydrophobic dimer interface and mode of cyclic di-GMPbinding.Imumunity 36,1073-1086.

Romling,U.,Galperin,M.Y.,and Gomelsky,M.(2013).Cyclic di-GMP:theFirst 25Years of a Universal Bacterial Second Messenger.Microbiol.Mol.Biol.Rev.77,1-52.

Ross,P.,Weinhouse,H.,Aloni,Y.,Michaeli,D.,Weinberger-Ohana,P.,Mayer,R.,Braun,S.,de Vroom,E.,van der Marel,G.A.,van Boom,J.H.,et al.(1987).Regulation of cellulose synthesis in Acetobacter xylinum by cyclicdiguanylic acid.Nature 325,279-281.

Sadler,A.J.,and Williams,B.R.(2008).Interferon-inducible antiviraleffectors. Nat.Rev.Immunol.8,559-568.

Schirmer,T.,and Jenal,U.(2009).Structural and mechanisticdeterminants of c- di-GMP signalling.Nat.Rev.Microbiol.7,724-735.

Shu,C.,Yi,G.,Watts,T.,Kao,C.C.,and Li,P.(2012).Structure of STINGbound to cyclic di-GMP reveals the mechanism of cyclic dinucleotiderecognition by the immune system.Nat.Struct.Mol.Biol.19,722-724.

Smith,K.D.,Lipchock,S.V.,Ames,T.D.,Wang,J.,Breaker,R.R.,and Strobel,S.A.(2009).Structural basis of ligand binding by a c-di-GMPriboswitch.Nat.Struct.Mol.Biol. 16,1218-1223.

Sudarsan,N.,Lee,E.R.,Weinberg,Z.,Moy,R.H.,Kim,J.N.,Link,K.H.,andBreaker,R.R.(2008).Riboswitches in eubacteria sense the second messengercyclic di-GMP. Science 321,411-413.

Sun,L.,Wu,J.,Du,F.,Chen,X.,and Chen,Z.J.(2013).Cyclic GMP-AMPsynthase is a cytosolic DNA sensor that activates the typeI interferonpathway.Sciernce 339, 786-791.

Sun,W.,Li,Y.,Chen,L.,Chen,H.,You,F.,Zhou,X.,Zhou,Y.,Zhai,Z.,Chen, D.,and Jiang,Z.(2009).ERIS,an endoplasmic reticulum IFN stimulator,activatesinnate immune signaling throngh dimerization.Proc.Natl.Acad.Sci.USA 106,8653-8658.

Takaoka,A.,Wang,Z.,Choi,M.K.,Yaanai,H.,Negishi,H.,Ban,T.,Lu,Y.,Miyagishi,M.,Kodama,T.,Honda,K.,et al.(2007).DAI(DLM-1/ZBP1)is a cytosolicDNA sensor and an activator of innate immune response.Naature 448,501-505.

Unterholzner,L.,Keating,S.E.,Baran,M.,Horan,K.A.,Jensen,S.B.,Sharma,S., Sirois,C.M.,Jin,T.,Latz,E.,Xiao,T.S..et al.(2010).IFI16 is an innateimmune sensor for intracellular DNA.Nat.Immunol.11,997-1004.

Wolkowicz,U.M.,and Cook,A.G.(2012).NF45 dimerizes with NF90,Zfr andSPNR via a conserved domain that has a nucleotidyltransferase fold.NucleicAcids Res.40, 9356-9368.

Woodward,J.J.,Iavarone,A.T.,and Portnoy,D.A.(2010).c-di-AMP Secretedby Intracellular Listeria monocytogenes Activates a Host Type I InterferonResponse.Science(New York,N.Y 328,1703-1705.

Wu,J.,Sun,L.,Chen,X.,Du,F.,Shi,H.,Chen,C.,and Chen,Z.J.(2013).CyclicGMP-AMP is an endogenous second messenger in innate immune signaling bycytosolic DNA. Science 339,826-830.

Yang,P.,An,H.,Liu,X.,Wen,M.,Zheng,Y.,Rui,Y.,and Cao,X.(2010).Thecytosolic nucleic acid sensor LRRFIP1 mediates the production of type Iinterferon via a beta- catenin-dependent pathway.Nat.Immunol.11,487-494.

Yin,Q.,Tian,Y.,Kabaleeswaran,V.,Jiang,X.,Tu,D.,Eck,M.J.,Chen,Z.J.,andWu,H.(2012).Cyclic di-GMP sensing via the innate immune signaling proteinSTING.Mol. Cell 46,735-745.

Zhang,Z.,Yuan,B.,Bao,M.,Lu,N.,Kim,T.,and Liu,Y.J.(2011).The helicaseDDX41senses intracellular DNA mediated by the adaptor STING in dendriticcells.Nat. Immunol.12,959-965.

Zhong,B.,Yang,Y.,Li,S.,Wang,Y.Y.,Li,Y.,Diao,F.,Lei,C.,He,X.,Zhang,L.,Tien,P.,et al.(2008).The adaptor protein MITA links virus-sensingreceptors to IRF3 transcription factor activation.Immunity 29,538-550.

本领域的技术人员将认识到,或仅使用常规实验就能够确定本文所述的根据本发明的具体实施方案的许多等效物。本发明的范围并不意图限于以上描述,而是如所附权利要求书所阐述。

在权利要求中,除非相反指出或另外从上下文明显看出,否则冠词如“一个 (a)”、“一种(an)”以及“所述(the)”可意指一个或多于一个。除非相反指出或另外从上下文明显看出,否则如果一个、多于一个或所有组成员存在于、用于或以其它方式关联于给定的产物或过程,那么认为包括在组的一个或多个成员之间的“或”的权利要求或描述得到了满足。本发明包括其中恰有组中的一个成员存在于、用于或以其它方式关联于给定的产物或过程的实施方案。本发明包括其中多于一个或所有的组成员存在于、用于或以其它方式关联于给定的产物或过程的实施方案。

还应该注意术语“包含”旨在为开放的并且容许但并非要求包括另外的要素或步骤。当本文中使用术语“包含”时,因此还涵盖并且公开术语“由……组成”。

在给出范围时,端点包括在内。此外,应该理解,除非另外指出或另外从上下文和本领域普通技术人员的理解显而易见,否则在本发明的不同实施方案中,表述为范围的值可假定为任何特定值或所陈述范围内的子范围,到所陈述范围的下限的单位的十分之一,除非在上下文中另有明确规定。

另外,应该理解,落入现有技术内的本发明的任何具体实施方案可从任何一个或多个权利要求中明确排除。因为认为此类实施方案为本领域普通技术人员所已知的,即使本文没有明确阐述排除,也可排除它们。本发明的组合物的任何具体实施方案(例如,因此编码的任何核酸或蛋白质;任何生产方法;任何使用方法等)可出于无论是否与现有技术存在相关的任何原因而从任何一个或多个权利要求中排除。

所有引用的来源例如参考文献、出版物、数据库、数据库条目和本文引用的技术均以引用的方式并入本申请,即使在引用中没有明确陈述。在引用的来源和本申请的陈述冲突的情况下,应当以本申请中的陈述为准。

小节标题和表格标题并不意图是限制性的。

序 列 表

<110> 纪念斯隆-凯特琳癌症中心

洛克菲勒大学

新泽西州立拉特格斯大学

波恩大学

<120> 用于改变第二信使信号传导的组合物和方法

<130> CHS-20003-CNDIV

<160> 50

<170> PatentIn version 3.3

<210> 1

<211> 52

<212> DNA

<213> 未知

<400> 1

caaaggtgtg gagcagctgg ccactggcag cgcctatgaa catgtgaaga tt 52

<210> 2

<211> 52

<212> DNA

<213> 未知

<400> 2

aatcttcaca tgttcatagg cgctgccagt ggccagctgc tccacacctt tg 52

<210> 3

<211> 46

<212> DNA

<213> 未知

<400> 3

cctctctttc tctcacactg aagcgtacat tttgaataat cacggg 46

<210> 4

<211> 46

<212> DNA

<213> 未知

<400> 4

cccgtgatta ttcaaaatgt acgcttcagt gtgagagaaa gagagg 46

<210> 5

<211> 31

<212> DNA

<213> 未知

<400> 5

ttgaaacgca aagatatcgc ggaggcggcc g 31

<210> 6

<211> 31

<212> DNA

<213> 未知

<400> 6

cggccgcctc cgcgatatct ttgcgtttca a 31

<210> 7

<211> 34

<212> DNA

<213> 未知

<400> 7

ggcggccgag acggtggcta aagttgtgga acgc 34

<210> 8

<211> 34

<212> DNA

<213> 未知

<400> 8

gcgttccaca actttagcca ccgtctcggc cgcc 34

<210> 9

<211> 40

<212> DNA

<213> 未知

<400> 9

gcagctgaac actggcagcg cctatgaaca tgtgaagatt 40

<210> 10

<211> 40

<212> DNA

<213> 未知

<400> 10

aatcttcaca tgttcatagg cgctgccagt gttcagctgc 40

<210> 11

<211> 51

<212> DNA

<213> 未知

<400> 11

agaaggtgct ggacaaattg gcattgaaag ccaaagatat ctcggaggcg g 51

<210> 12

<211> 51

<212> DNA

<213> 未知

<400> 12

ccgcctccga gatatctttg gctttcaatg ccaatttgtc cagcaccttc t 51

<210> 13

<211> 54

<212> DNA

<213> 未知

<400> 13

aatcttccgg agcaaaatgc tgcagagcag aatgtttaaa attaatgaaa tacc 54

<210> 14

<211> 54

<212> DNA

<213> 未知

<400> 14

ggtatttcat taattttaaa cattctgctc tgcagcattt tgctccggaa gatt 54

<210> 15

<211> 40

<212> DNA

<213> 未知

<400> 15

ggacaaattg agattgaaag ccaaagatat ctcggaggcg 40

<210> 16

<211> 40

<212> DNA

<213> 未知

<400> 16

cgcctccgag atatctttgg ctttcaatct caatttgtcc 40

<210> 17

<211> 42

<212> DNA

<213> 未知

<400> 17

gtggagcagc tgaacactgc cgcctactat gaacatgtga ag 42

<210> 18

<211> 42

<212> DNA

<213> 未知

<400> 18

cttcacatgt tcatagtagg cggcagtgtt cagctgctcc ac 42

<210> 19

<211> 35

<212> DNA

<213> 未知

<400> 19

ggagcagctg aacactgcca gctactatga acatg 35

<210> 20

<211> 35

<212> DNA

<213> 未知

<400> 20

catgttcata gtagctggca gtgttcagct gctcc 35

<210> 21

<211> 38

<212> DNA

<213> 未知

<400> 21

gtggagcagc tgaacactcc cagctactat gaacatgt 38

<210> 22

<211> 38

<212> DNA

<213> 未知

<400> 22

acatgttcat agtagctggg agtgttcagc tgctccac 38

<210> 23

<211> 48

<212> DNA

<213> 未知

<400> 23

ggtgtggagc agctgaacac tcccgcctac tatgaacatg tgaagatt 48

<210> 24

<211> 48

<212> DNA

<213> 未知

<400> 24

aatcttcaca tgttcatagt aggcgggagt gttcagctgc tccacacc 48

<210> 25

<211> 40

<212> DNA

<213> 未知

<400> 25

ggagcagctg aacactggcg cctactatga acatgtgaag 40

<210> 26

<211> 40

<212> DNA

<213> 未知

<400> 26

cttcacatgt tcatagtagg cgccagtgtt cagctgctcc 40

<210> 27

<211> 47

<212> DNA

<213> 未知

<400> 27

tgtgaagatt tctgctccta atgcatttga tgttatgttt aaactgg 47

<210> 28

<211> 47

<212> DNA

<213> 未知

<400> 28

ccagtttaaa cataacatca aatgcattag gagcagaaat cttcaca 47

<210> 29

<211> 63

<212> DNA

<213> 未知

<400> 29

gcaaaatgct gcagaaaaga atgtttaaaa ttaatggcat accttttgga acagttgaaa 60

aaa 63

<210> 30

<211> 63

<212> DNA

<213> 未知

<400> 30

ttttttcaac tgttccaaaa ggtatgccat taattttaaa cattcttttc tgcagcattt 60

tgc 63

<210> 31

<211> 36

<212> DNA

<213> 未知

<400> 31

ttcaagagct ggatgcattc tgtgcctacc atgtga 36

<210> 32

<211> 36

<212> DNA

<213> 未知

<400> 32

tcacatggta ggcacagaat gcatccagct cttgaa 36

<210> 33

<211> 44

<212> DNA

<213> 未知

<400> 33

gcctctcttt ctctcacact gcaaagtaca ttttgaataa tcac 44

<210> 34

<211> 44

<212> DNA

<213> 未知

<400> 34

gtgattattc aaaatgtact ttgcagtgtg agagaaagag aggc 44

<210> 35

<211> 44

<212> DNA

<213> 未知

<400> 35

gcattctgtt cctaccatgt ggcaactgcc atctttcaca tgtg 44

<210> 36

<211> 44

<212> DNA

<213> 未知

<400> 36

cacatgtgaa agatggcagt tgccacatgg taggaacaga atgc 44

<210> 37

<211> 34

<212> DNA

<213> 未知

<400> 37

tcaaggagag acctgggccc tctctttctc tcac 34

<210> 38

<211> 34

<212> DNA

<213> 未知

<400> 38

gtgagagaaa gagagggccc aggtctctcc ttga 34

<210> 39

<211> 40

<212> DNA

<213> 未知

<400> 39

gctggatgca ttctgttccg cccatgtgaa aactgccatc 40

<210> 40

<211> 40

<212> DNA

<213> 未知

<400> 40

gatggcagtt ttcacatggg cggaacagaa tgcatccagc 40

<210> 41

<211> 34

<212> DNA

<213> 未知

<400> 41

atatatctcg agatggaaga tccgcgtaga agga 34

<210> 42

<211> 44

<212> DNA

<213> 未知

<400> 42

atatatagat ctctatcaaa gcttgtcaaa aattggaaac ccat 44

<210> 43

<211> 45

<212> DNA

<213> 未知

<400> 43

tacagatcta ctagtgatct atgactgatc tgtacatgat ctaca 45

<210> 44

<211> 45

<212> DNA

<213> 未知

<400> 44

tgtagatcat gtacagatca gtcatagatc actagtagat ctgta 45

<210> 45

<211> 45

<212> RNA

<213> 未知

<400> 45

uacagaucua cuagugaucu augacugauc uguacaugau cuaca 45

<210> 46

<211> 45

<212> RNA

<213> 未知

<400> 46

uguagaucau guacagauca gucauagauc acuaguagau cugua 45

<210> 47

<211> 17

<212> DNA

<213> 未知

<400> 47

aaattgccga agacgaa 17

<210> 48

<211> 17

<212> DNA

<213> 未知

<400> 48

tttcgtcttc ggcaatt 17

<210> 49

<211> 36

<212> DNA

<213> 未知

<400> 49

acacacacac acacacacac acacacacac acacac 36

<210> 50

<211> 36

<212> DNA

<213> 未知

<400> 50

ctctctctct ctctctctct ctctctctct ctctct 36

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号