首页> 中国专利> 用于为癌症和其他病理状态提供治疗或治愈的系统、装置和方法

用于为癌症和其他病理状态提供治疗或治愈的系统、装置和方法

摘要

本发明提供了治疗由具有与健康人细胞的DNA不同的DNA序列的细胞引起的病状的方法。该方法利用序列差异的靶向性并产生在健康基因组中不存在的DNA的切割,由此含有靶向DNA的细胞被杀死或失活。用于实现这样的DNA损伤的优选系统是CRISPR系统,其中CAS切割与由CRISPR识别的序列相邻的DNA。本发明还公开了用于设计和/或生产靶向核酸的方法和计算机系统。

著录项

  • 公开/公告号CN116212052A

    专利类型发明专利

  • 公开/公告日2023-06-06

    原文格式PDF

  • 申请/专利权人 哈比卜·弗罗斯特;

    申请/专利号CN202310216261.6

  • 发明设计人 哈比卜·弗罗斯特;

    申请日2016-07-22

  • 分类号A61K48/00(2006.01);A61P35/00(2006.01);A61P31/04(2006.01);A61P31/10(2006.01);A61P33/00(2006.01);C12N15/64(2006.01);C12N15/10(2006.01);C12N9/22(2006.01);

  • 代理机构中国贸促会专利商标事务所有限公司 11038;

  • 代理人张小勇

  • 地址 丹麦哥本哈根

  • 入库时间 2023-06-23 06:30:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-23

    实质审查的生效 IPC(主分类):A61K48/00 专利申请号:2023102162616 申请日:20160722

    实质审查的生效

说明书

本申请是CN201680051463.8的分案申请。

技术领域

本发明涉及能够对一系列疾病进行治疗性干预的系统、装置和方法,其中治疗涉及杀死某些特定的细胞。本发明方法即提供了癌症、病毒性疾病以及致病生物引起的疾病的治疗。

背景

每年有数百万人死于癌症。目前例如手术、化疗和放疗的治疗是苛刻和非特异性的,杀死许多健康细胞以及意欲被消除的癌细胞。

已经尝试过个性化的癌症治疗方法,但其中很少已被证明对“任何”癌症都有效,因为在考虑到癌症具有基因病因学的情况下,每一种癌症都针对个体独特地呈现自己。一位患者器官中的癌症可以表现为-大致说明-另一位患者相同部位完全不同的疾病亚组。

此外,如今许多病毒性感染以及活病原体感染由于耐药性或由于同时缺乏对人无害的有效抗生素而不能得到令人满意的治疗。

因此需要针对与个体相关的特定癌症定制的癌症治疗,并且还需要能够特异性攻击被病毒感染的细胞或现有的抗生素药物难以靶向的细胞或致病生物的治疗。

几项研究表明例如在通过蛋白质结构域的CRISPR-Cas9筛选发现癌症药物靶标(Shi et al,Nature Biotechnology 2015)中,通过创建新的癌症动物模型(Mou etal.Genome Medicine 2015),通过转化与癌症相关的众所周知的基因并使用病毒载体将其转化为健康变体,以及通过在CAR-T免疫疗法(嵌合抗原受体T细胞免疫疗法)的工程改造中使用CRISPR-Cas9进行癌症治疗中的基因编辑。

在已知技术中,用于治疗癌症的基因疗法用于原位基因治疗操作方案,其中病毒载体用于转导产生对癌症的全身免疫性增加的特定基因,例如,在前列腺癌的免疫调节原位基因治疗中(The et al.,Clin Med Res.2006Sep;4(3):218–227)。CAR-T细胞免疫治疗具有与免疫疗法相关的风险,并且仍然对患者造成风险和不确定性,例如,自身免疫性疾病,免疫调节的副作用和死亡。

发明概述

本发明基于本发明人的最初认识,即现有技术的快速和可靠的基因组序列以及随后鉴定细胞(例如癌细胞、病毒感染细胞和致病生物细胞)特有的核酸序列与个体中的健康细胞相比可以用于设计编码识别和效应物分子的表达载体,以使得能够选择性破坏或中和所述细胞。

根据癌症基因组计划的发现,大多数癌细胞具有60种或更多种的突变。挑战已经在于鉴定这些突变中的哪种造成特定种类的癌症,因为这些突变在人际间变化-但绝大多数此类突变对于癌细胞而言是独特的,因此当靶向它们进行特定疗法时可以区分这些细胞。就细菌和病毒而言,鉴定用于靶向的独特序列的问题很少成为问题,但确保特定病毒或细菌序列的靶向不会导致不希望的脱靶效应当然是高度相关的。

如果具有非常高的可靠性/保真度的识别分子能够将个体中的癌细胞的核酸序列与同一个体中正常细胞的任何核酸序列区分开来,并且如果可以利用这种特异性识别来触发破坏或中和“癌症核酸”,则在个体中提供效应物癌症治疗的步骤可以分解为以下简单步骤:

1)鉴定和验证在癌细胞中出现但不在健康细胞中或至少仅在不重要的健康细胞群中出现的核酸序列-这种鉴定的序列在本文中称为“癌症NA序列”;

2)构建至少一种表达载体,其编码与癌症NA序列互补的识别序列并且还编码至少一种能够破坏或中和包含癌症NA序列的核酸的效应物分子;

3)将表达载体施用于患有癌症的患者,以实现包含癌症NA序列的核酸的靶向破坏或中和。进而,这将有助于破坏或中和癌细胞。

由于相对于正常细胞,癌细胞中存在的大量突变提供了识别序列的多个靶标,所以当破坏或中和核酸时获得的效果等价于用放射疗法治疗癌症细胞时发生的多种DNA破坏-然而,放射治疗也会导致正常细胞中(从而导致正常细胞)DNA的破坏,因此靶向癌症特异性核酸序列的方法将避免脱靶效应。

本发明人还已经认识到,完全相同的原理能够用于治疗任何类型的疾病,其中病原体-无论是病毒感染的细胞,细菌还是寄生虫-是疾病的致病物并且包含与受感染个体中的任何核酸序列不同的核酸序列。这种不同的序列在本文中被称为病原体NA序列。构建并向个体施用编码与病原体NA序列互补的识别序列并编码能够破坏或中和包含癌NA序列的核酸的效应物分子的适当表达载体将能够根除包含靶核酸的细胞。

因此,本发明提供了能够治疗癌症的基于个性化基因工程的治疗以及靶向病毒感染细胞或致病传染因子的基因工程治疗。

广义地说,本发明提供了一种系统,其配置成

-以预定义反应模式与患者材料或来自所述材料的数据相互作用

-提供设计或合成治疗性基因工程改造生物材料

-遵循基于计算机工具的预定义反应模式,所述计算机工具被配置为

-接收获取自采样自同一患者的疾病相关材料和健康材料二者的样品的生物状态或样品数据,下文的基因组,转录组,蛋白质组,基因表达,代谢物组,和表观基因组的数据的输入,并且配置成

-产生用于生物材料的设计和/或序列,和/或基于预定义模式合成生物材料,所述预定义模式基于所述患者采样的数据被配置成对疾病相关材料的生物状态是有害的,并且对健康材料是无害的。

在第一方面,本发明涉及治疗动物例如人的疾病的方法,所述方法包括通过施用以下载体和/或分子诱导优先杀死包含不存在于或不以显著量存在于所述动物的健康细胞中的至少一种DNA序列的细胞:

1)有效量的至少一种表达载体,其中所述至少一种表达载体中的每一种包含编码特异性识别所述至少一种DNA序列中的至少一种的识别分子的第一核酸序列,并且包含编码在与所述识别分子结合时选择性破坏包含所述至少一种DNA序列的DNA的分子的第二核酸序列,或

2)有效量的至少一种第一表达载体,其中所述至少一种表达载体中的每一种包含编码特异性识别所述至少一种DNA序列的至少一种的识别分子的第一核酸序列,和有效量的至少一种第二表达载体,所述至少一种第二表达载体包含编码在与所述识别分子结合时选择性破坏包含所述至少一种DNA序列的DNA的分子的第二核酸序列,或

3)特异性识别所述至少一种DNA序列中的至少一种的有效量的至少一种识别分子和在与所述识别分子结合时选择性破坏包含所述至少一种DNA序列的DNA的有效量的至少一种分子,或

4)有效量的至少一种表达载体和有效量的至少一种第二分子,所述至少一种表达载体包含编码特异性识别所述至少一种DNA序列中的至少一种的识别分子的核酸序列,所述第二分子在与所述识别分子结合时选择性破坏包含所述至少一种DNA序列的DNA,或

5)有效量的至少一种识别分子和有效量的至少一种表达载体,所述至少一种识别分子特异性识别所述至少一种DNA序列中的至少一种,所述至少一种表达载体包含编码在与所述识别分子结合时选择性破坏包含所述至少一种DNA序列的DNA的分子的核酸序列,

其中施用1-5中任一项所定义的所述载体和/或分子导致破坏包含所述至少一种DNA序列的核酸分子至所述细胞被杀死或中和的程度。

在第二方面,本发明涉及设计和任选地制备用于治疗动物例如人的疾病的治疗工具的方法,其包括:

a)对来自细胞或细胞群的DNA进行测序,其中所述细胞或细胞群来自恶性组织、病毒感染细胞和致病生物细胞,

b)随后将在步骤a中获得的DNA序列信息与来自所述动物的健康细胞或来自所述动物物种的完全测序的健康基因组的DNA序列信息进行比较,

c)鉴定来自细胞或细胞群的DNA序列,其中所述DNA序列没有出现在所述动物的健康细胞中,并且

d)设计和任选地制备治疗工具,所述治疗工具至少包含以下之一:

1)表达载体,其包含编码特异性识别步骤c中鉴定的至少一种DNA序列的识别分子的第一核酸序列,并且包含编码在与所述识别分子结合时选择性破坏在步骤c中鉴定的所述至少一种DNA序列的分子的第二核酸序列,或

2)第一表达载体和第二表达载体,所述第一表达载体包含编码特异性识别在步骤c中鉴定的所述至少一种DNA序列的分子的第一核酸序列,所述第二表达载体包含编码在与所述识别分子结合时选择性破坏在步骤c中鉴定的所述至少一种DNA序列的分子的第二核酸序列,或

3)识别分子和表达载体,所述识别分子特异性识别在步骤c中鉴定的至少一种DNA序列,所述表达载体包含编码在与所述识别分子结合时选择性破坏在步骤c中鉴定的所述至少一种DNA序列的分子的核酸序列,或

4)包含编码特异性识别在步骤c中鉴定的至少一种DNA序列的识别分子的核酸序列的表达载体和在与所述识别分子结合时选择性破坏在步骤c中鉴定的所述至少一种DNA序列的分子,或

5)特异性识别在步骤c中鉴定的至少一种DNA序列的识别分子和在与所述识别分子结合时选择性破坏在步骤c中鉴定的所述至少一种DNA序列的分子。

在第三方面,本发明涉及用于设计和任选地制备如本文所定义的治疗工具的计算机或计算机系统,其包含:

i)包含来自动物的健康细胞或来自所述动物物种的完全测序的健康基因组的DNA序列数据的第一计算机存储器或存储器段,

ii)包含来自病理相关细胞的DNA序列数据的第二计算机存储器或存储器段,

iii)适于将来自第二计算机存储器的DNA序列数据与第一存储器中的全部DNA序列数据集进行比较并且鉴定来自第二计算机存储器中的没有出现在第一计算机存储器中的DNA序列数据中的DNA序列的可执行代码,

iv)适于包含由iii中定义的计算机鉴定的DNA序列数据或指向DNA序列数据的指针的第三计算机存储器或存储器段,以及

v)适于基于1)存储或指向第三计算机存储器或存储器段中的DNA序列数据和2)编码效应物分子的核酸的序列数据来设计表达载体的可执行代码,以及任选地

vi)适于合成由v中的可执行代码设计的DNA序列的核酸合成仪。

附图说明

图1是示出实施例1中详细公开的检索和设计算法的流程图。

详细公开

识别分子和效应物分子

在本发明的大部分讨论和公开内容中,重点在于鉴定衍生自癌症/恶性细胞的区别性核酸。然而,如将理解的,本发明主要基于如下发现:目前的基因组编辑技术例如CRISPR-Cas-9系统提供了特异性靶向和编辑

如实施例所述,有可能在恶性细胞的基因组中检索可被识别分子靶向的序列,同时确保没有健康(正常)细胞被靶向。实际上,本发明第一方面的方法优选导致癌症患者中恶性细胞的杀死和中和,并且还优选该方法中使用的识别分子不能识别出健康(正常)细胞中的动物的自体DNA。

通过提供与靶位点互补的指导RNA序列,CRISPR系统在将CRISPR相关(Cas)蛋白质(例如本文CRISPR背景下讨论的Cas9和任何其他效应物分子)引导至多个基因靶标方面具有无与伦比的简易性。CRISPR/Cas9系统的靶位点可以在大多数基因组基因座附近找到;唯一的要求是匹配引导链RNA的靶序列后跟原间隔区邻近基序(PAM)序列。对于化脓性链球菌(Streptococcus pyogenes)(Sp)Cas9,这是任何核苷酸接着一对鸟嘌呤(NGG)。然而,新凶手弗朗西斯菌(Francisella novicida)Cas9已被工程改造为识别PAM YG(任何嘧啶接着鸟嘌呤),并且新凶手弗朗西斯菌的Cpf1识别PAM TTN或YTN。

因此,优选识别分子是核酸,其通过碱基配对识别靶向的所述至少一种DNA序列。通常,识别分子是crRNA,在与所述识别分子结合时选择性破坏所述至少一种DNA序列的分子是CRISPR相关蛋白(Cas),即核酸酶。该Cas可以是任何合适的Cas,但可以例如是Cas9、eSpCas9、SpCas9-HF和Cpf1。

治疗的靶位点的选择和CRISPR系统的选择可以通过经由CRISPR系统靶位点和脱靶位点预测活性评分器(例如,由哈佛大学提供的SgRNA Scorer 1.0)将靶标按优先次序排好而得到进一步优化。

尽管根据本发明优选的是由于多个DNA分子的破坏而使识别序列靶向的细胞受到致死性损伤,但即使靶向细胞仅仅是“中和”的情况下,本发明的治疗也将是有效的。

当利用CRISPR系统特异性识别恶性细胞中分散的DNA序列时,可以通过采用在识别序列主链中包括修饰的识别序列来增加识别的保真度。例如,识别序列与其靶DNA之间的双链体的稳定性可以通过使用包含修饰的核苷酸的识别序列来改善。一个例子是锁核酸(LNA);用LNA修饰的寡核苷酸(核糖修饰)能够在相对较短的互补核酸序列之间形成稳定的双链体,并且以这种方式能够确保使脱靶效应的风险最小化。其他可能性是使用磷酸主链变体,例如磷酸二酯和硫代磷酸酯核苷酸间连接修饰,核糖变体,如LNA,2'OMe,2'-氟RNA(2'F)和2'MOE;和非核糖主链变体,如PMO和PNA。

这些方法将需要通过直接施用来提供识别序列,因为修饰的核酸不是表达产物。

在本发明的优选实施方案中,CRISPR系统的设计和/或序列包括但不限于CRISPR-Cas9系统,CRISPR-eSpCas9系统和SpCas9-HF系统和CRISPR-Cpf1系统,或者同源重组,RNA干扰(RNAi),锌指核酸酶(ZFN),转录激活物样效应物核酸酶(TALEN)以及其他将来的方法来对基因组进行精确、靶向改变。这意味着效应物分子(核酸酶)可以在Cas9、eSpCas9、SpCas9-HF和Cpf1之间选择。由于其中一些发挥最小的脱靶效应,因此本发明的安全性主要依赖于正常细胞中未发现的独特DNA序列的正确鉴定。

本发明的有吸引力的特征是可以在对患者进行治疗之前对其进行体外测试,从而进一步提高安全性。当已经设计了识别序列的选择时,可以将它们施用于来自患者的分离的癌细胞和来自患者的分离的正常细胞-只有在要是该治疗是在患者中实施,DNA破坏作用实质上局限于癌细胞的情况下。该方法在本文公开的那些实施方案中特别相关,其中将癌细胞的DNA与标准健康基因组进行比较-作为安全措施,通过该方法确保患者正常细胞不会偶然地包括一个或多个被认为是癌症特异性的DNA靶标。

因此,在实施方案中,本发明涉及在体内施用合成的个性化疗法之前,在健康细胞和患病细胞上体外测试、优化和验证疗法。通过核苷酸解析DNA双链断裂作图来测量预期的结果,例如,直接原位断裂标记,链霉抗生物素蛋白上富集,和下一代测序(BLESS)。或者,可以在体外测定简单的细胞存活。

在已知技术中存在生物信息学检索算法,当提供基因或全基因组时,可以找到位于PAM附近的所有可能的20碱基片段,基于它们在基因组中的独特性和其他参数对它们排序,并且生成让你在那里的一系列指导RNA,例如哈佛大学的CHOPCHOP或耶鲁大学的CRISPRscan。在本文的背景中,对衍生自患者恶性细胞的DNA的讨论因此同样能够适用于衍生自任何病原体或参与病理学的细胞的DNA,只要所述DNA与待治疗个体的健康细胞中发现的DNA不同。实质上,当需要靶向癌症或其他病理学相关细胞的特定DNA时,仅需要改变识别分子(例如其核酸序列)的选择-此外,选择确保识别分子进入靶细胞的工具通常必须针对具体靶细胞进行优化。总之,本申请中涉及癌症情况下识别分子设计的所有公开内容可以以类似的方式用于其他病理学。

在本发明的一个实施方案中,提供的设计和/或序列用于合成CRISPR系统,或者同源重组,RNA干扰(RNAi),锌指核酸酶(ZFN),转录激活物样效应物核酸酶(TALEN)以及其他将来的方法来对基因组进行精确、靶向改变。目前优选的系统是CRISPR-Cas9系统,其现已经发展成用于真核(包括人类)基因组的基因编辑的多功能系统。

如果使用CRISPR-Cas9系统,唯一的其他先决条件是根据本发明待切割的序列在下游或上游接着原间隔区邻近基序(PAM)序列(如5'-NGG-3')。

从权利要求书中可以明显看出,本发明的治疗能够采取许多实用的形式并且仅仅必须确保靶细胞同时1)具有识别分子(例如至少一种CRISPR,其具有的DNA序列是与癌症NA序列或病原体NA序列互补)和效应物分子(如Cas9)。两种分子都可以由一种和同样的表达载体编码,可以由分开的表达载体编码,或者只有一种由表达载体编码,而另一种分子直接施用,或者它们可以二者均直接施用。

优选的表达载体是腺病毒、腺相关病毒或慢病毒,但可以使用能够提供识别和效应物分子的细胞存在的任何载体形式。因此,根据本发明,通常应用于基因治疗以实现转染至靶细胞的方法是实用的。例如,如果使用较长的、任选修饰的核酸,其不引入病毒载体中而是作为质粒引入,根据本发明,配制这些核酸以使它们被靶细胞吸收-脂质体制剂构成一种可能性,但核酸也可以通过例如连接到诸如胆固醇的脂质而直接修饰。

如将理解的是,优选的CRISPR-Cas9系统通常用作基因编辑工具而不是仅仅在靶DNA中引入断裂。然而,当根据本发明杀死或中和细胞时,基因编辑以及基因断裂方法都是有用的。

“中和”是指细胞由于其DNA的至少损伤到细胞不能增殖(在癌症中,这意味着癌症的生长被中断)和/或其不能复制其基因组的程度而失活。其他可能性是由于免疫原性表达产物的出现,细胞变得更具免疫原性,因此由于免疫反应而变得失活/死亡。还可能的是,DNA损伤诱导至少部分恢复到良性表型,这意味着细胞丧失了转移能力或其侵入组织的能力。最后,细胞也可能通常对本发明的原理可与之组合的其他抗癌疗法更敏感。然而,优选的是由于诱导的DNA破坏而导致靶向细胞被杀死。

在最简单的实施方案之一中,本发明的治疗方法利用一种或多种识别分子(例如CRISPR),其被设计为尽可能多地靶向靶细胞中的许多重要染色体。在染色体DNA中引入足够数量的断裂会将具有这样的作用:细胞随后不能存活;如上所述,对靶细胞的作用等同于放射疗法的效果。

而且,可以通过本发明的方法(例如使用恰当设计的CRISPR-Cas9或类似系统)位点特异性引入移码突变。移码是由不能被3整除的DNA序列中许多核苷酸的插入缺失(插入或缺失)引起的基因突变。由于密码子基因表达的三联体性质,插入或缺失能够改变阅读框(密码子的分组),导致与非突变基因相比完全不同的蛋白质表达产物。在序列中发生缺失或插入的位置越早,蛋白质将变得越多。

如果在靶细胞的一种或多种极重要蛋白质中发生插入缺失移码,并且修复机制受到抑制(如在癌症中的情况),则移码与细胞的持续寿命不相容。

移码突变不同于其中核苷酸被置换而不是插入或缺失的单核苷酸多态性。

这种方法是生物体可能被破坏的另一种方式。

如果几个位点被同时靶向,例如为了切出更大片的基因组生物体,就像进行重组DNA工程的情况一样,可以诱导通过上述损伤产生更大的影响。

细胞可被杀死的另一种方式是通过引入向序列中引入终止密码子(“UAA”、“UGA”或“UAG”)的一个或几个突变。产生的多肽可能异常短或异常长,并且很可能不起作用。

在令人关注的实施方案中,使用Crispr-Cas9系统或类似的系统,其将死亡基因或杀死机制插入靶细胞中,从而最快有效杀死癌症。

更简单的方法依赖于向靶细胞的基因组引入一种或多种破坏,从而通常干扰细胞的代谢。

在本发明的另一实施方案中,所用的Crispr-Cas9或类似系统缺失靶细胞基因组的一个或多个碱基对,从而扰乱细胞的代谢。

在本发明的另一实施方案中,Crispr-Cas9或类似系统将一个或多个基因修饰或插入到靶细胞基因组中,从而能够例如通过荧光染料从外科手术的角度可视化或电磁检测癌细胞。

在另一实施方案中,Crispr-Cas9系统被配置为产生其中核苷酸被置换而不是插入或缺失的单核苷酸多态性。

在另一个实施方案中,几个位点被同时靶向,例如,为了切割更大片的基因组生物体,就像在进行重组DNA工程时是有害的那样,可以诱导通过上述损伤产生更大的影响。

在本发明的另一实施方案中,将crispr-Cas9系统配置为引入向癌细胞序列中引入终止密码子(“UAA”、“UGA”或“UAG”)的一个或几个突变。

如从权利要求书中显而易见的,只要治疗过的个体自身健康细胞中不存在的基因材料确实存在于病理学相关细胞中,本发明的治疗方法就可以广泛应用。除癌症外,本发明允许靶向“困难的”细菌和其他感染,例如,结核病或特异性靶向已经产生了耐药性或者极其难以控制/根除的细菌或其他致病生物。某些感染没有目前有效的治愈方法:疟疾和许多其他寄生虫病(血吸虫病和多房棘球绦虫(Echinococcus multilocularis)感染就是例子),还有一些病毒性疾病。

就病毒性疾病而言,可能使用本发明仅靶向个体中包含衍生自病毒的DNA(在病毒利用感染细胞的生物化学机制产生来自DNA的病毒蛋白的情况下)的那些细胞。由于针对这种病毒感染的正常免疫防御是诱导杀死感染的细胞,所以目前公开的方法仅仅是以不同方式获得相同结果的方法。令人关注的靶标是HIV感染,以及HBV和HCV。

当谈到其他感染时,由于人类DNA序列与细菌、真菌和寄生虫中发现的序列之间的巨大差异,因此鉴定靶DNA或多或少是不重要的。在这些情况下,主要任务是选择用于将识别和效应物分子引入靶细胞的优化工具-在细菌的情况下,可以使用噬菌体作为载体,而其他工具如(真菌病毒或线虫病毒)可用于将表达载体引入真菌和寄生虫。

本发明第一方面的分开的实施方案将活性成分整合到预防性或治疗性储库中,即以注射剂、贴剂、丸剂或植入物形式的“疫苗”,其将持续剂量的活性剂进入所治疗的动物的组织、流体区室或血管,或者在获得疾病之前预防性地或诊断后。该实施方案需要使用现有技术来沉积药物并确保缓释。

用于鉴定和制备治疗工具的方法和工具

在本发明的第二方面的方法以及计算机工具的优选实施方案中,将癌症或病原体基因组与健康基因组进行比较,以找到序列中以这样的方式存在差异的区域,所述差异能够指导Crispr-Cas9的RNA部分的设计,使得它选择性地攻击癌症或病理学相关细胞而不是健康细胞。所述RNA序列这样的设计可以通过聚集来自一个或多个健康细胞以及来自一个或多个癌细胞的一个或多个样品来实现,以确保基因组高度代表健康基因组并确保差异高度代表癌症基因组。可能差别也存在于多代癌症中,从而出现在大多数癌细胞中。这是由于可能存在快速突变。

第二方面的方法和计算机工具因此被设置为使用在CRISPR-Cas9系统的合成中提供的设计和/或序列(诸如本文详述的那些),或者同源的重组,RNA干扰(RNAi),锌指核酸酶(ZFN)和转录激活物样效应物核酸酶(TALEN)来对基因组进行精确、靶向改变。

一般而言,在本发明的鉴定对靶有用的序列的方法中,可以获得待治疗个体中正常细胞的整个序列信息意义重大。但是,这可以省略;相反,可以使用已经测序的(健康的)基因组,即使由于待治疗个体可能包含与疾病序列相同的序列的风险而稍微不太安全,但是对于已经测序的基因组而言情况并非如此。然而,如本文所指出的,通过将来自待治疗个体的恶性细胞和健康细胞经历识别分子和在与识别分子结合时破坏靶向DNA序列的分子的组合,可以在体外进行初始安全性评估识别分子。

当疾病相关细胞DNA的测序开始时,可能需要更多或更少的时间才能对整个基因组进行测序,但在该过程中可能会连续鉴定出有用的靶序列-甚至可能在很早的时候。每次序列得到鉴定时,将其添加到一系列可能的靶序列中,其可以参照已包括的序列和连续包括的序列进行排序和重新排序-用于对序列进行排序的标准包括对评估PAM的存在、重要染色体中序列的存在等,见下文。

将癌症DNA序列与一个或多个完全测序的正常基因组进行比较并检索与先前序列基因组中高度保守基因相比的差异也是方便的。

另外,早已知道一系列与大量癌症相关且特异的约200个“常见”基因突变。如果将这样的突变鉴定为鉴定过程的一部分,那么当靶标是癌症时,这样的序列通常会排在最高级别以用于以后制备治疗工具-首先并且最重要的是因为已经知道这些序列是癌症特异性的并且包含靶向这种癌症特异性序列的识别序列将是安全的选择。

在本发明的一个实施方案中,系统的输出被整合到作为治疗载体的腺病毒(即腺相关病毒)或慢病毒中。

在本发明的一个实施方案中,计算机工具被配置为检索和检测癌基因组中序列,所述序列在基因组之间的相同位置处与健康基因组具有1-20个核苷酸不同,并且被配置为发现这样的位点下游或上游接着原间隔区邻近基序(PAM)序列(5'-NGG-3')。该系统被配置为-在发现多个这样的位点的情况下-基于具有最大差异的那些并且或者基于关于所讨论的基因的重要性的知识的数据库对发现进行排名。该系统被配置为以下各项中的至少一项:1)将健康状况与癌症/病原体相关之间差异最大的发现排在最高位置。2)基于预定义的知识库,将已知用途影响最大的发现排在最高位置。3)能够呈现这些发现的位置。4)基于这些发现产生设计和/或合成治疗,其通过将发现镜像到RNA序列中,当合成的是可以被包括在Crispr-Cas9系统中的单位的配方时,其将特异性靶向癌细胞,而不会靶向健康细胞。5)产生几个输出,例如几个Crispr-Cas9系统,其攻击靶向的癌性材料内的几个不同点,例如癌症基因组的多个点,旨在破坏大部分癌症材料。在立刻攻击癌细胞中几个点的情况下,其目的是切出更大片的基因组以导致更多的损伤。

在本发明的一个实施方案中,基因输入被配置为使用液体活检技术从患者的血液样品中提取癌症的基因材料。

在本发明的另一实施方案中,计算机工具利用基因组之间的差异数据库,并鉴定包括PAM位点、与PAM位点相邻或接近的差异,例如,两个基因组之间的距离PAM位点1-20个核苷酸的差异。实质上,即使是正常DNA序列与癌症中发现的序列之间的一些错配也可以用作靶标。在鉴定到较长错配的特别令人关注的实施方案中,可以设计多个部分重叠的识别序列,从而能够在癌细胞DNA中实现多种可能的断裂。

在一个实施方案中,机器可以接收一个或多个健康样品和一个或多个患病细胞的样品,以确保具有代表不同代患病细胞的患病DNA片段的高概率的位点的鉴定。

为了改进现有的癌症治疗,并且为了使仅对癌症具有高特异性的安全载体成为可能,本发明提供了一种系统,其能够聚集关于癌性和非癌性材料的若干数据样本,以关于数据代表各自材料类型的可能性提高安全性水平和特异性。

由于配置和计算机工具,该系统允许高度特异性的癌症治疗,其将患者健康细胞的规格和患者癌细胞的配置考虑在内。

在本发明的一个实施方案中,计算机工具被配置为读取至少包含基因组数据的数字文档并生成至少包含基因组数据的数字文档。

由于系统的计算机工具以及接收和解读患者数据的能力,该装置能够在设计靶向基因工程治疗的过程中,考虑个体实际癌症基因组规格,实现癌症治疗。

在另一实施方案中,计算机系统被配置为自己生成定义治疗载体及其基于个体患者基因组的设计的信息的方式-这仅需要计算机预先编程有一个或多个其中可以插入编码识别分子和效应物分子的序列的表达载体的序列信息。任选地,计算机系统可以连接或输送合成输入到核酸合成仪,其能够产生可用于本发明的表达载体。

该装置有助于安全程序,其中计算机不仅与基于患者的数据相互作用,而且还与关于以便对癌细胞造成伤害的优化策略的知识数据库相互作用。

在一个实施方案中,数据库包括以下信息以及关于已知在人类中普遍的基因位点及其基因产物的信息。

如从权利要求书中显而易见的,本发明描述的计算机系统和相关方法在用于提供癌症治疗或治愈的方法中是有用的,所述方法包括以预定义反应模式与患者材料或来自所述材料的数据相互作用:

-提供设计或合成治疗性基因工程生物材料

-遵循基于计算机工具的预定义反应模式,所述计算机工具被配置为

-接收获取自采样自同一患者的非癌性材料和癌性材料二者的样品的生物状态或样品数据,下文的基因组,转录组,蛋白质组,基因表达,代谢物组和表观基因组的数据的输入。

-产生用于生物材料的设计和/或序列,和/或基于预定义模式合成生物材料,所述预定义模式基于所述患者采样的数据被配置成对癌性材料的生物状态是有害的,并且对非癌性材料是无害的。

这些方法可以进一步利用前面提到的系统的一个或多个方面,从前面的段落中也可以看出。

已经如此详细描述了本发明的优选实施方案,对于本领域技术人员而言应理解并显而易见的是,可以在不改变本发明的概念的情况下做出在本发明的详细描述中未示例的许多改变和其中体现的原则。还应该理解的是,仅包含部分优选实施方案的许多实施方案是可能的,其相对于那些部分不会改变其中体现的发明概念和原理。因此,所提出的实施方案在所有方面都被认为是示例性的和/或说明性的而非限制性的,本发明的范围由所附权利要求书指示,并且因此所有替代实施方案和对本文所示的实施方案的改变落入本发明所附权利要求书的等价物的含义和范围内被包含在其中。

本发明实施方案的详细说明

在下文中,将参考附图更详细地描述本发明的实施方案,在附图中:

图1显示了计算的逐步示意图。

实施例1

生物信息学概念验证实验

图1示出了下面详细提供的计算的逐步示意图。

计算机系统的输入参数是来自一组代表健康组织的细胞的DNA序列和来自一组代表该实验中的恶性组织的细胞的DNA序列。以下算法可以提供来自病毒感染细胞和致病生物细胞的输入参数。

测序数据可以是全基因组、部分和/或深度DNA或RNA测序。

首先使用KMP(Knuth-Morris-Pratt)文本检索来鉴定健康或靶向细胞的PAM序列。该实验中的PAM序列代表Crispr-Cas9的前瞻性使用,因此是5'-NGG-3'。PAM序列,包括具有所需互补识别分子(例如Crispr RNA)长度的之后或之前的DNA核苷酸,以列表形式存储,供以后比较。使用BioPython开源项目制作的自定义算法和来自AWS 1000基因组计划的数据库(ref|NW_004929308.1)中发现的同一个体的健康和癌症基因组的染色体2样本进行试运行。

此后,染色体2样本序列被插入到它们各自的集合(Set)(或口袋(Bag))数据结构中。该集合允许重复的值,以便更多的发生序列不被忽略,并且能够参与部分匹配分析。集合数据结构用于其常量O(1)运行时,这对于较大的DNA序列是必不可少的。

作为第三步,两个相应的集合被计算为具有减(或差)运算的第三结果集合。差运算产生了互补识别分子的集合,这对于待靶向的癌细胞是独特的,并且不存在于健康细胞中。在2.3亿个核苷酸中进行的实验中,包括重叠重复,鉴定了800万个潜在靶标,其中在靶序列内的可变位置发生了PAM。

如果需要,则能够对所得到的对癌细胞或健康细胞独特的序列集合进行进一步的分析,例如它们独特性的排序,与已知对应于外显子组的部分的序列中与靶相关的靶序列的排序,基于它们的预测活性评分器例如通过SgRNA Scorer 1.0的靶的排序;基于其例如设计LNA的可用性的进一步优化的靶的排序,基于它们在特定载体(例如腺相关病毒或能够提供识别和效应物分子的细胞存在的另一种载体形式)中表达的生存力进行排序。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号