首页> 中国专利> 用于确定细胞色素P450 1A2、2A6和2D6、PXR以及UDP-葡萄糖醛酸基转移酶1A基因的基因型的单倍型标签单核苷酸多态性及其用于多重基因分型的方法

用于确定细胞色素P450 1A2、2A6和2D6、PXR以及UDP-葡萄糖醛酸基转移酶1A基因的基因型的单倍型标签单核苷酸多态性及其用于多重基因分型的方法

摘要

本发明涉及用于确定细胞色素P450 1A2(CYP1A2)、2A6(CYP2A6)和2D6(CYP2D6)、PXR和UDP-葡萄糖醛酸基转移酶1A(UGT1A)基因的基因型的单倍型标签单核苷酸多态性(htSNP)和使用所述htSNP的基因芯片,更具体而言,涉及用于确定人类CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的单倍型的htSNP的选择方法、使用所述htSNP确定所述基因的基因型的方法和用于所述方法的基因芯片。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-07

    未缴年费专利权终止 IPC(主分类):C12Q 1/68 专利号:ZL2007800336773 申请日:20070626 授权公告日:20120905

    专利权的终止

  • 2017-09-01

    专利权的转移 IPC(主分类):C12Q1/68 登记生效日:20170815 变更前: 变更后: 申请日:20070626

    专利申请权、专利权的转移

  • 2012-09-05

    授权

    授权

  • 2009-10-28

    实质审查的生效

    实质审查的生效

  • 2009-09-02

    公开

    公开

说明书

技术领域

本发明的设备和方法涉及用于确定细胞色素P450 1A2、2A6和2D6、PXR和UDP-葡萄糖醛酸基转移酶1A基因的基因型的单倍型标签单核苷酸多态性(htSNP)和基因芯片,更具体而言,涉及用于确定人类CYP1A2、CYP2A6、CYP2D6、NR1I2(=PXR)和UGT1A基因的单倍型的htSNP的选择方法、确定所述基因的基因型的方法和用于所述方法的基因芯片。

背景技术

出于遗传多样性的原因,个体对药物的毒性和效果会有不同反应。因此,在药物的初始开发阶段考虑重要药用蛋白相对于遗传多样性的效果是必要的,因为这可以降低药物开发的可能性失败。单倍型是决定个体之间的遗传多样性的因素之一。单倍型指的是在单个研究种群中每个基因序列的多态性的组合。单倍型比个体多态性提供了更准确和更可靠的关于遗传多样性的信息。

人类细胞色素P450是血红蛋白的一部分,血红蛋白协助氧化外来化学物质如药物、致癌物质和毒素以及内部物质如胆固醇、脂肪酸和维生素(Nelson等,Phamacogenetics 6:1-42,1996)。在肝、肾、小肠和肺中发现了细胞色素P450的各种亚科。

人类细胞色素P450 1A2(下文称CYP1A2)基因以及CYP1A1和CYP1B1都是CYP1基因群中包含的药物代谢酶。CYP1A2主要在肝脏中产生,并占细胞色素酶总量的15%。CYP1A2参与重要医用药物如咖啡因、氯氮平(clozapine)、丙咪嗪(imiparamine)和普萘洛尔(propranolol)的代谢。另外,CYP1A2催化内部合成物质(如17β-雌二醇、尿卟啉原III),以及致癌物质的生物活化(如多环芳烃的环氧化和芳香胺/杂环胺的N-羟基化)(Brosen K.,Clinical Pharmacokinetic,1995,29(suppl1):20-25;Josephy PD.,Environ.Mol.Mutagen,2001,38:12-18)。人类细胞色素P4502A6(下文称CYP2A6)基因位于19号染色体上,而具有非常相似的基因序列的伪基因CYP2A7处于CYP2A6基因之上。CYP2A6酶是一种将尼古丁转化为可替宁(cotinine)的主要酶,且CYP2A6酶参与大约80%的尼古丁代谢。CYP2A6酶将抗癌药物替加氟(tegafur)转化为体内活性药物5-氟尿嘧啶(5-FU)。所述酶主要由肝脏产生,并且在诸如肺、大肠、乳腺、肾和子宫等器官中少量表达(Drus Metab Dispos.,29(2):91-5,2001;AdvDrug Deliv Rev.,18;54(10):1245-56,2002)。

人类细胞色素P4502D6(下文称CYP2D6)基因位于22号染色体上,而伪基因CYP2D7和CYP2D8处于CYP2D6基因的一端。已知由所述基因编码的酶负责100种以上的重要临床药物(包括精神活性药物、心血管药物、吗啡药物等)的代谢。

由所述CYP2D6基因编码的酶主要由肝脏产生。尽管所述酶占细胞色素P450酶总量的大约2%,它们却是参与30%的药物代谢的主要酶类。

所述酶在个体中的活性各异,并根据其活性级别被划分为PM(弱代谢剂)、IM(中等代谢剂)、EM(强代谢剂)和UM(超快代谢剂)。所述基因的遗传多态性部分地造成了所述酶的不同活性。众所周知,CYP1A2基因展现了遗传多态性。到目前为止,在所述CYP1A2基因的启动子、外显子和内含子中发现了24种以上的变异体。到2007年6月为止,已有36种单倍型(遗传变异体的组合)(http://www.cypalleles.ki.se/cyp1a2.htm)、50种CYP2A6的基因型(http://www.cyDalleles.ki.se.cyp2a6.htm)以及大约80种CYP2D6基因的遗传多态性(www.immi.ki.se.cypalleles/cyp2d6.htm),它们在物种之间有极大的差异。由于各种类型的基因变异体和单倍型已经被报道过,因此有必要通过最小的单核苷酸多态性(SNP)确定准确的单倍型从而增强时间和成本有效性。

在各种药物被人体吸收并排出以前,代谢和转运将一直进行。细胞色素P450(CYP)和药物转运蛋白参与代谢和转运。对参与药物代谢的CYP酶的研究一直在积极地进行。目前,15种CYP酶,尤其是CYP2D6、CYP2C9、CYP3A4、CYP2B6、MDR1和CYP2C19,已被报道具有遗传多态性。所述遗传多态性是影响所述酶的药物底物的临床效果、治疗效果和副作用的主要因素。一些遗传变异体造成酶的沉积而根本不能代谢药物。其它遗传变异体使酶活性部分地降低。例如,诸如CYP2D6和CYP2C9等酶根据所述遗传变异体的不同而在表型上不同,且基因型和表型之间具有相对较高的相似性。同时,很难根据功能性遗传变异体的存在与否来预测CYP3A4、CYP2B6和MDR1基因的表型。

就人类而言,代谢50%的所有服用药物的CYP3A4在个体之间显示出极大的活性差异。已知CYP2B6在个体之间表现出最大270倍的差异。尽管个体差异如此之大,个体之间的活性差异仍很难直接从基因型来预测,因为基因型和表型之间具有低相关性的药物代谢酶或药物转运蛋白的蛋白表达根据外部因素的不同而出现极大的不同。对于这些基因而言,蛋白的表达调节,而非遗传变异体的存在与否,可能是更重要的导致代谢活性的个体差异的因素。当所述酶的表达被诱导后,这些酶自已大量生成来提高活性。表达诱导的机理通过将包含药物受体的外部材料与目标基因的启动子相结合来实现。所述药物受体的典型实例是已知在NR1I2基因中表达的孕烷X受体(PXR)。

据报道,PXR的表达量根据个体的不同而不同。有趣的是,所述受体的表达量与药物代谢酶如CYP3A4和CYP2B6的表达量具有高度相关性(Current Drug Metabolism,2005,6:369-383)。于是,个体之间的所述药物代谢酶的表达量差异取决于所述PXR基因的表达量差异或活性差异,而不是取决于变异体蛋白。

在这点上,对个体PXR基因的遗传多态性或所述PXR基因的表达差异的研究近来引起了关注。有报道称,尽管氨基酸序列并未改变,一些遗传变异体仍导致个体对药物反应的差异,如因红霉素呼吸测试或体内利福平(rifampin)引起的CYP3A4活性提升。这些PXR变异体由于所述目标基因的表达变化而导致活性变化。因此,所述PXR变异体可能导致药物或者生物分子在体内的活性差异,并极大地影响药物(PXR基因的耦合剂)引起的药物相互作用的个体差异。

UDP-葡萄糖醛酸基转移酶(UGT)是催化葡萄糖醛酸与体内内源性物质和外源性物质相结合的酶。所述UDP-葡萄糖醛酸基转移酶产生诸如苯酚、乙醇、胺和脂肪酸化合物等具有毒性的物质的葡萄糖醛酸耦合剂,并把这些物质转化为亲水材料以从人体经胆汁或尿排出(Parkinson A,Toxicol Pathol.,24:48-57,1996)。

据报道,所述UGT主要存在于间质细胞的内质网或核膜内,且在其它组织诸如肾和皮肤中也有表达。所述UGT酶可以根据一级氨基酸序列的相似性大致划分为UGT1和UGT2亚科。人类UGT1A族有9种异构体(UGT1A1和UGT1A3~UGT1A10)。其中,五种异构体(UGT1A1、UGT1A3、UGT1A4、UGT1A6和UGT1A9)由肝脏表达。所述UGT1A基因家族的遗传多态性因人而异。已知相对于UGT1A1、UGT1A3~UGT1A10基因存在数种遗传多态性(http://galien.pha.ulaval.ca/alleles/alleles.html)。所述UGT1A基因的多态性在种族之间有极大的差异。已证实酶的活性因多态性的不同而不同,而多态性是决定对于药物治疗的敏感性的重要因素。UGT1A1*6和UGT1A1*28与吉尔伯特综合征有关(Monaghan G,Lancet,347:578-581,1996)。另外,已报道了与各种疾病相关的各种功能性变异体。

由于已报道了各种类型的遗传变异体和单倍型,所以搜索方法应当是有效的。所述单倍型可以由Arlequin、SNPalyze或其它类似软件进行分析。分析所有单核苷酸多态性(SNP)来搜索每种单倍型的遗传变异体会在成本和时间上不够有效。

为了提高效率,可以提供单倍型标签SNP(htSNP)选择方法。所述htSNP选择方法是一种选择最小标签组来准确标记每种单倍型的方法。如果确定了所选SNP,则可以预测所有单倍型。

对于许多基因而言,遗传多态性的分布因种族的不同而不同。因此,有必要检查先天遗传变异体和单倍型是否频繁出现在高丽人中,而如果是的话,它们有多频繁,以及如何根据单倍型选择htSNP。然而,对高丽人的基因中的遗传变异体、与之对应的单倍型和根据每种单倍型的htSNP选择的研究并不多。

近来,已报道了一种通过对主要发现于白种人中的CYP2D6遗传变异体进行SNaPshot分析来确定11种SNP的方法(Sistonen J等,ClinChem.2005Jul;51(7):1291-1295),和Roche或Jurilab公司的CYP2D6诊断芯片。然而,它们集中在发现于白种人中的CYP2D6遗传变异体上。对诊断包括高丽人在内的亚洲人的CYP2D6遗传变异体的研究还不足。

因此,本发明人研究开发了一种短时间内准确确定主要发现于高丽人中的人类CYP1A2、CYP2A6、CYP2D6、NR1I2(=PXR)和UGT1A基因的变异体的方法。本发明提供了对主要发现于高丽人中的人类CYP1A2、CYP2A6、CYP2D6、NR1I2(=PXR)和UGT1A遗传变异体的htSNP选择方法,以便证明所选htSNP的可用性。

发明内容

因此,本发明的一个方面提供了用于确定发现于高丽人中的CYP1A2、CYP2A6、CYP2D6、NR1I2(=PXR)和UGT1A基因的单倍型的htSNP选择方法。

另外,本发明的另一方面提供了使用所述htSNP确定人类CYP1A2、CYP2A6、CYP2D6、NR112(=PXR)和UGT1A基因的基因型的方法。

另外,本发明的另一方面还提供了使用包含基因芯片的试剂盒来确定人类CYP2D6基因的基因型的方法。

总发明构思的其它方面和优点将在下面的说明中部分阐明,并将部分地根据所述说明而显而易见,或可通过实践所述总发明构思而得到理解。

本发明的上述和/或其它方面和优点通过提供选自人类CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因中的基因的htSNP的选择方法而实现,所述方法包括:从人类收集生物样本;从操作(a)中所收集的样本中提取核酸;用引物进行PCR(聚合酶链式反应),该反应使用操作中所提取的核酸作为模板来扩增选自人类CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因中的基因或其片段;由操作(c)中所得PCR产物的基因序列确定变异体的存在;由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和用SNPtagger软件对操作(d)中分析的所述单倍型进行测序并选择SNP。

本发明的上述和/或其它方面和优点通过提供确定人类CYP2A2基因的基因型的方法而实现,所述方法包括:(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取基因组DNA;(c)用引物进行PCR,该反应使用操作(b)中所提取的基因组DNA作为模板来扩增人类CYP1A2基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中确定CYP1A2基因的至少11种变异体的存在,所述至少11种变异体选自-3860G>A、-3598G>T、-3594T>G、-3113G>A、-2847T>C、-2808A>C、-2603insA、-2467delT、-1708T>C、-739T>G、-163C>A、1514G>A、2159G>A、2321G>C、3613T>C、5347C>T和5521A>G。

本发明的上述和/或其它方面和优点通过提供检测CYP1A2启动子基因中的变异体的方法实现,所述方法包括:(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取基因组DNA;(c)用引物进行PCR,该反应使用操作(b)中所得基因组DNA作为模板来扩增人类CYP1A2基因的启动子区域;(d)在操作(c)中所得的PCR产物的基因序列中确定CYP1A2遗传变异体的存在,所述CYP1A2遗传变异体包括-3860G>A、-3598G>T、-3594T>G、-3113G>A、-2847T>C、-2808A>C、-2603insA、-2467delT、-1708T>C、-739T>G和-163C>A。

本发明的上述和/或其它方面和优点通过提供确定人类CYP2A6基因的基因型的方法实现,所述方法包括:(a)从对象中收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类CYP2A6基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中确定CYP2A6遗传变异体的存在,所述CYP2A6遗传变异体选自-48T>G、13G>A、567C>T、2134A>G、3391T>C、6458A>T、6558T>C、6582G>T、6600G>T和6091C>T。

本发明的上述和/或其它方面和优点通过提供确定人类CYP2D6基因的基因型的方法实现,所述方法包括:(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得的核酸作为模板来扩增人类CYP2D6基因或其片段;和(d)确定CYP2D6基因中至少11种变异体的存在,所述至少11种变异体包括:选自-1426C>T、100C>T和1039C>T中的一种;选自-1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;1611T>A;1758G>A;1887insTA;2573insC;2988G>A;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

本发明的上述和/或其它方面和优点通过提供确定PXR基因的基因型的方法实现,所述方法包括:(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类PXR基因或其片段;和(d)在操作(c)中所得的PCR产物的基因序列中研究PXR基因的遗传变异体的存在,所述遗传变异体选自-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C。

本发明的上述和/或其它方面和优点通过提供确定UGT1A基因的功能性变异体的方法实现,所述方法包括:(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸作为模板来单独地扩增人类UGT1A基因;和(d)对操作(c)中扩增的所述基因测序并确定所述UGT1A基因中功能性变异体的存在,所述功能性变异体选自:UGT1A1基因中的-39(TA)6>(TA)7、211G>A,233C>T和686C>A;UGT1A3基因中的31T>C、133C>T和140T>C;UGT1A4基因中的31C>T、142T>G和292C>T;UGT1A6基因中的19T>G、541A>G和552A>C;UGT1A7基因中的387T>G、391C>A、392G<A、622T>C和701T>C;和UGT1A9基因中的-118T9>T10、726T>G和766G>A。

本发明的上述和/或其它方面和优点通过提供确定UGT1A基因的与对依立替康(irinotecan)的敏感性相关的多态性的方法而实现,所述方法包括:(a)从人类收集生物样本;(b)从操作(a)中所收集的样本中提取核酸;(c)使用操作(b)中所提取的核酸作为模板来扩增人类UGT1A基因;和(d)对操作(c)中扩增的所述人类UGT1A基因测序并确定所述UGT1A基因中变异体的存在,所述变异体选自:UGT1A1基因中的211G>A、233C>T和686C>A;UGT1A6基因中的19T>G、541A>G和552A>C;和UGT1A9基因中的-118T9>T10、726T>G和766G>A。

本发明的上述和/或其它方面和优点通过提供用基因芯片确定人类CYP2D6基因的基因型的方法实现,所述方法包括:(a)提取待研究的基因并进行多重PCR以获得包含待鉴定的SNP的边界(circumference)的PCR产物;(b)用识别等位基因的特异性碱基的ASPE(等位基因特异性引物延伸)引物进行ASPE反应;(c)将所述反应产物与基因芯片混合;和(d)分析所述基因芯片。

本发明的上述和/或其它方面和优点通过提供用于确定CYP2D6基因的基因型的SNaPshot基因分型试剂盒和用于确定SNP的具有Zip编码(Zip Code)寡核苷酸芯片的基因芯片来实现。

本发明中所述生物样本包括对象的血液、皮肤细胞、粘液细胞和毛发,且优选的是血液。

本发明中所述核酸可以包括DNA或RNA,优选的是DNA,更优选的是基因组DNA。

本发明中所述变异体将说明如下。

本发明中的术语“aN>M”或“NaM”(a是正数,N和M分别是A、C、T或G)是指在基因序列中第“a”位的碱基N被碱基M所替代。术语“ainsN”或“adelN”(a是正数,N是A、C、T或G)是在基因序列中第“a”位处插入或删除一个碱基N。

例如,“-1548C>T”变异体是基因序列中第-1584位的C碱基被T碱基替代。

“2573insC”变异体是在基因序列中第2573位插入(加入)了C碱基。“4125-4133insGTGCCCACT”变异体是在人类CYP2D6基因的第4125~4133位碱基处插入了9个碱基GTGCCCACT。

“2D6删除”变异体是将整个人类CYP2D6基因从染色体中删除。

另外,“2D6重复”变异体是在同一染色体中重复了至少2个人类CYP2D6基因。

如上所述,本发明提供了使用最优搜索组合来分析与CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的药物敏感性相关的功能性变异体或多态性的方法,所述最优搜索组合基于目前为止还未被检查的高丽人CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的多态性。本发明可以适用于确定包括在遗传学特性上与高丽人相似的日本人和中国人以及高丽人在内的亚洲人的CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的基因型。

附图说明

根据结合附图的对本发明实施方式的下述说明,本发明的上述和/或其它方面将变得显而易见且更容易理解,在所述附图中:

图1说明了根据本发明首次确定的CYP1A2基因的一种变异体在CYP1A2基因的基因序列中的位置;

图2~6是根据本发明选择的CYP1A2基因的htSNP组合的实例;

图7~14说明了CYP1A2启动子基因的变异体的结果,所述变异体是根据本发明选择的所述CYP1A2基因的功能性变异体(这里,X轴表示取决于引物分子数量的运动,Y轴表示每个峰的高度),

图7说明了CYP1A2启动子的野生型SNP,

图8说明了位于杂合(hetero)变异体中的CYP1A2启动子的-3860G>A(CYP1A2*1C)、-2467delT(CYP1A2*1D)和-163C>A(CYP1A2*1F)变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,

图9说明了位于纯合(homo)变异体中的CYP1A2启动子的-3860G>A(CYP1A2*1C)、-2467delT(CYP1A2*1D)和-163C>A(CYP1A2*1F)变异体,所述纯合变异体在双链DNA中含有两个变异体,

图10说明了位于杂合变异体中的CYP1A2启动子的-163C>A(CYP1A2*1F)和-2808A>C变异体,

图11说明了位于纯合变异体中的CYP1A2启动子的-163C>A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的-2467delT(CYP1A2*1D)、-739T>G(CYP1A2*1E)、-3598G>T、-3113G>A、-2847T>C和-1708T>C变异体,

图12说明了位于纯合变异体中的CYP1A2启动子的-163C>A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的-2467delT(CYP1A2*1D)、-3598G>T和-2847T>C变异体,

图13说明了位于杂合变异体中的CYP1A2启动子的-163C>A(CYP1A2*1F)、-2467delT(CYP1A2*1D)和-3594T>G变异体,

图14说明了位于纯合变异体中的CYP1A2启动子的-163C>A(CYP1A2*1F)变异体,还说明了位于杂合变异体中的-3860G>A(CYP1A2*C)、-2467delT(CYP1A2*1D)和-2603insA变异体;

图15说明了根据本发明用于选择htSNP组合的CYP2A6在高丽人中的单倍型的种类和频率;

图16~21举例说明了根据本发明选择的CYP2A6基因的htSNP组合,

图16说明了用于通过在遗传变异体检测目标中添加6种功能性变异体和具有所谓功能性的3种遗传变异体来确定CYP2A6基因的单倍型的htSNP组合的选择,

图17说明了用于确定CYP2A6基因的单倍型的htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁CYP2A6遗传变异体,

图18说明了用于确定CYP2A6基因的单倍型的另一htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁CYP2A6遗传变异体,

图19说明了用于确定CYP2A6基因的单倍型的另一htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁CYP2A6遗传变异体,

图20说明了用于确定CYP2A6基因的单倍型的另一htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁CYP2A6遗传变异体,

图21说明了用于确定CYP2A6基因的单倍型的另一htSNP组合的选择,所述CYP2A6基因包含8种含有氨基酸替换的变异体、3种具有CYP2A6基因删除标记的变异体和6种频繁CYP2A6遗传变异体,

图22~30说明了对所选htSNP组合和CYP2A6功能性遗传变异体组合的SNaPshot分析的结果,

图22说明了位于杂合变异体中的CYP2A6基因的-48T>G、2134A>G和6558T>C变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,

图23说明了位于杂合变异体中的CYP2A6基因的567C>7变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,

图24说明了位于杂合变异体中的CYP2A6基因的6458A>T和6558T>C变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,

图25说明了位于杂合变异体中的CYP2A6基因的-48T>G、13G>A和6558T>C变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型,

图26说明了位于杂合变异体中的CYP2A6基因的3391T>C变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,

图27说明了位于杂合变异体中的CYP2A6基因的-48T>G和2134A>G变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,

图28说明了位于杂合变异体中的CYP2A6基因的-48T>G、6558T>C和6600G>T变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,

图29说明了位于杂合变异体中的CYP2A6基因的6458A>T变异体,所述杂合变异体在双链DNA中含有一个变异体,而另一个被删除,

图30说明了位于杂合变异体中的CYP2A6基因的6558T>C和6582G>T变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型;

图31和32说明了与图22~30中所述基因研究一起进行的SNaPshot分析,所述SNaPshot分析另外确定了除图22~30中的所述遗传变异体之外的CYP2A6基因删除,

图31说明了存在于同源染色体中的CYP2A6基因,

图32说明了不存在于一个染色体中且只有一个基因的CYP2A6基因;

图33说明了部分的CYP2A6基因和CYP2A7基因的共轭连接;

图34~39说明了根据本发明选择的CYP2D6基因的htSNP组合,

图40和41说明了根据本发明选择的CYP2D6基因的htSNP组合之一的SNaPshot分析结果;

图42说明了使用基因芯片确定CYP2D6基因的基因型的过程;

图43说明了用于CYP2D6基因的所述基因芯片上的探针;

图44说明了使用长PCR进行的CYP2D6基因扩增;

图45说明了ASPE反应过程;

图46说明了显示根据示例性实施方式12对CYP2D6基因中的变异体的分析结果的基因芯片;

图47说明了根据本发明选择的PXR基因的htSNP组合;

图48~50说明了搜索根据本发明选择的PXR基因中的功能性变异体的结果(这里,X轴表示取决于每个引物的分子数量的运动,Y轴表示每个峰的高度),

图48说明了PXR基因的-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C功能性变异体,所述变异体均为野生型;

图49说明了位于杂合变异体中的PXR基因的-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C功能性变异体,所述杂合变异体在双链DNA中含有一个变异体和一个野生型;

图50说明了位于纯合变异体中的PXR基因的-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C功能性变异体,所述纯合变异体在双链DNA中含有两个变异体;

图51~54说明了对50个高丽人的UGT1A基因的功能性变异体的分析结果(这里,X轴表示SNP的位置,Y轴表示每个峰的高度,红色是T,黑色是C,蓝色是G,绿色是A);

图51说明了对UGT1A1(a)和UGT1A3(b)基因的功能性变异体的分析结果;

图52说明了对UGT1A4(a)和UGT1A6(b)基因的功能性变异体的分析结果;

图53说明了对UGT1A7基因的功能性变异体的分析结果;

图54说明了对UGT1A9基因的功能性变异体的分析结果;

图55说明了对50个高丽人的UGT1A1、UGT1A6和UGT1A9基因的与对依立替康(irinotecan)的敏感性相关的多态性的分析结果;

(a)UGT1A1基因的211G>A、233C>T和686C>A;UGT1A6基因的19T>G、541A>G和552A>C;以及UGT1A9基因的726T>G和766G>A,上述均为野生型,

(b)UGT1A1基因的野生型211G>A和233C>T,杂合型686C>A;UGT1A6基因的杂合型19T>G和552A>C,野生型541A>G;UGT1A9基因的野生型726T>G和766G>A,

(c)UGT1A1基因的野生型211G>A、233C>T和686C>A;UGT1A6基因的杂合型19T>G、541A>G和552A>C;UGT1A9基因的杂合型726T>G和野生型766G>A,和

(d)UGT1A1基因的杂合型211G>A和233C>T,野生型686C>A;UGT1A6基因的杂合型19T>G、541A>G和552A>C;UGT1A9基因的野生型726T>G和766G>A。

具体实施方式

下文将参照附图说明本发明的示例性实施方式,其中相同的附图标记表示相同要素,并且将尽量避免重复性说明。

本发明可供通过对高丽人CYP1A2基因的变异体分析来确定发现于高丽人中的CYP1A2基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。另外,本发明可供确定人类CYP1A2基因的新单倍型。

本发明的选择人类CYP1A2基因的htSNP的方法如下:

(a)从对象中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类CYP1A2基因或其片段;

(d)从操作(c)中所得的PCR产物的基因序列中确定变异体的存在;

(e)用SNPtagger软件对操作(d)中已确定具有变异体的所述PCR产物进行测序。

从操作(a)中所收集的样本中提取核酸的方法没有限制,是本领域公知的。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen公司(美国)和Stratagene公司(美国)生产的DNA或RNA提取试剂盒。如果从所述试剂盒提取的是RNA,则通过逆转录生产cDNA待用。

操作(c)中所述人类CYP1A2基因的片段是指包含人类CYP1A2基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP1A2基因或其片段的所述引物可以基于人类CYP1A2基因或其片段的基因序列来设计,并且可以选自含参照2~31的引物,但不限于此。

操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括17种变异体,如表5。

所述测序方法没有限制,可以是本领域内已知方法。例如,可以使用自动DNA测序仪或进行焦磷酸测序来确定基因序列。所述焦磷酸测序是用于DNA测序中的已知SNP测定方法,是检测来自DNA聚合时释放的无机焦磷酸盐(PPi)的光表达的方法。所述DNA测序可以使用来自参照32~61的引物进行,但不限于此。可以通过比较野生型CYP1A2基因的基因序列来确定操作(d)中变异体的存在。可以使用所述野生型CYP1A2基因的基因序列,例如参照1的基因序列(基因库(GenBank)登录号:NT_010194)或本领域内已知的每个CYP1A2基因型的基因序列(DrugMetab.Pharnmacokinet,2005,20(1):24-33)。

单倍型的频率和类型可以使用本领域内已知的技术程序或市场上销售的程序来估计。例如,可以使用免费分发的Haploview,或商业化程序SNPAlyze。所述Haploview软件是本领域内已知的。更优选的是,可以从http://www.broad.mit.edu/mpg/haploview下载所述软件。

本发明的方法可以另外包括对操作(a)~(d)的重复。为了确定诸如种族或者病人等特定群体内的CYP1A2基因的变异相及其单倍型,可以在检测完CYP1A2基因型的频率并从所述群体中选出频繁CYP1A2基因型之后执行操作(e)。

在操作(e)中,用SNPtagger软件分析CYP1A2基因的单倍型数据以选择htSNP。所述SNPtagger软件在本领域内是已知的,例如Genehunter、Merlin、Allegro、SNPHAP、htSNP finder(基于PCA)。更优选的是,所述软件可以从http://www.well.ox.ac.uk/~xiayi/haplotypehttp://slack.ser.man.ac.uk/progs/htsnp.html下载。

可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时分析数个SNP,则特定单倍型的组合可以和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab(迈斯沃克软件有限公司(TheMathWorks,Inc.),美国)来分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。

在本发明的一个示例性实施方式中,首先研究了高丽人CYP1A2基因中的变异体来选择发现于高丽人中的CYP1A2基因型的htSNP。结果,在高丽人CYP1A2基因中共发现17个SNP(参见表5)。17个SNP中有一个(-2603insA)是新型的。

本发明首次提供的所述单一SNP在双链DNA中包含一个变异体和一个野生型(参见图1)。

在本发明的另一个示例性实施方式中,确定了发现于高丽人中的17个SNP的单倍型。结果,本发明确定了此前从未在高丽人中发现的CYP1A2基因的的单倍型(参见表6)和基于上述单倍型的基因型。例如,表6中的CYP1A2基因的单倍型2(CYP1A2*1L)是指在所述CYP1A2基因的基因序列中的-3860、-2467和-163位碱基处有SNP的基因型。更具体而言,所述基因型具有-3860G>A、-2467T>delT(-2467delT)和-163C>A的SNP。

在本发明的另一个示例性实施方式中,用SNPtagger软件分析已由含CYP1A2基因中的变异体的基因序列确定的单倍型以便选择htSNP,亦即发现于高丽人中的CYP1A2基因的变异体的17个单倍型的最小标记。根据本发明选择的htSNP组合的实例如图2~6中所示。

根据本发明选择的所述htSNP组合可以用于确定人类CYP1A2基因的单倍型。因此,本发明提供了确定人类CYP1A2基因的单倍型的方法。所述方法包括如下步骤:

(a)从对象中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所得核酸作为模板来扩增人类CYP1A2基因或其片段;和

(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP1A2基因中变异体的存在,所述变异体选自-3860G>A、-3598G>T、-3594T>G、-3113G>A、-2847T>C、-2808A>C、-2603insA、-2467delT、-1708T>C、-739T>G、-163C>A、1514G>A、2159G>A、2321G>C、3613T>C、5347C>T和5521A>G。

操作(b)中的所述提取核酸的方法与上述相同。

如上所述,所述人类CYP1A2基因的片段是指包含所述人类CYP1A2基因的已知SNP的片段。用于操作(c)的所述引物没有限制,可以选自参照2~31。

操作(d)中研究的所述SNP可以选自图4~6中的htSNP。所述SNP的存在可以由如下变异体研究:图4中的-3860G>A、-3598G>T、-3113G>A、-2808A>C、-2603msA、-2467delT、-163C>A、1514G>A、2159G>A、5347C>T和5521A>G;图5中的-3860G>A、-3113G>A、-2808A>C、-2603insA、-2467delT、-739T>G、-163C>A、1514G>A、2159G>A、5347C>T和5521A>G;以及图6中的-3860G>A、-3598G>T、-3594T>G、-3113G>A、-2808A>C、-2603insA、-2467delT、-163C>A、1514G>A、2159G>A、5347C>T和5521A>G,或-3860G>A、-3598G>T、2321G>C、-3113G>A、-2808A>C、-2603insA、-2467delT、-163C>A、1514G>A、2159G>A、5347C>T和5521A>G。

操作(d)中检测的所述SNP基于发现于高丽人中的CYP1A2基因中的变异体,且该SNP对确定高丽人的CYP1A2基因的单倍型和基因型极具特异性。

操作(d)中的所述PCR产物的基因序列中的CYP1A2基因的SNP可以用本领域内已知的多态性分析方法确定。优选的是,所述SNP可以由SNaPshot分析(参见[Peter M.Vallone等,Int J Legal Med,2004,118:147-157])、电泳分析或它们的组合来确定,更优选的是用SNaPshot分析来确定。

所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的所述SNaPshot是用已知方法基于操作(c)中研究的所述CYP1A2基因的SNP设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与SNP位点相邻的已退火基因序列,并在5’端添加了T碱基即可。更具体而言,引物可以选自参照64~74。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因SNP的不同而大小不同。因此,可以同时确定数个SNP。

为确定用所述SNaPshot分析所得的基因分型结果是否正确,执行了另一种确定所述基因型的方法。另一种方法没有限制,优选包括自动DNA测序或焦磷酸测序。

发现于高丽人中的所述CYP1A2基因中的17种变异体的11个SNP位于启动子区域。所述11个SNP包含由本发明首次确定的-2603insA变异体。因此,本发明提供了确定人类CYP1A2启动子基因中变异体的方法。所述方法包括下列步骤:

(a)从对象中收集生物样本;

(b)从操作(a)中所收集的样本中提取基因组DNA;

(c)使用引物进行PCR,所述反应使用在操作(b)中所得的基因组DNA作为模板扩增人类CYP1A2基因的启动子区域;和

(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP1A2基因中变异体的存在,所述变异体包括-3860G>A、-3598G>T、-3594T>G、-3113G>A、-2847T>C、-2808A>C、-2603insA、-2467delT、-1708T>C、-739T>G和-163C>A。

操作(b)中的所述提取基因组DNA的方法与上述相同。

操作(c)中扩增人类CYP1A2基因的启动子区域的所述引物是可变的,只要所述引物能扩增来自参照1的从-3860G>A到-163C>A的SNP,更优选的是来自参照62和63的SNP即可。

操作(d)中所述PCR产物的基因序列中的CYP1A2基因的所述SNP可以用本领域内公知的多态性分析方法确定。优选的是,所述SNP可以用SNaPshot分析确定。本发明所用SNaPshot分析可以使用基于CYP1A2基因的所述11个SNP而设计的引物进行。本发明所用的SNaPshot引物是可变的,只要其被设计为包含与除所述SNP以外的序列相邻的基因序列即可。更优选的是,具有选自参照64~74的基因序列的引物。

在本发明的另一个示例性实施方式中,基于所述影响CYP1A2酶活性的启动子区域中的11个SNP,由SNaPshot分析检测所述CYP1A2启动子基因的变异体。结果,证实本发明的所述方法可以准确地高速检测所述CYP1A2启动子基因中的变异体(参见图7~14)。

2.CYP2A6

本发明可供通过对高丽人CYP2A6基因的变异体分析来确定主要发现于高丽人中的CYP2A6基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。

根据本发明选择人类CYP2A6基因的htSNP的方法如下:

(a)从对象中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类CYP2A6基因或其片段;

(d)确定在操作(c)中所得的PCR产物的基因序列中变异体的存在;

(e)由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和

(f)用SNPtagger软件(http://www.well.ox.ac.uk/~xiayi/haplotyDe/)对操作(e)中确定的所述单倍型进行测序以选择htSNP。

所述从操作(a)中收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen公司(美国)和Stratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是RNA,则通过逆转录生产cDNA待用。

操作(c)中所述人类CYP2A6基因的片段是指包含人类CYP2A6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP2A6基因或其片段的所述引物可以基于人类CYP2A6基因或其片段的基因序列来设计,并且可以选自参照76~89的引物,但不限于此。

操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括30种变异体,如表15。

操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。优选的是,用序列分析或电泳分析来比较本领域内已知的野生型CYP2A6基因的基因序列(例如参照75的基因序列(基因库登录号:NC_000019))或本领域内已知的CYP2A6基因型的各基因序列。另外,还可用RFLP分析来比较所述野生型CYP2A6基因的限制性酶的切割相。所述CYP2A6基因的删除或重复可以通过对PCR产物的电泳分析来确定。所述测序可以通过自动DNA测序仪或焦磷酸测序进行。

操作(e)中确定含有变异体的PCR产物的基因序列中的所述单倍型可以通过诸如SNPAlyze、Haplotyper、Arlequin等程序来确定。

本发明的方法可以另外包括对操作(a)~(d)的重复。为了确定诸如种族或者病人等特定群体内的CYP2A6基因的变异相,可以在检测完CYP2A6基因型的频率并从所述群体中选出频繁CYP2A6基因型之后执行操作(f)。

在操作(f)中,用SNPtagger软件分析操作(e)中确定的所述单倍型的基因序列以选择htSNP。用于选择htSNP的所述软件包括HapBlock、LDSelect、Haploview、htSNP、TagIT和tagSNPs以及SNPtagger。所述SNPtagger软件在本领域内是已知的,且优选的是可以从http://www.well.ox.ac.uk/~xiayi/haplotype下载。可以验证所选htSNP来改善精度从而确定二倍型。可以用Matlab(迈斯沃克软件有限公司,美国)来验证所述htSNP。

在本发明的一个示例性实施方式中,首先研究了发现于高丽人中的CYP2A6基因中的变异体来选择高丽人的CYP2A6基因型的htSNP。结果,在高丽人CYP2A6基因中共发现30个SNP(参见表15)。

在本发明的另一个示例性实施方式中,用DYNACOM公司生产的SNPAlyze确定了所选的30个SNP中的14个SNP的单倍型,从而确定了具有1%以上的频率的总共19个单倍型。所述14个SNP包括8个导致氨基酸替换且含有功能性遗传变异体的变异体,和6个频繁变异体。用来确定所述单倍型的程序不限于所述SNPAlyze。作为另外一种选择,可以使用本领域内已知的各种软件,例如,Haplotyper(http://www.people.fas.harvard.edu/~junliu/Haplo/docMain.htm)、Arlequin(htt://lgb.unife.ch/arlequin)和Istech公司生产的SNP Analyzer(http://www.istech21.com/)。

在本发明的另一个示例性实施方式中,用SNPtagger软件分析了包括19个单倍型和1个基因删除在内的20个单倍型的基因序列和频率以选择htSNP,亦即能方便地鉴定主要发现于高丽人中的CYP2A6基因的基因型的最小标记。htSNP的实例如图16~21所示。

可以使用本发明所选的htSNP组合来确定所述人类CYP2A6基因的基因型。因此,本发明提供了确定所述人类CYP2A6基因的基因型的方法。所述方法包括如下步骤:

(a)从对象中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类CYP2A6基因或其片段;

(d)在操作(c)中所得的PCR产物的基因序列中确定所述CYP2A6基因中变异体的存在,所述变异体选自-48T>G、13G>A、567C>T、2134A>G、3391T>C、6458A>T、6558T>C、6582G>T、6600G>T和6091C>T。

操作(b)中的所述提取核酸的方法与上述相同。

如上所述,所述人类CYP2A6基因的片段是指包含人类CYP2A6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以包括参照90、91、120和130的引物,但不限于此。

操作(d)中的所述变异体可以选自图16~21中的htSNP。例如,在操作(d)中,所述变异体可以由图16中的-48T>G;22C>T;567C>T;2134A>G;3391T>C;6458A>T;6558T>C;6582G>T;6600G>T;选自6091C>T、5971G>A和5983T>G中的一种;和13G>A;51G>A;1620T>C;以及1836G>T来确定。所述变异体也可以由图17中的-48T>G;22C>T;51G>A;567C>T;1620T>C;1836G>T;3391T>C;6458A>T;6558T>C;6600G>T;和选自6091C>T、5971G>A和5983T>G中的一种来确定。

如图18所示,所述变异体可以由22C>T;51G>A;567C>T;1620T>C;1836G>T;3391T>C;6354T>C;6458A>T;6558T>C;6600G>T;和选自6091C>T、5971G>A和5983T>G中的一种来确定。

如图19所示,所述变异体可以由-48T>G;13G>A;22C>T;51G>A;567C>T;1620T>C;1836G>T;2134A>G;3391T>C;6458A>T;6558T>C;和选自6091C>T、5971G>A和5983T>G中的一种来确定。

如图20所示,所述变异体可以由-48T>G;13G>A;22C>T;51G>A;567C>T;1620T>C;1836G>T;3391T>C;6458A>T;6558T>C;和选自6091C>T、5971G>A和5983T>G中的一种来确定。

另外,如图21所示,所述变异体可以由-48T>G;22C>T;51G>A;567C>T;1620T>C;1836G>T;2134A>G;3391T>C;6458A>T;6558T>C;6600G>T;和选自6091C>T、5971G>A和5983T>G中的一种来确定。优选的是,所述变异体如图16所示来确定。

在图16中的变异体中,证实具有功能性或具有很高的潜在功能性的变异体包含了替换氨基酸或导致基因删除的变异体。因此,要检测图16中的变异体中的功能性CYP2A6变异体,可以研究图16中的变异体中的所述氨基酸替换变异体或基因删除变异体。基因删除几乎无法由SNP检测。当搜索所述变异体以标记基因删除时,发现了6091C>T变异体。所述6091C>T变异体是特异性地发现于操作(c)所扩增的PCR产物中删除了CYP2A6基因的染色体中的SNP,而且所述6091C>T变异体可以用作基因删除标记变异体。用于确定功能性的所选变异体组合包括10个变异体,即-48T>G;13G>A;567C>T;2134A>G;3391T>C;6458A>T;6558T>C;6582G>T;6600G>T;和6091C>T。所述CYP2A6基因中的5971G>A和5983T>G变异体可以替代所述6091C>T变异体来标记基因删除。

操作(d)中研究的所述变异体基于主要发现于高丽人中的CYP2A6基因中的变异体。因此,它对确定高丽人的CYP2A6基因的单倍型和基因型极具特异性。

操作(d)中的所述PCR产物的基因序列中的CYP2A6基因的变异体可以用本领域内已知的多态性分析方法研究。可以用SNaPshot分析(参见[Peter M.Vallone等,Int J Legal Med,2004,118:147-157])、电泳分析或它们的组合,更具体而言,可以使用SNaPshot分析来研究所述变异体。

所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火序列(除SNP区域以外)和ddNTP。本发明中使用的所述SNaPshot是用基于操作(d)中研究的所述CYP2A6基因的SNP的已知方法设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP位点相邻的已退火基因序列,并在5’端添加了T碱基即可。更优选的是,引物可以选自参照97~102。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物的5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。

然后,扩增以用于SNaPshot分析的所述PCR产物的基因序列可以用本领域内的已知测序方法进行分析,优选的是使用自动DNA测序进行分析。

例如,具有选自参照92~101的基因序列的引物可以在操作(c)中用于研究图16中的htSNP组合。优选的是,可以使用来自参照92~101的所有引物,但不限于此。

然后,扩增以用于SNaPshot分析的所述PCR产物的基因序列可以用本领域内的已知测序方法进行分析,优选的是使用自动DNA测序进行分析。

在本发明的另一个示例性实施方式中,对所选htSNP组合的可用性进行了确认。通过从图16的htSNP组合中选择10种功能性或潜在功能性CYP2A6变异体来分析操作(c)中所得的PCR产物的基因序列,从而进行SNaPshot分析。结果,证实本发明的方法能高速地同时确定发现于高丽人中的CYP2A6基因型(参见图22~32)。

可以用本发明所述方法确定的所述CYP2A6基因的基因型包括-48T>G、13G>A、567C>T、2134A>G、3391T>C、6458A>T、6558T>C、6582G>T、6600G>T和6091C>T。与之相对应的每个基因型和变异体如图22~32中所示。例如,图22说明了含有-48T>G、6558T>C和2134A>G变异体和7个野生型的基因型。图23说明了含有567C>T和9个野生型的基因型。所述CYP2A6*4基因型包含2A6删除变异体。当从人类染色体中删除CYP2A6基因后,根本不会生成酶。如果CYP2A6基因被删除,则所述基因的形状为部分CYP2A6基因和部分CYP2A7基因相结合的形状。所述删除特异性变异体可以通过研究上述结合基因来确定。

3.CYP2D6

本发明可供通过对高丽人CYP2D6基因的变异体分析来确定主要发现于高丽人中的CYP2D6基因的基因型、选择htSNP作为每个单倍型的最优标签组并确认其可用性。

根据本发明选择人类CYP2D6基因的htSNP的方法如下:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类CYP2D6基因或其片段;

(d)由在操作(c)中所得的PCR产物的基因序列确定变异体的存在;

(e)由在操作(d)中已确定具有变异体的PCR产物的基因序列确定单倍型;和

(f)用SNPtagger软件对操作(e)中所确定的单倍型进行测序以选择htSNP。

所述从操作(a)中收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen公司(美国)和Stratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是RNA,则通过逆转录生产cDNA待用。

操作(c)中所述人类CYP2D6基因的片段是指包含人类CYP2D6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类CYP2D6基因或其片段的所述引物可以基于人类CYP2D6基因或其片段的基因序列来设计。例如,所述引物可以包含选自参照106、参照107、参照121~127、参照129~136、参照138、参照139、参照140和参照150的基因序列,但不限于此。

操作(d)中的所述变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括33种变异体,如表34。

操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。优选的是,可以用基因测序、电泳分析和RFLP分析来确定所述变异体。所述基因测序可以通过自动DNA测序仪或焦磷酸测序进行。所述焦磷酸测序是用于DNA测序中的已知SNP测定方法,是检测来自DNA聚合时释放的无机焦磷酸盐(PPi)的光表达的方法。

可以通过比较野生型CYP2D6基因的基因序列来确定操作(d)中的变异体的存在。所述野生型CYP2D6基因的基因序列是本领域内已知的。例如,可以使用参照105的基因序列(基因库登录号:AY545216)或本领域内已知的每个CYP2D6基因型的基因序列(基因库登录号:M33388,http://www.cypalleles.ki.se/cyp2d6.htm)。另外,还可进行RFLP分析来比较所述野生型CYP2D6基因的限制性酶的切割相。所述CYP2D6基因的删除或重复可以通过对PCR产物的电泳分析来确定。

操作(d)中已确定含有变异体的PCR产物的基因序列中的单倍型可以用全测序来确定。

本发明的方法可以另外包括对操作(a)~(d)的重复。为了确定诸如种族或者病人等特定群体内的CYP2D6基因的变异相,可以在检测完CYP2D6基因型的频率并从所述群体中选出频繁CYP2D6基因型之后执行操作(f)。

在操作(f)中,用SNPtagger软件分析操作(e)中确定的单倍型的基因序列以选择htSNP。所述SNPtagger软件在本领域内是已知的,例如Genehunter、Merlin、Allegro、SNPHAP、htSNP finder(基于PCA),更优选的是,所述软件可以从http://www.well.ox.ac.uk/~xiayi/haplotypehttp://slack.ser.man.ac.uk/progs/htsnp.html下载。

可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时确定数个SNP,则特定单倍型的组合可能和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab(迈斯沃克软件有限公司,美国)分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。

在本发明的一个示例性实施方式中,首先研究了发现于高丽人中的CYP2D6基因中的变异体以选择高丽人CYP2D6基因型的htSNP。结果,在高丽人CYP2D6基因中发现了33种变异体和与之相对应的12个单倍型(基因型)(参见表34和35)。

在本发明的另一个示例性实施方式中,用SNPtagger软件对12个CYP2D6基因型进行测序以选择htSNP,亦即可方便地鉴定主要发现于高丽人中的CYP2D6基因型的最小标记。根据本发明选择的htSNP组合的实例如图34~39中所示。

根据本发明选择的所述htSNP组合可以用于确定人类CYP2D6基因的基因型。因此,本发明提供了确定人类CYP2D6基因的基因型的方法。所述方法包括如下步骤:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类CYP2D6基因或其片段;

(d)在操作(c)中所得的PCR产物的基因序列中确定CYP2D6基因中的至少11种变异体的存在,所述至少11种变异体包括:选自-1426C>T、100C>T和1039C>T中的一种;选自1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;1611T>A;1758G>A;1887insTA;2573insC;2988G>A;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

操作(b)中的所述提取核酸的方法与上述相同。

如上所述,所述人类CYP2D6基因的片段是指包含人类CYP2D6基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以包括选自参照106和107、参照121~127、参照129~136、参照138、139、149和150的基因序列。

操作(d)中的所述变异体可以选自图34~39中的htSNP。例如,如图34所示,可以确定下述变异体的存在,所述变异体包括:选自-1426C>T、100C>T和1039C>T中的一种;选自1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;1611T>A;1758G>A;1887insTA;2573insC;2988G>A;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

如图35所示,可以确定下述变异体的存在,所述变异体包括:-1584C>G;选自-1426C>T、100C>T和1039C>T中的一种;1611T>A;1758G>A;2573insC;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;选自-1245insGA、-1028T>C、-377A>C、3877G>A、4388C>T和4401C>T中的一种;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

另外,如图36所示,可以确定下述变异体的存在,所述变异体包括:选自-1426C>T、100C>T和1039C>T中的一种;-1584C>G;选自-1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;1611T>A;1758G>A;1887insTA;2573insC;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

另外,如图37所示,可以确定下述变异体的存在,所述变异体包括:-1584C>G;选自-1426C>T、100C>T和1039C>T中的一种;1611T>A;1758G>A;2573insC;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;选自-1245insGA、-1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;4125-4133insGTGCCCACT;-1235A>G;1887insTA;2D6删除;和2D6重复。

另外,如图38所示,可以确定下述变异体的存在,所述变异体包括:选自-1426C>T、100C>T和1039C>T中的一种;选自-1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;1611T>A;选自1661G>C和4180G>C中的一种;1758G>A;1887insTA;2573insC;2988G>A;4125-4133insGTGCCCACT;-1235A>G;1887insTA;2D6删除;和2D6重复。

另外,如图39所示,可以确定下述变异体的存在,所述变异体包括:-1584C>G;选自-1426C>T、100C>T和1039C>T中的一种;1611T>A;1758G>A;2573insC;选自-740C>T、-678G>A、214G>C、221C>A、223C>G、227T>C、232G>C、233A>C、245A>G和2850C>T中的一种;选自-1245insGA、-1028T>C、-377A>G、3877G>A、4388C>T和4401C>T中的一种;1887insTA;2988G>A;4125-4133insGTGCCCACT;2D6删除;和2D6重复。

优选的是,可以确定图34中的变异体的存在。操作(d)中确定的所述变异体基于主要发现于高丽人中的CYP2D6基因中的变异体。因此,它对确定高丽人的CYP2D6基因的单倍型和基因型极具特异性。

操作(d)中所述PCR产物的基因序列中的CYP2D6基因的变异体可以用本领域内已知的多态性分析方法确定。优选的是,可以用SNaPshot分析(参见[Peter M.Vallone等,Int J Legal Med,2004,118:147-157])、电泳分析或它们的组合来确定所述变异体。如果所述CYP2D6中的变异体包含SNP,则可以使用SNaPshot分析。

所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的SNaPshot分析是用基于操作(c)中确定的所述CYP2D6基因的SNP的已知方法设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP位点相邻的已退火基因序列,并在5’端添加了T碱基即可。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。

例如,具有选自参照141~148以及参照152和153的基因序列的引物可以在操作(c)中用于研究图34中的htSNP组合。更优选的是,可以使用具有选自参照141~148以及参照152和153的基因序列的所有引物。然后,通过所述SNaPshot分析扩增的PCR产物的基因序列可以用已知基因测序方法进行分析。所述基因测序方法可以在本领域内的已知方法中灵活选取,优选的是包括自动DNA测序。

在本发明的另一个示例性实施方式中,对根据本发明所选的htSNP组合的可用性进行了确认。在使用图34中的htSNP组合进行所述SNaPshot分析后,分析了所得PCR产物的基因序列。结果,证实本发明的方法能高速地同时确定发现于高丽人中的CYP2D6基因型(参见图40和41)。

可以用本发明所述方法确定的所述CYP2D6基因的基因型包括CYP2D6*1A、CYP2D6*2A、CYP2D6*5、CYP2D6*2N、CYP2D6*10B、CYP2D6*14B、CYP2D6*18、CYP2D6*21B、CYP2D6*41A、CYP2D6*49、CYP2D6*52和CYP2D6*60。各个基因型和与之相对应的变异体如表34中所示。参见表34,例如,所述CYP2D6*1A基因型包含一个野生型,而所述CYP2D6*2A基因型包含野生型CYP2D6基因的基因序列中在SNP 1、SNP 5、SNP 8、SNP 9、SNP 12~SNP 18、SNP 21、SNP 25和SNP 28位点的变异体。所述CYP2D6*5基因型包含2D5删除变异体。当CYP2D6基因从人类染色体中被完全删除后,不再产生酶。所述CYP2D6*2N基因型包含2D6重复变异体。即在同一染色体中至少存在2个CYP2D6基因。

本发明提供了使用基因芯片确定人类CYP2D6基因的基因型的方法。所述方法包括如下步骤:

(a)提取待研究的基因,对所述基因进行多重PCR并得到包含SNP的边界的PCR产物;

(b)用ASPE(等位基因特异性引物延伸)引物进行ASPE反应以鉴定等位基因的特异性碱基;

(c)将所述反应产物与基因芯片相混合;和

(d)分析所述基因芯片。

本发明提供了用于确定SNP的基因型分析芯片(参见图42),所述芯片含有基于Zip编码(Zip Code)寡核苷酸的芯片。

对每个SNP生成一对引物以在操作(b)中进行ASPE反应。所生成的ASPE引物是在3’端包含SNP位点并与等位基因特异性结合的基因序列。所述ASPE引物包含Zip编码,即,朝向5’端具有24bp的寡核苷酸。所生成Zip编码在每个等位基因中含有不同的基因序列。

本发明从文献中公开的基因序列和用生物信息学技术设计的基因序列中选择了最优Zip编码序列,所述最优Zip编码序列经实验验证不与其它样品发生交叉反应。所选序列的Tm为61℃。所生成的Zip编码不互相干扰。所选基因序列具有ΔG值为-2以上的发夹形二级结构。

如果使用所述ASPE引物进行ASPE反应,则含有对应于所述引物的3’端的等位基因的样品与所述引物反应以发生等位基因特异性延伸反应。如果使用与荧光材料Cyanine 5(Cy5)共价结合的dUTP(Cy5-dUTP)来进行所述延伸反应,则只有含对应等位基因的样品会被Cy5荧光材料标记(参见图45)。所述荧光材料不限于Cy5,可以使用其它材料,诸如Cy3、TAMRA、TexasRed、Cy3.5、Rhodamin6G、SyBR Green等。

在本发明的分析芯片上提供了与所述Zip编码互补结合的寡核苷酸探针(cZip Code,互补Zip编码)。因此,可以识别用所述Zip编码引物延伸的样品中包含的每个等位基因(参见图43)。

在所述探针中,在3’端插入了10bp的基因序列作为间隔区来诱导与目标的杂交。例如,所述间隔区序列优选为5’-CAG GCC AAGT-3’。

本发明的所述探针优选包含参照158~184的基因序列。

在操作(c)和(d)中的将所述反应产物与所述基因芯片相混合并分析经混合的所述芯片的方法可以包括本领域内已知的方法。所用的DNA芯片扫描仪可以变化。更优选的是,使用Axon公司生产的GenePix 4100B扫描仪。扫描的图片可以用GenePix Pro 6.0软件进行分析。

如果用本发明所述基因芯片分析所述CYP2D6基因的变异体,则其结果与用序列分析所验证的结果相同。因此,本发明的基因芯片可以低成本分析各种基因的变异体。

4.PXR

本发明的方法使用基于高丽人PXR基因中的变异体选择的htSNP来确定PXR基因中的功能性变异体。

本发明所述的选择人类PXR基因的htSNP的方法包括如下步骤:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类PXR基因或其片段;

(d)对操作(c)中所得PCR产物测序以确定变异体的存在;

(e)确定操作(d)中已证实具有变异体的PCR产物的基因序列中的单倍型;和

(f)用SNPtagger软件对操作(e)中所确定的单倍型进行测序并选择htSNP。

所述从操作(a)收集的样本中提取核酸的方法没有限制,是本领域内的已知方法。作为另外一种选择,可以使用提取试剂盒来提取所述核酸。例如,可以使用由Qiagen公司(美国)和Stratagene公司(美国)生产的DNA或RNA提取试剂盒。如果提取的是RNA,则通过逆转录生产cDNA待用。

操作(c)中的所述人类PXR基因的片段是指包含人类PXR基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。扩增所述人类PXR基因或其片段的引物可以基于人类PXR基因或其片段的基因序列来设计,并且所述引物可以选自参照221~240的引物,但不限于此。

操作(d)中所述的变异体包括SNP、基因删除和基因重复,但不限于此。例如,所述变异体可以包括22种变异体,如表48。

操作(d)中确定变异体的存在的方法可以包括本领域内已知的变异体检测方法。优选的是,可以进行基因测序、电泳分析和RFLP分析来确定所述变异体的存在。所述基因测序可以通过自动DNA测序仪或焦磷酸测序进行。

可以通过比较野生型PXR基因的基因序列来确定操作(d)中变异体的存在。可以使用所述野生型PXR基因的基因序列,例如参照2200的基因序列(基因库登录号:NT_005612)或本领域内已知的每个PXR基因型的基因序列。另外,还可用RFLP分析来比较所述野生型PXR基因的限制性酶的切割相。所述PXR基因的删除或重复可以通过对PCR产物的电泳分析来确定。

操作(d)中证实含有变异体的PCR产物的基因序列中的单倍型的频率和类型可以使用本领域内已知的技术程序或市场上销售的程序来分析。例如,可以使用免费分发的Haploview,或商业化程序SNPAlyze。所述Haploview软件是本领域内已知的,而更优选的是,可以从http://www.broad.mit.edu/mpg/haploview下载所述软件。

本发明的方法可以另外包括对操作(a)~(e)的重复。为了确定诸如种族或者病人等特定群体内的PXR基因的变异相及其单倍型,可以在检测完PXR基因型的频率并从所述群体中选出频繁PXR基因型之后执行操作(f)。

在操作(f)中,用SNPtagger软件对操作(e)中确定的单倍型测序来选择htSNP。所述SNPtagger软件在本领域内是已知的,例如Genehunter、Merlin、Allegro、SNPHAP、htSNP finder(基于PCA),更优选的是,所述软件可以从http://www.well.ox.ac.uk/~xiavi/haplotvpehttp://slack.ser.man.ac.uk/Drogs/htsnp.html下载。

可以验证所选htSNP来改善精度从而确定二倍型。当由双链染色体确定人类的基因型后,将所述基因型解码以确定两种单倍型组合。如果同时确定数个SNP,则特定单倍型的组合可能和另一个单倍型的组合相同。如果所述基因型由根据本发明所开发的诊断解码,则应该验证它是否准确确定了所述基因型。可以用Matlab(迈斯沃克软件有限公司,美国)来分析是否由基因分析结果对所述基因型进行了正确的解码,从而进行所述验证。

在本发明的一个示例性实施方式中,首先研究了高丽人PXR基因中的变异体以选择htSNP,高丽人PXR基因的功能性变异体。结果,在高丽人的PXR基因中共发现了22个SNP(参见表48)。

在本发明的另一个示例性实施方式中,用DYNACOM公司生产的SNPAlyze软件确定了22个所选SNP中的6个功能性变异体的单倍型,从而确定了总共14个单倍型(参见表49)。

在本发明的另一个示例性实施方式中,用SNPtagger软件对所述14个单倍型进行测序以选择htSNP,亦即可方便地确定发现于高丽人中的PXR基因的功能性变异体的最小标记(参见图47)。

可以使用根据本发明选择的htSNP组合来确定人类PXR基因的功能性变异体。因此,本发明提供了确定人类PXR基因的功能性变异体的方法。所述方法包括如下步骤:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)用引物进行PCR,该反应使用操作(b)中所提取的核酸作为模板来扩增人类PXR基因或其片段;和

(d)在操作(c)中所得的PCR产物的基因序列中确定PXR基因中功能性变异体的存在,所述变异体选自-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C。

操作(b)中的所述从收集的样本中提取核酸的方法与上述相同。

所述人类PXR基因的片段是指包含人类PXR基因的已知变异体的片段,例如,单核苷酸多态性(SNP)。可以用于操作(c)的引物可以选自参照242~247的引物,但不限于此。

操作(d)中研究的所述SNP基于发现于高丽人中的PXR基因的功能性变异体,它对确定高丽人PXR基因的功能性变异体和所述功能性变异体的单倍型极具特异性。

可以用本领域内已知的多态性分析方法来确定操作(d)中所述PCR产物的基因序列中的PXR基因的变异体的存在。优选的是,可以用SNaPshot分析(参见[Peter M.Vallone等,Int J Legal Med,2004,118:147-157])、电泳分析或它们的组合,更优选的是用SNaPshot分析来确定所述变异体的存在。

所述SNaPshot分析是指通过用引物进行PCR反应来确定基因型的方法,所述引物含有在SNP位点附近的已退火基因序列(除SNP区域以外)和ddNTP。本发明中使用的SNaPshot分析是用基于操作(d)中研究的所述PXR基因的SNP的已知方法设计和制造的。所用SNaPshot是可变的,只要其含有紧邻SNP位点的碱基作为3’端,包含与所述SNP位点相邻的已退火基因序列,并在5’端添加了T碱基即可。更优选的是,引物可以选自参照242~2457的引物。优选的是,所述与SNP位点相邻的已退火基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为可变。例如,在所述5’端添加5个T碱基以使引物的大小不同,从而改变所述PCR产物的长度。然后,将所述SNaPshot引物与和每个SNP互补的ddNTP结合。所述组合物因所述SNP的不同而大小不同。因此,可以同时确定数个SNP。

为了确定使用所述SNaPshot分析的基因分型结果是否正确,采用了另一种基因分型方法。另一种基因分型方法没有限制,优选包括自动DNA测序或焦磷酸测序。

在本发明的另一个示例性实施方式中,对本发明所选的htSNP组合的可用性进行了确认。使用图47中的htSNP组合进行所述SNaPshot分析,并分析了所得PCR产物的基因序列。结果,证实本发明的方法能高速地同时确定发现于高丽人中的PXR基因功能性变异体(参见图48~50)。

可以用本发明的方法确定的所述PXR基因的功能性变异体包括-25385C>T、-24113G>A、7635A>G、8055C>T、11156A>C和11193T>C。

5.UGT1A

根据本发明确定人类UGT1A基因的功能性变异体的方法包括如下步骤:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)使用操作(b)中所提取的核酸个别地扩增人类UGT1A基因;和

(d)对操作(c)中扩增的所述基因进行测序并确定UGT1A基因的功能性变异体的存在,所述变异体选自:UGT1A1基因中的-39(TA)6>(TA)7、211G>A,233C>T和686C>A;UGT1A3基因中的31T>C、133C>T和140T>C;UGT1A4基因中的31C>T、142T>G和292C>T;UGT1A6基因中的19T>G、541A>G和552A>C;UGT1A7基因中的387T>G、391C>A、392G<A、622T>C和701T>C;和UGT1A9基因中的-118T9>T10、726T>G和766G>A。

本发明的确定UGT1A基因的与对依立替康的敏感性相关的多态性的方法包括如下步骤:

(a)从人类中收集生物样本;

(b)从操作(a)中所收集的样本中提取核酸;

(c)使用操作(b)中所提取的核酸个别地扩增人类UGT1A基因;和

(d)对操作(c)中扩增的所述基因进行测序并确定UGT1A遗传变异体的存在,所述变异体选自:UGT1A1基因中的211G>A、233C>T和686C>A;UGT1A6基因中的19T>G、541A>G和552A>C;和UGT1A9基因中的-118T9>T10、726T>G和766G>A。

本发明的方法采用了基于主要发现于高丽人的UGT1A基因的多态性而选择的最优多态性标签组,并确定了UGT1A基因中的功能性变异体或药物敏感性。与现有方法相比,本发明的方法对分析高丽人的UGT1A基因而言在时间和成本上具有有效性。

在本发明的操作(a)中,所述生物样本采自人类,优选的是包括高丽人、中国人和日本人在内的亚洲人,而更优选的是高丽人。所述生物样本可以包括血液、皮肤细胞、粘液细胞或毛发,更优选的是血液。

在本发明的操作(b)中,所述核酸提取自操作(a)中收集的生物样本。所述核酸可以包括DNA或RNA,优选的是DNA,更优选的是基因组DNA。从所收集的样本中提取核酸的工艺没有限制,可以根据本领域内已知的技术进行。作为另外一种选择,可以使用DNA或RNA提取试剂盒,例如由Quiagen公司(美国)和Stratagene公司(美国)生产的试剂盒。

在本发明的操作(c)中,使用操作(b)中提取的核酸作为模板并用引物扩增了所述UGT1A基因。如果操作(b)中提取的核酸是RNA,则将该RNA经逆转录转化为cDNA以用作模板。所述引物由已知方法基于人类UGT1A基因或其片段的基因序列设计和制造。

在本发明的操作(c)中,优选的是扩增UGT1A1、UGT1A3、UGT1A4、UGT1A6、UGT1A7和UGT1A9基因来确定UGT1A基因中的功能性变异体。优选的是,扩增UGT1A1、UGT1A6和UGT1A9基因来确定UGT1A基因的决定了对依立替康的敏感性的多态性。

在本发明的操作(d)中,使用操作(c)中所扩增的UGT1A基因来分析所述功能性变异体或与UGT1A基因的药物敏感性相关的多态性。可以使用本领域内已知的多态性分析方法来分析所述功能性变异体或多态性。例如,可以进行SNaPshot分析、电泳分析、焦磷酸测序或上述方法的组合。

具体而言,如果待分析的UGT1A基因的变异体包含SNP,则优选的是SNaPshot分析。在SNaPshot分析中,使用可以使与SNP位点相邻的区域退火的引物和ddNTP来进行PCR反应。SNaPshot分析中使用的所述引物由基于UGT1A基因的SNP的已知方法设计和制造。例如,设计和制造引物使得紧邻SNP位点的碱基是3’端,包含与所述SNP位点相邻的已退火基因序列,且在5’端添加了T碱基。优选的是,所述已退火的基因序列的长度大约为20bp。如果同时确定数个SNP,则所述SNaPshot引物5’端的T碱基的长度被设计为不同,从而改变所述PCR产物的长度。

含参照2905~314的基因序列的引物可以用来进行确定UGT1A基因的功能性变异体的SNaPshot分析。含参照315~322的基因序列的引物可以用来进行确定UGT1A基因的与对依立替康的敏感性相关的多态性。

由所述SNaPshot分析扩增的PCR产物的基因序列可以用已知测序方法分析。优选的是,所述PCR产物的基因序列可以用自动测序方法来分析,但不限于此。

如果待分析的UGT1A基因变异体不是SNP(例如,UGT1A1基因中的-39(TA)6>(TA)7),则可以进行已知的焦磷酸测序来代替所述SNaPshot分析。所述焦磷酸测序评价在DNA聚合时释放的PPi(无机焦磷酸盐)的表达。在本发明的一个示例性实施方式中,可以使用含参照292~294的基因序列的引物来进行焦磷酸测序以确定UGT1A1基因的-39(TA)6>(TA)7。

下文将对本发明的示例性实施方式进行详细说明。下述示例性实施方式对本发明进行了示例性说明,但本发明并不限于下述示例性实施方式。

<CYP1A2>

示例性实施方式1:确定高丽人CYP1A2基因的基因型

<1-1>CYP1A2基因的扩增

从48个健康对象采集血液后,使用Qiagen公司生产的基因组DNA分离试剂盒将DNA从血液中分离。所述CYP1A2基因包含7个外显子(exon),且大约为11kb长。将所述CYP1A2基因分为15个片段进行PCR。在每个PCR中使用的引物如表1所示。在本说明书中的基因序列中所写的A、T、G和C是指腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。

[表1]用于扩增CYP1A2基因及其基因序列的引物

所述引物的位置和所述PCR产物的大小如表2所示。核苷酸的位置根据细胞色素P450(CYP)等位基因命名委员会(http://www.cypalleles.ki.se/cyp1a2.htm)的命名方法书写。

[表2]引物位置和PCR产物大小

PCR片段对应的反应条件如表3所示。

[表3]PCR反应条件

 

PCR产物反应条件CYP1A2p794℃ 4分钟,(94℃ 30秒,55℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2p694℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2p594℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2p494℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2p394℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2p294℃ 4分钟,(94℃ 30秒,68.5℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2plela94℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2plelb94℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 45秒)35周期,72℃ 5分钟CYP1A2e2a94℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e2b94℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e394℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e494℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e594℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e694℃ 4分钟,(94℃ 30秒,60℃   30秒,72℃ 40秒)35周期,72℃ 5分钟CYP1A2e794℃ 4分钟,(94℃ 30秒,58℃   30秒,72℃ 40秒)35周期,72℃ 5分钟

<1-2>PCR产物测序

用自动DNA测序仪对由示例性实施方式<1-1>得到的PCR产物进行测序。所用引物如表4中所示。

[表4]测序用引物

用自动DNA测序仪分析了根据示例性实施方式<1-1>扩增的CYP1A2基因的完整基因序列。在将其与野生型CYP1A2基因(参照1)的基因序列比较后,共发现了17个SNP。其结果如表5中所示。经确认SNP-2603insA为新型SNP。

[表5]发现于高丽人中的CYP1A2基因变异体

 

SNP命名rs编号氨基酸变异体频率(%)-3860G>A*1C27.08-3598G>T20695199.38-3594T>G20695209.38-3113G>A206952112.50-2847T>C206952211.46-2808A>C125924801.04-2603insA-1.04-2467delT*1D-43.75-1708T>C20695256.25-739T>G*1E7.29-163C>A*1F76255155.211514G>A*13-G299S1.042159G>A247230414.582321G>C37434849.383613T>C46464276.255347C>T*1B2470890N516N15.635521A>G14.58

然后,本发明人使用包含所述SNP中发现的遗传变异体的对象的DNA作为模板,用含有参照38和39的引物进行了PCR并用与上述方法相同的方法分析了所述扩增产物的基因序列。其目标是确定所述新型SNP是否位于所述CYP1A2基因的一条单链中,在同一单链中是否存在其它变异体,所述新型SNP是否是由位于该染色体其它部位的相似基因导致的。

结果,发现这一SNP位于启动子的-2603insA处。所述双链DNA的一条链为变异体而另一条链为野生型(图1)。

示例性实施方式2:确定CYP1A2变异体的单倍型

在本发明的示例性实施方式中发现的17种CYP1A2基因变异体根据其组合可能影响CYP1A2酶的活性。已有报道对应于某些单倍型的酶活性的变异体。因此,本发明人用DYNACOM公司的SNPA1yze软件分析了由示例性实施方式1中所确定的变异体引起的单倍型。结果,发现了在其它种族中未曾发现过的新型高丽人单倍型,如表6所示。

[表6]

示例性实施方式3:htSNP的选择和验证

有报道称所述几个单倍型,即CYP1A2基因的SNP的组合,可能影响CYP1A2酶的活性。可以用最小标记检查所生成的单倍型的具体信息。所述最小标记称为htSNP,是准确标记单倍型所必需的,且包含数种组合。用SNPtagger软件(http://www.well.ox.ac.uk/~xiayi/haplotype)选择了所述htSNP组合,亦即最优标签组。所选的htSNP组合的实例如图2~6中所示。所选htSNP组合是最优标签组之一,其中“1”是指野生型,“2”是变异体而‘V’是指所选htSNP。htSNP组合的选择可以与图2~6中的htSNP组合不同。

用Matlab软件(7.1版,迈斯沃克软件有限公司,美国)分析发现的所述组合来确定二倍型和基因型而两者不相互重合。分析结果用于确定所述组合。

根据验证结果,可以确定二倍型和基因型,两者不相互重合。这指的是,本发明所选的htSNP组合不相同,且确定基因型的所述分析是绝对正确的。

示例性实施方式4:在CYP1A2启动子中快速搜索遗传变异体

在示例性实施方式1中确定的发现于高丽人中的CYP1A2基因中的17个SNP中,进行SNaPshot分析来高速搜索影响CYP1A2酶活性的11个启动子SNP。使用对象的DNA作为模板进行PCR,然后对扩增产物进行SNaPshot分析。所述CYP1A2基因的启动子大约为4,000碱基,而用于PCR的引物如表7所示。

[表7]引物名称和基因序列

所述PCR产物的反应条件如表8所示。

[表8]PCR反应条件

 

PCR产物反应条件CYP1A2_promoter94℃ 1分钟,(98℃ 10秒,55℃ 30秒,68℃ 4分钟)35周期,72℃ 5分钟                                                       

不与扩增后PCR产物反应的剩余引物和dNTP可能影响所述SNaPshot分析。为了除去剩余引物和dNTP,将5μL PCR产物与2μLExoSAP-IT(USB生产)混合以在37℃反应30分钟,然后于80℃再反应15分钟以使剩余的酶失活。使用产物与表9中的引物进行PCR来制成多重SNaPshot反应物。所述多重SNaPshot反应物和PCR反应条件如表10和表11中所示。

[表9]引物名称及其基因序列

 

引物名称基因序列(5′→3′)参照-163C/A_F(24)TTTTAAAGGGTGAGCTCTGTGGGC64-739T/G_F(20)GCCTGGGCTAGGTGTAGGGG65-2847T/C_F(32)TTTTTTTTTTTTGCCTTCAAACATGCTCTGTT66-2808A/C_R(36)TTTTTTTTTTTTTTTTAAAACTGTGGGATCAACCTG67-1708T/C_F(40)TTTTTTTTTTTTTTTTTTTTAACCATTCAAAAGGAGGTTG                                  68-3860G/A_R(44)TTTTTTTTTTTTTTTTTTTTTTTTGCATGACAATTGCTTGAATC                                69-3113G/A_F(48)TTTTTTTTTTTTTTTTTTTTTTTTTTTTCAAGAGGAATCCAAAGAGAC                            70-2603A7/A8_R2(52)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTAAACATTTTTTT                          71-3594T/G_R(56)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTTTTAATGTTTTCTT                      72-3598G/T_F(60)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTGTAATTTAATTTTTTTAA                    73-2467delT_F(64)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAGCCATGATTGTGGCACA                74

[表10]多重SNaPshot反应物

[表11]

 

PCR产物反应条件SNaPshot产物(96℃ 10分钟,50℃ 5秒,60℃ 30秒)30周期

反应进行完全后,将2μL SAP(USB)与5μL SNaPshot产物混合,在80℃反应15分钟,从而除去[F]ddNTP。然后将0.5μL反应物、9.25μLHi-Di甲酰胺(ABI)和0.25μL GeneScan-LIZ规模标准物(ABI)于95℃混合5分钟以使其变性。然后,用3130XL基因分析仪(3130XL GeneticAnalyzer,ABI)分析所述混合物。所得分析结果如图7~14中所示。

如图中所示,根据所述CYP1A2基因的变异体的不同而显示不同的峰的颜色和位置,从而易于辨认野生型、具有杂合等位基因的变异体(杂合)和具有纯合等位基因的变异体(纯合)。本发明所述分析方法节省成本和时间,且能方便地分析所述CYP1A2基因变异体。

<CYP2A6>

示例性实施方式5:确定高丽人2A6基因的基因型

<5-1>2A6基因的扩增

从50个健康对象采集血液后,使用Qiagen公司生产的基因组DNA试剂盒将DNA从血液中分离。所述CYP2A6基因包含9个外显子,且大约为6.9kb长。将所述CYP2A6基因分为7个片段进行PCR。PCR所用引物如表12所示。在本说明书中的基因序列中所写的A、T、G和C是指腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。

[表12]用于扩增CYP2A6基因的引物及其基因序列

*:从文献[Drug Metab.Pharmacokin,17(5):SNP18(482)-SNP23(487)(2002)]中引用的引物

所述引物的位置和所述PCR产物的大小如表13所示。核苷酸的位置根据细胞色素P450(CYP)等位基因命名委员会(http://www.cypalleles.ki.se/cyp1a2.htm)的命名方法书写。

[表13]引物位置和PCR产物大小

PCR片段对应的反应条件如表14所示。

[表14]PCR反应条件

 

PCR产物反应条件CYP2A6_exon194℃ 5分钟,(94℃ 30秒,63℃ 30秒,72℃ 65秒)35周期,72℃ 5分钟CYP2A6_exon294℃ 4分钟,(94℃ 30秒,63℃ 30秒,72℃ 50秒)35周期,72℃ 5分钟CYP2A6_exon3,494℃ 4分钟,(94℃ 30秒,60℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟CYP2A6_exon594℃ 4分钟,(94℃ 30秒,63℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟CYP2A6_exon694℃ 4分钟,(94℃ 30秒,63℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟CYP2A6_exon7,8               94℃ 5分钟,(94℃ 30秒,66℃ 30秒,72℃ 60秒)35周期,72℃ 5分钟CYP2A6_exon994℃ 4分钟,(94℃ 30秒,66℃ 30秒,72℃ 60秒)35周期,72℃ 5分钟

<5-2>PCR产物测序

用自动DNA测序仪和含有参照76~89的引物对由示例性实施方式<5-1>得到的PCR产物进行测序。

在将其与野生型CYP2A6基因的基因序列(参照75)比较后,共发现27个SNP。27个SNP中有2个为新型SNP。通过基因删除的结构分析发现了3个SNP。总共30个SNP如表5中所示。

[表15]发现于高丽人中的CYP2A6基因变异体

 

SNP等位基因位置氨基酸变异体频率(%)-495A>G#启动子1.19-48T>G启动子28.5713G>A外显子1G5R1.1922C>T外显子1L8L25.0051G>A*1B12外显子1V17V14.29144G>A外显子1Q48Q1.19237G>A内含子1.19411C>T内含子1.19567C>T外显子2R101X1.191620T>C内含子84.521836G>T内含子15.481890G>C内含子1.192134A>G外显子4K194E2.383391T>C*11外显子5S224P1.193492C>T外显子5R257R1.193570C>G内含子1.195336G>A内含子1.195628C>T内含子2.385636A>C内含子2.386218A>G内含子1.196282A>G内含子2.386293T>C内含子2.386354T>C内含子30.956458A>T#外显子9N438Y3.576558T>C*7外显子9471T20.236582G>T*5外显子9G479V1.196600G>T*8外显子9R485L5.955971G>A+*4基因删除16.005983T>G+*4基因删除16.006091C>T+*4基因删除16.00

在表15中,“+”标记了发现于因CYP2A6基因删除所致而结合了部分CYP2A6基因和CYP2A7基因的基因中的变异体(参见图33,CYP2A6基因的外显子1~8被除去,而所述CYP2A6基因的外显子9部分替换了CYP2A7基因的外显子9端)。在假设所述CYP2A6基因以整体存在的前提下,根据基因序列对所述SNP编号(由于CYP2A6基因被删除,所以所述SNP并非是针对CYP2A6基因的)。

为了使用所述SNP确定被删除的单倍型,在CYP2A6和CYP2A7基因的相同基因序列内的5’位点设计了正向引物,而在外显子9中设计了逆向引物,所述外显子9对CYP2A6基因具有特异性但不扩增CYP2A7基因。因此,整个CYP2A6基因或因所述CYP2A6基因被删除而与所述CYP2A7基因相结合的基因可被扩增,而所述CYP2A7基因不被扩增。

从扩增的PCR产物中选择对于CYP2A6和CYP2A7基因具有特异性的碱基。在所述CYP2A6基因的翻译起始密码子ATG的基础上,所述CYP2A6基因的6091C/T碱基的边界(参照75)与CYP2A7基因的6521T的边界(参照104)相似。不仅是6091,CYP2A6基因序列中的5971G和5983T都与所述CYP2A7基因不同。

*”是指被国际CYP命名委员会认可为等位基因的变异体。例如,*11是指含与野生型相比第224位氨基酸由丝氨酸变为脯氨酸的变异体的单倍型。所述国际命名方法参见http://www.cypalleles.ki.se/cyp2a6.htm。在表中,“#”指新型变异体。

示例性实施方式6:确定CYP2A6基因的基因型的单倍型

示例性实施方式5中的27个CYP2A6遗传变异体和3个CYP2A6删除标记的变异体取决于其组合方式而可能影响CYP2A6酶的活性。因此,本发明人用DYNACOM公司的SNPAlyze软件分析了示例性实施方式5中所确定的变异体的单倍型。通常,选择具有5%或10%以上的频率的变异体来预测单倍型的分布,因为低频率变异体很难保证统计显著性。然而,导致氨基酸替换的变异体即使频率较低仍具有显著功能性。因此,在本发明中,使用了6个高频变异体-48T>G、22C>T、51G>A、1620T>C、1836G>T和6354T>C以及8个导致氨基酸替换的变异体13G>A、567C>T、2134A>G、3391T>C、6458A>T、6558T>C、6582G>T和6600G>T来确定所述单倍型。在分析中添加了可以标记基因删除的变异体5971G>A、5983T>G和6091C>T。共使用了17个变异体来确定所述单倍型。因此,高丽人中的20个单倍型的分布如图15中所示。

示例性实施方式7:htSNP的选择和验证

有报道称,数个单倍型,即CYP2A6基因的SNP组合,可能影响CYP2A6酶的活性。可以用最小标记检查所生成的单倍型的具体信息。所述最小标记称为htSNP,是准确标记单倍型所必需的,且包含几种组合。用SNPtagger软件(http://www.well.ox.ac.uk/~xiayi/haplotype)分析了根据示例性实施方式6选择的20个单倍型的基因序列以选择所述htSNP组合,亦即最优标签组。

结果,选中的htSNP组合如图16~21中所示。所选htSNP组合是最优标签组,其中“1”是指野生型,“2”是变异体而“V”是指所选htSNP。

如果通过所述htSNP分析确定了所述变异体的基因型,则其单倍型可以根据分析结果预测。然而,不同单倍型的组合可能具有相同的基因型。用Matlab软件(7.1版,迈斯沃克软件有限公司,美国)分析发现的所述组合来确定二倍型和基因型,两者不相互重合。

根据所得结果,根据本实施方式选择的htSNP可以确定相互不重合的单倍型。这意味着,根据本发明选择的htSNP组合互不相同,且确定基因型的所述分析是绝对正确的。

示例性实施方式8:在CYP2A6基因中快速搜索功能性变异体

在示例性实施方式5中确定的发现于高丽人中的27种CYP2P6基因的变异体和3种标记CYP2A6基因删除的变异体中,改变功能性的所述CYP2A6基因的基因型可以用于确定基因。进行SNaPshot分析来高速搜索10种功能性变异体,所述SNaPshot分析是CYP2A6基因的高速基因分型技术之一。所述10种功能性变异体包括9种改变氨基酸或确认具有功能性的变异体-48T>G、13G>A、567C>T、2134A>G、3391T>C、6458A>T、6558T>C、6582G>T和6600G>T,和标记基因删除的变异体6091C>T。在图16的htSNP组合当中,选中的htSNP包括10种具有功能性的变异体。所述变异体的位置如表17所示。

[表17]由本发明的htSNP组合选出的变异体的位置

 

变异体位置htSNP 1SNP 1-48T>GhtSNP 2SNP 213G>AhtSNP 3SNP 5567C>ThtSNP 4SNP 82134A>GhtSNP 5SNP 93391T>ChtSNP 6SNP 116458A>T

 

htSNP 7SNP 126558T>ChtSNP 8SNP 136582G>ThtSNP 9SNP 146600G>ThtSNP 10SNP 156091C>T

具体而言,使用对象的DNA作为模板进行PCR,然后对扩增产物进行SNaPshot分析。用于PCR的引物如表18所示。

扩增CYP2A6_long的引物扩增了CYP2A6基因的整个长度。因此,它们不能用于CYP2A6基因删除。为了确定标记基因删除的6091C>T,应该使用一对引物CYP2A6delF和CYP2A6delR来扩增CYP2A6*4产物。

[表18]引物名称和基因序列

所述PCR产物的反应条件如表19所示。

[表19]PCR反应条件

 

PCR产物反应条件CYP2A6_long94℃ 1分钟,(98℃ 20秒,62℃ 30秒,72℃ 7分钟30秒)30周期,72℃ 10分钟CYP2A6*494℃ 5分钟,(94℃ 30秒,58℃ 30秒,72℃ 1分钟20秒)35周期,72℃ 7分钟

不与扩增的PCR产物反应的剩余引物和dNTP可能影响所述SNaPshot分析。为了除去剩余引物和dNTP,将5μL PCR产物与2μLExoSAP-IT(USB生产)混合,于37℃反应30分钟,然后于80℃再反应15分钟以使剩余的酶失活。使用所述经酶处理的产物与表20中的引物进行PCR来制成多重SNaPshot反应物。所述多重SNaPshot反应物和PCR反应条件如表21和表22中所示。

[表20]引物名称及其基因序列

 

引物名称基因序列(5′→3′)参照Mu_-48T>GGGCTGGGGTGGTTTGCCTTT92Mu_13G>A_FTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTACCACCATGCTGGCCTCA                    93Mu_567C>T_RTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAAGGTGGCTTGCTCGCCTC                 94Mu_2134A/G_RTTTTTTGACAGGAACTCTTTGTCCT95Mu_3391T/C_FTTTTTTTTTTCCCAGCTCTATGAGATGTTC96

 

Mu_6458A>T_RTTTTTTTTTTTTTTTCAGGCCTTCTCCGAAACAGT97Mu_6558T/C_FTTTTTTTTTTTTTTTTTTTTCTCCCAGTCACCTAAGGACA                                  98Mu_6582G>T_FTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCGTGTCCCCCAAACACGTGG                        99Mu_6600G/T_RTTTTTTTTTTTTTTTTTTTTTTTTTGGAAGCTCATGGTGTAGTTT                               100Mu1ti2A6/7_6091C>T_F            CAGTCATATTTGCAAGTGT101

[表21]多重SNaPshot反应物

(“+”1/2终点缓冲液的组成:200mM Tris-HCl,5mM MgCl2,pH 9;Nucleic Acids Research,30(15):74,2002)

[表22]

 

PCR产物反应条件SNaPshot产物(96℃ 10秒,50℃ 5秒,60℃ 30秒)40周期

反应完成后,将1μL SAP(USB)与10μL SNaPshot产物混合,于37℃反应60分钟,然后于65℃反应15分钟,从而除去剩余ddNTP。然后将0.5μL反应物、9.3μL Hi-Di甲酰胺(ABI)和0.2μL GeneScan-LIZ规模标准物(ABI)于95℃混合5分钟以使其变性。然后,用3130XL基因分析仪(ABI)分析所述混合物。所得分析结果如图22~30中所示。所述基因型的分析如表23所示。

[表23]

如图22~30中所示,在每个SNP中峰的颜色和大小相同。峰的颜色和大小随所述CYP2A6基因的功能性变异体的不同而不同,从而易于辨认野生型、具有杂合等位基因的变异体(杂合)和具有纯合等位基因的变异体(纯合)。在图22~30的图中,X轴是指因引物长度差异造成的引物在自动DNA测序仪中的移动距离,而Y轴是指各碱基中包含的具有特定波长的荧光材料所发出的荧光的强度。

图31和图32说明了与图22~30中的基因研究一同进行的SNaPshot分析,从而研究除图22~30中的遗传变异体以外的CYP2A6基因删除。图31说明了通常存在于同源染色体中的CYP2A6基因,而图32说明了不存在于一个染色体中且只有一个基因的CYP2A6。

用根据本发明开发的SNaPshot分析分析了50个样本及其全长序列。根据所述分析,基因分型结果100%相同。也即是说,本发明所述方法具有高再现性并且准确。

因此,可以用本发明所述分析方法方便地确定CYP2A6基因的功能性变异体且节省时间和成本。

所述方法确定了10个主要发现于高丽人中的CYP2A6单倍型且同时用所述组合快速确定了所述CYP2A6基因型。由于包括了发现于高丽人中的遗传变异体,因此所述分析方法在确定基因型方面是非常准确的。另外,所述方法可以分析具有与高丽人非常相似的遗传学特性的日本人的几乎所有基因型。另外还认为所述方法可以用于确定90%以上的中国人的CYP2A6基因型。

<CYP2D6>

示例性实施方式9:确定高丽人的CYP2D6基因的基因型

<9-1>基因组DNA的分离

使用基因组DNA分离试剂盒(Giagen)从采自174个高丽人的血液样本中分离基因组DNA。

<9-2>CYP2D6基因的扩增和全长测序

从示例性实施方式<9-1>中分离的共174个基因组DNA样品中随机选取51个样品用作模板。使用一对引物进行PCR以扩增人类CYP2D6基因的9个外显子和1.8kb启动子。

[表24]用于基因扩增的引物

 

引物名称基因序列(5′→3′)参照CYP505CACTGGCTCCAAGCATGGCAG1063′2D6ACTGAGCCCTGGGAGGTGGTA107

所述PCR在94℃进行1分钟,在98℃进行10秒,在64℃进行30秒,并在72℃进行7分钟,如此运行30周期,并最终在72℃进行10分钟。结果,产生了6,569bp的PCR产物(参见表25)。

[表25]引物位置和PCR产物大小

使用扩增的PCR产物作为模板,用表26中的共13个引物分析扩增的CYP2D6基因的基因序列。

[表26]用于全长测序的引物

 

引物名称基因序列(5′→3′)参照CYP505CACTGGCTCCAAGCATGGCAG1063′2D6ACTGAGCCCTGGGAGGTAGGTA107CYP507AACGTTCCCACCAGATTTC108CYP509GTAAGTGCCAGTGACAGATAAG1092d6-11AGGATCCTTTGTTCAGGATATGTTGC1102d6-12CACCAAGTACCCCACTTCCC1112d6-1CATGTGGACTTCCAGAACACACC1122d6-2GGTTCAAACCTTTTGCACTG1132d6-3GTCGTGCTCAATGGGCTG1142d6-4AAGGTGGATGCACAAAGAGT1152d6-5GACCTAGCTCAGGAGGGACT1162d6-6AGCTGGATGAGCTGCTAACT1172d6-7CCTGACCTCCTCCAACATAG1182d6-8CACCTAGTCCTCAATGCCAC1192d6-9GAGTCTTGCAGGGGTATCAC120

<9-3>针对各基因型的分别分析

对于剩余的123个示例性实施方式<9-1>中所分离的基因组DNA样品,分别分析了主要发现于亚洲人中的变异体*2A、*5、*2N、*10B、*14B、*18、*21B、*41A、*49、*52和*60的基因型。

a)CYP2D6*5的分析

为了确定所述CYP2D6*5基因型,使用表27中的引物进行PCR。所述PCR在94℃进行1分钟,在98℃进行10秒,在64℃进行30秒,并在72℃进行5分钟,如此运行30周期,然后在72℃进行10分钟。结果,对于野生型,扩增了包含9个外显子的5.1kb PCR产物。对于CYP2D6*5变异体,扩增了3.5kb PCR产物。

[表27]引物的基因序列和位置及PCR产物的大小

b)CYP2D6*2N的分析

为了确定所述CYP2D6*2N基因型,使用表28中的引物进行PCR。所述PCR在94℃进行1分钟,在98℃进行10秒,在64℃进行30秒,并在72℃进行8分钟,如此运行30周期,然后在72℃进行10分钟。结果,对于CYP2D6*2N变异体,产生了7.8kb PCR产物。

[表28]引物的基因序列和位置及PCR产物的大小

c)CYP2D6*2和*41的分析

除-1584C>G变异体之外,CYP2D6*2基因型和CYP2D6*41基因型包含相同的变异体(-1235A>G;-740C>T;-678G>A;在内含子1中基因转换为CYP2D7;1661G>C;2850C>T;4180G>C)。使用表29中的引物用AS-PCR方法(Johanson,Mo1ecular Pharmacology,46:452-459,1994)分析了在内含子1中基因转换为CYP2D7的所述变异体的基因序列。

如果内含子1中发生转换为CYP2D7基因的基因转换,则用含参照129的引物9和含参照125的引物10B进行PCR以产生扩增产物。如果所述CYP2D6*2基因型和CYP2D6*41基因型是正常的,则只有在用含参照129的引物9和含参照130的引物10的组合进行PCR时才会产生扩增产物。因此,可以通过用所述引物9和所述引物10B的组合进行PCR产生的扩增产物的存在来确定内含子1中转换为CYP2D7基因的所述基因转换。

所述PCR在94℃进行5分钟,在94℃进行30秒,在64℃进行30秒,并在72℃进行30秒,如此运行35周期,然后在72℃进行10分钟。用表29中的测序引物对-1584C>G变异体进行焦磷酸测序。确定了-1584G是CYP2D6*2基因型而-1584C是CYP2D6*41基因型。

[表29]引物的基因序列

d)CYP2D6*10B、*14、*18和*49基因型的分析

用PCR-RFLP方法(Johanson,Molecular Pharmacology,46:452-459,1994;Wang,Drug Metabolism and Dispososition,27:385-388,1998;及Geadigk,Pharmacogenetics,9:669-682,1999)分析了所述CYP2D6*10B、*14、*18和*49基因型。所用引物如表30中所示,实验条件如表31中所示。

[表30]针对各基因型的引物的基因序列和位置

[表31]针对各基因型的限制性酶和RFLP相

 

基因型PCR产物大小(bp)       限制性酶野生型的RFLP相(bp)          变异体的RFLP相(bp)          *10B534HphI474+60376+98+60*14b486MspI279+207486

 

*18645 o r654MwoI348+258+39272+258+85+39*49486Sau3A I347+142286+142+61

e)CYP2D6*21、*52和*60基因型的分析

通过PCR-焦磷酸测序分析了所述CYP2D6*21、*52和*60基因型。所述分析所用的引物的基因序列如表32所示。

[表32]针对各基因型的引物的基因序列

基于基因库登录号M33388中公开的CYP2D6基因的基因序列分析了示例性实施方式<9-2>和<9-3>中产生的数据。每个等位基因的频率如表33中所示。

[表33]发现于高丽人中的CYP2D6基因的单倍型

表33中,“Normal”是指正常态,“Incr”是指增加,“Decr”是指降低,而“None”是没有活性。括号中的标注是用于所述分析的标记药物的简写:b是丁呋洛尔(bufuralol);d是异哇胍(debrisoquine);dx是右美沙芬(dextromethorphan);s是司巴丁(sparteine)。

当从主要发现于高丽人中的12种基因型中选择基因后,基于细胞色素P450(CYP)等位基因命名委员会(http://www.cypalleles.ki.se/cyp2d6.htm)的各基因型的变异体如表34中所示。在表34中,“1”是指野生型而“2”指变异体。

[表34]

示例性实施方式10:htSNP的选择和验证

要确定示例性实施方式9中发现于高丽人中的12个CYP2D6基因型,分析表34中的所有33个变异体在成本和时间上不够有效。因此,选择了标记遗传变异体的htSNP来有效地确定所述基因型,所述htSNP具有单倍型的详细信息。所述htSNP必需准确标记每个单倍型,并包含各种组合。用SNPtagger软件(http://www.well.ox.ac.uk/~xiayi/haplotype/)选择所述htSNP组合亦即最优标签组。所选htSNP组合的实例如图34~39中所示。所选htSNP组合是最优标签组,其中“1”是指野生型而“2”是变异体,“V”标记了选中的htSNP。

用Matlab软件(7.1版,迈斯沃克软件有限公司,美国)分析所选组合来确定相互不重合的二倍型和基因型。然后,确定htSNP组合。

根据所述验证结果,可以确定二倍型和基因型而不用使两者相互重合。换言之,根据本发明选择的htSNP组合互不相同,且确定基因型的所述分析是绝对正确的。

示例性实施方式11:SNaPshot分析

使用示例性实施方式10中所选的htSNP组合来进行SNaPshot分析,SNaPshot分析是CYP2D6基因的高速基因分型技术之一。图34中的htSNP组合被选择用于分析。htSNP中包含的变异体的位置如表35所示。对于htSNP1~htSNP3,如果分析了各种变异体的一个SNP,则基因型即可确定。而对于htSNP9,有9个碱基被插入并重复。因此,当分析了第4125~4133位碱基之一并将其与野生型基因的基因序列比较之后即可确定基因型。

[表35]本发明的htSNP组合所选的变异体的位置

 

htSNP变异体位置htSNP 1SNP 2,7,19-1426 C>ThtSNP 2SNP 3,6,10,27,30,313877 G>AhtSNP 3SNP 8,9,12,13,14,15,16,17,18,252850 C>ThtSNP 4SNP 201611 T>AhtSNP 5SNP 221758 G>AhtSNP 6SNP 231887insTAhtSNP 7SNP 242573insChtSNP 8SNP 262988G>AhtSNP 9SNP 294125-4133ins9bphtSNP 10SNP 32删除htSNP 11SNP 33重复

用与示例性实施方式<9-2>中相同的方法扩增所述CYP2D6基因以产生约6.7kb产物。为确定CYP2D6*5,使用含参照154的引物CYP2D6_3(5’ACCTCTCTGGGCCCTCAGGGA-3’)和含参照123的引物3’2D6*5扩增CYP-REP-Del。所述PCR在94℃进行1分钟,在98℃进行10秒,在64℃进行30秒,并在72℃进行3分钟,如此运行30周期,并最终在72℃进行10分钟。结果,产生了6,569bp的PCR产物。

不与扩增的PCR产物反应的剩余引物和dNTP可能影响所述SNaPshot分析。为了除去剩余引物和dNTP,将5μL PCR产物与2μLExoSAP-IT(USB生产)混合,在37℃反应30分钟,然后在80℃再反应15分钟以使剩余的酶失活。将经酶处理的产物和3μL模板(2μL 6.7kb的CYP2D6基因和1μL 3.6kb的CYP-REP-DEL的混合物)、1μLSNaPshot多重预反应混合物(ABI)、4μL 1/2终点缓冲液(200mM Tris-HCl,5mMMgCl2,pH 9)和合并(Pooled)SNaPshot引物混合以制成共10μL反应物。然后,对所述反应物的PCR在96℃进行10秒,在50℃进行5秒,在60℃进行30秒,如此运行40周期。所用合并SNaPshot引物的处理浓度如表36所示。

[表36]合并SNaPshot引物的基因序列和处理浓度

 

引物名称基因序列(5′→3′)浓度(M) 参照2D6-1426RGCCACCACGTCTAGCTTTTT0.051412D6+1611R(P30)TTTTTTTTTTGGGCCCATAGCGCGCCAGGA0.31422D6+1758CGCCTTCGCCAACCACTCC0.21432D6+2573(P38)TTTTTTTTTTTTTTTTTGGGACCCAGCCCAGCCCCCCC                            0.021442D6+2850R(P55)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCAGGTCAGCCACCACTATGC               0.061452D6+2988(P39)TTTTTTTTTTTTTTTTTTTTAGTGCAGGGGCCGAGGGAG                           0.31462D6+3877(P45)TTTTTTTTTTTTTTTTTTTTTTTTTCTGGGCATCCAGGAAGTGTT                       0.31472D6+4125(P50)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCAGCTTCTCGGTGCCCACTG                    0.041482D6+1887R(P60)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTAGGGAGGCGATCACGTTGCT            0.21522D6-5R(P65)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTCTCGTCACTGGTCAGGGGTC       0.05153

反应完成后,将10μL反应物与1μL SAP(USB公司)混合,在37℃反应1小时,然后在65℃反应15分钟。然后将0.5μL反应物、0.2μLLIZ120(ABI)和9.3μL Hi-Di甲酰胺(ABI)混合并置于96孔板。在95℃反应2分钟后,用3130基因分析仪(ABI)分析所述样品。所得分析结果如图40中所示。

如图40所示,每个SNP的峰的颜色和大小都是相同的。可以清楚地鉴定野生型和变异体。

为了用SNaPshot分析来分析CYP2D6基因重复,用相同方法扩增CYP-REP-Dup以产生3.3kb PCR产物,但此处使用含参照155的Dup-F_2(5’-CCTCACCACAGGACTGGCCACC-3’)和含参照156的Dup-R(5’-CACGTGCAGGGCACCTAGAT-3’)。为从所述PCR产物中除去剩余引物,将5μL PCR产物和2μL ExoSAP-IT(USB)混合,在37℃反应30分钟。然后,所述PCR产物在80℃反应15分钟,使所剩ExoSAP-IT失活。将经酶处理的PCR产物与3μL模板、1μL SNaPshot多重预反应混合物、4μL 1/2终点缓冲液和SNaPshot引物(含参照157,CYP2D6-5R,5′-CTCGTCACTGGTCAGGGGTC-3′)混合,制成10μL的反应物,以在相同条件下进行SNaPshot反应。用3100基因分析仪分析所述反应物。分析结果如图41所示。

如图中所示,SNP的峰的颜色和大小是相同的。可以清楚地鉴定野生型和变异体。

通过测序验证了包括野生型和遗传变异体的50个样本。结果100%相同。换言之,本发明所述的方法具有高再现性并且准确。

所述方法确定了12个主要发现于高丽人中的CYP2D6单倍型且同时用所述组合快速确定了CYP2D6基因型。由于包括了发现于高丽人中的遗传变异体,因此所述方法在确定基因型方面是非常准确的。所述方法可以用于确定具有与高丽人非常相似的遗传学特性的日本人的基因型。根据上述结果可以认为所述方法可以用于确定90%以上的中国人的CYP2D6基因型。

示例性实施方式12:用基因芯片确定基因型

<12-1>Zip编码芯片的制作

1)探针的制作

将所述探针设计为具有与用于ASPE PCR反应的Zip编码互补的基因序列。在3’端插入10bp核苷酸序列(5’-CAG GCC AAGT-3’)作为间隔区以诱导与目标的杂交。

在所述间隔区的5’端加入24bpZip编码寡核苷酸。所述探针的基因序列(cZip Code)如表37所示。在这里,表37中的黑体字母是10bp间隔区序列(图43)。

[表37]

 

引物名称基因序列(5′→3′)参照cZip2CAGGCCAAGTATCTTGCGCGGCAGCTCGTCGACCG158cZip7CAGGCCAAGTGTGGTCCATCACAAACAGGGAGTCG159cZip8CAGGCCAAGTCTTGAGCGATGACGGACGGGAAAAG160cZip9CAGGCCAAGTAAGTTGGGGATCTGTAGACCCAGCC161cZip14CAGGCCAAGTGGATTGCACCGTCAGCACCACCGAG162cZip15CAGGCCAAGTTCCCAGGACGGCGCTGGCACGTTGA163cZip16CAGGCCAAGTCGGCGTCCACGTCGAGTTCCTTCGC164cZip19CAGGCCAAGTTTCGGGGAAACTCCGCACCGCCACG165cZip20CAGGCCAAGTTAGGTTTGCCAGTGCGTTGGATCG166cZip21CAGGCCAAGTTCGACAACCCGGTTGGAGGATTCAG167cZip22CAGGCCAAGTCCAAAAGCTTTACGCCAGCGCCGAA168cZip24CAGGCCAAGTAGATCGGTGAGCAGTTCAAAGCCGG169cZip27CAGGCCAAGTGGGTATCCGTTCGGTGTTGCGTAGT170cZip31CAGGCCAAGTTGGTGCTGGCGCAGACCTTTGTCTC171cZip32CAGGCCAAGTACCGCGCAAATGGACAGTGTGGCCA172cZip33CAGGCCAAGTGACCCCAACTTGACACGTCGCAAGG173cZip40CAGGCCAAGTCGTAAGCCTCGTCAGCTATCCGGGG174cZip41CAGGCCAAGTCCAAACGCACCCCAACCTGTCCGGA175cZip44CAGGCCAAGTCGGCGGTGGCATTGTCACTGCTGCT176cZip50CAGGCCAAGTGCAGTTCGTGGCCATGGTGACCGCT177cZip56CAGGCCAAGTCGTTGTGGTAGCGGCACTGGTGGTG178cZip61CAGGCCAAGTCTGGGTGTGGGTGCTCGTACGCCGA179cZip101CAGGCCAAGTCGGCACATAGGACGGGGTTCAGATA180cZip102CAGGCCAAGTGAACAAGATTGGTCCTGGAGGTGCG181cZip104CAGGCCAAGTTCGGATGGCGTTCAGTAGGAGAAGG182cZip106CAGGCCAAGTACACTCTCCATGCGGTAGACCTGAC183cZip109CAGGCCAAGTGAACCTAATGAAGACGGGGGGTGCT184

2)探针的点样和固定

使用涂布有胺的Corning产GAPSII载玻片来制造芯片。使用OmniGrid100点样器用SMP4XP针在所述载玻片上点样。点样条件是22℃和54%的湿度。分别在27个探针上进行双点样。点样过程完毕后,向所述载玻片照射7,500μL/cm2的紫外光以固定所述探针。

3)用于Zip编码测试的基因芯片

使用CYP2D6基因的9个基因型标签(SNP,在表37中以黑体字母标记)验证了11个基因型CYP2D6*1、*2、*5、*10B、*14A、*14B、*18、*21、*41、*49和*2N。

[表38]

 

CYP2D6等位基因碱基变化*1N/A(wt)*21584C>G;1235A>G;2850C>T;4180G>C*5CYP2D6被删除*10B100C>T;4180G>C*14A100C>T;1758G>A;2850C>T;4180G>C*14B1758G>A;2850C>T;4180G>C*184125-4133insGTGCCCACT*211584C>G;1235A>G;2573insC;2850C>T*411584C;1235A>G;2850C>T;4180G>C*491235A>G;100C>T;1611T>A;4180G>C*2NCYP2D6重复

<12-2>目标的制作

1)长PCR

将2μL CYP2D6基因组DNA样品、1X LA缓冲液、2.5mM MgCl2、0.4mM dNTP、0.2pmol/μL表16中的引物、2.5单位的LA标签DNA聚合酶(TAKARA:cat.No.PR002A)和去离子水混合制成50μL。然后使所述混合物在94℃进行1次变性1分钟,然后在98℃反应10秒,在64℃反应30秒,在72℃反应6分钟,并重复30个周期,然后再反应1分钟以便扩增(图44)。(从CYP2D6基因产生了3种对应*5、*2N等位基因和其它等位基因的第一PCR产物。反应条件同上。)

[表39]长PCR引物的基因序列

2)多重PCR

将0.5μL生成的所述长PCR产物、1X AmpliTaq缓冲液、0.2mMdNTP、0.5pmol/μL的各引物和0.5单位的AmpliTaq Gold(AppliedBiosystems:cat.No.N8080242)和去离子水混合制成10μL。使所述混合物在94℃进行1次变性5分钟,然后在94℃反应45秒,在57℃45秒,在72℃反应1分钟并重复30个周期,然后在72℃再反应1分钟以便扩增。第二PCR包括多重PCR。所述PCR产物扩增为4组,如表40所示。引物的基因序列如表41所示。

[表40]多重PCR组

[表41]多重PCR引物(基因组PCR引物)的基因序列

3)ASPE(等位基因特异性引物延伸)反应

将6μL生成的所述多重PCR产物、1X AmpliTaq缓冲液、10μM Cy5dUTP(GeneChem)、125nM的各ASPE引物、1单位AmpliTaq Gold(Applied Biosystems:cat.No.N8080242)、lX Band Doctor(Solgent)和去离子水混合制成20μL。使所述混合物在94℃进行1次变性5分钟,然后在94℃反应30秒,在60℃反应1分钟,在72℃反应1分钟,并重复30个周期来进行扩增(参见图45)。所述ASPE反应组和ASPE引物的基因序列如表42和表43所示。

[表42]ASPE反应组

[表43]ASPE引物的基因序列

4)PCR纯化

将ASPE反应生成的1~4组PCR产物合并,并用Qiagene纯化试剂盒(Qiagen:ca.no.28106)根据制造商手册进行纯化。最终流出体积为50μL。

使用快速真空浓缩机(4080C型,由BioTron制造)将纯化后的PCR产物干燥为1~2μL。

5)芯片的预杂交

在42℃加热预杂交缓冲液(25%甲酰胺、5X SSC、0.1% SDS和10mg/mL BSA)。然后,将芯片浸入所述缓冲液中,并在42℃温育30分钟以上。然后将所述芯片用蒸馏水清洗3次,放入锥管中,并用离心分离机在800rpm下干燥5分钟。

然后,在42℃预热预杂交缓冲液(25%甲酰胺、5X SSC、0.1% SDS、0.5mg/mL poly A、25μg/mL Cot-1DNA、10%葡聚糖硫酸酯)。将干燥后的样品溶解在所述预杂交缓冲液中。将溶解样品放入0.5mL PCR管中,在95℃加热5分钟。在杂交室内放入一片3M纸,然后在其上滴加20μL3X SSC。将所述经加热的样品加载到所述经预杂交的芯片上,然后将所述芯片组装到杂交室内并在42℃杂交过夜。

然后用预热到50℃的2X SSC的0.1% SDS溶液将所述芯片清洗1次,历时10分钟,其后于室温清洗4次每次1分钟。将清洗过的芯片立即放入椎管中并用离心分离机在800rpm干燥5分钟。

6)分析

用Axon制造的输出波长为约650nm的GenePix 4100B扫描仪扫描制备好的所述芯片。用GenePix Pro 6.0软件分析扫描图象的荧光信号强度。所述分析结果如图46和表44中所示。

[表44]

结果,用所述基因芯片分析的CYP2D6基因的变异体和由测序分析的变异体相同。

<PXR>

示例性实施方式13:确定高丽人PXR基因的基因型

<13-1>PXR基因的扩增

从54个健康对象采集血液后,使用Qiagen公司制造的基因组DNA分离试剂盒从血液中分离出DNA。用ABI 3130XL基因分析仪分析了PXR基因的完整基因序列。结果,发现了到目前为止报道过的18种功能性变异体中的6种。所述PXR基因包含9个外显子,且大约为38kb长。以含功能性变异体的外显子为中心,将所述PXR基因分为10个片段,以对所述片段进行PCR。PCR所用引物如表45所示。在本说明书中的基因序列中所写的A、T、G和C是指腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。

[表45]扩增PXR基因的引物及其基因序列

所述引物的位置和PCR产物的大小如表46中所示。核苷酸的位置根据文献[HUMAN MUTATION 11:1.3(1998)]的命名方法书写。

[表46]引物的位置和PCR产物的大小

各PCR片段对应的反应条件如表47中所示。

[表47]PCR反应条件

 

PCR产物反应条件PXR_5′UTR.194℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_5′UTR.294℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_exon194℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_exon294℃ 4分钟,(94℃ 30秒,50℃ 30秒,72℃ 30秒)35周期,72℃ 5分钟PXR_exon394℃ 4分钟,(94℃ 30秒,54℃ 30秒,72℃ 30秒)35周期,72℃ 5分钟

 

PXR_exon494℃ 4分钟,(94℃ 30秒,54℃ 30秒,72℃ 30秒)40周期,72℃ 5分钟PXR_exon594℃ 4分钟,(94℃ 30秒,54℃ 30秒,72℃ 30秒)35周期,72℃ 5分钟PXR_exon6~894℃ 4分钟,(94℃ 30秒,54℃ 30秒,72℃ 1分钟15秒)35周期,72℃ 5分钟                                                            PXR_exon994℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_exon9.294℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟

<13-2>PCR产物测序

用自动DNA测序仪和含参照131~150的引物分析了示例性实施方式<13-1>产生的每个PCR产物的基因序列。

与野生型PXR基因(参照130)的基因序列比较后,共发现了22个SNP。其中,有6个SNP包含于目前为止已报道过的18种功能性变异体内。表48中显示了22个SNP,报道过的功能性变异体用#标记。

[表48]发现于高丽人中的PXR基因变异体

 

SNP位置rs编号频率(%)-25564G>A上游rs127216021.9#-25385C>T上游rs381405516.7-24840A>G上游0.9-24622A>T上游2.8-24446C>A上游rs22767052.8-24381A>C上游21.3#-24113G>A5′UTR21.3120A>G内含子231.5155A>G内含子231.5178A>T内含子20.92883T>G内含子3rs37323563.74500G>A内含子40.94760G>A内含子4rs373235767.6#7635A>G内含子5rs678504951.97675C>T内含子5rs67978797.47958C>G内含子60.9#8055C>T内含子6rs227670737.08635C>A内含子810.29976G>A3′UTRrs37323580.910719A>G3′UTR5.6#11156A>C3′UTR48.1#11193T>C3′UTR48.1

如表48中所示,所述PXR基因的7种变异体发现于启动子中,而其余变异体发现于3’UTR和内含子中。没有发现引起氨基酸替换的变异体。

示例性实施方式14:确定PXR功能性变异体的单倍型

在示例性实施方式13中研究了PXR基因的6种功能性变异体的功能性,所述功能性变异体因其组合方式可能影响PXR基因的功能性。

因此,本发明人用DYNACOM公司的SNPAlyze软件分析了示例性实施方式13中所发现的变异体的单倍型。结果,确认了至少14种具有1%以上频率的单倍型,如表49所示。

[表49]

□:各SNP的变异体

示例性实施方式15:htSNP的选择和验证

有报道称几个单倍型,即所述PXR基因的SNP的组合,可能影响PXR基因的活性。可以用最小标记检查所生成单倍型的具体信息。所述最小标记称为htSNP,是准确标记单倍型所必需的,且包含数种组合。用SNPtagger软件(http://www.well.ox.ac.uk/~xiayi/haplotype)对示例性实施方式14中选出的14个单倍型进行测序以选择所述htSNP组合,亦即最优标签组。

结果,选中的htSNP组合如图47中所示。所选htSNP组合是最优标签组之一,其中“1”是指野生型,“2”是变异体而“V”是指所选htSNP。htSNP组合的选择可以与图47中的htSNP组合不同。

用Matlab软件(7.1版,迈斯沃克软件有限公司,美国)分析发现的所述组合来确定相互不重合的二倍型和基因型。分析结果用于确定所述组合。

根据所述验证结果,二倍型和基因型不用相互重合就可得以确定。换言之,根据本发明选择的htSNP组合互不相同,且确定基因型的所述分析是绝对正确的。

示例性实施方式16:在PXR基因中快速搜索功能性变异体

在示例性实施方式13中发现的高丽人PXR基因的6种功能性变异体中,进行SNaPshot分析来高速搜索影响所述PXR基因功能性的功能性变异体。使用对象的DNA作为模板进行PCR,对扩增产物进行SNaPshot分析。所述PCR所用的引物如表50所示。

[表50]

所述PCR产物对应的反应条件如表51所示。

[表51]PCR反应条件

 

PCR产物反应条件PXR_5′UTR.194℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_exon194℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 35秒)35周期,72℃ 5分钟PXR_exon694℃ 4分钟,(94℃ 30秒,54℃ 30秒,72℃ 30秒)35周期,72℃ 5分钟PXR_exon9.294℃ 4分钟,(94℃ 30秒,55℃ 30秒,72℃ 40秒)35周期,72℃ 5分钟

等量混合所述4个经扩增的PCR产物。不与混合PCR产物反应的剩余引物和dNTP可能影响SNaPshot分析。为了除去剩余引物和dNTP,将5μL PCR产物与2μL ExoSAP-IT(USB制造)混合,在37℃反应30分钟,然后在80℃再反应15分钟以使剩余的酶失活。使用所述经酶处理的产物与表52中的引物进行PCR来制成多重SNaPshot反应物。所述多重SNaPshot反应物和PCR反应条件如表53和表54中所示。

[表52]引物及其基因序列

 

引物名称基因序列(5′→3′)参照25385C>T_F(48)TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGCAATCCCAGGTT                                  24224113G>A_F(44)TTTTTTTTTTTTTTTTTTTTTTTTGTCTCCTCATTTCTAG243

 

GGTG7635A>G_F(28)TTTTTTTTCCATCCTCCCTCTTCCTCTC2448055C>T_F(32)TTTTTTTTTTTTCTGAGAAGCTGCCCCTCCAT24511156A>C_F(36)TTTTTTTTTTTTTTTTTATAAGGCATTCCACACCTA24611193T>C_R(40)TTTTTTTTTTTTTTTTTTTTATTCCTTTTGCCTTGATTTG157

[表53]多重SNaPshot反应物

[表54]

 

PCR产物反应条件SNaPshot产物96℃ 10秒,50℃ 5秒,60℃ 30秒)40周期

反应完成后,将10μL SNaPshot产物和1μL SAP(USB)混合,在37℃反应1小时,然后在65℃反应15分钟,从而除去[F]ddNTP。然后,将0.5μL反应物、9.3μL Hi-Di甲酰胺(ABI)和0.2μL GeneScan-LIZ规模标准物(ABI)在95℃混合5分钟以使其变性。然后,用3130XL基因分析仪(ABI)分析所述混合物。分析结果如图48~50所示。

如图48~50所示,峰的颜色和位置随所述PXR基因的功能性变异体的不同而不同,从而能方便地识别野生型、含杂合等位基因的变异体(杂合)和含纯合等位基因的变异体(纯合)。因此,本发明所述分析方法可以用于分析PXR基因中的功能性变异体,且节省成本和时间。

<UGT1A>

示例性实施方式17:高丽人UGT1A基因中的遗传变异体的选择

步骤1)基因组DNA的分离

从50个高丽人采集血液后,使用基因组DNA分离试剂盒(Qiagen)从血液样本中分离出DNA。

步骤2)UGT1A基因的扩增和全长测序

将步骤1中分离出的50个基因组DNA样本用作模板。使用表55中的一对引物进行PCR来扩增所述UGT1A基因。扩增的UGT1A基因的基因名称和位置、所用引物名称、引物的基因序列、引物的大小和PCR反应条件如表55所示。

[表55]

步骤3)UGT1A基因的变异体的分析

用已知的3130X基因分析仪(Applied Biosystems)分析了步骤2中扩增的所述UGT1A基因的全长序列。将分析结果与野生型UGT1A基因(基因库登录号:NT_005120)的基因序列进行比较。结果如表56和表57中所示。

[表56]

[表57]

步骤17-1)UGT1A基因中功能性变异体的选择

基于步骤3中发现于50个高丽人中的UGT1A基因的多态性来选择据报道与提高或降低酶活性有关的变异体。所选变异体如表58所示。尽管UGT1A9基因中的G766A变异体在步骤3中没有确定,但据报道该变异体为日本人中的功能性变异体。因此,表58中包括了G766A变异体。“截短蛋白”是指其翻译因突变体而暂停的蛋白。

[表58]

步骤17-2)UGT1A基因的与药物敏感性相关的多态性的选择

基于步骤3中发现于50个高丽人中的UGT1A基因的多态性选择了已知参与抗结肠癌药物依立替康的代谢的UGT1A1、UGT1A6和UGT1A9基因的多态性,如表59所示。尽管在步骤3中没有发现UGT1A9基因中的G766A变异体,但据报道该变异体是日本人的功能性变异体,因而将其添加到了表59中。

[表59]

示例性实施方式18:对UGT1A基因中功能性变异体和与药物敏感性相关的多态性的分析

18-1)UGT1A基因的功能性变异体的分析

对采自对象的血液进行研究以分析其功能性变异体,所述对象含有UGT1A基因的野生型、含杂合等位基因的变异体和含纯合等位基因的变异体。

用与示例性实施方式17中步骤1和步骤2相同的方法扩增了UGT1A1、UGT1A3、UGT1A4、UGT1A6、UGT1A7和UGT1A9基因的基因序列。将5μL各UGT1A基因的PCR产物和2μL ExoSAP-IT(USB制造)混合并在37℃反应30分钟以除去剩余引物。然后,所产生的反应物在80℃再反应15分钟以使剩余ExoSAP-IT失活。然后将2μL所述反应物和1μL SNaPshot多重预反应混合物(ABI)、4μL半终点缓冲液(组成:200mM Tris HCl,5mM MgCl2,pH 9)和表60中的各SNaPshot引物混合以制备SNaPshot反应溶液。此处,所述反应物的总量为10μL。

[表60]

对每种反应溶液在下述条件下进行PCR 40个周期(在96℃反应10秒,在50℃反应5秒并在60℃反应30秒)。反应过后,将10μL反应溶液与1μL SAP(虾碱性磷酸酶)(USB)混合并在37℃反应1小时然后在65℃反应15分钟。将0.5μL反应溶液与0.2μL LIZ120(ABI)以及9.3μLHi-Di甲酰胺混合并置于96孔板。反应样品在95℃反应2分钟,然后由3130X基因分析仪(Applied Biosystems)分析。分析结果如图51~54所示。

如图51~54所示,峰的颜色和位置随各UGT1A基因的功能性变异体的不同而不同,从而能方便地鉴定野生型、含杂合等位基因的变异体(杂合)和含纯合等位基因的变异体(纯合)。证实了峰的大小和类型与表55中由示例性实施方式17中测序所得的结果100%相同。因此,本发明所述分析方法可以用于分析UGT1A基因中的功能性变异体,且节省成本和时间。

由于UGT1A1基因的-39insTA基因型与SNP不对应,因此无法对该基因型进行SNaPshot分析。所述-39insTA基因型的变异体由PCR-焦磷酸测序确定。用于所述分析的引物的基因序列如表61中所示。引物UGT1A1*28F在5’端连接了生物素(biotin)(参见参照202)。用于焦磷酸测序的引物参见文献[ClinChem.,Jul;49(7):1182-1185,2003]。

更具体而言,将以含参照202和203的引物生成的PCR产物用作模板。使参照204测序用引物反应,从而用焦磷酸测序仪确定变异体的存在。

将所生成的PCR产物与37μL pH 7.6的结合缓冲液(组成:10mMTris-HCl,2M NaCl,1mM EDTA和0.1% Tween20)和3μL高效链霉亲和素琼脂糖(Streptavidin SepharoseTM High Performance,AmershamBioscience)混合。然后,将所述混合物置于96孔板,在室温和14,000rpm反应5分钟。将0.3μL含参照204的引物(100pmol)与100μLpH 7.6的1X退火缓冲液(组成:20mM三羟甲基氨基甲烷乙酸盐和2mMMgAc2)混合并置于96孔板。用真空Prep Tool处理所述反应样品,在90℃加热3分钟然后冷却到室温。将Pyro Gold试剂盒(Biotage)提供的酶混合物、底物混合物、dATP、dCTP、dGTP和dTTP加入冷却的板中以通过焦磷酸测序仪确定变异体。

[表61]

18-2)UGT1A基因中功能性变异体的分析

分析了UGT1A基因的与对依立替康的敏感性相关的多态性,除了使用表62中的引物代替表60中的引物以外,所用方法与18-1)中所述的SNaPshot分析相同。分析结果如图55所示。在表62中的引物的5’端加入了长度不同的T重复基因序列以改变所述引物的长度。

[表62]

结果,很容易地同时鉴定出UGT1A基因的与对依立替康的敏感性相关的数个SNP。证实了峰的大小和类型与示例性实施例17中通过测序得到的表55中的结果100%相同。

工业实用性

如上所述,本发明的CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的功能性变异体或与药物敏感性相关的多态性的分析方法可以用于确定CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的功能性变异体或UGT1A基因的与药物敏感性相关的多态性,所述方法使用基于之前尚未确定的高丽人CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的多态性的最优搜索组合。本发明可以应用于确定诸如与高丽人有相似遗传学特性的日本人和中国人以及高丽人等亚洲人的CYP1A2、CYP2A6、CYP2D6、PXR和UGT1A基因的基因型。

尽管本文已经对本发明的一些示例性实施方式进行了展示和说明,但本领域技术人员会意识到,可以在不背离本发明的原理和实质的情况下对所述示例性实施方式进行变化,本发明的范围已在所附权利要求和等同物中进行了限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号